WO1999062055A1 - Decodeur de son et procede de decodage de son - Google Patents

Decodeur de son et procede de decodage de son Download PDF

Info

Publication number
WO1999062055A1
WO1999062055A1 PCT/JP1999/002801 JP9902801W WO9962055A1 WO 1999062055 A1 WO1999062055 A1 WO 1999062055A1 JP 9902801 W JP9902801 W JP 9902801W WO 9962055 A1 WO9962055 A1 WO 9962055A1
Authority
WO
WIPO (PCT)
Prior art keywords
signal
decoder
excitation signal
codebook
frame error
Prior art date
Application number
PCT/JP1999/002801
Other languages
English (en)
French (fr)
Inventor
Nobuhiko Naka
Original Assignee
Ntt Mobile Communications Network Inc.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ntt Mobile Communications Network Inc. filed Critical Ntt Mobile Communications Network Inc.
Priority to DE69942658T priority Critical patent/DE69942658D1/de
Priority to JP54238699A priority patent/JP3554566B2/ja
Priority to US09/462,126 priority patent/US6714908B1/en
Priority to EP99922522A priority patent/EP1001541B1/en
Publication of WO1999062055A1 publication Critical patent/WO1999062055A1/ja

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
    • H03M7/42Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code using table look-up for the coding or decoding process, e.g. using read-only memory
    • H03M7/425Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code using table look-up for the coding or decoding process, e.g. using read-only memory for the decoding process only
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/60General implementation details not specific to a particular type of compression
    • H03M7/6005Decoder aspects

Definitions

  • the present invention relates to an audio decoder and an audio decoding method used for audio CODEC.
  • CELP Code Excited Linear Predictive Coding
  • This CELP is a type of predictive coding that predicts the current audio signal sample from past decoding results and encodes and sends a prediction error, which is the difference between the predicted value of the audio signal sample and the actual sample value. . Then, in this CELP, the prediction error is vector-quantized by a noise sequence and transmitted.
  • an excitation signal is generated from the encoded audio signal and the internal state of the decoder every fixed frame period.
  • the excitation signal is generated and a speech signal is decoded from the excitation signal, and the internal state is updated by the excitation signal.
  • concealment processing for attenuating the excitation signal is performed. The concealment process is described in, for example, R. Salam et al., "Design and Description of CS-ACELP: A Toll Quality 8 kb / s Speech Coder", IEEE Trans. On Speech and Audio Processing, vol. .2, March 1998.
  • the present invention has been made in view of the above-described circumstances, and has as its object to realize that even when an encoded audio signal is continuously incorrect, the original power is quickly restored when the encoded audio signal is normally input again. It is an object of the present invention to provide an audio decoder and an audio decoding method capable of returning to a state in which decoding can be performed with a sufficient amount.
  • the present invention receives a frame of a coded voice signal that has been predictively coded, generates an excitation signal from the coded voice signal and an internal state, and decodes the voice signal based on the excitation signal.
  • a speech decoder for generating a signal and updating the internal state and performing a concealment process for attenuating the excitation signal when there is a frame code error, a continuous frame exceeding a predetermined reference frame error number is provided.
  • amplification control means for outputting an amplification instruction signal for a period after the continuous frame error is eliminated, and amplifying the excitation signal while the amplification instruction signal is being output.
  • An audio decoder characterized by comprising an amplifying means is provided.
  • the internal state of the decoder is returned to the state before the occurrence of the frame error at an early stage, and the original state is obtained. Since decoding can be performed with the amount of power, it is possible to reduce the deterioration of the subjective voice quality after the frame error recovery.
  • FIG. 1 is a block diagram showing a configuration of a speech decoder according to an embodiment of the present invention.
  • FIG. 2 is a block diagram showing an application example of the embodiment to a CELP decoder.
  • FIG. 3 is a block diagram showing a specific configuration of an excitation signal reconstructing unit of the CELP decoder. BEST MODE FOR CARRYING OUT THE INVENTION
  • FIG. 1 is a block diagram showing a configuration of a speech decoder 10 according to an embodiment of the present invention. is there.
  • the audio decoder 10 has a decoding processing unit 11 and an amplification processing control unit 12.
  • the decoding processing unit 11 is a device that decodes the received encoded audio signal (bit stream) B S and outputs a decoded audio signal SP.
  • the encoded speech signal B S includes a code parameter P C, a gain parameter P G, and a synthesized parameter P S Y.
  • the amplification control unit 12 monitors the occurrence of frame errors in the coded audio signal BS, and if a continuous frame error exceeding a predetermined reference frame error number occurs, the continuous frame error is eliminated.
  • This is a device that outputs a switching control signal C SW (amplification instruction signal) for a predetermined number of frames from. The purpose of outputting the switching control signal CSW and the processing performed in accordance with the switching control signal CSW will be described later.
  • the decoding processing unit 11 has a codebook data generation / output unit 15, an amplifier 16, a synthesis filter 17, and a changeover switch SW.
  • the codebook data generation / output unit 15 is configured by a codebook decoder 18 and a pre-amplifier 19.
  • the codebook decoder 18 has a rewritable memory. In this memory, a predetermined number of recently generated codebooks DCB (described later) are stored as original code blocks DCB0.
  • the original codebook database DB0 is used for decoding as information indicating the internal state of the decoder.
  • the codebook decoder 18 is supplied with a codebook parameter PC included in the encoded audio signal BS.
  • the codebook decoder 18 uses the codebook parameter PC as an index and outputs the original codebook data DCB0 stored in the storage area corresponding to the index in the memory.
  • the preamplifier 19 amplifies the original code block DCB0 with a gain corresponding to the gain parameter PG, and outputs it as codebook data DCB.
  • the switch SW is a codebook data D CB output from the preamplifier 19. This switch is used to switch the supply destination of the switch.
  • the switch supplies the codebook data DCB to the synthesizing filter 17.
  • the switch outputs the codebook data DCB.
  • the book data DCB is output to the amplifier 16.
  • the amplifier 16 amplifies the codebook data DCB at a predetermined amplification rate, and amplifies the codebook data. Evening Output as DACB.
  • the synthesis filter 17 synthesizes and outputs the decoded audio signal SP from one of the codebook data DCB or the amplified codebook data DACB (excitation signal) and the synthesis parameter PSY. Further, the data (excitation signal) input to the synthesis filter 17 of the codebook data DCB or the amplified codebook data DACB is converted into a new original codebook data DCB0 as the codebook decoder 18 described above. Given to. Then, the oldest one of the original codebook data DCB0 in the memory of the codebook decoder 18 is discarded, and a new original codebook data DCB0 is written to the memory.
  • the amplification control unit 12 includes an error detection unit 21A, a counter unit 22A, and a switching control unit 23A.
  • the error detection unit 21A detects a frame error of the coded voice signal BS and outputs an error detection signal SER.
  • the counting section 22A counts the number of consecutive frame errors based on the error detection signal SER, and outputs a count signal SCN. More specifically, the counter section 22A increases the count value by “1” when the error detection signal SER is output in each frame period, and increases the count value when the error detection signal SER is not output. To “0”. Then, the count value is output as the count signal CN in each frame period.
  • the switching control unit 23A monitors the count signal SCN, and when the number of consecutive frame errors indicated by the count signal SCN exceeds a predetermined reference frame error number, thereafter, the predetermined number of frames after the frame error is eliminated. During this period, the switching control signal CSW for switching the switching switch SW to the amplifier 16 is output. Here, the switching control unit 23A determines that the error detection signal SER is no longer output, It detects that the continued frame error has ended.
  • the original codebook data DCB0 corresponding to the codebook parameter PC included in the coded audio signal BS is output from the codebook decoder 18 in the codebook data generation / output unit 15 .
  • This original codebook data DCB0 is amplified by the pre-amplifier 19 with a gain corresponding to the gain parameter PG, and is output as codebook data DCB.
  • the composite file 17 is selected as the supply destination of the codebook data DCB by the changeover switch SW.
  • the codebook data DCB output from the pre-amplifier 19 is supplied to the synthesis filter 17 via the switching switch SW.
  • the decoded speech signal SP is synthesized from the codebook data DCB and the synthesis parameter PSY.
  • the codebook data DCB supplied to the composite filter 17 is written to the codebook decoder 18 as a new original codebook DCB0.
  • the switching control signal C SW is output from the switching control unit 23A, and the codebook is switched by the switching switch for one frame period.
  • the amplifier 16 is selected as the DCB supply destination.
  • this code block DCB is supplied to the amplifier 16 via the changeover switch SW, amplified at a predetermined amplification rate, supplied to the composite filter section 17 as amplified codebook data DACB, and newly added.
  • the original codebook data DCB0 is written to the memory of the codebook decoder 18.
  • the amplified codebook data DACB corresponding to the amplification factor of the amplifier 16 is obtained as the excitation signal for a certain period. Therefore, after consecutive frame errors, the normally input coded speech signal BS can be decoded with a power amount closer to the original power amount, thereby improving the subjective voice quality of the decoded voice signal SP. be able to.
  • FIG. 2 a specific example in which the present embodiment is applied to a CODEC speech decoder of CS—ACELP (Conjugate—Structure Algebraic Code Excited Linear—Prediction), which is one of the predictive coding methods.
  • CS—ACELP Conjugate—Structure Algebraic Code Excited Linear—Prediction
  • This type of CS-ACELP speech encoder and speech decoder is described, for example, in Salam et al., "Design and Description of CS-ACELP: A Toll Quality 8kb / s Speech Coder", IEEE Trans.on. Speech and Audio Processing, vol. 6 No. 2, March 1998.
  • Speech decoder configuration A Toll Quality 8kb / s Speech Coder
  • the audio decoder 20 has a parameter decoder 21.
  • This parameter overnight decoder 21 receives the encoded voice signal (bit stream) from the BS and outputs a pitch delay parameter overnight group GP, a codebook gain parameter overnight group GG, a codebook index parameter overnight group GC, LSP (Line Spectrum Pairs) This is a device that decodes the index parameter group GL.
  • the codebook index parameter overnight group GC includes a plurality of codebook index parameters and a plurality of codebook code parameters.
  • the speech decoder 20 has an adaptive code vector decoder 22, a fixed code vector decoder 23, and an adaptive pre-filter 25.
  • the adaptive code vector decoder 22 is a device that outputs an adaptive code vector A C V corresponding to the pitch delay parameter group GP. More specifically, the adaptive code vector decoder 22 has a rewritable memory, in which a predetermined number of previously input adaptive code vectors A C V are stored. The adaptive code vector decoder 22 uses the pitch delay parameter group GP as an index, reads out the adaptive code vector A CV corresponding to the index from the memory, and outputs the read out. When the excitation signal S EXC is reconstructed by the excitation signal reconstruction unit 27 described later, the excitation signal S EXC is written to the memory of the adaptive code vector decoder 22 as a new adaptive code vector ACV. The oldest adaptive vector ACV in the memory is discarded.
  • the fixed code vector decoder 23 is a device that outputs the original fixed code vector F C V0 corresponding to the code book index parameter group G C.
  • the adaptive pre-processing filter 25 functions as an emphasis processing means, and performs an emphasis process on the decoded original fixed code vector FC V0 to emphasize its harmonic components, thereby obtaining a fixed code vector. It is a device that outputs as FCV. Further, the audio decoder 20 has a gain decoder 24 and an LSP reconstructing unit 26.
  • the gain decoder 24 is a device that outputs an adaptive codebook gain ACG and a fixed codebook gain FCG based on the fixed code vector FCV (or original fixed code vector FCV0) and the codebook gain parameter group GG. .
  • the 3? Reconstruction unit 26 is a device that reconstructs the LSP coefficient CLSP based on the LSP index parameter overnight group GL.
  • the speech decoder 20 includes an excitation signal reconstruction unit 27 and an LP synthesis filter.
  • the excitation signal reconstructing unit 27 calculates the excitation signal SEXC based on the adaptive code vector AC V, the adaptive code book gain ACG, the fixed code book gain F CG, and the fixed code vector FCV (or the original fixed code vector FCV0). It is a device that reconstructs This excitation signal SEXC is written into the memory of the adaptive code vector decoder 22 as a new adaptive code vector ACV, and the oldest adaptive code vector ACV in the memory is discarded.
  • the LP synthesis filter 28 is a device that performs LP synthesis based on the excitation signal SEXC and the LSP coefficient CLSP to reconstruct the audio signal SSPC.
  • the post-processing filter 29 is a device that performs post-processing filtering of the audio signal SSPC.
  • This post-processing filter 29 is composed of three types of filters: a long post-processing post, a short post-processing post, and a tilt compensation post. These three filters are connected in series from the input side to the output side in the following order: long-term post-processing filter, short-term post-processing filter, and slope compensation filter.
  • the high-pass filter / up-scaling unit 30 is a device that performs a high-pass filter processing and an up-scaling process on the output signal of the post-processing filter 29.
  • the audio decoder 20 includes an error detection unit 31, a counter unit 32, and a switching control unit.
  • the error detection unit 31 is a device that detects a frame error of the received encoded voice signal BS and outputs an error detection signal SER.
  • the counting unit 32 is a device that counts the number of consecutive frame errors based on the error detection signal SER and outputs a count signal SCN.
  • the switching control unit 33 when the number of consecutive frame errors indicated by the count signal SCN exceeds a predetermined reference frame error number, the switching control unit 33 thereafter sets a switching switch (described later) for a predetermined number of frames after the frame error disappears.
  • This is a device that outputs a switching control signal SSW for switching SW1 to a third amplifier 44 (see FIG. 3) described later.
  • the error detection unit 31, the counter unit 32, and the switching control unit 33 correspond to the error detection unit 21 A, the counter unit 22 A, and the switching control unit 23 A in FIG. I have.
  • FIG. 3 is a block diagram showing a configuration example of the excitation signal reconstructing unit 27.
  • the excitation signal reconstructing unit 27 includes a first amplifier 41, a second amplifier 42, a reconstructing unit 43, a switching switch SW1, and a third amplifier 44.
  • the first amplifier 41 amplifies the adaptive code vector ACV with a gain corresponding to the adaptive codebook gain ACG and outputs the amplified adaptive code vector ACV as an amplified adaptive code vector ACV1.
  • the second amplifier 42 amplifies the fixed code vector FCV with a gain corresponding to the fixed codebook gain FCG, and outputs the amplified fixed code vector FCV as an amplified fixed code vector FCV1.
  • the reconstructing unit 43 reconstructs the original excitation signal SEXC0 based on the amplified adaptive code vector ACV1 and the amplified fixed code vector FCV1. This
  • the switch SW1 outputs the original excitation signal SEXC0 to the LP synthesis filter 28 when the switching control signal SSW is not output, and outputs the original excitation signal SEXC0 when the switching control signal SSW is output. Output to the third amplifier 44.
  • the third amplifier 44 amplifies the original excitation signal S EXC0 and outputs it to the LP synthesis filter 28 as an excitation signal S EXC.
  • the switching control unit 33 provides a switching control signal SSW for switching the switching switch SW1 to the third amplifier 44 side for one frame after the number of consecutive frame errors exceeds “4” and thereafter there is no frame error. Shall be output.
  • the parameter decoder 21 converts the received coded voice signal (bit stream) from the BS to a pitch delay parameter group GP, a codebook gain parameter — a group GG, a codebook index parameter group GC and LSP. (Line Spectrum Pairs) Decode the index parameter group GL.
  • the parameter overnight decoder 21 outputs the pitch delay parameter group GP obtained by decoding to the adaptive code vector decoder 22, outputs the codebook gain parameter overnight group GG to the gain decoder 24, and outputs
  • the one-book index parameter overnight group GC is output to the fixed code vector decoder 23, and the LSP (Line Spectrum Pairs) index parameter one-day group GL is output to the LSP reconstruction unit 26.
  • the LSP reconstruction unit 26 reconstructs the LSP coefficient CLSP based on the LSP index parameter group GL, and outputs it to the LP synthesis filter 28 and the post-processing filter 29.
  • Adaptive code vector decoder 22 decodes adaptive code vector ACV based on pitch delay parameter group GP and outputs it to excitation signal reconstructing section 27.
  • the fixed code decoder 23 decodes the original fixed code vector FCV0 based on the codebook index parameter group GC and outputs it to the adaptive preprocessing filter 25.
  • the adaptive pre-processing filter 25 performs an emphasis process on the decoded original fixed code vector FCV0 to emphasize its harmonic components, thereby reconstructing the gain decoder 24 and the excitation signal as a fixed vector FCV. Output to part 27.
  • the gain decoder 24 converts the adaptive code block gain AC G and the fixed code book gain FCG based on the fixed code vector FCV (or the original fixed code vector F CV0) and the codebook gain parameter group GG into an excitation signal reconstruction unit. 27 Output to
  • the first amplifier 41 amplifies the adaptive code vector ACV with a gain corresponding to the adaptive codebook gain ACG, and reconstructs the amplified adaptive code vector ACV1 as the amplified adaptive code vector ACV1.
  • the second amplifier 42 amplifies the fixed code vector FCV with a gain corresponding to the fixed codebook gain FCG, and outputs the amplified fixed code vector FCV to the reconstructing unit 43 as an amplified fixed code vector FCV1.
  • the reconstructing unit 43 reconstructs the original excitation signal SEXC0 based on the amplified adaptive code vector ACV1 and the amplified fixed code vector FCV1, and outputs the signal to the switching switch SW1.
  • the switch SW1 is set to the LP synthesis filter 28 side.
  • the original excitation signal SEXC0 is output to the LP synthesis filter 28 as the excitation signal SEXC.
  • the excitation signal SEXC is written into the memory of the adaptive code vector decoder 22 as a new adaptive code vector ACV, and the oldest adaptive code vector ACV in the memory is discarded.
  • the LP synthesis filter 28 performs LP synthesis on the basis of the excitation signal SEXC and the LSP coefficient CLSP to reconstruct the audio signal SSPC, and outputs it to the post-processing filter 29.
  • the post-processing filter 29 performs post-processing filtering of the audio signal SSPC and outputs it to the high-pass filtering / up-scaling unit 30.
  • the high-pass filter / up-scaling unit 30 performs high-pass filter processing and up-scaling of the input audio signal SSPC, and outputs the decoded audio signal SP.
  • the excitation signal SEXC of an appropriate level is written into the memory of the adaptive code vector decoder 22. Since decoding is performed using the previous excitation signal SEXC written in the memory as described above, the decoded voice signal SP having the optimal power is output. 2 Operation when frame errors occur consecutively
  • the switching control unit 33 outputs the switching control signal SSW for switching the switching switch SW1 to the third amplifier 44 for one frame from the timing when the frame error has disappeared.
  • the original excitation signal SEXC0 output from the reconstructing unit 43 is sent to the third amplifier 44 via the switching switch SW1.
  • the level of the original excitation signal SEXC0 is slight because it is immediately after the concealment process is continuously performed.
  • the original excitation signal SEXC0 is amplified by the third amplifier 44, output to the LP synthesis filter 28 as the excitation signal SEXC, and stored in the memory of the adaptive code decoder 22 as a new adaptive code vector ACV. Written.
  • the past internal state of the speech decoder 20 that is, the adaptive code vector ACV in the memory of the adaptive code vector decoder 22 returns to the state at the time of normality early, and is almost the same as the normal state.
  • the decoded speech signal SP having the electric energy is output.
  • the subjective audio quality of the decoded audio signal SP is improved as compared with the case where no amplification processing is performed.
  • the present invention performs predictive coding. If it is an audio signal processing device that can be applied to other types of audio signal processing devices, for example, APC (Adaptive Predictive Coding), LPC (Linear Prediction Coding), RELP (Residual Excited LPC),
  • APC Adaptive Predictive Coding
  • LPC Linear Prediction Coding
  • RELP Residual Excited LPC
  • CELP Code Excited LPC

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

明細書
音声復号器および音声復号方法
技術分野
この発明は、 音声 C O D E Cに用いられる音声復号器および音声復号方法に関 する。
背景技術
音声符号化方法の 1つとして、 C E L P (Code Excited Linear Predictive C oding) が注目されている。
この C E L Pは、 過去の復号結果から現在の音声信号のサンプルを予測し、 音 声信号のサンプルの予測値と実際のサンプル値の差である予測誤差を符号化して 送る予測符号化の一種である。 そして、 この C E L Pでは、 予測誤差を雑音系列 によりべクトル量子化して送信する。
この C E L Pのような予測符号化方法により得られた符号化音声信号を受信し て復号する復号器では、 一定のフレーム周期毎に、 符号化音声信号と復号器の内 部状態とから励起信号が発生され、 この励起信号から音声信号が復号されるとと もに、 この励起信号により内部状態の更新が行われる。 ここで、 符号化音声信号 のフレームに符号誤りがあることが判明した場合には、 励起信号を減衰させるコ ンシールメント処理が行われる。 なお、 このコンシールメント処理については、 例えば R. Salam他による文献 "Design and Description of CS-ACELP: A Toll Qu ality 8kb/s Speech Coder", IEEE Trans . on Speech and Audio Processing, v ol.6 No.2, March 1998に説明されている。
このコンシールメント処理が行われることによりフレーム誤りによる耳障りな 歪みの発生が防止される。
しかし、 複数フレーム連続して受信フレームに符号誤りが生じ、 このコンシ一 ルメント処理が繰り返されると、 復号器の内部状態がほぼ零に近くなつてしまう。 このため、 その後、 連続したフレーム誤りが終了したとしても、 正常に受信され た符号化音声信号が本来の電力量で復号されるようになるまで長時間を要してし まうという問題点があった。
発明の開示 この発明は以上説明した事情に鑑みてなされたものであり、 その目的は、 符号 化音声信号が連続して誤った場合でも、 再び符号化音声信号が正常に入力された ときには早期に本来の電力量での復号が可能な状態に復帰させることができる音 声復号器および音声復号方法を提供することにある。
この目的を達成するため、 この発明は、 予測符号化された符号化音声信号のフ レームを受け取り、 該符号化音声信号と内部状態とから励起信号を生成し、 この 励起信号に基づいて復号音声信号を生成するとともに前記内部状態を更新し、 フ レームの符号誤りがあった場合には前記励起信号を減衰させるコンシールメント 処理を行う音声復号器において、 所定の基準フレーム誤り数を越える連続したフ レーム誤りが生じた場合に、 この連続したフレーム誤りがなくなつてから一定期 間、 増幅指示信号を出力する増幅制御手段と、 前記増幅指示信号が出力されてい る間、 前記励起信号を増幅する増幅手段とを備えたことを特徴とする音声復号器 を提供するものである。
本発明によれば、 連続してフレーム誤りが発生した場合であって、 かつ、 その 後フレーム誤りがなくなった場合に、 復号器の内部状態を早期にフレーム誤り発 生前の状態に戻し、 本来の電力量での復号を行うことができるので、 フレーム誤 り回復後の主観音声品質の劣化を軽減することができる。 図面の簡単な説明
図 1は、 この発明の一実施形態である音声復号器の構成を示すプロック図であ る。
図 2は、 同実施形態の C E L Pデコ一ダへの適用例を示すブロック図である。 図 3は、 同 C E L Pデコーダの励起信号再構築部の具体的構成を示すプロック 図である。 発明の実施するための最良の形態
次に図面を参照して本発明の好適な実施形態について説明する。
A . 実施形態の構成
図 1はこの発明の一実施形態である音声復号器 1 0の構成を示すブロック図で ある。
この音声復号器 1 0は、 復号処理部 1 1と増幅処理制御部 1 2とを有している。 ここで、 復号処理部 1 1は、 受信した符号化音声信号 (ビットストリーム) B Sを復号化して復号音声信号 S Pを出力する装置である。 また、 符号化音声信号 B Sには、 コードプックパラメ一夕 P Cと、 ゲインパラメ一夕 P Gと、 合成パラ メ一夕 P S Yとが含まれている。
増幅処理制御部 1 2は、 符号化音声信号 B Sのフレーム誤りの発生状況を監視 し、 所定の基準フレーム誤り数を越える連続したフレーム誤りが生じた場合に、 この連続したフレーム誤りがなくなつてから所定フレーム数の間、 切替制御信号 C SW (増幅指示信号) を出力する装置である。 なお、 この切替制御信号 C SWを出 力する目的およびこの切替制御信号 C SWに従って行われる処理については後述す る。
次に、 復号処理部 1 1および増幅処理制御部 1 2の各々の構成について説明す る。
まず、 復号処理部 1 1は、 コードブックデータ生成出力部 1 5と、 増幅器 1 6 と、 合成フィル夕 1 7と、 切替スイッチ S Wとを有している。
ここで、 コードブックデータ生成出力部 1 5は、 コードブックデコーダ 1 8と 前段増幅器 1 9とにより構成されている。
これらのうち、 コードブックデコーダ 1 8は、 書き換え可能なメモリを有して いる。 このメモリには、 最近生成された所定個数のコードブックデ一夕 DCB (後 述) が原コードプヅクデ一夕 D CB0として記憶される。 この原コードブックデ一夕 D CB0は、 この復号器の内部状態を示す情報として復号処理に用いられる。 コード ブックデコーダ 1 8には、 符号化音声信号 B Sに含まれているコードブックパラ メータ P Cが供給される。 コードブックデコーダ 1 8は、 このコードブックパラ メ一夕 P Cをィンデックスとし、 上記メモリ内のこのィンデヅクスに対応した記 憶エリアに記憶されている原コードブックデータ DCB0を出力する。
前段増幅器 1 9は、 この原コードブヅクデ一夕 DCB0をゲインパラメ一夕 P Gに 対応するゲインで増幅し、 コードブックデータ D CBとして出力する。
切替スィッチ S Wは、 前段増幅器 1 9から出力されるコードブックデータ D CB の供給先を切り換えるスィツチであり、 上述した切替制御信号 CSWが出力されて いないときはコードブックデータ DCBを合成フィル夕 1 7に供給し、 切替制御信 号 CSWが出力されているときはコ一ドブックデータ DCBを増幅器 1 6に出力する。 増幅器 1 6は、 切替スィツチ SWを介して前段増幅器 19からコードブックデ 一夕 DCBが供給された場合に、 そのコードブックデ一夕 DCBを所定の増幅率で増 幅し、 増幅コ一ドブヅクデ一夕 DACBとして出力する。
合成フィル夕 17は、 コードブックデ一夕 DCBまたは増幅コードブックデ一夕 DACBの一方 (励起信号) と、 合成パラメ一夕 P SYとから復号音声信号 SPを合 成して出力する。 また、 コードブックデータ DCBまたは増幅コードブックデ一夕 DACBのうち合成フィルタ 1 7に入力されるデ一夕 (励起信号) は、 新たな原コ一 ドブックデ一夕 DCB0として、 上述したコードブックデコーダ 18に与えられる。 そして、 コードブックデコーダ 18のメモリ内の原コードブックデ一夕 DCB0のう ち最も古いものが廃棄され、 新たな原コードブックデ一夕 D CB0がメモリに書き込 まれる。
次に、 増幅処理制御部 12は、 誤り検出部 2 1 Aと、 カウン夕部 22 Aと、 切 替制御部 23 Aとを有している。
誤り検出部 2 1 Aは、 符号化音声信号 BSのフレーム誤りを検出し、 誤り検出 信号 SERを出力する。
カウン夕部 22 Aは、 誤り検出信号 SERに基づいて連続フレーム誤り数をカウ ン卜し、 カウント信号 SCNを出力する。 具体的には、 このカウンタ部 22 Aは、 各フレーム周期において誤り検出信号 S ERが出力されたときはカウント値を 「 1」 だけ増加させ、 誤り検出信号 SERが出力されなかったときはカウント値を 「0」 にする。 そして、 各フレーム周期においてカウント値をカウント信号 CNとして 出力するのである。
切替制御部 23 Aは、 カウント信号 SCNを監視し、 カウント信号 SCNによって 示される連続フレーム誤り数が所定の基準フレーム誤り数を越えた場合に、 その 後、 フレーム誤りがなくなつてから所定フレーム数の間、 切替スィッチ SWを増 幅器 16側に切り替えるための切替制御信号 CSWを出力する。 ここで、 切替制御 部 23Aは、 誤り検出信号 SERが出力されなくなつたことを以て、 それまでの連 続したフレーム誤りが終了したことを検知する。
B . 実施形態の動作
次に音声復号器 1 0の動作について説明する。
以下の説明においては、 基準連続フレーム誤り数を 「4」 とする。 また、 切替 制御部 2 3 Aは、 連続フレ一ム誤り数が 「4」 を越え、 かつ、 その後フレーム誤 りがなくなったタイミングから 1フレーム (=所定フレーム数) の間、 切替スィ ッチ S Wを増幅器 1 6側に切り替えるための切替制御信号 C SWを出力するものと する。
①連続フレーム誤り数が 「4」 以下であるときの動作
各フレーム周期において、 コードブックデ一夕生成出力部 1 5におけるコード ブックデコーダ 1 8から、 符号化音声信号 B Sに含まれるコードブックパラメ一 夕 P Cに対応した原コ一ドブックデータ DCB0が出力される。 この原コ一ドブック デ一夕 DCB0は、 前段増幅器 1 9によってゲインパラメ一夕 P Gに対応したゲイン で増幅され、 コ一ドブックデ一夕 DCBとして出力される。
ここで、 連続フレーム誤り数が基準連続フレーム誤り数 「4」 を越えていない ので、 切替スイッチ S Wにより、 コードブックデータ DCBの供給先として合成フ ィル夕 1 7が選択される。
従って、 前段増幅器 1 9から出力されたコードブックデータ DCBは、 切替スィ ツチ S Wを介して合成フィルタ 1 7に供給される。 合成フィル夕 1 7では、 コ一ドブックデータ DCBと合成パラメ一夕 P S Yとから復号音声信号 S Pが合成 される。 また、 合成フィル夕 1 7に供給されたコードブックデ一夕 DCBは、 新た な原コードブヅクデ一夕 DCB0としてコードブックデコーダ 1 8に書き込まれる。
②連続してフレーム誤りが生じた場合の動作
この音声復号器 1 0では、 フレーム誤りが生じると、 復号結果を急速に減衰さ せるコンシ一ルメント処理が行われる。 このコンシールメント処理が複数フレー ム周期に亙って続くと、 コードブックデコーダ 1 8のメモリ内の原コードブック デ一夕 DCB0が次第に 「0」 に近づいてゆく。 なお、 このコンシールメント処理に ついては、 例えば文献 "Design and Description of CS-ACELP: A Toll Quality 8kb/s Speech Coder" , IEEE Trans, on Speech and Audio Processing, vol.6 No.2, March 1998に説明されている。
③連続フレーム誤り数が「4」 を越え、 その後、 フレーム誤りがなくなった場合 の動作
連続フレーム誤り数が「4」 を越え、 その後、 フレーム誤りがなくなると、 切 替制御部 2 3 Aから切替制御信号 C SWが出力され、 1フレーム周期の間、 切替ス ィヅチ S Wにより、 コードブックデ一夕 DCBの供給先として増幅器 1 6が選択さ れる。
このときコードブックデコーダ 1 8のメモリに言己憶された原コードブックデ一 夕 DCB0は殆ど 「0」 であるため、 前段増幅器 1 9から得られるコードブックデ一 夕 DCBの大きさは僅かである。
しかし、 このコードブヅクデ一夕 DCBは、 切替スイッチ S Wを介して増幅器 1 6に供給され、 所定の増幅率で増幅され、 増幅コードブックデータ DACBとして合 成フィル夕部 1 7に供給されるとともに、 新たな原コードブックデータ DCB0とし てコードブックデコーダ 1 8のメモリに書き込まれる。
このように、 連続したフレーム誤りにより音声復号器 1 0の過去の内部状態、 すなわち、 コードブックデコーダ 1 8のメモリ内の原コードブックデ一夕 DCB0が ほぼ零に近くなつていても、 その後、 フレーム誤りがなくなったときには、 一定 期間、 増幅器 1 6の増幅率に応じた増幅コードブックデータ DACBが励起信号とし て得られる。 従って、 連続したフレーム誤りの後、 正常に入力された符号化音声 信号 B Sをより本来の電力量に電力量に近い電力量で復号することができ、 復号 音声信号 S Pの主観音声品質を向上することができる。
C . 具体的適用例
次に図 2を参照し、 予測符号化方式の 1つである C S— A C E L P方式 (Conj ugate - Structure Algebraic Code Excited Linear - Prediction方式) の C O D E Cの音声復号器に本実施形態を適用した具体例について説明する。 なお、 この種 の C S— A C E L P方式の音声符号化器および音声復号器については、 例えば Salam他による文献 "Design and Description of CS- ACELP : A Toll Quality 8k b/s Speech Coder", IEEE Trans . on Speech and Audio Processing, vol.6 No. 2, March 1998に説明されている。 ( 1 ) 音声復号器の構成
図 2において、 音声復号器 2 0は、 パラメ一夕デコーダ 2 1を有している。 こ のパラメ一夕デコーダ 2 1は、 受信した符号化音声信号 (ビッ卜ストリーム) B Sからピッチ遅延パラメ一夕群 G P、 コードブックゲインパラメ一夕群 G G、 コ —ドブックインデックスパラメ一夕群 G C及び L S P (Line Spectrum Pairs) ィ ンデックスパラメ一夕群 G Lを復号する装置である。
ここで、 コードブックインデックスパラメ一夕群 G Cには、 複数のコードブヅ クインデックスパラメ一夕及び複数のコードブック符号パラメ一夕が含まれてい る。
また、 音声復号器 2 0は、 適応コードベクトルデコーダ 2 2と、 固定コードべ クトルデコーダ 2 3と、 適応前処理フィル夕 (adaptive pre-filter) 2 5とを有 している。
ここで、 適応コードベクトルデコーダ 2 2は、 ピッチ遅延パラメ一夕群 G Pに 対応した適応コードべクトル A C Vを出力する装置である。 さらに詳述すると、 この適応コードべクトルデコーダ 2 2は、 書き換え可能なメモリを有しており、 このメモリには過去入力された所定個数の適応コードベクトル A C Vが記憶され ている。 適応コードベクトルデコーダ 2 2は、 ピッチ遅延パラメ一夕群 G Pをィ ンデックスとし、 このィンデヅクスに対応した適応コ一ドべクトル A C Vをメモ リから読み出して出力するのである。 また、 後述する励起信号再構築部 2 7によ つて励起信号 S EXCが再構築された場合、 この励起信号 S EXCが新たな適応コード べクトル A C Vとして適応コードべクトルデコーダ 2 2のメモリに書き込まれ、 同メモリ内の最も古い適応コ一ドべクトル A C Vが廃棄される。
固定コードべクトルデコーダ 2 3は、 コードブックインデックスパラメ一夕群 G Cに対応した原固定コードべクトル F C V0を出力する装置である。
これらの適応コードべクトルデコーダ 2 2および固定コードべクトルデコーダ 2 3は、 図 1におけるコードブックデコーダ 1 8に対応している。
適応前処理フィル夕 2 5は、 強調処理手段として機能し、 デコードされた原固 定コードベクトル F C V0に対し、 その高調波成分 (harmonic components) を強 調する強調処理を行い、 固定コードべクトル F C Vとして出力する装置である。 さらに、 音声復号器 20は、 ゲインデコーダ 24と L SP再構築部 26とを有 している。
ゲインデコーダ 24は、 固定コードベクトル FCV (あるいは原固定コードべ クトル FCV0) 及びコードブックゲインパラメ一夕群 GGに基づいて、 適応コー ドブックゲイン ACG及び固定コ一ドブックゲイン F CGを出力する装置である。
3?再構築部26は、 LSPインデックスパラメ一夕群 GLに基づいて、 L SP係数 CLSPを再構築する装置である。
さらにまた、 音声復号器 20は、 励起信号再構築部 27と、 LP合成フィルタ
28と、 後処理フィル夕 29と、 ハイパスフィル夕/アップスケーリング部 30 とを有している。
ここで、 励起信号再構築部 27は、 適応コードベクトル AC V、 適応コードブ ックゲイン ACG、 固定コ一ドブックゲイン F CG及び固定コードべクトル F C V (あるいは原固定コードベクトル FCV0) に基づいて、 励起信号 SEXCを再構 築する装置である。 この励起信号 SEXCは、 新たな適応コードベクトル ACVとし て適応コードべクトルデコーダ 22のメモリに書き込まれ、 同メモリ内の最も古 い適応コードべクトル AC Vが廃棄される。
LP合成フィルタ 28は、 励起信号 SEXC及び LSP係数 CLSPに基づいて LP 合成を行い、 音声信号 SSPCを再構築する装置である。
後処理フィル夕 29は、 音声信号 SSPCの後処理フィル夕リングを行う装置であ る。 この後処理フィル夕 29は、 ロング夕一ム後処理フィル夕、 ショート夕一ム 後処理フィル夕及び傾き補償フィル夕の 3つのフィル夕により構成されている。 これらの 3つのフィル夕は、 入力側から出力側に向かって、 ロングターム後処理 フィル夕 ショート夕一ム後処理フィル夕 傾き補償フィル夕の順番で直列に接 続されている。
ハイパスフィル夕/アップスケ一リング部 30は、 後処理フィル夕 29の出力 信号に対してハイパスフィル夕リング処理及びアップスケーリング処理を行う装 置である。
また、 音声復号器 20は、 誤り検出部 3 1と、 カウン夕部 32と、 切替制御部
33とを有している。 ここで、 誤り検出部 3 1は、 受信した符号化音声信号 BSのフレーム誤りを検 出し、 誤り検出信号 SERを出力する装置である。
また、 カウン夕部 32は、 誤り検出信号 SERに基づいて連続フレーム誤り数を カウントし、 カウント信号 SCNを出力する装置である。
さらに切替制御部 33は、 カウント信号 SCNによって示される連続フレーム誤 り数が所定の基準フレーム誤り数を越えた場合に、 その後、 フレーム誤りがなく なつてから所定フレーム数の間、 後述の切替スィツチ SW1を後述の第 3増幅器 44 (図 3参照) 側に切り替えるための切替制御信号 SSWを出力する装置である。 これらの誤り検出部 3 1と、 カウン夕部 32と、 切替制御部 33とは、 図 1に おける誤り検出部 2 1 Aと、 カウン夕部 22Aと、 切替制御部 23 Aとに対応し ている。
図 3は励起信号再構築部 27の構成例を示すプロック図である。
図 3に示すように、 励起信号再構築部 27は、 第 1増幅器 41と、 第 2増幅器 42と、 再構築部 43と、 切替スィッチ SW1と、 第 3増幅器 44とを有してい る。
ここで、 第 1増幅器 4 1は、 適応コードべクトル AC Vを適応コードブックゲ ィン AC Gに対応するゲインで増幅して増幅適応コ一ドべクトル ACV 1として 出力する。
また、 第 2増幅器 42は、 固定コードベクトル FCVを固定コードブックゲイ ン FCGに対応するゲインで増幅して増幅固定コードべクトル FCV 1として出 力する。
再構築部 43は、 増幅適応コードべクトル AC V 1及び増幅固定コードべクト ル FCV 1に基づいて原励起信号 SEXC0を再構築する。 この
切替スイッチ S W 1は、 切替制御信号 S SWが出力されていないときは原励起信 号 SEXC0を LP合成フィル夕 28に出力し、 切替制御信号 SSWが出力されている ときは原励起信号 S EXC0を第 3増幅器 44に出力する。
第 3増幅器 44は、 原励起信号 S EXC0を増幅して励起信号 S EXCとして L P合成 フィル夕 28に出力する。
(2) 音声復号器の動作 次に音声復号器の動作について説明する。
以下の説明においては、 基準連続フレーム誤り数を 「4」 とする。 また、 切替 制御部 33は、 連続フレーム誤り数が「4」 を越え、 その後フレーム誤りがなく なつてから 1フレームの間、 切替スィツチ SW1を第 3増幅器 44側に切り替え るための切替制御信号 SSWを出力するものとする。
①連続フレーム誤り数が「4」 以下の場合の動作
図 2において、 パラメ一夕デコーダ 21は、 受信した符号化音声信号 (ビット ストリーム) B Sからピッチ遅延パラメ一夕群 GP、 コードブックゲインパラメ —夕群 GG、 コードブックインデックスパラメ一夕群 GC及び LSP (Line Spe ctrum Pairs) ィンデックスパラメ一夕群 G Lを復号する。
そして、 パラメ一夕デコーダ 21は、 復号により得られたピッチ遅延パラメ一 夕群 GPを適応コードべクトルデコーダ 22に出力し、 コードブックゲインパラ メ一夕群 GGをゲインデコーダ 24に出力し、 コ一ドブックインデックスパラメ 一夕群 GCを固定コードベクトルデコーダ 23に出力し、 LSP (Line Spectru m Pairs) ィンデヅクスパラメ一夕群 GLを L S P再構築部 26に出力する。
LSP再構築部 26は、 LSPインデックスパラメ一夕群 GLに基づいて LS P係数 CLSPを再構築し、 LP合成フィルタ 28及び後処理フィル夕 29に出力す る。
適応コードべクトルデコーダ 22は、 ピッチ遅延パラメ一夕群 GPに基づいて 適応コードべクトル ACVを復号し、 励起信号再構築部 27に出力する。
固定コ一ドべクトルデコーダ 23は、 コ一ドブックインデックスパラメ一夕群 GCに基づいて原固定コードべクトル FCV0をデコードし、 適応前処理フィル夕 25に出力する。
適応前処理フィル夕 25は、 デコードされた原固定コードぺクトル FCV0に対 し、 その高調波成分を強調する強調処理を行って固定コ一ドべクトル FCVとし てゲインデコーダ 24及び励起信号再構築部 27に出力する。
ゲインデコーダ 24は、 固定コードベクトル FCV (あるいは原固定コードべ クトル F CV0) 及びコ一ドプックゲインパラメ一夕群 GGに基づいて適応コード ブヅクゲイン AC G及び固定コードブックゲイン FCGを励起信号再構築部 27 に出力する。
励起信号再構築部 27において、 第 1増幅器 4 1は、 適応コードべクトル AC Vを適応コ一ドブックゲイン A C Gに対応するゲインで増幅して増幅適応コ一ド べクトル ACV 1として再構築部 43に出力する。
また、 第 2増幅器 42は、 固定コードベクトル FCVを固定コードブックゲイ ン FCGに対応するゲインで増幅して増幅固定コードべクトル FCV 1として再 構築部 43に出力する。
再構築部 43は、 増幅適応コードべクトル ACV1及び増幅固定コードべク卜 ル FCV 1に基づいて原励起信号 SEXC0を再構築し、 切替スィツチ SW1に出力 する。
ここで、 符号化音声信号 B Sの連続フレーム誤り数が所定の基準フレーム誤り 数「4」 以下の場合、 切替スィッチ SW1は、 LP合成フィル夕 28側に設定さ れている。
従って、 原励起信号 SEXC0は、 励起信号 SEXCとして、 LP合成フィル夕 28に 出力される。 また、 この励起信号 SEXCは、 新たな適応コードベクトル ACVとし て適応コードべクトルデコーダ 22のメモリに書き込まれ、 同メモリ内の最も古 い適応コードべクトル AC Vが廃棄される。
LP合成フィル夕 28は、 励起信号 SEXC及び L SP係数 CLSPに基づいて LP 合成を行って音声信号 SSPCを再構築し、 後処理フィルタ 29に出力する。
後処理フィル夕 29は、 音声信号 SSPCの後処理フィル夕リングを行って、 ハイ パスフィル夕/アップスケ一リング部 30に出力する。
ハイパスフィル夕/アップスケーリング部 30は、 入力された音声信号 SSPC のハイパスフィル夕リング処理及びアップスケーリング処理を行って復号音声信 号 SPとして出力することとなる。
このように連続フレーム誤り数が 4以下の場合、 すなわち、 符号化音声信号 B Sの受信状態が良い場合には、 適正なレベルの励起信号 SEXCが適応コードぺクト ルデコーダ 22のメモリに書き込まれ、 このようにしてメモリに書き込まれた過 去の励起信号 SEXCを用いて復号化が行われるので、 最適な電力量を有する復号音 声信号 SPが出力されることとなる。 ②フレーム誤りが連続して発生した場合の動作
フレーム誤りが生じると、 復号結果を急速に減衰させるコンシールメント処理 が行われる。 このコンシールメント処理が複数フレーム周期に亙って続くと、 適 応コードべクトルデコーダ 22のメモリ内の適応コードべクトル AC Vが次第に 「0」 に近づいてゆく。 なお、 このコンシールメント処理については、 文献 " De sign and Description of CS-ACELP: A Toll Quality 8kb/s Speech Coder" ,IE EE Trans, on Speech and Audio Processing, vol.6 No.2, March 1998に説明さ れている。
③連続フレーム誤り数が 「4」 を越え、 その後、 フレーム誤りがなくなった場合 の動作
この場合、 切替制御部 33は、 フレーム誤りがなくなったタイミングから 1フ レームの間、 切替スィツチ SW 1を第 3増幅器 44側に切り替えるための切替制 御信号 SSWを出力する。
この結果、 励起信号再構築部 27では、 再構築部 43から出力された原励起信 号 SEXC0が切替スィツチ SW1を介して第 3増幅器 44に送られる。
ここで、 原励起信号 SEXC0は、 連続的にコンシールメント処理が行われた直後 のものであるため、 そのレベルは僅かである。 しかし、 原励起信号 SEXC0は、 第 3増幅器 44によって増幅され、 励起信号 SEXCとして LP合成フィル夕 28に出 力されるとともに新たな適応コードべクトル ACVとして適応コ一ドべクトルデ コーダ 22のメモリに書き込まれる。
このため、 音声復号器 20の過去の内部状態、 すなわち、 適応コードベクトル デコーダ 22のメモリ内の適応コ一ドべクトル ACVが早期に正常なときの状態 に復帰し、 正常な場合とほぼ同様な電力量を有する復号音声信号 SPが出力され ることとなる。
したがって、 復号音声信号 S Pの主観音声品質が増幅処理を行わない場合と比 較して向上されることとなる。
D. 実施形態の変形例
以上の説明においては、 音声信号処理装置の具体例として、 CS— ACELP 方式の音声復号器の場合について説明したが、 本発明は、 予測符号化を行ってい る音声信号処理装置であれば、 他の方式の音声信号処理装置にも適用が可能であ り、 例えば、 APC (Adaptive Predictive Coding) 、 LPC (Linear Predict ion Coding) 、 RELP (Residual Excited LPC) 、 CELP (Code Excited L PC) 、 などの方式を用いた音声復号器についても適用が可能である。

Claims

請求の範囲
1 . 予測符号化された符号化音声信号のフレームを受け取り、 該符号化音声信号 と内部状態とから励起信号を生成し、 この励起信号に基づいて復号音声信号を生 成するとともに前記内部状態を更新し、 フレームの符号誤りがあつた場合には前 記励起信号を減衰させるコンシールメント処理を行う音声復号器において、 所定の基準フレーム誤り数を越える連続したフレーム誤りが生じた場合に、 こ の連続したフレーム誤りがなくなつてから一定期間、 増幅指示信号を出力する増 幅制御手段と、
前記増幅指示信号が出力されている間、 前記励起信号を増幅する増幅手段と、 を備えたことを特徴とする音声復号器。
2 . 前記増幅制御手段は、
前記フレーム誤りを検出し、 誤り検出信号を出力する誤り検出手段と、 前記誤り検出信号に基づいて、 連続したフレーム誤りのフレーム数をカウント し、 連続フレーム誤り数を出力するカウント手段と、
前記カウント手段から出力される連続フレーム誤り数が前記基準フレーム誤り 数を越えた場合に、 その後、 フレーム誤りがなくなつてから一定期間、 前記増幅 指示信号を出力する增幅指示信号出力手段と、
を備えたことを特徴とする請求項 1に記載の音声復号器。
3 . C E L P方式に音声符号化器によつて符号化された信号の復号を行うことを 特徴とする請求項 1に記載の音声復号器。
4 . 予測符号化された符号化音声信号のフレームを受け取り、 該符号化音声信号 と内部状態とから励起信号を生成し、 この励起信号に基づいて復号音声信号を生 成するとともに前記内部状態を更新し、 フレームの符号誤りがあつた場合には前 記励起信号を減衰させるコンシールメント処理を行う音声復号方法において、 所定の基準フレーム誤り数を越える連続したフレーム誤りが生じた場合には、 この連続したフレーム誤りがなくなつてから所定フレーム数の間、 前記励起信号 を増幅することを特徴とする音声復号方法。
PCT/JP1999/002801 1998-05-27 1999-05-27 Decodeur de son et procede de decodage de son WO1999062055A1 (fr)

Priority Applications (4)

Application Number Priority Date Filing Date Title
DE69942658T DE69942658D1 (de) 1998-05-27 1999-05-27 Verfahren und vorrichtung zur dekodierung eines schaltsignals
JP54238699A JP3554566B2 (ja) 1998-05-27 1999-05-27 音声復号器および音声復号方法
US09/462,126 US6714908B1 (en) 1998-05-27 1999-05-27 Modified concealing device and method for a speech decoder
EP99922522A EP1001541B1 (en) 1998-05-27 1999-05-27 Sound decoder and sound decoding method

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP10/146194 1998-05-27
JP14619498 1998-05-27

Publications (1)

Publication Number Publication Date
WO1999062055A1 true WO1999062055A1 (fr) 1999-12-02

Family

ID=15402266

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP1999/002801 WO1999062055A1 (fr) 1998-05-27 1999-05-27 Decodeur de son et procede de decodage de son

Country Status (6)

Country Link
US (1) US6714908B1 (ja)
EP (1) EP1001541B1 (ja)
JP (1) JP3554566B2 (ja)
CN (1) CN1134762C (ja)
DE (1) DE69942658D1 (ja)
WO (1) WO1999062055A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3881157B2 (ja) * 2000-05-23 2007-02-14 株式会社エヌ・ティ・ティ・ドコモ 音声処理方法及び音声処理装置
US7409338B1 (en) * 2004-11-10 2008-08-05 Mediatek Incorporation Softbit speech decoder and related method for performing speech loss concealment
KR100723409B1 (ko) * 2005-07-27 2007-05-30 삼성전자주식회사 프레임 소거 은닉장치 및 방법, 및 이를 이용한 음성복호화 방법 및 장치
CA3160488C (en) 2010-07-02 2023-09-05 Dolby International Ab Audio decoding with selective post filtering
EP2922056A1 (en) 2014-03-19 2015-09-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and corresponding computer program for generating an error concealment signal using power compensation
EP2922055A1 (en) 2014-03-19 2015-09-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and corresponding computer program for generating an error concealment signal using individual replacement LPC representations for individual codebook information
EP2922054A1 (en) 2014-03-19 2015-09-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and corresponding computer program for generating an error concealment signal using an adaptive noise estimation
JP6906876B2 (ja) * 2017-06-19 2021-07-21 アールティーエックス アー/エス オーディオ信号の符号化および復号化

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05113798A (ja) * 1991-07-15 1993-05-07 Nippon Telegr & Teleph Corp <Ntt> 音声復号方法
JPH09101800A (ja) * 1995-10-04 1997-04-15 Matsushita Electric Ind Co Ltd 音声復号化装置
JPH09134198A (ja) * 1995-11-10 1997-05-20 Nec Corp 音声復号化装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4178549A (en) * 1978-03-27 1979-12-11 National Semiconductor Corporation Recognition of a received signal as being from a particular transmitter
CN1100396C (zh) * 1995-05-22 2003-01-29 Ntt移动通信网株式会社 语音解码器
US5664055A (en) * 1995-06-07 1997-09-02 Lucent Technologies Inc. CS-ACELP speech compression system with adaptive pitch prediction filter gain based on a measure of periodicity
US5699485A (en) * 1995-06-07 1997-12-16 Lucent Technologies Inc. Pitch delay modification during frame erasures
US5732389A (en) * 1995-06-07 1998-03-24 Lucent Technologies Inc. Voiced/unvoiced classification of speech for excitation codebook selection in celp speech decoding during frame erasures

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05113798A (ja) * 1991-07-15 1993-05-07 Nippon Telegr & Teleph Corp <Ntt> 音声復号方法
JPH09101800A (ja) * 1995-10-04 1997-04-15 Matsushita Electric Ind Co Ltd 音声復号化装置
JPH09134198A (ja) * 1995-11-10 1997-05-20 Nec Corp 音声復号化装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP1001541A4 *

Also Published As

Publication number Publication date
JP3554566B2 (ja) 2004-08-18
EP1001541B1 (en) 2010-08-11
EP1001541A4 (en) 2001-02-21
CN1134762C (zh) 2004-01-14
EP1001541A1 (en) 2000-05-17
CN1272199A (zh) 2000-11-01
US6714908B1 (en) 2004-03-30
DE69942658D1 (de) 2010-09-23

Similar Documents

Publication Publication Date Title
EP2041745B1 (en) Adaptive encoding and decoding methods and apparatuses
JP3432082B2 (ja) フレーム消失の間のピッチ遅れ修正方法
Andersen et al. iLBC-a linear predictive coder with robustness to packet losses
AU2002221389B2 (en) Indexing pulse positions and signs in algebraic codebooks for coding of wideband signals
EP1141946B1 (en) Coded enhancement feature for improved performance in coding communication signals
JP3392412B2 (ja) 音声コーディング装置及び音声エンコーディング方法
EP0503684A2 (en) Vector adaptive coding method for speech and audio
JP3354138B2 (ja) 音声符号化
US20050261897A1 (en) Method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding
CN113223540B (zh) 在声音信号编码器和解码器中使用的方法、设备和存储器
JPH09120298A (ja) フレーム消失の間の音声復号に使用する音声の有声/無声分類
JP3180762B2 (ja) 音声符号化装置及び音声復号化装置
WO2001059757A2 (en) Method and apparatus for compression of speech encoded parameters
US5659659A (en) Speech compressor using trellis encoding and linear prediction
JP3357795B2 (ja) 音声符号化方法および装置
JP3554567B2 (ja) 音声復号器および音声復号方法
US6768978B2 (en) Speech coding/decoding method and apparatus
JP2002268696A (ja) 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体
JP3582589B2 (ja) 音声符号化装置及び音声復号化装置
JP3554566B2 (ja) 音声復号器および音声復号方法
US5933802A (en) Speech reproducing system with efficient speech-rate converter
JPH09120297A (ja) フレーム消失の間のコードブック利得減衰
JP4438280B2 (ja) トランスコーダ及び符号変換方法
JPH05165499A (ja) Lsp係数の量子化方法
JP3319396B2 (ja) 音声符号化装置ならびに音声符号化復号化装置

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 99800841.9

Country of ref document: CN

AK Designated states

Kind code of ref document: A1

Designated state(s): CN JP US

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LU MC NL PT SE

WWE Wipo information: entry into national phase

Ref document number: 09462126

Country of ref document: US

WWE Wipo information: entry into national phase

Ref document number: 1999922522

Country of ref document: EP

121 Ep: the epo has been informed by wipo that ep was designated in this application
WWP Wipo information: published in national office

Ref document number: 1999922522

Country of ref document: EP