WO2006064879A1 - 音声符号化方法、音声復号化方法、音声符号化装置および音声復号化装置 - Google Patents

音声符号化方法、音声復号化方法、音声符号化装置および音声復号化装置 Download PDF

Info

Publication number
WO2006064879A1
WO2006064879A1 PCT/JP2005/023053 JP2005023053W WO2006064879A1 WO 2006064879 A1 WO2006064879 A1 WO 2006064879A1 JP 2005023053 W JP2005023053 W JP 2005023053W WO 2006064879 A1 WO2006064879 A1 WO 2006064879A1
Authority
WO
WIPO (PCT)
Prior art keywords
decoded
band
speech
important
signal
Prior art date
Application number
PCT/JP2005/023053
Other languages
English (en)
French (fr)
Inventor
Yutaka Banba
Original Assignee
Matsushita Electric Industrial Co., Ltd.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co., Ltd. filed Critical Matsushita Electric Industrial Co., Ltd.
Publication of WO2006064879A1 publication Critical patent/WO2006064879A1/ja

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals

Definitions

  • Speech coding method speech decoding method, speech coding apparatus, and speech decoding apparatus
  • the present invention relates to a high-quality, low-delay speech coding method, speech decoding method, speech coding apparatus, and speech decoding apparatus with little degradation of decoded speech when a transmission error occurs.
  • PHS Personal Handy phone
  • FIG. 8 is a block diagram of a decoder (decoding device) in a conventional speech coding / decoding method.
  • a conventional decoder (decoding device) in PHS consists of a C RC detector 401, an ADPCM decoder 402, and a mute means 403, which receives a received frame and detects a transmission error by the CRC detector 401. In this case, the mute means 403 is instructed to mute.
  • the ADPCM decoder 402 has a function of decoding the received compressed codeword into a speech signal.
  • the transmission side adds CRC check code bits to all audio signals encoded and compressed by the ADPC M method for each transmission frame and transmits them. When there is a transmission error, the receiving side mutes the decoded speech silently (for example, see Patent Document 1).
  • Patent Document 1 Japanese Patent Application Laid-Open No. 2004-48281 (FIG. 8)
  • the present invention has been made in view of the above circumstances, and in high-quality speech / acoustic signal coding with a relatively high sampling frequency, the addition of redundant bits such as a CRC code reduces transmission efficiency.
  • An object is to provide a speech encoding method, speech decoding method, speech encoding device, and speech decoding device.
  • the speech coding method divides a high-quality speech signal having a sampling frequency equal to or higher than a predetermined frequency into a plurality of frequency bands, and applies an adaptive difference to the down-sampled signal with a different number of information bits per band.
  • the coded and adaptive differentially encoded codeword bits are classified into important bits and non-important bits according to the degree of degradation of the decoded speech when a transmission error occurs.
  • a CRC code is added to the important bit string, and a transmission frame including the important bit string and the non-important bit string to which the CRC code is added is generated.
  • the speech coding method according to the present invention can increase transmission efficiency by adding only a few RC detection codes while suppressing deterioration in sound quality due to transmission errors.
  • the speech decoding method separates the transmission frame encoded by the speech encoding method into an important bit sequence to which the CRC code is added and an unimportant bit sequence, A codeword for each band is generated from the important bit string and the non-important bit string, a dequantized signal for each band is decoded based on the codeword for each band, and the dequantization for each band is performed.
  • the speech decoding method according to the present invention can improve transmission efficiency with only a small number of CRC detection code additions while suppressing deterioration in sound quality due to transmission errors, and can reduce the calculation amount of CRC detection. .
  • the speech decoding method includes an important bit sequence in which the CRC code is added to the transmission frame encoded by the speech encoding method and the non-important bit sequence. And generating a codeword for each band from the significant bit string and the non-important bit string, decoding a dequantized signal for each band based on the codeword for each band, A speech decoding method for generating a decoded speech signal by filtering the dequantized signal in each of the above-mentioned bands, and in a pitch period unit represented by a bandwidth assigned to a low frequency of speech decoded in the past. Repetitive waveforms are extracted and buffered, and an error is detected in the important bit string to which the CRC code is added. When an error is detected in the important bit string, the pitch period unit decoded in the past is detected. Replace with the repeated waveform frame at.
  • the speech decoding method includes an important bit sequence in which the CRC code is added to the transmission frame encoded by the speech encoding method and the non-important bit sequence. And generating a codeword for each band from the important bit string and the non-important bit string, and decoding and decoding the dequantized signal of each band based on the codeword for each band.
  • a voice decoding method that filters the dequantized signal in each band to generate a decoded voice signal, and is a repetitive waveform in pitch periods expressed in the band assigned to the low frequency range of the previously decoded voice Is extracted and buffered, and error detection is performed on the important bit sequence to which the CRC code is added. When an error is detected in the important bit sequence, a repetitive waveform in units of the pitch period decoded in the past is used. Current recovery Duplicate the summing and voice.
  • the speech decoding method includes an important bit sequence in which the CRC code is added to the transmission frame encoded by the speech encoding method, and the non-important bit sequence. And generating a codeword for each band from the important bit string and the non-important bit string, and decoding and decoding the dequantized signal of each band based on the codeword for each band.
  • This is a voice decoding method for filtering a band dequantized signal and generating a decoded voice signal. A repetitive waveform in a pitch period unit represented by a band assigned to a low frequency band of previously decoded voice is obtained. Extraction and buffering are performed, and error detection is performed on the important bit string to which the CRC code is added.
  • the speech decoding method includes an important bit sequence in which the CRC code is added to the transmission frame encoded by the speech encoding method and the non-important bit sequence. And generating a codeword for each band from the important bit string and the non-important bit string, and decoding and decoding the dequantized signal of each band based on the codeword for each band.
  • a voice decoding method that filters the dequantized signal in each band to generate a decoded voice signal, and is a repetitive waveform in pitch periods expressed in the band assigned to the low frequency range of the previously decoded voice Are extracted and buffered, and an error is detected in the important bit string to which the CRC code is added. If an error is detected in the important bit string, the code word is restricted and the error is detected in the past.
  • the speech coding apparatus divides a high-quality speech signal having a sampling frequency equal to or higher than a predetermined frequency into a plurality of frequency bands, and generates a down-sampled signal for each of the divided bands.
  • a filter bank, a plurality of ADPCM encoders for adaptively differentially encoding the divided down-sampled signals for each band with different numbers of information bits for each band, and each bit of the adaptive differentially encoded codeword A classifier that generates an important bit string and an unimportant bit string according to the degree of degradation of decoded speech when a transmission error occurs, and a CRC code is added to the important bit string.
  • a CRC adder, and a multiplexer that generates a transmission frame including the important bit sequence and the non-important bit sequence to which the CRC code is added. That.
  • the speech coding apparatus can improve transmission efficiency with only a small number of CRC detection codes while suppressing deterioration in sound quality due to transmission errors.
  • the speech decoding apparatus includes an important bit sequence to which the CRC code is added and an unimportant bit sequence, with respect to the transmission frame encoded by the speech encoding device.
  • a demultiplexer for separating, a CRC error detector for performing CRC code check of the important bit string to which the CRC code is added, and a class combiner for generating a code word for each band from the important bit string and the non-important bit string;
  • An ADPCM decoder that decodes a dequantized signal in each band based on a codeword for each band; and a band synthesis filter bank that filters the decoded dequantized signal in each band and generates a decoded speech signal
  • a codeword limiter that limits the codeword when a transmission error is detected by the CRC error detector.
  • the speech decoding apparatus can improve transmission efficiency with only a small number of CRC detection code additions while suppressing deterioration in sound quality due to transmission errors, and can reduce the calculation amount of CRC detection. .
  • means for extracting and buffering a repetitive waveform in units of pitch periods expressed in a band assigned to a low frequency of speech decoded in the past, and a transmission error means for overlappingly adding a repetitive waveform in the unit of the pitch period decoded in the past and the current decoded speech when detected.
  • the present invention provides a wireless communication apparatus having means for executing the speech encoding method described above. According to this configuration, it is possible to realize a wireless communication apparatus with little deterioration in sound quality when a transmission error occurs.
  • the present invention provides a wireless communication apparatus having means for executing any of the speech decoding methods described above. According to this configuration, it is possible to realize a wireless communication apparatus with little deterioration in sound quality when transmission errors occur.
  • the present invention provides a wireless microphone having means for executing the speech encoding method described above.
  • a transmission device of a system is provided. According to this configuration, it is possible to realize a transmission device for a wireless microphone system with little deterioration in sound quality when a transmission error occurs.
  • the present invention provides a receiving device for a wireless microphone system having means for executing any of the speech decoding methods described above. According to this configuration, it is possible to provide a receiving device for a wireless microphone system with little deterioration in sound quality when a transmission error occurs.
  • the present invention it is possible to improve transmission efficiency by adding only a small number of CRC detection codes while suppressing deterioration in sound quality due to transmission errors, and to reduce the amount of calculation of CRC detection. It is possible to provide a speech encoding method, a speech decoding method, a speech encoding device, a speech decoding device, a wireless communication device, a transmitting device and a receiving device of a wireless microphone system.
  • FIG. 1 is a block diagram of a speech encoding apparatus to which a speech encoding method according to the present invention is applied.
  • FIG. 2 is a block diagram of a speech decoding apparatus to which the speech decoding method according to the present invention is applied.
  • FIG. 3 is a block diagram of a speech decoding apparatus to which another speech decoding method according to the present invention is applied.
  • FIG. 4 shows the relationship between time and weight in overlap addition in the speech decoding apparatus shown in FIG. Graph showing
  • FIG. 5 is a block diagram of a wireless communication apparatus according to an embodiment of the present invention.
  • FIG. 6 is a block diagram of a transmitter of the wireless microphone system according to the embodiment of the present invention.
  • FIG. 7 is a block diagram of the receiving device of the wireless microphone system according to the embodiment of the present invention.
  • FIG. 8 A block diagram of a decoder in a conventional speech encoding / decoding method.
  • FIG. 1 is a block diagram of a speech coding apparatus to which a speech coding method according to the present invention is applied.
  • the speech coding apparatus 100 shown in FIG. 1 divides a high-quality speech signal with a sampling frequency of 16 KHz or higher into multiple (four) frequency bands, and generates a down-sampled signal for each of the divided bands.
  • Each bit of the codeword is divided into an important bit and an insignificant bit according to the degree of deterioration of the decoded speech when a transmission error occurs.
  • Classifier 106 that generates important bit sequences and non-important bit sequences
  • CRC adder 107 that adds CRC codes to the important bit sequences, and important bit sequences and non-important bit sequences to which CRC codes are added
  • a multiplexer 108 that generates a transmission frame including
  • the discretized speech signal is input to band division filter bank 101.
  • band division filter bank 101 a band pass filter is applied in an equal division band, and thinning (downsampling) is performed at a 4: 1 thinning rate corresponding to the number of divisions.
  • Each thinned signal in each band is adaptive differentially encoded in each ADPCM encoder 102-105. At this time, the number of encoded information bits in ADPCM encoders 102 to 105 for each band is allocated unevenly, and the allocation may be performed adaptively.
  • ADPCM codewords for each band are classified by a classifier 106 that compiles several codewords into bits that are important in sound quality and bits that are not important (unimportant bits).
  • the CRC code is added by the CRC adder 107 for the important bit string.
  • the important bit string to which the CRC code is added and the other bit string (non-important bit string) are respectively supplied to the multiplexer 108 to form a transmission frame.
  • a transmission frame is usually transmitted with a preamble, a synchronization code, and the like added to the receiving side.
  • FIG. 2 is a block diagram of a speech decoding apparatus to which the speech decoding method according to the present invention is applied.
  • the speech decoding apparatus 200 shown in FIG. 2 includes a demultiplexer 201 that separates a received transmission frame into an important bit string to which a CRC code is added and other bit strings (non-important bit strings), and a CRC code.
  • a CRC error detector 202 that performs CRC code check of an important bit string
  • a class combiner 203 that generates a compression codeword for each band from an important bit string and a non-important bit string (non-important bit string)
  • a codeword limiter 204 that limits the codeword in the transmission frame
  • a plurality of (four) ADPCM decoders 205 that receive the codeword and decode the dequantized signal in each band.
  • ⁇ 208 and a band synthesis filter bank 209 that filters the decoded signals of each band and generates a decoded voice signal.
  • the audio decoding device 200 side On the receiving side, the audio decoding device 200 side, from the transmission frame, a preamble or synchronization
  • the information power from which the code and the like are removed is sent to the demultiplexer 201, where it is decomposed into the important bit string with the CRC code attached and the other bit string (non-important bit string).
  • the important bit string to which the CRC code is added is checked by the CRC error detector 202 to determine whether it contains a transmission error. Furthermore, the CRC code and the important bit string are separated here.
  • the important bits ⁇ IJ and the other bit strings (non-important bit strings) are input to the class combiner 203 and returned to the ADPCM codeword for each band.
  • the ADPCM codeword limits the ADPCM codeword in the band including the significant bits when an error is detected in the codeword limiter 204.
  • the ADPCM codeword for the first subband only is limited as an example. Depending on the sampling frequency, the number of band divisions, etc., the A DPCM codeword for the second subband and the third subband is used. Codeword restriction may be performed. Codeword restriction is performed as shown in (Equation 1) below.
  • ADPCM codewords that are code-limited and non-code-limited ADPCM codewords when an error occurs are all sent to ADPCM decoders 205 to 208 for each band.
  • ADPCM decoders 205 to 208 in each band decode with the same number of information bits as the encoder.
  • the signal for each band after decoding is sent to the band synthesis filter bank 209 and output as decoded speech.
  • speech encoding apparatus 100 shown in FIG. 1, speech decoding apparatus 200 shown in FIG. 2, and such speech encoding method and speech decoding method relatively high quality is achieved.
  • a voice / acoustic signal with a high sampling frequency is band-divided, and bits that are important in terms of sound quality are extracted, bit strings are formed, and errors are detected in the important bits, so only a few CRC codes are added. Since the number of redundant bits per unit time can be reduced, transmission efficiency You can raise the rate. In addition, the amount of computation can be greatly reduced because the system does not perform error correction processing such as Viterbi decoding.
  • FIG. 3 is a block diagram of a speech decoding apparatus to which another speech decoding method according to the present invention is applied.
  • the audio decoding device 300 shown in FIG. 3 receives a received frame and demultiplexes it into an important bit string to which a CRC code is added and other bit strings (non-important bit strings), and a CRC code is added.
  • CRC error detector 202 that performs error detection and extraction of the important bit string, and received codewords of ADPCM decoders 205 to 208 for each band from the important bit string and other bit strings (non-important bit string)
  • a codeword limiter 204 that limits the codeword in the transmission frame, and receives the codeword and converts the dequantized signal of each band.
  • ADPCM decoder 205 to 208 for decoding waveform buffer 301 for buffering the decoded waveform of the first decoded first subband, pitch extractor 302 for extracting the pitch of the decoded waveform, and transmission error
  • the replacement waveform extractor 303 which extracts the waveform one pitch before from the waveform buffer 301, and the waveform in order to smoothly connect the past decoded waveform and the current decoded waveform.
  • the switching switch 307 includes a counter 308 that performs timer control based on information from the CRC error detector 202, and a band synthesis filter bank 209 that generates a decoded speech signal by filtering the decoded signal of each band. It is composed.
  • speech decoding apparatus 300 configured as described above will be described.
  • information obtained by removing a preamble, a synchronization code, and the like from a received transmission frame is sent to a demultiplexer 201, and is decomposed into an important bit string to which a CRC code is added and other bit strings (non-important bit strings).
  • the CRC error detector 202 checks whether the important bit string to which the CRC code is added includes a transmission error. Furthermore, the CRC code and the important bit ⁇ 1J are separated here.
  • the important bit string and the other bit strings (non-important bits ⁇ IJ) are input to the class combiner 203 and returned to the ADPCM codeword for each band.
  • the codeword limiter 204 limits the ADPCM codeword in the band including the significant bits.
  • the ADPCM codeword of the second subband and the third subband is coded according to the force S that restricts the ADPCM codeword of only the first subband, the sampling frequency, the number of band divisions, etc. Word restriction may be performed.
  • (Equation 1) described above is used.
  • ADPCM codewords that are code-limited and non-code-limited ADPCM codewords when an error occurs are all sent to ADPCM decoders 205 to 208 for each band. At this time, the A DPCM decoders 205 to 208 of each band decode with the same number of information bits as that of the coding apparatus 100.
  • the decoded waveform buffered in the waveform buffer 301 is detected by the pitch extractor 302. Pitch detection is performed only when an error is detected, using a waveform buffer that does not include past errors.
  • the replacement waveform extractor 303 uses the pitch information from the pitch extractor 302 to extract the waveform for one frame decoded from the waveform buffer 301 one pitch before.
  • the extracted waveform is weighted by the multiplier 304 and output as a decoded waveform of the first subband for a while as a waveform added by the adder 306 (overlapping addition waveform).
  • the switch to normal ADPCM decoded speech is made by switch 307.
  • the value of ⁇ takes a form of decreasing as needed.
  • FIG. 4 shows an example in which the weight ⁇ is changed linearly.
  • the force weight ⁇ may be changed in a curve.
  • the signal for each band after decoding is sent to the band synthesis filter bank 209 and output as decoded speech.
  • the pitch period is detected from the signal waveform decoded in the past, and the waveform replacement is performed by performing overlapping addition when an error occurs.
  • the amount of processing increases, but it is possible to further suppress degradation of decoded speech when an error occurs.
  • FIG. 5 is a block diagram of the wireless communication apparatus according to the embodiment of the present invention.
  • the radio communication apparatus 500 shown in FIG. 5 amplifies the audio signal collected by the microphone 501 by the low frequency amplifier 502, converts it to a digital audio signal by the A / D converter 503, and outputs the digital audio signal to the audio coding apparatus 100.
  • the bit stream that has been subband encoded by the speech coding apparatus 100 shown in FIG. 1 and formed as a transmission frame is supplied to the transmission unit 504, which performs predetermined digital modulation and power amplification. And transmit as a radio wave from the antenna 506 via the antenna sharing device 505.
  • a signal received by antenna 506 is supplied to receiving section 507 via antenna sharing device 505, subjected to high frequency amplification by receiving section 507, demodulated, and supplied to speech decoding apparatus 300.
  • the digital audio signal decoded by the audio decoding device 300 shown in FIG. 3 is converted into an analog audio signal by the D / A converter 508, amplified by the power amplifier 509, and reproduced by the speaker 510.
  • FIG. 6 is a block diagram of the transmission device of the wireless microphone system according to the embodiment of the present invention.
  • the transmitter 600 of the wireless microphone system shown in FIG. 6 amplifies the audio signal collected by the microphone mouthphone 601 by the low frequency amplifier 602, converts it to a digital audio signal by the A / D converter 603, and converts the audio signal into an audio encoding device. Supply to 100.
  • a bit stream that has been subband encoded by the speech encoding apparatus 100 shown in FIG. 1 and formed as a transmission frame is supplied to the transmission unit 604, and the transmission unit 504 performs predetermined digital modulation to perform power amplification.
  • FIG. 7 is a block diagram of a receiving device of the wireless microphone system according to the embodiment of the present invention.
  • the signal received by the antenna 701 is supplied to the receiving unit 702, subjected to high frequency amplification by the receiving unit 702, demodulated, and then supplied to the audio decoding device 300.
  • the digital audio signal decoded by the audio decoding device 300 shown in FIG. 3 is converted into an analog audio signal by the D / A converter 703, amplified by the power amplifier 704, and reproduced by the speaker 705.
  • the present invention it is possible to improve transmission efficiency by adding only a small number of CRC detection codes while suppressing deterioration in sound quality due to transmission errors, and to reduce the amount of calculation of CRC detection. It is useful for speech encoding methods, speech decoding methods, speech encoding devices, speech decoding devices, wireless communication devices, wireless microphone system transmitters and receivers, and the like.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Error Detection And Correction (AREA)
  • Detection And Prevention Of Errors In Transmission (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

 本発明の課題は、低遅延で高品位かつ伝送誤りに対して音質劣化の少ない音声符号化方法、音声復号化方法、音声符号化装置および音声復号化装置を提供することである。  符号化装置側では、音声信号を複数の周波数帯域に分割し、ダウンサンプリングした信号を各帯域ごとに適応差分符号化し、伝送誤り発生時における復号音声の劣化度合に応じて重要ビットと非重要ビットとにクラス分けし、重要ビット列に対してのみCRC符号を付加する。復号化装置(300)では、CRCエラー検出器(202)によって誤りを検出したときは、符号語制限器(204)によって符号語に対して制限を行ない、また、ピッチ抽出器(302)によって基本周波数を逐次計算しておいて、過去のピッチ波形との重複加算を行ない、帯域合成フィルタバンク(209)によって音声信号を復号する。

Description

明 細 書
音声符号化方法、音声復号化方法、音声符号化装置および音声復号化 装置
技術分野
[0001] 本発明は、伝送誤り時に復号音声の劣化が少ない、高品位で低遅延な音声符号 化方法、音声複号化方法、音声符号化装置および音声復号化装置に関する。
背景技術
[0002] 従来の音声復号化方法および装置の例として、 PHS (Personal Handy phone
System)を例に説明する。図 8は従来の音声符号化 '復号化方法における復号器 (複号化装置)のブロック図である。 PHSにおける従来の復号器 (複号化装置)は、 C RC検出器 401、 ADPCM復号器 402、ミュート手段 403で構成されており、受信フ レームを受け取り、 CRC検出器 401にて伝送誤りを検出した場合、ミュート手段 403 にミュートするように命令する作用を持つ。また、 ADPCM復号器 402は受信した圧 縮符号語を音声信号に復号する作用を持つ。送信側は、伝送フレームごとに ADPC M方式によって符号化圧縮した音声信号のすべてに CRCチェック符号ビットを付カロ して伝送する。受信側は、伝送誤りがあった場合、復号化される音声を無音にミュー トする (例えば、特許文献 1参照)。
[0003] 特許文献 1 :特開 2004— 48281号公報(図 8)
発明の開示
発明が解決しょうとする課題
[0004] し力、しながら、サンプリング周波数の高い高品位の音声 ·音響信号をごく低遅延で( エンコード +デコードで例えば 6ms以内)、し力、も無線通信などのような厳しい伝送 路条件を通して符復号する場合、従来のように適応差分符号化 (ADPCM)をそのま ま使用すると、サンプリング周波数が高いので、 1伝送フレームの時間長は短いため 、 CRC検出の処理量が増えるという問題があり、さらに誤りを検知したときに伝送フレ ーム分の時間ミュートされてしまうため、復号音声品質が悪くなるという問題があった [0005] 本発明は、上記事情に鑑みてなされたもので、サンプリング周波数の比較的高い 高品位な音声 ·音響信号の符号ィヒにおいて、 CRC符号などの冗長ビット付加が少な ぐ伝送効率のよい音声符号化方法、音声復号化方法、音声符号化装置および音 声複号化装置を提供することを目的とする。
課題を解決するための手段
[0006] 本発明に係る音声符号化方法は、サンプリング周波数が所定の周波数以上の高 品位音声信号を複数の周波数帯域に分割し、ダウンサンプリングした信号を帯域ご とに異なる情報ビット数で適応差分符号化し、適応差分符号化された符号語の各ビ ットを伝送誤り発生時における復号音声の劣化度合に応じて重要ビットと非重要ビッ トとにクラス分けし、重要ビット列と非重要ビット列とを生成し、前記重要ビット列に対し て CRC符号を付加し、前記 CRC符号が付加された重要ビット列と非重要ビット列とを 含む伝送フレームを生成する。
[0007] 本発明に係る音声符号化方法は、伝送誤りによる音質劣化を抑えながら、少ない C RC検出符号の付加のみで伝送効率を上げることができる。
[0008] 本発明に係る音声復号化方法は、上記の音声符号化方法により符号化された伝 送フレームに対して、前記 CRC符号が付加された重要ビット列と前記非重要ビット列 とに分離し、前記重要ビット列と前記非重要ビット列とから各帯域ごとの符号語を生成 し、前記各帯域ごとの符号語に基づいて各帯域の逆量子化信号を復号し、復号した 前記各帯域の逆量子化信号をフィルタリングし、復号音声信号を生成する音声復号 化方法であって、前記 CRC符号が付加された重要ビット列の誤り検出を行なレ、、前 記重要ビット列に誤りが検出されたときは、前記符号語を制限する。
[0009] 本発明に係る音声複号化方法は、伝送誤りによる音質劣化を抑えながら、少ない C RC検出符号の付カ卩のみで伝送効率を上げることができ、 CRC検出の演算量を削減 できる。
[0010] また、本発明に係る音声復号化方法は、上記の音声符号化方法により符号化され た伝送フレームに対して、前記 CRC符号が付加された重要ビット列と前記非重要ビ ット列とに分離し、前記重要ビット列と前記非重要ビット列とから各帯域ごとの符号語 を生成し、前記各帯域ごとの符号語に基づいて各帯域の逆量子化信号を復号し、復 号した前記各帯域の逆量子化信号をフィルタリングし、復号音声信号を生成する音 声復号化方法であって、過去に復号された音声の低域に割り当てた帯域で表れるピ ツチ周期単位での繰り返し波形を抽出してバッファリングし、前記 CRC符号が付加さ れた重要ビット列の誤り検出を行なレ、、前記重要ビット列に誤りが検出されたときは、 過去に復号された前記ピッチ周期単位での繰り返し波形フレームと置き換える。
[0011] これにより、伝送誤り時における音質劣化を抑えることができる。
[0012] また、本発明に係る音声複号化方法は、上記の音声符号化方法により符号化され た伝送フレームに対して、前記 CRC符号が付加された重要ビット列と前記非重要ビ ット列とに分離し、前記重要ビット列と前記非重要ビット列とから各帯域ごとの符号語 を生成し、前記各帯域ごとの符号語に基づいて各帯域の逆量子化信号を復号し、復 号した前記各帯域の逆量子化信号をフィルタリングし、復号音声信号を生成する音 声複号化方法であって、過去に復号された音声の低域に割り当てた帯域で表れるピ ツチ周期単位での繰り返し波形を抽出してバッファリングし、前記 CRC符号が付加さ れた重要ビット列の誤り検出を行ない、前記重要ビット列に誤りが検出されたときは、 過去に復号された前記ピッチ周期単位での繰り返し波形と現行復号音声とを重複加 算する。
[0013] これにより、伝送誤り時に 1ピッチ前の波形と復号波形を滑らかにつなぐことができ、 音質が向上することとなる。
[0014] また、本発明に係る音声復号化方法は、上記の音声符号化方法により符号化され た伝送フレームに対して、前記 CRC符号が付加された重要ビット列と前記非重要ビ ット列とに分離し、前記重要ビット列と前記非重要ビット列とから各帯域ごとの符号語 を生成し、前記各帯域ごとの符号語に基づいて各帯域の逆量子化信号を復号し、復 号した前記各帯域の逆量子化信号をフィルタリングし、復号音声信号を生成する音 声複号化方法であって、過去に復号された音声の低域に割り当てた帯域で表れるピ ツチ周期単位での繰り返し波形を抽出してバッファリングし、前記 CRC符号が付加さ れた重要ビット列の誤り検出を行なレ、、前記重要ビット列に誤りが検出されたときは、 前記符号語の制限を行なうとともに、過去に復号された前記ピッチ周期単位での繰り 返し波形フレームと置き換える。 [0015] これにより、伝送誤りの種類によっては、符号語の制限のみを行なう場合や波形フ レームの置き換えのみを行なう場合よりも伝送誤り時の復号音声の劣化を抑えること となる。
[0016] また、本発明に係る音声複号化方法は、上記の音声符号化方法により符号化され た伝送フレームに対して、前記 CRC符号が付加された重要ビット列と前記非重要ビ ット列とに分離し、前記重要ビット列と前記非重要ビット列とから各帯域ごとの符号語 を生成し、前記各帯域ごとの符号語に基づいて各帯域の逆量子化信号を復号し、復 号した前記各帯域の逆量子化信号をフィルタリングし、復号音声信号を生成する音 声複号化方法であって、過去に復号された音声の低域に割り当てた帯域で表れるピ ツチ周期単位での繰り返し波形を抽出してバッファリングし、前記 CRC符号が付加さ れた重要ビット列の誤り検出を行なレ、、前記重要ビット列に誤りが検出されたときは、 前記符号語の制限を行なうとともに、過去に復号された前記ピッチ周期単位での繰り 返し波形と現行復号音声とを重複加算する。
[0017] これにより、伝送誤りの種類によっては、符号語の制限のみを行なう場合や重複加 算のみを行なう場合よりも伝送誤り時の復号音声の劣化を抑えることとなる。
[0018] 本発明に係る音声符号化装置は、サンプリング周波数が所定の周波数以上の高 品位音声信号を複数の周波数帯域に分割し、分割した各帯域ごとにダウンサンプリ ングした信号を生成する帯域分割フィルタバンクと、分割した前記各帯域ごとにダウ ンサンプリングした信号を帯域ごとに異なる情報ビット数で適応差分符号化する複数 の ADPCM符号器と、前記適応差分符号化された符号語の各ビットを伝送誤り発生 時における復号音声の劣化度合に応じて重要ビットと非重要ビットとにクラス分けし、 重要ビット列と非重要ビット列とを生成するクラス分け器と、前記重要ビット列に対して CRC符号を付加する CRC付加器と、前記 CRC符号が付加された重要ビット列と非 重要ビット列とを含む伝送フレームを生成するマルチプレクサと、を有する。
[0019] 本発明に係る音声符号化装置は、伝送誤りによる音質劣化を抑えながら、少ない C RC検出符号の付加のみで伝送効率を上げることができる。
[0020] 本発明に係る音声複号化装置は、上記の音声符号化装置により符号化された伝 送フレームに対して、前記 CRC符号が付加された重要ビット列と非重要ビット列とに 分離するデマルチプレクサと、前記 CRC符号が付加された重要ビット列の CRC符号 チェックを行なう CRCエラー検出器と、前記重要ビット列と非重要ビット列とから各帯 域ごとの符号語を生成するクラス結合器と、前記各帯域ごとの符号語に基づいて各 帯域の逆量子化信号を復号する ADPCM復号器と、復号した前記各帯域の逆量子 化信号をフィルタリングし、復号音声信号を生成する帯域合成フィルタバンクと、前記 CRCエラー検出器によって伝送誤りが検出されたときに前記符号語の制限を行なう 符号語制限器と、を有する。
[0021] 本発明に係る音声複号化装置は、伝送誤りによる音質劣化を抑えながら、少ない C RC検出符号の付カ卩のみで伝送効率を上げることができ、 CRC検出の演算量を削減 できる。
[0022] また、上記の音声複号化装置であって、過去に復号された音声の低域に割り当て た帯域で表れるピッチ周期単位での繰り返し波形を抽出してバッファリングする手段 と、伝送誤りが検出されたときに、過去に復号された前記ピッチ周期単位での繰り返 し波形フレームと置き換える手段とをさらに有する。
[0023] この構成により、伝送誤り時における音質劣化を抑えることができる。
[0024] また、上記の音声復号化装置であって、過去に復号された音声の低域に割り当て た帯域で表れるピッチ周期単位での繰り返し波形を抽出してバッファリングする手段 と、伝送誤りが検出されたときに、過去に復号された前記ピッチ周期単位での繰り返 し波形と現行復号音声とを重複加算する手段とをさらに有する。
[0025] この構成により、伝送誤り時に 1ピッチ前の波形と復号波形を滑らかにつなぐことが でき、音質が向上する。
[0026] 本発明は、上記の音声符号化方法を実行する手段を有する無線通信装置を提供 する。この構成によれば、伝送誤り時に音質劣化の少ない無線通信装置を実現でき る。
[0027] 本発明は、上記いずれかに記載の音声復号化方法を実行する手段を有する無線 通信装置を提供する。この構成によれば、伝送誤り時に音質劣化の少ない無線通信 装置を実現できる。
[0028] 本発明は、上記の音声符号化方法を実行する手段を有するワイヤレスマイクロホン システムの送信装置を提供する。この構成によれば、伝送誤り時に音質劣化の少な レ、ワイヤレスマイクロホンシステムの送信装置を実現できる。
[0029] 本発明は、上記いずれかに記載の音声復号化方法を実行する手段を有するワイヤ レスマイクロホンシステムの受信装置を提供する。この構成によれば、伝送誤り時に 音質劣化の少ないワイヤレスマイクロホンシステムの受信装置を提供できる。
発明の効果
[0030] 本発明によれば、伝送誤りによる音質劣化を抑えながら、少ない CRC検出符号の 付加のみで伝送効率を上げることができ、 CRC検出の演算量を削減できるとレ、う効 果を有する音声符号化方法、音声復号化方法、音声符号化装置、音声復号化装置 、無線通信装置、ワイヤレスマイクロホンシステムの送信装置および受信装置を提供 すること力 Sできる。
図面の簡単な説明
[0031] [図 1]本発明に係る音声符号化方法を適用した音声符号化装置のブロック図
[図 2]本発明に係る音声複号化方法を適用した音声複号化装置のブロック図
[図 3]本発明に係る他の音声復号ィヒ方法を適用した音声復号ィヒ装置のブロック図 [図 4]図 3に示した音声復号ィヒ装置において重複加算における時間と重みの関係を 示すグラフ
[図 5]本発明の実施の形態に係る無線通信装置のブロック図
[図 6]本発明の実施の形態に係るワイヤレスマイクロホンシステムの送信装置のブロッ ク図
[図 7]本発明の実施の形態に係るワイヤレスマイクロホンシステムの受信装置のブロッ ク図
[図 8]従来の音声符号化'復号化方法における復号器のブロック図
符号の説明
[0032] 100 音声符号化装置
101 帯域分割フィルタバンク
102〜: 105 ADPCM符号器
106 クラス分け器 107 CRC付加器
108 マノレチプレクサ
200, 300 音声復号化装置
201 デマノレチプレクサ
202 CRCエラー検出器
203 クラス結合器
204 符号語制限器
205〜208 ADPCM復号器
209 帯域合成フィルタバンク
301 波形バッファ
302 ピッチ抽出器
303 置換波形抽出器
304, 305 乗算器
306 加算器
307 切り替えスィッチ
308 カウンタ
500 無線通信装置
600 ワイヤレスマイクロホンシステムの送信装置
700 ワイヤレスマイクロホンシステムの受信装置
発明を実施するための最良の形態
[0033] 以下、本発明の実施の形態について図面を参照して詳細に説明する。
[0034] 図 1は本発明に係る音声符号化方法を適用した音声符号化装置のブロック図であ る。図 1に示す音声符号化装置 100は、サンプリング周波数が 16KHz以上の高品位 音声信号を複数 (4つ)の周波数帯域に分割し、分割した各帯域ごとにダウンサンプリ ングした信号を生成する帯域分割フィルタバンク 101と、分割した各帯域ごとにダウン サンプリングした信号を帯域ごとに異なる情報ビット数で適応差分符号化する複数 (4 個)の ADPCM符号器 102〜: 105と、適応差分符号化された符号語の各ビットを伝 送誤り発生時における復号音声の劣化度合に応じて重要ビットと非重要ビットとにク ラス分けし、重要ビット列と非重要ビット列とを生成するクラス分け器 106と、重要ビッ ト列に対して CRC符号を付加する CRC付加器 107と、 CRC符号が付加された重要 ビット列と非重要ビット列とを含む伝送フレームを生成するマルチプレクサ 108と、を 有して構成されている。
[0035] この音声符号化装置 100においては、離散化された音声信号が帯域分割フィルタ バンク 101に入力される。帯域分割フィルタバンク 101では、等分割帯域でバンドパ スフィルタが掛けられ、分割数に対応した 4 : 1の間引き率で間引き (ダウンサンプリン グ)が行なわれる。間引きされた各帯域における信号は、各 ADPCM符号器 102〜1 05にてそれぞれ適応差分符号化される。このとき、各帯域ごとの ADPCM符号器 10 2〜105における符号化情報ビット数は、不均一に割り当てされており、適応的に割 り当てを行なってもよい。
[0036] 各帯域ごとの ADPCM符号語は、レ、くつかの符号語をまとめて、音質的に重要な ビットとそうでないビット(非重要ビット)に分けるクラス分け器 106において、分別され る。分別されたもののうち、重要ビット列に関しては CRC付加器 107により、 CRC符 号が付加される。 CRC符号を付加した重要ビット列とそれ以外のビット列(非重要ビッ ト列)はそれぞれマルチプレクサ 108に供給され、伝送フレームが形成される。伝送 フレームは、通常、プリアンブルや同期符号などが付加され、受信側へ送信される。
[0037] 図 2は本発明に係る音声復号化方法を適用した音声復号化装置のブロック図であ る。図 2に示す音声復号化装置 200は、受信した伝送フレームを CRC符号が付加さ れた重要ビット列とそれ以外のビット列(非重要ビット列)とに分離するデマルチプレク サ 201と、 CRC符号が付加された重要ビット列の CRC符号チェックを行う CRCエラ 一検出器 202と、重要ビット列とそうでないビット列 (非重要ビット列)とから各帯域ごと の圧縮符号語を生成するクラス結合器 203と、第 1バンドにおいて、伝送誤りを検知 したら、その伝送フレームでの符号語の制限を行う符号語制限器 204と、符号語を受 けて各帯域の逆量子化信号を復号する複数 (4個)の ADPCM復号器 205〜208と 、復号した各帯域の信号をフィルタリングし、復号音声信号を生成する帯域合成フィ ノレタバンク 209と、を有して構成されている。
[0038] 受信側である音声複号化装置 200側では、伝送フレームからプリアンブルや同期 符号などが取り除かれた情報力 デマルチプレクサ 201に送られ、 CRC符号が付カロ された重要ビット列およびそれ以外のビット列(非重要ビット列)に分解される。 CRC 符号が付加された重要ビット列は、 CRCエラー検出器 202にて、伝送誤りを含むか チェックが行われる。さらに CRC符号と重要ビット列はここで分離される。重要ビット 歹 IJとそれ以外のビット列 (非重要ビット列)は、クラス結合器 203に入力され、各帯域ご との ADPCM符号語に戻される。次に ADPCM符号語は、符号語制限器 204にお いて、エラーが検出されたときに、重要ビットを含む帯域における ADPCM符号語の 制限を行う。
[0039] 図 2では例として第 1サブバンドのみの ADPCM符号語の制限を行っている力 サ ンプリング周波数や、帯域分割数などによって、第 2サブバンドや第 3サブバンドの A DPCM符号語に符号語制限を行っても良い。符号語制限は、以下のような(式 1)の ような形で行われる。
I =1 if(l ≤1 ) (式 1)
M REP Mth
ただし
I :受信符号語のマグニチュードビット (スケールファクタ適応にかかわるビット。
M
通常 ADPCM符号語の MSBを除レ、たビット)
I :置換えマグニチュードビット(I >1 )
REP REP Mth
I :スレツショルド値
Mth
[0040] エラー発生時に符号制限された ADPCM符号語および符号制限されない ADPC M符号語は、みな帯域ごとの ADPCM復号器 205〜208に送られる。このとき、各帯 域の ADPCM復号器 205〜208は、符号器と同じ情報ビット数で復号する。復号後 の帯域ごとの信号は、帯域合成フィルタバンク 209に送られ、復号音声として出力さ れる。
[0041] 図 1に示した音声符号ィ匕装置 100および図 2に示した音声復号ィ匕装置 200、なら びにこのような音声符号化方法および音声複号化方法によれば、比較的高品位な サンプリング周波数の高い音声 ·音響信号を帯域分割し、さらに音質的に重要なビッ トを抽出して、ビット列を形成し、重要ビットを誤り検出することにより、少ない CRC符 号の付加のみで、単一時間あたりの冗長ビット数を抑えることができるため、伝送効 率を上げることができる。さらにビタビ復号などの誤り訂正処理を行わない方式のた め、演算量を大幅に削減できる。
[0042] 次に、本発明に係る他の音声復号化方法について説明する。図 3は本発明に係る 他の音声復号化方法を適用した音声複号化装置のブロック図である。図 3に示す音 声複号化装置 300は、受信フレームを受信し、 CRC符号が付加された重要ビット列 とそれ以外のビット列(非重要ビット列)とに分離するデマルチプレクサ 201と、 CRC 符号が付加された重要ビット列のエラー検出および重要ビット列の抽出を行う CRC エラー検出器 202と、重要ビット列とそれ以外のビット列(非重要ビット列)から各帯域 の ADPCM復号器 205〜208の受信符号語を生成するクラス結合器 203と、第 1バ ンドにおいて、伝送誤りを検知したら、その伝送フレームでの符号語の制限を行う符 号語制限器 204と、符号語を受けて各帯域の逆量子化信号を復号する ADPCM復 号器 205〜208と、過去の復号した第 1サブバンドの復号波形をバッファリングする 波形バッファ 301と、復号波形のピッチ抽出を行うピッチ抽出器 302と、伝送誤り時に ピッチ抽出器 302の情報を受けて、波形バッファ 301から 1ピッチ前の波形を抽出す る置換波形抽出器 303と、過去の復号波形と現在の復号波形とをスムーズにつなぐ ために波形に重付けするための、各乗算器 304, 305と、重複加算のための加算器 306と、加算器 306の結果である重複加算波形か、 ADPCM復号器 205の復号波 形かを切り替える切り替えスィッチ 307と、切り替えスィッチ 307を CRCエラー検出器 202からの情報をもとに、タイマー制御を行うカウンタ 308と、各帯域の復号信号をフ ィルタリングし、復号音声信号を生成する帯域合成フィルタバンク 209と、を有して構 成されている。
[0043] 以上のように構成された音声複号化装置 300についてその動作を説明する。まず、 受信した伝送フレームからプリアンブルや同期符号などが取り除かれた情報が、デマ ルチプレクサ 201に送られ、 CRC符号が付加された重要ビット列およびそれ以外の ビット列(非重要ビット列)とに分解される。 CRC符号が付加された重要ビット列は、 C RCエラー検出器 202にて、伝送誤りを含むかチェックが行われる。さらに CRC符号 と重要ビット歹 1Jはここで分離される。重要ビット列とそれ以外のビット列(非重要ビット 歹 IJ)は、クラス結合器 203に入力され、各帯域ごとの ADPCM符号語に戻される。 [0044] 次に、符号語制限器 204は、 CRCエラー検出器 202において、エラーが検出され たときに、重要ビットを含む帯域における ADPCM符号語の制限を行う。図 3では、 例として第 1サブバンドのみの ADPCM符号語の制限を行っている力 S、サンプリング 周波数や、帯域分割数などによって、第 2サブバンドや第 3サブバンドの ADPCM符 号語に符号語制限を行っても良い。符号語制限は、前述した (式 1)を用いる。エラー 発生時に符号制限された ADPCM符号語および符号制限されない ADPCM符号 語は、みな帯域ごとの ADPCM復号器 205〜208に送られる。このとき、各帯域の A DPCM復号器 205〜208は、符号ィ匕装置 100と同じ情報ビット数で復号する。
[0045] 第 1サブバンドにおける ADPCM復号波形については、常に伝送フレームごとに生 成されるサンプル分のバッファリングが波形バッファ 301においてなされる。波形バッ ファ 301にバッファリングされた復号波形はピッチ抽出器 302にてピッチ検出がなさ れる。ピッチ検出はエラーを検出したときにのみ、過去のエラーを含まない波形バッ ファを用いて行う。置換波形抽出器 303では、ピッチ抽出器 302でのピッチ情報を用 いて、波形バッファ 301から 1ピッチ前に復号された 1フレーム分の波形の抽出を行う 。抽出された波形は、乗算器 304により重み付けをされて、加算器 306により足しあ わされた波形 (重複加算波形)として、しばらく第 1サブバンドの復号波形として出力 が行われ、カウンタ 308にてエラー検出から一定時間 τ後に、通常の ADPCM復号 音声に切り替えスィッチ 307により切り替えられる。 αの値は、図 4に示すように、随時 減少していく形をとる。図 4では、重み αを直線的に変化させる例を示した力 重み αを曲線的に変化させてもよい。復号後の帯域ごとの信号は、帯域合成フィルタバン ク 209に送られ、復号音声として出力される。
[0046] 以上のように図 3に示した音声復号ィ匕装置 300によれば、過去に復号した信号波 形からピッチ周期を検出し、エラー発生時に波形置換えを重複加算を交えて行うこと により、符号語制限による利点に加え、処理量は増加するが、誤り発生時の復号音 声劣化をさらに抑えることができる。
[0047] なお、以上の説明では、過去の復号波形を重複加算により置き換える方法を示した 力 伝送誤り発生時のフレームにのみ波形置換えを行う簡易的な方法についても同 様に実施可能である。 [0048] 図 5は本発明の実施の形態に係る無線通信装置のブロック図である。図 5に示す無 線通信装置 500は、マイクロホン 501で集音した音声信号を低周波増幅器 502で増 幅し、 A/D変換器 503でデジタル音声信号に変換して音声符号ィ匕装置 100へ供 給する。図 1に示した音声符号ィ匕装置 100によってサブバンド符号化され、伝送フレ ームとして形成されたビットストリームを送信部 504へ供給し、送信部 504で所定のデ ジタル変調を施し、電力増幅を行なってアンテナ共有器 505を介してアンテナ 506か ら電波として送信する。
[0049] アンテナ 506で受信した信号は、アンテナ共有器 505を介して受信部 507へ供給 され、受信部 507で高周波増幅された後に復調がなされ、音声復号ィ匕装置 300に供 給される。図 3に示した音声複号化装置 300によって復号されたデジタル音声信号 は、 D/A変換器 508でアナログ音声信号へ変換され、電力増幅器 509で増幅され 、スピーカ 510で再生される。
[0050] 図 6は本発明の実施の形態に係るワイヤレスマイクロホンシステムの送信装置のブ ロック図である。図 6に示すワイヤレスマイクロホンシステムの送信装置 600は、マイク 口ホン 601で集音した音声信号を低周波増幅器 602で増幅し、 A/D変換器 603で デジタル音声信号に変換して音声符号化装置 100へ供給する。図 1に示した音声符 号化装置 100によってサブバンド符号ィ匕され、伝送フレームとして形成されたビットス トリームを送信部 604へ供給し、送信部 504で所定のデジタル変調を施し、電力増幅 を行なってアンテナ 605から電波として送信する。
[0051] 図 7は本発明の実施の形態に係るワイヤレスマイクロホンシステムの受信装置のブ ロック図である。図 7に示すワイヤレスマイクロホンシステムの受信装置 700は、アンテ ナ 701で受信した信号は受信部 702へ供給され、受信部 702で高周波増幅された 後に復調がなされ、音声複号化装置 300に供給される。図 3に示した音声復号化装 置 300によって復号されたデジタル音声信号は、 D/A変換器 703でアナログ音声 信号へ変換され、電力増幅器 704で増幅され、スピーカ 705で再生される。
[0052] 本発明を詳細にまた特定の実施態様を参照して説明したが、本発明の精神と範囲 を逸脱することなく様々な変更や修正を加えることができることは当業者にとって明ら かである。 [0053] 本出願は、 2004年 12月 15日出願の日本特許出願(特願 2004— 362954)に基 づくものであり、その内容はここに参照として取り込まれる。
産業上の利用可能性
[0054] 本発明によれば、伝送誤りによる音質劣化を抑えながら、少ない CRC検出符号の 付加のみで伝送効率を上げることができ、 CRC検出の演算量を削減できるとレ、う効 果を有し、音声符号化方法、音声複号化方法、音声符号化装置、音声複号化装置、 無線通信装置、ワイヤレスマイクロホンシステムの送信装置および受信装置等に有 用である。

Claims

請求の範囲
[1] サンプリング周波数が所定の周波数以上の高品位音声信号を複数の周波数帯域 に分割し、ダウンサンプリングした信号を帯域ごとに異なる情報ビット数で適応差分符 号化し、適応差分符号化された符号語の各ビットを伝送誤り発生時における復号音 声の劣化度合に応じて重要ビットと非重要ビットとにクラス分けし、重要ビット列と非重 要ビット列とを生成し、前記重要ビット列に対して CRC符号を付加し、前記 CRC符号 が付加された重要ビット列と非重要ビット列とを含む伝送フレームを生成する音声符 号化方法。
[2] 請求項 1記載の音声符号ィ匕方法により符号化された伝送フレームに対して、前記 C RC符号が付加された重要ビット列と前記非重要ビット列とに分離し、前記重要ビット 歹 IJと前記非重要ビット列とから各帯域ごとの符号語を生成し、前記各帯域ごとの符号 語に基づレ、て各帯域の逆量子化信号を復号し、復号した前記各帯域の逆量子化信 号をフィルタリングし、復号音声信号を生成する音声復号化方法であって、
前記 CRC符号が付加された重要ビット列の誤り検出を行ない、前記重要ビット列に 誤りが検出されたときは、前記符号語を制限する音声復号化方法。
[3] 請求項 1記載の音声符号ィ匕方法により符号化された伝送フレームに対して、前記 C RC符号が付加された重要ビット列と前記非重要ビット列とに分離し、前記重要ビット 歹 IJと前記非重要ビット列とから各帯域ごとの符号語を生成し、前記各帯域ごとの符号 語に基づレ、て各帯域の逆量子化信号を復号し、復号した前記各帯域の逆量子化信 号をフィルタリングし、復号音声信号を生成する音声復号化方法であって、
過去に復号された音声の低域に割り当てた帯域で表れるピッチ周期単位での繰り 返し波形を抽出してバッファリングし、前記 CRC符号が付加された重要ビット列の誤 り検出を行なレ、、前記重要ビット列に誤りが検出されたときは、過去に復号された前 記ピッチ周期単位での繰り返し波形フレームと置き換える音声復号ィヒ方法。
[4] 請求項 1記載の音声符号ィ匕方法により符号化された伝送フレームに対して、前記 C RC符号が付加された重要ビット列と前記非重要ビット列とに分離し、前記重要ビット 歹 IJと前記非重要ビット列とから各帯域ごとの符号語を生成し、前記各帯域ごとの符号 語に基づレ、て各帯域の逆量子化信号を復号し、復号した前記各帯域の逆量子化信 号をフィルタリングし、復号音声信号を生成する音声復号化方法であって、 過去に復号された音声の低域に割り当てた帯域で表れるピッチ周期単位での繰り 返し波形を抽出してバッファリングし、前記 CRC符号が付加された重要ビット列の誤 り検出を行なレ、、前記重要ビット列に誤りが検出されたときは、過去に復号された前 記ピッチ周期単位での繰り返し波形と現行復号音声とを重複加算する音声複号化方 法。
[5] 請求項 1記載の音声符号ィ匕方法により符号化された伝送フレームに対して、前記 C RC符号が付加された重要ビット列と前記非重要ビット列とに分離し、前記重要ビット 歹 IJと前記非重要ビット列とから各帯域ごとの符号語を生成し、前記各帯域ごとの符号 語に基づレ、て各帯域の逆量子化信号を復号し、復号した前記各帯域の逆量子化信 号をフィルタリングし、復号音声信号を生成する音声復号化方法であって、
過去に復号された音声の低域に割り当てた帯域で表れるピッチ周期単位での繰り 返し波形を抽出してバッファリングし、前記 CRC符号が付加された重要ビット列の誤 り検出を行ない、前記重要ビット列に誤りが検出されたときは、前記符号語の制限を 行なうとともに、過去に復号された前記ピッチ周期単位での繰り返し波形フレームと 置き換える音声復号化方法。
[6] 請求項 1記載の音声符号ィ匕方法により符号化された伝送フレームに対して、前記 C RC符号が付加された重要ビット列と前記非重要ビット列とに分離し、前記重要ビット 歹 IJと前記非重要ビット列とから各帯域ごとの符号語を生成し、前記各帯域ごとの符号 語に基づレ、て各帯域の逆量子化信号を復号し、復号した前記各帯域の逆量子化信 号をフィルタリングし、復号音声信号を生成する音声復号化方法であって、
過去に復号された音声の低域に割り当てた帯域で表れるピッチ周期単位での繰り 返し波形を抽出してバッファリングし、前記 CRC符号が付加された重要ビット列の誤 り検出を行ない、前記重要ビット列に誤りが検出されたときは、前記符号語の制限を 行なうとともに、過去に復号された前記ピッチ周期単位での繰り返し波形と現行復号 音声とを重複加算する音声復号化方法。
[7] サンプリング周波数が所定の周波数以上の高品位音声信号を複数の周波数帯域 に分割し、分割した各帯域ごとにダウンサンプリングした信号を生成する帯域分割フ ィルタバンクと、
分割した前記各帯域ごとにダウンサンプリングした信号を帯域ごとに異なる情報ビッ ト数で適応差分符号化する複数の ADPCM符号器と、
前記適応差分符号化された符号語の各ビットを伝送誤り発生時における復号音声 の劣化度合に応じて重要ビットと非重要ビットとにクラス分けし、重要ビット列と非重要 ビット列とを生成するクラス分け器と、
前記重要ビット列に対して CRC符号を付加する CRC付加器と、
前記 CRC符号が付加された重要ビット列と非重要ビット列とを含む伝送フレームを 生成するマルチプレクサと、
を有する音声符号化装置。
[8] 請求項 7記載の音声符号ィ匕装置により符号化された伝送フレームに対して、前記 C RC符号が付加された重要ビット列と非重要ビット列とに分離するデマルチプレクサと 前記 CRC符号が付加された重要ビット列の CRC符号チェックを行なう CRCエラー 検出器と、
前記重要ビット列と非重要ビット列とから各帯域ごとの符号語を生成するクラス結合 器と、
前記各帯域ごとの符号語に基づいて各帯域の逆量子化信号を復号する ADPCM 復号器と、
復号した前記各帯域の逆量子化信号をフィルタリングし、復号音声信号を生成する 帯域合成フィルタバンクと、
前記 CRCエラー検出器によって伝送誤りが検出されたときに前記符号語の制限を 行なう符号語制限器と、
を有する音声複号化装置。
[9] 請求項 8記載の音声復号化装置であって、
過去に復号された音声の低域に割り当てた帯域で表れるピッチ周期単位での繰り 返し波形を抽出してバッファリングする手段と、
伝送誤りが検出されたときに、過去に復号された前記ピッチ周期単位での繰り返し 波形フレームと置き換える手段とをさらに有する音声復号化装置。
[10] 請求項 8記載の音声復号化装置であって、
過去に復号された音声の低域に割り当てた帯域で表れるピッチ周期単位での繰り 返し波形を抽出してバッファリングする手段と、
伝送誤りが検出されたときに、過去に復号された前記ピッチ周期単位での繰り返し 波形と現行復号音声とを重複加算する手段とをさらに有する音声復号ィヒ装置。
[11] 請求項 1記載の音声符号化方法を実行する手段を有する無線通信装置。
[12] 請求項 2乃至 6のいずれかに記載の音声復号化方法を実行する手段を有する無線 通信装置。
[13] 請求項 1記載の音声符号ィヒ方法を実行する手段を有するワイヤレスマイクロホンシ ステムの送信装置。
[14] 請求項 2乃至 6のレ、ずれかに記載の音声復号化方法を実行する手段を有するワイ ャレスマイクロホンシステムの受信装置。
PCT/JP2005/023053 2004-12-15 2005-12-15 音声符号化方法、音声復号化方法、音声符号化装置および音声復号化装置 WO2006064879A1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2004-362954 2004-12-15
JP2004362954A JP2006174028A (ja) 2004-12-15 2004-12-15 音声符号化方法、音声復号化方法、音声符号化装置および音声復号化装置

Publications (1)

Publication Number Publication Date
WO2006064879A1 true WO2006064879A1 (ja) 2006-06-22

Family

ID=36587933

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2005/023053 WO2006064879A1 (ja) 2004-12-15 2005-12-15 音声符号化方法、音声復号化方法、音声符号化装置および音声復号化装置

Country Status (2)

Country Link
JP (1) JP2006174028A (ja)
WO (1) WO2006064879A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105122356A (zh) * 2013-01-31 2015-12-02 奥兰吉公司 信号解码期间帧丢失的改进型校正

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0637725A (ja) * 1992-07-17 1994-02-10 Asahi Chem Ind Co Ltd 無線通信装置
JPH06252865A (ja) * 1993-02-23 1994-09-09 Nippon Telegr & Teleph Corp <Ntt> ディジタル音声信号処理装置
JPH06350540A (ja) * 1993-06-03 1994-12-22 Sanyo Electric Co Ltd デジタルオーディオ信号のエラー補償方法
JP2004048281A (ja) * 2002-07-10 2004-02-12 Matsushita Electric Ind Co Ltd 伝送路符号化方法、復号化方法、及び装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6248824A (ja) * 1985-08-28 1987-03-03 Fujitsu Ltd 音声デ−タ蓄積方式

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0637725A (ja) * 1992-07-17 1994-02-10 Asahi Chem Ind Co Ltd 無線通信装置
JPH06252865A (ja) * 1993-02-23 1994-09-09 Nippon Telegr & Teleph Corp <Ntt> ディジタル音声信号処理装置
JPH06350540A (ja) * 1993-06-03 1994-12-22 Sanyo Electric Co Ltd デジタルオーディオ信号のエラー補償方法
JP2004048281A (ja) * 2002-07-10 2004-02-12 Matsushita Electric Ind Co Ltd 伝送路符号化方法、復号化方法、及び装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105122356A (zh) * 2013-01-31 2015-12-02 奥兰吉公司 信号解码期间帧丢失的改进型校正

Also Published As

Publication number Publication date
JP2006174028A (ja) 2006-06-29

Similar Documents

Publication Publication Date Title
CN100545908C (zh) 用于隐蔽压缩域分组丢失的方法和装置
JP3922979B2 (ja) 伝送路符号化方法、復号化方法、及び装置
JP5277350B2 (ja) 圧縮符号化および復号の方法、符号器、復号器、ならびに符号化装置
WO2006025313A1 (ja) 音声符号化装置、音声復号化装置、通信装置及び音声符号化方法
JPH11122120A (ja) 符号化方法及び装置、並びに復号化方法及び装置
KR20060135699A (ko) 신호 복호화 장치 및 신호 복호화 방법
JP3568255B2 (ja) 音声符号化装置及びその方法
WO2006064879A1 (ja) 音声符号化方法、音声復号化方法、音声符号化装置および音声復号化装置
AU2018289986B2 (en) Audio signal encoding and decoding
JP4758687B2 (ja) 音声パケット送信方法、音声パケット受信方法、それらの方法を用いた装置、プログラム、および記録媒体
WO2006009240A1 (ja) 送信機、音声送信方法及びプログラム、受信機、音声受信方法及びプログラム、ワイヤレスマイクシステム、音声送受信方法
KR20120107855A (ko) 무선 수신기
JPH07283757A (ja) 音声データ通信装置
JP4705556B2 (ja) ワイヤレスマイク送信機、受信機ならびにシステム
JP4597360B2 (ja) 音声復号装置及び音声復号方法
JP3407994B2 (ja) 伝送符号誤り補償装置
JPH05347594A (ja) 伝送符号誤り補償装置
JP3660676B2 (ja) 音声符号化装置及びその方法
JP3936369B2 (ja) 音声復号化装置及びその方法
JP3571709B2 (ja) 音声符号化装置及びその方法
KR960003627B1 (ko) 서브 밴드 부호화된 오디오 신호의 난청자용 복호화 방법
JP2998426B2 (ja) 音声伝送装置
JPH0974387A (ja) 無線送信装置及び無線受信装置
JP4299436B2 (ja) ハミング距離を利用した音声符号化方式及び音声伝送システム
JP2005316497A (ja) 音声復号化装置及びその方法

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BW BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE EG ES FI GB GD GE GH GM HR HU ID IL IN IS KE KG KM KN KP KR KZ LC LK LR LS LT LU LV LY MA MD MG MK MN MW MX MZ NA NG NI NO NZ OM PG PH PL PT RO RU SC SD SE SG SK SL SM SY TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): BW GH GM KE LS MW MZ NA SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IS IT LT LU LV MC NL PL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 05816670

Country of ref document: EP

Kind code of ref document: A1