WO2005081232A1 - 通信装置及び信号符号化/復号化方法 - Google Patents

通信装置及び信号符号化/復号化方法 Download PDF

Info

Publication number
WO2005081232A1
WO2005081232A1 PCT/JP2005/002764 JP2005002764W WO2005081232A1 WO 2005081232 A1 WO2005081232 A1 WO 2005081232A1 JP 2005002764 W JP2005002764 W JP 2005002764W WO 2005081232 A1 WO2005081232 A1 WO 2005081232A1
Authority
WO
WIPO (PCT)
Prior art keywords
transmission mode
transmission
signal
communication
bit rate
Prior art date
Application number
PCT/JP2005/002764
Other languages
English (en)
French (fr)
Inventor
Tomofumi Yamanashi
Kaoru Sato
Toshiyuki Morii
Original Assignee
Matsushita Electric Industrial Co., Ltd.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co., Ltd. filed Critical Matsushita Electric Industrial Co., Ltd.
Priority to CA002557000A priority Critical patent/CA2557000A1/en
Priority to US10/590,417 priority patent/US7653539B2/en
Priority to DE602005009501T priority patent/DE602005009501D1/de
Priority to EP05710495A priority patent/EP1720154B1/en
Priority to CN2005800057013A priority patent/CN1922660B/zh
Publication of WO2005081232A1 publication Critical patent/WO2005081232A1/ja

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques

Definitions

  • the present invention relates to a packet communication system typified by Internet communication, and a communication apparatus and a signal code bit Z decoding method in the case of transmitting a voice and tone signal in a mobile communication system or the like.
  • voice 'musical tone signals are transmitted in a packet communication system represented by the Internet communication, mobile communication system, etc.
  • compression' encoding technology is often used to improve the transmission efficiency of the voice 'musical tone signals.
  • signal multiplexing as the transmission bit rate of each communication terminal is smaller, it is possible to multiplex more communication, so in order for many subscribers to communicate simultaneously, transmission of each communication terminal is required. It is desirable to reduce the bit rate and make the channel more efficient.
  • Non-Patent Document 1 the presence or absence of the voice of the speaker is detected, and the section (voiced section) in which the speaker is producing speech is coded at a high bit rate, and the speaker does not produce speech.
  • a technique for reducing the transmission bit rate as a whole by coding and transmitting a section (unvoiced section) at a low bit rate for example, Non-Patent Document 1
  • Patent Document 1 Japanese Patent Application Laid-Open No. 11-331936
  • Non-Patent Document l ANSI / TIA / EIA-96-C, Speech Service Option Standard for Wideband Spread Spectrum Digital Cellular System Disclosure of the invention
  • the object of the present invention is to perform efficient encoding of a speech 'musical tone signal while maintaining a predetermined quality by controlling the transmission bit rate on the transmission side in consideration of the usage environment on the reception side.
  • a communication apparatus determines a transmission mode for controlling a transmission bit rate of a signal transmitted from a device at the other end of communication in accordance with the level of environmental noise included in an input signal, and transmits the transmission mode.
  • Transmission source determining means for transmitting to the other party device, and an information source code obtained by encoding the input signal at the transmission bit rate corresponding to the transmission mode with the communication party device from the device of the communication party
  • decoding means for decoding based on the transmitted transmission mode.
  • the communication apparatus has a first transmission mode for controlling the transmission bit rate of a signal transmitted from the own apparatus according to the level of environmental noise included in the input signal of the apparatus of the other party of communication; Transmission mode determining means for determining a second transmission mode for controlling the transmission bit rate of the input signal of the own apparatus based on the level of environmental noise included in the input signal, and corresponding to the second transmission mode Encoding means for encoding the input signal at the transmission bit rate and transmitting an information source code obtained by the encoding and the second transmission mode to the device of the other party of communication.
  • a communication device includes a decoding means for decoding an information source code obtained by encoding with a device of a communication counterpart, and environmental noise of a signal decoded by the decoding means.
  • Means for determining the transmission mode for controlling the transmission bit rate of the input signal according to the level of the input signal, and the input signal at the transmission bit rate corresponding to the transmission mode determined by the transmission mode determination means.
  • Source code obtained by encoding and encoding And encoding means for transmitting the transmission mode to the device at the other end of the communication.
  • a communication device comprises decoding means for decoding an information source code obtained by encoding with a device at the other end of communication, a level of environmental noise contained in an input signal, and the decoding means.
  • Transmission mode determining means for determining a transmission mode for controlling the transmission bit rate of the input signal based on the level of environmental noise of the signal decoded in the second stage, and the transmission mode determined by the transmission mode determining means
  • encoding means for encoding the input signal at a transmission bit rate corresponding to the information source code obtained by encoding and the transmission mode to the device of the other party of communication.
  • a communication device determines a transmission mode for controlling a transmission bit rate of a signal transmitted from a device at the other end of communication in accordance with the level of environmental noise contained in an input signal.
  • Transmission mode determining means for transmitting to the other device, and source code obtained by encoding the input signal at the transmission bit rate corresponding to the transmission mode by the communication counterpart device is used as the transmission mode determining means.
  • decoding means for decoding based on the determined transmission mode.
  • the first communication device and the second communication device perform wireless communication, and the second communication device encodes the input signal, thereby obtaining the information source code.
  • a signal encoding / decoding method for transmitting to the first communication device wherein the first communication device decodes the information source code, in the first communication device, a level of environmental noise included in an input signal.
  • the signal encoding Z decoding method determines a transmission mode for controlling a transmission bit rate of a signal transmitted from a device of a communication counterpart according to the level of environmental noise included in an input signal, and Transmitting a transmission mode to the device at the other end of the communication; And decoding the source code obtained by encoding the input signal at the transmission bit rate corresponding to the transmission mode by the device based on the transmission mode transmitted from the device at the other end of the communication.
  • the signal encoding Z decoding method comprises the steps of decoding an information source code obtained by encoding with a device of a communication counterpart, and responding to the level of environmental noise of the decoded signal.
  • the transmitting side bit rate is determined by using the masking effect of environmental noise on the receiving side. Since communication can be performed at the minimum transmission bit rate without affecting human hearing, line efficiency can be greatly improved.
  • FIG. 1 A diagram for explaining the auditory masking effect
  • FIG. 2 A block diagram showing a configuration of a communication terminal apparatus according to Embodiment 1 of the present invention
  • FIG. 3 A block diagram showing an internal configuration of a transmission mode determination unit of the communication terminal device according to the above embodiment
  • FIG. 4 A block diagram showing the internal configuration of the signal encoding unit of the communication terminal apparatus according to the above embodiment.
  • FIG. 5 A block diagram showing an internal configuration of a base layer coding unit of the communication terminal device according to the above embodiment.
  • FIG. 6 A block diagram showing an internal configuration of a base layer decoding unit of the communication terminal device according to the above embodiment.
  • FIG. 7 is a block diagram showing an internal configuration of a signal decoding unit of the communication terminal apparatus according to the above embodiment.
  • FIG. 8 A professional showing an internal configuration of the signal encoding unit of the communication terminal apparatus according to the above embodiment.
  • FIG. 9 is a block diagram showing an internal configuration of a signal decoding unit of the communication terminal apparatus according to the above embodiment.
  • FIG. 10 A block diagram showing a configuration of a communication terminal apparatus according to Embodiment 2 of the present invention
  • FIG. 11 A block diagram showing an internal configuration of a transmission mode determining unit of the communication terminal device according to the above embodiment.
  • FIG. 12 A block diagram showing a configuration of a communication apparatus according to Embodiment 3 of the present invention
  • FIG. 13 A block diagram showing a configuration of a communication terminal apparatus according to Embodiment 4 of the present invention
  • FIG. 14 A block diagram showing an internal configuration of a transmission mode determining unit of the communication terminal device according to the above embodiment.
  • FIG. 15 A block diagram showing a configuration of a communication terminal apparatus according to Embodiment 5 of the present invention
  • FIG. 16 is a block diagram showing an internal configuration of a transmission mode determining unit of the communication terminal device according to the above embodiment.
  • FIG. 17 A block diagram showing a configuration of a communication terminal apparatus and a relay station according to Embodiment 6 of the present invention.
  • FIG. 18 A block diagram showing a configuration of a relay station according to the above embodiment
  • FIG. 19 A block diagram showing a configuration of a relay station according to the above embodiment
  • Audio coding methods typified by MP3 (Mpeg-1 Audio Layer-3) and AAC (Advanced Audio Coding) use the perceptual masking effect and the quantization error at the time of coding is band by band. Efficient coding is realized by performing quantization so that the audio signal strength to be encoded becomes equal to or less than the calculated masking level.
  • the auditory masking effect is a phenomenon that “if there is a large component of energy at a certain frequency, then a small component of energy of nearby frequencies will be masked and it will not be audible.
  • FIG. 1 is a diagram for explaining the auditory masking effect.
  • Component B and component C in FIG. 1 are masked by component A and component D and are not perceived audibly. Therefore, masked components such as component B and component C can not be perceived even if they are greatly reduced.
  • the energy The error (quantization error) is hard to be perceived perceptually by human beings, even if the quantization is roughly performed during encoding, for the minute component (large component in the triangular area in FIG. 1).
  • the relationship between the perceptual masking effect often used in audio coding schemes and the quantization error at the time of encoding is applied to environmental noise, and transmission is performed based on the masking level by environmental noise. Control the bit rate.
  • a transmission mode is determined in consideration of the auditory masking effect due to environmental noise, and a speech / musical tone encoding / decoding method is described to control the transmission bit rate.
  • FIG. 2 is a block diagram showing a configuration of a communication terminal apparatus according to Embodiment 1. In FIG. 2, bi-directional communication is performed between two communication terminals 100 and 150.
  • Communication terminal apparatus 100 mainly includes transmission mode determining section 101, signal encoding section 102, and signal decoding section 103.
  • Transmission mode determination unit 101 detects environmental noise included in the background of voice and tone signals in the input signal, and according to the level of the environmental noise, from communication terminal apparatus 150 which is the other party communication terminal. The transmission mode to control the transmission bit rate of the signal to be transmitted is determined. Information indicating the determined transmission mode (hereinafter referred to as “transmission mode information”) is output to the transmission path 110 and the signal decoding unit 103.
  • transmission mode information is output to the transmission path 110 and the signal decoding unit 103.
  • one transmission bit rate is selected from two or more predetermined transmission bit rates, and the transmission mode information includes three predetermined transmission types. It is assumed that values of bit rate bitratel, bitrate2, bitrate3 (bitrate3 ⁇ bitrate2 ⁇ bitrate 1) can be taken.
  • Signal encoding section 102 encodes an input signal, which is a voice 'tone signal, according to transmission mode information transmitted from communication terminal apparatus 150 via transmission path 110, and obtains the encoded information obtained. Output to the transmission line 110.
  • Signal decoding section 103 decodes the encoded information transmitted from communication terminal apparatus 150 via transmission path 110, and outputs the obtained signal as an output signal.
  • the signal decoding unit 103 transmits the transmission mode information and transmission mode contained in the coding information output from the transmission line 110.
  • a transmission error can be detected by comparing the transmission mode information obtained from the frame determination unit 101 with the transmission delay taken into consideration. Specifically, when the transmission mode information obtained from transmission mode determination section 101 in consideration of transmission delay and the transmission mode information included in the coding information output from transmission path 110 are different, the signal duplication is performed.
  • the encoding unit 103 determines that a transmission error has occurred on the transmission path 110.
  • the signal coding unit 152 of the communication terminal apparatus 150 does not integrate the transmission mode information into the coding information, and the signal decoding unit 103 uses the transmission mode information obtained from the transmission mode determination unit 101 to transmit the transmission path. It is also possible to adopt a method of decoding the code information output from 110.
  • Communication terminal apparatus 150 mainly includes transmission mode determination unit 151, signal encoding unit 152, and signal decoding unit 153.
  • Transmission mode determination unit 151 receives an input signal, detects environmental noise included in the background of voice 'musical tone signal, and transmits the signal transmitted from communication terminal apparatus 100 according to the level of the environmental noise. Determine the transmission mode to control the bit rate. Next, transmission mode information indicating the determined transmission mode is output to the transmission path 110 and the signal decoding unit 153.
  • Signal coding section 152 receives as input transmission mode information transmitted from communication terminal apparatus 100 via transmission path 110, and encodes an input signal which is a voice 'musical tone signal according to the transmission mode information, The obtained code information is output to the transmission line 110.
  • Signal decoding section 153 receives the encoded information transmitted from communication terminal apparatus 100 via transmission path 110 and the transmission mode information obtained from transmission mode determination section 151, and decodes the encoded information. After that, the obtained signal is output as an output signal. Signal decoding section 153 compares the transmission mode information included in the encoded information output from transmission path 110 with the transmission mode information obtained from transmission mode determination section 151 in consideration of the transmission delay. Thus, transmission errors can be detected. Specifically, when the transmission mode information obtained from the transmission mode determination unit 151 in consideration of the transmission delay and the transmission mode information included in the encoding information output from the transmission path 110 are different, signal decoding is performed. The unit 153 determines that a transmission error has occurred in the transmission path 110.
  • the signal encoding unit 102 of the communication terminal apparatus 100 does not integrate the transmission mode information into the encoded information, and the signal decoding unit 153 uses the transmission mode information obtained from the transmission mode determination unit 151 to transmit the transmission path. From 110 It is also possible to adopt a method of decoding the output code information.
  • the configuration of transmission mode determination unit 151 in FIG. 2 is the same as the configuration of transmission mode determination unit 101.
  • the transmission mode determination unit 101 mainly includes a masking level calculation unit 301 and a transmission mode determination unit 302.
  • the masking level calculation unit 301 calculates the masking level from the input signal, and outputs the calculated masking level to the transmission mode determination unit 302.
  • the transmission mode determination unit 302 compares the masking level output from the masking level calculation unit 301 with a predetermined threshold, and determines the transmission bit rate based on the comparison result. Specifically, when the level of environmental noise present on the communication terminal apparatus 100 side detected in the communication terminal apparatus 100 is large and the masking level is large, the transmission bit rate is lowered. This is because the quantization error of the encoded information to be transmitted by the communication terminal 150 is masked to some extent by the auditory masking effect due to the environmental noise, so even if the transmission bit rate is lowered in the communication terminal 150, it was not lowered. It is based on the principle that a decoded signal of the same quality as that of the case can be obtained.
  • the auditory masking effect of the environmental noise causes the communication terminal 150 to transmit the code information transmitted from the communication terminal 150. Since the quantization error is not masked, increase the transmission bit rate.
  • transmission mode determination section 302 outputs transmission mode information indicating the determined transmission mode to transmission path 110 and signal decoding section 103.
  • the transmission mode determination unit 101 calculates the maximum value and the minimum value of the power value of the input signal in a predetermined period (for example, within a fixed period of about 5 seconds and 10 seconds), and the maximum value and the minimum value
  • a predetermined period for example, within a fixed period of about 5 seconds and 10 seconds
  • the processes of the masking level calculation unit 301 and the transmission mode determination unit 302 will be described in the case of determining the level of environmental noise included in the input signal and controlling the bit rate according to the level.
  • the level of environmental noise is determined and output is performed each time each frame is processed will be described. It is also possible to perform the following processing in response to a button press or the like from the last user as a trigger, or to perform the following processing at certain fixed time intervals.
  • a masking level calculation unit 301 divides the input signal into N samplings (N is a natural number), and performs processing for each frame with the same section as one frame.
  • N is a natural number
  • N is a predetermined nonnegative integer and depends on the number N of samples in one frame
  • interval of one frame is about 20 ms, it is confirmed that performance can be obtained with a value of about 100 500.
  • the masking level calculation unit 301 determines the frame power of the frame to be processed.
  • Pframe is calculated by the following equation 1.
  • the masking level calculation unit 301 substitutes the frame power Pframe obtained by Equation 1 into the buffer buf.
  • the masking level calculation unit 301 lengthens / frame length P frame of frame power P frame in section i (section length N) and maximum frame length [kPframe lasts, Pframe, Pframe transmission frame
  • the masking level calculation unit 301 updates the buffer buf according to the following equation 2.
  • the transmission mode determination unit 302 transmits from Pframe and Pframe output from the masking level calculation unit 301.
  • Transmission mode information Mode is determined by the following equation 3c
  • Th and Th (Th ⁇ Th) are based on the auditory masking effect of environmental noise
  • the coding method used when Mode is bitrate is represented by coding method A, coding method A
  • a signal obtained by decoding the encoded information is called a decoded signal A.
  • the encoding method used when Mode is bitrate is represented by encoding method B and encoding method B.
  • the signal obtained by decoding the decoded information is called a decoded signal B. Also, when Mode is bitrate
  • the coding method used in 3 is decoded by the coding method C, and the signal obtained by decoding the information coded by the coding method C is decoded as the decoded signal C and the like.
  • An average noise (for example, white noise etc.) is added to the decoded signal A and the decoded signal B so that the level thereof gradually increases, and the decoded signal to which the noise is added Let T be the noise level at the time when the decoded signal B with noise added to A and A is aurally equal.
  • Th be the noise level at the time when the decoded signal A to which noise is added and the decoded signal C to which noise is equaled audibly.
  • transmission mode determination section 302 transmits transmission mode information to transmission path 110 and a signal decoding section.
  • the configuration of the second signal encoding unit 152 is the same as the configuration of the signal encoding unit 102.
  • the present embodiment in the case of encoding / decoding a voice / musical signal in a three-layer voice encoding / decoding method including a base layer and two enhancement layers.
  • the present invention is not limited in terms of hierarchy.
  • the speech encoding / decoding method it is possible to apply S even when encoding / decoding speech / musical tone signals.
  • the hierarchical speech coding method is a speech coding method in which the residual signal (the difference between the input signal of the lower layer and the decoded signal of the lower layer) is coded and the coded information is output. It is a method that exists in a layer and forms a hierarchical structure.
  • the hierarchical speech decoding method is a method in which a plurality of speech decoding methods for decoding the residual signal exist in the upper layer to form a hierarchical structure.
  • the speech coding Z decoding method present in the lowermost layer is taken as a base layer. Also, let the speech coding Z decoding method existing in the layer higher than the base layer be the enhancement layer.
  • the coding unit and the decoding unit in the base layer are referred to as a base layer coding unit and a base layer decoding unit respectively, and the coding unit and the decoding unit in the enhancement layer are respectively referred to as an enhancement layer coding unit.
  • the enhancement layer decoding unit is referred to as a base layer coding unit and a base layer decoding unit respectively.
  • Signal coding section 102 includes transmission bit rate control section 401, control switches 402 to 405, base layer coding section 406, base layer decoding section 407, addition sections 408 and 411, and (1)
  • An enhancement layer coding unit 409 mainly includes a first enhancement layer coding unit 409, a first enhancement layer decoding unit 410, a second enhancement layer coding unit 412, and a coding information integration unit 413.
  • An input signal is input to a base layer code selector 406 and a control switch 402. Also, transmission mode information is input to the transmission bit rate control unit 401.
  • the transmission bit rate control unit 401 performs on / off control of the control switch 402-405 in accordance with the input transmission mode information. Specifically, when the transmission mode information is bitrate, the transmission bit rate control unit 401 turns on all the control switches 402 to 405. Also, when the transmission mode information is bitrate 2, the transmission bit rate control unit 401 turns on the control switches 402 and 403 and turns off the control switches 404 and 405. Also, when the transmission mode information is bitrate 3, the transmission bit rate control unit 401 turns off all of the control switches 402 to 405. As described above, the transmission bit rate control unit 401 performs on / off control of the control switch in accordance with the transmission mode information to determine the combination of coding units used for coding the input signal.
  • the transmission mode information is output from the transmission bit rate control unit 401 to the code information integration unit 413.
  • Base layer coding section 406 performs coding on the input signal, and an information source code (hereinafter referred to as “base layer information source code”) obtained by coding is converted into control switch 403 and coding information. Output to the integration unit 413.
  • base layer information source code an information source code (hereinafter referred to as “base layer information source code”) obtained by coding is converted into control switch 403 and coding information.
  • base layer information source code an information source code
  • the base layer decoding unit 407 decodes the base layer information source code output from the base layer coding unit 406, and obtains the obtained complex.
  • the encoded signal (hereinafter referred to as “base layer decoded signal”) is output to the addition unit 408.
  • the basic layer decoding unit 407 does not operate when the control switch 403 is off. The internal configuration of base layer decoding section 407 will be described later.
  • Addition section 408 adds the signal obtained by inverting the polarity of the base layer decoded signal output from base layer decoding section 407 to the input signal when control switches 402 and 403 are in the on state.
  • the first residual signal which is the addition result is output to the first enhancement layer coding unit 409 and the control switch 404.
  • the addition unit 408 does not operate when the control switches 402 and 403 are off.
  • the first enhancement layer coding unit 409 performs coding on the first residual signal output from the addition unit 408 when the control switches 402 and 403 are in the on state, and the first enhancement layer coding unit 409 obtains
  • the information source code (hereinafter, referred to as “first enhancement layer information source code”) is output to the control switch 405 and the encoded information integration unit 413.
  • the first enhancement layer coding unit 409 does not operate when the control switches 402 and 403 are off.
  • the first enhancement layer decoding unit 410 decodes the first enhancement layer information source code output from the first enhancement layer coding unit 409 when the control switch 405 is in the on state.
  • the decoded signal (hereinafter, referred to as “first enhancement layer decoded ⁇ ⁇ ⁇ signal”) obtained by the decoding is output to the adding unit 411. Note that the first enhancement layer decoding unit 410 does not operate when the control switch 405 is off.
  • Adding section 411 adds the signal obtained by inverting the polarity of the output signal of first enhancement layer decoding section 410 to the first residual signal when control switches 404 and 405 are in the on state, and adds the result And outputs the second residual signal, which is The addition unit 411 does not operate when the control switches 404 and 405 are off.
  • the second enhancement layer coding unit 412 performs coding on the second residual signal output from the addition unit 411 when the control switches 404 and 405 are in the on state, and is obtained by coding.
  • the information source code (hereinafter referred to as “the second enhancement layer information source code”) is output to the coded information integration unit 413.
  • the second enhancement layer coding unit 412 does not operate when the control switches 404 and 405 are off.
  • the coding information integration unit 413 includes the transmission mode information output from the transmission bit rate control unit 401, the base layer information source code output from the base layer coding unit 406, and the first extension layer coding unit 409.
  • the second enhancement layer information source code output from the first enhancement layer information source code and the second enhancement layer information source code output from the second enhancement layer coding unit 412 are integrated, and the combined encoded information is output to the transmission path 110.
  • the transmission mode information is always input to the transmission bit rate control unit 401 at the time of processing each frame.
  • the transmission mode information is not input to the transmission bit rate control unit 401
  • base layer coding section 406 in FIG. 4 will be described using FIG.
  • the case of performing CELP type voice coding in base layer coding section 406 will be described.
  • the pre-processing unit 501 performs waveform shaping processing and pre-emphasis processing that lead to high-pass filtering processing for removing DC components and improvement in the performance of subsequent encoding processing on the signal of the input sampling frequency.
  • the processed signal (Xin) is output to the LPC analysis unit 502 and the addition unit 505.
  • the LPC analysis unit 502 performs linear prediction analysis using Xin, and outputs the analysis result (linear prediction coefficient) to the LPC quantization unit 503.
  • the LPC quantization unit 503 performs quantization processing of the linear prediction coefficient (LPC) output from the LPC analysis unit 502, outputs the quantized LPC to the synthesis filter 504, and multiplexes the code (L) representing the quantized LPC. Output to the conversion unit 514.
  • LPC linear prediction coefficient
  • the synthesis finoretter 504 generates a synthesized signal by performing filter synthesis on the drive sound source output from the addition unit 511, which will be described later, using filter coefficients based on the quantized LPC, The combined signal is output to the addition unit 505.
  • the adder 505 calculates the error signal by inverting the polarity of the synthesized signal and adding it to Xin, and outputs the error signal to the auditory weighting unit 512.
  • Adaptive sound source codebook 506 stores the driving sound source output by addition unit 511 in the past in a buffer, and one frame from the previous driving sound source specified by the signal output from parameter determination unit 513 The sampling part of a minute is cut out as an adaptive excitation vector and multiplied by 50
  • the quantization gain generation unit 507 outputs the quantization adaptive excitation gain and the quantization fixed excitation gain specified by the signal output from the parameter determination unit 513 to the multiplication unit 509 and the multiplication unit 510, respectively. Do.
  • Fixed excitation codebook 508 outputs a fixed excitation vector obtained by multiplying the pulse excitation vector having a shape specified by the signal output from parameter determination section 513 by the diffusion vector to multiplication section 510.
  • Multiplication section 509 multiplies the adaptive excitation vector output from adaptive excitation codebook 506 by the quantized adaptive excitation gain output from quantization gain generation section 507, and outputs the result to addition section 511.
  • the multiplication unit 510 multiplies the fixed excitation vector output from the fixed excitation codebook 508 by the quantized fixed excitation gain output from the quantization gain generation unit 507, and outputs the result to the addition unit 511.
  • the addition unit 511 receives the adaptive excitation vector after gain multiplication and the fixed excitation vector from the multiplication unit 509 and the multiplication unit 510 respectively, adds these vectors, and combines the drive excitation result as a synthesis filter Output to 504 and adaptive excitation codebook 506.
  • the driving sound source input to the adaptive sound source codebook 506 is stored in the buffer.
  • Auditory weighting unit 512 performs auditory weighting on the error signal output from addition unit 505, and outputs the result to parameter determination unit 513 as code distortion.
  • the parameter determination unit 513 includes an adaptive excitation codebook 506 and a fixed excitation codebook 508, respectively, for the adaptive excitation vector, the fixed excitation vector, and the quantization gain that minimize the code distortion output from the auditory weighting unit 512. And an adaptive excitation vector code (A), a fixed excitation vector code (F), and an excitation gain code (G) which are selected from the quantization gain generation unit 507 and which indicate the selection result. Are output to the multiplexing unit 514.
  • A adaptive excitation vector code
  • F fixed excitation vector code
  • G excitation gain code
  • the multiplexing unit 514 receives the code (L) representing the quantized LPC from the LPC quantization unit 503, the code (A) representing the adaptive excitation vector from the parameter determination unit 513, and the code representing the fixed excitation vector (F) and a code (G) representing an excitation gain are input, these pieces of information are multiplexed and output as a basic layer information source code.
  • first enhancement layer coding section 409 and second enhancement layer coding section 412 in FIG. 4 is the same as that of base layer coding section 406, and the types of input signals and Since only the type of source code to be output is different, the description is omitted.
  • the base layer source code input to base layer decoding section 407 is separated into individual codes (L, A, G, F) by demultiplexing section 601.
  • the separated LPC code (L) is output to the LPC decoding unit 602, and the separated adaptive excitation vector code (A) is output to the adaptive excitation codebook 605, and the separated excitation gain code (G) is quantized.
  • the fixed excitation vector code (F) output to the gain generation unit 606 and separated is output to the fixed excitation codebook 607.
  • the LPC decoding unit 602 quantizes the code (L) output from the demultiplexing unit 601 from the quantized LP
  • Adaptive excitation codebook 605 extracts a sample of a frame worth of adaptive excitation vectors from the past driven excitation designated by code (A) output from demultiplexing section 601 and outputs the result to multiplication section 608 Do.
  • a quantization gain generation unit 606 decodes the quantization adaptive sound source gain and the quantization fixed sound source gain specified by the sound source gain code (G) output from the multiplexing / separating portion 601, and multiplies the multiplication portion 608 and the multiplication portion 608. Output to multiplication section 609.
  • Fixed excitation codebook 607 generates a fixed excitation vector specified by code (F) output from demultiplexing section 601, and outputs the fixed excitation vector to multiplying section 609.
  • Multiplication section 608 multiplies the adaptive excitation vector by the quantization adaptive excitation gain, and outputs the result to addition section 610.
  • the multiplication unit 609 multiplies the fixed excitation vector by the quantization fixed excitation gain, and outputs the result to the addition unit 610.
  • the addition unit 610 adds the adaptive excitation vector after gain multiplication output from the multiplication units 608 and 609 and the fixed excitation vector, generates a driving excitation, generates a driving excitation, and generates a synthesis filter 603 and an adaptive excitation. Output to codebook 605.
  • the synthesis filter 603 uses the filter coefficients decoded by the LPC decoding unit 602 to perform the filter synthesis of the drive sound source output from the addition unit 610, and the post-processing unit 604. Output to
  • Post-processing section 604 improves the subjective quality of speech, such as formant emphasis and pitch emphasis, for the signal output from synthesis filter 603, and improves the subjective quality of stationary noise. Processing etc., and output as basic layer decoding information.
  • first enhancement layer decoding unit 410 in FIG. 4 is the same as the internal configuration of base layer decoding unit 407, and the type of the source code to be input and the signal to be output are Since only the type of is different, the explanation is omitted.
  • the configuration of the signal decoding unit 153 in FIG. 2 is the same as the configuration of the signal decoding unit 103.
  • Signal decoding section 103 includes transmission bit rate control section 701, base layer decoding section 702, first enhancement layer decoding section 703, second enhancement layer decoding section 704, and control switch 705. , 706, force calculation 707, 708 and mainly composed of force.
  • the transmission bit rate control unit 701 performs on / off control of the control switches 705 and 706 according to transmission mode information included in the received encoded information. Specifically, if the transmission mode information is bitrate, the transmission bit rate control unit 701 turns on both of the control switches 705 and 706. In addition, when the transmission mode information is bitrate 2, the transmission bit rate control unit 701 turns on the control switch 705 and turns off the control switch 706. Also, when the transmission mode information is bitrate 3, the transmission bit rate control unit 701 turns off both of the control switches 705 and 706.
  • the transmission bit rate control unit 7 01 separates the base layer information source code, the first enhancement layer information source code, and the second enhancement layer information source code contained in the received encoded information, and the base layer information source code is divided by the base layer decoding section 702. , And outputs the first enhancement layer source code to the control switch 705 and the second enhancement layer source code to the control switch 706.
  • Base layer decoding section 702 decodes the base layer information source code output from transmission bit rate control section 701, generates a base layer decoded signal, and outputs this to addition section 708.
  • the first enhancement layer decoding unit 703 decodes the first enhancement layer information source code output from the transmission bit rate control unit 701 when the control switch 705 is in the on state, and performs the first enhancement layer decoding. A layer decoded signal is generated and output to the addition unit 707. The first enhancement layer decoding unit 703 does not operate when the control switch 705 is off.
  • the second enhancement layer decoding unit 704 decodes the second enhancement layer information source code output from the transmission bit rate control unit 701 when the control switch 706 is in the on state, and performs a second enhancement layer decoding process. A layer decoded signal is generated and output to the addition unit 707. The second enhancement layer decoding unit 704 does not operate when the control switch 706 is off.
  • the addition unit 707 When the control switches 705 and 706 are in the ON state, the addition unit 707 outputs the second enhancement layer decoding signal output from the second enhancement layer decoding unit 704 and the first enhancement layer decoding unit 70. 3 and the first enhancement layer decoded signal output from 3 and outputs the signal after the addition to the addition unit 708.
  • the addition unit 707 When the control switch 706 is off and the control switch 705 is on, the addition unit 707 outputs the first enhancement layer decoding signal output from the first enhancement layer decoding unit 703. Output to adder 708.
  • the addition unit 707 does not operate when the control switches 705 and 706 are off.
  • the addition unit 708 adds the base layer decoding signal output from the base layer decoding unit 702 and the output signal of the addition unit 707, and outputs the signal after addition as an output signal. Further, the addition unit 708 outputs the base layer decoded signal output from the base layer decoding unit 702 as an output signal when the control switches 705 and 706 are in the off state.
  • the internal configuration of the layer decoding unit 704 is the same as the internal configuration of the base layer decoding unit 407 in FIG. 4 and differs only in the type of the input signal and the type of the source code to be output. The explanation is omitted.
  • a coding Z decoding method in signal coding section 102 and signal decoding section 103 a plurality of coding / decoding methods with different bit rates are switched for coding / decoding. It is also possible to apply a configuration that The configurations of the signal encoding unit 102 and the signal decoding unit 103 in this case will be described below with reference to FIGS. 8 and 9.
  • FIG. 8 is a block diagram showing an internal configuration of the signal code unit 102.
  • the signal coding unit 102 mainly includes a transmission bit rate control unit 801, control switches 802 and 803, signal coding units 804 to 806, and a coding information integration unit 807.
  • the input signal is input to the control switch 802. Also, transmission mode information is input to the transmission bit rate control unit 801.
  • the transmission bit rate control unit 801 performs switching control of the control switches 802 and 803 in accordance with the input transmission mode information. Specifically, the transmission bit rate control unit 801 connects both the control switches 802 and 803 to the signal encoding unit 804 when the transmission mode information is bitrate. Also, when the transmission mode information is bitrate 2, the transmission bit rate control unit 801 connects both of the control switches 802 and 803 to the signal coding unit 805. Also, when the transmission mode information is bitrate 3, the transmission bit rate control unit 801 connects both of the control switches 802 and 803 to the signal encoding unit 806.
  • the transmission bit rate control unit 801 switches and controls the control switch according to the transmission mode information, whereby the coding unit to be used for coding the input signal is determined.
  • the transmission mode information is output from the transmission bit rate control unit 801 to the coding information integration unit 807.
  • Signal coding section 804 codes the input signal by the coding method corresponding to bitratel, and The information source code obtained by the encoding is output to the encoded information integration unit 807 via the control switch 803.
  • the signal encoding unit 805 encodes the input signal by the encoding method corresponding to bitrate 2, and outputs the information source code obtained by the encoding to the encoded information integration unit 807 via the control switch 803.
  • the signal encoding unit 806 encodes the input signal by the encoding method corresponding to bitrate 3, and outputs the information source code obtained by the encoding to the encoded information integration unit 807 via the control switch 803.
  • the coding information integration unit 807 integrates the transmission mode information output from the transmission bit rate information control unit 801 and the information source code output from the switch 803, and transmits the integrated coding information. Output to path 110.
  • the transmission mode information is always input to the transmission bit rate control unit 801 at each frame processing, but when the transmission mode information is not input to the transmission bit rate control unit 801 Alternatively, it is possible to use the transmission mode information at the time of the previous input by storing the transmission mode information input at the previous time in the buffer in the transmission bit rate control unit 801 or the like.
  • signal encoding sections 804 to 806 in FIG. 8 is the same as that of base layer coding section 406 in FIG. 4, and the types of input signals and the information source codes to be output are the same. Since only the type is different, the explanation is omitted.
  • FIG. 9 is a block diagram showing an internal configuration of signal decoding section 103.
  • the signal decoding unit 103 mainly includes a transmission bit rate control unit 901, control switches 902 and 903 and signal decoding units 904 to 906.
  • the coding information is input to the transmission bit rate control unit 901.
  • the transmission bit rate control unit 901 performs switching control of the control switches 902 and 903 according to the transmission mode information included in the received code information. Specifically, when the transmission mode information is bitrate, the transmission bit rate control unit 901 connects both of the control switches 902 and 903 to the signal decoding unit 904. In addition, when the transmission mode information is bitrate 2, the transmission bit rate control unit 901 performs both of the control switches 902 and 903 as the signal decoding unit 90. Connect to 5 Also, when the transmission mode information is bitrate 3, the transmission bit rate control unit 901 connects both of the control switches 902 and 903 to the signal decoding unit 906. Also, the received source code is output to the control switch 902.
  • the signal decoding unit 904 decodes the information source code input via the control switch 902 by the decoding method corresponding to bitrate, and outputs the output signal obtained by decoding using the control switch 903. Do.
  • the signal decoding unit 905 decodes the information source code input via the control switch 902 by the decoding method corresponding to bitrate 2, and outputs the output signal obtained by decoding via the control switch 90 3. Do.
  • the signal decoding unit 906 decodes the information source code input via the control switch 902 by the decoding method corresponding to bitrate 3, and outputs the output signal obtained by decoding via the control switch 90 3. Do.
  • signal decoding units 904-906 in FIG. 9 is the same as the internal configuration of base layer decoding unit 407 in FIG. 4, and the type and output of the source code to be input are The description is omitted because only the type of signal differs.
  • the above-described speech encoding method such as CELP uses a voice source 'vocal tract model
  • human speech can be efficiently encoded, but for example, environmental noise existing in the background Components other than human speech such as etc. can not be encoded efficiently. Therefore, when environmental noise is present on the transmission side, in order to encode the voice's tone signal on the transmission side including the environmental noise with the same quality as that in the absence of environmental noise, the environment on the transmission side More bits are required than in the absence of noise.
  • FIG. 10 is a block diagram showing a configuration of a communication terminal apparatus according to Embodiment 2 of the present invention.
  • the same components as those of the communication terminal devices 100 and 150 shown in FIG. 2 are assigned the same reference numerals as in FIG.
  • Communication terminal apparatus 1000 in FIG. 10 differs from transmission mode determining section 101 in the operation of transmission mode determining section 1001 as compared with communication terminal apparatus 100 in FIG. Further, in the communication terminal apparatus 1050 in FIG. 10, the operation of the transmission mode determination unit 1051 is different from that of the transmission mode determination unit 151 in comparison with the communication terminal apparatus 150 in FIG.
  • Transmission mode determination unit 1001 detects environmental noise included in the background of voice and tone signals in the input signal, and transmits from communication terminal apparatus 1050, which is the other party's communication terminal, according to the level of the environmental noise. The transmission mode to control the transmission bit rate of the signal to be transmitted is determined, and transmission mode information indicating the determined transmission mode is output to the transmission line 110. In addition, transmission mode determination section 1001 performs transmission bit rate at the time of encoding / decoding based on the level of environmental noise in the input signal and the transmission mode information transmitted from communication terminal apparatus 1050 via transmission path 110. Is determined, and transmission mode information indicating the determined transmission mode is output to the signal encoding unit 102 and the signal decoding unit 103.
  • the transmission mode determination unit 1001 mainly includes a masking level calculation unit 1101 and a transmission mode determination unit 1102.
  • the level of environmental noise is determined each time each frame is processed, and the power described in the processing to be output is described.
  • the following processing is triggered by pressing a button from the user of the communication terminal or the like. It is also possible to perform the following processing at certain fixed time intervals.
  • the masking level calculation unit 1101 calculates the masking level from the input signal, and outputs the calculated masking level to the transmission mode determination unit 1102.
  • Transmission mode determination unit 1102 controls the transmission bit rate in consideration of environmental noise on the transmission side based on the comparison result of masking level output from masking level calculation unit 1101 and a predetermined threshold value. Are determined, and information indicating the determined transmission mode (hereinafter referred to as “first transmission mode information”) is output to the transmission line 110. Also, transmission mode judgment Unit 1102 is based on the first transmission mode information and transmission mode information (hereinafter referred to as “second transmission mode information”) transmitted from communication terminal apparatus 1050 via transmission path 110, on the transmitting side and the receiving side. Determines the transmission mode for controlling the transmission bit rate in consideration of environmental noise in the network, and information indicating the determined transmission mode (hereinafter referred to as “third transmission mode information”) is signal encoding unit 102 and signal decoding unit Output to 103.
  • transmission mode determination section 1001 calculates the maximum value and the minimum value of the power value of the input signal in a predetermined period, and the level of environmental noise included in the input signal is calculated from the maximum value and the minimum value.
  • the processing of the transmission mode determination unit 1102 will be described in the case of determining and controlling the bit rate according to the level.
  • transmission mode determination section 1102 determines first transmission mode information Mode ′ from P frame and P frame output from masking level calculation section 1101 according to the following equation 4.
  • Th ′ is the same as that of the environmental noise of the environmental noise by the same experiment as the preliminary experiment described in the first embodiment.
  • transmission mode determination section 1102 outputs first transmission mode information Mode ′ to transmission path 110.
  • transmission mode determination section 1102 uses the second transmission mode information Mode ′ transmitted from communication terminal apparatus 1050 via transmission path 110 to generate third transmission mode information according to equation 5 below.
  • Mode ′ is obtained and output to the signal coding unit 102 and the signal decoding unit 103.
  • transmission mode determination unit 1051 in FIG. 10 is the same as the transmission mode determination unit in FIG. It is identical to the configuration of 1001.
  • the receiving side recognizes such environmental noise and uses the masking effect by the environmental noise, so that the transmitting side can It becomes possible to communicate voice and tone signals using the minimum transmission bit rate within the range that does not affect human hearing, thereby greatly improving channel efficiency.
  • information on the environmental noise on the transmitting side is detected, and this can be used as the sign of the voice / music signal to make more efficient communication possible.
  • the transmission mode information determination method of the present invention is applied to unidirectional communication represented by a music distribution service using a mobile terminal such as a mobile phone.
  • FIG. 12 is a block diagram showing a configuration of a communication apparatus according to Embodiment 3.
  • the communication device 1200 is a communication terminal device on the user side that receives the music distribution service
  • the communication device 1250 is a base station device on the server side of music distribution.
  • Communication apparatus 1200 mainly includes transmission mode determining section 1201 and signal decoding section 1202.
  • the communication device 1250 includes a signal encoding unit 1251.
  • Transmission mode determination unit 1201 detects environmental noise included in the background of the input signal that is a voice tone signal, and controls the transmission bit rate in communication device 1250 according to the level of the environmental noise. Are output to the transmission path 110 and the signal decoding unit 1202 as transmission mode information.
  • Signal encoding section 1251 encodes the input signal based on the transmission mode information transmitted through transmission path 110, and then integrates the transmission signal with transmission mode information, and transmits this as transmission information to transmission path 110. Output.
  • the signal decoding unit 1202 decodes the encoded information transmitted through the transmission path 110, and outputs the obtained decoded signal as an output signal.
  • Signal decoding section 1202 compares the transmission mode information included in the encoded information output from transmission path 110 with the transmission mode information obtained from transmission mode determination section 1201 in consideration of transmission delay. By doing Transmission errors can be detected. Specifically, when the transmission mode information obtained from the transmission mode determination unit 1201 considering the transmission delay and the transmission mode information included in the coding information output from the transmission path 110 are different, the signal decoding unit A step 1202 determines that a transmission error has occurred in the transmission path 110.
  • the signal encoding unit 1251 of the communication apparatus 1250 does not integrate the transmission mode information into the code information, and the signal decoding unit 1202 uses the transmission mode information obtained from the transmission mode determination unit 1201. It is also possible to adopt a method of decoding code information output from the transmission line 110.
  • transmission mode determination unit 1201, signal encoding unit 1202, and signal decoding unit 1251 in FIG. 12 are the same as transmission mode determination unit 101, signal encoding unit 102 shown in FIG. 2, and signals, respectively.
  • decoding unit 103 is the same as the decoding unit 103, the detailed description of its configuration is omitted.
  • the base station apparatus can communicate the voice 'musical tone signal using the minimum transmission bit rate within the range that does not affect human's sense of hearing, whereby line efficiency can be improved. It can be greatly improved.
  • the transmission mode is determined by decoding the encoded information transmitted from the other side and detecting the environmental noise contained in the obtained decoded signal.
  • FIG. 13 is a block diagram showing a configuration of a communication terminal apparatus according to Embodiment 4.
  • the same components as those of the communication terminal devices 100 and 150 shown in FIG. 2 will be assigned the same reference numerals as in FIG.
  • Communication terminal apparatus 1300 in FIG. 13 differs from transmission mode determining section 101 in the operation of transmission mode determining section 1301 as compared with communication terminal apparatus 100 in FIG. Further, in the communication terminal device 1350 of FIG. 13, the operation of the transmission mode determination unit 1351 differs from that of the transmission mode determination unit 151 as compared with the communication terminal device 150 of FIG.
  • Transmission mode determination unit 1301 detects environmental noise included in the decoded signal, and A transmission mode for controlling a transmission bit rate at the time of encoding is determined according to the level of noise, and transmission mode information indicating the determined transmission mode is output to the signal encoding unit 102.
  • the transmission mode determination unit 1301 mainly includes a masking level calculation unit 1401 and a transmission mode determination unit 1402. Note that, like the transmission mode determination unit 101 in FIG. 2, the transmission mode determination unit 1301 in FIG. 13 determines the level of environmental noise every time each frame is processed and performs processing to output the same. It is also possible to perform the following processing using a button press or the like from the user of the communication terminal as a trigger, or to perform the following processing at certain time intervals.
  • the masking level calculation unit 1401 calculates the masking level of the decoded signal power output from the signal decoding unit 103 as in the masking level calculation unit 301 of FIG. 3, and calculates the masking level calculated. Are output to the transmission mode determination unit 1402.
  • transmission mode determination unit 1402 compares the masking level output from masking level calculation unit 1401 with a predetermined threshold, and based on the comparison result, , Determines the transmission mode for controlling the transmission bit rate, and outputs transmission mode information indicating the determined transmission mode to the signal encoding unit 102.
  • transmission mode determination unit 1351 in FIG. 13 is the same as the configuration of transmission mode determination unit 1301, and thus detailed description thereof will be omitted.
  • masking of environmental noise is performed by decoding encoded information transmitted from the other party and detecting environmental noise included in a decoded signal obtained.
  • the effects can be exploited and very efficient signal coding can be achieved.
  • the environmental noise on the transmitting side is used to determine the transmission mode.
  • FIG. 15 is a block diagram showing a configuration of a communication terminal apparatus according to the fifth embodiment.
  • the same components as in the communication terminal devices 100 and 150 shown in FIG. 2 are assigned the same reference numerals as in FIG.
  • Communication terminal apparatus 1500 in FIG. 15 has a transmission mode decision as compared to communication terminal apparatus 100 in FIG.
  • the operation of constant unit 1501 is different from that of transmission mode determination unit 101.
  • the operation of the transmission mode determining unit 1551 differs from that of the transmission mode determining unit 151 as compared with the communication terminal device 150 of FIG.
  • Transmission mode determination unit 1501 detects environmental noise included in the background of voice and tone signals in the input signal, and further detects environmental noise included in the decoded signal, and sets the level of the environmental noise to that level. In response, the transmission mode for controlling the transmission bit rate at the time of encoding is determined, and transmission mode information indicating the determined transmission mode is output to the signal encoding unit 102.
  • the transmission mode determination unit 1501 mainly includes a masking level calculation unit 1601 and a transmission mode determination unit 1602.
  • the transmission mode determination unit 1501 in FIG. 15 determines the level of environmental noise each time each frame is processed and performs processing for output similarly to the transmission mode determination unit 101 in FIG. It is also possible to perform the following processing using a button press or the like from the user of the communication terminal as a trigger, or to perform the following processing at certain time intervals.
  • Masking level calculation section 1601 calculates the masking level from the input signal and the decoded signal output from signal decoding section 103, and outputs the calculated masking level to transmission mode determination section 1602. .
  • transmission mode determination section 1602 compares the masking level output from masking level calculation section 1601 with a predetermined threshold, and based on the comparison result, , Determines the transmission mode for controlling the transmission bit rate, and outputs transmission mode information indicating the determined transmission mode to the signal encoding unit 102.
  • transmission mode determining section 1501 calculates the maximum value and the minimum value of the power value of the input signal for a predetermined period, and the level of environmental noise included in the input signal is calculated from the maximum value and the minimum value.
  • the processing of the masking level calculation unit 1601 and the transmission mode determination unit 1602 in the case where the method of determining and controlling the bit rate according to the level is adopted will be described.
  • the masking level calculation unit 1601 divides the input signal into N samples at a time (N is a natural number), and performs processing for each frame with the same section as one frame.
  • N is a natural number
  • the masking level calculation unit 1601 obtains the frame size Pframeu ′ of the frame to be processed according to the following equation 6.
  • the masking level calculation unit 1601 substitutes the frame power Pframeu obtained by Expression 6 into the buffer buft.
  • the masking level calculation unit 1601 calculates the maximum / J of the frame power Pframeu in the i section (section length N), the value Pframeu and the direct Pframeu ⁇ , Pframeu
  • masking level calculation section 1601 updates buffer bufh ′ according to the following equation 7.
  • the masking level calculation unit 1601 divides the decoded signal output from the signal decoding unit 103 by N samples (N is a natural number), and performs processing for each frame with N samples as one frame.
  • N is a natural number
  • the masking level calculation unit 1601 obtains the frame size Pframeu of the frame to be processed according to the following equation 8.
  • the masking level calculation unit 1601 substitutes the frame power Pframeu obtained by Equation 8 into the buffer bufli ⁇ .
  • the masking level calculation unit 1601 determines the transmission mode of Pframeu and Pframeu by extending the frame power Pframeu's maximum / J ⁇ [EPframeu; 3 ⁇ 4 * f @ frameu in the i section (section length N f ) Output to section 1602.
  • the masking level calculation unit 1601 updates the buffer bufh ⁇ according to the following equation 9.
  • the transmission mode determination unit 1602 determines transmission mode information Modeu ′ from Pframeu ′ and Pframeu ′ output from the masking level calculation unit 1601 according to the following Expression 10.
  • Thu ' is a predetermined constant based on the auditory masking effect of the environmental noise by the same experiment as the above-mentioned preliminary experiment.
  • transmission mode determination unit 1602 determines transmission mode information Modeu from P frameu ′ ′ and Pframeu ′ ′ output from masking level calculation unit 1601 according to Equation 11 below.
  • Thu is a predetermined constant based on the hearing effect of the environmental noise by the same experiment as the above-mentioned preliminary experiment.
  • the transmission mode determination unit 1602 transmits transmission mode information Modeu ′ and transmission mode information.
  • the transmission mode information Modeu ' is obtained by the following equation 12 using Modeu', and is output to the signal coding unit 102.
  • transmission mode determination unit 1551 in FIG. 15 is the same as that of transmission mode determination unit 1501, and the description thereof will be omitted.
  • the transmitting side when running sounds of cars and trains are present on the receiving side, environmental noise included in the voice 'musical tone signal transmitted from the receiving side on the transmitting side.
  • the transmitting side can communicate using the minimum transmission bit rate within the range that does not affect human hearing, and the line efficiency is greatly increased.
  • information on environmental noise on the transmitting side is detected and used for voice and tone signal coding, enabling more efficient communication.
  • the relay station on transmission path 110 adjusts the transmission bit rate transmitted from each communication terminal apparatus.
  • FIG. 17 is a block diagram showing configurations of a communication terminal apparatus and a relay station according to Embodiment 6 of the present invention.
  • a relay station 1730 exists in the middle of communication of the communication terminal devices 1700 and 1750 in FIG.
  • the same components as in the communication terminal devices 100 and 150 shown in FIG. 2 will be assigned the same reference numerals as in FIG.
  • Communication terminal apparatus 1700 in FIG. 17 is different from communication terminal apparatus 100 in FIG. 2 in the operation of transmission mode determination section 1701 and signal encoding section 1702 as transmission mode determination section 101 and signal encoding section, respectively. Different from 102. Further, the communication terminal apparatus 1750 of FIG. 17 is compared with the communication terminal apparatus 150 of FIG. 2 and the functions of the transmission mode determination section 1751 and the signal encoding section 1752 are respectively the transmission mode determination section 151 and the signal code section 152. It is different from Transmission mode determining section 1701 detects environmental noise included in the background of voice and tone signals in the input signal, and controls transmission bit rate when encoding according to the level of the environmental noise.
  • the mode is determined, and transmission mode information indicating the determined transmission mode is output to the transmission line 110 and the signal decoding unit 103.
  • the transmission mode determination unit 1701 in FIG. 17 determines the level of environmental noise each time each frame is processed and performs processing for output similarly to the transmission mode determination unit 101 in FIG. It is also possible to execute the following processing triggered by a button press or the like from the terminal user or to perform the following processing at certain time intervals.
  • Signal encoding section 1702 receives an input signal and initial transmission mode information, encodes the input signal according to the initial transmission mode information, and outputs the obtained encoded information to transmission path 110. .
  • the internal configuration of the signal coding unit 1702 is such that transmission mode information is replaced with initial transmission mode information as compared with the signal coding unit 102 shown in FIG.
  • Transmission mode determining unit 1751 detects environmental noise included in the background of voice and tone signals in the input signal, and controls transmission bit rate when encoding according to the level of the environmental noise. The mode is determined, and transmission mode information indicating the determined transmission mode is output to the transmission line 110 and the signal decoding unit 153.
  • Signal coding section 1752 receives an input signal and initial transmission mode information, codes the input signal according to initial transmission mode information, and integrates the obtained source code and initial transmission mode information. Then, this is output to the transmission line 110 as code information.
  • initial transmission mode information Mode A in communication terminal apparatuses 1700 and 1750 is represented by Formula 13 below.
  • ModeA , bitrate 2 ⁇ ⁇ ⁇ ⁇ ⁇ 3)
  • bitrate 3 Note that the internal configuration of the transmission mode determination unit 1751 in FIG. 17 is the same as that of the transmission mode determination unit 1701, and therefore the description thereof is omitted.
  • FIG. 18 An internal configuration of relay station 1730 will be described using FIG. In Figure 18
  • the case of controlling the transmission bit rate of the encoded information from communication terminal 1700 according to the transmission mode information from communication terminal 1750 will be described, but according to the transmission mode information from communication terminal 1700.
  • the relay station 1730 mainly includes an interface unit 1801, a coded information analysis unit 1802, a transmission mode conversion unit 1803, a coded information integration unit 1804, and an interface unit 1805.
  • Interface section 1801 receives the information transmitted from communication terminal apparatus 1700 via transmission path 110, and transmits information to communication terminal apparatus 1750 via transmission path 110.
  • Coded information analysis section 1802 analyzes the information transmitted from communication terminal apparatus 1700, and generates source code coded in each layer in signal coding section 1702 and initial transmission mode information Mode A. It separates and outputs the information to the transmission mode conversion unit 1803.
  • Transmission mode conversion section 1803 performs transmission bit rate conversion processing on the information source code and initial transmission mode information Mode A in accordance with transmission mode information Mode B transmitted from communication terminal apparatus 1750. Specifically, when the transmission mode conversion unit 1803 is the initial transmission mode information ModeA power 3 ⁇ 4itratel, and the transmission mode information ModeB is bitrate2, the initial transmission mode information ModeA is changed to bitrate2, and the base layer information source is generated. The code, the first enhancement layer information source code, and the initial transmission mode information Mode A are output to the code information integration unit 1804.
  • the transmission mode conversion unit 1803 when the transmission mode conversion unit 1803 is the initial transmission mode information Mode A power Sbitratel and the transmission mode information Mode B is bit rate 3, the transmission mode conversion unit 1803 changes the initial transmission mode information Mode A to bit rate 3, and Initial transmission mode information Mode A is output to the coding information integration unit 1804. Further, when the transmission mode information ModeA is 3 and 2 and the transmission mode information ModeB is bitrate3, the transmission mode conversion unit 1803 changes the initial transmission mode information ModeA to bitrate3, and the base layer information source code and the initial layer information source code. Transmission mode information Mode A is output to the code information integration unit 1804.
  • the transmission mode conversion unit 1803 outputs the information source code and the initial transmission mode information Mode A to the code information integration unit 1804 as it is.
  • Coding information integration section 1804 receives the information source code and initial transmission mode information Mode A obtained from transmission mode conversion section 1803, integrates them, and converts them as converted coding information into interface section 1805. Output to
  • the interface unit 1805 receives the information transmitted from the communication terminal 1750 via the transmission path 110, and transmits the information to the communication terminal 1700 via the transmission path 110.
  • the present embodiment it is possible to control the transmission bit rate also in the relay station which is not on the transmission side when environmental noise such as running noise of a car or a train is present on the reception side. S can. As a result, more flexible transmission bit rate control becomes possible, and line efficiency can be further improved.
  • the relay station can also determine the transmission mode in which the transmission bit rate is controlled using environmental noise on the transmission side in addition to environmental noise on the reception side.
  • FIG. 19 is a block diagram showing a configuration of relay station 1730 in this case, and the operation of transmission mode conversion unit 1901 is different from that of transmission mode conversion unit 1803 in FIG.
  • the transmission mode conversion unit 1901 performs transmission bit rate conversion processing on the information source code and the initial transmission mode information Mode A in accordance with the transmission mode information Mode A ′ and the transmission mode information Mode B from the communication terminal 1700.
  • transmission mode conversion section 1901 is initial transmission mode information ModeA power tratel, transmission mode information ModeB power titrate, and transmission mode information
  • ModeA If it is ModeA 'power titrate, change the initial transmission mode information ModeA to bitrate2,
  • Base layer source code first enhancement layer source code, initial transmission mode information
  • Mode A is output to the code information integration unit 1804.
  • the transmission mode conversion unit 1901 is initial transmission mode information Mode A power and is transmission mode information Mode B power titrate.
  • the initial transmission mode information is
  • the ModeA change the bitrat e 2, and the base layer information source code, the first enhancement layer information source code, and outputs the initial transmission mode information ModeA to encoded information multiplexing section 1804.
  • the transmission mode conversion unit 1901 When the initial transmission mode information ModeA is bitrate, the transmission mode information ModeB is bitrate, and the transmission mode information ModeA 'power titrate, the transmission mode conversion unit 1901 The initial transmission mode information Mode A is changed to bit rate 3, and the base layer information source code and the initial transmission mode information Mode A are output to the encoded information integration unit 1804.
  • the transmission mode conversion unit 1901 is the initial transmission mode information ModeA power trate2
  • the transmission mode information ModeB is bitrate
  • the transmission mode information ModeA 'is bitrate the initial transmission low high is set.
  • Mode information Mode A is changed to bit rate 3, and the base layer information source code and transmission mode information Mode A are output to the code information integration unit 1804.
  • the transmission mode conversion unit 1901 integrates the information source code and transmission mode information Mode A as it is. Output to section 1804.
  • the transmission bit rate is controlled also in the relay station not on the transmitting side. can do. As a result, more flexible transmission bit rate control becomes possible, and line efficiency can be further improved.
  • transmission path 110 can be used in an environment where one-way communication of voice and tone signals is performed by scalable coding. If there is a relay station in the network, the relay station uses the transmission mode information transmitted from the communication terminal to reduce the amount of information of the encoded information transmitted from the base station, and then transmits the transmission path again. Can also be sent to
  • the present invention is suitable for use in a communication terminal apparatus of a packet communication system or a mobile communication system.

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Detection And Prevention Of Errors In Transmission (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Communication Control (AREA)

Abstract

 受信側の使用環境を考慮して送信側の伝送ビットレートを制御することにより、所定の品質を維持しつつ効率的な音声・楽音信号の符号化を行う通信装置。この装置では、伝送モード決定部(101)は、入力信号中の音声・楽音信号の背景に含まれる環境雑音を検知し、その環境雑音のレベルに応じて相手側通信端末である通信端末装置(150)から伝送される信号の伝送ビットレートを制御する伝送モードを決定する。信号復号化部(103)は、伝送路(110)を介して通信端末装置(150)から伝送される符号化情報を復号化し、得られた信号を出力信号として出力する。このとき、信号復号化部(103)は、伝送路(110)から出力される符号化情報に含まれる伝送モード情報と伝送モード決定部(101)から得られる伝送モード情報とを、伝送遅延を考慮した上で比較することにより、伝送誤りを検出する。

Description

明 細 書
通信装置及び信号符号化 Z復号化方法
技術分野
[0001] 本発明は、インターネット通信に代表されるパケット通信システムや、移動通信シス テムなどで音声'楽音信号を伝送する場合における通信装置及び信号符号ィヒ Z復 号化方法に関するものである。
背景技術
[0002] インターネット通信に代表されるパケット通信システムや、移動通信システムなどで 音声'楽音信号を伝送する場合、音声'楽音信号の伝送効率を高めるため、圧縮'符 号化技術がよく使われる。また、信号の多重化に関しても、各通信端末の伝送ビット レートが小さい程、多くの通信の多重化が可能になるため、多くの加入者が同時に通 信するためには、各通信端末の伝送ビットレートを下げ、回線の効率化を図る手法が 望まれている。
[0003] これに対して、従来から、通信端末及び基地局において、同時接続者数、呼損率、 接続待ち時間、 BER (Bit Error Rate)、 SIR (Signal Interference Ratio)等の情報を 取得し、得られた情報に応じて、予め定められた複数の通信モードの中から適切な モードを選択して通信を行うことにより、伝送ビットレートを下げる技術が開示されてい る(例えば、特許文献 1)。
[0004] また、話者の音声の有無を検出し、その検出結果に応じて伝送ビットレートを制御 するという手法も開発されている。例えば、非特許文献 1には、話者の音声の有無を 検出し、話者が音声を発している区間(有声区間)は高ビットレートで符号ィ匕し、話者 が音声を発していない区間(無声区間)は低ビットレートで符号ィ匕し伝送することによ り、全体として伝送ビットレートを下げる技術が開示されている(例えば、非特許文献 1 ) 0
特許文献 1 :特開平 11 - 331936号公報
非特許文献 l : ANSI/TIA/EIA-96-C, Speech Service Option Standard for Wideband Spread Spectrum Digital Cellular System 発明の開示
発明が解決しょうとする課題
[0005] しかしながら、上記従来の音声'楽音符号化/復号化方法では、送信側の通信環 境の一つとして通話中一定時間無音であれば伝送ビットレートを低くする制御を行つ ているのみで、受信側の使用環境については全く考慮されていないため、効率的な 伝送を行うことができないとレ、う課題を有してレ、る。
[0006] 本発明の目的は、受信側の使用環境を考慮して送信側の伝送ビットレートを制御 することにより、所定の品質を維持しつつ効率的な音声'楽音信号の符号化を行うこ とができる通信装置及び信号符号化/復号化方法を提供することである。
課題を解決するための手段
[0007] 本発明の通信装置は、入力信号に含まれる環境雑音のレベルに応じて通信相手 の装置から伝送される信号の伝送ビットレートを制御する伝送モードを決定し、前記 伝送モードを前記通信相手の装置に伝送する伝送モード決定手段と、前記通信相 手の装置にて前記伝送モードに対応した伝送ビットレートで入力信号を符号化して 得られた情報源符号を、前記通信相手の装置から伝送された前記伝送モードに基 づいて復号化する復号化手段と、を具備する構成を採る。
[0008] 本発明の通信装置は、通信相手の装置の入力信号に含まれる環境雑音のレベル に応じて自装置から伝送される信号の伝送ビットレートを制御する第 1伝送モードと、 自装置の入力信号に含まれる環境雑音のレベルとに基づレ、て前記自装置の入力信 号の伝送ビットレートを制御する第 2伝送モードを決定する伝送モード決定手段と、 前記第 2伝送モードに対応した伝送ビットレートで入力信号を符号化し、符号化によ つて得られた情報源符号と前記第 2伝送モードとを前記通信相手の装置に伝送する 符号化手段と、を具備する構成を採る。
[0009] 本発明の通信装置は、通信相手の装置にて符号化して得られた情報源符号を復 号化する復号化手段と、前記複号化手段にて復号化された信号の環境雑音のレべ ルに応じて入力信号の伝送ビットレートを制御する伝送モードを決定する伝送モード 決定手段と、前記伝送モード決定手段にて決定された伝送モードに対応した伝送ビ ットレートで前記入力信号を符号化し、符号化によって得られた情報源符号と前記伝 送モードとを前記通信相手の装置に伝送する符号化手段と、を具備する構成を採る
[0010] 本発明の通信装置は、通信相手の装置にて符号化して得られた情報源符号を復 号化する復号化手段と、入力信号に含まれる環境雑音のレベル及び前記複号化手 段にて復号化された信号の環境雑音のレベルに基づいて前記入力信号の伝送ビッ トレートを制御する伝送モードを決定する伝送モード決定手段と、前記伝送モード決 定手段にて決定された伝送モードに対応した伝送ビットレートで前記入力信号を符 号化し、符号化によって得られた情報源符号と前記伝送モードとを前記通信相手の 装置に伝送する符号化手段と、を具備する構成を採る。
[0011] 本発明の通信装置は、入力信号に含まれる環境雑音のレベルに応じて通信相手 の装置から伝送される信号の伝送ビットレートを制御する伝送モードを決定し、前記 伝送モードを前記通信相手の装置に伝送する伝送モード決定手段と、前記通信相 手の装置にて前記伝送モードに対応した伝送ビットレートで入力信号を符号化して 得られた情報源符号を、前記伝送モード決定手段にて決定された伝送モードに基づ いて復号化する復号化手段と、を具備する構成を採る。
[0012] 本発明の信号符号化/復号化方法は、第 1通信装置と第 2通信装置とが無線通信 を行い、前記第 2通信装置が入力信号を符号化して得られた情報源符号を前記第 1 通信装置に伝送し、前記第 1通信装置が前記情報源符号を復号化する信号符号化 /復号化方法であって、第 1通信装置において、入力信号に含まれる環境雑音のレ ベルに応じて第 2通信装置から伝送される信号の伝送ビットレートを制御する伝送モ ードを決定し、前記伝送モードを前記第 2通信装置に伝送する工程と、前記第 2通信 装置において、前記第 1通信装置にて決定された伝送モードに対応した伝送ビットレ ートで入力信号を符号化し、符号化によって得られた情報源符号を前記第 1通信装 置に伝送する工程と、前記第 1通信装置において、前記第 2通信装置から伝送され た前記伝送ビットレートの情報源符号を復号化する工程と、を具備する方法を採る。
[0013] 本発明の信号符号化 Z復号化方法は、入力信号に含まれる環境雑音のレベルに 応じて通信相手の装置から伝送される信号の伝送ビットレートを制御する伝送モード を決定し、前記伝送モードを前記通信相手の装置に伝送する工程と、前記通信相手 の装置にて前記伝送モードに対応した伝送ビットレートで入力信号を符号化して得ら れた情報源符号を、前記通信相手の装置から伝送された前記伝送モードに基づレ、 て復号化する工程と、を具備する方法を採る。
[0014] 本発明の信号符号化 Z復号化方法は、通信相手の装置にて符号化して得られた 情報源符号を復号化する工程と、前記復号化された信号の環境雑音のレベルに応 じて入力信号の伝送ビットレートを制御する伝送モードを決定する工程と、前記決定 された伝送モードに対応した伝送ビットレートで前記入力信号を符号化し、符号化に よって得られた情報源符号と前記伝送モードとを前記通信相手の装置に伝送するェ 程と、を具備する方法を採る。
発明の効果
[0015] 本発明によれば、受信側において自動車や電車の走行音等が存在した場合、受 信側における環境雑音によるマスキング効果を利用して送信側のビットレートを決定 することにより、送信側は、人間の聴感に影響のない範囲で最小限の伝送ビットレー トで通信することができるので、回線効率を大幅に向上させることができる。
図面の簡単な説明
[0016] [図 1]聴感マスキング効果を説明する図
[図 2]本発明の実施の形態 1に係る通信端末装置の構成を示すブロック図
[図 3]上記実施の形態に係る通信端末装置の伝送モード決定部の内部構成を示す ブロック図
[図 4]上記実施の形態に係る通信端末装置の信号符号化部の内部構成を示すプロ ック図
[図 5]上記実施の形態に係る通信端末装置の基本レイヤ符号化部の内部構成を示 すブロック図
[図 6]上記実施の形態に係る通信端末装置の基本レイヤ復号化部の内部構成を示 すブロック図
[図 7]上記実施の形態に係る通信端末装置の信号復号化部の内部構成を示すプロ ック図
[図 8]上記実施の形態に係る通信端末装置の信号符号化部の内部構成を示すプロ ック図
[図 9]上記実施の形態に係る通信端末装置の信号復号化部の内部構成を示すプロ ック図
[図 10]本発明の実施の形態 2に係る通信端末装置の構成を示すブロック図
[図 11]上記実施の形態に係る通信端末装置の伝送モード決定部の内部構成を示す ブロック図
[図 12]本発明の実施の形態 3に係る通信装置の構成を示すブロック図
[図 13]本発明の実施の形態 4に係る通信端末装置の構成を示すブロック図
[図 14]上記実施の形態に係る通信端末装置の伝送モード決定部の内部構成を示す ブロック図
[図 15]本発明の実施の形態 5に係る通信端末装置の構成を示すブロック図
[図 16]上記実施の形態に係る通信端末装置の伝送モード決定部の内部構成を示す ブロック図
[図 17]本発明の実施の形態 6に係る通信端末装置及び中継局の構成を示すブロック 図
[図 18]上記実施の形態に係る中継局の構成を示すブロック図
[図 19]上記実施の形態に係る中継局の構成を示すブロック図
発明を実施するための最良の形態
[0017] MP3 (Mpeg-1 Audio Layer-3)や AAC (Advanced Audio Coding)に代表されるよう なオーディオ符号化方式では、聴感マスキング効果を利用し、帯域毎に符号化時の 量子化誤差が、符号ィ匕対象となるオーディオ信号力 算出されるマスキングレベル 以下になるように量子化することで、効率的な符号ィ匕を実現している。聴感マスキン グ効果とは、「ある周波数にエネルギーの大きな成分が存在することにより、その近隣 の周波数のエネルギーの小さな成分がマスクされ、聴覚的に聴こえなくなる」という現 象である。
[0018] 図 1は、聴感マスキング効果を説明する図である。図 1中の成分 B、成分 Cは、成分 A及び成分 Dにマスクされ聴感的には感知されない。従って、成分 B及び成分 Cのよ うなマスクされる成分は大きく削減しても知覚されなレ、。また、エネルギーの大きな成 分(図 1では三角形の領域の大きな成分)に対しては、符号化時に粗く量子化を行つ ても、その誤差 (量子化誤差)が人間の聴感的に知覚されにくいという性質がある。
[0019] 本発明では、オーディオ符号化方式によく用いられている聴感マスキング効果と符 号化時の量子化誤差の関係を環境雑音に応用し、環境雑音によるマスキングレベル に基づレ、て伝送ビットレートを制御する。
[0020] 以下、本発明の実施の形態について、添付図面を参照して詳細に説明する。
[0021] (実施の形態 1)
実施の形態 1では、通信端末同士の双方向通信において、環境雑音による聴感マ スキング効果を考慮して伝送モードを決定し、伝送ビットレートを制御する音声 ·楽音 符号化/複号化方法について説明する。
[0022] 図 2は、実施の形態 1に係る通信端末装置の構成を示すブロック図である。図 2で は、 2つの通信端末装置 100、 150の間で双方向通信を行うものとする。
[0023] まず、通信端末装置 100の構成について説明する。通信端末装置 100は、伝送モ ード決定部 101と、信号符号化部 102と、信号復号化部 103とから主に構成される。
[0024] 伝送モード決定部 101は、入力信号中の音声'楽音信号の背景に含まれる環境雑 音を検知し、その環境雑音のレベルに応じて相手側通信端末である通信端末装置 1 50から伝送される信号の伝送ビットレートを制御する伝送モードを決定する。その決 定した伝送モードを示す情報 (以下、「伝送モード情報」という)を伝送路 110及び信 号復号化部 103に出力する。なお、本実施の形態の一例では、予め定められた 2つ 以上の伝送ビットレートの中から一つの伝送ビットレートを選択するものとし、伝送モ ード情報は、予め定められた 3種類の伝送ビットレート bitratel、 bitrate2、 bitrate3 ( bitrate3 < bitrate2 < bitrate 1 )の値を取り得るものとする。
[0025] 信号符号化部 102は、伝送路 110を介して通信端末装置 150から伝送される伝送 モード情報に応じて、音声'楽音信号である入力信号を符号化し、得られた符号化 情報を伝送路 110に出力する。
[0026] 信号複号化部 103は、伝送路 110を介して通信端末装置 150から伝送される符号 化情報を復号化し、得られた信号を出力信号として出力する。なお、信号復号化部 1 03は、伝送路 110から出力される符号化情報に含まれる伝送モード情報と伝送モー ド決定部 101から得られる伝送モード情報とを、伝送遅延を考慮した上で比較するこ とにより、伝送誤りを検出することができる。具体的には、伝送遅延を考慮した伝送モ ード決定部 101から得られる伝送モード情報と伝送路 110から出力される符号化情 報に含まれる伝送モード情報とが異なる場合には、信号複号化部 103は、伝送路 11 0において伝送誤りが発生したと判断する。また、通信端末装置 150の信号符号化 部 152では、符号化情報に伝送モード情報を統合せず、信号復号化部 103では、 伝送モード決定部 101から得られる伝送モード情報を用いて、伝送路 110から出力 される符号ィ匕情報を復号化するという手法を採ることも可能である。
[0027] 次に、通信端末装置 150の構成について説明する。通信端末装置 150は、伝送モ ード決定部 151と、信号符号化部 152と、信号複号化部 153とから主に構成される。
[0028] 伝送モード決定部 151は、入力信号を入力とし、音声'楽音信号の背景に含まれる 環境雑音を検知し、その環境雑音のレベルに応じて通信端末装置 100から伝送され る信号の伝送ビットレートを制御する伝送モードを決定する。次に、決定した伝送モ ードを示す伝送モード情報を伝送路 110及び信号復号化部 153に出力する。
[0029] 信号符号化部 152は、伝送路 110を介して通信端末装置 100から伝送される伝送 モード情報を入力とし、伝送モード情報に応じて、音声'楽音信号である入力信号を 符号化し、得られた符号ィヒ情報を伝送路 110に出力する。
[0030] 信号復号化部 153は、伝送路 110を介して通信端末装置 100から伝送される符号 化情報及び伝送モード決定部 151から得られる伝送モード情報を入力とし、符号化 情報を復号化した後、得られた信号を出力信号として出力する。なお、信号復号ィ匕 部 153は、伝送路 110から出力される符号化情報に含まれる伝送モード情報と伝送 モード決定部 151から得られる伝送モード情報とを、伝送遅延を考慮した上で比較 することにより、伝送誤りを検出することができる。具体的には、伝送遅延を考慮した 伝送モード決定部 151から得られる伝送モード情報と伝送路 110から出力される符 号化情報に含まれる伝送モード情報とが異なる場合には、信号複号化部 153は、伝 送路 110において伝送誤りが発生したと判断する。また、通信端末装置 100の信号 符号化部 102では、符号化情報に伝送モード情報を統合せず、信号復号化部 153 では、伝送モード決定部 151から得られる伝送モード情報を用いて、伝送路 110から 出力される符号ィ匕情報を復号化するという手法を採ることも可能である。
[0031] 次に、図 2の伝送モード決定部 101の内部構成について、図 3を用いて説明する。
なお、図 2の伝送モード決定部 151の構成は伝送モード決定部 101の構成と同じで ある。
[0032] 伝送モード決定部 101は、マスキングレベル算出部 301と、伝送モード判定部 302 とから主に構成される。
[0033] マスキングレベル算出部 301は、入力信号からマスキングレベルを算出し、算出さ れたマスキングレベルを伝送モード判定部 302に出力する。
[0034] 伝送モード判定部 302は、マスキングレベル算出部 301から出力されたマスキング レベルと所定の閾値とを比較し、比較結果に基づいて伝送ビットレートを決定する。 具体的には、通信端末装置 100において検知された通信端末装置 100側に存在す る環境雑音のレベルが大きくマスキングレベルが大きい場合には伝送ビットレートを 低くする。これは、その環境雑音による聴感マスキング効果により通信端末装置 150 力 伝送する符号化情報の量子化誤差がある程度マスキングされるため、通信端末 装置 150において伝送ビットレートを低くしても、低くしなかった場合と聴感的に同等 の品質の復号化信号が得られるという原理に基づくものである。一方、通信端末装置 100において検知された通信端末装置 100側に存在する環境雑音のレベルが小さ い場合には、その環境雑音の聴感マスキング効果によって、通信端末装置 150から 伝送する符号ィ匕情報の量子化誤差がマスキングされないため、伝送ビットレートを高 くする。
[0035] そして、伝送モード判定部 302は、決定した伝送モードを示す伝送モード情報を伝 送路 110及び信号複号化部 103に出力する。
[0036] ここで、伝送モード決定部 101が、所定期間(例えば、 5秒一 10秒程度の一定区間 内)の入力信号のパワー値の最大値と最小値を算出し、最大値と最小値とから、入力 信号に含まれる環境雑音のレベルを判定し、そのレベルに応じてビットレートを制御 する方法を採る場合におけるマスキングレベル算出部 301及び伝送モード判定部 3 02の処理について説明する。なお、ここでは各フレームを処理する毎に、環境雑音 のレベルを判定し、出力する処理を行う場合について説明するが、この他に、通信端 末のユーザからのボタン押下などをトリガとして以下の処理を行う、あるいは、ある一 定時間間隔ごとに以下の処理を行うといったことも可能である。さらに、一定時間間 隔ごとに環境雑音のレベルを検出し、検知した環境雑音のレベルと前回検知したも のとの差が所定の閾値より大きい場合に以下の処理を行うといったことも可能である。
[0037] まず、マスキングレベル算出部 301の処理について説明する。マスキングレベル算 出部 301は、入力信号を Nサンプノレずつ区切り(Nは自然数)、同区間を 1フレームと してフレーム毎に処理を行う。以下、符号化の対象となる入力信号を X (η = 0, · · · ,Ν -1)と表す。
[0038] また、マスキングレベル算出部 301は、内部にバッファ buf (i=0, ' ' ' ,N -l)を有す る。ここで、 Nは予め定められる非負の整数であり、 1フレームのサンプル数 Nに依存
i
し、 1フレームの区間がおよそ 20ミリ秒程度の場合には、 100 500程度の値で性能が 得られることが確認されてレ、る。
[0039] 次に、マスキングレベル算出部 301は、処理対象であるフレームのフレームパワー
Pframeを以下の式 1により求める。
[0040] [数 1]
N-1
Pframe = |JCM | · · · ( 1 ) 次に、マスキングレベル算出部 301は、式 1により求めたフレームパワー Pframeをバ ッファ buf に代入する。
Ni-l
[0041] 次に、マスキングレベル算出部 301は、 i区間(区間長 N )におけるフレームパワー P frameの最 /Jヽィ直 Pframe と最大ィ [kPframe を永め、 Pframe 、 Pframe 伝送モ
IN MAX IN MAX
ード判定部 302に出力する。
[0042] 次に、マスキングレベル算出部 301は、以下の式 2によりバッファ bufを更新する。
i
[0043] [数 2]
み" " (i = 0, -Nt - 2) · · · ( 2 )
以上が、図 3のマスキングレベル算出部 301における処理の説明である。
[0044] 次に、伝送モード判定部 302における処理について説明する。伝送モード判定部 302は、マスキングレベル算出部 301から出力された Pframe 、 Pframe から、伝 送モード情報 Modeを以下の式 3により決定する c
[0045] [数 3]
Mode ' - - ( 3 )
Figure imgf000012_0001
ここで、 Th及び Th (Th <Th )は、環境雑音の聴感マスキング効果に基づいた
0 1 0 1
予備実験により予め定められた定数である。
[0046] 以下、 Th及び Thを算出するための予備実験について簡単に説明する。ここで、
0 1
Modeが bitrateのときに使用される符号ィ匕方法を符号化方法 A、符号ィ匕方法 Aにより
1
符号化した情報を復号して得られる信号を復号ィ匕信号 Aという。同様に、 Modeが bitrateのときに使用される符号ィヒ方法を符号化方法 B、符号化方法 Bにより符号ィ匕
2
した情報を復号して得られる信号を復号ィ匕信号 Bという。また、 Modeが bitrateのとき
3 に使用される符号化方法を符号化方法 C、符号化方法 Cにより符号化した情報を復 号して得られる信号を復号化信号 Cとレヽぅ。
[0047] 復号化信号 Aと復号化信号 Bに対して、平均的な雑音 (例えばホワイトノイズ等)を、 そのレベルが徐々に増加するように付加していき、雑音が付加された復号化信号 Aと 雑音が付加された復号化信号 Bが聴感的に等しくなつた時点の雑音レベルを Thと
0 する。同様に、雑音が付加された復号化信号 Aと雑音が付加された復号化信号 Cが 聴感的に等しくなつた時点の雑音レベルを Thとする。このようにして、雑音によるマ
1
スキング効果を利用し、 Th及び Thを実験的に定める。
0 1
[0048] 次に、伝送モード判定部 302は、伝送モード情報を伝送路 110及び信号複号化部
103に出力する。
[0049] 以上が、図 2の伝送モード決定部 101の内部構成の説明である。
[0050] 次に、図 2の信号符号化部 102の構成について、図 4を用いて説明する。なお、図
2の信号符号化部 152の構成は信号符号化部 102の構成と同じである。
[0051] ここで、本実施の形態では、基本レイヤと 2つの拡張レイヤとで構成される 3階層の 音声符号化/複号化方法において音声 ·楽音信号を符号化/復号化する場合につ いて説明する。ただし、本発明は階層について制限はなぐ 4階層以上の階層的な 音声符号化/復号化方法において音声'楽音信号を符号化/復号化する場合につ レ、ても適用すること力 Sできる。
[0052] 階層的な音声符号化方法とは、残差信号 (下位レイヤの入力信号と下位レイヤの 複号化信号との差)を符号化し、符号化情報を出力する音声符号化方法が上位レイ ャに複数存在して階層構造を成している方法である。また、階層的な音声複号化方 法とは、残差信号を復号ィヒする音声複号化方法が上位レイヤに複数存在して階層 構造を成している方法である。ここで、最下のレイヤに存在する音声符号化 Z復号化 方法を基本レイヤとする。また、基本レイヤより上位レイヤに存在する音声符号化 Z 複号化方法を拡張レイヤとする。なお、以下、基本レイヤにおける符号化部、復号ィ匕 部をそれぞれ基本レイヤ符号化部、基本レイヤ復号ィ匕部といい、拡張レイヤにおける 符号化部、複号化部をそれぞれ拡張レイヤ符号化部、及び拡張レイヤ複号化部とい う。
[0053] 信号符号化部 102は、伝送ビットレート制御部 401と、制御スィッチ 402— 405と、 基本レイヤ符号ィ匕部 406と、基本レイヤ復号化部 407と、加算部 408、 411と、第 1拡 張レイヤ符号ィ匕部 409と、第 1拡張レイヤ復号化部 410と、第 2拡張レイヤ符号化部 4 12と、符号化情報統合部 413とから主に構成される。
[0054] 入力信号は、基本レイヤ符号ィ匕部 406及び制御スィッチ 402に入力される。また、 伝送モード情報は、伝送ビットレート制御部 401に入力される。
[0055] 伝送ビットレート制御部 401は、入力した伝送モード情報に応じて、制御スィッチ 40 2— 405のオン/オフ制御を行う。具体的には、伝送ビットレート制御部 401は、伝送 モード情報が bitratelである場合、制御スィッチ 402— 405を全てオン状態にする。ま た、伝送ビットレート制御部 401は、伝送モード情報が bitrate2である場合、制御スィ ツチ 402及び 403をオン状態にし、制御スィッチ 404及び 405をオフ状態にする。ま た、伝送ビットレート制御部 401は、伝送モード情報が bitrate3である場合、制御スィ ツチ 402— 405を全てオフ状態にする。このように、伝送ビットレート制御部 401が伝 送モード情報に応じて制御スィッチをオン Zオフ制御することにより、入力信号の符 号化に用いる符号ィ匕部の組み合わせが決定される。なお、伝送モード情報は、伝送 ビットレート制御部 401から符号ィ匕情報統合部 413に出力される。 [0056] 基本レイヤ符号化部 406は、入力信号に対して符号化を行い、符号化により得られ た情報源符号 (以下、「基本レイヤ情報源符号」という)を制御スィッチ 403及び符号 化情報統合部 413に出力する。なお、基本レイヤ符号化部 406の内部構成につい ては後述する。
[0057] 基本レイヤ複号化部 407は、制御スィッチ 403がオン状態である場合、基本レイヤ 符号化部 406から出力された基本レイヤ情報源符号に対して復号ィ匕を行い、得られ た複号化信号 (以下、「基本レイヤ複号化信号」という)を加算部 408に出力する。な お、基本レイヤ複号化部 407は、制御スィッチ 403がオフ状態の場合には何も動作 しない。なお、基本レイヤ復号ィ匕部 407の内部構成については後述する。
[0058] 加算部 408は、制御スィッチ 402、 403がオン状態の場合、入力信号に、基本レイ ャ復号化部 407から出力された基本レイヤ復号ィ匕信号の極性を反転させた信号を 加算し、加算結果である第 1残差信号を第 1拡張レイヤ符号化部 409及び制御スイツ チ 404に出力する。なお、加算部 408は、制御スィッチ 402、 403がオフ状態の場合 には何も動作しない。
[0059] 第 1拡張レイヤ符号化部 409は、制御スィッチ 402、 403がオン状態の場合、加算 部 408から出力された第 1残差信号に対して符号化を行い、符号ィ匕により得られた 情報源符号 (以下、「第 1拡張レイヤ情報源符号」という)を制御スィッチ 405及び符 号化情報統合部 413に出力する。なお、第 1拡張レイヤ符号ィ匕部 409は、制御スイツ チ 402、 403がオフ状態の場合には何も動作しなレ、。
[0060] 第 1拡張レイヤ復号化部 410は、制御スィッチ 405がオン状態の場合、第 1拡張レ ィャ符号化部 409から出力された第 1拡張レイヤ情報源符号に対して復号化を行い 、複号化により得られた復号化信号 (以下、「第 1拡張レイヤ復号ィ匕信号」という)を加 算部 411に出力する。なお、第 1拡張レイヤ復号ィ匕部 410は、制御スィッチ 405がォ フ状態の場合には何も動作しない。
[0061] 加算部 411は、制御スィッチ 404、 405がオン状態の場合、第 1残差信号に、第 1 拡張レイヤ復号化部 410の出力信号の極性を反転させた信号を加算し、加算結果 である第 2残差信号を第 2拡張レイヤ符号化部 412に出力する。なお、加算部 411は 、制御スィッチ 404、 405がオフ状態の場合には何も動作しない。 [0062] 第 2拡張レイヤ符号化部 412は、制御スィッチ 404、 405がオン状態の場合、加算 部 411から出力される第 2残差信号に対して符号ィ匕を行い、符号化により得られた情 報源符号 (以下、「第 2拡張レイヤ情報源符号」という)を符号化情報統合部 413に出 力する。なお、第 2拡張レイヤ符号ィ匕部 412は、制御スィッチ 404、 405がオフ状態 の場合には何も動作しない。
[0063] 符号化情報統合部 413は、伝送ビットレート制御部 401から出力された伝送モード 情報、基本レイヤ符号化部 406から出力された基本レイヤ情報源符号、第 1拡張レイ ャ符号化部 409から出力された第 1拡張レイヤ情報源符号及び第 2拡張レイヤ符号 化部 412から出力された第 2拡張レイヤ情報源符号を統合し、統合後の符号化情報 を伝送路 110に出力する。
[0064] 以上が、図 4を用いた信号符号ィ匕部 102の構成の説明である。なお、以上では、各 フレーム処理時に常に伝送モード情報が伝送ビットレート制御部 401に入力されると レ、う条件で説明したが、伝送モード情報が伝送ビットレート制御部 401に入力されな い場合には、前回入力された伝送モード情報を伝送ビットレート制御部 401内のバッ ファに格納する等、前回入力時の伝送モード情報を使うことも可能である。
[0065] 次に、図 5を用いて、図 4における基本レイヤ符号化部 406の構成について説明す る。なお、本実施の形態では、基本レイヤ符号ィ匕部 406において、 CELPタイプの音 声符号化を行う場合について説明する。
[0066] 前処理部 501は、入力サンプリング周波数の信号に対し、 DC成分を取り除くハイ パスフィルタ処理や後続する符号化処理の性能改善につながるような波形整形処理 やプリエンファシス処理を行い、これらの処理後の信号(Xin)を LPC分析部 502およ び加算部 505に出力する。
[0067] LPC分析部 502は、 Xinを用いて線形予測分析を行い、分析結果 (線形予測係数) を LPC量子化部 503に出力する。 LPC量子化部 503は、 LPC分析部 502から出力 された線形予測係数 (LPC)の量子化処理を行い、量子化 LPCを合成フィルタ 504 に出力するとともに量子化 LPCを表す符号 (L)を多重化部 514に出力する。
[0068] 合成フィノレタ 504は、量子化 LPCに基づくフィルタ係数により、後述する加算部 51 1から出力される駆動音源に対してフィルタ合成を行うことにより合成信号を生成し、 合成信号を加算部 505に出力する。
[0069] 加算部 505は、合成信号の極性を反転させて Xinに加算することにより誤差信号を 算出し、誤差信号を聴覚重み付け部 512に出力する。
[0070] 適応音源符号帳 506は、過去に加算部 511によって出力された駆動音源をバッフ ァに記憶しており、パラメータ決定部 513から出力された信号により特定される過去の 駆動音源から 1フレーム分のサンプノレを適応音源ベクトルとして切り出して乗算部 50
9に出力する。
[0071] 量子化利得生成部 507は、パラメータ決定部 513から出力された信号によって特 定される量子化適応音源利得と量子化固定音源利得とをそれぞれ乗算部 509と乗 算部 510とに出力する。
[0072] 固定音源符号帳 508は、パラメータ決定部 513から出力された信号によって特定さ れる形状を有するパルス音源ベクトルに拡散ベクトルを乗算して得られた固定音源 ベクトルを乗算部 510に出力する。
[0073] 乗算部 509は、量子化利得生成部 507から出力された量子化適応音源利得を、適 応音源符号帳 506から出力された適応音源ベクトルに乗じて、加算部 511に出力す る。乗算部 510は、量子化利得生成部 507から出力された量子化固定音源利得を、 固定音源符号帳 508から出力された固定音源ベクトルに乗じて、加算部 511に出力 する。
[0074] 加算部 511は、利得乗算後の適応音源ベクトルと固定音源ベクトルとをそれぞれ乗 算部 509と乗算部 510とから入力し、これらをベクトル加算し、加算結果である駆動 音源を合成フィルタ 504および適応音源符号帳 506に出力する。なお、適応音源符 号帳 506に入力された駆動音源は、バッファに記憶される。
[0075] 聴覚重み付け部 512は、加算部 505から出力された誤差信号に対して聴覚的な重 み付けをおこない符号ィ匕歪みとしてパラメータ決定部 513に出力する。
[0076] パラメータ決定部 513は、聴覚重み付け部 512から出力された符号ィ匕歪みを最小 とする適応音源ベクトル、固定音源ベクトル及び量子化利得を、各々適応音源符号 帳 506、固定音源符号帳 508及び量子化利得生成部 507から選択し、選択結果を 示す適応音源ベクトル符号 (A)、固定音源ベクトル符号 (F)及び音源利得符号 (G) を多重化部 514に出力する。
[0077] 多重化部 514は、 LPC量子化部 503から量子化 LPCを表す符号 (L)を入力し、パ ラメータ決定部 513から適応音源ベクトルを表す符号 (A)、固定音源ベクトルを表す 符号 (F)および音源利得を表す符号 (G)を入力し、これらの情報を多重化して基本 レイヤ情報源符号として出力する。
[0078] 以上が、図 4の基本レイヤ符号化部 406の内部構成の説明である。
[0079] なお、図 4の第 1拡張レイヤ符号ィ匕部 409及び第 2拡張レイヤ符号ィ匕部 412の内部 構成は、基本レイヤ符号化部 406と同一であり、入力される信号の種類及び出力さ れる情報源符号の種類のみが異なるので、その説明は省略する。
[0080] 次に、図 4の基本レイヤ複号化部 407の内部構成について図 6を用いて説明する。
ここでは、基本レイヤ復号ィ匕部 407において、 CELPタイプの音声復号ィ匕を行う場合 について説明する。
[0081] 図 6において、基本レイヤ復号化部 407に入力された基本レイヤ情報源符号は、多 重化分離部 601によって個々の符号 (L、 A、 G、 F)に分離される。分離された LPC 符号 (L)は LPC復号化部 602に出力され、分離された適応音源ベクトル符号 (A)は 適応音源符号帳 605に出力され、分離された音源利得符号 (G)は量子化利得生成 部 606に出力され、分離された固定音源ベクトル符号 (F)は固定音源符号帳 607に 出力される。
[0082] LPC復号化部 602は、多重化分離部 601から出力された符号 (L)から量子化 LP
Cを復号ィ匕し、合成フィルタ 603に出力する。
[0083] 適応音源符号帳 605は、多重化分離部 601から出力された符号 (A)で指定される 過去の駆動音源から 1フレーム分のサンプノレを適応音源ベクトルとして取り出して乗 算部 608に出力する。
[0084] 量子化利得生成部 606は、多重化分離部 601から出力された音源利得符号 (G) で指定される量子化適応音源利得と量子化固定音源利得を複号化し乗算部 608及 び乗算部 609に出力する。
[0085] 固定音源符号帳 607は、多重化分離部 601から出力された符号 (F)で指定される 固定音源ベクトルを生成し、乗算部 609に出力する。 [0086] 乗算部 608は、適応音源ベクトルに量子化適応音源利得を乗算して、加算部 610 に出力する。乗算部 609は、固定音源ベクトルに量子化固定音源利得を乗算して、 加算部 610に出力する。
[0087] 加算部 610は、乗算部 608、 609から出力された利得乗算後の適応音源ベクトルと 固定音源ベクトルとの加算を行レ、、駆動音源を生成し、これを合成フィルタ 603及び 適応音源符号帳 605に出力する。
[0088] 合成フイノレタ 603は、 LPC復号ィ匕部 602によって復号化されたフィルタ係数を用い て、加算部 610から出力された駆動音源のフィルタ合成を行レ、、合成した信号を後 処理部 604に出力する。
[0089] 後処理部 604は、合成フィルタ 603から出力された信号に対して、ホルマント強調 やピッチ強調といったような音声の主観的な品質を改善する処理や、定常雑音の主 観的品質を改善する処理などを施し、基本レイヤ複号化情報として出力する。
[0090] 以上が、図 4の基本レイヤ復号化部 407の内部構成の説明である。
[0091] なお、図 4の第 1拡張レイヤ復号ィ匕部 410の内部構成は、基本レイヤ復号ィ匕部 407 の内部構成と同一であり、入力される情報源符号の種類及び出力される信号の種類 のみが異なるので、その説明は省略する。
[0092] 次に、図 2の信号復号化部 103の構成について図 7を用いて説明する。なお、図 2 の信号復号化部 153の構成は信号復号化部 103の構成と同じである。
[0093] 信号復号化部 103は、伝送ビットレート制御部 701と、基本レイヤ復号化部 702と、 第 1拡張レイヤ復号ィ匕部 703と、第 2拡張レイヤ復号化部 704と、制御スィッチ 705、 706と、力卩算咅 707、 708と力ら主に構成される。
[0094] 伝送ビットレート制御部 701は、受信した符号化情報に含まれる伝送モード情報に 応じて、制御スィッチ 705、 706のオン/オフ制御を行う。具体的には、伝送ビットレ ート制御部 701は、伝送モード情報が bitratelである場合、制御スィッチ 705、 706の 両方ともオン状態にする。また、伝送ビットレート制御部 701は、伝送モード情報が bitrate2である場合、制御スィッチ 705をオン状態にし、制御スィッチ 706をオフ状態 にする。また、伝送ビットレート制御部 701は、伝送モード情報が bitrate3である場合 、制御スィッチ 705、 706の両方ともオフ状態にする。また、伝送ビットレート制御部 7 01は、受信した符号化情報に含まれる基本レイヤ情報源符号、第 1拡張レイヤ情報 源符号及び第 2拡張レイヤ情報源符号を分離し、それぞれ基本レイヤ情報源符号を 基本レイヤ復号ィ匕部 702に出力し、第 1拡張レイヤ情報源符号を制御スィッチ 705に 出力し、第 2拡張レイヤ情報源符号を制御スィッチ 706に出力する。
[0095] 基本レイヤ複号化部 702は、伝送ビットレート制御部 701から出力された基本レイ ャ情報源符号を複号化し、基本レイヤ復号化信号を生成して加算部 708に出力する
[0096] 第 1拡張レイヤ複号化部 703は、制御スィッチ 705がオン状態の場合、伝送ビットレ ート制御部 701から出力された第 1拡張レイヤ情報源符号を復号ィ匕し、第 1拡張レイ ャ復号化信号を生成して加算部 707に出力する。なお、第 1拡張レイヤ複号化部 70 3は、制御スィッチ 705がオフ状態の場合には何も動作しない。
[0097] 第 2拡張レイヤ複号化部 704は、制御スィッチ 706がオン状態の場合、伝送ビットレ ート制御部 701から出力された第 2拡張レイヤ情報源符号を復号ィ匕し、第 2拡張レイ ャ復号化信号を生成して加算部 707に出力する。なお、第 2拡張レイヤ復号化部 70 4は、制御スィッチ 706がオフ状態の場合には何も動作しない。
[0098] 加算部 707は、制御スィッチ 705、 706がオン状態である場合、第 2拡張レイヤ復 号化部 704から出力された第 2拡張レイヤ復号ィ匕信号と第 1拡張レイヤ復号化部 70 3から出力された第 1拡張レイヤ復号ィ匕信号とを加算し、加算後の信号を加算部 708 に出力する。また、加算部 707は、制御スィッチ 706がオフ状態であり、かつ、制御ス イッチ 705がオン状態である場合、第 1拡張レイヤ復号化部 703から出力された第 1 拡張レイヤ復号ィ匕信号を加算部 708に出力する。なお、加算部 707は、制御スイツ チ 705、 706がオフ状態である場合には何も動作しなレ、。
[0099] 加算部 708は、基本レイヤ復号化部 702から出力された基本レイヤ複号化信号と 加算部 707の出力信号とを加算し、加算後の信号を出力信号として出力する。また、 加算部 708は、制御スィッチ 705、 706がオフ状態である場合、基本レイヤ複号化部 702から出力された基本レイヤ復号ィ匕信号を出力信号として出力する。
[0100] 以上が、図 2の信号複号化部 103の構成の説明である。
[0101] なお、図 7の基本レイヤ復号ィ匕部 702、第 1拡張レイヤ復号化部 703及び第 2拡張 レイヤ復号ィ匕部 704の内部構成は、図 4の基本レイヤ復号化部 407の内部構成と同 一であり、入力される信号の種類及び出力される情報源符号の種類のみが異なるの で、その説明は省略する。
[0102] ここで、信号符号化部 102及び信号復号化部 103における符号化 Z復号化方法と して、ビットレートの異なる複数の符号ィ匕 Z復号ィ匕方法を切り替えて符号化/複号化 する構成を適用することも可能である。以下、この場合の信号符号化部 102及び信 号複号化部 103の構成について図 8、図 9を用いて説明する。
[0103] なお、本実施の形態では、 3種類の音声符号化/複号化方法を利用して音声'楽 音信号を符号化 Z復号化する場合について説明する。ただし、本発明は符号化 Z 複号化方法の数について制限はなぐ 4種類以上の異なるビットレートの音声符号ィ匕
/複号化方法を利用して音声 ·楽音信号を符号化 Z復号化する場合にっレ、ても適 用すること力 sできる。
[0104] 図 8は、信号符号ィ匕部 102の内部構成を示すブロック図である。信号符号化部 102 は、伝送ビットレート制御部 801と、制御スィッチ 802、 803と、信号符号化部 804— 806と、符号化情報統合部 807とから主に構成される。
[0105] 入力信号は、制御スィッチ 802に入力される。また、伝送モード情報は、伝送ビット レート制御部 801に入力される。
[0106] 伝送ビットレート制御部 801は、入力した伝送モード情報に応じて、制御スィッチ 80 2、 803の切替え制御を行う。具体的には、伝送ビットレート制御部 801は、伝送モー ド情報が bitratelである場合、制御スィッチ 802、 803を両方とも信号符号化部 804 に接続する。また、伝送ビットレート制御部 801は、伝送モード情報が bitrate2である 場合、制御スィッチ 802、 803を両方とも信号符号化部 805に接続する。また、伝送 ビットレート制御部 801は、伝送モード情報が bitrate3である場合、制御スィッチ 802 、 803を両方とも信号符号化部 806に接続する。このように、伝送ビットレート制御部 801が伝送モード情報に応じて制御スィッチを切替え制御することにより、入力信号 の符号化に用いる符号化部が決定される。なお、伝送モード情報は、伝送ビットレー ト制御部 801から符号化情報統合部 807に出力される。
[0107] 信号符号化部 804は、 bitratelに対応する符号化方法で入力信号を符号化し、符 号化により得られた情報源符号を制御スィッチ 803経由で符号化情報統合部 807に 出力する。
[0108] 信号符号化部 805は、 bitrate2に対応する符号化方法で入力信号を符号化し、符 号化により得られた情報源符号を制御スィッチ 803経由で符号化情報統合部 807に 出力する。
[0109] 信号符号化部 806は、 bitrate3に対応する符号化方法で入力信号を符号化し、符 号化により得られた情報源符号を制御スィッチ 803経由で符号化情報統合部 807に 出力する。
[0110] 符号化情報統合部 807は、伝送ビットレート情報制御部 801から出力された伝送モ ード情報及びスィッチ 803から出力された情報源符号を統合し、統合後の符号化情 報を伝送路 110に出力する。
[0111] 以上が、図 8を用いた信号符号ィ匕部 102の構成の説明である。なお、以上では、各 フレーム処理時に常に伝送モード情報が伝送ビットレート制御部 801に入力されると レ、う条件で説明したが、伝送モード情報が伝送ビットレート制御部 801に入力されな い場合には、前回入力された伝送モード情報を伝送ビットレート制御部 801内のバッ ファに格納する等して、前回入力時の伝送モード情報を使うことも可能である。
[0112] なお、図 8の信号符号化部 804— 806の内部構成は、図 4の基本レイヤ符号ィ匕部 4 06と同一であり、入力される信号の種類及び出力される情報源符号の種類のみが異 なるので、その説明は省略する。
[0113] 図 9は、信号復号ィ匕部 103の内部構成を示すブロック図である。信号復号化部 103 は、伝送ビットレート制御部 901と、制御スィッチ 902、 903と、信号復号化部 904— 906とから主に構成される。
[0114] 符号化情報は、伝送ビットレート制御部 901に入力される。
[0115] 伝送ビットレート制御部 901は、受信した符号ィ匕情報に含まれる伝送モード情報に 応じて、制御スィッチ 902、 903の切替え制御を行う。具体的には、伝送ビットレート 制御部 901は、伝送モード情報が bitratelである場合、制御スィッチ 902、 903を両 方とも信号複号化部 904に接続する。また、伝送ビットレート制御部 901は、伝送モ ード情報が bitrate2である場合、制御スィッチ 902、 903を両方とも信号復号化部 90 5に接続する。また、伝送ビットレート制御部 901は、伝送モード情報が bitrate3である 場合、制御スィッチ 902、 903を両方とも信号復号化部 906に接続する。また、受信 した情報源符号を制御スィッチ 902に出力する。
[0116] 信号複号化部 904は、制御スィッチ 902経由で入力した情報源符号を bitratelに 対応する復号化方法で復号化し、復号ィ匕により得られた出力信号を制御スィッチ 90 3経由で出力する。
[0117] 信号複号化部 905は、制御スィッチ 902経由で入力した情報源符号を bitrate2に 対応する復号化方法で復号化し、復号ィ匕により得られた出力信号を制御スィッチ 90 3経由で出力する。
[0118] 信号複号化部 906は、制御スィッチ 902経由で入力した情報源符号を bitrate3に 対応する復号化方法で復号化し、復号ィ匕により得られた出力信号を制御スィッチ 90 3経由で出力する。
[0119] 以上が、図 9を用いた信号復号ィ匕部 103の構成の説明である。
[0120] なお、図 9の信号復号化部 904— 906の内部構成は、図 4の基本レイヤ復号ィ匕部 4 07の内部構成と同一であり、入力される情報源符号の種類及び出力される信号の 種類のみが異なるので、その説明は省略する。
[0121] このように、受信側の環境雑音によるマスキング効果を考慮して、環境雑音によるマ スキングレベルに応じて送信側の伝送ビットレートを制御することにより、効率的な音 声'楽音信号の符号化を行うことができる。
[0122] (実施の形態 2)
ここで、上述した CELP等の音声符号化方法は、音声の音源'声道モデルを用いる ため、人間の音声については効率的に符号ィ匕することができるが、例えば背景に存 在する環境雑音等のような人間の音声以外の成分に関しては効率的に符号化する ことはできない。従って、送信側に環境雑音が存在した場合に、その環境雑音を含 む送信側の音声'楽音信号を、環境雑音が存在しない場合と同等の品質で符号化 するためには、送信側に環境雑音が存在しない場合よりも多くのビットが必要となる。
[0123] 実施の形態 2では、受信側における環境雑音に加え、送信側における環境雑音も 考慮して伝送ビットレートを制御する場合について説明する。 [0124] 図 10は、本発明の実施の形態 2に係る通信端末装置の構成を示すブロック図であ る。なお、図 10に示す通信端末装置 1000、 1050において、図 2に示した通信端末 装置 100、 150と共通する構成部分には図 2と同一の符号を付して説明を省略する。
[0125] 図 10の通信端末装置 1000は、図 2の通信端末装置 100と比較して伝送モード決 定部 1001の作用が伝送モード決定部 101と異なる。また、図 10の通信端末装置 10 50は、図 2の通信端末装置 150と比較して伝送モード決定部 1051の作用が伝送モ ード決定部 151と異なる。
[0126] 伝送モード決定部 1001は、入力信号中の音声'楽音信号の背景に含まれる環境 雑音を検知し、その環境雑音のレベルに応じて相手側通信端末である通信端末装 置 1050から伝送される信号の伝送ビットレートを制御する伝送モードを決定し、決定 した伝送モードを示す伝送モード情報を伝送路 110に出力する。また、伝送モード 決定部 1001は、入力信号中の環境雑音のレベル及び通信端末装置 1050から伝 送路 110を介して伝送される伝送モード情報に基づいて符号化/復号化する際の 伝送ビットレートを制御する伝送モードを決定し、決定した伝送モードを示す伝送モ ード情報を信号符号化部 102及び信号復号化部 103に出力する。
[0127] 次に、図 10の伝送モード決定部 1001の内部構成について、図 11を用いて説明 する。伝送モード決定部 1001は、マスキングレベル算出部 1101と、伝送モード判定 部 1102とから主に構成される。なお、ここでは各フレームを処理する毎に、環境雑音 のレベルを判定し、出力する処理を行う場合について説明する力 この他に、通信端 末のユーザからのボタン押下などをトリガとして以下の処理を行う、あるいは、ある一 定時間間隔ごとに以下の処理を行うことも可能である。
[0128] マスキングレベル算出部 1101は、図 3のマスキングレベル算出部 301と同様に、入 力信号からマスキングレベルを算出し、算出されたマスキングレベルを伝送モード判 定部 1102に出力する。
[0129] 伝送モード判定部 1102は、マスキングレベル算出部 1101から出力されたマスキン グレベルと所定の閾値との比較結果に基づいて、送信側における環境雑音を考慮し て伝送ビットレートを制御する伝送モードを決定し、決定した伝送モードを示す情報( 以下、「第 1伝送モード情報」という)を伝送路 110に出力する。また、伝送モード判定 部 1102は、第 1伝送モード情報、及び、通信端末装置 1050から伝送路 110を介し て伝送される伝送モード情報 (以下、「第 2伝送モード情報」という)に基づいて、送信 側及び受信側における環境雑音を考慮して伝送ビットレートを制御する伝送モードを 決定し、決定した伝送モードを示す情報 (以下、「第 3伝送モード情報」という)を信号 符号化部 102及び信号複号化部 103に出力する。
[0130] ここで、伝送モード決定部 1001が、所定期間の入力信号のパワー値の最大値と最 小値を算出し、最大値と最小値とから、入力信号に含まれる環境雑音のレベルを判 定し、そのレベルに応じてビットレートを制御する方法を採る場合における伝送モード 判定部 1102の処理について説明する。
[0131] まず、伝送モード判定部 1102は、マスキングレベル算出部 1101から出力された P frame 、 Pframe から、第 1伝送モード情報 Mode'を以下の式 4により決定する。
IN MAX 1
[0132] [数 4]
βί ϋ≤ Pframe I Pframe
, 、 · · ,(4 )
{Pframe' J Pframe' MN < Th' )
Figure imgf000024_0001
なお、 Th'は、実施の形態 1で説明した予備実験と同様の実験により、環境雑音の
0
聴感マスキング効果に基づいて予め定められた定数である。
[0133] 次に、伝送モード判定部 1102は、第 1伝送モード情報 Mode'を伝送路 110に出力
1
する。
[0134] また、伝送モード判定部 1102は、通信端末装置 1050から伝送路 110を介して伝 送される第 2伝送モード情報 Mode'を用いて、以下の式 5により、第 3伝送モード情報
2
Mode'を求め、信号符号化部 102及び信号複号化部 103に出力する。
3
[0135] [数 5]
Figure imgf000024_0002
以上が、図 10の伝送モード決定部 1001の内部構成の説明である。
[0136] なお、図 10における伝送モード決定部 1051の構成は、図 10の伝送モード決定部 1001の構成と同一である。
[0137] このように、受信側において自動車や電車の走行音等が存在した場合、受信側に おいてそのような環境雑音を認識し、環境雑音によるマスキング効果を利用すること により、送信側は、音声'楽音信号を、人間の聴感に影響のない範囲で最小限の伝 送ビットレートを用いて通信することが可能となり、それによつて回線効率を大幅に向 上させることができる。また、受信側の環境雑音に加え、送信側における環境雑音の 情報を検知し、これを音声 ·楽音信号の符号ィヒに利用することにより、さらに効率的な 通信が可能となる。
[0138] (実施の形態 3)
実施の形態 3では、携帯電話等の携帯端末を利用した音楽配信サービスに代表さ れる単方向通信に関して、本発明の伝送モード情報決定方法を適用した例を説明 する。
[0139] 図 12は、実施の形態 3に係る通信装置の構成を示すブロック図である。図 12にお いて、通信装置 1200は音楽配信サービスを受けるユーザ側の通信端末装置であり 、通信装置 1250は音楽配信のサーバ側の基地局装置である。
[0140] 通信装置 1200は、伝送モード決定部 1201と、信号復号化部 1202とから主に構 成される。通信装置 1250は信号符号化部 1251を有する。
[0141] 伝送モード決定部 1201は、音声'楽音信号である入力信号の背景に含まれる環 境雑音を検知し、その環境雑音のレベルに応じて通信装置 1250における伝送ビット レートを制御する伝送モードを決定し、これを伝送モード情報として伝送路 110及び 信号復号化部 1202に出力する。
[0142] 信号符号化部 1251は、伝送路 110を介して伝送された伝送モード情報に基づい て入力信号を符号化した後、伝送モード情報と統合し、これを符号化情報として伝送 路 110に出力する。
[0143] 信号複号化部 1202は、伝送路 110を介して伝送される符号化情報を複号化し、 得られる複号化信号を出力信号として出力する。なお、信号複号化部 1202は、伝送 路 110から出力される符号化情報に含まれる伝送モード情報と伝送モード決定部 12 01から得られる伝送モード情報とを、伝送遅延を考慮した上で比較することにより、 伝送誤りを検出することができる。具体的には、伝送遅延を考慮した伝送モード決定 部 1201から得られる伝送モード情報と伝送路 110から出力される符号化情報に含 まれる伝送モード情報とが異なる場合には、信号復号化部 1202は、伝送路 110に おいて伝送誤りが発生したと判断する。また、通信装置 1250の信号符号化部 1251 では、符号ィ匕情報に伝送モード情報を統合せずに、信号復号ィ匕部 1202では、伝送 モード決定部 1201から得られる伝送モード情報を用いて、伝送路 110から出力され る符号ィ匕情報を復号化するという手法を採ることも可能である。
[0144] なお、図 12の伝送モード決定部 1201、信号符号化部 1202、信号複号化部 1251 の内部構成は、それぞれ図 2に示した伝送モード決定部 101、信号符号化部 102、 信号複号化部 103と同一であるので、それらの構成についての詳しい説明は省略す る。
[0145] このように、本実施の形態によれば、音楽配信サービス等の単方向通信システムに おいても、通信装置における環境雑音を検知し、環境雑音による聴感マスキング効 果を利用して伝送モード情報を決定することにより、基地局装置は、音声'楽音信号 を、人間の聴感に影響のない範囲で最小限の伝送ビットレートを用いて通信すること が可能となり、それによつて回線効率を大幅に向上させることができる。
[0146] (実施の形態 4)
実施の形態 4では、相手側から送信されてきた符号化情報を復号化し、得られる復 号化信号に含まれる環境雑音を検知することにより伝送モードを決定する場合につ いて説明する。
[0147] 図 13は、実施の形態 4に係る通信端末装置の構成を示すブロック図である。なお、 図 13に示す通信端末装置 1300、 1350において、図 2に示した通信端末装置 100 、 150と共通する構成部分には図 2と同一の符号を付して説明を省略する。
[0148] 図 13の通信端末装置 1300は、図 2の通信端末装置 100と比較して伝送モード決 定部 1301の作用が伝送モード決定部 101と異なる。また、図 13の通信端末装置 13 50は、図 2の通信端末装置 150と比較して伝送モード決定部 1351の作用が伝送モ ード決定部 151と異なる。
[0149] 伝送モード決定部 1301は、復号化信号に含まれる環境雑音を検知し、その環境 雑音のレベルに応じて符号化する際の伝送ビットレートを制御する伝送モードを決定 し、決定した伝送モードを示す伝送モード情報を信号符号化部 102に出力する。
[0150] 次に、図 13の伝送モード決定部 1301の内部構成について、図 14を用いて説明 する。伝送モード決定部 1301は、マスキングレベル算出部 1401と、伝送モード判定 部 1402とから主に構成される。なお、図 13の伝送モード決定部 1301は、図 2の伝 送モード決定部 101と同様、各フレームを処理する毎に環境雑音のレベルを判定し 、出力する処理を行うと手法の他に、通信端末のユーザからのボタン押下などをトリ ガとして以下の処理を行う、あるいは、ある一定時間間隔ごとに以下の処理を行うとい つたことも可能である。
[0151] マスキングレベル算出部 1401は、図 3のマスキングレベル算出部 301と同様に、信 号複号化部 103から出力された復号ィ匕信号力 マスキングレベルを算出し、算出さ れたマスキングレベルを伝送モード判定部 1402に出力する。
[0152] 伝送モード判定部 1402は、図 3の伝送モード判定部 302と同様に、マスキングレ ベル算出部 1401から出力されたマスキングレベルと所定の閾値とを比較し、比較結 果に基づレ、て伝送ビットレートを制御する伝送モードを決定し、決定した伝送モード を示す伝送モード情報を信号符号化部 102に出力する。
[0153] なお、図 13における伝送モード決定部 1351の内部構成は、伝送モード決定部 13 01の構成と同じであるので、その詳しい説明は省略する。
[0154] このように、本実施の形態によれば、相手側から送信されてきた符号化情報を復号 化し、得られる復号化信号に含まれる環境雑音を検知することにより、その環境雑音 のマスキング効果を利用することができ、非常に効率的な信号の符号ィ匕ができる。
[0155] (実施の形態 5)
実施の形態 5では、複号化信号に含まれる受信側における環境雑音に加え、送信 側における環境雑音も利用して伝送モードを決定する場合について説明する。
[0156] 図 15は、実施の形態 5に係る通信端末装置の構成を示すブロック図である。なお、 図 15に示す通信端末装置 1500、 1550において、図 2に示した通信端末装置 100 、 150と共通する構成部分には図 2と同一の符号を付して説明を省略する。
[0157] 図 15の通信端末装置 1500は、図 2の通信端末装置 100と比較して伝送モード決 定部 1501の作用が伝送モード決定部 101と異なる。また、図 15の通信端末装置 15 50は、図 2の通信端末装置 150と比較して伝送モード決定部 1551の作用が伝送モ ード決定部 151と異なる。
[0158] 伝送モード決定部 1501は、入力信号中の音声'楽音信号の背景に含まれる環境 雑音を検知し、さらに複号化信号に含まれる環境雑音を検知し、その環境雑音のレ ベルに応じて符号化する際の伝送ビットレートを制御する伝送モードを決定し、決定 した伝送モードを示す伝送モード情報を信号符号化部 102に出力する。
[0159] 次に、図 15の伝送モード決定部 1501の内部構成について、図 16を用いて説明 する。伝送モード決定部 1501は、マスキングレベル算出部 1601と、伝送モード判定 部 1602とから主に構成される。なお、図 15の伝送モード決定部 1501は、図 2の伝 送モード決定部 101と同様、各フレームを処理する毎に環境雑音のレベルを判定し 、出力する処理を行うと手法の他に、通信端末のユーザからのボタン押下などをトリ ガとして以下の処理を行う、あるいは、ある一定時間間隔ごとに以下の処理を行うとい つたことも可能である。
[0160] マスキングレベル算出部 1601は、入力信号と、信号復号化部 103から出力された 復号化信号とからマスキングレベルを算出し、算出されたマスキングレベルを伝送モ ード判定部 1602に出力する。
[0161] 伝送モード判定部 1602は、図 3の伝送モード判定部 302と同様に、マスキングレ ベル算出部 1601から出力されたマスキングレベルと所定の閾値とを比較し、比較結 果に基づレ、て伝送ビットレートを制御する伝送モードを決定し、決定した伝送モード を示す伝送モード情報を信号符号化部 102に出力する。
[0162] ここで、伝送モード決定部 1501が、所定期間の入力信号のパワー値の最大値と最 小値を算出し、最大値と最小値とから、入力信号に含まれる環境雑音のレベルを判 定し、そのレベルに応じてビットレートを制御する方法を採る場合におけるマスキング レベル算出部 1601及び伝送モード判定部 1602の処理について説明する。
[0163] マスキングレベル算出部 1601は、入力信号を Nサンプルずつ区切り(Nは自然数) 、同区間を 1フレームとしてフレーム毎に処理を行う。以下、符号化の対象となる入力 信号を u (η = 0, · · · ,Ν_1)と表す。 [0164] また、マスキングレベル算出部 1601は、内部にバッファ bufu' (i=0,''',N
-1)を有する。
[0165] 次に、マスキングレベル算出部 1601は、処理対象であるフレームのフレームパヮ 一 Pframeu'を以下の式 6により求める。
[0166] [数 6]
Pframeu' · · · (6)
Figure imgf000029_0001
次に、マスキングレベル算出部 1601は、式 6により求めたフレームパワー Pframeu をバッファ buft に代入する。
Ni-l
[0167] 次に、マスキングレベル算出部 1601は、 i区間(区間長 N )におけるフレームパワー Pframeu,の最 /J、値 Pframeu と取大ィ直 Pframeu ^求め、 Pframeu
IN MAX IN、 Pframeu を伝送モード判定部 1602に出力する。
MAX
[0168] 次に、マスキングレベル算出部 1601は、以下の式 7によりバッファ bufh'を更新する
[0169] [数 7]
bufu = bufu' M (i = ,---Nt -2) - · - (7)
次に、マスキングレベル算出部 1601は、信号復号化部 103から出力される復号化 信号を Nサンプルずつ区切り(Nは自然数)、 Nサンプルを 1フレームとしてフレーム 毎に処理を行う。以下、符号化の対象となる復号化信号 u〃(η=0
η ,···,Ν-1)と表す。
[0170] また、マスキングレベル算出部 1601は、内部にバッファ1) 11" =0,'''^-1)を有 する。
[0171] 次に、マスキングレベル算出部 1601は、処理対象であるフレームのフレームパヮ 一 Pframeu〃を以下の式 8により求める。
[0172] [数 8]
Pframeu" = …(8)
Figure imgf000029_0002
次に、マスキングレベル算出部 1601は、式 8により求めたフレームパワー Pframeu をバッファ bufli〃 に代入する。 [0173] 次に、マスキングレベル算出部 1601は、 i区間(区間長 Nf)におけるフレームパワー Pframeuの最 /Jヽ[EPframeu と; ¾*f@ frameu を永め、 Pframeu 、 Pframeu を伝送モード判定部 1602に出力する。
[0174] 次に、マスキングレベル算出部 1601は、以下の式 9によりバッファ bufh〃を更新する
[0175] [数 9]
bufu' = bufun M (i = 0, - - -N( - 2) - . . ( 9 )
以上が、図 16のマスキングレベル算出部 1601における処理の説明である。
[0176] 次に、伝送モード判定部 1602における処理について説明する。伝送モード判定 部 1602は、マスキングレベル算出部 1601から出力された Pframeu' 、 Pframeu' から、伝送モード情報 Modeu'を以下の式 10により決定する。
[0177] [数 10] )
)
Figure imgf000030_0001
ここで、 Thu'は、上述した予備実験と同様の実験により、環境雑音の聴感マスキン グ効果に基づいて予め定められた定数である。
[0178] 次に、伝送モード判定部 1602は、マスキングレベル算出部 1601から出力された P frameu" 、 Pframeu" から、伝送モード情報 Modeu を以下の式 11により決定する
[0179] [数 11]
)
) . . .(1 1 )
Figure imgf000030_0002
ここで、 Thu"は、上述した予備実験と同様の実験により、環境雑音の聴感- グ効果に基づいて予め定められた定数である。
[0180] 次に、伝送モード判定部 1602は、伝送モード情報 Modeu'と伝送モード情報
Modeu'を用いて、以下の式 12により、伝送モード情報 Modeu'を求め、信号符号化 部 102に出力する。
[0181] [数 12] bitrate^ {Modeu\ = bitrate w)and (Mode l 2 = titrate high J
Modeu、 ( 1 2 )
Figure imgf000031_0001
以上が、図 15の伝送モード決定部 1501の内部構成の説明である。
[0182] なお、図 15の伝送モード決定部 1551の内部構成は、伝送モード決定部 1501と 同一であり、説明を省略する。
[0183] このように、本実施の形態によれば、受信側において自動車や電車の走行音等が 存在した場合、送信側において、受信側から伝送されてきた音声'楽音信号に含ま れる環境雑音を認識し、環境雑音によるマスキング効果を利用することにより、送信 側は、人間の聴感に影響のない範囲で最小限の伝送ビットレートを用いて通信する ことが可能となり、それにより回線効率が大幅に向上する。また、受信側の環境雑音 に加え、送信側における環境雑音の情報を検知し、それを音声'楽音信号符号化に 利用することにより、より効率的な通信が可能となる。
[0184] (実施の形態 6)
実施の形態 6では、スケーラブル符号化方式により通信が行われている環境にお いて、伝送路 110にある中継局が各通信端末装置から伝送される伝送ビットレートを 調整する場合について説明する。
[0185] 図 17は、本発明の実施の形態 6に係る通信端末装置及び中継局の構成を示すブ ロック図である。また、図 17の通信端末装置 1700、 1750の通信途中に中継局 173 0が存在する。なお、図 17に示す通信端末装置 1700、 1750において、図 2に示し た通信端末装置 100、 150と共通する構成部分には図 2と同一の符号を付して説明 を省略する。
[0186] 図 17の通信端末装置 1700は、図 2の通信端末装置 100と比較して伝送モード決 定部 1701、信号符号化部 1702の作用がそれぞれ伝送モード決定部 101、信号符 号化部 102と異なる。また、図 17の通信端末装置 1750は、図 2の通信端末装置 15 0と比較して伝送モード決定部 1751、信号符号化部 1752の作用がそれぞれ伝送 モード決定部 151、信号符号ィ匕部 152と異なる。 [0187] 伝送モード決定部 1701は、入力信号中の音声'楽音信号の背景に含まれる環境 雑音を検知し、その環境雑音のレベルに応じて符号化する際の伝送ビットレートを制 御する伝送モードを決定し、決定した伝送モードを示す伝送モード情報を伝送路 11 0及び信号複号化部 103に出力する。なお、図 17の伝送モード決定部 1701は、図 2の伝送モード決定部 101と同様、各フレームを処理する毎に環境雑音のレベルを 判定し、出力する処理を行うと手法の他に、通信端末のユーザからのボタン押下など をトリガとして以下の処理を行う、あるいは、ある一定時間間隔ごとに以下の処理を行 うといつたことも可能である。
[0188] 信号符号化部 1702は、入力信号と初期伝送モード情報を入力し、初期伝送モー ド情報に応じて、入力信号を符号化し、得られた符号化情報を伝送路 110に出力す る。なお、信号符号化部 1702の内部構成は、図 4に示した信号符号化部 102と比較 して伝送モード情報を初期伝送モード情報に置き換えたものとなる。
[0189] 伝送モード決定部 1751は、入力信号中の音声'楽音信号の背景に含まれる環境 雑音を検知し、その環境雑音のレベルに応じて符号化する際の伝送ビットレートを制 御する伝送モードを決定し、決定した伝送モードを示す伝送モード情報を伝送路 11 0及び信号復号化部 153に出力する。
[0190] 信号符号化部 1752は、入力信号と初期伝送モード情報を入力し、初期伝送モー ド情報に応じて入力信号を符号ィヒし、得られた情報源符号及び初期伝送モード情報 を統合し、これを符号ィ匕情報として伝送路 110に出力する。
[0191] なお、通信端末装置 1700、 1750における初期伝送モード情報 ModeAは、以下の 式 13に表されるものとする。
[0192] [数 13]
bitratex
ModeA = , bitrate2 · · · 丄 3 )
bitrate3 なお、図 17の伝送モード決定部 1751の内部構成は、伝送モード決定部 1701と 同一であるため説明を省略する。
[0193] 次に、中継局 1730の内部構成について図 18を用いて説明する。なお、図 18では 、通信端末装置 1750からの伝送モード情報に応じて、通信端末装置 1700からの符 号化情報の伝送ビットレートを制御する場合について説明するが、通信端末装置 17 00からの伝送モード情報に応じて、通信端末装置 1750からの符号化情報の伝送ビ ットレートを制御する場合についても同様である。
[0194] 中継局 1730は、インターフェース部 1801と、符号化情報解析部 1802と、伝送モ ード変換部 1803と、符号化情報統合部 1804と、インターフェース部 1805とから主 に構成される。
[0195] インターフェース部 1801は、通信端末装置 1700から伝送される情報を伝送路 11 0経由で入力し、通信端末装置 1750への情報を伝送路 110経由で伝送する。
[0196] 符号化情報解析部 1802は、通信端末装置 1700から伝送された情報を解析し、信 号符号化部 1702内の各レイヤで符号化された情報源符号と初期伝送モード情報 ModeAとに分離し、それらの情報を伝送モード変換部 1803に出力する。
[0197] 伝送モード変換部 1803は、通信端末装置 1750から伝送された伝送モード情報 ModeBに応じて、情報源符号及び初期伝送モード情報 ModeAに対して、伝送ビット レート変換処理を行う。具体的には、伝送モード変換部 1803は、初期伝送モード情 報 ModeA力 ¾itratelであり、伝送モード情報 ModeBが bitrate2である場合には、初期 伝送モード情報 ModeAを bitrate2と変更し、基本レイヤ情報源符号と、第 1拡張レイヤ 情報源符号と、初期伝送モード情報 ModeAとを符号ィ匕情報統合部 1804に出力する 。また、伝送モード変換部 1803は、初期伝送モード情報 ModeA力 Sbitratelであり、伝 送モード情報 ModeBが bitrate3である場合には、初期伝送モード情報 ModeAを bitrate3と変更し、基本レイヤ情報源符号と、初期伝送モード情報 ModeAとを符号化 情報統合部 1804に出力する。また、伝送モード変換部 1803は、伝送モード情報 ModeA力 ¾itrate2であり、伝送モード情報 ModeBが bitrate3である場合には、初期伝 送モード情報 ModeAを bitrate3と変更し、基本レイヤ情報源符号と、初期伝送モード 情報 ModeAとを符号ィ匕情報統合部 1804に出力する。また、伝送モード変換部 1803 は、初期伝送モード情報 ModeA、伝送モード情報 ModeBが上記以外の組み合わせ の場合は、情報源符号及び初期伝送モード情報 ModeAをそのまま符号ィヒ情報統合 部 1804に出力する。 [0198] 符号化情報統合部 1804は、伝送モード変換部 1803から得られる情報源符号、及 び初期伝送モード情報 ModeAを入力し、これらを統合し、変換後符号化情報としてィ ンターフェース部 1805に出力する。
[0199] インターフェース部 1805は、通信端末装置 1750から伝送される情報を伝送路 11 0経由で入力し、通信端末装置 1700への情報を伝送路 110経由で伝送する。
[0200] 以上が、図 17の中継局 1730の構成についての説明である。
[0201] このように、本実施の形態によれば、受信側において自動車や電車の走行音等の 環境雑音が存在した場合に、送信側ではなぐ中継局においても伝送ビットレートを 制御すること力 Sできる。これにより、より柔軟な伝送ビットレート制御が可能となり、更な る回線効率の向上を図ることができる。
[0202] なお、本実施の形態では、中継局が、受信側における環境雑音に加え、送信側に おける環境雑音も利用して伝送ビットレートを制御する伝送モードを決定することもで きる。
[0203] 図 19は、この場合の中継局 1730の構成を示すブロック図であり、伝送モード変換 部 1901の作用が図 18の伝送モード変換部 1803と異なる。伝送モード変換部 1901 は、通信端末装置 1700からの伝送モード情報 ModeA'と伝送モード情報 ModeBとに 応じて、情報源符号及び初期伝送モード情報 ModeAに対して、伝送ビットレート変換 処理を行う。具体的には、伝送モード変換部 1901は、初期伝送モード情報 ModeA 力 tratelであり、伝送モード情報 ModeB力 titrate であり、かつ伝送モード情報
high
ModeA'力 titrate である場合には、初期伝送モード情報 ModeAを bitrate2と変更し、
high
基本レイヤ情報源符号と、第 1拡張レイヤ情報源符号と、初期伝送モード情報
ModeAとを符号ィ匕情報統合部 1804に出力する。また、伝送モード変換部 1901は、 初期伝送モード情報 ModeA力 tratelであり、伝送モード情報 ModeB力 titrate であ
low り、かつ伝送モード情報 ModeA'が bitrate である場合には、初期伝送モード情報
low
ModeAを bitrate2と変更し、基本レイヤ情報源符号と、第 1拡張レイヤ情報源符号と、 初期伝送モード情報 ModeAとを符号化情報統合部 1804に出力する。また、伝送モ ード変換部 1901は、初期伝送モード情報 ModeAが bitratelであり、伝送モード情報 ModeBが bitrate であり、かつ伝送モード情報 ModeA'力 titrate である場合には、 初期伝送モード情報 ModeAを bitrate3と変更し、基本レイヤ情報源符号と、初期伝送 モード情報 ModeAとを符号化情報統合部 1804に出力する。また、伝送モード変換 部 1901は、初期伝送モード情報 ModeA力 trate2であり、伝送モード情報 ModeBが bitrate であり、かつ伝送モード情報 ModeA'が bitrate である場合には、初期伝送 low high
モード情報 ModeAを bitrate3と変更し、基本レイヤ情報源符号と、伝送モード情報 ModeAとを符号ィ匕情報統合部 1804に出力する。また、伝送モード変換部 1901は、 初期伝送モード情報 ModeA、伝送モード情報 ModeB及び伝送モード情報 ModeA'が 上記以外の組み合わせの場合には、情報源符号及び伝送モード情報 ModeAをその まま符号化情報統合部 1804に出力する。
[0204] このように、本実施の形態によれば、受信側及び送信側において自動車や電車の 走行音等の環境雑音が存在した場合に、送信側ではなぐ中継局においても伝送ビ ットレートを制御することができる。これにより、より柔軟な伝送ビットレート制御が可能 となり、更なる回線効率の向上を図ることができる。
[0205] なお、本実施の形態と上記実施の形態 3とを組み合わせることにより、音声'楽音信 号の単方向通信方式通信がスケーラブル符号化方式により行われている環境にお いて、伝送路 110にある中継局が存在した場合に、その中継局が、通信端末から伝 送される伝送モード情報を利用し、基地局から伝送される符号化情報の情報量を削 減し、再び伝送路 110に送出することもできる。
[0206] 本明糸田書は、 2004年 2月 24曰出願の特願 2004—048569に基づく。この内容は すべてここに含めておく。
産業上の利用可能性
[0207] 本発明は、パケット通信システムや移動通信システムの通信端末装置に用いるに 好適である。

Claims

請求の範囲
[1] 入力信号に含まれる環境雑音のレベルに応じて通信相手の装置から伝送される信 号の伝送ビットレートを制御する伝送モードを決定し、前記伝送モードを前記通信相 手の装置に伝送する伝送モード決定手段と、
前記通信相手の装置にて前記伝送モードに対応した伝送ビットレートで入力信号 を符号化して得られた情報源符号を、前記通信相手の装置から伝送された前記伝 送モードに基づいて復号化する復号化手段と、を具備する通信装置。
[2] 通信相手の装置の入力信号に含まれる環境雑音のレベルに応じて自装置から伝 送される信号の伝送ビットレートを制御する第 1伝送モードと、 自装置の入力信号に 含まれる環境雑音のレベルとに基づいて前記自装置の入力信号の伝送ビットレート を制御する第 2伝送モードを決定する伝送モード決定手段と、
前記第 2伝送モードに対応した伝送ビットレートで入力信号を符号ィ匕し、符号化に よって得られた情報源符号と前記第 2伝送モードとを前記通信相手の装置に伝送す る符号化手段と、を具備する通信装置。
[3] 通信相手の装置にて符号化して得られた情報源符号を復号化する復号化手段と、 前記複号化手段にて復号化された信号の環境雑音のレベルに応じて入力信号の 伝送ビットレートを制御する伝送モードを決定する伝送モード決定手段と、
前記伝送モード決定手段にて決定された伝送モードに対応した伝送ビットレートで 前記入力信号を符号ィ匕し、符号化によって得られた情報源符号と前記伝送モードと を前記通信相手の装置に伝送する符号化手段と、を具備する通信装置。
[4] 通信相手の装置にて符号化して得られた情報源符号を復号化する複号化手段と、 入力信号に含まれる環境雑音のレベル及び前記復号ィヒ手段にて復号化された信 号の環境雑音のレベルに基づいて前記入力信号の伝送ビットレートを制御する伝送 モードを決定する伝送モード決定手段と、
前記伝送モード決定手段にて決定された伝送モードに対応した伝送ビットレートで 前記入力信号を符号ィヒし、符号ィヒによって得られた情報源符号と前記伝送モードと を前記通信相手の装置に伝送する符号化手段と、を具備する通信装置。
[5] 入力信号に含まれる環境雑音のレベルに応じて通信相手の装置から伝送される信 号の伝送ビットレートを制御する伝送モードを決定し、前記伝送モードを前記通信相 手の装置に伝送する伝送モード決定手段と、
前記通信相手の装置にて前記伝送モードに対応した伝送ビットレートで入力信号 を符号化して得られた情報源符号を、前記伝送モード決定手段にて決定された伝送 モードに基づいて復号化する複号化手段と、を具備する通信装置。
[6] 請求項 1記載の通信装置にて決定された伝送モードに対応した伝送ビットレートで 入力信号を符号ィ匕し、符号化によって得られた情報源符号と前記伝送モードとを前 記請求項 1記載の通信装置に伝送する符号化手段を具備する通信装置。
[7] 伝送モード決定手段は、所定期間の入力信号のパワー値の最大値と最小値を算 出し、前記パワー値の最大値あるいは最小値の少なくとも一つを用いて、入力信号 に含まれる環境雑音のレベルを検知する請求項 1に記載の通信装置。
[8] 伝送モード決定手段は、ユーザの指示に基づいて環境雑音のレベルを検知する 請求項 7記載の通信装置。
[9] 伝送モード決定手段は、入力信号に含まれる環境雑音のレベルを定期的に検知 する請求項 7記載の通信装置。
[10] 伝送モード決定手段は、検知した環境雑音のレベルと前回検知したものとの差が 所定の閾値より大きい場合に伝送モードを決定する処理を行う請求項 9記載の通信 装置。
[11] 第 1通信装置と第 2通信装置とが無線通信を行い、前記第 2通信装置が入力信号 を符号化して得られた情報源符号を前記第 1通信装置に伝送し、前記第 1通信装置 が前記情報源符号を復号化する信号符号化/復号化方法であって、
第 1通信装置において、入力信号に含まれる環境雑音のレベルに応じて第 2通信 装置から伝送される信号の伝送ビットレートを制御する伝送モードを決定し、前記伝 送モードを前記第 2通信装置に伝送する工程と、
前記第 2通信装置において、前記第 1通信装置にて決定された伝送モードに対応 した伝送ビットレートで入力信号を符号ィ匕し、符号ィ匕によって得られた情報源符号を 前記第 1通信装置に伝送する工程と、
前記第 1通信装置において、前記第 2通信装置から伝送された前記伝送ビットレー トの情報源符号を復号化する工程と、を具備する信号符号化/復号化方法。
[12] 入力信号に含まれる環境雑音のレベルに応じて通信相手の装置から伝送される信 号の伝送ビットレートを制御する伝送モードを決定し、前記伝送モードを前記通信相 手の装置に伝送する工程と、
前記通信相手の装置にて前記伝送モードに対応した伝送ビットレートで入力信号 を符号化して得られた情報源符号を、前記通信相手の装置から伝送された前記伝 送モードに基づいて復号化する工程と、を具備する信号符号化 Z復号化方法。
[13] 通信相手の装置にて符号化して得られた情報源符号を復号化する工程と、
前記復号化された信号の環境雑音のレベルに応じて入力信号の伝送ビットレート を制御する伝送モードを決定する工程と、
前記決定された伝送モードに対応した伝送ビットレートで前記入力信号を符号化し 、符号化によって得られた情報源符号と前記伝送モードとを前記通信相手の装置に 伝送する工程と、を具備する信号符号化/復号化方法。
PCT/JP2005/002764 2004-02-24 2005-02-22 通信装置及び信号符号化/復号化方法 WO2005081232A1 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CA002557000A CA2557000A1 (en) 2004-02-24 2005-02-22 Communication device, signal encoding/decoding method
US10/590,417 US7653539B2 (en) 2004-02-24 2005-02-22 Communication device, signal encoding/decoding method
DE602005009501T DE602005009501D1 (de) 2004-02-24 2005-02-22 Kommunikationseinrichtung, signalcodierungs-/ -decodierungsverfahren
EP05710495A EP1720154B1 (en) 2004-02-24 2005-02-22 Communication device, signal encoding/decoding method
CN2005800057013A CN1922660B (zh) 2004-02-24 2005-02-22 通信装置和通信方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2004-048569 2004-02-24
JP2004048569A JP4464707B2 (ja) 2004-02-24 2004-02-24 通信装置

Publications (1)

Publication Number Publication Date
WO2005081232A1 true WO2005081232A1 (ja) 2005-09-01

Family

ID=34879519

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2005/002764 WO2005081232A1 (ja) 2004-02-24 2005-02-22 通信装置及び信号符号化/復号化方法

Country Status (8)

Country Link
US (1) US7653539B2 (ja)
EP (2) EP1720154B1 (ja)
JP (1) JP4464707B2 (ja)
KR (1) KR20060131851A (ja)
CN (2) CN101819781B (ja)
CA (1) CA2557000A1 (ja)
DE (2) DE602005017952D1 (ja)
WO (1) WO2005081232A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103516483A (zh) * 2013-08-29 2014-01-15 天津大学 传输速率可按需调节的远距离有线数据传输装置

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4976381B2 (ja) * 2006-03-31 2012-07-18 パナソニック株式会社 音声符号化装置、音声復号化装置、およびこれらの方法
US8619623B2 (en) 2006-08-08 2013-12-31 Marvell World Trade Ltd. Ad-hoc simple configuration
US8233456B1 (en) 2006-10-16 2012-07-31 Marvell International Ltd. Power save mechanisms for dynamic ad-hoc networks
US8732315B2 (en) 2006-10-16 2014-05-20 Marvell International Ltd. Automatic ad-hoc network creation and coalescing using WiFi protected setup
US9308455B1 (en) 2006-10-25 2016-04-12 Marvell International Ltd. System and method for gaming in an ad-hoc network
JP4871894B2 (ja) * 2007-03-02 2012-02-08 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
WO2009006585A1 (en) 2007-07-03 2009-01-08 Marvell Semiconductor, Inc. Location aware ad-hoc gaming
US7987285B2 (en) 2007-07-10 2011-07-26 Bytemobile, Inc. Adaptive bitrate management for streaming media over packet networks
US7991904B2 (en) 2007-07-10 2011-08-02 Bytemobile, Inc. Adaptive bitrate management for streaming media over packet networks
CN101430880A (zh) * 2007-11-07 2009-05-13 华为技术有限公司 一种背景噪声的编解码方法和装置
US8775665B2 (en) * 2009-02-09 2014-07-08 Citrix Systems, Inc. Method for controlling download rate of real-time streaming as needed by media player
CN102376306B (zh) * 2010-08-04 2013-01-23 华为技术有限公司 语音帧等级的获取方法及装置
US9473406B2 (en) 2011-06-10 2016-10-18 Citrix Systems, Inc. On-demand adaptive bitrate management for streaming media over packet networks
WO2012170904A2 (en) 2011-06-10 2012-12-13 Bytemobile, Inc. Adaptive bitrate management on progressive download with indexed media files
US9560392B2 (en) * 2012-09-07 2017-01-31 Google Inc. Dynamic bit rate encoding
CN103780345A (zh) * 2014-01-21 2014-05-07 清华大学 密集通信中实时业务的多缓冲非恒速码传输系统和方法
CN105280188B (zh) * 2014-06-30 2019-06-28 美的集团股份有限公司 基于终端运行环境的音频信号编码方法和系统
JP6317235B2 (ja) * 2014-11-07 2018-04-25 日本電信電話株式会社 コンテンツサーバ装置、コンテンツサーバ装置の動作方法およびコンピュータプログラム
CN104485112B (zh) * 2014-12-08 2017-12-08 福建联迪商用设备有限公司 一种基于音频通讯中的音频解码方法及其装置
JP7262593B2 (ja) * 2019-01-13 2023-04-21 華為技術有限公司 ハイレゾリューションオーディオ符号化

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000244384A (ja) * 1999-02-18 2000-09-08 Mitsubishi Electric Corp 移動通信端末装置及び移動通信端末装置における音声符号化レート決定方法
JP2003218781A (ja) * 2002-01-24 2003-07-31 Toshiba Corp 通信端末およびネットワーク制御装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6125179A (en) * 1995-12-13 2000-09-26 3Com Corporation Echo control device with quick response to sudden echo-path change
JP3750705B2 (ja) 1997-06-09 2006-03-01 松下電器産業株式会社 音声符号化伝送方法及び音声符号化伝送装置
US6185244B1 (en) * 1997-08-29 2001-02-06 Telefonaktiebolaget Lm Ericsson Cell searching in a CDMA communications system
US6201796B1 (en) * 1998-05-14 2001-03-13 Broadcom Corporation Startup protocol for high throughput communications systems
JPH11331936A (ja) 1998-05-20 1999-11-30 Oki Electric Ind Co Ltd 移動体通信システム
US6275798B1 (en) * 1998-09-16 2001-08-14 Telefonaktiebolaget L M Ericsson Speech coding with improved background noise reproduction
JP3061039B2 (ja) 1998-10-20 2000-07-10 日本電気株式会社 無音圧縮符号復号化方法及びその装置
US6760435B1 (en) * 2000-02-08 2004-07-06 Lucent Technologies Inc. Method and apparatus for network speech enhancement
US6898566B1 (en) * 2000-08-16 2005-05-24 Mindspeed Technologies, Inc. Using signal to noise ratio of a speech signal to adjust thresholds for extracting speech parameters for coding the speech signal
JP2004048569A (ja) 2002-07-15 2004-02-12 Matsushita Electric Ind Co Ltd アンテナ用カバー

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000244384A (ja) * 1999-02-18 2000-09-08 Mitsubishi Electric Corp 移動通信端末装置及び移動通信端末装置における音声符号化レート決定方法
JP2003218781A (ja) * 2002-01-24 2003-07-31 Toshiba Corp 通信端末およびネットワーク制御装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP1720154A4 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103516483A (zh) * 2013-08-29 2014-01-15 天津大学 传输速率可按需调节的远距离有线数据传输装置
CN103516483B (zh) * 2013-08-29 2016-08-10 天津大学 传输速率可按需调节的远距离有线数据传输装置

Also Published As

Publication number Publication date
EP1720154A1 (en) 2006-11-08
CN101819781B (zh) 2012-03-14
DE602005009501D1 (de) 2008-10-16
CA2557000A1 (en) 2005-09-01
US7653539B2 (en) 2010-01-26
US20080167865A1 (en) 2008-07-10
JP4464707B2 (ja) 2010-05-19
CN101819781A (zh) 2010-09-01
CN1922660A (zh) 2007-02-28
EP1968047B1 (en) 2009-11-25
EP1720154A4 (en) 2007-02-28
EP1968047A2 (en) 2008-09-10
JP2005241761A (ja) 2005-09-08
DE602005017952D1 (de) 2010-01-07
EP1968047A3 (en) 2008-09-24
KR20060131851A (ko) 2006-12-20
EP1720154B1 (en) 2008-09-03
CN1922660B (zh) 2010-06-09

Similar Documents

Publication Publication Date Title
WO2005081232A1 (ja) 通信装置及び信号符号化/復号化方法
CA2562916C (en) Coding of audio signals
JP5203929B2 (ja) スペクトルエンベロープ表示のベクトル量子化方法及び装置
JP4518714B2 (ja) 音声符号変換方法
TWI642052B (zh) 用於產生一高頻帶目標信號之方法及設備
JP5413839B2 (ja) 符号化装置および復号装置
JP5753540B2 (ja) ステレオ信号符号化装置、ステレオ信号復号装置、ステレオ信号符号化方法及びステレオ信号復号方法
JP4263412B2 (ja) 音声符号変換方法
JP4489960B2 (ja) 音声の無声セグメントの低ビットレート符号化
WO2004097796A1 (ja) 音声符号化装置、音声復号化装置及びこれらの方法
WO2006118178A1 (ja) 音声符号化装置および音声符号化方法
KR20030041169A (ko) 무성 음성의 코딩 방법 및 장치
US8457953B2 (en) Method and arrangement for smoothing of stationary background noise
US8055499B2 (en) Transmitter and receiver for speech coding and decoding by using additional bit allocation method
JPH1097295A (ja) 音響信号符号化方法及び復号化方法
TW201603005A (zh) 在一裝置處切換寫碼技術之系統及方法
JP4236675B2 (ja) 音声符号変換方法および装置
KR100619893B1 (ko) 휴대단말기의 개선된 저전송률 선형예측코딩 장치 및 방법
JP2004053763A (ja) 多地点制御装置の音声符号化伝送システム
JP4985743B2 (ja) 音声符号変換方法

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BW BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE EG ES FI GB GD GE GH GM HR HU ID IL IN IS KE KG KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NA NI NO NZ OM PG PH PL PT RO RU SC SD SE SG SK SL SY TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): BW GH GM KE LS MW MZ NA SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IS IT LT LU MC NL PL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 2005710495

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 2557000

Country of ref document: CA

WWE Wipo information: entry into national phase

Ref document number: 4812/DELNP/2006

Country of ref document: IN

WWE Wipo information: entry into national phase

Ref document number: 200580005701.3

Country of ref document: CN

WWE Wipo information: entry into national phase

Ref document number: 1020067017018

Country of ref document: KR

WWE Wipo information: entry into national phase

Ref document number: 10590417

Country of ref document: US

WWP Wipo information: published in national office

Ref document number: 2005710495

Country of ref document: EP

WWP Wipo information: published in national office

Ref document number: 1020067017018

Country of ref document: KR

WWG Wipo information: grant in national office

Ref document number: 2005710495

Country of ref document: EP