WO2003098603A1 - Method and device for code conversion between audio encoding/decoding methods and storage medium thereof - Google Patents

Method and device for code conversion between audio encoding/decoding methods and storage medium thereof Download PDF

Info

Publication number
WO2003098603A1
WO2003098603A1 PCT/JP2003/006378 JP0306378W WO03098603A1 WO 2003098603 A1 WO2003098603 A1 WO 2003098603A1 JP 0306378 W JP0306378 W JP 0306378W WO 03098603 A1 WO03098603 A1 WO 03098603A1
Authority
WO
WIPO (PCT)
Prior art keywords
code
signal
circuit
fixed codebook
information
Prior art date
Application number
PCT/JP2003/006378
Other languages
English (en)
French (fr)
Inventor
Atsushi Murashima
Original Assignee
Nec Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nec Corporation filed Critical Nec Corporation
Priority to KR1020047018743A priority Critical patent/KR100672878B1/ko
Priority to EP03730566A priority patent/EP1507257A4/en
Priority to US10/515,168 priority patent/US8117028B2/en
Publication of WO2003098603A1 publication Critical patent/WO2003098603A1/ja

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/173Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders

Definitions

  • the present invention relates to an encoding and decoding method for transmitting or storing an audio signal at a low bit rate, and particularly, when performing audio communication using different encoding and decoding methods, the audio is encoded by a certain method.
  • the present invention relates to a code conversion method and apparatus for converting a code obtained by conversion into a code decodable by another method with high sound quality and low operation amount, and a program thereof.
  • the speech signal is separated into a linear prediction (LP) filter and an excitation signal for driving the filter, and then encoded.
  • LP linear prediction
  • One of the typical methods is code-excited linear prediction (Code Exc i te t d L i n e a r P R e d i c t i o n: CELP).
  • an LP filter with LP coefficients representing the frequency characteristics of the input speech is fixed to an adaptive codebook (ACB) representing the pitch period of the input speech, and a fixed number of random numbers and pulses.
  • a synthetic speech signal can be obtained by driving with an excitation signal expressed as the sum of the codebook (Fixed Codebook: FCB).
  • FCB Fixed Codebook
  • the ACB component and the FCB component are multiplied by an ACB gain and an FCB gain, respectively.
  • CELP Code Excited Linear Prediction
  • an audio signal (code sequence) is generated by encoding the audio according to one of the standard schemes, and then the audio signal is decoded using the standard scheme.
  • the audio signal is re-encoded according to the other standard system, that is, two encodings and one decoding are performed. For this reason, the number of times of encoding is increased one time, compared with the case where encoding and decoding are performed only once in each audio coding / decoding scheme, resulting in a decrease in sound quality, an increase in delay, and an increase in the amount of calculation. There is a problem.
  • FIG. 1 is a block diagram illustrating an example of a configuration of a transcoder 1500.
  • the conventional code converter 1 500 includes an input terminal 10, a code separation circuit 1010, an LP coefficient code conversion circuit 100, an ACB code conversion circuit 200, and an FCB code conversion circuit.
  • the circuit 300 includes a circuit 300, a gain code conversion circuit 400, a code multiplexing circuit 1020, and an output terminal 20.
  • the code separation circuit 1010 receives, via an input terminal 10, a first code string obtained by coding speech according to the first method.
  • the code separation circuit 1010 generates a code corresponding to a linear prediction coefficient (hereinafter referred to as “LP coefficient”), ACB (adaptive codebook), FCB (fixed codebook), ACB gain and FCB gain from the first code sequence, , LP coefficient code, ACB code, FCB code and gain code.
  • LP coefficient linear prediction coefficient
  • ACB adaptive codebook
  • FCB fixed codebook
  • the AC B gain and the FCB gain are encoded and decoded collectively, and for simplicity of description, the AC B gain and the FCB gain are hereinafter collectively referred to as “gain”, and the sign is referred to as “gain code”. I will call it.
  • the LP coefficient code, the ACB code, the FCB code, and the gain code separated from the first code string by the code separation circuit 1010 are referred to as “first LP coefficient code”, respectively. These are referred to as “first ACB code”, “first FCB code”, and “first gain code J”.
  • the code separation circuit 1010 outputs the first LP coefficient code to the LP coefficient code conversion circuit 100, outputs the first ACB code to the ACB code conversion circuit 200, and outputs the first FCB code to the FCB code conversion circuit 300. And outputs the first gain code to the gain code conversion circuit 400.
  • the LP coefficient code conversion circuit 100 receives the first LP coefficient code output from the code separation circuit 1010, decodes the first LP coefficient code by the LP coefficient decoding method in the first method, and Get the LP coefficient. Next, the first LP coefficient is quantized and coded by an LP coefficient quantization method and a coding method in the second method to obtain a second LP coefficient code. This second LP coefficient code is an LP coefficient code that can be decoded by the second method. Next, LP coefficient code conversion circuit 100 outputs the second LP coefficient code to code multiplexing circuit 1020.
  • the ACB code conversion circuit 200 receives the first ACB code output from the code separation circuit 1010, and converts the first ACB code into an ACB code that can be decoded by the second method.
  • the converted ACB code is used as a second ACB code as a code multiplexing circuit. Output to 1 0 2 0.
  • the FCB code conversion circuit 3000 receives the first FCB code output from the code separation circuit 11010, and converts the first FCB code into an FCB code that can be decoded by the second method.
  • the converted FCB code is output to the code multiplexing circuit 102 as a second FCB code.
  • the gain code conversion circuit 400 receives the first gain code output from the code separation circuit 11010 and decodes it by a gain decoding method in the first method to obtain a first gain. Next, the first gain is quantized and coded by a gain quantization method and a coding method in the second method to obtain a second gain code. This second gain code is a gain code that can be decoded by the second method. Next, the second gain code is output to code multiplexing circuit 102.
  • the code multiplexing circuit 10020 includes a second LP coefficient code output from the LP coefficient code conversion circuit 100, a second ACB code output from the ACB code conversion circuit 200, and an FCB code conversion.
  • the second FCB code output from the circuit 300 and the second gain code output from the gain code conversion circuit 400 are input, and a code sequence obtained by multiplexing them is converted into a second code. Output through the output terminal 20 as a column.
  • the conventional code conversion apparatus 1500 shown in FIG. 10 converts the number of pulses in the FCB of the first method and the second method. However, when the number of pulses in the FCB is different, all FCB codes cannot be converted.
  • the present invention has been made in view of such problems, and its main purpose is to perform code conversion from the first method to the second method, and to use a fixed code book (FCB) of the first method.
  • An object of the present invention is to provide a code conversion device, a code conversion method, and a code conversion program capable of converting all FCB codes even when the number of pulses in the FCB differs from the number of pulses in the second type FCB. Disclosure of the invention
  • the present invention provides a code conversion method for converting a first code string into a second code string, comprising: a first linear prediction coefficient and excitation signal information from the first code string.
  • a fixed codebook code of the second system is partially obtained from a fixed codebook code of the first system by conversion of the fixed codebook code based on code replacement.
  • a fixed codebook signal is obtained using the decoded speech signal generated from the information including the linear prediction coefficient, the adaptive codebook signal, and the gain in the i-th method, and the code corresponding to the fixed codebook signal is obtained.
  • the fixed codebook code of the second method is combined with the partial fixed codebook code.
  • the pulse position and pulse polarity can be obtained for the number of pulses required for the fixed codebook of the second method.
  • fixed codebook information included in the excitation signal information can be used as a part of fixed codebook information in the second code sequence.
  • fixed codebook information in the second code sequence can be obtained by minimizing a distance between the second audio signal and the first audio signal.
  • the fixed codebook information includes a pulse position and a pulse of a multi-pulse signal. Polarity.
  • a pulse position included in the excitation signal information is set as a candidate for a pulse position in the second code string, and a pulse position candidate is set between the second audio signal and the first audio signal. Can be minimized.
  • the present invention provides a code conversion device for converting a first code string into a second code string, wherein the first linear prediction coefficient and excitation signal information are obtained from the first code string, Using a speech decoding circuit that generates a first speech signal by driving a filter having linear prediction coefficients of the following with an excitation signal obtained from the excitation signal information, and using fixed codebook information included in the excitation signal information, A fixed codebook code generation circuit for obtaining fixed codebook information in a second codestream based on a second audio signal generated from information obtained from a second codestream and the first audio signal; A transcoding device is provided.
  • the fixed codebook code generation circuit can be configured to use the fixed codebook information as a part of the fixed codebook information in the second code sequence.
  • the fixed codebook code generation circuit obtains fixed codebook information in the second code sequence by minimizing a distance between the second audio signal and the first audio signal.
  • the fixed codebook information can be composed of a pulse position and a pulse polarity of a multi-pulse signal.
  • the fixed codebook code generation circuit sets a pulse position included in the excitation signal information as a pulse position candidate in the second code sequence. It can be configured to minimize the distance from the first audio signal.
  • the present invention is a program for causing a computer to execute a code conversion method for converting a first code string into a second code string, wherein the program performs processing from the first code string.
  • First processing for obtaining first linear prediction coefficients and excitation signal information A second process of generating an excitation signal based on the excitation signal information; and a third of generating a first audio signal by driving a filter having the first linear prediction coefficient with the excitation signal.
  • Processing a fourth processing of generating a second audio signal based on information obtained from the second code string, and the first code processing using fixed codebook information included in the excitation signal information.
  • a fifth process for obtaining fixed codebook information in the second code sequence based on an audio signal and the second audio signal is provided.
  • the fixed codebook information included in the excitation signal information may be used as a part of the fixed codebook information in the second code sequence.
  • the fixed codebook information may include pulse positions and pulse polarities of a multi-pulse signal.
  • a pulse position included in the excitation signal information is set as a candidate for a pulse position in the second code string, and the second audio signal and the first The distance between the audio signal and the audio signal can be minimized.
  • the above-described program can be provided by being recorded on a recording medium.
  • the present invention is a code conversion device comprising: a code separation circuit that separates multiplexed codes; and a code multiplexing circuit that multiplexes codes, wherein the code conversion device encodes an audio signal by the first method. Is separated by the code separation circuit, the separated code is converted into a code conforming to a second method different from the first method, and the converted code is In the code conversion device, which supplies the signal to the code multiplexing circuit and generates code string data obtained by multiplexing the code converted in the code multiplexing circuit, the code conversion device according to the first system separated by the code separation circuit.
  • a first method comprising decoding excitation signal information including an adaptive codebook code, a fixed codebook code, and a gain code, and decoding the excitation signal information using a first method based on the linear prediction coefficient code separated by the code separation circuit.
  • a speech decoding circuit that synthesizes a decoded speech signal by driving a synthesis filter having linear prediction coefficients of the following with an excitation signal obtained from the excitation signal information, and conversion of a fixed codebook code based on code replacement At least a part of the fixed codebook code of the second scheme is obtained from the fixed codebook code of the second scheme, and a fixed codebook signal is obtained using the decoded speech signal, and corresponds to the fixed codebook signal.
  • a fixed codebook code generation circuit that combines a fixed codebook code and a partial fixed codebook code obtained by replacing the code to form a fixed codebook code of the second system.
  • a code conversion device characterized by the following.
  • the fixed codebook signal can be configured to be represented by a multi-pulse signal defined by a pulse position and a pulse polarity.
  • a code conversion device is configured to decode a first linear prediction coefficient decoded by a first method and a second linear prediction coefficient by a second method based on the linear prediction coefficient code separated by the code separation circuit.
  • To generate an adaptive codebook code of the second system, and an adaptive codebook delay corresponding to the adaptive codebook code of the second system will be described later as a second adaptive codebook delay.
  • An adaptive codebook code conversion circuit for outputting to a target signal calculation circuit; and a weighting synthesis filter using the first and second linear prediction coefficients.
  • An impulse response calculation circuit that outputs a signal, a first target signal is calculated from the decoded speech signal, the first and second linear prediction coefficients, and power, the second adaptive codebook signal, A second excitation signal generated in the past based on the second fixed codebook signal and the gain signal, the impulse response signal, the first target signal, and the second adaptive codebook delay.
  • a target signal calculating circuit that obtains the adaptive codebook signal and the optimal adaptive codebook gain of the above, and outputs the first target signal, the optimal adaptive codebook gain and the second adaptive codebook signal.
  • the fixed codebook code generation circuit uses a correspondence relationship between codes between the first method and the second method.
  • the first fixed codebook code is read based on the correspondence to obtain a fixed codebook code of the second system, and for pulses that cannot use the correspondence, the fixed codebook code is fixed.
  • a pulse position and a pulse polarity at which the distance to the second target signal obtained by subtracting the signal obtained by multiplying the adaptive codebook signal by the optimum adaptive codebook gain from the first target signal is selected.
  • a pulse position and a pulse polarity by reading the first fixed codepook code, and a pulse by the selection A fixed codebook signal defined from the position and the pulse polarity is defined as a second fixed codebook signal, and a code that can be decoded by a second method corresponding to the second fixed codebook signal is used as a second fixed codebook signal.
  • the present invention is a code conversion device comprising: a code separation circuit that separates multiplexed codes; and a code multiplexing circuit that multiplexes codes, wherein the code conversion device encodes an audio signal by the first method.
  • Is separated by the code separation circuit and the separated code is converted into a code conforming to a second method different from the first method, and the converted code
  • the code multiplexing circuit a code conversion device that generates code string data obtained by multiplexing the converted code, a linear prediction coefficient generation circuit, a speech decoding circuit, An impulse response calculation circuit, and a fixed codebook code generation circuit, wherein the linear prediction coefficient generation circuit decodes in the first method based on the linear prediction coefficient code separated by the code separation circuit.
  • the first Generating a linear prediction coefficient and a second linear prediction coefficient obtained by decoding in the second method, wherein the speech decoding circuit includes excitation signal information including an adaptive codebook code separated by the code separation circuit.
  • the synthesized filter having the first linear prediction coefficient is driven by an excitation signal obtained from the excitation signal information to synthesize and output a decoded speech signal.
  • the impulse response calculation circuit includes: The first and second linear prediction coefficients are used to form a perceptual weighting synthesis filter, an impulse response signal of the perceptual weighting synthesis filter is output, and the fixed codebook code generation circuit includes a first method and a second method. Pulses for which the correspondence between codes between the two methods is available By reading the first fixed codebook code based on the correspondence, a second fixed codebook code is obtained, and for the remaining pulses for which the correspondence cannot be used, a fixed codebook signal is used.
  • a pulse position and a pulse polarity at which a distance between the signal obtained by multiplying the first target signal and a second target signal obtained by subtracting the signal from the first target signal is minimized, and the first fixed codebook code is selected. From the pulse position and pulse polarity obtained by reading the data, and the pulse position and pulse polarity obtained by the selection.
  • the fixed codebook signal to be decoded is output as a second fixed codebook signal, and a code that can be decoded by the second method corresponding to the second fixed codebook signal is output as a second fixed codebook code.
  • the above code conversion device reads the first ACB code input from the code separation circuit using the correspondence between the code in the first method and the code in the second method, thereby obtaining the second ACB code.
  • An ACB code conversion circuit that generates a code and outputs an ACB delay corresponding to the second ACB code as a second ACB delay can be further provided.
  • the above code conversion device calculates a first target signal from the decoded speech signal and the first and second linear prediction coefficients, and obtains a second excitation signal, the impulse response signal, and the first target signal.
  • a target signal calculation circuit for obtaining a second ACB signal and an optimum ACB gain from the second ACB delay and an ACB gain and an FCB gain for minimizing a weighted square error between the first target signal and the reconstructed voice And generates a code that can be decoded by the second method corresponding to the selected ACB gain and FCB gain as a second gain code, and selects the selected ACB gain and FCB gain.
  • a gain code generation circuit for generating gains as a second ACB gain and a second FCB gain, a signal obtained by multiplying the second ACB signal by the second ACB gain, and a second FCB signal Multiplied by the second FCB gain
  • a second excitation signal calculation circuit for generating a second excitation signal by adding And a second excitation signal storage circuit that stores and holds the second excitation signal and outputs the second excitation signal that is already stored and held.
  • FIG. 1 is a block diagram illustrating a configuration of a transcoder according to a first embodiment of the present invention.
  • FIG. 2 is a block diagram showing a configuration of an LP coefficient code conversion circuit in the code conversion device according to the first example of the present invention.
  • FIG. 3 is a diagram for explaining the correspondence between the ACB code and the ACB delay and the method of reading the ACB code.
  • FIG. 4 is a block diagram showing a configuration of a speech decoding circuit in the transcoder according to the first embodiment of the present invention.
  • FIG. 5 is a diagram for explaining the correspondence between the pulse position codes and the pulse positions and a method of reading the ACB code.
  • FIG. 6 is a block diagram illustrating a configuration of a target signal calculation circuit in the code conversion device according to the first embodiment of the present invention.
  • FIG. 7 is a block diagram showing a configuration of the FCB code generation circuit in the code conversion device according to the first example of the present invention.
  • FIG. 8 is a block diagram showing a configuration of a gain code generation circuit in the code conversion device according to the first example of the present invention.
  • FIG. 9 is a block diagram showing a configuration of a second embodiment of the code conversion apparatus according to the second embodiment of the present invention.
  • FIG. 10 is a block diagram showing a configuration of a conventional transcoder.
  • FIG. 1 is a block diagram showing a configuration of a code conversion apparatus 1000 according to the first embodiment of the present invention.
  • code conversion apparatus 1000 shown in FIG. 1 the same or equivalent elements as in conventional code conversion apparatus 1500 shown in FIG. 10 are denoted by the same reference numerals.
  • the code conversion apparatus 1000 includes an input terminal 10, a code separation circuit 10 10, an LP coefficient code conversion circuit 1 100, an LSP-LPC conversion circuit 1 1 10, a pulse response calculation circuit 1 120, , An ACB conversion generation circuit 1200, a speech decoding circuit 1500, a target signal calculation circuit 1700, an FCB code generation circuit 1800, a gain code generation circuit 1400, a second excitation signal calculation circuit 1610, and a second excitation A signal storage circuit 1620, a code multiplexing circuit 1020, and an output terminal 20.
  • the input terminal 10, the output terminal 20, the code separation circuit 1010, and the code multiplexing circuit 1020 are basically the terminals or circuits shown in FIG. Is the same as In the following, description of the same or equivalent elements will be omitted, and differences from code conversion apparatus 1500 shown in FIG. 10 will be described.
  • the encoding of the LP coefficient in the first method is as follows.
  • T ⁇ ) T ( f A r ) / / / N ( 2 )
  • the encoding of the LP coefficient in the second method is as follows.
  • T (f B r) (3) is performed every ms ec cycle (frame), ACB (adaptive codebook), FCB (Fixed codebook) and coding of the elements constituting the excitation signal, such as gain,
  • the frame length, the number of subframes, and the subframe length of the first method are respectively
  • the frame length, the number of subframes, and the subframe length of the second method are respectively NTNL 15
  • the sampling frequency is set to 800 OHz
  • the encoding cycle of the LP coefficient in the first scheme and the second scheme is set.
  • the LP coefficient code conversion circuit 1100 receives the first LP coefficient code from the code separation circuit 1010.
  • LSP line spectral pair
  • LSP line spectral pair
  • the conversion from the LP coefficient to the LSP and the conversion from the LSP to the LP coefficient are performed according to a known method. For example, it is performed according to the method described in Section 5.2.3 and Section 5.2.4 of Reference 3.
  • the LP coefficient code conversion circuit 1100 decodes the first LP coefficient code input from the code separation circuit 1010 by the LSP decoding method in the first method to obtain a first LSP.
  • the LP coefficient code conversion circuit 1100 quantizes and encodes the first LSP according to the LSP quantization method and encoding method in the second method, and the second LSP and the corresponding second Get the LP coefficient sign.
  • the LP coefficient code conversion circuit 1100 outputs the second LP coefficient code to the code multiplexing circuit 1020 as a code that can be decoded by the LSP decoding method in the second method, and also outputs the first LSP and the second Outputs the LSP to the LSP-LPC conversion circuit.
  • FIG. 2 is a block diagram showing a configuration example of the LP coefficient code conversion circuit 1100.
  • the LP coefficient code conversion circuit 1100 includes, for example, an LSP decoding circuit 110, a first LSP codebook 111, an LSP encoding circuit 130, a second LSP codebook 131, an input terminal 31, It consists of output terminals 32, 33 and 34.
  • the LSP decoding circuit 110 decodes the LSP corresponding to the LP coefficient code from the LP coefficient code.
  • the LSP decoding circuit 110 includes a first LSP codebook 111 in which a plurality of sets of LSPs are stored, and receives the first LP coefficient code output from the code separation circuit 1010. Input via terminal 31, read the LSP corresponding to the first LP coefficient code from the first LSP codebook 11 1 and use the read L 3? As the first 3? The output to the LIDAR circuit 130 and to the LSP-LPC conversion circuit 1110 via the output terminal 33.
  • the decoding of the LSP from the LP coefficient code is performed according to the decoding method of the LP coefficient in the first method (here, the LSP is represented by the LSP, so the LSP is decoded). This is done using a codebook.
  • the LSP encoding circuit 130 receives the first LSP output from the third party decoding circuit 110, and receives the second LSP from the second LSP codebook 131 storing a plurality of sets of LSPs and the second LSP. Each of the corresponding LP coefficient codes is sequentially read, a second LSP that minimizes an error from the first LSP is selected, and the corresponding LP coefficient code is set as a second LP coefficient code via the output terminal 32. And outputs the second LSP to the LSP-to-LPC converter circuit 110 via the output terminal 34.
  • the second LSP selection method that is, LSP quantization and coding
  • the second method LSP codebook according to the LSP quantization method and coding method in the second method.
  • the quantization and coding of LSP for example, the description in Section 5.2.5 of “Reference 3” can be referred to.
  • the LSP-to-LPC conversion circuit 1 110 receives the first LSP and the second LSP output from the LP coefficient code conversion circuit 1 100 and converts the first LSP to the first LSP. And convert the second LSP to the second LP coefficient a 2 , i Conversion, the first LP coefficients shed lt i outputs the target signal calculating circuit 1700 and the audio decoding circuit 150 0 and the impulse response calculation circuit 1 120, the target signal calculating circuit 1 700 a second LP coefficients a 2, i Is output to the impulse response calculation circuit 1 120.
  • the ACB code conversion circuit 1200 reads the first ACB code input from the code separation circuit 1010 using the correspondence between the code in the first method and the code in the second method, thereby obtaining the second ACB code. Get the sign. Next, ACB code conversion circuit 1200 outputs the second ACB code to code multiplexing circuit 1020 as a code decodable by the ACB decoding method in the second system, and outputs an ACB delay corresponding to the second ACB code. Is output to the target signal calculation circuit 1700 as a second ACB delay.
  • (1 5) consists of a code sequence of 48, 49, 50, 51, 52, 53, and the ACB delay T ( B) corresponding to these ACB codes is 71, 72, 73, 74, 75, 76. It is assumed that it consists of Therefore, for example, the ACB delay T ( B) corresponding to the ACB code “53” is “76”. In such a case, to convert the ACB code from the first method to the second method, the ACB code in the first method is converted to the ACB code in the second method so that the ACB delay value is the same. Correspond.
  • the ACB code “56” in the first scheme is associated with the ACB code “53” in the second scheme.
  • the ACB code “51” in the first scheme is associated with the ACB code “48” in the second scheme.
  • the speech decoding circuit 1500 receives the first ACB code, the first FCB code, and the first gain code output from the code separation circuit 1010, and further receives the LSP-LPC conversion circuit 110 Enter the LP coefficient of 1 .
  • the speech decoding circuit 1500 uses the AC ⁇ signal decoding method, the FCB signal decoding method, and the gain decoding method in the first method to generate a first ACB code, a first FCB code, and a first FCB code. Decode each of the ACB delay, FCB signal and gain from each of the gain codes. Hereinafter, these are referred to as a first ACB delay, a first FCB signal, and a first gain.
  • Voice decoding circuit 1500 generates an ACB signal using the first ACB delay.
  • this ACB signal is referred to as a first ACB signal.
  • the audio decoding circuit 1500 generates a decoded audio from the first ACB signal, the first FCB signal, the first gain, and the first LP coefficient, and outputs the generated audio to the target signal calculation circuit 1700. Output.
  • FIG. 4 is a block diagram showing a configuration example of the audio decoding circuit 1500. .
  • the audio decoding circuit 1500 includes an excitation signal information decoding circuit 1600, an excitation signal calculation circuit 1540, an excitation signal storage circuit 1570, and a synthesis filter 1580.
  • the excitation signal information decoding circuit 1600 includes an ACB. It comprises a decoding circuit 1510, an FCB decoding circuit 1520, and a gain decoding circuit 1530.
  • the excitation signal information decoding circuit 1600 decodes the information of the excitation signal from the code corresponding to the information of the excitation signal. Further, the excitation signal information decoding circuit 1600 inputs the first ACB code, the first FCB code, and the first gain code output from the code separation circuit 1010 via input terminals 51, 52, and 53, respectively.
  • the first gain is composed of an ACB gain and an FCB gain, which are hereinafter referred to as a first ACB gain and a first FCB gain, respectively.
  • a past excitation signal output from the excitation signal storage circuit 1570 is input, and an ACB signal is generated using the past excitation signal and the first ACB delay.
  • the excitation signal information decoding circuit 1600 outputs the first ACB signal, the first FCB signal, the first ACB gain, and the first FCB gain to the excitation signal calculation circuit 1540. .
  • the ACB decoding circuit 15010, the FCB decoding circuit 1520, and the gain decoding circuit 1530 which are components of the excitation signal information decoding circuit 1600 will be described.
  • the ACB decoding circuit 1510 inputs the first AC B code output from the code separation circuit 1010 via the input terminal 51, and also inputs the past excitation signal output from the excitation signal storage circuit 1570.
  • the ACB decoding circuit 1510 uses the correspondence between the ACB code and the ACB delay in the first method shown in FIG. Get the AC B delay T ⁇ A of 1.
  • the AC B decoding circuit 1510 calculates a length corresponding to the subframe length from the past point of T (A) samples starting from the start point of the current subframe in the excitation signal.
  • T (A) is the length corresponding to the subframe length
  • ACB decoding circuit 1510 outputs the first ACB signal thus generated to excitation signal calculation circuit 1540.
  • the FCB decoding circuit 1520 inputs the first FCB code output from the code separation circuit 1010 via the input terminal 52, and outputs the first FCB signal corresponding to the first FCB code to the excitation signal calculation circuit 1540. Output.
  • the FCB signal is represented by a multi-pulse signal defined by a pulse position and a pulse polarity.
  • the first FCB code is a code corresponding to the pulse position (pulse position code) and a code corresponding to the pulse polarity (pulse polarity). Sign).
  • the description in Sections 6.1 and 5.7 of Reference 3j can be referred to.
  • the gain decoding circuit 1530 inputs the first gain code output from the code separation circuit 1010 via the input terminal 53.
  • Gain decoding circuit 1530 has a built-in table (not shown) in which a plurality of gains are stored, and reads a gain corresponding to the first gain code from the table.
  • the gain decoding circuit 1530 outputs the first ACB gain corresponding to the ACB gain and the first FCB gain corresponding to the FCB gain among the read gains to the excitation signal calculation circuit 1540. I do.
  • a table (not shown) includes the first ACB gain and the first FCB gain. Multiple 2D vectors are stored.
  • the first ACB gain and the first FCB gain are individually encoded, two tables are used. (Not shown), one table stores a plurality of first ACB gains, and the other table stores a plurality of first FCB gains.
  • the excitation signal calculation circuit 1540 receives the first AC B signal output from the AC B decoding circuit 1510, and # 8: The first FCB signal output from the decoding circuit 1520 is input, and the first ACB gain and the first FCB gain output from the gain decoding circuit 1530 are input.
  • the excitation signal calculation circuit 1540 adds a signal obtained by multiplying the first ACB signal by the first ACB gain and a signal obtained by multiplying the first FCB signal by the first FCB gain. To obtain the first excitation signal.
  • the excitation signal calculation circuit 1540 outputs the first excitation signal thus obtained to the synthesis filter 1580 and the excitation signal storage circuit 1570.
  • the excitation signal storage circuit 1570 receives the first excitation signal output from the excitation signal calculation circuit 1540, and stores the first excitation signal. Upon receiving the first excitation signal from the excitation signal calculation circuit 1540, the excitation signal storage circuit 1570 outputs the past first excitation signal that has been input and stored in the past to the ACB decoding circuit 1510.
  • the synthesis filter 1580 receives the first excitation signal output from the excitation signal calculation circuit 1540 and inputs the first LP coefficient ⁇ i output from the LSP-LPC conversion circuit 1 110 via the input terminal 61. Enter
  • the synthesis filter 1580 functions as a linear prediction filter having a first LP coefficient ⁇ , and generates an audio signal by being driven by the first excitation signal output from the excitation signal calculation circuit 1540.
  • the synthesis filter 1580 outputs the audio signal thus generated to the target signal calculation circuit 1700 via the output terminal 63.
  • the target signal calculation circuit 1700 receives the first LP coefficient and the second LP coefficient from the LSP-LPC conversion circuit 110, and outputs the second LP coefficient and the second LP coefficient from the ACB code conversion circuit 1200.
  • the second ACB delay corresponding to the ACB code is input, the decoded audio is input from the audio decoding circuit 1500, the impulse response calculation circuit 1 is input with the impulse response signal, and the second excitation signal storage circuit is input. Past stored in 1620 Input the second excitation signal.
  • the target signal calculation circuit 1700 calculates a first target signal from the decoded speech, the first LP coefficient, and the second LP coefficient.
  • the target signal calculation circuit 1700 obtains a second ACB signal and an optimum ACB gain from the past second excitation signal, impulse response signal, second ACB delay, and first target signal. .
  • the target signal calculation circuit 1700 outputs the first target signal to the FCB code generation circuit 1800 and the gain code generation circuit 1400, outputs the optimal ACB gain to the FCB code generation circuit 1800, and outputs the second ACB signal. Is output to the FCB code generation circuit 180 °, the gain code generation circuit 1400, and the second excitation signal calculation circuit 1610.
  • the impulse response calculation circuit 1120 receives the first LP coefficient ⁇ 1 and the second LP coefficient a 2 , i output from the LSP-LPC conversion circuit 1110, and inputs the first LP coefficient A perceptual weighting synthesis filter is constructed using the second LP coefficient.
  • the impulse response calculation circuit 1120 outputs the impulse response signal of the perceptual weighting synthesis filter to the target signal generation circuit 1700, the FCB code generation circuit 1800, and the gain code generation circuit 1400.
  • P is the linear prediction order (for example, 10)
  • the FCB code generation circuit 1800 receives the first target signal, the second ACB signal, and the optimum ACB gain output from the target signal calculation circuit 1700, and outputs an impulse response signal output from the impulse response calculation circuit 1120. , And the first FCB code from the code separation circuit 1010.
  • the FCB code generation circuit 1800 reads the first FCB code based on the correspondence between pulses for which the correspondence between codes between the first method and the second method can be used. Partially get the FCB code of 2.
  • the FCB signal is composed of a plurality of pulses, and is represented by a multi-pulse signal defined by a pulse position and a pulse polarity.
  • the FCB code consists of a code corresponding to the pulse position (pulse position code) and a code corresponding to the pulse polarity (pulse polarity code). These codes are read in the same way as the AC ⁇ code described above. Can be realized by:
  • the pulse position code in the first method (A AO Bp) (19)
  • I p be a code sequence of 2, 3, 4, 5, 6, 7 and the pulse positions corresponding to these pulse position codes
  • (20) consists of a code string of 10, 15, 20, 25, 30, and 35. Therefore, for example, the pulse position corresponding to the pulse position code “6” is “30”.
  • (21) shall consist of a code sequence of 5, 4, 3, 2, 1, 0, and the pulse positions corresponding to these pulse position codes
  • (22) is composed of code strings of 10, 15, 20, 25, 30, and 35. Therefore, for example, the pulse position corresponding to the pulse position code “1” is “30”.
  • the pulse position code in the first method in order to convert the pulse position code from the first method to the second method, the pulse position code in the first method must be changed so that the pulse position value is the same. Corresponds to the position code.
  • the pulse position code “6” in the first method is associated with the pulse position code “1” in the second method.
  • the pulse position code “2” in the first method is associated with the pulse position code “5” in the second method.
  • the pulse polarity code the code is read so that the polarity (positive or negative) corresponding to the code before reading and the polarity corresponding to the code after reading are equal.
  • the FCB code generation circuit 1800 uses the first FCB code based on the pulse for which the correspondence between codes between the first method and the second method can be used. By reading, the second FCB code is partially obtained.
  • the FCB code generation circuit 1800 regards the pulse for which the correspondence cannot be used as the FCB signal filtered by the convolution of the FCB signal and the impulse response signal (Co nvo o ution) and the second signal. Select the pulse position and pulse polarity that minimize the distance to the target signal. This corresponds to minimizing the distance between the sound generated by the information obtained from the second code string and the sound generated by the information obtained from the first code string.
  • the second target signal is calculated from the first target signal, the second ACB signal, the optimum ACB gain, and the impulse response signal.
  • the FCB code generation circuit 1800 converts the F ⁇ 8 signal defined by the pulse position and pulse polarity by reading the first FCB code and the selected pulse position and pulse polarity into the second? B signal. The same 8 signals are generated.
  • the FCB code generation circuit 1800 outputs a code corresponding to the second FCB signal, which can be decoded by the second method, to the code multiplexing circuit 1020 as a second FCB code, and gains the second FCB signal by gain. Output to the encoding circuit 1410 and the second excitation signal calculation 1610.
  • the gain code generation circuit 1400 receives the first target signal and the second ACB signal output from the target signal calculation circuit 1700, and receives the second FCB signal output from the FCB code generation circuit 1800.
  • the impulse response calculation circuit inputs the impulse response signal output from the 1120 force.
  • the gain code generation circuit 1400 selects an ACB gain and an FCB gain that minimize the weighted square error between the first target signal and the reconstructed speech.
  • the reconstructed voice is calculated from the second ACB signal, the second FCB signal, the impulse response signal, and the ACB gain and FCB gain stored in a table built in the gain code generation circuit 1400.
  • the gain code generation circuit 1400 sets, as a second gain code, a code that can be decoded by the second method and corresponds to the selected ACB gain and FCB gain. And outputs the selected ACB gain and FCB gain to the second excitation signal calculation circuit 1610 as a second ACB gain and a second FCB gain, respectively.
  • the second excitation signal calculation circuit 1610 receives the second ACB signal output from the target signal calculation circuit 1700, receives the second FCB signal output from the FCB code generation circuit 1800, and generates a gain code.
  • the second AC B gain and the second FCB gain output from the circuit 1400 are input.
  • the second excitation signal calculation circuit 1610 calculates a signal obtained by multiplying the second ACB signal by the second ACB gain and a signal obtained by multiplying the second FCB signal by the second FCB gain. Add to obtain the second excitation signal. The second excitation signal is output to the second excitation signal storage circuit 1620.
  • the second excitation signal storage circuit 1620 inputs the second excitation signal output from the second excitation signal calculation circuit 1610, and stores and holds the second excitation signal.
  • the second excitation signal storage circuit 1620 stores the second excitation signal that has been input and stored in the past in the target signal calculation circuit. Output to 1 700.
  • FIG. 6 is a block diagram illustrating an example of the configuration of the target signal calculation circuit 1700 in the present embodiment.
  • the target signal calculation circuit 1700 includes a weighting signal calculation circuit 1710 and an AC B signal generation circuit 1720.
  • the weighting signal calculation circuit 1710 receives the decoded voice output from the synthesis filter 1580 which is a component of the voice decoding circuit 1500 via the input terminal 57, and outputs the first signal output from the LSP-LPC conversion circuit 111.
  • the LP coefficient and the second LP coefficient are input via the input terminal 36 and the input terminal 35, respectively.
  • the weighting signal calculation circuit 1710 uses the first LP coefficient to form an auditory weighting finalizer W (z) (see equation (18)). Then, the perceptual weighting filter is driven by the decoded voice output from the synthesis filter 1580, and the perceptual weighting is performed. Generate an audio signal.
  • the weighting signal calculation circuit 1710 configures an auditory weighting synthesis filter W (z) / K 2 ( ⁇ ) (see equation (16)) using the first LP coefficient and the second LP coefficient. .
  • the weighting signal calculation circuit 1710 outputs a first target signal X ( ⁇ ) obtained by subtracting the zero input response of the perceptual weighting synthesis filter from the perceptual weighting audio signal to the ACB signal generating circuit 1720,
  • the target signal X ( ⁇ ) is output to a second target signal calculation circuit 1810 (described later) and a gain encoding circuit 1410 via an output terminal 78.
  • the ACB signal generation circuit 1720 receives the first target signal X ( ⁇ ) output from the weighting signal calculation circuit 1710, and receives the second AC ⁇ delay output from the ACB code conversion circuit 1200 as an input terminal 37. , And the impulse response signal output from the impulse response calculation circuit 1 120 is input via the input terminal 74, and the past second excitation signal output from the second excitation signal storage circuit 1620 is Input via input terminal 75.
  • the delay k is a second AC B delay.
  • a signal cut out from the past second excitation signal with a delay k is defined as a second ACB signal V (n).
  • the ACB signal generation circuit 1720 calculates an optimum ACB gain g p from the first target signal X (n) and y k (n) by the following equation. I ( B ) _1
  • the ACB signal generation circuit 1720 outputs the second ACB signal v (n) to a second target signal calculation circuit 1810, a gain coding circuit 14.10, and a second excitation signal calculation circuit 1610 via an output terminal 76. And outputs the optimum AC B gain to the second target signal calculation circuit 1810 via the output terminal 77.
  • FIG. 7 is a block diagram illustrating an example of the configuration of the FCB code generation circuit 1800 according to the present embodiment.
  • the FCB code generation circuit 1800 includes a second target signal calculation circuit 1810, an FCB code conversion circuit 1300, and an FCB coding circuit 1820.
  • the second target signal calculation circuit 1810 receives the first target signal X (n) output from the weighting signal calculation circuit 1710, which is a component of the target signal calculation circuit 1700, via an input terminal 81.
  • the impulse response signal output from the impulse response calculation circuit 1 120 is input through the input terminal 84, and the second ACB signal V (n) output from the ACB signal generation circuit 1720 and the optimum ACB gain g p is input via input terminals 83 and 82, respectively.
  • the second target signal calculation circuit 1810 converts the second ACB signal y (n) filtered by the convolution of the second ACB signal V (n) and the impulse response signal (Co nvo 1 ution).
  • y (n), n 0 '..., Li r) one 1 (25) is calculated, a signal obtained by multiplying the optimum ACB gain g p to the second ACB signal y (n) first target signal To obtain a second target signal x '(n).
  • the FCB code conversion circuit 1300 converts the first FCB code input from the code separation circuit 11010 via the input terminal 85 into the correspondence between the code in the first method and the code in the second method.
  • the second FCB code is partially obtained by reading using
  • the FCB signal of the first method consists of four pulses P 0, PI, P 2, and P 3, and the position where each pulse can take is a 40-sample FCB signal (0, 1, 2, ... , 39) shall be specified by tracks 1, 2, 3, and 4 in Table 1. 1]
  • the FCB signal of the second method has 10 pulses P0, P1, P2, P9 And the possible positions of each pulse shall be specified by tracks 2, 3, 4, and 5 in Table 2. 2] Torak Panoles
  • the 10 pulses P0, P1, P2, P2, P9 Of these, PO, P 1, and P 2 can be associated with pulses P 0, P 1, and P 2 in the FCB signal of the first method, and these three pulses P 0, P 1, and P 2
  • the position code and pulse polarity code can be obtained.
  • the FCB code conversion circuit 1300 outputs the pulse position code and the pulse polarity code of these pulses P O, P 1, and P 2 to the FCB coding circuit 1820 as partial FCB codes.
  • the FCB encoding circuit 1820 receives the second target signal x '(n) output from the second target signal calculation circuit 1810, and receives the impulse response signal output from the impulse response calculation circuit 1120.
  • a partial FCB code input from the terminal 84 and output from the FCB code conversion circuit 1300 is input.
  • FCB code circuit 1820 uses partial FCB code to determine pulse position and pulse For the remaining pulses (pulses P3, P4,..., P9 in the above example) except for the pulses whose polarity is determined (pulses PO, PI, P2 in the above example), the FCB signal FCB signal filtered by convolution of the impulse response signal and
  • the position candidates of each pulse are the positions shown in Table 2 according to the track to which each pulse belongs.
  • base-vector ck represents the k-th candidate FCB signal, d two ⁇ ⁇ ⁇ '(30) ⁇ two H l H o, vector chi, the second target signal, ⁇ is a lower triangular taper matrix (To ep 1 iz matrix) whose elements are the impulse response signal h (n). Name your, ⁇ ⁇ is the transpose of the matrix H, ckd 1 is the transpose base vector of the vector ck and base vector d base, respectively.
  • the FCB encoding circuit 1820 determines the pulse position and pulse A second FCB signal c (n) is generated from the FCB signal defined by the pulse polarity and the selected pulse position and pulse polarity.
  • the FCB coding circuit 1820 outputs a code corresponding to the second FCB signal, which can be decoded by the second method, to the code multiplexing circuit 1020 via the output terminal 55 as a second FCB code
  • the second FCB signal c (n) is output to a gain encoding circuit 1410 (described later) and a second excitation signal calculation 1610 via an output terminal 86.
  • Table 1 of the FCB code conversion circuit 1300 corresponds to the second method and Table 2 corresponds to the first method
  • the pulses P0, P1, P2, and P3 in the FCB signal of the second method are used.
  • P9 in the FCB signal of the first method cannot be directly associated with any of the pulses P0, P1, P2,. Select its position and polarity for 3.
  • Candidate pulse PO A): Candidate pulse PO (B) or pulse P5 (B)
  • Candidate pulse PI A): Candidate pulse PI (B) or pulse P6 (B)
  • Candidate pulse P2 A) : Candidate for pulse P 2 (B) or pulse P 7 (B)
  • pulse P 3 A): pulse P 3 (B), P 8 (B) or pulse P 4 (B)
  • P 9 B)
  • the FCB encoding circuit 1820 selects a pulse position and a pulse polarity that maximize the evaluation value Ak for these pulse position candidates, and outputs an FCB signal defined from the pulse position and the pulse polarity obtained by the selection. Let FCB signal c (n) of 2 be used.
  • a pulse position candidate a position included in a track corresponding to each pulse shown in Table 1 can be used.
  • FIG. 8 is a block diagram illustrating an example of the configuration of the gain code generation circuit 1400 according to the present embodiment.
  • the gain code generation circuit 1400 includes a gain coding circuit 1410 and a gain codebook 1420.
  • the gain encoding circuit 1410 inputs the first target signal X (n) output from the weighting signal calculation circuit 1710, which is a component of the target signal calculation circuit 1700, through the input terminal 93, and
  • the second AC B signal V (n) output from the signal generation circuit 1720 is input via the input terminal 92, and the second FCB signal c (n) output from the FCB encoding circuit 1820 is input to the input terminal
  • the impulse response signal h (n) output from the impulse response calculation circuit 1 120 is input via the input terminal 94.
  • the gain coding circuit 1410 sequentially reads the ACB gain and the FCB gain from the gain codebook 1420 storing the plurality of ACB gains and the plurality of FCB gains, and obtains the second ACB signal, the second FCB signal, and the impulse.
  • Weighted reconstructed speech is sequentially calculated from the response signal, ACB gain, and FCB gain, and the weighted squared error between the weighted reconstructed speech and the first target signal is sequentially calculated, and the ACB gain that minimizes the weighted squared error And select the FCB gain.
  • Y (n) is a filtered second ACB signal, which is obtained by convolving the second ACB signal with the impulse response signal.
  • z (n) is the second filtered FCB signal, Obtained by convolving the second FCB signal with the impulse response signal.
  • the weighted reconstructed speech is expressed by the following equation.
  • the gain code I ⁇ path 1 4 1 0 corresponds to the ACB gain and FCB gain that is selected
  • the The code decodable by the method 2 is output as a second gain code to the code multiplexing circuit 10020 via the output terminal 56
  • the ACB gain and the FCB gain are respectively changed to the second ACB gain and the second The FCB gain is output to the second excitation signal calculation circuit 1610 via the output terminals 95 and 96.
  • the selection method and the coding method of the ACB gain and the FCB gain are performed using the gain codebook of the second method in accordance with the selection method and the coding method in the second method.
  • the description in Section 5.8 of “Document 3” can be referred to.
  • the above-described code conversion apparatus 100 of the first embodiment of the present invention can be realized by a digital signal processing processor or other control devices.
  • FIG. 9 is a block diagram schematically illustrating a configuration in a case where a code conversion process performed by the code conversion apparatus 100 according to the first embodiment is implemented by a computer as a second embodiment of the present invention.
  • FIG. 9 is a block diagram schematically illustrating a configuration in a case where a code conversion process performed by the code conversion apparatus 100 according to the first embodiment is implemented by a computer as a second embodiment of the present invention.
  • the computer 1 includes a central processing unit 2, a memory 3, and a recording medium reading device interface 4, and the recording medium reading device interface 4 reads a recording medium as an external device. Connected to device 5.
  • the recording medium 6 is set in the recording medium reading device 5.
  • a program for operating the computer 1 is stored in the recording medium 6, and the recording medium reading device 5 reads the program from the set recording medium 6.
  • the program read by the recording medium reading device 5 is stored in the memory 3 in the computer 1 via the recording medium reading device interface 4.
  • the computer 1 reads out the program from the memory 3 and executes the program.
  • the memory 3 is, for example, a nonvolatile memory such as a mask ROM or a flash memory. Can be composed of moly.
  • recording medium includes any medium on which data can be recorded.
  • Examples of the recording medium 6 include, in addition to a nonvolatile memory, a disk-type recording medium such as a CD-ROM (CompactD isk-ROM) and a Pd, a magnetic tape
  • MT Magnetic Disk
  • DVD Dynamic Optical Disk
  • DVD-ROM DVD-Read Only Memory
  • RAM Random Access Memory
  • EP ROM Erasable Programmable Read On 1 y Memory
  • % EE PROM E rewritable card-type ROM such as lectrically Erasable Programmable Read Only Memory
  • smart media registered trademark
  • flash memory registered trademark
  • compact flash registered trademark
  • This recording medium 6 is created by programming necessary functions using a program language readable by the computer 1 and recording the program on the recording medium 6 capable of recording the program 1. can do.
  • a hard disk provided in a server can be used as the recording medium 6.
  • transmission may be wired or wireless.
  • the first code obtained by encoding the speech by the first encoding / decoding device can be decoded by the second encoding / decoding device.
  • the recording medium 6 has a programmer for executing the following processes (a) to (e). Is recorded.
  • the computer 1 may perform the following process (e) instead of the above process (e).
  • the fixed codebook information included in the information of the excitation signal is used as a part of the fixed codebook information in the second code sequence, and the second code sequence generated from the information obtained from the second code sequence is used.
  • FCB fixed codebook
  • FCB code based on the code replacement by converting the FCB code based on the code replacement, a part of the FCB code of the second system is obtained from the FCB code of the first system, and the linear prediction in the first system is performed.
  • the FCB signal is obtained by using the decoded speech generated from the information including the coefficient, the adaptive codebook (ACB) signal, and the gain. This is because FCB codes are used.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

明 細 書 音声符号化復号方式間の符号変換方法および装置とその記憶媒体 発明の技術分野
本発明は、 音声信号を低ビットレートで伝送あ'るいは蓄積するための符号化及 び復号方法に関し、特に、異なる符号化復号方式を用いて音声通信を行うに際し、 音声をある方式により符号化して得た符号を、 他の方式により復号可能な符号に 高音質かつ低演算量で変換する符号変換方法及び装置ならびにそのプログラムに 関する。 従来の技術
音声信号を中低ビットレートで髙能率に符号化する方法として、 音声信号を線 形予測 (L i n e a r P r e d i c t i on : LP) フィルタとそれを駆動す る励振信号とに分離して符号ィヒする方法が広く用いられている。
その代表的な方法の一つとして、 符号励振線形予測 (Co d e Ex c i t e d L i n e a r P r e d i c t i o n : CELP) がある。
符号励振線形予測によれば、 入力音声の周波数特性を表す L P係数が設定され た LPフィルタを、 入力音声のピッチ周期を表す適応コードブック (Ad a p t i v e Co d e b o o k : ACB) と乱数やパルスからなる固定コードブック (F i x e d Co d e b o o k : FCB) との和で表される励振信号で駆動す ることによって、 合成音声信号が得られる。 このとき、 ACB成分と FCB成分 には各々 AC Bゲイン及び F C Bゲインが乗算される。
なお、 符号励振線形予測 (CELP) に関しては、 M. R. S c h r o e d e r及び B. S. At a lによる 「Co d e E c i t e d L i n e a r P r e d i c t i o n : H i g h Qu a l i t y S p e e c h a t v e r y l ow b i t r a t e s」 (P r o c. o f I EEE I n t. C o n f . o n A c o u s t . S p e e c h a n d S i g n a l P r o c e s s i n g p p. 937-940, 1985) (以下、 「文献 1 j と呼ぶ) を参照することができる。
例えば、 3G (第 3世代) 移動体網と有線パケット網との間の相互接続を想定 した場合、 各網で用いられる標準音声符号化方式が異なるため、 各網間を直接に 接続することができない、 という問題がある。
.この問題に対する最も簡単な解法策はタンデム接続である。
タンデム接続においては、 一方の標準方式に従って音声を符号化することによ り音声信号 (符号列) を生成した後、 その標準方式を用いて音声信号を一且復号 し、 さらに、 この復号された音声信号を他方の標準方式に従って再度符号化を行 すなわち、 2回の符号化と 1回の復号が行われる。 このため、 各音声符号化復 号方式で符号化と復号をそれぞれ一度だけ行う場合に比べて、 符号化を行う回数 がー回多くなり、 音質の低下、 遅延の増加、 計算量の増加を招くという問題があ る。
これに対して、 一方の標準方式に従って音声を符号化して得た符号を他方の標 準方式に従つて復号可能となるように、 符号領域または符号化パラメータ領域で 符号を変換する符号変換方式が提案されている。 この符号変換方式は上記の問題 に対しては有効である。
この符号変換方式については、 Ho n g— Go o Ka n gらによる 「Imp r o v i n g T r a n s c o d i n g Ca p a o i l i t y o t S p e e c h Co d e r s i n C l e a n a n d F r ame E r a s u r e d Ch a nn e l Env i r o nme n t s」 (P r o c. o f I E E E Wo r k s h o p o n S p e e c h Co d i n g 2000, p p. 78— 80, 2000) (以下、 「文献 2j と呼ぶ) を参照することができる。 図 10は、 第 1の音声符号化方式 (以下、 単に 「第 1の方式」 と呼ぶ) を用い て音声を符号化して得られた符号を、 第 2の音声復号方式 (以下、 単に 「第 2の 方式」 と呼ぶ) により復号可能な符号に変換する従来の符号変換装置 1500の 構成の一例を示すブロック図である。
従来の符号変換装置 1 500は、 入力端子 10と、 符号分離回 1010と、 L P係数符号変換回路 100と、 AC B符号変換回路 200と、 F C B符号変換回 路 300と、 ゲイン符号変換回路 400と、 符号多重回路 1020と、 出力端子 20と、 から構成されている。
符号分離回路 1010には、 第 1の方式により音声を符号化して得た第 1の符 号列が入力端子 10を介して入力される。
符号分離回路 1010は第 1の符号列から線形予測係数(以下、 「LP係数」 と 呼ぶ)、 ACB (適応コードブック)、 FCB (固定コードブック)、 ACBゲイン 及び FCBゲインに対応する符号、 すなわち、 LP係数符号、 ACB符号、 FC B符号及びゲイン符号を分離する。
ここで、 AC Bゲイン及び F C Bゲインはまとめて符号化及び復号されるもの とし、説明の簡素化のため、以下、 AC Bゲイン及び FCBゲインをまとめて「ゲ イン」、 その符号を 「ゲイン符号」 と呼ぶことにする。 また、 後に説明される同様 の符号と区別するため、 符号分離回路 1010が第 1の符号列から分離した LP 係数符号、 ACB符号、 FCB符号及びゲイン符号をそれぞれ 「第 1の LP係数 符号」、 「第 1の ACB符号」、 「第 1の FCB符号」 及び 「第 1のゲイン符号 J と 呼ぶことにする。
符号分離回路 1010は、 第 1の LP係数符号を LP係数符号変換回路 100 に出力し、 第 1の ACB符号を ACB符号変換回路 200に出力し、 第 1の FC B符号を FCB符号変換回路 300に出力し、 第 1のゲイン符号をゲイン符号変 換回路 400に出力する。
LP係数符号変換回路 100は、 符号分離回路 1010から出力される第 1の L P係数符号を入力し、 第 1の L P係数符号を第 1の方式における L P係数復号 方法により復号して、 第 1の LP係数を得る。 次いで、 第 1の LP係数を、 第 2 の方式における L P係数の量子化方法及ぴ符号化方法により量子化及び符号化し て第 2の L P係数符号を得る。 この第 2の L P係数符号は第 2の方式により復号 可能な LP係数符号である。 次いで、 LP係数符号変換回路 100は、 この第 2 の LP係数符号を符号多重回路 1020に出力する。
AC B符号変換回路 200は、 符号分離回路 1010から出力される第 1の A C B符号を入力し、 第 1の AC B符号を第 2の方式により復号可能な A C B符号 に変換する。 この変換された ACB符号を第 2の ACB符号として符号多重回路 1 0 2 0に出力する。
F C B符号変換回路 3 0 0は、 符号分離回路 1 0 1 0から出力される第 1の F C B符号を入力し、 第 1の F C B符号を第 2の方式により復号可能な F C B符号 に変換する。 この変換された F C B符号を、 第 2の F C B符号として符号多重回 路 1 0 2 0に出力する。
ゲイン符号変換回路 4 0 0は、 符号分離回路 1 0 1 0から出力される第 1のゲ イン符号を入力し、 第 1の方式におけるゲイン復号方法により復号して、 第 1の ゲインを得る。 次いで、 第 1のゲインを、 第 2の方式におけるゲインの量子化方 法及び符号化方法により量子化及び符号化して第 2のゲイン符号を得る。 この第 2のゲイン符号は第 2の方式により復号可能なゲイン符号である。 次いで、 この 第 2のゲイン符号を符号多重回路 1 0 2 0に出力する。
符号多重回路 1 0 2 0は、 L P係数符号変換回路 1 0 0から出力される第 2の L P係数符号と、 A C B符号変換回路 2 0 0から出力される第 2の A C B符号と、 F C B符号変換回路 3 0 0から出力される第 2の F C B符号と、 ゲイン符号変換 回路 4 0 0から出力される第 2のゲイン符号とを入力し、 これらを多重化して得 られる符号列を第 2の符号列として出力端子 2 0を介して出力する。
図 1 0に示した従来の符号変換装置 1 5 0 0は、 マルチパルス信号により表現 される F C Bに対応する F C B符号を変換するに際して、 第 1の方式の F C Bに おけるパルス数と第 2の方式の F C Bにおけるパルス数とが異なる場合に全ての F C B符号を変換できない、 という問題点を有していた。
その理由は、 第 1の方式におけるパルス数と第 2の方式におけるパルス数とが 異なる場合には、 第 1の方式と第 2の方式との間でパルス位置符号を対応付ける ことができないパルスが存在してしまうからである。
本発明は、 このような問題点に鑑みてなされたものであって、 その主たる目的 は、 第 1の方式から第 2の方式への符号変換にあたり、 第 1の方式の固定コード ブック (F C B ) におけるパルス数と第 2の方式の F C Bにおけるパルス数とが 異なる場合であっても、 全ての F C B符号を変換できる符号変換装置及び符号変 換方法ならびに符号変換用プログラムを提供することにある。 発明の開示
本発明は、 上記の目的を達成するため、 第 1の符号列を第 2の符号列に変換す る符号変換方法において、 前記第 1の符号列から第 1の線形予測係数及び励振信 号情報を得る第一の過程と、 前記励振信号情報に基づいて励振信号を生成する第 二の過程と、 前記第 1の線形予測係数を有するフィルタを前記励振信号で駆動す ることによって第 1の音声信号を生成する第三の過程と、 前記第 2の符号列から 得られる情報に基づいて第 2の音声信号を生成する第四の過程と、 前記励振信号 情報に含まれる固定コードブック情報を用いて、 前記第 1の音声信号及び前記第 2の音声信号に基づき、 前記第 2の符号列における固定コードブック情報を求め る第五の過程と、 を備える符号変換方法を提供する。
本発明に係る符号変換方法においては、 符号の読み替えに基づく固定コードブ ック符号の変換により、 第 1の方式の固定コ一ドブック符号から第 2の方式の固 定コードブック符号を一部について得るとともに、 第 iの方式における線形予測 係数、 適応コードブック信号及びゲインを含む情報から生成される復号音声信号 を用いて固定コードブック信号を求め、 これに対応する符号と、 読み替えにより 得た先の部分的な固定コードブック符号とを併せて、 第 2の方式の固定コードブ ック符号とする。
このため、 第 2の方式の固定コードブックに必要な個数のパルスについて、 パ ルス位置とパルス極性を求めることができる。
その結果、 第 1の方式の固定コードブックにおけるパルス数と第 2の方式の固 定コードブックにおけるパルス数とが異なる場合であっても、 全ての固定コード ブック符号を変換することができる。
例えば、 前記第五の過程において、 前記励振信号情報に含まれる固定コードブ ック情報を前記第 2の符号列における固定コードブック情報の一部として用いる ことができる。
前記第五の過程において、 前記第 2の音声信号と前記第 1の音声信号との間の 距離を最小化することによって、 前記第 2の符号列における固定コードブック情 報を求めることができる。
例えば、 前記固定コードブック情報はマルチパルス信号のパルス位置とパルス 極性とからなるものとすることができる。
例えば、 前記励振信号情報に含まれるパルス位置を前記第 2の符号列における パルス位置の候補とし、 前記パルス位置候補に対して、 前記第 2の音声信号と前 記第 1の音声信号との間の距離を最小化することができる。
また、 本発明は、 第 1の符号列を第 2の符号列に変換する符号変換装置におい て、 前記第 1の符号列から第 1の線形予測係数及び励振信号情報を得て、 前記第 1の線形予測係数を有するフィルタを前記励振信号情報から得られる励振信号で 駆動することによって第 1の音声信号を生成する音声復号回路と、 前記励振信号 情報に含まれる固定コードブック情報を用いて、 第 2の符号列から得られる情報 から生成される第 2の音声信号と前記第 1の音声信号とに基づき、 第 2の符号列 における固定コードブック情報を求める固定コードブック符号生成回路と、 を備 える符号変換装置を提供する。
本発明に係る符号変換装置によっても、 上述の本発明に係る符号変換方法と同 様の効果を得ることができる。
例えば、 前記固定コードブック符号生成回路は、 前記固定コードブック情報を 前記第 2の符号列における固定コードブック情報の一部に用いるものとして構成 することができる。
また、 前記固定コードブック符号生成回路は、 前記第 2の音声信号と前記第 1 の音声信号との間の距離を最小化することによって、 前記第 2の符号列における 固定コードブック情報を求めるものとして構成することができる。
例えば、 前記固定コードブック情報はマルチパルス信号のパルス位置及ぴパル ス極性からなるものとすることができる。
例えば、 前記固定コードブック符号生成回路は、 前記励振信号情報に含まれる パルス位置を前記第 2の符号列におけるパルス位置の候補とし、 前記パルス位置 候補に対して、 前記第 2の音声信号と前記第 1の音声信号との間の距離を最小化 するものとして構成することができる。
さらに、 本発明は、 第 1の符号列を第 2の符号列に変換する符号変換方法をコ ンピュータに実行させるためのプログラムであって、 前記プログラムが行う処理 は、 前記第 1の符号列から第 1の線形予測係数及び励振信号情報を得る第一の処 理と、 前記励振信号情報に基づいて励振信号を生成する第二の処理と、 前記第 1 の線形予測係数を有するフィルタを前記励振信号で駆動することによって第 1の 音声信号を生成する第三の処理と、 前記第 2の符号列から得られる情報に基づい て第 2の音声信号を生成する第四の処理と、 前記励振信号情報に含まれる固定コ ードブック情報を用いて、前記第 1の音声信号及ぴ前記第 2の音声信号に基づき、 前記第 2の符号列における固定コードブック情報を求める第五の処理と、 もので あるプログラムを提供する。
例えば、 前記第五の処理において、 前記励振信号情報に含まれる固定コードブ ック情報が前記第 2の符号列における固定コードブック情報の一部として用いら れるようにすることができる。
また、 前記第五の処理において、 前記第 2の音声信号と前記第 1の音声信号と の間の距離を最小化することによって、 前記第 2の符号列における固定コードブ ック情報を求めることができる。
前記固定コードブック情報はマルチパルス信号のパルス位置及びパルス極性か らなるものとすることができる。
例えば、 前記第五の処理において、 前記励振信号情報に含まれるパルス位置を 前記第 2の符号列におけるパルス位置の候補とし、前記パルス位置候補に対して、 前記第 2の音声信号と前記第 1の音声信号との間の距離を最小化することができ る。
上述のプログラムは記録媒体に記録して提供することができる。
さらに、 本発明は、 多重された符号を分離する符号分離回路と、 符号を多重ィ匕 する符号多重回路と、 を備える符号変換装置であって、 第 1の方式で音声信号を 符号化した符号を多重してなる符号列データを前記符号分離回路により分離し、 分離された符号を、前記第 1の方式とは別の第 2の方式に準拠する符号に変換し、 該変換された符号を前記符号多重回路に供給し、 前記符号多重回路において、 前 記変換された符号を多重してなる符号列データを生成する符号変換装置におい て、 前記符号分離回路で分離された第 1の方式における適応コードブック符号、 固定コードブック符号及びゲイン符号を含む励振信号情報を復号し、 前記符号分 離回路で分離された線形予測係数符号に基づき、 第 1の方式で復号してなる第 1 の線形予測係数をもつ合成フィルタを前記励振信号情報から得られる励振信号で 駆動することにより、 復号音声信号を合成する音声復号回路と、 符号の読み替え に基づく固定コードブック符号の変換により、 第 1の方式の固定コードブック符 号から第 2の方式の固定コードブック符号の少なくとも 1部を得るとともに、 前 記復号音声信号を用いて固定コードブック信号を求め、 前記固定コードブック信 号に対応する固定コードブック符号と、 前記符号の読み替えにより得た部分的な 固定コードブック符号とを併せて、 第 2の方式の固定コードブック符号とする固 定コードブック符号生成回路と、 を備えていることを特徴とする符号変換装置を 提供する。
前記固定コードブック信号は、 パルス位置及びパルス極性で規定されるマルチ パルス信号により表現されるものとして構成することができる。
本発明に係る符号変換装置は、 前記符号分離回路で分離された線形予測係数符 号に基づき、 第 1の方式で復号してなる第 1の線形予測係数と第 2の方式で復号 してなる第 2の線形予測係数とを生成する回路と、 前記符号分離回路から入力し た第 1の方式の適応コ一ドブック符号を、 第 1の方式における符号と第 2の方式 における符号との対応関係を用いて読み替えることにより、 第 2の方式の適応コ 一ドブック符号を生成し、 前記第 2の方式の適応コードブック符号に対応する適 応コードブック遅延を第 2の適応コードブック遅延として後述する目標信号計算 回路に出力する適応コードブック符号変換回路と、 前記第 1及び第 2の線形予測 係数を用いて聰感重み付け合成フィルタを構成し、 前記聴感重み付け合成フィル タのィンパルス応答信号を出力するィンパルス応答計算回路と、 前記復号音声信 号と前記第 1及び前記第 2の線形予測係数と力 ら第 1の目標信号を計算し、 前記 第 2の適応コードブック信号、 前記第 2の固定コードブック信号及び前記ゲイン 信号に基づき過去に生成された第 2の励振信号と、 前記ィンパルス応答信号と、 前記第 1の目標信号と、 前記第 2の適応コードブック遅延とから第 2の適応コー ドブック信号及び最適適応コードブックゲインを求め、 前記第 1の目標信号、 前 記最適適応コードブックゲイン及び前記第 2の適応コードブック信号を出力する 目標信号計算回路と、 をさらに備えることができる。 この場合、 前記固定コード ブック符号生成回路は、 第 1の方式と第 2の方式との間の符号間の対応関係が利 用できるパルスについては、 前記第 1の固定コードブック符号を前記対応関係に 基づいて読み替えることにより第 2の方式の固定コードブック符号を得るととも に、 前記対応関係を利用できないパルスについては、 固定コードブック信号と前 記ィンパルス応答信号との畳み込み演算によりフィルタ処理された固定コードブ ック信号と、 前記第 2の適応コ一ドブック信号と前記ィンパルス応答信号との畳 み込みによりフィルタ処理された第 2の適応コードブック信号に最適適応コード ブックゲインを乗じて得られる信号を前記第 1の目標信号から減算してなる第 2 の目標信号との距離が最小となるパルス位置とパルス極性を選択し、 前記第 1の 固定コードプック符号の読み替えによるパルス位置及びパルス極性と、 前記選択 によるパルス位置及ぴパルス極性とから規定される固定コードブック信号を第 2 の固定コードブック信号とし、 前記第 2の固定コードブック信号に対応する第 2 の方式で復号可能な符号を、 第 2の固定コードブック符号として、 出力する。 また、 本発明は、 多重された符号を分離する符号分離回路と、 符号を多重化す る符号多重回路と、 を備える符号変換装置であって、 第 1の方式で音声信号を符 号化した符号を多重してなる符号列データを前記符号分離回路により分離し、 分 離された符号を、 前記第 1の方式とは別の第 2の方式に準拠する符号に変換し、 該変換された符号を前記符号多重回路に供給し、 前記符号多重回路において、 前 記変換された符号を多重してなる符号列データを生成する符号変換装置におい て、 線形予測係数生成回路と、 音声復号回路と、 インパルス応答計算回路と、 固 定コードブック符号生成回路と、 を備え、 前記線形予測係数生成回路は、 前記符 号分離回路で分離された線形予測係数符号に基づき、 前記第 1の方式で復号して なる第 1の線形予測係数と、 前記第 2の方式で復号してなる第 2の線形予測係数 とを生成し、 前記音声復号回路は、 前記符号分離回路で分離された適応コードブ ック符号を含む励振信号情報を復号し、 前記第 1の線形予測係数をもつ合成フィ ルタを、 前記励振信号情報から得られる励振信号で駆動することで復号音声信号 を合成して出力し、 前記インパルス応答計算回路は、 前記第 1及び第 2の線形予 測係数を用いて聴感重み付け合成フィルタを構成し、 前記聴感重み付け合成フィ ルタのインパルス応答信号を出力し、 前記固定コードブック符号生成回路は、 第 1の方式と第 2の方式との間の符号間の対応関係が利用できるパルスについて は、 前記第 1の固定コードブック符号を前記対応関係に基づいて読み替えること により、 第 2の固定コードブック符号を得るとともに、 前記対応関係を利用でき ない残りのパルスについては、 固定コ一ドブック信号と前記インパルス応答信号 との畳み込み演算によりフィルタ処理された固定コードブック信号と、 適応コー ドブック信号と前記ィンパルス応答信号との畳み込み演算によりフィルタ処理さ れた適応コ一ドブック信号に最適適応コードブックゲインを乗じて得られる信号 を前記第 1の目標信号から減算してなる第 2の目標信号との間の距離が最小とな るパルス位置とパルス極性を選択し、 前記第 1の固定コードブック符号の読み替 えによるパルス位置及びパルス極性と、 前記選択によるパルス位置及びパルス極 性とから規定される固定コードブック信号を第 2の固定コードブック信号とし て、 第 2の固定コードブック信号に対応する第 2の方式で復号可能な符号を第 2 の固定コードブック符号としてそれぞれ出力するものであることを特徴とする符 号変換装置を提供する。
上記の符号変換装置は、 前記符号分離回路から入力した第 1の A C B符号を、 第 1の方式における符号と第 2の方式における符号との対応関係を用いて読み替 えることにより第 2の A C B符号を生成し、 前記第 2の A C B符号に対応する A C B遅延を第 2の A C B遅延として出力する A C B符号変換回路をさらに備える ことができる。
上記の符号変換装置は、 前記復号音声信号と前記第 1及び前記第 2の線形予測 係数から第 1の目標信号を計算し、 第 2の励振信号と前記ィンパルス応答信号と 前記第 1の目標信号と前記第 2の A C B遅延とから第 2の A C B信号及び最適 A C Bゲインを求める目標信号計算回路と、 前記第 1の目標信号と再構成音声との 重み付け自乗誤差を最小にする A C Bゲインと F C Bゲインとを選択し、 選択さ れた前記 A C Bゲイン及び前記 F C Bゲインに対応する、 第 2の方式により復号 可能な符号を、 第 2のゲイン符号として生成し、 選択された前記 A C Bゲイン及 び前記 F C Bゲインを各々第 2の A C Bゲイン及び第 2の F C Bゲインとして生 成するゲイン符号生成回路と、 前記第 2の A C B信号に前記第 2の A C Bゲイン を乗じて得た信号と、 第 2の F C B信号に前記第 2の F C Bゲインを乗じて得た 信号とを加算して、 第 2の励振信号を生成する第 2の励振信号計算回路と、 前記 第 2の励振信号を記憶保持し、 既に記憶保持されている第 2の励振信号を出力す る第 2の励振信号記憶回路と、 を備えることができる。 図面の簡単な説明
図 1は、 本発明の第 1の実施例に係る符号変換装置の構成を示すプロック図で ある。
図 2は、 本発明の第 1の実施例に係る符号変換装置における L P係数符号変換 回路の構成を示すプロック図である。
図 3.は、 A C B符号と A C B遅延との対応関係と A C B符号の読み替え方法を 説明する図である。
図 4は、 本発明の第 1の実施例に係る符号変換装置における音声復号回路の構 成を示すプロック図である。
図 5は、 パルス位置符号とパルス位置との対応関係と A C B符号の読み替え方 法を説明する図である。
図 6は、 本発明の第 1の実施例に係る符号変換装置における目標信号計算回路 の構成を示すプロック図である。
図 7は、 本発明の第 1の実施例に係る符号変換装置における F C B符号生成回 路の構成を示すブロック図である。
図 8は、 本発明の第 1の実施例に係る符号変換装置におけるゲイン符号生成回 路の構成を示すブロック図である。
図 9は、 本発明の第 2の実施例に係る符号変換装置の第 2の実施例の構成を示 すブロック図である。
図 1 0は、 従来の符号変換装置の構成を示すブロック図である。
(符号の説明)
1 コンピュータ
2 C P U
3 メモリ
4 記録媒体読出装置インタフヱース
5 記録媒体読出装置 6 記録媒体
10、 31、 35、 36、 37、 51、 52、 53、 57、 61、 74、 751、 82、 83、 84、 85、 91、 92、 93、 94 入力端子
20、 32、 33、 34、 55、 56、 62、 63、 76、 77、 78、 86 5, 96 出力端子
1010 符号分離回路
1020 符号多重回路
1 100 LP係数符号変換回路
1 10 LS P復号回路
130 LS P符号化回路
1 1 1 第 1の LSPコードブック
1 31 第 2の LSPコードブック
1200 AC B符号変換回路
1300 FCB符号変換回路
1500 音声復号回路
1600 励振信号情報復号回路
1510 AC B復号回路
1520 FCB復号回路
1530 ゲイン復号回路
1540 励振信号計算回路
1570 励振信号記憶回路
1580 合成フィルタ
1 1 10 LSP— LPC変換回路
1 1 20 ィンパルス応答計算回路
1700 目標信号計算回路
1 710 重み付け信号計算回路
1720 A CB信号生成回路
1800 FCB符号生成回路
18 10 第 2の目標信号計算回路 18 fx 20 FCB符号化回路
1400 ゲイン符号生成回路
1410 ゲイン符号化回路
1420 ゲインコードブック
1610 第 2の励振信号計算回路
1620 第 2の励振信号記憶回路 好ましい実施例の詳細な説明
次に、 本発明の実施例について図面を参照して詳細に説明する。
図 1は、 本発明の第 1の実施例に係る符号変換装置 1000の構成を示すプロ ック図である。 図 1に示す符号変換装置 1000おいては、 図 10に示した従来 の符号変換装置 1500と同一または同等の要素には同一の参照符号が付されて いる。
本実施例に係る符号変換装置 1000は、 入力端子 10と、 符号分離回路 10 10と、 L P係数符号変換回路 1 100と、 LSP— LP C変換回路 1 1 10と、 ィンパルス応答計算回路 1 120と、 A C B変換生成回路 1200と、 音声復号 回路 1500と、 目標信号計算回路 1 700と、 FCB符号生成回路 1800と、 ゲイン符号生成回路 1400と、 第 2の励振信号計算回路 1610と、 第 2の励 振信号記憶回路 1620と、 符号多重回路 1020と、 出力端子 20と、 から構 成されている。
本実施例に係る符号変換装置 1000において、入力端子 10、出力端子 20、 符号分離回路 1010及び符号多重回路 1020は配線の一部が分岐する以外は 基本的には図 10に示した端子または回路と同じである。 以下では、 同一または 同等の要素の説明は省略し、 図 10に示した符号変換装置 1 500との相違点に ついて説明する。
本実施例においては、 第 1の方式における L P係数の符号化は、
T (1) N
( S
ms S (e S ( B f ΐc (ミリ秒) 周期 (フレーム) 毎に行われ、 ACB (適応コードプック)、 FCB (固一一定一一コードブック) 及びゲインなどの励振信号を構成する要素の符号ィヒ は、 T
B
T^) = T( f A r) / / /N (2)
N
m s e c周期 (サブフレーム) N毎 ( Sに行われるものとする。
B S f.
また、 第 2の方式における LP係数の符号化は、
T( f B r) (3) ms e c周期 (フレーム) 毎に行われ、 ACB (適応コードブック)、 F C B (固 定コードブック) 及びゲインなどの励振信号を構成する要素の符号化は、
(4) ms e c周期 (サブフレーム) 毎に行われるものとする。
また、 第 1の方式のフレーム長、 サブフレーム数及ぴサブフレーム長をそれぞ れ
(5)
(6)
(7) とする。
同様に、 第 2の方式のフレーム長、 サブフレーム数及ぴサブフレーム長をそれ ぞれ、 し N T N L 15
|_( A A AΒe B B)
(8)
一一一一
し N (9) r r ) )
Figure imgf000017_0001
2
とする。
なお、 以下の説明を単純化するため、
(1 1) sfr (12)
Figure imgf000017_0002
とする。
ここで、 例えば、 サンプリング周波数を 800 OH zとし、 第 1の方式及び第 2の方式における L P係数の符号化の周期
(1)
T (3) をともに 1 Oms e cに等しいと設定すれば、
(5)
(8) はともに 160サンプノレとなり、 )
Figure imgf000018_0001
。) はともに 80サンプルとなる。
LP係数符号変換回路 1 100は、 符号分離回路 1010から第 1の LP係数 符号を入力する。
ここで、 「 AMR S p e e c h Co d e c ;T r a n s c o d i n g F u n c t i o n s」 (3GPP TS 26. 090) (以下、 「文献 3」 と呼ぶ)や I TU— T勧告 G. 729など多くの標準方式においては、 LP係数を線スぺク トノレ対 (L i n e a r S p e c t r a l P a i r : L S P) で表現し、 この 線スペクトル対 (LSP) を符号化及び復号することが多いため、 以下、 LP係 数の符号化及ぴ復号は L S P領域で行われるものとする。
L P係数から L S Pへの変換及び L S Pから L P係数への変換は周知の方法に 従って行われる。 例えば、 「文献 3」 の第 5. 2. 3節及び第 5. 2. 4節に記載 されている方法に従って行われる。
LP係数符号変換回路 1 100は、 符号分離回路 1010から入力された第 1 の L P係数符号を第 1の方式における L S P復号方法により復号して、 第 1の L S Pを得る。
次いで、 LP係数符号変換回路 1 100は、 第 2の方式における LSPの量子 化方法及び符号化方法により第 1の L S Pを量子化及び符号化して、 第 2の L S Pとこれに対応する第 2の L P係数符号を得る。
次いで、 LP係数符号変換回路 1 100は、 第 2の LP係数符号を第 2の方式 における L S P復号方法により復号可能な符号として符号多重回路 1020に出 力するとともに、 第 1の LSP及び第 2の LSPを LSP— LPC変換回路 1 1 10に出力する。
図 2は、 L P係数符号変換回路 1 100の一構成例を示すプロック図である。 L P係数符号変換回路 1 100は、 例えば、 L S P復号回路 1 10と、 第 1の LSPコードブック 1 1 1と、 LSP符号化回路 130と、 第 2の LSPコード ブック 131と、 入力端子 31と、 出力端子 32、 33、 34とから構成されて いる。
LSP復号回路 1 10は、 LP係数符号から、 その LP係数符号に対応する L S Pを復号する。
具体的には、 LSP復号回路 1 10は、 複数セットの L S Pが格納された第 1 の LSPコードブック 1 1 1を備えており、 符号分離回路 1010から出力され る第 1の LP係数符号を入力端子 31を介して入力し、 第 1の LP係数符号に対 応する LSPを第 1の LSPコードブック 11 1より読み出し、 読み出された L 3?を第1の 3?として1^3?符号ィ匕回路130に出力するとともに、 出力端 子 33を介して LSP— LP C変換回路 1 110に出力する。
ここで、 LP係数符号からの LSPの復号は、 第 1の方式における LP係数の 復号方法 (ここでは、 LSPにより表現されているので LS Pの復号となる) に 従って、 第 1の方式の L S Pコードブックを用いて行われる。
LS P符号化回路 130は、 乙3?復号回路1 10から出力される第 1の LS Pを入力し、 複数セットの LSPが格納された第 2の LSPコードブック 131 から第 2の LSPとそれに対応する L P係数符号の各々を順次読み込み、 第 1の L S Pとの誤差が最小となる第 2の LSPを選択し、 それに対応する L P係数符 号を第 2の LP係数符号として出力端子 32を介して符号多重回路 1020に出 力するとともに、 第 2の LSPを出力端子 34を介して LS P— LP C変換回路 1 1 10に出力する。
ここで、 第 2の LSPの選択方法、 すなわち、 L S Pの量子化及び符号化は、 第 2の方式における L S Pの量子化方法及び符号化方法に従って、 第 2の方式の L S Pコードブックを用いて行われる。 L S Pの量子化及び符号化については、 例えば、 「文献 3」 の第 5. 2. 5節の記載を参照することができる。
再び図 1を参照すると、 L S P— L P C変換回路 1 1 10は、 L P係数符号変 換回路 1 100から出力される第 1の LSPと第 2の LSPとを入力し、 第 1の LS Pを第 1の LP係数 に変換し、 第 2の LS Pを第 2の LP係数 a2,iに 変換し、第 1の LP係数ひ lt iを目標信号計算回路 1700と音声復号回路 150 0とインパルス応答計算回路 1 120に出力し、第 2の LP係数 a2,iを目標信号 計算回路 1 700とインパルス応答計算回路 1 120に出力する。
ここで、 L S Pから LP係数への変換については、 例えば、 「文献 3」 の第 5. 2. 4節の記載を参照することができる。
AC B符号変換回路 1200は、 符号分離回路 1010から入力した第 1の A C B符号を、 第 1の方式における符号と第 2の方式における符号との対応関係を 用いて読み替えることにより、 第 2の ACB符号を得る。 次いで、 ACB符号変 換回路 1200は、 この第 2の ACB符号を第 2の方式における ACB復号方法 により復号可能な符号として符号多重回路 1020に出力するとともに、 第 2の ACB符号に対応する A C B遅延を第 2の ACB遅延として目標信号計算回路 1 700に出力する。
ここで、 図 3を参照して、 符号の読み替えについて説明する。
例えば、 第 1の方式における AC B符号
(14) 力;51、 52、 53、 54、 55、 56の符号列からなるものとし、 これらの A CB符号に対応する ACB遅延 T (A)が 7 1、 72、 73、 74、 75、 76の 符号列からなるものとする。 従って、 例えば、 ACB符号 「56」 に対応する A CB遅延 T (A)は 「76」 である。
同様に、 第 2の方式における AC B符号
(1 5) が 48、 49、 50、 51、 52、 53の符号列からなるものとし、 これらの A CB符号に対応する ACB遅延 T (B)が 71、 72、 73、 74、 75、 76の 符号列からなるものとする。 従って、 例えば、 ACB符号 「53」 に対応する A CB遅延 T (B)は 「76」 である。 このような場合、 第 1の方式から第 2の方式へと A C B符号を変換するには、 ACB遅延の値が同一となるように第 1の方式における A C B符号を第 2の方式 における A C B符号に対応付ける。
例えば、 ACB遅延の値が 「76」 である場合には、 第 1の方式における AC B符号 「56」 を第 2の方式における ACB符号 「53」 に対応付ける。 あるい は、 ACB遅延の値が 「71」 である場合には、 第 1の方式における ACB符号 「51」 を第 2の方式における ACB符号 「48」 に対応付ける。
音声復号回路 1 500は、 符号分離回路 1010から出力される第 1の ACB 符号、 第 1の FCB符号及び第 1のゲイン符号を入力し、 さらに、 LSP— LP C変換回路 1 1 10から第 1の LP係数ひ 1 を入力する。
音声復号回路 1 500は、 第 1の方式における AC Β信号復号方法、 FCB信 号復号方法及びゲイン復号方法の各々を用いて、 第 1の AC B符号、 第 1の FC B符号及び第 1のゲイン符号の各々から、 ACB遅延、 FCB信号及びゲインの 各々を復号する。 以下、 これらを第 1の ACB遅延、 第 1の FCB信号及び第 1 のゲインと呼ぶ。
音声復号回路 1500は第 1の AC B遅延を用いて AC B信号を生成する。 以 下、 この ACB信号を第 1の ACB信号とする。
次いで、 音声復号回路 1500は、 第 1の AC B信号、 第 1の FCB信号及び 第 1のゲインと第 1の L P係数とから復号音声を生成し、 生成した音声を目標信 号計算回路 1700に出力する。
図 4は音声復号回路 1500の一構成例を示すブロック図である。 .
音声復号回路 1 500は、 励振信号情報復号回路 1600と、 励振信号計算回 路 1540と、 励振信号記憶回路 1570と、 合成フィルタ 1 580とから構成 されており、 励振信号情報復号回路 1600は、 ACB復号回路 1510と、 F CB復号回路 1 520と、 ゲイン復号回路 1530とから構成されている。 励振信号情報復号回路 1600は、 励振信号の情報に対応する符号から励振信 号の情報を復号する。 さらに、 励振信号情報復号回路 1600は、 符号分離回路 1010から出力される第 1の AC B符号、 第 1の FCB符号及び第 1のゲイン 符号を各々入力端子 51、 52及び 53を介して入力し、 第 1の AC B符号、 第 1の ( S FCB符号及び第 1のゲイン符号の各々から、 ACB遅延、 FCB信号及び ゲインの各々を復号する。 これらは上述の第 1の AC B遅延、 第 1の FCB信号 及ぴ第 1のゲインである。 ここで、 第 1のゲインは AC Bゲイン及び FCBゲイ ンからなり、 以下、 各々を第 1の AC Bゲイン及び第 1の FCBゲインと呼ぶ。 また、 励振信号情報復号回路 1600は、 励振信号記憶回路 1570から出力 される過去の励振信号を入力し、 過去の励振信号と第 1の AC B遅延とを用いて AC B信号を生成する。 以下、 この AC B信号を第 1の AC B信号と呼ぶ。 次いで、 励振信号情報復号回路 1600は、 第 1の AC B信号、 第 1の FCB 信号、 第 1の AC Bゲイン及び第 1の FCBゲインを励振信号計算回路 1540 に出力する。
以下、 励振信号情報復号回路 1600の構成要素である ACB復号回路 1 51 0、 F C B復号回路 1520及びゲイン復号回路 1 530を説明する。
ACB復号回路 1510は、 符号分離回路 1010から出力される第 1の AC B符号を入力端子 51を介して入力するとともに、 励振信号記憶回路 1570力 ら出力される過去の励振信号を入力する。
AC B復号回路 1510は、 上述した従来の方法と同様にして、 図 3に示した 第 1の方式における ACB符号と ACB遅延との対応関係を用いて、 第 1の AC B符号に対応する第 1の AC B遅延 T^Aを得る。
さらに、 AC B復号回路 1510は、 励振信号において、 現サブフレームの始 点から起算して T (A)サンプル分の過去の点から、 サブフレーム長に相当する長 さ
(7) のサンプルの信号を切り出して、 第 1の AC B信号を生成する。
ここで、 T (A)がサブフレーム長に相当する長さ ) よりし Sも小さい場合には、 T (A)サンプル分のベクトルを切り出し、 このベクトル を繰り返し接続して、 長さ
(7) のサンプルの信号とする。
次いで、 ACB復号回路 1510は、 このようにして生成した第 1の AC B信 号を励振信号計算回路 1 540に出力する。
ここで、第 1の ACB信号を生成する方法の詳細については、 「文献 3」の第 6. 1節及び第 5. 6節の記載を参照することができる。
FCB復号回路1520は、 符号分離回路 1010から出力される第 1の F C B符号を入力端子 52を介して入力し、 第 1の FCB符号に対応する第 1の FC B信号を励振信号計算回路 1540に出力する。
F C B信号は、 パルス位置とパルス極性で規定されるマルチパルス信号により 表現されており、 第 1の FCB符号はパルス位置に対応する符号 (パルス位置符 号) とパルス極性に対応する符号 (パルス極性符号) とからなる。 ここで、 マル チパルス信号により表現された F CB信号を生成する方法の詳細については、 「文献 3j の第 6. 1節及び第 5. 7節の記載を参照することができる。
ゲイン復号回路 1530は、 符号分離回路 1010から出力される第 1のゲイ ン符号を入力端子 53を介して入力する。 ゲイン復号回路 1530は、 複数のゲ インが格納されたテーブル (図示せず) を内蔵しており、 第 1のゲイン符号に対 応するゲインをそのテーブルから読み出す。
次いで、 ゲイン復号回路 1530は、 読み出されたゲインのうち、 ACBゲイ ンに対応する第 1の AC Bゲインと F C Bゲインに対応する第 1の F CBゲイン とを励振信号計算回路 1 540に出力する。
ここで、 第 1の AC Bゲインと第 1の FCBゲインとがまとめて符号化されて いる場合には、 テーブル (図示されない) には第 1の ACBゲインと第 1の FC Bゲインとからなる 2次元ベク トルが複数個格納されている。 また、 第 1の AC Bゲインと第 1の F C Bゲインが個別に符号ィ匕されている場合には、 二つのテー ブル (図示されない) が内蔵され、 一方のテーブルに第 1の AC Bゲインが複数 個格納されており、 他方のテーブルに第 1の F C Bゲインが複数個格納されてい る。
励振信号計算回路 1540は、 AC B復号回路 15 10から出力される第 1の AC B信号を入力し、 ?〇8復号回路1520から出力される第 1の FCB信号 を入力し、 ゲイン復号回路 1530から出力される第 1の AC Bゲインと第 1の FCBゲインとを入力する。
励振信号計算回路 1540は、 第 1の AC B信号に第 1の AC Bゲインを乗じ て得た信号と、 第 1の F C B信号に第 1の F C Bゲインを乗じて得た信号とを加 算して第 1の励振信号を得る。 励振信号計算回路 1540は、 このようにして得 られた第 1の励振信号を合成フィルタ 1580と励振信号記憶回路 1570とに 出力する。
励振信号記憶回路 1570は、 励振信号計算回路 1 540から出力される第 1 の励振信号を入力し、 これを記憶保持する。 励振信号記憶回路 1570は、 励振 信号計算回路 1 540から第 1の励振信号を入力すると、 過去に入力されて記憶 保持されている過去の第 1の励振信号を AC B復号回路 1510に出力する。 合成フィルタ 1580は、 励振信号計算回路 1540から出力される第 1の励 振信号を入力するとともに、 LSP— LPC変換回路 1 1 10から出力される第 1の LP係数 α iを入力端子 61を介して入力する。
合成フィルタ 1580は、第 1の LP係数 αい;を有する線形予測フィルタとし て機能し、 励振信号計算回路 1540から出力される第 1の励振信号で駆動され ることにより、 音声信号を生成する。
合成フィルタ 1580は、 このようにして生成された音声信号を出力端子 63 を介して目標信号計算回路 1700に出力する。
図 1に示すように、 目標信号計算回路 1 700は、 LSP— LPC変換回路 1 1 10から第 1の LP係数と第 2の LP係数とを入力し、 ACB符号変換回路 1 200から第 2の ACB符号に対応する第 2の ACB遅延を入力し、 音声復号回 路 1500から復号音声を入力し、 インパルス応答計算回路 1 120力、らインパ ルス応答信号を入力し、 第 2の励振信号記憶回路 1620に記憶保持される過去 の第 2の励振信号を入力する。
目標信号計算回路 1 700は、 復号音声と第 1の LP係数及び第 2の LP係数 とから第 1の目標信号を計算する。
次いで、 目標信号計算回路 1 700は、 過去の第 2の励振信号とインパルス応 答信号と第 2の AC B遅延と第 1の目標信号とから、 第 2の AC B信号及び最適 ACBゲインを求める。
次いで、 目標信号計算回路 1 700は、 第 1の目標信号を FCB符号生成回路 1800とゲイン符号生成回路 1400とに出力し、 最適 ACBゲインを FCB 符号生成回路 1800に出力し、 第 2の ACB信号を FCB符号生成回路 180 ◦とゲイン符号生成回路 1400と第 2の励振信号計算回路 1610とに出力す る。
インパ ス応答計算回路 1 120は、 LS P— LPC変換回路 1 110から出 力される第 1の LP係数 α1 及び第 2の LP係数 a2,iを入力し、 第 1の LP係 数と第 2の L P係数を用いて聴感重み付け合成フィルタを構成する。 ィンパルス 応答計算回路 1 120は、 聴感重み付け合成フィルタのィンパルス応答信号を目 標信号生成回路 1 700と F C B符号生成回路 1 800とゲイン符号生成回路 1 400とに出力する。
ここで、 聴感重み付け合成フィルタの伝達関数は、 次式により表される。
Figure imgf000025_0001
ただし、
(17)
Figure imgf000025_0002
は、 第 2の LP係数 a 2,i ( i =1, ···, P) をもつ線形予測フィルタの伝達関数 であり、
w(z)
Figure imgf000026_0001
(18) は、 第 1の LP係数 ( i =1, ··', P) をもつ聴感重み付けフィルタの伝達 関数である。
ここで、 Pは線形予測次数 (例えば、 10) であり、 γ 1と y 2は重み付けを制 御する係数 (例えば、 γι=0. 94、 γ2=0. 6) である。
FCB符号生成回路 1800は、 目標信号計算回路 1 700から出力される第 1の目標信号と第 2の ACB信号と最適 ACBゲインとを入力し、 インパルス応 答計算回路 1120から出力されるインパルス応答信号を入力し、 符号分離回路 1010から第 1の FCB符号を入力する。
FCB符号生成回路 1800は、 第 1の方式と第 2の方式との間における符号 間の対応関係が利用できるパルスについては、 この対応関係に基づいて、 第 1の FCB符号を読み替えることにより、 第 2の FCB符号を部分的に得る。
ここで、 FCB信号は、 複数のパルスからなり、 パルス位置及びパルス極性で 規定されるマルチパルス信号により表現される。 FCB符号は、 パルス位置に対 応する符号 (パルス位置符号) とパルス極性に対応する符号 (パルス極性符号) とからなり、 これらの符号の読み替えは、 前述した AC Β符号の読み替えと同様 の方法により実現することができる。
マルチパルス信号による FCB信号の表現方法については、 例えば、 文献 3の 第 5. 7節の記載を参照することができる。
以下、 図 5を参照して、 パルス位置符号の読み替えについて説明する。
例えば、 第 1の方式におけるパルス位置符号 ; (A AO Bp) (19)
I p が 2、 3、 4、 5、 6、 7の符号列からなるものとし、 これらのパルス位置符号 に対応するパルス位置
(A) (20) が 10、 15、 20、 25、 30、 35の符号列からなるものとする。 従って、 例えば、 パルス位置符号 「6」 に対応するパルス位置は 「30」 である。
同様に、 第 2の方式におけるパルス位置符号
(21) が 5、 4、 3、 2、 1、 0の符号列からなるものとし、 これらのパルス位置符号 に対応するパルス位置
(B) (22) が 10、 15、 20、 25、 30、 35の符号列からなるものとする。 従って、 例えば、 パルス位置符号 「1」 に対応するパルス位置は 「30」 である。
このような場合、 第 1の方式から第 2の方式へとパルス位置符号を変換するに は、 パルス位置の値が同一となるように第 1の方式におけるパルス位置符号を第 2の方式におけるパルス位置符号に対応付ける。
例えば、 パルス位置の値が 「30」 である場合には、 第 1の方式におけるパル ス位置符号 「6」 を第 2の方式におけるパルス位置符号 「1」 に対応付ける。 あ るいは、 パルス位置の値が 「10」 である場合には、 第 1の方式におけるパルス 位置符号 「2」 を第 2の方式におけるパルス位置符号 「5」 に対応付ける。 パルス極性符号については、 読み替え前の符号に対応する極性 (正または負) と読み替え後の符号に対応する極性とが等しくなるように符号を読み替える。 前述のように、 FCB符号生成回路 1800は、 第 1の方式と第 2の方式との 間における符号間の対応関係が利用できるパルスについては、 この対応関係に基 づいて、 第 1の FCB符号を読み替えることにより、 第 2の FCB符号を部分的 に得る。 これに対して、 FCB符号生成回路 1800は、 対応関係を利用できな いパルスについては、 FCB信号とインパルス応答信号との畳み込み (Co nv o 1 u t i o n) によってフィルタ処理された FCB信号と第 2の目標信号との 距離が最小となるパルス位置とパルス極性を選択する。 これは、 第 2の符号列か ら得られる情報により生成される音声と第 1の符号列から得られる情報により生 成される音声との距離を最小化することに対応する。
ここで、 第 2の目標信号は、 第 1の目標信号と第 2の ACB信号と最適 AC B ゲインとインパルス応答信号とから計算される。
FCB符号生成回路 1800は、 第 1の FCB符号の読み替えによるパルス位 置及びパルス極性と、 選択されたパルス位置及びパルス極性とから規定される F 〇8信号を第2の?じ8信号として生成する。
次いで、 FCB符号生成回路 1800は、 第 2の FCB信号に対応する、 第 2 の方式により復号可能な符号を、 第 2の FCB符号として符号多重回路 1020 に出力し、 第 2の FCB信号をゲイン符号化回路 1410及び第 2の励振信号計 算 1 610に出力する。
ゲイン符号生成回路 1400は、 目標信号計算回路 1700から出力される第 1の目標信号と第 2の AC B信号とを入力し、 FCB符号生成回路 1800から 出力される第 2の FCB信号を入力し、 インパルス応答計算回路 1120力 ら出 力されるインパルス応答信号を入力する。
ゲイン符号生成回路 1400は、 第 1の目標信号と再構成音声との重み付け自 乗誤差を最小にする ACBゲインと FCBゲインとを選択する。 ここで、 再構成 音声は、 第 2の AC B信号と第 2の FCB信号とインパルス応答信号と、 ゲイン 符号生成回路 1400が内蔵するテーブルに格納された AC Bゲインと FCBゲ インとから計算される。
次いで、 ゲイン符号生成回路 1400は、 選択された ACBゲイン及び FCB ゲインに対応する、 第 2の方式により復号可能な符号を、 第 2のゲイン符号とし て符号多重回路 1020に出力し、 選択された AC Bゲイン及び FCBゲインを 各々第 2の ACBゲイン及び第 2の F C Bゲインとして第 2の励振信号計算回路 1610に出力する。
第 2の励振信号計算回路 1610は、 目標信号計算回路 1700から出力され る第 2の AC B信号を入力し、 FCB符号生成回路 1800から出力される第 2 の FCB信号を入力し、 ゲイン符号生成回路 1400から出力される第 2の AC Bゲインと第 2の FCBゲインとを入力する。
第 2の励振信号計算回路 1610は、 第 2の AC B信号に第 2の AC Bゲイン を乗じて得た信号と、 第 2の F C B信号に第 2の F C Bゲインを乗じて得た信号 とを加算して第 2の励振信号を得る。 第 2の励振信号は第 2の励振信号記憶回路 1620に出力される。
第 2の励振信号記憶回路 1620は、 第 2の励振信号計算回路 1610から出 力される第 2の励振信号を入力し、 これを記憶保持する。 第 2の励振信号記憶回 路 1620は、 第 2の励振信号計算回路 1610から第 2の励振信号を入力する と、 過去に入力されて記憶保持されている第 2の励振信号を目標信号計算回路 1 700に出力する。
本実施例における目標信号計算回路 1700、 FCB符号生成回路 1800及 びゲイン符号生成回路 1400のそれぞれの構成の一例を以下に説明する。 図 6は、 本実施例における目標信号計算回路 1 700の構成の一例を示すプロ ック図である。
図 4に示すように、 目標信号計算回路 1700は、 重み付け信号計算回路 1 7 10と AC B信号生成回路 1 720とを備えている。
重み付け信号計算回路 1710は、 音声復号回路 1500の構成要素である合 成フィルタ 1580から出力される復号音声を入力端子 57を介して入力し、 L S P— LPC変換回路 1 1 10から出力される第 1の LP係数及び第 2の LP係 数をそれぞれ入力端子 36及び入力端子 35を介して入力する。
重み付け信号計算回路 1 710は、 第 1の LP係数を用いて、 聴感重み付けフ イノレタ W (z) (式 (1 8) 参照) を構成する。 そして、 合成フィルタ 1580か ら出力される復号音声によりこの聴感重み付けフィルタを駆動し、 聴感重み付け 音声信号を生成する。
さらに、 重み付け信号計算回路 1710は、 第 1の LP係数及ぴ第 2の LP係 数を用いて、 聴感重み付け合成フィルタ W (z) /K2 (ζ) (式 (16) 参照) を構成する。
重み付け信号計算回路 1 710は、 聴感重み付け合成フィルタの零入力応答を 聴感重み付け音声信号から減算して得られる第 1の目標信号 X (η) を ACB信 号生成回路 1720に出力するとともに、 第 1の目標信号 X (η) を第 2の目標 信号計算回路 1810 (後述) 及びゲイン符号化回路 1410に出力端子 78を 介して出力する。
ACB信号生成回路 1 720は重み付け信号計算回路 1 710から出力される 第 1の目標信号 X (η) を入力し、 ACB符号変換回路 1 200から出力される 第 2の AC Β遅延を入力端子 37を介して入力し、 インパルス応答計算回路 1 1 20から出力されるインパルス応答信号を入力端子 74を介して入力し、 第 2の 励振信号記憶回路 1620から出力される過去の第 2の励振信号を入力端子 75 を介して入力する。
AC B信号生成回路 1720は、 過去の第 2の励振信号から遅延 kで切り出さ れた信号とインパルス応答信号との畳み込みにより、 フィルタ処理された遅延 k の過去の励振信号 yk(n), n = 0,…,
Figure imgf000030_0001
-1 (23) を計算する。 ここで、 遅延 kは第 2の AC B遅延とする。 過去の第 2の励振信号 から遅延 kで切り出された信号を第 2の ACB信号 V (n) とする。
また、 ACB信号生成回路 1720は、 第 1の目標信号 X (n) 及ぴ yk (n) から最適 AC Bゲイン g pを次式により計算する。 I (B)_1
Figure imgf000031_0001
ACB信号生成回路 1 720は、 第 2の ACB信号 v (n) を第 2の目標信号 計算回路 1810とゲイン符号化回路 14.10と第 2の励振信号計算回路 161 0とに出力端子 76を介して出力し、 最適 AC Bゲインを第 2の目標信号計算回 路 1810に出力端子 77を介して出力する。
なお、 第 2の AC B信号 V (n) を計算する方法及び最適 ACBゲイン g pを 計算する方法の詳細については、 「文献 3」 の第 6. 1節及び第 5. 6節の記載を 参照することができる。
図 7は、 本実施例における F C B符号生成回路 1800の構成の一例を示すブ 口ック図である。
図 7に示すように、 FCB符号生成回路 1800は、 第 2の目標信号計算回路 1810と、 F C B符号変換回路 1 300と、 F C B符号化回路 1820とを備 えている。
第 2の目標信号計算回路 18 10は、 目標信号計算回路 1 700の構成要素で ある重み付け信号計算回路 17 10から出力される第 1の目標信号 X (n) を入 力端子 81を介して入力し、 インパルス応答計算回路 1 1 20から出力されるィ ンパルス応答信号を入力端子 84を介して入力し、 AC B信号生成回路 1720 から出力される第 2の ACB信号 V (n) 及び最適 ACBゲイン gpをそれぞれ 入力端子 83及び 82を介して入力する。
第 2の目標信号計算回路 1810は、 第 2の ACB信号 V (n) とインパルス 応答信号との畳み込み (Co n v o 1 u t i o n) により、 フィルタ処理された 第 2の ACB信号 y (n) y(n), n = 0'…, Lir)一 1 (25) を計算し、 第 2の ACB信号 y (n) に最適 A C Bゲイン g pを乗じて得られる 信号を第 1の目標信号から減算して第 2の目標信号 x' (n) を得る。
X'(n) = X(n)― gPy(n (26) y(n) = v(n)*h(n) (27) 第 2の目標信号計算回路 1 8 1 0は、 このようにして得られた第 2の目標信号 x' (n) を FCB符号化回路 1 820に出力する。
FCB符号変換回路 1 300は、 符号分離回路 1 01 0から入力端子 85を介 して入力した第 1の FCB符号を、 第 1の方式における符号と第 2の方式におけ る符号との対応関係を用いて読み替えることにより、 第 2の F C B符号を部分的 に得る。
例えば、 第 1の方式の FCB信号は 4個のパルス P 0, P I , P 2, P 3から なり、 各パルスの取り得る位置は 40サンプルの F CB信号 (0、 1、 2、 ···、 39) の範囲内において、 表 1のトラック 1、 2、 3、 4により規定されている ものとする。 1]
Figure imgf000032_0001
また、 第 2の方式の FCB信号は 10個のパルス P 0, P 1 , P 2, ···, P 9 からなり、 各パルスの取り得る位置は表 2のトラック 2、 3、 4、 5により 規定されているものとする。 2] 卜ラック パノレス 位
1 P0, P5 0, 5, 10, 15, 20, 25, 30, 35
2 P1, P6 1, 6, 11, 16, 21, 26, 31, 36
3 P2, P7 2, 7, 12, 17, 22, 27, 32, 37
4 P3, P8 3, 8, 13, 18, 23, 28, 33, 38
5 P4, P9 4, 9, 14, 19, 24, 29, 34, 39 この場合、第 2の方式の FCB信号における 10個のパルス P 0, P 1 , P 2, ·■·, P 9のうち P O, P 1 , P 2を、 第 1の方式の F CB信号におけるパルス P 0, P 1 , P 2に対応付けることが可能であり、 これら 3個のパルス P0, P 1 , P 2のパルス位置符号及びパルス極性符号を得ることができる。
FCB符号変換回路 1300は、 これらのパルス P O, P 1 , P 2についての パルス位置符号及びパルス極性符号を部分的な F C B符号として F C B符号化回 路 1820に出力する。
逆に、 表 1が第 2の方式に、 表 2が第 1の方式にそれぞれ対応する場合、 第 2 の方式の FCB信号におけるパルス P 0, P 1 , P 2, 3を第1の方式の?じ B信号における 10個のパルス P 0, P I, P 2, '··, P 9のいずれかに直接的 には対応付けることができない。 このため、 部分的な FCB符号は不定となる。 従って、 パルス P O, P 1 , P 2, P 3の全てについて、 FCB符号化回路 18 20において、 その位置と極性が選択される。
FCB符号化回路 1820は、 第 2の目標信号計算回路 1810から出力され る第 2の目標信号 x' (n) を入力し、 インパルス応答計算回路 1 120力、ら出力 されるインパルス応答信号を入力端子 84を介して入力し、 FCB符号変換回路 1 300から出力される部分的な FCB符号を入力する。
FCB符号ィヒ回路 1820は、 部分的な FCB符号によりパルス位置とパルス 極性が決定されるパルス (上述の例では、 パルス PO, P I, P 2) を除いた残 りのパルス (上述の例では、 パルス P3, P4, ···, P 9) について、 FCB信 号とインパルス応答信号との畳み込みによりフィルタ処理された F C B信号
Ζ(η), η = 0, …, し 一 1 (28) と第 2の目標信号 x' (n) との間の距離が最小となるパルス位置とパルス極性を 選択する。
これは次式 (29) で表される評価値 A kを最大化するパルス位置及びパルス 極性を選択することと同義である。 このとき、 各パルスの位置候補は、 各パルス が属するトラックに応じて、 表 2に示す位置となる。
Figure imgf000034_0001
(29) ここで、 べク トル c kは FCB信号の k番目の候補を表し、 d二 Ηιχ' (30) Φ 二 HlH o であり、 ベクトル χ, は第 2の目標信号、 Ηはインパルス応答信号 h (n) を要 素とする下三角テープリッッ行列 (To e p 1 i z ma t r i x) である。 な お、 Ηιは行列 Hの転置行列、 c k d 1はそれぞれべクトル c k及びべクトル dの転置べクトルである。
FCB信号の選択方法、 すなわち、 FCB信号におけるパルス位置及びパルス 極性の選択方法の詳細については、 「文献 3jの第 5. 7節の記载を参照すること ができる。
F C B符号化回路 1820は、 部分的な F C B符号によるパルス位置及びパル ス極性と、 選択されたパルス位置及びパルス極性とから規定される FCB信号を 第 2の FCB信号 c (n) として生成する。
次いで、 FCB符号ィ匕回路 1820は、 第 2の FCB信号に対応する、 第 2の 方式により復号可能な符号を第 2の FCB符号として符号多重回路 1020に出 力端子 55を介して出力し、 第 2の FCB信号 c (n) をゲイン符号化回路 14 10 (後述)及び第 2の励振信号計算 1610に出力端子 86を介して出力する。 他方、 F C B符号変換回路 1300の表 1が第 2の方式に、 表 2が第 1の方式 に対応する場合、 第 2の方式の FCB信号におけるパルス P 0, P 1, P 2, P 3を、 第 1の方式の FCB信号におけるパルス P 0, P 1 , P 2, …, P 9のい ずれかに直接的には対応付けることができないため、 全てのパルス PO, P 1, P 2, P 3についてその位置と極性を選択する。
ここで、 第 1の方式のパルス Pn (n = 0, 1, 2, ···, 9) を Pn (A)、 第 2の方式のパルス P nを P n (B) と表すと、 パルス P 0 (A) 乃至 P 3 (A) の候補は次のようになる。
パルス PO (A) の候補:パルス P O (B) またはパルス P 5 (B)、 パルス P I (A) の候補:パルス P I (B) またはパルス P 6 (B)、 パルス P 2 (A) の候補:パルス P 2 (B) またはパルス P 7 (B)、 パルス P 3 (A) の候補:パルス P 3 (B)、 P 8 (B) またはパルス P 4 (B)、 P 9 (B)
FCB符号化回路 1820は、 これらのパルス位置候補に対して、 評価値 Ak を最大化するパルス位置及びパルス極性を選択し、 選択によって得られたパルス 位置及びパルス極性から規定される FCB信号を第 2の FCB信号 c (n) とす る。
なお、 パルス位置の候補として、 表 1に示す各パルスに対応するトラックに含 まれる位置を用いることもできる。
図 8は、 本実施例におけるゲイン符号生成回路 1400の構成の一例を示すブ 口ック図である。
図 8に示すように、 ゲイン符号生成回路 1400は、 ゲイン符号化回路 141 0とゲインコードブック 1420とを備えている。 ゲイン符号化回路 1410は、 目標信号計算回路 1700の構成要素である重 み付け信号計算回路 1 710から出力される第 1の目標信号 X (n) を入力端子 93を介して入力し、 AC B信号生成回路 1720から出力される第 2の AC B 信号 V (n) を入力端子 92を介して入力し、 FCB符号化回路 1820から出 力される第 2の FCB信号 c (n) を入力端子 91を介して入力し、 インパルス 応答計算回路 1 120から出力されるインパルス応答信号 h (n) を入力端子 9 4を介して入力する。
ゲイン符号化回路 1410は、 複数の AC Bゲインと複数の FCBゲインとが 格納されたゲインコードブック 1420から ACBゲインと FCBゲインを順次 読み出し、 第 2の AC B信号と第 2の F C B信号とインパルス応答信号と AC B ゲインと F C Bゲインとから重み付け再構成音声を順次計算し、 重み付け再構成 音声と第 1の目標信号との重み付け自乗誤差を順次計算し、 重み付け自乗誤差を 最小にする AC Bゲイン及び FCBゲインを選択する。
ここで、 重み付け自乗誤差 Eは、 次式により表される。 八 A ク
E = (x(n)一 gP ■ Z(n)一 gc■ y(n))
Figure imgf000036_0001
(32) ただし、
Figure imgf000036_0002
Figure imgf000036_0003
は各々 ACBゲイン及び FCBゲインである。 また、 y (n) はフィルタ処理さ れた第 2の A C B信号であり、 第 2の A C B信号とィンパルス応答信号との畳み 込みにより得られる。 z (n) はフィルタ処理された第 2の FCB信号であり、 第 2の F C B信号とインパルス応答信号との畳み込みにより得られる。 なお、 重 み付け再構成音声は次式により表される。
S(n) 二 gP ■ Z(n) + gc , y(n) ( 3 5 ) 次いで、 ゲイン符号ィ匕回路 1 4 1 0は、 選択された A C Bゲイン及び F C Bゲ インに対応する、 第 2の方式により復号可能な符号を、 第 2のゲイン符号として 出力端子 5 6を介して符号多重回路 1 0 2 0に出力し、 A C Bゲイン及び F C B ゲインを各々第 2の A C Bゲイン及び第 2の F C Bゲインとして出力端子 9 5及 ぴ 9 6を介して第 2の励振信号計算回路 1 6 1 0に出力する。
' ここで、 A C Bゲイン及び F C Bゲインの選択方法及び符号化方法は、 第 2の 方式における選択方法及び符号化方法に従い、 第 2の方式のゲインコードブック を用いて行われる。 なお、 ゲインの選択方法については、 例えば、 「文献 3」 の第 5 . 8節の記載を参照することができる。
上述した本発明の第 1の実施例の符号変換装置 1 0 0 0は、 ディジタル信号処 理プロセッサその他の制御装置により実現することも可能である。
図 9は、 本発明の第 2の実施例として、 上記の第 1の実施例に係る符号変換装 置 1 0 0 0が行う符号変換処理をコンピュータで実現する場合の構成を模式的に 示すブロック図である。
図 9に示すように、 コンピュータ 1は、 中央処理装置 2と、 メモリ 3と、 記録 媒体読出装置ィンターフェース 4とを備えており、 記録媒体読出装置ィンターフ エース 4は外部装置としての記録媒体読出装置 5に接続されている。
記録媒体読出装置 5には記録媒体 6がセットされる。 記録媒体 6には、 コンビ ユータ 1を作動させるプログラムが格納されており、 記録媒体読出装置 5は、 セ ットされた記録媒体 6からそのプログラムを読み込む。
記録媒体読出装置 5が読み出したプログラムは録媒体読出装置ィンターフェ一 ス 4を介してコンピュータ 1内のメモリ 3に格納される。 コンピュータ 1は、 メ モリ 3からそのプログラムを読み出し、 実行する。
メモリ 3は、 例えば、 マスク ROMあるいはフラッシュメモリ等の不揮発性メ モリから構成することができる。
本明細書において、 「記録媒体」の語は、データを記録することができるあらゆ る媒体を含むものとする。
記録媒体 6としては、 例えば、 不揮発性メモリの他に、 CD— ROM (Com p a c t D i s k-ROM) や P Dなどのディスク型の記録媒体、 磁気テープ
(MT)、 MO (Ma gn e t o Op t i c a l D i s k)、 DVD (D i g i t a 1 Ve r s a t i l e D i s k) DVD-ROM (DVD-Re a d On l y Memo r y DVD— RAM (DVD— Ac c e s s Memo r y )、 フレキシブノレディスク、 R AM (R a n d o m Ac c e s s Memo r y ) や ROM (Re a d On l y Memo r y) などのメモリーチップ、 E P ROM (E r a s a b l e P r o g r amma b l e Re a d On 1 y Memo r y)% EE PROM (E l e c t r i c a l l y E r a s a b l e P r o g r amma b l e Re a d On l y Memo r y)、スマート メディア (登録商標)、 フラッシュメモリー、 コンパク トフラッシュ (登録商標) カードなどの書き換え可能なカード型 ROM、 ハードディスクまたは可搬型 HD Dがあり、 その他プログラムの格納に適していれば、 いかなる手段も用いること ができる。
この記録媒体 6は、 コンピュータ 1が読み取り可能なプログラム用言語を用い て必要な各機能をプロダラミングし、 そのプログラムをプログラム 1の記録が可 能な上記の記録媒体 6に記録することにより、 作成することができる。
あるいは、 記録媒体 6として、 サーバーに備え付けられたハードディスクを用 いることも可能である。
あるいは、 例えば、 サーバ装置 (図示せず) からコンピュータ 1に該プロダラ ムを通信媒体伝送することも可能である。 この場合の伝送は有線及び無線の別を 問わない。
記録媒体 6から読み出されたプログラムを実行するコンピュータ 1において、 第 1の符号化復号装置により音声を符号化して得た第 1の符号を第 2の符号化復 号装置により復号可能な第 2の符号へ変換する符号変換処理を実行するにあた り、 記録媒体 6には以下の (a) 乃至 (e) の処理を実行させるためのプロダラ ムが記録されている。
(a ) 第 1の符号列から第 1の線形予測係数を得る処理
(b) 第 1の符号列から励振信号の情報を得る処理
(c) 励振信号の情報から励振信号を得る処理
( d ) 第 1の線形予測係数をもつフィルタを励振信号により駆動することによ つて音声信号を生成する処理
(e) 励振信号の情報に含まれる固定コードブック情報を用いて、 第 2の符号 列から得られる情報から生成される第 2の音声信号と第 1の音声信号との間の距 離を最小化することによって第 2の符号列における固定コードブック情報を求め る処理
上記の (e) の処理に代えてコンピュータ 1が次の (e) の処理を行うように することもできる。
(e) 励振信号の情報に含まれる固定コードブック情報を、 第 2の符号列にお ける固定コードブック情報の一部に用いるとともに、 第 2の符号列から得られる 情報から生成される第 2の音声信号と第 1の音声信.号との間の距離を最小化する ことによって第 2の符号列における固定コードブック情報を求める処理。 産業上の利用可能性
以上説明したように、 本発明によれば、 第 1の方式の固定コードブック (FC B) におけるパルス数と第 2の方式の FCBにおけるパルス数とが異なる場合で あっても、 全ての FCB符号を変換できる、 という効果を奏する。
その理由は、 本発明においては、 符号の読み替えに基づく FCB符号の変換に より、 第 1の方式の F C B符号から第 2の方式の F C B符号を一部について得る とともに、 第 1の方式における線形予測係数、 適応コードブック (ACB) 信号 及びゲインを含む情報から生成される復号音声を用いて FCB信号を求め、 これ に対応する符号と、 読み替えにより得た F C B符号とを併せて第 2の方式の F C B符号とするように構成したためである。

Claims

請求の範囲
1 . 第 1の符号列を第 2の符号列に変換する符号変換方法において、 前記第 1の符号列から第 1の線形予測係数及び励振信号情報を得る第一の過程 と、
前記励振信号情報に基づいて励振信号を生成する第二の過程と、
前記第 1の線形予測係数を有するフィルタを前記励振信号で駆動することによ つて第 1の音声信号を生成する第三の過程と、
前記第 2の符号列から得られる情報に基づいて第 2の音声信号を生成する第四 の過程と、
前記励振信号情報に含まれる固定コードブック情報を用いて、 前記第 1の音声 信号及び前記第 2の音声信号に基づき、 前記第 2の符号列における固定コードブ ック情報を求める第五の過程と、
を備える符号変換方法。
2 . 前記第五の過程において、 前記励振信号情報に含まれる固定コードブッ ク情報を前記第 2の符号列における固定コードブック情報の一部として用いるこ とを特徴とする請求の範囲第 1項に記載の符号変換方法。
3 . 前記第五の過程において、 前記第 2の音声信号と前記第 1の音声信号との 間の距離を最小化することによって、 前記第 2の符号列における固定コードブッ ク情報を求めることを特徴とする請求の範囲第 1項又は第 2項に記載の符号変換 方法。
4 . 前記固定コ一ドブック情報はマルチパルス信号のパルス位置とパルス極 性とからなるものであることを特徴とする請求の範囲第 1項乃至第 3項のいずれ か一項に記載の符号変換方法。
5 . 前記励振信号情報に含まれるパルス位置を前記第 2の符号列におけるパ ルス位置の候補とし、 前記パルス位置候補に対して、 前記第 2の音声信号と前記 第 1の音声信号との間の距離を最小化することを特徴とする請求の範囲第 1項又 は第 2項に記載の符号変換方法。
6 . 第 1の符号列を第 2の符号列に変換する符号変換装置において、 前記第 1の符号列から第 1の線形予測係数及び励振信号情報を得て、 前記第 1 の線形予測係数を有するフィルタを前記励振信号情報から得られる励振信号で駆 動することによって第 1の音声信号を生成する音声復号回路と、
前記励振信号情報に含まれる固定コ一ドブック情報を用いて、 第 2の符号列か ら得られる情報から生成される第 2の音声信号と前記第 1の音声信号とに基づ き、 第 2の符号列における固定コードブック情報を求める固定コードブック符号 生成回路と、
を備える符号変換装置。
7 . 前記固定コードブック符号生成回路は、 前記固定コードブック情報を前 記第 2の符号列における固定コードブック情報の一部に用いるものであることを 特徴とする請求の範囲第 6項に記載の符号変換装置。
8 . 前記固定コードブック符号生成回路は、 前記第 2の音声信号と前記第 1 の音声信号との間の距離を最小化することによって、 前記第 2の符号列における 固定コードブック情報を求めるものであることを特徴とする請求の範囲第 6項又 は第 7項に記載の符号変換装置。
9 · 前記固定コードブック情報はマルチパルス信号のパルス位置及びパルス 極性からなるものであることを特徴とする請求の範囲第 6項乃至第 8項のいずれ か一項に記載の符号変換装置。
1 0 . 前記固定コードブック符号生成回路は、 前記励振信号情報に含まれる パルス位置を前記第 2の符号列におけるパルス位置の候補とし、 前記パルス位置 候補に対して、 前記第 2の音声信号と前記第 1の音声信号との間の距離を最小化 するものであることを特徴とする請求の範囲第 6項または第 7項に記載の符号変
1 1 . 第 1の符号列を第 2の符号列に変換する符号変換方法をコンピュータ に実行させるためのプログラムであって、
前記プログラムが行う処理は、
前記第 1の符号列から第 1の線形予測係数及び励振信号情報を得る第一の処理 と、
前記励振信号情報に基づいて励振信号を生成する第二の処理と、
前記第 1の線形予測係数を有するフィルタを前記励振信号で駆動することによ つて第 1の音声信号を生成する第三の処理と、
前記第 2の符号列から得られる情報に基づいて第 2の音声信号を生成する第四 の処理と、
前記励振信号情報に含まれる固定コードプック情報を用いて、 前記第 1の音声 信号及び前記第 2の音声信号に基づき、 前記第 2の符号列における固定コードブ ック情報を求める第五の処理と、 ·
ものであるプログラム。
1 2 . 前記第五の処理において、 前記励振信号情報に含まれる固定コードブ ック情報が前記第 2の符号列における固定コードブック情報の一部として用いら れることを特徴とする請求の範囲第 1 1項に記載のプログラム。
1 3 . 前記第五の処理において、 前記第 2の音声信号と前記第 1の音声信号 との間の距離を最小化することによって、 前記第 2の符号列における固定コード ブック情報を求めることを特徴とする請求の範囲第 1 1項又は第 1 2項に記載の プログラム。
1 4 . 前記固定コードブック情報はマルチパルス信号のパルス位置及びパル ス極性からなるものであることを特徴とする請求の範囲第 1 1項乃至第 1 3項の 何れか一項に記載のプログラム。
1 5 . 前記第五の処理において、 前記励振信号情報に含まれるパルス位置を 前記第 2の符号列におけるパルス位置の候補とし、前記パルス位置候補に対して、 前記第 2の音声信号と前記第 1の音声信号との間の距離を最小化することを特徴 とする請求の範囲第 1 1項又は第 1 2項に記載のプログラム。
1 6 . 請求の範囲第 1 1項乃至第 1 5項のいずれか一項に記載のプログラム を記録した記録媒体。
1 7 . 多重された符号を分離する符号分離回路と、
符号を多重化する符号多重回路と、 を備える符号変換装置であって、 第 1の方式で音声信号を符号化した符号を多重してなる符号列データを前記符 号分離回路により分離し、 分離された符号を、 前記第 1の方式とは別の第 2の方 式に準拠する符号に変換し、 該変換された符号を前記符号多重回路に供給し、 前 記符号多重回路において、 前記変換された符号を多重してなる符号列データを生 成する符号変換装置において、
前記符号分離回路で分離された第 1の方式における適応コードブック符号、 固 定コードブック符号及びゲイン符号を含む励振信号情報を復号し、 前記符号分離 回路で分離された線形予測係数符号に基づき、 第 1の方式で復号してなる第 1の 線形予測係数をもつ合成フィルタを前記励振信号情報から得られる励振信号で駆 動することにより、 復号音声信号を合成する音声復号回路と、
符号の読み替えに基づく固定コードブック符号の変換により、 第 1の方式の固 定コードブック符号から第 2の方式の固定コードブック符号の少なくとも 1部を 得るとともに、 前記復号音声信号を用いて固定コードブック信号を求め、 前記固 定コードブック信号に対応する固定コードブック符号と、 前記符号の読み替えに より得た部分的な固定コードブック符号とを併せて、 第 2の方式の固定コードブ ック符号とする固定コードブック符号生成回路と、 を備えていることを特徴とする符号変換装置。
1 8 . 前記固定コードブック信号は、 パルス位置及びパルス極性で規定され るマルチパルス信号により表現されていることを特徴とする請求の範囲第 1 7項 に記載の符号変換装置。
1 9 . 前記符号分離回路で分離された線形予測係数符号に基づき、 第 1の方 式で復号してなる第 1の線形予測係数と第 2の方式で復号してなる第 2の線形予 測係数とを生成する回路と、
前記符号分離回路から入力した第 1の方式の適応,コードブック符号を、 第 1の 方式における符号と第 2の方式における符号との対応関係を用いて読み替えるこ とにより、 第 2の方式の適応コードプック符号を生成し、 前記第 2の方式の適応 コードブック符号に対応する適応コードブック遅延を第 2の適応コードブック遅 延として後述する目標信号計算回路に出力する適応コードブック符号変換回路 と、
前記第 1及び第 2の線形予測係数を用いて聴感重み付け合成フィルタを構成 し、 前記聴感重み付け合成フィルタのィンパルス応答信号を出力するィンパルス 応答計算回路と、
前記復号音声信号と前記第 1及び前記第 2の線形予測係数とから第 1の目標信 号を計算し、 前記第 2の適応コードブック信号、 前記第 2の固定コードブック信 号及び前記ゲイン信号に基づき過去に生成された第 2の励振信号と、 前記ィンパ ルス応答信号と、 前記第 1の目標信号と、 前記第 2の適応コードブック遅延とか ら第 2の適応コードブック信号及び最適適応コードブックゲインを求め、 前記第 1の目標信号、 前記最適適応コ一ドブックゲイン及ぴ前記第 2の適応コードブッ ク信号を出力する目標信号計算回路と、
をさらに備え、
前記固定コードブック符号生成回路は、 第 1の方式と第 2の方式との間の符号 間の対応関係が利用できるパルスについては、 前記第 1の固定コードブック符号 を前記対応関係に基づいて読み替えることにより第 2の方式の固定コードブック 符号を得るとともに、 前記対応関係を利用できないパルスについては、 固定コー ドブック信号と前記ィンパルス応答信号との畳み込み演算によりフィルタ処理さ れた固定コードブック信号と、 前記第 2の適応コ一ドブック信号と前記ィンパル ス応答信号との畳み込みによりフィルタ処理された第 2の適応コードブック信号 に最適適応コードブックゲインを乗じて得られる信号を前記第 1の目標信号から 減算してなる第 2の目標信号との距離が最小となるパルス位置とパルス極性を選 択し、 前記第 1の固定コードプック符号の読み替えによるパルス位置及びパルス 極性と、 前記選択によるパルス位置及びパルス極性とから規定される固定コード プック信号を第 2の固定コードブック信号とし、 前記第 2の固定コードブック信 号に対応する第 2の方式で復号可能な符号を、 第 2の固定コードブック符号とし て、 出力することを特徴とする請求の範囲第 1 8項に記載の符号変換装置。
2 0 . 多重された符号を分離する符号分離回路と、
符号を多重化する符号多重回路と、 を備える符号変換装置であって、 第 1の方式で音声信号を符号化した符号を多重してなる符号列データを前記符 号分離回路により分離し、 分離された符号を、 前記第 1の方式とは別の第 2の方 式に準拠する符号に変換し、 該変換された符号を前記符号多重回路に供給し、 前 記符号多重回路において、 前記変換された符号を多重してなる符号列データを生 成する符号変換装置において、
線形予測係数生成回路と、
音声復号回路と、
インパルス応答計算回路と、
固定コードブック符号生成回路と、
を備え、
前記線形予測係数生成回路は、 前記符号分離回路で分離された線形予測係数符 号に基づき、 前記第 1の方式で復号してなる第 1の線形予測係数と、 前記第 2の 方式で復号してなる第 2の線形予測係数とを生成し、
前記音声復号回路は、 前記符号分離回路で分離された適応コ一ドブック符号を 含む励振信号情報を復号し、 前記第 1の線形予測係数をもつ合成フィルタを、 前 記励振信号情報から得られる励振信号で駆動することで復号音声信号を合成して 出力し、
前記ィンパルス応答計算回路は、 前記第 1及び第 2の線形予測係数を用いて聴 感重み付け合成フィルタを構成し、 前記聴感重み付け合成フィルタのィンパルス 応答信号を出力し、
前記固定コードブック符号生成回路は、 第 1の方式と第 2の方式との間の符号 間の対応関係が利用できるパルスについては、 前記第 1の固定コ一ドブック符号 を前記対応関係に基づいて読み替えることにより、 第 2の固定コードプック符号 を得るとともに、 前記対応関係を利用できない残りのパルスについては、 固定コ 一ドブック信号と前記ィンパルス応答信号との畳み込み演算によりフィルタ処理 された固定コードブック信号と、 適応コードブック信号と前記インパルス応答信 号との畳み込み演算によりフィルタ処理された適応コードブック信号に最適適応 コードブックゲインを乗じて得られる信号を前記第 1の目標信号から減算してな る第 2の目標信号との間の距離が最小となるパルス位置とパルス極性を選択し、 前記第 1の固定コードブック符号の読み替えによるパルス位置及ぴパルス極性 と、 前記選択によるパルス位置及びパルス極性とから規定される固定コードブッ ク信号を第 2の固定コードブック信号として、 第 2の固定コードブック信号に対 応する第 2の方式で復号可能な符号を第 2の固定コードブック符号としてそれぞ れ出力するものであることを特徴とする符号変換装置。
2 1 . 前記符号分離回路から入力した第 1の A C B符号を、 第 1の方式にお ける符号と第 2の方式における符号との対応関係を用いて読み替えることにより 第 2の A C B符号を生成し、 前記第 2の A C B符号に対応する A C B遅延を第 2 の A C B遅延として出力する A C B符号変換回路をさらに備えることを特徴とす る請求の範囲第 2 0項に記載の符号変換装置。
2 2 . 前記復号音声信号と前記第 1及び前記第 2の線形予測係数から第 1の 目標信号を計算し、 第 2の励振信号と前記ィンパルス応答信号と前記第 1の目標 信号と前記第 2の A C B遅延とから第 2の A C B信号及び最適 A C Bゲインを求 める目標信号計算回路と、
前記第 1の目標信号と再構成音声との重み付け自乗誤差を最小にする A C Bゲ インと F C Bゲインとを選択し、 選択された前記 A C Bゲイン及ぴ前記 F C Bゲ インに対応する、 第 2の方式により復号可能な符号を、 第 2のゲイン符号として 生成し、 選択された前記 A C Bゲイン及ぴ前記 F C Bゲインを各々第 2の A C B ゲイン及び第 2の F C Bゲインとして生成するゲイン符号生成回路と、
前記第 2の A C B信号に前記第 2の A C Bゲインを乗じて得た信号と、 第 2の F C B信号に前記第 2の F C Bゲインを乗じて得た信号とを加算して、 第 2の励 振信号を生成する第 2の励振信号計算回路と、
前記第 2の励振信号を記憶保持し、 既に記憶保持されている第 2の励振信号を 出力する第 2の励振信号記憶回路と、
を備えることを特徴とする請求の範囲第 2 1項に記載の符号変換装置。
PCT/JP2003/006378 2002-05-22 2003-05-22 Method and device for code conversion between audio encoding/decoding methods and storage medium thereof WO2003098603A1 (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1020047018743A KR100672878B1 (ko) 2002-05-22 2003-05-22 음성 부호화 복호 방식간의 부호 변환 방법 및 장치와 그기억 매체
EP03730566A EP1507257A4 (en) 2002-05-22 2003-05-22 METHOD AND DEVICE FOR CONVERTING CODE BETWEEN AUDIO CODING AND DECODING METHODS AND RECORDING MEDIUM
US10/515,168 US8117028B2 (en) 2002-05-22 2003-05-22 Method and device for code conversion between audio encoding/decoding methods and storage medium thereof

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2002-147485 2002-05-22
JP2002147485A JP4304360B2 (ja) 2002-05-22 2002-05-22 音声符号化復号方式間の符号変換方法および装置とその記憶媒体

Publications (1)

Publication Number Publication Date
WO2003098603A1 true WO2003098603A1 (en) 2003-11-27

Family

ID=29545183

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2003/006378 WO2003098603A1 (en) 2002-05-22 2003-05-22 Method and device for code conversion between audio encoding/decoding methods and storage medium thereof

Country Status (6)

Country Link
US (1) US8117028B2 (ja)
EP (1) EP1507257A4 (ja)
JP (1) JP4304360B2 (ja)
KR (1) KR100672878B1 (ja)
CN (1) CN100369110C (ja)
WO (1) WO2003098603A1 (ja)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4016709B2 (ja) * 2002-04-26 2007-12-05 日本電気株式会社 オーディオデータの符号変換伝送方法と符号変換受信方法及び装置とシステムならびにプログラム
JP2004151123A (ja) * 2002-10-23 2004-05-27 Nec Corp 符号変換方法、符号変換装置、プログラム及びその記憶媒体
KR100668300B1 (ko) * 2003-07-09 2007-01-12 삼성전자주식회사 비트율 확장 음성 부호화 및 복호화 장치와 그 방법
FR2867648A1 (fr) 2003-12-10 2005-09-16 France Telecom Transcodage entre indices de dictionnaires multi-impulsionnels utilises en codage en compression de signaux numeriques
US8200496B2 (en) * 2008-12-29 2012-06-12 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US9817728B2 (en) 2013-02-01 2017-11-14 Symbolic Io Corporation Fast system state cloning
US9304703B1 (en) 2015-04-15 2016-04-05 Symbolic Io Corporation Method and apparatus for dense hyper IO digital retention
US10133636B2 (en) 2013-03-12 2018-11-20 Formulus Black Corporation Data storage and retrieval mediation system and methods for using same
US9467294B2 (en) 2013-02-01 2016-10-11 Symbolic Io Corporation Methods and systems for storing and retrieving data
US9628108B2 (en) 2013-02-01 2017-04-18 Symbolic Io Corporation Method and apparatus for dense hyper IO digital retention
US10061514B2 (en) 2015-04-15 2018-08-28 Formulus Black Corporation Method and apparatus for dense hyper IO digital retention
US10572186B2 (en) 2017-12-18 2020-02-25 Formulus Black Corporation Random access memory (RAM)-based computer systems, devices, and methods
WO2020142431A1 (en) 2019-01-02 2020-07-09 Formulus Black Corporation Systems and methods for memory failure prevention, management, and mitigation
JP7092047B2 (ja) * 2019-01-17 2022-06-28 日本電信電話株式会社 符号化復号方法、復号方法、これらの装置及びプログラム
WO2022179406A1 (zh) * 2021-02-26 2022-09-01 腾讯科技(深圳)有限公司 音频转码方法、装置、音频转码器、设备以及存储介质
CN115050377A (zh) * 2021-02-26 2022-09-13 腾讯科技(深圳)有限公司 音频转码方法、装置、音频转码器、设备以及存储介质
CN117558283B (zh) * 2024-01-12 2024-03-22 杭州国芯科技股份有限公司 一种多路多标准的音频解码系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08146997A (ja) * 1994-11-21 1996-06-07 Hitachi Ltd 符号変換装置および符号変換システム
JPH10282997A (ja) * 1997-04-04 1998-10-23 Nec Corp 音声符号化装置及び復号装置

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2658794B2 (ja) 1993-01-22 1997-09-30 日本電気株式会社 音声符号化方式
US5598504A (en) * 1993-03-15 1997-01-28 Nec Corporation Speech coding system to reduce distortion through signal overlap
JP3483958B2 (ja) 1994-10-28 2004-01-06 三菱電機株式会社 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法
US5822724A (en) * 1995-06-14 1998-10-13 Nahumi; Dror Optimized pulse location in codebook searching techniques for speech processing
JP3970327B2 (ja) * 1996-02-15 2007-09-05 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴイ 複雑さが軽減された信号送信システム
JP3157116B2 (ja) 1996-03-29 2001-04-16 三菱電機株式会社 音声符号化伝送システム
US5960386A (en) * 1996-05-17 1999-09-28 Janiszewski; Thomas John Method for adaptively controlling the pitch gain of a vocoder's adaptive codebook
DE69715478T2 (de) * 1996-11-07 2003-01-09 Matsushita Electric Ind Co Ltd Verfahren und Vorrichtung zur CELP Sprachkodierung und -dekodierung
US6408268B1 (en) * 1997-03-12 2002-06-18 Mitsubishi Denki Kabushiki Kaisha Voice encoder, voice decoder, voice encoder/decoder, voice encoding method, voice decoding method and voice encoding/decoding method
US5995923A (en) * 1997-06-26 1999-11-30 Nortel Networks Corporation Method and apparatus for improving the voice quality of tandemed vocoders
US6029125A (en) * 1997-09-02 2000-02-22 Telefonaktiebolaget L M Ericsson, (Publ) Reducing sparseness in coded speech signals
US6330533B2 (en) * 1998-08-24 2001-12-11 Conexant Systems, Inc. Speech encoder adaptively applying pitch preprocessing with warping of target signal
US6260009B1 (en) * 1999-02-12 2001-07-10 Qualcomm Incorporated CELP-based to CELP-based vocoder packet translation
EP1052622B1 (en) * 1999-05-11 2007-07-11 Nippon Telegraph and Telephone Corporation Selection of a synthesis filter for CELP type wideband audio coding
JP3478209B2 (ja) 1999-11-01 2003-12-15 日本電気株式会社 音声信号復号方法及び装置と音声信号符号化復号方法及び装置と記録媒体
JP2002202799A (ja) * 2000-10-30 2002-07-19 Fujitsu Ltd 音声符号変換装置
US7606703B2 (en) * 2000-11-15 2009-10-20 Texas Instruments Incorporated Layered celp system and method with varying perceptual filter or short-term postfilter strengths
JP2002268697A (ja) * 2001-03-13 2002-09-20 Nec Corp パケット誤り耐性付き音声復号装置、音声符号化復号装置、及びその方法
US20030195745A1 (en) * 2001-04-02 2003-10-16 Zinser, Richard L. LPC-to-MELP transcoder
KR100464369B1 (ko) * 2001-05-23 2005-01-03 삼성전자주식회사 음성 부호화 시스템의 여기 코드북 탐색 방법
JP4518714B2 (ja) * 2001-08-31 2010-08-04 富士通株式会社 音声符号変換方法
US7050969B2 (en) * 2001-11-27 2006-05-23 Mitsubishi Electric Research Laboratories, Inc. Distributed speech recognition with codec parameters
US6829579B2 (en) * 2002-01-08 2004-12-07 Dilithium Networks, Inc. Transcoding method and system between CELP-based speech codes
US7231345B2 (en) * 2002-07-24 2007-06-12 Nec Corporation Method and apparatus for transcoding between different speech encoding/decoding systems
JP2004151123A (ja) * 2002-10-23 2004-05-27 Nec Corp 符号変換方法、符号変換装置、プログラム及びその記憶媒体
US7249014B2 (en) * 2003-03-13 2007-07-24 Intel Corporation Apparatus, methods and articles incorporating a fast algebraic codebook search technique

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08146997A (ja) * 1994-11-21 1996-06-07 Hitachi Ltd 符号変換装置および符号変換システム
JPH10282997A (ja) * 1997-04-04 1998-10-23 Nec Corp 音声符号化装置及び復号装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP1507257A4 *

Also Published As

Publication number Publication date
KR100672878B1 (ko) 2007-01-24
CN100369110C (zh) 2008-02-13
CN1669071A (zh) 2005-09-14
US20050219073A1 (en) 2005-10-06
JP2003337600A (ja) 2003-11-28
KR20040104750A (ko) 2004-12-10
EP1507257A1 (en) 2005-02-16
US8117028B2 (en) 2012-02-14
EP1507257A4 (en) 2007-06-06
JP4304360B2 (ja) 2009-07-29

Similar Documents

Publication Publication Date Title
WO2003098603A1 (en) Method and device for code conversion between audio encoding/decoding methods and storage medium thereof
JP3180762B2 (ja) 音声符号化装置及び音声復号化装置
JP2009134303A (ja) 音声復号化方法及び音声復号化装置
JPH1130997A (ja) 音声符号化復号装置
WO2001020595A1 (en) Voice encoder/decoder
JP4108317B2 (ja) 符号変換方法及び装置とプログラム並びに記憶媒体
JP3746067B2 (ja) 音声復号化方法及び音声復号化装置
JP3582589B2 (ja) 音声符号化装置及び音声復号化装置
JP3063668B2 (ja) 音声符号化装置及び復号装置
KR100796836B1 (ko) 코드 변환 방법, 장치 및 이 방법을 실행하는 컴퓨터용 프로그램이 기록된 기록 매체
JP4396524B2 (ja) 符号変換方法及び装置
WO2000000963A1 (fr) Codeur vocal
US7747431B2 (en) Code conversion method and device, program, and recording medium
JP5174651B2 (ja) 低演算量符号励振線形予測符号化
WO2004010416A1 (ja) 音声符号化復号方式間の符号変換方法及び装置とその記憶媒体
JP2004151123A (ja) 符号変換方法、符号変換装置、プログラム及びその記憶媒体
JP2008090311A (ja) 音声符号化方法
JP2000029499A (ja) 音声符号化装置ならびに音声符号化復号化装置
JP3563400B2 (ja) 音声復号化装置及び音声復号化方法
JP2005165342A (ja) 音声符号化方法及び音声符号化装置

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): CN KR US

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IT LU MC NL PT RO SE SI SK TR

DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 1020047018743

Country of ref document: KR

WWE Wipo information: entry into national phase

Ref document number: 10515168

Country of ref document: US

WWE Wipo information: entry into national phase

Ref document number: 2003730566

Country of ref document: EP

WWP Wipo information: published in national office

Ref document number: 1020047018743

Country of ref document: KR

WWE Wipo information: entry into national phase

Ref document number: 20038170795

Country of ref document: CN

WWP Wipo information: published in national office

Ref document number: 2003730566

Country of ref document: EP