WO2004010416A1 - 音声符号化復号方式間の符号変換方法及び装置とその記憶媒体 - Google Patents

音声符号化復号方式間の符号変換方法及び装置とその記憶媒体 Download PDF

Info

Publication number
WO2004010416A1
WO2004010416A1 PCT/JP2003/008701 JP0308701W WO2004010416A1 WO 2004010416 A1 WO2004010416 A1 WO 2004010416A1 JP 0308701 W JP0308701 W JP 0308701W WO 2004010416 A1 WO2004010416 A1 WO 2004010416A1
Authority
WO
WIPO (PCT)
Prior art keywords
gain
code
fcb
circuit
acb
Prior art date
Application number
PCT/JP2003/008701
Other languages
English (en)
French (fr)
Inventor
Atsushi Murashima
Original Assignee
Nec Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nec Corporation filed Critical Nec Corporation
Priority to DE60327217T priority Critical patent/DE60327217D1/de
Priority to EP03765278A priority patent/EP1536413B1/en
Publication of WO2004010416A1 publication Critical patent/WO2004010416A1/ja
Priority to US11/039,969 priority patent/US7231345B2/en
Priority to US11/171,387 priority patent/US7319953B2/en

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders

Definitions

  • the present invention relates to a method and an apparatus for transcoding between speech coding and decoding systems and a storage medium therefor.
  • the present invention relates to an encoding and decoding method for transmitting or storing an audio signal at a low bit rate, and in particular, when performing audio communication using different encoding and decoding methods, obtains an audio signal by encoding it using a certain method.
  • the present invention relates to a code conversion method and apparatus for converting a decoded code into a code that can be decoded by another method with high sound quality and a low operation amount, and a recording medium thereof.
  • CELP Code Excited Linear Prediction
  • a synthesized speech signal can be obtained by driving with an excitation signal expressed as the sum of a fixed codebook (Fixed Codebook: “FCB”).
  • ACB gain and FCB gain
  • CELP Code excited linear prediction: High Quality speech at very low bit rates
  • tandem connection in tandem connection, a code sequence obtained by encoding speech using one of the standard methods is used.
  • the audio signal is once decoded by using the standard method, and the decoded audio signal is encoded again by using the other standard method. For this reason, there is a problem that the sound quality is generally lowered, the delay is increased, and the calculation amount is increased as compared with the case where encoding and decoding are performed only once in each audio coding / decoding method.
  • a code obtained by encoding speech using one standard method is converted into a code decodable by the other standard method in a code domain or a coded parameter overnight domain. It is effective for the above problem.
  • a method of converting codes see Hong-Goo Kang et al., "I Immediately Roving Transcoding Capability of Speech Coders in Clean and Frame Erasured Channel Enviro confidential nts" (Pro of IEEE Works op on Speech Coding 2000, pp.78- 80, 2000) (referred to as “Reference 2”).
  • FIG. 12 shows a code obtained by coding speech using the first speech coding method (referred to as "method A") into a code that can be decoded using the second method (referred to as “method B”).
  • FIG. 3 is a diagram illustrating an example of a configuration of a transcoding device.
  • the code conversion device includes an input terminal 10, a code separation circuit 1010, an LP coefficient code conversion circuit 100, an AC B code conversion circuit 200, an FCB code conversion circuit 300, and a gain conversion circuit.
  • a code conversion circuit 400, a code multiplexing circuit 1020, and an output terminal 20 are provided.
  • each component of the conventional transcoder will be described. From the input terminal 10, a first code string obtained by encoding a sound by the method A is input.
  • the code separation circuit 1010 outputs, from the first code string input from the input terminal 10, a code corresponding to the LP coefficient, ACB, FCB, ACB gain and FCB gain, that is, an LP coefficient code, an ACB code, an FCB code, Separate gain sign.
  • a code corresponding to the LP coefficient, ACB, FCB, ACB gain and FCB gain that is, an LP coefficient code, an ACB code, an FCB code, Separate gain sign.
  • the ACB gain and the FCB gain are collectively encoded and decoded, and for simplicity, this is referred to as a gain and the code thereof is referred to as a gain code.
  • the LP coefficient code, the ACB code, the FCB code, and the gain code are referred to as a first LP coefficient code, a first ACB code, a first FCB code, and a first gain code, respectively.
  • the first LP coefficient code is output to the LP coefficient code conversion circuit 100
  • the first ACB code is output to the ACB code conversion circuit 200
  • the first FCB code is output to the FCB code conversion circuit 300.
  • the first gain code is output to the gain code conversion circuit 400.
  • LP coefficient code conversion circuit 100 receives the first LP coefficient code output from code separation circuit 1010, and converts the first LP coefficient code into a code that can be decoded by method B.
  • the converted LP coefficient code is output to code multiplexing circuit 1020 as a second LP coefficient code.
  • ACB code conversion circuit 200 receives the first ACB code output from code separation circuit 1010, and converts the first ACB code into a code that can be decoded by method B.
  • the converted ACB code is output to code multiplexing circuit 1020 as a second ACB code.
  • the FCB code conversion circuit 300 receives the first FCB code output from the code separation circuit 1010, and converts the first FCB code into a code that can be decoded by the method B.
  • the converted FCB code is output to the code multiplexing circuit 1020 as a second FCB code.
  • Gain code conversion circuit 400 receives the first gain code output from code separation circuit 1010, and converts the first gain code into a code that can be decoded by method B. The converted gain code is output to code multiplexing circuit 1020 as a second gain code.
  • the LP coefficient code conversion circuit 100 decodes the first LP coefficient code input from the code separation circuit 1010 by the LP coefficient decoding method in the system A to obtain a first LP coefficient. Next, the LP coefficient code conversion circuit 100 quantizes and encodes the first LP coefficient according to the quantization method and the encoding method of the LP coefficient in the system B to obtain a second LP coefficient code. Then, LP coefficient code conversion circuit 100 outputs the second LP coefficient code to code multiplexing circuit 1020 as a code that can be decoded by the LP coefficient decoding method in scheme B.
  • the ACB code conversion circuit 200 reads the first AC B code input from the code separation circuit 1010 using the correspondence between the code in the method A and the code in the method B, thereby converting the second ACB code. obtain. Then, the ACB code conversion circuit 200 converts the second ACB code into a code that can be decoded by the ACB decoding method in the scheme B. Is output to the code multiplexing circuit 102.
  • the FCB code conversion circuit 300 reads the first FCB code input from the code separation circuit 10010 using the correspondence between the code in the method A and the code in the method B, thereby obtaining the second FCB code. Get FCB code. Then, the FCB code conversion circuit 300 outputs the second FCB code to the code multiplexing circuit 102 as a code that can be decoded by the FCB decoding method in the system B.
  • the gain code conversion circuit 400 decodes the first gain code input from the code separation circuit 1010 by the gain decoding method in the scheme A to obtain a first gain. Next, the gain code conversion circuit 400 quantizes and encodes the first gain by the quantization method and the encoding method of the gain in the method B, and obtains the second gain and its sign (the second gain). Sign). Then, gain code conversion circuit 400 outputs the second gain code to code multiplexing circuit 10020 as a code that can be decoded by the gain decoding method in scheme B.
  • the code multiplexing circuit 1 0 2 0 includes a second LP coefficient code output from the LP coefficient code conversion circuit 1 0 0, a second ACB code output from the ACB code conversion circuit 2 0 0, and FCB code conversion
  • the second FCB code output from the circuit 300 and the second gain code output from the gain code conversion circuit 400 are input, and a code string obtained by multiplexing them is converted into a second code. Output as a column via output terminal 20. This concludes the description of FIG.
  • the conventional transcoder described with reference to FIG. 12 has a problem that the sound quality of the background noise in the non-speech section deteriorates.
  • the present invention has been made in view of the above problems, and has as its main object to provide an apparatus and a method capable of reducing deterioration of background noise sound quality in a non-voice section, and a recording medium storing the program. Is to provide. Other objects, features, advantages, and the like of the present invention will be immediately apparent to those skilled in the art from the following description. Will. Disclosure of the invention
  • a method is a code conversion that converts a first code string conforming to the first scheme into a second code string conforming to the second scheme.
  • information of a first linear prediction coefficient and an excitation signal is obtained from the first code string, and a filter having the first linear prediction coefficient is driven by an excitation signal obtained from the information of the excitation signal.
  • the optimum gain is preferably a gain that minimizes a distance between a second audio signal generated by information obtained from a second code string and the first audio signal. Is required.
  • a method is a code conversion method for converting a first code string conforming to a first method into a second code string conforming to a second method, the method comprising: A step of decoding gain information from a code string; a step of correcting a decoded gain (decoding gain); a corrected decoding gain (corrected decoding gain); the decoding gain; and a gain code in a second method.
  • a first squared error is calculated from the corrected optimal gain and a gain read from the gain codebook, and the first squared error is calculated from the corrected optimal gain and the gain codebook.
  • the second square error is calculated from the gain obtained from the gain codebook, and the gain that minimizes the evaluation function based on the first square error and the second square error is selected from the gain codebook. Is obtained in the code string of.
  • the modified decoding gain is And calculating a first square error from the gain read from the gain codebook, calculating a second square error from the decoding gain and the gain read from the gain codebook, and calculating the first square error.
  • the gain information in the second code string is obtained by selecting a gain that minimizes the evaluation function based on the square error and the second square error from the gain codebook.
  • the corrected optimal gain is based on a long-term average of the optimal gain.
  • the modified decoding gain is based on a long-term average of the decoding gain.
  • An apparatus is a code conversion apparatus for converting a first code string conforming to a first method into a second code string conforming to a second method, wherein the first Obtaining a first linear prediction coefficient and information of an excitation signal from a code sequence, and driving a filter having the first linear prediction coefficient with an excitation signal obtained from the information of the excitation signal to obtain a first audio signal.
  • An audio decoding circuit that generates an optimal gain based on the first audio signal and a second audio signal that is generated based on information obtained from a second code sequence.
  • a column Gain encoding circuit for obtaining a kick gain information including.
  • the optimum gain calculation circuit preferably has a distance between a second audio signal generated based on information obtained from a second code string and the first audio signal. Is obtained as the optimum gain.
  • An apparatus is a code conversion apparatus that converts a first code string conforming to a first method into a second code string conforming to a second method.
  • a gain decoding circuit for decoding gain information from the first code string; a decoding gain correction circuit for correcting a decoded gain (decoding gain); a corrected decoding gain (corrected decoding gain); And a gain coding circuit for obtaining gain information in the second code sequence based on the gain read from the gain codebook in the second method.
  • the gain encoding circuit preferably calculates a first squared error from the corrected optimal gain and a gain read from the gain codebook, and further comprising: A second square error is calculated from the gain read from the gain codebook, and a gain that minimizes the evaluation function based on the first square error and the second square error is selected from the gain codebook. To obtain gain information in the second code sequence.
  • the gain encoding circuit preferably calculates a first squared error from the corrected decoding gain and a gain read from the gain codebook, and further comprising: A second square error is calculated from the gain read from the gain codebook, and a gain that minimizes the evaluation function based on the first square error and the second square error is selected from the gain codebook. To obtain gain information in the second code sequence.
  • the corrected optimum gain is based on a long-term average of the optimum gain.
  • the correction decoding gain is based on a long-term average of the decoding gain.
  • a program according to a fifth aspect of the present invention constitutes a code conversion device that converts a first code string conforming to the first method into a second code string conforming to the second method.
  • a program according to a sixth aspect of the present invention constitutes a code conversion device that converts a first code string compliant with the first method into a second code string compliant with the second method.
  • the program according to the fifth aspect of the present invention which provides a program for execution, preferably, calculates a first squared error from the corrected optimal gain and a gain read from the gain codebook, A second square error is calculated from the optimum gain and the gain read from the gain codebook, and the gain that minimizes the evaluation function based on the first square error and the second square error is calculated as the gain.
  • the gain information in the second code sequence is obtained by selecting from the codebook.
  • a first square error is calculated from the corrected decoding gain and a gain read from the gain codebook, and the decoding gain and the gain codebook are calculated. Calculating the second square error from the gain read out from the first and second gain errors, and selecting a gain from the gain codebook that minimizes the evaluation function based on the first square error and the second square error. Find the gain information in the second code string.
  • the modified optimal gain is based on a long-term average of the optimal gain.
  • the modified decoding gain is based on a long-term average of the decoding gain.
  • the invention according to a seventh aspect of the present invention provides a recording medium storing the program according to the fifth and sixth aspects.
  • FIG. 1 is a diagram showing a configuration of a first embodiment of a code conversion apparatus according to the present invention.
  • FIG. 2 is a diagram showing a configuration of an LP coefficient code conversion circuit in the code conversion device according to the present invention.
  • FIG. 3 is a diagram for explaining a correspondence relationship between an ACB code and an ACB delay and a method of reading the ACB code.
  • FIG. 4 is a diagram showing a configuration of a speech decoding circuit of the transcoder according to the present invention.
  • FIG. 5 is a diagram showing a configuration of a target signal calculation circuit in the transcoder according to the present invention.
  • FIG. 6 is a diagram showing a configuration of an FCB code generation circuit in the code conversion device according to the present invention.
  • FIG. 7 is a diagram for explaining a correspondence relationship between a pulse position code and a pulse position, and a method of reading an ACB code.
  • FIG. 8 is a diagram showing a configuration of a gain code generation circuit in the code conversion device according to the present invention.
  • FIG. 9 is a diagram showing a configuration of a second embodiment of the transcoder according to the present invention.
  • FIG. 10 is a diagram showing a configuration of a gain code generation circuit in the code conversion device according to the present invention.
  • FIG. 11 is a diagram showing a configuration of the third to fourth embodiments of the code conversion apparatus according to the present invention.
  • FIG. 12 is a diagram showing a configuration of a conventional transcoder. BEST MODE FOR CARRYING OUT THE INVENTION
  • the speech decoding circuit (1500) obtains information on the first linear prediction coefficient and the excitation signal from the first code sequence conforming to the first method
  • the excitation signal obtained from the information of the excitation signal is a filter having the first linear prediction coefficient.
  • a gain code generation circuit (1400) generates a first audio signal by driving with a second code sequence generated by information obtained from a second code sequence conforming to the second method. Calculating a gain (optimum gain) that minimizes a distance between the audio signal and the first audio signal; correcting the optimal gain; and modifying the optimal gain (corrected optimal gain); And gain information in the second code string based on the gain read from the gain codebook in the second method.
  • the method according to the present invention has the following steps.
  • Step a Obtain a first linear prediction coefficient from the first code sequence.
  • Step b Obtain information of the excitation signal from the first code string.
  • Step c Obtain the excitation signal from the information of the excitation signal.
  • Step d A first audio signal is generated by driving a filter having a first linear prediction coefficient by the excitation signal.
  • Step e Calculate the gain (optimum gain) that minimizes the distance between the second audio signal generated from the information obtained from the second code sequence and the first audio signal.
  • Step f Modify the optimum gain.
  • Step g Based on the corrected optimum gain (corrected optimum gain), the optimum gain, and the gain read from the gain codebook in the second method, gain information in the second code string is obtained.
  • the second gain is obtained by using an evaluation function that reduces the time variation of the second gain (gain in the second code string) in the non-voice section.
  • the obtained second gain has a small temporal variation
  • the temporal noise energy in the same section has a small temporal variation
  • FIG. 1 is a diagram showing a configuration of a first embodiment of a code conversion apparatus according to the present invention.
  • the same or equivalent elements as those in FIG. 12 are denoted by the same reference numerals. ing.
  • input terminal 10 code separation circuit 1010, LP coefficient code conversion circuit 1 100, LSPL PC conversion circuit 1 110, impulse response calculation circuit 1 120, ACB Code conversion circuit 1 200 and target signal calculation circuit 1
  • a circuit 1020 and an output terminal 20 are provided.
  • the input terminal 10, the output terminal 20, the code separation circuit 1010, and the code multiplexing circuit 1020 are basically the same as those shown in FIG. 12 except that a part of the connection is branched. In the following, description of the same or equivalent elements described above will be omitted, and differences from the configuration shown in FIG. 12 will be mainly described.
  • the frame length, number of subframes, and subframe length of method B are the same.
  • sampling frequency is 8000 Hz
  • the LP coefficient code conversion circuit 1100 receives the first LP coefficient code from the code separation circuit 1010.
  • the LP coefficient is represented by a line spectrum pair (LSP), and the LS Since P is often encoded and decoded, it is assumed that encoding and decoding of LP coefficients are performed in the LSP area.
  • LSP line spectrum pair
  • the LP coefficient code conversion circuit 1100 decodes the first LP coefficient code by the LSP decoding method in the system A to obtain a first LSP.
  • the LP coefficient code conversion circuit 1100 quantizes and codes the first LSP according to the LSP quantization method and the coding method in the method B, and obtains a second LSP and a code corresponding thereto. (The second LP coefficient sign). Then, the LP coefficient code conversion circuit 1100 outputs the second LP coefficient code to the code multiplexing circuit 1020 as a code decodable by the LSP decoding method in the system B, and outputs the second LSP code and the first LSP 2 LSP is output to LSP-LPC conversion circuit 1 1 10
  • FIG. 2 is a diagram showing a configuration of the LP coefficient code conversion circuit 1100.
  • the LP coefficient code conversion circuit 1100 includes an LSP decoding circuit 110 and a first
  • An LSP codebook 111, an LSP coefficient encoding circuit 130, and a second LSP codebook 1331 are provided. With reference to FIG. 2, each component of the LP coefficient code conversion circuit 1100 will be described.
  • the LSP decoding circuit 110 decodes the corresponding LSP from the LP coefficient code.
  • the LSP decoding circuit 110 includes a first LSP codebook 111 in which a plurality of sets of LSPs are stored, and converts the first LP coefficient code output from the code separation circuit 101 0 into: Input via the input terminal 31, read the LSP corresponding to the first LP coefficient code from the first LSP codebook 111, and use the read LSP as the first LSP to the LSP encoding circuit 130.
  • the signal is output to the LSP-LPC conversion circuit 110 via the output terminal 33.
  • the LSP decoding from the LP coefficient code uses the LSP code book of the system A according to the LSP decoding method in the system A.
  • the LSP encoding circuit 130 receives the first LSP output from the decoding circuit 110, and outputs a second LSP codebook 131 to a second LSP codebook in which a plurality of sets of LSPs are stored. And the corresponding LP coefficient code are sequentially read, a second LSP that minimizes an error from the first LSP is selected, and the corresponding LP coefficient code is output as a second LP coefficient code as an output terminal. Output to the code multiplexing circuit 1020 via 32, and output the second LSP via the output terminal 34 for 3? ⁇ Output to the conversion circuit 1 1 10.
  • the second LSP selection method that is, the LSP quantization and encoding method uses the LSP codebook of scheme B according to the LSP quantization method and encoding method of scheme B.
  • the description in Section 5.2.5 of “Reference 3” is referred to.
  • the LSP-LPC conversion circuit 1 1 10 inputs the first LSP and the second LSP output from the LP coefficient code conversion circuit 1 1 00, and converts the first LSP into the first LP coefficient a, , i, the second LSP to the second LP coefficient a 2 ,, and the first LP coefficient ai , i to the target signal calculation circuit 1700, the audio decoding circuit 1500, Output to the pulse response calculation circuit 1 1 20 and calculate the second LP coefficient a 2. , Output to the circuit 1 700 and the impulse response calculation circuit 1 120.
  • the conversion from LSP to LP coefficient refer to the description in Section 5.2.4 of [Reference 3].
  • the AC B code conversion circuit 1200 reads the first A CB code input from the code separation circuit 1010 using the correspondence between the code in the method A and the code in the method B, thereby obtaining the second AC B code. Get the sign. Then, ACB code conversion circuit 1200 outputs second ACB code to code multiplexing circuit 1020 as a code that can be decoded by the ACB decoding method in scheme B. Further, ACB code conversion circuit 1200 outputs the ACB delay corresponding to the second ACB code to target signal calculation circuit 1 00 as a second ACB delay.
  • the speech decoding circuit 1500 inputs the first ACB code, the first FCB code, and the first gain code output from the code separation circuit 1010, and ⁇ ? The first LP coefficient is input from the conversion circuit 1 1 10. Next, the audio decoding circuit 1500 performs the ACB signal decoding method, the FCB signal decoding method, and the gain decoding method in the method A.
  • the audio decoding circuit 1500 generates an ACB signal using the first ACB delay, and uses this as the first ACB signal. Then, the audio decoding circuit 1500 generates audio from the first ACB signal, the first FCB signal, the first gain, and the first LP coefficient, and outputs the audio to the target signal calculation circuit 1700.
  • FIG. 4 is a diagram showing a configuration of the audio decoding circuit 1500.
  • an audio decoding circuit 1500 includes an excitation signal information decoding circuit 1600 having an AC B decoding circuit 1510, an 08 decoding circuit 1520, and a gain decoding circuit 1530, an excitation signal calculation circuit 1540, An excitation signal storage circuit 1570 and a synthesis filter 1580 are provided. Referring to FIG. 4, each component of speech decoding circuit 1500 will be described.
  • the excitation signal information decoding circuit 1600 decodes the information of the excitation signal from the code corresponding to the information of the excitation signal.
  • the first ACB code, the first FCB code, and the first gain code output from the code separation circuit 1010 are input via input terminals 51, 52, and 53, respectively, and the first ACB code, the first ACB code, The ACB delay, the FCB signal, and the gain are decoded from the FCB code and the first gain code, respectively, and are used as the first ACB delay, the first FCB signal, and the first gain, respectively.
  • the first gain is made up of an ACB gain and an FCB gain, which are respectively referred to as a first ACB gain and a first FCB gain.
  • the excitation signal information decoding circuit 1600 receives the past excitation signal output from the excitation signal storage circuit 1570.
  • the excitation signal information decoding circuit 1600 generates an ACB signal using the past excitation signal and the first ACB delay, and sets this as the first ACB signal. Then, the excitation signal information decoding circuit 1600 outputs the first ACB signal, the first FCB signal, the first ACB gain, and the first FCB gain to the excitation signal calculation circuit 1540.
  • the ACB decoding circuit 1510 inputs the first ACB code output from the code separation circuit 1010 via the input terminal 51, and inputs the past excitation signal output from the excitation signal storage circuit 1570.
  • the ACB decoding circuit 1510 supports the first ACB code using the correspondence between the ACB code and the ACB delay in the method A shown in FIG. 3 in the same manner as the ACB code conversion circuit 1200 described above.
  • the first AC B signal is output to the excitation signal calculation circuit 1540.
  • the method of generating the first AC B signal refer to the descriptions in Sections 6.1 and 5.6 of “Reference 3”.
  • the FCB decoding circuit 1520 receives the first FCB code output from the code separation circuit 1010 via the input terminal 52, and converts the first FCB signal corresponding to the first FCB code into an excitation signal calculation circuit. Output to 1540.
  • FCB signal is pulse position
  • the first FCB code is composed of a code corresponding to the pulse position (pulse position code) and a code corresponding to the pulse polarity (pulse polarity code).
  • pulse position code a code corresponding to the pulse position
  • pulse polarity code a code corresponding to the pulse polarity
  • the gain decoding circuit 1530 inputs the first gain code output from the code separation circuit 1010 via the input terminal 53.
  • the gain decoding circuit 1530 has a built-in table in which a plurality of gains are stored, and reads the gain corresponding to the first gain code from the table. Then, the gain decoding circuit 1530 outputs the first ACB gain corresponding to the ACB gain and the first FCB gain corresponding to the FCB gain among the read gains to the excitation signal calculation circuit 1540 .
  • the table contains a two-dimensional vector composed of the first ACB gain and the first FCB gain. Multiple are stored.
  • two tables are built in, and one of the tables stores a plurality of the first ACB gains. The other table stores multiple first FCB gains.
  • the excitation signal calculation circuit 1540 receives the first AC B signal output from the AC B decoding circuit 1510, and The first FCB signal output from the decoding circuit 1520 is input, and the first ACB gain and the first FCB gain output from the gain decoding circuit 1530 are input.
  • the excitation signal calculation circuit 1540 adds a signal obtained by multiplying the first ACB signal by the first ACB gain and a signal obtained by multiplying the first FCB signal by the first FCB gain. To obtain the first excitation signal. Then, the excitation signal calculation circuit 1540 outputs the first excitation signal to the synthesis filter 1580 and the excitation signal storage circuit 1570.
  • the excitation signal storage circuit 1570 receives the first excitation signal output from the excitation signal calculation circuit 1540, and stores the first excitation signal. Then, the excitation signal storage circuit 1570 outputs the past first excitation signal that has been input and stored in the past to the ACB decoding circuit 1510.
  • the synthesis filter 1580 inputs the first excitation signal output from the excitation signal calculation circuit 1540, and inputs the first LP coefficient output from the LSP-LPC conversion circuit 1110 via the input terminal 61. I do. Then, the synthesis filter 1580 generates an audio signal by driving the linear prediction filter having the first LP coefficient with the first excitation signal. The audio signal is output to the target signal calculation circuit 1700 via the output terminal 63.
  • the target signal calculation circuit 1700 receives the first LSP and the second LSP from the LSP-to-LPC conversion circuit 110, and outputs the second ACB delay corresponding to the second ACB code from the ACB code conversion circuit 1200. Input, input the decoded audio from the audio decoding circuit 1500, input the impulse response signal from the impulse response calculation circuit 1 120, and input the past second excitation signal stored and held in the second excitation signal storage circuit 1620. I do.
  • the target signal calculation circuit 1700 calculates a first target signal from the decoded speech, the first LP coefficient, and the second LP coefficient.
  • the target signal calculation circuit 1700 obtains a second ACB signal and an optimum ACB gain from the past second excitation signal, impulse response signal, first target signal, and second ACB delay. . Then, the target signal calculation circuit 1700 outputs the first target signal and the optimum AC B gain to the gain code generation circuit 1400, and outputs the second AC B signal to the gain code generation circuit 1400 and the second excitation signal. Output to the calculation circuit 1610.
  • FIG. 5 is a diagram showing a configuration of the target signal calculation circuit 1700.
  • the target signal calculation circuit 1700 includes a weighting signal calculation circuit 1710, an ACB signal generation circuit 1720, and an optimum AC B gain calculation circuit 1730. Each component of the target signal calculation circuit 1700 will be described with reference to FIG.
  • the weighting signal calculation circuit 1710 inputs the decoded voice s (n) output from the synthesis filter 15 80 of the voice decoding circuit 1500 via the input terminal 57, and outputs from the LSP-LPC conversion circuit 110.
  • the first LP coefficient a ,, i and the second LP coefficient a 2 , i are input via the input terminal 36 and the input terminal 35, respectively.
  • the weighting signal calculation circuit 1710 uses the first LP coefficient to generate an auditory weighting filter W (z). Constitute.
  • the weighting signal calculation circuit 1710 drives the perceptual weighting filter with the decoded voice to generate a perceptual weighted voice signal.
  • the weighting signal calculation circuit 1710 forms an auditory weighting synthesis filter W (z) / A2 (z) using the first LP coefficient and the second LP coefficient.
  • the weighting signal calculation circuit 1710 optimizes the first target signal x (n) obtained by subtracting the zero input response of the perceptual weighting synthesis filter from the perceptual weighting audio signal with the ACB signal generating circuit 1720.
  • the signal is output to the AC B gain calculation circuit 1730 and is output to the second target signal calculation circuit 1430 via the output terminal 78.
  • the ACB signal generation circuit 1720 receives the first target signal output from the weighting signal calculation circuit 1710, and receives the second ACB delay T ( B ) and ag output from the ACB code conversion circuit 1200 . Input via terminal 37, input impulse response signal h (n) output from impulse response calculation circuit 1 1 20 via input terminal 74, and output from second excitation signal storage circuit 1620 The second excitation signal u (n) is input via the input terminal 75.
  • the ACB signal generation circuit 1720 convolves the impulse response signal with the signal cut out from the past second excitation signal with a delay k to generate a past excitation signal with a delay k of "-0,... ⁇ , ⁇ 3 ⁇ 4) -1 is calculated.
  • the delay k is the second AC ⁇ delay.
  • a signal cut out from the past second excitation signal with a delay k is defined as a second ACB signal V (n).
  • the AC B signal generation circuit 1720 outputs the second ACB signal to the second target signal calculation circuit 1430 and the second excitation signal calculation circuit 16 10 via the output terminal 76, and performs the filter processing.
  • the obtained excitation signal yk (n) with a delay k is output to the optimum ACB gain calculation circuit 1730.
  • the optimal AC B gain calculation circuit 1730 is derived from the weighted signal calculation circuit 1 7 10
  • the optimal AC B gain calculation circuit 1730 calculates the optimal AC B gain gp from the first target signal x (n) and the past excitation signal yk (n) of the filtered delay k by using the following equation. Calculated by The optimum ACB gain gp is a gain that minimizes the distance between the first target signal x (n) and the past excitation signal yk (n) with the filtered k delay. -'
  • the optimum ACB gain calculation circuit 1730 outputs the optimum ACB gain gp to the ACB gain encoding circuit 1410 via the output terminal 77.
  • the impulse response calculation circuit 1120 receives the first LP coefficient and the second LP coefficient output from the conversion circuit 1110, and calculates the first LP coefficient and the second LP coefficient. To form an auditory weighting synthesis filter.
  • the impulse response calculation circuit 1120 outputs the impulse response signal of the perceptual weighting synthesis filter to the target signal calculation circuit 1700 and the gain code generation circuit 1400.
  • the transfer function of the perceptual weighting synthesis filter is expressed by the following equation.
  • P is a linear prediction order (for example, 10)
  • a1 and a2 are coefficients (for example, 0.94 and 0.6) for controlling weighting.
  • FCB code generation circuit 1800 receives the first FCB code output from code separation circuit 1010, and converts the first FCB code into a code that can be decoded by method B.
  • the FCB code generation circuit 1800 outputs the converted FCB code as a second FCB code to the code multiplexing circuit 1020, and outputs a second FCB signal corresponding to the second FCB code to the gain code generation circuit 1400.
  • the second excitation signal calculation circuit 16 10 is composed of a plurality of pulses, and is represented by a multi-pulse signal defined by a pulse position (pulse position) and a polarity (pulse polarity).
  • the FCB code consists of a code corresponding to the pulse position (pulse position code) and a code corresponding to the pulse polarity (pulse polarity code).
  • FIG. 6 is a diagram showing a configuration of the FCB code generation circuit 1800 in FIG.
  • the FCB code generation circuit 1800 includes an FCB code conversion circuit 1300 and an FCB signal generation circuit 1820. With reference to FIG. 6, each component of the FCB code generation circuit 1800 will be described.
  • the FCB code conversion circuit 1300 converts the first FCB code i ( A> p) input from the code separation circuit 1010 via the input terminal 85 into the correspondence between the code in the method A and the code in the method B. by Te replaced, obtaining a second FCB code i (B) P. Then, FCB code conversion circuit 1300, code multiplexing circuit via the output terminal 55 which as code decodable by FCB decoding method in method B Output to 102 0 and pulse position corresponding to the second FCB code
  • pulse position code 6 in method A may be associated with pulse position code 1 in method B.
  • the code should be read so that the polarity (positive or negative) corresponding to the code before reading and the polarity corresponding to the code after reading are equal.
  • the FCB signal generation circuit 1820 inputs the pulse position and the pulse polarity output from the FCB code conversion circuit 1300.
  • the FCB signal generation circuit 1820 uses the FCB signal defined from the pulse position and the pulse polarity as the second FCB signal c (n), and sends this to the optimal FCB gain calculation circuit 1440 and the second excitation signal calculation circuit 1610. Output via output terminal 86.
  • the gain code generation circuit 1400 receives the first target signal, the second ACB signal, and the optimum ACB gain output from the target signal calculation circuit 1700, and outputs the second FCB output from the FCB code generation circuit 1800.
  • a signal is input, an impulse response signal output from the impulse response calculation circuit 1120 is input, and a first LSP output from the LP coefficient code conversion circuit 1100 is input.
  • the gain code generation circuit 1400 first calculates a second target signal from the first target signal, the second ACB signal, the optimal ACB gain, and the impulse response signal, and calculates the second target signal and the second FCB Calculate the optimum FCB gain from the signal and the impulse response signal, calculate the corrected FCB gain from the optimum FCB gain, and determine the voice judgment value from the first LSP.
  • the gain code generation circuit 1400 calculates a first squared error from the ACB gain sequentially read from the ACB gain codebook and the optimal ACB gain, and calculates a second squared error from the ACB gain and the corrected ACB gain. Calculate the error.
  • the gain code generation circuit 1400 calculates the AC that minimizes the evaluation function calculated from the weight coefficient calculated from the speech determination value, the first square error, and the second square error. Select the B gain and the corresponding AC B gain code.
  • the gain code generation circuit 1400 calculates a third square error from the FCB gain sequentially read from the FCB gain codebook and the optimal FCB gain, and obtains a fourth square error from the FCB gain and the corrected FCB gain. Is calculated.
  • the gain code generation circuit 1400 calculates the FCB gain and the corresponding FCB gain code that minimize the evaluation function calculated from the weight coefficient calculated from the speech determination value, the third squared error, and the fourth squared error.
  • the gain code generation circuit 1400 converts the second gain code composed of the selected AC B gain code and FC B gain code to a code multiplexing circuit 1020 as a code that can be decoded by the gain decoding method in scheme B. Output via output terminal 56.
  • FIG. 8 is a diagram showing a configuration of the gain code generation circuit 1400.
  • gain code generation circuit 1400 includes ACB gain encoding circuit 1410, ACB gain codebook 1411, FCB gain encoding circuit 1420, FCB gain codebook 1421, A target signal calculation circuit 1430, an optimum FCB gain calculation circuit 1440, an optimum FCB gain correction circuit 1450, and a voice Z non-voice discrimination circuit 1460.
  • each component of gain code generating circuit 1400 will be described in detail.
  • the second target signal calculation circuit 1430 inputs the second ACB signal v (n) output from the ACB signal generation circuit 1720 via the input terminal 92, and outputs the first ACB signal v (n) output from the weighting signal calculation circuit 1710.
  • the input signal x (n) is input via the input terminal 93
  • the impulse response signal h (n) output from the impulse response calculation circuit 1 120 is input via the input terminal 94
  • the ACB gain encoding circuit 1410 Input the second AC B gain output from.
  • the second target signal calculation circuit 1430 outputs the second target signal x 2 (n) to the optimum FCB gain calculation circuit 1440.
  • the optimal FCB gain calculation circuit 1440 receives the second FCB signal c (n) output from the FCB signal generation circuit 1820 through the input terminal 91, and outputs the impulse output from the impulse response calculation circuit 1120.
  • the second FCB signal z (n), n 0,-, L ) - ⁇ filtered by convolution of the second target signal x2 (n) and the second FCB signal filtered From the signal z (n), calculate the optimal FCB gain gc by the following equation.
  • the optimal FCB gain gc is a gain that minimizes the distance between the second target signal x2 (n) and the filled second FCB signal z (n).
  • the optimal FCB gain calculation circuit 1440 outputs the optimal FCB gain to the optimal FCB gain correction circuit 1450 and the FCB gain encoding circuit 1420.
  • the voice / non-voice discriminating circuit 1460 inputs the first LSP output from the LSP decoding circuit 110 via the input terminal 98.
  • the amount of LSP fluctuation is calculated from the first LSP and its long-term average, and the voice judgment value is determined from the LSP fluctuation.
  • Np is the linear prediction order
  • 0 is, for example, 0.9.
  • the section where the variation dd (n) is large is the voice section, and the small section is the non-voice section.
  • the threshold value for the variation dQ (n) can be used to determine the voice judgment value.
  • Vs 0 dq (n) force less than VS
  • Cvs is a constant (for example, 2.2)
  • the voice judgment value is output to the optimum AC B gain correction circuit 1480, ACB gain coding circuit 1410, optimum FCB gain correction circuit 1450, and FCB gain coding circuit 1420.
  • the optimum AC B gain correction circuit 1480 inputs the optimum ACB gain output from the AC B signal generation circuit 1 720 via the input terminal 97, and inputs the voice judgment value output from the voice / non-voice discrimination circuit 1460. .
  • the voice judgment value Vs is 0 (non-voice section)
  • the long-term average of the optimum AC B gain is set as the corrected AC B gain.
  • the long-term average of the optimal AC B gain is calculated by the following equation.
  • the average, median, mode, etc. can be applied to the long-term average.
  • the optimum ACB gain correction circuit 1480 when the voice judgment value Vs is 1 (voice section), the optimum ACB gain itself is used as the corrected ACB gain.
  • the optimum A CB gain correction circuit 1480 outputs the corrected AC B gain to the AC B gain encoding circuit 1410.
  • the AC B gain coding circuit 1410 inputs the optimum AC B gain gp output from the AC B signal generation circuit 1720 via the input terminal 97, and inputs the corrected AC B gain output from the optimum AC B gain correction circuit 1480. Then, the voice judgment value output from the voice / non-voice discriminating circuit 1460 is input.
  • the AC B gain encoding circuit 1410 calculates the first square error from the AC B gain sequentially read from the AC B gain codebook 141 1 and the optimum AC B gain from the input terminal 97, and calculates the A CB gain and the corrected AC Calculate the second squared error from the B gain and calculate the evaluation function defined by the following equation from the weighting factor calculated from the voice judgment value, the first squared error, and the second squared error .
  • Corrected form (Rule 91) Is corrected AC B gain, S P is the ACB gain sequentially read from the ACB gain code book, is a weighting coefficient. For example, when the voice judgment value Vs is 1 (voice section), the weighting factor / is 1.0, and when Vs is 0 (non-voice section), it is 0.2.
  • the AC B gain encoding circuit 1410 selects the AC B gain that minimizes the evaluation function, and outputs the selected AC B gain as the second AC B gain to the second target signal calculation circuit 1430 At the same time, the signal is output to the second excitation signal calculation circuit 1610 via the output terminal 95, and the code corresponding to the second ACB gain is output to the gain code multiplexing circuit 1470 as the ACB gain code.
  • the optimum FCB gain correction circuit 1450 inputs the optimum FCB gain output from the optimum FCB gain calculation circuit 1440, and inputs the voice determination value Vs output from the voice / ⁇ voice identification circuit 1460.
  • the long-term average of the optimum FCB gain is set as the corrected FCB gain.
  • the long term average of the optimal FCB gain is calculated by the following formula.
  • g c ⁇ n is a long-term average of the optimal FCB gain in the n-th subframe, and ⁇ is, for example, 0.9.
  • the average, median, mode, etc. can be applied to the long-term average.
  • Optimal FCB gain correction circuit 1450 outputs the corrected FCB gain to FCB gain encoding circuit 1420.
  • the FCB gain coding circuit 1420 inputs the optimum FCB gain output from the optimum FCB gain calculation circuit 1440, inputs the corrected FCB gain output from the optimum FCB gain correction circuit 1450, and outputs the voice / non-voice discrimination circuit 1460. Enter the output voice judgment value.
  • the FCB gain encoding circuit 1420 calculates a first square error from the FCB gain sequentially read from the FCB gain codebook 1421 and the optimal FCB gain, and calculates a second square error from the FCB gain and the corrected FCB gain. Is calculated, and an evaluation function defined by the following equation is calculated from the weight coefficient calculated from the voice determination value, the first square error, and the second square error.
  • Is the corrected FCB gain is the FCB gain sequentially read from the FCB gain codebook, and is the weight coefficient. For example, when the voice determination value Vs is 1 (voice section), the weighting factor ⁇ is 1.0, and when the voice determination value Vs is 0 (non-voice section), it is 0.2.
  • the FCB gain encoding circuit 1420 selects the FCB gain with the smallest evaluation function, and sets the selected FCB gain as the second FCB gain to the second excitation signal calculation circuit 1610 via the output terminal 96. And outputs the code corresponding to the second FCB gain to the gain code multiplexing circuit 1470 as the FCB gain code.
  • the gain code multiplexing circuit 1470 inputs the AC B gain code output from the AC B gain coding circuit 1410, inputs the FCB gain code output from the FCB gain coding circuit 1420, and outputs the ACB gain code and FCB gain code. Are output to the code multiplexing circuit 102 through the output terminal 56 as a code decodable by the gain decoding method in the scheme B.
  • the second excitation signal calculation circuit 1610 receives the second ACB signal output from the target signal calculation circuit 1700, inputs the second FCB signal output from the FCB code generation circuit 1800, and generates a gain code.
  • the second AC B gain and the second FCB gain output from the circuit 1400 are input.
  • the second excitation signal calculation circuit 1610 calculates a signal obtained by multiplying the second ACB signal by the second ACB gain and a signal obtained by multiplying the second FCB signal by the second FCB gain. And are added to obtain a second excitation signal.
  • the second excitation signal is output to the second excitation signal storage circuit 1620.
  • the second excitation signal storage circuit 1620 receives the second excitation signal output from the second excitation signal calculation circuit 1610, and stores and holds the second excitation signal. Then, the second excitation signal input and stored in the past is output to the target signal calculation circuit 1700.
  • FIG. 9 is a diagram showing a configuration of a second embodiment of the transcoder according to the present invention.
  • the LP coefficient code conversion circuit 100 and the gain code conversion circuit 400 in FIG. 12 are replaced with an LP coefficient code conversion circuit 1 100 and a gain code conversion circuit 2400, respectively.
  • a connection is added between the code conversion circuit 1100 and the gain code conversion circuit 2400.
  • the LP coefficient code conversion circuit 1100 is the same as that in the first embodiment described with reference to FIG. However, the way of connection with other circuits is different.
  • LSP is output to gain code conversion circuit 400.
  • Gain code conversion circuit 2400 receives the first gain code output from code separation circuit 1010, and receives the first LSP output from LP coefficient code conversion circuit 1100.
  • the gain code conversion circuit 2400 first converts the first gain code from the first gain (the first ACB gain and the first FCB gain) obtained by decoding by the gain decoding method in the method A to obtain a modified ACB. Calculate the gain and modified FCB gain, and determine the voice judgment value from the first LSP.
  • gain code conversion circuit 2400 calculates a first square error from the ACB gain sequentially read from the AC B gain codebook and the first ACB gain, and calculates the first squared error from the AC B gain and the corrected AC B gain. Calculate the second squared error.
  • the gain code conversion circuit 2400 calculates the AC B gain and the corresponding AC that minimize the evaluation function calculated from the weight coefficient calculated from the speech determination value, the first square error, and the second square error. Select the B gain code.
  • gain code conversion circuit 2400 calculates a third square error from the FCB gain sequentially read from the FCB gain codebook and the first FCB gain, and obtains a fourth square error from the FCB gain and the corrected FCB gain. Calculate the error.
  • the gain code conversion circuit 2400 calculates the FCB gain and the corresponding FCB gain code that minimize the evaluation function calculated from the weight coefficient calculated from the voice determination value, the third squared error, and the fourth squared error.
  • the gain code conversion circuit 2400 outputs the second gain code composed of the selected ACB gain code and FCB gain code to the code multiplexing circuit 1020 as a code that can be decoded by the gain decoding method in the scheme B. I do.
  • FIG. 10 is a diagram showing a configuration of the gain code conversion circuit 2400 in FIG.
  • the gain code conversion circuit 2400 includes a voice / non-voice identification circuit 1460, a gain code separation circuit 2490, an ACB gain decoding circuit 2470, an ACB gain codebook 2471, and an ACB gain correction circuit 2440.
  • AC B gain coding circuit 2410 AC B gain code book 1411, FCB gain decoding circuit 2480, FCB gain code book 2481, FCB gay A correction circuit 2450, an FCB gain encoding circuit 2420, an FCB gain codebook 1421, and a gain code multiplexing circuit 1470.
  • each component of the gain code conversion circuit 2400 of this embodiment will be described.
  • the voice / non-voice discriminating circuit 1460 and the gain code multiplexing circuit 1470 are basically the same as the elements shown in FIG. 8, and a description thereof will be omitted below.
  • the gain code separation circuit 2490 receives the first gain code output from the code separation circuit 1010 via the input terminal 45, and outputs a code corresponding to the ACB gain and FCB gain from the first gain code, that is, the first gain code.
  • the ACB gain code and the first FCB gain code are separated, the first ACB gain code is output to the ACB gain decoding circuit 2470, and the first FCB gain code is output to the FCB gain decoding circuit 2480. I do.
  • the AC B gain decoding circuit 2470 includes an A CB gain codebook 2471 in which a plurality of sets of AC B gains are stored, and receives the first AC B gain code output from the gain code separation circuit 2490.
  • the ACB gain corresponding to the first AC B gain code is read from the first AC B gain codebook 2471, and the read ACB gain is used as the first ACB gain, and the ACB gain correction circuit 24
  • the decoding of the AC B gain from the AC B gain code uses the AC B gain codebook of the system A according to the AC B gain decoding method in the system A.
  • the FCB gain decoding circuit 2480 includes an FCB gain codebook 2481 in which a plurality of sets of FCB gains are stored, and inputs the first FCB gain code output from the gain code separation circuit 2490, and The FCB gain corresponding to the FCB gain code is read from the first FCB gain codebook 2481, and the read FCB gain is used as the first FCB gain.
  • FCB gain encoding circuit 2420 Output to FCB gain encoding circuit 2420.
  • decoding of the FCB gain from the FCB gain code uses the FCB gain codebook of the system A according to the decoding method of the FCB gain in the system A.
  • the AC B gain correction circuit 2440 outputs from the AC B gain decoding circuit 2470.
  • the first ACB gain is input, and the voice judgment value output from the voice / non-voice discriminating circuit 1460 is input.
  • the voice judgment value Vs is 0 (non-voice section)
  • the long-term average of the first ACB gain is set as the corrected ACB gain.
  • the ACB gain correction circuit 2440 calculates the long-term average of the first ACB gain in the non-voice section using the following equation. (") Where
  • g gp (n) is the first ACB gain in the n-th sub-frame
  • g a An is the long-term average of the first ACB gain in the n-th sub-frame, and is, for example, 0.9.
  • the average, median, mode, etc. can be applied to the long-term average.
  • the AC B gain correction circuit 2440 sets the first ACB gain itself as the corrected ACB gain.
  • AC B gain correction circuit 2440 outputs the corrected AC B gain to AC B gain encoding circuit 2410.
  • the FCB gain correction circuit 2450 receives the first FCB gain output from the FCB gain decoding circuit 2480, and receives the voice determination value output from the voice / non-voice discrimination circuit 1460.
  • the long-term average of the first FCB gain is used as the corrected FCB gain.
  • the long-term average of the first FCB gain is calculated by the following equation.
  • Replacement paper (Rule: ⁇ ⁇ 8 q An ) is the first FCB gain in the n-th subframe
  • the average, median, mode, etc. can be applied to the long-term average.
  • the FCB gain correction circuit 2450 sets the first FCB gain itself as the corrected FCB gain.
  • FCB gain correction circuit 2450 outputs the corrected FCB gain to FCB gain encoding circuit 2420.
  • the AC B gain encoding circuit 2410 receives the first AC B gain output from the AC B gain decoding circuit 2470, inputs the corrected ACB gain output from the ACB gain correction circuit 2440, and performs speech / non-speech discrimination. Input the voice judgment value output from the circuit 1460.
  • the AC B gain encoding circuit 2410 calculates a first square error from the AC B gain and the first ACB gain sequentially read from the AC B gain codebook 141 1, and calculates the first squared error from the ACB gain and the corrected ACB gain.
  • the squared error of 2 is calculated, and an evaluation function defined by the following equation is calculated from the weighting factor calculated from the voice judgment value, the first squared error, and the second squared error.
  • the ACB gain encoding circuit 2410 selects an ACB gain that minimizes the evaluation function, sets the selected ACB gain as a second ACB gain, and sets a code corresponding to the second ACB gain. Output to the gain code multiplexing circuit 1470 as the second AC B gain code.
  • the FCB gain encoding circuit 2420 inputs the first FCB gain output from the FCB gain decoding circuit 2480, inputs the corrected FCB gain output from the FCB gain correction circuit 2450, and outputs a voice / non-voice discrimination circuit 1460. Enter the voice judgment value output from.
  • the FCB gain encoding circuit 242 0 calculates a third square error from the FCB gain sequentially read from the FCB gain codebook 1 421 and the first FCB gain, and calculates a fourth square error from the FCB gain and the corrected FCB gain. Then, an evaluation function defined by the following equation is calculated from the weighting factor calculated from the voice judgment value, the third square error, and the fourth square error.
  • FCB 8 is an FCB gain sequentially read from the FCB gain codebook 142 1, and is a weight coefficient. For example, when the voice determination value Vs is 1 (voice section), the weighting factor is 1.0, and when the voice determination value Vs is 0 (non-voice section), it is 0.2.
  • the FCB gain encoding circuit 2420 selects the FCB gain with the smallest evaluation function, sets the selected FCB gain as the second FCB gain, and sets the code corresponding to the second FCB gain to the second FCB gain. Output to the gain code multiplexing circuit 1470 as an FCB gain code.
  • FIG. 11 is a diagram schematically showing an apparatus configuration in a case where the code conversion processing of each of the above embodiments is realized by a program executed by a computer (processor) as a third embodiment of the present invention.
  • the computer 1 that executes the program read from the recording medium 6, the first code obtained by encoding the audio by the first encoding / decoding device can be decoded by the second encoding / decoding device.
  • the recording medium 6 includes:
  • the program is read from the recording medium 6 to the memory 3 via the recording medium reading device 5 and the interface 4 and executed.
  • the above program may be stored in a non-volatile memory such as a flash memory such as a mask ROM.
  • the recording medium includes CD-R0M, FD, Digita 1 Versatile Disk (DVD),
  • a medium such as a magnetic tape (MT) and a portable HDD
  • it also includes a wired or wireless communication medium carrying the program, for example, when the program is transmitted from a server device to a computer by a communication medium.
  • the first code obtained by encoding the speech by the first encoding / decoding device is used as the second code.
  • the recording medium 6 includes:
  • the first code sequence is obtained from the first audio signal and the second code sequence obtained by driving the synthetic filter having the first linear prediction coefficient with the excitation signal.
  • the optimum gain is derived from the second audio signal generated based on the information, and the optimum gain is further corrected.
  • the corrected optimum gain, the optimum gain, and the gain read out from the gain codebook in the second method are obtained.
  • the gain information in the second code string is calculated based on the second gain, and the second gain is calculated using an evaluation function that reduces the time variation of the second gain in the non-voice section. It is.
  • the above effect is obtained by decoding the gain information from the first code string, correcting the decoded gain, and based on the corrected decoding gain, and the decoding gain and the gain read from the gain codebook in the second method.
  • gain information in the second code string is obtained, and in a non-voice section, the second gain is obtained by using an evaluation function that reduces the time variation of the second gain. Can also be played.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

 第1の方式に準拠する第1の符号列を、第2の方式に準拠する第2の符号列へ変換する符号変換装置において、音声復号回路(1500)は、前記第1の符号列から第1の線形予測係数と励振信号の情報を得て、前記第1の線形予測係数をもつフィルタを前記励振信号の情報から得られる励振信号で駆動することによって第1の音声信号を生成し、ゲイン符号生成回路(1400)は、第2の符号列から得られる情報により生成される第2の音声信号と、前記第1の音声信号との距離が最小となるゲイン(最適ゲイン)を計算し、前記最適ゲインを修正し、修正された最適ゲイン(修正最適ゲイン)と、前記最適ゲインと、第2の方式におけるゲインコードブックから読み出されるゲインとに基づき、第2の符号列におけるゲイン情報を求める。その際、音声判別値に基づき、非音声区間において、第2の符号列のゲインの時間変動が小さくなるような評価関数を用いて、ゲインを求める。

Description

明 細 書
音声符号化復号方式間の符号変換方法及び装置とその記憶媒体 技術分野
本発明は、 音声信号を低ビットレートで伝送あるいは蓄積するための符号化及 び復号方法に関し、 特に、 異なる符号化復号方式を用いて音声通信を行うに際し 、 音声をある方式により符号化して得た符号を、 他の方式により復号可能な符号 に高音質かつ低演算量で変換する、 符号変換方法及び装置ならびにその記録媒体 に関する。 背景技術
音声信号を中低ビットレートで高能率に符号化する方法として、 音声信号を線 形予測 (Linear Prediction: LP) フィル夕とそれを駆動する励振信号に分離し て符号化する方法が広く用いられている。 その代表的な方法の一つに Code Excit ed Linear Prediction (符号励振線形予測: 「CELP」 という) がある。 CE L Pでは、 入力音声の周波数特性を表す L P係数が設定された L Pフィル夕を、 入力音声のピッチ周期を表す適応コードブック (Adaptive Codebook: 「ACB 」 という) と、 乱数やパルスから成る固定コードブック (Fixed Codebook: 「F CB」 という) との和で表される励振信号により駆動することで、 合成音声信号 が得られる。 このとき、 前記 AC B成分と前記 FCB成分には各々ゲイン ( 「A CBゲイン」 と 「FCBゲイン」 ) を乗ずる。 なお、 CELPに関しては M. Sch roederと B. S. Atalによる 「Code excited linear prediction: High Quality spe ech at very low bit rates」 (Proc. of IEEE Int. Conf. on Acoust. , Speech and Signal Processing, pp.937-940, 1985) ( 「文献 1」 という) が参照され る。
ところで、 例えば 3G移動体網と有線バケツト網間の相互接続を想定した場合、 各網で用いられる標準音声符号化方式が異なるため、 直接接続できないという問 題がある。 これに対する最も簡単な解法はタンデム接続である。 しかしな力 sら、 タンデム接続では、 一方の標準方式を用いて音声を符号化して得た符号列からそ の標準方式を用いて音声信号を一旦復号し、 この復号された音声信号を他方の標 準方式を用いて再度符号化を行う。 このため、 各音声符号化復号方式で符号化と 復号を一度だけ行う場合に比べて、 一般に音質の低下、 遅延の増加、 計算量の増 加を招くという問題がある。
これに対して、 一方の標準方式を用いて音声を符号化して得た符号を他方の標 準方式により復号可能な符号に、 符号領域又は符号化パラメ一夕領域で変換する 、 符号変換方式は前述の問題に対し有効である。 符号を変換する方法については 、 Hong-Goo Kangらによる 「I即 roving Transcoding Capability of Speech Code rs in Clean and Frame Erasured Channel Enviro匿 nts」 (Pro of IEEE Wor ks op on Speech Coding 2000, pp.78-80, 2000) ( 「文献 2」 という) が参照さ れる。
第 12図は、 第 1の音声符号化方式 ( 「方式 A」 という) を用いて音声を符号 化して得た符号を、 第 2の方式 ( 「方式 B」 という) により復号可能な符号に変 換する、 符号変換装置の構成の一例を示す図である。 第 12図を参照すると、 符 号変換装置は、 入力端子 10と、 符号分離回路 1010と、 L P係数符号変換回 路 100と、 AC B符号変換回路 200と、 FCB符号変換回路 300と、 ゲイ ン符号変換回路 400と、 符号多重回路 1020と、 出力端子 20とを備えてい る。 第 12図を参照して、 従来の符号変換装置の各構成要素について説明する。 入力端子 10から、 方式 Aにより音声を符号化して得た第 1の符号列を入力す る。
符号分離回路 1010は、 入力端子 10から入力した第 1の符号列から、 LP 係数、 ACB、 FCB、 AC Bゲイン及び FCBゲインに対応する符号、 すなわ ち LP係数符号、 ACB符号、 FCB符号、 ゲイン符号を分離する。 ここで、 A C Bゲインと F C Bゲインはまとめて符号化復号されるものとし、 簡単のため、 これをゲイン、 その符号をゲイン符号と呼ぶことにする。 また、 LP係数符号、 ACB符号、 FCB符号、 ゲイン符号を各々第 1の LP係数符号、 第 1の ACB 符号、 第 1の FCB符号、 第 1のゲイン符号と呼ぶことにする。 そして、 第 1の LP係数符号を LP係数符号変換回路 100へ出力し、 第 1の AC B符号を AC B符号変換回路 200へ出力し、 第 1の FCB符号を FCB符号変換回路 300 へ出力し、 第 1のゲイン符号をゲイン符号変換回路 400へ出力する。
LP係数符号変換回路 100は、 符号分離回路 1010から出力される第 1の L P係数符号を入力し、 第 1の L P係数符号を方式 Bにより復号可能な符号に変 換する。 この変換された LP係数符号を、 第 2の LP係数符号として符号多重回 路 1020へ出力する。
AC B符号変換回路 200は、 符号分離回路 1010から出力される第 1の A C B符号を入力し、 第 1の A C B符号を方式 Bにより復号可能な符号に変換する 。 この変換された ACB符号を、 第 2の ACB符号として符号多重回路 1020 へ出力する。
FCB符号変換回路 300は、 符号分離回路 1010から出力される第 1の F C B符号を入力し、 第 1の F C B符号を方式 Bにより復号可能な符号に変換する 。 この変換された FCB符号を、 第 2の FCB符号として符号多重回路 1020 へ出力する。
ゲイン符号変換回路 400は、 符号分離回路 1010から出力される第 1のゲ イン符号を入力し、 第 1のゲイン符号を方式 Bにより復号可能な符号に変換する 。 この変換されたゲイン符号を、 第 2のゲイン符号として符号多重回路 1020 へ出力する。
各変換回路のより具体的な動作を以下に説明する。
LP係数符号変換回路 100は、 符号分離回路 1010から入力した第 1の L P係数符号を、 方式 Aにおける LP係数復号方法により復号して、 第 1の LP係 数を得る。 次に、 LP係数符号変換回路 100は、 第 1の LP係数を、 方式 Bに おける L P係数の量子化方法及び符号化方法により量子化及び符号化して第 2の LP係数符号を得る。 そして、 LP係数符号変換回路 100は、 第 2の LP係数 符号を方式 Bにおける L P係数復号方法により復号可能な符号として符号多重回 路 1020へ出力する。
A CB符号変換回路 200は、 符号分離回路 1010から入力した第 1の AC B符号を、 方式 Aにおける符号と方式 Bにおける符号との対応関係を用いて読み 替えることにより、 第 2の ACB符号を得る。 そして、 ACB符号変換回路 20 0は、 第 2の AC B符号を方式 Bにおける AC B復号方法により復号可能な符号 として符号多重回路 1 0 2 0へ出力する。
F C B符号変換回路 3 0 0は、 符号分離回路 1 0 1 0から入力した第 1の F C B符号を、 方式 Aにおける符号と方式 Bにおける符号との対応関係を用いて読み 替えることにより、 第 2の F C B符号を得る。 そして、 F C B符号変換回路 3 0 0は、 第 2の F C B符号を方式 Bにおける F C B復号方法により復号可能な符号 として符号多重回路 1 0 2 0へ出力する。
ゲイン符号変換回路 4 0 0は、 符号分離回路 1 0 1 0から入力した第 1のゲイ ン符号を、 方式 Aにおけるゲイン復号方法により復号して、 第 1のゲインを得る 。 次に、 ゲイン符号変換回路 4 0 0は、 第 1のゲインを、 方式 Bにおけるゲイン の量子化方法及び符号化方法により量子化及び符号化して、 第 2のゲインとその 符号(第 2のゲイン符号)を得る。 そして、 ゲイン符号変換回路 4 0 0は、 第 2の ゲイン符号を方式 Bにおけるゲイン復号方法により復号可能な符号として符号多 重回路 1 0 2 0へ出力する。
符号多重回路 1 0 2 0は、 L P係数符号変換回路 1 0 0から出力される第 2の L P係数符号と、 A C B符号変換回路 2 0 0から出力される第 2の A C B符号と 、 F C B符号変換回路 3 0 0から出力される第 2の F C B符号と、 ゲイン符号変 換回路 4 0 0から出力される第 2のゲイン符号を入力し、 これらを多重化して得 られる符号列を第 2の符号列として出力端子 2 0を介して出力する。 以上により 第 1 2図の説明を終える。
しかしながら、 第 1 2図を参照して説明した従来の符号変換装置は、 非音声区 間における背景雑音の音質が劣化する、 という問題点を有している。
その理由は、 非音声区間において背景雑音エネルギーの時間変動が大きいため である。 これは、 第 1のゲインを再量子化することによって得られる第 2のゲイ ンが、 非音声区間において時間的に大きく変動することに起因する。 したがって、 本発明は、 上記問題点に鑑みてなされたものであって、 その主た る目的は、 非音声区間における背景雑音音質の劣化を低減できる装置及び方法な らびにそのプログラムを記録した記録媒体を提供することにある。 これ以外の本 発明の目的、 特徴、 利点等は以下の説明から、 当業者には直ちに明らかとされる であろう。 発明の開示
前記目的を達成する、 本発明の第 1のアスペクトに係る方法は、 第 1の方式に 準拠する第 1の符号列を、 第 2の方式に準拠する第 2の符号列へ変換する符号変 換方法において、 前記第 1の符号列から第 1の線形予測係数と励振信号の情報を 得て、 前記第 1の線形予測係数をもつフィル夕を前記励振信号の情報から得られ る励振信号で駆動することによって第 1の音声信号を生成するステップと、 第 2 の符号列から得られる情報により生成される第 2の音声信号と、 前記第 1の音声 信号とに基づき最適ゲインを計算するステップと、 前記最適ゲインを修正するス テツプと、 修正された最適ゲイン (修正最適ゲイン)と、 前記最適ゲインと、 第 2 の方式におけるゲインコードブックから読み出されるゲインとに基づき、 第 2の 符号列におけるゲイン情報を求めるステップと、 を含む。 本発明に係る方法にお いて、 最適ゲインは、 好ましくは、 第 2の符号列から得られる情報により生成さ れる第 2の音声信号と、 前記第 1の音声信号との距離が最小となるゲインとして 求められる。
本発明の第 2のアスペクトに係る方法は、 第 1の方式に準拠する第 1の符号列 を、 第 2の方式に準拠する第 2の符号列へ変換する符号変換方法において、 前記 第 1の符号列からゲイン情報を復号するステップと、 復号されたゲイン(復号ゲ イン)を修正するステップと、 修正された復号ゲイン(修正復号ゲイン)と、 前記 復号ゲインと、 第 2の方式におけるゲインコードブックから読み出されるゲイン とに基づき、 第 2の符号列におけるゲイン情報を求めるステップ、 を含む。 上記第 1のアスペクトに係る発明において、 好ましくは、 前記修正最適ゲイン と、 前記ゲインコードブックから読み出されるゲインとから第 1の自乗誤差を計 算し、 前記最適ゲインと、 前記ゲインコードブックから読み出されるゲインとか ら第 2の自乗誤差を計算し、 前記第 1の自乗誤差と前記第 2の自乗誤差に基づく 評価関数が最小となるゲインを前記ゲインコードブックから選択することによつ て第 2の符号列におけるゲイン情報を求める。
上記第 2のアスペクトに係る発明において、 好ましくは、 前記修正復号ゲイン と、 前記ゲインコードブックから読み出されるゲインとから第 1の自乗誤差を計 算し、 前記復号ゲインと、 前記ゲインコードブックから読み出されるゲインとか ら第 2の自乗誤差を計算し、 前記第 1の自乗誤差と前記第 2の自乗誤差に基づく 評価関数が最小となるゲインを前記ゲインコードブックから選択することによつ て第 2の符号列におけるゲイン情報を求める。
上記第 1のアスペクトに係る発明において、 好ましくは、 前記修正最適ゲイン 力 前記最適ゲインの長時間平均に基づく。
上記第 2のアスペクトに係る発明において、 好ましくは、 前記修正復号ゲイン が、 前記復号ゲインの長時間平均に基づく。
本発明の第 3のアスペクトに係る装置は、 第 1の方式に準拠する第 1の符号列 を、 第 2の方式に準拠する第 2の符号列へ変換する符号変換装置において、 前記 第 1の符号列から第 1の線形予測係数と励振信号の情報を得て、 前記第 1の線形 予測係数をもつフィル夕を前記励振信号の情報から得られる励振信号で駆動する ことによって第 1の音声信号を生成する音声復号回路と、 第 2の符号列から得ら れる情報により生成される第 2の音声信号と、 前記第 1の音声信号とに基づき、 最適ゲインを計算する最適ゲイン計算回路と、 前記最適ゲインを修正する最適ゲ イン修正回路と、 修正された最適ゲイン(修正最適ゲイン)と、 前記最適ゲインと 、 第 2の方式におけるゲインコードブックから読み出されるゲインとに基づき、 第 2の符号列におけるゲイン情報を求めるゲイン符号化回路、 を含む。 本発明に 係る装置において、 最適ゲイン計算回路は、 好ましくは、 第 2の符号列から得ら れる情報により生成される第 2の音声信号と、 前記第 1の音声信号との距離が最 小となるゲインを最適ゲインとして求める。
本発明の第 4のァスぺク卜に係る装置は、 第 1の方式に準拠する第 1の符号列 を、 第 2の方式に準拠する第 2の符号列へ変換する符号変換装置において、 前記 第 1の符号列からゲイン情報を復号するゲイン復号回路と、 復号されたゲイン( 復号ゲイン)を修正する復号ゲイン修正回路と、 修正された復号ゲイン (修正復号 ゲイン)と、 前記復号ゲインと、 第 2の方式におけるゲインコードブックから読 み出されるゲインとに基づき、 第 2の符号列におけるゲイン情報を求めるゲイン 符号化回路、 を含む。 上記第 3のアスペクトに係る発明において、 ゲイン符号化回路は、 好ましくは 、 前記修正最適ゲインと、 前記ゲインコードブックから読み出されるゲインとか ら第 1の自乗誤差を計算し、 前記最適ゲインと、 前記ゲインコードブックから読 み出されるゲインとから第 2の自乗誤差を計算し、 前記第 1の自乗誤差と前記第 2の自乗誤差に基づく評価関数が最小となるゲインを前記ゲインコードブックか ら選択することによって第 2の符号列におけるゲイン情報を求める。
上記第 4のアスペクトに係る発明において、 ゲイン符号化回路は、 好ましくは 、 前記修正復号ゲインと、 前記ゲインコードブックから読み出されるゲインとか ら第 1の自乗誤差を計算し、 前記復号ゲインと、 前記ゲインコードブックから読 み出されるゲインとから第 2の自乗誤差を計算し、 前記第 1の自乗誤差と前記第 2の自乗誤差に基づく評価関数が最小となるゲインを前記ゲインコードブックか ら選択することによって第 2の符号列におけるゲイン情報を求める。
上記第 3のァスぺク卜に係る発明の最適ゲイン修正回路において、 好ましくは 、 前記修正最適ゲインが、 前記最適ゲインの長時間平均に基づく。
上記第 4のアスペクトに係る発明の復号ゲイン修正回路において、 好ましくは 、 前記修正復号ゲインが、 前記復号ゲインの長時間平均に基づく。
本発明の第 5のァスぺク卜に係るプログラムは、 第 1の方式に準拠する第 1の 符号列を、 第 2の方式に準拠する第 2の符号列へ変換する符号変換装置を構成す るコンピュータに、
(a)前記第 1の符号列から第 1の線形予測係数と励振信号の情報を得て、 前記 第 1の線形予測係数をもつフィル夕を前記励振信号の情報から得られる励振信号 で駆動することによって第 1の音声信号を生成する処理と、
(b)第 2の符号列から得られる情報により生成される第 2の音声信号と、 前記 第 1の音声信号とに基づきゲイン(最適ゲイン)を計算する処理と、
(c)前記最適ゲインを修正する処理と、
(d)修正された最適ゲイン (修正最適ゲイン)と、 前記最適ゲインと、 第 2の方 式におけるゲインコードブックから読み出されるゲインとに基づき、 第 2の符号 列におけるゲイン情報を求める処理、 を実行させるためのプログラムを提供する 。 本発明において、 第 2の符号列から得られる情報により生成される第 2の音声 信号と、 前記第 1の音声信号との距離が最小となるゲインを最適ゲインとして求 める。
本発明の第 6のァスぺク卜に係るプログラムは、 第 1の方式に準拠する第 1の 符号列を、 第 2の方式に準拠する第 2の符号列へ変換する符号変換装置を構成す るコンピュータに、
(a)前記第 1の符号列からゲイン情報を復号する処理と、
(b)復号されたゲイン(復号ゲイン)を修正する処理と、
(c)修正された復号ゲイン (修正復号ゲイン)と、 前記復号ゲインと、 第 2の方 式におけるゲインコードブックから読み出されるゲインとに基づき、 第 2の符号 列におけるゲイン情報を求める処理、 を実行させるためのプログラムを提供する 上記第 5のアスペクトに係る発明のプログラムにおいて、 好ましくは、 前記修 正最適ゲインと、 前記ゲインコードブックから読み出されるゲインとから第 1の 自乗誤差を計算し、 前記最適ゲインと、 前記ゲインコードブックから読み出され るゲインとから第 2の自乗誤差を計算し、 前記第 1の自乗誤差と前記第 2の自乗 誤差に基づく評価関数が最小となるゲインを前記ゲインコードブックから選択す ることによって第 2の符号列におけるゲイン情報を求める。
上記第 6のアスペクトに係る発明のプログラムにおいて、 好ましくは、 前記修 正復号ゲインと、 前記ゲインコードブックから読み出されるゲインとから第 1の 自乗誤差を計算し、 前記復号ゲインと、 前記ゲインコードブックから読み出され るゲインとから第 2の自乗誤差を計算し、 前記第 1の自乗誤差と前記第 2の自乗 誤差に基づく評価関数が最小となるゲインを前記ゲインコ一ドブックから選択す ることによって第 2の符号列におけるゲイン情報を求める。
上記第 5のアスペクトに係る発明のプログラムにおいて、 好ましくは、 前記修 正最適ゲインが、 前記最適ゲインの長時間平均に基づく。
上記第 6のアスペクトに係る発明のプログラムにおいて、 好ましくは、 前記修 正復号ゲインが、 前記復号ゲインの長時間平均に基づく。
本願の第 7のァスぺク卜に係る発明は、 前記第 5及び第 6のァスぺク卜に係る 発明の前記プログラムを記録した記録媒体を提供する。 図面の簡単な説明
第 1図は、 本発明による符号変換装置の第 1の実施例の構成を示す図である。 第 2図は、 本発明による符号変換装置における L P係数符号変換回路の構成を 示す図である。
第 3図は、 A C B符号と A C B遅延との対応関係と A C B符号の読み替え方法 を説明する図である。
第 4図は、 本発明による符号変換装置の音声復号回路の構成を示す図である。 第 5図は、 本発明による符号変換装置における目標信号計算回路の構成を示す 図である。
第 6図は、 本発明による符号変換装置における F C B符号生成回路の構成を示 す図である。
第 7図は、 パルス位置符号とパルス位置との対応関係と A C B符号の読み替え 方法を説明する図である。
第 8図は、 本発明による符号変換装置におけるゲイン符号生成回路の構成を示 す図である。
第 9図は、 本発明による符号変換装置の第 2の実施例の構成を示す図である。 第 1 0図は、 本発明による符号変換装置におけるゲイン符号生成回路の構成を 示す図である。
第 1 1図は、 本発明による符号変換装置の第 3から第 4の実施例の構成を示す 図である。
第 1 2図は、 従来の符号変換装置の構成を示す図である。 発明を実施するための最良の形態
以下本発明の実施の形態について説明する。 まず本発明の装置と方法の概要と 原理を説明したあと、 実施例について以下に詳細に説明する。
本発明に係る符号変換装置において、 音声復号回路 (1 5 0 0 ) は、 第 1の方 式に準拠する第 1の符号列から第 1の線形予測係数と励振信号の情報を得て、 前 記第 1の線形予測係数をもつフィル夕を前記励振信号の情報から得られる励振信 号で駆動することによって第 1の音声信号を生成し、 ゲイン符号生成回路 (1 4 0 0 ) は、 第 2の方式に準拠する第 2の符号列から得られる情報により生成され る第 2の音声信号と、 前記第 1の音声信号との距離が最小となるゲイン (最適ゲ イン)を計算し、 前記最適ゲインを修正し、 修正された最適ゲイン(修正最適ゲイ ン)と、 前記最適ゲインと、 第 2の方式におけるゲインコードブックから読み出 されるゲインとに基づき、 第 2の符号列におけるゲイン情報を求める。
本発明に係る方法は以下のステップを有する。
ステップ a:第 1の符号列から第 1の線形予測係数を得る。
ステップ b:第 1の符号列から励振信号の情報を得る。
ステップ c:励振信号の情報から励振信号を得る。
ステップ d:第 1の線形予測係数をもつフィル夕を前記励振信号によって駆動 することで第 1の音声信号を生成する。
ステツプ e:第 2の符号列から得られる情報により生成される第 2の音声信号 と、 前記第 1の音声信号との距離が最小となるゲイン (最適ゲイン)を計算する。 ステップ f :前記最適ゲインを修正する。
ステツプ g:修正された最適ゲイン(修正最適ゲイン)と、 前記最適ゲインと、 第 2の方式におけるゲインコードブックから読み出されるゲインとに基づき、 第 2の符号列におけるゲイン情報を求める。
本発明では、 非音声区間において、 第 2のゲイン (第 2の符号列におけるゲイ ン) の時間変動が小さくなるような評価関数を用いて、 前記第 2のゲインを求め る。
このため、 前記非音声区間において、 得られた第 2のゲインの時間変動は小さ くなり、 同区間での背景雑音エネルギーの時間変動が小さくなる。
その結果、 前記非音声区間における背景雑音音質の劣化を低減できる。 次に、 本発明の実施例について図面を参照して詳細に説明する。
実施例 1
第 1図は、 本発明による符号変換装置の第 1の実施例の構成を示す図である。 第 1図において、 第 1 2図と同一又は同等の要素には、 同一の参照符号が付され ている。 第 1図を参照すると、 入力端子 1 0と、 符号分離回路 1010と、 LP 係数符号変換回路 1 1 00と、 L S P-L P C変換回路 1 1 1 0と、 ィンパルス 応答計算回路 1 1 20と、 ACB符号変換回路 1 200と、 目標信号計算回路 1
700と、 FCB符号生成回路 1800と、 ゲイン符号生成回路 1400と、 音 声復号回路 1 500と、 第 2の励振信号計算回路 16 10と、 第 2の励振信号記 憶回路 1 620と、 符号多重回路 1020と、 出力端子 20とを備えている。 入 力端子 1 0、 出力端子 20、 符号分離回路 10 10、 符号多重回路 1020は、 結線の一部が分岐する以外は、 基本的に、 第 12図に示した要素と同じである。 以下では、 上述した同一又は同等の要素の説明は省略し、 主に、 第 1 2図に示し た構成との相違点について説明する。
また、 方式 Aにおいて、 LP係数の符号化は、
τ (
msec周期 (フレーム) 毎に行われ、 ACB、 F C B及びゲインなど励振信号の構 成要素の符号化は、
msec周期 (サブフレーム) 毎に行われるものとする。
一方、 方式 Bにおいては、 LP係数の符号化は、
msec周期 (フレーム) 毎に行われ、 励振信号の構成要素の符号化は、
τ ( —
一 msec周期 (サブフレーム) 毎に行われるものとする。
また、 方式 Aのフレーム長、 サブフレーム数、 及びサブフレーム長を、 それぞ れ、
11
羞替え用紙 (規則 26) {A)
N
及び
Figure imgf000013_0001
とする。
方式 Bのフレーム長、 サブフレーム数、 及び、 サブフレーム長を、 それぞれ、
(B)
L
N (fl)
及び、
L≠ Lfi 1 l sfr とする。
以下の説明では、 簡単のため、
(S)
d ) = 2
とする。
ここで、 例えば、 サンプリング周波数を、 8000Hzとし,
τ (
1 fr 及び
lfi
を 10 msecとすれば、
12
S替え用紙 OH j
及び
(fl)
L
は 160サンプル、
j
及び
(8)
L
は 80サンプルとなる。
LP係数符号変換回路 1 1 00は、 符号分離回路 10 10から第 1の LP係数 符号を入力する。 ここで、 「3GPP AMR S p e e c h Cod e c」 ( 文献 3) や、 I TU— T勧告 G. 729など多くの標準方式では、 LP係数を線 スペクトル対 (Line Spectral Pair: LSP) で表現し、 LS Pを符号化及び復 号することが多いため、 LP係数の符号化及び復号は、 LSP領域で行われると する。 LP係数から L S Pへの変換、 及び L S Pから L P係数への変換について は、 周知の方法、 例えば 「文献 3」 の第 5.2.3節及び第 5.2.4節の記載が参照され る。 LP係数符号変換回路 1 100は、 前記第 1の LP係数符号を方式 Aにおけ る LSP復号方法により復号して、 第 1の LSPを得る。
次に、 LP係数符号変換回路 1 100は、 前記第 1の LSPを、 方式 Bにおけ る L S P量子化方法及び符号化方法により量子化及び符号化して、 第 2の L S P とこれに対応する符号 (第 2の LP係数符号)を得る。 そして、 LP係数符号変換 回路 1 100は、 前記第 2の LP係数符号を方式 Bにおける LSP復号方法によ り復号可能な符号として符号多重回路 1 020へ出力し、 前記第 1の L SPと第 2の LSPを LS P-LPC変換回路 1 1 10へ出力する。
第 2図は、 LP係数符号変換回路 1 100の構成を示す図である。 第 2図を参 照すると、 LP係数符号変換回路 1 100は、 LS P復号回路 1 1 0と、 第 1の
13
差替え用紙 (規則 26) LSPコードブック 1 1 1と、 LSP係数符号化回路 1 30と、 第 2の LSPコ —ドブック 1 3 1とを備えている。 第 2図を参照して、 LP係数符号変換回路 1 100の各構成要素について説明する。
LSP復号回路 1 10は、 LP係数符号から対応する LS Pを復号する。 LS P復号回路 1 1 0は、 複数セットの LSPが格納された第 1の LS Pコードブッ ク 1 1 1を備えており、 符号分離回路 101 0から出力される第 1の LP係数符 号を、 入力端子 31を介して入力し、 第 1の LP係数符号に対応する LSPを第 1の L S Pコードブック 1 1 1より読み出し、 読み出された L S Pを第 1の L S Pとして L S P符号化回路 1 30へ出力するとともに、 出力端子 33を介して L S P- LPC変換回路 1 1 10へ出力する。 ここで、 LP係数符号からの LS P の復号は、 方式 Aにおける L S Pの復号方法に従い、 方式 Aの LS Pコードブッ クを用いる。
LSP符号化回路 1 30は、 し 5 復号回路1 10から出力される第 1の LS Pを入力し、 複数セッ卜の L S Pが格納された第 2の L S Pコードブック 13 1 から第 2の LS Pとそれに対応する LP係数符号の各々を順次読み込み、 第 1の L S Pとの誤差が最小となる第 2の L S Pを選択し、 それに対応する L P係数符 号を、 第 2の LP係数符号として出力端子 32を介して符号多重回路 1020へ 出力し、 第 2の LS Pを出力端子 34を介してし3?_し?〇変換回路1 1 10 へ出力する。 ここで、 第 2の LS Pの選択方法、 すなわち L S Pの量子化及び符 号化方法は、 方式 Bにおける LS Pの量子化方法及び符号化方法に従い、 方式 B の L S Pコードブックを用いる。 ここで、 L S Pの量子化及び符号化については 、 例えば 「文献 3」 の第 5.2.5節の記載が参照される。
以上により、 第 2図による LP係数符号変換回路 1 100の説明を終え、 再び 第 1図の説明に戻る。
LSP— LPC変換回路 1 1 10は、 L P係数符号変換回路 1 1 00から出力 される第 1の LSPと第 2の LS Pとを入力し、 第 1の LS Pを第 1の LP係数 a, , i に変換し、 第 2の LS Pを第 2の LP係数 a2 , , に変換し、 第 1の L P係数 a i , i を目標信号計算回路 1 700と、 音声復号回路 1 500と、 イン パルス応答計算回路 1 1 20へ出力し、 第 2の LP係数 a2 . , を目標信号計算 回路 1 700とインパルス応答計算回路 1 1 20へ出力する。 ここで、 LS Pか ら LP係数への変換については、 「文献 3」 の第 5.2.4節の記載が参照される。
AC B符号変換回路 1200は、 符号分離回路 1010から入力した第 1の A CB符号を、 方式 Aにおける符号と方式 Bにおける符号との対応関係を用いて読 み替えることにより、 第 2の AC B符号を得る。 そして、 AC B符号変換回路 1 200は、 第 2の AC B符号を方式 Bにおける AC B復号方法により復号可能な 符号として符号多重回路 1020へ出力する。 また、 ACB符号変換回路 1 20 0は、 第 2の AC B符号に対応する AC B遅延を第 2の AC B遅延として目標信 号計算回路 1 Ί 00へ出力する。
ここで、 第 3図を参照して、 符号の読み替えについて説明する。 例えば、 方式 Aにおける AC B符号
が 56のとき、 これに対応する AC B遅延 が 76であるとする。 方式 Bでは、 ACB符号
が 53のとき、 これに対応する AC B遅延
が 76であるとすると、 ACB遅延の値が同一 (この場合では 76) となるように、 方式 Aから方式 Bへと AC B符号を変換するには、 方式 Aにおける AC B符号 56 を方式 Bにおける AC B符号 53に対応付ければよい。 以上により、 符号の読み替 えについての説明を終え、 再び第 1図の説明に戻る。
音声復号回路 1 500は、 符号分離回路 1 010から出力される第 1の AC B 符号、 第 1の FCB符号、 第 1のゲイン符号を入力し、 乙 ?ーし?じ変換回路 1 1 10から第 1の LP係数を入力する。 次に、 音声復号回路 1 500は、 方式 Aにおける、 AC B信号復号方法、 FCB信号復号方法及びゲイン復号方法の各
15
羞替え用紙 0^IJ26) 々を用いて、 第 1の ACB符号、 第 1の FCB符号及び第 1のゲイン符号の各々 から、 ACB遅延、 FCB信号及びゲインの各々を復号し、 各々を第 1の AC B 遅延、 第 1の FC'B信号及び第 1のゲインとする。 音声復号回路 1500は、 第 1の ACB遅延を用いて ACB信号を生成し、 これを第 1の ACB信号とする。 そして、 音声復号回路 1500は、 第 1の ACB信号、 第 1の FCB信号及び第 1のゲインと、 第 1の LP係数とから、 音声を生成し、 音声を目標信号計算回路 1700へ出力する。
第 4図は、 音声復号回路 1500の構成を示す図である。 第 4図を参照すると 、 音声復号回路 1500は、 AC B復号回路 1510と、 08復号回路152 0と、 ゲイン復号回路 1530とを有する励振信号情報復号回路 1600と、 励 振信号計算回路 1540と、 励振信号記憶回路 1570と、 合成フィル夕 158 0を備えている。 第 4図を参照して、 音声復号回路 1500の各構成要素につい て説明する。
励振信号情報復号回路 1600は、 励振信号の情報に対応する符号から励振信 号の情報を復号する。 符号分離回路 1010から出力される第 1の ACB符号、 第 1の FCB符号及び第 1のゲイン符号を各々入力端子 51、 52及び 53を介 して入力し、 第 1の AC B符号、 第 1の FCB符号及び第 1のゲイン符号の各々 から、 ACB遅延、 FCB信号及びゲインの各々を復号し、 各々を第 1の AC B 遅延、 第 1の FCB信号及び第 1のゲインとする。 ここで、 第 1のゲインは、 A CBゲインと FCBゲインとからなり、 各々を第 1の ACBゲインと第 1の FC Bゲインとする。 また、 励振信号情報復号回路 1600は、 励振信号記憶回路 1 570から出力される過去の励振信号を入力する。 励振信号情報復号回路 160 0は、 過去の励振信号と第 1の AC B遅延とを用いて AC B信号を生成し、 これ を第 1の AC B信号とする。 そして、 励振信号情報復号回路 1600は、 第 1の ACB信号、 第 1の FCB信号、 第 1の AC Bゲイン及び第 1の F C Bゲインを 、 励振信号計算回路 1540へ出力する。
次に、 励振信号情報復号回路 1600の構成要素である AC B復号回路 151 0、 F C B復号回路 1520、 及びゲイン復号回路 1530について詳細に説明 する。 ACB復号回路 1510は、 符号分離回路 1010から出力される第 1の AC B符号を、 入力端子 51を介して入力し、 励振信号記憶回路 1570から出力さ れる過去の励振信号を入力する。 次に、 ACB復号回路 1510は、 上述した A CB符号変換回路 1200と同様にして、 第 3図に示す方式 Aにおける ACB 符号と AC B遅延の対応関係を用いて、 第 1の ACB 符号に対応する第 1の A CB遅延
を得る。 励振信号において、 現サブフレームの始点より
サンプル過去の点から、 サブフレーム長に相当する
(
し Φ サンプルの信号を切り出して、 第 1の AC Β信号を生成する。 ここで、
よりも小さい場合には、 サンプル分のベクトルを切り出し、 このベクトルを繰り返し接続して、 長さ サンプルの信号とする。 そして、 第 1の AC B信号を励振信号計算回路 1540 へ出力する。 ここで、 第 1の AC B信号を生成する方法の詳細については、 「文 献 3」 の第 6.1節及び第 5.6節の記載が参照される。
FCB復号回路1520は、 符号分離回路 1010から出力される第 1の F C B符号を、 入力端子 52を介して入力し、 第 1の FCB符号に対応する第 1の F CB信号を、 励振信号計算回路 1540へ出力する。 FCB信号は、 パルス位置
17
H された用紙 CH!i91) とパルス極性で規定されるマルチパルス信号により表現されており、 第 1の F C B符号はパルス位置に対応する符号 (パルス位置符号)とパルス極性に対応する符 号 (パルス極性符号)とからなる。 ここで、 マルチパルス信号により表現された F CB信号を生成する方法の詳細については、 「文献 3」 の第 6.1節及び第 5.7節の 記載が参照される。
ゲイン復号回路 1530は、 符号分離回路 1010から出力される第 1のゲイ ン符号を、 入力端子 53を介して入力する。 ゲイン復号回路 1530は、 複数の ゲインが格納されたテーブルを内蔵しており、 第 1のゲイン符号に対応するゲイ ンをテーブルから読み出す。 そして、 ゲイン復号回路 1530は、 読み出された ゲインのうち、 AC Bゲインに対応する第 1の AC Bゲインと、 FCBゲインに 対応する第 1の FCBゲインとを励振信号計算回路 1540へ出力する。 ここで 、 第 1の AC Bゲインと第 1の F C Bゲインがまとめて符号化されている場合に は、 テーブルには第 1の AC Bゲインと第 1の FCBゲインとから成る 2次元べ クトルが複数格納されている。 また、 第 1の ACBゲインと第 1の FCBゲイン が個別に符号化されている場合には、 二つのテーブルが内蔵され、 一方のテープ ルに第 1の AC Bゲインが複数格納されており、 他方のテーブルに第 1の F C B ゲインが複数格納されている。
励振信号計算回路 1540は、 AC B復号回路 1510から出力される第 1の AC B信号を入力し、 ?じ8復号回路1520から出力される第 1の FCB信号 を入力し、 ゲイン復号回路 1530から出力される第 1の ACBゲインと第 1の FCBゲインとを入力する。 励振信号計算回路 1540は、 第 1の AC B信号に 第 1の AC Bゲインを乗じて得た信号と、 第 1の FCB信号に第 1の FCBゲイ ンを乗じて得た信号とを加算して第 1の励振信号を得る。 そして、 励振信号計算 回路 1540は、 第 1の励振信号を、 合成フィルタ 1580と励振信号記憶回路 1570とへ出力する。
励振信号記憶回路 1570は、 励振信号計算回路 1540から出力される第 1 の励振信号を入力し、 これを記憶保持する。 そして、 励振信号記憶回路 1570 は、 過去に入力されて記憶保持されている過去の第 1の励振信号を AC B復号回 路 1510へ出力する。 合成フィル夕 1580は、 励振信号計算回路 1540から出力される第 1の励 振信号を入力し、 LSP— LPC変換回路 1 110から出力される第 1の LP係 数を入力端子 61を介して入力する。 そして、 合成フィル夕 1580は、 第 1の L P係数をもつ線形予測フィル夕を、 第 1の励振信号で駆動することにより音声 信号を生成する。 音声信号を目標信号計算回路 1700へ出力端子 63を介して 出力する。
以上で、 第 4図による音声復号回路 1500の説明を終え、 再び第 1図の説明 に戻る。
目標信号計算回路 1700は、 LSP— LPC変換回路 1 1 10から第 1の L S Pと第 2の L S Pとを入力し、 ACB符号変換回路 1200から第 2の ACB 符号に対応する第 2の ACB遅延を入力し、 音声復号回路 1500から復号音声 を入力し、 インパルス応答計算回路 1 120からインパルス応答信号を入力し、 第 2の励振信号記憶回路 1620に記憶保持される過去の第 2の励振信号を入力 する。 目標信号計算回路 1700は、 復号音声と第 1の LP係数及び第 2の LP 係数とから第 1の目標信号を計算する。 次に、 目標信号計算回路 1700は、 過 去の第 2の励振信号とィンパルス応答信号と第 1の目標信号と第 2の A C B遅延 とから、 第 2の AC B信号及び最適 AC Bゲインを求める。 そして、 目標信号計 算回路 1700は、 第 1の目標信号と最適 AC Bゲインとをゲイン符号生成回路 1400へ出力し、 第 2の AC B信号をゲイン符号生成回路 1400と第 2の励 振信号計算回路 1610とへ出力する。
第 5図は、 目標信号計算回路 1700の構成を示す図である。 第 5図を参照す ると、 目標信号計算回路 1700は、 重み付け信号計算回路 1710と、 ACB 信号生成回路 1720と、 最適 AC Bゲイン計算回路 1730とを備えている。 第 5図を参照して、 目標信号計算回路 1700の各構成要素について説明する。 重み付け信号計算回路 1710は、 音声復号回路 1500の合成フィル夕 1 5 80から出力される復号音声 s (n)を入力端子 57を介して入力し、 L S P— L P C変換回路 1 1 10から出力される第 1の LP係数 a,, iと第 2の LP係数 a2, i とを、 各々入力端子 36と入力端子 35とを介して入力する。 重み付け信号計算 回路 1710は、 まず、 第 1の LP係数を用いて、 聴感重み付けフィルタ W(z)を 構成する。
そして、 重み付け信号計算回路 17 10は、 復号音声により聴感重み付けフィ ル夕を駆動して聴感重み付け音声信号を生成する。 次に、 重み付け信号計算回路 17 10は、 第 1の LP係数と第 2の LP係数とを用いて、 聴感重み付け合成フ ィル夕 W(z)/A2(z)を構成する。
そして、 重み付け信号計算回路 17 10は、 聴感重み付け合成フィル夕の零入 力応答を聴感重み付け音声信号から減算して得られる第 1の目標信号 x(n)を、 A CB信号生成回路 1720と最適 AC Bゲイン計算回路 1730へ出力するとと もに、 第 2の目標信号計算回路 1430へ出力端子 78を介して出力する。
ACB信号生成回路 1720は、 重み付け信号計算回路 17 10から出力され る第 1の目標信号を入力し、 AC B符号変換回路 1 200から出力される第 2の ACB遅延 T( B ) , a g を入力端子 37を介して入力し、 インパルス応答計算 回路 1 1 20から出力されるインパルス応答信号 h(n)を入力端子 74を介して入 力し、 第 2の励振信号記憶回路 1620から出力される過去の第 2の励振信号 u( n)を入力端子 75を介して入力する。
ACB信号生成回路 1720は、 過去の第 2の励振信号から遅延 kで切り出さ れた信号とィンパルス応答信号との畳み込みにより、 フィル夕処理された遅延 k の過去の励振信号 ," -0,·.·,Ζ¾)-1 を計算する。
ここで、 遅延 kは第 2の AC Β遅延とする。 過去の第 2の励振信号から遅延 kで 切り出された信号を第 2の A C B信号 V (n)とする。
そして、 AC B信号生成回路 1 720は、 第 2の A C B信号を第 2の目標信号 計算回路 1430と第 2の励振信号計算回路 16 1 0とへ出力端子 76を介して 出力し、 フィル夕処理された遅延 kの過去の励振信号 yk(n)を最適 ACBゲイン計 算回路 1730へ出力する。
最適 AC Bゲイン計算回路 1730は、 重み付け信号計算回路 1 7 10から出
20
差替え用紙 (規則 26) 力される第 1の目標信号 x(n)を入力し、 ACB信号生成回路 1720から出力さ れるフィル夕処理された遅延 kの過去の励振信号 yk (n)を入力する。
次に、 最適 AC Bゲイン計算回路 1730は、 第 1の目標信号 x(n)と、 フィル 夕処理された遅延 kの過去の励振信号 yk(n)と、 から最適 AC Bゲイン gpを次式に より計算する。 最適 ACBゲイン gpは、 第 1の目標信号 x(n)と、 フィル夕処理さ れた遅延 kの過去の励振信号 yk(n)との距離を最小とするゲインである。 -'
^x(n)yk (n)
n=0
=0 そして、 最適 ACBゲイン計算回路 1730は、 最適 ACBゲイン gpを ACB ゲイン符号化回路 1410へ出力端子 77を介して出力する。
なお、 第 2の ACB信号を計算する方法及び最適 ACBゲインを計算する方法 の詳細については、 「文献 3」 の第 6.1節及び第 5.6節の記載が参照できる。 以上 で第 5図による目標信号計算回路 1700の説明を終え、 再び第 1図の説明に戻 る。
インパルス応答計算回路 1 120は、 し3?_1^ じ変換回路1 110から出 力される第 1の LP係数と第 2の LP係数を入力し、 第 1の LP係数と第 2の L P係数を用いて聴感重み付け合成フィルタを構成する。
そして、 インパルス応答計算回路 1120は、 聴感重み付け合成フィル夕のィ ンパルス応答信号を目標信号計算回路 1700とゲイン符号生成回路 1400と へ出力する。 ここで、 聴感重み付け合成フィル夕の伝達関数は次式により表され る。
Figure imgf000022_0001
ただし、
21 羞替え; a ift imm) 1 1
1+∑
は、 第 2の LP係数
をもつ線形予測フィル夕の伝達関数である (
Figure imgf000023_0001
は、 第 1の LP係数
,i = l---,P をもつ聴感重み付けフィル夕の伝達関数である。
ここで、 Pは、 線形予測次数 (例えば、 10) であり、 ァ1とァ 2は、 重み付けを 制御する係数 (例えば、 0.94と 0.6) である。
FCB符号生成回路 1800は、 符号分離回路 10 10から出力される第 1の F C B符号を入力し、 第 1の F C B符号を方式 Bにより復号可能な符号に変換す る。 FCB符号生成回路 1800は、 変換された FCB符号を、 第 2の FCB符 号として符号多重回路 1020へ出力し、 第 2の FCB符号に対応する第 2の F CB信号をゲイン符号生成回路 1400と、 第 2の励振信号計算回路 16 1 0と へ出力する。 ここで、 FCB信号は、 複数のパルスから成り、 パルスの位置 (パ ルス位置) と極性 (パルス極性) で規定されるマルチパルス信号により表現され る。 FCB符号は、 パルス位置に対応する符号 (パルス位置符号)とパルス極性に 対応する符号 (パルス極性符号)とからなる。 マルチパルス信号による FCB信号 の表現方法については、 「文献 3」 の第 5.7節の記載が参照される。
22
差替え用鈸 m 第 6図は、 第 1図の FCB符号生成回路 1800の構成を示す図である。 第 6 図を参照すると、 FCB符号生成回路 1800は、 FCB符号変換回路 1300 と、 FCB信号生成回路 1820を備えている。 第 6図を参照して、 FCB符号 生成回路 1800の各構成要素について説明する。
FCB符号変換回路 1300は、 符号分離回路 1010から入力端子 85を介 して入力した第 1の FCB符号 i (A> p を、 方式 Aにおける符号と方式 Bにおけ る符号との対応関係を用いて読み替えることにより、 第 2の FCB符号 i (B ) P を得る。 そして、 FCB符号変換回路 1300は、 これを方式 Bにおける FCB 復号方法により復号可能な符号として出力端子 55を介して符号多重回路 102 0へ出力し、 第 2の F C B符号に対応するパルス位置
及び、 パルス極性
5,(Λ) を FCB信号生成回路 1820へ出力する。
第 7図を参照して、 パルス位置符号の読み替えについて説明する。
例えば、 方式 Aにおけるパルス位置符号
iiA)
が 6のとき、 これに対応するパルス位置
が 30であるとする。 方式 Βでは、 パルス位置符号 が 1のとき、 これに対応するパルス位置
ρ(δ)
'0
が 30であるとすると、 パルス位置の値が同一 (この場合では 30) となるように
23
された用紙 (規則 91) 方式 Aから方式 Bへとパルス位置符号を変換するには、 方式 Aにおけるパルス位 置符号 6を方式 Bにおけるパルス位置符号 1に対応付ければよい。
パルス極性符号については、 読み替え前の符号に対応する極性 (正又は負)と、 読み替え後の符号に対応する極性とが等しくなるように、 符号を読み替えればよ レ^
以上により、 パルス位置符号及びパルス極性符号の読み替えについての説明を 終え、 再び第 6図の説明に戻る。
FCB信号生成回路 1820は、 FCB符号変換回路 1300から出力される パルス位置及びパルス極性を入力する。 FCB信号生成回路 1820は、 パルス 位置及びパルス極性から規定される FCB信号を第 2の FCB信号 c(n)とし、 こ れを最適 FCBゲイン計算回路 1440と第 2の励振信号計算回路 1610とへ 出力端子 86を介して出力する。
以上で第 6図による FCB符号生成回路 1800の説明を終え、 再び第 1図の 説明に戻る。
ゲイン符号生成回路 1400は、 目標信号計算回路 1700から出力される第 1の目標信号と第 2の ACB信号と最適 ACBゲインとを入力し、 FCB符号生 成回路 1800から出力される第 2の FCB信号を入力し、 インパルス応答計算 回路 1 120から出力されるインパルス応答信号を入力し、 LP係数符号変換回 路 1100から出力される第 1の LSPを入力する。
ゲイン符号生成回路 1400は、 まず、 第 1の目標信号と第 2の ACB信号と 最適 AC Bゲインとィンパルス応答信号とから第 2の目標信号を計算し、 第 2の 目標信号と第 2の FCB信号とインパルス応答信号とから最適 FCBゲインを計 算し、 最適 FCBゲインから修正 FCBゲインを計算し、 第 1の LSPから音声 判定値を決定する。
次に、 ゲイン符号生成回路 1400は、 A CBゲインコードブックから順次読 み込まれる ACBゲインと最適 ACBゲインとから第 1の自乗誤差を計算し、 A C Bゲインと修正 A C Bゲインとから第 2の自乗誤差を計算する。
そして、 ゲイン符号生成回路 1400は、 音声判定値から計算される重み係数 と第 1の自乗誤差と第 2の自乗誤差とから計算される評価関数が最小となる AC Bゲイン及び対応する AC Bゲイン符号を選択する。
また、 ゲイン符号生成回路 1400は、 FCBゲインコードブックから順次読 み込まれる FCBゲインと最適 FCBゲインとから第 3の自乗誤差を計算し、 F CBゲインと修正 FCBゲインとから第 4の自乗誤差を計算する。
そして、 ゲイン符号生成回路 1400は、 音声判定値から計算される重み係数 と第 3の自乗誤差と第 4の自乗誤差とから計算される評価関数が最小となる FC Bゲイン及び対応する F C Bゲイン符号を選択する。
最後に、 ゲイン符号生成回路 1400は、 選択された AC Bゲイン符号と FC Bゲイン符号とからなる第 2のゲイン符号を、 方式 Bにおけるゲイン復号方法に より復号可能な符号として符号多重回路 1020へ出力端子 56を介して出力す る。
第 8図は、 ゲイン符号生成回路 1400の構成を示す図である。 第 8図を参照 すると、 ゲイン符号生成回路 1400は、 ACBゲイン符号化回路 1410と、 AC Bゲインコードブック 141 1と、 FCBゲイン符号化回路 1420と、 F CBゲインコードブック 142 1と、 第 2の目標信号計算回路 1430と、 最適 F C Bゲイン計算回路 1440と、 最適 F C Bゲイン修正回路 1450と、 音声 Z非音声識別回路 1460と、 を備えている。 第 8図を参照して、 ゲイン符号生 成回路 1400の各構成要素について詳細に説明する。
第 2の目標信号計算回路 1430は、 ACB信号生成回路 1720から出力さ れる第 2の ACB信号 v(n)を入力端子 92を介して入力し、 重み付け信号計算回 路 1710から出力される第 1の目標信号 x(n)を入力端子 93を介して入力し、 インパルス応答計算回路 1 120から出力されるインパルス応答信号 h(n)を入力 端子 94を介して入力し、 ACBゲイン符号化回路 1410から出力される第 2 の AC Bゲインを入力する。
第 2の目標信号計算回路 1430は、 第 2の ACB信号とインパルス応答信号 との畳み込みにより、 フィルタ処理された第 2の ACB信号 y(n),n = 0,---,L (B)
25
差替え用紙(¾||!126) を計算し、 y(n)に第 2の ACBゲイン
を乗じて得られる信号を、 第 1の目標信号 x(n)から減算して、 第 2の目標信号 X 2 (n)を得る。 x2(n) = x(n)- gpy(n),
y(n) = v{n)^h{n)
そして、 第 2の目標信号計算回路 1430は、 第 2の目標信号 x2 (n)を最適 F CBゲイン計算回路 1440へ出力する。
最適 FCBゲイン計算回路 1440は、 FCB信号生成回路 1 820から出力 される第 2の FCB信号 c(n)を入力端子 9 1を介して入力し、 インパルス応答計 算回路 1 120から出力されるインパルス応答信号 Mn)を入力端子 94を介して 入力し、 第 2の目標信号計算回路 1430から出力される第 2の目標信号 x2 (n) を入力し、 第 2の FCB信号とィンパルス応答信号との畳み込みによりフィルタ 処理された第 2の FCB信号 z(n),n = 0,-,L ) -\ を計算し、 第 2の目標信号 x2 (n)とフィル夕処理された第 2の F C B信号 z (n)か ら、 次の式により最適 FCBゲイン gcを計算する。 最適 FCBゲイン gcは、 第 2 の目標信号 x2 (n)とフィル夕処理された第 2の F C B信号 z (n)との距離を最小と するゲインである。
26
差替え用紙(¾f ]26)
Figure imgf000028_0001
そして、 最適 FCBゲイン計算回路 1440は、 最適 FCBゲインを最適 FC Bゲイン修正回路 1450と FCBゲイン符号化回路 1420とへ出力する。 音声/非音声識別回路 1460は、 L S P復号回路 110から出力される第 1 の LSPを入力端子 98を介して入力する。 第 1の LSPとその長時間平均とか ら L S P変動量を計算し、 L S P変動量から音声判定値を決定する。
L S P変動量を求める手順を以下に示す。 第 nフレームにおいて、 LSPの長 時間平均
を次式により計算する。
ここで、 Npは線形予測次数であり、 0は例えば 0.9である。
第 nフレームにおける L S Pの変動量 dQ(n)を次式により定義する
Figure imgf000028_0002
ここで、
D は、 と
27
差替え用紙 (規則 26) '")(") との誤差として、 例えば、
¾)(") = ( (")- "') ("))2 又は、
;·)(")叫 ")- ;m'(") などが定義できるが、 ここでは、 後者を用いる。 変動量 dd(n)が大きい区間を音 声区間に、 小さい区間を非音声区間に対応させることができる。 変動量 dQ(n)に 対する閾値処理により、 音声判定値
5,„ を決定する。 if (dq(n)≥ Cvs) then Vs = I
else ^ =0
(Vs=l dQ(n)が CVS以上の場合
Vs= 0 dq (n)力 VSより小の場合)
ここで、 Cvsはある定数 (例えば、 2.2) であり、 Vs=lは音声区間に、 Vs=0は非 音声区間に対応する。 音声判定値を最適 AC Bゲイン修正回路 1480と ACB ゲイン符号化回路 1410と最適 F C Bゲイン修正回路 1450と FCBゲイン 符号化回路 1420とへ出力する。
最適 AC Bゲイン修正回路 1480は、 AC B信号生成回路 1 720から出力 される最適 ACBゲインを入力端子 97を介して入力し、 音声/非音声識別回路 1460から出力される音声判定値を入力する。 最適 AC Bゲイン修正回路 14 80では、 音声判定値 Vsが 0(非音声区間)のとき、 最適 AC Bゲインの長時間平 均を修正 AC Bゲインとする。 非音声区間において、 次式により最適 AC Bゲイ ンの長時間平均を計算する。
28
差替え用紙 (規則 2 gp(n) = gp(n-l) + (l-a) gp(n)
ここで、
8P(n)
は第 nサブフレームにおける最適 ACBゲイン、 は第 nサブフレームにおける最適 A C Bゲインの長時間平均であり、 ひは例えば 0.9である。 なお、 長時間平均には平均値、 中央値、 最頻値なども適用できる。 一方、 最適 ACBゲイン修正回路 1480では、 音声判定値 Vsが 1 (音声区間) のとき、 最適 AC Bゲインそのものを修正 AC Bゲインとする。
最適 A CBゲイン修正回路 1480は、 修正 AC Bゲインを、 AC Bゲイン符 号化回路 1410へ出力する。
AC Bゲイン符号化回路 1410は、 AC B信号生成回路 1720から出力さ れる最適 AC Bゲイン gpを入力端子 97を介して入力し、 最適 ACBゲイン修正 回路 1480から出力される修正 AC Bゲインを入力し、 音声/非音声識別回路 1460から出力される音声判定値を入力する。
AC Bゲイン符号化回路 1410は、 AC Bゲインコードブック 141 1から 順次読み込まれる AC Bゲインと入力端子 97からの最適 AC Bゲインとから第 1の自乗誤差を計算し、 A CBゲインと修正 AC Bゲインとから第 2の自乗誤差 を計算し、 音声判定値から計算される重み係数と、 第 1の自乗誤差と、 第 2の自 乗誤差とから次式で定義される評価関数を計算する。
E gP = -(gp - 8P)2 )-(gP -gP)~ ここで、
は最適 ACBゲイン、
SP
29
訂正された用紙 (規則 91) は修正 AC Bゲイン、 SP は A C Bゲインコードブックから順次読み込まれる A C Bゲインであり、 は重 み係数である。 例えば、 音声判定値 Vsが 1(音声区間)のとき、 重み係数/ は 1.0と し、 Vsが 0 (非音声区間)のときは は 0.2とする。
そして、 AC Bゲイン符号化回路 1410は、 評価関数が最小となる AC Bゲ インを選択し、 選択された AC Bゲインを第 2の AC Bゲインとして第 2の目標 信号計算回路 1430へ出力するとともに、 第 2の励振信号計算回路 1610へ 出力端子 95を介して出力し、 第 2の ACBゲインに対応する符号を ACBゲイ ン符号としてゲイン符号多重化回路 14 70へ出力する。
最適 FCBゲイン修正回路 1450は、 最適 FCBゲイン計算回路 1440力 ら出力される最適 FCBゲインを入力し、 音声/^ 音声識別回路 1460から出 力される音声判定値 Vsを入力する。
最適 F C Bゲイン修正回路 1450において、 音声判定値 Vsが 0 (非音声区間) のとき、 最適 FCBゲインの長時間平均を修正 FCBゲインとする。 非音声区間 において、 次式により最適 F C Bゲインの長時間平均を計算する。 gc (n) = a- gc (n - 1) + (1 - α) · gc (") ここで、
は第 nサブフレームにおける最適 FCBゲイン、
gc{n) は第 nサブフレームにおける最適 FCBゲインの長時間平均であり、 αは例えば 0.9である。 なお、 長時間平均には、 平均値、 中央値、 最頻値なども適用できる
30
差替え用紙 (規則 26) 一方、 最適 F C Bゲイン修正回路 1450において、 音声判定値 Vsが 1 (音声区 間)のとき、 最適 F C Bゲインそのものを修正 F C Bゲインとする。
最適 FCBゲイン修正回路 1450は、 修正 FCBゲインを FCBゲイン符号 化回路 1420へ出力する。
FCBゲイン符号化回路 1420は、 最適 FCBゲイン計算回路 1440から 出力される最適 FCBゲインを入力し、 最適 FCBゲイン修正回路 1450から 出力される修正 FCBゲインを入力し、 音声/非音声識別回路 1460から出力 される音声判定値を入力する。 FCBゲイン符号化回路 1420は、 FCBゲイ ンコードブック 1421から順次読み込まれる FCBゲインと、 最適 FCBゲイ ンとから第 1の自乗誤差を計算し、 FCBゲインと修正 FCBゲインとから第 2 の自乗誤差を計算し、 音声判定値から計算される重み係数と第 1の自乗誤差と第 2の自乗誤差とから次式で定義される評価関数を計算する。
Egc = M (gc -gcY + (1 - Λ) · (gc ~gc)2 ここで、 は最適 FCBゲイン、
gc
は修正 FCBゲイン、 は F C Bゲインコードブックから順次読み込まれる F C Bゲインであり、 は重 み係数である。 例えば、 音声判定値 Vsが 1(音声区間)のとき、 重み係数^は 1.0と し、 音声判定値 Vsが 0(非音声区間)のときは は 0.2とする。
そして、 FCBゲイン符号化回路 1420は、 評価関数が最小となる F C Bゲ ィンを選択し、 選択された F C Bゲインを第 2の F C Bゲインとして第 2の励振 信号計算回路 1610へ出力端子 96を介して出力し、 第 2の FCBゲインに対 応する符号を FCBゲイン符号としてゲイン符号多重化回路 1470へ出力する
31
差替え用紙(規 2 ゲイン符号多重回路 1470は、 AC Bゲイン符号化回路 1410から出力さ れる AC Bゲイン符号を入力し、 FCBゲイン符号化回路 1420から出力され る F C Bゲイン符号を入力し、 A C Bゲイン符号と F C Bゲイン符号とを多重化 して得られる第 2のゲイン符号を、 方式 Bにおけるゲイン復号方法により復号可 能な符号として符号多重回路 1 020へ出力端子 56を介して出力する。
以上で第 8図によるゲイン符号生成回路 1400の説明を終え、 再び第 1図の 説明に戻る。
第 2の励振信号計算回路 16 10は、 目標信号計算回路 1700から出力され る第 2の ACB信号を入力し、 FCB符号生成回路 1800から出力される第 2 の FCB信号を入力し、 ゲイン符号生成回路 1400から出力される第 2の AC Bゲインと第 2の FCBゲインとを入力する。 第 2の励振信号計算回路 16 10 は、 第 2の AC B信号に第 2の AC Bゲインを乗じて得た信号と、 第 2の FCB 信号に第 2の F C Bゲインを乗じて得た信号と、 を加算して第 2の励振信号を得 る。 そして第 2の励振信号を第 2の励振信号記憶回路 1620へ出力する。 第 2の励振信号記憶回路 1620は、 第 2の励振信号計算回路 1 6 10から出 力される第 2の励振信号を入力し、 これを記憶保持する。 そして、 過去に入力さ れて記憶保持されている第 2の励振信号を目標信号計算回路 1 700へ出力する 。 以上により、 本発明の第 1の実施例の説明を終える。 実施例 2
次に、 本発明の第 2の実施例について説明する。 第 9図は、 本発明による符号 変換装置の第 2の実施例の構成を示す図である。 第 9図においては、 第 1 2図に おける LP係数符号変換回路 100と、 ゲイン符号変換回路 400とを、 それぞ れ L P係数符号変換回路 1 100とゲイン符号変換回路 2400とで置き換え、 LP係数符号変換回路 1 100とゲイン符号変換回路 2400との間に結線が付 加されている。 以下では、 第 1 2図に示す要素と同一又は同等の要素の説明は省 略し、 相違点について説明する。
LP係数符号変換回路 1 100は、 第 1図を用いて説明した第 1の実施例にお けるそれと同様である。 ただし、 他回路との結線の仕方が異なっており、 第 1の LSPをゲイン符号変換回路 400へ出力する。
ゲイン符号変換回路 2400は、 符号分離回路 1010から出力される第 1の ゲイン符号を入力し、 LP係数符号変換回路 1 100から出力される第 1の LS Pを入力する。
ゲイン符号変換回路 2400は、 まず、 第 1のゲイン符号を、 方式 Aにおける ゲイン復号方法により復号して得られる第 1のゲイン(第 1の AC Bゲイン及び 第 1の F C Bゲイン)から、 修正 A C Bゲイン及び修正 F C Bゲインを計算し、 第 1の L S Pから音声判定値を決定する。
次に、 ゲイン符号変換回路 2400は、 AC Bゲインコードブックから順次読 み込まれる ACBゲインと第 1の ACBゲインとから第 1の自乗誤差を計算し、 AC Bゲインと修正 AC Bゲインとから第 2の自乗誤差を計算する。
そして、 ゲイン符号変換回路 2400は、 音声判定値から計算される重み係数 と、 第 1の自乗誤差と、 第 2の自乗誤差とから計算される評価関数が最小となる AC Bゲイン及び対応する AC Bゲイン符号を選択する。
また、 ゲイン符号変換回路 2400は、 F C Bゲインコードブックから順次読 み込まれる FCBゲインと第 1の FCBゲインとから第 3の自乗誤差を計算し、 FCBゲインと修正 FCBゲインとから第 4の自乗誤差を計算する。 そして、 ゲ イン符号変換回路 2400は、 音声判定値から計算される重み係数と第 3の自乗 誤差と第 4の自乗誤差とから計算される評価関数が最小となる FCBゲイン及び 対応する F C Bゲイン符号を選択する。
最後に、 ゲイン符号変換回路 2400は、 選択された ACBゲイン符号と FC Bゲイン符号とからなる第 2のゲイン符号を、 方式 Bにおけるゲイン復号方法に より復号可能な符号として符号多重回路 1020へ出力する。
第 10図は、 第 9図のゲイン符号変換回路 2400の構成を示す図である。 第 10図を参照すると、 ゲイン符号変換回路 2400は、 音声 非音声識別回路 1 460と、 ゲイン符号分離回路 2490と、 ACBゲイン復号回路 2470と、 ACBゲインコードブック 2471と、 ACBゲイン修正回路 2440と、 AC Bゲイン符号化回路 2410と、 AC Bゲインコードブック 141 1と、 FCB ゲイン復号回路 2480と、 FCBゲインコードブック 2481と、 FCBゲイ ン修正回路 2450と、 FCBゲイン符号化回路 2420と、 FCBゲインコー ドブック 1421と、 ゲイン符号多重回路 1470と、 を備えている。 第 10図 を参照して、 この実施例のゲイン符号変換回路 2400の各構成要素について説 明する。 なお、 第 10図において、 音声/非音声識別回路 1460及びゲイン符 号多重回路 1470は、 第 8図に示した要素と基本的に周じであり、 以下では、 これらの説明は省略する。
ゲイン符号分離回路 2490は、 符号分離回路 1010から出力される第 1の ゲイン符号を入力端子 45を介して入力し、 第 1のゲイン符号から AC Bゲイン 及び F C Bゲインに対応する符号、 すなわち第 1の AC Bゲイン符号及び第 1の FCBゲイン符号を分離し、 第 1の AC Bゲイン符号を AC Bゲイン復号回路 2 470へ出力し、 第 1の FCBゲイン符号を FCBゲイン復号回路 2480へ出 力する。
AC Bゲイン復号回路 2470は、 複数セッ卜の AC Bゲインが格納された A CBゲインコードブック 2471を備えており、 ゲイン符号分離回路 2490力、 ら出力される第 1の AC Bゲイン符号を入力し、 第 1の AC Bゲイン符号に対応 する AC Bゲインを第 1の AC Bゲインコードブック 2471より読み出し、 読 み出された A C Bゲインを第 1の A C Bゲインとして A C Bゲイン修正回路 24
40へ出力するとともに、 AC Bゲイン符号化回路 2410へ出力する。 ここで 、 AC Bゲイン符号からの AC Bゲインの復号は、 方式 Aにおける AC Bゲイン の復号方法に従い、 方式 Aの AC Bゲインコードブックを用いる。
F C Bゲイン復号回路 2480は、 複数セットの F C Bゲインが格納された F CBゲインコードブック 2481を備えており、 ゲイン符号分離回路 2490か ら出力される第 1の F C Bゲイン符号を入力し、 第 1の F C Bゲイン符号に対応 する FCBゲインを第 1の FCBゲインコードブック 2481より読み出し、 読 み出された FCBゲインを第 1の FCBゲインとして FCBゲイン修正回路 24
50へ出力するとともに、 FCBゲイン符号化回路 2420へ出力する。 ここで 、 FCBゲイン符号からの FCBゲインの復号は、 方式 Aにおける FCBゲイン の復号方法に従い、 方式 Aの FCBゲインコードブックを用いる。
AC Bゲイン修正回路 2440は、 AC Bゲイン復号回路 2470から出力さ れる第 1の ACBゲインを入力し、 音声/非音声識別回路 1460から出力され る音声判定値を入力する。 音声判定値 Vsが 0(非音声区間)のとき、 第 1の ACB ゲインの長時間平均を修正 AC Bゲインとする。
ACBゲイン修正回路 2440は、 非音声区間において、 次式により第 1の A CBゲインの長時間平均を計算する。
Figure imgf000036_0001
(") こで、
ggp(n) は第 nサブフレームにおける第 1の ACBゲイン、 gaAn) は第 nサブフレームにおける第 1の A C Bゲインの長時間平均であり、 ひは例え ば 0.9である。 なお、 長時間平均には、 平均値、 中央値、 最頻値なども適用でき る。
一方、 音声判定値 Vsが 1 (音声区間)のとき、 AC Bゲイン修正回路 2440は 、 第 1の ACBゲインそのものを修正 ACBゲインとする。
AC Bゲイン修正回路 2440は、 修正 AC Bゲインを AC Bゲイン符号化回 路 2410へ出力する。
FCBゲイン修正回路 2450は、 FCBゲイン復号回路 2480から出力さ れる第 1の FCBゲインを入力し、 音声/非音声識別回路 1460から出力され る音声判定値を入力する。
FCBゲイン修正回路 2450において、 音声判定値 Vsが 0(非音声区間)のと き、 第 1の FCBゲインの長時間平均を修正 FCBゲインとする。 非音声区間に おいて、 次式により第 1の F C Bゲインの長時間平均を計算する。
35
差替え用紙(規 :^ノ 8qAn) は第 nサブフレームにおける第 1の FCBゲイン,
は第 ηサブフレームにおける第 1の FCBゲインの長時間平均であり、 αは例え ば 0.9である。 なお、 長時間平均には、 平均値、 中央値、 最頻値なども適用でき る。
一方、 音声判定値 Vsが 1(音声区間)のとき、 FCBゲイン修正回路 2450は 、 第 1の FCBゲインそのものを修正 FCBゲインとする。
FCBゲイン修正回路 2450は、 修正 FCBゲインを FCBゲイン符号化回 路 2420へ出力する。
AC Bゲイン符号化回路 2410は、 AC Bゲイン復号回路 2470から出力 される第 1の AC Bゲインを入力し、 ACBゲイン修正回路 2440から出力さ れる修正 ACBゲインを入力し、 音声/非音声識別回路 1460から出力される 音声判定値を入力する。
AC Bゲイン符号化回路 2410は、 AC Bゲインコードブック 141 1から 順次読み込まれる AC Bゲインと第 1の A C Bゲインとから第 1の自乗誤差を計 算し、 ACBゲインと修正 ACBゲインとから第 2の自乗誤差を計算し、 音声判 定値から計算される重み係数と第 1の自乗誤差と第 2の自乗誤差とから次式で定 義される評価関数を計算する。
― eqp V^) qp o qp ' J qp 。 qj? ここで、
36 羞替え用紙 ,{j26) g
は第 1の AC Bゲイン、
8 は修正 A C Bゲイン、
は AC Bゲインコードブック 1 4 1 1から順次読み込まれる AC Bゲインであり 、 は重み係数である。 例えば、 音声判定値 Vsが 1 (音声区間)のとき、 重み係数 は 1.0とし、 Vsが 0(非音声区間)のときは は 0.2とする。
そして、 ACBゲイン符号化回路 24 1 0は、 評価関数が最小となる AC Bゲ インを選択し、 選択された ACBゲインを第 2の ACBゲインとし、 第 2の AC Bゲインに対応する符号を第 2の AC Bゲイン符号としてゲイン符号多重化回路 14 7 0へ出力する。
FCBゲイン符号化回路 2420は、 FCBゲイン復号回路 2480から出力 される第 1の FCBゲインを入力し、 FCBゲイン修正回路 24 50から出力さ れる修正 FCBゲインを入力し、 音声/非音声識別回路 1460から出力される 音声判定値を入力する。
FCBゲイン符号化回路 242 0は、 FCBゲインコードブック 1 42 1から 順次読み込まれる FCBゲインと第 1の FCBゲインとから第 3の自乗誤差を計 算し、 FCBゲインと修正 FCBゲインとから第 4の自乗誤差を計算し、 音声判 定値から計算される重み係数と第 3の自乗誤差と第 4の自乗誤差とから次式で定 義される評価関数を計算する。
Esqc = M-(gqc -gqc)2 +^- )-(8 -8qc 2 ここで、
37
羞替え用紙(規則 26) は第 1の FCBゲイン、 o qc
は修正 FCBゲイン、
8 は FCBゲインコードブック 142 1から順次読み込まれる FCBゲインであり 、 は重み係数である。 例えば、 音声判定値 Vsが 1(音声区間)のとき、 重み係数 は 1.0とし、 音声判定値 Vsが 0(非音声区間)のときは は 0.2とする。
そして、 FCBゲイン符号化回路 2420は、 評価関数が最小となる FCBゲ インを選択し、 選択された FCBゲインを第 2の FCBゲインとし、 第 2の FC Bゲインに対応する符号を第 2の F C Bゲイン符号としてゲイン符号多重化回路 1470へ出力する。 実施例 3
上述した本発明の各実施例の符号変換装置は、 ディジタル信号処理プロセッサ 等のコンピュータ制御で実現するようにしてもよい。 第 1 1図は、 本発明の第 3 の実施例として、 上記各実施例の符号変換処理を、 コンピュータ (プロセッサ) で実行されるプログラムによって実現する場合の装置構成を模式的に示す図であ る。 記録媒体 6から読み出されたプログラムを実行するコンピュータ 1において 、 第 1の符号化復号装置により音声を符号化して得た第 1の符号を第 2の符号化 復号装置により復号可能な第 2の符号へ変換する符号変換処理を実行するにあた り、 記録媒体 6には、
(a) 第 1の符号列から第 1の線形予測係数を得る処理と、
(b) 第 1の符号列から励振信号の情報を得る処理と、
(c) 励振信号の情報から励振信号を得る処理と、
(d) 第 1の線形予測係数をもつフィル夕を励振信号により駆動することによつ て音声信号を生成する処理と、
(e) 第 2の符号列から得られる情報により生成される第 2の音声信号と、 第 1 の音声信号との距離が最小となるゲイン (最適ゲイン)を計算する処理と、
38
羞替え用紙 0^IJ6) (f) 最適ゲインを修正する処理と、
(g) 修正された最適ゲイン(修正最適ゲイン)と、 第 2の方式におけるゲインコ ードブックから読み出されるゲインとから第 1の自乗誤差を計算し、 最適ゲイン と、 ゲインコードブックから読み出されるゲインとから第 2の自乗誤差を計算し 、 第 1の自乗誤差と第 2の自乗誤差に基づく評価関数が最小となるゲインをゲイ ンコードブックから選択することによって第 2の符号列におけるゲイン情報を求 める処理、
を実行させるためのプログラムが記録されている。 記録媒体 6から該プロダラ ムを記録媒体読出装置 5、 イン夕フェース 4を介してメモリ 3に読み出して実行 する。 上記プログラムは、 マスク ROM等、 フラッシュメモリ等の不揮発性メモリ に格納してもよく、 記録媒体は不揮発性メモリを含むほか、 CD- R0M、 FD、 Digi ta 1 Versat i le Di sk (DVD)、 磁気テープ (MT) 、 可搬型 HDD等の媒体の他、 例えば サーバ装置からコンピュータで該プログラムを通信媒体伝送する場合等、 プログ ラムを担持する有線、 無線で通信される通信媒体等も含む。
本発明の第 4の実施例では、 記録媒体 6から読み出されたプログラムを実行す るコンピュータ 1において、 第 1の符号化復号装置により音声を符号化して得た 第 1の符号を第 2の符号化復号装置により復号可能な第 2の符号へ変換する符号 変換処理を実行するにあたり、 記録媒体 6には、
(a) 第 1の符号列からゲイン情報を復号する処理と、
(b) 復号されたゲイン (復号ゲイン)を修正する処理と、
(c) 修正された復号ゲイン(修正復号ゲイン)と、 第 2の方式におけるゲインコ ードブックから読み出されるゲインとから第 1の自乗誤差を計算し、 復号ゲイン と、 ゲインコードブックから読み出されるゲインとから第 2の自乗誤差を計算し 、 第 1の自乗誤差と第 2の自乗誤差に基づく評価関数が最小となるゲインをゲイ ンコードブックから選択することによって第 2の符号列におけるゲイン情報を求 める処理、
を実行させるためのプログラムが記録されている。
以上本発明を上記実施例に即して説明したが、 本発明は、 上記実施例の構成に のみ限定されるものでなく、 請求の範囲の各項の発明の範囲内で当業者であれば なし得るであろう各種変形、 修正を含むことは勿論である。 産業上の利用可能性
以上説明したように、 本発明によれば、 非音声区間における背景雑音音質の劣 化を低減することができる、 という効果を奏する。
その理由は、 本発明においては、 第 1の符号列から第 1の線形予測係数をもつ 合成フィル夕を励振信号で駆動して得た第 1の音声信号と第 2の符号列から得ら れる情報により生成される第 2の音声信号とから最適ゲインを導出し、 さらに最 適ゲインを修正し、 修正した最適ゲインと、 最適ゲインと、 第 2の方式における ゲインコードブックから読み出されるゲインとに基づき、 第 2の符号列における ゲイン情報を求め、 その際、 非音声区間において、 第 2のゲインの時間変動が小 さくなるような評価関数を用いて、 第 2のゲインを求めるように構成したためで ある。 上記効果は、 第 1の符号列からゲイン情報を復号し、 復号されたゲインを 修正し、 修正された復号ゲインと、 前記復号ゲインと第 2の方式におけるゲイン コードブックから読み出されるゲインとに基づき、 第 2の符号列におけるゲイン 情報を求め、 非音声区間において、 第 2のゲインの時間変動が小さくなるような 評価関数を用いて、 第 2のゲインを求めるように構成してなる本発明によっても 奏することができる。

Claims

請 求 の 範 囲
1 . 第 1の方式に準拠する第 1の符号列を、 第 2の方式に準拠する第 2の符号 列へ変換する符号変換方法において、
前記第 1の符号列から第 1の線形予測係数と励振信号の情報を得て、 前記第 1 の線形予測係数をもつフィル夕を前記励振信号の情報から得られる励振信号で駆 動することによって第 1の音声信号を生成するステップと、
第 2の符号列から得られる情報により生成される第 2の音声信号と、 前記第 1 の音声信号とに基づき最適ゲインを導出するステップと、
前記最適ゲインを修正するステップと、
修正された最適ゲイン ( 「修正最適ゲイン」 という) と、 前記最適ゲインと、 第 2の方式におけるゲインコードブックから読み出されるゲインとに基づき、 第 2の符号列におけるゲイン情報を求めるステップと、
を含む、 ことを特徴とする符号変換方法。
2 . 第 1の方式に準拠する第 1の符号列を、 第 2の方式に準拠する第 2の符号 列へ変換する符号変換方法において、
前記第 1の符号列からゲイン情報を復号するステップと、
復号されたゲイン( 「復号ゲイン」 という)を修正するステップと、
修正された復号ゲイン( 「修正復号ゲイン」 という)と、 前記復号ゲインと、 第 2の方式におけるゲインコードブックから読み出されるゲインとに基づき、 第 2 の符号列におけるゲイン情報を求めるステップと、
を含む、 ことを特徴とする符号変換方法。
3 . 前記修正最適ゲインと、 前記ゲインコードブックから読み出されるゲイン とから、 第 1の自乗誤差を計算するステップと、
前記最適ゲインと、 前記ゲインコードブックから読み出されるゲインとから第 2の自乗誤差を計算するステップと、
前記第 1の自乗誤差と前記第 2の自乗誤差とに基づく評価関数を最小とするゲ インを、 前記ゲインコードブックから選択することによって、 第 2の符号列にお けるゲイン情報を求めるステップと、
を含む、 ことを特徴とする請求の範囲第 1項に記載の符号変換方法。
4 . 前記修正復号ゲインと、 前記ゲインコードブックから読み出されるゲイン とから第 1の自乗誤差を計算するステップと、
前記復号ゲインと、 前記ゲインコードブックから読み出されるゲインとから第 2の自乗誤差を計算するステップと、
前記第 1の自乗誤差と前記第 2の自乗誤差に基づく評価関数を最小とするゲイ ンを、 前記ゲインコードブックから選択することによって、 第 2の符号列におけ るゲイン情報を求めるステップと、
を含む、 ことを特徴とする請求の範囲第 2項に記載の符号変換方法。
5 . 前記修正最適ゲインが、 前記最適ゲインの長時間平均に基づくものである 、 ことを特徴とする請求の範囲第 1項又は第 3項に記載の符号変換方法。
6 . 前記修正復号ゲインが、 前記復号ゲインの長時間平均に基づくものである 、 ことを特徴とする請求の範囲第 2項又は第 4項に記載の符号変換方法。
7 . 前記第 2の符号列から得られる情報により生成される第 2の音声信号と、 前記第 1の音声信号との距離を最小とするゲインを、 前記最適ゲインとして求め る、 ことを特徴とする請求の範囲第 1項に記載の符号変換方法。
8 . 前記評価関数が、 前記第 1の自乗誤差と前記第 2の自乗誤差と重み係数と からなる、 ことを特徴とする請求の範囲第 3項乃至第 7項のいずれか一項に記載 の符号変換方法。
9 . 前記第 1の線形予測係数に基づき、 音声区間 非音声区間を識別する音声 判別値を決定するステツプと、
前記音声判別値が非音声区間を示すときに、 前記第 2の符号列におけるゲイン の時間変動が小さくなるような評価関数を用いて、 前記第 2の符号列におけるゲ ィン情報を求めるステップと、
を含む、 ことを特徴とする請求の範囲第 1項又は第 2項に記載の符号変換方法
1 0 . 前記第 1の線形予測係数に基づき、 音声区間/非音声区間を識別する音 声判別値を決定するステップを有し、
前記評価関数は、 前記第 1の自乗誤差と前記第 2の自乗誤差とを重み係数によ り加重平均することで求められ、 前記音声判別値に基づき、 音声区間と非音声区間とに応じて、 前記重み係数を それぞれ所定の値に設定し、 前記評価関数を計算するステップを有する、 ことを 特徴とする請求の範囲第 3項又は第 4項に記載の符号変換方法。
1 1 . 第 1の方式に準拠する第 1の符号列を、 第 2の方式に準拠する第 2の符 号列へ変換する符号変換装置において、
前記第 1の符号列から第 1の線形予測係数と励振信号の情報を得て、 前記第 1 の線形予測係数をもつフィル夕を前記励振信号の情報から得られる励振信号で駆 動することによって第 1の音声信号を生成する音声復号回路と、
第 2の符号列から得られる情報により生成される第 2の音声信号と、 前記第 1 の音声信号とに基づき、 最適ゲインを計算する最適ゲイン計算回路と、
前記最適ゲインを修正する最適ゲイン修正回路と、
修正された最適ゲイン( 「修正最適ゲイン」 という)と、 前記最適ゲインと、 第 2の方式におけるゲインコードブックから読み出されるゲインとに基づき、 第 2 の符号列におけるゲイン情報を求めるゲイン符号化回路と、
を含む、 ことを特徴とする符号変換装置。
1 2 . 第 1の方式に準拠する第 1の符号列を、 第 2の方式に準拠する第 2の符 号列へ変換する符号変換装置において、
前記第 1の符号列からゲイン情報を復号するゲイン復号回路と、
復号されたゲイン( 「復号ゲイン」 という)を修正する復号ゲイン修正回路と、 修正された復号ゲイン( 「修正復号ゲイン」 という)と、 前記復号ゲインと、 第 2の方式におけるゲインコードブックから読み出されるゲインとに基づき、 第 2 の符号列におけるゲイン情報を求めるゲイン符号化回路、
を含む、 ことを特徴とする符号変換装置。
1 3 . 前記ゲイン符号化回路が、
前記修正最適ゲインと、 前記ゲインコードブックから読み出されるゲインとか ら第 1の自乗誤差を計算し、 前記最適ゲインと、 前記ゲインコードブックから読 み出されるゲインとから第 2の自乗誤差を計算し、 前記第 1の自乗誤差と前記第 2の自乗誤差に基づく評価関数が最小となるゲインを前記ゲインコードブックか ら選択することによって第 2の符号列におけるゲイン情報を求める手段を備えて いる、 ことを特徴とする請求の範囲第 1 1項に記載の符号変換装置。
1 4. 前記ゲイン符号化回路が、
前記修正復号ゲインと、 前記ゲインコードブックから読み出されるゲインとか ら第 1の自乗誤差を計算し、 前記復号ゲインと、 前記ゲインコードブックから読 み出されるゲインとから第 2の自乗誤差を計算し、 前記第 1の自乗誤差と前記第 2の自乗誤差に基づく評価関数が最小となるゲインを前記ゲインコードブックか ら選択することによって第 2の符号列におけるゲイン情報を求める手段を備えて いる、 ことを特徴とする請求の範囲第 1 2項に記載の符号変換装置。
1 5 . 前記修正最適ゲインが、 前記最適ゲインの長時間平均に基づくものであ る、 ことを特徴とする請求の範囲第 1 1項又は第 1 3項に記載の符号変換装置。
1 6 . 前記修正復号ゲインが、 前記復号ゲインの長時間平均に基づくものであ る、 ことを特徴とする請求の範囲第 1 2項又は第 1 4項に記載の符号変換装置。
1 7 . 前記最適ゲイン計算回路が、 前記第 2の符号列から得られる情報により 生成される第 2の音声信号と、 前記第 1の音声信号との距離を最小とするゲイン を前記最適ゲインとして出力する、 ことを特徴とする請求の範囲第 1 0項に記載 の符号変換装置。
1 8 . 前記評価関数が、 前記第 1の自乗誤差と前記第 2の自乗誤差と重み係数 とからなる、 ことを特徴とする請求の範囲第 1 2項乃至第 1 7項のいずれか一項 に記載の符号変換装置。
1 9 . 前記第 1の線形予測係数に基づき、 音声区間 非音声区間を識別する音 声判別値を出力する音声 Z非音声識別回路を備え、
前記ゲイン符号化回路は、 前記音声判別値が非音声区間を示すとき、 第 2の符 号列におけるゲインの時間変動が小さくなるような評価関数を用いて、 前記第 2 の符号列におけるゲイン情報を求める、 ことを特徴とする、 請求の範囲第 1 1項 又は第 1 2項に記載の符号変換装置。
2 0 . 前記第 1の線形予測係数に基づき、 音声区間 非音声区間を識別する音 声判別値を出力する音声 非音声識別回路を備え、
前記ゲイン符号化回路は、 前記評価関数を、 前記第 1の自乗誤差と前記第 2の 自乗誤差とを重み係数により加重平均することで求め、 その際、 前記音声判別値 に基づき、 音声区間と非音声区間とに応じて、 前記重み係数をそれぞれ所定の値 に設定して、 前記評価関数を計算する、 ことを特徴とする請求の範囲第 1 3項又 は第 1 4項に記載の符号変換装置。
2 1 . 第 1の方式に準拠する第 1の符号列を、 第 2の方式に準拠する第 2の符 号列へ変換する符号変換装置を構成するコンピュータに、
(a)前記第 1の符号列から第 1の線形予測係数と励振信号の情報を得て、 前記 第 1の線形予測係数をもつフィル夕を前記励振信号の情報から得られる励振信号 で駆動することによって第 1の音声信号を生成する処理と、
(b)第 2の符号列から得られる情報により生成される第 2の音声信号と、 前記 第 1の音声信号とに基づき最適ゲインを計算する処理と、
(c)前記最適ゲインを修正する処理と、
(d)修正された最適ゲイン( 「修正最適ゲイン」 という)と、 前記最適ゲインと 、 第 2の方式におけるゲインコードブックから読み出されるゲインとに基づき、 第 2の符号列におけるゲイン情報を求める処理、
を実行させるためのプログラムを、 コンピュータで利用可能な媒体に含むコン ピュー夕 ·プログラム ·プロダクト。
2 2 . 第 1の方式に準拠する第 1の符号列を、 第 2の方式に準拠する第 2の符 号列へ変換する符号変換装置を構成するコンピュータに、
(a)前記第 1の符号列からゲイン情報を復号する処理と、
(b)復号されたゲイン( 「復号ゲイン」 という)を修正する処理と、
(c)修正された復号ゲイン( 「修正復号ゲイン」 という)と、 前記復号ゲインと 、 第 2の方式におけるゲインコードブックから読み出されるゲインとに基づき、 第 2の符号列におけるゲイン情報を求める処理、
を実行させるためのプログラムを、 コンビュ一夕で利用可能な媒体に含むコン ピュータ ·プログラム ·プロダクト。
2 3 . 請求の範囲第 2 1項に記載のコンピュータ ·プログラム ·プロダクトに おいて、
前記修正最適ゲインと、 前記ゲインコードブックから読み出されるゲインとか ら第 1の自乗誤差を計算し、 前記最適ゲインと、 前記ゲインコードブックから読 み出されるゲインとから第 2の自乗誤差を計算し、 前記第 1の自乗誤差と前記第 2の自乗誤差に基づく評価関数が最小となるゲインを前記ゲインコードブックか ら選択することによって第 2の符号列におけるゲイン情報を求める処理、 を前記 コンピュータに実行させるためのプログラムを含むコンピュータ ·プログラム · プロダクト。
2 4 . 請求の範囲第 2 2項に記載のコンピュータ ·プログラム ·プロダク卜に おいて、
前記修正復号ゲインと、 前記ゲインコードブックから読み出されるゲインとか ら第 1の自乗誤差を計算し、 前記復号ゲインと、 前記ゲインコードブックから読 み出されるゲインとから第 2の自乗誤差を計算し、 前記第 1の自乗誤差と前記第 2の自乗誤差に基づく評価関数が最小となるゲインを前記ゲインコードブックか ら選択することによって第 2の符号列におけるゲイン情報を求める処理、 を前記 コンピュータに実行させるためのプログラムを含むコンピュータ ·プログラム · プロダク卜。
2 5 . 請求の範囲第 2 1項又は第 2 3項に記載のコンピュータ ·プログラム · プロダク卜において、
前記修正最適ゲインが、 前記最適ゲインの長時間平均に基づくものである、 こ とを特徴とするコンピュータ ·プログラム ·プロダク卜。
2 6 . 請求の範囲第 2 2項又は第 2 4項に記載のコンピュータ,プログラム · プロダクトにおいて、
前記修正復号ゲインが、 前記復号ゲインの長時間平均に基づくものである、 こ とを特徴とするコンピュータ ·プログラム ·プロダク卜。
2 7 . 請求の範囲第 2 2項乃至第 2 6項のいずれか一項に記載のコンピュータ •プログラム ·プロダク卜において、
前記第 2の符号列から得られる情報により生成される第 2の音声信号と、 前記 第 1の音声信号との距離を最小とするゲインを前記最適ゲインとして求める処理 、 を前記コンピュータに実行させるためのプログラムを含むコンピュータ ·プロ グラム ·プロダク卜。
2 8 . 請求の範囲第 2 1項乃至第 2 6項のいずれか一項に記載のコンピュータ •プログラム ·プロダク卜において、
前記評価関数が、 前記第 1の自乗誤差と前記第 2の自乗誤差と重み係数とから なる、 ことを特徵とするコンピュータ ·プログラム ·プロダクト。
2 9 . 請求の範囲第 2 1項又は第 2 2項に記載のコンピュータ ·プログラム · プロダクトにおいて、
前記第 1の線形予測係数に基づき、 音声区間 Z非音声区間を識別する音声判別 値を出力する処理と、
前記音声判別値が非音声区間を示すとき、 第 2の符号列におけるゲインの時間 変動が小さくなるような評価関数を用いて、 前記第 2の符号列におけるゲイン情 報を求める処理と、
を前記コンピュータに実行させるためのプログラムを含むコンピュータ ·プロ グラム ·プロダク卜。
3 0 . 請求の範囲第 2 3項又は第 2 4項に記載のコンピュータ ·プログラム · プロダク卜において、
前記第 1の線形予測係数に基づき、 音声区間 非音声区間を識別する音声判別 値を出力する処理と、
前記評価関数は、 前記第 1の自乗誤差と前記第 2の自乗誤差とを重み係数によ り加重平均して求められるものであり、 前記音声判別値に基づき、 音声区間と非 音声区間とに応じて、 前記重み係数をそれぞれ所定の値に設定し、 前記評価関数 を計算する処理と、
を前記コンピュータに実行させるためのプログラムを含むコンピュータ ·プロ グラム ·プロダクト。
3 1 . 請求の範囲第 2 1項乃至第 3 0項のいずれか一項に記載の前記プロダラ ムを記録した、 コンピュータで読み取り可能な記録媒体。
3 2 . 第 1の方式で音声信号を符号化した符号を多重してなる符号列データを 符号分離回路に入力し、 前記符号分離回路にて分離された符号に基づき、 前記第 1の方式とは別の第 2の方式に準拠する符号に変換し、 該変換された符号を符号 多重回路に供給し、 前記符号多重回路から前記変換された符号を多重してなる符 号列データを出力する符号変換装置において、 前記符号分離回路で分離された線形予測係数符号に基づき、 第 1の方式と第 2 の方式で復号してなる第 1、 第 2の線形予測係数を生成する回路と、
前記符号分離回路から入力した第 1の方式の適応コードブック (ACB) 符号 を、 第 1の方式における符号と第 2の方式における符号との対応関係を用いて読 み替えることにより第 2の方式の ACB符号を得、 前記符号多重回路へ出力し、 前記第 2の AC B符号に対応する AC B遅延を第 2の AC B遅延として目標信号 計算回路へ出力する手段を含む適応コードブック符号変換回路 ( 「ACB符号変 換回路」 という) と、
前記符号分離回路で分離された第 1の方式における A C B符号、 固定コードブ ック (FCB) 符号及びゲイン符号を含む励振信号情報を入力として受け取って それぞれを復号し、 前記符号分離回路で分離された線形予測係数符号に基づき第 1の方式で復号してなる第 1の線形予測係数をもつ合成フィル夕を、 前記励振信 号情報から得られる励振信号で駆動することで、 復号音声信号を合成して出力す る音声復号回路と、
前記符号分離回路から出力される第 1の方式の FCB符号を入力し、 前記 FC B符号を第 2の方式により復号可能な符号に変換し、 前記変換した F C B符号を 、 第 2の FCB符号として前記符号多重回路へ出力し、 前記第 2の FCB符号に 対応する第 2の FCB信号を出力する固定コードブック符号生成回路 ( 「FCB 符号生成回路」 という) と、
前記第 1の線形予測係数と前記第 2の線形予測係数から構成される聴感重み付 け合成フィル夕のインパルス応答信号を出力するインパルス応答計算回路と、 前記目標信号計算回路と、
ゲイン符号生成回路と、
を備え、
前記目標信号計算回路は、
前記音声復号回路の合成フィル夕から出力される復号音声を入力し、 前記第 1 の線形予測係数を用いて構成される聴感重み付けフィル夕を前記復号音声で駆動 して聴感重み付け音声信号を生成するとともに、 前記第 1及び第 2の線形予測係 数を用いて構成される聴感重み付け合成フィルタの零入力応答を、 前記聴感重み 付け音声信号から減算して得られる第 1の目標信号を生成する重み付け信号計算 回路と、
前記重み付け信号計算回路から出力される前記第 1の目標信号と、 前記 A C B 符号変換回路から出力される前記第 2の A C B遅延と、 前記ィンパルス応答計算 回路から出力される前記インパルス応答信号と、 過去の第 2の励振信号を記憶保 持する第 2の励振信号記憶回路から出力される過去の第 2の励振信号とを入力し 、 前記過去の第 2の励振信号から、 遅延 k (ただし、 kは前記第 2の A C B遅延 ) で切り出された信号と前記インパルス応答信号との畳み込みにより、 フィル夕 処理された遅延 kの過去の励振信号を計算して第 2の A C B信号として出力する A C B信号生成回路と、
前記重み付け信号計算回路から出力される前記第 1の目標信号と、 前記 A C B 信号生成回路から出力される、 前記フィル夕処理された遅延 kの過去の励振信号 とを入力し、 前記第 1の目標信号と、 前記フィル夕処理された遅延 kの過去の励 振信号とから、 最適 A C Bゲインを導出して出力する最適 A C Bゲイン計算回路 と、
を備え、
前記ゲイン符号生成回路は、
前記目標信号計算回路から出力される、 前記第 1の目標信号と、 前記第 2の A C B信号と、 前記最適 A C Bゲインと、 前記 F C B符号生成回路から出力される 前記第 2の F C B信号と、 前記インパルス応答計算回路から出力される前記イン パルス応答信号と、 前記第 1の線形予測係数とを入力し、
前記第 1の目標信号と前記第 2の A C B信号と前記最適 A C Bゲインと前記ィ ンパルス応答信号とから第 2の目標信号を計算し、 前記第 2の目標信号と、 前記 第 2の F C B信号と前記ィンパルス応答信号とから最適 F C Bゲインを計算する 手段と、
前記最適 A C Bゲインから修正 A C Bゲインを求める手段と、
前記計算された最適 F C Bゲインを入力し、 前記最適 F C Bゲインから修正 F C Bゲインを計算する手段と、
前記第 1の線形予測係数から音声判定値を決定する手段と、 ACBゲインコードブックから順次読み込まれる ACBゲインと、 前記最適 A CBゲインとから第 1の自乗誤差を計算し、 前記 AC Bゲインと前記修正 AC B ゲインとから第 2の自乗誤差を計算する手段と、
前記音声判定値から計算される重み係数と、 前記第 1の自乗誤差と前記第 2の 自乗誤差とから計算される第 1の評価関数を最小とする AC Bゲイン及び対応す る AC Bゲイン符号を選択する手段と、
F C Bゲインコードブックから順次読み込まれる F C Bゲインと前記最適 F C Bゲインとから第 3の自乗誤差を計算し、 前記 F C Bゲインと前記修正 F C Bゲ インとから第 4の自乗誤差を計算する手段と、
前記音声判定値から計算される重み係数と第 3の自乗誤差と第 4の自乗誤差と から計算される第 2の評価関数を最小とする F C Bゲイン及び対応する F C Bゲ イン符号を選択する手段と、
選択された A C Bゲイン符号と F C Bゲイン符号とからなる第 2のゲイン符号 を、 第 2の方式におけるゲイン復号方法により復号可能な符号として前記符号多 重回路出力する手段と、
を備えている、 ことを特徴とする符号変換装置。
33. 前記目標信号計算回路から出力される第 2の ACB信号と、 前記 FCB 符号生成回路から出力される第 2の FCB信号と、 前記ゲイン符号生成回路から 出力される第 2の AC Bゲインと第 2の FCBゲインとを入力し、 前記第 2の A CB信号に第 2の ACBゲインを乗じて得た信号と、 前記第 2の FCB信号に第 2の FCBゲインを乗じて得た信号と、 を加算して第 2の励振信号を得、 前記第 2の励振信号を前記第 2の励振信号記憶回路へ出力する第 2の励振信号計算回路 を備え、
前記第 2の励振信号記憶回路は、 前記第 2の励振信号計算回路から出力される 第 2の励振信号を入力し、 これを記憶保持し、 過去に入力されて記憶保持されて いる第 2の励振信号を前記目標信号計算回路へ出力する、 ことを特徴とする請求 の範囲第 32項に記載の符号変換装置。
34. 前記ゲイン符号生成回路は、
前記 AC B信号生成回路から出力される前記第 2の AC B信号と、 前記重み付 け信号計算回路から出力される前記第 1の目標信号と、 前記ィンパルス応答計算 回路から出力される前記ィンパルス応答信号と、 前記 A C Bゲイン符号化回路か ら出力される前記第 2の A C Bゲインとを入力し、 前記第 2の A C B信号と前記 ィンパルス応答信号との畳み込みにより、 フィルタ処理された第 2の A C B信号 を計算し、 前記フィル夕処理された第 2の A C B信号に前記第 2の A C Bゲイン を乗じて得られる信号を、 前記第 1の目標信号から減算して第 2の目標信号を導 出し前記第 2の目標信号を出力する第 2の目標信号計算回路と、
前記 F C B信号生成回路から出力される前記第 2の F C B信号と、 前記ィンパ ルス応答計算回路から出力される前記インパルス応答信号と、 前記第 2の目標信 号計算回路から出力される前記第 2の目標信号とを入力し、 前記第 2の F C B信 号とィンパルス応答信号との畳み込みにより、 フィルタ処理された第 2の F C B 信号を計算し、 前記第 2の目標信号と前記第 2の F C B信号との距離を最小とす る最適 F C Bゲインを計算する最適 F C Bゲイン計算回路と、
前記第 1の線形予測係数とその長時間平均とから線形予測係数の変動量を計算 し音声判定値を決定する音声 Z非音声識別回路と、
前記 A C B信号生成回路から出力される前記最適 A C Bゲインと、 前記音声/ 非音声識別回路から出力される前記音声判定値とを入力し、 前記音声判定値が非 音声区間のとき、 前記最適 A C Bゲインの長時間平均を修正 A C Bゲインとして 非音声区間において前記最適 A C Bゲインの長時間平均を計算し、 音声区間のと き、 前記最適 A C Bゲインそのものを修正 A C Bゲインとして出力する、 最適 A C Bゲイン修正回路と、
前記 A C B信号生成回路から出力される前記最適 A C Bゲインと、 前記最適 A C Bゲイン修正回路から出力される前記修正 A C Bゲインと、 前記音声/非音声 識別回路から出力される前記音声判定値とを入力し、 前記 A C Bゲインコードブ ックから順次読み込まれる A C Bゲインと、 前記最適 A C Bゲインとから第 1の 自乗誤差を計算し、 前記 A C Bゲインと前記修正 A C Bゲインとから第 2の自乗 誤差を計算し、 前記音声判定値から計算される重み係数と、 前記第 1の自乗誤差 と、 前記第 2の自乗誤差とから評価関数を求め、 前記評価関数が最小となる A C Bゲインを選択し、 選択された前記 A C Bゲインを第 2の A C Bゲインとして前 記第 2の目標信号計算回路へ出力するとともに、 前記第 2の励振信号計算回路へ 出力し、 前記第 2の A C Bゲインに対応する符号を A C Bゲイン符号としてゲイ ン符号多重化回路へ出力する A C B符号ゲイン符号化回路と、
前記最適 F C Bゲイン計算回路から出力される前記最適 F C Bゲインと、 前記 音声/非音声識別回路から出力される前記音声判定値とを入力し、 前記音声判定 値が非音声区間のとき、 前記最適 F C Bゲインの長時間平均を修正 F C Bゲイン とし、 前記音声判定値が音声区間のとき、 最適 F C Bゲインそのものを修正 F C Bゲインとし、 前記修正 F C Bゲインを F C Bゲイン符号化回路へ出力する最適 F C Bゲイン修正回路と、
前記最適 F C Bゲイン計算回路から出力される前記最適 F C Bゲインと、 前記 最適 F C Bゲイン修正回路から出力される前記修正 F C Bゲインと、 前記音声/ 非音声識別回路から出力される前記音声判定値を入力し、 前記 F C Bゲインコー ドブックから順次読み込まれる F C Bゲインと、 前記最適 F C Bゲインとから第 3の自乗誤差を計算し、 前記 F C Bゲインと前記修正 F C Bゲインとから第 4の 自乗誤差を計算し、 前記音声判定値から計算される重み係数と前記第 3の自乗誤 差と前記第 4の自乗誤差とから評価関数を計算し、 前記評価関数が最小となる F C Bゲインを選択し、 選択された前記 F C Bゲインを第 2の F C Bゲインとして 前記第 2の励振信号計算回路へ出力し、 第 2の F C Bゲインに対応する符号を F C Bゲイン符号としてゲイン符号多重化回路へ出力する F C Bゲイン符号化回路 と、
前記 A C Bゲイン符号化回路から出力される A C Bゲイン符号と、 前記 F C B ゲイン符号化回路から出力される F C Bゲイン符号とを入力し、 A C Bゲイン符 号と F C Bゲイン符号とを多重化して得られる第 2のゲイン符号を、 第 2の方式 におけるゲイン復号方法により復号可能な符号として前記符号多重回路へ出力す るゲイン符号多重回路と、
を備えている、 ことを特徴とする請求の範囲第 3 2項に記載の符号変換装置。
3 5 . 第 1の方式で音声信号を符号化した符号を多重してなる符号列データを 符号分離回路に入力し、 前記符号分離回路にて分離された符号に基づき、 前記第 1の方式とは別の第 2の方式に準拠する符号に変換し、 該変換された符号を符号 多重回路に供給し、 前記符号多重回路から前記変換された符号を多重してなる符 号列データを出力する符号変換装置において、
前記符号分離回路で分離された線形予測係数符号に基づき、 第 1の方式と第 2 の方式で復号してなる第 1、 第 2の線形予測係数を生成する回路と、
前記符号分離回路から出力される第 1の ACB符号を入力し、 前記第 1の AC B符号を第 2の方式により復号可能な符号に変換し、 変換された AC B符号を、 第 2の AC B符号として前記符号多重回路へ出力する AC B符号変換回路と、 前記符号分離回路から出力される第 1の FCB符号を入力し、 前記第 1の FC B符号を第 2の方式により復号可能な符号に変換し、 変換された FCB符号を、 第 2の F C B符号として前記符号多重回路へ出力する F C B符号変換回路と、 前記符号分離回路から出力される第 1のゲイン符号を入力し、 前記第 1のゲイ ン符号を第 2の方式により復号可能な符号に変換し、 変換されたゲイン符号を、 第 2のゲイン符号として前記符号多重回路へ出力するゲイン符号変換回路と、 を備え、
前記ゲイン符号変換回路が、
前記符号分離回路から出力される第 1のゲイン符号と、 前記第 1の線形予測係 数とを入力し、 前記第 1のゲイン符号を、 第 1の方式におけるゲイン復号方法に より復号して得られる第 1の適応コードブック (ACB) ゲイン及び第 1の固定 コードブック (FCB) ゲインから、 修正 AC Bゲイン及び修正 FCBゲインを 計算する手段と、
前記第 1の線形予測係数から音声判定値を決定する手段と、
AC Bゲインコードブックから順次読み込まれる AC Bゲインと、 前記第 1の A C Bゲインとから第 1の自乗誤差を計算し、 前記 A C Bゲインと前記修正 A C Bゲインとから第 2の自乗誤差を計算し、 前記音声判定値から計算される重み係 数と、 前記第 1の自乗誤差と、 前記第 2の自乗誤差とから計算される第 1の評価 関数が最小となる AC Bゲイン及び対応する AC Bゲイン符号を選択する手段と
FCBゲインコードブックから順次読み込まれる FCBゲインと前記第 1の F CBゲインとから第 3の自乗誤差を計算し、 〇8ゲィンと前記修正 。8ゲィ ンとから第 4の自乗誤差を計算し、 前記音声判定値から計算される重み係数と、 前記第 3の自乗誤差と、 前記第 4の自乗誤差とから計算される第 2の評価関数を 最小とする F C Bゲイン及び対応する F C Bゲイン符号を選択する手段と、 選択された前記 AC Bゲイン符号と前記 F C Bゲイン符号とからなる第 2のゲ イン符号を、 第 2の方式におけるゲイン復号方法により復号可能な符号として符 号多重回路へ出力する手段と、
を備えている、 ことを特徵とする符号変換装置。
36. 前記ゲイン符号変換回路が、
前記第 1の線形予測係数とその長時間平均とから線形予測係数の変動量を計算 し音声判定値を決定する音声 非音声識別回路と、
前記符号分離回路から出力される第 1のゲイン符号を入力し、 第 1のゲイン符 号から A C Bゲイン及び F C Bゲインに対応する第 1の A C Bゲイン符号及び第 1の F C Bゲイン符号を分離し、 第 1の AC Bゲイン符号を AC Bゲイン復号回 路へ出力し、 第 1の F C Bゲイン符号を F C Bゲイン復号回路へ出力するゲイン 符号分離回路と、
複数セットの A C Bゲインが格納された A C Bゲインコードブックを備えてお り、 前記ゲイン符号分離回路から出力される第 1の AC Bゲイン符号を入力し、 前記第 1の AC Bゲイン符号に対応する AC Bゲインを第 1の AC Bゲインコー ドブックより読み出し、 読み出された ACBゲインを第 1の ACBゲインとして AC Bゲイン修正回路へ出力するとともに、 AC Bゲイン符号化回路へ出力し、 AC Bゲイン符号からの AC Bゲインの復号は、 第 1の方式における AC Bゲイ ンの復号方法に従い、 第 1の方式の AC Bゲインコードブックを用いる AC Bゲ イン復号回路と、
複数セッ卜の F C Bゲインが格納された F C Bゲインコードブックを備えてお り、 前記ゲイン符号分離回路から出力される第 1の FCBゲイン符号を入力し、 前記第 1の F C Bゲイン符号に対応する F C Bゲインを第 1の F C Bゲインコー ドブックより読み出し、 読み出された FCBゲインを第 1の FCBゲインとして F C Bゲイン修正回路へ出力するとともに、 F C Bゲイン符号化回路へ出力し、 FCBゲイン符号からの FCBゲインの復号は、 第 1の方式における FCBゲイ ンの復号方法に従い、 第 1の方式の F C Bゲインコードブックを用いる F C Bゲ イン復号回路と、
前記 A C Bゲイン復号回路から出力される前記第 1の A C Bゲインと、 前記音 声/非音声識別回路から出力される前記音声判定値とを入力し、 前記音声判定値 が非音声区間のとき、 前記第 1の AC Bゲインの長時間平均を修正 AC Bゲイン とし、 音声区間のとき、 前記第 1の ACBゲインそのものを修正 ACBゲインと し、 前記修正 A C Bゲインを A C Bゲイン符号化回路へ出力する A C Bゲイン修 正回路と、
前記 F C Bゲイン復号回路から出力される前記第 1の F C Bゲインと、 前記音 声/非音声識別回路から出力される前記音声判定値とを入力し、 前記音声判定値 が非音声区間のとき、 前記第 1の F C Bゲインの長時間平均を修正 F C Bゲイン とし、 前記音声判定値が音声区間のとき、 前記第 1の FCBゲインそのものを修 正 F C Bゲインとし、 前記修正 F C Bゲインを F C Bゲイン符号化回路へ出力す る FCBゲイン修正回路と、
前記 AC Bゲイン復号回路から出力される前記第 1の AC Bゲインと、 前記 A C Bゲイン修正回路から出力される前記修正 A C Bゲインと、 前記音声/非音声 識別回路から出力される音声判定値とを入力し、 前記 AC Bゲインコードブック から順次読み込まれる AC Bゲインと第 1の AC Bゲインとから第 1の自乗誤差 を計算し、 前記 A C Bゲインと前記修正 A C Bゲインとから第 2の自乗誤差を計 算し、 前記音声判定値から計算される重み係数と、 前記第 1の自乗誤差と、 前記 第 2の自乗誤差とから第 1の評価関数を計算し、 前記第 1の評価関数が最小とな る AC Bゲインを選択し、 選択された前記 AC Bゲインを第 2の AC Bゲインと し、 前記第 2の AC Bゲインに対応する符号を第 2の AC Bゲイン符号としてゲ ィン符号多重化回路へ出力する AC Bゲイン符号化回路と、
前記 FCBゲイン復号回路から出力される前記第 1の FCBゲインと、 前記 F C Bゲイン修正回路から出力される前記修正 F C Bゲインと、 前記音声/非音声 識別回路から出力される前記音声判定値とを入力し、 F C Bゲインコードブック から順次読み込まれる F C Bゲインと前記第 1の F C Bゲインとから第 3の自乗 誤差を計算し、 前記 FCBゲインと前記修正 FCBゲインとから第 4の自乗誤差 を計算し、 前記音声判定値から計算される重み係数と、 前記第 3の自乗誤差と、 前記第 4の自乗誤差とから第 2の評価関数を計算し、 前記第 2の評価関数が最小 となる FCBゲインを選択し、 選択された前記 FCBゲインを第 2の FCBゲイ ンとし、 第 2の FCBゲインに対応する符号を第 2の F C Bゲイン符号としてゲ ィン符号多重化回路へ出力する F C Bゲイン符号化回路と、
前記 A C Bゲイン符号化回路から出力される ACBゲイン符号と、 前記 F C B ゲイン符号化回路から出力される FCBゲイン符号とを入力し、 A C Bゲイン符 号と F C Bゲイン符号とを多重化して得られる第 2のゲイン符号を、 第 2の方式 におけるゲイン復号方法により復号可能な符号として前記符号多重回路へ出力す るゲイン符号多重回路と、
を備えている、 ことを特徴とする請求の範囲第 35項に記載の符号変換装置。
PCT/JP2003/008701 2002-07-24 2003-07-09 音声符号化復号方式間の符号変換方法及び装置とその記憶媒体 WO2004010416A1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
DE60327217T DE60327217D1 (de) 2002-07-24 2003-07-09 Verfahren und vorrichtung zur sprachcodekonvertierung
EP03765278A EP1536413B1 (en) 2002-07-24 2003-07-09 Method and device for voice code conversion
US11/039,969 US7231345B2 (en) 2002-07-24 2005-01-24 Method and apparatus for transcoding between different speech encoding/decoding systems
US11/171,387 US7319953B2 (en) 2002-07-24 2005-07-01 Method and apparatus for transcoding between different speech encoding/decoding systems using gain calculations

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2002215766A JP4238535B2 (ja) 2002-07-24 2002-07-24 音声符号化復号方式間の符号変換方法及び装置とその記憶媒体
JP2002-215766 2002-07-24

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US11/039,969 Continuation US7231345B2 (en) 2002-07-24 2005-01-24 Method and apparatus for transcoding between different speech encoding/decoding systems

Publications (1)

Publication Number Publication Date
WO2004010416A1 true WO2004010416A1 (ja) 2004-01-29

Family

ID=30767940

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2003/008701 WO2004010416A1 (ja) 2002-07-24 2003-07-09 音声符号化復号方式間の符号変換方法及び装置とその記憶媒体

Country Status (3)

Country Link
JP (1) JP4238535B2 (ja)
CN (1) CN1327410C (ja)
WO (1) WO2004010416A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11170797B2 (en) 2014-07-28 2021-11-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, method and computer program using a zero-input-response to obtain a smooth transition

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2867648A1 (fr) * 2003-12-10 2005-09-16 France Telecom Transcodage entre indices de dictionnaires multi-impulsionnels utilises en codage en compression de signaux numeriques
DE102006051673A1 (de) * 2006-11-02 2008-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08146997A (ja) * 1994-11-21 1996-06-07 Hitachi Ltd 符号変換装置および符号変換システム
JPH10207491A (ja) * 1997-01-23 1998-08-07 Toshiba Corp 背景音/音声分類方法、有声/無声分類方法および背景音復号方法
JP2002198870A (ja) * 2000-12-27 2002-07-12 Mitsubishi Electric Corp エコー処理装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08146997A (ja) * 1994-11-21 1996-06-07 Hitachi Ltd 符号変換装置および符号変換システム
JPH10207491A (ja) * 1997-01-23 1998-08-07 Toshiba Corp 背景音/音声分類方法、有声/無声分類方法および背景音復号方法
JP2002198870A (ja) * 2000-12-27 2002-07-12 Mitsubishi Electric Corp エコー処理装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11170797B2 (en) 2014-07-28 2021-11-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, method and computer program using a zero-input-response to obtain a smooth transition
US11922961B2 (en) 2014-07-28 2024-03-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, method and computer program using a zero-input-response to obtain a smooth transition

Also Published As

Publication number Publication date
CN1327410C (zh) 2007-07-18
CN1672192A (zh) 2005-09-21
JP2004061558A (ja) 2004-02-26
JP4238535B2 (ja) 2009-03-18

Similar Documents

Publication Publication Date Title
JP3180762B2 (ja) 音声符号化装置及び音声復号化装置
JP2009134303A (ja) 音声復号化方法及び音声復号化装置
JP4304360B2 (ja) 音声符号化復号方式間の符号変換方法および装置とその記憶媒体
JP4108317B2 (ja) 符号変換方法及び装置とプログラム並びに記憶媒体
JP3582589B2 (ja) 音声符号化装置及び音声復号化装置
JP3746067B2 (ja) 音声復号化方法及び音声復号化装置
JP4231987B2 (ja) 音声符号化復号方式間の符号変換方法、その装置、そのプログラム及び記憶媒体
KR100796836B1 (ko) 코드 변환 방법, 장치 및 이 방법을 실행하는 컴퓨터용 프로그램이 기록된 기록 매체
KR101629661B1 (ko) 복호 방법, 복호 장치, 프로그램 및 그 기록매체
JP4396524B2 (ja) 符号変換方法及び装置
WO2004010416A1 (ja) 音声符号化復号方式間の符号変換方法及び装置とその記憶媒体
US7231345B2 (en) Method and apparatus for transcoding between different speech encoding/decoding systems
JP3578933B2 (ja) 重み符号帳の作成方法及び符号帳設計時における学習時のma予測係数の初期値の設定方法並びに音響信号の符号化方法及びその復号方法並びに符号化プログラムが記憶されたコンピュータに読み取り可能な記憶媒体及び復号プログラムが記憶されたコンピュータに読み取り可能な記憶媒体
EP1536413B1 (en) Method and device for voice code conversion
JP4737416B2 (ja) 符号変換方法及び装置
JP3845316B2 (ja) 音声符号化装置及び音声復号装置
JP2004151123A (ja) 符号変換方法、符号変換装置、プログラム及びその記憶媒体
JP2008090311A (ja) 音声符号化方法
JP2000029499A (ja) 音声符号化装置ならびに音声符号化復号化装置
JP2004252490A (ja) 音声符号化装置及び音声復号装置

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): CN KR RU SG US

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): DE ES FR GB IT NL

DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 2003765278

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 20038176750

Country of ref document: CN

Ref document number: 11039969

Country of ref document: US

WWP Wipo information: published in national office

Ref document number: 2003765278

Country of ref document: EP