WO2005114655A1 - 音声・楽音復号化装置および音声・楽音復号化方法 - Google Patents

音声・楽音復号化装置および音声・楽音復号化方法 Download PDF

Info

Publication number
WO2005114655A1
WO2005114655A1 PCT/JP2005/008774 JP2005008774W WO2005114655A1 WO 2005114655 A1 WO2005114655 A1 WO 2005114655A1 JP 2005008774 W JP2005008774 W JP 2005008774W WO 2005114655 A1 WO2005114655 A1 WO 2005114655A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
vector
layer
signal
output
Prior art date
Application number
PCT/JP2005/008774
Other languages
English (en)
French (fr)
Inventor
Kaoru Sato
Toshiyuki Morii
Tomofumi Yamanashi
Original Assignee
Matsushita Electric Industrial Co., Ltd.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co., Ltd. filed Critical Matsushita Electric Industrial Co., Ltd.
Priority to US11/569,377 priority Critical patent/US8255210B2/en
Priority to CA002567788A priority patent/CA2567788A1/en
Priority to CN2005800168247A priority patent/CN1957399B/zh
Priority to EP05739228A priority patent/EP1750254B1/en
Priority to DE602005026802T priority patent/DE602005026802D1/de
Publication of WO2005114655A1 publication Critical patent/WO2005114655A1/ja

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Definitions

  • 0001 relates to voice, voice, and law used in communication systems for transmitting voice and sound signals.
  • 0002 In the field of communication, such as digital line communication and Internet communication, in the field of communication and voice products, the art of voice signals is indispensable in order to effectively use storage media such as radio waves.
  • Equations are used as mainstream equations (for example,).
  • a human voice is output based on the stored voice data of the 003 CP type.
  • the digitized speech signal is cut into ⁇ 2 s degrees, and the linear number and vector of the speech signal are calculated for each unit, and the linear number and vector are set separately. Since the amount of voice data that can be stored is limited in order to execute bit transmission, the conventional CP-type formula mainly stores voice data.
  • Formulas are disclosed (eg, patents).
  • the 5000 scaler expression is composed of a plurality of basic ears, and the ears form a hierarchical structure with the basic ear being the lowest order ear. Then, in the ear, is performed on the signal that is the difference between the signal of the lower ear and the output signal. In this case, the voice / sound can be restored using only the information on the lower ears.
  • Loss Compensation generally, based on the information contained in a previously received message, the current message is generated. For example, the information contained in the music before the lost music is used as the information for the lost music, and the onion of the signal generated by using the information contained in the immediately preceding music is attenuated to a low level. In the law, make up the number of lost mu.
  • a step for generating a report, and a report to be used for each layer is determined from the report and the number of previously received reports according to the report, and the determined report is used to determine the report to be used. And the same number of stages as the number of layers for generating a signal.
  • the information to be used for each layer is determined from the information to be generated and the information and the number of received information in the past according to the information, and the determined information is used to determine the information to be used. And the same number of layers as the number of layers for generating a signal.
  • the information obtained by using another sign is used to obtain the number, so that the number of the number is smaller than when only the information obtained in the past is used. You can aim up.
  • Figure 2 shows the internal configuration of Part 2 pertaining to the present invention.
  • the information is output and transmitted from the other parts, and it is determined whether or not the code is transmitted by a loss, and if the code information is detected.
  • FIG. 4 is a block diagram showing essential configurations of and 5 according to the present invention.
  • 001 is, and 2, and addition 3 , 24, judgment 5, and multiplexing 6. Also, 5 is multiplex 5 and mu 52,
  • the output is transmitted via transmission 3 and transmitted five times.
  • the input signal is a voice / sound signal.
  • 0019 obtains a report from the input voice / sound signal using the CP-type note code method, and converts the obtained report to the first
  • 022224 obtains two reports from the signal output from the addition 3 using the CP sound code method and multiplies the obtained two reports by 6.
  • the information generation unit 235 generates information by a method described later and multiplexes the information.
  • the term “la” is information instructing, in 5), that if information is detected, the 53rd should be used for information and 2 reports should be included.
  • the value of or is used as information. If the la news is, the fifty-third will perform using only the news of the mu, and if the la news is, the fifty-three will perform the using the news of the mu and the second news.
  • 002 46 is the information output from The two information output from the part 4 and the information output from the decision 5 are multiplexed and transmitted as multiplexed information 3.
  • the E2 bet is sent 5 times per game, and if a bet occurs, the upper one of the first and second reports is lost.
  • the timer 52 determines whether the two reports output from the multiplex 5 are normally received, and generates a timer report indicating the determination result.
  • a method of issuing the loss for example, a method of monitoring the information attached to, is known. For example, by monitoring the information attached to, such as the time (ket) of the, the time stamp indicating the time when the, was generated, and the like, and detecting the continuity of these information, the Detect loss.
  • the information for example, a KPs KP number of a communication put, a KPs KP number of a PP, a time stamp information, and the like can be used.
  • values of up to 3 are used as the information.
  • the value of is taken when both the information and the second information are received normally.
  • the value of is taken when it is received normally.2
  • the value of is taken when it is not received properly. Takes the value of 2 if not received, and takes the value of 3 if the second report is received normally.
  • mu 52 The report is numbered 53 2 54.
  • the memory 52 outputs the information that has been normally received in a corresponding manner. Physically, if the news is 3 (if the news was successfully received), the news 52 will
  • the 2nd information is output to the 2nd and 4th.
  • 3 has an internal memory for storing the information of
  • the information is restored using the CP-type method and the information is returned. If the information is, the information of the immediately previous element is restored using the CP-type information and the information is returned. Inputs two reports from 254 and restores the two reports and the report that is captured as the previous report using the CP-based method. In the case of (3), if the report is, do not use the report 2.
  • the information when the information is received normally, the information is restored, and when the information is not received normally, the information included in the immediately preceding message is restored. Also, in the present embodiment, if two reports are received normally, and if the information is not received normally, in addition to the information contained in the immediately preceding message, the two reports are used, so that the We aim for higher quality.
  • 53 adds 5 to the number determined by: Also, 53 is if the news is 3 In this case, the second report is issued. In the case of 3, if the news report is 2 or more, the news of the immediately preceding news report is output.
  • the memory 254 has a built-in memory for storing the two reports of the immediately preceding message. If the two reports of the message are not normally received, the two reports of the immediately preceding message stored in the memory are restored. Used when Next, at 254, refer to the news report. If the news report is 3, input two news reports from the news 52, and use the P-type method to restore the two news reports. In case of
  • the law is used to recover two reports and the previous report, and if the report is
  • 254 uses the two reports and the report of the immediately preceding message, and when the two reports are not received normally, The two previous reports and the last report were used.
  • 254 adds the number 2 obtained by To do. In the case of 254, if the news is 2, the second report 53 is executed.
  • the number 53 and the number 2 and the number 2 are input, and the number and the number 2 are added, and the number resulting from the addition is used as the output number.
  • FIG. 2 is a block diagram showing the configuration of the part. Is to cut the input voice / sound signal without sampling (where is a natural number), and set the sampling as a unit for each unit.
  • the C component is removed, and the reasoning and the following reasoning are improved, and (Xn) is subjected to SP22 and 25.
  • the SP 23 processes the SP output from the SP 22 and synthesizes the SP (SP) obtained by the processing.
  • the SP 23 multiplexes SP () representing the SP into the multiplexing unit 24.
  • the ita 24 generates a composite signal by performing an iterative process on the output from the addition 2 described later, based on the number of bits of the SP, and adds the composite signal 25.
  • 046 26 is the drive signal output by Addition 2 in the past.
  • a sump stored in the memory and specified by the signal output from the radiator 23 is extracted from the sampling position, and is multiplied 29 as a vector.
  • the adaptation 26 updates the update every time the drive is added from the addition 2.
  • the calculus 27 determines the gain and the first gain based on the signal output from the radiator 23, and sets these to 2 9 multiplication 2 respectively.
  • 048 28 is identified by the number output from
  • the gain output from the element 27 is multiplied by the vector output from the adaptation 26, and the result is added 2.
  • the gain output from 27 is multiplied by the vector output from fixed 28, and the result is added 2.
  • 00052 inputs the gain vector and the 29 multiplier 2 respectively, adds the gain vector and the gain vector, and synthesizes the result of the addition by the synthesis iterators 24 and 26.
  • the drive input to the adaptation 26 is stored in the memory.
  • the error signal output from the addition 25 is perceptually weighted, and the error signal is subjected to a ramification 23.
  • the radiator 23 selects a lag from the adaptation 26 that minimizes only the output from the hearing sense 22 and indicates the selection result.
  • the lag is a place for cutting out a vector, and will be described later in detail.
  • the parameter 23 selects the vector that minimizes only the output from the auditory sense 22 from the fixed 2 8 and indicates the selection result.
  • the vector () is multiplexed into 24. Also, Lam 2 3 Minimizes only the output from hearing
  • the acquisition and the acquisition are selected from 27, and (G) indicating the selection result is set to the multiplexing unit 24.
  • the multiplexing unit 24 inputs SP () from SP 23, inputs lag (), vector (), and (G) from ram 23 and multiplexes these information.
  • SP 23 determines the SP.
  • the number to be assigned to () is set to 8, and the case where the SP is selected is briefly described as an example.
  • SP 23 has an SP dock in which 256 types of SP vector sp (0 are stored.
  • 1 is an index assigned to the SP vector and takes a value of ⁇ 255.
  • SP is an index assigned to the SP vector and takes a value of ⁇ 255.
  • SP 23 is the SP output from SP 22. Here, it is an S-element.
  • SP 23 obtains e with the SP SP vector sp u by ().
  • the multiplexed output 24 is output as P (), and the composite it is output as Sp 1 as SP.
  • the reason 2 to determine the lag is 3 Will be explained.
  • the character 3 is the adaptation 26
  • the character 32 is the source of the vector
  • the vector 33 is the extracted vector.
  • Numerals 4 and 296 correspond to the upper and lower limits of the range in which the cutout 32 is moved.
  • the number of bits assigned to () representing lag is set to 8, which can be set to 256 (for example, 4 to 296).
  • moving the cutout 32 can be set arbitrarily.
  • the parameter 23 moves the cutout 32 within the set area, and sequentially instructs the adaptation 26 to the cutout 32.
  • adaptation 26 uses the cutout 32 indicated by the radiator 23 to
  • the vector 33 is cut out by the length of the mu, and the cut vector is multiplied by 29. Next, Lam 2 3
  • the protrusion 32 formed by the lamella 23 is a lug.
  • the ram- er 23 makes the lag () representing the lag minimizing the code into a multiplex 24.
  • each of the tracks 4 4 2 4 3 generates a unit ().
  • the multiplication 4 456 adds polarity to the unit generated by the tiger 4 4 4 3.
  • 47 is an addition for adding the three generated single cells
  • a vector 48 is a vector formed of the three single cells.
  • each of the generated unit cells is given a property by 4 456, and three units are added by an addition unit 47, and a vector 48 as an addition result is formed.
  • Lamometer 23 moves the polarity of three single elements, and sequentially fixes the generated polarity.
  • the fixed unit 28 configures the vector 48 using the generated polarity indicated by the parameter 23 and multiplies the configured vector 48 by 2.
  • the radiator 23 obtains only the output from the auditory recognition 22 in combination with all the polarities, and determines the combination with the generated polarity having the minimum sign.
  • the radiator 23 multiplies the vector () representing the combination with the generated polarity with the minimum code into a multiplex 24.
  • the parameter 23 is generated from the parameter 27
  • 27 has 256 kinds of generated vectors, g n, and stored.
  • k is an index attached to the vector and takes a value of ⁇ 255.
  • the vector gan is a binary element, and takes a value from to.
  • the parameter 23 instructs the value of k to 27 in order from 255 to 255.
  • 27 uses k indicated by the parameter 23 to select do, gan, and gan (0).
  • gan ⁇ ⁇ is The parameter 23 determines only the output from the auditory perception 22 for all k, and determines (k) of k that minimizes the sign.
  • SP () is output to SP 52 and separated
  • the SP 52 sets the SP () output from the multiplex 5 to the SP, and sets the resulting SP as the synthesis iter 5 32 4 judgment 5.
  • the sump specified by the lag () output from the multiplex 5 is cut out from the sample at the outlet position, and the cut out is multiplied by 58 as the vector. Also adapt
  • 5 5 is 2 4 with the exit specified by the lug () as the first lug.
  • the update is performed.
  • 00775 performs a calculation with the vector of the output of the multiplication 589 to generate a drive, and sets the drive to the combining unit 5355.
  • the drive input to the adaptation 55 is stored in the buffer.
  • the iter 53 performs an iterative process by using the drive output from the adder 5 and the number of the iterators generated by the SP 52, and outputs the combined signal to the post-processing unit 54.
  • the post-processing unit 54 applies, to the signal output from the synthesis filter 53, a process of improving the visual quality of the font pitch voice and a process of improving the visual quality of the stationary sound. , As a number.
  • the C component is removed, and the reasoning and unwinding are performed in order to improve the issuance and subsequent processing, and (Xn) of these is subjected to SP 62 and SP 65.
  • the SP 63 includes the SP and SP 62 to 2 SP. Next, SP 63 calculates SP by inverting the nature of SP and adding it to 2 SP. Next, SP 63 calculates the SP by adding the calculated SP (SP SP. The SP is synthesized and the 2 SP (2) representing the SP is multiplexed by the multiplexing section 64. Also, SP 63
  • the iter 64 generates a composite signal by performing an iterative operation on the output from the addition 6 described later, based on the number of bases in 2SP, and adds the composite signal 65.
  • 0085 65 calculates the signal by inverting the sex of the composite signal and adding the result to Xn, and then auditories the signal 62.
  • 008 66 is stored in the drive output in the past by addition 6, and also corresponds to the extension position specified by the signal output from the rag parameter 63. Cut out the sump from the right, multiply as 2 vector and multiply by 69. In addition, the adaptation 66 updates every time the drive is added from the addition 6.
  • the second gain and the second gain are determined by the signal output from the radiator 63, and these are each multiplied by 6 9 to 6.
  • 008868 multiplies 6 a vector having a shape specified by the signal output from the lamella 63 as two vectors.
  • 008969 multiplies the 2 gains output from 67 by the 2 vectors output from the adaptation 66 and adds 6. 6 is 2 output from 6 7
  • the input unit 906 6 inputs the two vectors of the gain and the two vectors of the gain from the 69 multiplication 6 respectively, adds them, and outputs the addition result as a composite iterator 64 and 66.
  • the drive input to the adaptation 66 is stored in the memory.
  • the finding 62 is an auditory weight for the error signal output from the addition 65. It is attached, and it is lumped as a sign.
  • the radiator 6 3 selects 2 lags from the adaptation 6 6 which minimizes only the output from the hearing detection 6 2 and indicates the selection result 2
  • the lag (2) is multiplexed into 64.
  • the two lags are a device for cutting out two vectors and will be described later in detail.
  • the lamella 63 selects two vectors that minimize only the output from the auditory sense 62 from the fixed 68, and multiplexes the two vectors (2) indicating the selection result.
  • the radiator 6 3 minimizes only the output from the hearing
  • the gain and the second gain are selected from 67, and 2 (G2) indicating the selected result is multiplexed 64.
  • the number to be assigned to (2) is set to 8, and the case where the SP is selected is briefly described as an example.
  • SP 63 has a 2SP dock containing 256 types of 2SP vectors sp (generated.
  • 2 is an index assigned to the 2SP vectors and takes a value of 255.
  • the 2 SP vector sp (1 is the original vector, and takes the value of.
  • SP 6 3 is the 2 SP output from SP 6 2, where 2 SP is the original vector. Also, SP 6 3 was output from 2
  • SP 63 calculates (SPesU by (2).
  • SP 63 becomes SPes 2 SP vector sp 1 according to (3).
  • SP 6 3 calculates the squared e by all 2 and determines (2) of 2 that minimizes the squared e.
  • SP 63 obtains 2 SPsp by (4).
  • SP 63 synthesizes 2 SPsp. It is possible that the SP obtained by SP 63 is 2 SP.
  • the character 7 is an adaptation 66
  • the character 72 is a source of two vectors
  • the vector 73 is a cut two vectors.
  • the numerical values 4 and 296 correspond to the limit and the upper limit of the circumference of the lag search of the lag 23.
  • 6 and 5 correspond to the upper and lower limits of the range in which the two vectors are moved.
  • the number of bits assigned to (2) which represents 2 lags, is set to 5
  • it can be set to 32 (for example, 6 to 5).
  • moving the cutout 72 can be set arbitrarily.
  • 0104 Lamter 6 3 inputs the lag from 2 Move the cutout 7 2 Set the range to 6-5.
  • the radiator 63 moves the cutout 72 within the set area, and sequentially instructs the adaptation 66 to the cutout 72.
  • the adaptation 66 uses the clipping 72 indicated by the parameter 63 to cut out the two vectors 73 by the length of m, and multiplies the cut two vectors 73 by the multiplication 69.
  • the output from the auditory recognition 62 is obtained, and the projection 72 with the minimum sign is obtained. To determine.
  • the lag 2 lag v is added, and the addition result is cut out to obtain 2 2 to cut out 2 lags 7 3.
  • Lam 6 3 represents 2 lags that minimize the sign
  • Lamata 63 is vector.
  • Two vectors (2) are determined by the same principle as that for determining ().
  • the method of determining 2 (G2) is the same as the method of determining the value of (G) by the method of determining the value of (G). . 5 is SP, 2 is SP, 2
  • the judgment 5 has a function of storing the SP of the memory therein.
  • the SP that has been given is referred to as a SP.
  • the input signal 53 is separated into (G) by the multiplex 8. SP released () is SP
  • the lag () that is output to 82 and the separated lag () is output to the adaptation 85, and the separated lag (G) is output to 86.
  • the separated vector () is output as a fixed 8 7.
  • the SP 82 inputs the SP () from the multiplex 8 and performs the SP from the SP () when the information is 3, if necessary.
  • the mu SP inputs the mu SP from the coding unit 8 and sets it as SP.
  • the SP 8 2 When the information is 2, the SP 8 2
  • SP SP is input, and the result of adding these is designated as SP. However, if the information is
  • the SP 82 uses the SP as the synthesis unit 83 and the working unit 8. Work 8 output
  • the SP is referred to as the former SP during the course of the process.
  • [0118] 85 is stored in the drive previously output by the addition 8.
  • Reference numeral 5 indicates a code generator 8 information. 8 5 If multiplex information is 3, enter lag () from multiplex 8 and
  • the mug is input from the encoding unit 8, and a sample corresponding to the mug is cut out from the sum designated by the mulag at the exit location, and the cut out is regarded as a vector.
  • 8 5 is, when the mu information is 2, inputs mulag 2 lag from the coding unit 8 and cuts out a sump of mu from the exit location determined by the addition result of adding these. , And the cut out is the vector.
  • the adaptation 85 multiplies the vector by 8 8.
  • the adaptation 85 works 8 with the vector exit at the exit. Tsukubu 8
  • the output lag is used as the front lag during the humming process.
  • the adaptation 85 updates the data every time the drive is input from the addition 8.
  • the gain and the first gain specified in (G) are performed. 8 6 indicates that if the mu information is
  • the second and third gains are input, the second and third gains are added, and the result of multiplying the addition result by 5 is determined as the first gain.
  • Tsukubu 8 The gains and the first gains that are output are referred to as the previous gains and the previous gains in the process of learning.
  • 012187 enters the encoding unit 8 information.
  • 8 7 is multiplexed if the
  • Tsukubu 8 The output vector is used as the previous vector in the processing of the music.
  • the 01238 performs a calculation with the vector of the output from the multiplication 88889, generates a drive, and sets the drive as a composite inverter 8385.
  • the iter 83 uses the drive output from the adder 8 and the number of the iterators generated by the SP 82 to perform the iterative process, and outputs the combined signal to the post-processing unit 84.
  • the post-processing unit 84 performs, for the signal output from the synthesis iter 83, processing to improve the visual quality of the pitch sound, or to improve the visual quality of the stationary sound. , As a number.
  • the working unit 8 has a memory for storing various lamellas therein, and is provided with an SP (mu SP), a lug (mu lug), and a lug (mu, mu). (M) and the vector (M)
  • the work part 8 inputs the information about the music 52.
  • the encoding unit 8 sets the second
  • the coding unit 8 sets the mu information as SP 8 285 8 6 fixed 87. If the news is, the work part 8 will apply the SP 82
  • the gain is fixed, and the gain is fixed. If the work information is 2, SP 8 2 SP
  • the SP is set to SP 82, the lag is set to 85, the gain and the gain are set to 86, and the vector is fixed to 87.
  • the encoding unit 8 outputs the SP lag acquisition and the acquisition at the time of 2 54 when the mu information is 3, and is stored in the memory when the mu information is 2 if it is 2.
  • the working unit 8 sets the SP used for the current process as the mode SP, the lag as the mode, and obtains the previous mode.
  • the SP 92 inputs the encoding unit 9 information.
  • the SP 92 inputs the SP from the coding unit 9, the multiplex 9 inputs the 2 SP (2), the 2 SP (2) outputs the SP,
  • the addition result obtained by adding SP SP is defined as a second SP.
  • the information is:
  • SP SP is input, and an addition result obtained by adding SP SP is set as a second SP. If the information is 2, the encoding unit 9 inputs the mu SP, the multiplex 9 inputs the 2 SP (2), the 2 SP (2) inputs the SP, and the mu SP
  • the result of addition of P is defined as the second SP.
  • the SP 92 inputs the SP from the encoding unit 9 and sets the addition result obtained by adding the SP to the second SP as the second SP.
  • the SP 92 synthesizes the above-mentioned 2 SP with the synthesis it 93.
  • the SP 9 2 outputs the SP obtained by performing the second SP (2) if the information is 2 or 3, and outputs the SP if the information is 2 or 3.
  • 013395 is stored in the drive output in the past by the addition 9.
  • Reference numeral 95 denotes a code generator. 95, when the mu information is 3, the lag is input from the coding unit 9 and the 2 lag (2) is input from the multiplex 9 and the lag 2 lag (.2) is added to the result of addition. It is cut out from a sample of the sample from the outlet where it is located, and the cut out is defined as 2 vectors.
  • the cut out vector shall be 2 vectors.
  • Lagum 2 lags are input, and the sum determined by adding these lags is cut out from the sump at the exit, and the cutout is set as 2 vectors.
  • adaptation 95 multiplies 98 by two vectors.
  • adaptation 95 outputs the second lag (2) as 2 lags when the news information is 2 or 3 and outputs the second lag (2).
  • the 2nd and 2nd gains specified in (G2) are performed.
  • 96 when the mu information is, inputs the gain, the second gain, the previous mu 2 gain, and the previous mu 2 gain from the encoding unit 9 and adds the gain and the previous mu 2 gain, and
  • the multiplication result obtained by multiplying the result by 5 is defined as a second result
  • the result is added to the result of the previous operation 2
  • the multiplication result obtained by multiplying the addition result by 5 is defined as a second result.
  • the mu information when the mu information is, the mu 2 and the previous mu 2 are input from the coding unit 9, and these are designated as the 2nd and the 2nd.
  • the gain and the second gain are referred to as the previous gain 2 and the previous gain 2 at the time of the management of the mu.
  • 9 7 is a multiplex if the information is 2 or 3
  • step 97 Input 2 vectors (2) and generate 2 vectors specified by 2 vectors (2).
  • the mu information is or, the mu 2 vector is inputted from the coding unit 9 and this is set to 2 vectors.
  • the fixed unit 97 multiplies the two vectors 9 9 by 9 to form a unit 9.
  • 01399 is the 2 vector of the output from the multiplication 989
  • the calculation with the two vectors is performed to generate a drive, and the drive is set to a composite inverter 9395.
  • the 0140 iter 93 performs the iterative process using the drive output from the adder 9 and the number of the iterative processes performed by the SP 92, and outputs the combined signal to the post-processing unit 94.
  • the processing unit 94 performs processing on the signal output from the synthesis iter 93 to improve the visual quality of the pitch sound and the quality of the stationary sound. Issued as No. 2.
  • Work part 9 is equipped with an internal memory for storing various parameters, and is provided with an SP (mu SP), a 2 rug (mu 2 lag), and a mug 2 (mu 2), 2 (mu 2) obtained by mu, and 2 vectors (mu 2 vector) obtained by hum are memorized.
  • the working section 9 inputs the information about the program 52. If the news report is 3, the work part 9
  • the work unit 9 performs the 53rd mu P mu lag.
  • the coding unit 9 sets the mu information as SP 9295 96 fixed 97. Work 9 If the information is, the SP 9 2 SP
  • SP is set to SP 92
  • 2 lag is applied 95
  • 2 and 2nd gains are set to 96
  • 2 vectors are fixed to 97.
  • the coding unit 9 performs the SP 2 lag 2 acquisition and the second acquisition 53.
  • the working unit 9 sets the SP used in the present process as the mu SP, the 2 lag as the mu 2 lag, the 2 Previous M 2
  • the information and the second By selecting a parameter to be used according to the information from among the previous information, the previous information, and the previous two information, it is possible to obtain a code suitable for the type of code information, and obtain a quality number. it can.
  • 01482 inserts a mummy report.
  • 2 performs SP from 82 to SP, lag from adaptation 85, acquisition and acquisition from 86, and fixed from 87.
  • the symbol 3 indicates the SP, lag, vector,
  • code 3 indicates that if the mu information is 2, the previous mu SP is output as SP 8 2, the mulag is adaptively output 85, the motion vector is fixed 87 output, and the mu gain and the previous mu are output.
  • SPs, rugs, vects, stakes, and stakes are referred to as stakes, SPs, stakes, stakes, and stakes.
  • 0150 224 inputs a mummy report. Next, 24, if the news is 2, the 2 54th SP, 2 lags, 2
  • the gain and the second gain are 8 6. [0151] Next, a description will be given with reference to the block diagram showing the configuration of the encoding unit 9. The user inputs the information from the
  • 05152 enters a mummy report. Second, if the newsletter is 3, enter the 53rd SP, lag, gain, and gain. Also,
  • Reference numeral 3 indicates SP 2 lag, 2 vector, 2 gain and 2
  • sign 3 indicates that if the mu information is, the previous mu SP is output P92, the mu2 lag is output 95, the mu2 vector is fixed 97 output, and the mu2 is obtained.
  • the obtained SP, 2 rugs, 2 vegets, 2 vests and 2 MUs are considered as MU SPs, 2 rugs, 2 vegets, 2 vegeta and 2 fu.
  • 01552 is a news report and 53 2 54
  • FIG. 6 is a diagram showing types of lamellas used in response to a news report. Note that both the news report, the corresponding news report, and the second report are shown. Note that in 2, sp is SP and P sp is
  • Lag, c is vector, psc is vector, ga is vector, Pga is vector, 9 is vector, Pgs is vector.
  • D sp is SP
  • pd sp is mu SP
  • d ag is 2 lags
  • pd ag is 2 lags
  • esc is 2 vectors
  • pesc is 2 lags
  • ega is 2 lags
  • Pega gets mu 2 egs gets 2 and pegs gets mu 2.
  • 01613 indicates that if the information is not normal
  • FIG. 3 is a diagram visually illustrating that the information can be improved by using two reports in addition to the news report.
  • the case where the SP 82 of 53 obtains the SP will be described as an example.
  • SP is a two-dimensional cut.
  • reference 3 is a graph schematically showing SP SP SP. Where X represents SP and the long arrow
  • SP short arrow SP. SP is included in the newsletter and SP is included in the two newsletters.
  • Reference 3 is a graph schematically showing SP and SP. Where X represents SP and the dashed line
  • SP This is a graph schematically representing SP. Where X represents SP, dashed SP, and long solid mu
  • SP is not normal, and SP 82 adds SP and SP, and the result of the addition is used as SP.
  • the SP using the SP method was compared with the SP method, and the SPs were actually calculated at the mu m rank, compared, and an experiment was performed in which the SP of either method came close to the SP at the mu m rank. As a result of conducting an experiment with eight sumps of the previous and subsequent issues, the latter method was closer to SP in eight sumps.
  • the case where the code has a part of 2 has been described as an example. However, the number of the code part is not limited to this, and may be three. [0169] Further, in the present embodiment, the case where 5 has a part of 2 has been described as an example, but the number of parts is not limited to this, and may be three. [0170] In the present embodiment, when the mu information is, the fifty-third was explained using only the mu information, but the fifty-third was used in addition to the mu information. The present invention can be applied to any case using the information, and the same effects as those of the present embodiment can be obtained. In this case, the issue number can be obtained by a method similar to the method of 53 when the information is 2.
  • the signal may be generated by multiplying the information of the signal by a certain constant so that the signal is slightly attenuated. For example, if the information is 2, then 8 6
  • the present embodiment the case has been described where the vector generated by the fixed block 28 is formed by switches.
  • the present invention can be applied to a case where the fixed block forming the fixed vector is a diffusion block. As a result, the same effects as in the present embodiment can be obtained.
  • the code part is a CP-type sound code method
  • the code part is a sound code outside the CP type (for example, tone, prediction, vector, datum).
  • tone, prediction, vector, datum for example, a sound code outside the CP type
  • the present invention can be applied to a case where the method is a different voice / speech coding method in the part of the present invention, and the same effect as in the present embodiment can be obtained. 0179 (Alpha 2)
  • FIG. 4 (a) is a block diagram showing a configuration of a voice / device according to the second embodiment of the present invention, including the device described in the first embodiment.
  • the sound signal 4 is converted into an electric signal by the input 42,
  • 4 3 converts the (anag) signal output from the input 4 2 into a jitter signal and converts it into a voice / voice code 4 4.
  • Phonetic code 4 4 implements the shown in,
  • 4 4 Signs the jitter and sound signals output from 4 3.
  • 4 5 is voice / phonetic code
  • the information output from 4 4 is converted into a signal to be transmitted on the body of the radio wave and transmitted to the transmitting antenna 4 6.
  • the antenna 46 transmits the output signal output from the antenna 45 as a radio wave ().
  • f 47 represents a radio wave () transmitted from the antenna 46.
  • 01824 (b) shows the provisions of the present application, including the arrangements described in the above application.
  • FIG. 3 is a block diagram showing a configuration of a voice / device according to FIG.
  • the 0183 R48 is received by the receiving antenna 49 and output to 4.
  • f48 represents a radio wave received by the receiving antenna 49 and becomes the same as f47 if there is no signal noise in propagation.
  • 0184 R4 demodulates the information from the f-number output from the receiving antenna 49, and outputs the voice. ⁇ 4 and 5 are implemented, and voice and sound signals are recovered from the information output from 4 and 4 2.
  • a high-quality output signal can be obtained by providing the voice / sound signal and the voice / sound signal unit in the base and the unit in the 0186 line communication system as described above.
  • the device according to the present invention can be mounted on the sound signal and the voice / sound signal device. It is possible to implement it.
  • the present invention has the effect of obtaining a signal of quality even if code information is lost, and voice used in a communication system for transmitting voice and sound signals. ⁇ It is useful as phonetic code and voice.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

 スケーラブル符号化方式においてフレーム消去の隠蔽処理により生成される復号化信号の品質向上を図ることができる音声・楽音復号化装置。この音声・楽音復号化装置では、フレーム損失検出部(152)は、符号化情報が正常に受信されているかどうかを判定し、判定結果を示すフレーム損失情報を生成する。第1復号化部(153)は、フレーム損失情報に応じて直前のフレームの第1符号化情報と現フレームの第1符号化情報と現フレームの第2符号化情報とから少なくとも一つ以上の符号化情報を復号化の際に用いる。第2復号化部(154)は、フレーム損失情報に応じて、直前のフレームの第1符号化情報と現フレームの第1符号化情報と直前のフレームの第2符号化情報と現フレームの第2符号化情報とから少なくとも一つ以上の符号化情報を復号化の際に用いる。加算器(155)は、第1復号化部(153)から出力された復号化信号と第2復号化部(154)から出力された復号化信号を加算する。

Description

Figure imgf000003_0001
・ および音声・
術分野
0001 、音声・ 音信号を して伝送する通信 ステムに て使用される 音声・ 音声・ 法に関する。 0002 ディジタ 線通信 、インタ ネット 信に代表される 、 信、ある は音 声 積などの 野に ては、電波などの 記憶 体の 効利用を図 るため、音声 号の 術が不可欠であり、これまでに多 の
式が開発されてきた。その中で、C P 式の
式が主流の 式として実用 されて る( えば、 )。
0003 C P 式の 、 記憶された音声 デ に基 て人力 声を ド する。 体的には、ディジタ された音声 号を ~2 s 度の ムに 切り、 ム毎に音声 号の 、線形 数と ベクト を求め、線形 数と ベクト をそれぞれ 別 に する。そして、 ビット トの 信を実行するためには、記憶できる音声 デ の量が限られるため、従来のC Pタイプの 式は、主に 発声音の デ を記憶して る。
0004 また、インタ ネット 信の ケットを伝送する通信 ステムでは、ネットワ ク の 態に ケット 起こるため、符号 報の 部が欠損した場合であ て も 報の りの 部 ら音声、
Figure imgf000003_0002
。 様に、 通信 量に応じて 、 ト トを さ る可変 ト ステムに ては、通 信 量が低下した場合、符号 報の 部のみを伝送することに 通信 量の
Figure imgf000003_0003
。この に、符号 報の て若し は 報の 部のみを用 て音声、楽音を復 できる 術として、最近、ス ケ ラ 術が注目を浴びて る。 来にも のスケ ラ
式が開示されて る( えば、特許 )。 0005 スケ ラ 式は、一般的に、基本 イヤ 複数の イヤと らなり、 イヤは、基本 イヤを最も下位の イヤとし、階層構造を形成して る。そして、 イヤでは、 下位 イヤの 号と出力 号との差である 号に て が行われる。この 成に 、 イヤの 報もし は下位 イヤの 報のみを用 て、音声・ 音を復 することができる。
0006 また、前記 ケ、 を伝送する通信 ステムでは、 、 失などに
報を受信できな 場合、消失補償( ) 理を〒 ことで 号の をある程度 えることができる。 えば、 G・ 729などでは ア ズムの 部として ム 去の 法が規定されて る。
0007 失補償( ) 、一般的に、事前に受信した ムに含まれて る 報を元に現 ムの 生を〒 。 えば、 失した ムの 前の ム に含まれて る 報を損失した ムの 報として る、直前の ムに含まれて る 報を用 て生成する 号の ネ ギ を に減衰さ る、などの 法に 、 失した ムの 号を作り上 げる。
1 97295
MR choede B・ Aa CodeExc ed nea Pedc on Hgh Q a peecha owB Ra e EEEpoc・ CA P85pp937 940
明の
明が解決しよ とする課題
0008 し しながら、従来の 失補償( ) 理にお ては、 失した ムの 前の ムに含まれて る 報を用 て 号を再生するだけであり 、 号の はある程度 えられるが、 号の 十分 であるとは えな 。また、スケ ラ 式にお ては、一般的に、基本 イヤの 報の 要度は高 、基本 イヤの 報が ム
われた場合、直前の ムに含まれて る 報を用 て
号を再生するだけでは、十分な品質の 号を得ることはできな 。
0009 明の 、スケ ラ 式にお て、 ム 発生して 報が失われた場合であ ても、十分な品質の 号を得ることがで きる音声・ および音声・ 法を提供することである。 題を解決するための
0010 明の ・ 、スケ ラ により複数 層で構成さ れた 報を復 して 号を生成する音声・ 置であ て、受信された ムの 階層の 報が正常 否 を判定し、判定 果である ム 報を生成する ム 段と、前記 ム 報に応じて前記 された 報と過去に受信された 数の 報と ら各階層の に用 る 報を決定し、決定した 報を用 て 〒 ことにより 号を生成する前記 層と同数の 段と、を具 備する構成を採 。
0011 明の ・ 、スケ ラ により複数 層で構成さ れた 報を復 して 号を生成する音声・ 法であ て、受信された ムの 階層の 報が正常 否 を判定し、判定 果である ム 報を生成する ム 程と、前記 ム 報に応じて前記 された 報と過去に受信された 数の 報と ら各階層の に用 る 報を決定し、決定した 報を用 て 〒 ことにより 号を生成する前記 層と同数の 程と、を具 備する方法を採 。
明の
0012 明によれば、過去に得られた 報に加え、別の符 部により得られ た 報を用 て 号を得ることにより、過去に得られた 報の みを用 る場合に比 、 号の 上を図ることができる。
Figure imgf000005_0001
0013 明の 施の に係る および 置の 成を示す 2 明の 施の に係る第 部の内部構成を示す ック
ラグを決定する 理を説明するための 4 ベクト を決定する 理を説明するための
5 明の 施の に係る第 部の内部構成を示す ック 6 明の 施の に係る第2 部の内部構成を示す ック 7 ラグを決定する 理に て 単に説明するための
8 明の 施の に係る第 部の内部構成を示す ック 9 明の 施の に係る第2 部の内部構成を示す ック 0 明の 施の に係る 作部の 部構成を示す ック 11 明の 施の に係る 作部の 部構成を示す ック 12 明の 施の に係る ム および 部で用 る ラ メ タを示す
13 2 報を加えることにより品質が向上する原理を視覚的に説明するた めの
14A 明の 施の 2に係る音声・ 置の 成を示す ック 14B 明の 施の 2に係る音声・ 置の 成を示す ック 明を実施するための 良の
0014 明の 、複数の 部 ら 成されるスケ ラ 式にお て、 の 部 ら 報を出力して 送し、符号 が損失 伝送されて る ど を で判定し、符号 報の 検出された場合には、 失した ムの 前の ムの 報に加え、 他の符 部 ら出力された 報を用 て を ことにより、
号の 上を図ることである。
0015 下、本 明の 施の 態に て、 面を参照して詳細に説明する。なお 、ここでは、c 式の ・ 音符号 を行 合を例にと て説明す る。
0016 ( 施の )
は、 明の 施の に係る および 5 の 要な構成を示す ック図である。
0017 は、 と、 2と、加算 3 、 2 4と、判定 5と、多重 6と、 ら主に構成される。また、 5 は、多重化 5 と、 ム 52と、
53と、 2 54と、加算 55と、 ら主に構成される。
ら出力される 、伝送 3 を介して、 5 送される 0018 下、符号 の 部の 理に て説明する。 加算
3とには、入力 号である音声・ 音信号が入力される。
0019 は、入力された音声・ 音信号 ら、C P 式の ・ 音符 号 法を用 て、 報を求め、求めた 報を第
2 多重 6と する。
0020 2は、 ら出力された 報を、C
P 式の ・ 法を用 て 号に復 、この によ て められる 号を加算 3 する。
0021 3は、入力された音声・ 音信号に、 2 ら出力され た 号を極性反転して ら加算し、加算結果である 号を第2 4 する。
0022 2 4は、加算 3 ら出力された 号 ら、C P 式の ・ 音符号 法を用 て、 2 報を求め、求めた 2 報を多 重 6 する。
0023 5は、後述する方法により 報を生成し、これを多重 6 する。ここで、 ラ とは、 5 にお て、 報の 検出された場合、第 53が に用 る 報 して 2 報を含める めな 、を指示する情報である。ここでは、 ラ 報として 又は の値を用 る。 ラ 報が である場合、第 53は、 ムの 報のみを用 て を行 、 ラ 報が である場合、 第 53は、 ムの 報と第2 報とを用 て を行 。
0024 6は、 ら出力された 報と、 2 部 4 ら出力された 2 報と、判定 5 ら出力された 報と、 を多重 して多重化 報として伝送 3 する。
0025 明細書では、符号 にお て、 ム 位で音声・ 音信号の 理を行 、 ムの 報と第2 報とをそれぞれ ケット 納し、伝送することを想定して る。 て、 ムには、
Figure imgf000008_0001
ケットが存在する。 E2 の ケットは、 ム毎に 5 送され 、 ケット 発生した場合、第 報と第2 報との な とも 上の符 報が失われる。
0026 次に、 5 の 部の 理に て説明する。 5 は、符 号 ら伝送された多重化 報を、 報、第2 報及び 報に分離し、分離された 2 報を ム 5 2 出力し、 ラ 報を第 53 する。
0027 ム 52は、多重 5 ら出力された 2 報が正常に受信されて る ど を判定し、判定 果を示す ム 報を生成する。なお、 ム 失の 出方法として、例えば、 、 に付されて る 報を監視する方法が知られて る。 えば、 、 の ケンス ( ケット )、 、 が生成された時刻を示すタイムスタンプ、等の 、 に付され て る 報を受信 で監視し、これらの 報の 連続性を検知することに より、 、 の 失を検出する。 報として、例えば、通信プ ト の CP Pの ケンス 号、 P Pの ケンス 号、タイムスタンプ 報、等が利用で きる。
0028 ここでは、 ム 報として ~ 3 の値を用 る。 ム 、 報と第2 報とが共に正常に受信されな た場合に の値 をとり、 正常に受信され、 2 正常に受信されな た場合に の値をとり、 2 正常に受信され、 正常 に受信されな た場合に 2の値を り、 報 第2 報 が共 に正常に受信された場合に 3 の値をとる。次に、 ム 52は、 報を第 53 2 54と する。次に、 ム 52は、正常に受信された 報を対応する 部 出 する 。 体的には、 ム 52は、 ム 報が もし は 3 で ある場合( 報が正常に受信された場合)、 報を第
53 出力し、 ム 報が 2もし は 3 である場合( 2 報が 正常に受信された場合)、 2 報を第2 4 する。
0029 53は、多重化 5 報を入力し、 ム
52 ら ム 報を入 する。また、 3は、直前の ムの 報を記憶する ッ を内部に備え、 ムの
報が正常に受信されな た場合は、 ッ に記憶されて る直前の ムの 報を復 の際に用 る。
0030 次に、 53は、 ム 報を参照 、 ム 報が
もし は 3 である場合( 報が正常に受信された場合)は、 ム
52 ら 報を入力し、C P 式の ・ 法を用 て 報を復 、 ム 報が である場合は、C P 式 の ・ 法を用 て直前の ムの 報を復 、 ム 報が 2である場合は、 2 54 ら 2 報を入力し C P 式の ・ 法を用 て 2 報と直前の ムの 報と ら められる 報を復 する。なお、 3 は、 ラ 報が である場合は、 2 報を使用しな 。
0031 このよ に、本実施の 態では、 報が正常に受信された場合は、 報を復 、 報が正常に受信されな た場合は、直前の ムに含まれて る 報を復 する。また、本実施の 態では、 2 報が正常に受信され、 報が正常に受信されな た場合は 、直前の ムに含まれて る 報に加え、 2 報を用 るこ とにより、 号の なる品質 上を図 て る。
0032 次に、 53は、 により められた 号を加算 5 する。また、 53は、 ム 報が もし は 3 である 合、第 報を第2 54 する。また、 3は、 ム 報が もし は 2である場合、直前の ムの 報 を第2 54 する。
0033 なお、 53における具体的な 報の 法に ては 後述する。
0034 2 54は、 ム 52 ら ム 報を入 する。
また、 2 54は、直前の ムの 2 報を記憶する ッ を 内部に備え、 ムの 2 報が正常に受信されな た場合は、 ッ に記憶されて る直前の ムの 2 報を復 の際に用 る。 0035 次に、 2 54は、 ム 報を参照 、 ム 報が 3 である場合は、 ム 52 ら 2 報を入力し、 P 式 の ・ 法を用 て 2 報を復 、 ム 報が 2である場合は、 ム 52 ら 2 報を入力し、
53 ら直前の ムの 報を入力し、C P 式の ・
法を用 て 2 報と直前の ムの 報と ら め られる 報を復 、 ム 報が である場合は、
53 ら 報を入力し、C P 式の ・ 法を用 て 報と直前の ムの 2 報と ら められる 報を復 、 ム 報が である場合は、 3 ら直前の ムの 報を入力し、C P 式の ・ 法を用 て直前の ムの 報と直前の ムの 2 報と ら められる 報を復 する。
0036 このよ に、 2 54は、 2 報が正常に受信された場合は、 2 報と、 報もし は直前の ムの 報とを用 て を 、 2 報が正常に受信されな た場合は、直前の ム の 2 報と、 報もし は直前の ムの 報とを 用 て を行 。
0037 次に、 2 54は、 により められた 2 号を加算 5 する。また、 2 54は、 ム 報が 2である場合、第2 報を第 53 する。
0038 なお、 2 54における具体的な 報の 法に ては 後述する。
0039 55は、 53 ら 号を、 2 54 ら 2 号を、入力し、 号と第2 号とを加算し、加算結果で ある 号を出力 号として する。
0040 次に、符号 の の 部構成に て説明する。 2は 、 の 部構成を示す ック図である。 は、入力 される音声・ 音信号を サンプ ず 切り( は自然数)、 サンプ を ムとして ム毎に を 。
0041 の 、 理部2 に入力される。 理部2 は、
C 分を取り除 イ ス ィ タ 理や後続する 理の 善に な がるよ 理や ン ァ ス 理を行 、これらの の (Xn )を SP 2 2および 2 5 する。
0042 SP 2 2は、Xnを用 て 行 、分析結果である PC(
)を SP( ne pec a Pa s)に変換し、変換 果を第 SPとして SP 2 3 判定 5と する。
0043 SP 2 3は、 SP 2 2 ら出力された SPの 理を行 、 された SP( SP)を合成 ィ タ2 4 する。また、 SP 2 3は、 SPを表す SP ( )を多重化部 2 4 する。
0044 ィ タ2 4は、 SPに基 ィ タ 数により、後述する加算 2 ら出力される に対して ィ タ 成を〒 ことにより合成 号を生成し 、合成 号を加算 2 5 する。
0045 2 5は、合成 号の 性を反転さ てXnに加算することにより 号を 算出し、 号を聴覚 み付け 2 2 する。
0046 2 6は、過去に加算 2 によ て出力された駆動 ッ 記憶しており、 ラメ タ 2 3 ら出力される信号によ て特定される り 出し 置 ら ム分のサンプ を ッ より切り出し、 ベクト と して乗算 2 9 する。また、適応 2 6は、加算 2 ら駆動 を入 する毎に ッ のアップデ トを 。
0047 2 7は、 ラメ タ 2 3 ら出力される信号によ て、 得と第 得とを決定し、これらをそれぞれ 2 9 乗算 2 と する。
0048 2 8は、 ラメ タ 2 3 ら出力された 号によ て特定さ
Figure imgf000012_0001
0049 2 9は、 2 7 ら出力された 得を 、適応 2 6 ら出力された ベクト に乗じて、加算 2 する。 2 は、 2 7 ら出力された 得を、固定 2 8 ら出力された ベクト に乗じて、 加算 2 する。
0050 2 は、利得 の ベクト ベクト とをそ れぞれ 2 9 乗算 2 ら入力し、利得 の ベクト ベクト とを加算し、加算結果である を合成 イ タ2 4およ び 2 6 する。なお、適応 2 6に入力された駆動 、 ッ に記憶される。
0051 み付け 2 2は、加算 2 5 ら出力された誤差 号に対して聴覚的な重 み付けをおこな 、符号 みとして ラメ タ 2 3 する。
0052 ラメ タ 2 3は、聴覚 み付け 2 2 ら出力される みを最小と する ラグを適応 2 6 ら選択し、選択 果を示す
ラグ ( )を多重 2 4に する。ここで、 ラグ とは、 ベクト を切り出す り出し 置であり、詳細な説明は後述する。また、 ラメ タ 2 3は、聴覚 み付け 2 2 ら出力される みを最小とす る ベクト を固定 2 8 ら選択し、選択 果を示す
ベクト ( )を多重 2 4に する。また、 ラメ タ 2 3 は、聴覚 み付け 2 2 ら出力される みを最小とする
得と第 得とを 2 7 ら選択し、選択 果 を示す (G )を多重化部2 4に する。
0053 重化部2 4は、 SP 2 3 ら SP ( )を入力し、 ラ メ タ 2 3 ら ラグ ( )、 ベクト ( ) および (G )を入力し、これらの 報を多重 して
報として する。
0054 次に、 SP 2 3が SPを決定する 理を、 SP
( )に割り当てる 、 数を 8 とし、 SPを クト する場合を例に挙 げ、簡単に説明する。
0055 SP 2 3は、 成された256 類の SP ドベクト sp (0 が 納された SP ド ックを備える。ここで、 1は SP ドベクト に付 されたインデクスであり ~255の値をとる。また、 SP ドベクト sp
元の クト であり、 は ~ の値をとる。 SP 2 3は、 SP 2 2 ら出力された SP を する。ここで、 S 元の クト である。
0056 次に、 SP 2 3は、 ( )により SP SP ドベクト sp u との e を求める。
0057
。 () ( ・ ・ ・ 、 SP 2 3は、全ての1に て二乗 e を求め、二乗 e が 最小となる (1 )を決定する。次に、 SP 2 3は、 1
mを
m
P ( )として多重 2 4 出力し、また、 Sp 1を SPとして 合成 イ タ2 4 する。
m
0058 このよ に、 SP 2 3によ て められるSp 1が SPで ある。
0059 次に、 ラメ タ 2 3が ラグを決定する 理に て 3を て説明する。 3にお て、 ッ ァ3 は適応 2 6が える ッ であり、 3 2は ベクト の り出し 置であり、ベクト 3 3は、切り 出された ベクト である。また、数値 4 、 296 は、切り出し 3 2 を動 す 囲の 限と上限とに対応して る。
0060 り出し 3 2を動 す 、 ラグを表す ( )に割り当て るビット数を 8 とする場合、 256 の さの ( えば、4 ~296)に設定するこ とができる。また、切り出し 3 2を動 す 、任意に設定することができる。 0061 ラメ タ 2 3は、切り出 3 2を設定された 囲内で動 し、順次、 適応 2 6に切り出し 3 2を指示する。次に、適応 2 6は 、 ラメ タ 2 3により 示された切り出し 3 2を用 て、
ベクト 3 3を ムの さだけ切り出し、切り出した ベクト を乗算 2 9に する。次に、 ラメ タ 2 3は、全ての り出し 3 2で
ベクト 3 3を切り出した場合に て、聴覚 み付け 2 2 ら出力さ れる みを求め、符号 みが最小となる り出し 3 2を決定する。 0062 このよ に、 ラメ タ 2 3によ て められる ッ の り出し 3 2が ラグである。
0063 次に、 ラメ タ 2 3は、符号 みを最小とする ラグを表す ラグ ( )を多重 2 4に する。
0064 次に、 ラメ タ 2 3が ベクト を決定する 理に て 4 を用 て説明する。なお、ここでは、 ベクト ( )に割り当てるビッ ト数を 2 とする場合を例にと て説明する。
0065 4にお て、トラック4 4 2 4 3は、それぞれ単位 ス( )を 生成する。また、乗算 4 4 5 6は、トラ、 4 4 2 4 3で生成される単 位 スに極性を付する。 4 7は、生成された3本の単 スを加算する 加算 であり、ベクト 4 8は、 3本の単 ス ら 成される ベク ト である。
0066 トラックは単位 スを生成できる 置が異な ており、 4にお ては、トラック 4 は036912 5 82 8 所の ちの ずれ に、トラック4 2 147 n GG 22 8 所の ちの ずれ に、トラック4 3
258 1 79 23 8 所の ちの ずれ に、それぞれ単位 スを ず てる構成とな て る。
0067 次に、生成された単位 スはそれぞれ 4 4 5 6により 性が付さ れ、加算 4 7により3本の単 スが加算され、加算結果である ベ クト 4 8が 成される。
0068 4の例では、 スに対して位置が8 、極性が正負の2 、であるの で、 3 、 、極性情報 、 、が スを表現するのに用 られる。 したが て、合計12ビットの となる。 ラメ タ 2 3は、 3本の 単 スの 極性とを動 し、順次、生成 極性とを固定
2 8に指示する。次に、固定 2 8は、 ラメ タ 2 3により 示 された生成 極性とを用 て ベクト 4 8を構成して、構成された ベクト 4 8を乗算 2 に する。次に、 ラメ タ 2 3は 、全ての 極性との み合わ に て、聴覚 み付け 2 2 ら出力さ れる みを求め、符号 みが最小となる生成 極性との み合わ を 決定する。次に、 ラメ タ 2 3は、符号 みが最小となる生成 極性 との み合わ を表す ベクト ( )を多重 2 4に する。 0069 次に、 ラメ タ 2 3が、 2 7 ら生成される
得と第 得とを決定する 理を、
(G )に割り当てる 、 数を 8 とする場合を例に説明する。
2 7は、 成された256 類の ドベクト g n 納さ れた ド 、 を備える。ここで、k は ドベクト に 付されたインデクスであり ~255の値をとる。また、 ドベクト gan は2 元の クト であり、 は ~ の値をとる。 ラメ タ 2 3は、kの値 を ら255まで、順次、 2 7に指示する。 2 7は、 ラメ タ 2 3により 示されたkを用 て ド 、 ら ドベクト gan 選択し、gan (0)を
得として乗算 2 9に出力し、また、gan ㈲を 得として乗算 2 に する。
0070 このよ に、 2 7によ て められるgan (0)が
であり、gan ㈲が である。 ラメ タ 2 3は、全てのk に て、聴覚 み付け 2 2より出力される みを求 め、符号 みが最小となるkの (k )を決定する。次に、 ラメ タ 2 3 m
は、k を (G )として多重 2 4に する。
007 次に、 2の 部構成に て 5に示す ック図を用 て 説明する。 5にお て、 2に入力された 、多 重 5 によ て の ( G )に分離される。 離された
SP ( )は SP 5 2に出力され、分離された
ラグ ( )は適応 5 5に出力され、分離された
(G )は 5 6に出力され、分離された ベクト ( )は固定 5 7 出力される。
0072 SP 5 2は、多重 5 ら出力された SP ( ) ら SPを 、 した SPを合成 イ タ5 3 2 4 判定 5と する。
0073 5 5は、多重 5 ら出力された ラグ ( )で指定される り出口 置 ら ム分のサンプ を ッ より切り出し、 切り出した クト を ベクト として乗算 5 8 する。また、適応
5 5は、 ラグ ( )で指定される り出口 を第 ラグとして 2 4 する。また、適応 5 5は、加算 5 ら駆動 を入 する毎に ッ のアップデ トを 。
0074 5 6は、多重化 5 ら出力された
(G )で指定される 得と第 得とを 、 得を乗算 5 8 出力し、
得を乗算 5 9 する。
0075 5 7は、多重化 5 ら出力された ベクト
( )で指定される ベクト を生成し、乗算 5 9 する。 0076 5 8は、 ベクト に 得を乗算して、加算 5 する。 5 9は、 ベクト に
得を乗算して、加算 5 する。
0077 5 は、乗算 5 8 9 ら出力された の ベクト ベクト との 算を行 、駆動 を生成し、駆動 を合成 イ タ5 3 5 5に する。なお、適応 5 5に入力 された駆動 、 ッフ に記憶される。
0078 イ タ5 3は、加算 5 ら出力された駆動 、 SP 5 2に よ て された イ タ 数とを用 て イ タ 成を行 、合成 号を後処理 部5 4 する。
0079 後処理部5 4は、合成フイ タ5 3 ら出力された 号に対して、ホ ント ピッチ 音声の 観的な品質を改善する 理や、定常 音 の 観的 質を改善する 理などを施し、 号として する。
0080 次に、 2 4の 部構成に て、 6に示す ック図を用 て説明 する。 2 4は、入力される 号を サンプ ず 切り( 然 数)、 サンプ を ムとして ム毎に を 。
0081 2 4の 、 理部6 に入力される。 理部6 は、
C 分を取り除 イ ス イ タ 理や後続する 理の 善に な がるよ 理や ン ァ ス 理を行 、これらの の (Xn )を SP 6 2および 6 5 する。
0082 SP 6 2は、Xnを用 て 行 、分析結果である PC(
)を SP( ne pec a Pa s)に変換し、変換 果を第2 SPとして SP 6 3 する。
0083 SP 6 3は、 SPと SP 6 2 ら 2 SPとを す る。次に、 SP 6 3は、 SPの 性を反転さ て 2 SPに加 算することにより SPを算出する。次に、 SP 6 3は、 SPの 理を行 、 された SP( SP SP を 加算することにより 2 SPを算出する。次に、 SP 6 3は、 2 SPを合成 イ タ6 4 するとともに SPを表す 2 SP ( 2)を多重化部6 4 する。また、 SP 6 3は、
SPを判定 5 する。
0084 イ タ6 4は、 2 SPに基 イ タ 数により、後述する加算 6 ら出力される に対して イ タ 成を〒 ことにより合成 号を生成し 、合成 号を加算 6 5 する。
0085 6 5は、合成 号の 性を反転さ てXnに加算することにより 号を 算出し、 号を聴覚 み付け 6 2 する。
0086 6 6は、過去に加算 6 によ て出力された駆動 ッ に記憶しており、また、 ラグ ラメ タ 6 3 ら出力される信 号とによ て特定される り出し 置 ら ム分のサンプ を ッ より切り出 し、 2 ベクト として乗算 6 9 する。また、適応 6 6 は、加算 6 ら駆動 を入 する毎に ッ のアップデ トを 。
0087 6 7は、 ラメ タ 6 3 ら出力される信号によ て、 2 得と第2 得とを決定し、これらをそれぞれ 6 9 乗算 6 と する。
0088 6 8は、 ラメ タ 6 3 ら出力される信号によ て特定さ れる形状を有する クト を 2 ベクト として乗算 6 する。 0089 6 9は、 6 7 ら出力された 2 得を 、適応 6 6 ら出力された 2 ベクト に乗じて、加算 6 する。 6 は、 6 7 ら出力された 2
得を、固定 6 8 ら出力された 2 ベクト に乗じて、 加算 6 する。
0090 6 は、利得 の 2 ベクト 2 ベクト とをそ れぞれ 6 9 乗算 6 ら入力し、これらを加算し、加算結果である を合成 イ タ6 4および 6 6 する。なお、適応 6 6に入力された駆動 、 ッ に記憶される。
0091 み付け 6 2は、加算 6 5 ら出力された誤差 号に対して聴覚的な重 付けをおこな 、符号 みとして ラメ タ 6 3 する。
0092 ラメ タ 6 3は、聴覚 み付け 6 2 ら出力される みを最小と する 2 ラグを適応 6 6 ら選択し、選択 果を示す 2
ラグ ( 2)を多重 6 4に する。ここで、 2 ラグ とは、 2 ベクト を切り出す り出し 置であり、詳細な説明は後述する。また、 ラメ タ 6 3は、聴覚 み付け 6 2 ら出力される みを最小とす る 2 ベクト を固定 6 8 ら選択し、選択 果を示す 2 ベクト ( 2)を多重 6 4に する。また、 ラメ タ 6 3 は、聴覚 み付け 6 2から出力される みを最小とする 2
得と第2 得とを 6 7 ら選択し、選択 果 を示す 2 (G2)を多重 6 4に する。
0093 6 4は、 SP 6 3 ら 2 SP ( 2)を入力し、 ラ メ タ 6 3 ら 2 ラグ ( 2)、 2 ベクト ( 2) および 2 (G2)を入力し、これらの 報を多重 して 2 報として する。
0094 次に、 SP 6 3が 2 SPを決定する 理を、 2 SP
( 2)に割り当てる 、 数を 8 とし、 SPを クト する場合を例に 挙げ、簡単に説明する。
0095 SP 6 3は、 成された256 類の 2 SP ドベクト sp ( が 納された 2 SP ド ックを備える。ここで、 2は 2 SP ドベクト に付 されたインデクスであり 255の値をとる。また、 2 SP ドベクト sp (1は 元の クト であり、 は ~ の値をとる。 SP 6 3は、 SP 6 2 ら出力された 2 SP を する。ここで、 2 SP は 元の クト である。また、 SP 6 3は、 2 ら出力された
SPsp (0を する。ここで、 SPsp (0は 元の クト であり、 は ~ の値をとる。
0096 次に、 SP 6 3は、 (2により SPesUを求める。
0097 2 4)
Figure imgf000020_0001
( 0 ・ ( ) 次に、 SP 6 3は、 (3)により SPes 2 SP ドベクト sp 1)と
。 の e
2を求める。
0098 3
" ) ) ・ (3) 次に、 SP 6 3は 全ての2に て二乗 e を求め、二乗 e が 最小となる2の (2 )を決定する。次に、 SP 6 3は、 2
mを 2
P ( 2)として多重 6 4 する。
0099 次に、 SP 6 3は、 (4)により 2 SPsp を求める。
0100 4
() m () ( 0 V ) ・ (4) 次に、 SP 6 3は、 2 SPsp を合成 イ タ6 4 0101 このよ に、 SP 6 3によ て められるsp が 2 SPであり
2
、二乗 e が最小となるsp SPである
2 。 。
0102 次に、 ラメ タ 6 3が 2 ラグを決定する 理に て 7を用 て説明する。 7にお て、 ッ ァ7 は適応 6 6が える ッ であり、 7 2は 2 ベクト の り出し 置であり、ベクト 7 3は 切り 出された 2 ベクト である。また、 は ラグであり、また、 数値 4 、 296 は、 ラメ タ 2 3が ラグの 索を行 囲 の 限と上限とに対応して る。また、 6 、 5 は、 2 ベクト の り出し 置を動 す 囲の 限と上限とに対応して る。
0103 り出し 7 2を動 す 、 2 ラグを表す ( 2)に割り当て るビット数を 5 とする場合、 32 の さの ( えば、 6~ 5)に設定す ることができる。また、切り出し 7 2を動 す 、任意に設定することができ る。
0104 ラメ タ 6 3は 2 ら ラグ を入力し 、切り出し 7 2を動 す 囲を 6~ 5に設定する。次に、 ラメ タ 6 3は、切り出し 7 2を設定された 囲内で動 し、順次、適応 6 6に切り出し 7 2を指示する。次に、適応 6 6は、 ラメ タ 6 3により 示された切り出 7 2を用 て、 2 ベクト 7 3を ムの さだけ切り出し、切り出した 2 ベクト 7 3を乗算 6 9に する。次に、 ラメ タ 6 3は、全ての り出 7 2で 2 ベクト 7 3を切り出した場合に て、聴覚 み付け 6 2 ら出力される みを求め、符号 みが最小となる り出し 7 2を決定する。
0105 このよ に、 ラメ タ 6 3によ て められる ッ の り出し 7 2が である場合、 ( は 6~ 5の ずれ の )が 2 ラグである 。 て、 2 54で 2 ベクト 7 3を切り出すには、
ラグ 2 ラグvとを加算し、加算結果 を切り出し 7 2とす ることにより 2 ラグ7 3を切り出す。
0106 次に、 ラメ タ 6 3は、符号 みを最小とする 2 ラグを表す
2 ラグ ( 2)を多重 6 4に する。
0107 なお、 ラメ タ 6 3は、 ラメ タ 2 3が ベクト
( )を決定する 理と同様の 理により、 2 ベクト ( 2)を決定す る。
0108 また、 ラメ タ 6 3は、 ラメ タ 2 3が ( G )を決定する 理と同様の 理により、 2 (G2)を決定する 0109 次に、判定 5が 報を生成する 理に て説明する。 5は 、 ら SP、 2 ら SP、 2
4 ら SP、を する。また、判定 5は、 ム の SPを記憶する ッ を内部に備える。
0110 次に、判定 5は、 (5)を用 て、 SP ム SPとの e を求める。
011 " ( ) ) ・ (5)
,0 "
ここで、 ( は SPであり、 sp は ッ に記憶されて る ム 。1
SPである。
0112 次に、判定 5は、 ( 6)を用 て、 SPと、 ム SP
SPとを加算した クト との e を求める。
0113 6
" ( (
, , ) , ) ・ (6)
ここで、 sp は SPである。
0114 次に、判定 5は、二乗 e 二乗 e との大 、二乗 e の方がⅡ、さ 場合、 ラ 値を り、二乗 e
4の方がⅡ、さ 場合、 ラ の値をとる。次に、判定 5は、フラ 報を多重 6 する。次に、判定 5は、 2 ら入力した SPを 、
ソ ァ することにより、 ッ の プデ トを 。 された S Pは、 ムにお て、 ム SPとして られる。
0115 このよ に、 ム 報のみを用 た場合と、 ム
報と SPとを用 た場合とを 較し、どちらの 合がより SPに近 値を得ることができる 、 報を 報として 送すること により、 で第 報の 検出された場合、第 部に お て、 ム 報のみを用 て を 、 ム
報 SP を用 て を行 、を指示するこ ができる。 0116 次に、 53の 部構成に て 8に示す ック図を用 て説明 する。 8にお て、 報が損失 伝送されて る場合、第
53に入力された 、多重 8 によ て の ( G )に分離される。 離された SP ( )は SP
8 2に出力され、分離された ラグ ( )は適応 8 5に 出力され、分離された (G )は 8 6に され、分離された ベクト ( )は固定 8 7 出力さ れる。
0117 SP 8 2は、多重 5 報を入力し、符号
作部8 ム 報を入 する。 SP 8 2は、 ム 報が もし は 3 である場合、多重化 8 ら SP ( ) を入力し、 SP ( ) ら SPを する。 SP
8 2は、 ム 報が である場合、符号 作部8 ら ム SPを入力し、これを SPとする。 SP 8 2は 、 ム 報が 2である場合、符号 作部8 ら ム
SP SPとを入力し、これらを加算した加算結果を第 S Pとする。し し、 SP 8 2は、 ラ 報が である場合は、
SPを使用しな 。次に、 SP 8 2は、前記 SPを合成 イ タ8 3 作部8 と する。 作部8 出力された
SPは、 ムの 理の際に前 ム SPとし て られる。
0118 8 5は、過去に加算 8 によ て出力された駆動 ッ に記憶して る。 8 5は、符号 作部8 ム 報を入 する。 8 5は、 ム 報が もし は 3 で ある場合、多重化 8 ら ラグ ( )を入力し、
ラグ ( )で指定される り出口 置 ら ム分のサンプ を ッ よ り切り出し、切り出した クト を ベクト とする。 8 5 は、 ム 報が である場合、符号 作部8 ら ム ラグを入力し、 ム ラグで指定される り出口 置 ら ム分のサンプ を ッ より切り出し、切り出した クト を ベ クト とする。 8 5は、 ム 報が 2 である場合、符号 作部8 ら ム ラグ 2 ラグとを入力し、こ れらを加算した加算結果により 定される り出口 置 ら ム分のサンプ を ッ より切り出し、切り出した クト を ベクト とする。 0119 次に、適応 8 5は、 ベクト を乗算 8 8 する。ま た、適応 8 5は、 ベクト の り出口 を第 ラ グとして 作部8 する。 作部8 出力された ラグは、 フ ムの 理の際に前 ム ラグと して られる。また、適応 8 5は、加算 8 ら駆動 を入 する 毎に ッ のアップデ トを 。
0 20 8 6は、符号 作部8 ム 報を入 する。 8 6は、 ム 報が もし は 3 である場合、 多重化 8 ら (G )を入力し、
(G )で指定される 得と第 得とを する。 8 6は、 ム 報が である場合、符号 作部8 ら ム 得と前 ム
得とを入力し、これらを 得と第 得とする。 8 6は、 ム 報が 2である場合、符号 作部8 ら ム 得と前 ム
得と第2 得と第2 得とを入力し、 ム 得と第2 得とを加算し、加算結果 に ・ 5を掛けた乗算結果を第 得とし、また、 ム
得と第2 得とを加算し、加算結果に ・ 5を掛けた乗 算結果を第 得とする。次に、 8 6は、
得を乗算 8 8 作部8 と 出力し、
得を乗算 8 9 作部8 と する。
作部8 出力された 得と第 得とは、 ムの 理の際に前 ム 得と前 ム 得として られる。
0121 8 7は、符号 作部8 ム 報を入 する 。 8 7は、 ム 報が もし は 3である場合、多重化
8 ら ベクト ( )を入力し、 ベクト ( )で指定される ベクト を生成する。 8 7は、 ム 報が もし は 2である場合、符号 作部8 ら ム ベクト を入力し、これを ベクト とする。次に、固定 8 7は、 ベクト を乗算 8 9 作部8 と する。
作部8 出力された ベクト は、 ムの 理の際に前 ム ベクト として られる。
0122 8 8は、 ベクト に 得を乗算して、加算
8 する。 8 9は、 ベクト に
得を乗算して、加算 8 する。
0123 8 は、乗算 8 8 8 9 ら出力された の ベクト ベクト との 算を行 、駆動 を生成し、駆動 を合成 イ タ8 3 8 5と する。
0124 イ タ8 3は、加算 8 ら出力された駆動 、 SP 8 2に よ て された イ タ 数とを用 て イ タ 成を行 、合成 号を後処理 部8 4 する。
0125 後処理部8 4は、合成 イ タ8 3 ら出力された 号に対して、ホ ント ピッチ 音声の 観的な品質を改善する 理や、定常 音 の 観的 質を改善する 理などを施し、 号として する。
0126 作部8 は、各種 ラメ タを記憶する ッ を内部に備え、 ムで められた SP( ム SP)と、 ムで められた ラグ( ム ラグ)と、 ムで められ た ( ム 、 ムで められた ( ム )と、 ムで められた ベクト ( ム ベクト )と、を 、
ソ ァに記憶して る。
0127 作部8 は、 ム 52 ら ム 報を入 する。次に、符号 作部8 は、 ム 報が 2である場合、第2
54 ら SP 2 ラグ 2 得と第 2 得とを する。次に、符号 作部8 は、 ム 報を SP 8 2 8 5 8 6 固定 8 7と する。 作部8 は、 ム 報が である場合、 SP 8 2 ム SPを、適応 8 5 ム ラグを、 8 6 ム
得と前 ム 得とを、固定 8 7 ム ベクト を、 する。 作部8 は、 ム 報が 2である場合、 SP 8 2 ム SP
SPとを、適応 8 5 ム ラグ 2 ラグとを、 8 6 ム 得と前 ム 得と第2 得と第2
得とを、固定 8 7 ム ベクト を、 する。 0128 次に、符号 作部8 は、 ムでの 理に用 られた
SPを SP 8 2 ら、 ラグを適応 8 5 ら、 得と第 得とを 8 6 ら、 ベクト を固定 8 7 ら する。次に、符号 作部8 は、 ム 報が もし は 3 である場合、第 SP ラグ 得と第 得とを 2 54 出力し、 ム 報が もし は 2である場合、 ッ に記憶さ れて る ム SP ム ラグとを 2
54 する。
0129 作部8 は、以上の処理が終了した後、現 ムでの 理 に用 られた SPを ム SPとして、 ラグ を ム ラグとして、 得を前 ム
得として、 得を前 ム
得として、 ベクト を ム 得として ッ 憶し、 ッ のアップデ トを 。
0130 次に、 2 54の 部構成に て 9に示す ック図を用 て説明 する。 9にお て、 2 報が損失 伝送されて る場合、第2
54に入力された 2 、多重 9 によ て の ( 2 2 G2 2)に分離される。 離された 2 SP ( 2)は SP 9 2に出力され、分離された 2 ラグ ( 2)は適応 9 5に 出力され、分離された 2 (G2)は 9 6に出 力され、分離された 2 ベクト ( 2)は固定 9 7 出力さ れる。
0131 SP 9 2は、符号 作部9 ム 報を入 する。
SP 9 2は、 ム 報が 3 である場合、符号 作部9 ら SPを入力し、また、多重 9 ら 2 SP ( 2)を入力し、 2 SP ( 2) ら SPを 、
SP SPとを加算した加算結果を第2 SPとする。 SP 9 2は、 ム 報が である場合、符号 作部9 ら
SP ム SPとを入力し、 SP ム SPとを加算した加算結果を第2 SPとする。 ム 報 が 2である場合、符号 作部9 ら ム SPを入力し、 また、多重化 9 ら 2 SP ( 2)を入力し、 2 SP ( 2) ら SPを 、 ム SP
Pとを加算した加算結果を第2 SPとする。 SP 9 2は、 ム 報が である場合、符号 作部9 ら ム SP ム SPとを入力し、 ム SP ム SPとを加算した加算結果を第2 SPとする。
0132 次に、 SP 9 2は、前記 2 SPを合成 イ タ9 3 する。
次に、 SP 9 2は、 ム 報が 2もし は 3 である場合、第2 SP ( 2)を して めた SPを 作部9 出力し、 ム 報が もし は である場合、前 ム
Pを 作部9 する。 作部9 出力された
SPもし は フ ム SPは、 ムの 理の に ム SPとして られる。
0133 9 5は、過去に加算 9 によ て出力された駆動 ッ に記憶して る。 9 5は、符号 作部9 ム 報を入 する。 9 5は、 ム 報が 3 である場合、 符号 作部9 ら ラグを入力し、また、多重 9 ら 2 ラグ ( 2)を入力し、 ラグ 2 ラグ ( 。 2)とを加算した加算結果により 定される り出口 置 ら ム分のサンフ ッ より切り出し、切り出した クト を 2 ベクト とする。
9 5は、 ム 報が である場合、符号 作部9 ら ラグ ム 2 ラグとを入力し、これらの ラグを 加算した加算結果により 定される り出口 置 ら ム分のサンプ を ッ より切り出し、切り出した クト を 2 ベクト とする。
9 5は、 ム 報が 2である場合、符号 作部9 ら ム ラグを入力し、また、多重 9 ら 2 ラグ ( 2)を入力し、 ム ラグ 2 ラグ ( 2)とを加算し た加算結果により 定される り出口 置 ら ム分のサンプ を ッ より 切り出し、切り出した クト を 2 ベクト とする。 9 5は 、 ム 報が である場合、符号 作部9 ら ム
ラグ ム 2 ラグとを入力し、これらの ラグを加算し た加算結果により 定される り出口 置 ら ム分のサンプ を ッ より 切り出し、切り出した クト を 2 ベクト とする。
0134 次に、適応 9 5は、 2 ベクト を乗算 9 8 する。ま た、適応 9 5は、 ム 報が 2もし は 3 である場合、第2 ラグ ( 2)を 2 ラグとして 作部9 出力し、 ム 報が もし は である場合、前 ム 2 ラグを
作部9 する。 作部9 出力された 2 ラグもし は ム 2 ラグは、 ムの 理の際に前 ム 2 ラグとして られる。また、適応 9 5は、加算 9 ら駆動 を入 する毎に ッ のアップデ トを 。
0135 9 6は、符号 作部9 ム 報を入 する。 9 6は、 ム 報が 2もし は 3 である場合、 多重 9 ら 2 (G2)を入力し、 2
(G2)で指定される 2 得と第2 得とを する。 9 6は、 ム 報が である場合、符号 作部9 ら 得と第 得と前 ム 2 得と前 ム 2 得とを入力し、 得と前 ム 2 得とを加算し、加算結果 に ・ 5を掛けた乗算結果を第2 得とし、 得 と前 ム 2 得とを加算し、加算結果に ・ 5を掛けた乗算結 果を第2 得とする。 9 6は、 ム 報 が である場合、符号 作部9 ら ム 2 得 と前 ム 2 得とを入力し、これらを 2 得 と第2 得とする。
0136 次に、 9 6は、 2 得を乗算 9 8
作部9 と 出力し、 2 得を乗算 9 9 作部9 と する。 作部9 出力された 2
得と第2 得とは、 ムの 理の際に前 ム 2 得と前 ム 2 得として られる。 0137 9 7は、符号 作部9 ム 報を入 する 。 9 7は、 ム 報が 2もし は 3 である場合、多重
9 ら 2 ベクト ( 2)を入力し、 2 ベクト ( 2 )で指定される 2 ベクト を生成する。 9 7は、 ム 報が もし は である場合、符号 作部9 ら ム 2 ベクト を入力し、これを 2 ベクト とする。次に、固定 9 7は、 2 ベクト を乗算 9 9 作部9 する。
作部9 出力された 2 ベクト は、 ムの 理の際に前 ム 2 ベクト として られる。
0 38 9 8は、 2 ベクト に 2 得を乗算して、加算
9 する。 9 9は、 2 ベクト に 2
得を乗算して、加算 9 する。
0139 9 は、乗算 9 8 9 ら出力された の 2 ベクト
2 ベクト との 算を行 、駆動 を生成し、駆動 を合成 イ タ9 3 9 5と する。
0140 イ タ9 3は、加算 9 ら出力された駆動 、 SP 9 2に よ て された イ タ 数とを用 て イ タ 成を行 、合成 号を後処理 部9 4 する。
0141 処理部9 4は、合成 イ タ9 3 ら出力された 号に対して、ホ ント ピッチ 音声の 観的な品質を改善する 理や、定常 音 の 観的 質を改善する 理などを施し、 2 号として する。
0142 作部9 は、各種 ラメ タを記憶する ッ を内部に備え、 ムで められた SP( ム SP)と、 ムで められた 2 ラグ( ム 2 ラグ)と、 ムで めら れた 2 ( ム 2 )と、 ム で められた 2 ( ム 2 )と、 フ ムで められた 2 ベクト ( ム 2 ベクト )と、を ッ に記憶して る。
0143 作部9 は、 ム 52 ら ム 報を入 する。 作部9 は、 ム 報が もし は 3である場合、 第 53 ら SP ラグ
得と第 得とを する。 作部9 は、 ム 報が もし は 2である場合、第 53 ら ム P ム ラグとを する。次に、符号 作部9 は、 ム 報を SP 9 2 9 5 9 6 固定 9 7と する。 作部9 は、 ム 報が である場合、 SP 9 2 ム SP ム SPとを、適応 9 5 ム ラグ
ム 2 ラグとを、 9 6 ム 2 得と前 ム 2 得とを、固定 9 7 ム 2 ベクト を、 する。 作部9 は、 ム 報が である場合、 SP 9 2 SP ム
SPとを、適応 9 5 ラグ ム 2 ラグと を、 9 6 得と第 得 と前 ム 2 得と前 ム 2 得とを、固 定 9 7 フ ム 2 ベクト を、 する。
作部9 は、 ム 報が 2である場合、 SP 9 2 ム
SPを、適応 9 5 ム ラグを、 す る。 作部9 は、 ム 報が 3 である場合、 SP
9 2 SPを 適応 9 5 ラグを する。 0144 次に、符号 作部9 は、 ムでの 理に用 られた
SPを SP 9 2 ら、 2 ラグを適応 9 5 ら、 2 得と第2 得とを 9 6 ら、 2 ベクト を固定 9 7 ら する。次に、符号 作部9 は、 ム 報が 2である場合、 SP 2 ラグ 2 得と第2 得とを 53 する。
0145 作部9 は、以上の処理が終了した後、現 ムでの 理 に用 られた SPを ム SPとして、 2 ラ グを ム 2 ラグとして、 2 得を前 ム 2 得として、 2 得を前 ム 2
得として、 2 ベクト を ム 2 得として ッ 憶し、 ッ のアップデ トを 。
0146 このよ に、 53、 2 54にお て、 報、第2 報、前 ム 報、前 ム 2 報の中 ら、 ム 報に応じて に用 る ラメ タを 択することにより、符号 報の 態に適した を〒 ことができ、品質の 号を得ること ができる。
0147 次に、符号 作部8 の 部構成に て に示す ック図を用 て説明する。 ム は、 ム 52 ら ム 報を入力し、これを 2、符号
3、 2 4 SP 8 2、適応 8 5、
8 6 8 7に する。
0148 2は、 ム ム 報を入 する。次に、 2は、 SP 8 2 ら SPを、適応 8 5 ら ラグを、 8 6 ら 得と第 得とを、固定 8 7 ら ベクト を、 する。次に、 2は、
SP、 ラグ、 ベクト 、
得及び 得を 3 する。次に、
2は、 ム 報が もし は 3 である場合、第 SP ラグ ベクト 得と第 得とを 2 54 する。
0149 3は、 ム ム
報を入 する。また、符号 3は、 ムの SP、 ラグ、 ベクト 、 得及び
得を記憶する ッ を内部に備える。次に、符号 3は、 ム 報が もし は 2である場合、前 ム SPを SP 8 2 出力し、 ム ラグを適応 8 5 出力 し、 ム ベクト を固定 8 7 出力し、 ム 得と前 ム 得 を
8 6 する。また、符号 3は、 ム 報が もし は 2である場合、前 ム SP ム ラグとを 2 54 する。次に、符号 3は、
2 ら SP、 ラグ、 ベクト 、
得及び 得を入 する。次に、符号
3は、 SP、 ラグ、 ベクト 、
得及び 得を ッ することにより、 ッ のアップ 。 された SP、 ラグ、 ベクト 、 得及び 、 ム にお て、 ム SP、 ム ラグ、 ム ベクト 、 ム 得及び ム 得として られる。
0150 2 4は、 ム ム 報を入 する。次に、 2 4は、 ム 報が 2で ある場合、第2 54 ら SP、 2 ラグ、 2
得及び 2 得を入 する。次に、 2 4は、 ム 報が 2である場合、 SPを SP
8 2 出力し、 2 ラグを適応 8 5 出力し、 2
得と第2 得とを 8 6 する。 0151 次に、符号 作部9 の 部構成に て 示す ック図を用 て説明する。 ム は、 ム 52 ら ム 報を入力し、これを 2、符号
3、 2 4 SP 9 2、適応 9 5、
9 6 9 7に する。
0152 2は、 ム ム 報を入 する。次に、 2は、 ム 報が も し は 3 である場合、第 53 ら SP、 ラグ、 得及び 得を入 する。また、
2は、 ム 報が もし は 2である場合、第 53 ら ム SP ム ラグとを する。次 に、 2は、 ム 報が もし は 3 である場合 、第 SPを SP 9 2 出力し、 ラグを適応
9 5 する。また、 2は、 ム 報が である場合、第 得と第 得とを
9 6 する。また、 2は、 ム 報が もし は 2である場合、前 ム SPを SP 9 2 出力し 、 ム ラグを適応 9 5 する。
0153 2 4は、 ム ム 報を入 する。次に、 2 4は、 SP 9 2 ら
SPを、適応 9 5 ら 2 ラグを、 9 6 ら 2 得と第2 得とを、固定
9 7 ら 2 ベクト を、 する。次に、 2 4は、
SP、 2 ラグ、 2 ベクト 、 2 得及び 2 得を 3 する。次に、 2
4は、 ム 報が 2である場合、 SP 、 2 ラグ、 2 得及び 2 得を第
53 する。
0154 3は、 ム ム
報を入 する。また、符号 3は、 ムの SP 2 ラグ、 2 ベクト 、 2 得及び 2
得を記憶する ッ を内部に備える。次に、符号 3 は、 ム 報が もし は である場合、前 ム SPを P 9 2 出力し、 ム 2 ラグを適応 9 5 出力し、 ム 2 ベクト を固定 9 7 出力し、 ム 2 得と前 ム 2 得とを
9 6 する。次に、符号 3は、 2
4 ら SP、 2 ラグ、 2 ベクト 、 2 得及び 2 得を入 する。次に、符号
3は、 SP、 2 ラグ、 2 ベクト 、 2
得及び 2 得を ッ することにより、 ッ の アップデ トを 。 された SP、 2 ラグ、 2 ベクト 、 2 得及び 2 、 ムに お て、 ム SP、 ム 2 ラグ、 ム 2 ベクト 、 ム 2 得及び ム 2 得として られる。
0155 2は、 ム 報、および 53 2 54
ム 報に応じて に用 る ラメ タの 類を示した図である。なお、 ム 報とこれに対応する 報の 態と第2 報の 態と を併 て 。なお、 2にお て、 sp は SP、 P sp は ム
SPを、 ag は ラグを、 P ag は ム
ラグを、 c は ベクト を、 psc は ム ベクト を 、 ga は 得を、 Pga は ム 得 を、 9 は 得を、 Pgs は ム
得を、 d sp は SPを、 pd sp は ム SPを、 d ag は 2 ラグを、 pd ag は ム 2 ラグを、 e sc は 2 ベクト を、 pesc は ム 2 ベクト を、 ega は 2 得を、 pega は ム 2 得を、 egs は 2 得を、 pegs は ム 2 得をそ れぞれ 。
0156 また、 2にお て、 は、符号 報が正常に受信された状態を示し 、 は、正常に受信されな た( 失した) 態を示す。
0157 ム 報が 3 である場合、第 報、第2 に正常 されるので、 53 2 54とは、受信された
報と第2 報とを用 て を 。 、 ム 失を考慮しな 通常 の を 。 0158 ム 報が 2である場合、第 報が正常 されな ので、 53 2 54とは、 報の わりに ムの 報を用 て を 。また、 53は、 ムの 報に加え、 2 報を用 て を ことにより、 号の 上を図 て る。
0159 ム 報が である場合、第2 報が正常 されな ので、 2 54は、 2 報の わりに ムの 2 報を用 て を 。
0160 ム 報が である場合、第 報、第2 に正常 されな ので、 53 2 54とは、 報と第2 報との わりに ムの 報と前 ムの 2 報とを用 て を 。
0161 3は、 報が正常 されな 場合、第 53が、
ム 報に加え、 2 報を用 て を ことにより、 号の 上を図ることができることを視覚的に説明する図である。 0162 ここでは、 53の SP 8 2が SPを求める場合 を例にと て説明する。また、説明を簡単にする 、 SPは二次元の ク ト であるとする。
0163 3にお て、参照 3 は、 SP SP SP とを模式的に表したグラ である。ここで、 X は SPを表し、長 方の矢
SPを表し、短 方の矢 SPを表す。 SPは 報に、 SPは 2 報に、 まれる。
0164 また、参照 3 は、 SP ム SP SPと を模式的に表したグラ である。ここで、 X は SPを表し、破線の
SPを表し、実線の ム SPを表す。すなわち、 ( SP)が正常 されず、 SP 8 2が、 ム SPのみを用 て SPを求める( ム S Pを SPとする) 合を表す。 0165 また、参照 3 2は、 SP ム SP
SP SPとを模式的に表したグラ である。ここで、 X は SPを表し、 破線の SPを表し、長 方の実線の ム
SPを表し、短 方の実線の SPを表す。すなわち、
( SP)が正常 されず、 SP 8 2が、 ム SP SPとを加算し、加算した結果を第 SPとする場合 を表す。
0166 SP ム SPとの間の相関が高 、 差が 、さ 場 合、前 ム SPのみを用 る手法( 3 )に比 、 ム
SP SPとを用 る手法( 3 2)の方が、求める SP は SP( X ) 。
0167 し しながら、 SP ム SPとの間の相関が低 、 差が大き 場合、前 ム SP SPとを用 る手法の方 が、求める SPは SP( X ) とは限らな ( 3 3)。そこで 、 ム SPのみを用 る手法と、 ム SP
SPとを用 る手法と、の 方の 法に て、実際に ム 位で第 SPを求め、比較し、どちらの 法の SPが SPに近 を ム 位で出 する実験を行 た。8 前後の 号を8サンプ て 実験を行 た結果、8サンプ てに て、後者の 法の方が第 SPに近
ム数が多 果が得られた。また、特に有声 間にお て、前記 向が強 現れることが た。
0168 なお、本実施の 態では、符号 が2 の 部を有する場合を例に と て説明したが、符号 部の はこれに限定されず、3 上であ ても良 。 0169 また、本実施の 態では、 5 が2 の 部を有する場合を例に と て説明したが、 部の はこれに限定されず、3 上であ ても良 。 0170 また、本実施の 態では、 ム 報が である場合、第 53 は、 ムの 報のみを用 て を行 合に て説明した が、 53が、 ムの 報に加え、 ムの 2 報を用 て を〒 合に ても 適用することができ、本実 施の 態と同様の ・ 果を得ることができる。この 合、 ム 報が 2 である場合の 53の 法と同様の 法で第 号を求 めることができる。
0171 また、本実施の 態では、 ラ 報を用 て、 53が に用 る 報に第2 報を含める めな を指示する場合に て説 明したが、 ラ 報を用 ず、 53が に用 る 報に 第2 報を必ず める場合に ても 適用することができ、本実施 の 態と同様の ・ 果を得ることができる。
0172 また、本実施の 態では、 53 2 54とが、 ム の 報をそのまま ムの 報として 、 号を生成す る場合に て説明したが、 ムで生成される が前 ムで生成 された駆動 に比 やや減衰するよ に、 ムの 報に、ある一定 の を乗算して駆動 を求め、 号を生成しても良 。 えば、 ム 報が 2である場合、 8 6は、求めた
( )に、ある一定の ( えば、 ・ 9)を乗算し 、乗算結果を第 ( )として するこ とにより、 ムで生成される を減衰さ ることができる。
0173 また、本実施の 態では、 ム 報が 2である場合、
8 6は、 ム ( ム
) 2 ( 2 )とを加算し、加算結果に ・ 5を掛けた乗算結果を第 ( )とす る場合に て説明したが、 ム ( ム
) 2 ( 2 )とをある 一定の 合で し合わ て ( )を 求めても良 。 えば、 (7)により、 (
b a を求めるこ ができる。
0174 b a a B e a X( 0) (7) ここで、 a は ム ( ム であり、e a は 2 ( 2
)であり、 はO ら までの れ の値をとる。また、 の値は任意に設定することが できる。
0175 また、本実施の 態では、 ム 報が である場合、
9 6は、 ( ) ム 2
( ム 2 )とを加算し、加算結果に ・ 5を掛けた乗算結果を第2 ( 2 )とする 場合に て説明したが、上記 同様の 法を用 て 2 ( 2 )を求めても良 。
0176 また、本実施の 態では、 ム 報として十進 を用 る場合を例にと て説明したが、 ム 報として二進 を用 る場合に ても 適 用することができ、本実施の 態と同様の ・ 果を得ることができる。 えば、2 の ( ~2 )の 態を二進 で用 て表現する場合、正 常に受信されて る状態を 、正常に受信されて な 状態を 表すことにより 、 の ( ~ )で ム 報を表現することができる。
0177 また、本実施の 態では、固定 2 8が生成する ベクト が、 スにより 成されて る場合に て説明したが、固定 ベクト を形成する スが拡散 スである場合に ても 適用することができ、本実施の 態と同様の ・ 果を得ることができる。
0178 また、本実施の 態では、符号 部がC Pタイプの ・ 音符号 法である場合に て説明したが、符号 部がC Pタ イプ 外の ・ 音符号 ( えば、 ス 調、予測 、ベクト 、 ダ)である場合に ても 適用することができ、本 実施の 態と同様の ・ 果を得ることができる。また、音声・ 音符号
法が、 の 部にお て異なる音声・ 音符号 法である場合に ても 適用することができ、本実施の 態と同様の ・ 果を得ることができる。 0179 ( 施の 2)
4(a)は、上記 施の で説明した 置を含む、 明の 施の 2に係る音声・ 置の 成を示す ック図である。
0180 ・ 音信号 4 は、入力 4 2によ て電気 号に変換され、
4 3に出力される。 4 3は、入力 4 2 ら出力さ れた(アナ グ) 号を ジタ 号に変換し、音声・ 音符号 4 4 する。 ・ 音符号 4 4は、 に示した を実装し、
4 3 ら出力された ジタ ・ 音信号を 、符号 4 5 する。 4 5は、音声・ 音符号
4 4 ら出力された 報を電波 の 体に載 て送出するための 号 に変換し送信アンテナ 4 6 する。 アンテナ 4 6は 4 5 ら出力された出力 号を電波( )として送出する。なお、 f 4 7は アンテナ 4 6から送出された電波( )を表す。
0181 上が音声・ 音信号 置の および 作である。
0182 4(b)は、上記 施の で説明した 置を含む、 明の 施の
2に係る音声・ 置の 成を示す ック図である。
0183 R 4 8は、受信アンテナ 4 9によ て受信され 4 に出力 される。なお、 f 4 8は、受信アンテナ 4 9に受信された電波を表し 、伝播 にお て 号の 雑音の がなければ f 4 7 全 同じもの になる。
0184 R 4 は、受信アンテナ 4 9 ら出力された f 号 ら 報 を復調し、音声・ 4 する。 ・ 4 、 に示した 5 を実装し、 4 ら出力された 報 ら音声・ 音信号を復 、 4 2 する。
4 2 、音声・ 4 ら出力された ジタ ・ 音信号 をアナ グの 号に変換し出力 4 3 する。 4 3は電 気 号を空気の 動に変換し 波 して人間の耳に聴こえるよ に する。な お、 、参照 4 4は出力された音波を表す。 0185 上が音声・ 音信号 置の および 作である。
0186 線通信 ステムにおける基地 および 置に、上記のよ 音声・ 音信号 および音声・ 音信号 置を備えることにより、高品質な出 力 号を得ることができる。
0187 このよ に、本実施の 態によれば、 明に係る および 置 を ・ 音信号 および音声・ 音信号 置に実装することができる 0188 明に係る および 、上記の 施の ~2に限定さ れず、 して実施することが可能である。
0189 明に係る および 、移動体 ステムにおける移 動 および 置に搭 することも可能であり、これにより上記 同様の 果を有する移動 および 置を提供することができる。
0190 なお、ここでは、 明を ドウ アで構成する場合を例にと て説明したが、 ソ トウ アで実現することも可能である。
0191 明細書は、 2 4 5 24 出願の 2 4 53997に基 。この
、す てここに含めてお 。
上の利用 , 0192 明に係る および 、符号 報が失われた場合であ ても、品質の 号を得る効果を有し、音声・ 音信号を し て伝送する通信 ステムにお て使用される音声・ 音符号 および音声・ として有用である。

Claims

求の
スケ ラ により複数 層で構成された 報を復 して 号を生成する音声・ 置であ て、
受信された ムの 階層の 報が正常 否 を判定し、判定 果 である ム 報を生成する ム 段と、
前記 ム 報に応じて前記 された 報と過去に受信された 数の 報と ら各階層の に用 る 報を決定し、決定した 報を用 て を〒 ことにより 号を生成する前記 層と同数の 段と、を具備する音声・ 。
2 (は2 上の整 )の 、 層にお て ム
検出された場合、受信された ( ) 降の 報と前 ムの 層の 報と ら少な とも一 上の符 報を選択し、選択した
報を用 て を〒 ことにより 号を生成する 載の ・ 。
3 層の 、 層の 報が正常に受信されて な 場合、第2 層の 報と前 ムの 層の 報と ら少な とも 一 上の符 報を選択し、選択した 報を用 て を〒 ことに より 号を生成する に記載の ・ 。
4 ム 、符号 報の 信状態を数値により 現される に 記載の ・ 。
5 ム 、符号 報の 信状態を二進 により 現される
に記載の ・ 。
6 な とも一 の 、C Pタイプの ・ 法により を〒 に記載の ・ 。
7 C Pタイプの 、 SP 号を復 して SPを生成 する SP 段と、適応 ラグ 号を復 して適応 ベクト を生成す る ベクト 段と、固定 ベクト 号を復 して ベクト を生成する ベクト 段と、 号を復 して 得と 得とを生成する 段と、 層の 報が正常に受信されて な 場合、第( ) 降の 報と前 ムの 層の 報とに含まれて る複数の SP 号 ら少な とも一 上の量 SP 号を選択する 作手段と、を 具備し、
前記 SP 、前記 作手段にて選択された SP 号を用 て を行 、 SPを生成する 6に記載の ・
8 SP 、前記 作手段にて選択された SP 号を復 することによ て得られる SPを全て 算し、加算結果を
Pとする 7に記載の ・ 。
9 作手段は、 層の 報が正常に受信されて な 場 合、第( ) 降の 報と前 ムの 層の 報とに含ま れて る複数の ラグ 号 ら少な とも一 上の適 ラグ 号を選 択し、
前記 ベクト 、前記 作手段にて選択された ラグ 号を用 て を行 、適応 ベクト を生成する 7に記 載の ・ 。
0 ベクト 、前記 作手段にて選択された ラグ 号を復 することによ て得られる ラグを全て 算し、加算 結果を用 て適応 ベクト を生成する 7に記載の ・ 作手段は、 層の 報が正常に受信されて な 場 合、第( ) 降の 報と前 ムの 層の 報とに含ま れて る複数の 号 ら少な とも一 上の量
号を選択し、
前記 、選択された 号を用 て を行 、 得と 得とを生成する 7に 載の音 ・ 。
2 、前記 作手段にて選択された 号を復 することによ て得られる 得をある 一定の 合で全て 算し、加算結果を 得とし、また、
得をある一定の 合で全て 算し、加算結果を とする 7に記載の ・ 。
3 に記載の ・ 置を具備する音声・ 音信号 。4 3 載の ・ 音信号 置を具備する基地 。
5 3 載の ・ 音信号 置を具備する通信 。
6 スケ ラ により複数 層で構成された 報を復 して
号を生成する音声・ 法であ て、
受信された ムの 階層の 報が正常 否 を判定し、判定 果 である ム 報を生成する ム 程と、
前記 ム 報に応じて前記 された 報と過去に受信された 数の 報と ら各階層の に用 る 報を決定し、決定した 報を用 て を〒 ことにより 号を生成する前記 層と同数の 程と、を具備する音声・ 。
PCT/JP2005/008774 2004-05-24 2005-05-13 音声・楽音復号化装置および音声・楽音復号化方法 WO2005114655A1 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
US11/569,377 US8255210B2 (en) 2004-05-24 2005-05-13 Audio/music decoding device and method utilizing a frame erasure concealment utilizing multiple encoded information of frames adjacent to the lost frame
CA002567788A CA2567788A1 (en) 2004-05-24 2005-05-13 Audio/music decoding device and audio/music decoding method
CN2005800168247A CN1957399B (zh) 2004-05-24 2005-05-13 语音/音频解码装置以及语音/音频解码方法
EP05739228A EP1750254B1 (en) 2004-05-24 2005-05-13 Audio/music decoding device and audio/music decoding method
DE602005026802T DE602005026802D1 (de) 2004-05-24 2005-05-13 Audio/musikdecodierungseinrichtung und audio/musikdecodierungsverfahren

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2004-153997 2004-05-24
JP2004153997A JP4445328B2 (ja) 2004-05-24 2004-05-24 音声・楽音復号化装置および音声・楽音復号化方法

Publications (1)

Publication Number Publication Date
WO2005114655A1 true WO2005114655A1 (ja) 2005-12-01

Family

ID=35428593

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2005/008774 WO2005114655A1 (ja) 2004-05-24 2005-05-13 音声・楽音復号化装置および音声・楽音復号化方法

Country Status (8)

Country Link
US (1) US8255210B2 (ja)
EP (1) EP1750254B1 (ja)
JP (1) JP4445328B2 (ja)
KR (1) KR20070028373A (ja)
CN (1) CN1957399B (ja)
CA (1) CA2567788A1 (ja)
DE (1) DE602005026802D1 (ja)
WO (1) WO2005114655A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8712765B2 (en) 2006-11-10 2014-04-29 Panasonic Corporation Parameter decoding apparatus and parameter decoding method
CN113724716A (zh) * 2021-09-30 2021-11-30 北京达佳互联信息技术有限公司 语音处理方法和语音处理装置

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE602006018129D1 (de) * 2005-05-11 2010-12-23 Panasonic Corp Codierer, decodierer und verfahren dafür
EP1990800B1 (en) 2006-03-17 2016-11-16 Panasonic Intellectual Property Management Co., Ltd. Scalable encoding device and scalable encoding method
JP4551472B2 (ja) * 2006-05-25 2010-09-29 パイオニア株式会社 デジタル音声データ処理装置及び処理方法
JPWO2008007698A1 (ja) * 2006-07-12 2009-12-10 パナソニック株式会社 消失フレーム補償方法、音声符号化装置、および音声復号装置
EP2080194B1 (fr) * 2006-10-20 2011-12-07 France Telecom Attenuation du survoisement, notamment pour la generation d'une excitation aupres d'un decodeur, en absence d'information
JP4504389B2 (ja) 2007-02-22 2010-07-14 富士通株式会社 隠蔽信号生成装置、隠蔽信号生成方法および隠蔽信号生成プログラム
US8599981B2 (en) * 2007-03-02 2013-12-03 Panasonic Corporation Post-filter, decoding device, and post-filter processing method
CN100583649C (zh) * 2007-07-23 2010-01-20 华为技术有限公司 矢量编/解码方法、装置及流媒体播放器
JP2009047914A (ja) * 2007-08-20 2009-03-05 Nec Corp 音声復号化装置、音声復号化方法、音声復号化プログラムおよびプログラム記録媒体
US8527265B2 (en) * 2007-10-22 2013-09-03 Qualcomm Incorporated Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs
CN101588341B (zh) * 2008-05-22 2012-07-04 华为技术有限公司 一种丢帧隐藏的方法及装置
KR101261677B1 (ko) 2008-07-14 2013-05-06 광운대학교 산학협력단 음성/음악 통합 신호의 부호화/복호화 장치
US9026434B2 (en) 2011-04-11 2015-05-05 Samsung Electronic Co., Ltd. Frame erasure concealment for a multi rate speech and audio codec
CN103280222B (zh) * 2013-06-03 2014-08-06 腾讯科技(深圳)有限公司 音频编码、解码方法及其系统
JP5981408B2 (ja) * 2013-10-29 2016-08-31 株式会社Nttドコモ 音声信号処理装置、音声信号処理方法、及び音声信号処理プログラム
CN103646647B (zh) * 2013-12-13 2016-03-16 武汉大学 混合音频解码器中帧差错隐藏的谱参数代替方法及系统
FR3024582A1 (fr) * 2014-07-29 2016-02-05 Orange Gestion de la perte de trame dans un contexte de transition fd/lpd
CN112750419B (zh) * 2020-12-31 2024-02-13 科大讯飞股份有限公司 一种语音合成方法、装置、电子设备和存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1097295A (ja) 1996-09-24 1998-04-14 Nippon Telegr & Teleph Corp <Ntt> 音響信号符号化方法及び復号化方法
JP2002268696A (ja) * 2001-03-13 2002-09-20 Nippon Telegr & Teleph Corp <Ntt> 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0883107B9 (en) 1996-11-07 2005-01-26 Matsushita Electric Industrial Co., Ltd Sound source vector generator, voice encoder, and voice decoder
EP1734512B1 (en) 1997-10-22 2015-09-09 Godo Kaisha IP Bridge 1 CELP encoder and a method of CELP encoding
FR2774827B1 (fr) * 1998-02-06 2000-04-14 France Telecom Procede de decodage d'un flux binaire representatif d'un signal audio
CA2300077C (en) 1998-06-09 2007-09-04 Matsushita Electric Industrial Co., Ltd. Speech coding apparatus and speech decoding apparatus
US6188980B1 (en) * 1998-08-24 2001-02-13 Conexant Systems, Inc. Synchronized encoder-decoder frame concealment using speech coding parameters including line spectral frequencies and filter coefficients
US6775649B1 (en) * 1999-09-01 2004-08-10 Texas Instruments Incorporated Concealment of frame erasures for speech transmission and storage system and method
US6584438B1 (en) * 2000-04-24 2003-06-24 Qualcomm Incorporated Frame erasure compensation method in a variable rate speech coder
US6996522B2 (en) * 2001-03-13 2006-02-07 Industrial Technology Research Institute Celp-Based speech coding for fine grain scalability by altering sub-frame pitch-pulse
US7590525B2 (en) * 2001-08-17 2009-09-15 Broadcom Corporation Frame erasure concealment for predictive speech coding based on extrapolation of speech waveform
WO2006025313A1 (ja) 2004-08-31 2006-03-09 Matsushita Electric Industrial Co., Ltd. 音声符号化装置、音声復号化装置、通信装置及び音声符号化方法
WO2006030864A1 (ja) 2004-09-17 2006-03-23 Matsushita Electric Industrial Co., Ltd. 音声符号化装置、音声復号装置、通信装置及び音声符号化方法
KR100612889B1 (ko) * 2005-02-05 2006-08-14 삼성전자주식회사 선스펙트럼 쌍 파라미터 복원 방법 및 장치와 그 음성복호화 장치

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1097295A (ja) 1996-09-24 1998-04-14 Nippon Telegr & Teleph Corp <Ntt> 音響信号符号化方法及び復号化方法
JP2002268696A (ja) * 2001-03-13 2002-09-20 Nippon Telegr & Teleph Corp <Ntt> 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
M.R.SCHROEDER; B.S.ATAL: "Code Excited Linear Prediction: High Quality Speech at Low Bit Rate", IEEE PROC., ICASSP'85, 1985, pages 937 - 940, XP000560465
NOMURA ET AL: "MPEG-4/CELP Onsei Fugoka Hoshiki.", THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS., vol. 98, no. 424, 20 November 1998 (1998-11-20), pages 19 - 26, XP002998381 *
See also references of EP1750254A4

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8712765B2 (en) 2006-11-10 2014-04-29 Panasonic Corporation Parameter decoding apparatus and parameter decoding method
CN113724716A (zh) * 2021-09-30 2021-11-30 北京达佳互联信息技术有限公司 语音处理方法和语音处理装置
CN113724716B (zh) * 2021-09-30 2024-02-23 北京达佳互联信息技术有限公司 语音处理方法和语音处理装置

Also Published As

Publication number Publication date
JP2005338200A (ja) 2005-12-08
US8255210B2 (en) 2012-08-28
CN1957399B (zh) 2011-06-15
EP1750254B1 (en) 2011-03-09
EP1750254A4 (en) 2007-10-03
CN1957399A (zh) 2007-05-02
EP1750254A1 (en) 2007-02-07
KR20070028373A (ko) 2007-03-12
DE602005026802D1 (de) 2011-04-21
JP4445328B2 (ja) 2010-04-07
US20070271101A1 (en) 2007-11-22
CA2567788A1 (en) 2005-12-01

Similar Documents

Publication Publication Date Title
WO2005114655A1 (ja) 音声・楽音復号化装置および音声・楽音復号化方法
CN101268351B (zh) 健壮解码器
EP1768105A1 (en) Audio encoding device, audio decoding device, and method thereof
US20090112581A1 (en) Method and apparatus for transmitting an encoded speech signal
JP2738534B2 (ja) 異なる型の励起情報を有するディジタル音声符号器
WO2004097796A1 (ja) 音声符号化装置、音声復号化装置及びこれらの方法
KR100351484B1 (ko) 음성 부호화 장치, 음성 복호화 장치, 음성 부호화 방법 및 기록 매체
JP2007538282A (ja) 各種の符号化フレーム長でのオーディオ符号化
CN102648493A (zh) 音频信号处理方法和设备
CN100405460C (zh) 音频信号编码
JP2005241761A (ja) 通信装置及び信号符号化/復号化方法
JP4216364B2 (ja) 音声符号化/復号化方法および音声信号の成分分離方法
JP2010213350A (ja) 中継装置
JPH09512645A (ja) マルチパルス分析音声処理システムおよび方法
JP2013076871A (ja) 音声符号化装置及びプログラム、音声復号装置及びプログラム、並びに、音声符号化システム
JP5313967B2 (ja) ビット率拡張音声符号化及び復号化装置とその方法
EP4143825A2 (en) Method, apparatus and system for enhancing multi-channel audio in a dynamic range reduced domain
JP3886482B2 (ja) 多チャネル符号化方法、復号方法、これらの装置、プログラムおよびその記録媒体
EP1098298B1 (en) Speech coding with an orthogonal search
JP4578145B2 (ja) 音声符号化装置、音声復号化装置及びこれらの方法
WO2000063878A1 (fr) Codeur de parole, processeur de parole et procede de traitement de la parole
JPH11259098A (ja) 音声符号化/復号化方法
JP2005215502A (ja) 符号化装置、復号化装置、およびこれらの方法
CN116580695A (zh) 语音合成装置、方法、移动终端及存储介质
USRE43209E1 (en) Speech coding apparatus and speech decoding apparatus

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BW BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE EG ES FI GB GD GE GH GM HR HU ID IL IN IS KE KG KM KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NA NG NI NO NZ OM PG PH PL PT RO RU SC SD SE SG SK SL SM SY TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): BW GH GM KE LS MW MZ NA SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IS IT LT LU MC NL PL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 2005739228

Country of ref document: EP

Ref document number: 11569377

Country of ref document: US

WWE Wipo information: entry into national phase

Ref document number: 2567788

Country of ref document: CA

WWE Wipo information: entry into national phase

Ref document number: 1020067024640

Country of ref document: KR

WWE Wipo information: entry into national phase

Ref document number: 200580016824.7

Country of ref document: CN

NENP Non-entry into the national phase

Ref country code: DE

WWW Wipo information: withdrawn in national office

Country of ref document: DE

WWP Wipo information: published in national office

Ref document number: 2005739228

Country of ref document: EP

WWP Wipo information: published in national office

Ref document number: 1020067024640

Country of ref document: KR

WWP Wipo information: published in national office

Ref document number: 11569377

Country of ref document: US