WO1999038156A1 - Methode et dispositif d'accentuation de registre - Google Patents

Methode et dispositif d'accentuation de registre Download PDF

Info

Publication number
WO1999038156A1
WO1999038156A1 PCT/JP1999/000293 JP9900293W WO9938156A1 WO 1999038156 A1 WO1999038156 A1 WO 1999038156A1 JP 9900293 W JP9900293 W JP 9900293W WO 9938156 A1 WO9938156 A1 WO 9938156A1
Authority
WO
WIPO (PCT)
Prior art keywords
lag
pitch
value
lag value
signal
Prior art date
Application number
PCT/JP1999/000293
Other languages
English (en)
French (fr)
Inventor
Koji Yoshida
Original Assignee
Matsushita Electric Industrial Co., Ltd.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co., Ltd. filed Critical Matsushita Electric Industrial Co., Ltd.
Priority to EP99901170A priority Critical patent/EP0971337A4/en
Priority to CA002283202A priority patent/CA2283202A1/en
Priority to AU20750/99A priority patent/AU2075099A/en
Priority to KR1019997008620A priority patent/KR100338606B1/ko
Publication of WO1999038156A1 publication Critical patent/WO1999038156A1/ja

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain

Definitions

  • the present invention relates to a pitch emphasizing method and apparatus for a voice decoder mounted on a digital voice communication device such as a digital mobile phone.
  • a digital voice communication device such as a digital mobile phone.
  • a speech codec Z-decoding device for efficiently compressing and transmitting a speech signal.
  • a process using a Boost filter is performed to improve the perceived quality with respect to the quality degradation of the decoded audio caused by the encoding.
  • the processing by the Bost filter includes pitch enhancement which enhances the perceived quality by enhancing the pitch periodicity of the decoded signal.
  • the conventional pitch enhancement methods there is a technology based on the standard recommendation G.729 (8 kbps CS—ACELP speech coding system) of the international organization ITU-T.
  • G.729 8 kbps CS—ACELP speech coding system
  • FIG. 1 is a block diagram showing a configuration of a Boost filter arranged on the audio decoding side of the audio code Z decoding device.
  • the post-filter 1 performs pitch emphasis on a decoded speech after speech decoding in a pitch emphasizing unit 2 described later, and then emphasizes a speech spectrum in a formant emphasizing unit 3.
  • the high-frequency emphasis unit 4 corrects the tilt characteristics of the spectrum generated by the formant emphasis unit 3
  • the gain control unit 5 converts the post-filter-processed signal power to the signal power before the post-filter process. Perform gain correction to match.
  • FIG. 2 is a block diagram showing a configuration of the pitch emphasis unit 2.
  • the pitch emphasis unit 2 is an LPC inverse filter composed of LPC parameters used during speech decoding.
  • a residual signal is calculated from the decoded speech.
  • the LPC inverse filter corresponds to the numerator of the formant enhancement filter in the formant enhancement unit 3 in FIG. 1 and also serves as a part of the formant enhancement processing.
  • the lag value calculation unit 22 calculates a lag value using the residual signal obtained by the LPC inverse filter 21.
  • the lag value is calculated using the lag parameter used in speech decoding. From before and after the integer lag value represented by the lag parameter, an integer lag value at which the correlation value of the residual signal becomes maximum is determined, and a decimal lag value T at which the normalized correlation value becomes maximum before and after the integer lag value is determined. decide.
  • the gain coefficient calculator 23 calculates a coefficient g for controlling the gain of the pitch emphasis filter 24. This is obtained as the pitch prediction gain (normalized correlation value) at the lag value T.
  • the pitch emphasis filter 24 performs pitch emphasis processing on the residual signal of the decoded speech after the LPC inverse filter.
  • the pitch emphasis filter H p (z) is given by equation (1).
  • is a constant for controlling the degree of pitch enhancement.
  • a method and apparatus are provided.
  • the purpose is to calculate a first lag value from at least one of the lag parameters used in decoded speech or speech decoding to a signal waveform similar to the signal waveform to be pitch-emphasized, and to calculate the first lag value. Calculating one or more other lag values up to another signal waveform similar to the signal waveform to be pitch-emphasized based on the reference, and using the signal waveforms at the plurality of lag values to emphasize the decoded speech. Is achieved by As a result, when applied to a low-bit-rate speech codec, pitch emphasis with a high degree of emphasis can be performed without impairing the naturalness of the decoded speech, and the audibility quality can be further improved. BRIEF DESCRIPTION OF THE FIGURES
  • FIG. 1 is a block diagram illustrating a configuration of a conventional boost filter that performs pitch enhancement
  • FIG. 2 is a block diagram illustrating a configuration of a pitch enhancement unit in the conventional boost filter
  • FIG. 3 is a block diagram illustrating a configuration of a wireless communication device including the Bost filter according to the first embodiment of the present invention.
  • FIG. 4 is a block diagram illustrating a configuration of a voice decoding unit of the wireless communication device illustrated in FIG. 3
  • FIG. 5 is a block diagram illustrating a configuration of a pitch emphasis unit of the Bost filter according to the first embodiment of the present invention.
  • FIG. 6 is a flowchart showing an operation procedure of the pitch emphasizing operation in the first embodiment
  • FIG. 7 is a block diagram illustrating a configuration of a pitch emphasizing unit of the post filter according to the second embodiment of the present invention.
  • FIG. 3 is a block diagram illustrating a configuration of a wireless communication device including the Bost filter according to the first embodiment of the present invention.
  • sound is converted into an electric analog signal by a sound input device 101 such as a microphone on the transmitting side, and output to an A / D converter 102.
  • the analog audio signal is converted into a digital audio signal by the AZD converter 102 and output to the audio encoding unit 103.
  • the voice coding unit 103 performs voice coding processing on the digital voice signal, and outputs the coded information to the modulation / demodulation unit 104.
  • the modulation / demodulation unit 104 receives the coded voice signal. Is digitally modulated and sent to the wireless transmission unit 105.
  • the wireless transmission unit 105 performs a predetermined wireless transmission process on the modulated signal. This signal is transmitted via antenna 106.
  • a reception signal received by the antenna 107 is subjected to predetermined wireless reception processing by the wireless reception unit 108 and sent to the modulation / demodulation unit 104.
  • the modulation and demodulation section 104 performs demodulation processing on the received signal, and outputs the demodulated signal to the audio decoding section 109.
  • Speech decoding section 109 performs a decoding process on the demodulated signal to obtain a digital decoded speech signal, and outputs the digital decoded speech signal to DZA converter 110.
  • the D / A converter 1] 0 converts the digital decoded audio signal output from the audio decoding unit 109 into an analog decoded audio signal and outputs the analog decoded audio signal to an audio output device 11] such as a speaker.
  • the audio output device 1 1 1 converts the electrical analog decoded audio signal into decoded audio and outputs it.
  • the audio decoding unit 109 has the configuration shown in FIG. You That is, when the received data is input to the separator 201, the LPC parameter code L that represents the quantized LPC from the received data, the fixed excitation code S that represents the fixed excitation code vector, and the lag value are represented. A lag parameter code P and a gain code G representing gain information are extracted, and the respective codes are LPC decoder 201, fixed excitation codebook 205, lag parameter decoding unit 203, and gain code. Entered into Book 206.
  • the LPC decoder 207 decodes the quantized LPC from the LPC parameter code L and outputs the result to the synthesis filter 208.
  • the fixed excitation codebook 205 stores a predetermined number of fixed excitation code vectors having different shapes.
  • the fixed excitation codebook 205 has a fixed excitation codebook index obtained by decoding the input fixed excitation code S.
  • the fixed excitation code vector is output.
  • the fixed excitation code vector is output to an adder after being multiplied by a fixed excitation codebook gain described later in a multiplier.
  • the adaptive excitation codebook 204 buffers the driving excitation signals generated in the past while successively updating them, and generates an adaptive excitation code vector using lag parameters.
  • the lag parameter is a lag parameter in the lag parameter codebook specified by the lag parameter codebook index obtained by decoding the input lag parameter code P by the lag parameter decoding unit 203.
  • This adaptive excitation code vector is output to an adder after being multiplied by an adaptive excitation codebook gain described later in a multiplier.
  • the gain codebook 206 stores a predetermined number of sets (gain vectors) of the adaptive excitation codebook gain and the fixed excitation codebook gain, and is obtained by decoding the input gain code G.
  • the adaptive excitation codebook gain component of the gain vector specified by the gain codebook index is output to the multiplier, and the fixed excitation codebook gain component is output to the multiplier.
  • the adder generates a driving excitation signal by adding the fixed excitation code vector input from the multiplier and the adaptive excitation code vector, and outputs the driving excitation signal to the synthesis filter 208 and the adaptive excitation codebook 204.
  • the synthesis filter 208 constructs an LPC synthesis filter using the input quantized LPC. A filter processing is performed on the synthesis filter with the driving sound source signal output from the adder as an input, and the synthesis signal is output to the post-filter 209.
  • the post filter 209 processes the synthesized signal input from the synthesis filter 208 to improve the subjective quality of the audio signal, such as pitch emphasis, formant emphasis, high-frequency emphasis, and gain control. I do.
  • the output of the post-filter 209 is output as output data such as a decoded voice signal digitized after a predetermined post-processing.
  • FIG. 5 is a functional block diagram of the pitch emphasizing unit of the post filter according to the first embodiment of the present invention.
  • the pitch enhancement unit of the post filter according to Embodiment 1 performs LPC inverse filter processing on the decoded speech to obtain a residual signal, and LPC inverse filter 101 that uses the lag parameter used in speech decoding to decode the decoded speech.
  • the first lag value calculation unit 102 that calculates the first lag value from A second lag value calculation unit that calculates a second lag value from the lag value and the decoded voice of the first and second lag values from the decoded voice.
  • a first and second gain coefficient calculation unit 104 for calculating the second gain coefficient and the decoded voice, using the first and second lag values and the first and second gain coefficients.
  • a pitch emphasis filter 105 for performing pitch emphasis filter processing is provided.
  • Equation (2) shows the filter characteristics of the pitch emphasis filter 105.
  • ⁇ 1 and ⁇ 2 are the first and second lag values
  • gl and g 2 are the gain coefficients of the pitch enhancement filter of ⁇ 1 and ⁇ 2
  • ⁇ 1 and ⁇ 2 are the lag values ⁇ 1 and ⁇ Pitch against 2 It is a constant that controls the degree of emphasis.
  • the pitch emphasis filter 105 emphasizes the pitch using the signal of the second lag value T2 in addition to the signal of the first lag value T1 as shown in Expression (2).
  • the pitch enhancement process is performed in units of a fixed length section of the decoded speech. This section length corresponds to the coding unit (frame or subframe) of speech codec processing to which pitch enhancement is applied.
  • LPC coefficients constituting the LPC inverse filter 101 LPC parameters transmitted from the encoding side used for speech decoding are used.
  • LPC coefficient an LPC parameter obtained by directly performing an LPC analysis on the decoded speech s (n) can be used.
  • the first lag value calculating section 102 obtains a first lag value T 1 from the residual signal r (n).
  • the method of calculating the first lag value T 1 is arbitrary, for example,
  • the lag value at which the correlation value R (k) of the residual signal shown in Eq. (3) or the normalized correlation value Rn (k) shown in Eq. (4) becomes the maximum can be obtained as the first lag value T 1. it can.
  • Equation (3) r k (n) is the residual signal at the lag value k (including the decimal lag value).
  • the lag value of the lag parameter transmitted from the encoding side at the time of speech decoding may be used as it is as the first lag value, or a decimal lag value may be calculated in the range before and after the integer part.
  • the first lag value T1 obtained in this manner represents the amount of delay to a position where a signal waveform most similar to the target signal waveform for pitch enhancement exists.
  • the decoded speech signal or residual signal has a periodic signal waveform, it indicates the distance from the target signal waveform to the signal waveform one pitch cycle earlier.
  • the second lag value calculation unit 103 calculates a second lag value T2 using the first lag value T1 and the residual signal.
  • the second lag value calculation means 103 is based on a lag value obtained by doubling the first lag value T 1 (or an integer part of the first lag value T 1), and a decimal lag value before and after the lag value.
  • the lag value that maximizes equation (4) within the range including is calculated as the second lag value T2.
  • the second lag value T 2 obtained in this manner is typically calculated from the target signal waveform to the signal waveform two pitch periods before when the decoded speech signal or the residual signal has a periodic signal waveform. Indicates the distance.
  • the search range of the second lag value T 2 exceeds the value of the buffer length of the residual signal.
  • the calculation of the second lag value is stopped, and the decoded speech signal at the second lag value T2 is not used for pitch enhancement. This can suppress an increase in the buffer capacity (memory capacity) of the residual signal and the decoded audio signal.
  • the first and second gain coefficient calculation units 304 The gain factor of the pitch emphasis filter at the lag value is determined.
  • the first and second gain coefficients gl and g2 can be calculated by equations (5) and (6).
  • the pitch emphasis filter 105 applies the pitch emphasis filter shown in equation (2) to the decoded speech to perform pitch emphasis, thereby obtaining an output signal after pitch emphasis.
  • the output after pitch emphasis is then subjected to formant emphasis, high-frequency emphasis, and gain control, resulting in post-filter output.
  • the second lag value calculating section 103 is provided in addition to the first lag value calculating section 102.
  • the optimum second lag value T2 is calculated, and the decoded speech signal at the lag value T2 is added to the decoded speech signal at the first lag value and used for pitch enhancement, whereby the signal to be subjected to pitch enhancement is obtained.
  • the signal with the second lag value one pitch period before
  • the signal with the second lag value two pitch periods before
  • smooth pitch emphasis using a similar signal waveform can be realized, and high-pitched pitch emphasis can be performed without impairing the naturalness of decoded speech.
  • FIG. 7 is a functional block diagram of a pitch emphasizing unit of a Bost filter according to Embodiment 2 of the present invention.
  • the post-filter according to the second embodiment uses a residual signal, which is an output of an LPC inverse filter, as an input of the pitch emphasis filter 105, instead of the decoded speech signal.
  • Other configurations are the same as those of the first embodiment.
  • the residual signal and gain relation at the first and second lag values Pitch emphasis processing is performed using numbers.
  • a filter characteristic of the LPC inverse filter 101 a characteristic corresponding to a numerator term of the formant enhancement filter expressed by Expression (9) performed after the pitch enhancement processing is used.
  • ⁇ , ⁇ d are constants controlling the degree of formant enhancement
  • lZgf is a gain correction term.
  • the LPC inverse filter processing for obtaining the lag value used in the pitch enhancement filter of the present invention and the residual signal used in calculating the gain coefficient is performed.
  • first and second lag values are used as the lag values used for pitch enhancement.
  • a method using two or more lag values is similarly realized. it can.
  • the method of calculating the lag value and the gain coefficient using the residual signal after the LPC inverse filter has been described.
  • the lag value and the gain coefficient may be calculated directly from the decoded speech signal.
  • the second lag value 2 pitch period
  • the present invention also includes a device that operates as a pitch emphasizing device using a program in which the above-described pitch emphasizing method is realized by software and recorded on a recording medium such as a magnetic disk, a magneto-optical disk, and a ROM.
  • the pitch emphasizing method and device of the present invention can be applied to a base station device, a communication terminal device, and the like in a wireless communication system.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

明 細 書 ピッチ強調方法及びその装置 技術分野
本発明は、 ディジタル携帯電話などのディジタル音声通信装置に搭載され る音声復号器におけるピッチ強調方法及びその装置に関する。 景技術
従来、 ディジタル携帯電話などでは、 音声信号を効率的に情報圧縮して伝 送するため音声符号 Z復号化装置を搭載している。 音声符号 Z復号化装置の 音声復号側において、 符号化により生じる復号音声の品質劣化に対して聴感 上の品質を向上させるためボストフィルタによる処理が実行される。 ボスト フィルタによる処理には、 復号信号が有するピッチ周期性を強調することに より聴感品質の向上を図るピッチ強調が含まれる。 従来のピッチ強調方法の 一つとして、 国際機関 I T U— Tの標準勧告 G . 7 2 9 ( 8 k b p s C S— A C E L P音声符号化方式) に基づく技術がある。 以下、 その従来のピッチ 強調方法について図 1及び図 2を用いて説明する。
図 1は、 音声符号 Z復号化装置の音声復号側に配置されたボストフィルタ の構成を示すブロック図である。 このポストフィルタ 1は、 音声復号後の復 号音声に対して、 後述するピッチ強調部 2でピッチ強調を行った後、 ホルマ ント強調部 3で音声スペク トルの強調を行う。 そして、 高域強調部 4でホル マント強調部 3により生じたスぺク トルの傾斜特性を補正し、 最後にゲイン 制御部 5によりポストフィルタ処理後の信号パヮ一をボストフィルタ処理前 の信号パワーに合わせるゲイン補正を行う。
図 2はピッチ強調部 2の構成を示すブロック図である。 ピッチ強調部 2は、 音声復号時に用いられた L P Cパラメータにより構成された L P C逆フィル タ 2 1で復号音声から残差信号を算出する。 本従来例では、 L P C逆フィル タは、 図 1のホルマント強調部 3におけるホルマント強調フィルタの分子項 に相当し、 ホルマント強調処理の一部を兼ねている。
ラグ値算出部 2 2では、 L P C逆フィルタ 2 1で得られた残差信号を用い てラグ値を算出する。 ラグ値の算出には、 音声復号で用いられたラグパラメ ータを利用する。 ラグパラメータの表す整数ラグ値の前後から、 残差信号の 相関値が最大になる整数ラグ値を決定し、 さらにその整数ラグ値の前後で正 規化相関値が最大になる小数ラグ値 Tを決定する。
ゲイン係数算出部 2 3では、 ピッチ強調フィルタ 2 4のゲインを制御する 係数 gを算出する。 これは、 ラグ値 Tにおけるピッチ予測ゲイン (正規化相 関値) として求める。
最後にピッチ強調フィルタ 2 4により、 復号音声の L P C逆フィルタ後の 残差信号に対してピッチ強調処理を行う。 ピッチ強調フィルタ H p ( z ) は、 ( 1 ) 式で与えられる。
Figure imgf000004_0001
ただし、 γはピッチ強調の度合いを制御する定数である。
ところで、 上記従来のピッチ強調方法をより効率的な符号化を行う低ビッ トレート (例えば 4 k b p s ) での音声符復号器に適用する場合、 低ビット レート化に伴う復号音声品質の劣化をより抑えるために、 ピッチ強調の度合 いを強める必要がある。 従来のピッチ強調方法は、 ピッチ強調の度合いを強 める場合、 上記 (1 ) 式におけるピッチ強調の度合いを制御する定数 Yを大 きくする必要がある。
しかしながら、 単に定数 γを大きく しただけでは、 音声の自然性を損なう ことから違和感のある音質となり、 かえつて聴感上の品質を劣化させてしま うという問題を有する。 発明の開示
本発明の目的は、 低ビットレートな音声符復号器において、 復号音声の自 然性を損なうことなく強調度合いの高いピッチ強調を行うことができ聴感品 質をより高めることのできる優れたピッチ強調方法及びその装置を提供する ことである。
この目的は、 復号音声又は音声復号で用いられるラグパラメータの少なく とも一つからピッチ強調対象の信号波形に類似する信号波形までの第 1のラ グ値を算出し、 前記第 1のラグ値を基準にして前記ピッチ強調対象の信号波 形に類似する他の信号波形までの他のラグ値を一つ以上算出し、 前記複数の ラグ値での信号波形を用いて復号音声の強調を行うことにより達成される。 これにより、 低ビットレートな音声符復号器に適用する際に、 復号音声の 自然性を損なうことなく強調度合いの高いピッチ強調を行い聴感品質をより 向上させることができる。 図面の簡単な説明
図 1は、 従来のピッチ強調を行うボストフィルタの構成を示すプロック図、 図 2は、 従来のボストフィルタにおけるピッチ強調部の構成を示すプロッ ク図、
図 3は、 本発明の実施の形態 1にかかるボストフィルタを備えた無線通信 装置の構成を示すプロック図、
図 4は、 図 3に示す無線通信装置の音声複号化部の構成を示すプロック図、 図 5は、 本発明の実施の形態 1にかかるボストフィルタのピッチ強調部の 構成を示すブロック図、
図 6は、 実施の形態 1におけるピッチ強調動作の動作手順を示すフロー図、 並びに 図 7は、 本発明の実施の形態 2にかかるポストフィルタのピッチ強調部の 構成を示すプロック図である。 発明を実施するための最良の形態
以下、 本発明の実施の形態について、 図面を用いて具体的に説明する。
(実施の形態 1 )
図 3は、 本発明の実施の形態 1にかかるボストフィルタを備えた無線通信 装置の構成を示すプロック図である。
この無線通信装置において、 送信側で音声がマイクなどの音声入力装置 1 0 1によって電気的アナログ信号に変換され、 A/ D変換器 1 0 2に出力さ れる。 アナログ音声信号は、 AZD変換器 1 0 2によってディジタル音声信 号に変換され、 音声符号化部 1 0 3に出力される。 音声符号化部 1 0 3は、 ディジタル音声信号に対して音声符号化処理を行い、 符号化した情報を変復 調部 1 0 4に出力する 変復調部 1 0 4は、 符号化された音声信号をデイジ タル変調して、 無線送信部 1 0 5に送る。 無線送信部 1 0 5では、 変調後の 信号に所定の無線送信処理を施す。 この信号は、 アンテナ 1 0 6を介して送 信される。
一方、 無線通信装置の受信側では、 アンテナ 1 0 7で受信した受信信号は、 無線受信部 1 0 8で所定の無線受信処理が施され、 変復調部 1 0 4に送られ る。 変復調部 1 0 4では、 受信信号に対して復調処理を行い、 復調後の信号 を音声複号化部 1 0 9に出力する。 音声複号化部 1 0 9は、 復調後の信号に 復号処理を行ってディジタル復号音声信号を得て、 そのディジタル復号音声 信号を DZ A変換器 1 1 0へ出力する。 D/A変換器 1 ] 0は、 音声複号化 部 1 0 9から出力されたディジタル復号音声信号をアナログ復号音声信号に 変換してスピーカなどの音声出力装置 1 1 ]に出力する。 最後に音声出力装 置 1 1 1が電気的アナログ復号音声信号を復号音声に変換して出力する。 上記構成において、 音声復号化部 1 0 9は、 図 4に示す構成を有する。 す なわち、 受信データが分離器 2 0 1に入力されると、 受信データから量子化 L P Cを表現する L P Cパラメータ符号 L、 固定音源符号べク トルを表現す る固定音源符号 S、 ラグ値を表現するラグパラメータ符号 P、 及びゲイン情 報を表現するゲイン符号 Gが抽出され、 それぞれの符号が L P C復号器 2 0 1、 固定音源符号帳 2 0 5、 ラグパラメータ復号部 2 0 3、 及びゲイン符号 帳 2 0 6に入力される。
L P C復号器 2 0 7は、 L P Cパラメ一タ符号 Lから量子化 L P Cを復号 し、 合成フィルタ 2 0 8に出力する。 固定音源符号帳 2 0 5は、 予め定めら れた個数の形状の異なる固定音源符号べク トルが格納されており、 入力した 固定音源符号 Sを復号して得られる固定音源符号帳ィンデッタスによって指 定される固定音源符号べク トルを出力する。 この固定音源符号べク トルは、 乗算器で後述する固定音源符号帳利得が乗じられた後に加算器に出力される。 適応音源符号帳 2 0 4は、 過去に生成した駆動音源信号を逐次更新しなが らバッファリングしており、 ラグパラメ一タを用いて適応音源符号べク トル を生成する。 このラグパラメータは、 入力したラグパラメータ符号 Pをラグ パラメータ復号部 2 0 3で復号して得られるラグパラメ一タ符号帳ィンデッ タスにより指定されたラグパラメータ符号帳上のラグパラメ一タである。 こ の適応音源符号べク トルは、 乗算器で後述する適応音源符号帳利得が乗じら れた後に加算器に出力される。
ゲイン符号帳 2 0 6は、 適応音源符号帳利得と固定音源符号帳利得のセッ ト (ゲインベク トル) を予め定められた個数だけ格納しており、 入力したゲ ィン符号 Gを復号して得られるゲイン符号帳ィンデックスによって指定され るゲインべク トルの適応音源符号帳利得成分を乗算器に、 固定音源符号帳利 得成分を乗算器に夫々出力する。
加算器は、 乗算器から入力される固定音源符号ベクトルと適応音源符号べ ク トルの加算を行って駆動音源信号を生成し、 合成フィルタ 2 0 8及び適応 音源符号帳 2 0 4に出力する。 合成フィルタ 2 0 8は、 入力した量子化 L P Cを用いて L P C合成フィル タを構築する。 この合成フィルタに対して加算器から出力される駆動音源信 号を入力としてフィルタ処理を行って合成信号をポストフィルタ 2 0 9に出 力する。
ポス トフィルタ 2 0 9は、 合成フィルタ 2 0 8から入力した合成信号に対 して、 ピッチ強調、 ホルマント強調、 高域強調、 及びゲイン制御などの音声 信号の主観的品質を改善させるための処理を行う。 ポストフィルタ 2 0 9の 出力は、 所定の後処理が施された後にディジタル化された復号音声信号など の出力データとして出力される。
図 5は、 本発明の実施の形態 1にかかるポストフィルタのピッチ強調部の 機能ブロック図である。 実施の形態 1に係るポス トフィルタのピツチ強調部 は、 復号音声に対して L P C逆フィルタ処理を行い残差信号を求める L P C 逆フィルタ 1 0 1、 音声復号で用いられるラグパラメータを用いて復号音声 から第 1のラグ値を算出する第 1のラグ値算出部 1 0 2、 第:!のラグ値及び 復号音声から第 2のラグ値を算出する第 2のラグ値算出部] 0 3、 第〗、 第 2のラグ値及び前記復号音声から第 1及び第 2のラグ値に対する第 1及び第 2のゲイン係数を算出する第 1及ぴ第 2のゲイン係数算出部 1 0 4、 復号音 声、 第 1及び第 2のラグ値及ぴ第 1及ぴ第 2のゲイン係数を用いてピッチ強 調フィルタ処理を行うピッチ強調フィルタ 1 0 5を備える。
ピッチ強調フィルタ 1 0 5のフィルタ特性を (2 ) 式に示す。
+ 2 jZ 丁2 : (2)
Figure imgf000008_0001
ここで、 Τ 1 , Τ 2は、 第 1及び第 2のラグ値、 g l , g 2は Τ 1,Τ 2のピッ チ強調フィルタのゲイン係数、 γ 1、 γ 2はラグ値 Τ 1,Τ 2に対するピッチ 強調の度合いを制御する定数である。 ピッチ強調フィルタ 1 05は、 (2) 式に示されるように第 1のラグ値 T 1 の信号に加え、 第 2のラグ値 T 2の信 号を用いてピッチ強調する。
以上のように構成された実施の形態 1についてそのピッチ強調の動作を図 6に示す処理手順にしたがって説明する。 なお、 本実施の形態 1でピッチ強 調処理は復号音声の一定長の区間を単位として行われる。 この区間長は、 ピ ツチ強調が適用される音声符復号処理の符号化単位 (フレーム又はサブフレ ーム) に対応している。
まず、 L P C逆フィルタ 1 01では、 復号音声 s (n) (n = 0, 1, …, N— 1 ; N : 区間長) から残差信号 r (n) (n = 0, 1, …, N— 1 ) 算出される。 L PC逆フィルタ 1 01を構成する L P C係数は、 音声復号時 に用いる符号化側から送信された LP Cパラメ一タを用いている。 なお、 L PC係数については、 復号音声 s (n) を直接 L P C分析して求めた L P C パラメータを用いることができる。
次に、 第 1のラグ値算出部 1 02において、 残差信号 r (n) から第 1の ラグ値 T 1を求める。 第 1のラグ値 T 1の算出方法は任意であるが、 例えば、
(3) 式に示す残差信号の相関値 R (k) 、 又は (4) 式に示す正規化相関 値 Rn (k) が最大になるラグ値を第 1のラグ値 T 1 として求めることがで きる。
R(k)=∑r(n)rk(n) … (3) n=0
Figure imgf000010_0001
ここで、 (3 ) 式、 (4 ) 式において r k ( n ) はラグ値 k (小数ラグ値 を含む) における残差信号である。
また、 最初に整数ラグ値でラグ値の範囲を絞り、 その整数ラグ値の前後の 特定範囲内で小数ラグ値の最適値を求めるという方法を採ることができる。 また、 音声復号時に符号化側から送信されるラグパラメータのラグ値をその まま第 1のラグ値とする、 あるいはその整数部分を中心にその前後の範囲で 小数ラグ値を算出しても良い。
このようにして得られた第 1のラグ値 T 1は、 ピッチ強調の対象信号波形 に最も類似した信号波形が存在する位置までの遅延量を表すことになる。 典 型的には、 復号音声信号又は残差信号が周期的な信号波形の場合、 対象信号 波形から 1 ピッチ周期前の信号波形までの距離を示す。
次に、 第 2のラグ値算出部 1 0 3が、 第 1のラグ値 T 1 と残差信号を用い て第 2のラグ値 T 2を算出する。 第 2のラグ値算出手段 1 0 3は、 第 1のラ グ値 T 1 (又は第 1のラグ値 T 1における整数部分) を 2倍したラグ値を中 心に、 その前後の小数ラグ値を含む範囲で (4 ) 式が最大になるラグ値を第 2のラグ値 T 2として算出する。 このように第 2のラグ値を求めることによ り、 算出すべき第 2のラグ値を第 1のラグ値からより適切な範囲に限定する と共に、 少ない演算量で第 2のラグ値を算出できる。
このようにして得られた第 2のラグ値 T 2は、 典型的には、 復号音声信号 又は残差信号が周期的な信号波形の場合、 対象信号波形から 2ピッチ周期前 の信号波形までの距離を示す。
なお、 第 2のラグ値 T 2の探索範囲が、 残差信号のバッファ長の値を越え るような場合には、 第 2のラグ値算出を中止し、 第 2のラグ値 T 2における 復号音声信号をピッチ強調に用いないようにする。 このことで、 残差信号及 び復号音声信号のバッファ容量 (メモリ容量) の増加を抑えることができる 次に、 第 1及ぴ第 2のゲイン係数算出部 304により、 第]及ぴ第 2のラ グ値におけるピッチ強調フィルタのゲイン係数を決定する。 第 1及び第 2の ゲイン係数 g l、 g 2は (5) 式、 (6) 式により算出できる。
N-]
∑nn)rT i)
d … )
Figure imgf000011_0001
(6)
Figure imgf000011_0002
なお、 g l、 g 2に関連する (7) 式及び (8) 式の値があるしきい値 T h 1、 T h 2以下の場合、 そのラグ値でのピッチ強調を行わないようにする。 このことで、 類似性の高くない復号音声信号をピッチ強調に用いてしまうこ とによる聴感品質の劣化を抑えることができる。
(7)
Figure imgf000011_0003
…(8)
Figure imgf000012_0001
最後に、 ピッチ強調フィルタ 1 0 5により、 復号音声に対して (2 ) 式に 示すピッチ強調フィルタを施すことでピツチ強調を行い、 ピッチ強調後の出 力信号を得る。
ピッチ強調後の出力に対しては、 その後ホルマント強調、 高域強調、 及び ゲイン制御の各処理が施され、 ポストフィルタの出力となる。 このような処 理を行うことにより、 聴感特性に優れたピツチ強調を可能にした音声復号を 行うことができる。
以上のような実施の形態 1によれば、 第 1のラグ値算出部 1 0 2に加え、 第 2のラグ値算出部 1 0 3を備え、 第 1のラグ値 T 1の 2倍付近で最適な第 2のラグ値 T 2を算出し、 そのラグ値 T 2での復号音声信号を第 1のラグ値 での復号音声信号に加えてピッチ強調に用いることで、 ピッチ強調を行う信 号波形に最も類似な第] のラグ値 (1 ピッチ周期前) の信号に加え、 波形の 類似性の高い第 2のラグ値 (2ピッチ周期前) における信号を用いることと なり、 過去の複数の類似信号波形を用いたより滑らかなピッチ強調を実現で き、 復号音声の自然性を損なうことなく強調度合いの高いピツチ強調を行う ことができる。
(実施の形態 2 )
図 7は、 本発明の実施の形態 2に係るボストフィルタのピッチ強調部の機 能ブロックである。 実施の形態 2のポストフィルタは、 ピッチ強調フィルタ 1 0 5, の入力として、 復号音声信号の代わりに L P C逆フィルタの出力で ある残差信号を用いる。 その他の構成は実施の形態 1と同一である。
実施の形態 2では、 第 1及び第 2のラグ値における残差信号及びゲィン係 数を用いてピッチ強調処理を行う。 ここで、 L P C逆フィルタ 1 01のフィ ルタ特性として、 ピッチ強調処理の後段で行われる (9) 式で示すホルマン ト強調フィルタの分子項に相当する特性を用いる。 a i ( i = l, …, Np) は L P C係数、 γ η, γ dはホルマント強調度合いを制御する定数、 l Zg f はゲイン補正項である。
Figure imgf000013_0001
¾ (9)
, a一iZ 以上のように、 本発明の実施の形態 2によれば、 本発明のピッチ強調フィ ルタで用いるラグ値及びゲィン係数算出時に用いる残差信号を得るための L PC逆フィルタ処理が、 ホルマント強調フィルタの一部を兼ねることができ、 演算量の削減を図ることができる。
なお、 上記実施の形態 1及び 2では、 ピッチ強調に用いるラグ値として第 1及び第 2の 2つのラグ値を用いる場合について説明したが、 2つ以上のラ グ値を用いる方法も同様に実現できる。
また、 その場合に、 第 1のラグ値の 1/2 (あるいは lZn (n = 3, 4, …) 付近のラグ値を用いるようにして、 第 1のラグ値算出時に n倍ピッチ誤 り (ラグ値を本来の n倍の値として誤って算出してしまう) 場合の改善を図 ることも可能である。
また、 上記実施の形態 1及び 2においては、 ラグ値及びゲイン係数算出に L PC逆フィルタ後の残差信号を用いて算出する方法について説明したが、 復号音声信号から直接求めてもよい。
以上のように、 本発明は、 ピッチ強調を行う信号波形に最も類似な第 1の ラグ値 (1 ピッチ周期前) の信号に加え、 波形の類似性の高い第 2のラグ値 (2ピッチ周期前) における信号を用いることにより、 過去の複数の類似信 号波形を用いたより滑らかなピッチ強調を実現でき、 復号音声の自然性を損 なうことなく強調度合いの高いピツチ強調を行うことができるという効果が 得られる。
また、 本発明は、 上述したピッチ強調方法をソフトウェアで実現したプロ グラムを磁気ディスク、 光磁気ディスク、 R O Mなどの記録媒体に記録した ものを用いてピッチ強調装置として動作するものを含む。
上記実施の形態においては、 C E L P形式の場合について説明しているが、 本発明は C E L P形式でない場合にも適用することができる n
この出願は、 1 9 9 8年 1月 2 6日に出願された日本国特許出願平成 1 0 年 0 2 7 7 1 0号に基づいている。 その内容はすべてここに含めておく。 産業上の利用可能性
本発明のピッチ強調方法及びその装置は、 無線通信システムにおける基地 局装置や通信端末装置などに適用することができる。

Claims

請求の範囲
1 . 復号音声又は音声復号で用いられるラグパラメータの少なくとも一 つからピッチ強調対象の信号波形に類似する信号波形までの第 1のラグ値を 算出し、 前記第 1のラグ値を基準にして前記ピッチ強調対象の信号波形に類
5 似する他の信号波形までの他のラグ値を一つ以上算出し、 前記複数のラグ値 での信号波形を用いて復号音声の強調を行うピッチ強調方法。
2 . 他のラグ値は、 第〗のラグ値又は第 1のラグ値の整数部分を n倍し た値又はその付近の値である請求項 1記載のピッチ強調方法。
3 . 復号音声又は音声復号で用いられるラグパラメータの少なくとも一 10 つからピッチ強調対象の信号波形に類似する信号波形までの第 1のラグ値を 算出し、 前記第 1のラグ値を基準にして前記ピッチ強調対象の信号波形に類 似する他の信号波形までの第 2のラグ値を算出し、 前記第 1、 第 2のラグ値 及び前記復号音声から第 1及び第 2のラグ値に対する第 1及ぴ第 2のゲイン 係数を算出し、 前記復号音声、 第 1及び第 2のラグ値及び第 1及び第 2のゲ 15 ィン係数を用いて復号音声のピッチ強調を行うピッチ強調方法。
4 . 第 2のラグ値は、 第 1のラグ値又は第 1のラグ値の整数部分を 2倍 した値を中心に、 小数値を含むその前後のラグ値候補の中から、 復号音声又 はそれに関連する信号の相関値又はそれに関連する値を最大にするラグ値で ある請求項 3記載のピッチ強調方法。
20 5 . 第 2のラグ値が、 ラグ値算出に用いる復号音声又はそれに関連する 信号のバッファ長の値を越える場合には、 前記第 2のラグ値における復号音 声又はそれに関連する信号をピッチ強調には用いなレ、請求項 3記載のピッチ 強調方法。
6 . 復号音声又はそれに関連する信号の第 1又は第 2のラグ値における ¾ 正規化相関値があるしきい値以下の場合には、 そのラグ値における復号音声 又はそれに関連する信号をピッチ強調には用いない請求項 3記載のピッチ強 調方法。
7 . ラグ値算出及び相関値算出に用いる復号音声又はそれに関連する信 号として、 復号音声に対して L P C逆フィルタを施して得られる残差信号を 用いる請求項 3記載のピッチ強調方法。
8 . 復号音声の代わりに、 復号音声に対して L P C逆フィルタを施して 得られる残差信号をピッチ強調フィルタ処理の入力として用いる請求項 3記 載のピッチ強調方法。
9 . 請求項 1記載のピッチ強調方法を復号側のポストフィルタの処理に 適用した音声復号化方法。
1 0 . 復号音声又は音声復号で用いられるラグパラメータの少なくとも 一つからピッチ強調対象の信号波形に類似する信号波形までの第 1のラグ値 を算出する第 1 のラグ値算出器と、 前記第 1のラグ値を基準にして前記ピッ チ強調対象の信号波形に類似する他の信号波形までの第 2のラグ値を算出す る第 2のラグ値算出器と、 前記第 1 ,第 2のラグ値及び前記復号音声から第 1 及び第 2のラグ値に対する第 1及び第 2のゲイン係数を算出する第 1及び第 2のゲイン係数算出器と、 前記復号音声、 第 1及び第 2のラグ値及び第 1及 び第 2のゲイン係数を用いてピッチ強調フィルタ処理を行うピッチ強調フィ ルタとを備えたピッチ強調装置。
1 1 . 復号音声に対して L P C逆フィルタ処理を行い残差信号を求める L P C逆フィルタを備え、 第 1及び第 2のラグ値及びゲイン係数の算出に前 記残差信号を用いる請求項 1 0記載のピッチ強調装置。
1 2 . 復号音声に対して L P C逆フィルタ処理を行い残差信号を求める L P C逆フィルタと、 前記残差信号又は音声復号で用いられるラグパラメ一 タの少なくとも一つからピッチ強調対象の信号波形に類似する信号波形まで の第 1のラグ値を算出する第 1のラグ値算出器と、 前記第 1のラグ値及び前 記残差信号から前記ピッチ強調対象の信号波形に類似する他の信号波形まで の第 2のラグ値を算出する第 2のラグ値算出器と、 前記第 1、 第 2のラグ値 及び前記残差信号から第 1及び第 2のラグ値に対する第 1及び第 2のゲイン 係数を算出する第 1及び第 2のゲイン係数算出器と、 前記残差信号、 第 1及 ぴ第 2のラグ値及ぴ第 1及ぴ第 2のゲイン係数を用いてピッチ強調フィルタ 処理を行うピッチ強調フィルタとを備えたピッチ強調装置。
1 3 . 請求項 1 0記載のピッチ強調装置を復号側のボストフィルタの一 部に適用した音声復号化装置。
1 4 . 請求項 1 0記載のピツチ強調装置を復号側のボストフィルタの一 部に適用したデジタル音声通信装置。
1 5 . コンピュータによる読み取りの可能な媒体と、 復号音声又は音声 復号で用いられるラグパラメータの少なくとも一つからコンピュータ ·プロ セッサにピッチ強調対象の信号波形に類似する信号波形までの第 1のラグ値 を算出させる第 1のプログラム命令手段と、 前記第 1のラグ値を基準にして コンピュータ .プロセッサに前記ピッチ強調対象の信号波形に類似する他の 信号波形までの他のラグ値を一つ以上算出させる第 2のプログラム命令手段 と、 コンピュータ 'プロセッサに前記複数のラグ値での信号波形を用いて復 号音声のピッチ強調をさせる第 3のプロダラム命令手段とを具備し、
各プログラム命令手段が実行可能な形式で前記媒体に記憶されていて、 関連したプロセッサによる実行の際にコンピュータ .メモリにロードされて コンピュータを動かすコンピュータ ·プログラム製品。
PCT/JP1999/000293 1998-01-26 1999-01-26 Methode et dispositif d'accentuation de registre WO1999038156A1 (fr)

Priority Applications (4)

Application Number Priority Date Filing Date Title
EP99901170A EP0971337A4 (en) 1998-01-26 1999-01-26 METHOD AND DEVICE FOR HIGHLIGHTING THE BASIC LANGUAGE FREQUENCY
CA002283202A CA2283202A1 (en) 1998-01-26 1999-01-26 Method and apparatus for enhancing pitch
AU20750/99A AU2075099A (en) 1998-01-26 1999-01-26 Method and device for emphasizing pitch
KR1019997008620A KR100338606B1 (ko) 1998-01-26 1999-01-26 피치 강조 방법 및 그 장치

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP10/27710 1998-01-26
JP2771098 1998-01-26

Publications (1)

Publication Number Publication Date
WO1999038156A1 true WO1999038156A1 (fr) 1999-07-29

Family

ID=12228565

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP1999/000293 WO1999038156A1 (fr) 1998-01-26 1999-01-26 Methode et dispositif d'accentuation de registre

Country Status (6)

Country Link
EP (1) EP0971337A4 (ja)
KR (1) KR100338606B1 (ja)
CN (1) CN1256000A (ja)
AU (1) AU2075099A (ja)
CA (1) CA2283202A1 (ja)
WO (1) WO1999038156A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3888097B2 (ja) 2001-08-02 2007-02-28 松下電器産業株式会社 ピッチ周期探索範囲設定装置、ピッチ周期探索装置、復号化適応音源ベクトル生成装置、音声符号化装置、音声復号化装置、音声信号送信装置、音声信号受信装置、移動局装置、及び基地局装置
US7103539B2 (en) * 2001-11-08 2006-09-05 Global Ip Sound Europe Ab Enhanced coded speech
EP2099026A4 (en) * 2006-12-13 2011-02-23 Panasonic Corp POST-FILTER AND FILTERING METHOD
CN101266797B (zh) * 2007-03-16 2011-06-01 展讯通信(上海)有限公司 语音信号后处理滤波方法
EP2192578A1 (en) * 2007-09-21 2010-06-02 Panasonic Corporation Communication terminal device, communication system, and communication method
CN101587711B (zh) * 2008-05-23 2012-07-04 华为技术有限公司 基音后处理方法、滤波器以及基音后处理系统
CN103714824B (zh) * 2013-12-12 2017-06-16 小米科技有限责任公司 一种音频处理方法、装置及终端设备
EP2980799A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an audio signal using a harmonic post-filter

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60118898A (ja) * 1983-11-30 1985-06-26 富士通株式会社 音声分析方式
JPH05173596A (ja) * 1991-12-24 1993-07-13 Oki Electric Ind Co Ltd コード励振線形予測符号化装置
JPH08179795A (ja) * 1994-12-27 1996-07-12 Nec Corp 音声のピッチラグ符号化方法および装置
JPH08211895A (ja) * 1994-11-21 1996-08-20 Rockwell Internatl Corp ピッチラグを評価するためのシステムおよび方法、ならびに音声符号化装置および方法
JPH09152897A (ja) * 1995-11-30 1997-06-10 Hitachi Ltd 音声符号化装置および音声符号化方法
JPH09212194A (ja) * 1996-02-01 1997-08-15 Sony Corp ピッチ抽出装置及びピッチ抽出方法
JPH1039899A (ja) * 1996-07-18 1998-02-13 Nec Corp ピッチポストフィルタ装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5544278A (en) * 1994-04-29 1996-08-06 Audio Codes Ltd. Pitch post-filter

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60118898A (ja) * 1983-11-30 1985-06-26 富士通株式会社 音声分析方式
JPH05173596A (ja) * 1991-12-24 1993-07-13 Oki Electric Ind Co Ltd コード励振線形予測符号化装置
JPH08211895A (ja) * 1994-11-21 1996-08-20 Rockwell Internatl Corp ピッチラグを評価するためのシステムおよび方法、ならびに音声符号化装置および方法
JPH08179795A (ja) * 1994-12-27 1996-07-12 Nec Corp 音声のピッチラグ符号化方法および装置
JPH09152897A (ja) * 1995-11-30 1997-06-10 Hitachi Ltd 音声符号化装置および音声符号化方法
JPH09212194A (ja) * 1996-02-01 1997-08-15 Sony Corp ピッチ抽出装置及びピッチ抽出方法
JPH1039899A (ja) * 1996-07-18 1998-02-13 Nec Corp ピッチポストフィルタ装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP0971337A4 *

Also Published As

Publication number Publication date
KR100338606B1 (ko) 2002-05-27
AU2075099A (en) 1999-08-09
CN1256000A (zh) 2000-06-07
EP0971337A1 (en) 2000-01-12
KR20010005557A (ko) 2001-01-15
CA2283202A1 (en) 1999-07-29
EP0971337A4 (en) 2001-01-17

Similar Documents

Publication Publication Date Title
EP1959435B1 (en) Speech encoder
JP3653826B2 (ja) 音声復号化方法及び装置
US7426465B2 (en) Speech signal decoding method and apparatus using decoded information smoothed to produce reconstructed speech signal to enhanced quality
JP4040126B2 (ja) 音声復号化方法および装置
US7606702B2 (en) Speech decoder, speech decoding method, program and storage media to improve voice clarity by emphasizing voice tract characteristics using estimated formants
US6910009B1 (en) Speech signal decoding method and apparatus, speech signal encoding/decoding method and apparatus, and program product therefor
JP4734286B2 (ja) 音声符号化装置
JP3236592B2 (ja) デジタル音声符号器において使用するための音声符号化方法
WO1999038156A1 (fr) Methode et dispositif d'accentuation de registre
CN107945813B (zh) 解码方法、解码装置、和计算机可读取的记录介质
JP3270922B2 (ja) 符号化,復号化方法及び符号化,復号化装置
JP4343302B2 (ja) ピッチ強調方法及びその装置
JP3417362B2 (ja) 音声信号復号方法及び音声信号符号化復号方法
US20190378528A1 (en) Apparatus and method for synthesizing an audio signal, decoder, encoder, system and computer program
JP3785363B2 (ja) 音声信号符号化装置、音声信号復号装置及び音声信号符号化方法
JPH09244695A (ja) 音声符号化装置及び復号化装置
JP3468862B2 (ja) 音声符号化装置
JP4034929B2 (ja) 音声符号化装置
JP2000089797A (ja) 音声符号化装置
JPH0786952A (ja) 音声の予測符号化方法
JP2002169595A (ja) 固定音源符号帳及び音声符号化/復号化装置
JPH09269798A (ja) 音声符号化方法および音声復号化方法
JPH08254999A (ja) ゲイン量子化装置および音声符号化/復号化装置

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 99800071.X

Country of ref document: CN

AK Designated states

Kind code of ref document: A1

Designated state(s): AL AM AT AU AZ BA BB BG BR BY CA CH CN CU CZ DE DK EE ES FI GB GE GH GM HR HU ID IL IS KE KG KR KZ LC LK LR LS LT LU LV MD MG MK MN MW MX NO NZ PL PT RO RU SD SE SG SI SK SL TJ TM TR TT UA UG US UZ VN YU ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): GH GM KE LS MW SD SZ UG ZW AM AZ BY KG KZ MD RU TJ TM AT BE CH CY DE DK ES FI FR GB GR IE IT LU MC NL PT SE BF BJ CF CG CI CM GA GN GW ML MR NE SN TD TG

WWE Wipo information: entry into national phase

Ref document number: 09367837

Country of ref document: US

ENP Entry into the national phase

Ref document number: 2283202

Country of ref document: CA

Ref document number: 2283202

Country of ref document: CA

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 1999901170

Country of ref document: EP

Ref document number: 1019997008620

Country of ref document: KR

121 Ep: the epo has been informed by wipo that ep was designated in this application
WWP Wipo information: published in national office

Ref document number: 1999901170

Country of ref document: EP

REG Reference to national code

Ref country code: DE

Ref legal event code: 8642

WWP Wipo information: published in national office

Ref document number: 1019997008620

Country of ref document: KR

WWG Wipo information: grant in national office

Ref document number: 1019997008620

Country of ref document: KR

WWW Wipo information: withdrawn in national office

Ref document number: 1999901170

Country of ref document: EP