JPH09269798A - Voice coding method and voice decoding method - Google Patents

Voice coding method and voice decoding method

Info

Publication number
JPH09269798A
JPH09269798A JP8076249A JP7624996A JPH09269798A JP H09269798 A JPH09269798 A JP H09269798A JP 8076249 A JP8076249 A JP 8076249A JP 7624996 A JP7624996 A JP 7624996A JP H09269798 A JPH09269798 A JP H09269798A
Authority
JP
Japan
Prior art keywords
pitch
filter
pitch period
input
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8076249A
Other languages
Japanese (ja)
Other versions
JP3350340B2 (en
Inventor
Masahiro Oshikiri
正浩 押切
Kimio Miseki
公生 三関
Masami Akamine
政巳 赤嶺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP07624996A priority Critical patent/JP3350340B2/en
Priority to EP97300609A priority patent/EP0788091A3/en
Priority to US08/791,741 priority patent/US5819213A/en
Publication of JPH09269798A publication Critical patent/JPH09269798A/en
Application granted granted Critical
Publication of JP3350340B2 publication Critical patent/JP3350340B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To provide a voice coding method capable of obtaining the voice of high quality by expressing the pitch cycle of a voice signal correctly. SOLUTION: The pitch cycle information of a voice signal to be inputted from an input terminal 101 is analyzed in a pitch information analyzing part 103 and the information of this pitch cycle are applied to an auditory sensation weighting filter 104 for making a quantization noise to be hardly heard by utilizing a masking effect. Then, at the time of coding the information of the pitch cycle of the input voice signal by searching an adaptive code book 108 by a minimum distortion searching part 116 based on the voice signal passing through the auditor sensation weighting filter 104, the analysis range of pitch cycles in the pitch information analyzing part 103 to be applied to a pitch filter is set boarder with respect to the range of pitch cycles which can be expressed by the coded data.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、音声信号の圧縮符
号化を行う音声符号化方法および符号化データから元の
音声信号を復号する音声復号化方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a speech coding method for compressing and coding a speech signal and a speech decoding method for decoding an original speech signal from encoded data.

【0002】[0002]

【従来の技術】音声信号を低ビットレートで高能率に圧
縮符号化する技術は、自動車電話などの移動体通信や企
業内通信において、電波の有効利用や通信コストの削減
のための重要な技術である。8kbps以下のビットレ
ートで品質の優れた音声合成が可能な音声符号化方法と
して、CELP(Code Excited Linear Prediction)方式
が知られている。このCELP方式は、AT&Tベル研
の M.R.Schroeder氏とB.S.Atal氏により、“Code-Excit
ed Linear Prediction(CELP) High-Quality Speech at
Very low Bit Rates”,Proc.ICASSP;1985,pp.937-939”
(文献1)で発表されて以来、高品質な音声が合成でき
る方式として注目され、品質の改善や計算量の削減等に
ついて種々の検討がなされてきた。
2. Description of the Related Art A technique for compressing and encoding a voice signal at a low bit rate with high efficiency is an important technique for effective use of radio waves and reduction of communication cost in mobile communications such as car telephones and in-house communications. Is. A CELP (Code Excited Linear Prediction) method is known as a voice encoding method capable of performing high-quality voice synthesis at a bit rate of 8 kbps or less. This CELP method was introduced by Mr. MR Schroeder and Mr. BSAtal of AT & T Bell Labs in "Code-Excit.
ed Linear Prediction (CELP) High-Quality Speech at
Very low Bit Rates ”, Proc.ICASSP; 1985, pp.937-939”
Since it was announced in (Reference 1), it has attracted attention as a method capable of synthesizing high-quality speech, and various studies have been made on improvement of quality and reduction of calculation amount.

【0003】CELP方式による音声符号化装置の構成
要素の一つとして、適応符号帳がある。適応符号帳は、
入力音声のピッチ予測分析を閉ループ動作または合成に
よる分析(Analysis by Synthesis)によって行うもので
ある。一般に、適応符号帳によるピッチ予測分析は20
〜147サンプルの探索範囲(128候補)でピッチ周
期の探索を行って、目標信号に対する歪が最小となるピ
ッチ周期を求め、このピッチ周期の情報を7ビットの符
号化データとして伝送することが多い。
An adaptive codebook is one of the constituent elements of a speech coding apparatus based on the CELP method. The adaptive codebook is
The pitch prediction analysis of the input voice is performed by a closed loop operation or an analysis by synthesis. In general, the pitch prediction analysis by the adaptive codebook is 20
In many cases, a pitch period is searched for in a search range of 147 samples (128 candidates) to find a pitch period that minimizes distortion with respect to a target signal, and information on this pitch period is transmitted as 7-bit encoded data. .

【0004】しかし、上記探索範囲から外れるピッチ周
期が入力音声信号に含まれる場合には、ピッチ周期を適
応符号帳で表現できなくなるために、実際と異なるピッ
チ周期が選択され、復号音声に大きな品質劣化が生じる
という問題があった。また、これを防ぐために適応符号
帳のピッチ周期探索範囲を広げようとすると、ピッチ周
期を表す符号化データのビット数を増加させる必要があ
り、結果的に伝送レートが高くなってしまうという問題
があった。
However, when the input speech signal includes a pitch period outside the search range, the pitch period cannot be expressed by the adaptive codebook, so that a pitch period different from the actual one is selected, and the decoded speech has a high quality. There was a problem of deterioration. Further, if the pitch cycle search range of the adaptive codebook is widened in order to prevent this, it is necessary to increase the number of bits of encoded data representing the pitch cycle, resulting in a problem that the transmission rate becomes high. there were.

【0005】[0005]

【発明が解決しようとする課題】上述したように、従来
の音声符号化方法では、予め定められた探索範囲のピッ
チ周期を予め定められたビット数の符号化データに符号
化するため、探索範囲から外れるピッチ周期が存在する
音声が入力された場合、品質劣化が生じる。一般に、符
号化されるピッチ周期の範囲は実験的に検証され妥当な
ものが選ばれているが、常にこの範囲に収まるという保
証はなく、発声者の特徴や同一発声者でのピッチ周期の
変動によってはピッチ周期の探索範囲から外れるという
危険性は常につきまとう。
As described above, in the conventional speech coding method, the pitch period of the predetermined search range is coded into the coded data of the predetermined number of bits. When a voice having a pitch period outside the range is input, quality deterioration occurs. In general, the range of the pitch period to be encoded is experimentally verified and a valid one is selected, but there is no guarantee that it will always be within this range, and the characteristics of the speaker and variations in the pitch period with the same speaker are not always guaranteed. Depending on the situation, there is always the danger of going outside the search range of the pitch period.

【0006】本発明は、上述した従来技術の問題点を解
決するためになされたもので、音声信号のピッチ周期を
正しく表現して高品質の音声を得ることができる音声符
号化方法および音声復号化方法を提供することを目的と
する。
The present invention has been made to solve the above-mentioned problems of the prior art, and a speech coding method and a speech decoding method capable of accurately expressing the pitch period of a speech signal to obtain a high quality speech. The purpose is to provide a method of conversion.

【0007】[0007]

【課題を解決するための手段】上記問題を解決するた
め、本発明に係る音声符号化方法は、入力音声信号のピ
ッチ周期を分析して、該入力音声信号のピッチ周期成分
を抑圧するピッチフィルタに与え、このピッチフィルタ
を含む聴感重みフィルタに通した音声信号に基づいて該
入力音声信号のピッチ周期を探索し符号化する際、符号
化データにより表現できるピッチ周期の範囲に対し、ピ
ッチフィルタに与えるピッチ周期の分析範囲を広く設定
したことを特徴とする。より具体的には、ピッチ周期の
符号化データにより表現できるピッチ周期(TL)の範
囲をTLL≦TL≦TLHとし、ピッチフィルタに与え
るピッチ周期(TW)の分析範囲をTWL≦TW≦TW
Hとしたとき、TLL>TWLおよびTLH<TWHの
少なくとも一方の条件を満足することを特徴とする。
In order to solve the above problems, a speech coding method according to the present invention analyzes a pitch period of an input speech signal and suppresses a pitch period component of the input speech signal. When the pitch period of the input voice signal is searched for and encoded based on the voice signal passed through the perceptual weighting filter including the pitch filter, the pitch filter is applied to the pitch period range that can be represented by the encoded data. The feature is that the analysis range of the given pitch period is set wide. More specifically, the range of the pitch period (TL) that can be represented by the encoded data of the pitch period is TLL ≦ TL ≦ TLH, and the analysis range of the pitch period (TW) given to the pitch filter is TWL ≦ TW ≦ TW.
When H is set, at least one of TLL> TWL and TLH <TWH is satisfied.

【0008】聴感重みフィルタは、マスキング効果を利
用して量子化雑音を聞こえにくくすることで、主観品質
を向上させるものである。ここでいうマスキング効果と
は、入力音声のパワースペクトルの大きい周波数領域で
は、量子化雑音が大きくとも入力音声のスペクトルにマ
スクされて聞こえにくくなる現象をいう。逆に、入力信
号のパワースペクトルが小さい周波数領域ではマスキン
グ効果は働かず、量子化雑音が聞こえやすい。聴感重み
フィルタは、量子化雑音のスペクトルを入力音声のスペ
クトルに近くなるように整形する働きを持ち、音声のス
ペクトル包絡に対応するLPC合成フィルタと、音声の
スペクトル微細構造に対応し、入力音声信号のピッチ周
期成分を抑圧する機能を有するピッチフィルタとにより
構成される。
The perceptual weighting filter improves the subjective quality by making the quantization noise difficult to hear by utilizing the masking effect. The masking effect referred to here is a phenomenon in which the noise is masked by the spectrum of the input voice and becomes hard to hear in the frequency region where the power spectrum of the input voice is large, even if the quantization noise is large. On the contrary, the masking effect does not work in the frequency region where the power spectrum of the input signal is small, and the quantization noise is easily heard. The perceptual weighting filter has a function of shaping the spectrum of the quantization noise so as to be close to the spectrum of the input voice, corresponds to the LPC synthesis filter corresponding to the spectrum envelope of the voice, and corresponds to the fine structure of the spectrum of the voice. And a pitch filter having a function of suppressing the pitch period component of.

【0009】従来、聴感重みフィルタ内のピッチフィル
タに与えるピッチ周期(TW)の分析範囲(TWL≦T
W≦TWH)は、適応符号帳によるピッチ周期(TL)
の探索範囲(TLL≦TL≦TLH)と同じであった。
すなわち、TWL=TLLおよびTWH=TLHとして
いた。これは、適応符号帳によるピッチ周期の探索範囲
として既に妥当なものが選ばれているという前提の下
で、ピッチフィルタに与えるピッチ周期の分析範囲を適
応符号帳のピッチ周期探索範囲に一致させているからに
他ならない。
Conventionally, the analysis range (TWL ≦ T) of the pitch period (TW) given to the pitch filter in the perceptual weighting filter.
W ≦ TWH) is the pitch period (TL) according to the adaptive codebook
Was the same as the search range (TLL ≦ TL ≦ TLH).
That is, TWL = TLL and TWH = TLH. This is based on the assumption that a reasonable pitch period search range by the adaptive codebook has already been selected, and the pitch period analysis range given to the pitch filter must match the pitch period search range of the adaptive codebook. There is nothing but because there is.

【0010】ところで、聴感重みフィルタは音声符号化
装置において符号帳探索の歪尺度として用いられるもの
であるため、聴感重みフィルタの構成を表す情報を音声
復号化装置へ送る必要はない。従って、聴感重みフィル
タ内のピッチフィルタに与えるピッチ周期の分析範囲
は、符号化データのビット数で制限される適応符号帳の
ピッチ周期探索範囲と異なり、本来自由に設定すること
ができる。この点に着目して、本発明では聴感重みフィ
ルタ内のピッチフィルタに与えるピッチ周期の分析範囲
を適応符号帳のピッチ周期探索範囲より十分広く設定す
る。
By the way, since the perceptual weighting filter is used as a distortion measure for the codebook search in the speech coding apparatus, it is not necessary to send information indicating the structure of the perceptual weighting filter to the speech decoding apparatus. Therefore, unlike the pitch period search range of the adaptive codebook which is limited by the number of bits of encoded data, the pitch period analysis range given to the pitch filter in the perceptual weighting filter can be originally set freely. Focusing on this point, in the present invention, the analysis range of the pitch period given to the pitch filter in the perceptual weighting filter is set sufficiently wider than the pitch period search range of the adaptive codebook.

【0011】このようにすると、適応符号帳のピッチ周
期探索範囲で表すことのできないピッチ周期を有する入
力音声信号が与えられても、ピッチフィルタに与えるピ
ッチ周期を正確に求めることができる。従って、このピ
ッチ周期を基にピッチフィルタで入力音声信号のピッチ
周期成分を抑圧し、このピッチフィルタを含む聴感重み
フィルタにより量子化雑音のスペクトル整形を行うこと
で、マスキング効果による音声の品質向上を図ることが
できる。また、この処理は音声符号化装置と音声復号化
装置間の接続性になんら変化を与えないので、互換性を
保ったまま品質改善を実現できる。
By doing so, even if an input speech signal having a pitch period that cannot be represented by the pitch period search range of the adaptive codebook is given, the pitch period given to the pitch filter can be accurately obtained. Therefore, based on this pitch period, a pitch filter suppresses the pitch period component of the input voice signal, and a perceptual weighting filter including this pitch filter performs spectrum shaping of the quantization noise to improve the voice quality by the masking effect. Can be planned. Further, this process does not change the connectivity between the speech coding apparatus and the speech decoding apparatus, so that the quality improvement can be realized while maintaining the compatibility.

【0012】一方、本発明に係る音声復号化方法は、符
号化データを復号して得られる復号音声信号のピッチ周
期を分析して、復号音声信号をピッチ周期成分を強調す
るピッチフィルタを含むポストフィルタに通して出力す
る音声復号化方法において、符号化データにより表現で
きるピッチ周期の範囲に対し、ピッチフィルタに与える
ピッチ周期の分析範囲を広く設定したことを特徴とす
る。より具体的には、符号化データにより表現できるピ
ッチ周期(TL)の範囲をTLL≦TL≦TLHとし、
ピッチフィルタに与えるピッチ周期(TP)の分析範囲
をTPL≦TP≦TPHとしたとき、TLL>TPLお
よびTLH<TPHの少なくとも一方の条件を満足する
ことを特徴とする。
On the other hand, the speech decoding method according to the present invention analyzes the pitch period of the decoded speech signal obtained by decoding the coded data, and analyzes the pitch period of the decoded speech signal so as to enhance the pitch period component. In the speech decoding method of outputting through a filter, the analysis range of the pitch period given to the pitch filter is set wider than the range of the pitch period that can be represented by the encoded data. More specifically, the range of the pitch period (TL) that can be represented by the encoded data is TLL ≦ TL ≦ TLH,
When the analysis range of the pitch period (TP) given to the pitch filter is TPL ≦ TP ≦ TPH, at least one of TLL> TPL and TLH <TPH is satisfied.

【0013】ポストフィルタは、音声復号化装置で得ら
れる復号音声信号のスペクトルの山の部分を強調し、谷
の部分を減衰させることで、主観品質を向上させるフィ
ルタである。このポストフィルタの一構成要素として、
復号音声信号のピッチ周期成分を強調するピッチフィル
タが存在する。
The post filter is a filter which enhances the subjective quality by emphasizing the peak portion and attenuating the valley portion of the spectrum of the decoded speech signal obtained by the speech decoding apparatus. As a component of this post filter,
There is a pitch filter that emphasizes the pitch period component of the decoded speech signal.

【0014】従来、このポストフィルタ内のピッチフィ
ルタに用いるピッチ周期(TP)の情報は、符号化デー
タを復号して得たピッチ周期をそのまま使うか、さもな
くば適応符号帳のピッチ周期探索範囲と同じ範囲として
新たにピッチ周期を求めるかのいずれかであり、いずれ
にしろピッチ周期(TP)の分析範囲{TPL≦TP≦
TPH}は、適応符号帳のピッチ周期(TL)の探索範
囲{TLL≦TL≦TLH}と同じ範囲としていた。す
なわち、TPL=TLLおよびTPH=TLHとしてい
た。これは、適応符号帳によるピッチ周期の探索範囲と
して既に妥当なものが選ばれているという前提の下で、
ピッチフィルタに与えるピッチ周期の分析範囲を適応符
号帳のピッチ周期探索範囲に一致させているからに他な
らない。
Conventionally, as the information of the pitch period (TP) used for the pitch filter in the post filter, the pitch period obtained by decoding the encoded data is used as it is, or otherwise, the pitch period search range of the adaptive codebook is used. Pitch period (TP) analysis range {TPL≤TP≤
TPH} is the same as the search range {TLL ≦ TL ≦ TLH} of the pitch period (TL) of the adaptive codebook. That is, TPL = TLL and TPH = TLH. This is based on the assumption that a valid range has already been selected as the search range for the pitch period by the adaptive codebook.
This is because the analysis range of the pitch period given to the pitch filter matches the pitch period search range of the adaptive codebook.

【0015】ところで、ポストフィルタは復号音声信号
に対して処理を行うものであるため、ポストフィルタ内
のピッチフィルタに与えるピッチ周期の分析範囲は、符
号化データのビット数で制限される適応符号帳のピッチ
周期探索範囲と異なり、本来自由に設定できる。この点
に着目して、本発明ではポストフィルタ内のピッチフィ
ルタに与えるピッチ周期の分析範囲を符号化データによ
り表現できるピッチ周波の範囲すなわち適応符号帳のピ
ッチ周期探索範囲より十分広く設定する。
By the way, since the post filter processes the decoded speech signal, the analysis range of the pitch period given to the pitch filter in the post filter is limited by the number of bits of the encoded data. Unlike the pitch period search range of, it can be originally set freely. Focusing on this point, in the present invention, the analysis range of the pitch period given to the pitch filter in the post filter is set sufficiently wider than the range of pitch frequencies that can be represented by the encoded data, that is, the pitch period search range of the adaptive codebook.

【0016】このようにすると、適応符号帳のピッチ周
期探索範囲で表すことのできないピッチ周期を持つ復号
音声信号がポストフィルタに与えられたとしても、復号
音声信号のピッチ周期が求められれば、そのピッチ周期
を基にピッチ周期成分の強調を行い、伝送され得なかっ
たピッチ周期成分を復元して品質の改善を図ることがで
きる。
In this way, even if a decoded voice signal having a pitch period that cannot be represented by the pitch period search range of the adaptive codebook is given to the post filter, if the pitch period of the decoded voice signal is obtained, that is obtained. It is possible to improve the quality by emphasizing the pitch period component based on the pitch period and restoring the pitch period component that could not be transmitted.

【0017】[0017]

【発明の実施の形態】まず、本発明による音声符号化方
法の実施形態について説明する。図1は、本発明の一実
施形態に係る音声符号化方法に用いる聴感重みフィルタ
の基本動作を説明するためのブロック図である。同図に
おいて、入力端子101からディジタル化された音声信
号(入力音声信号)が複数サンプルを1フレームとして
フレーム単位で順次入力される。本実施形態では、1フ
レームを80サンプルとする。この入力音声信号は、L
PC係数分析部102、ピッチ情報分析部103および
聴感重みフィルタ104に与えられる。
BEST MODE FOR CARRYING OUT THE INVENTION First, an embodiment of a speech coding method according to the present invention will be described. FIG. 1 is a block diagram for explaining the basic operation of a perceptual weighting filter used in a speech coding method according to an embodiment of the present invention. In the figure, a digitized audio signal (input audio signal) is sequentially input from the input terminal 101 frame by frame with a plurality of samples as one frame. In this embodiment, one frame has 80 samples. This input audio signal is L
It is given to the PC coefficient analysis unit 102, the pitch information analysis unit 103 and the perceptual weighting filter 104.

【0018】LPC係数分析部102では、例えば自己
相関法などの既存の技術を用いて入力音声信号をフレー
ム単位で分析し、LPC係数{α(i);i=1〜N
P}を求める。このLPC分析に際しては、入力音声信
号の分析対象フレームを中心として安定した分析結果を
得るのに十分な長さのデータを用いる必要がある。NP
は分析次数を表し、ここではNP=10とする。こうし
て求められたLPC係数{α(i);i=1〜NP}
は、ピッチ情報分析部103および聴感重みフィルタ1
04に与えられる。
The LPC coefficient analysis unit 102 analyzes the input speech signal on a frame-by-frame basis using an existing technique such as an autocorrelation method, and LPC coefficients {α (i); i = 1 to N
P}. In this LPC analysis, it is necessary to use data having a length sufficient to obtain a stable analysis result centering on the frame to be analyzed of the input audio signal. NP
Represents the analysis order, and here NP = 10. LPC coefficient thus obtained {α (i); i = 1 to NP}
Is the pitch information analysis unit 103 and the perceptual weighting filter 1.
04.

【0019】ピッチ情報分析部103では、例えば後述
のように入力音声信号をフレーム単位で分析してピッチ
周期TWおよびピッチフィルタ係数gを求める。このピ
ッチ情報分析部103の詳細については、図2を用いて
後述する。
The pitch information analysis unit 103 analyzes the input voice signal frame by frame, for example, as described later, to obtain the pitch period TW and the pitch filter coefficient g. Details of the pitch information analysis unit 103 will be described later with reference to FIG.

【0020】聴感重みフィルタ104は、量子化雑音の
スペクトルを入力音声信号のスペクトルに近くなるよう
に整形するフィルタであり、音声のスペクトル包絡に対
応するLPC合成フィルタと、音声のスペクトル微細構
造に対応し、入力音声信号のピッチ周期成分を抑圧する
機能を有するピッチフィルタとにより構成される。具体
的には、聴感重みフィルタ104はLPC係数分析部1
02から得られるLPC係数{α(i);i=1〜N
P}およびピッチ情報分析部103から得られるピッチ
周期TWおよびピッチフィルタ係数gをもとに、(1)
式で規定される伝達関数W(z)のフィルタを構成し
て、フレーム単位で入力される入力音声信号に対してフ
ィルタリングを行い、重みつき入力音声信号を出力端子
105へ出力する。
The perceptual weighting filter 104 is a filter for shaping the spectrum of the quantization noise so as to be close to the spectrum of the input speech signal, and corresponds to the LPC synthesis filter corresponding to the speech spectral envelope and the spectral fine structure of speech. And a pitch filter having a function of suppressing the pitch period component of the input audio signal. Specifically, the perceptual weighting filter 104 includes the LPC coefficient analysis unit 1
02 LPC coefficient {α (i); i = 1 to N
P} and the pitch period TW and the pitch filter coefficient g obtained from the pitch information analysis unit 103, (1)
A filter having a transfer function W (z) defined by the formula is configured to filter the input audio signal input in frame units, and output the weighted input audio signal to the output terminal 105.

【0021】[0021]

【数1】 [Equation 1]

【0022】A(z/β)/A(z/γ)が音声のスペ
クトル包絡に対応する聴感重みフィルタに相当し、Q
(z)が音声のスペクトル微細構造に対応する聴感重み
フィルタに相当する。ここで、各パラメータの具体的な
数値として、本発明者らはβ=0.9,γ=0.4,λ
=0.4を推奨する。ただし、これらパラメータの値は
主観的な好みに依存するので、これら数値が必ずしも最
適というわけではない。入力音声信号を(1)式で規定
される伝達関数W(z)の聴感重みフィルタ104に通
して得られる重み付き入力音声信号は、出力端子105
より出力される。
A (z / β) / A (z / γ) corresponds to a perceptual weighting filter corresponding to the spectral envelope of the voice, and Q
(Z) corresponds to the perceptual weighting filter corresponding to the fine spectral structure of the voice. Here, as specific numerical values of each parameter, the present inventors have β = 0.9, γ = 0.4, λ
= 0.4 is recommended. However, since the values of these parameters depend on subjective preferences, these numbers are not always optimal. The weighted input voice signal obtained by passing the input voice signal through the perceptual weighting filter 104 of the transfer function W (z) defined by the equation (1) is output terminal 105.
Output.

【0023】次に、図2を参照してピッチ情報分析部1
03について説明する。図2において、入力端子301
からは入力音声信号が、また入力端子302からはLP
C係数{α(i);i=1〜NP}がそれぞれ入力さ
れ、予測残差信号計算部303に与えられる。予測残差
信号計算部303では、LPC係数分析部102と同様
に入力音声信号の分析対象フレームを中心として安定し
た分析結果を得るのに十分な長さのデータを用いて分析
を行う。予測残差信号計算部303では、分析に用いる
入力音声信号のデータを{u(n);n=0〜NU−
1}と表すと、LPC係数{α(i);i=1〜NP}
を用いてデータu(n)についての予測残差信号{e
(n);n=0〜NU−1}を次式に従い求める。
Next, referring to FIG. 2, the pitch information analysis unit 1
03 will be described. In FIG. 2, the input terminal 301
Input audio signal from the input terminal 302 and LP from the input terminal 302.
C coefficients {α (i); i = 1 to NP} are respectively input and given to the prediction residual signal calculation unit 303. Similar to the LPC coefficient analysis unit 102, the prediction residual signal calculation unit 303 performs analysis using data having a length sufficient to obtain a stable analysis result centering on the analysis target frame of the input speech signal. In the prediction residual signal calculation unit 303, the data of the input speech signal used for analysis is {u (n); n = 0 to NU−
1}, the LPC coefficient {α (i); i = 1 to NP}
Using the prediction residual signal {e
(N); n = 0 to NU-1} is calculated according to the following equation.

【0024】[0024]

【数2】 [Equation 2]

【0025】このようにして求められた予測残差信号
{e(n);n=0〜NU−1}は、ピッチ周期分析部
304に与えられる。ピッチ周期分析部304では、予
測残差信号{e(n);n=0〜NU−1}にハミング
窓を乗じた信号{ew(n);n=0〜NU−1}を基
に、(6)式で規定される自己相関値φ(t)をピッチ
周期分析範囲{TWL≦t≦TWH}において算出す
る。
The prediction residual signal {e (n); n = 0 to NU-1} obtained in this way is provided to the pitch period analysis unit 304. In the pitch period analysis unit 304, based on the signal {ew (n); n = 0 to NU-1} obtained by multiplying the prediction residual signal {e (n); n = 0 to NU-1} by a Hamming window, The autocorrelation value φ (t) defined by the equation (6) is calculated in the pitch period analysis range {TWL ≦ t ≦ TWH}.

【0026】[0026]

【数3】 (Equation 3)

【0027】ここで、本実施形態ではピッチ周期分析範
囲の下限TWLおよび上限TWHを例えばTWL=10
およびTWH=200と設定する。一方、図1には示さ
れていないピッチ周期の符号化手段(例えば後述する適
応符号帳)のピッチ周期探索範囲{TLL≦TL≦TL
H}の下限TLLおよび上限TLHは、例えばTLL=
20、TLH=147とする。すなわち、TLL>TW
L,TLH<TWHであり、ピッチ周期分析範囲をピッ
チ周期探索範囲より広くしていることに特徴がある。
In this embodiment, the lower limit TWL and the upper limit TWH of the pitch period analysis range are set to TWL = 10, for example.
And TWH = 200. On the other hand, a pitch period search range {TLL ≦ TL ≦ TL of a pitch period coding means (for example, an adaptive codebook described later) not shown in FIG. 1 is used.
The lower limit TLL and the upper limit TLH of H} are, for example, TLL =
20 and TLH = 147. That is, TLL> TW
L, TLH <TWH, and is characterized in that the pitch period analysis range is wider than the pitch period search range.

【0028】このようにして求めた自己相関値φ(t)
が最大となるときのtがピッチ周期TWとしてピッチフ
ィルタ係数分析部305に与えられる。ピッチフィルタ
係数分析部305では、予測残差信号計算部303で求
められた予測残差信号{e(n);n=0〜NU−1}
とピッチ周期分析部304で求められたピッチ周期TW
を用いて、次式に従いピッチフィルタ係数gを算出す
る。
The autocorrelation value φ (t) thus obtained
Is provided to the pitch filter coefficient analysis unit 305 as the pitch cycle TW. In the pitch filter coefficient analysis unit 305, the prediction residual signal {e (n); n = 0 to NU-1} obtained by the prediction residual signal calculation unit 303.
And the pitch period TW obtained by the pitch period analysis unit 304
Using, the pitch filter coefficient g is calculated according to the following equation.

【0029】[0029]

【数4】 (Equation 4)

【0030】このようにして求められピッチ周期TWお
よびピッチフィルタ係数gが出力端子306より出力さ
れる。なお、ここでは1次のピッチフィルタを用いた場
合について説明を行ったが、さらに高次のピッチフィル
タを用いて実現しても良い。その場合には、計算量が多
少増加するが、より正確なピッチ情報を得ることができ
る。また、ピッチ周期分析法およびピッチフィルタ係数
分析法は前述した方法に限定されるわけではなく、他の
技術を用いても良い。
The pitch period TW and the pitch filter coefficient g thus obtained are output from the output terminal 306. Although the case of using the first-order pitch filter has been described here, it may be realized by using a higher-order pitch filter. In that case, more accurate pitch information can be obtained although the amount of calculation increases somewhat. Further, the pitch period analysis method and the pitch filter coefficient analysis method are not limited to the methods described above, and other techniques may be used.

【0031】以上の処理をまとめると、図3に示される
フローチャートのようになる。まず最初に、ステップS
11でLPC係数{α(i);i=1〜NP}を求め、
次にステップS12で予測残差信号{e(n);n=0
〜NU−1}を求める。ステップS13でピッチ周期T
Wを分析し、次にステップS14でピッチ周期TWにお
けるピッチフィルタ係数gを求める。ステップS15で
は、ステップS11、ステップS13およびステップS
14で求めたLPC係数{α(i);i=1〜NP}、
ピッチ周期TWおよびピッチフィルタ係数gを用いて
(1)式で規定される聴感重みフィルタを構成し、ステ
ップS16で入力音声信号を聴感重みフィルタに通して
重み付き入力音声信号を生成して出力する。
The above processing is summarized as a flow chart shown in FIG. First of all, step S
11, the LPC coefficient {α (i); i = 1 to NP} is obtained,
Next, in step S12, the prediction residual signal {e (n); n = 0
~ NU-1} is obtained. In step S13, pitch cycle T
W is analyzed, and then the pitch filter coefficient g in the pitch period TW is obtained in step S14. In step S15, steps S11, S13 and S
14, LPC coefficient {α (i); i = 1 to NP},
A pitch weight TW and a pitch filter coefficient g are used to form a perceptual weighting filter defined by the equation (1), and in step S16, the input voice signal is passed through the perceptual weighting filter to generate and output a weighted input voice signal. .

【0032】次に、図4を参照して上述した聴感重みフ
ィルタを用いたCELP方式による音声符号化装置につ
いて説明する。図4において、図1と同一の構成要素に
は同一の参照符号を付して詳細な説明を省略する。
Next, a CELP-based speech encoding apparatus using the above-described perceptual weighting filter will be described with reference to FIG. 4, the same components as those of FIG. 1 are designated by the same reference numerals, and detailed description thereof will be omitted.

【0033】まず、LPC係数分析部102より出力さ
れるLPC係数{α(i);i=1〜NP}はLPC係
数量子化部106に与えられ、量子化される。重み付き
合成フィルタ107では、LPC係数分析部102から
LPC係数{α(i);i=1〜NP}の情報、ピッチ
情報分析部103からピッチ周期TWとピッチフィルタ
係数gの情報、LPC係数量子化部106から量子化さ
れたLPC係数{αq(i);i=1〜NP}の情報を
それぞれ受取ることにより、Hw(z)なる伝達関数の
フィルタを構成する。この重み付き合成フィルタ107
の伝達関数Hw(z)は、次式で表される。
First, the LPC coefficients {α (i); i = 1 to NP} output from the LPC coefficient analysis unit 102 are given to the LPC coefficient quantization unit 106 and quantized. In the weighted synthesis filter 107, the LPC coefficient analysis unit 102 outputs information on the LPC coefficients {α (i); i = 1 to NP}, the pitch information analysis unit 103 outputs information on the pitch period TW and the pitch filter coefficient g, and the LPC coefficient quantum. By receiving the quantized information of the LPC coefficients {αq (i); i = 1 to NP} from the conversion unit 106, the filter of the transfer function Hw (z) is configured. This weighted synthesis filter 107
The transfer function Hw (z) of is expressed by the following equation.

【0034】 Hw(z)=W(z)・H(z) (8) ここで、聴感重みフィルタ104の伝達関数W(z)
は、先に示した(1)式と同じである。また、合成フィ
ルタH(z)は次式で表される。
Hw (z) = W (z) · H (z) (8) Here, the transfer function W (z) of the perceptual weighting filter 104.
Is the same as the equation (1) shown above. The synthesis filter H (z) is expressed by the following equation.

【0035】[0035]

【数5】 (Equation 5)

【0036】重み付き合成フィルタ107に与えられる
駆動信号は、適応符号帳108、適応ベクトルゲイン符
号帳113、雑音符号帳109および雑音ベクトルゲイ
ン符号帳111の各候補の組み合わせで表現される。
The drive signal given to the weighted synthesis filter 107 is expressed by a combination of candidates of adaptive codebook 108, adaptive vector gain codebook 113, noise codebook 109, and noise vector gain codebook 111.

【0037】適応符号帳108は、直前の駆動信号系列
を常に保持しており、この駆動信号系列を所望のピッチ
周期で繰り返して適応ベクトルを生成し、周期性を効率
よく表現する。ただし、このピッチ周期はマルチプレク
サを介して伝送されなければならないので、予め決めら
れたビット数で表現できる候補数の範囲内でのみピッチ
周期は探索される。本実施形態では、適応符号帳108
によるピッチ周期探索範囲{TLL≦TL≦TLH}を
TLL=20、TLH=147として説明を行う。
The adaptive codebook 108 always holds the immediately preceding drive signal sequence, repeats this drive signal sequence at a desired pitch period to generate an adaptive vector, and efficiently expresses the periodicity. However, since this pitch period must be transmitted through the multiplexer, the pitch period is searched only within the range of the number of candidates that can be expressed by the predetermined number of bits. In this embodiment, the adaptive codebook 108
The pitch period search range {TLL ≦ TL ≦ TLH} by TLL = 20 and TLH = 147 will be described.

【0038】雑音符号帳109は、雑音系列を候補ベク
トルとして持つ符号帳である。一般に、雑音符号帳10
9は計算量削減や品質改善のために構造化が図られる
が、本発明の要旨とは特に関係がないので、説明は省略
する。
The noise codebook 109 is a codebook having a noise sequence as a candidate vector. In general, the random codebook 10
Structure 9 is structured for the purpose of reducing the amount of calculation and improving quality, but since it is not particularly related to the gist of the present invention, its explanation is omitted.

【0039】適応符号帳108および適応ベクトルゲイ
ン符号帳113から適応ベクトルおよび適応ベクトルゲ
インがそれぞれ選択され、これらが乗算器110で掛け
合わされる。同様に、雑音符号帳109および雑音ベク
トルゲイン符号帳114から適応ベクトルおよび雑音ベ
クトルゲインがそれぞれ選択され、乗算器111で掛け
合わされる。そして、加算器112で乗算器110,1
11の出力のベクトル同士が加算されることにより駆動
信号が生成され、重み付き合成フィルタ107に入力と
して与えられる。
Adaptive vector and adaptive vector gain are selected from adaptive codebook 108 and adaptive vector gain codebook 113, and these are multiplied by multiplier 110. Similarly, the adaptive vector and the noise vector gain are selected from the noise codebook 109 and the noise vector gain codebook 114, respectively, and are multiplied by the multiplier 111. Then, in the adder 112, the multipliers 110, 1
A drive signal is generated by adding the output vectors of 11 to each other, and is supplied to the weighted synthesis filter 107 as an input.

【0040】聴感重みフィルタ104の出力信号を目標
信号として、重み付き合成フィルタ107の出力信号の
誤差が減算器115でとられ、さらに最小歪探索部11
6で2乗歪が算出される。最小歪探索部116は、適応
符号帳108、適応ベクトルゲイン符号帳113、雑音
符号帳109および雑音ベクトルゲイン符号帳111に
対して、2乗歪が最小となる適応ベクトル、適応ベクト
ルゲイン、雑音ベクトルおよび雑音ベクトルゲインの組
み合わせを効率よく探索し、2乗歪が最小となるときの
適応ベクトル、適応ベクトルゲイン、雑音ベクトルおよ
び雑音ベクトルゲインの各候補のインデックス情報をマ
ルチプレクサ117に与える。
With the output signal of the perceptual weighting filter 104 as the target signal, the error of the output signal of the weighted synthesis filter 107 is taken by the subtractor 115, and the minimum distortion searching unit 11 is further used.
The square distortion is calculated at 6. The minimum distortion search unit 116, for the adaptive codebook 108, the adaptive vector gain codebook 113, the noise codebook 109, and the noise vector gain codebook 111, the adaptive vector, the adaptive vector gain, and the noise vector that minimize the square distortion. And a vector of noise vector gains are efficiently searched for, and index information of each candidate of an adaptive vector, an adaptive vector gain, a noise vector, and a noise vector gain when the square distortion is minimized is given to the multiplexer 117.

【0041】一方、LPC係数量子化部106でLPC
係数を量子化した結果得られるインデックス情報がマル
チプレクサ117に与えられる。マルチプレクサ117
は、LPC係数量子化部106および最小歪探索部11
6より入力されたインデックス情報を符号化データとし
てビットストリームに変換し、出力端子118へ出力す
る。最後に、最小歪探索部116で算出される2乗歪が
最小となるときの駆動信号を適応符号帳108に与えて
内部状態を更新し、次フレームの入力音声信号に備え
る。
On the other hand, the LPC coefficient quantization unit 106
Index information obtained as a result of quantizing the coefficient is given to the multiplexer 117. Multiplexer 117
Is an LPC coefficient quantization unit 106 and a minimum distortion search unit 11
The index information input from 6 is converted into a bit stream as encoded data and output to the output terminal 118. Finally, the drive signal when the squared distortion calculated by the minimum distortion search unit 116 is minimized is given to the adaptive codebook 108 to update the internal state, and prepares for the input speech signal of the next frame.

【0042】このように本実施形態では、聴感重みフィ
ルタ104および重み付き合成フィルタ107で用いら
れるピッチ情報分析部103のピッチ周期分析範囲{T
WL≦TW≦TWH}と、重みつき合成フィルタ107
に与える駆動信号の周期性を表し、マルチプレクサ11
7を介して符号化され出力端子118より出力されるピ
ッチ周期の符号化データ(適応ベクトルインデックスの
符号化データ)で表現される適応符号帳108のピッチ
周期探索範囲{TLL≦TL≦TLH}の関係がTWL
<TLLおよびTWH>TLHの条件を満足している。
すなわち、ピッチ周期分析範囲{TWL≦TW≦TW
H}をピッチ周期探索範囲{TLL≦TL≦TLH}よ
りも広く設定している。
As described above, in this embodiment, the pitch period analysis range {T of the pitch information analysis unit 103 used in the perceptual weighting filter 104 and the weighted synthesis filter 107 is used.
WL ≦ TW ≦ TWH} and the weighted synthesis filter 107
Represents the periodicity of the drive signal given to the multiplexer 11
Of the pitch cycle search range {TLL ≦ TL ≦ TLH} of the adaptive codebook 108 represented by the coded data of the pitch cycle (encoded data of the adaptive vector index) output from the output terminal 118. Relationship is TWL
<TLL and TWH> The condition of TLH is satisfied.
That is, the pitch period analysis range {TWL ≦ TW ≦ TW
H} is set wider than the pitch period search range {TLL ≦ TL ≦ TLH}.

【0043】このような条件を満足することにより、予
め定められたビット数で表現されなければならない適応
符号帳108のピッチ周期探索範囲{TLL≦TL≦T
LH}から外れたピッチ周期を有する入力音声信号が与
えられても、聴感重みフィルタ104および重み付き合
成フィルタ107内のピッチフィルタの分析範囲{TW
L≦TW≦TWH}が適応符号帳108のピッチ周期探
索範囲より広いために、入力音声信号のピッチ周期で量
子化雑音のスペクトル整形を行い、マスキング効果によ
って雑音感の低減を図ることができる。その結果、主観
品質を効果的に向上させることができる。
By satisfying such a condition, the pitch period search range {TLL≤TL≤T of the adaptive codebook 108 which must be expressed by a predetermined number of bits.
Even if an input speech signal having a pitch period deviating from LH} is given, the pitch filter analysis range {TW in the perceptual weighting filter 104 and the weighting synthesis filter 107 is given.
Since L ≤ TW ≤ TWH} is wider than the pitch period search range of the adaptive codebook 108, it is possible to perform spectrum shaping of the quantization noise in the pitch period of the input speech signal and reduce the noise feeling by the masking effect. As a result, the subjective quality can be effectively improved.

【0044】なお、本実施形態ではピッチ周期分析範囲
{TWL≦TW≦TWH}をピッチ周期探索範囲{TL
L≦TL≦TLH}との関係がTLL>TWLおよびT
LH<TWHの条件を満足しているが、TLL>TWL
およびTLH<TWHのいずれか一方の条件のみを満足
するようにしてもよい。
In the present embodiment, the pitch cycle analysis range {TWL≤TW≤TWH} is set to the pitch cycle search range {TL.
L ≦ TL ≦ TLH} has a relationship of TLL> TWL and T
The condition of LH <TWH is satisfied, but TLL> TWL
Alternatively, only one of the conditions of TLH <TWH and TLH <TWH may be satisfied.

【0045】次に、本発明による音声復号化方法の実施
形態について説明する。図5は、本発明の一実施形態に
係る音声復号化方法に用いるポストフィルタの基本動作
を説明するためのブロック図である。同図において、入
力端子201からディジタル化された音声信号(例えば
復号音声信号)が複数サンプルを1フレームとしてフレ
ーム単位で順次入力される。本実施形態では、1フレー
ムを80サンプルとして説明する。
Next, an embodiment of the speech decoding method according to the present invention will be described. FIG. 5 is a block diagram for explaining the basic operation of the post filter used in the speech decoding method according to the embodiment of the present invention. In the figure, a digitized audio signal (for example, a decoded audio signal) is sequentially input from the input terminal 201 frame by frame with a plurality of samples as one frame. In this embodiment, one frame is described as 80 samples.

【0046】一方、入力端子202からは、入力端子2
01からの音声信号のLPC予測残差信号もしくはそれ
に準じる信号、例えば後述するCELP方式の音声復号
化装置における合成フィルタを駆動する駆動信号が入力
される。ピッチ情報分析部203では、LPC予測残差
信号または合成フィルタの駆動信号を用いてピッチ周期
を求める。ピッチ情報分析部203の詳細については後
述する。
On the other hand, from the input terminal 202, the input terminal 2
The LPC prediction residual signal of the audio signal from 01 or a signal similar thereto, for example, a drive signal for driving a synthesis filter in a CELP-type audio decoding device described later is input. The pitch information analysis unit 203 obtains the pitch period using the LPC prediction residual signal or the drive signal of the synthesis filter. Details of the pitch information analysis unit 203 will be described later.

【0047】ポストフィルタ205には、入力端子20
1から例えば復号音声信号が与えられ、ピッチ情報分析
部203からピッチ周期TPおよびピッチフィルタ係数
gの情報が与えられ、入力端子204からLPC係数
{α(i);i=1〜NP}の情報が与えられる。LP
C係数は、入力端子201からの音声信号のスペクトル
包絡を表している。ポストフィルタ205は、これらピ
ッチ周期TPおよびLPC係数{α(i);i=1〜N
P}の情報を用いて次式の伝達関数R(z)で表される
フィルタを構成し、入力端子201からの音声信号にフ
ィルタリング処理を施す。フィルタリングされた出力信
号は、出力端子206より出力される。 R(z)=F(z)・P(z)・U(z) (10) F(z),P(z),B(z)は、以下のように表され
る。
The post filter 205 has an input terminal 20.
For example, the decoded speech signal is given from 1, the information of the pitch period TP and the pitch filter coefficient g is given from the pitch information analysis unit 203, and the information of the LPC coefficient {α (i); i = 1 to NP} from the input terminal 204. Is given. LP
The C coefficient represents the spectrum envelope of the audio signal from the input terminal 201. The post filter 205 uses the pitch period TP and the LPC coefficient {α (i); i = 1 to N.
The filter represented by the transfer function R (z) of the following equation is configured using the information of P}, and the audio signal from the input terminal 201 is filtered. The filtered output signal is output from the output terminal 206. R (z) = F (z) * P (z) * U (z) (10) F (z), P (z), and B (z) are represented as follows.

【0048】[0048]

【数6】 (Equation 6)

【0049】ここで、各パラメータの具体的に数値とし
て、本発明者らはν=0.5,ξ=0.8,η=0.
7,μ=0.4を推奨する。これらパラメータの値は、
主観的な好みに依存するので、これらの数値が必ずしも
最適というわけではない。
Here, as concrete numerical values of each parameter, the present inventors have ν = 0.5, ξ = 0.8, η = 0.
7, μ = 0.4 is recommended. The values of these parameters are
These numbers are not always optimal as they depend on subjective preferences.

【0050】次に、図6を参照して本実施形態における
ピッチ情報分析部203について説明する。図6におい
て、図2と同一の構成要素には同一の参照番号を付し
て、説明を省略する。
Next, the pitch information analysis unit 203 in this embodiment will be described with reference to FIG. 6, the same elements as those of FIG. 2 are designated by the same reference numerals, and the description thereof will be omitted.

【0051】図6に示されるピッチ情報分析部203
と、先の実施形態における図2に示されるピッチ情報分
析部103の違いは、入力される信号にある。すなわ
ち、図6におけるピッチ情報分析部203には、予測残
差信号、もしくはそれに準じる信号、例えば図示しない
音声復号化装置で生成される駆動信号が入力される。こ
のため、ピッチ情報分析部203には図2におけるピッ
チ情報分析部103のように入力音声信号やLPC係数
を入力する必要はなく、よって予測残差信号計算部30
3も必要ない。図6におけるピッチ情報分析部203
は、ピッチ周期分析部304で求められたピッチ周期T
Pおよびピッチフィルタ係数分析部305で求められた
ピッチフィルタ係数gの情報を出力端子308から出力
する。
The pitch information analysis unit 203 shown in FIG.
The difference between the pitch information analysis unit 103 and the pitch information analysis unit 103 shown in FIG. 2 in the above embodiment is the input signal. That is, the pitch information analysis unit 203 in FIG. 6 receives the prediction residual signal or a signal corresponding thereto, for example, a drive signal generated by a speech decoding device (not shown). Therefore, it is not necessary to input the input voice signal and the LPC coefficient to the pitch information analysis unit 203 unlike the pitch information analysis unit 103 in FIG.
3 is not necessary either. Pitch information analysis unit 203 in FIG.
Is the pitch period T obtained by the pitch period analysis unit 304.
Information on the pitch filter coefficient g obtained by P and the pitch filter coefficient analysis unit 305 is output from the output terminal 308.

【0052】ここで、ピッチ情報分析部203内のピッ
チ周期分析部304におけるピッチ周期TPの分析範囲
{TPL≦TP≦TPH}の下限TPLおよび上限TP
Hは、例えばTPL=10およびTPH=200と設定
する。一方、ピッチ周期の符号化手段(例えば適応符号
帳)のピッチ周期探索範囲{TLL≦TL≦TLH}の
下限TLLおよび上限TLHは、TLL=20、TLH
=147である。すなわち、TLL>TPL,TPH>
TLHであり、ピッチ周期分析範囲をピッチ周期探索範
囲より広くしていることが特徴である。
Here, the lower limit TPL and the upper limit TP of the analysis range {TPL≤TP≤TPH} of the pitch period TP in the pitch period analysis unit 304 in the pitch information analysis unit 203.
H is set to TPL = 10 and TPH = 200, for example. On the other hand, the lower limit TLL and the upper limit TLH of the pitch period search range {TLL ≦ TL ≦ TLH} of the pitch period encoding means (for example, adaptive codebook) are TLL = 20 and TLH.
= 147. That is, TLL> TPL, TPH>
TLH is characterized in that the pitch period analysis range is wider than the pitch period search range.

【0053】以上の処理をまとめると、図7に示される
フローチャートのようになる。まず最初に、ステップS
21でピッチ周期TPを分析し、次にステップS22で
ピッチ周期TPにおけるピッチフィルタ係数gを求め
る。ステップS23では、ステップS21とステップS
22で求めたピッチ周期TPおよびピッチフィルタ係数
gおよび入力端子204より入力されるLPC係数を用
いて(10)式で規定されるポストフィルタを構成し、
ステップS24で入力端子201より入力される音声信
号をポストフィルタに通して出力する。
The above processing is summarized as a flow chart shown in FIG. First of all, step S
In step 21, the pitch period TP is analyzed, and in step S22, the pitch filter coefficient g in the pitch period TP is obtained. In step S23, steps S21 and S
A pitch filter TP and pitch filter coefficient g obtained in step 22 and the LPC coefficient input from the input terminal 204 are used to form a post filter defined by equation (10),
In step S24, the audio signal input from the input terminal 201 is passed through the post filter and output.

【0054】次に、図8を参照して上述したポストフィ
ルタを用いたCELP方式による音声復号化装置につい
て説明する。図8において、図5と同一の構成要素には
同一の参照符号を付して詳細な説明を省略する。
Next, the CELP speech decoding apparatus using the above-described post filter will be described with reference to FIG. 8, the same elements as those of FIG. 5 are designated by the same reference numerals, and detailed description thereof will be omitted.

【0055】図8において、入力端子401には図示し
ないCELP方式による音声符号化装置から出力される
符号化データであるビットストリームが図示しない伝送
路または蓄積媒体を介して入力される。音声符号化装置
は、例えば図4に示したように構成される。デマルチプ
レクサ402では、入力されるビットストリームから音
声信号を生成するために必要なパラメータを復号する。
これらのパラメータの種類や個数は、音声符号化装置の
構成に依存して変わってくるが、ここではLPC係数イ
ンデックス、適応ベクトルインデックス、適応ベクトル
ゲインインデックス、雑音ベクトルインデックスおよび
雑音ベクトルゲインインデックスがパラメータとして復
号されるものとする。
In FIG. 8, a bit stream, which is encoded data output from a CELP audio encoding apparatus (not shown), is input to an input terminal 401 via a transmission line or a storage medium (not shown). The voice encoding device is configured, for example, as shown in FIG. The demultiplexer 402 decodes the parameters required to generate an audio signal from the input bitstream.
The type and number of these parameters vary depending on the configuration of the speech coder, but here, LPC coefficient index, adaptive vector index, adaptive vector gain index, noise vector index and noise vector gain index are used as parameters. It shall be decrypted.

【0056】適応符号帳403および適応ベクトルゲイ
ン符号帳404から、適応ベクトルインデックスおよび
適応ベクトルゲインインデックスでそれぞれ指定される
適応ベクトルおよび適応ベクトルゲインが選択され、こ
れらが乗算器405で掛け合わされる。同様に、雑音符
号帳406および雑音ベクトルゲイン符号帳407か
ら、雑音ベクトルインデックスおよび雑音ベクトルゲイ
ンインデックスでそれぞれ指定される雑音ベクトルおよ
び雑音ベクトルゲインが選択され、これらが乗算器40
8で掛け合わされる。
From the adaptive codebook 403 and the adaptive vector gain codebook 404, the adaptive vector and the adaptive vector gain designated by the adaptive vector index and the adaptive vector gain index are selected, and these are multiplied by the multiplier 405. Similarly, the noise vector and the noise vector gain designated by the noise vector index and the noise vector gain index are selected from the noise codebook 406 and the noise vector gain codebook 407, respectively.
It is multiplied by 8.

【0057】そして、加算器409により乗算器40
5,408から出力されるベクトルの和がとられて駆動
信号が生成され、この駆動信号が合成フィルタ411お
よびピッチ情報分析部203に与えられる。また、この
駆動信号は適応符号帳403にも与えられて内部状態の
更新が行われ、次の入力に備える。
Then, the adder 409 causes the multiplier 40 to
5, 408, the drive signals are generated by summing the vectors output, and the drive signals are provided to the synthesis filter 411 and the pitch information analysis unit 203. This drive signal is also given to the adaptive codebook 403 to update the internal state and prepare for the next input.

【0058】一方、LPC係数インデックスがLPC係
数復号部410に与えられることにより、LPC係数
{αq(i);i=1〜NP}が復号され、このLPC
係数は合成フィルタ411およびポストフィルタ205
に与えられる。合成フィルタ411の伝達関数は(9)
式と同様に表わされ、この合成フィルタ411に加算器
409からの駆動信号が入力されることによりフィルタ
リングが行われ、復号音声信号が得られる。この復号音
声信号は、ポストフィルタ205に入力される。
On the other hand, when the LPC coefficient index is given to the LPC coefficient decoding section 410, the LPC coefficient {αq (i); i = 1 to NP} is decoded, and this LPC coefficient is decoded.
The coefficients are the synthesis filter 411 and the post filter 205.
Given to. The transfer function of the synthesis filter 411 is (9)
It is expressed in the same manner as the equation, and the driving signal from the adder 409 is input to the synthesis filter 411 to perform filtering and obtain a decoded speech signal. This decoded audio signal is input to the post filter 205.

【0059】ポストフィルタ205およびピッチ情報分
析部203は図5〜図7で説明した通りであるので、こ
こでは詳細な説明を省略する。本実施形態では、ポスト
フィルタ205には合成フィルタ411から出力される
復号音声信号が入力され、ピッチ情報分析部203には
加算器409から出力される駆動信号が入力される。本
実施形態の音声復号化装置では、ポストフィルタ205
を通った復号音声信号が最終的に出力端子206より出
力される。
The post filter 205 and the pitch information analysis unit 203 are as described with reference to FIGS. 5 to 7, so detailed description will be omitted here. In the present embodiment, the decoded audio signal output from the synthesis filter 411 is input to the post filter 205, and the drive signal output from the adder 409 is input to the pitch information analysis unit 203. In the speech decoding apparatus of this embodiment, the post filter 205
The decoded voice signal that has passed through is finally output from the output terminal 206.

【0060】このように本実施形態では、ポストフィル
タ205で用いられるピッチ情報を分析するピッチ情報
分析部203におけるピッチ周期分析範囲{TPL≦T
P≦TPH}と、合成フィルタ411に与えられる駆動
信号の周期性を表し、デマルチプレクサ402を介して
復号され適応符号帳403で用いられる適応ベクトルイ
ンデックスにより指定されるピッチ周期(TL)のとり
得る範囲{TLL≦TL≦TLH}の関係がTPL<T
LLおよびTPH>TLHの条件を満足している。すな
わち、ピッチ周期分析範囲{TPL≦TP≦TPH}を
ピッチ周期の符号化データ(適応ベクトルインデックス
の符号化データ)により表現できるピッチ周期の範囲
{TLL≦TL≦TLH}よりも広く設定している。
As described above, in this embodiment, the pitch period analysis range {TPL≤T in the pitch information analysis unit 203 that analyzes the pitch information used in the post filter 205.
P ≦ TPH} and the periodicity of the drive signal given to the synthesis filter 411, which can be the pitch period (TL) specified by the adaptive vector index decoded by the demultiplexer 402 and used in the adaptive codebook 403. The relation of the range {TLL ≦ TL ≦ TLH} is TPL <T
The conditions of LL and TPH> TLH are satisfied. That is, the pitch cycle analysis range {TPL≤TP≤TPH} is set wider than the pitch cycle range {TLL≤TL≤TLH} that can be expressed by pitch cycle encoded data (adaptive vector index encoded data). .

【0061】このような条件を満足することにより、予
め定められたビット数で表現されなければならない適応
符号帳403のピッチ周期探索範囲{TLL≦TL≦T
LH}から外れたピッチ周期を有する復号音声信号がポ
ストフィルタ205に入力されたとしても、ポストフィ
ルタ205で用いられるピッチ情報分析部203のピッ
チ分析範囲{TPL≦TP≦TPH}が適応符号帳40
3のピッチ周期探索範囲より広いために、適応ベクトル
インデックスの符号化データとして伝送され得なかった
ピッチ周期を復元することができる。その結果、主観品
質を向上させることができる。
By satisfying such a condition, the pitch period search range {TLL≤TL≤T of the adaptive codebook 403 which has to be expressed by a predetermined number of bits.
Even if a decoded speech signal having a pitch period deviating from LH} is input to the post filter 205, the pitch analysis range {TPL ≦ TP ≦ TPH} of the pitch information analysis unit 203 used in the post filter 205 is determined by the adaptive codebook 40.
Since it is wider than the pitch period search range of 3, the pitch period that could not be transmitted as the encoded data of the adaptive vector index can be restored. As a result, the subjective quality can be improved.

【0062】なお、本実施形態ではピッチ周期分析範囲
{TPL≦TP≦TPH}を符号化データにより表現で
きるピッチ周期の範囲{TLL≦TL≦TLH}との関
係がTPL<TLLおよびTPH>TLHの条件を満足
しているが、TLL>TPLおよびTLH<TPHのい
ずれか一方の条件のみを満足するようにしてもよい。
In this embodiment, the relationship between the pitch period analysis range {TPL≤TP≤TPH} and the pitch period range {TLL≤TL≤TLH} that can be expressed by the encoded data is TPL <TLL and TPH> TLH. Although the condition is satisfied, only one of TLL> TPL and TLH <TPH may be satisfied.

【0063】次に、本発明の他の実施形態を説明する。
図9は、本発明の他の実施形態に係る音声符号化方法に
用いるポストフィルタの基本動作を説明するためのブロ
ック図である。同図において、図5と同一の構成要素に
は同一の参照符号を付して詳細な説明を省略する。
Next, another embodiment of the present invention will be described.
FIG. 9 is a block diagram for explaining the basic operation of the post filter used in the speech coding method according to another embodiment of the present invention. In the figure, the same components as those of FIG. 5 are designated by the same reference numerals, and detailed description thereof will be omitted.

【0064】本実施形態と図5の実施形態の違いは、図
示しない音声復号化装置が適応符号帳と予め用意された
固定の候補ベクトルからなる固定符号帳とを同列に有し
ており、かつ適応符号帳が選択された場合と固定符号帳
が選択された場合とでピッチ周期TPの求め方が異なる
点にある。
The difference between this embodiment and the embodiment shown in FIG. 5 is that a speech decoding apparatus (not shown) has an adaptive codebook and a fixed codebook made up of fixed candidate vectors prepared in advance, and The difference is that the pitch period TP is obtained differently when the adaptive codebook is selected and when the fixed codebook is selected.

【0065】適応符号帳が選択された場合、伝送され復
号された適応符号帳のピッチ周期TLをポストフィルタ
内のピッチフィルタに与えるピッチ周期TPとみなし、
このピッチ周期TPを用いてピッチフィルタ係数gを求
め、ポストフィルタ205に与える。逆に、固定符号帳
が選択された場合、ピッチ情報分析部203で新たにピ
ッチ周期TPを求め、このピッチ周期TPを用いてピッ
チフィルタ係数gを算出してポストフィルタ205に与
える。
When the adaptive codebook is selected, the pitch period TL of the transmitted and decoded adaptive codebook is regarded as the pitch period TP given to the pitch filter in the post filter,
A pitch filter coefficient g is obtained using this pitch period TP and is given to the post filter 205. On the contrary, when the fixed codebook is selected, the pitch information analysis unit 203 newly obtains the pitch period TP, calculates the pitch filter coefficient g using this pitch period TP, and gives it to the post filter 205.

【0066】次に、図10を参照して本実施形態におけ
るピッチ情報分析部203について説明する。図10に
おいて、図6と同一の構成要素には同一の参照番号を付
して説明を省略する。
Next, the pitch information analysis unit 203 in this embodiment will be described with reference to FIG. 10, the same elements as those of FIG. 6 are designated by the same reference numerals and the description thereof will be omitted.

【0067】図10において、入力端子211からは図
示しない音声復号化装置において適応符号帳および固定
符号帳のいずれを使用したかを表す選択情報が与えられ
る。この選択情報が適応符号帳を表すとき、スイッチ3
10は入力端子207より入力される適応符号帳のピッ
チ周期TLの情報をポストフィルタで用いられるピッチ
周期TPの情報とみなしてピッチフィルタ係数分析部3
05に与える。一方、入力端子211からの選択情報が
固定符号帳を表すとき、スイッチ310は入力端子20
2からの入力が有効になるよう働く。つまり、入力端子
202から予測残差信号もしくはそれに準じる信号であ
る駆動信号系列が入力され、この信号を基にピッチ周期
分析部304でピッチ周期TPが求められ、ピッチフィ
ルタ係数分析部305に与えられる。このとき、固定符
号帳が選択されたのは適応符号帳のピッチ周期探索範囲
{TLL≦TL≦TLH}で表せないピッチが発生した
ためであると考えることができるので、ピッチ周期分析
部305での分析範囲は適応符号帳のピッチ周期探索範
囲を除いた{TPL≦TP<TLL、TLH<TP≦T
PH}とすることができ、その結果ピッチ周期の分析に
必要な計算量を削減することができる。
In FIG. 10, the input terminal 211 supplies selection information indicating which of the adaptive codebook and the fixed codebook is used in the speech decoding apparatus (not shown). When this selection information represents the adaptive codebook, switch 3
Reference numeral 10 regards the information of the pitch cycle TL of the adaptive codebook input from the input terminal 207 as the information of the pitch cycle TP used in the post filter, and the pitch filter coefficient analysis unit 3
Give to 05. On the other hand, when the selection information from the input terminal 211 represents the fixed codebook, the switch 310 switches the input terminal 20.
It works so that the input from 2 becomes effective. That is, the driving signal sequence which is a prediction residual signal or a signal corresponding thereto is input from the input terminal 202, the pitch period analysis unit 304 determines the pitch period TP based on this signal, and the pitch period TP is given to the pitch filter coefficient analysis unit 305. . At this time, it can be considered that the fixed codebook is selected because a pitch that cannot be represented by the pitch period search range {TLL ≦ TL ≦ TLH} of the adaptive codebook has occurred, so that the pitch period analysis unit 305 selects the fixed codebook. The analysis range excludes the pitch period search range of the adaptive codebook {TPL ≦ TP <TLL, TLH <TP ≦ T
PH}, which can reduce the amount of calculation required for the pitch period analysis.

【0068】ピッチフィルタ係数分析部305では、与
えられるピッチ周期TPの情報を基に、予測残差信号も
しくはそれに準じる駆動信号系列を用いてピッチフィル
タ係数gを算出し、ピッチ周期TPおよびピッチフィル
タ係数gの情報を出力端子308より出力する。
The pitch filter coefficient analysis unit 305 calculates the pitch filter coefficient g by using the prediction residual signal or a drive signal sequence based on the information of the given pitch cycle TP, and calculates the pitch cycle TP and the pitch filter coefficient. The information of g is output from the output terminal 308.

【0069】以上の処理をまとめると、図11に示され
るフローチャートのようになる。図11のステップS3
3、S34、S35およびS36の処理は、図7のステ
ップS21、S22、S23およびS24と同一なの
で、ここでは説明を省略する。ただし、ステップS33
におけるピッチ周期分析範囲とステップS21における
ピッチ周期分析範囲とが異なることは、前述した通りで
ある。
The above processing is summarized as a flow chart shown in FIG. Step S3 of FIG.
The processes of 3, S34, S35, and S36 are the same as steps S21, S22, S23, and S24 of FIG. 7, and thus the description thereof is omitted here. However, step S33
The difference between the pitch cycle analysis range in step S21 and the pitch cycle analysis range in step S21 is as described above.

【0070】最初に、ステップS31で選択情報が適応
符号帳を表しているか固定符号帳を表しているかを判定
する。選択情報が適応符号帳を表している場合はステッ
プS32に進み、固定符号帳を表している場合はステッ
プS33に進む。選択情報が適応符号帳を表す場合、ス
テップS32で適応符号帳探索で求めたピッチ周期TL
をポストフィルタ内のピッチフィルタで用いるピッチ周
期TPとし、ステップS34へ進む。選択情報が固定符
号帳を表す場合、ステップS33でピッチ周期TPを新
たに算出し、ステップS34へ進む。
First, in step S31, it is determined whether the selection information represents the adaptive codebook or the fixed codebook. When the selection information represents the adaptive codebook, the process proceeds to step S32, and when the selection information represents the fixed codebook, the process proceeds to step S33. When the selection information represents the adaptive codebook, the pitch period TL obtained by the adaptive codebook search in step S32
Is set as a pitch period TP used in the pitch filter in the post filter, and the process proceeds to step S34. When the selection information represents the fixed codebook, the pitch period TP is newly calculated in step S33, and the process proceeds to step S34.

【0071】次に、図12を参照して上述したポストフ
ィルタを用いたCELP方式による音声復号化装置につ
いて説明する。図12において、図8と同一の構成要素
には同一の参照符号を付して詳細な説明を省略する。
Next, the CELP speech decoding apparatus using the above-described post filter will be described with reference to FIG. 12, the same components as those of FIG. 8 are designated by the same reference numerals, and detailed description thereof will be omitted.

【0072】本実施形態は、図8の実施形態と比較して
適応符号帳403と同列に固定符号帳412を有する点
が異なっている。以下、図8の実施形態との違いに重点
をおいて説明を行う。
The present embodiment is different from the embodiment of FIG. 8 in that a fixed codebook 412 is provided in the same column as the adaptive codebook 403. Hereinafter, the description will be given with an emphasis on the difference from the embodiment of FIG.

【0073】図12において、デマルチプレクサ402
から出力される適応ベクトルインデックスは判定部41
3に与えられ、復号されるべきベクトルが適応符号帳4
03から生成されるベクトルであるか固定符号帳412
から生成されるベクトルであるかが判定される。その判
定結果はスイッチ414、スイッチ415およびピッチ
情報分析部203に与えられる。ここでは、適応ベクト
ルインデックスが適応符号帳403と固定符号帳412
の両者のベクトルを同様に表現する場合について説明し
たが、デマルチプレクサから直接判定情報が生成される
場合もあり得るので、そのときは判定部413は不要で
ある。この場合、図示しない音声符号化装置は伝送すべ
き情報として新たに判定情報をマルチプレクサに与えて
いる構成を持ち、この判定情報としては適応符号帳か固
定符号帳かの区別を表すために1ビットの付加情報が必
要になる。
In FIG. 12, the demultiplexer 402
The adaptive vector index output from
3 is applied to the adaptive codebook 4 to be decoded.
Is a vector generated from the fixed codebook 412
Is determined from the vector. The determination result is given to the switches 414, 415 and the pitch information analysis unit 203. Here, the adaptive vector indexes are adaptive codebook 403 and fixed codebook 412.
Although the case where both vectors are represented in the same manner has been described, the determination information may be directly generated from the demultiplexer, and in that case, the determination unit 413 is not necessary. In this case, the speech coding apparatus (not shown) has a configuration in which the multiplexer is newly provided with decision information as information to be transmitted, and the decision information is 1 bit to indicate whether it is an adaptive codebook or a fixed codebook. Additional information is required.

【0074】スイッチ414は、判定部413から与え
られる判定情報に基づき、適応ベクトルインデックスを
適応符号帳403に与えるか固定符号帳412に与える
かを切り替える。同様に、スイッチ415は判定部41
3から与えられる判定情報に基づき、乗算器405に与
えるベクトルを決定する。
The switch 414 switches whether the adaptive vector index is given to the adaptive codebook 403 or the fixed codebook 412 based on the decision information given from the decision unit 413. Similarly, the switch 415 serves as the determination unit 41.
A vector to be given to the multiplier 405 is determined based on the judgment information given from No. 3.

【0075】ピッチ情報分析部203では、判定部41
3から与えられる判定情報に基づいて、ポストフィルタ
205内で用いるピッチフィルタのピッチ周期TPの算
出法を図10および図11で説明したように切り替え、
ピッチ情報分析部203で求めたピッチ周期TPおよび
ピッチフィルタ係数gをポストフィルタ205に与え
る。
In the pitch information analysis unit 203, the judgment unit 41
Based on the determination information given from No. 3, the method of calculating the pitch period TP of the pitch filter used in the post filter 205 is switched as described in FIGS. 10 and 11,
The pitch period TP and the pitch filter coefficient g calculated by the pitch information analysis unit 203 are given to the post filter 205.

【0076】次に、本実施形態の効果について説明す
る。適応符号帳403は、直前の駆動信号系列を用いて
ピッチ周期を効率よく表現できる適応ベクトルを生成す
るのに対し、固定符号帳412は予め定められた固定ベ
クトルを複数個用意している。図示しない音声符号化装
置に与えられる入力音声信号のピッチ周期が適応符号帳
403のピッチ周期探索範囲{TLL≦TL≦TLH}
の範囲に含まれている場合、適応符号帳403の適応ベ
クトルが選択され、そのインデックスが符号化されるこ
とになる。
Next, the effect of this embodiment will be described. Adaptive codebook 403 generates an adaptive vector that can efficiently represent the pitch period using the immediately preceding drive signal sequence, whereas fixed codebook 412 prepares a plurality of predetermined fixed vectors. The pitch cycle of the input speech signal given to the speech coding apparatus (not shown) is the pitch cycle search range of adaptive codebook 403 {TLL≤TL≤TLH}.
, The adaptive vector of the adaptive codebook 403 is selected and its index is encoded.

【0077】しかし、入力音声信号が適応符号帳403
のピッチ周期探索範囲に含まれないピッチ周期を持つ場
合、適応符号帳403の代わりに固定符号帳412が使
用される。これは、適応符号帳403が使用されたか、
固定符号帳412が使用されたかによって、入力音声信
号のピッチ周期が適応符号帳403のピッチ周期探索範
囲に含まれるかどうか判断することができることを意味
する。
However, the input voice signal is the adaptive codebook 403.
If the pitch period is not included in the pitch period search range of, the fixed codebook 412 is used instead of the adaptive codebook 403. This is because the adaptive codebook 403 was used,
This means that it is possible to determine whether the pitch cycle of the input speech signal is included in the pitch cycle search range of the adaptive codebook 403 depending on whether the fixed codebook 412 is used.

【0078】さらに、固定符号帳412が使用された場
合、ピッチ情報分析部203でのピッチ周期分析範囲は
適応符号帳403のピッチ周期探索範囲{TLL≦TL
≦TLH}を含まないと判断できることから、ピッチ周
期分析範囲を{TPL≦TP<TLL、TLH<TP≦
TPH}に限定することができ、計算量の削減を図るこ
とができる。一方、適応符号帳403が選択された場
合、入力音声信号のピッチ周期は適応符号帳403のピ
ッチ周期TLで表現されたものと考え、このピッチ周期
TLを基にポストフィルタ内205のピッチフィルタで
ピッチ強調を行えば良い。
Furthermore, when fixed codebook 412 is used, the pitch period analysis range in pitch information analysis section 203 is the pitch period search range of adaptive codebook 403 {TLL≤TL.
Since it can be determined that ≦ TLH} is not included, the pitch period analysis range is set to {TPL ≦ TP <TLL, TLH <TP ≦.
TPH} and the amount of calculation can be reduced. On the other hand, when the adaptive codebook 403 is selected, it is considered that the pitch period of the input speech signal is represented by the pitch period TL of the adaptive codebook 403, and the pitch filter in the post-filter 205 is based on this pitch period TL. Pitch emphasis should be performed.

【0079】なお、上述した実施形態はCELP方式の
音声符号化/復号化方法に本発明を適用した例について
述べたが、本発明はAPC(Adaptive Predictive Codin
g)方式といった他の方式の音声符号化/復号化方法にも
適用できる。
Although the above-described embodiment has described the example in which the present invention is applied to the speech encoding / decoding method of the CELP system, the present invention is not limited to the APC (Adaptive Predictive Codin).
It can also be applied to voice encoding / decoding methods of other methods such as g) method.

【0080】[0080]

【発明の効果】以上説明したように、本発明によれば音
声信号のピッチ周期を正しく表現して高品質の音声が得
られる音声符号化方法および音声復号化方法を提供する
ことができる。
As described above, according to the present invention, it is possible to provide a voice coding method and a voice decoding method which can accurately express the pitch period of a voice signal to obtain high quality voice.

【0081】すなわち、本発明による音声符号化方法で
は、聴感重みフィルタ内のピッチフィルタに与えるピッ
チ周期の分析範囲を適応符号帳のピッチ周期探索範囲よ
り広く設定することにより、適応符号帳のピッチ周期探
索範囲で表すことのできないピッチ周期を有する入力音
声信号が与えられても、ピッチフィルタに与えるピッチ
周期を正確に求めることができる。従って、このピッチ
周期を基にピッチフィルタで入力音声信号のピッチ周期
成分を抑圧し、このピッチフィルタを含む聴感重みフィ
ルタにより量子化雑音のスペクトル整形を行うことで、
マスキング効果による音声の品質向上を図ることができ
る。また、この処理は音声符号化装置と音声復号化装置
間の接続性になんら変化を与えないので、互換性を保っ
たまま品質改善を実現できる。
That is, in the speech coding method according to the present invention, the pitch period of the adaptive codebook is set by setting the analysis range of the pitch period given to the pitch filter in the perceptual weight filter wider than the pitch period search range of the adaptive codebook. Even if an input speech signal having a pitch period that cannot be represented by the search range is given, the pitch period given to the pitch filter can be accurately obtained. Therefore, by suppressing the pitch period component of the input speech signal with the pitch filter based on this pitch period, and performing the spectral shaping of the quantization noise by the perceptual weighting filter including this pitch filter,
The quality of voice can be improved by the masking effect. Further, this process does not change the connectivity between the speech coding apparatus and the speech decoding apparatus, so that the quality improvement can be realized while maintaining the compatibility.

【0082】また、本発明による音声復号化方法では、
ポストフィルタ内のピッチフィルタに与えるピッチ周期
の分析範囲を符号化データにより表現できるピッチ周波
の範囲より広く設定することにより、符号化データで表
すことのできないピッチ周期を持つ復号音声信号がポス
トフィルタに与えられたとしても、復号音声信号のピッ
チ周期を求めれば、そのピッチ周期を基にピッチ周期成
分の強調を行い、伝送され得なかったピッチ周期成分を
復元して品質の改善を図ることができる。
Further, in the voice decoding method according to the present invention,
By setting the analysis range of the pitch period given to the pitch filter in the post filter wider than the range of the pitch frequency that can be represented by the encoded data, the decoded audio signal with the pitch period that cannot be represented by the encoded data is transmitted to the post filter. Even if given, if the pitch period of the decoded speech signal is obtained, the pitch period component can be emphasized based on the pitch period and the pitch period component that could not be transmitted can be restored to improve the quality. .

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施形態に係る音声符号化方法に用
いる聴感重みフィルタの基本動作を説明するためのブロ
ック図
FIG. 1 is a block diagram for explaining a basic operation of a perceptual weighting filter used in a speech coding method according to an embodiment of the present invention.

【図2】同実施形態におけるピッチ情報分析部の構成を
示すブロック図
FIG. 2 is a block diagram showing a configuration of a pitch information analysis unit in the same embodiment.

【図3】同実施形態の処理手順を示すフローチャートFIG. 3 is a flowchart showing a processing procedure of the embodiment.

【図4】同実施形態に係る音声符号化方法を適用したC
ELP方式による音声合成装置の構成を示すブロック図
FIG. 4 is a C to which the speech coding method according to the embodiment is applied.
Block diagram showing the configuration of a speech synthesizer by ELP method

【図5】本発明の一実施形態に係る音声復号化方法に用
いるポストフィルタの基本動作を説明するためのブロッ
ク図
FIG. 5 is a block diagram for explaining a basic operation of a post filter used in the speech decoding method according to the embodiment of the present invention.

【図6】同実施形態におけるピッチ情報分析部の構成を
示すブロック図
FIG. 6 is a block diagram showing a configuration of a pitch information analysis unit in the same embodiment.

【図7】同実施形態の処理手順を示すフローチャートFIG. 7 is a flowchart showing a processing procedure according to the embodiment;

【図8】同実施形態に係る音声復号化方法を適用したC
ELP方式による音声復号化装置の構成を示すブロック
FIG. 8 is a C to which the speech decoding method according to the embodiment is applied.
Block diagram showing the configuration of a voice decoding device by the ELP method

【図9】同実施形態に係る音声復号化方法に用いるポス
トフィルタの基本動作を説明するブロック図
FIG. 9 is a block diagram illustrating a basic operation of a post filter used in the speech decoding method according to the embodiment.

【図10】同実施形態におけるピッチ情報分析部の構成
を示すブロック図
FIG. 10 is a block diagram showing a configuration of a pitch information analysis unit in the same embodiment.

【図11】同実施形態の処理手順を示すフローチャートFIG. 11 is a flowchart showing a processing procedure of the embodiment.

【図12】本発明の他の実施形態に係る音声復号化方法
を適用したCELP方式による音声復号化装置の構成を
示すブロック図
FIG. 12 is a block diagram showing the configuration of a CELP speech decoding apparatus to which a speech decoding method according to another embodiment of the present invention is applied.

【符号の説明】[Explanation of symbols]

101…音声信号入力端子 102…LPC係数分析部 103…ピッチ情報分析部 104…聴感重みフィルタ 105…出力端子 106…LPC係数量子化部 107…重み付き合成フィルタ 108…適応符号帳 109…雑音符号帳 110,111…乗算器 112…加算器 113…適応ベクトルゲイン符号帳 114…雑音ベクトルゲイン符号帳 115…減算器 116…最小歪探索部 117…マルチプレクサ 118…出力端子 201…復号音声信号入力端子 202…駆動信号入力端子 203…ピッチ情報分析部 204…LPC係数入力端子 205…ポストフィルタ 206…ポストフィルタ出力端子 207…適応符号帳のピッチ周期入力端子 211…符号帳選択情報入力端子 301…音声信号入力端子 302…LPC係数入力端子 303…予測残差信号計算部 304…ピッチ周期分析部 305…ピッチフィルタ係数入力端子 306…出力端子 308…出力端子 310…スイッチ 401…ビットストリーム入力端子 402…デマルチプレクサ 403…適応符号帳 404…適応ベクトルゲイン符号帳 405…乗算器 406…雑音符号帳 407…雑音ベクトルゲイン符号帳 408…乗算器 409…加算器 410…LPC係数復号部 411…合成フィルタ 412…固定符号帳 413…判定部 414,415…スイッチ 101 ... Voice signal input terminal 102 ... LPC coefficient analysis section 103 ... Pitch information analysis section 104 ... Auditory weighting filter 105 ... Output terminal 106 ... LPC coefficient quantization section 107 ... Weighted synthesis filter 108 ... Adaptive codebook 109 ... Noise codebook 110, 111 ... Multiplier 112 ... Adder 113 ... Adaptive Vector Gain Codebook 114 ... Noise Vector Gain Codebook 115 ... Subtractor 116 ... Minimum Distortion Search Unit 117 ... Multiplexer 118 ... Output Terminal 201 ... Decoded Speech Signal Input Terminal 202 ... Drive signal input terminal 203 ... Pitch information analysis unit 204 ... LPC coefficient input terminal 205 ... Post filter 206 ... Post filter output terminal 207 ... Adaptive codebook pitch period input terminal 211 ... Codebook selection information input terminal 301 ... Voice signal input terminal 302 ... LPC coefficient input terminal 3 3 ... Prediction residual signal calculation unit 304 ... Pitch cycle analysis unit 305 ... Pitch filter coefficient input terminal 306 ... Output terminal 308 ... Output terminal 310 ... Switch 401 ... Bit stream input terminal 402 ... Demultiplexer 403 ... Adaptive codebook 404 ... Adaptation Vector gain codebook 405 ... Multiplier 406 ... Noise codebook 407 ... Noise vector gain codebook 408 ... Multiplier 409 ... Adder 410 ... LPC coefficient decoding unit 411 ... Synthesis filter 412 ... Fixed codebook 413 ... Judgment unit 414, 415 …switch

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】入力音声信号のピッチ周期を分析して、該
入力音声信号のピッチ周期成分を抑圧するピッチフィル
タに与え、このピッチフィルタを含む聴感重みフィルタ
に通した音声信号に基づいて該入力音声信号のピッチ周
期を探索し符号化する音声符号化方法において、 前記ピッチ周期の符号化データにより表現できるピッチ
周期の範囲に対し、前記ピッチフィルタに与えるピッチ
周期の分析範囲を広く設定したことを特徴とする音声符
号化方法。
1. A pitch cycle of an input speech signal is analyzed, the pitch cycle component of the input speech signal is applied to a pitch filter, and the input is made based on the speech signal passed through a perceptual weighting filter including the pitch filter. In a voice encoding method for searching and encoding a pitch period of a voice signal, a wide range of analysis of the pitch period given to the pitch filter is set with respect to the range of the pitch period that can be represented by the encoded data of the pitch period. Characteristic speech coding method.
【請求項2】入力音声信号のピッチ周期を分析して、該
入力音声信号のピッチ周期成分を強調するピッチフィル
タに与え、このピッチフィルタを含む聴感重みフィルタ
に通した音声信号に基づいて該入力音声信号のピッチ周
期を探索し符号化する音声符号化方法において、 前記符号化データにより表現できるピッチ周期(TL)
の範囲をTLL≦TL≦TLHとし、前記ピッチフィル
タに与えるピッチ周期(TW)の分析範囲をTWL≦T
W≦TWHとしたとき、TLL>TWLおよびTLH<
TWHの少なくとも一方の条件を満足することを特徴と
する音声符号化方法。
2. A pitch cycle of an input speech signal is analyzed, the pitch cycle component of the input speech signal is given to a pitch filter which emphasizes the pitch cycle component, and the input is based on the speech signal passed through a perceptual weighting filter including this pitch filter. A voice coding method for searching for and coding a pitch period of a voice signal, comprising a pitch period (TL) that can be represented by the coded data.
Is set to TLL ≦ TL ≦ TLH, and the analysis range of the pitch period (TW) given to the pitch filter is TWL ≦ T.
When W ≦ TWH, TLL> TWL and TLH <
A speech encoding method characterized by satisfying at least one condition of TWH.
【請求項3】符号化データを復号して得られた復号音声
信号のピッチ周期を分析して、該復号音声信号をピッチ
周期成分を強調するピッチフィルタを含むポストフィル
タに通して出力する音声復号化方法において、 前記符号化データにより表現できるピッチ周期の範囲に
対し、前記ピッチフィルタに与えるピッチ周期の分析範
囲を広く設定したことを特徴とする音声復号化方法。
3. Speech decoding for analyzing a pitch period of a decoded speech signal obtained by decoding coded data and outputting the decoded speech signal through a post filter including a pitch filter for emphasizing a pitch period component. The speech decoding method, wherein the analysis range of the pitch period given to the pitch filter is set wider than the range of the pitch period that can be represented by the encoded data.
【請求項4】符号化データを復号して得られた復号音声
信号のピッチ周期を分析して、該復号音声信号をピッチ
周期成分を強調するピッチフィルタを含むポストフィル
タに通して出力する音声復号化方法において、 前記符号化データにより表現できるピッチ周期(TL)
の範囲をTLL≦TL≦TLHとし、前記ピッチフィル
タに与えるピッチ周期(TP)の分析範囲をTPL≦T
P≦TPHとしたとき、TLL>TPLおよびTLH<
TPHの少なくとも一方の条件を満足することを特徴と
する音声復号化方法。
4. A speech decoding method in which a pitch period of a decoded speech signal obtained by decoding encoded data is analyzed, and the decoded speech signal is output through a post filter including a pitch filter that emphasizes a pitch period component. Method, a pitch period (TL) that can be represented by the encoded data.
Is set to TLL ≦ TL ≦ TLH, and the analysis range of the pitch period (TP) given to the pitch filter is TPL ≦ T.
When P ≦ TPH, TLL> TPL and TLH <
A speech decoding method characterized by satisfying at least one condition of TPH.
JP07624996A 1996-01-31 1996-03-29 Voice coding method and voice decoding method Expired - Lifetime JP3350340B2 (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP07624996A JP3350340B2 (en) 1996-03-29 1996-03-29 Voice coding method and voice decoding method
EP97300609A EP0788091A3 (en) 1996-01-31 1997-01-30 Speech encoding and decoding method and apparatus therefor
US08/791,741 US5819213A (en) 1996-01-31 1997-01-30 Speech encoding and decoding with pitch filter range unrestricted by codebook range and preselecting, then increasing, search candidates from linear overlap codebooks

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP07624996A JP3350340B2 (en) 1996-03-29 1996-03-29 Voice coding method and voice decoding method

Publications (2)

Publication Number Publication Date
JPH09269798A true JPH09269798A (en) 1997-10-14
JP3350340B2 JP3350340B2 (en) 2002-11-25

Family

ID=13599930

Family Applications (1)

Application Number Title Priority Date Filing Date
JP07624996A Expired - Lifetime JP3350340B2 (en) 1996-01-31 1996-03-29 Voice coding method and voice decoding method

Country Status (1)

Country Link
JP (1) JP3350340B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004040553A1 (en) * 2002-10-31 2004-05-13 Nec Corporation Bandwidth expanding device and method

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004040553A1 (en) * 2002-10-31 2004-05-13 Nec Corporation Bandwidth expanding device and method
US7684979B2 (en) 2002-10-31 2010-03-23 Nec Corporation Band extending apparatus and method

Also Published As

Publication number Publication date
JP3350340B2 (en) 2002-11-25

Similar Documents

Publication Publication Date Title
US5778335A (en) Method and apparatus for efficient multiband celp wideband speech and music coding and decoding
US7171355B1 (en) Method and apparatus for one-stage and two-stage noise feedback coding of speech and audio signals
US6202046B1 (en) Background noise/speech classification method
US5602961A (en) Method and apparatus for speech compression using multi-mode code excited linear predictive coding
US10468045B2 (en) Methods, encoder and decoder for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates
JPH08263099A (en) Encoder
JP2002541499A (en) CELP code conversion
US5659659A (en) Speech compressor using trellis encoding and linear prediction
JP3357795B2 (en) Voice coding method and apparatus
US20040111257A1 (en) Transcoding apparatus and method between CELP-based codecs using bandwidth extension
JP3628268B2 (en) Acoustic signal encoding method, decoding method and apparatus, program, and recording medium
JPH1097295A (en) Coding method and decoding method of acoustic signal
JPH09152896A (en) Sound path prediction coefficient encoding/decoding circuit, sound path prediction coefficient encoding circuit, sound path prediction coefficient decoding circuit, sound encoding device and sound decoding device
JPH10177398A (en) Voice coding device
JP2002268686A (en) Voice coder and voice decoder
JP2000112498A (en) Audio coding method
JP3888097B2 (en) Pitch cycle search range setting device, pitch cycle search device, decoding adaptive excitation vector generation device, speech coding device, speech decoding device, speech signal transmission device, speech signal reception device, mobile station device, and base station device
KR100341398B1 (en) Codebook searching method for CELP type vocoder
KR100718487B1 (en) Harmonic noise weighting in digital speech coders
JP3350340B2 (en) Voice coding method and voice decoding method
JP2002073097A (en) Celp type voice coding device and celp type voice decoding device as well as voice encoding method and voice decoding method
JP2968109B2 (en) Code-excited linear prediction encoder and decoder
JP3262652B2 (en) Audio encoding device and audio decoding device
JP2004348120A (en) Voice encoding device and voice decoding device, and method thereof
JP3468862B2 (en) Audio coding device

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070913

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080913

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080913

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090913

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090913

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100913

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110913

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110913

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120913

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120913

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130913

Year of fee payment: 11

EXPY Cancellation because of completion of term