JP3350340B2 - Voice coding method and voice decoding method - Google Patents

Voice coding method and voice decoding method

Info

Publication number
JP3350340B2
JP3350340B2 JP07624996A JP7624996A JP3350340B2 JP 3350340 B2 JP3350340 B2 JP 3350340B2 JP 07624996 A JP07624996 A JP 07624996A JP 7624996 A JP7624996 A JP 7624996A JP 3350340 B2 JP3350340 B2 JP 3350340B2
Authority
JP
Japan
Prior art keywords
pitch
filter
speech
signal
cycle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP07624996A
Other languages
Japanese (ja)
Other versions
JPH09269798A (en
Inventor
正浩 押切
公生 三関
政巳 赤嶺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP07624996A priority Critical patent/JP3350340B2/en
Priority to US08/791,741 priority patent/US5819213A/en
Priority to EP97300609A priority patent/EP0788091A3/en
Publication of JPH09269798A publication Critical patent/JPH09269798A/en
Application granted granted Critical
Publication of JP3350340B2 publication Critical patent/JP3350340B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、音声信号の圧縮符
号化を行う音声符号化方法および符号化データから元の
音声信号を復号する音声復号化方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an audio encoding method for compressing and encoding an audio signal and an audio decoding method for decoding an original audio signal from encoded data.

【0002】[0002]

【従来の技術】音声信号を低ビットレートで高能率に圧
縮符号化する技術は、自動車電話などの移動体通信や企
業内通信において、電波の有効利用や通信コストの削減
のための重要な技術である。8kbps以下のビットレ
ートで品質の優れた音声合成が可能な音声符号化方法と
して、CELP(Code Excited Linear Prediction)方式
が知られている。このCELP方式は、AT&Tベル研
の M.R.Schroeder氏とB.S.Atal氏により、“Code-Excit
ed Linear Prediction(CELP) High-Quality Speech at
Very low Bit Rates”,Proc.ICASSP;1985,pp.937-939”
(文献1)で発表されて以来、高品質な音声が合成でき
る方式として注目され、品質の改善や計算量の削減等に
ついて種々の検討がなされてきた。
2. Description of the Related Art A technology for efficiently compressing and encoding a voice signal at a low bit rate is an important technology for effective use of radio waves and reduction of communication costs in mobile communications such as car telephones and in-company communications. It is. A CELP (Code Excited Linear Prediction) method is known as a speech coding method capable of performing high-quality speech synthesis at a bit rate of 8 kbps or less. The CELP method is described in "Code-Excit" by Mr. MR Schroeder and BSAtal of AT & T Bell Labs.
ed Linear Prediction (CELP) High-Quality Speech at
Very low Bit Rates ”, Proc.ICASSP; 1985, pp.937-939”
Since it was announced in (Reference 1), it has attracted attention as a method capable of synthesizing high-quality speech, and various studies have been made on improving quality, reducing the amount of calculation, and the like.

【0003】CELP方式による音声符号化装置の構成
要素の一つとして、適応符号帳がある。適応符号帳は、
入力音声のピッチ予測分析を閉ループ動作または合成に
よる分析(Analysis by Synthesis)によって行うもので
ある。一般に、適応符号帳によるピッチ予測分析は20
〜147サンプルの探索範囲(128候補)でピッチ周
期の探索を行って、目標信号に対する歪が最小となるピ
ッチ周期を求め、このピッチ周期の情報を7ビットの符
号化データとして伝送することが多い。
An adaptive codebook is one of the components of a speech coding apparatus based on the CELP system. The adaptive codebook is
The pitch prediction analysis of the input voice is performed by closed loop operation or analysis by synthesis (Analysis by Synthesis). Generally, pitch prediction analysis using an adaptive codebook requires 20
The pitch period is searched in a search range of 147 samples (128 candidates) to find a pitch period that minimizes distortion with respect to the target signal, and the information of the pitch period is often transmitted as 7-bit encoded data. .

【0004】しかし、上記探索範囲から外れるピッチ周
期が入力音声信号に含まれる場合には、ピッチ周期を適
応符号帳で表現できなくなるために、実際と異なるピッ
チ周期が選択され、復号音声に大きな品質劣化が生じる
という問題があった。また、これを防ぐために適応符号
帳のピッチ周期探索範囲を広げようとすると、ピッチ周
期を表す符号化データのビット数を増加させる必要があ
り、結果的に伝送レートが高くなってしまうという問題
があった。
However, if the input speech signal contains a pitch cycle that is out of the above search range, the pitch cycle cannot be represented by the adaptive codebook. There is a problem that deterioration occurs. Further, if the pitch period search range of the adaptive codebook is to be expanded to prevent this, it is necessary to increase the number of bits of the encoded data representing the pitch period, resulting in a problem that the transmission rate increases. there were.

【0005】[0005]

【発明が解決しようとする課題】上述したように、従来
の音声符号化方法では、予め定められた探索範囲のピッ
チ周期を予め定められたビット数の符号化データに符号
化するため、探索範囲から外れるピッチ周期が存在する
音声が入力された場合、品質劣化が生じる。一般に、符
号化されるピッチ周期の範囲は実験的に検証され妥当な
ものが選ばれているが、常にこの範囲に収まるという保
証はなく、発声者の特徴や同一発声者でのピッチ周期の
変動によってはピッチ周期の探索範囲から外れるという
危険性は常につきまとう。
As described above, in the conventional speech coding method, the pitch period of a predetermined search range is coded into coded data having a predetermined number of bits. If a voice having a pitch period out of the range is input, quality degradation occurs. In general, the range of the pitch period to be coded is experimentally verified and selected appropriately, but there is no guarantee that the range will always fall within this range, and the characteristics of the speaker and the fluctuation of the pitch period within the same speaker In some cases, the danger of being out of the search range of the pitch period is always present.

【0006】本発明は、上述した従来技術の問題点を解
決するためになされたもので、音声信号のピッチ周期を
正しく表現して高品質の音声を得ることができる音声符
号化方法および音声復号化方法を提供することを目的と
する。
SUMMARY OF THE INVENTION The present invention has been made to solve the above-mentioned problems of the prior art, and a speech encoding method and speech decoding capable of correctly expressing a pitch period of a speech signal to obtain high quality speech. The purpose of the present invention is to provide a conversion method.

【0007】[0007]

【課題を解決するための手段】上記問題を解決するた
め、本発明に係る音声符号化方法は、入力音声信号のピ
ッチ周期を分析して、該入力音声信号のピッチ周期成分
を抑圧するピッチフィルタに与え、このピッチフィルタ
を含む聴感重みフィルタに通した音声信号に基づいて該
入力音声信号のピッチ周期を探索し符号化する際、符号
化データにより表現できるピッチ周期の範囲に対し、ピ
ッチフィルタに与えるピッチ周期の分析範囲を広く設定
したことを特徴とする。より具体的には、ピッチ周期の
符号化データにより表現できるピッチ周期(TL)の範
囲をTLL≦TL≦TLHとし、ピッチフィルタに与え
るピッチ周期(TW)の分析範囲をTWL≦TW≦TW
Hとしたとき、TLL>TWLおよびTLH<TWHの
少なくとも一方の条件を満足することを特徴とする。
In order to solve the above problems, a speech encoding method according to the present invention analyzes a pitch cycle of an input speech signal and suppresses a pitch cycle component of the input speech signal. When the pitch period of the input audio signal is searched for and encoded based on the audio signal passed through the perceptual weight filter including the pitch filter, a range of the pitch period that can be expressed by the encoded data is applied to the pitch filter. The analysis range of the given pitch period is set wide. More specifically, the range of the pitch cycle (TL) that can be represented by the encoded data of the pitch cycle is TLL ≦ TL ≦ TLH, and the analysis range of the pitch cycle (TW) given to the pitch filter is TWL ≦ TW ≦ TW
When H, at least one of the conditions of TLL> TWL and TLH <TWH is satisfied.

【0008】聴感重みフィルタは、マスキング効果を利
用して量子化雑音を聞こえにくくすることで、主観品質
を向上させるものである。ここでいうマスキング効果と
は、入力音声のパワースペクトルの大きい周波数領域で
は、量子化雑音が大きくとも入力音声のスペクトルにマ
スクされて聞こえにくくなる現象をいう。逆に、入力信
号のパワースペクトルが小さい周波数領域ではマスキン
グ効果は働かず、量子化雑音が聞こえやすい。聴感重み
フィルタは、量子化雑音のスペクトルを入力音声のスペ
クトルに近くなるように整形する働きを持ち、音声のス
ペクトル包絡に対応するLPC合成フィルタと、音声の
スペクトル微細構造に対応し、入力音声信号のピッチ周
期成分を抑圧する機能を有するピッチフィルタとにより
構成される。
The perceptual weight filter improves the subjective quality by making the quantization noise inaudible using the masking effect. Here, the masking effect refers to a phenomenon that in a frequency region where the power spectrum of the input voice is large, even if the quantization noise is large, it is masked by the spectrum of the input voice and becomes hard to hear. Conversely, in a frequency region where the power spectrum of the input signal is small, the masking effect does not work, and quantization noise is easily heard. The audibility weighting filter has a function of shaping the spectrum of the quantization noise so as to be close to the spectrum of the input voice, and an LPC synthesis filter corresponding to the spectrum envelope of the voice, and an input voice signal corresponding to the fine structure of the voice spectrum. And a pitch filter having a function of suppressing the pitch period component of

【0009】従来、聴感重みフィルタ内のピッチフィル
タに与えるピッチ周期(TW)の分析範囲(TWL≦T
W≦TWH)は、適応符号帳によるピッチ周期(TL)
の探索範囲(TLL≦TL≦TLH)と同じであった。
すなわち、TWL=TLLおよびTWH=TLHとして
いた。これは、適応符号帳によるピッチ周期の探索範囲
として既に妥当なものが選ばれているという前提の下
で、ピッチフィルタに与えるピッチ周期の分析範囲を適
応符号帳のピッチ周期探索範囲に一致させているからに
他ならない。
Conventionally, an analysis range (TWL ≦ TW) of a pitch period (TW) given to a pitch filter in an auditory weighting filter has been described.
W ≦ TWH) is the pitch period (TL) according to the adaptive codebook
(TLL ≦ TL ≦ TLH).
That is, TWL = TLL and TWH = TLH. This is based on the premise that a valid search range of the pitch cycle by the adaptive codebook has already been selected, and the analysis range of the pitch cycle given to the pitch filter is made to match the pitch cycle search range of the adaptive codebook. There is nothing other than that.

【0010】ところで、聴感重みフィルタは音声符号化
装置において符号帳探索の歪尺度として用いられるもの
であるため、聴感重みフィルタの構成を表す情報を音声
復号化装置へ送る必要はない。従って、聴感重みフィル
タ内のピッチフィルタに与えるピッチ周期の分析範囲
は、符号化データのビット数で制限される適応符号帳の
ピッチ周期探索範囲と異なり、本来自由に設定すること
ができる。この点に着目して、本発明では聴感重みフィ
ルタ内のピッチフィルタに与えるピッチ周期の分析範囲
を適応符号帳のピッチ周期探索範囲より十分広く設定す
る。
[0010] By the way, since the perceptual weighting filter is used as a distortion measure for codebook search in the voice coding device, it is not necessary to send information representing the configuration of the perceptual weighting filter to the voice decoding device. Therefore, the analysis range of the pitch period given to the pitch filter in the perceptual weight filter can be set freely, unlike the pitch period search range of the adaptive codebook limited by the number of bits of the encoded data. Focusing on this point, in the present invention, the analysis range of the pitch cycle given to the pitch filter in the perceptual weighting filter is set sufficiently wider than the pitch cycle search range of the adaptive codebook.

【0011】このようにすると、適応符号帳のピッチ周
期探索範囲で表すことのできないピッチ周期を有する入
力音声信号が与えられても、ピッチフィルタに与えるピ
ッチ周期を正確に求めることができる。従って、このピ
ッチ周期を基にピッチフィルタで入力音声信号のピッチ
周期成分を抑圧し、このピッチフィルタを含む聴感重み
フィルタにより量子化雑音のスペクトル整形を行うこと
で、マスキング効果による音声の品質向上を図ることが
できる。また、この処理は音声符号化装置と音声復号化
装置間の接続性になんら変化を与えないので、互換性を
保ったまま品質改善を実現できる。
In this way, even if an input speech signal having a pitch period that cannot be represented by the pitch period search range of the adaptive codebook is provided, the pitch period to be applied to the pitch filter can be accurately determined. Therefore, based on this pitch cycle, the pitch filter suppresses the pitch cycle component of the input speech signal, and the auditory weighting filter including the pitch filter performs the spectrum shaping of the quantization noise, thereby improving the speech quality due to the masking effect. Can be planned. In addition, since this process does not change the connectivity between the speech encoding device and the speech decoding device, quality can be improved while maintaining compatibility.

【0012】一方、本発明に係る音声復号化方法は、符
号化データを復号して得られる復号音声信号のピッチ周
期を分析して、復号音声信号をピッチ周期成分を強調す
るピッチフィルタを含むポストフィルタに通して出力す
る音声復号化方法において、符号化データにより表現で
きるピッチ周期の範囲に対し、ピッチフィルタに与える
ピッチ周期の分析範囲を広く設定したことを特徴とす
る。より具体的には、符号化データにより表現できるピ
ッチ周期(TL)の範囲をTLL≦TL≦TLHとし、
ピッチフィルタに与えるピッチ周期(TP)の分析範囲
をTPL≦TP≦TPHとしたとき、TLL>TPLお
よびTLH<TPHの少なくとも一方の条件を満足する
ことを特徴とする。
On the other hand, a speech decoding method according to the present invention analyzes a pitch cycle of a decoded speech signal obtained by decoding encoded data, and converts the decoded speech signal into a post signal including a pitch filter for emphasizing a pitch cycle component. A speech decoding method for outputting through a filter is characterized in that an analysis range of a pitch cycle given to a pitch filter is set wider than a range of a pitch cycle that can be represented by encoded data. More specifically, the range of the pitch period (TL) that can be represented by the encoded data is TLL ≦ TL ≦ TLH,
When the analysis range of the pitch cycle (TP) given to the pitch filter is TPL ≦ TP ≦ TPH, at least one of TLL> TPL and TLH <TPH is satisfied.

【0013】ポストフィルタは、音声復号化装置で得ら
れる復号音声信号のスペクトルの山の部分を強調し、谷
の部分を減衰させることで、主観品質を向上させるフィ
ルタである。このポストフィルタの一構成要素として、
復号音声信号のピッチ周期成分を強調するピッチフィル
タが存在する。
The post-filter is a filter that enhances the subjective quality by emphasizing peaks and attenuating valleys of the spectrum of the decoded speech signal obtained by the speech decoding device. As one component of this post filter,
There is a pitch filter that emphasizes the pitch period component of the decoded audio signal.

【0014】従来、このポストフィルタ内のピッチフィ
ルタに用いるピッチ周期(TP)の情報は、符号化デー
タを復号して得たピッチ周期をそのまま使うか、さもな
くば適応符号帳のピッチ周期探索範囲と同じ範囲として
新たにピッチ周期を求めるかのいずれかであり、いずれ
にしろピッチ周期(TP)の分析範囲{TPL≦TP≦
TPH}は、適応符号帳のピッチ周期(TL)の探索範
囲{TLL≦TL≦TLH}と同じ範囲としていた。す
なわち、TPL=TLLおよびTPH=TLHとしてい
た。これは、適応符号帳によるピッチ周期の探索範囲と
して既に妥当なものが選ばれているという前提の下で、
ピッチフィルタに与えるピッチ周期の分析範囲を適応符
号帳のピッチ周期探索範囲に一致させているからに他な
らない。
Conventionally, as information on a pitch period (TP) used for a pitch filter in this post filter, a pitch period obtained by decoding encoded data is used as it is, or a pitch period search range of an adaptive codebook is used. Either a new pitch period is obtained as the same range as above. In any case, the analysis range of the pitch period (TP) {TPL ≦ TP ≦
TPH} is the same range as the search range {TLL ≦ TL ≦ TLH} of the pitch period (TL) of the adaptive codebook. That is, TPL = TLL and TPH = TLH. This is based on the premise that a valid search range for the pitch period by the adaptive codebook has already been selected.
This is because the analysis range of the pitch cycle given to the pitch filter matches the pitch cycle search range of the adaptive codebook.

【0015】ところで、ポストフィルタは復号音声信号
に対して処理を行うものであるため、ポストフィルタ内
のピッチフィルタに与えるピッチ周期の分析範囲は、符
号化データのビット数で制限される適応符号帳のピッチ
周期探索範囲と異なり、本来自由に設定できる。この点
に着目して、本発明ではポストフィルタ内のピッチフィ
ルタに与えるピッチ周期の分析範囲を符号化データによ
り表現できるピッチ周波の範囲すなわち適応符号帳のピ
ッチ周期探索範囲より十分広く設定する。
Since the post-filter performs processing on the decoded speech signal, the analysis range of the pitch period given to the pitch filter in the post-filter is an adaptive codebook limited by the number of bits of the encoded data. Unlike the pitch period search range, the pitch period can be set freely. Focusing on this point, in the present invention, the analysis range of the pitch cycle applied to the pitch filter in the post filter is set to be sufficiently wider than the range of the pitch frequency that can be represented by the encoded data, that is, the pitch cycle search range of the adaptive codebook.

【0016】このようにすると、適応符号帳のピッチ周
期探索範囲で表すことのできないピッチ周期を持つ復号
音声信号がポストフィルタに与えられたとしても、復号
音声信号のピッチ周期が求められれば、そのピッチ周期
を基にピッチ周期成分の強調を行い、伝送され得なかっ
たピッチ周期成分を復元して品質の改善を図ることがで
きる。
In this way, even if a decoded speech signal having a pitch period that cannot be represented by the pitch period search range of the adaptive codebook is given to the post-filter, if the pitch period of the decoded speech signal is obtained, the The pitch cycle component is emphasized based on the pitch cycle, and the pitch cycle component that could not be transmitted can be restored to improve the quality.

【0017】[0017]

【発明の実施の形態】まず、本発明による音声符号化方
法の実施形態について説明する。図1は、本発明の一実
施形態に係る音声符号化方法に用いる聴感重みフィルタ
の基本動作を説明するためのブロック図である。同図に
おいて、入力端子101からディジタル化された音声信
号(入力音声信号)が複数サンプルを1フレームとして
フレーム単位で順次入力される。本実施形態では、1フ
レームを80サンプルとする。この入力音声信号は、L
PC係数分析部102、ピッチ情報分析部103および
聴感重みフィルタ104に与えられる。
DESCRIPTION OF THE PREFERRED EMBODIMENTS First, an embodiment of a speech encoding method according to the present invention will be described. FIG. 1 is a block diagram for explaining a basic operation of an audibility weighting filter used in a speech encoding method according to an embodiment of the present invention. In FIG. 1, a digitized audio signal (input audio signal) is sequentially input from an input terminal 101 in frame units with a plurality of samples as one frame. In this embodiment, one frame has 80 samples. This input audio signal is L
It is provided to the PC coefficient analysis unit 102, the pitch information analysis unit 103, and the audibility weight filter 104.

【0018】LPC係数分析部102では、例えば自己
相関法などの既存の技術を用いて入力音声信号をフレー
ム単位で分析し、LPC係数{α(i);i=1〜N
P}を求める。このLPC分析に際しては、入力音声信
号の分析対象フレームを中心として安定した分析結果を
得るのに十分な長さのデータを用いる必要がある。NP
は分析次数を表し、ここではNP=10とする。こうし
て求められたLPC係数{α(i);i=1〜NP}
は、ピッチ情報分析部103および聴感重みフィルタ1
04に与えられる。
The LPC coefficient analysis unit 102 analyzes the input speech signal on a frame-by-frame basis using an existing technique such as the autocorrelation method, and calculates the LPC coefficient {α (i); i = 1 to N
Find P}. In this LPC analysis, it is necessary to use data having a length sufficient to obtain a stable analysis result centering on the analysis target frame of the input audio signal. NP
Represents the analysis order, and NP = 10 here. LPC coefficient {α (i) thus obtained; i = 1 to NP}
Is the pitch information analysis unit 103 and the perceptual weight filter 1
04.

【0019】ピッチ情報分析部103では、例えば後述
のように入力音声信号をフレーム単位で分析してピッチ
周期TWおよびピッチフィルタ係数gを求める。このピ
ッチ情報分析部103の詳細については、図2を用いて
後述する。
The pitch information analysis unit 103 analyzes the input speech signal on a frame basis, for example, as described later, and obtains a pitch period TW and a pitch filter coefficient g. The details of the pitch information analysis unit 103 will be described later with reference to FIG.

【0020】聴感重みフィルタ104は、量子化雑音の
スペクトルを入力音声信号のスペクトルに近くなるよう
に整形するフィルタであり、音声のスペクトル包絡に対
応するLPC合成フィルタと、音声のスペクトル微細構
造に対応し、入力音声信号のピッチ周期成分を抑圧する
機能を有するピッチフィルタとにより構成される。具体
的には、聴感重みフィルタ104はLPC係数分析部1
02から得られるLPC係数{α(i);i=1〜N
P}およびピッチ情報分析部103から得られるピッチ
周期TWおよびピッチフィルタ係数gをもとに、(1)
式で規定される伝達関数W(z)のフィルタを構成し
て、フレーム単位で入力される入力音声信号に対してフ
ィルタリングを行い、重みつき入力音声信号を出力端子
105へ出力する。
The audibility weighting filter 104 is a filter for shaping the spectrum of the quantization noise so as to be close to the spectrum of the input voice signal, and corresponds to an LPC synthesis filter corresponding to the voice spectrum envelope and a voice spectrum fine structure. And a pitch filter having a function of suppressing a pitch cycle component of the input audio signal. Specifically, the audibility weighting filter 104 is the LPC coefficient analysis unit 1
LPC coefficient {α (i) obtained from Eq. 02
Based on P} and pitch cycle TW and pitch filter coefficient g obtained from pitch information analysis section 103, (1)
A filter having a transfer function W (z) defined by the equation is configured to perform filtering on an input audio signal input in frame units, and output a weighted input audio signal to an output terminal 105.

【0021】[0021]

【数1】 (Equation 1)

【0022】A(z/β)/A(z/γ)が音声のスペ
クトル包絡に対応する聴感重みフィルタに相当し、Q
(z)が音声のスペクトル微細構造に対応する聴感重み
フィルタに相当する。ここで、各パラメータの具体的な
数値として、本発明者らはβ=0.9,γ=0.4,λ
=0.4を推奨する。ただし、これらパラメータの値は
主観的な好みに依存するので、これら数値が必ずしも最
適というわけではない。入力音声信号を(1)式で規定
される伝達関数W(z)の聴感重みフィルタ104に通
して得られる重み付き入力音声信号は、出力端子105
より出力される。
A (z / β) / A (z / γ) corresponds to an audibility weighting filter corresponding to the spectral envelope of speech, and
(Z) corresponds to an audibility weighting filter corresponding to the spectral fine structure of the voice. Here, as specific numerical values of each parameter, the present inventors have β = 0.9, γ = 0.4, λ
= 0.4 is recommended. However, since the values of these parameters depend on subjective preferences, these values are not always optimal. A weighted input audio signal obtained by passing the input audio signal through an audibility weighting filter 104 having a transfer function W (z) defined by equation (1) is output from an output terminal 105.
Output.

【0023】次に、図2を参照してピッチ情報分析部1
03について説明する。図2において、入力端子301
からは入力音声信号が、また入力端子302からはLP
C係数{α(i);i=1〜NP}がそれぞれ入力さ
れ、予測残差信号計算部303に与えられる。予測残差
信号計算部303では、LPC係数分析部102と同様
に入力音声信号の分析対象フレームを中心として安定し
た分析結果を得るのに十分な長さのデータを用いて分析
を行う。予測残差信号計算部303では、分析に用いる
入力音声信号のデータを{u(n);n=0〜NU−
1}と表すと、LPC係数{α(i);i=1〜NP}
を用いてデータu(n)についての予測残差信号{e
(n);n=0〜NU−1}を次式に従い求める。
Next, referring to FIG.
03 will be described. In FIG. 2, an input terminal 301
From the input audio signal, from the input terminal 302 LP
The C coefficient {α (i); i = 1 to NP} is input and provided to the prediction residual signal calculation unit 303. The prediction residual signal calculation unit 303 performs analysis using data having a length sufficient to obtain a stable analysis result centering on the analysis target frame of the input speech signal, similarly to the LPC coefficient analysis unit 102. The prediction residual signal calculation unit 303 converts the data of the input speech signal used for analysis into {u (n); n = 0 to NU−
1}, LPC coefficient {α (i); i = 1 to NP}
And the prediction residual signal {e for the data u (n)
(N); n = 0 to NU-1} is obtained according to the following equation.

【0024】[0024]

【数2】 (Equation 2)

【0025】このようにして求められた予測残差信号
{e(n);n=0〜NU−1}は、ピッチ周期分析部
304に与えられる。ピッチ周期分析部304では、予
測残差信号{e(n);n=0〜NU−1}にハミング
窓を乗じた信号{ew(n);n=0〜NU−1}を基
に、(6)式で規定される自己相関値φ(t)をピッチ
周期分析範囲{TWL≦t≦TWH}において算出す
る。
The prediction residual signal {e (n); n = 0 to NU-1} obtained in this manner is supplied to the pitch period analyzer 304. The pitch cycle analysis unit 304 calculates a signal {ew (n) obtained by multiplying the prediction residual signal {e (n); n = 0 to NU-1} by a Hamming window, n = 0 to NU-1}. The autocorrelation value φ (t) defined by the equation (6) is calculated in the pitch period analysis range {TWL ≦ t ≦ TWH}.

【0026】[0026]

【数3】 (Equation 3)

【0027】ここで、本実施形態ではピッチ周期分析範
囲の下限TWLおよび上限TWHを例えばTWL=10
およびTWH=200と設定する。一方、図1には示さ
れていないピッチ周期の符号化手段(例えば後述する適
応符号帳)のピッチ周期探索範囲{TLL≦TL≦TL
H}の下限TLLおよび上限TLHは、例えばTLL=
20、TLH=147とする。すなわち、TLL>TW
L,TLH<TWHであり、ピッチ周期分析範囲をピッ
チ周期探索範囲より広くしていることに特徴がある。
In this embodiment, the lower limit TWL and the upper limit TWH of the pitch period analysis range are set to, for example, TWL = 10
And TWH = 200. On the other hand, a pitch period search range {TLL ≦ TL ≦ TL of a pitch period encoding means (for example, an adaptive codebook described later) not shown in FIG.
The lower limit TLL and the upper limit TLH of H} are, for example, TLL =
20, TLH = 147. That is, TLL> TW
L, TLH <TWH, and the characteristic is that the pitch cycle analysis range is wider than the pitch cycle search range.

【0028】このようにして求めた自己相関値φ(t)
が最大となるときのtがピッチ周期TWとしてピッチフ
ィルタ係数分析部305に与えられる。ピッチフィルタ
係数分析部305では、予測残差信号計算部303で求
められた予測残差信号{e(n);n=0〜NU−1}
とピッチ周期分析部304で求められたピッチ周期TW
を用いて、次式に従いピッチフィルタ係数gを算出す
る。
The autocorrelation value φ (t) thus obtained
Is given to the pitch filter coefficient analysis unit 305 as the pitch period TW. In pitch filter coefficient analysis section 305, prediction residual signal {e (n); n = 0 to NU-1} obtained in prediction residual signal calculation section 303.
And pitch cycle TW obtained by pitch cycle analysis section 304
Is used to calculate the pitch filter coefficient g according to the following equation.

【0029】[0029]

【数4】 (Equation 4)

【0030】このようにして求められピッチ周期TWお
よびピッチフィルタ係数gが出力端子306より出力さ
れる。なお、ここでは1次のピッチフィルタを用いた場
合について説明を行ったが、さらに高次のピッチフィル
タを用いて実現しても良い。その場合には、計算量が多
少増加するが、より正確なピッチ情報を得ることができ
る。また、ピッチ周期分析法およびピッチフィルタ係数
分析法は前述した方法に限定されるわけではなく、他の
技術を用いても良い。
The pitch period TW and the pitch filter coefficient g thus obtained are output from the output terminal 306. Here, the case where the first-order pitch filter is used has been described, but it may be realized by using a higher-order pitch filter. In this case, although the amount of calculation slightly increases, more accurate pitch information can be obtained. Further, the pitch period analysis method and the pitch filter coefficient analysis method are not limited to the methods described above, and other techniques may be used.

【0031】以上の処理をまとめると、図3に示される
フローチャートのようになる。まず最初に、ステップS
11でLPC係数{α(i);i=1〜NP}を求め、
次にステップS12で予測残差信号{e(n);n=0
〜NU−1}を求める。ステップS13でピッチ周期T
Wを分析し、次にステップS14でピッチ周期TWにお
けるピッチフィルタ係数gを求める。ステップS15で
は、ステップS11、ステップS13およびステップS
14で求めたLPC係数{α(i);i=1〜NP}、
ピッチ周期TWおよびピッチフィルタ係数gを用いて
(1)式で規定される聴感重みフィルタを構成し、ステ
ップS16で入力音声信号を聴感重みフィルタに通して
重み付き入力音声信号を生成して出力する。
The above processing is summarized as a flowchart shown in FIG. First, step S
At 11, the LPC coefficient {α (i); i = 1 to NP} is obtained,
Next, in step S12, the prediction residual signal {e (n); n = 0
~ NU-1}. In step S13, the pitch period T
W is analyzed, and then a pitch filter coefficient g in the pitch cycle TW is obtained in step S14. In step S15, steps S11, S13 and S
14, the LPC coefficient {α (i); i = 1 to NP},
Using the pitch period TW and the pitch filter coefficient g, a perceptual weight filter defined by the expression (1) is formed, and in step S16, the input voice signal is passed through the perceptual weight filter to generate and output a weighted input voice signal. .

【0032】次に、図4を参照して上述した聴感重みフ
ィルタを用いたCELP方式による音声符号化装置につ
いて説明する。図4において、図1と同一の構成要素に
は同一の参照符号を付して詳細な説明を省略する。
Next, a description will be given of a speech coding apparatus based on the CELP system using the above-described perceptual weighting filter with reference to FIG. In FIG. 4, the same components as those in FIG. 1 are denoted by the same reference numerals, and detailed description will be omitted.

【0033】まず、LPC係数分析部102より出力さ
れるLPC係数{α(i);i=1〜NP}はLPC係
数量子化部106に与えられ、量子化される。重み付き
合成フィルタ107では、LPC係数分析部102から
LPC係数{α(i);i=1〜NP}の情報、ピッチ
情報分析部103からピッチ周期TWとピッチフィルタ
係数gの情報、LPC係数量子化部106から量子化さ
れたLPC係数{αq(i);i=1〜NP}の情報を
それぞれ受取ることにより、Hw(z)なる伝達関数の
フィルタを構成する。この重み付き合成フィルタ107
の伝達関数Hw(z)は、次式で表される。
First, LPC coefficients {α (i); i = 1 to NP} output from LPC coefficient analysis section 102 are provided to LPC coefficient quantization section 106 and quantized. In the weighted synthesis filter 107, information of the LPC coefficient {α (i); i = 1 to NP} from the LPC coefficient analysis unit 102, information of the pitch period TW and pitch filter coefficient g from the pitch information analysis unit 103, LPC coefficient quantum By receiving the information of the quantized LPC coefficient {αq (i); i = 1 to NP} from the conversion unit 106, a filter having a transfer function of Hw (z) is configured. This weighted synthesis filter 107
Is represented by the following equation.

【0034】 Hw(z)=W(z)・H(z) (8) ここで、聴感重みフィルタ104の伝達関数W(z)
は、先に示した(1)式と同じである。また、合成フィ
ルタH(z)は次式で表される。
Hw (z) = W (z) · H (z) (8) Here, the transfer function W (z) of the audibility weighting filter 104
Is the same as equation (1) shown above. The synthesis filter H (z) is expressed by the following equation.

【0035】[0035]

【数5】 (Equation 5)

【0036】重み付き合成フィルタ107に与えられる
駆動信号は、適応符号帳108、適応ベクトルゲイン符
号帳113、雑音符号帳109および雑音ベクトルゲイ
ン符号帳111の各候補の組み合わせで表現される。
The drive signal applied to the weighted synthesis filter 107 is represented by a combination of each of the adaptive codebook 108, adaptive vector gain codebook 113, noise codebook 109, and noise vector gain codebook 111.

【0037】適応符号帳108は、直前の駆動信号系列
を常に保持しており、この駆動信号系列を所望のピッチ
周期で繰り返して適応ベクトルを生成し、周期性を効率
よく表現する。ただし、このピッチ周期はマルチプレク
サを介して伝送されなければならないので、予め決めら
れたビット数で表現できる候補数の範囲内でのみピッチ
周期は探索される。本実施形態では、適応符号帳108
によるピッチ周期探索範囲{TLL≦TL≦TLH}を
TLL=20、TLH=147として説明を行う。
The adaptive codebook 108 always holds the immediately preceding drive signal sequence, generates an adaptive vector by repeating this drive signal sequence at a desired pitch cycle, and efficiently expresses the periodicity. However, since this pitch period must be transmitted via the multiplexer, the pitch period is searched only within the range of the number of candidates that can be represented by a predetermined number of bits. In the present embodiment, the adaptive codebook 108
, The pitch period search range {TLL ≦ TL ≦ TLH} is set as TLL = 20 and TLH = 147.

【0038】雑音符号帳109は、雑音系列を候補ベク
トルとして持つ符号帳である。一般に、雑音符号帳10
9は計算量削減や品質改善のために構造化が図られる
が、本発明の要旨とは特に関係がないので、説明は省略
する。
The noise codebook 109 is a codebook having a noise sequence as a candidate vector. Generally, the random codebook 10
9 is structured in order to reduce the amount of calculation and improve the quality, but is not particularly related to the gist of the present invention, so that the description is omitted.

【0039】適応符号帳108および適応ベクトルゲイ
ン符号帳113から適応ベクトルおよび適応ベクトルゲ
インがそれぞれ選択され、これらが乗算器110で掛け
合わされる。同様に、雑音符号帳109および雑音ベク
トルゲイン符号帳114から適応ベクトルおよび雑音ベ
クトルゲインがそれぞれ選択され、乗算器111で掛け
合わされる。そして、加算器112で乗算器110,1
11の出力のベクトル同士が加算されることにより駆動
信号が生成され、重み付き合成フィルタ107に入力と
して与えられる。
An adaptive vector and an adaptive vector gain are selected from adaptive codebook 108 and adaptive vector gain codebook 113, respectively, and are multiplied by multiplier 110. Similarly, an adaptive vector and a noise vector gain are selected from the noise codebook 109 and the noise vector gain codebook 114, respectively, and are multiplied by the multiplier 111. Then, the adders 112, 1
A drive signal is generated by adding the vectors of the 11 outputs to each other, and is provided to the weighted synthesis filter 107 as an input.

【0040】聴感重みフィルタ104の出力信号を目標
信号として、重み付き合成フィルタ107の出力信号の
誤差が減算器115でとられ、さらに最小歪探索部11
6で2乗歪が算出される。最小歪探索部116は、適応
符号帳108、適応ベクトルゲイン符号帳113、雑音
符号帳109および雑音ベクトルゲイン符号帳111に
対して、2乗歪が最小となる適応ベクトル、適応ベクト
ルゲイン、雑音ベクトルおよび雑音ベクトルゲインの組
み合わせを効率よく探索し、2乗歪が最小となるときの
適応ベクトル、適応ベクトルゲイン、雑音ベクトルおよ
び雑音ベクトルゲインの各候補のインデックス情報をマ
ルチプレクサ117に与える。
Using the output signal of the perceptual weighting filter 104 as a target signal, the error of the output signal of the weighted synthesis filter 107 is obtained by a subtractor 115, and further, the minimum distortion search unit 11
6, the square distortion is calculated. The minimum distortion search unit 116 calculates an adaptive vector, an adaptive vector gain, and a noise vector that minimize the square distortion with respect to the adaptive codebook 108, the adaptive vector gain codebook 113, the noise codebook 109, and the noise vector gain codebook 111. And a combination of the noise vector gain and the adaptive vector when the square distortion is minimized, the adaptive vector gain, the noise vector, and index information of each candidate of the noise vector gain are provided to the multiplexer 117.

【0041】一方、LPC係数量子化部106でLPC
係数を量子化した結果得られるインデックス情報がマル
チプレクサ117に与えられる。マルチプレクサ117
は、LPC係数量子化部106および最小歪探索部11
6より入力されたインデックス情報を符号化データとし
てビットストリームに変換し、出力端子118へ出力す
る。最後に、最小歪探索部116で算出される2乗歪が
最小となるときの駆動信号を適応符号帳108に与えて
内部状態を更新し、次フレームの入力音声信号に備え
る。
On the other hand, the LPC coefficient quantization section 106
Index information obtained as a result of quantizing the coefficients is supplied to the multiplexer 117. Multiplexer 117
Are the LPC coefficient quantization unit 106 and the minimum distortion search unit 11
6 is converted into a bit stream as encoded data and output to an output terminal 118. Finally, a drive signal when the square distortion calculated by the minimum distortion search unit 116 is minimized is given to the adaptive codebook 108 to update the internal state, and prepare for the input speech signal of the next frame.

【0042】このように本実施形態では、聴感重みフィ
ルタ104および重み付き合成フィルタ107で用いら
れるピッチ情報分析部103のピッチ周期分析範囲{T
WL≦TW≦TWH}と、重みつき合成フィルタ107
に与える駆動信号の周期性を表し、マルチプレクサ11
7を介して符号化され出力端子118より出力されるピ
ッチ周期の符号化データ(適応ベクトルインデックスの
符号化データ)で表現される適応符号帳108のピッチ
周期探索範囲{TLL≦TL≦TLH}の関係がTWL
<TLLおよびTWH>TLHの条件を満足している。
すなわち、ピッチ周期分析範囲{TWL≦TW≦TW
H}をピッチ周期探索範囲{TLL≦TL≦TLH}よ
りも広く設定している。
As described above, in the present embodiment, the pitch period analysis range ΔT of the pitch information analysis unit 103 used in the audibility weighting filter 104 and the weighted synthesis filter 107.
WL ≦ TW ≦ TWH} and the weighted synthesis filter 107
Represents the periodicity of the drive signal applied to the
Of the pitch period search range {TLL ≦ TL ≦ TLH} of the adaptive codebook 108 represented by encoded data of the pitch period (encoded data of the adaptive vector index) which is encoded via the output terminal 7 and output from the output terminal 118 Relationship is TWL
<TLL and TWH> The condition of TLH is satisfied.
That is, pitch cycle analysis range {TWL ≦ TW ≦ TW
H} is set wider than the pitch period search range {TLL ≦ TL ≦ TLH}.

【0043】このような条件を満足することにより、予
め定められたビット数で表現されなければならない適応
符号帳108のピッチ周期探索範囲{TLL≦TL≦T
LH}から外れたピッチ周期を有する入力音声信号が与
えられても、聴感重みフィルタ104および重み付き合
成フィルタ107内のピッチフィルタの分析範囲{TW
L≦TW≦TWH}が適応符号帳108のピッチ周期探
索範囲より広いために、入力音声信号のピッチ周期で量
子化雑音のスペクトル整形を行い、マスキング効果によ
って雑音感の低減を図ることができる。その結果、主観
品質を効果的に向上させることができる。
By satisfying such a condition, the pitch period search range of the adaptive codebook 108 which must be represented by a predetermined number of bits {TLL ≦ TL ≦ T
Even if an input speech signal having a pitch cycle deviating from LH is given, the analysis range of the pitch filter in the audibility weighting filter 104 and the weighted synthesis filter 107 {TW
Since L ≦ TW ≦ TWH} is wider than the pitch period search range of the adaptive codebook 108, the spectrum of the quantization noise can be shaped at the pitch period of the input speech signal, and the noise effect can be reduced by the masking effect. As a result, the subjective quality can be effectively improved.

【0044】なお、本実施形態ではピッチ周期分析範囲
{TWL≦TW≦TWH}をピッチ周期探索範囲{TL
L≦TL≦TLH}との関係がTLL>TWLおよびT
LH<TWHの条件を満足しているが、TLL>TWL
およびTLH<TWHのいずれか一方の条件のみを満足
するようにしてもよい。
In this embodiment, the pitch period analysis range {TWL ≦ TW ≦ TWH} is changed to the pitch period search range {TL
The relationship with L ≦ TL ≦ TLH} is TLL> TWL and T
Although the condition of LH <TWH is satisfied, TLL> TWL
Alternatively, only one of the following conditions may be satisfied: TLH <TWH.

【0045】次に、本発明による音声復号化方法の実施
形態について説明する。図5は、本発明の一実施形態に
係る音声復号化方法に用いるポストフィルタの基本動作
を説明するためのブロック図である。同図において、入
力端子201からディジタル化された音声信号(例えば
復号音声信号)が複数サンプルを1フレームとしてフレ
ーム単位で順次入力される。本実施形態では、1フレー
ムを80サンプルとして説明する。
Next, an embodiment of a speech decoding method according to the present invention will be described. FIG. 5 is a block diagram for explaining a basic operation of the post filter used in the speech decoding method according to one embodiment of the present invention. In the figure, a digitized audio signal (for example, a decoded audio signal) is sequentially input from an input terminal 201 in frame units with a plurality of samples as one frame. In this embodiment, one frame is described as 80 samples.

【0046】一方、入力端子202からは、入力端子2
01からの音声信号のLPC予測残差信号もしくはそれ
に準じる信号、例えば後述するCELP方式の音声復号
化装置における合成フィルタを駆動する駆動信号が入力
される。ピッチ情報分析部203では、LPC予測残差
信号または合成フィルタの駆動信号を用いてピッチ周期
を求める。ピッチ情報分析部203の詳細については後
述する。
On the other hand, from the input terminal 202, the input terminal 2
The LPC prediction residual signal of the audio signal from S01 or a signal similar thereto, for example, a drive signal for driving a synthesis filter in a CELP-type audio decoding device described later. The pitch information analysis unit 203 obtains a pitch cycle using the LPC prediction residual signal or the driving signal of the synthesis filter. Details of the pitch information analysis unit 203 will be described later.

【0047】ポストフィルタ205には、入力端子20
1から例えば復号音声信号が与えられ、ピッチ情報分析
部203からピッチ周期TPおよびピッチフィルタ係数
gの情報が与えられ、入力端子204からLPC係数
{α(i);i=1〜NP}の情報が与えられる。LP
C係数は、入力端子201からの音声信号のスペクトル
包絡を表している。ポストフィルタ205は、これらピ
ッチ周期TPおよびLPC係数{α(i);i=1〜N
P}の情報を用いて次式の伝達関数R(z)で表される
フィルタを構成し、入力端子201からの音声信号にフ
ィルタリング処理を施す。フィルタリングされた出力信
号は、出力端子206より出力される。 R(z)=F(z)・P(z)・U(z) (10) F(z),P(z),B(z)は、以下のように表され
る。
The post filter 205 has an input terminal 20
For example, a decoded speech signal is given from 1; information on a pitch period TP and a pitch filter coefficient g is given from a pitch information analyzer 203; and information on LPC coefficients {α (i); i = 1 to NP} from an input terminal 204. Is given. LP
The C coefficient represents the spectrum envelope of the audio signal from the input terminal 201. The post filter 205 determines the pitch period TP and the LPC coefficient {α (i); i = 1 to N
A filter represented by the following transfer function R (z) is configured using the information of P}, and the audio signal from the input terminal 201 is subjected to filtering processing. The filtered output signal is output from output terminal 206. R (z) = F (z) · P (z) · U (z) (10) F (z), P (z) and B (z) are expressed as follows.

【0048】[0048]

【数6】 (Equation 6)

【0049】ここで、各パラメータの具体的に数値とし
て、本発明者らはν=0.5,ξ=0.8,η=0.
7,μ=0.4を推奨する。これらパラメータの値は、
主観的な好みに依存するので、これらの数値が必ずしも
最適というわけではない。
Here, as specific numerical values of each parameter, the present inventors have ν = 0.5, ξ = 0.8, η = 0.
7, μ = 0.4 is recommended. The values of these parameters are
These numbers are not always optimal, as they depend on subjective preferences.

【0050】次に、図6を参照して本実施形態における
ピッチ情報分析部203について説明する。図6におい
て、図2と同一の構成要素には同一の参照番号を付し
て、説明を省略する。
Next, the pitch information analyzer 203 in the present embodiment will be described with reference to FIG. 6, the same components as those in FIG. 2 are denoted by the same reference numerals, and description thereof will be omitted.

【0051】図6に示されるピッチ情報分析部203
と、先の実施形態における図2に示されるピッチ情報分
析部103の違いは、入力される信号にある。すなわ
ち、図6におけるピッチ情報分析部203には、予測残
差信号、もしくはそれに準じる信号、例えば図示しない
音声復号化装置で生成される駆動信号が入力される。こ
のため、ピッチ情報分析部203には図2におけるピッ
チ情報分析部103のように入力音声信号やLPC係数
を入力する必要はなく、よって予測残差信号計算部30
3も必要ない。図6におけるピッチ情報分析部203
は、ピッチ周期分析部304で求められたピッチ周期T
Pおよびピッチフィルタ係数分析部305で求められた
ピッチフィルタ係数gの情報を出力端子308から出力
する。
The pitch information analyzer 203 shown in FIG.
The difference between the first embodiment and the pitch information analyzer 103 shown in FIG. 2 in the previous embodiment lies in the input signal. That is, the prediction residual signal or a signal equivalent thereto, for example, a drive signal generated by a speech decoding device (not shown) is input to the pitch information analysis unit 203 in FIG. Therefore, it is not necessary to input the input speech signal and the LPC coefficient to the pitch information analysis unit 203 as in the case of the pitch information analysis unit 103 in FIG.
No three is needed. Pitch information analyzer 203 in FIG.
Is the pitch period T obtained by the pitch period analysis unit 304
Information about P and the pitch filter coefficient g obtained by the pitch filter coefficient analysis unit 305 is output from an output terminal 308.

【0052】ここで、ピッチ情報分析部203内のピッ
チ周期分析部304におけるピッチ周期TPの分析範囲
{TPL≦TP≦TPH}の下限TPLおよび上限TP
Hは、例えばTPL=10およびTPH=200と設定
する。一方、ピッチ周期の符号化手段(例えば適応符号
帳)のピッチ周期探索範囲{TLL≦TL≦TLH}の
下限TLLおよび上限TLHは、TLL=20、TLH
=147である。すなわち、TLL>TPL,TPH>
TLHであり、ピッチ周期分析範囲をピッチ周期探索範
囲より広くしていることが特徴である。
Here, the lower limit TPL and the upper limit TP of the analysis range {TPL ≦ TP ≦ TPH} of the pitch cycle TP in the pitch cycle analysis section 304 in the pitch information analysis section 203.
H is set to, for example, TPL = 10 and TPH = 200. On the other hand, the lower limit TLL and the upper limit TLH of the pitch period search range {TLL ≦ TL ≦ TLH} of the pitch period encoding means (for example, an adaptive codebook) are TLL = 20, TLH
= 147. That is, TLL> TPL, TPH>
TLH, which is characterized in that the pitch cycle analysis range is wider than the pitch cycle search range.

【0053】以上の処理をまとめると、図7に示される
フローチャートのようになる。まず最初に、ステップS
21でピッチ周期TPを分析し、次にステップS22で
ピッチ周期TPにおけるピッチフィルタ係数gを求め
る。ステップS23では、ステップS21とステップS
22で求めたピッチ周期TPおよびピッチフィルタ係数
gおよび入力端子204より入力されるLPC係数を用
いて(10)式で規定されるポストフィルタを構成し、
ステップS24で入力端子201より入力される音声信
号をポストフィルタに通して出力する。
The above processing is summarized as a flowchart shown in FIG. First, step S
At 21 the pitch cycle TP is analyzed, and then at step S22 a pitch filter coefficient g at the pitch cycle TP is determined. In step S23, steps S21 and S
A post filter defined by equation (10) is configured using the pitch period TP and pitch filter coefficient g obtained in step 22 and the LPC coefficient input from the input terminal 204,
In step S24, the audio signal input from the input terminal 201 is output through a post filter.

【0054】次に、図8を参照して上述したポストフィ
ルタを用いたCELP方式による音声復号化装置につい
て説明する。図8において、図5と同一の構成要素には
同一の参照符号を付して詳細な説明を省略する。
Next, a speech decoding apparatus based on the CELP system using the above-described post filter will be described with reference to FIG. 8, the same components as those in FIG. 5 are denoted by the same reference numerals, and detailed description will be omitted.

【0055】図8において、入力端子401には図示し
ないCELP方式による音声符号化装置から出力される
符号化データであるビットストリームが図示しない伝送
路または蓄積媒体を介して入力される。音声符号化装置
は、例えば図4に示したように構成される。デマルチプ
レクサ402では、入力されるビットストリームから音
声信号を生成するために必要なパラメータを復号する。
これらのパラメータの種類や個数は、音声符号化装置の
構成に依存して変わってくるが、ここではLPC係数イ
ンデックス、適応ベクトルインデックス、適応ベクトル
ゲインインデックス、雑音ベクトルインデックスおよび
雑音ベクトルゲインインデックスがパラメータとして復
号されるものとする。
In FIG. 8, a bit stream which is coded data output from a speech coding apparatus based on a CELP system (not shown) is input to an input terminal 401 via a transmission path or a storage medium (not shown). The speech encoding device is configured, for example, as shown in FIG. The demultiplexer 402 decodes parameters necessary for generating an audio signal from the input bit stream.
The type and number of these parameters vary depending on the configuration of the speech coding apparatus. Here, the LPC coefficient index, the adaptive vector index, the adaptive vector gain index, the noise vector index, and the noise vector gain index are used as parameters. It shall be decrypted.

【0056】適応符号帳403および適応ベクトルゲイ
ン符号帳404から、適応ベクトルインデックスおよび
適応ベクトルゲインインデックスでそれぞれ指定される
適応ベクトルおよび適応ベクトルゲインが選択され、こ
れらが乗算器405で掛け合わされる。同様に、雑音符
号帳406および雑音ベクトルゲイン符号帳407か
ら、雑音ベクトルインデックスおよび雑音ベクトルゲイ
ンインデックスでそれぞれ指定される雑音ベクトルおよ
び雑音ベクトルゲインが選択され、これらが乗算器40
8で掛け合わされる。
An adaptive vector and an adaptive vector gain specified by an adaptive vector index and an adaptive vector gain index are selected from the adaptive codebook 403 and the adaptive vector gain codebook 404, and are multiplied by a multiplier 405. Similarly, a noise vector and a noise vector gain specified by the noise vector index and the noise vector gain index are selected from the noise codebook 406 and the noise vector gain codebook 407, and these are selected by the multiplier 40.
Multiplied by eight.

【0057】そして、加算器409により乗算器40
5,408から出力されるベクトルの和がとられて駆動
信号が生成され、この駆動信号が合成フィルタ411お
よびピッチ情報分析部203に与えられる。また、この
駆動信号は適応符号帳403にも与えられて内部状態の
更新が行われ、次の入力に備える。
Then, the adder 409 causes the multiplier 40
The drive signal is generated by summing the vectors output from 5,408, and the drive signal is provided to the synthesis filter 411 and the pitch information analyzer 203. This drive signal is also given to the adaptive codebook 403 to update the internal state and prepare for the next input.

【0058】一方、LPC係数インデックスがLPC係
数復号部410に与えられることにより、LPC係数
{αq(i);i=1〜NP}が復号され、このLPC
係数は合成フィルタ411およびポストフィルタ205
に与えられる。合成フィルタ411の伝達関数は(9)
式と同様に表わされ、この合成フィルタ411に加算器
409からの駆動信号が入力されることによりフィルタ
リングが行われ、復号音声信号が得られる。この復号音
声信号は、ポストフィルタ205に入力される。
On the other hand, when the LPC coefficient index is given to LPC coefficient decoding section 410, LPC coefficient {αq (i); i = 1 to NP} is decoded.
The coefficients are calculated by the synthesis filter 411 and the post filter 205.
Given to. The transfer function of the synthesis filter 411 is (9)
This is expressed in the same manner as in the expression, and filtering is performed by inputting a drive signal from the adder 409 to the synthesis filter 411, so that a decoded speech signal is obtained. This decoded audio signal is input to the post filter 205.

【0059】ポストフィルタ205およびピッチ情報分
析部203は図5〜図7で説明した通りであるので、こ
こでは詳細な説明を省略する。本実施形態では、ポスト
フィルタ205には合成フィルタ411から出力される
復号音声信号が入力され、ピッチ情報分析部203には
加算器409から出力される駆動信号が入力される。本
実施形態の音声復号化装置では、ポストフィルタ205
を通った復号音声信号が最終的に出力端子206より出
力される。
The post filter 205 and the pitch information analyzer 203 are as described with reference to FIGS. 5 to 7, and a detailed description thereof will be omitted. In the present embodiment, the decoded voice signal output from the synthesis filter 411 is input to the post filter 205, and the drive signal output from the adder 409 is input to the pitch information analysis unit 203. In the audio decoding device of the present embodiment, the post filter 205
The decoded audio signal passed through is finally output from the output terminal 206.

【0060】このように本実施形態では、ポストフィル
タ205で用いられるピッチ情報を分析するピッチ情報
分析部203におけるピッチ周期分析範囲{TPL≦T
P≦TPH}と、合成フィルタ411に与えられる駆動
信号の周期性を表し、デマルチプレクサ402を介して
復号され適応符号帳403で用いられる適応ベクトルイ
ンデックスにより指定されるピッチ周期(TL)のとり
得る範囲{TLL≦TL≦TLH}の関係がTPL<T
LLおよびTPH>TLHの条件を満足している。すな
わち、ピッチ周期分析範囲{TPL≦TP≦TPH}を
ピッチ周期の符号化データ(適応ベクトルインデックス
の符号化データ)により表現できるピッチ周期の範囲
{TLL≦TL≦TLH}よりも広く設定している。
As described above, in the present embodiment, the pitch period analysis range ΔTPL ≦ T in the pitch information analysis unit 203 for analyzing the pitch information used in the post filter 205
P ≦ TPH}, which represents the periodicity of the drive signal supplied to the synthesis filter 411, and can be a pitch period (TL) specified by the adaptive vector index used by the adaptive codebook 403 after being decoded via the demultiplexer 402. When the relationship of the range {TLL ≦ TL ≦ TLH} is TPL <T
LL and TPH> TLH are satisfied. That is, the pitch cycle analysis range {TPL ≦ TP ≦ TPH} is set wider than the pitch cycle range {TLL ≦ TL ≦ TLH} that can be expressed by encoded data of the pitch cycle (encoded data of the adaptive vector index). .

【0061】このような条件を満足することにより、予
め定められたビット数で表現されなければならない適応
符号帳403のピッチ周期探索範囲{TLL≦TL≦T
LH}から外れたピッチ周期を有する復号音声信号がポ
ストフィルタ205に入力されたとしても、ポストフィ
ルタ205で用いられるピッチ情報分析部203のピッ
チ分析範囲{TPL≦TP≦TPH}が適応符号帳40
3のピッチ周期探索範囲より広いために、適応ベクトル
インデックスの符号化データとして伝送され得なかった
ピッチ周期を復元することができる。その結果、主観品
質を向上させることができる。
By satisfying such a condition, the pitch period search range of the adaptive codebook 403 which must be represented by a predetermined number of bits {TLL ≦ TL ≦ T
Even if a decoded speech signal having a pitch period deviating from LH is input to the post filter 205, the pitch analysis range {TPL ≦ TP ≦ TPH} of the pitch information analysis unit 203 used in the post filter 205 is determined by the adaptive codebook 40.
Since the pitch period is wider than the pitch period search range of 3, the pitch period that cannot be transmitted as encoded data of the adaptive vector index can be restored. As a result, the subjective quality can be improved.

【0062】なお、本実施形態ではピッチ周期分析範囲
{TPL≦TP≦TPH}を符号化データにより表現で
きるピッチ周期の範囲{TLL≦TL≦TLH}との関
係がTPL<TLLおよびTPH>TLHの条件を満足
しているが、TLL>TPLおよびTLH<TPHのい
ずれか一方の条件のみを満足するようにしてもよい。
In the present embodiment, the relationship with the pitch cycle range {TLL ≦ TL ≦ TLH} in which the pitch cycle analysis range {TPL ≦ TP ≦ TPH} can be represented by encoded data is TPL <TLL and TPH> TLH. Although the condition is satisfied, only one of TLL> TPL and TLH <TPH may be satisfied.

【0063】次に、本発明の他の実施形態を説明する。
図9は、本発明の他の実施形態に係る音声符号化方法に
用いるポストフィルタの基本動作を説明するためのブロ
ック図である。同図において、図5と同一の構成要素に
は同一の参照符号を付して詳細な説明を省略する。
Next, another embodiment of the present invention will be described.
FIG. 9 is a block diagram for explaining a basic operation of a post filter used in a speech encoding method according to another embodiment of the present invention. In the figure, the same components as those of FIG. 5 are denoted by the same reference numerals, and detailed description thereof will be omitted.

【0064】本実施形態と図5の実施形態の違いは、図
示しない音声復号化装置が適応符号帳と予め用意された
固定の候補ベクトルからなる固定符号帳とを同列に有し
ており、かつ適応符号帳が選択された場合と固定符号帳
が選択された場合とでピッチ周期TPの求め方が異なる
点にある。
The difference between this embodiment and the embodiment shown in FIG. 5 is that a speech decoding apparatus (not shown) has an adaptive codebook and a fixed codebook made up of fixed candidate vectors prepared in the same column, and The point that the method of obtaining the pitch period TP is different between the case where the adaptive codebook is selected and the case where the fixed codebook is selected.

【0065】適応符号帳が選択された場合、伝送され復
号された適応符号帳のピッチ周期TLをポストフィルタ
内のピッチフィルタに与えるピッチ周期TPとみなし、
このピッチ周期TPを用いてピッチフィルタ係数gを求
め、ポストフィルタ205に与える。逆に、固定符号帳
が選択された場合、ピッチ情報分析部203で新たにピ
ッチ周期TPを求め、このピッチ周期TPを用いてピッ
チフィルタ係数gを算出してポストフィルタ205に与
える。
When the adaptive codebook is selected, the pitch period TL of the transmitted and decoded adaptive codebook is regarded as a pitch period TP to be applied to the pitch filter in the post filter.
Using this pitch period TP, a pitch filter coefficient g is obtained and given to the post filter 205. Conversely, when the fixed codebook is selected, the pitch information analysis unit 203 newly obtains a pitch cycle TP, calculates a pitch filter coefficient g using the pitch cycle TP, and provides the calculated pitch filter coefficient g to the post filter 205.

【0066】次に、図10を参照して本実施形態におけ
るピッチ情報分析部203について説明する。図10に
おいて、図6と同一の構成要素には同一の参照番号を付
して説明を省略する。
Next, the pitch information analyzer 203 in the present embodiment will be described with reference to FIG. 10, the same components as those in FIG. 6 are denoted by the same reference numerals, and description thereof will be omitted.

【0067】図10において、入力端子211からは図
示しない音声復号化装置において適応符号帳および固定
符号帳のいずれを使用したかを表す選択情報が与えられ
る。この選択情報が適応符号帳を表すとき、スイッチ3
10は入力端子207より入力される適応符号帳のピッ
チ周期TLの情報をポストフィルタで用いられるピッチ
周期TPの情報とみなしてピッチフィルタ係数分析部3
05に与える。一方、入力端子211からの選択情報が
固定符号帳を表すとき、スイッチ310は入力端子20
2からの入力が有効になるよう働く。つまり、入力端子
202から予測残差信号もしくはそれに準じる信号であ
る駆動信号系列が入力され、この信号を基にピッチ周期
分析部304でピッチ周期TPが求められ、ピッチフィ
ルタ係数分析部305に与えられる。このとき、固定符
号帳が選択されたのは適応符号帳のピッチ周期探索範囲
{TLL≦TL≦TLH}で表せないピッチが発生した
ためであると考えることができるので、ピッチ周期分析
部305での分析範囲は適応符号帳のピッチ周期探索範
囲を除いた{TPL≦TP<TLL、TLH<TP≦T
PH}とすることができ、その結果ピッチ周期の分析に
必要な計算量を削減することができる。
In FIG. 10, selection information indicating which of an adaptive codebook and a fixed codebook is used in a speech decoding device (not shown) is provided from an input terminal 211. When this selection information indicates an adaptive codebook, switch 3
Reference numeral 10 denotes a pitch filter coefficient analysis unit 3 which regards information on the pitch period TL of the adaptive codebook input from the input terminal 207 as information on the pitch period TP used in the post filter.
Give to 05. On the other hand, when the selection information from the input terminal 211 indicates a fixed codebook, the switch 310
It works to make the input from 2 valid. That is, a drive signal sequence that is a prediction residual signal or a signal equivalent thereto is input from the input terminal 202, a pitch period TP is obtained by the pitch period analysis unit 304 based on this signal, and is provided to the pitch filter coefficient analysis unit 305. . At this time, the fixed codebook is selected because it can be considered that a pitch that cannot be expressed by the pitch period search range {TLL ≦ TL ≦ TLH} of the adaptive codebook has occurred. The analysis range is {TPL ≦ TP <TLL, TLH <TP ≦ T excluding the pitch period search range of the adaptive codebook.
PH}, and as a result, the amount of calculation required for analyzing the pitch period can be reduced.

【0068】ピッチフィルタ係数分析部305では、与
えられるピッチ周期TPの情報を基に、予測残差信号も
しくはそれに準じる駆動信号系列を用いてピッチフィル
タ係数gを算出し、ピッチ周期TPおよびピッチフィル
タ係数gの情報を出力端子308より出力する。
The pitch filter coefficient analysis unit 305 calculates a pitch filter coefficient g using a prediction residual signal or a drive signal sequence equivalent thereto based on the information of the given pitch cycle TP, and calculates the pitch cycle TP and the pitch filter coefficient. The information of g is output from the output terminal 308.

【0069】以上の処理をまとめると、図11に示され
るフローチャートのようになる。図11のステップS3
3、S34、S35およびS36の処理は、図7のステ
ップS21、S22、S23およびS24と同一なの
で、ここでは説明を省略する。ただし、ステップS33
におけるピッチ周期分析範囲とステップS21における
ピッチ周期分析範囲とが異なることは、前述した通りで
ある。
The above processing is summarized as a flowchart shown in FIG. Step S3 in FIG.
3, S34, S35, and S36 are the same as steps S21, S22, S23, and S24 in FIG. 7, and thus description thereof is omitted here. However, step S33
Is different from the pitch cycle analysis range in step S21 as described above.

【0070】最初に、ステップS31で選択情報が適応
符号帳を表しているか固定符号帳を表しているかを判定
する。選択情報が適応符号帳を表している場合はステッ
プS32に進み、固定符号帳を表している場合はステッ
プS33に進む。選択情報が適応符号帳を表す場合、ス
テップS32で適応符号帳探索で求めたピッチ周期TL
をポストフィルタ内のピッチフィルタで用いるピッチ周
期TPとし、ステップS34へ進む。選択情報が固定符
号帳を表す場合、ステップS33でピッチ周期TPを新
たに算出し、ステップS34へ進む。
First, at step S31, it is determined whether the selection information indicates an adaptive codebook or a fixed codebook. When the selection information indicates the adaptive codebook, the process proceeds to step S32, and when the selection information indicates the fixed codebook, the process proceeds to step S33. If the selection information indicates an adaptive codebook, the pitch period TL obtained in the adaptive codebook search in step S32
Is the pitch period TP used in the pitch filter in the post filter, and the process proceeds to step S34. If the selection information indicates a fixed codebook, the pitch cycle TP is newly calculated in step S33, and the process proceeds to step S34.

【0071】次に、図12を参照して上述したポストフ
ィルタを用いたCELP方式による音声復号化装置につ
いて説明する。図12において、図8と同一の構成要素
には同一の参照符号を付して詳細な説明を省略する。
Next, a speech decoding apparatus based on the CELP method using the above-described post filter will be described with reference to FIG. 12, the same components as those in FIG. 8 are denoted by the same reference numerals, and detailed description will be omitted.

【0072】本実施形態は、図8の実施形態と比較して
適応符号帳403と同列に固定符号帳412を有する点
が異なっている。以下、図8の実施形態との違いに重点
をおいて説明を行う。
This embodiment is different from the embodiment of FIG. 8 in that a fixed codebook 412 is provided in the same column as adaptive codebook 403. The following description focuses on the differences from the embodiment of FIG.

【0073】図12において、デマルチプレクサ402
から出力される適応ベクトルインデックスは判定部41
3に与えられ、復号されるべきベクトルが適応符号帳4
03から生成されるベクトルであるか固定符号帳412
から生成されるベクトルであるかが判定される。その判
定結果はスイッチ414、スイッチ415およびピッチ
情報分析部203に与えられる。ここでは、適応ベクト
ルインデックスが適応符号帳403と固定符号帳412
の両者のベクトルを同様に表現する場合について説明し
たが、デマルチプレクサから直接判定情報が生成される
場合もあり得るので、そのときは判定部413は不要で
ある。この場合、図示しない音声符号化装置は伝送すべ
き情報として新たに判定情報をマルチプレクサに与えて
いる構成を持ち、この判定情報としては適応符号帳か固
定符号帳かの区別を表すために1ビットの付加情報が必
要になる。
In FIG. 12, the demultiplexer 402
The adaptive vector index output from
3 and the vector to be decoded is the adaptive codebook 4
03 or a fixed codebook 412
Is determined to be a vector generated from. The determination result is given to the switch 414, the switch 415, and the pitch information analysis unit 203. Here, the adaptive vector index is the adaptive codebook 403 and the fixed codebook 412.
Although the case where both vectors are expressed in the same way has been described, the determination information may be directly generated from the demultiplexer, and in that case, the determination unit 413 is unnecessary. In this case, a speech coding apparatus (not shown) has a configuration in which decision information is newly given to the multiplexer as information to be transmitted, and the decision information includes one bit to indicate the distinction between the adaptive codebook and the fixed codebook. Additional information is required.

【0074】スイッチ414は、判定部413から与え
られる判定情報に基づき、適応ベクトルインデックスを
適応符号帳403に与えるか固定符号帳412に与える
かを切り替える。同様に、スイッチ415は判定部41
3から与えられる判定情報に基づき、乗算器405に与
えるベクトルを決定する。
Switch 414 switches between providing an adaptive vector index to adaptive codebook 403 and fixed codebook 412 based on the determination information provided from determination section 413. Similarly, the switch 415 is connected to the determination unit 41
The vector to be given to the multiplier 405 is determined based on the judgment information given from 3.

【0075】ピッチ情報分析部203では、判定部41
3から与えられる判定情報に基づいて、ポストフィルタ
205内で用いるピッチフィルタのピッチ周期TPの算
出法を図10および図11で説明したように切り替え、
ピッチ情報分析部203で求めたピッチ周期TPおよび
ピッチフィルタ係数gをポストフィルタ205に与え
る。
In the pitch information analysis section 203, the judgment section 41
3, the calculation method of the pitch period TP of the pitch filter used in the post filter 205 is switched as described with reference to FIGS.
The pitch period TP and the pitch filter coefficient g obtained by the pitch information analysis unit 203 are given to the post filter 205.

【0076】次に、本実施形態の効果について説明す
る。適応符号帳403は、直前の駆動信号系列を用いて
ピッチ周期を効率よく表現できる適応ベクトルを生成す
るのに対し、固定符号帳412は予め定められた固定ベ
クトルを複数個用意している。図示しない音声符号化装
置に与えられる入力音声信号のピッチ周期が適応符号帳
403のピッチ周期探索範囲{TLL≦TL≦TLH}
の範囲に含まれている場合、適応符号帳403の適応ベ
クトルが選択され、そのインデックスが符号化されるこ
とになる。
Next, effects of the present embodiment will be described. Adaptive codebook 403 generates an adaptive vector that can efficiently represent the pitch period using the immediately preceding drive signal sequence, whereas fixed codebook 412 prepares a plurality of predetermined fixed vectors. The pitch period of the input speech signal given to the speech coding device (not shown) is the pitch period search range of adaptive codebook 403 {TLL ≦ TL ≦ TLH}.
, The adaptive vector of the adaptive codebook 403 is selected and its index is encoded.

【0077】しかし、入力音声信号が適応符号帳403
のピッチ周期探索範囲に含まれないピッチ周期を持つ場
合、適応符号帳403の代わりに固定符号帳412が使
用される。これは、適応符号帳403が使用されたか、
固定符号帳412が使用されたかによって、入力音声信
号のピッチ周期が適応符号帳403のピッチ周期探索範
囲に含まれるかどうか判断することができることを意味
する。
However, if the input speech signal is
, The fixed codebook 412 is used instead of the adaptive codebook 403. This is whether adaptive codebook 403 was used,
This means that it is possible to determine whether or not the pitch period of the input speech signal is included in the pitch period search range of the adaptive codebook 403 depending on whether the fixed codebook 412 is used.

【0078】さらに、固定符号帳412が使用された場
合、ピッチ情報分析部203でのピッチ周期分析範囲は
適応符号帳403のピッチ周期探索範囲{TLL≦TL
≦TLH}を含まないと判断できることから、ピッチ周
期分析範囲を{TPL≦TP<TLL、TLH<TP≦
TPH}に限定することができ、計算量の削減を図るこ
とができる。一方、適応符号帳403が選択された場
合、入力音声信号のピッチ周期は適応符号帳403のピ
ッチ周期TLで表現されたものと考え、このピッチ周期
TLを基にポストフィルタ内205のピッチフィルタで
ピッチ強調を行えば良い。
Further, when the fixed codebook 412 is used, the pitch cycle analysis range of the pitch information analysis unit 203 is the pitch cycle search range of the adaptive codebook 403 {TLL ≦ TL
≦ TLH}, the pitch period analysis range is set to {TPL ≦ TP <TLL, TLH <TP ≦
TPH}, and the amount of calculation can be reduced. On the other hand, when the adaptive codebook 403 is selected, it is considered that the pitch cycle of the input speech signal is represented by the pitch cycle TL of the adaptive codebook 403, and the pitch filter in the post filter 205 based on the pitch cycle TL. You only need to emphasize the pitch.

【0079】なお、上述した実施形態はCELP方式の
音声符号化/復号化方法に本発明を適用した例について
述べたが、本発明はAPC(Adaptive Predictive Codin
g)方式といった他の方式の音声符号化/復号化方法にも
適用できる。
Although the above-described embodiment has described the example in which the present invention is applied to the CELP-based speech encoding / decoding method, the present invention relates to an APC (Adaptive Predictive Codin).
The present invention can also be applied to other types of speech encoding / decoding methods such as the g) method.

【0080】[0080]

【発明の効果】以上説明したように、本発明によれば音
声信号のピッチ周期を正しく表現して高品質の音声が得
られる音声符号化方法および音声復号化方法を提供する
ことができる。
As described above, according to the present invention, it is possible to provide a speech encoding method and a speech decoding method capable of correctly expressing the pitch period of a speech signal and obtaining high-quality speech.

【0081】すなわち、本発明による音声符号化方法で
は、聴感重みフィルタ内のピッチフィルタに与えるピッ
チ周期の分析範囲を適応符号帳のピッチ周期探索範囲よ
り広く設定することにより、適応符号帳のピッチ周期探
索範囲で表すことのできないピッチ周期を有する入力音
声信号が与えられても、ピッチフィルタに与えるピッチ
周期を正確に求めることができる。従って、このピッチ
周期を基にピッチフィルタで入力音声信号のピッチ周期
成分を抑圧し、このピッチフィルタを含む聴感重みフィ
ルタにより量子化雑音のスペクトル整形を行うことで、
マスキング効果による音声の品質向上を図ることができ
る。また、この処理は音声符号化装置と音声復号化装置
間の接続性になんら変化を与えないので、互換性を保っ
たまま品質改善を実現できる。
That is, in the speech coding method according to the present invention, the analysis range of the pitch period given to the pitch filter in the perceptual weight filter is set wider than the pitch period search range of the adaptive codebook, so that the pitch period of the adaptive codebook is Even if an input voice signal having a pitch period that cannot be represented by the search range is provided, the pitch period to be applied to the pitch filter can be accurately obtained. Therefore, based on this pitch period, the pitch filter suppresses the pitch period component of the input audio signal, and the spectral weighting of the quantization noise is performed by the auditory weighting filter including the pitch filter.
The sound quality can be improved by the masking effect. In addition, since this process does not change the connectivity between the speech encoding device and the speech decoding device, quality can be improved while maintaining compatibility.

【0082】また、本発明による音声復号化方法では、
ポストフィルタ内のピッチフィルタに与えるピッチ周期
の分析範囲を符号化データにより表現できるピッチ周波
の範囲より広く設定することにより、符号化データで表
すことのできないピッチ周期を持つ復号音声信号がポス
トフィルタに与えられたとしても、復号音声信号のピッ
チ周期を求めれば、そのピッチ周期を基にピッチ周期成
分の強調を行い、伝送され得なかったピッチ周期成分を
復元して品質の改善を図ることができる。
In the speech decoding method according to the present invention,
By setting the analysis range of the pitch period given to the pitch filter in the post filter wider than the range of the pitch frequency that can be represented by the encoded data, the decoded speech signal having the pitch period that cannot be represented by the encoded data is sent to the post filter. Even if given, if the pitch period of the decoded speech signal is obtained, the pitch period component is emphasized based on the pitch period, and the pitch period component that could not be transmitted can be restored to improve the quality. .

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施形態に係る音声符号化方法に用
いる聴感重みフィルタの基本動作を説明するためのブロ
ック図
FIG. 1 is a block diagram for explaining a basic operation of an auditory weighting filter used in a speech encoding method according to an embodiment of the present invention.

【図2】同実施形態におけるピッチ情報分析部の構成を
示すブロック図
FIG. 2 is a block diagram showing a configuration of a pitch information analyzer in the embodiment.

【図3】同実施形態の処理手順を示すフローチャートFIG. 3 is a flowchart showing a processing procedure according to the embodiment;

【図4】同実施形態に係る音声符号化方法を適用したC
ELP方式による音声合成装置の構成を示すブロック図
FIG. 4 is a diagram illustrating C to which the speech encoding method according to the embodiment is applied;
FIG. 2 is a block diagram showing a configuration of a speech synthesis device using the ELP method

【図5】本発明の一実施形態に係る音声復号化方法に用
いるポストフィルタの基本動作を説明するためのブロッ
ク図
FIG. 5 is a block diagram for explaining a basic operation of a post filter used in a speech decoding method according to an embodiment of the present invention.

【図6】同実施形態におけるピッチ情報分析部の構成を
示すブロック図
FIG. 6 is a block diagram showing a configuration of a pitch information analyzer in the embodiment.

【図7】同実施形態の処理手順を示すフローチャートFIG. 7 is a flowchart showing a processing procedure according to the embodiment;

【図8】同実施形態に係る音声復号化方法を適用したC
ELP方式による音声復号化装置の構成を示すブロック
FIG. 8 shows C to which the speech decoding method according to the embodiment is applied.
FIG. 2 is a block diagram showing a configuration of a speech decoding device based on the ELP method.

【図9】同実施形態に係る音声復号化方法に用いるポス
トフィルタの基本動作を説明するブロック図
FIG. 9 is a block diagram illustrating a basic operation of a post-filter used in the speech decoding method according to the embodiment;

【図10】同実施形態におけるピッチ情報分析部の構成
を示すブロック図
FIG. 10 is a block diagram showing a configuration of a pitch information analysis unit in the embodiment.

【図11】同実施形態の処理手順を示すフローチャートFIG. 11 is a flowchart showing a processing procedure according to the embodiment;

【図12】本発明の他の実施形態に係る音声復号化方法
を適用したCELP方式による音声復号化装置の構成を
示すブロック図
FIG. 12 is a block diagram showing a configuration of a CELP-based speech decoding apparatus to which a speech decoding method according to another embodiment of the present invention is applied.

【符号の説明】 101…音声信号入力端子 102…LPC係数分析部 103…ピッチ情報分析部 104…聴感重みフィルタ 105…出力端子 106…LPC係数量子化部 107…重み付き合成フィルタ 108…適応符号帳 109…雑音符号帳 110,111…乗算器 112…加算器 113…適応ベクトルゲイン符号帳 114…雑音ベクトルゲイン符号帳 115…減算器 116…最小歪探索部 117…マルチプレクサ 118…出力端子 201…復号音声信号入力端子 202…駆動信号入力端子 203…ピッチ情報分析部 204…LPC係数入力端子 205…ポストフィルタ 206…ポストフィルタ出力端子 207…適応符号帳のピッチ周期入力端子 211…符号帳選択情報入力端子 301…音声信号入力端子 302…LPC係数入力端子 303…予測残差信号計算部 304…ピッチ周期分析部 305…ピッチフィルタ係数入力端子 306…出力端子 308…出力端子 310…スイッチ 401…ビットストリーム入力端子 402…デマルチプレクサ 403…適応符号帳 404…適応ベクトルゲイン符号帳 405…乗算器 406…雑音符号帳 407…雑音ベクトルゲイン符号帳 408…乗算器 409…加算器 410…LPC係数復号部 411…合成フィルタ 412…固定符号帳 413…判定部 414,415…スイッチ[Description of Codes] 101: Audio signal input terminal 102: LPC coefficient analysis unit 103: Pitch information analysis unit 104: Perceptual weight filter 105: Output terminal 106: LPC coefficient quantization unit 107: Weighted synthesis filter 108: Adaptive codebook 109: noise codebook 110, 111: multiplier 112: adder 113: adaptive vector gain codebook 114: noise vector gain codebook 115: subtractor 116: minimum distortion search unit 117: multiplexer 118: output terminal 201: decoded voice Signal input terminal 202 ... Drive signal input terminal 203 ... Pitch information analysis unit 204 ... LPC coefficient input terminal 205 ... Post filter 206 ... Post filter output terminal 207 ... Adaptive codebook pitch period input terminal 211 ... Codebook selection information input terminal 301 ... Sound signal input terminal 302 ... LPC Number input terminal 303: prediction residual signal calculation unit 304: pitch cycle analysis unit 305: pitch filter coefficient input terminal 306 ... output terminal 308 ... output terminal 310 ... switch 401 ... bit stream input terminal 402 ... demultiplexer 403 ... adaptive codebook 404 ... Adaptive vector gain codebook 405 ... Multiplier 406 ... Noise codebook 407 ... Noise vector gain codebook 408 ... Multiplier 409 ... Adder 410 ... LPC coefficient decoding unit 411 ... Synthesis filter 412 ... Fixed codebook 413 ... Decision unit 414, 415 ... switch

───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平9−81192(JP,A) 特開 平6−202698(JP,A) 特開 平8−76793(JP,A) 特開 平6−77834(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 19/04 G10L 19/12 ────────────────────────────────────────────────── ─── Continuation of the front page (56) References JP-A-9-81192 (JP, A) JP-A-6-202698 (JP, A) JP-A-8-76793 (JP, A) 77834 (JP, A) (58) Field surveyed (Int. Cl. 7 , DB name) G10L 19/04 G10L 19/12

Claims (4)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】入力音声信号のピッチ周期を分析して、該
入力音声信号のピッチ周期成分を抑圧するピッチフィル
タに与え、このピッチフィルタを含む聴感重みフィルタ
に通した音声信号に基づいて該入力音声信号のピッチ周
期を探索し符号化する音声符号化方法において、 前記ピッチ周期の符号化データにより表現できるピッチ
周期の範囲に対し、前記ピッチフィルタに与えるピッチ
周期の分析範囲を広く設定したことを特徴とする音声符
号化方法。
An input audio signal is analyzed for a pitch period and is applied to a pitch filter for suppressing a pitch period component of the input audio signal. Based on the audio signal passed through an auditory weighting filter including the pitch filter, the input signal is analyzed. In a speech encoding method for searching and encoding a pitch cycle of an audio signal, a range of a pitch cycle that can be represented by encoded data of the pitch cycle is set to be wider than a range of an analysis of a pitch cycle given to the pitch filter. Characteristic speech coding method.
【請求項2】入力音声信号のピッチ周期を分析して、該
入力音声信号のピッチ周期成分を抑圧するピッチフィル
タに与え、このピッチフィルタを含む聴感重みフィルタ
に通した音声信号に基づいて該入力音声信号のピッチ周
期を探索し符号化する音声符号化方法において、 前記符号化データにより表現できるピッチ周期(TL)
の範囲をTLL≦TL≦TLHとし、前記ピッチフィル
タに与えるピッチ周期(TW)の分析範囲をTWL≦T
W≦TWHとしたとき、TLL>TWLおよびTLH<
TWHの少なくとも一方の条件を満足することを特徴と
する音声符号化方法。
2. A pitch filter for analyzing a pitch cycle of an input voice signal and applying the same to a pitch filter for suppressing a pitch cycle component of the input voice signal, based on the voice signal passed through an auditory weighting filter including the pitch filter. In a speech encoding method for searching for and encoding a pitch cycle of a speech signal, a pitch cycle (TL) that can be represented by the encoded data
Is defined as TLL ≦ TL ≦ TLH, and the analysis range of the pitch cycle (TW) given to the pitch filter is defined as TWL ≦ T
When W ≦ TWH, TLL> TWL and TLH <
A speech coding method characterized by satisfying at least one condition of TWH.
【請求項3】符号化データを復号して得られた復号音声
信号のピッチ周期を分析して、該復号音声信号をピッチ
周期成分を強調するピッチフィルタを含むポストフィル
タに通して出力する音声復号化方法において、 前記符号化データにより表現できるピッチ周期の範囲に
対し、前記ピッチフィルタに与えるピッチ周期の分析範
囲を広く設定したことを特徴とする音声復号化方法。
3. Speech decoding for analyzing a pitch cycle of a decoded speech signal obtained by decoding encoded data and outputting the decoded speech signal through a post filter including a pitch filter for emphasizing a pitch cycle component. A speech decoding method, wherein an analysis range of a pitch cycle given to the pitch filter is set wider than a range of a pitch cycle that can be represented by the encoded data.
【請求項4】符号化データを復号して得られた復号音声
信号のピッチ周期を分析して、該復号音声信号をピッチ
周期成分を強調するピッチフィルタを含むポストフィル
タに通して出力する音声復号化方法において、 前記符号化データにより表現できるピッチ周期(TL)
の範囲をTLL≦TL≦TLHとし、前記ピッチフィル
タに与えるピッチ周期(TP)の分析範囲をTPL≦T
P≦TPHとしたとき、TLL>TPLおよびTLH<
TPHの少なくとも一方の条件を満足することを特徴と
する音声復号化方法。
4. Speech decoding for analyzing a pitch cycle of a decoded speech signal obtained by decoding encoded data and outputting the decoded speech signal through a post filter including a pitch filter for emphasizing a pitch cycle component. A pitch period (TL) that can be represented by the encoded data.
Is defined as TLL ≦ TL ≦ TLH, and the analysis range of the pitch period (TP) given to the pitch filter is TPL ≦ T
When P ≦ TPH, TLL> TPL and TLH <
A speech decoding method characterized by satisfying at least one condition of TPH.
JP07624996A 1996-01-31 1996-03-29 Voice coding method and voice decoding method Expired - Lifetime JP3350340B2 (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP07624996A JP3350340B2 (en) 1996-03-29 1996-03-29 Voice coding method and voice decoding method
US08/791,741 US5819213A (en) 1996-01-31 1997-01-30 Speech encoding and decoding with pitch filter range unrestricted by codebook range and preselecting, then increasing, search candidates from linear overlap codebooks
EP97300609A EP0788091A3 (en) 1996-01-31 1997-01-30 Speech encoding and decoding method and apparatus therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP07624996A JP3350340B2 (en) 1996-03-29 1996-03-29 Voice coding method and voice decoding method

Publications (2)

Publication Number Publication Date
JPH09269798A JPH09269798A (en) 1997-10-14
JP3350340B2 true JP3350340B2 (en) 2002-11-25

Family

ID=13599930

Family Applications (1)

Application Number Title Priority Date Filing Date
JP07624996A Expired - Lifetime JP3350340B2 (en) 1996-01-31 1996-03-29 Voice coding method and voice decoding method

Country Status (1)

Country Link
JP (1) JP3350340B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4433668B2 (en) * 2002-10-31 2010-03-17 日本電気株式会社 Bandwidth expansion apparatus and method

Also Published As

Publication number Publication date
JPH09269798A (en) 1997-10-14

Similar Documents

Publication Publication Date Title
US5778335A (en) Method and apparatus for efficient multiband celp wideband speech and music coding and decoding
US7171355B1 (en) Method and apparatus for one-stage and two-stage noise feedback coding of speech and audio signals
JPH08263099A (en) Encoder
JPH1091194A (en) Method of voice decoding and device therefor
JPH09127991A (en) Voice coding method, device therefor, voice decoding method, and device therefor
WO2001020595A1 (en) Voice encoder/decoder
JP3357795B2 (en) Voice coding method and apparatus
JP3628268B2 (en) Acoustic signal encoding method, decoding method and apparatus, program, and recording medium
JPH08272395A (en) Voice encoding device
US6205423B1 (en) Method for coding speech containing noise-like speech periods and/or having background noise
JPH09152896A (en) Sound path prediction coefficient encoding/decoding circuit, sound path prediction coefficient encoding circuit, sound path prediction coefficient decoding circuit, sound encoding device and sound decoding device
JPH1097295A (en) Coding method and decoding method of acoustic signal
JP3266178B2 (en) Audio coding device
JP2002268686A (en) Voice coder and voice decoder
JP4359949B2 (en) Signal encoding apparatus and method, and signal decoding apparatus and method
JP3888097B2 (en) Pitch cycle search range setting device, pitch cycle search device, decoding adaptive excitation vector generation device, speech coding device, speech decoding device, speech signal transmission device, speech signal reception device, mobile station device, and base station device
JP3350340B2 (en) Voice coding method and voice decoding method
JP2796408B2 (en) Audio information compression device
JP3916934B2 (en) Acoustic parameter encoding, decoding method, apparatus and program, acoustic signal encoding, decoding method, apparatus and program, acoustic signal transmitting apparatus, acoustic signal receiving apparatus
KR100718487B1 (en) Harmonic noise weighting in digital speech coders
JP3576485B2 (en) Fixed excitation vector generation apparatus and speech encoding / decoding apparatus
KR100341398B1 (en) Codebook searching method for CELP type vocoder
JP3496618B2 (en) Apparatus and method for speech encoding / decoding including speechless encoding operating at multiple rates
JP2968109B2 (en) Code-excited linear prediction encoder and decoder
JP2002073097A (en) Celp type voice coding device and celp type voice decoding device as well as voice encoding method and voice decoding method

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070913

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080913

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080913

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090913

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090913

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100913

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110913

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110913

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120913

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120913

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130913

Year of fee payment: 11

EXPY Cancellation because of completion of term