JP2000250597A - Lsp correcting device, voice encoding device, and voice decoding device - Google Patents

Lsp correcting device, voice encoding device, and voice decoding device

Info

Publication number
JP2000250597A
JP2000250597A JP11047079A JP4707999A JP2000250597A JP 2000250597 A JP2000250597 A JP 2000250597A JP 11047079 A JP11047079 A JP 11047079A JP 4707999 A JP4707999 A JP 4707999A JP 2000250597 A JP2000250597 A JP 2000250597A
Authority
JP
Japan
Prior art keywords
lsp
frequency domain
decoding
dimension
correction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11047079A
Other languages
Japanese (ja)
Inventor
Hirohisa Tazaki
裕久 田崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP11047079A priority Critical patent/JP2000250597A/en
Publication of JP2000250597A publication Critical patent/JP2000250597A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To obtain auditory equal effects over the entire frequency band by correcting an LSP(line spectrum pair) converted into the frequency range corresponding to auditory characteristics and putting the frequency range of the LSP back to a linear frequency range. SOLUTION: A bark conversion part 1 when inputting the LSP converts the respective dimensional values of the LSP from the linear frequency range into a bark frequency range and outputs a bark-LSP as the conversion result to an LSP deformation part 2. An inter-dimension distance calculation part 3 of the LSP deformation part 2 once receiving the bark-LSP from the bark conversion part 1 calculates inter-adjacent-dimension distances of the bark-LSP in order and outputs the inter-adjacent-dimension distances to an inter-dimension distance expansion part 4 of the LSP conversion part 2. The expansion part 4 once receiving the inter-adjacent-dimension distance of the bark-LSP from the inter-dimension distance calculation part 3 compares it with a specific threshold, and corrects a dimension value when the threshold is not exceeded and performs a process for widening the inter-adjacent-dimension distance, thereby outputting the corrected bark-LSP to a bark reconversion part 5.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】この発明は、音声符号化装置
や音声復号化装置が使用するスペクトルパラメータであ
るLSP(線スペクトル対)を補正するLSP補正装
置、ディジタル音声信号を少ない情報量に圧縮する音声
符号化装置、及び音声符号を復号化してディジタル音声
信号を再生する音声復号化装置に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an LSP correction device for correcting an LSP (line spectrum pair), which is a spectrum parameter used by a voice encoding device and a voice decoding device, and to compress a digital voice signal into a small amount of information. The present invention relates to an audio encoding device and an audio decoding device that decodes an audio code to reproduce a digital audio signal.

【0002】[0002]

【従来の技術】LSPをスペクトルパラメータとして使
用する従来の音声符号化装置と音声復号化装置として
は、特開平4−5700号公報及び特開平5−2739
97号公報に開示されているものがある。特開平4−5
700号公報(以下、従来例1と称する)は、LSP符
号化誤差や伝送路誤りによる復号音の品質劣化を抑制す
ることを目的として、音声符号化装置内と音声復号化装
置内に同様なLSP補正手段を備えるようにしたもので
ある。
2. Description of the Related Art Conventional speech coding apparatuses and speech decoding apparatuses using an LSP as a spectrum parameter are disclosed in JP-A-4-5700 and JP-A-5-2739.
No. 97 is disclosed. JP-A-4-5
Japanese Patent Application Publication No. 700 (hereinafter referred to as Conventional Example 1) has the same structure in a speech encoding device and a speech decoding device for the purpose of suppressing quality degradation of decoded sound due to LSP encoding errors and transmission path errors. An LSP correction means is provided.

【0003】ここにおけるLSP補正方法としては、隣
接次元間の距離を算出して、これが閾値を下回るとき
に、その閾値まで間隔を広げる方法が開示されている。
具体的には、補正対象のLSPをω(k)、k=1〜M
とすると、隣接次元間距離d(k)は下記に示すように
なる。 d(k)=ω(k+1)−ω(k)
As the LSP correction method, a method is disclosed in which a distance between adjacent dimensions is calculated, and when the distance is smaller than a threshold, the interval is increased to the threshold.
Specifically, the LSP to be corrected is ω (k), k = 1 to M
Then, the distance d (k) between adjacent dimensions is as shown below. d (k) = ω (k + 1) −ω (k)

【0004】この隣接次元間距離d(k)が閾値Dを下
回ると、下記に示すようにLSPの補正処理を実行す
る。ただし、ω’が補正後のLSPである。 ω’(k) ={ω(k)+ω(k+1)}/2−D/2 ω’(k+1)={ω(k)+ω(k+1)}/2+D/2
When the distance d (k) between adjacent dimensions falls below the threshold value D, an LSP correction process is executed as described below. Here, ω ′ is the corrected LSP. ω ′ (k) = {ω (k) + ω (k + 1)} / 2−D / 2 ω ′ (k + 1) = {ω (k) + ω (k + 1)} / 2 + D / 2

【0005】特開平5−273997号公報(以下、従
来例2と称する)は、品質の劣化(量子化ノイズ)した
復号音を再分析してスペクトルパラメータを算出したと
きに起こる分析時の不安定化や量子化ノイズの影響を軽
減することを目的として、バックワード型のCELP系
の音声符号化装置と音声復号化装置内において、線形予
測分析手段によって得られたスペクトルパラメータに対
してLSP上での制御を行うLSP制御手段を備えるよ
うにしたものである。
Japanese Unexamined Patent Publication No. Hei 5-273997 (hereinafter referred to as Conventional Example 2) discloses an instability at the time of analysis which occurs when a decoded sound having deteriorated quality (quantization noise) is re-analyzed to calculate a spectrum parameter. For the purpose of reducing the influence of quantization and quantization noise, in the backward type CELP-based speech coding apparatus and speech decoding apparatus, the spectral parameters obtained by the linear prediction analysis means are converted on the LSP. LSP control means for performing the above control is provided.

【0006】LSP制御手段としては、算出されたLS
Pと予め固定的に与えておいたLSPとを結合係数を用
いて線形加算する方法が開示されている。具体的には、
結合係数β、固定LSPをωとすれば、線形加算によ
って得られるLSPは、下記の通りとなる。 ω’(k)=ω(k)・β+ω(k)(1−β)
[0006] As the LSP control means, the calculated LS
A method of linearly adding P and an LSP fixedly given in advance using a coupling coefficient is disclosed. In particular,
Coupling coefficient beta, if the fixed LSP and omega 0, LSP obtained by linear addition becomes as follows. ω ′ (k) = ω (k) · β + ω 0 (k) (1−β)

【0007】また、従来例2には、上記結合係数βの値
を制御するために用いるLSPの隣接次元間距離の許容
限界値D(k)を各次元毎に与えることが開示されてい
る。この許容限界値D(k)の設定は、量子化ノイズが
含まれない入力音声を予め分析した線形予測係数より求
めたLSPの隣接次元間距離に基づいて行われる。従来
例2では、この固定値であるD(k)と、隣接次元間距
離d(k)を比較して、全ての次数でd(k)>D
(k)となるように結合係数βを制御する。 d(k)=ω(k+1)−ω(k)
Further, the second conventional example discloses that an allowable limit value D (k) of the distance between adjacent dimensions of the LSP used for controlling the value of the coupling coefficient β is given for each dimension. The setting of the permissible limit value D (k) is performed based on the distance between adjacent dimensions of the LSP obtained from a linear prediction coefficient obtained by previously analyzing an input speech that does not include quantization noise. In Conventional Example 2, the fixed value D (k) is compared with the distance d (k) between adjacent dimensions, and d (k)> D for all orders.
The coupling coefficient β is controlled so as to satisfy (k). d (k) = ω (k + 1) −ω (k)

【0008】LSPの補正処理を使用した従来のポスト
フィルタ(音声復号化装置における後処理フィルタ)とし
ては、特開平8−305397号公報に開示されている
ものがある。特開平8−305397号公報(以下、従
来例3と称する)は、ポストフィルタの設計自由度を高
めるために、LSP補正処理によって算出した補正LS
Pによって音声強調処理を行うようにしたものである。
A conventional post-filter (post-processing filter in an audio decoding device) using the LSP correction process is disclosed in Japanese Patent Application Laid-Open No. 8-305397. Japanese Patent Application Laid-Open No. 8-305397 (hereinafter referred to as Conventional Example 3) discloses a correction LS calculated by an LSP correction process in order to increase the degree of freedom in designing a post filter.
The voice emphasis processing is performed by P.

【0009】ここにおけるLSP補正処理としては、従
来例2と同様の式で表されるLSP上の内分処理、従来
例1と類似する隣接次元間距離を広げる処理が開示され
ている。但し、ここでは隣接次元間距離が閾値未満の場
合に、その部分より高次のLSPを一括して上にずらす
ことで隣接次元間距離を閾値まで広げ、(低次から順
に)全ての隣接次元に対する処理を行った結果、上にず
らした合計距離分だけ、均等に全隣接次元間距離を縮め
るという方法を開示している。
As the LSP correction process, there are disclosed an internal division process on the LSP represented by the same formula as that of the conventional example 2 and a process of increasing the distance between adjacent dimensions similar to the conventional example 1. However, here, when the distance between adjacent dimensions is smaller than the threshold value, the distance between adjacent dimensions is increased to the threshold value by shifting the higher-order LSP collectively above that portion, and all the adjacent dimensions (in order from the lower order) As a result of performing the processing for, the method of uniformly reducing the distance between all adjacent dimensions by the total distance shifted upward is disclosed.

【0010】[0010]

【発明が解決しようとする課題】従来の音声符号化装置
及び音声復号化装置は以上のように構成されているの
で、従来例1及び従来例3の場合、隣接次元間距離を広
げるLSPの補正処理を実行する際、入力LSPの値に
依らず、固定的な閾値を使用するようにしている。しか
し、本来低域と高域では、線形周波数領域で同じ帯域幅
であっても聴覚器官内部の基底膜状の帯域幅は大きく異
なっており、線形周波数領域で固定的な閾値で行われる
補正の効果は低域と高域で大きく異なっている。このた
め全帯域に渡って適切な補正が行われない課題があっ
た。
Since the conventional speech coding apparatus and speech decoding apparatus are constructed as described above, in the case of the prior art examples 1 and 3, the correction of the LSP for increasing the distance between adjacent dimensions is performed. When executing the process, a fixed threshold is used regardless of the value of the input LSP. However, in the low frequency band and the high frequency band, even though the bandwidth is the same in the linear frequency domain, the bandwidth of the basilar membrane inside the auditory organ is greatly different, and the correction performed with a fixed threshold in the linear frequency domain The effect is very different between low and high frequencies. For this reason, there has been a problem that appropriate correction is not performed over the entire band.

【0011】例えば、音声符号化装置におけるLSP量
子化誤差の影響を軽減するためにLSP補正処理を導入
した場合を考える。閾値Dを使用することによって、低
域では振幅不安定を抑制できているとしても、同じ閾値
Dでは高域に聴覚的に気になる程度に急峻な極を抑制す
ることができない場合がある。逆に高域の急峻な極を抑
制できる程度まで閾値Dを大きく設定すると、低域の極
が広がりすぎて平均的な符号化歪が大きく劣化してしま
う。この様に、従来の周波数帯域に依らない閾値を使用
した次元間距離拡張処理には、適用した音声符号化装置
及び音声復号化装置の符号化復号化品質の劣化を解消で
きなかったり、逆に劣化をもたらしてしまう課題があっ
た。
For example, consider a case where an LSP correction process is introduced to reduce the effect of LSP quantization error in a speech encoding device. Even if the amplitude instability can be suppressed in the low frequency range by using the threshold value D, there may be a case where the same threshold value D cannot suppress the steep pole to such an extent as to be auditoryly noticeable in the high frequency range. Conversely, if the threshold D is set large enough to suppress the steep poles in the high band, the poles in the low band will be too wide and the average coding distortion will be greatly degraded. As described above, in the conventional inter-dimension distance extension processing using a threshold independent of the frequency band, deterioration of the coding / decoding quality of the applied speech coding apparatus and speech decoding apparatus cannot be eliminated, or conversely, There was a problem of causing deterioration.

【0012】さらに、音声符号化装置、音声復号化装
置、音声符号化装置、音声復号化装置、というように多
段階に接続される場合を考える。この場合、最初の音声
符号化装置と音声復号化装置によって、量子化ノイズや
ポストフィルタ等によってある程度の劣化やスペクトル
変形が導入される。このため、2つ目の音声符号化装置
と音声復号化装置内では、通常の入力音声には存在しな
いような急峻な極を持つLSPが生成されることがあ
り、これを適切に補正しないと歪感の大きい符号化復号
化音が生成されてしまう。背景雑音が重畳した場合にも
同様の問題が発生する。従来のLSP補正手段では、高
域にこの様な歪感を生じる急峻な極がある場合でも、上
述の通り十分に補正できない課題があった。繰り返す
と、高域の急峻な極を抑制できる程度までLSPの補正
を強く設定すると、低域の極が広がりすぎて平均的な符
号化歪が大きく劣化してしまう課題があった。
[0012] Further, consider a case where connections are made in multiple stages, such as a speech coding apparatus, a speech decoding apparatus, a speech coding apparatus, and a speech decoding apparatus. In this case, the first speech coding apparatus and the first speech decoding apparatus introduce a certain degree of deterioration or spectrum deformation due to quantization noise, post-filter, or the like. For this reason, in the second speech encoding device and the speech decoding device, an LSP having a steep pole that does not exist in the normal input speech may be generated, and unless this is appropriately corrected. An encoded / decoded sound with a large sense of distortion is generated. A similar problem occurs when background noise is superimposed. As described above, the conventional LSP correction means has a problem in that even when there is a steep pole that causes such a sense of distortion in a high frequency band, it cannot be sufficiently corrected as described above. To repeat, if the LSP correction is set strong enough to suppress the steep pole in the high band, there is a problem that the pole in the low band is too wide and the average coding distortion is greatly deteriorated.

【0013】従来例2及び従来例3に開示された内分処
理を用いてLSPの補正処理を実行する場合、結合係数
βを適応制御したり次元毎に値を設定することも可能で
あるが、やはり補正対象のLSPの周波数上における値
と関係なく補正が行われるため、この補正による聴覚的
な影響が周波数毎に差異が出て、適用した音声符号化装
置及び音声復号化装置の符号化復号化品質の劣化を解消
できなかったり、逆に劣化をもたらしてしまう課題があ
った。
When the LSP correction processing is executed using the internal division processing disclosed in Conventional Examples 2 and 3, it is possible to adaptively control the coupling coefficient β or set a value for each dimension. Also, since the correction is performed irrespective of the value on the frequency of the LSP to be corrected, the perceptual effect of this correction differs for each frequency, and the coding of the applied voice coding apparatus and voice decoding apparatus is performed. There has been a problem that the deterioration of the decoding quality cannot be eliminated, or on the contrary, the deterioration occurs.

【0014】従来例2では、各次元毎に隣接次元間距離
の許容限界値D(k)を予め与えて結合係数βの制御に
使用しているが、同じ次元内でもLSPの値は大きな分
散を持っているため、次元毎に1つの許容限界値D
(k)を設定すると誤差が大きくなる。
In the second conventional example, the allowable limit value D (k) of the distance between adjacent dimensions is given in advance for each dimension and used for controlling the coupling coefficient β. , One permissible limit value D per dimension
Setting (k) increases the error.

【0015】この発明は上記のような課題を解決するた
めになされたもので、全周波数帯域に渡って聴覚的に均
等な効果をもたらすことができるLSP補正装置を得る
ことを目的とする。また、この発明は、符号化品質を高
めることができる音声符号化装置を得ることを目的とす
る。さらに、この発明は、復号化品質を高めることがで
きる音声復号化装置を得ることを目的とする。
SUMMARY OF THE INVENTION The present invention has been made to solve the above-described problems, and has as its object to provide an LSP correction device capable of providing an acoustically uniform effect over the entire frequency band. Another object of the present invention is to provide a speech coding apparatus capable of improving coding quality. Another object of the present invention is to provide a speech decoding device capable of improving the decoding quality.

【0016】[0016]

【課題を解決するための手段】この発明に係るLSP補
正装置は、聴覚的特性に対応する周波数領域に変換され
たLSPを補正し、そのLSPの周波数領域を線形周波
数領域に戻すようにしたものである。
An LSP correction apparatus according to the present invention corrects an LSP converted to a frequency domain corresponding to auditory characteristics, and returns the LSP frequency domain to a linear frequency domain. It is.

【0017】この発明に係るLSP補正装置は、LSP
の周波数領域を線形周波数領域からバーク周波数領域に
変換して補正するようにしたものである。
[0017] The LSP correction apparatus according to the present invention comprises an LSP
Is converted from the linear frequency domain to the Bark frequency domain to make correction.

【0018】この発明に係るLSP補正装置は、LSP
の周波数領域を線形周波数領域からメル周波数領域に変
換して補正するようにしたものである。
The LSP correction device according to the present invention is an LSP correction device.
Is converted from the linear frequency domain to the mel frequency domain for correction.

【0019】この発明に係るLSP補正装置は、LSP
の周波数領域を線形周波数領域から対数周波数領域に変
換して補正するようにしたものである。
An LSP correction device according to the present invention is an LSP correction device.
Is converted from the linear frequency domain to the logarithmic frequency domain for correction.

【0020】この発明に係るLSP補正装置は、LSP
の各次元値を基準にして、隣接次元間距離に関する閾値
を各次元毎に算出し、各次元毎の閾値に基づいてLSP
を補正するようにしたものである。
An LSP correction device according to the present invention is an LSP correction device.
The threshold value for the distance between adjacent dimensions is calculated for each dimension on the basis of each dimension value of LSP, and the LSP is calculated based on the threshold value for each dimension.
Is corrected.

【0021】この発明に係るLSP補正装置は、LSP
の周波数領域を線形周波数領域から聴覚的特性に対応す
る周波数領域に変換し、その聴覚的特性に対応する周波
数領域で閾値を算出するようにしたものである。
An LSP correction apparatus according to the present invention
Is converted from the linear frequency domain to the frequency domain corresponding to the auditory characteristics, and the threshold value is calculated in the frequency domain corresponding to the auditory characteristics.

【0022】この発明に係るLSP補正装置は、聴覚的
特性に対応する周波数領域で算出した閾値と、線形周波
数領域で定義された閾値を比較し、大きい方の閾値を補
正手段に出力するようにしたものである。
An LSP correction apparatus according to the present invention compares a threshold calculated in a frequency domain corresponding to an auditory characteristic with a threshold defined in a linear frequency domain, and outputs a larger threshold to the correction means. It was done.

【0023】この発明に係るLSP補正装置は、LSP
の周波数領域を線形周波数領域からバーク周波数領域に
変換して閾値を算出するようにしたものである。
The LSP correction device according to the present invention is an LSP correction device.
Is converted from the linear frequency domain to the Bark frequency domain to calculate the threshold.

【0024】この発明に係るLSP補正装置は、LSP
の周波数領域を線形周波数領域からメル周波数領域に変
換して閾値を算出するようにしたものである。
The LSP correction device according to the present invention is an LSP correction device.
Is converted from the linear frequency domain to the mel frequency domain to calculate the threshold value.

【0025】この発明に係るLSP補正装置は、LSP
の周波数領域を線形周波数領域から対数周波数領域に変
換して閾値を算出するようにしたものである。
The LSP correction device according to the present invention is an LSP correction device.
Is converted from the linear frequency domain to the logarithmic frequency domain to calculate the threshold.

【0026】この発明に係る音声符号化装置は、聴覚特
性に対応する周波数領域で補正されたLSPを符号化し
てLSP符号と量子化LSPを出力するようにしたもの
である。
A speech encoding apparatus according to the present invention encodes an LSP corrected in a frequency domain corresponding to auditory characteristics and outputs an LSP code and a quantized LSP.

【0027】この発明に係る音声符号化装置は、LSP
の各次元値を基準にして算出した各次元毎の閾値を用い
て補正されたLSPを符号化してLSP符号と量子化L
SPを出力するようにしたものである。
[0027] The speech encoding apparatus according to the present invention comprises an LSP
The corrected LSP is encoded using a threshold value for each dimension calculated based on each dimension value of
The SP is output.

【0028】この発明に係る音声符号化装置は、聴覚特
性に対応する周波数領域で補正された復号LSPと入力
音声から符号化音源を算出するようにしたものである。
[0028] A speech encoding apparatus according to the present invention calculates an encoded sound source from a decoded LSP corrected in a frequency domain corresponding to auditory characteristics and an input speech.

【0029】この発明に係る音声符号化装置は、LSP
の各次元値を基準にして算出した各次元毎の閾値を用い
て補正された復号LSPと入力音声から符号化音源を算
出するようにしたものである。
[0029] The speech encoding apparatus according to the present invention comprises an LSP
The encoded excitation is calculated from the decoded LSP and the input speech corrected using the threshold value for each dimension calculated on the basis of each dimension value.

【0030】この発明に係る音声復号化装置は、聴覚特
性に対応する周波数領域で補正された復号LSPと音源
復号化手段により生成された音源信号から合成音を生成
するようにしたものである。
The speech decoding apparatus according to the present invention is configured to generate a synthesized sound from a decoded LSP corrected in a frequency domain corresponding to the auditory characteristics and a sound source signal generated by a sound source decoding unit.

【0031】この発明に係る音声復号化装置は、LSP
の各次元値を基準にして算出した各次元毎の閾値を用い
て補正された復号LSPと音源復号化手段により生成さ
れた音源信号から合成音を生成するようにしたものであ
る。
[0031] The speech decoding apparatus according to the present invention comprises an LSP.
The synthesized sound is generated from the decoded LSP corrected by using the threshold value for each dimension calculated based on each dimension value and the sound source signal generated by the sound source decoding means.

【0032】この発明に係る音声復号化装置は、聴覚特
性に対応する周波数領域で補正された復号LSPを用い
て合成音に対するスペクトル強調処理を実行するように
したものである。
The speech decoding apparatus according to the present invention executes a spectrum emphasis process on a synthesized sound using a decoded LSP corrected in a frequency domain corresponding to auditory characteristics.

【0033】この発明に係る音声復号化装置は、LSP
の各次元値を基準にして算出した各次元毎の閾値を用い
て補正された復号LSPを用いて合成音に対するスペク
トル強調処理を実行するようにしたものである。
[0033] The speech decoding apparatus according to the present invention comprises an LSP
The spectrum emphasizing process is performed on the synthesized sound using the decoded LSP corrected using the threshold value for each dimension calculated based on each dimension value.

【0034】[0034]

【発明の実施の形態】以下、この発明の実施の一形態を
説明する。実施の形態1.図1はこの発明の実施の形態
1によるLSP補正装置を示す構成図であり、図におい
て、1はスペクトルパラメータであるLSPを入力する
と、そのLSPの周波数領域を線形周波数領域からba
rk周波数領域(聴覚的特性に対応する周波数領域)に
変換するbark変換部(変換手段)、2はbark変
換部1により周波数領域が変換されたLSPを補正する
LSP変形部(補正手段)、3はLSPの隣接次元間距
離を算出する次元間距離算出部、4は次元間距離算出部
3により算出された隣接次元間距離が所定の閾値を下回
るとき、その隣接次元間距離を広げる次元間距離拡張
部、5はLSP変形部2により補正されたLSPの周波
数領域を線形周波数領域に戻すbark逆変換部(逆変
換手段)である。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS One embodiment of the present invention will be described below. Embodiment 1 FIG. FIG. 1 is a block diagram showing an LSP correction apparatus according to Embodiment 1 of the present invention. In FIG. 1, when an LSP which is a spectrum parameter is input, the frequency domain of the LSP is shifted from the linear frequency domain to ba.
a bark transformation unit (conversion unit) 2 for converting to an rk frequency region (a frequency region corresponding to auditory characteristics); an LSP transformation unit (correction unit) 3 for correcting the LSP whose frequency domain has been transformed by the bark transformation unit 1; Is an inter-dimensional distance calculating unit that calculates the distance between adjacent dimensions of the LSP, and 4 is an inter-dimensional distance that increases the distance between adjacent dimensions when the distance between adjacent dimensions calculated by the inter-dimensional distance calculating unit 3 falls below a predetermined threshold. The extension unit 5 is a bark inverse transform unit (inverse transform unit) that returns the frequency domain of the LSP corrected by the LSP transforming unit 2 to the linear frequency domain.

【0035】次に動作について説明する。まず、LSP
はbark変換部1に入力されるが、LSPは音声符号
化装置や音声復号化装置等で算出されたり、復号化され
たりして得られたものであり、LSPパラメータの安定
化やスペクトルの平坦化のために、LSP補正装置に入
力されるものである。
Next, the operation will be described. First, LSP
Is input to the bark transform unit 1, and the LSP is obtained by being calculated or decoded by a speech coding device or a speech decoding device, and is used to stabilize LSP parameters and to flatten a spectrum. Is input to the LSP correction device for the purpose of conversion.

【0036】bark変換部1は、LSPを入力する
と、そのLSPの各次元値を線形周波数領域からbar
k周波数領域に変換し、その変換結果であるbark−
LSPをLSP変形部2に出力する。なお、線形周波数
領域からbark周波数領域への変換は、テーブル引き
に基づいて計算する方法と、以下に示すような近似式に
従って変換する方法がある。
When the LSP is input, the bark transform unit 1 converts each dimension value of the LSP from the linear frequency domain into a bar.
k-frequency domain, and the result of the conversion, bark-
The LSP is output to the LSP transformation unit 2. The conversion from the linear frequency domain to the bark frequency domain includes a method of calculating based on a table lookup and a method of performing conversion according to an approximate expression as shown below.

【0037】[0037]

【数1】 (Equation 1)

【0038】そして、LSP変形部2の次元間距離算出
部3は、bark変換部1からbark−LSPを受け
ると、bark−LSPの隣接次元間距離を順番に算出
して、その隣接次元間距離をLSP変形部2の次元間距
離拡張部4に出力する。
When the distance-to-dimension calculating unit 3 of the LSP transforming unit 2 receives the bark-LSP from the barrier transforming unit 1, it calculates the distance between adjacent dimensions of the bark-LSP in order, and calculates the distance between adjacent dimensions. Is output to the inter-dimensional distance extension unit 4 of the LSP transformation unit 2.

【0039】そして、次元間距離拡張部4は、次元間距
離算出部3からbark−LSPの隣接次元間距離を受
けると、その隣接次元間距離を所定の閾値Dと比較し、
その隣接次元間距離が閾値Dを下回る場合には、bar
k−LSPの対応する次元値を補正して、その隣接次元
間距離を広げる処理を実行し、その補正bark−LS
Pをbark逆変換部5に出力する。
Upon receiving the distance between adjacent dimensions of the bark-LSP from the interdimensional distance calculation section 3, the interdimensional distance extension section 4 compares the distance between adjacent dimensions with a predetermined threshold value D.
If the distance between adjacent dimensions is less than the threshold D, bar
A process for correcting the corresponding dimension value of the k-LSP to increase the distance between adjacent dimensions is performed, and the corrected bark-LS
P is output to the inverse inverse transform unit 5.

【0040】具体的には、補正対象のbark−LSP
をb(k)、k=1〜Mとすると、隣接次元間距離d
(k)は下記に示すようになるので、この隣接次元間距
離d(k)が閾値Dを下回ると、下記に示すようにba
rk−LSPの補正処理を実行する。ただし、b’が補
正後のbark−LSPである。 d(k)=b(k+1)−b(k) b’(k) ={b(k)+b(k+1)}/2−D/2 b’(k+1)={b(k)+b(k+1)}/2+D/2
Specifically, the bark-LSP to be corrected is
Where b (k) and k = 1 to M, the distance d between adjacent dimensions
(K) is as shown below, and when the distance d (k) between adjacent dimensions falls below the threshold value D, as shown below, ba
The rk-LSP correction process is performed. Here, b ′ is the corrected bark-LSP. d (k) = b (k + 1) -b (k) b '(k) = {b (k) + b (k + 1)} / 2-D / 2b' (k + 1) = {b (k) + b (k + 1) )} / 2 + D / 2

【0041】なお、次元間距離拡張部4における拡張処
理は、これに限られるものではなく、特開平8−305
397号公報に開示されている方法等様々なものを用い
ることができる。さらに、LSP変形部2の構成につい
ても、この実施の形態1の構成に限定されるものではな
い。
The extension processing in the inter-dimension distance extension unit 4 is not limited to this, but is described in Japanese Patent Laid-Open No. 8-305.
Various methods such as the method disclosed in Japanese Patent No. 397 can be used. Further, the configuration of the LSP deforming unit 2 is not limited to the configuration of the first embodiment.

【0042】そして、bark逆変換部5は、LSP変
形部2から補正bark−LSPを受けると、その補正
bark−LSPの各次元値に対して、bark周波数
領域から線形周波数領域に戻す逆変換処理を実行し、そ
の逆変換結果である補正LSPを出力する。なお、ba
rk周波数領域から線形周波数領域への変換は、テーブ
ル引きに基づいて計算する方法と、以下に示すような近
似式に従って変換する方法がある。この式はbark変
換部1における近似式の逆変換に相当する。
When receiving the corrected bark-LSP from the LSP transforming unit 2, the bark inverse transform unit 5 performs an inverse transform process for returning each dimension value of the corrected bark-LSP from the bark frequency domain to the linear frequency domain. And outputs a corrected LSP as a result of the inverse conversion. In addition, ba
The conversion from the rk frequency domain to the linear frequency domain includes a method of calculating based on a table lookup and a method of performing conversion according to an approximate expression as shown below. This expression corresponds to the inverse conversion of the approximate expression in the bark conversion unit 1.

【0043】[0043]

【数2】 (Equation 2)

【0044】図2はこの実施の形態1によるLSP補正
装置の補正結果を説明する説明図である。図2(a)は
入力LSPであり、この入力LSPは、説明の簡単のた
めに6次としているが、一般にLSPは8〜14次程度
が使用される。図2(b)は入力LSPをbark変換
部1により変換したbark−LSPの例である。ba
rk周波数領域に変換すると、低周波数帯域の隣接次元
間距離が広がり、高周波数帯域の隣接次元間距離が狭く
なる。これは人間の聴覚的な感覚に良く対応する。図2
(c)はbark−LSPに対してLSP変形部2によ
る変形を行った結果である補正bark−LSPの例で
ある。bark周波数領域における隣接次元間距離に関
する閾値Dに基づいてω5とω6の次元間距離が広げら
れている。
FIG. 2 is an explanatory diagram for explaining a correction result of the LSP correction device according to the first embodiment. FIG. 2A shows an input LSP. The input LSP has a sixth order for the sake of simplicity, but generally an LSP of the order of 8 to 14 is used. FIG. 2B is an example of a bark-LSP obtained by converting the input LSP by the bark converting unit 1. ba
When converted to the rk frequency domain, the distance between adjacent dimensions in the low frequency band increases, and the distance between adjacent dimensions in the high frequency band decreases. This corresponds well to the human auditory sensation. FIG.
(C) is an example of a corrected bark-LSP obtained as a result of performing deformation of the bark-LSP by the LSP deforming unit 2. The inter-dimensional distance between ω5 and ω6 is widened based on the threshold value D regarding the distance between adjacent dimensions in the bark frequency domain.

【0045】従来のように線形周波数領域において同様
なLSP変形処理を行った場合、図2(a)における次
元間距離が狭いω1とω2、ω2とω3の間が広げられ
ることになる。しかし、これは聴覚的には、ω5とω6
の間に存在する極が最も急峻に感じられることと対応が
悪い。この実施の形態1の方法では良好にω5とω6の
間隔を広げることができる。
When the same LSP deformation processing is performed in the linear frequency domain as in the conventional case, the distance between ω1 and ω2 and the distance between ω2 and ω3 in FIG. However, this is aurally ω5 and ω6
The pole that exists between the two is felt most steeply, and the response is poor. According to the method of the first embodiment, the interval between ω5 and ω6 can be favorably increased.

【0046】以上で明らかなように、この実施の形態1
によれば、入力LSPの周波数領域を線形周波数領域か
らbark周波数領域に変換してから補正処理を行うよ
うにしたので、全周波数帯域に渡って聴覚的に均等な効
果をもたらすことができる効果を奏する。また、音声符
号化装置と音声復号化装置が多段階に接続されたり、背
景雑音が多い場合でも、低域の劣化を引き起こすことな
く、高域に生じる急峻な極を良好に補正することができ
る効果を奏する。
As is clear from the above, the first embodiment
According to the method described above, since the correction process is performed after converting the frequency domain of the input LSP from the linear frequency domain to the bark frequency domain, an effect that an auditory equal effect can be obtained over the entire frequency band. Play. Further, even when the speech encoding device and the speech decoding device are connected in multiple stages or when there is a lot of background noise, it is possible to satisfactorily correct a steep pole generated in a high frequency band without causing deterioration in a low frequency region. It works.

【0047】なお、bark変換部1の近似式を用いた
LSP補正装置を、音声符号化装置や音声復号化装置に
適用した時に、例えば、高域の符号化特性の劣化が大き
い傾向があったり、逆に低域の補正が弱くて復号音の振
幅が不安定になるような場合には、線形周波数領域とb
ark周波数領域の中間的な周波数領域に変換するよう
に近似式を調整することもできる。この場合には、当然
bark逆変換部5もこれに対応して調整することが必
要である。
When the LSP correction device using the approximation formula of the bark conversion unit 1 is applied to a speech coding device or a speech decoding device, for example, there is a tendency that the degradation of the high-frequency coding characteristic is large. On the contrary, when the low-frequency correction is weak and the amplitude of the decoded sound becomes unstable, the linear frequency domain and b
The approximation formula can be adjusted so as to convert to an intermediate frequency domain of the ark frequency domain. In this case, the bark inverse transform unit 5 also needs to be adjusted accordingly.

【0048】実施の形態2.図3はこの発明の実施の形
態2によるLSP補正装置を示す構成図であり、図にお
いて、6はスペクトルパラメータであるLSPを入力す
ると、そのLSPの周波数領域を線形周波数領域からメ
ル周波数領域(聴覚的特性に対応する周波数領域)に変
換するメル変換部(変換手段)、7はメル変換部6によ
り周波数領域が変換されたLSPを補正するLSP変形
部(補正手段)、8はLSPの隣接次元間距離を算出す
る次元間距離算出部、9は次元間距離算出部8により算
出された隣接次元間距離が所定の閾値を下回るとき、そ
の隣接次元間距離を広げる次元間距離拡張部、10はL
SP変形部7により補正されたLSPの周波数領域を線
形周波数領域に戻すメル逆変換部(逆変換手段)であ
る。
Embodiment 2 FIG. 3 is a block diagram showing an LSP correction apparatus according to Embodiment 2 of the present invention. In FIG. 3, when an LSP which is a spectrum parameter is input, the frequency domain of the LSP is changed from a linear frequency domain to a mel frequency domain (audio Transform unit (conversion means) for converting the LSP into a frequency domain corresponding to the dynamic characteristic, 7 is an LSP transformation unit (correction means) for correcting the LSP whose frequency domain has been transformed by the mel transform unit 6, and 8 is an adjacent dimension of the LSP. When the distance between adjacent dimensions calculated by the distance calculating unit 8 is smaller than a predetermined threshold, the distance between dimension calculating unit 9 for calculating the distance between dimensions is expanded by the dimension distance expanding unit 9 for expanding the distance between adjacent dimensions. L
This is a mel inverse transform unit (inverse transform unit) that returns the frequency domain of the LSP corrected by the SP transforming unit 7 to the linear frequency domain.

【0049】次に動作について説明する。まず、LSP
はメル変換部6に入力されるが、LSPは音声符号化装
置や音声復号化装置等で算出されたり、復号化されたり
して得られたものであり、LSPパラメータの安定化や
スペクトルの平坦化のために、LSP補正装置に入力さ
れるものである。
Next, the operation will be described. First, LSP
Is input to the mel transform unit 6, where the LSP is obtained by being calculated or decoded by a speech coding device or a speech decoding device, etc., and is used to stabilize the LSP parameters and flatten the spectrum. Is input to the LSP correction device for the purpose of conversion.

【0050】メル変換部6は、LSPを入力すると、そ
のLSPの各次元値を線形周波数領域からメル周波数領
域に変換し、その変換結果であるメルLSPをLSP変
形部7に出力する。なお、線形周波数領域からメル周波
数領域への変換は、テーブル引きに基づいて計算する方
法と、以下に示すような近似式に従って変換する方法が
ある。
Upon receiving the LSP, the mel transform unit 6 converts each dimension value of the LSP from the linear frequency domain to the mel frequency domain, and outputs the mel LSP, which is the result of the conversion, to the LSP transforming unit 7. The conversion from the linear frequency domain to the mel frequency domain includes a method of calculating based on a table lookup and a method of performing conversion according to an approximate expression as shown below.

【0051】[0051]

【数3】 (Equation 3)

【0052】そして、LSP変形部7の次元間距離算出
部8は、メル変換部6からメルLSPを受けると、メル
LSPの隣接次元間距離を順番に算出して、その隣接次
元間距離をLSP変形部7の次元間距離拡張部9に出力
する。
Upon receiving the mel LSP from the mel conversion unit 6, the inter-dimensional distance calculation unit 8 of the LSP transformation unit 7 calculates the distance between adjacent dimensions of the mel LSP in order, and calculates the distance between adjacent dimensions to the LSP. Output to the inter-dimension distance extension unit 9 of the deformation unit 7.

【0053】そして、次元間距離拡張部9は、次元間距
離算出部8からメルLSPの隣接次元間距離を受ける
と、その隣接次元間距離を所定の閾値Dと比較し、その
隣接次元間距離が閾値Dを下回る場合には、メルLSP
の対応する次元値を補正して、その隣接次元間距離を広
げる処理を実行し、その補正メルLSPをメル逆変換部
10に出力する。
Upon receiving the distance between adjacent dimensions of the mel LSP from the distance calculating unit 8, the distance expanding unit 9 compares the distance between adjacent dimensions with a predetermined threshold value D, and determines the distance between adjacent dimensions. Is less than the threshold D, the mel LSP
Is performed to increase the distance between adjacent dimensions, and outputs the corrected mel LSP to the mel inverse transform unit 10.

【0054】具体的には、補正対象のメルLSPをm
(k)、k=1〜Mとすると、隣接次元間距離d(k)
は下記に示すようになるので、この隣接次元間距離d
(k)が閾値Dを下回ると、下記に示すようにメルLS
Pの補正処理を実行する。ただし、m’が補正後のメル
LSPである。 d(k)=m(k+1)−m(k) m’(k) ={m(k)+m(k+1)}/2−D/2 m’(k+1)={m(k)+m(k+1)}/2+D/2
Specifically, the mel LSP to be corrected is m
(K), where k = 1 to M, distance d (k) between adjacent dimensions
Is as shown below, and this distance d between adjacent dimensions is
When (k) falls below the threshold value D, as shown below, the mel LS
The P correction process is performed. Here, m ′ is the corrected mel LSP. d (k) = m (k + 1) -m (k) m '(k) = {m (k) + m (k + 1)} / 2-D / 2 m' (k + 1) = {m (k) + m (k + 1) )} / 2 + D / 2

【0055】なお、次元間距離拡張部9における拡張処
理は、これに限られるものではなく、特開平8−305
397号公報に開示されている方法等様々なものを用い
ることができる。さらに、LSP変形部7の構成につい
ても、この実施の形態2の構成に限定されるものではな
い。
The extension processing in the inter-dimension distance extension unit 9 is not limited to this, but is described in Japanese Patent Application Laid-Open No. 8-305.
Various methods such as the method disclosed in Japanese Patent No. 397 can be used. Further, the configuration of the LSP deforming unit 7 is not limited to the configuration of the second embodiment.

【0056】そして、メル逆変換部10は、LSP変形
部7から補正メルLSPを受けると、その補正メルLS
Pの各次元値に対して、メル周波数領域から線形周波数
領域に戻す逆変換処理を実行し、その逆変換結果である
補正LSPを出力する。なお、メル周波数領域から線形
周波数領域への変換は、テーブル引きに基づいて計算す
る方法と、メル変換部6における近似式の逆変換に相当
する計算式によって算出する方法がある。
Then, upon receiving the corrected mel LSP from the LSP transforming section 7, the mel inverse transform section 10 receives the corrected mel LS
For each dimension value of P, an inverse transformation process for returning from the mel frequency domain to the linear frequency domain is performed, and a corrected LSP as a result of the inverse transformation is output. The conversion from the mel frequency domain to the linear frequency domain includes a method of calculating based on a table lookup and a method of calculating using a calculation formula corresponding to the inverse conversion of the approximate expression in the mel conversion unit 6.

【0057】以上で明らかなように、この実施の形態2
によれば、入力LSPの周波数領域を線形周波数領域か
らメル周波数領域に変換してから補正処理を行うように
したので、全周波数帯域に渡って聴覚的に均等な効果を
もたらすことができる効果を奏する。また、音声符号化
装置と音声復号化装置が多段階に接続されたり、背景雑
音が多い場合でも、低域の劣化を引き起こすことなく、
高域に生じる急峻な極を良好に補正することができる効
果を奏する。
As is clear from the above, this embodiment 2
According to the method described above, since the correction process is performed after converting the frequency domain of the input LSP from the linear frequency domain to the mel frequency domain, an effect that can provide an auditory equal effect over the entire frequency band is obtained. Play. Also, even when the audio encoding device and the audio decoding device are connected in multiple stages, or when there is a lot of background noise, without causing deterioration of the low frequency band,
There is an effect that a steep pole generated in a high frequency range can be satisfactorily corrected.

【0058】なお、メル変換部6の近似式を用いたLS
P補正装置を、音声符号化装置や音声復号化装置に適用
した時に、例えば、高域の符号化特性の劣化が大きい傾
向があったり、逆に低域の補正が弱くて復号音の振幅が
不安定になるような場合には、線形周波数領域とメル周
波数領域の中間的な周波数領域に変換するように近似式
を調整することもできる。この場合には、当然メル逆変
換部10もこれに対応して調整することが必要である。
Note that LS using the approximate expression of the mel conversion unit 6
When the P correction device is applied to an audio encoding device or an audio decoding device, for example, the degradation of the high-frequency encoding characteristics tends to be large, or the low-frequency correction is weak and the amplitude of the decoded sound is low. In the case where the frequency becomes unstable, the approximation formula can be adjusted so as to convert to an intermediate frequency region between the linear frequency region and the mel frequency region. In this case, it is, of course, necessary to adjust the mel inverse transform unit 10 accordingly.

【0059】実施の形態3.上記実施の形態1,2で
は、bark周波数領域又はメル周波数領域でLSPを
補正するものについて示したが、図1におけるbark
変換部1を対数周波数変換部(LSPの周波数領域を線
形周波数領域から対数周波数領域に変換する変換部)に
変更するとともに、bark逆変換部5を対数周波数逆
変換部(LSPの周波数領域を線形周波数領域に戻す逆
変換部)に変更し、対数周波数領域でLSPを補正する
ようにしてもよい。また、bark周波数領域,メル周
波数領域又は対数周波数領域以外にも、聴覚的特性と比
較的対応が良い周波数領域に変換してLSPを補正する
ようにしてもよい。
Embodiment 3 In the first and second embodiments, the LSP is corrected in the bar frequency domain or the mel frequency domain.
The conversion unit 1 is changed to a logarithmic frequency conversion unit (a conversion unit that converts the LSP frequency domain from a linear frequency domain to a logarithmic frequency domain), and the bark inverse conversion unit 5 is replaced with a logarithmic frequency inverse conversion unit (the LSP frequency domain (Inverse transform unit that returns to the frequency domain), and the LSP may be corrected in the logarithmic frequency domain. Further, in addition to the bark frequency domain, the mel frequency domain, or the logarithmic frequency domain, the LSP may be corrected by converting to a frequency domain having relatively good correspondence with auditory characteristics.

【0060】以上で明らかなように、この実施の形態3
によれば、入力LSPの周波数領域を線形周波数領域か
ら対数周波数領域に変換してから補正処理を行うように
したので、全周波数帯域に渡って聴覚的に均等な効果を
もたらすことができる効果を奏する。また、音声符号化
装置と音声復号化装置が多段階に接続されたり、背景雑
音が多い場合でも、低域の劣化を引き起こすことなく、
高域に生じる急峻な極を良好に補正することができる効
果を奏する。
As is apparent from the above, the third embodiment
According to the method described above, since the correction process is performed after the frequency domain of the input LSP is converted from the linear frequency domain to the logarithmic frequency domain, an effect that can provide an auditory equal effect over the entire frequency band is obtained. Play. Also, even when the audio encoding device and the audio decoding device are connected in multiple stages, or when there is a lot of background noise, without causing deterioration of the low frequency band,
There is an effect that a steep pole generated in a high frequency range can be satisfactorily corrected.

【0061】実施の形態4.図4はこの発明の実施の形
態4によるLSP補正装置を示す構成図であり、図にお
いて、11はスペクトルパラメータであるLSPを入力
すると、そのLSPの各次元値を基準にして、隣接次元
間距離に関する閾値を各次元毎に算出する閾値算出部
(閾値算出手段)、12はLSPの周波数領域を線形周
波数領域からbark周波数領域(聴覚的特性に対応す
る周波数領域)に変換するbark変換部、13はba
rk変換部12により周波数領域が変換されたbark
−LSPの各次元値に所定の閾値Dの半分値を加減算し
て、その加算結果と減算結果を仮bark値として出力
する仮bark値算出部、14は仮bark値算出部1
3から出力された仮bark値の周波数領域をbark
周波数領域から線形周波数領域に逆変換して、その逆変
換結果を仮周波数値として出力するbark逆変換部、
15はbark逆変換部14から出力された各次元毎の
仮周波数値の差分を算出し、その算出結果を次元間距離
閾値として出力する差分算出部である。
Embodiment 4 FIG. 4 is a block diagram showing an LSP correction apparatus according to Embodiment 4 of the present invention. In FIG. 4, when an LSP which is a spectrum parameter is input, the distance between adjacent dimensions is determined based on each dimension value of the LSP. A threshold calculating unit (threshold calculating means) for calculating a threshold value for each dimension, a bark converting unit for converting an LSP frequency domain from a linear frequency domain to a bark frequency domain (frequency domain corresponding to auditory characteristics), 13 Is ba
bark whose frequency domain has been transformed by the rk transform unit 12
A temporary bank value calculating unit that adds and subtracts a half value of a predetermined threshold value D to each dimension value of the LSP, and outputs the addition result and the subtraction result as a temporary bark value;
3 is the frequency domain of the provisional bark value output from bark
A bark inverse transform unit that performs inverse transform from the frequency domain to the linear frequency domain and outputs the inverse transform result as a provisional frequency value;
Reference numeral 15 denotes a difference calculation unit that calculates a difference between provisional frequency values for each dimension output from the bark inverse transform unit 14 and outputs the calculation result as an inter-dimension distance threshold.

【0062】16は閾値算出部11により算出された各
次元毎の閾値に基づいてLSPを補正するLSP変形部
(補正手段)、17はLSPの隣接次元間距離を算出す
る次元間距離算出部、18は次元間距離算出部17によ
り算出された隣接次元間距離が閾値算出部11から出力
された次元間距離閾値より算出される閾値を下回ると
き、その隣接次元間距離を広げる次元間距離拡張部であ
る。
Reference numeral 16 denotes an LSP deformation unit (correction means) for correcting the LSP based on the threshold value for each dimension calculated by the threshold value calculation unit 11, 17 an inter-dimensional distance calculation unit for calculating the distance between adjacent dimensions of the LSP, Reference numeral 18 denotes an inter-dimension distance extension unit that increases the inter-dimension distance when the inter-dimension distance calculated by the inter-dimension calculation unit 17 is smaller than a threshold calculated from the inter-dimension distance threshold output from the threshold calculation unit 11. It is.

【0063】次に動作について説明する。まず、入力L
SPは閾値算出部11のbark変換部12と、LSP
変形部16の次元間距離算出部17と次元間距離拡張部
18に入力される。bark変換部12は、LSPを入
力すると、そのLSPの各次元値をbark周波数領域
に変換し、その変換結果であるbark−LSPを仮b
ark値算出部13に出力する。
Next, the operation will be described. First, input L
The SP includes a bark converter 12 of the threshold calculator 11 and an LSP
It is input to the inter-dimension distance calculation unit 17 and the inter-dimension distance expansion unit 18 of the deformation unit 16. When the LSP is input, the bark conversion unit 12 converts each dimension value of the LSP into a bark frequency domain, and outputs a bark-LSP, which is a result of the conversion, as a temporary b.
Output to the ark value calculation unit 13.

【0064】そして、仮bark値算出部13は、ba
rk変換部12からbark−LSPを受けると、下記
に示すように、そのbark−LSPの各次元値に所定
の閾値Dの半分値を加減算して、その加算結果と減算結
果を仮bark値としてbark逆変換部14に出力す
る。即ち、各次元毎に、次元値を基準にして2個の仮b
ark値を算出して出力する。 仮bark値=(bark−LSPの各次元値)+D/
2 仮bark値=(bark−LSPの各次元値)−D/
Then, the provisional bark value calculating unit 13
When the bark-LSP is received from the rk conversion unit 12, a half value of a predetermined threshold value D is added to and subtracted from each dimension value of the bark-LSP as described below, and the addition result and the subtraction result are used as a temporary bark value. Output to the bark inverse transform unit 14. That is, for each dimension, two temporary b
Calculate and output the ark value. Temporary bark value = (each dimension value of bark-LSP) + D /
2 Temporary bark value = (bark-each dimension value of LSP)-D /
2

【0065】bark逆変換部14は、仮bark値算
出部13から各次元毎に2個の仮bark値を受ける
と、仮bark値の周波数領域をbark周波数領域か
ら線形周波数領域に逆変換し、その逆変換結果を仮周波
数値として差分算出部15に出力する。
When the bark inverse transform unit 14 receives two temporary bark values for each dimension from the temporary bark value calculation unit 13, the bark inverse transform unit 14 inversely transforms the frequency domain of the temporary bark value from the bark frequency domain to the linear frequency domain. The result of the inverse conversion is output to the difference calculator 15 as a temporary frequency value.

【0066】そして、差分算出部15は、bark逆変
換部14から各次元毎に2個の仮周波数値を受けると、
各次元毎に2個の仮周波数値の差分を算出し、その算出
結果を各次元毎の次元間距離閾値としてLSP変形部1
6に出力する。
When the difference calculating unit 15 receives two provisional frequency values for each dimension from the bark inverse transform unit 14,
A difference between two provisional frequency values is calculated for each dimension, and the calculation result is used as an inter-dimension distance threshold value for each dimension.
6 is output.

【0067】一方、LSP変形部16の次元間距離算出
部17は、LSPを入力すると、そのLSPの隣接次元
間距離を算出する。そして、LSP変形部16の次元間
距離拡張部18は、次元間距離算出部17がLSPの隣
接次元間距離を算出すると、そのLSPの隣接次元間距
離と、閾値算出部11の差分算出部15から出力された
次元間距離閾値より算出される閾値と比較する。そし
て、LSPの隣接次元間距離が閾値を下回る場合、その
入力LSPの対応する次元値を補正して、その隣接次元
間距離を広げる処理を実行する。
On the other hand, when the LSP transformation unit 16 receives the LSP, the interdimensional distance calculation unit 17 calculates the distance between adjacent dimensions of the LSP. Then, when the inter-dimensional distance calculating unit 17 calculates the distance between adjacent dimensions of the LSP, the inter-dimensional distance extending unit 18 of the LSP deforming unit 16 compares the distance between the adjacent dimensions of the LSP with the difference calculating unit 15 of the threshold calculating unit 11. Is compared with the threshold value calculated from the inter-dimensional distance threshold value output from. Then, when the distance between adjacent dimensions of the LSP is smaller than the threshold value, a process of correcting the corresponding dimension value of the input LSP and increasing the distance between adjacent dimensions is executed.

【0068】具体的には、補正対象の入力LSPをf
(k)、k=1〜Mとすると、隣接次元間距離d(k)
は下記に示すようになるので、この隣接次元間距離d
(k)が各次元毎の次元間距離閾値Df(k)から算出
される閾値D’(k)を下回ると、下記に示すように入
力LSPの補正処理を実行する。ただし、f’が補正後
の入力LSPである。 d(k)=f(k+1)−f(k) D’f(k)=(Df(k)+Df(k+1))/2 f’(k) ={f(k)+f(k+1)}/2−D’f(k) f’(k+1)={f(k)+f(k+1)}/2+D’f(k)
Specifically, the input LSP to be corrected is represented by f
(K), where k = 1 to M, distance d (k) between adjacent dimensions
Is as shown below, and this distance d between adjacent dimensions is
When (k) falls below a threshold value D '(k) calculated from the inter-dimension distance threshold value Df (k) for each dimension, the input LSP is corrected as described below. Here, f ′ is the corrected input LSP. d (k) = f (k + 1) -f (k) D'f (k) = (Df (k) + Df (k + 1)) / 2 f '(k) = {f (k) + f (k + 1)} / 2-D'f (k) f '(k + 1) = {f (k) + f (k + 1)} / 2 + D'f (k)

【0069】なお、次元間距離拡張部18における拡張
処理は、これに限られるものではなく、特開平8−30
5397号公報に開示されている方法等様々なものを用
いることができる。さらに、LSP変形部16の構成に
ついても、この実施の形態4の構成に限定されるもので
はない。
The extension processing in the inter-dimension distance extension unit 18 is not limited to this, but is described in
Various methods such as the method disclosed in Japanese Patent No. 5397 can be used. Further, the configuration of LSP deforming section 16 is not limited to the configuration of the fourth embodiment.

【0070】図5はこの実施の形態4によるLSP補正
装置の補正結果を説明する説明図である。図5(a)は
bark変換部12が出力したbark−LSPの第k
次の値b(k)と、これに対応して仮bark値算出部
13が出力した仮bark値bt1(k)とbt2(k)を
示している。仮bark値は、bark−LSPの各次
元値に所定の閾値Dの半分値を加減算して算出される。
図15(b)は図15(a)の仮bark値をbark
逆変換部14が逆変換して出力した仮周波数値f
t1(k)とft2(k)を示している。差分算出部15
は、この2つの仮周波数値の差分をとることで、第k次
の次元間距離閾値Df(k)を算出する。
FIG. 5 is an explanatory diagram for explaining a correction result of the LSP correction device according to the fourth embodiment. FIG. 5A shows the k-th bar-LSP output from the bark conversion unit 12.
The following values b (k) and corresponding temporary bark values b t1 (k) and b t2 (k) output by the temporary bark value calculation unit 13 are shown. The temporary bark value is calculated by adding and subtracting a half value of a predetermined threshold D to each dimension value of the bark-LSP.
FIG. 15B shows the provisional bark value of FIG.
Temporary frequency value f output by inverse conversion by inverse conversion unit 14
t1 (k) and ft2 (k) are shown. Difference calculator 15
Calculates the k-th dimension distance threshold Df (k) by taking the difference between these two provisional frequency values.

【0071】以上で明らかなように、この実施の形態4
によれば、入力LSPの各次元毎の値に応じて、隣接次
元間距離に関する閾値を各次元毎に算出し、この閾値に
基づいて入力LSPの補正を行うようにしたので、各次
元の周波数に最適な閾値に基づいて入力LSPが補正さ
れるようになり、その結果、補正による影響が周波数毎
に差異が出て、適用した音声符号化装置及び音声復号化
装置の符号化復号化品質の劣化を解消できなかったり、
逆に劣化をもたらしてしまう課題を解消することができ
る効果を奏する。
As is apparent from the above, the fourth embodiment
According to the method, the threshold value for the distance between adjacent dimensions is calculated for each dimension according to the value of each dimension of the input LSP, and the input LSP is corrected based on the threshold value. The input LSP is corrected based on the optimal threshold value, and as a result, the influence of the correction is different for each frequency, and the coding / decoding quality of the applied voice coding apparatus and voice decoding apparatus is reduced. Deterioration cannot be eliminated,
On the contrary, there is an effect that the problem of causing deterioration can be solved.

【0072】また、聴覚的特性に対応が良いbark周
波数領域で閾値を算出するようにしたので、全周波数帯
域に渡って聴覚的に均等な効果をもたらすことができる
効果を奏する。さらに、音声符号化装置と音声復号化装
置が多段階に接続されたり、背景雑音が多い場合でも、
低域の劣化を引き起こすことなく、高域に生じる急峻な
極を良好に補正することができる効果を奏する。
Further, since the threshold value is calculated in the bark frequency region having a good correspondence to the auditory characteristics, an effect that an auditory equal effect can be obtained over the entire frequency band is obtained. Furthermore, even when the speech encoding device and speech decoding device are connected in multiple stages, or when there is much background noise,
There is an effect that a steep pole generated in a high frequency can be favorably corrected without causing deterioration in a low frequency.

【0073】なお、bark変換部12の近似式を用い
たLSP補正装置を、音声符号化装置や音声復号化装置
に適用した時に、例えば、高域の符号化特性の劣化が大
きい傾向があったり、逆に低域の補正が弱くて復号音の
振幅が不安定になるような場合には、線形周波数領域と
bark周波数領域の中間的な周波数領域に変換するよ
うに近似式を調整することもできる。この場合には、当
然bark逆変換部14もこれに対応して調整すること
が必要である。
When an LSP correction device using the approximation formula of the bark conversion unit 12 is applied to a speech coding device or a speech decoding device, for example, the degradation of high-frequency coding characteristics tends to be large. On the other hand, if the low-frequency correction is weak and the amplitude of the decoded sound becomes unstable, the approximation formula may be adjusted to convert to an intermediate frequency domain between the linear frequency domain and the bark frequency domain. it can. In this case, the bark inverse transform unit 14 also needs to be adjusted accordingly.

【0074】実施の形態5.図6はこの発明の実施の形
態5によるLSP補正装置を示す構成図であり、図にお
いて、図4と同一符号は同一または相当部分を示すので
説明を省略する。21はスペクトルパラメータであるL
SPを入力すると、そのLSPの各次元値を基準にし
て、隣接次元間距離に関する閾値を各次元毎に算出する
閾値算出部(閾値算出手段)、22はLSPの周波数領
域を線形周波数領域からメル周波数領域(聴覚的特性に
対応する周波数領域)に変換するメル変換部、23はメ
ル変換部22により周波数領域が変換されたメルLSP
の各次元値に所定の閾値Dの半分値を加減算して、その
加算結果と減算結果を仮メル値として出力する仮メル値
算出部、24は仮メル値算出部23から出力された仮メ
ル値の周波数領域をメル周波数領域から線形周波数領域
に逆変換して、その逆変換結果を仮周波数値として出力
するメル逆変換部、25はメル逆変換部24から出力さ
れた各次元毎の仮周波数値の差分を算出し、その算出結
果を次元間距離閾値として出力する差分算出部である。
Embodiment 5 FIG. 6 is a block diagram showing an LSP correction apparatus according to Embodiment 5 of the present invention. In the figure, the same reference numerals as those in FIG. 4 denote the same or corresponding parts, and a description thereof will be omitted. 21 is a spectrum parameter L
When an SP is input, a threshold calculator (threshold calculating means) for calculating a threshold for the distance between adjacent dimensions for each dimension based on each dimension value of the LSP. A mel transform unit 23 for transforming into a frequency domain (frequency domain corresponding to auditory characteristics), and a mel LSP 23 whose frequency domain is transformed by the mel transform unit 22
A temporary mel value calculator that adds and subtracts a half value of a predetermined threshold value D to and from each dimension value and outputs the addition result and the subtraction result as a temporary mel value. A mel inverse transform unit that inversely transforms the frequency domain of the value from the mel frequency domain to the linear frequency domain and outputs the result of the inverse transform as a temporary frequency value. This is a difference calculation unit that calculates the difference between the frequency values and outputs the calculation result as a distance threshold between dimensions.

【0075】次に動作について説明する。まず、入力L
SPは閾値算出部21のメル変換部22と、LSP変形
部16の次元間距離算出部17と次元間距離拡張部18
に入力される。メル変換部22は、LSPを入力する
と、そのLSPの各次元値をメル周波数領域に変換し、
その変換結果であるメルLSPを仮メル値算出部23に
出力する。
Next, the operation will be described. First, input L
The SP is the mel conversion unit 22 of the threshold value calculation unit 21, the inter-dimension distance calculation unit 17 of the LSP deformation unit 16, and the inter-dimension distance expansion unit 18
Is input to Upon input of the LSP, the mel transform unit 22 converts each dimension value of the LSP into a mel frequency domain,
The mel LSP as a result of the conversion is output to the provisional mel value calculation unit 23.

【0076】そして、仮メル値算出部23は、メル変換
部22からメルLSPを受けると、下記に示すように、
そのメルLSPの各次元値に所定の閾値Dの半分値を加
減算して、その加算結果と減算結果を仮メル値としてメ
ル逆変換部24に出力する。即ち、各次元毎に、次元値
を基準にして2個の仮メル値を算出して出力する。 仮メル値=メルLSPの各次元値+D/2 仮メル値=メルLSPの各次元値−D/2
Upon receiving the mel LSP from the mel conversion unit 22, the temporary mel value calculation unit 23 calculates
A half value of a predetermined threshold value D is added to and subtracted from each dimension value of the mel LSP, and the addition result and the subtraction result are output to the mel inverse conversion unit 24 as a temporary mel value. That is, for each dimension, two temporary mel values are calculated and output based on the dimension value. Temporary Mel Value = Each Dimension Value of Mel LSP + D / 2 Temporary Mel Value = Each Dimension Value of Mel LSP−D / 2

【0077】メル逆変換部24は、仮メル値算出部23
から各次元毎に2個の仮メル値を受けると、仮メル値の
周波数領域をメル周波数領域から線形周波数領域に逆変
換し、その逆変換結果を仮周波数値として差分算出部2
5に出力する。
The inverse mel conversion unit 24 is provided with a temporary mel value calculation unit 23.
When two temporary mel values are received for each dimension from, the frequency domain of the tentative mel value is inversely transformed from the mel frequency domain to the linear frequency domain, and the result of the inverse transformation is used as a tentative frequency value in the difference calculation unit 2.
5 is output.

【0078】そして、差分算出部25は、メル逆変換部
24から各次元毎に2個の仮周波数値を受けると、各次
元毎に2個の仮周波数値の差分を算出し、その算出結果
を各次元毎の次元間距離閾値としてLSP変形部16に
出力する。以降のLSP変形部16の動作は上記実施の
形態4と同様であるため説明を省略する。
Upon receiving the two provisional frequency values for each dimension from the mel inverse transform unit 24, the difference calculation unit 25 calculates the difference between the two provisional frequency values for each dimension, and calculates the result. Is output to the LSP transformation unit 16 as an inter-dimensional distance threshold for each dimension. Subsequent operations of the LSP deforming unit 16 are the same as those of the fourth embodiment, and thus description thereof is omitted.

【0079】以上で明らかなように、この実施の形態5
によれば、入力LSPの各次元毎の値に応じて、隣接次
元間距離に関する閾値を各次元毎に算出し、この閾値に
基づいて入力LSPの補正を行うようにしたので、各次
元の周波数に最適な閾値に基づいて入力LSPが補正さ
れるようになり、その結果、補正による影響が周波数毎
に差異が出て、適用した音声符号化装置及び音声復号化
装置の符号化復号化品質の劣化を解消できなかったり、
逆に劣化をもたらしてしまう課題を解消することができ
る効果を奏する。
As is apparent from the above, the fifth embodiment
According to the method, the threshold value for the distance between adjacent dimensions is calculated for each dimension according to the value of each dimension of the input LSP, and the input LSP is corrected based on the threshold value. The input LSP is corrected based on the optimal threshold value, and as a result, the influence of the correction is different for each frequency, and the coding / decoding quality of the applied voice coding apparatus and voice decoding apparatus is reduced. Deterioration cannot be eliminated,
On the contrary, there is an effect that the problem of causing deterioration can be solved.

【0080】また、聴覚的特性に対応が良いメル周波数
領域で閾値を算出するようにしたので、全周波数帯域に
渡って聴覚的に均等な効果をもたらすことができる効果
を奏する。さらに、音声符号化装置と音声復号化装置が
多段階に接続されたり、背景雑音が多い場合でも、低域
の劣化を引き起こすことなく、高域に生じる急峻な極を
良好に補正することができる効果を奏する。
Further, since the threshold value is calculated in the mel frequency region having a good response to the auditory characteristics, an effect that an auditory equal effect can be obtained over the entire frequency band is achieved. Furthermore, even when the speech encoding device and the speech decoding device are connected in multiple stages or there is a lot of background noise, it is possible to satisfactorily correct a steep pole generated in a high frequency band without causing deterioration in a low frequency region. It works.

【0081】なお、メル変換部22の近似式を用いたL
SP補正装置を、音声符号化装置や音声復号化装置に適
用した時に、例えば、高域の符号化特性の劣化が大きい
傾向があったり、逆に低域の補正が弱くて復号音の振幅
が不安定になるような場合には、線形周波数領域とメル
周波数領域の中間的な周波数領域に変換するように近似
式を調整することもできる。この場合には、当然メル逆
変換部24もこれに対応して調整することが必要であ
る。
Note that L using the approximate expression of the mel conversion unit 22
When the SP correction device is applied to a voice coding device or a voice decoding device, for example, the degradation of the high-frequency coding characteristics tends to be large, or the low-frequency correction is weak and the amplitude of the decoded sound is low. In the case where the frequency becomes unstable, the approximation formula can be adjusted so as to convert to an intermediate frequency region between the linear frequency region and the mel frequency region. In this case, it is necessary to adjust the mel inverse transform unit 24 accordingly.

【0082】実施の形態6.上記実施の形態4,5で
は、bark周波数領域又はメル周波数領域での計算に
より閾値を算出するものについて示したが、図4におけ
るbark変換部12を対数周波数変換部(LSPの周
波数領域を線形周波数領域から対数周波数領域に変換す
る変換部)に変更し、仮bark値算出部13を仮対数
周波数算出部(仮対数周波数値を算出する算出部)に変
更し、さらに、bark逆変換部14を対数周波数逆変
換部(LSPの周波数領域を線形周波数領域に戻す逆変
換部)に変更し、対数周波数領域での計算により閾値を
算出するようにしてもよい。また、bark周波数領
域,メル周波数領域又は対数周波数領域以外にも、聴覚
的特性と比較的対応が良い周波数領域での計算により閾
値を算出するようにしてもよい。
Embodiment 6 FIG. In the above fourth and fifth embodiments, the calculation of the threshold by the calculation in the bark frequency domain or the mel frequency domain has been described. However, the bark transform unit 12 in FIG. To a logarithmic frequency domain), the temporary bark value calculator 13 is changed to a temporary logarithmic frequency calculator (calculator for calculating a temporary logarithmic frequency value), and the bark inverse converter 14 The threshold may be calculated by changing to a logarithmic frequency inverse transform unit (an inverse transform unit for returning the frequency domain of the LSP to the linear frequency domain) and calculating in the logarithmic frequency domain. In addition, the threshold may be calculated by calculation in a frequency domain having relatively good correspondence with auditory characteristics, in addition to the bark frequency domain, the mel frequency domain, or the logarithmic frequency domain.

【0083】実施の形態7.図7はこの発明の実施の形
態7によるLSP補正装置を示す構成図であり、図にお
いて、図4と同一符号は同一または相当部分を示すので
説明を省略する。31は差分算出部15により算出され
た各次元毎の次元間距離閾値と、線形周波数領域で定義
された固定閾値を比較し、大きい方の閾値をLSP変形
部16に出力する最大値選択部である。
Embodiment 7 FIG. FIG. 7 is a block diagram showing an LSP correction apparatus according to Embodiment 7 of the present invention. In the figure, the same reference numerals as those in FIG. 4 denote the same or corresponding parts, and a description thereof will be omitted. Reference numeral 31 denotes a maximum value selection unit that compares the inter-dimension distance threshold calculated for each dimension by the difference calculation unit 15 with a fixed threshold defined in the linear frequency domain, and outputs the larger threshold to the LSP transformation unit 16. is there.

【0084】上記実施の形態4では、差分算出部15に
より算出された各次元毎の次元間距離閾値を常にLSP
変形部16に出力するものについて示したが、最大値選
択部31が差分算出部15により算出された各次元毎の
次元間距離閾値と、線形周波数領域で定義された固定閾
値を比較し、大きい方の閾値をLSP変形部16に出力
するようにしてもよい。
In the fourth embodiment, the inter-dimension distance threshold for each dimension calculated by the difference calculator 15 is always set to the LSP.
Although the output to the transformation unit 16 is shown, the maximum value selection unit 31 compares the inter-dimension distance threshold calculated for each dimension by the difference calculation unit 15 with the fixed threshold defined in the linear frequency domain, and The other threshold may be output to the LSP transformation unit 16.

【0085】この実施の形態7によれば、入力LSPの
各次元毎の値に応じて、隣接次元間の距離に関する閾値
を聴覚的特性に対応が良い周波数領域で算出し、これと
線形周波数領域で定義される閾値の内の最大値を最終的
な閾値とするようにしたので、上記実施の形態4が奏す
る効果に加えて、全周波数帯域に渡って聴覚的に均等な
効果をもたらし、かつ、不安定なLSP(低域で次元間
距離が近づき過ぎてLSPのフィルタゲインが大きくな
り過ぎる状態)を出力することがないLSP補正装置が
提供できる効果を奏する。
According to the seventh embodiment, in accordance with the value of each dimension of the input LSP, the threshold value for the distance between adjacent dimensions is calculated in the frequency domain having a good correspondence to the auditory characteristics. Since the maximum value among the threshold values defined in is set as the final threshold value, in addition to the effect of the fourth embodiment, an acoustically uniform effect is provided over the entire frequency band, and And an LSP correction device that does not output an unstable LSP (a state in which the inter-dimensional distance is too small in a low frequency range and the filter gain of the LSP is too large) is provided.

【0086】なお、この実施の形態7では、上記実施の
形態4のLSP補正装置に最大値選択部31を適用する
ものについて示したが、上記実施の形態5,6のLSP
補正装置に最大値選択部31を適用するようにしてもよ
い。
In the seventh embodiment, the case where the maximum value selector 31 is applied to the LSP correction device of the fourth embodiment has been described.
The maximum value selection unit 31 may be applied to the correction device.

【0087】実施の形態8.図8はこの発明の実施の形
態8によるLSP補正装置を示す構成図であり、図にお
いて、図4と同一符号は同一または相当部分を示すので
説明を省略する。32はスペクトルパラメータであるL
SPを入力すると、そのLSPの各次元値(周波数値)に
近い2つの周波数値を周波数対閾値テーブル33から探
索し、2つの周波数値に基づいて各次元の次元間距離閾
値を算出する閾値算出部(閾値算出手段)、33は代表
的な周波数値と代表的な周波数値に対応する閾値を格納
する周波数対閾値テーブル、34は代表的な周波数値に
対応する2個の閾値を検索するとともに、2個の閾値を
補間する補間部である。
Embodiment 8 FIG. FIG. 8 is a configuration diagram showing an LSP correction apparatus according to Embodiment 8 of the present invention. In the figure, the same reference numerals as those in FIG. 4 denote the same or corresponding parts, and a description thereof will not be repeated. 32 is a spectrum parameter L
When an SP is input, two frequency values close to each dimension value (frequency value) of the LSP are searched from the frequency-to-threshold table 33, and a threshold calculation for calculating an inter-dimensional distance threshold of each dimension based on the two frequency values is performed. Unit (threshold value calculating means), 33 is a frequency-to-threshold table for storing a representative frequency value and a threshold value corresponding to the representative frequency value, and 34 is for searching for two threshold values corresponding to the representative frequency value. And an interpolation unit for interpolating two threshold values.

【0088】次に動作について説明する。上記実施の形
態4〜7では、bark周波数領域又はメル周波数領域
での計算により閾値を算出するものについて示したが、
入力LSPの各次元値に近い2つの周波数値を周波数対
閾値テーブル33から探索し、2つの周波数値に基づい
て各次元の次元間距離閾値を算出するようにしてもよ
い。
Next, the operation will be described. In the above fourth to seventh embodiments, the calculation of the threshold by the calculation in the bark frequency domain or the mel frequency domain has been described.
Two frequency values close to each dimension value of the input LSP may be searched from the frequency-threshold table 33, and the inter-dimension distance threshold of each dimension may be calculated based on the two frequency values.

【0089】具体的には、まず、閾値算出部32の補間
部34が、入力LSPの各次元値(周波数値)に近い2つ
の周波数値を周波数対閾値テーブル33から探索する。
そして、補間部34は、2つの周波数値を検索すると、
その2つの周波数値に対応する2個の閾値を周波数対閾
値テーブル33から取得する。
More specifically, first, the interpolator 34 of the threshold calculator 32 searches the frequency-threshold table 33 for two frequency values close to each dimension value (frequency value) of the input LSP.
Then, when the interpolation unit 34 searches for two frequency values,
Two threshold values corresponding to the two frequency values are obtained from the frequency-threshold table 33.

【0090】そして、補間部34は、2つの周波数値と
入力LSPにおける当該次数値の差に応じて2個の閾値
の重み付け加算を実行し、当該次数の次元間距離閾値を
算出する。この算出処理を各次数に対して実行し、次元
毎の次元間距離閾値をLSP変形部16の次元間距離拡
張部18に出力する。以降のLSP変形部16の動作は
上記実施の形態4と同様であるため説明を省略する。
Then, the interpolation unit 34 performs weighted addition of the two thresholds according to the difference between the two frequency values and the order value in the input LSP, and calculates the dimension distance threshold of the order. This calculation process is executed for each order, and the dimension distance threshold for each dimension is output to the dimension extension section 18 of the LSP deforming section 16. Subsequent operations of the LSP deforming unit 16 are the same as those of the fourth embodiment, and thus description thereof is omitted.

【0091】以上で明らかなように、この実施の形態8
によれば、入力LSPの各次元毎の値に応じて、隣接次
元間距離に関する閾値を各次元毎に算出し、この閾値に
基づいて入力LSPの補正を行うようにしたので、各次
元の周波数に最適な閾値に基づいて入力LSPが補正さ
れるようになり、その結果、補正による影響が周波数毎
に差異が出て、適用した音声符号化装置及び音声復号化
装置の符号化復号化品質の劣化を解消できなかったり、
逆に劣化をもたらしてしまう課題を解消することができ
る効果を奏する。
As is clear from the above, this embodiment 8
According to the method, the threshold value for the distance between adjacent dimensions is calculated for each dimension according to the value of each dimension of the input LSP, and the input LSP is corrected based on the threshold value. The input LSP is corrected based on the optimal threshold value, and as a result, the influence of the correction is different for each frequency, and the coding / decoding quality of the applied voice coding apparatus and voice decoding apparatus is reduced. Deterioration cannot be eliminated,
On the contrary, there is an effect that the problem of causing deterioration can be solved.

【0092】また、音声符号化装置と音声復号化装置が
多段階に接続されたり、背景雑音が多い場合でも、低域
の劣化を引き起こすことなく、高域に生じる急峻な極を
良好に補正することができる効果を奏する。なお、上記
実施の形態4と比べると、テーブルのためのメモリが新
たに必要になるが、処理が簡単になる効果を奏する。
Further, even when the speech encoding device and the speech decoding device are connected in multiple stages or when there is a lot of background noise, the steep pole generated in the high frequency range is corrected well without causing deterioration in the low frequency range. The effect that can be achieved. Although a new memory for the table is required as compared with the fourth embodiment, the effect of simplifying the processing is obtained.

【0093】実施の形態9.図9はこの発明の実施の形
態9による音声符号化装置を示す構成図であり、図にお
いて、図1と同一符号は同一または相当部分を示すので
説明を省略する。41は入力音声を分析してLSPを算
出するLSP分析部(LSP分析手段)、42はLSP
分析部41により算出されたLSPを補正するLSP補
正装置、43はLSP補正装置42が出力する補正LS
Pを符号化してLSP符号と量子化LSPを出力するL
SP符号化部(LSP符号化手段)、44はLSP符号
化部43から出力された量子化LSPと入力音声から符
号化音源(音源符号)を算出する音源符号化部(音源符
号化手段)である。
Embodiment 9 FIG. FIG. 9 is a block diagram showing a speech encoding apparatus according to Embodiment 9 of the present invention. In the figure, the same reference numerals as those in FIG. 1 denote the same or corresponding parts, and a description thereof will be omitted. 41 is an LSP analysis unit (LSP analysis means) for analyzing an input voice to calculate an LSP, and 42 is an LSP
An LSP correction device for correcting the LSP calculated by the analysis unit 41, and a correction LS 43 output by the LSP correction device 42
L that encodes P and outputs an LSP code and a quantized LSP
An SP encoding unit (LSP encoding unit) 44 is an excitation encoding unit (excitation encoding unit) that calculates an encoded excitation (excitation code) from the quantized LSP output from the LSP encoding unit 43 and the input speech. is there.

【0094】次に動作について説明する。まず、LSP
分析部41は、入力音声を入力すると、その入力音声を
分析してLSPを算出し、そのLSPをLSP補正装置
42に出力する。なお、LSPの算出は、線形予測分析
を実行して線形予測係数を計算し、これを変換して求め
るのが一般的である。
Next, the operation will be described. First, LSP
When the input voice is input, the analysis unit 41 analyzes the input voice, calculates an LSP, and outputs the LSP to the LSP correction device 42. In general, the LSP is calculated by performing a linear prediction analysis, calculating a linear prediction coefficient, and converting the coefficient.

【0095】そして、LSP補正装置42は、LSP分
析部41からLSPを受けると、上記実施の形態1と同
様の手順でLSPの補正を実施し、その補正LSPをL
SP符号化部43に出力する。そして、LSP符号化部
43は、LSP補正装置42が補正LSPを出力する
と、その補正LSPを符号化してLSP符号を出力する
とともに、例えば、符号化処理の途中の段階で得られる
量子化LSP(量子化LSPは符号化復号化結果に相当
する)を音源符号化部44に出力する。
When receiving the LSP from the LSP analysis unit 41, the LSP correction unit 42 corrects the LSP in the same procedure as in the first embodiment, and converts the corrected LSP to the LSP.
Output to the SP encoder 43. Then, when the LSP correction device 42 outputs the corrected LSP, the LSP encoding unit 43 encodes the corrected LSP and outputs an LSP code. For example, the LSP encoding unit 43 obtains a quantized LSP ( (The quantized LSP is equivalent to the result of encoding and decoding.)

【0096】音源符号化部44は、LSP符号化部43
から量子化LSPを受けると、その量子化LSPを用い
て、入力音声の音源情報を符号化し、その符号化結果を
音源符号として出力する。
[0096] Excitation encoding section 44 includes LSP encoding section 43.
Receives the quantized LSP from the source codec, it encodes the sound source information of the input voice using the quantized LSP, and outputs the coding result as a sound source code.

【0097】なお、この実施の形態9では、上記実施の
形態1のLSP補正装置を適用するものについて示した
が、上記実施の形態2〜8のLSP補正装置を適用する
ようにしてもよい。また、LSP分析部41の入力を復
号音声に変更して、特開平5−273997号公報のよ
うにバックワード型のCELP系構成にしてもかまわな
い。
In the ninth embodiment, the LSP correction apparatus of the first embodiment is applied. However, the LSP correction apparatuses of the second to eighth embodiments may be applied. Alternatively, the input of the LSP analysis unit 41 may be changed to a decoded speech, and a backward CELP system configuration as disclosed in Japanese Patent Application Laid-Open No. Hei 5-273997 may be employed.

【0098】以上で明らかなように、この実施の形態9
によれば、入力音声を分析して算出したLSPをLSP
補正装置42が補正し、その補正LSPを符号化するよ
うにしたので、入力音声の歪や分析誤差に伴う品質劣化
を良好に抑制することができる効果を奏する。
As is apparent from the above, the ninth embodiment
According to the LSP calculated by analyzing the input voice,
Since the correction device 42 corrects and encodes the corrected LSP, there is an effect that the quality degradation due to the distortion of the input voice and the analysis error can be suppressed well.

【0099】特に、LSP補正装置42がLSPを補正
しているので、LSPの各次元の周波数に最適な閾値が
算出することができるようになり、その結果、補正によ
る影響が周波数毎に差異が出て符号化復号化品質の劣化
を解消できなかったり、逆に劣化をもたらしてしまう課
題を解消することができる効果を奏する。また、聴覚的
特性に対応が良い周波数領域に変換してからLSPの補
正処理を行うようにした場合には、全周波数帯域に渡っ
て聴覚的に均等な効果をもたらすLSP補正が実現され
るため、良好な符号化特性が得られる効果を奏する。さ
らに、この音声符号化装置と、対応する音声復号化装置
が多段階に接続されたり、背景雑音が多い場合でも、低
域の劣化を引き起こすことなく、高域に生じる急峻な極
を良好に補正して、良好な符号化特性が得られる効果を
奏する。
In particular, since the LSP correction device 42 corrects the LSP, it becomes possible to calculate the optimum threshold value for the frequency of each dimension of the LSP, and as a result, the effect of the correction is different for each frequency. There is an effect that it is possible to solve the problem that the degradation of the encoding / decoding quality cannot be eliminated or the degradation is caused. In addition, if the LSP correction process is performed after converting to a frequency region having good correspondence to the auditory characteristics, LSP correction that provides an auditory equal effect over the entire frequency band is realized. This provides an effect that good coding characteristics can be obtained. Furthermore, even when the speech encoding device and the corresponding speech decoding device are connected in multiple stages or when there is a lot of background noise, the steep poles generated in the high frequency range can be satisfactorily corrected without causing deterioration in the low frequency range. As a result, there is an effect that a good encoding characteristic can be obtained.

【0100】実施の形態10.図10はこの発明の実施
の形態10による音声符号化装置を示す構成図であり、
図において、図9と同一符号は同一または相当部分を示
すので説明を省略する。45はLSP分析部41により
算出されたLSPを符号化してLSP符号を出力するL
SP符号化部(LSP符号化手段)、46はLSP符号
化部45から出力されたLSP符号を復号化して復号L
SPを出力するLSP復号化部(LSP復号化手段)、
47はLSP復号化部46が出力する復号LSPを補正
するLSP補正装置、48はLSP補正装置47により
補正された復号LSPと入力音声から符号化音源(音源
符号)を算出する音源符号化部(音源符号化手段)であ
る。
Embodiment 10 FIG. FIG. 10 is a configuration diagram showing a speech encoding apparatus according to Embodiment 10 of the present invention.
9, the same reference numerals as those in FIG. 9 denote the same or corresponding parts, and a description thereof will not be repeated. Reference numeral 45 denotes L for encoding the LSP calculated by the LSP analysis unit 41 and outputting an LSP code
The SP encoder (LSP encoder) 46 decodes the LSP code output from the LSP encoder 45 to decode LSP code.
An LSP decoding unit that outputs SP (LSP decoding means);
Reference numeral 47 denotes an LSP correction device for correcting the decoded LSP output from the LSP decoding unit 46, and reference numeral 48 denotes a sound source coding unit (calculated from the decoded LSP corrected by the LSP correction device 47 and the input voice, which calculates an encoded sound source (sound source code)). (Excitation coding means).

【0101】次に動作について説明する。まず、LSP
分析部41は、入力音声を入力すると、上記実施の形態
9と同様に、その入力音声を分析してLSPを算出し、
そのLSPをLSP符号化部45に出力する。
Next, the operation will be described. First, LSP
When inputting the input voice, the analysis unit 41 analyzes the input voice and calculates the LSP, as in the ninth embodiment.
The LSP is output to the LSP encoder 45.

【0102】そして、LSP符号化部45は、LSP分
析部41からLSPを受けると、そのLSPを符号化し
てLSP符号を出力する。そして、LSP復号化部46
は、LSP符号化部45がLSP符号を出力すると、そ
のLSP符号を復号化して復号LSPをLSP補正装置
47に出力する。
Then, when receiving the LSP from the LSP analyzer 41, the LSP encoder 45 encodes the LSP and outputs an LSP code. Then, the LSP decoding unit 46
When the LSP encoding unit 45 outputs the LSP code, the LSP encoding unit 45 decodes the LSP code and outputs the decoded LSP to the LSP correction device 47.

【0103】LSP補正装置47は、LSP復号化部4
6から復号LSPを受けると、上記実施の形態1と同様
の手順で復号LSPの補正を実施し、その補正LSPを
音源符号化部48に出力する。そして、音源符号化部4
8は、LSP補正装置47から補正LSPを受けると、
その補正LSPを用いて、入力音声の音源情報を符号化
し、その符号化結果を音源符号として出力する。
The LSP correction unit 47 includes an LSP decoding unit 4
When the decoding LSP is received from 6, the decoding LSP is corrected in the same procedure as in the first embodiment, and the corrected LSP is output to excitation coding section 48. Then, excitation coding section 4
8 receives the correction LSP from the LSP correction device 47,
The sound source information of the input voice is encoded using the corrected LSP, and the encoded result is output as a sound source code.

【0104】なお、この実施の形態10では、上記実施
の形態1のLSP補正装置を適用するものについて示し
たが、上記実施の形態2〜8のLSP補正装置を適用す
るようにしてもよい。
In the tenth embodiment, the LSP correction apparatus of the first embodiment is applied. However, the LSP correction apparatuses of the second to eighth embodiments may be applied.

【0105】以上で明らかなように、この実施の形態1
0によれば、LSP補正装置47が復号LSPを補正
し、その補正LSPを使って音源情報の符号化を行うよ
うにしたので、LSPの符号化歪(量子化歪)による復号
音の不安定化を良好に抑制することができる効果を奏す
る。
As is apparent from the above, the first embodiment
According to 0, the LSP correction device 47 corrects the decoded LSP and encodes the excitation information using the corrected LSP, so that the decoded sound becomes unstable due to LSP coding distortion (quantization distortion). This has the effect of successfully suppressing the formation.

【0106】特に、LSP補正装置47がLSPを補正
しているので、LSPの各次元の周波数に最適な閾値が
算出することができるようになり、その結果、補正によ
る影響が周波数毎に差異が出て符号化復号化品質の劣化
を解消できなかったり、逆に劣化をもたらしてしまう課
題を解消することができる効果を奏する。また、聴覚的
特性に対応が良い周波数領域に変換してからLSPの補
正処理を行うようにした場合には、全周波数帯域に渡っ
て聴覚的に均等な効果をもたらすLSP補正が実現され
るため、良好な符号化特性が得られる効果を奏する。さ
らに、この音声符号化装置と、対応する音声復号化装置
が多段階に接続されたり、背景雑音が多い場合でも、低
域の劣化を引き起こすことなく、高域に生じる急峻な極
を良好に補正して、良好な符号化特性が得られる効果を
奏する。
In particular, since the LSP correction device 47 corrects the LSP, it becomes possible to calculate the optimum threshold value for the frequency of each dimension of the LSP, and as a result, the influence of the correction is different for each frequency. There is an effect that it is possible to solve the problem that the degradation of the encoding / decoding quality cannot be eliminated or the degradation is caused. In addition, if the LSP correction process is performed after converting to a frequency region having good correspondence to the auditory characteristics, LSP correction that provides an auditory equal effect over the entire frequency band is realized. This provides an effect that good coding characteristics can be obtained. Furthermore, even when the speech encoding device and the corresponding speech decoding device are connected in multiple stages or when there is a lot of background noise, the steep poles generated in the high frequency range can be satisfactorily corrected without causing deterioration in the low frequency range. As a result, there is an effect that a good encoding characteristic can be obtained.

【0107】実施の形態11.図11はこの発明の実施
の形態11による音声復号化装置を示す構成図であり、
図において、図1と同一符号は同一または相当部分を示
すので説明を省略する。51はLSP符号を復号化して
復号LSPを出力するLSP復号化部(LSP復号化手
段)、52はLSP復号化部51が出力する復号LSP
を補正するLSP補正装置、53は音源符号を復号化し
て音源信号を生成する音源復号化部(音源復号化手
段)、54はLSP補正装置52が出力する補正LSP
と音源復号化部53により生成された音源信号から合成
音を生成する合成フィルタ(合成手段)である。
Embodiment 11 FIG. FIG. 11 is a configuration diagram showing a speech decoding apparatus according to Embodiment 11 of the present invention.
In the figure, the same reference numerals as those in FIG. 51 is an LSP decoding unit (LSP decoding means) for decoding the LSP code and outputting a decoded LSP, 52 is a decoded LSP output from the LSP decoding unit 51
A sound source decoding unit (sound source decoding means) for decoding a sound source code to generate a sound source signal, and a correction LSP output from the LSP correction device 52.
And a synthesis filter (synthesis unit) for generating a synthesized sound from the sound source signal generated by the sound source decoding unit 53.

【0108】次に動作について説明する。まず、LSP
復号化部51は、LSP符号を入力すると、そのLSP
符号を復号化して復号LSPをLSP補正装置52に出
力する。このLSP符号は、上記実施の形態10で説明
した音声符号化装置等から出力されたものである。
Next, the operation will be described. First, LSP
When the decoding unit 51 receives the LSP code, the LSP code
The code is decoded and the decoded LSP is output to the LSP correction device 52. This LSP code is output from the speech coding device or the like described in the tenth embodiment.

【0109】LSP補正装置52は、LSP復号化部5
1から復号LSPを受けると、上記実施の形態1と同様
の手順で復号LSPの補正を実施し、その補正LSPを
合成フィルタ54に出力する。一方、音源復号化部53
は、音源符号を入力すると、その音源符号を復号化して
音源信号を生成し、その音源信号を合成フィルタ54に
出力する。
The LSP correction device 52 includes an LSP decoding unit 5
When receiving the decoded LSP from the first LSP, the decoding LSP is corrected in the same procedure as in the first embodiment, and the corrected LSP is output to the synthesis filter 54. On the other hand, the sound source decoding unit 53
Receives the excitation code, generates the excitation signal by decoding the excitation code, and outputs the excitation signal to the synthesis filter 54.

【0110】そして、合成フィルタ54は、LSP補正
装置52から補正LSPを受けると、その補正LSPを
用いて、その音源信号に対する合成フィルタリング処理
を実行し、その結果得られた合成音を出力音声として出
力する。なお、この実施の形態11では、上記実施の形
態1のLSP補正装置を適用するものについて示した
が、上記実施の形態2〜8のLSP補正装置を適用する
ようにしてもよい。
When receiving the corrected LSP from the LSP corrector 52, the synthesis filter 54 performs a synthesis filtering process on the sound source signal using the corrected LSP, and uses the resulting synthesized sound as an output voice. Output. In the eleventh embodiment, the LSP correction device of the first embodiment is applied. However, the LSP correction device of the second to eighth embodiments may be applied.

【0111】以上で明らかなように、この実施の形態1
1によれば、LSP補正装置52が復号LSPを補正
し、その補正LSPを使って合成フィルタリング処理を
行うようにしたので、LSP符号の伝送誤りによる復号
音の不安定化を良好に抑制することができる効果を奏す
る。また、上記実施の形態10の音声符号化装置等が出
力するLSP符号を入力として、音声復号化装置のLS
P補正装置52を音声符号化装置のLSP補正装置と同
様のものにする場合には、LSPの符号化歪(量子化歪)
による復号音の不安定化を良好に抑制した音声復号化装
置が提供できる効果を奏する。
As is clear from the above, the first embodiment
According to No. 1, since the LSP correction device 52 corrects the decoded LSP and performs the synthesis filtering process using the corrected LSP, it is possible to appropriately suppress the instability of the decoded sound due to the transmission error of the LSP code. It has the effect of being able to. Further, the LSP code output from the speech encoding device or the like according to the tenth embodiment is input and the LS
When the P correction device 52 is the same as the LSP correction device of the speech coding device, the LSP coding distortion (quantization distortion)
Thus, it is possible to provide an audio decoding device that can appropriately suppress the instability of the decoded sound due to.

【0112】特に、LSP補正装置52が復号LSPを
補正しているので、復号LSPの各次元の周波数に最適
な閾値が算出することができるようになり、その結果、
補正による影響が周波数毎に差異が出て符号化復号化品
質の劣化を解消できなかったり、逆に劣化をもたらして
しまう課題を解消することができる効果を奏する。ま
た、聴覚的特性に対応が良い周波数領域に変換してから
LSPの補正処理を行うようにした場合には、全周波数
帯域に渡って聴覚的に均等な効果をもたらすLSP補正
が実現されるため、良好な復号化特性が得られる効果が
ある。さらに、この音声復号化装置に対応する音声符号
化装置と、この音声復号化装置が多段階に接続された
り、音声符号化装置に入力される背景雑音が多い場合で
も、低域の劣化を引き起こすことなく、高域に生じる急
峻な極を良好に補正して、良好な復号化特性が得られる
効果を奏する。
In particular, since the LSP correction device 52 corrects the decoded LSP, it becomes possible to calculate the optimum threshold value for the frequency of each dimension of the decoded LSP.
There is an effect that it is possible to solve the problem that the influence of the correction is different for each frequency and the degradation of the encoding / decoding quality cannot be eliminated, or the degradation of the quality can be solved. In addition, if the LSP correction process is performed after converting to a frequency region having good correspondence to the auditory characteristics, LSP correction that provides an auditory equal effect over the entire frequency band is realized. Thus, there is an effect that good decoding characteristics can be obtained. Further, even if the speech encoding device corresponding to the speech decoding device and the speech decoding device are connected in multiple stages, or if there is much background noise input to the speech encoding device, low-frequency degradation is caused. Without this, it is possible to satisfactorily correct a steep pole generated in a high frequency range and obtain an effect of obtaining a good decoding characteristic.

【0113】実施の形態12.図12はこの発明の実施
の形態12による音声復号化装置を示す構成図であり、
図において、図11と同一符号は同一または相当部分を
示すので説明を省略する。55はLSP復号化部51か
ら出力された復号LSPと音源復号化部53により生成
された音源信号から合成音を生成する合成フィルタ(合
成手段)、56はLSP補正装置52から出力された補
正LSPを用いて合成音に対するスペクトル強調処理を
実行するポストフィルタ(ポストフィルタ手段)であ
る。
Embodiment 12 FIG. FIG. 12 is a configuration diagram showing a speech decoding apparatus according to Embodiment 12 of the present invention.
In the figure, the same reference numerals as those in FIG. 11 denote the same or corresponding parts, and a description thereof will not be repeated. Reference numeral 55 denotes a synthesis filter (synthesis unit) that generates a synthesized sound from the decoded LSP output from the LSP decoding unit 51 and the sound source signal generated by the sound source decoding unit 53, and reference numeral 56 denotes a corrected LSP output from the LSP correction device 52. Is a post-filter (post-filter means) for executing a spectrum emphasis process on a synthesized sound by using.

【0114】次に動作について説明する。まず、LSP
復号化部51は、LSP符号を入力すると、そのLSP
符号を復号化して復号LSPをLSP補正装置52及び
合成フィルタ55に出力する。このLSP符号は、上記
実施の形態10で説明した音声符号化装置等から出力さ
れたものである。
Next, the operation will be described. First, LSP
When the decoding unit 51 receives the LSP code, the LSP code
The code is decoded and the decoded LSP is output to the LSP correction device 52 and the synthesis filter 55. This LSP code is output from the speech coding device or the like described in the tenth embodiment.

【0115】一方、音源復号化部53は、音源符号を入
力すると、その音源符号を復号化して音源信号を生成
し、その音源信号を合成フィルタ55に出力する。そし
て、LSP補正装置52は、LSP復号化部51から復
号LSPを受けると、上記実施の形態1と同様の手順で
復号LSPの補正を実施し、その補正LSPをポストフ
ィルタ56に出力する。
On the other hand, when excitation codec 53 receives the excitation code, it decodes the excitation code to generate an excitation signal and outputs the excitation signal to synthesis filter 55. Then, when receiving the decoded LSP from the LSP decoding unit 51, the LSP correction device 52 corrects the decoded LSP in the same procedure as in the first embodiment, and outputs the corrected LSP to the post filter 56.

【0116】そして、合成フィルタ55は、LSP復号
化部51から復号LSPを受けると、その復号LSPを
用いて、その音源信号に対する合成フィルタリング処理
を実行し、その結果得られた合成音をポストフィルタ5
6に出力する。そして、ポストフィルタ56は、LSP
補正装置52から補正LSPを受けると、その補正LS
Pを用いて合成音に対する音声強調処理を実行し、その
結果得られた加工合成音を出力音声として出力する。
When receiving the decoded LSP from the LSP decoding unit 51, the synthesis filter 55 executes synthesis filtering processing on the sound source signal using the decoded LSP, and converts the resultant synthesized sound into a post-filter. 5
6 is output. And the post filter 56 is an LSP
When receiving the correction LSP from the correction device 52, the correction LS
A voice emphasizing process is performed on the synthesized sound using P, and the processed synthesized sound obtained as a result is output as an output sound.

【0117】なお、この実施の形態12では、上記実施
の形態1のLSP補正装置を適用するものについて示し
たが、上記実施の形態2〜8のLSP補正装置を適用す
るようにしてもよい。また、上記実施の形態11と組み
合わせて、合成フィルタ55にも補正LSPが入力され
るようにしてもよい。
In the twelfth embodiment, the LSP correction apparatus of the first embodiment is applied. However, the LSP correction apparatuses of the second to eighth embodiments may be applied. Further, in combination with the eleventh embodiment, the correction LSP may also be input to the synthesis filter 55.

【0118】以上で明らかなように、この実施の形態1
2によれば、補正LSPを使ってポストフィルタ処理を
行うようにしたので、ポストフィルタの極が急峻過ぎて
過強調を引き起こすことを抑制することができる効果を
奏する。また、LSP補正装置52が補正を行うように
したので、復号LSPの各次元の周波数に最適な閾値が
算出することができるようになり、その結果、良好な音
声強調が得られる効果を奏する。
As is clear from the above, the first embodiment
According to 2, since the post-filter processing is performed using the correction LSP, it is possible to prevent the pole of the post-filter from being too steep to cause over-emphasis. Further, since the LSP correction device 52 performs the correction, it is possible to calculate the optimum threshold value for the frequency of each dimension of the decoded LSP, and as a result, it is possible to obtain an effect of obtaining good voice enhancement.

【0119】また、聴覚的特性に対応が良い周波数領域
に変換してからLSPの補正処理を行うようにした場合
には、全周波数帯域に渡って聴覚的に均等な効果をもた
らすLSP補正が実現されるため、良好な音声強調特性
が得られる効果を奏する。さらに、この音声復号化装置
に対応する音声符号化装置と、この音声復号化装置が多
段階に接続されたり、音声符号化装置に入力される背景
雑音が多い場合でも、低域の劣化を引き起こすことな
く、高域に生じる急峻な極を良好に補正して、良好な音
声強調特性が得られる効果を奏する。
Further, when the LSP correction process is performed after converting to a frequency region having a good correspondence to the auditory characteristics, the LSP correction that provides an auditory equal effect over the entire frequency band is realized. Therefore, there is an effect that a good voice emphasis characteristic can be obtained. Further, even if the speech encoding device corresponding to the speech decoding device and the speech decoding device are connected in multiple stages, or if there is much background noise input to the speech encoding device, low-frequency degradation is caused. Without this, it is possible to satisfactorily correct a steep pole generated in a high frequency range and obtain an effect of obtaining a good voice emphasis characteristic.

【0120】実施の形態13.図13はこの発明の実施
の形態13による音声復号化装置におけるポストフィル
タを示す構成図であり、図において、61,62は復号
LSPを補正するLSP補正装置、63,64はLSP
補正装置61,62が出力する補正LSPをLPC領域
に変換するLPC変換部、65はLPC変換部63が出
力するLPCを用いて、音声復号化装置内で別途生成さ
れた合成音に対する合成フィルタ処理を実行するLPC
合成フィルタ、66はLPC変換部64が出力するLP
Cを用いて、LPC合成フィルタ65の出力信号に対す
る逆フィルタ処理を実行するLPC逆フィルタである。
なお、音声復号化装置の全体構成は、図12と同じもの
でも、他の構成でもかまわない。
Embodiment 13 FIG. FIG. 13 is a block diagram showing a post filter in an audio decoding apparatus according to Embodiment 13 of the present invention. In the figure, reference numerals 61 and 62 denote LSP correction apparatuses for correcting a decoded LSP, and reference numerals 63 and 64 denote LSPs.
An LPC conversion unit for converting the corrected LSP output from the correction devices 61 and 62 into an LPC area, and a synthesis filter process 65 for the synthesized sound separately generated in the speech decoding device using the LPC output from the LPC conversion unit 63 LPC to execute
The synthesis filter 66 is an LP output from the LPC conversion unit 64
This is an LPC inverse filter that performs inverse filtering on the output signal of the LPC synthesis filter 65 using C.
Note that the overall configuration of the speech decoding device may be the same as that of FIG. 12 or may be another configuration.

【0121】次に動作について説明する。まず、復号L
SPがLSP補正装置61,62に入力されるが、この
復号LSPは、音声復号化装置内で生成されたものであ
り、音声復号化装置内の合成フィルタに使用されるもの
と同一か、それを実施の形態12と同様にして補正した
ものである。
Next, the operation will be described. First, decryption L
The SP is input to the LSP correction devices 61 and 62. The decoded LSP is generated in the audio decoding device and is the same as or different from the one used for the synthesis filter in the audio decoding device. Is corrected in the same manner as in the twelfth embodiment.

【0122】LSP補正装置61は、復号LSPを入力
すると、その復号LSPを補正して、その補正LSPを
LPC変換部63に出力する。そして、LPC変換部6
3は、LSP補正装置61から補正LSPを受けると、
その補正LSPをLPC領域に変換し、その結果得られ
たLPCをLPC合成フィルタ65に出力する。
When receiving the decoded LSP, the LSP correction device 61 corrects the decoded LSP and outputs the corrected LSP to the LPC conversion unit 63. Then, the LPC conversion unit 6
3 receives the correction LSP from the LSP correction device 61,
The corrected LSP is converted into an LPC area, and the resulting LPC is output to the LPC synthesis filter 65.

【0123】一方、LSP補正装置62は、復号LSP
を入力すると、その復号LSPを補正して、その補正L
SPをLPC変換部64に出力する。そして、LPC変
換部64は、LSP補正装置62から補正LSPを受け
ると、その補正LSPをLPC領域に変換し、その結果
得られたLPCをLPC逆フィルタ66に出力する。
On the other hand, the LSP correction device 62 outputs the decrypted LSP
Is input, the decoded LSP is corrected, and the corrected LSP is corrected.
The SP is output to the LPC conversion unit 64. Then, when receiving the correction LSP from the LSP correction device 62, the LPC conversion unit 64 converts the correction LSP into an LPC area, and outputs the LPC obtained as a result to the LPC inverse filter 66.

【0124】そして、LPC合成フィルタ65は、LP
C変換部63がLPCを出力すると、そのLPCを用い
て、音声復号化装置内で別途生成された合成音に対する
合成フィルタ処理を実行し、その結果得られた信号をL
PC逆フィルタ66に出力する。
Then, the LPC synthesis filter 65
When the C conversion unit 63 outputs the LPC, the LPC is used to perform a synthesis filter process on a synthesized sound separately generated in the speech decoding apparatus, and the resultant signal is converted to an L signal.
Output to the PC inverse filter 66.

【0125】そして、LPC逆フィルタ66は、LPC
変換部64が出力するLPCを用いて、LPC合成フィ
ルタ65の出力信号に対する逆フィルタ処理を実行し、
その結果得られた信号を加工合成音として出力する。こ
の加工合成音が音声復号化装置全体の最終的な出力音声
となる場合と、更に後段で加工処理を加えられて最終的
な出力音声とする場合がある。
The LPC inverse filter 66 is an LPC inverse filter.
Using the LPC output from the conversion unit 64, an inverse filter process is performed on the output signal of the LPC synthesis filter 65,
The signal obtained as a result is output as processed synthetic sound. In some cases, the processed synthesized sound is the final output sound of the entire speech decoding device, and in another case, the processed sound is further processed in a later stage to be the final output sound.

【0126】なお、この実施の形態13では、上記実施
の形態1のLSP補正装置を適用するものについて示し
たが、上記実施の形態2〜8のLSP補正装置を適用す
るようにしてもよい。
In the thirteenth embodiment, the LSP correction apparatus of the first embodiment is applied. However, the LSP correction apparatuses of the second to eighth embodiments may be applied.

【0127】以上で明らかなように、この実施の形態1
3によれば、LSP補正装置61,62が復号LSPを
補正し、その補正LSPを使ってポストフィルタ処理を
行うようにしたので、復号LSPの各次元の周波数に最
適な閾値が算出することができるようになり、その結
果、良好な音声強調が得られる効果を奏する。また、聴
覚的特性に対応が良い周波数領域に変換してからLSP
の補正処理を行うようにした場合には、全周波数帯域に
渡って聴覚的に均等な効果をもたらすLSP補正が実現
されるため、良好な音声強調特性が得られる効果を奏す
る。さらに、この音声復号化装置に対応する音声符号化
装置と、この音声復号化装置が多段階に接続されたり、
音声符号化装置に入力される背景雑音が多い場合でも、
低域の劣化を引き起こすことなく、高域に生じる急峻な
極を良好に補正して、良好な音声強調特性が得られる効
果を奏する。
As is apparent from the above, the first embodiment
According to No. 3, since the LSP correction devices 61 and 62 correct the decoded LSP and perform the post-filter processing using the corrected LSP, it is possible to calculate the optimum threshold value for the frequency of each dimension of the decoded LSP. As a result, it is possible to obtain an effect that good voice enhancement can be obtained. In addition, after converting to a frequency domain that is compatible with auditory characteristics, LSP
When the correction processing is performed, the LSP correction that provides an equal effect perceptually over the entire frequency band is realized, so that an effect that a good voice emphasis characteristic is obtained can be obtained. Furthermore, a speech encoding device corresponding to the speech decoding device and the speech decoding device are connected in multiple stages,
Even if there is much background noise input to the speech coding device,
Without causing deterioration in the low frequency range, steep poles generated in the high frequency range are satisfactorily corrected, and an effect of obtaining good voice emphasis characteristics can be obtained.

【0128】[0128]

【発明の効果】以上のように、この発明によれば、聴覚
的特性に対応する周波数領域に変換されたLSPを補正
し、そのLSPの周波数領域を線形周波数領域に戻すよ
うに構成したので、全周波数帯域に渡って聴覚的に均等
な効果をもたらすことができる効果がある。
As described above, according to the present invention, the LSP converted into the frequency domain corresponding to the auditory characteristic is corrected, and the frequency domain of the LSP is returned to the linear frequency domain. There is an effect that an auditory equal effect can be provided over the entire frequency band.

【0129】この発明によれば、LSPの周波数領域を
線形周波数領域からバーク周波数領域に変換して補正す
るように構成したので、全周波数帯域に渡って聴覚的に
均等な効果をもたらすことができる効果がある。
According to the present invention, since the LSP frequency domain is converted from the linear frequency domain to the Bark frequency domain for correction, it is possible to provide an auditory equal effect over the entire frequency band. effective.

【0130】この発明によれば、LSPの周波数領域を
線形周波数領域からメル周波数領域に変換して補正する
ように構成したので、全周波数帯域に渡って聴覚的に均
等な効果をもたらすことができる効果がある。
According to the present invention, since the LSP frequency domain is converted from the linear frequency domain to the mel frequency domain for correction, it is possible to provide an acoustically uniform effect over the entire frequency band. effective.

【0131】この発明によれば、LSPの周波数領域を
線形周波数領域から対数周波数領域に変換して補正する
ように構成したので、全周波数帯域に渡って聴覚的に均
等な効果をもたらすことができる効果がある。
According to the present invention, since the LSP frequency domain is converted from the linear frequency domain to the logarithmic frequency domain and corrected, it is possible to provide an acoustically uniform effect over the entire frequency band. effective.

【0132】この発明によれば、LSPの各次元値を基
準にして、隣接次元間距離に関する閾値を各次元毎に算
出し、各次元毎の閾値に基づいてLSPを補正するよう
に構成したので、補正による影響が周波数毎に差異が出
て、適用した音声符号化装置及び音声復号化装置の符号
化復号化品質の劣化を解消できなかったり、逆に劣化を
もたらしてしまう課題を解消することができる効果があ
る。
According to the present invention, the threshold for the distance between adjacent dimensions is calculated for each dimension based on each dimension value of the LSP, and the LSP is corrected based on the threshold for each dimension. To solve the problem that the influence of the correction is different for each frequency, and the deterioration of the coding / decoding quality of the applied speech coding apparatus and the speech decoding apparatus cannot be eliminated or, conversely, causes the degradation. There is an effect that can be.

【0133】この発明によれば、LSPの周波数領域を
線形周波数領域から聴覚的特性に対応する周波数領域に
変換し、その聴覚的特性に対応する周波数領域で閾値を
算出するように構成したので、全周波数帯域に渡って聴
覚的に均等な効果をもたらすことができる効果がある。
According to the present invention, the LSP frequency domain is converted from the linear frequency domain to the frequency domain corresponding to the auditory characteristics, and the threshold value is calculated in the frequency domain corresponding to the auditory characteristics. There is an effect that an auditory equal effect can be provided over the entire frequency band.

【0134】この発明によれば、聴覚的特性に対応する
周波数領域で算出した閾値と、線形周波数領域で定義さ
れた閾値を比較し、大きい方の閾値を補正手段に出力す
るように構成したので、全周波数帯域に渡って聴覚的に
均等な効果をもたらし、かつ、不安定なLSP(低域で
次元間距離が近づき過ぎてLSPのフィルタゲインが大
きくなり過ぎる状態)を出力することがないLSP補正
装置が提供できる効果がある。
According to the present invention, the threshold calculated in the frequency domain corresponding to the auditory characteristic is compared with the threshold defined in the linear frequency domain, and the larger threshold is output to the correction means. An LSP that produces an auditory equal effect over the entire frequency band and does not output an unstable LSP (a state in which the filter gain of the LSP becomes too large due to the inter-dimensional distance being too close in the low frequency range). There is an effect that the correction device can provide.

【0135】この発明によれば、LSPの周波数領域を
線形周波数領域からバーク周波数領域に変換して閾値を
算出するように構成したので、全周波数帯域に渡って聴
覚的に均等な効果をもたらすことができる効果がある。
According to the present invention, since the threshold is calculated by converting the LSP frequency domain from the linear frequency domain to the Bark frequency domain, it is possible to provide an auditory equal effect over the entire frequency band. There is an effect that can be.

【0136】この発明によれば、LSPの周波数領域を
線形周波数領域からメル周波数領域に変換して閾値を算
出するように構成したので、全周波数帯域に渡って聴覚
的に均等な効果をもたらすことができる効果がある。
According to the present invention, since the LSP frequency domain is converted from the linear frequency domain to the mel frequency domain to calculate the threshold value, an auditory equal effect can be obtained over the entire frequency band. There is an effect that can be.

【0137】この発明によれば、LSPの周波数領域を
線形周波数領域から対数周波数領域に変換して閾値を算
出するように構成したので、全周波数帯域に渡って聴覚
的に均等な効果をもたらすことができる効果がある。
According to the present invention, the threshold is calculated by converting the frequency domain of the LSP from the linear frequency domain to the logarithmic frequency domain, so that an auditory equal effect is provided over the entire frequency band. There is an effect that can be.

【0138】この発明によれば、聴覚特性に対応する周
波数領域で補正されたLSPを符号化してLSP符号と
量子化LSPを出力するように構成したので、入力音声
の歪や分析誤差に伴う品質劣化を良好に抑制することが
できる効果がある。
According to the present invention, since the LSP corrected in the frequency domain corresponding to the auditory characteristics is encoded and the LSP code and the quantized LSP are output, the quality of the input speech due to distortion and analysis error is increased. There is an effect that deterioration can be favorably suppressed.

【0139】この発明によれば、LSPの各次元値を基
準にして算出した各次元毎の閾値を用いて補正されたL
SPを符号化してLSP符号と量子化LSPを出力する
ように構成したので、入力音声の歪や分析誤差に伴う品
質劣化を良好に抑制することができる効果がある。
According to the present invention, the LSP corrected using the threshold value for each dimension calculated based on each dimension value of the LSP.
Since the SP is encoded and the LSP code and the quantized LSP are output, there is an effect that the quality deterioration due to the distortion and the analysis error of the input voice can be suppressed well.

【0140】この発明によれば、聴覚特性に対応する周
波数領域で補正された復号LSPと入力音声から符号化
音源を算出するように構成したので、LSPの符号化歪
(量子化歪)による復号音の不安定化を良好に抑制するこ
とができる効果がある。
According to the present invention, since the coded excitation is calculated from the decoded LSP corrected in the frequency domain corresponding to the auditory characteristics and the input voice, the coding distortion of the LSP is reduced.
There is an effect that the instability of the decoded sound due to (quantization distortion) can be favorably suppressed.

【0141】この発明によれば、LSPの各次元値を基
準にして算出した各次元毎の閾値を用いて補正された復
号LSPと入力音声から符号化音源を算出するように構
成したので、LSPの符号化歪(量子化歪)による復号音
の不安定化を良好に抑制することができる効果がある。
According to the present invention, the coded excitation is calculated from the decoded LSP and the input speech which are corrected using the threshold value for each dimension calculated based on each dimension value of the LSP. Thus, there is an effect that the instability of the decoded sound due to the encoding distortion (quantization distortion) can be favorably suppressed.

【0142】この発明によれば、聴覚特性に対応する周
波数領域で補正された復号LSPと音源復号化手段によ
り生成された音源信号から合成音を生成するように構成
したので、LSP符号の伝送誤りによる復号音の不安定
化を良好に抑制することができる効果がある。
According to the present invention, since the synthesized sound is generated from the decoded LSP corrected in the frequency domain corresponding to the auditory characteristics and the sound source signal generated by the sound source decoding means, the transmission error of the LSP code can be improved. Thus, there is an effect that the instability of the decoded sound due to the above can be suppressed well.

【0143】この発明によれば、LSPの各次元値を基
準にして算出した各次元毎の閾値を用いて補正された復
号LSPと音源復号化手段により生成された音源信号か
ら合成音を生成するように構成したので、LSP符号の
伝送誤りによる復号音の不安定化を良好に抑制すること
ができる効果がある。
According to the present invention, a synthesized sound is generated from the decoded LSP corrected by using the threshold value for each dimension calculated based on each dimension value of the LSP and the sound source signal generated by the sound source decoding means. With such a configuration, there is an effect that the instability of the decoded sound due to the transmission error of the LSP code can be favorably suppressed.

【0144】この発明によれば、聴覚特性に対応する周
波数領域で補正された復号LSPを用いて合成音に対す
るスペクトル強調処理を実行するように構成したので、
ポストフィルタの極が急峻過ぎて過強調を引き起こすこ
とを抑制しつつ良好な音声強調が得られる効果がある。
According to the present invention, the spectrum emphasis processing is performed on the synthesized sound using the decoded LSP corrected in the frequency domain corresponding to the auditory characteristics.
There is an effect that good voice enhancement can be obtained while suppressing that the pole of the post-filter is too steep to cause over-emphasis.

【0145】この発明によれば、LSPの各次元値を基
準にして算出した各次元毎の閾値を用いて補正された復
号LSPを用いて合成音に対するスペクトル強調処理を
実行するように構成したので、ポストフィルタの極が急
峻過ぎて過強調を引き起こすことを抑制しつつ良好な音
声強調が得られる効果がある。
According to the present invention, the spectrum emphasis processing for the synthesized sound is performed using the decoded LSP corrected using the threshold value for each dimension calculated based on each dimension value of the LSP. In addition, there is an effect that good voice enhancement can be obtained while suppressing that the pole of the post filter is too steep to cause over-emphasis.

【図面の簡単な説明】[Brief description of the drawings]

【図1】 この発明の実施の形態1によるLSP補正装
置を示す構成図である。
FIG. 1 is a configuration diagram showing an LSP correction device according to a first embodiment of the present invention.

【図2】 この実施の形態1によるLSP補正装置の補
正結果を説明する説明図である。
FIG. 2 is an explanatory diagram illustrating a correction result of the LSP correction device according to the first embodiment.

【図3】 この発明の実施の形態2によるLSP補正装
置を示す構成図である。
FIG. 3 is a configuration diagram showing an LSP correction device according to a second embodiment of the present invention.

【図4】 この発明の実施の形態4によるLSP補正装
置を示す構成図である。
FIG. 4 is a configuration diagram showing an LSP correction device according to a fourth embodiment of the present invention.

【図5】 この実施の形態4によるLSP補正装置の補
正結果を説明する説明図である。
FIG. 5 is an explanatory diagram illustrating a correction result of the LSP correction device according to the fourth embodiment.

【図6】 この実施の形態5によるLSP補正装置の補
正結果を説明する説明図である。
FIG. 6 is an explanatory diagram illustrating a correction result of the LSP correction device according to the fifth embodiment.

【図7】 この実施の形態7によるLSP補正装置の補
正結果を説明する説明図である。
FIG. 7 is an explanatory diagram illustrating a correction result of the LSP correction device according to the seventh embodiment.

【図8】 この実施の形態8によるLSP補正装置の補
正結果を説明する説明図である。
FIG. 8 is an explanatory diagram illustrating a correction result of the LSP correction device according to the eighth embodiment.

【図9】 この実施の形態9による音声符号化装置を示
す構成図である。
FIG. 9 is a configuration diagram illustrating a speech encoding device according to a ninth embodiment.

【図10】 この実施の形態10による音声符号化装置
を示す構成図である。
FIG. 10 is a configuration diagram illustrating a speech encoding device according to a tenth embodiment.

【図11】 この実施の形態11による音声復号化装置
を示す構成図である。
FIG. 11 is a configuration diagram illustrating a speech decoding apparatus according to an eleventh embodiment.

【図12】 この実施の形態12による音声復号化装置
を示す構成図である。
FIG. 12 is a configuration diagram illustrating a speech decoding apparatus according to a twelfth embodiment.

【図13】 この実施の形態13による音声復号化装置
におけるポストフィルタを示す構成図である。
FIG. 13 is a configuration diagram showing a post filter in a speech decoding apparatus according to Embodiment 13;

【符号の説明】[Explanation of symbols]

1 bark変換部(変換手段)、2,7,16 LS
P変形部(補正手段)、5 bark逆変換部(逆変換
手段)、6 メル変換部(変換手段)、10メル逆変換
部(逆変換手段)、11,21,32 閾値算出部(閾
値算出手段)、41 LSP分析部(LSP分析手
段)、43,45 LSP符号化部(LSP符号化手
段)、44,48 音源符号化部(音源符号化手段)、
46,51LSP復号化部(LSP復号化手段)、53
音源復号化部(音源復号化手段)、54,55 合成
フィルタ(合成手段)、56 ポストフィルタ(ポスト
フィルタ手段)。
1 bark conversion unit (conversion means), 2, 7, 16 LS
P transformation unit (correction unit), 5 bark inverse conversion unit (inversion unit), 6 mel conversion unit (conversion unit), 10 mel inverse conversion unit (inverse conversion unit), 11, 21, 32 Threshold calculation unit (threshold calculation) Means), 41 LSP analysis section (LSP analysis means), 43, 45 LSP encoding section (LSP encoding means), 44, 48 excitation encoding section (excitation encoding means),
46, 51 LSP decoding section (LSP decoding means), 53
Sound source decoding unit (sound source decoding means), 54, 55 synthesis filter (synthesis means), 56 post filter (post filter means).

Claims (18)

【特許請求の範囲】[Claims] 【請求項1】 スペクトルパラメータであるLSPを入
力すると、そのLSPの周波数領域を線形周波数領域か
ら聴覚的特性に対応する周波数領域に変換する変換手段
と、上記変換手段により周波数領域が変換されたLSP
を補正する補正手段と、上記補正手段により補正された
LSPの周波数領域を線形周波数領域に戻す逆変換手段
とを備えたLSP補正装置。
When an LSP which is a spectrum parameter is input, a conversion means for converting a frequency domain of the LSP from a linear frequency domain to a frequency domain corresponding to an auditory characteristic, and an LSP whose frequency domain is converted by the conversion means
An LSP correction apparatus comprising: a correction unit that corrects the LSP;
【請求項2】 変換手段は、LSPの周波数領域を線形
周波数領域からバーク周波数領域に変換することを特徴
とする請求項1記載のLSP補正装置。
2. The LSP correction device according to claim 1, wherein the conversion means converts the LSP frequency domain from a linear frequency domain to a Bark frequency domain.
【請求項3】 変換手段は、LSPの周波数領域を線形
周波数領域からメル周波数領域に変換することを特徴と
する請求項1記載のLSP補正装置。
3. The LSP correction apparatus according to claim 1, wherein the conversion means converts the frequency domain of the LSP from a linear frequency domain to a mel frequency domain.
【請求項4】 変換手段は、LSPの周波数領域を線形
周波数領域から対数周波数領域に変換することを特徴と
する請求項1記載のLSP補正装置。
4. The LSP correction device according to claim 1, wherein the conversion means converts the frequency domain of the LSP from a linear frequency domain to a logarithmic frequency domain.
【請求項5】 スペクトルパラメータであるLSPを入
力すると、そのLSPの各次元値を基準にして、隣接次
元間距離に関する閾値を各次元毎に算出する閾値算出手
段と、上記閾値算出手段により算出された各次元毎の閾
値に基づいてそのLSPを補正する補正手段とを備えた
LSP補正装置。
5. When a LSP which is a spectrum parameter is input, a threshold value calculating means for calculating a threshold value for a distance between adjacent dimensions for each dimension based on each dimension value of the LSP, and a threshold value calculating means for calculating a threshold value. Correction means for correcting the LSP based on a threshold value for each dimension.
【請求項6】 閾値算出手段は、隣接次元間距離に関す
る閾値を算出する際、LSPの周波数領域を線形周波数
領域から聴覚的特性に対応する周波数領域に変換し、そ
の聴覚的特性に対応する周波数領域で閾値を算出するこ
とを特徴とする請求項5記載のLSP補正装置。
6. The threshold value calculating means converts a frequency domain of an LSP from a linear frequency domain to a frequency domain corresponding to an auditory characteristic when calculating a threshold value regarding a distance between adjacent dimensions, and calculates a frequency corresponding to the auditory characteristic. The LSP correction device according to claim 5, wherein a threshold value is calculated in the area.
【請求項7】 閾値算出手段は、聴覚的特性に対応する
周波数領域で算出した閾値と、線形周波数領域で定義さ
れた閾値を比較し、大きい方の閾値を補正手段に出力す
ることを特徴とする請求項6記載のLSP補正装置。
7. The threshold calculating means compares a threshold calculated in a frequency domain corresponding to an auditory characteristic with a threshold defined in a linear frequency domain, and outputs a larger threshold to the correcting means. The LSP correction device according to claim 6, wherein
【請求項8】 閾値算出手段は、LSPの周波数領域を
線形周波数領域からバーク周波数領域に変換して閾値を
算出することを特徴とする請求項6または請求項7記載
のLSP補正装置。
8. The LSP correction device according to claim 6, wherein the threshold value calculating means calculates the threshold value by converting the frequency domain of the LSP from the linear frequency domain to the Bark frequency domain.
【請求項9】 閾値算出手段は、LSPの周波数領域を
線形周波数領域からメル周波数領域に変換して閾値を算
出することを特徴とする請求項6または請求項7記載の
LSP補正装置。
9. The LSP correction device according to claim 6, wherein the threshold value calculating means calculates the threshold value by converting a frequency domain of the LSP from a linear frequency domain to a mel frequency domain.
【請求項10】 閾値算出手段は、LSPの周波数領域
を線形周波数領域から対数周波数領域に変換して閾値を
算出することを特徴とする請求項6または請求項7記載
のLSP補正装置。
10. The LSP correction device according to claim 6, wherein the threshold value calculating means calculates the threshold value by converting a frequency domain of the LSP from a linear frequency domain to a logarithmic frequency domain.
【請求項11】 入力音声を分析してLSPを算出する
LSP分析手段と、上記LSP分析手段により算出され
たLSPの周波数領域を線形周波数領域から聴覚的特性
に対応する周波数領域に変換する変換手段と、上記変換
手段により周波数領域が変換されたLSPを補正する補
正手段と、上記補正手段により補正されたLSPの周波
数領域を線形周波数領域に戻す逆変換手段と、上記逆変
換手段から出力されたLSPを符号化してLSP符号と
量子化LSPを出力するLSP符号化手段と、上記LS
P符号化手段から出力された量子化LSPと上記入力音
声から符号化音源を算出する音源符号化手段とを備えた
音声符号化装置。
11. An LSP analyzer for analyzing an input voice to calculate an LSP, and a converter for converting a frequency domain of the LSP calculated by the LSP analyzer from a linear frequency domain to a frequency domain corresponding to auditory characteristics. Correction means for correcting the LSP whose frequency domain has been converted by the conversion means, inverse conversion means for returning the frequency domain of the LSP corrected by the correction means to the linear frequency domain, and output from the inverse conversion means. LSP encoding means for encoding the LSP and outputting an LSP code and a quantized LSP;
An audio encoding device comprising: a quantized LSP output from a P encoding unit; and an excitation encoding unit that calculates an encoded excitation from the input audio.
【請求項12】 入力音声を分析してLSPを算出する
LSP分析手段と、上記LSP分析手段により算出され
たLSPの各次元値を基準にして、隣接次元間距離に関
する閾値を各次元毎に算出する閾値算出手段と、上記閾
値算出手段により算出された各次元毎の閾値に基づいて
そのLSPを補正する補正手段と、上記補正手段により
補正されたLSPを符号化してLSP符号と量子化LS
Pを出力するLSP符号化手段と、上記LSP符号化手
段から出力された量子化LSPと上記入力音声から符号
化音源を算出する音源符号化手段とを備えた音声符号化
装置。
12. An LSP analyzing means for analyzing an input voice to calculate an LSP, and a threshold value for a distance between adjacent dimensions is calculated for each dimension based on each dimension value of the LSP calculated by the LSP analyzing means. Threshold calculation means, correction means for correcting the LSP based on the threshold value for each dimension calculated by the threshold calculation means, LSP code corrected by the correction means, and an LSP code and quantization LS
An audio encoding apparatus comprising: an LSP encoding unit that outputs P; and an excitation encoding unit that calculates an encoded excitation from the quantized LSP output from the LSP encoding unit and the input audio.
【請求項13】 入力音声を分析してLSPを算出する
LSP分析手段と、上記LSP分析手段により算出され
たLSPを符号化してLSP符号を出力するLSP符号
化手段と、上記LSP符号化手段から出力されたLSP
符号を復号化して復号LSPを出力するLSP復号化手
段と、上記LSP復号化手段から出力された復号LSP
の周波数領域を線形周波数領域から聴覚的特性に対応す
る周波数領域に変換する変換手段と、上記変換手段によ
り周波数領域が変換された復号LSPを補正する補正手
段と、上記補正手段により補正された復号LSPの周波
数領域を線形周波数領域に戻す逆変換手段と、上記逆変
換手段から出力された復号LSPと上記入力音声から符
号化音源を算出する音源符号化手段とを備えた音声符号
化装置。
13. An LSP analyzing unit for analyzing an input voice to calculate an LSP, an LSP encoding unit for encoding the LSP calculated by the LSP analyzing unit and outputting an LSP code, and an LSP encoding unit. Output LSP
LSP decoding means for decoding a code and outputting a decoded LSP, and a decoded LSP output from the LSP decoding means
Transforming the frequency domain from the linear frequency domain to the frequency domain corresponding to the auditory characteristic, correcting means for correcting the decoded LSP whose frequency domain has been converted by the converting means, and decoding corrected by the correcting means. A speech encoding apparatus comprising: an inverse transform unit for returning a frequency domain of an LSP to a linear frequency domain; and a sound source encoding unit for calculating an encoded excitation from the decoded LSP output from the inverse transform unit and the input speech.
【請求項14】 入力音声を分析してLSPを算出する
LSP分析手段と、上記LSP分析手段により算出され
たLSPを符号化してLSP符号を出力するLSP符号
化手段と、上記LSP符号化手段から出力されたLSP
符号を復号化して復号LSPを出力するLSP復号化手
段と、上記LSP復号化手段から出力された復号LSP
の各次元値を基準にして、隣接次元間距離に関する閾値
を各次元毎に算出する閾値算出手段と、上記閾値算出手
段により算出された各次元毎の閾値に基づいてそのLS
Pを補正する補正手段と、上記補正手段により補正され
た復号LSPと上記入力音声から符号化音源を算出する
音源符号化手段とを備えた音声符号化装置。
14. An LSP analyzing means for analyzing an input voice to calculate an LSP, an LSP encoding means for encoding the LSP calculated by the LSP analyzing means and outputting an LSP code, and Output LSP
LSP decoding means for decoding a code and outputting a decoded LSP, and a decoded LSP output from the LSP decoding means
A threshold value calculating means for calculating a threshold value for the distance between adjacent dimensions for each dimension with reference to each dimension value of, and an LS value based on the threshold value for each dimension calculated by the threshold value calculating means.
A speech coding apparatus comprising: a correction unit for correcting P; a decoding LSP corrected by the correction unit; and a sound source coding unit for calculating a coding sound source from the input voice.
【請求項15】 LSP符号を復号化して復号LSPを
出力するLSP復号化手段と、上記LSP復号化手段か
ら出力された復号LSPの周波数領域を線形周波数領域
から聴覚的特性に対応する周波数領域に変換する変換手
段と、上記変換手段により周波数領域が変換された復号
LSPを補正する補正手段と、上記補正手段により補正
された復号LSPの周波数領域を線形周波数領域に戻す
逆変換手段と、音源符号を復号化して音源信号を生成す
る音源復号化手段と、上記逆変換手段から出力された復
号LSPと上記音源復号化手段により生成された音源信
号から合成音を生成する合成手段とを備えた音声復号化
装置。
15. An LSP decoding means for decoding an LSP code and outputting a decoded LSP, and converting a frequency domain of the decoded LSP output from the LSP decoding means from a linear frequency domain to a frequency domain corresponding to auditory characteristics. Conversion means for converting; a correction means for correcting the decoded LSP whose frequency domain has been converted by the conversion means; an inverse conversion means for returning the frequency domain of the decoded LSP corrected by the correction means to the linear frequency domain; Comprising a sound source decoding means for decoding a sound signal to generate a sound source signal, and a synthesis means for generating a synthesized sound from the decoded LSP output from the inverse conversion means and the sound source signal generated by the sound source decoding means. Decryption device.
【請求項16】 LSP符号を復号化して復号LSPを
出力するLSP復号化手段と、上記LSP復号化手段か
ら出力された復号LSPの各次元値を基準にして、隣接
次元間距離に関する閾値を各次元毎に算出する閾値算出
手段と、上記閾値算出手段により算出された各次元毎の
閾値に基づいてそのLSPを補正する補正手段と、音源
符号を復号化して音源信号を生成する音源復号化手段
と、上記補正手段により補正された復号LSPと上記音
源復号化手段により生成された音源信号から合成音を生
成する合成手段とを備えた音声復号化装置。
16. An LSP decoding unit for decoding an LSP code and outputting a decoded LSP, and a threshold value for a distance between adjacent dimensions is set based on each dimension value of the decoded LSP output from the LSP decoding unit. Threshold calculating means for calculating each dimension, correcting means for correcting the LSP based on the threshold for each dimension calculated by the threshold calculating means, and excitation decoding means for decoding an excitation code to generate an excitation signal A speech decoding device comprising: a decoding LSP corrected by the correction means; and a synthesis means for generating a synthesized sound from the sound source signal generated by the sound source decoding means.
【請求項17】 LSP符号を復号化して復号LSPを
出力するLSP復号化手段と、上記LSP復号化手段か
ら出力された復号LSPの周波数領域を線形周波数領域
から聴覚的特性に対応する周波数領域に変換する変換手
段と、上記変換手段により周波数領域が変換された復号
LSPを補正する補正手段と、上記補正手段により補正
された復号LSPの周波数領域を線形周波数領域に戻す
逆変換手段と、音源符号を復号化して音源信号を生成す
る音源復号化手段と、上記LSP復号化手段から出力さ
れた復号LSPと上記音源復号化手段により生成された
音源信号から合成音を生成する合成手段と、上記逆変換
手段から出力された復号LSPを用いて上記合成音に対
するスペクトル強調処理を実行するポストフィルタ手段
とを備えた音声復号化装置。
17. An LSP decoding means for decoding an LSP code and outputting a decoded LSP, and converting a frequency domain of the decoded LSP output from the LSP decoding means from a linear frequency domain to a frequency domain corresponding to auditory characteristics. Conversion means for converting; a correction means for correcting the decoded LSP whose frequency domain has been converted by the conversion means; an inverse conversion means for returning the frequency domain of the decoded LSP corrected by the correction means to the linear frequency domain; Sound source decoding means for decoding the sound signal to generate a sound source signal; synthesizing means for generating a synthesized sound from the decoded LSP output from the LSP decoding means and the sound source signal generated by the sound source decoding means; Post decoding means for performing spectrum enhancement processing on the synthesized sound using the decoding LSP output from the conversion means. Device.
【請求項18】 LSP符号を復号化して復号LSPを
出力するLSP復号化手段と、上記LSP復号化手段か
ら出力された復号LSPの各次元値を基準にして、隣接
次元間距離に関する閾値を各次元毎に算出する閾値算出
手段と、上記閾値算出手段により算出された各次元毎の
閾値に基づいてそのLSPを補正する補正手段と、音源
符号を復号化して音源信号を生成する音源復号化手段
と、上記LSP復号化手段から出力された復号LSPと
上記音源復号化手段により生成された音源信号から合成
音を生成する合成手段と、上記補正手段により補正され
た復号LSPを用いて上記合成音に対するスペクトル強
調処理を実行するポストフィルタ手段とを備えた音声復
号化装置。
18. An LSP decoding unit for decoding an LSP code and outputting a decoded LSP, and a threshold value for a distance between adjacent dimensions is set based on each dimension value of the decoded LSP output from the LSP decoding unit. Threshold calculating means for calculating each dimension, correcting means for correcting the LSP based on the threshold for each dimension calculated by the threshold calculating means, and excitation decoding means for decoding an excitation code to generate an excitation signal Synthesizing means for generating a synthesized sound from the decoded LSP output from the LSP decoding means and the sound source signal generated by the sound source decoding means, and the synthesized sound using the decoded LSP corrected by the correcting means. And a post-filter means for performing a spectrum emphasis process on the audio signal.
JP11047079A 1999-02-24 1999-02-24 Lsp correcting device, voice encoding device, and voice decoding device Pending JP2000250597A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11047079A JP2000250597A (en) 1999-02-24 1999-02-24 Lsp correcting device, voice encoding device, and voice decoding device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11047079A JP2000250597A (en) 1999-02-24 1999-02-24 Lsp correcting device, voice encoding device, and voice decoding device

Publications (1)

Publication Number Publication Date
JP2000250597A true JP2000250597A (en) 2000-09-14

Family

ID=12765179

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11047079A Pending JP2000250597A (en) 1999-02-24 1999-02-24 Lsp correcting device, voice encoding device, and voice decoding device

Country Status (1)

Country Link
JP (1) JP2000250597A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015162979A1 (en) * 2014-04-24 2015-10-29 日本電信電話株式会社 Frequency domain parameter sequence generation method, coding method, decoding method, frequency domain parameter sequence generation device, coding device, decoding device, program, and recording medium

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015162979A1 (en) * 2014-04-24 2015-10-29 日本電信電話株式会社 Frequency domain parameter sequence generation method, coding method, decoding method, frequency domain parameter sequence generation device, coding device, decoding device, program, and recording medium
JPWO2015162979A1 (en) * 2014-04-24 2017-04-13 日本電信電話株式会社 Frequency domain parameter sequence generation method, encoding method, decoding method, frequency domain parameter sequence generation device, encoding device, decoding device, program, and recording medium
JP2018067010A (en) * 2014-04-24 2018-04-26 日本電信電話株式会社 Encoding method, encoder, program, and recording medium
JP2018077501A (en) * 2014-04-24 2018-05-17 日本電信電話株式会社 Decoding method, decoding apparatus, program, and recording medium

Similar Documents

Publication Publication Date Title
JP4777918B2 (en) Audio processing apparatus and audio processing method
JP3653826B2 (en) Speech decoding method and apparatus
JP5047268B2 (en) Speech post-processing using MDCT coefficients
JP4792613B2 (en) Information processing apparatus and method, and recording medium
JP3483958B2 (en) Broadband audio restoration apparatus, wideband audio restoration method, audio transmission system, and audio transmission method
JPH0863196A (en) Post filter
KR100882771B1 (en) Perceptually Improved Enhancement of Encoded Acoustic Signals
JP3881946B2 (en) Acoustic encoding apparatus and acoustic encoding method
JPH08305397A (en) Voice processing filter and voice synthesizing device
RU2707727C1 (en) Audio signal processing device, audio signal processing method and audio signal processing program
JP4413480B2 (en) Voice processing apparatus and mobile communication terminal apparatus
KR20070007851A (en) Hierarchy encoding apparatus and hierarchy encoding method
JP2004515801A (en) Perceptual improvement of audio signal coding
JP2001102930A (en) Method and device for correcting quantization error, and method and device for decoding audio information
JP4786183B2 (en) Speech decoding apparatus, speech decoding method, program, and recording medium
JP3472279B2 (en) Speech coding parameter coding method and apparatus
JP3270922B2 (en) Encoding / decoding method and encoding / decoding device
JP2000250597A (en) Lsp correcting device, voice encoding device, and voice decoding device
JP4438280B2 (en) Transcoder and code conversion method
JP2004302257A (en) Long-period post-filter
JP2000242298A (en) Lsp correcting device, voice encoding device, and voice decoding device
JP4343302B2 (en) Pitch emphasis method and apparatus
JPH11109994A (en) Device and method for encoding musical sound and storage medium recording musical sound encoding program
JP4125520B2 (en) Decoding method for transform-coded data and decoding device for transform-coded data
JP2659605B2 (en) Audio decoding device and audio encoding / decoding device