JP2005284162A - Signal coding device, signal decoding device, signal coding method, and signal decoding method - Google Patents
Signal coding device, signal decoding device, signal coding method, and signal decoding method Download PDFInfo
- Publication number
- JP2005284162A JP2005284162A JP2004100895A JP2004100895A JP2005284162A JP 2005284162 A JP2005284162 A JP 2005284162A JP 2004100895 A JP2004100895 A JP 2004100895A JP 2004100895 A JP2004100895 A JP 2004100895A JP 2005284162 A JP2005284162 A JP 2005284162A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- frame
- change amount
- change
- temporal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
本発明は、オーディオ信号などの信号を符復号化する技術に関する。 The present invention relates to a technique for codec decoding a signal such as an audio signal.
近年、信号処理技術の発達に伴い、オーディオ信号を高効率に圧縮符号化する技術は数多く提案されている。音声・音響符号化方式は、時間領域で符号化する方式(時間符号化方式)と、所定の変換規則に則って変換した後に、その変換領域で符号化する方式(変換符号化方式)とに大別することができる。この変換規則としては、例えば、DFT(Discrete Fourier Transform)やDCT(Discrete Cosine Transform)などのような、時間領域と周波数領域との間で変換する規則(時間周波数変換)が一般的に利用されている。 In recent years, with the development of signal processing technology, many technologies for compressing and encoding audio signals with high efficiency have been proposed. The speech / acoustic encoding method is divided into a method of encoding in the time domain (time encoding method) and a method of encoding in the conversion domain after conversion according to a predetermined conversion rule (conversion encoding method). It can be divided roughly. As this conversion rule, for example, a rule for converting between the time domain and the frequency domain (time frequency conversion) such as DFT (Discrete Fourier Transform) and DCT (Discrete Cosine Transform) is generally used. Yes.
時間周波数変換では、時間領域において、ある個数のサンプルをまとめて変換フレームを構成し、この変換フレームに対して上記変換規則を適用することで、周波数領域での変換係数を得る。この変換係数を圧縮符号化する方式が変換符号化方式である。変換符号化方式を用いた代表的なオーディオ信号符号化技術としては、ISO/IECで規格化されたMPEG-2 Audio AAC(Moving Picture Expert Group-2 Advanced Audio Coding)を挙げることができる(例えば、非特許文献1参照。)。AACでは、修正離散コサイン変換(MDCT:Modified Discrete Cosine Transform)と呼ばれる変換規則が用いられており、この変換規則も時間周波数変換である。
In the time-frequency transform, a transform frame in the frequency domain is obtained by forming a transform frame by collecting a certain number of samples in the time domain and applying the transform rule to the transform frame. A method of compressing and encoding the transform coefficient is a transform coding method. As a typical audio signal coding technique using the transform coding system, there can be mentioned MPEG-2 Audio AAC (Moving Picture Expert Group-2 Advanced Audio Coding) standardized by ISO / IEC (for example, (Refer
また、非特許文献2においては、時間領域の符号化であるピッチパルス駆動音源とLPC(Linear Predictive Coding)フィルタとに基づく分析・合成系の符号化処理に際して、位相等化を用いる方法が開示されている。通常、ピッチパルス駆動音源とLPCフィルタとの合成では、位相特性が最小位相特性に限定されるため、原音声との整合性をとることが困難である。そこで、非特許文献2に開示の技術では、音声の位相は変形しても主観品質の変化が少ないという利点に鑑みて、原音声を最小位相に位相等化した音声と、ピッチパルス駆動音源と、LPCフィルタの合成音声との整合を図っている。 Non-Patent Document 2 discloses a method that uses phase equalization in encoding processing of an analysis / synthesis system based on a pitch pulse driving sound source and LPC (Linear Predictive Coding) filter, which are time domain encoding. ing. Usually, in the synthesis of the pitch pulse driving sound source and the LPC filter, the phase characteristic is limited to the minimum phase characteristic, and it is difficult to achieve consistency with the original voice. Therefore, in the technology disclosed in Non-Patent Document 2, in view of the advantage that there is little change in subjective quality even when the phase of the audio is deformed, the audio obtained by phase equalizing the original audio to the minimum phase, And matching with the synthesized speech of the LPC filter.
更に、特許文献1には、変換符号化に際して、フレーム内の途中に急峻な立ち上がり(以下、「アタック」と記す。)が存在する場合に発生するプリエコーを回避する方法が開示されている。このプリエコーは、アタックの前に存在する、信号レベルの比較的小さな部分に生じる歪みであり、耳障りな音として知覚されやすい。特許文献1に記載の技術では、フレーム内の途中に存在するアタックの位置が、フレームの開始位置となるように制御することで、プリエコーを回避する。
Further,
しかしながら、上記従来技術には、以下に説明するような問題点があった。
まず、非特許文献1に関して、DFTの変化係数には、変換基底の振幅情報及び位相情報が含まれるのに対して、MDCTの変化係数には、変換基底の振幅情報のみが含まれる。この点においては、DCTの変化係数に関してもMDCTと同様である。このため、入力信号に含まれている信号成分の位相が、この信号成分と周波数を同一とする変換基底の位相と一致している場合には、当該変換基底のみにより信号成分を表現できる。ところが、これらの位相がずれている場合には、当該変換基底のみならず他の周波数の変換基底を参照しない限り、信号成分を表現することはできない。その結果、変換係数は、上記信号成分の周波数に局所化することなく、他の周波数にまで拡散してしまい、圧縮効果が低減するという問題がある。
However, the above prior art has the following problems.
First, regarding
また、非特許文献2に記載の方法は、上述のように、ピッチパルス駆動音源とLPCフィルタとに基づく分析・合成系の符号化の位相特性に鑑みて、原音声を位相等化する方法である。しかし、この方法は、入力信号の変換係数の局所化を行うものではないので、変換符号化における圧縮効果は上がらない。また、位相等化のパラメータを決定する際に、所与の評価基準を用いてパラメータ毎に評価値を算出し、その評価値を比較した結果に基づいて、パラメータを決定するという処理は行われない。 Further, as described above, the method described in Non-Patent Document 2 is a method for phase equalizing the original speech in view of the phase characteristics of the analysis / synthesis coding based on the pitch pulse driving sound source and the LPC filter. is there. However, since this method does not localize the transform coefficient of the input signal, the compression effect in transform coding does not increase. Also, when determining the phase equalization parameter, a process is performed in which an evaluation value is calculated for each parameter using a given evaluation criterion, and the parameter is determined based on a result of comparison of the evaluation value. Absent.
更に、特許文献1に記載の技術は、フレーム内の途中にアタックが存在するという特別な状況を想定したものであり、当該文献には、アタックが存在しない状況に関しては何ら言及されていない。
Furthermore, the technique described in
そこで、本発明の課題は、上述の問題点に鑑みて、DCTやMDCTを始めとする、位相情報を明示的にもたない変換規則に関しても、変換係数の局在化を可能とすることで、変換符号化における圧縮効率を向上することである。 Therefore, in view of the above-described problems, an object of the present invention is to enable localization of transform coefficients for transform rules that do not explicitly include phase information, such as DCT and MDCT. It is to improve the compression efficiency in transform coding.
本発明に係る信号符号化装置は、入力された信号をフレームに分割する分割手段と、前記フレームの時間的特性を複数の変更量により変更する変更手段と、所定の評価基準に基づいて、時間的特性が変更された前記フレームの評価値を算出する算出手段と、算出された前記評価値に基づいて、前記複数の変更量の中から最適な変更量を選択する選択手段と、選択された前記最適な変更量だけフレームの時間的特性が変更された信号を変換符号化する符号化手段と、変換符号化された前記信号を信号符号化系列として出力する出力手段とを備える。 A signal encoding apparatus according to the present invention includes a dividing unit that divides an input signal into frames, a changing unit that changes temporal characteristics of the frame by a plurality of changing amounts, and a time based on a predetermined evaluation criterion. A calculation unit that calculates an evaluation value of the frame in which a characteristic is changed, a selection unit that selects an optimal change amount from the plurality of change amounts based on the calculated evaluation value, and Coding means for transform-coding the signal whose temporal characteristics of the frame have been changed by the optimum change amount, and output means for outputting the transform-coded signal as a signal coding sequence.
本発明に係る信号符号化方法は、入力された信号をフレームに分割する分割ステップと、前記フレームの時間的特性を複数の変更量により変更する変更ステップと、所定の評価基準に基づいて、時間的特性が変更された前記フレームの評価値を算出する算出ステップと、算出された前記評価値に基づいて、前記複数の変更量の中から最適な変更量を選択する選択ステップと、選択された前記最適な変更量だけフレームの時間的特性が変更された信号を変換符号化する符号化ステップと、変換符号化された前記信号を信号符号化系列として出力する出力ステップとを含む。 A signal encoding method according to the present invention includes a dividing step of dividing an input signal into frames, a changing step of changing temporal characteristics of the frame by a plurality of changing amounts, and a time based on a predetermined evaluation criterion. A calculation step for calculating an evaluation value of the frame in which a characteristic is changed, a selection step for selecting an optimal change amount from the plurality of change amounts based on the calculated evaluation value, and An encoding step for transform-encoding the signal in which the temporal characteristic of the frame is changed by the optimum change amount; and an output step for outputting the transform-encoded signal as a signal encoding sequence.
本発明に係る信号符号化装置において好ましくは、前記フレームの時間的特性を変更するか否かを判定する判定手段を更に備え、前記変更手段は、前記判定手段により時間的特性を変更すると判定されたフレームの時間的特性を複数の変更量により変更し、前記符号化手段は、前記判定手段により時間的特性を変更すると判定されたフレームに関しては、選択された前記最適な変更量だけ当該フレームの時間的特性が変更された信号を変換符号化すると共に、前記判定手段により時間的特性を変更しないと判定されたフレームに関しては、当該フレームの信号をそのまま変換符号化する。 Preferably, the signal encoding device according to the present invention further includes a determination unit that determines whether or not to change the temporal characteristic of the frame, and the changing unit is determined to change the temporal characteristic by the determination unit. The temporal characteristics of the received frame are changed by a plurality of change amounts, and the encoding means, with respect to the frame determined to change the temporal characteristics by the determination means, only the selected optimal change amount of the frame. The signal with the temporal characteristic changed is transform-coded, and for the frame determined not to change the temporal characteristic by the determination means, the signal of the frame is directly transform-coded.
本発明に係る信号符号化装置において、前記符号化手段は、前記フレームの信号に併せて、前記最適な変更量を符号化し、前記出力手段は、前記信号符号化系列に併せて、前記最適な変更量を示す変更量符号化系列を出力するものとしてもよい。
本発明に係る信号符号化装置の符号化手段は、離散コサイン変換係数、修正離散コサイン変換係数の何れかを符号化することができる。
In the signal encoding device according to the present invention, the encoding means encodes the optimal change amount in conjunction with the signal of the frame, and the output means in combination with the signal encoded sequence A change amount coded sequence indicating the change amount may be output.
The encoding means of the signal encoding apparatus according to the present invention can encode either the discrete cosine transform coefficient or the modified discrete cosine transform coefficient.
本発明に係る信号符号化装置の算出手段は、所定の変換規則に基づく変換利得を算出することができる。
また、前記算出手段は、聴覚心理モデルに基づく聴覚エントロピを算出するものとしてもよい。
更に、前記算出手段は、符復号信号(符号化復号信号とも称する。)の歪み信号に基づく客観評価値を算出することもできる。
The calculation means of the signal encoding device according to the present invention can calculate a conversion gain based on a predetermined conversion rule.
The calculation means may calculate auditory entropy based on an auditory psychological model.
Furthermore, the calculation means can also calculate an objective evaluation value based on a distortion signal of a code decoded signal (also referred to as an encoded decoded signal).
本発明に係る信号符号化装置の算出手段は、符復号信号の歪み量を算出するものとしてもよい。当該符復号信号の歪み量は、例えば、聴覚重み付けされた歪み量である。 The calculation means of the signal encoding apparatus according to the present invention may calculate the distortion amount of the codec signal. The distortion amount of the codec signal is, for example, an auditory weighted distortion amount.
本発明に係る信号復号装置は、入力された信号符号化系列を復号信号に復号する復号手段と、入力された変更量符号化系列を復号することにより、位相変更量、サンプル削除量、サンプル挿入量、時間的伸縮変更量のうち、少なくとも1つを含む復号変更量を生成する生成手段と、前記復号変更量に基づいて、前記復号信号の時間的特性を変更する変更手段と、前記変更手段により時間的特性が変更された復号信号を出力する出力手段とを備える。 The signal decoding apparatus according to the present invention includes a decoding unit that decodes an input signal encoded sequence into a decoded signal, and a phase change amount, a sample deletion amount, and a sample insertion by decoding the input change amount encoded sequence. Generating means for generating a decoding change amount including at least one of the amount and the temporal expansion / contraction change amount, a changing means for changing a temporal characteristic of the decoded signal based on the decoding change amount, and the changing means And outputting means for outputting a decoded signal whose temporal characteristics are changed.
本発明に係る信号復号方法は、入力された信号符号化系列を復号信号に復号する復号ステップと、入力された変更量符号化系列を復号することにより、位相変更量、サンプル削除量、サンプル挿入量、時間的伸縮変更量のうち、少なくとも1つを含む復号変更量を生成する生成ステップと、前記復号変更量に基づいて、前記復号信号の時間的特性を変更する変更ステップと、前記変更ステップにて時間的特性が変更された復号信号を出力する出力ステップとを含む。 The signal decoding method according to the present invention includes a decoding step for decoding an input signal encoded sequence into a decoded signal, and a phase change amount, a sample deletion amount, and a sample insertion by decoding the input change amount encoded sequence. A generation step for generating a decoding change amount including at least one of the amount and a temporal expansion / contraction change amount, a change step for changing a temporal characteristic of the decoded signal based on the decoding change amount, and the change step And outputting a decoded signal whose temporal characteristics have been changed.
これらの発明によれば、入力信号が一旦フレームに分割された後に、これらのフレームに時間的特性(例えば位相)の変更処理が施されて符号化される。これにより、変換係数が局在化される。したがって、位相情報をもたない変換規則に関しても、変換符号化における圧縮効率が向上する。更に、時間的特性を変更するか否かの判定をフレーム単位で行うものとすれば、必要のないフレームに関してまで時間的特性の変更を行うことに伴う、処理量の増大を抑制することができる。 According to these inventions, after the input signal is once divided into frames, these frames are subjected to the temporal characteristic (for example, phase) changing process and encoded. Thereby, the conversion coefficient is localized. Therefore, the compression efficiency in transform coding is improved even for transform rules that do not have phase information. Furthermore, if the determination as to whether or not to change the temporal characteristics is performed in units of frames, it is possible to suppress an increase in the amount of processing associated with changing the temporal characteristics even with respect to unnecessary frames. .
本発明によれば、時間的特性を変更して変換係数を局在化させることにより、DCTやMDCTのような位相情報を明示的にもたない変換規則に関しても、変換符号化における圧縮効率を向上することができる。 According to the present invention, by changing the temporal characteristics to localize the transform coefficient, the compression efficiency in transform coding can be improved even for transform rules having no phase information such as DCT and MDCT. Can be improved.
[第1の実施形態]
以下、例示のみの為に添付された図面を参照しながら、本発明の第1の実施形態について説明する。まず、本実施の形態における信号符号化装置10の構成を説明する。図1に示すように、信号符号化装置10は、フレーム分割部11(分割手段に対応)と時間的特性変更量指示部12と時間的特性変更部13(変更手段に対応)と時間的特性変更信号保持部14とフレーム評価値算出部15(算出手段に対応)と時間的特性変更量選択部16(選択手段に対応)と信号符号化部17(符号化手段に対応)と符号化系列出力部18(出力手段に対応)とを備える。これら各部はバスを介して接続されている。
[First Embodiment]
Hereinafter, a first embodiment of the present invention will be described with reference to the accompanying drawings for illustration only. First, the configuration of the
以下、信号符号化装置10の各構成要素について具体的に説明する。
フレーム分割部11は、入力信号を所定長Nのフレームに分割する。本実施の形態では、入力信号は、AD変換後のオーディオ信号つまりデジタル信号とする。
時間的特性変更量指示部12には、K個(Kは自然数)の時間的特性変更量が予め保持されている。時間的特性変更量指示部12は、これらの時間的特性変更量の中から1つの時間的特性変更量ck(k=0,1,…,K−1)分の時間的特性の変更を時間的特性変更部13に指示する。
Hereinafter, each component of the
The
The temporal characteristic change
時間的特性変更部13は、分割されたフレームのうちm番目の入力フレーム信号xmの時間的特性を、時間的特性変更量指示部12から指示された時間的特性変更量だけ変更する。時間的特性は、例えば入力信号の位相であり、この場合、時間的特性変更量は、入力信号の位相変更量となる。時間的特性変更部13は、時間的特性が変更されたフレームを時間的特性変更フレーム信号xmkとして出力する。
Temporal
時間的特性変更信号保持部14には、時間的特性変更部13から入力された時間的特性変更フレーム信号xmkが保持される。また、時間的特性変更信号保持部14は、入力フレーム信号xmに関する全ての時間的特性変更量ckのうち、最適の時間的特性変更量cm,sltを採る時の時間的特性変更フレーム信号xm,sltを信号符号化部17に出力する。
The temporal characteristic change
フレーム評価値算出部15は、時間的特性変更部13より入力された時間的特性変更フレーム信号xmkから、所定の算定式を用いてフレーム評価値を算出する。フレーム評価値としては、例えば、変換係数の局所化の度合いを表す変換利得を使用することができる。変換規則としてDCT(Discrete Cosine Transform)を適用した場合、変換係数gmkは、DCT係数Xmkn(n=0,1,…,N−1)を用いて、次式(1)により算定することができる。
フレーム評価値としては、変換利得以外のパラメータを利用することもできる。その例が、聴覚エントロピである。聴覚エントロピは、聴覚的に雑音が知覚されないように符号化するために必要な情報量の最小値である。聴覚エントロピの詳細な算出手法に関しては、例えば、文献「Johnston, J. D., “Estimation of perceptual entropy using noise masking criteria”, Proc. of IEEE Int. Conf. Acoust., Speech and Signal Proc., pp. 2524-2527,1988.」に記載されている。
また、変換規則には、MDCT(Modified Discrete Cosine Transform)を用いてもよい。
Parameters other than the conversion gain can be used as the frame evaluation value. An example is auditory entropy. Auditory entropy is the minimum value of information necessary for encoding so that noise is not perceptually perceived. For a detailed method for calculating auditory entropy, see, for example, the document “Johnston, JD,“ Estimation of perceptual entropy using noise masking criteria ”, Proc. Of IEEE Int. Conf. Acoust., Speech and Signal Proc., Pp. 2524- 2527, 1988. ”.
Further, MDCT (Modified Discrete Cosine Transform) may be used as the conversion rule.
フレーム評価値は、時間的特性変更量指示部12に保持されている全ての時間的特性変更量による時間的特性変更フレーム信号に関して算出される。すなわち、フレーム評価値算出部15は、時間的特性変更量指示部12に保持されているK個の時間的特性変更量ckのそれぞれに関して、フレーム評価値Emkの算出を行う。
The frame evaluation value is calculated for the temporal characteristic change frame signal based on all temporal characteristic change amounts held in the temporal characteristic change
時間的特性変更量選択部16は、入力フレーム信号xmについて全ての時間的特性変更量ckに対応するフレーム評価値Emkが算出された後に、フレーム評価値が最も高い値を採る時間的特性変更量を最適変更量に選択する。フレーム評価値が変換利得の場合には、対応する変換利得が最も大きい時間的特性変更量が最適変更量として選択される。時間的特性変更量選択部16は、選択した時間的特性変更量の最適変更量cm,sltを時間的特性変更信号保持部14に通知する。
Temporal characteristic
信号符号化部17は、時間的特性変更フレーム信号xm,sltを符号化して信号符号化系列を生成し、後段の符号化系列出力部18に出力する。信号符号化部17は、変換符号化に際して、MPEG-2のAAC(Advanced Audio Coding)を用いることができる。
符号化系列出力部18は、信号符号化部17から入力された信号符号化系列を外部装置に出力する。
The
The encoded
なお、時間的特性変更信号保持部14に保持されている信号は、時間信号でなくてもよい。すなわち、フレーム評価値算出部15にて時間的特性変更信号の変換係数が算出され、この変換係数が信号符号化部17で利用される場合には、その変換係数を時間的特性変更信号保持部14に保持させるものとしてもよい。この場合、信号符号化部17において変換係数を算出する必要が無くなるという効果がある。
The signal held in the temporal characteristic change
次に、図2を参照しながら、本実施の形態における信号符号化装置10の動作、併せて、本発明に係る信号符号化方法を構成する各ステップについて説明する。動作説明の前提として、時間的特性変更量指示部12には、K個の時間的特性変更量ck(k=0,1,…,K−1)が保持されているものとする。
Next, with reference to FIG. 2, the operation of the
まず、入力信号が、所定のデータ長Nを有するフレームに分割されると(S1)、時間的特性変更量を特定するインデックスkに初期値として“0”が設定される(S2)。続いて、時間的特性変更量の数Kとインデックスkとの大小関係が比較される(S3)。k<Kが成立する場合には(S3;YES)、入力フレーム信号xmの時間的特性は時間的特性変更量ckにより変更され、その結果、時間的特性変更フレーム信号xmkが生成及び保持される(S4)。 First, when an input signal is divided into frames having a predetermined data length N (S1), “0” is set as an initial value to an index k for specifying a temporal characteristic change amount (S2). Subsequently, the magnitude relationship between the number K of temporal characteristic change amounts and the index k is compared (S3). if k <K is satisfied (S3; YES), the temporal characteristics of the input frame signal x m is changed by the temporal characteristic change amount c k, as a result, generation and temporal characteristic change frame signal x mk It is held (S4).
S5では、S4で生成された時間的特性変更フレーム信号xmkのフレーム評価値Emkが算出される。その後、kに1が加算され(S6)、S3〜S6の一連の処理は、k=Kが成立するまで繰り返し実行される。 In S5, the frame evaluation value E mk of the temporal characteristic change frame signal x mk generated in S4 is calculated. Thereafter, 1 is added to k (S6), and a series of processes from S3 to S6 are repeatedly executed until k = K is established.
k<Kが成立しない場合、すなわちk≧Kが成立する場合には(S3;NO)、S4で使用された各時間的特性変更量ckに対応するフレーム評価値Emkの中から最も評価の高い値Em,sltが選択される。そして、これに対応する時間的特性変更量cm,sltが最適変更量として選択される(S7)。S8では、時間的特性変更量cm,sltに対応する時間的特性変更フレーム信号xm,sltが符号化される。この時間的特性変更フレーム信号xm,sltの符号化系列は、信号符号化系列として装置外部に出力される(S9)。 When k <K is not satisfied, that is, when k ≧ K is satisfied (S3; NO), the most evaluated frame evaluation value E mk corresponding to each temporal characteristic change amount ck used in S4. A high value Em, slt is selected. Then, the temporal characteristic change amount cm, slt corresponding to this is selected as the optimum change amount (S7). In S8, the temporal characteristic change frame signal xm, slt corresponding to the temporal characteristic change amount cm, slt is encoded. The encoded sequence of the temporal characteristic change frame signal xm, slt is output to the outside of the apparatus as a signal encoded sequence (S9).
S10では、S1で分割された入力信号を構成するフレームのうち、最終フレームまで一連の処理(S2〜S9の各処理)が終了したか否かが判定される。終了していない場合には(S10;NO)、信号符号化系列が未だに出力されていないフレームが残存するものと判断できるので、S2に戻り、後続のフレームに関して上記一連の処理が実行される。入力信号を構成する全てのフレームに関して上記一連の処理が完了した時点で(S10;YES)、本実施の形態の信号符号化処理は終了する。 In S10, it is determined whether a series of processes (each process of S2 to S9) has been completed up to the final frame among the frames constituting the input signal divided in S1. If it has not been completed (S10; NO), it can be determined that there remains a frame for which a signal encoded sequence has not yet been output. When the above-described series of processing is completed for all the frames constituting the input signal (S10; YES), the signal encoding processing of the present embodiment ends.
ここで、図3は、第1の実施形態の変形態様における信号符号化装置10の動作を説明するためのフローチャートである。本態様における信号符号化装置10の動作は、上記詳述した信号符号化装置10の動作と類似するので、共通するステップには同一のステップ番号を付すと共に、その説明は省略する。かかる態様では、差異であるS11〜S13の処理をS5の後処理として追加することにより、S7の処理の実行を省略する。
Here, FIG. 3 is a flowchart for explaining the operation of the
すなわち、S11ではk=0であるか否かの判定が為され、k=0である場合には(S11;YES)、Em,slt=Emk,cm,slt=ck,xm,slt=xmkがそれぞれ設定される(S12)。一方、k≠0である場合には(S11;NO)、フレーム評価値Emkの評価がEm,sltの評価よりも高いか否かが判定される(S13)。判定の結果、フレーム評価値Emkの評価がEm,sltの評価よりも高い場合には(S13;YES)、S12に移行し、フレーム評価値Emkの評価がEm,sltの評価以下である場合には(S13;NO)、S12の処理は省略され、S6以降の処理に移行する。 That is, in S11, it is determined whether or not k = 0. If k = 0 (S11; YES), E m, slt = E mk , cm, slt = c k , x m , Slt = x mk are set (S12). On the other hand, if k ≠ 0 (S11; NO), it is determined whether or not the evaluation of the frame evaluation value E mk is higher than the evaluation of E m, slt (S13). As a result of the determination, when the evaluation of the frame evaluation value E mk is higher than the evaluation of E m, slt (S13; YES), the process proceeds to S12, and the evaluation of the frame evaluation value E mk is equal to or less than the evaluation of E m, slt . (S13; NO), the process of S12 is omitted, and the process proceeds to S6 and subsequent processes.
このような変形態様を採ることにより、評価の最も高い時間的特性変更信号、時間的特性変更量、及び、フレーム評価値を信号符号化装置10に保持しておけば、変換係数を局在化することができる。換言すれば、全ての時間的特性変更信号、時間的特性変更量、及びフレーム評価値を保持しておく必要が無いので、データ記憶領域の節約が実現される。
By adopting such a modification mode, if the temporal characteristic change signal, the temporal characteristic change amount, and the frame evaluation value with the highest evaluation are held in the
[第2の実施形態]
次に、図4及び図5を参照して、本発明の第2の実施形態について説明する。
図4は、本実施の形態における信号符号化装置の機能的構成を示すブロック図である。信号符号化装置20の構成は、第1の実施形態において詳述した信号符号化装置10の構成と類似するので、共通する構成部分には同列(末尾が同一)の符号を付しその説明は省略すると共に、第1の実施形態との差異について詳述する。
[Second Embodiment]
Next, a second embodiment of the present invention will be described with reference to FIGS.
FIG. 4 is a block diagram showing a functional configuration of the signal encoding apparatus according to the present embodiment. Since the configuration of the
変更量符号化部29は、信号符号化装置20に特有の構成部分である。
変更量符号化部29は、時間的特性変更量選択部26から通知された時間的特性変更量cm,sltを符号化して変更量符号化系列を生成する。この変更量符号化系列は、符号化系列出力部28により、信号符号化系列とともに出力される。
The change
The change
次いで、図5を参照することで、第2の実施形態における信号符号化処理について説明する。本信号符号化処理は、第1の実施形態において詳述した信号符号化処理(図2参照)と共通するステップを複数含む。具体的には、図5のS21〜S27,S210は、図2に示したS1〜S7,S10にそれぞれ相当する。 Next, the signal encoding process in the second embodiment will be described with reference to FIG. This signal encoding process includes a plurality of steps in common with the signal encoding process (see FIG. 2) described in detail in the first embodiment. Specifically, S21 to S27 and S210 in FIG. 5 correspond to S1 to S7 and S10 shown in FIG. 2, respectively.
以下、第1及び第2の実施形態における差異であるS28,S29について説明する。図5のS28では、符号化系列出力部28により、時間的特性変更フレーム信号xm,sltと最適変更量cm,sltとが符号化される。その結果、時間的特性変更フレーム信号xm,sltからは信号符号化系列が生成され、最適変更量cm,sltからは変更量符号化系列が生成される。これらの符号化系列は、符号化系列出力部28により外部装置に出力される(S29)。
Hereinafter, S28 and S29, which are the differences between the first and second embodiments, will be described. In S28 of FIG. 5, the encoded
[第3の実施形態]
次に、図6及び図7を参照して、本発明の第3の実施形態について説明する。
図6は、本実施の形態における信号符号化装置の機能的構成を示すブロック図である。信号符号化装置30の構成は、第1の実施形態において詳述した信号符号化装置10の構成と類似するので、共通する構成部分には同列(末尾が同一)の符号を付しその説明は省略すると共に、第1の実施形態との差異について詳述する。
[Third Embodiment]
Next, a third embodiment of the present invention will be described with reference to FIGS.
FIG. 6 is a block diagram showing a functional configuration of the signal encoding apparatus according to the present embodiment. Since the configuration of the
時間的特性変更判定部39(判定手段に対応)は、信号符号化装置30に特有の構成部分である。
時間的特性変更判定部39は、分割されたm番目の入力フレーム信号xmに対して時間的特性の変更処理を施すか否かの判定を行う。判定の基準としては、例えば、入力フレーム信号xmの電力値を算出し、この電力値と閾値との大小関係を利用することができる。すなわち、時間的特性変更判定部39は、フレームの電力値が閾値以上である場合にのみ時間的特性変更処理を実行する。
The temporal characteristic change determination unit 39 (corresponding to the determination unit) is a component unique to the
The temporal characteristic
続いて、図7を参照することで、第3の実施形態における信号符号化処理について説明する。本信号符号化処理は、第1の実施形態において詳述した信号符号化処理(図2参照)と共通するステップを複数含む。具体的には、図7のS31,S33〜S311は、図2に示したS1,S2〜S10にそれぞれ相当する。 Subsequently, a signal encoding process according to the third embodiment will be described with reference to FIG. This signal encoding process includes a plurality of steps in common with the signal encoding process (see FIG. 2) described in detail in the first embodiment. Specifically, S31 and S33 to S311 in FIG. 7 correspond to S1, S2 to S10 shown in FIG.
以下、第1及び第3の実施形態における差異であるS32,S312について説明する。図7のS32では、時間的特性変更判定部39により、時間的特性の変更処理を実行するか否かの判定が為される。当該判定の結果、変更処理の実行が決定された場合には(S32;YES)、S33以降の処理に移行する。これに対して、変更処理の非実行が決定された場合には(S32;NO)、信号符号化処理はS312に移行する。すなわち、入力フレーム信号は、フレーム分割部31から信号符号化部37に出力され、時間的特性変更処理が施されないまま符号化される(S39)。符号化の結果生成された信号符号化系列は、符号化系列出力部38から外部に出力される(S310)。
Hereinafter, S32 and S312 which are the differences between the first and third embodiments will be described. In S32 of FIG. 7, the temporal characteristic
[第4の実施形態]
次に、図8及び図9を参照して、本発明の第4の実施形態について説明する。
図8は、本実施の形態における信号符号化装置の機能的構成を示すブロック図である。信号符号化装置40の構成は、第3の実施形態において詳述した信号符号化装置30の構成と類似するので、共通する構成部分には同列(末尾が同一)の符号を付しその説明は省略すると共に、第3の実施形態との差異について詳述する。
[Fourth Embodiment]
Next, a fourth embodiment of the present invention will be described with reference to FIGS.
FIG. 8 is a block diagram showing a functional configuration of the signal encoding apparatus according to the present embodiment. Since the configuration of the
時間的特性変更判定部49は、分割されたm番目の入力フレーム信号xmに対して時間的特性の変更処理を施すか否かの判定を行う。時間的特性の変更処理を実行しないものと判定された場合には、時間的特性変更判定部49は、入力フレーム信号を信号符号化部47に直接に出力すると共に、時間的特性変更処理が施されていない旨を示す時間的特性変更量「ゼロ」を変更量符号化部410に通知する。一方、時間的特性の変更処理を実行するものと判定された場合には、時間的特性変更判定部49は、変更量「ゼロ」を変更量符号化部410に通知することなく、入力フレーム信号を時間的特性変更部43に出力する。
The temporal characteristic
変更量符号化部410は、時間的特性変更量選択部46から通知された時間的特性変更量cm,sltを符号化して変更量符号化系列を生成する。また、変更量符号化部410は、時間的特性変更処理が実行されない場合に入力される変更量「ゼロ」を符号化して変更量符号化系列を生成する。これらの変更量符号化系列は、符号化系列出力部48により、信号符号化系列とともに出力される。
The change
次いで、図9を参照することで、第4の実施形態における信号符号化処理について説明する。本信号符号化処理は、第3の実施形態において詳述した信号符号化処理(図7参照)と基本的に同様である。具体的には、図9のS41〜S411は、図7に示したS31〜S311にそれぞれ相当する。特に、S49,S410の各処理に関しては、第2の実施形態にて説明したS28,S29(図5参照)と同様である。 Next, a signal encoding process in the fourth embodiment will be described with reference to FIG. This signal encoding process is basically the same as the signal encoding process (see FIG. 7) described in detail in the third embodiment. Specifically, S41 to S411 in FIG. 9 correspond to S31 to S311 shown in FIG. 7, respectively. In particular, the processes of S49 and S410 are the same as S28 and S29 (see FIG. 5) described in the second embodiment.
以下、第3と第4の実施形態との差異であるS412について説明する。図9のS412は、時間的特性変更処理が実行されないと判定された場合(S42;NO)に実行される。S412では、入力フレーム信号xmが、時間的特性変更フレーム信号xm,sltとして信号符号化部47に入力される。同様に、最適変更量cm,sltとしては、上記変更処理を施していないことを示す「ゼロ」が変更量符号化部410に入力される。S412の処理が終了すると、S49以降の処理に移行する。
Hereinafter, S412 which is the difference between the third and fourth embodiments will be described. S412 in FIG. 9 is executed when it is determined that the temporal characteristic changing process is not executed (S42; NO). In S412, the input frame signal x m is the temporal characteristic change frame signal x m, is input to the
[第5の実施形態]
次に、図10及び図11を参照して、本発明の第5の実施形態について説明する。図10は、生成された符号化系列を復号する信号復号装置の機能的構成を示すブロック図である。図10に示すように、信号復号装置50は、信号復号部51(復号手段に対応)と、変更量復号部52(生成手段に対応)と、時間的特性変更部53(変更手段に対応)と、時間的特性変更復号フレーム信号出力部54(出力手段に対応)とを備える。これら各部はバスを介して接続されている。
[Fifth Embodiment]
Next, a fifth embodiment of the present invention will be described with reference to FIGS. FIG. 10 is a block diagram illustrating a functional configuration of a signal decoding apparatus that decodes a generated encoded sequence. As shown in FIG. 10, the
信号復号部51は、入力された信号符号化系列を復号して復号信号とする。
変更量復号部52は、入力された変更量符号化系列を復号することにより、位相変更量、サンプル削除量、サンプル挿入量、時間的伸縮変更量のうち、少なくとも1つを含む復号変更量を生成する。
The
The change
時間的特性変更部53は、生成された復号変更量に基づいて、復号信号の時間的特性を変更する。時間的特性変更部53は、例えば位相変更部として機能し、この場合、変更量符号化系列としては位相変更量が符号化されたものが使用される。例えば、第2の実施形態における信号符号化装置20において、入力フレーム信号xmの時間的特性が復号変更量csltにより変更された場合には、本実施の形態における信号復号装置50では、−csltにより、復号フレーム信号xmの時間的特性を変更する。
時間的特性変更復号フレーム信号出力部54は、時間的特性が変更された復号信号を時間的特性変更復号フレーム信号(復号信号に対応)として外部に出力する。
The temporal
The temporal characteristic changed decoded frame
続いて、図11を参照しながら、信号復号装置50の動作を説明する。
まずT1では、信号復号部51において、入力された信号符号化系列が復号され、その結果、復号フレーム信号x’mが生成される。この復号フレーム信号x’mは、時間的特性変更部53に入力される。一方、変更量復号部52では、入力された変更量符号化系列が復号された結果、復号変更量c’sltが生成される(T2)。この復号変更量c’sltは、時間的特性変更部53に入力される。T1,T2の処理は、T2,T1の順で、つまり逆順で実行されてもよいし、同時に並行して実行されてもよい。
Next, the operation of the
First, at T1, the
時間的特性変更部53は、上記復号フレーム信号x’mの時間的特性を、上記復号変更量c’sltに基づいて変更し、時間的特性変更復号フレーム信号x’m,sltを生成する(T3)。そして、生成された時間的特性変更復号フレーム信号x’m,sltは、時間的特性変更復号フレーム信号出力部54にて出力される(T4)。T5では、最終のフレーム信号までの復号処理が完了したか否かの判定が為され、完了していない場合には(T5;NO)T1以降の処理が再び実行される。全てのフレーム信号に関する信号復号処理が終了した時点で(T5;YES)、一連の信号復号処理は終了する。
The temporal
以上説明したように、第1〜第5の実施形態における信号符号化装置10〜50によれば、入力信号がフレームに分割された後に、これらのフレームに時間的特性(例えば位相)の変更処理を施して符号化(第5の実施形態では復号)する。したがって、位相情報を明示的にもたない変換規則に関しても変換係数が局在化されるので、変換符号化における圧縮効率(第5の実施形態では伸張効率)が向上する。更に、第1、第3、及び第4の実施形態における信号符号化装置10,30,40によれば、時間的特性を変更するか否かの判定をフレーム単位で行うため、本来不必要な、フレームに関する時間的特性の変更処理を省略することができる。この結果、処理量が必要最小限に低減される。
As described above, according to the
なお、本発明は、上述した各実施の形態に限定されるものではなく、その趣旨を逸脱しない範囲において、適宜変形態様を採ることもできる。
例えば、第1〜第5の実施形態においては、時間的特性変更部は、時間的特性の一例である位相を変更するものとしたが、サンプル削除機能を有するものとしてもよい。すなわち、時間的特性変更部は、時間的特性変更量としてサンプル削除量が指示されたことに伴い、サンプル削除量だけ入力信号からサンプルを削除する。かかる態様では、フレーム分割部は、入力信号をフレームに分割する際に、あるフレーム信号から上記サンプル削除量だけサンプルを削除した後に、後続のフレーム信号に当該サンプル削除量だけサンプルを追加する。これにより、データ長Nのフレームを構成する。
In addition, this invention is not limited to each embodiment mentioned above, In the range which does not deviate from the meaning, a deformation | transformation aspect can also be taken suitably.
For example, in the first to fifth embodiments, the temporal characteristic changing unit changes the phase, which is an example of the temporal characteristic, but may have a sample deletion function. That is, the temporal characteristic changing unit deletes the sample from the input signal by the amount of sample deletion when the sample deletion amount is instructed as the temporal characteristic change amount. In such an aspect, when the input signal is divided into frames, the frame dividing unit deletes the sample from the certain frame signal by the sample deletion amount, and then adds the sample to the subsequent frame signal by the sample deletion amount. Thus, a frame having a data length N is configured.
反対に、時間的特性変更部は、サンプル挿入機能を有することもできる。すなわち、時間的特性変更部は、時間的特性変更量としてサンプル挿入量が指示されたことに伴い、サンプル挿入量だけ入力信号にサンプルを挿入する。本態様では、フレーム分割部は、入力信号をフレームに分割する際に、あるフレーム信号に対して上記サンプル挿入量だけサンプルを挿入した後、当該フレーム信号の末尾のサンプルより当該サンプル挿入量だけサンプルを消去する。これにより、データ長Nのフレームを構成する。消去されたサンプルは、後続するフレーム信号の先頭のサンプルに使用される。 On the contrary, the temporal characteristic changing unit may have a sample insertion function. That is, the temporal characteristic changing unit inserts a sample into the input signal by the amount of sample insertion when the sample insertion amount is instructed as the temporal characteristic change amount. In this aspect, when the frame dividing unit divides the input signal into frames, after inserting the sample by the sample insertion amount into a certain frame signal, the sample is inserted by the sample insertion amount from the sample at the end of the frame signal. Erase. Thus, a frame having a data length N is configured. The erased sample is used as the first sample of the subsequent frame signal.
更に、時間的特性変更部は、時間的伸縮機能を有するものとしてもよい。すなわち、時間的特性変更部は、入力フレーム信号のある部分の時間分解能を高くし、その分、別の信号部分の時間分解能を低くする。これにより、サンプル数を変えることなく、入力フレーム信号の時間的伸縮を実現する。 Furthermore, the temporal characteristic changing unit may have a temporal expansion / contraction function. That is, the temporal characteristic changing unit increases the time resolution of a certain part of the input frame signal and decreases the time resolution of another signal part accordingly. This realizes temporal expansion and contraction of the input frame signal without changing the number of samples.
図12を参照して、より具体的に説明すると、時間的特性変更部(例えば、第1の実施形態における時間的特性変更部13)は、複数の特性変更部に分割することができる。すなわち、第1時間的特性変更部131に位相変更機能をもたせ、第2、第3時間的特性変更部132,133にそれぞれサンプル削除機能、サンプル挿入機能をもたせることができる。この場合、フレーム評価値算出部15は、第1〜第3の時間的特性変更信号の各々に関してフレーム評価値を算定する。
More specifically, with reference to FIG. 12, the temporal characteristic changing unit (for example, the temporal
例えば、時間的特性変更量指示部12が、第1時間的特性変更量をK1個、第2時間的特性変更量をK2個、第3時間的特性変更量をK3個、保持しているものとする。かかる例では、(K1+K2+K3)個のフレーム評価値が算出されることになる。時間的特性変更量選択部16は、これら全ての時間的特性変更量に対応するフレーム評価値の高低を比較して、評価が最も高い時間的特性変更量を最適変更量に選択する。選択された最適変更量に対応する時間的特性変更信号は、時間的特性変更信号保持部14から信号符号化部17に出力される。
For example, the temporal characteristic change
なお、本変形態様において、時間的特性変更量指示部12は、各フレーム信号に対して異なる種類の時間的特性変更量を指示するものとしてもよい。また、過去のフレーム信号において選択された時間的特性変更量に応じて、指示する時間的特性変更量を変化させてもよい。
In this modification, the temporal characteristic change
更に別の変形態様における信号符号化装置は、符号化歪みを算出して、その歪み量や聴覚的な重み付けをした歪み量をフレーム評価値に使用する。あるいは、符復号信号を用いてPESQ(ITU−T勧告 P.862)、PEAQ(ITU−R勧告 BS.1387−1)により算出される客観評価値を用いることもできる。符復号信号の歪み量を評価値とした態様(前者の態様)における信号符号化装置の構成例を図13に示す。 Further, the signal coding apparatus according to another modification mode calculates coding distortion, and uses the distortion amount or the distortion amount subjected to auditory weighting as a frame evaluation value. Alternatively, an objective evaluation value calculated by PESQ (ITU-T recommendation P.862) or PEAQ (ITU-R recommendation BS.1387-1) using a codec signal may be used. FIG. 13 shows a configuration example of the signal encoding apparatus in an aspect (the former aspect) in which the amount of distortion of the codec signal is an evaluation value.
図13に示すように、時間的特性変更フレーム信号xmkは、信号符号化部17にて符号化され、その結果、信号符号化系列が生成される。この信号符号化系列は、符号化歪み量算出部19と信号符号化系列保持部110とに出力される。符号化歪み量算出部19は、入力された信号符号化系列を復号して符復号信号を得る。そして、この信号と入力フレーム信号との差分である歪みのエネルギ量(符号化歪み量dmk)を算出する。
As shown in FIG. 13, the temporal characteristic change frame signal x mk is encoded by the
入力フレーム信号xmに関して、全ての時間的特性変更量ckに対応する符号化歪み量dmkが算出されると、時間的特性変更量選択部16において、最も小さい符号化歪み量に対応する時間的特性変更量が、最適変更量cm,sltに選択される。信号符号化系列保持部110には、時間的特性変更量と信号符号化系列とが予め対応付けて保持されている。信号符号化系列保持部110は、時間的特性変更量選択部16より通知される上記最適変更量cm,sltに対応する信号符号化系列を符号化系列出力部18に出力する。符号化系列出力部18は、この信号符号化系列を出力する。
When the encoding distortion amount d mk corresponding to all temporal characteristic change amounts ck is calculated for the input frame signal x m , the temporal characteristic change
第1の実施形態に関しては、図3を参照して説明した変形態様を採ることができることは上述した通りであるが、かかる態様は、他の変形態様と同様に、第2〜第4の実施形態に対しても適用可能である。これにより、信号符号化装置は、全ての時間的特性変更信号、時間的特性変更量、及びフレーム評価値を保持しておく必要が無い。このため、記憶データ容量を節減することができる。 Regarding the first embodiment, it is as described above that the modified embodiment described with reference to FIG. 3 can be adopted. However, this embodiment is similar to the other modified embodiments in the second to fourth embodiments. It is applicable to the form. This eliminates the need for the signal encoding device to hold all temporal characteristic change signals, temporal characteristic change amounts, and frame evaluation values. For this reason, the storage data capacity can be reduced.
10,20,30,40…信号符号化装置、11,21,31,41…フレーム分割部、12,22,32,42…時間的特性変更量指示部、13,23,33,43…時間的特性変更部、131…第1時間的特性変更部、132…第2時間的特性変更部、133…第3時間的特性変更部、14,24,34,44…時間的特性変更信号保持部、15,25,35,45…フレーム評価値算出部、16,26,36,46…時間的特性変更量選択部、17,27,37,47…信号符号化部、18,28,38,48…符号化系列出力部、19…符号化歪み量算出部、110…信号符号化系列保持部、29,410…変更量符号化部、39,49…時間的特性変更判定部、50…信号復号装置、51…信号復号部、52…変更量復号部、53…時間的特性変更部、54…時間的特性変更復号フレーム信号出力部
10, 20, 30, 40 ... signal encoding device, 11, 21, 31, 41 ... frame division unit, 12, 22, 32, 42 ... temporal characteristic change amount instruction unit, 13, 23, 33, 43 ... time Characteristic change unit, 131... First time characteristic change unit, 132... Second time characteristic change unit, 133... Third time characteristic change unit, 14, 24, 34, 44. , 15, 25, 35, 45... Frame evaluation value calculation unit, 16, 26, 36, 46... Temporal characteristic change amount selection unit, 17, 27, 37, 47... Signal encoding unit, 18, 28, 38,. 48 ... Coding sequence output unit, 19 ... Coding distortion amount calculation unit, 110 ... Signal coding sequence holding unit, 29, 410 ... Change amount coding unit, 39, 49 ... Temporal characteristic change determination unit, 50 ...
Claims (12)
前記フレームの時間的特性を複数の変更量により変更する変更手段と、
所定の評価基準に基づいて、時間的特性が変更された前記フレームの評価値を算出する算出手段と、
算出された前記評価値に基づいて、前記複数の変更量の中から最適な変更量を選択する選択手段と、
選択された前記最適な変更量だけフレームの時間的特性が変更された信号を変換符号化する符号化手段と、
変換符号化された前記信号を信号符号化系列として出力する出力手段と
を備えることを特徴とする信号符号化装置。 A dividing means for dividing the input signal into frames;
Change means for changing the temporal characteristics of the frame by a plurality of change amounts;
A calculation means for calculating an evaluation value of the frame whose temporal characteristics have been changed based on a predetermined evaluation criterion;
Selection means for selecting an optimum change amount from the plurality of change amounts based on the calculated evaluation value;
Coding means for transform-coding a signal in which the temporal characteristics of the frame are changed by the selected optimum change amount;
And a signal encoding device comprising: an output unit configured to output the transform-coded signal as a signal encoded sequence.
前記変更手段は、前記判定手段により時間的特性を変更すると判定されたフレームの時間的特性を複数の変更量により変更し、
前記符号化手段は、前記判定手段により時間的特性を変更すると判定されたフレームに関しては、選択された前記最適な変更量だけ当該フレームの時間的特性が変更された信号を変換符号化すると共に、前記判定手段により時間的特性を変更しないと判定されたフレームに関しては、当該フレームの信号をそのまま変換符号化することを特徴とする請求項1に記載の信号符号化装置。 A determination means for determining whether to change the temporal characteristic of the frame;
The changing means changes the temporal characteristics of the frame determined to change the temporal characteristics by the determining means by a plurality of change amounts,
The encoding unit transform-encodes a signal in which the temporal characteristic of the frame is changed by the selected optimal change amount for the frame determined to change the temporal characteristic by the determining unit; 2. The signal encoding apparatus according to claim 1, wherein for the frame determined not to change the temporal characteristic by the determination unit, the signal of the frame is directly converted and encoded.
前記出力手段は、前記信号符号化系列に併せて、前記最適な変更量を示す変更量符号化系列を出力する
ことを特徴とする請求項1又は2に記載の信号符号化装置。 The encoding means encodes the optimum amount of change together with the signal of the frame,
The signal encoding apparatus according to claim 1, wherein the output unit outputs a change amount coding sequence indicating the optimum change amount together with the signal coding sequence.
入力された変更量符号化系列を復号することにより、位相変更量、サンプル削除量、サンプル挿入量、時間的伸縮変更量のうち、少なくとも1つを含む復号変更量を生成する生成手段と、
前記復号変更量に基づいて、前記復号信号の時間的特性を変更する変更手段と、
前記変更手段により時間的特性が変更された復号信号を出力する出力手段と
を備えることを特徴とする信号復号装置。 Decoding means for decoding an input signal encoded sequence into a decoded signal;
Generating means for generating a decoding change amount including at least one of a phase change amount, a sample deletion amount, a sample insertion amount, and a temporal expansion / contraction change amount by decoding the input change amount encoded sequence;
Changing means for changing a temporal characteristic of the decoded signal based on the decoding change amount;
An output means for outputting a decoded signal whose temporal characteristics have been changed by the changing means.
前記フレームの時間的特性を複数の変更量により変更する変更ステップと、
所定の評価基準に基づいて、時間的特性が変更された前記フレームの評価値を算出する算出ステップと、
算出された前記評価値に基づいて、前記複数の変更量の中から最適な変更量を選択する選択ステップと、
選択された前記最適な変更量だけフレームの時間的特性が変更された信号を変換符号化する符号化ステップと、
変換符号化された前記信号を信号符号化系列として出力する出力ステップと
を含むことを特徴とする信号符号化方法。 A dividing step of dividing the input signal into frames;
A change step of changing the temporal characteristics of the frame by a plurality of change amounts;
A calculation step for calculating an evaluation value of the frame whose temporal characteristics are changed based on a predetermined evaluation criterion;
A selection step of selecting an optimal change amount from the plurality of change amounts based on the calculated evaluation value;
An encoding step of transform-encoding a signal in which the temporal characteristics of the frame are changed by the selected optimal change amount;
An output step of outputting the transform-encoded signal as a signal encoding sequence.
入力された変更量符号化系列を復号することにより、位相変更量、サンプル削除量、サンプル挿入量、時間的伸縮変更量のうち、少なくとも1つを含む復号変更量を生成する生成ステップと、
前記復号変更量に基づいて、前記復号信号の時間的特性を変更する変更ステップと、
前記変更ステップにて時間的特性が変更された復号信号を出力する出力ステップと
を含むことを特徴とする信号復号方法。 A decoding step of decoding the input signal encoded sequence into a decoded signal;
Generating a decoding change amount including at least one of a phase change amount, a sample deletion amount, a sample insertion amount, and a temporal expansion / contraction change amount by decoding the input change amount encoded sequence;
A changing step of changing a temporal characteristic of the decoded signal based on the decoding change amount;
An output step of outputting the decoded signal whose temporal characteristics have been changed in the changing step.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004100895A JP2005284162A (en) | 2004-03-30 | 2004-03-30 | Signal coding device, signal decoding device, signal coding method, and signal decoding method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004100895A JP2005284162A (en) | 2004-03-30 | 2004-03-30 | Signal coding device, signal decoding device, signal coding method, and signal decoding method |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005284162A true JP2005284162A (en) | 2005-10-13 |
Family
ID=35182570
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004100895A Pending JP2005284162A (en) | 2004-03-30 | 2004-03-30 | Signal coding device, signal decoding device, signal coding method, and signal decoding method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005284162A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008111991A (en) * | 2006-10-30 | 2008-05-15 | Ntt Docomo Inc | Encoder, decoder, encoding method and decoding method |
-
2004
- 2004-03-30 JP JP2004100895A patent/JP2005284162A/en active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008111991A (en) * | 2006-10-30 | 2008-05-15 | Ntt Docomo Inc | Encoder, decoder, encoding method and decoding method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5038138B2 (en) | Time envelope shaping for spatial audio coding using frequency domain Wiener filters | |
US7864843B2 (en) | Method and apparatus to encode and/or decode signal using bandwidth extension technology | |
JP5942358B2 (en) | Encoding apparatus and method, decoding apparatus and method, and program | |
KR101455915B1 (en) | Decoder for audio signal including generic audio and speech frames | |
KR101125429B1 (en) | Method and apparatus for generating an enhancement layer within an audio coding system | |
KR101274827B1 (en) | Method and apparatus for decoding a multiple channel audio signal, and method for coding a multiple channel audio signal | |
KR101275892B1 (en) | Method and apparatus for encoding and decoding an audio signal | |
JP5285162B2 (en) | Selective scaling mask calculation based on peak detection | |
KR101437127B1 (en) | Low-delay transform coding, using weighting windows | |
KR100840439B1 (en) | Audio coding apparatus and audio decoding apparatus | |
JP3137805B2 (en) | Audio encoding device, audio decoding device, audio post-processing device, and methods thereof | |
MX2007011102A (en) | Time warping frames inside the vocoder by modifying the residual. | |
KR20100095585A (en) | A method and an apparatus for processing a signal | |
KR20090083070A (en) | Method and apparatus for encoding/decoding audio signal using adaptive lpc coefficient interpolation | |
CA2829328A1 (en) | Encoding device, encoding method, and program | |
CN110853667B (en) | audio encoder | |
JP2021525905A (en) | Methods and equipment for controlling the enhancement of low bit rate coded audio | |
US7363216B2 (en) | Method and system for parametric characterization of transient audio signals | |
US11380341B2 (en) | Selecting pitch lag | |
JP2005284162A (en) | Signal coding device, signal decoding device, signal coding method, and signal decoding method | |
JP4625709B2 (en) | Stereo audio signal encoding device | |
JP3559485B2 (en) | Post-processing method and device for audio signal and recording medium recording program | |
JP4438655B2 (en) | Encoding device, decoding device, encoding method, and decoding method | |
JP4438654B2 (en) | Encoding device, decoding device, encoding method, and decoding method | |
JP2008026372A (en) | Encoding rule conversion method and device for encoded data |