JP5694751B2 - Encoding method, decoding method, encoding device, decoding device, program, recording medium - Google Patents

Encoding method, decoding method, encoding device, decoding device, program, recording medium Download PDF

Info

Publication number
JP5694751B2
JP5694751B2 JP2010277180A JP2010277180A JP5694751B2 JP 5694751 B2 JP5694751 B2 JP 5694751B2 JP 2010277180 A JP2010277180 A JP 2010277180A JP 2010277180 A JP2010277180 A JP 2010277180A JP 5694751 B2 JP5694751 B2 JP 5694751B2
Authority
JP
Japan
Prior art keywords
sample
samples
acoustic signal
sequence
sample sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010277180A
Other languages
Japanese (ja)
Other versions
JP2012128022A (en
Inventor
守谷 健弘
健弘 守谷
登 原田
登 原田
祐介 日和▲崎▼
祐介 日和▲崎▼
優 鎌本
優 鎌本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2010277180A priority Critical patent/JP5694751B2/en
Publication of JP2012128022A publication Critical patent/JP2012128022A/en
Application granted granted Critical
Publication of JP5694751B2 publication Critical patent/JP5694751B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、音響信号の符号化技術並びにそのこの符号化技術によって得られた符号列の復号技術に関する。より詳しくは、音響信号を周波数領域に変換して得られた周波数領域のサンプル列の符号化とその復号に関する。   The present invention relates to an encoding technique for an acoustic signal and a decoding technique for a code string obtained by the encoding technique. More specifically, the present invention relates to encoding and decoding of a frequency domain sample sequence obtained by converting an acoustic signal into the frequency domain.

低ビット(例えば10kbit/s〜20kbit/s程度)の音声信号や音響信号の符号化方法として、DFT(離散フーリエ変換)やMDCT(変形離散コサイン変換)などの直交変換係数に対する適応符号化が知られている。例えば標準規格技術であるAMR-WB+(Extended Adaptive Multi-Rate Wideband)は、TCX(transform coded excitation:変換符号化励振)符号化モードを持ち、この中ではDFT係数を8サンプルごとに正規化してベクトル量子化している。   Adaptive coding for orthogonal transform coefficients such as DFT (Discrete Fourier Transform) and MDCT (Modified Discrete Cosine Transform) is known as a coding method for low-bit (for example, about 10 kbit / s to 20 kbit / s) speech and acoustic signals. It has been. For example, AMR-WB + (Extended Adaptive Multi-Rate Wideband), which is a standard technology, has a TCX (transform coded excitation) coding mode, in which DFT coefficients are normalized every 8 samples and vectorized It is quantized.

また、TwinVQ(Transform domain Weighted Interleave Vector Quantization)では、MDCT係数全体を固定の規則で並べ替えた後のサンプルの集まりがベクトルとして符号化される。この際、例えば、MDCT係数からピッチ周期ごとの大きな成分を抽出し、ピッチ周期に対応する情報を符号化し、さらにピッチ周期ごとの大きな成分を取り除いた残りのMDCT係数列を並べ替えて、並べ替え後のMDCT係数列を所定サンプル数ごとにベクトル量子化することにより符号化する方法などが採用される場合もある。TwinVQに関する文献として非特許文献1,2を例示できる。   In TwinVQ (Transform domain Weighted Interleave Vector Quantization), a set of samples after the entire MDCT coefficients are rearranged according to a fixed rule is encoded as a vector. At this time, for example, a large component for each pitch period is extracted from the MDCT coefficient, information corresponding to the pitch period is encoded, and the remaining MDCT coefficient sequence from which the large component for each pitch period is further removed is rearranged. A method of encoding the subsequent MDCT coefficient sequence by vector quantization for each predetermined number of samples may be employed. Non-patent documents 1 and 2 can be exemplified as documents related to TwinVQ.

また、等間隔にサンプルを抽出して符号化する技術として例えば特許文献1を例示できる。   Further, as a technique for extracting and encoding samples at equal intervals, for example, Patent Document 1 can be exemplified.

特開2009−156971号公報JP 2009-156971 A

T. Moriya, N. Iwakami, A. Jin, K. Ikeda, and S. Miki, "A Design of Transform Coder for Both Speech and Audio Signals at 1 bit/sample," Proc. ICASSP'97, pp. 1371-1374, 1997.T. Moriya, N. Iwakami, A. Jin, K. Ikeda, and S. Miki, "A Design of Transform Coder for Both Speech and Audio Signals at 1 bit / sample," Proc. ICASSP'97, pp. 1371- 1374, 1997. J.Herre, E. Allamanche, K. Brandenburg, M. Dietz, B.Teichmann, B. Grill, A. Jin, T. Moriya, N. Iwakami, T. Norimatsu, M. Tsushima, T. Ishikawa, "The integrated Filterbank Based Scalable MPEG-4 Audio Coder," 105th Convention Audio Engineering Society, 4810, 1998.J. Herre, E. Allamanche, K. Brandenburg, M. Dietz, B. Teichmann, B. Grill, A. Jin, T. Moriya, N. Iwakami, T. Norimatsu, M. Tsushima, T. Ishikawa, "The integrated Filterbank Based Scalable MPEG-4 Audio Coder, "105th Convention Audio Engineering Society, 4810, 1998.

AMR-WB+をはじめ、TCXに基づく符号化では周期性に基づく周波数領域の係数の振幅のばらつきは考慮されていないため、ばらつきの大きい振幅をまとめて符号化すると符号化効率は低下してしまう。TCXでの量子化や符号化には各種変形例があるが、例えば、量子化により離散値となったMDCT係数を周波数の低いほうから並べた系列をエントロピー符号化によって圧縮を行う場合を考える。この場合、複数のサンプルを1シンボル(符号化単位)とし、そのシンボルの直前のシンボルに依存して割り当て符号を適応的に制御する。一般に、振幅が小さければ短い符号が割り当てられ、振幅が大きい場合には長い符号が割り当てられる。シンボルの直前のシンボルに依存して割り当て符号を適応的に制御するため、振幅の小さい値が連続すると、ますます短い符号が割り当てられる一方、小さい振幅のサンプルのあとに急に大きな振幅が出現すると非常に長い符号が割り当てられてしまう。   Since coding based on TCX, such as AMR-WB +, does not consider variation in the amplitude of frequency domain coefficients based on periodicity, coding large amplitudes together reduces coding efficiency. There are various modifications to TCX quantization and coding. For example, consider a case where a sequence in which MDCT coefficients that have become discrete values by quantization are arranged from the lowest frequency is compressed by entropy coding. In this case, a plurality of samples are set as one symbol (coding unit), and the assigned code is adaptively controlled depending on the symbol immediately before the symbol. In general, a short code is assigned if the amplitude is small, and a long code is assigned if the amplitude is large. Since the assigned code is adaptively controlled depending on the symbol immediately before the symbol, if a small amplitude value continues, an increasingly shorter code is assigned, while a large amplitude suddenly appears after a sample with a small amplitude. A very long code is assigned.

また、従来のTwinVQは、所定サンプルにより構成されるベクトルの全てに同じ符号帳の符号を割り当てる固定長符号のベクトル量子化を用いることを前提として設計されており、可変長符号化を使ってMDCT係数を符号化することは一切想定されていなかった。   In addition, the conventional TwinVQ is designed on the assumption that vector quantization of fixed-length code that assigns the same codebook code to all the vectors composed of predetermined samples, and MDCT using variable-length coding No coding of the coefficients was envisaged.

本発明は、このような技術的背景に鑑みて、離散信号、特に音声音響ディジタル信号の低ビットでの符号化による品質を低演算量で改善する符号化・復号技術を提供することを目的とする。   In view of such a technical background, an object of the present invention is to provide an encoding / decoding technique for improving the quality of a discrete signal, in particular, an audio-acoustic digital signal, by encoding with a low bit with a low calculation amount. To do.

本発明の符号化技術によると、所定の時間区間の音響信号に由来する周波数領域のサンプル列について、(1)サンプル列の全てのサンプルが含まれ、かつ、(2)サンプル列に含まれる少なくとも一部のサンプルを、音響信号の線形予測係数に基づくパワースペクトル包絡係数列のうちの当該サンプルに対応する値の絶対値が大きい順または小さい順に並べ替えたもの、を並べ替え後のサンプル列として出力する[並べ替え処理]。そして、並べ替え処理によって得られたサンプル列を符号化する[符号化手続]。   According to the encoding technique of the present invention, (1) all samples of the sample sequence are included and (2) at least included in the sample sequence for the frequency domain sample sequence derived from the acoustic signal in a predetermined time interval. As a sample sequence after rearrangement, some samples are rearranged in order of increasing or decreasing absolute value of the value corresponding to the sample in the power spectrum envelope coefficient sequence based on the linear prediction coefficient of the acoustic signal. [Sort process] to output. Then, the sample sequence obtained by the rearrangement process is encoded [encoding procedure].

あるいは、本発明の符号化技術によると、所定の時間区間の音響信号に由来する周波数領域のサンプル列について、(1)サンプル列の全てのサンプルが含まれ、かつ、(2)サンプル列のうちの音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、サンプル列のうちの音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるようにサンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、を並べ替え後のサンプル列(以下、暫定サンプル列という)とし、(3)暫定サンプル列の全てのサンプルが含まれ、かつ、(4)暫定サンプル列に含まれる少なくとも一部のサンプルを、音響信号の線形予測係数に基づくパワースペクトル包絡係数列のうちの当該サンプルに対応する値の絶対値が大きい順または小さい順に並べ替えたもの、を並べ替え後のサンプル列として出力する[並べ替え処理]。そして、並べ替え処理によって得られたサンプル列を符号化する[符号化手続]。   Alternatively, according to the encoding technique of the present invention, (1) all samples in the sample sequence are included in the frequency domain sample sequence derived from the acoustic signal in a predetermined time interval, and (2) of the sample sequences One or a plurality of consecutive samples including samples corresponding to the periodicity or fundamental frequency of the acoustic signal and one or more samples corresponding to an integer multiple of the periodicity or fundamental frequency of the acoustic signal in the sample sequence, or A sample sequence after rearrangement (hereinafter referred to as a provisional sample sequence) obtained by rearranging at least some of the samples included in the sample sequence so that all or some of the consecutive samples gather. (3) all samples of the temporary sample sequence are included, and (4) at least some of the samples included in the temporary sample sequence are The absolute value of the value corresponding to the sample of the power spectrum envelope coefficient sequence based on linear prediction coefficients that sorted in descending order or ascending order, and outputs as a sample sequence after rearrangement of Sort Processing. Then, the sample sequence obtained by the rearrangement process is encoded [encoding procedure].

あるいは、本発明の符号化技術によると、所定の時間区間の音響信号に由来する周波数領域のサンプル列について、(1)サンプル列の全てのサンプルが含まれ、かつ、(2)サンプル列に含まれる少なくとも一部のサンプルを、音響信号の線形予測係数に基づくパワースペクトル包絡係数列のうちの当該サンプルに対応する値の絶対値が大きい順または小さい順に並べ替えたもの、を並べ替え後のサンプル列(以下、第1サンプル列という)として出力し、(3)サンプル列の全てのサンプルが含まれ、かつ、(4)サンプル列のうちの音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、サンプル列のうちの音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるようにサンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、を並べ替え後のサンプル列(以下、第2サンプル列という)として出力する[並べ替え処理]。そして、第1サンプル列及び第2サンプル列をそれぞれ符号化して符号列を得て、得られた符号列のうち符号量が最小の符号列を出力する[符号化手続]。   Alternatively, according to the encoding technique of the present invention, (1) all samples of the sample sequence are included in the frequency domain sample sequence derived from the acoustic signal in the predetermined time interval, and (2) included in the sample sequence Samples after rearrangement of at least some of the samples that are rearranged in descending order of the absolute value of the value corresponding to the sample in the power spectrum envelope coefficient sequence based on the linear prediction coefficient of the acoustic signal Output as a sequence (hereinafter referred to as a first sample sequence), (3) all samples of the sample sequence are included, and (4) a sample corresponding to the periodicity or fundamental frequency of the acoustic signal in the sample sequence Including one or a plurality of consecutive samples and one corresponding to an integer multiple of the periodicity or fundamental frequency of the acoustic signal in the sample sequence Or, a sample sequence (hereinafter referred to as a second sample sequence) obtained by rearranging at least some of the samples included in the sample sequence so that all or some of the consecutive samples are collected. ) To output as [Sort]. Then, each of the first sample sequence and the second sample sequence is encoded to obtain a code sequence, and a code sequence having the minimum code amount is output from the obtained code sequence [encoding procedure].

これらの符号化技術では、所定の時間区間の音響信号に対応する予測利得またはその推定値が予め定められた閾値以上である場合に、並べ替え処理が実行され、並べ替え処理が実行されない場合には、符号化手続では音響信号に由来する周波数領域のサンプル列が符号化されるように構成してもよい。あるいは、音響信号に由来する周波数領域のサンプル列に含まれるサンプルの絶対値和またはパワーが予め定められた閾値以上である場合に、並べ替え処理が実行され、並べ替え処理が実行されない場合には、符号化手続では音響信号に由来する周波数領域のサンプル列が符号化されるように構成してもよい。   In these encoding techniques, when the prediction gain corresponding to the acoustic signal in a predetermined time interval or an estimated value thereof is equal to or greater than a predetermined threshold, the rearrangement process is executed, and the rearrangement process is not executed. In the encoding procedure, a sample sequence in the frequency domain derived from the acoustic signal may be encoded. Alternatively, when the sum of absolute values or power of samples included in the frequency domain sample sequence derived from the acoustic signal is equal to or greater than a predetermined threshold, the rearrangement process is executed, and the rearrangement process is not executed. In the encoding procedure, a sample sequence in the frequency domain derived from the acoustic signal may be encoded.

上述の符号化技術の符号化手続では、並べ替え処理で得られたサンプル列のうち、所定の時間区間の音響信号に対応する予測利得またはその推定値と予め定められた閾値との大小関係に応じて定まる範囲に含まれるサンプルの集まりに対してライス符号化が適用されるようにしてもよい。   In the encoding procedure of the encoding technique described above, among the sample sequences obtained by the rearrangement process, the prediction gain corresponding to the acoustic signal in a predetermined time interval or its estimated value and the predetermined threshold value are in a magnitude relationship. Rice coding may be applied to a collection of samples included in a range determined accordingly.

本発明の復号技術によると、所定の時間区間ごとに、入力された符号列を復号して、周波数領域のサンプル列を得る[復号手続]。そして、音響信号の線形予測係数に基づくパワースペクトル包絡係数列の大小関係に従って、復号手続で得られたサンプル列に含まれる少なくとも一部のサンプルを並べ替えて当該音響信号に由来するサンプル列を得る[回復処理]。復号手続で得られたサンプル列は、(1)音響信号に由来するサンプル列を構成する全てのサンプルを含み、かつ、(2)音響信号に由来するサンプル列に含まれる少なくとも一部のサンプルが、パワースペクトル包絡係数列のうちの当該サンプルに対応する値の絶対値が大きい順または小さい順に並べられたものである。   According to the decoding technique of the present invention, an input code string is decoded every predetermined time interval to obtain a frequency-domain sample string [decoding procedure]. Then, according to the magnitude relation of the power spectrum envelope coefficient sequence based on the linear prediction coefficient of the acoustic signal, at least a part of the samples included in the sample sequence obtained by the decoding procedure is rearranged to obtain a sample sequence derived from the acoustic signal. [Recovery processing]. The sample sequence obtained by the decoding procedure includes (1) all samples constituting the sample sequence derived from the acoustic signal, and (2) at least a part of the samples included in the sample sequence derived from the acoustic signal. In the power spectrum envelope coefficient sequence, the absolute values of the values corresponding to the sample are arranged in descending order or in ascending order.

あるいは、本発明の復号技術によると、所定の時間区間ごとに、入力された符号列を復号して、周波数領域のサンプル列を得る[復号手続]。そして、(A)音響信号の周期性を表わす情報、音響信号の基本周波数を表す情報、音響信号の周期性または基本周波数に対応するサンプルと音響信号の周期性または基本周波数の整数倍に対応するサンプルとの間隔を表す情報、のいずれかと、(B)音響信号の線形予測係数に基づくパワースペクトル包絡係数列の大小関係とに従って、復号手続で得られたサンプル列に含まれる少なくとも一部のサンプルを並べ替えて当該音響信号に由来するサンプル列を得る[回復処理]。復号手続で得られたサンプル列は、(1)音響信号に由来するサンプル列を構成する全てのサンプルを含み、かつ、(2)音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるように、周波数領域のサンプルが並べられたもの(以下、暫定サンプル列という)に対して、(3)暫定サンプル列を構成する全てのサンプルを含み、かつ、(4)暫定サンプル列に含まれる少なくとも一部のサンプルが、パワースペクトル包絡係数列のうちの当該サンプルに対応する値の絶対値が大きい順または小さい順に並べられたものである。   Alternatively, according to the decoding technique of the present invention, the input code string is decoded every predetermined time interval to obtain a frequency domain sample string [decoding procedure]. And (A) information representing the periodicity of the acoustic signal, information representing the fundamental frequency of the acoustic signal, the periodicity of the acoustic signal or a sample corresponding to the periodicity or fundamental frequency of the acoustic signal, and an integer multiple of the periodicity of the acoustic signal or the fundamental frequency. At least a part of the samples included in the sample sequence obtained by the decoding procedure according to any one of the information representing the interval between the samples and (B) the magnitude relation of the power spectrum envelope coefficient sequence based on the linear prediction coefficient of the acoustic signal Are rearranged to obtain a sample sequence derived from the acoustic signal [recovery processing]. The sample sequence obtained by the decoding procedure includes (1) all samples constituting the sample sequence derived from the acoustic signal, and (2) one including samples corresponding to the periodicity or fundamental frequency of the acoustic signal. Or a sample in the frequency domain such that all or some of the samples are collected together, including one or more consecutive samples and samples that correspond to the periodicity of the acoustic signal or an integer multiple of the fundamental frequency. Are arranged (hereinafter referred to as a provisional sample string), (3) includes all the samples constituting the provisional sample string, and (4) at least some of the samples included in the provisional sample string include: In the power spectrum envelope coefficient sequence, the absolute values of the values corresponding to the sample are arranged in descending order or in ascending order.

あるいは、本発明の復号技術によると、所定の時間区間ごとに、入力された符号列を復号して、周波数領域のサンプル列を得る[復号手続]。そして、復号手続で得られたサンプル列に含まれる少なくとも一部のサンプルを並べ替えて当該音響信号に由来するサンプル列を得る[回復処理]。復号手続で得られたサンプル列は、(1)音響信号に由来するサンプル列を構成する全てのサンプルを含み、かつ、(2)音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるように、周波数領域のサンプルが並べられたもの(以下、第1サンプル列という)、または、(3)音響信号に由来するサンプル列を構成する全てのサンプルを含み、かつ、(4)音響信号に由来するサンプル列に含まれる少なくとも一部のサンプルが、パワースペクトル包絡係数列のうちの当該サンプルに対応する値の絶対値が大きい順または小さい順に並べられたもの(以下、第2サンプル列という)、であり、回復処理は、(A)復号手続で得られたサンプル列が第1サンプル列である場合には、音響信号の周期性を表わす情報、音響信号の基本周波数を表す情報、音響信号の周期性または基本周波数に対応するサンプルと音響信号の周期性または基本周波数の整数倍に対応するサンプルとの間隔を表す情報、のいずれかに従って、第1サンプル列に含まれる少なくとも一部のサンプルを並べ替えて音響信号に由来するサンプル列を得て、(B)復号手続で得られたサンプル列が第2サンプル列である場合には、音響信号の線形予測係数に基づくパワースペクトル包絡係数列の大小関係に従って、第2サンプル列に含まれる少なくとも一部のサンプルを並べ替えて音響信号に由来するサンプル列を得る。   Alternatively, according to the decoding technique of the present invention, the input code string is decoded every predetermined time interval to obtain a frequency domain sample string [decoding procedure]. Then, at least a part of the samples included in the sample sequence obtained in the decoding procedure is rearranged to obtain a sample sequence derived from the acoustic signal [recovery processing]. The sample sequence obtained by the decoding procedure includes (1) all samples constituting the sample sequence derived from the acoustic signal, and (2) one including samples corresponding to the periodicity or fundamental frequency of the acoustic signal. Or a sample in the frequency domain such that all or some of the samples are collected together, including one or more consecutive samples and samples that correspond to the periodicity of the acoustic signal or an integer multiple of the fundamental frequency. Are arranged (hereinafter referred to as the first sample sequence), or (3) includes all samples constituting the sample sequence derived from the acoustic signal, and (4) included in the sample sequence derived from the acoustic signal. At least some of the samples are arranged in order of increasing or decreasing absolute value of the value corresponding to the sample in the power spectrum envelope coefficient sequence. The recovery process is (A) when the sample sequence obtained by the decoding procedure is the first sample sequence, information indicating the periodicity of the acoustic signal, acoustic According to any one of the information representing the fundamental frequency of the signal, the periodicity of the acoustic signal, or the information representing the interval between the sample corresponding to the periodicity of the acoustic signal and the sample corresponding to the periodicity of the acoustic signal or an integer multiple of the fundamental frequency. When at least a part of samples included in the sample sequence is rearranged to obtain a sample sequence derived from the acoustic signal, and (B) the sample sequence obtained in the decoding procedure is the second sample sequence, A sample sequence derived from the acoustic signal is obtained by rearranging at least some of the samples included in the second sample sequence according to the magnitude relationship of the power spectrum envelope coefficient sequence based on the linear prediction coefficient. .

これらの復号技術では、入力された量子化済PARCOR係数から計算される予測利得またはその推定値が予め定められた閾値以上である場合に、回復処理が実行されるように構成してもよいし、あるいは、復号手続で得られたサンプル列に含まれるサンプルの絶対値和またはパワーが予め定められた閾値以上である場合に、回復処理が実行されるように構成してもよい。   These decoding techniques may be configured such that the recovery process is executed when the prediction gain calculated from the input quantized PARCOR coefficient or its estimated value is greater than or equal to a predetermined threshold. Alternatively, the recovery process may be executed when the sum of absolute values or powers of samples included in the sample sequence obtained in the decoding procedure is equal to or greater than a predetermined threshold.

上述の復号技術では、入力された符号列の少なくとも一部はライス符号化によって得られたものであり、復号手続では、入力された量子化済PARCOR係数から計算される予測利得またはその推定値と予め定められた閾値との大小関係に応じて定まる範囲の符号列に対してライス符号化に対応する復号が行われるように構成してもよい。   In the decoding technique described above, at least a part of the input code string is obtained by Rice encoding, and in the decoding procedure, the prediction gain calculated from the input quantized PARCOR coefficient or its estimated value and You may comprise so that the decoding corresponding to a Rice encoding may be performed with respect to the code sequence of the range defined according to the magnitude relationship with a predetermined threshold value.

本発明によると、例えば、音響信号に由来する周波数領域のサンプル列に含まれる少なくとも一部のサンプルを、音響信号の線形予測係数に基づくパワースペクトル包絡係数列のうちの当該サンプルに対応する値の絶対値が大きい順または小さい順に並べ替える。このように大きい振幅を持つサンプルが例えば低域側に偏るように並べ替えるという少ない演算量で実行可能な処理を行うことにより、符号化効率の向上や量子化歪の軽減などが実現される。   According to the present invention, for example, at least a part of samples included in a frequency domain sample sequence derived from an acoustic signal is a value corresponding to the sample in the power spectrum envelope coefficient sequence based on the linear prediction coefficient of the acoustic signal. Sort in descending order of absolute value. By performing processing that can be executed with a small amount of calculation, for example, rearranging samples having a large amplitude so as to be biased toward the low frequency side, an improvement in coding efficiency, a reduction in quantization distortion, and the like are realized.

符号化装置の実施形態の機能構成例を示す図。The figure which shows the function structural example of embodiment of an encoding apparatus. 符号化方法の実施形態の処理手順を示す図。The figure which shows the process sequence of embodiment of an encoding method. 重み付け包絡正規化処理おいて用いられる、パワースペクトル包絡係数列を鈍らせた重み付けパワースペクトル包絡係数列を説明するための概念図。The conceptual diagram for demonstrating the weighting power spectrum envelope coefficient sequence which blunted the power spectrum envelope coefficient sequence used in a weighted envelope normalization process. パワースペクトル包絡係数列に含まれる係数と周波数領域のサンプル列に含まれるサンプルとの間に1対1の関係があることを説明するための図。The figure for demonstrating that there exists a one-to-one relationship between the coefficient contained in a power spectrum envelope coefficient row | line | column, and the sample contained in the sample row | line | column of a frequency domain. パワースペクトル包絡係数列に含まれる係数の大小関係に拠る並べ替えが、周波数領域のサンプル列に含まれるサンプルの並べ替えに反映されることを説明するための図。(a)並べ替え前のパワースペクトル包絡係数列。(b)並べ替え後のパワースペクトル包絡係数列。(c)並べ替え前の周波数領域のサンプル列。(d)並べ替え後の周波数領域のサンプル列。The figure for demonstrating that the rearrangement based on the magnitude relationship of the coefficient contained in a power spectrum envelope coefficient sequence is reflected in the rearrangement of the sample contained in the sample sequence of a frequency domain. (A) A power spectrum envelope coefficient sequence before rearrangement. (B) Rearranged power spectrum envelope coefficient sequence. (C) Sample sequence in the frequency domain before rearrangement. (D) Sample sequence in the frequency domain after rearrangement. 周期性並べ替え処理に拠る、サンプル列に含まれるサンプルの並べ替えの一例を説明するための概念図。The conceptual diagram for demonstrating an example of the rearrangement of the sample contained in a sample row | line based on a periodicity rearrangement process. 周期性並べ替え処理に拠る、サンプル列に含まれるサンプルの並べ替えの一例を説明するための概念図。The conceptual diagram for demonstrating an example of the rearrangement of the sample contained in a sample row | line based on a periodicity rearrangement process. 並べ替え後のパワースペクトル包絡係数列の勾配と同一のライスパラメータが適用される区間との関係を示す図(勾配が大である場合)。The figure which shows the relationship with the area where the same rice parameter is applied to the gradient of the power spectrum envelope coefficient sequence after rearrangement (when the gradient is large). 並べ替え後のパワースペクトル包絡係数列の勾配と同一のライスパラメータが適用される区間との関係を示す図(勾配が小である場合)。The figure which shows the relationship with the area to which the same rice parameter is applied to the gradient of the power spectrum envelope coefficient sequence after rearrangement (when the gradient is small). 復号装置の実施形態の機能構成例を示す図。The figure which shows the function structural example of embodiment of a decoding apparatus. 復号方法の実施形態の処理手順を示す図。The figure which shows the process sequence of embodiment of a decoding method.

図面を参照しながら本発明の実施形態を説明する。なお、重複する構成要素には同じ参照符号を当てて重複説明を省略する。   Embodiments of the present invention will be described with reference to the drawings. In addition, the same referential mark is applied to the overlapping component, and duplication description is abbreviate | omitted.

所定の時間区間の音響信号に由来する周波数領域のサンプル列を量子化する枠組みの中で、音声や楽音などの音響信号では一般的に、量子化対象の周波数領域のサンプル列の振幅傾向を音響信号のパワースペクトル包絡と類似させることにより聴覚的歪みを小さくできることが知られている。本発明は、例えばこのような「パワースペクトル包絡に振幅傾向を類似させる処理」を施された周波数領域のサンプル列に含まれるサンプルを効率良く符号化できるように並べ替える処理を特徴の一つとする。サンプルの並べ替えでは、周波数領域のサンプル列の振幅傾向と音響信号のパワースペクトル包絡との類似性に基づいて、大きな振幅のサンプルができるだけ連続して並ぶように、周波数領域のサンプル列に含まれる少なくとも一部のサンプルが並べ替えられる。以下、所定の時間区間をフレームと呼称する。ここで、音響信号に由来する周波数領域のサンプル列として、例えば、フレーム単位の音声音響ディジタル信号が時間領域から周波数領域に変換して得られるDFT係数列やMDCT係数列などを例示することができる。以下、MDCT係数列を例にとって本発明の実施形態を説明する。   In the framework of quantizing a frequency domain sample sequence derived from an acoustic signal in a predetermined time interval, an acoustic signal such as speech or musical sound generally has an amplitude tendency of the sample sequence in the frequency domain to be quantized. It is known that auditory distortion can be reduced by resembling the power spectrum envelope of a signal. One feature of the present invention is, for example, a process of rearranging samples included in a frequency-sequence sample sequence that has been subjected to such a “process that resembles an amplitude tendency to a power spectrum envelope” so that the samples can be efficiently encoded. . Sample reordering is included in the frequency domain sample sequence so that large amplitude samples are arranged as continuously as possible based on the similarity between the amplitude trend of the frequency domain sample sequence and the power spectrum envelope of the acoustic signal. At least some samples are reordered. Hereinafter, the predetermined time interval is referred to as a frame. Here, as a sample sequence in the frequency domain derived from the acoustic signal, for example, a DFT coefficient sequence, an MDCT coefficient sequence, or the like obtained by converting the audio acoustic digital signal in frame units from the time domain to the frequency domain can be exemplified. . Hereinafter, an embodiment of the present invention will be described using an MDCT coefficient sequence as an example.

[実施形態]
「符号化処理」
最初に図1〜図9を参照して符号化処理を説明する。
[Embodiment]
"Encoding process"
First, the encoding process will be described with reference to FIGS.

「周波数領域変換部1」
まず、周波数領域変換部1がフレーム単位で音声音響ディジタル信号を周波数領域のN点のMDCT係数列に変換する(ステップS1)。
"Frequency domain conversion unit 1"
First, the frequency domain conversion unit 1 converts the audio-acoustic digital signal into N-point MDCT coefficient sequences in the frequency domain in units of frames (step S1).

一般論として、符号化側ではMDCT係数列を量子化して、量子化されたMDCT係数列を符号化して、得られた符号列を復号側へ伝送し、復号側では当該符号列から量子化されたMDCT係数列を再構成し、さらに逆MDCT変換によって時間領域の音声音響ディジタル信号を再構成することができる。ところで、MDCT係数の振幅は近似的に通常のDFTのパワースペクトルと同じ振幅包絡(パワースペクトル包絡)を持つ。このため、振幅包絡の対数値に比例する情報割り当てを行うことによって、全帯域のMDCT係数の量子化歪(量子化誤差)を均一に分散させることができ、全体の量子化歪を小さくすることができ、加えて情報圧縮も実現される。なお、パワースペクトル包絡は線形予測分析によって求められた線形予測係数を使って効率よく推定することができる。このような量子化誤差を制御する方法としては、各MDCT係数の量子化ビットを適応的に割り当てる(振幅を平坦にした後で量子化のステップ幅を調整する)方法や、重み付けベクトル量子化により適応的に重みをつけて符号を決定する方法がある。ここでは、本発明の実施形態において実行される量子化方法の一例を説明するが、説明する量子化方法に限定されるものではないことに留意されたい。   As a general rule, the encoding side quantizes the MDCT coefficient sequence, encodes the quantized MDCT coefficient sequence, transmits the obtained code sequence to the decoding side, and the decoding side quantizes the code sequence. The MDCT coefficient sequence can be reconstructed, and the time-domain audio-acoustic digital signal can be reconstructed by inverse MDCT transformation. By the way, the amplitude of the MDCT coefficient has approximately the same amplitude envelope (power spectrum envelope) as the power spectrum of a normal DFT. For this reason, by assigning information proportional to the logarithmic value of the amplitude envelope, the quantization distortion (quantization error) of the MDCT coefficients in all bands can be uniformly distributed, and the overall quantization distortion can be reduced. In addition, information compression is also realized. Note that the power spectrum envelope can be efficiently estimated using a linear prediction coefficient obtained by linear prediction analysis. As a method for controlling such quantization error, a method of adaptively assigning quantization bits of each MDCT coefficient (adjusting the quantization step width after flattening the amplitude), or weighted vector quantization is used. There is a method of adaptively weighting and determining a code. Here, although an example of the quantization method performed in the embodiment of the present invention will be described, it should be noted that the present invention is not limited to the quantization method described.

「重み付け包絡正規化部2」
重み付け包絡正規化部2が、フレーム単位の音声音響ディジタル信号に対する線形予測分析によって求められた線形予測係数を用いて推定された音声音響ディジタル信号のパワースペクトル包絡係数列によって、入力されたMDCT係数列の各係数を正規化し、重み付け正規化MDCT係数列を出力する(ステップS2)。ここでは聴覚的に歪が小さくなるような量子化の実現のために、重み付け包絡正規化部2は、パワースペクトル包絡係数列を鈍らせた重み付けパワースペクトル包絡係数列(図3参照)を用いて、フレーム単位でMDCT係数列の各係数を正規化する。この結果、重み付け正規化MDCT係数列は、入力されたMDCT係数列ほどの大きな振幅の傾きや振幅の凹凸を持たないものの、音声音響ディジタル信号のパワースペクトル包絡係数列と類似の大小関係を保つこととなる。なお、正確を期せば、ここでの「大小関係」は、「係数列に含まれる各係数の間の大小関係」を意味する。また、この正規化の具体的な処理内容に応じて、重み付け正規化MDCT係数列に含まれる各係数の間の大小関係は、音声音響ディジタル信号のパワースペクトル包絡係数列に含まれる各係数の間の大小関係と同じになる場合がある。従って、上記「類似の大小関係」は「同じ大小関係」を含む意味であることに留意されたい。
"Weighting envelope normalization unit 2"
The weighted envelope normalization unit 2 uses the power spectrum envelope coefficient sequence of the speech acoustic digital signal estimated using the linear prediction coefficient obtained by the linear prediction analysis for the speech acoustic digital signal in units of frames to input the MDCT coefficient sequence Are normalized, and a weighted normalized MDCT coefficient sequence is output (step S2). Here, the weighted envelope normalization unit 2 uses a weighted power spectrum envelope coefficient sequence (see FIG. 3) in which the power spectrum envelope coefficient sequence is blunted in order to realize quantization that audibly reduces distortion. Each coefficient of the MDCT coefficient sequence is normalized on a frame basis. As a result, the weighted normalized MDCT coefficient sequence does not have the amplitude gradient and amplitude irregularity as large as the input MDCT coefficient sequence, but maintains a similar magnitude relationship with the power spectrum envelope coefficient sequence of the audio-acoustic digital signal. It becomes. For the sake of accuracy, the “magnitude relation” here means “magnitude relation between coefficients included in the coefficient sequence”. In addition, depending on the specific processing content of this normalization, the magnitude relationship between the coefficients included in the weighted normalized MDCT coefficient sequence is between the coefficients included in the power spectrum envelope coefficient sequence of the audio-acoustic digital signal. It may be the same as the size relationship. Therefore, it should be noted that the above “similar magnitude relationship” includes “same magnitude relationship”.

[重み付け包絡正規化処理の具体例]
N点のMDCT係数列の各係数X(1),・・・,X(N)に対応するパワースペクトル包絡係数列の各係数W(1),・・・,W(N)は、線形予測係数を周波数領域に変換して得ることができる。例えば、全極型モデルであるp次自己回帰過程により、時刻tの時間信号x(t)は、p時点まで遡った過去の自分自身の値x(t-1),・・・,x(t-p)と予測残差e(t)と線形予測係数α1,・・・,αpによって式(1)で表される。このとき、パワースペクトル包絡係数列の各係数W(n)[1≦n≦N]は式(2)で表される。exp(・)はネイピア数を底とする指数関数、jは虚数単位、σ2は予測残差エネルギーである。

Figure 0005694751
[Specific example of weighted envelope normalization]
Each coefficient W (1),..., W (N) of the power spectrum envelope coefficient sequence corresponding to each coefficient X (1),..., X (N) of the N-point MDCT coefficient sequence is linearly predicted. It can be obtained by converting the coefficients into the frequency domain. For example, the time signal x (t) at the time t becomes a past value x (t−1),..., X ( tp) and the prediction residuals e (t) and the linear prediction coefficients alpha 1, · · ·, represented by the formula (1) by alpha p. At this time, each coefficient W (n) [1 ≦ n ≦ N] of the power spectrum envelope coefficient sequence is expressed by Expression (2). exp (·) is an exponential function with the Napier number as the base, j is an imaginary unit, and σ 2 is the predicted residual energy.
Figure 0005694751

線形予測係数は、周波数領域変換部1に入力された音声音響ディジタル信号を重み付け包絡正規化部2によって線形予測分析して得られたものでもよいし、符号化装置100内に在る図示しない他の手段によって音声音響ディジタル信号を線形予測分析して得られたものであってもよい。このような場合には、重み付け包絡正規化部2が線形予測係数を用いてパワースペクトル包絡係数列の各係数W(1),・・・,W(N)を求める。また、符号化装置100内に在る他の手段(パワースペクトル包絡係数列計算部7)によってパワースペクトル包絡係数列の各係数W(1),・・・,W(N)が既に得られている場合には、重み付け包絡正規化部2は、このパワースペクトル包絡係数列の各係数W(1),・・・,W(N)を用いることができる。なお、後述する復号装置200でも符号化装置100で得られた値と同じ値を得る必要があるため、量子化された線形予測係数および/またはパワースペクトル包絡係数列が利用される。以後の説明において、特に断りが無い限り、「線形予測係数」ないし「パワースペクトル包絡係数列」は量子化された線形予測係数ないしパワースペクトル包絡係数列を意味する。パワースペクトル包絡係数列は、後述するステップS5の処理でも用いられるため、再計算のコストを省く観点から、符号化装置100内に在る図示しない記憶部に記憶しておけばよい。また、線形予測係数ないしパワースペクトル包絡係数列は例えば従来的な符号化技術によって符号化されて復号側へ伝送される。   The linear prediction coefficient may be obtained by performing linear prediction analysis on the audio-acoustic digital signal input to the frequency domain transform unit 1 by the weighted envelope normalization unit 2, or may not be shown in the encoding device 100. It may be obtained by linear predictive analysis of a speech sound digital signal by the means described above. In such a case, the weighted envelope normalization unit 2 obtains each coefficient W (1),..., W (N) of the power spectrum envelope coefficient sequence using the linear prediction coefficient. Further, the coefficients W (1),..., W (N) of the power spectrum envelope coefficient sequence are already obtained by other means (power spectrum envelope coefficient sequence calculation unit 7) in the encoding apparatus 100. If there is, the weighted envelope normalization unit 2 can use each coefficient W (1),..., W (N) of this power spectrum envelope coefficient sequence. Note that since the decoding device 200 described later needs to obtain the same value as the value obtained by the coding device 100, a quantized linear prediction coefficient and / or power spectrum envelope coefficient sequence is used. In the following description, unless otherwise specified, “linear prediction coefficient” or “power spectrum envelope coefficient sequence” means a quantized linear prediction coefficient or power spectrum envelope coefficient sequence. Since the power spectrum envelope coefficient sequence is also used in the process of step S5 described later, it may be stored in a storage unit (not shown) in the encoding device 100 from the viewpoint of saving the recalculation cost. The linear prediction coefficient or power spectrum envelope coefficient sequence is encoded by, for example, a conventional encoding technique and transmitted to the decoding side.

ここでは、重み付け包絡正規化処理の具体例として二つの例を示すが、本発明ではこれらの例に限定されるものではない。
<例1>
重み付け包絡正規化部2は、MDCT係数列の各係数X(1),・・・,X(N)を当該各係数に対応するパワースペクトル包絡係数列の各係数の補正値Wγ(1),・・・,Wγ(N)で除算することによって、重み付け正規化MDCT係数列の各係数X(1)/Wγ(1),・・・,X(N)/Wγ(N)を得る処理を行う。補正値Wγ(n)[1≦n≦N]は式(3)で与えられる。但し、γは1未満の正の定数であり、パワースペクトル係数を鈍らせる定数である。

Figure 0005694751
Here, two examples are shown as specific examples of the weighted envelope normalization process, but the present invention is not limited to these examples.
<Example 1>
The weighted envelope normalization unit 2 converts each coefficient X (1),..., X (N) of the MDCT coefficient sequence to a correction value W γ (1) of each coefficient of the power spectrum envelope coefficient sequence corresponding to each coefficient. , ..., W γ (N), by dividing each coefficient X (1) / W γ (1), ..., X (N) / W γ (N) of the weighted normalized MDCT coefficient sequence Process to get. The correction value W γ (n) [1 ≦ n ≦ N] is given by Equation (3). However, γ is a positive constant less than 1, and is a constant that dulls the power spectrum coefficient.
Figure 0005694751

<例2>
重み付け包絡正規化部2は、MDCT係数列の各係数X(1),・・・,X(N)を当該各係数に対応するパワースペクトル包絡係数列の各係数のβ乗(0<β<1)の値W(1)β,・・・,W(N)βで除算することによって、重み付け正規化MDCT係数列の各係数X(1)/W(1)β,・・・,X(N)/W(N)βを得る処理を行う。
<Example 2>
The weighted envelope normalization unit 2 converts each coefficient X (1),..., X (N) of the MDCT coefficient sequence to the β power of each coefficient of the power spectrum envelope coefficient sequence corresponding to each coefficient (0 <β < 1) values W (1) β ,..., W (N) β by dividing each coefficient X (1) / W (1) β ,. (N) / W (N) β is obtained.

これらの例から明らかなように、要するに、重み付け包絡正規化部2が行う「重み付け包絡正規化」によって、
(1)入力されたMDCT係数列に含まれる係数のうち絶対値が最大のものの絶対値|X(a)|と絶対値が最小のものの絶対値|X(b)|との差分|X(a)|-|X(b)|よりも、重み付け包絡正規化によって得られる重み付け正規化MDCT係数列に含まれる係数のうち絶対値が最大のものの絶対値|X(a)/Q(a)|と絶対値が最小のものの絶対値|X(b)/Q(b)|との差分|X(a)/Q(a)|-|X(b)/Q(b)|が小さくなり(ただし、Q(a),Q(b)は鈍らされたパワースペクトル包絡係数であり、上述の例であれば、Q(a)=Wγ(a),Q(b)=Wγ(b)あるいはQ(a)=W(a)β,Q(b)= W(b)βである)、
かつ、
(2)入力されたMDCT係数列に含まれる各係数の間の大小関係と、重み付け包絡正規化によって得られる重み付け正規化MDCT係数列に含まれる各係数の間の大小関係との類似性が保たれる。
As is clear from these examples, in short, by the “weighted envelope normalization” performed by the weighted envelope normalization unit 2,
(1) The difference between the absolute value | X (a) | having the largest absolute value and the absolute value | X (b) | having the smallest absolute value among the coefficients included in the input MDCT coefficient sequence | X ( a) |-| X (b) |, the absolute value of the largest absolute value among the coefficients included in the weighted normalized MDCT coefficient sequence obtained by weighted envelope normalization | X (a) / Q (a) The difference between | and the absolute value of the smallest absolute value | X (b) / Q (b) | | X (a) / Q (a) |-| X (b) / Q (b) | (However, Q (a) and Q (b) are dull power spectrum envelope coefficients. In the above example, Q (a) = W γ (a), Q (b) = W γ (b ) Or Q (a) = W (a) β , Q (b) = W (b) β ),
And,
(2) The similarity between the magnitude relationship between the coefficients included in the input MDCT coefficient sequence and the magnitude relationship between the coefficients included in the weighted normalized MDCT coefficient sequence obtained by weighted envelope normalization is maintained. Be drunk.

なお、<例1>の場合、入力されたMDCT係数列に含まれる各係数の間の大小関係と、重み付け包絡正規化によって得られる重み付け正規化MDCT係数列に含まれる各係数の間の大小関係との類似性が保たれ、<例2>の場合、入力されたMDCT係数列に含まれる各係数の間の大小関係は、重み付け包絡正規化によって得られる重み付け正規化MDCT係数列に含まれる各係数の間の大小関係と同じになる。   In the case of <Example 1>, the magnitude relationship between the coefficients included in the input MDCT coefficient sequence and the magnitude relationship between the coefficients included in the weighted normalized MDCT coefficient sequence obtained by weighted envelope normalization In the case of <Example 2>, the magnitude relationship between the coefficients included in the input MDCT coefficient sequence is determined by the weighted normalized MDCT coefficient sequence obtained by the weighted envelope normalization. The magnitude relationship between the coefficients is the same.

この結果、フレーム単位の重み付け正規化MDCT係数列が得られるが、重み付け正規化MDCT係数列は入力されたMDCT係数列ほどの大きな振幅の傾きや振幅の凹凸を持たないものの、入力されたMDCT係数列のパワースペクトル包絡と類似の大小関係を有するものとなる。   As a result, a frame-by-frame weighted normalized MDCT coefficient sequence is obtained, but the weighted normalized MDCT coefficient sequence does not have a larger amplitude gradient or amplitude unevenness than the input MDCT coefficient sequence, but the input MDCT coefficient It has a magnitude relationship similar to the power spectrum envelope of the column.

なお、重み付け包絡正規化処理に対応する逆処理、つまり、重み付け正規化MDCT係数列からMDCT係数列を復元する処理が復号側にて行われるため、パワースペクトル包絡係数列から重み付けパワースペクトル包絡係数列を算出する方法を符号化側と復号側で共通の設定にしておくことが必要である。   Note that the inverse processing corresponding to the weighted envelope normalization process, that is, the process of restoring the MDCT coefficient sequence from the weighted normalized MDCT coefficient sequence is performed on the decoding side, so the weighted power spectrum envelope coefficient sequence from the power spectrum envelope coefficient sequence It is necessary to set a common setting for the encoding side and the decoding side.

「正規化利得計算部3」
次に、正規化利得計算部3が、フレームごとに、重み付け正規化MDCT係数列の各係数を与えられた総ビット数で量子化できるように、全周波数に亘る振幅値の和またはエネルギー値を用いて量子化ステップ幅を決定し、この量子化ステップ幅になるように重み付け正規化MDCT係数列の各係数を割り算する係数(以下、「利得」という。)を求める(ステップS3)。この利得を表す情報は、利得情報として復号側へ伝送される。正規化利得計算部3は、フレームごとに、重み付け正規化MDCT係数列の各係数をこの利得で正規化(除算)する。
Normalized gain calculator 3”
Next, the sum or energy value of the amplitude values over all frequencies is calculated so that the normalization gain calculation unit 3 can quantize each coefficient of the weighted normalization MDCT coefficient sequence with the given total number of bits for each frame. Then, the quantization step width is determined, and a coefficient (hereinafter referred to as “gain”) for dividing each coefficient of the weighted normalized MDCT coefficient sequence so as to be the quantization step width is obtained (step S3). Information representing this gain is transmitted to the decoding side as gain information. The normalization gain calculation unit 3 normalizes (divides) each coefficient of the weighted normalization MDCT coefficient sequence by this gain for each frame.

「量子化部4」
次に、量子化部4が、フレームごとに、利得で正規化された重み付け正規化MDCT係数列の各係数をステップS3の処理で決定された量子化ステップ幅で量子化する(ステップS4)。
"Quantizer 4"
Next, the quantization unit 4 quantizes each coefficient of the weighted normalized MDCT coefficient sequence normalized by the gain for each frame with the quantization step width determined in the process of step S3 (step S4).

「並べ替え部5」
ステップS4の処理で得られたフレーム単位の量子化MDCT係数列は、本実施形態の要部である並べ替え部5の入力となるが、並べ替え部5の入力は、ステップS1〜ステップS4の各処理で得られた係数列に限定されない。例えば、重み付け包絡正規化部2による正規化が適用されていない係数列や量子化部4による量子化が適用されていない係数列であってもよい。このことを明示的に理解するため、以下、並べ替え部5の入力を音響信号に由来する「周波数領域のサンプル列」あるいは単に「サンプル列」と呼称することにする。この実施形態では、ステップS4の処理で得られた量子化MDCT係数列が「周波数領域のサンプル列」に相当し、この場合、周波数領域のサンプル列を構成するサンプルは量子化MDCT係数列に含まれる係数に相当する。
"Sort part 5"
The quantized MDCT coefficient sequence in units of frames obtained by the process of step S4 is input to the rearrangement unit 5 which is a main part of the present embodiment. The input of the rearrangement unit 5 is performed in steps S1 to S4. The coefficient sequence obtained in each process is not limited. For example, a coefficient sequence to which normalization by the weighted envelope normalization unit 2 is not applied or a coefficient sequence to which quantization by the quantization unit 4 is not applied may be used. In order to clearly understand this, hereinafter, the input of the rearrangement unit 5 will be referred to as a “frequency domain sample string” or simply a “sample string” derived from an acoustic signal. In this embodiment, the quantized MDCT coefficient sequence obtained in step S4 corresponds to a “frequency domain sample sequence”. In this case, the samples constituting the frequency domain sample sequence are included in the quantized MDCT coefficient sequence. It corresponds to the coefficient.

並べ替え部5は、フレームごとに、(1)周波数領域のサンプル列の全てのサンプルを含み、かつ、(2)この周波数領域のサンプル列に含まれる少なくとも一部のサンプルについて、音声音響ディジタル信号の線形予測係数に基づくパワースペクトル包絡係数列に含まれる係数であって各サンプルに対応する係数の大きい順または小さい順に当該各サンプルを並べ替えたもの、を並べ替え後のサンプル列として出力する(ステップS5)。並べ替え部5は、ステップS5の処理で用いられるパワースペクトル包絡係数列として、例えば符号化装置100内に在る図示しない記憶部に記憶されているパワースペクトル包絡係数列を用いることができる。   The rearrangement unit 5 includes, for each frame, (1) all samples in the frequency domain sample sequence, and (2) audio acoustic digital signals for at least some of the samples included in the frequency domain sample sequence. Are the coefficients included in the power spectrum envelope coefficient sequence based on the linear prediction coefficients, and the samples are rearranged in descending order of the coefficient corresponding to each sample, and output as a sample string after rearrangement ( Step S5). The rearrangement unit 5 can use, for example, a power spectrum envelope coefficient sequence stored in a storage unit (not shown) in the encoding device 100 as the power spectrum envelope coefficient sequence used in the process of step S5.

[並べ替え処理の詳細]
この並べ替え処理の具体例を説明する。N点のサンプル列F(1),・・・,F(N)に、音声音響ディジタル信号のパワースペクトル包絡係数列W(1),・・・,W(N)が低域側から1対1で対応しているとする(図4参照)。つまり、nが1からNまでの各整数を表すとして、F(n)にW(n)が対応しているとする。説明を具体的にするため、例として、N=16の場合を考える。パワースペクトル包絡係数列に含まれる16個の係数W(1),・・・,W(16)の間に次のような大小関係があるとする。
---
W(1)> W(5)> W(3)> W(2)> W(6)> W(4)> W(8)> W(9)> W(7)> W(10)> W(11)> W(12)> W(13)> W(15)> W(14)> W(16)
---
[Details of Sorting Process]
A specific example of this rearrangement process will be described. N-point sample sequences F (1),..., F (N) are paired with the power spectrum envelope coefficient sequences W (1),. 1 (see FIG. 4). In other words, suppose that n represents each integer from 1 to N, and W (n) corresponds to F (n). To make the explanation more specific, consider the case of N = 16 as an example. Assume that the following 16 magnitude relationships exist between the 16 coefficients W (1),..., W (16) included in the power spectrum envelope coefficient sequence.
---
W (1)> W (5)> W (3)> W (2)> W (6)> W (4)> W (8)> W (9)> W (7)> W (10)> W (11)> W (12)> W (13)> W (15)> W (14)> W (16)
---

<サンプル列に含まれる全てのサンプルを並べ替えの対象とする場合>
この場合、周波数領域のサンプル列に含まれる全部のサンプルをパワースペクトル包絡係数列に基づく並べ替えの対象とするならば、並べ替え部5は、パワースペクトル包絡係数列に含まれる16個の係数W(1),・・・,W(16)の大きい順の並びに一致するように、低域側から各係数W(n)[1≦n≦16]に対応するサンプルF(n)[1≦n≦16]を並べる。この場合、入力されたサンプル列F(1), F(2), F(3), F(4), F(5), F(6), F(7), F(8), F(9), F(10), F(11), F(12), F(13), F(14), F(15), F(16)の並びは、次のような並びに変更される。並べ替え部5は、この並びのサンプル列を「並べ替え後のサンプル列」として出力する。
---
F(1), F(5), F(3), F(2), F(6), F(4), F(8), F(9), F(7), F(10), F(11), F(12), F(13), F(15), F(14), F(16)
---
<When sorting all samples included in the sample column>
In this case, if all the samples included in the frequency domain sample sequence are to be rearranged based on the power spectrum envelope coefficient sequence, the reordering unit 5 includes the 16 coefficients W included in the power spectrum envelope coefficient sequence. (1),..., W (16) samples F (n) [1 ≦ 1 corresponding to each coefficient W (n) [1 ≦ n ≦ 16] from the low frequency side so as to match in order n ≦ 16] are arranged. In this case, the input sample sequence F (1), F (2), F (3), F (4), F (5), F (6), F (7), F (8), F ( 9), F (10), F (11), F (12), F (13), F (14), F (15), F (16) are arranged as follows. The rearrangement unit 5 outputs the sample string in this arrangement as a “sample string after rearrangement”.
---
F (1), F (5), F (3), F (2), F (6), F (4), F (8), F (9), F (7), F (10), F (11), F (12), F (13), F (15), F (14), F (16)
---

この場合の処理の理解の一助として図5を示す。図5では、上述の例における設定(N=16、W(n)の大小関係)と異なる例を示しているが、パワースペクトル包絡係数列に含まれる係数の大小関係に拠る並べ替えが、周波数領域のサンプル列に含まれるサンプルの並べ替えに反映されることが理解できよう。なお、図4および図5では、周波数領域のサンプル列に含まれる全てのサンプルが0以上の値であるかの如く図示してあるが、これは、サンプルの並べ替えによって低域側に、より大きな振幅を持つサンプルが偏ることを分かりやすく図示するための便宜に過ぎない。周波数領域のサンプル列に含まれる各サンプルは正または負またはゼロの値をとる場合があり、このような場合であっても、上述の並べ替え処理あるいは後述の並べ替え処理を実行すればよい。   FIG. 5 is shown as an aid to understanding the processing in this case. FIG. 5 shows an example different from the setting in the above example (N = 16, W (n) magnitude relationship), but the rearrangement based on the magnitude relationship of the coefficients included in the power spectrum envelope coefficient sequence is the frequency. It can be seen that this is reflected in the sorting of the samples contained in the sample column of the region. In FIGS. 4 and 5, all the samples included in the frequency-domain sample sequence are illustrated as if they have a value of 0 or more. This is merely a convenient way of illustrating that a sample having a large amplitude is biased. Each sample included in the frequency domain sample string may take a positive, negative, or zero value. Even in such a case, the above-described rearrangement process or the rearrangement process described later may be executed.

<サンプル列に含まれるサンプルのうち一部を並べ替えの対象とする場合>
パワースペクトル包絡係数列に含まれる16個の係数W(1),・・・,W(16)の間に上記のような大小関係があるとして、周波数領域のサンプル列に含まれる一部のサンプル(サンプル数をkとする。k<Nを満たす)をパワースペクトル包絡係数列に基づく並べ替えの対象とするならば、並べ替え部5は、パワースペクトル包絡係数列に含まれる16個の係数W(1),・・・,W(16)の中から大きい順で選択されたk個の係数の大きい順の並びに一致するように、これらk個の係数W(n)[n∈R]に対応するサンプルW(n)[n∈R]を低域側から並べる。Rは、選択されたk個の係数のインデックスの集合である。説明を具体的にするため、例として、k=4の場合を考える。このとき、「パワースペクトル包絡係数列に含まれる16個の係数W(1),・・・,W(16)の中から大きい順で選択された4個の係数の大きい順の並び」は次のとおりである。
---
W(1)> W(5)> W(3)> W(2)
---
従って、並べ替え部5は、W(1), W(2), W(3), W(5)に対応する4個のサンプルF(1), F(2), F(3), F(5)を「パワースペクトル包絡係数列に含まれる16個の係数W(1),・・・,W(16)の中から大きい順で選択された4個の係数の大きい順の並び」に一致するように並べ替えるので、サンプルF(1), F(2), F(3), F(5)は次のような並びに変更される。
---
F(1), F(5), F(3), F(2)
---
この場合、パワースペクトル包絡係数列に基づく並べ替えの対象に含まれなかったサンプルF(4), F(6), F(7), F(8), F(9), F(10), F(11), F(12), F(13), F(14), F(15), F(16)は元の並びを維持して4個のサンプルの並びF(1), F(5), F(3), F(2)の後に(つまり、高域側に)連結されるため、結果として、入力されたサンプル列F(1), F(2), F(3), F(4), F(5), F(6), F(7), F(8), F(9), F(10), F(11), F(12), F(13), F(14), F(15), F(16)の並びは、次のような並びに変更される。並べ替え部5は、この並びのサンプル列を「並べ替え後のサンプル列」として出力する。
---
F(1), F(5), F(3), F(2), F(4), F(6), F(7), F(8), F(9), F(10), F(11), F(12), F(13), F(14), F(15), F(16)
---
<When some of the samples included in the sample column are to be sorted>
Some samples included in the frequency domain sample sequence, assuming that the 16 coefficients W (1), ..., W (16) included in the power spectrum envelope coefficient sequence have the above magnitude relationship If the number of samples is k (satisfying k <N) is to be rearranged based on the power spectrum envelope coefficient sequence, the reordering unit 5 includes 16 coefficients W included in the power spectrum envelope coefficient sequence. The k coefficients W (n) [n∈R] are matched so that the k coefficients selected in the descending order from (1),... Corresponding samples W (n) [n∈R] are arranged from the low frequency side. R is a set of indices of the selected k coefficients. To make the explanation concrete, consider the case of k = 4 as an example. At this time, “the order of four coefficients selected in descending order from the 16 coefficients W (1),..., W (16) included in the power spectrum envelope coefficient sequence” is as follows: It is as follows.
---
W (1)> W (5)> W (3)> W (2)
---
Therefore, the rearrangement unit 5 has four samples F (1), F (2), F (3), F corresponding to W (1), W (2), W (3), W (5). (5) to “a sequence of four coefficients selected in descending order from the 16 coefficients W (1),..., W (16) included in the power spectrum envelope coefficient sequence”. Since the data are rearranged so as to match, the samples F (1), F (2), F (3), and F (5) are changed as follows.
---
F (1), F (5), F (3), F (2)
---
In this case, samples F (4), F (6), F (7), F (8), F (9), F (10), F (4), which were not included in the target of reordering based on the power spectrum envelope coefficient sequence, F (11), F (12), F (13), F (14), F (15), F (16) maintain the original sequence and the sequence of four samples F (1), F ( 5), F (3), F (2) are connected after (that is, on the high frequency side), and as a result, the input sample sequence F (1), F (2), F (3), F (4), F (5), F (6), F (7), F (8), F (9), F (10), F (11), F (12), F (13), The sequence of F (14), F (15), and F (16) is changed as follows. The rearrangement unit 5 outputs the sample string in this arrangement as a “sample string after rearrangement”.
---
F (1), F (5), F (3), F (2), F (4), F (6), F (7), F (8), F (9), F (10), F (11), F (12), F (13), F (14), F (15), F (16)
---

上述の具体例では、「パワースペクトル包絡係数列W(1),・・・,W(N)の大きい順」を規準としてサンプルを低域側から並べていく並べ替え処理を説明したが、同規準の下、サンプルを高域側から並べていく並べ替え処理を採用してもよい。この場合、サンプル列に含まれるサンプルの並びは、上述の例の逆順となることは容易に理解されるであろう。念のため、この場合の並べ替え後のサンプル列を示す。
サンプル列に含まれるサンプルの全部がパワースペクトル包絡係数列に基づく並べ替えの対象である場合:
---
F(16), F(14), F(15), F(13), F(12), F(11), F(10), F(7), F(9), F(8), F(4), F(6), F(2), F(3), F(5), F(1)
---
サンプル列に含まれるサンプルの一部がパワースペクトル包絡係数列に基づく並べ替えの対象である場合:
---
F(16), F(15), F(14), F(13), F(12), F(11), F(10), F(9), F(8), F(7), F(6), F(4), F(2), F(3), F(5), F(1)
---
In the above-described specific example, the rearrangement process in which samples are arranged from the low frequency side with reference to “in descending order of power spectrum envelope coefficient sequence W (1),..., W (N)” has been described. A rearrangement process in which samples are arranged from the high frequency side may be adopted. In this case, it will be easily understood that the arrangement of the samples included in the sample sequence is the reverse order of the above example. As a precaution, the sample sequence after rearrangement in this case is shown.
When all the samples included in the sample sequence are to be sorted based on the power spectrum envelope coefficient sequence:
---
F (16), F (14), F (15), F (13), F (12), F (11), F (10), F (7), F (9), F (8), F (4), F (6), F (2), F (3), F (5), F (1)
---
If some of the samples included in the sample sequence are subject to sorting based on the power spectrum envelope coefficient sequence:
---
F (16), F (15), F (14), F (13), F (12), F (11), F (10), F (9), F (8), F (7), F (6), F (4), F (2), F (3), F (5), F (1)
---

上述の具体例では、「パワースペクトル包絡係数列W(1),・・・,W(N)の大きい順」を規準としてサンプル列に含まれるサンプルを並べ替える処理を説明したが、「パワースペクトル包絡係数列W(1),・・・,W(N)の小さい順」を規準としてサンプル列に含まれるサンプルを並べ替える処理を採用してもよい。以下、この処理を採用した場合の具体例を説明する。
まず、サンプル列に含まれるサンプルの全部がパワースペクトル包絡係数列に基づく並べ替えの対象である場合は、「パワースペクトル包絡係数列W(1),・・・,W(N)の大きい順」を規準としてサンプル列に含まれるサンプルを並べ替える既述の処理と結果的に同じ結果が得られる。この場合、サンプルを低域側から並べるようにしてもよいし、高域側から並べるようにしてもよい。
次に、サンプル列に含まれるサンプルの一部がパワースペクトル包絡係数列に基づく並べ替えの対象である場合について具体例を用いて説明する。パワースペクトル包絡係数列に含まれる16個の係数W(1),・・・,W(16)の間に上記のような大小関係があるとして、周波数領域のサンプル列に含まれる一部のサンプル(サンプル数をkとする。k<Nを満たす)をパワースペクトル包絡係数列に基づく並べ替えの対象とするならば、並べ替え部5は、パワースペクトル包絡係数列に含まれる16個の係数W(1),・・・,W(16)の中から小さい順で選択されたk個の係数の小さい順の並びに一致するように、これらk個の係数W(n)[n∈R]に対応するサンプルF(n)[n∈R]を低域側から並べる。Rは、選択されたk個の係数のインデックスの集合である。説明を具体的にするため、例として、k=8の場合を考える。このとき、「パワースペクトル包絡係数列に含まれる16個の係数W(1),・・・,W(N)の中から小さい順で選択された8個の係数の小さい順の並び」は次のとおりである。
---
W(16)< W(14)< W(15)< W(13)< W(12)< W(11)< W(10)< W(7)
---
従って、並べ替え部5は、W(7), W(10), W(11), W(12), W(13), W(14), W(15), W(16)に対応する8個のサンプルF(7), F(10), F(11), F(12), F(13), F(14), F(15), F(16)を「パワースペクトル包絡係数列に含まれる16個の係数W(1),・・・,W(16)の中から小さい順で選択された8個の係数の小さい順の並び」に一致するように並べ替えるので、サンプルF(7), F(10), F(11), F(12), F(13), F(14), F(15), F(16)は次のような並びに変更される。
---
F(16), F(14), F(15), F(13), F(12), F(11), F(10), F(7)
---
この場合、パワースペクトル包絡係数列に基づく並べ替え対象に含まれなかったサンプルF(1), F(2), F(3), F(4), F(5), F(6), F(8), F(9)は元の並びを維持して8個のサンプルの並びF(16), F(14), F(15), F(13), F(12), F(11), F(10), F(7)の後に(つまり、高域側に)連結されるため、結果として、入力されたサンプル列F(1), F(2), F(3), F(4), F(5), F(6), F(7), F(8), F(9), F(10), F(11), F(12), F(13), F(14), F(15), F(16)の並びは、次のような並びに変更される。
---
F(16), F(14), F(15), F(13), F(12), F(11), F(10), F(7), F(1), F(2), F(3), F(4), F(5), F(6), F(8), F(9)
---
サンプルを高域側から並べる並べ替え処理の場合は、逆の並びになるので、入力されたサンプル列F(1), F(2), F(3), F(4), F(5), F(6), F(7), F(8), F(9), F(10), F(11), F(12), F(13), F(14), F(15), F(16)の並びは、次のような並びに変更される。
---
F(9), F(8), F(6), F(5), F(4), F(3), F(2), F(1), F(7) F(10), F(11), F(12), F(13), F(15), F(14), F(16)
---
In the above-described specific example, the process of rearranging the samples included in the sample sequence on the basis of “in descending order of the power spectrum envelope coefficient sequence W (1),..., W (N)” has been described. A process of rearranging the samples included in the sample sequence on the basis of the order of the envelope coefficient sequence W (1),..., W (N) is small may be employed. Hereinafter, a specific example when this process is adopted will be described.
First, when all of the samples included in the sample sequence are to be rearranged based on the power spectrum envelope coefficient sequence, “in order of increasing power spectrum envelope coefficient sequence W (1),..., W (N)” As a result, the same result as the above-described processing for rearranging the samples included in the sample sequence can be obtained. In this case, the samples may be arranged from the low frequency side or from the high frequency side.
Next, a case where a part of the samples included in the sample sequence is a target of rearrangement based on the power spectrum envelope coefficient sequence will be described using a specific example. Some samples included in the frequency domain sample sequence, assuming that the 16 coefficients W (1), ..., W (16) included in the power spectrum envelope coefficient sequence have the above magnitude relationship If the number of samples is k (satisfying k <N) is to be rearranged based on the power spectrum envelope coefficient sequence, the reordering unit 5 includes 16 coefficients W included in the power spectrum envelope coefficient sequence. The k coefficients W (n) [n∈R] are matched so that the k coefficients selected from (1),... Corresponding samples F (n) [n∈R] are arranged from the low frequency side. R is a set of indices of the selected k coefficients. To make the explanation concrete, consider the case of k = 8 as an example. At this time, “the order of 8 coefficients selected in ascending order from the 16 coefficients W (1),..., W (N) included in the power spectrum envelope coefficient sequence” is as follows: It is as follows.
---
W (16) <W (14) <W (15) <W (13) <W (12) <W (11) <W (10) <W (7)
---
Therefore, the rearrangement unit 5 corresponds to W (7), W (10), W (11), W (12), W (13), W (14), W (15), W (16). Eight samples F (7), F (10), F (11), F (12), F (13), F (14), F (15), F (16) Sample F is reordered so that it matches “the order of 8 coefficients selected in ascending order from the 16 coefficients W (1),... (7), F (10), F (11), F (12), F (13), F (14), F (15), F (16) are changed as follows.
---
F (16), F (14), F (15), F (13), F (12), F (11), F (10), F (7)
---
In this case, samples F (1), F (2), F (3), F (4), F (5), F (6), F that were not included in the reordering target based on the power spectrum envelope coefficient sequence (8), F (9) maintain the original sequence and the sequence of 8 samples F (16), F (14), F (15), F (13), F (12), F (11 ), F (10), F (7) are connected after (that is, on the high frequency side), and as a result, the input sample sequence F (1), F (2), F (3), F (4), F (5), F (6), F (7), F (8), F (9), F (10), F (11), F (12), F (13), F The order of (14), F (15), and F (16) is changed as follows.
---
F (16), F (14), F (15), F (13), F (12), F (11), F (10), F (7), F (1), F (2), F (3), F (4), F (5), F (6), F (8), F (9)
---
In the case of the rearrangement process in which the samples are arranged from the high frequency side, the order is reversed, so the input sample sequences F (1), F (2), F (3), F (4), F (5), F (6), F (7), F (8), F (9), F (10), F (11), F (12), F (13), F (14), F (15), The sequence of F (16) is changed as follows.
---
F (9), F (8), F (6), F (5), F (4), F (3), F (2), F (1), F (7) F (10), F (11), F (12), F (13), F (15), F (14), F (16)
---

上述の具体例では、本発明の容易な理解のため、パワースペクトル包絡係数列に含まれる係数W(1),・・・,W(N)の間の大小関係が明確である場合(つまり、任意の二つの係数が等しくない場合)を例示した。実際には、インデックスが異なる係数W(i)とW(j)[i≠j]についてW(i)=W(j)が成立する場合がある。このような場合、「パワースペクトル包絡係数列W(1),・・・,W(N)の大きい順(あるいは小さい順)」という規準において、インデックスiとjの大小関係を維持するように係数を並べればよい。このようにすると、同じ大きさを持つ係数に対応するサンプルの間では並べ替えは発生しないから、並べ替えに必要な計算資源を節約できる。   In the above specific example, for easy understanding of the present invention, when the magnitude relationship between the coefficients W (1),..., W (N) included in the power spectrum envelope coefficient sequence is clear (that is, The case where any two coefficients are not equal) is illustrated. Actually, W (i) = W (j) may be established for coefficients W (i) and W (j) [i ≠ j] having different indexes. In such a case, in the criterion “in order of power spectrum envelope coefficient sequence W (1),..., W (N) (or in ascending order)”, the coefficients are set so as to maintain the magnitude relationship between indexes i and j. Can be arranged. In this way, since rearrangement does not occur between samples corresponding to coefficients having the same size, calculation resources necessary for rearrangement can be saved.

実際の処理を限定する意図ではなく本発明の要点を端的に表現するならば、並べ替え部5は、パワースペクトル包絡係数列に含まれる係数の大小関係に基づく並べ替えに連動して、パワースペクトル包絡係数列に含まれる係数に1対1で対応付けられたサンプル列に含まれるサンプルのうち並べ替え対象のサンプルを並べ替える、のである。もちろん、実際の処理としては、適切なアルゴリズムに従い、パワースペクトル包絡係数列に含まれる係数の大小関係に基づく並べ替えに連動して並べ替え対象のサンプルを並べ替えてもよいし、あるいは、まず、パワースペクトル包絡係数列に含まれる係数の大小関係に基づく並べ替えを記録し、次に、当該並べ替え処理の記録に基づいて並べ替え対象のサンプルを並べ替えてもよい。本発明の実施形態の処理によると、周波数領域のサンプル列の振幅傾向が音響信号のパワースペクトル包絡と類似しているため、並べ替え部5が周波数領域のサンプル列の実際の値を知らなくても、パワースペクトル包絡係数列に含まれる係数の大小関係に基づく並べ替えに連動して並べ替え対象のサンプルを並べ替えることにより、並べ替え後のサンプル列では、大きな振幅のサンプルが低域側(あるいは高域側)に偏る可能性がとても高くなる。   If the gist of the present invention is expressed in a straight line rather than the intention of limiting the actual processing, the reordering unit 5 operates in conjunction with the reordering based on the magnitude relation of the coefficients included in the power spectrum envelope coefficient sequence, and the power spectrum. The samples to be rearranged are rearranged among the samples included in the sample sequence that is one-to-one associated with the coefficients included in the envelope coefficient sequence. Of course, as an actual process, according to an appropriate algorithm, the samples to be rearranged may be rearranged in conjunction with the rearrangement based on the magnitude relation of the coefficients included in the power spectrum envelope coefficient sequence. The rearrangement based on the magnitude relation of the coefficients included in the power spectrum envelope coefficient sequence may be recorded, and then the samples to be rearranged may be rearranged based on the recording of the rearrangement process. According to the processing of the embodiment of the present invention, since the amplitude tendency of the frequency domain sample sequence is similar to the power spectrum envelope of the acoustic signal, the reordering unit 5 does not know the actual value of the frequency domain sample sequence. However, by rearranging the samples to be rearranged in conjunction with the rearrangement based on the magnitude relationship of the coefficients included in the power spectrum envelope coefficient sequence, a sample with a larger amplitude is lower in the rearranged sample sequence ( Or the possibility of being biased to the high frequency side becomes very high.

フレームごとに、パワースペクトル包絡係数列に基づく並べ替え対象としてサンプル列に含まれるサンプルの全部または一部を選択可能な実施形態を採用することもでき、この場合、フレームごとに、パワースペクトル包絡係数列に基づく並べ替え対象がサンプル列に含まれるサンプルの全部であること或いは一部であることを指定する情報(以下、「対象情報」という)を復号側へ伝送すればよい。なお、上述の具体例では、周波数領域のサンプル列に含まれる一部のサンプルをパワースペクトル包絡係数列に基づく並べ替えの対象とする場合、対象となる一部のサンプルをサンプル数k(k<N)で特定した。しかし、対象となる一部のサンプルをサンプル数kで特定することに限定されず、例えば対象となる一部のサンプルをフレームに含まれるサンプル総数Nに対する割合で特定してもよい。対象情報には、パワースペクトル包絡係数列に基づく並べ替え対象がサンプル列に含まれるサンプルの一部であることを指定する情報に加えて、サンプル数kや前記割合などの情報も付加される。   For each frame, an embodiment in which all or a part of the samples included in the sample sequence can be selected as an object to be rearranged based on the power spectrum envelope coefficient sequence can be adopted. In this case, the power spectrum envelope coefficient is selected for each frame. Information (hereinafter referred to as “target information”) designating that the sorting target based on the column is all or a part of the samples included in the sample column may be transmitted to the decoding side. In the specific example described above, when a part of samples included in the frequency domain sample sequence is to be rearranged based on the power spectrum envelope coefficient sequence, the target sample is the number of samples k (k < N). However, the present invention is not limited to specifying a part of the target sample by the number of samples k. For example, the part of the target sample may be specified by a ratio to the total number N of samples included in the frame. In addition to information specifying that the rearrangement target based on the power spectrum envelope coefficient sequence is a part of the samples included in the sample sequence, information such as the number of samples k and the ratio is also added to the target information.

また、フレームごとに、「パワースペクトル包絡係数列W(1),・・・,W(N)の大きい順」を規準としてサンプル列に含まれるサンプルを並べ替える処理と「パワースペクトル包絡係数列W(1),・・・,W(N)の小さい順」を規準としてサンプル列に含まれるサンプルを並べ替える処理を選択可能な実施形態を採用することもできる。この場合、フレームごとに、いずれの規準に準拠したかを指定する情報を復号側へ伝送すればよい。ただし、一般的には、フレームごとに当該両処理を選択可能とすることにメリットは少なく、事前に、符号化側と復号側でどちらの規準に従うかを取り決めておけば足りる。   Further, for each frame, a process of rearranging the samples included in the sample sequence based on “in order of increasing power spectrum envelope coefficient sequence W (1),..., W (N)” and “power spectrum envelope coefficient sequence W It is also possible to adopt an embodiment in which processing for rearranging the samples included in the sample sequence can be selected with “(1),..., W (N) in ascending order” as a criterion. In this case, for each frame, information designating which standard is complied may be transmitted to the decoding side. However, in general, there is little merit in making it possible to select both processes for each frame, and it is sufficient to decide in advance which standard is to be followed on the encoding side and the decoding side.

同様に、フレームごとに、サンプル列に含まれるサンプルを低域側から並べていく処理と、サンプル列に含まれるサンプルを高域側から並べていく処理のいずれかを選択可能な実施形態を採用することもできる。この場合、フレームごとに、低域側からサンプルを並べたこと或いは高域側からサンプルを並べたことを指定する情報を復号側へ伝送すればよい。ただし、一般的には、フレームごとに当該両処理を選択可能とすることにメリットは少なく、事前に、符号化側と復号側でサンプル列に含まれるサンプルをどちらの帯域側から並べるかを取り決めておけば足りる。   Similarly, for each frame, an embodiment in which either the processing of arranging the samples included in the sample sequence from the low frequency side or the processing of arranging the samples included in the sample sequence from the high frequency side can be selected is adopted. You can also. In this case, information specifying that samples are arranged from the low frequency side or samples are arranged from the high frequency side may be transmitted to the decoding side for each frame. However, in general, there is little merit in making it possible to select both processes for each frame, and it is decided in advance from which band side the samples included in the sample sequence are arranged on the encoding side and decoding side. That's enough.

〈並べ替え処理の変形例1〉
並べ替え処理の変形例1を説明するに先立ち、上述の並べ替え処理(以下、「スペクトル包絡並べ替え処理」という)と異なるコンセプトに基づく並べ替え処理(以下、「周期性並べ替え処理」という)を説明する。
<Modification 1 of rearrangement process>
Prior to describing Modification Example 1 of the rearrangement process, a rearrangement process based on a different concept from the above-described rearrangement process (hereinafter referred to as “spectrum envelope rearrangement process”) (hereinafter referred to as “periodic rearrangement process”). Will be explained.

[周期性並べ替え処理]
周期性並べ替え処理では、フレームごとに、(1)周波数領域のサンプル列の全てのサンプルを含み、かつ、(2)サンプルの大きさを反映する指標が同等か同程度のサンプルが集まるように周波数領域のサンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、が並べ替え後のサンプル列として出力される。ここで「サンプルの大きさを反映する指標」とは、例えばサンプルの振幅の絶対値やパワー(自乗値)であるが、これらに限定されない。なお、周期性並べ替え処理の実行主体は並べ替え部5であってもよいし、符号化装置100内に在る他の手段であってもよいが、説明の便宜から、並べ替え部5が周期性並べ替え処理を実行するとして説明する。
[Periodic sorting process]
In the periodicity rearrangement process, for each frame, (1) all samples of the frequency domain sample sequence are included, and (2) samples having the same or similar index reflecting the sample size are collected. A sample in which at least a part of samples included in the frequency domain sample sequence is rearranged is output as the rearranged sample sequence. Here, the “index reflecting the sample size” is, for example, the absolute value or power (square value) of the amplitude of the sample, but is not limited thereto. Note that the execution subject of the periodic reordering process may be the reordering unit 5 or other means in the encoding apparatus 100, but for the convenience of explanation, the reordering unit 5 A description will be given assuming that the periodicity rearrangement process is executed.

[周期性並べ替え処理の詳細]
この周期性並べ替え処理の具体例を説明する。例えば、並べ替え部5は、(1)サンプル列の全てのサンプルを含み、かつ、(2)サンプル列のうちの音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、サンプル列のうちの音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるようにサンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、を並べ替え後のサンプル列として出力する。つまり、音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、当該音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプルが例えば低域側に集まるように、入力されたサンプル列に含まれる少なくとも一部のサンプルが並べ替えられる。
[Details of periodic sort processing]
A specific example of this periodicity rearrangement process will be described. For example, the rearrangement unit 5 includes (1) all samples in the sample sequence, and (2) one or a plurality of consecutive samples including samples corresponding to the periodicity or fundamental frequency of the acoustic signal in the sample sequence. Included in the sample sequence such that all or some of the samples and one or more consecutive samples including samples corresponding to the periodicity of the acoustic signal in the sample sequence or an integer multiple of the fundamental frequency are collected A rearranged sample sequence is output as a rearranged sample sequence. That is, one or a plurality of consecutive samples including samples corresponding to the periodicity or fundamental frequency of the acoustic signal, and one or a plurality of consecutive samples including samples corresponding to an integer multiple of the periodicity or fundamental frequency of the acoustic signal. For example, at least a part of the samples included in the input sample sequence is rearranged so that the samples are collected on the low frequency side, for example.

この理由は、基本周波数や高調波(基本周波数の整数倍波)に対応するサンプルとそれらの近傍のサンプルの振幅の絶対値やパワーは、基本周波数と高調波を除く周波数領域に対応するサンプルの振幅の絶対値やパワーよりも大きいという音響信号、特に音声や楽音などに顕著な特徴に基づく。ここで、音声や楽音などの音響信号から抽出される音響信号の周期性の特徴量(例えばピッチ周期)は、基本周波数と等価なものであるから、音響信号の周期性の特徴量(例えばピッチ周期)やその整数倍に対応するサンプルとそれらの近傍のサンプルの振幅の絶対値やパワーは、周期性特徴量やその整数倍を除く周波数領域に対応するサンプルの振幅の絶対値やパワーよりも大きいという特徴も認められる。   This is because the absolute value and power of the amplitude corresponding to the fundamental frequency and harmonics (integer multiples of the fundamental frequency) and samples in the vicinity of them are the same as those of the samples corresponding to the frequency region excluding the fundamental frequency and harmonics. This is based on a remarkable feature in an acoustic signal that is larger than the absolute value or power of the amplitude, particularly voice or musical sound. Here, since the periodic characteristic amount (for example, pitch period) of the acoustic signal extracted from the acoustic signal such as voice or music is equivalent to the fundamental frequency, the periodic characteristic amount (for example, pitch) of the acoustic signal is equivalent to the fundamental frequency. The absolute value and power of the amplitude of the sample corresponding to the periodicity) and its integer multiples and the samples in the vicinity of them are larger than the absolute value and power of the amplitude of the sample corresponding to the frequency domain excluding the periodic feature and their integral multiples. The feature of being large is also recognized.

そして、音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、当該音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプルは、例えば低周波側に一まとまりになるように集められる。以下、音響信号の周期性または基本周波数に対応するサンプルと当該音響信号の周期性または基本周波数の整数倍に対応するサンプルとの間隔(以下、単に「間隔」という)を表す記号をTとする。   And one or a plurality of continuous samples including samples corresponding to the periodicity or fundamental frequency of the acoustic signal, and one or a plurality of consecutive samples including samples corresponding to an integer multiple of the periodicity or fundamental frequency of the acoustic signal. The samples are collected, for example, in a group on the low frequency side. Hereinafter, T represents a symbol representing an interval (hereinafter simply referred to as “interval”) between a sample corresponding to the periodicity or fundamental frequency of the acoustic signal and a sample corresponding to an integer multiple of the periodicity or fundamental frequency of the acoustic signal. .

具体例として、並べ替え部5は、入力されたサンプル列から、間隔Tの整数倍に対応するサンプルF(qT)の前後のサンプルF(qT-1),F(qT+1)を含めた3個のサンプルF(qT-1),F(qT),F(qT+1)を選択する。F(j)は、周波数に対応するサンプルインデックスを表す番号jに対応するサンプルである。qは、1からqT+1が予め設定した対象サンプルの上限Mを超えない範囲の各整数とする。q=1は基本周波数に対応し、q>1は高調波に対応する。周波数に対応するサンプルインデックスを表す番号jの最大値をNとする。qに応じて選択されたサンプルの集まりをサンプル群と呼称する。上限Mは、Nと一致させてもよいが、音声や楽音などの音響信号では高域におけるサンプルの指標は一般的に十分に小さいことが多いので、MはNよりも小さい値であってもよい。例えば、MはNの半分程度の値であってもよい。上限Mに基づいて定まるqの最大値をqmaxとすると、入力されたサンプル列に含まれるサンプルのうち、最低の周波数から第1の所定の周波数qmax*T+1までの各周波数に対応するサンプルが並べ替えの対象となる。なお、記号*は乗算を表す。   As a specific example, the rearrangement unit 5 includes samples F (qT−1) and F (qT + 1) before and after the sample F (qT) corresponding to an integer multiple of the interval T from the input sample sequence. Three samples F (qT-1), F (qT), and F (qT + 1) are selected. F (j) is a sample corresponding to the number j representing the sample index corresponding to the frequency. q is an integer in a range from 1 to qT + 1 not exceeding the preset upper limit M of the target sample. q = 1 corresponds to the fundamental frequency and q> 1 corresponds to the harmonic. Let N be the maximum value of the number j representing the sample index corresponding to the frequency. A collection of samples selected according to q is called a sample group. The upper limit M may be equal to N, but in the case of acoustic signals such as speech and musical sounds, the sample index in the high frequency is generally sufficiently small, so even if M is a value smaller than N Good. For example, M may be about half of N. If the maximum value of q determined based on the upper limit M is qmax, samples corresponding to each frequency from the lowest frequency to the first predetermined frequency qmax * T + 1 among the samples included in the input sample sequence Are subject to sorting. The symbol * represents multiplication.

並べ替え部5は、選択されたサンプルF(j)を、元の番号jの大小関係を保ったままサンプル列の先頭から順に配置してサンプル列Aを生成する。例えば、qが1から5までの各整数を表す場合、並べ替え部5は、第1のサンプル群F(T-1),F(T),F(T+1)、第2のサンプル群F(2T-1),F(2T),F(2T+1)、第3のサンプル群F(3T-1),F(3T),F(3T+1)、第4のサンプル群F(4T-1),F(4T),F(4T+1)、第5のサンプル群F(5T-1),F(5T),F(5T+1)をサンプル列の先頭から並べる。つまり、15個のサンプルF(T-1),F(T),F(T+1),F(2T-1),F(2T),F(2T+1),F(3T-1),F(3T),F(3T+1),F(4T-1),F(4T),F(4T+1),F(5T-1),F(5T),F(5T+1)がこの順番でサンプル列の先頭から並べられ、これら15個のサンプルがサンプル列Aを構成する。   The rearrangement unit 5 generates the sample sequence A by arranging the selected samples F (j) in order from the beginning of the sample sequence while maintaining the magnitude relationship of the original number j. For example, when q represents each integer from 1 to 5, the rearrangement unit 5 uses the first sample group F (T-1), F (T), F (T + 1), and the second sample group. F (2T-1), F (2T), F (2T + 1), third sample group F (3T-1), F (3T), F (3T + 1), fourth sample group F ( 4T-1), F (4T), F (4T + 1), and fifth sample group F (5T-1), F (5T), F (5T + 1) are arranged from the head of the sample sequence. That is, 15 samples F (T-1), F (T), F (T + 1), F (2T-1), F (2T), F (2T + 1), F (3T-1) , F (3T), F (3T + 1), F (4T-1), F (4T), F (4T + 1), F (5T-1), F (5T), F (5T + 1) Are arranged in this order from the top of the sample sequence, and these 15 samples constitute the sample sequence A.

さらに、並べ替え部5は、選択されなかったサンプルF(j)を、元の番号の大小関係を保ったままサンプル列Aの最後から順に配置する。選択されなかったサンプルF(j)は、サンプル列Aを構成するサンプル群の間に位置するサンプルであり、このような連続した一まとまりのサンプルをサンプルセットと呼称する。つまり、上述の例であれば、第1のサンプルセットF(1),…,F(T-2)、第2のサンプルセットF(T+2),…,F(2T-2)、第3のサンプルセットF(2T+2),…,F(3T-2)、第4のサンプルセットF(3T+2),…,F(4T-2)、第5のサンプルセットF(4T+2),…,F(5T-2)、第6のサンプルセットF(5T+2),…F(N)がサンプル列Aの最後から順に並べられ、これらのサンプルがサンプル列Bを構成する。   Furthermore, the rearrangement unit 5 arranges the unselected samples F (j) in order from the end of the sample row A while maintaining the magnitude relationship of the original numbers. The unselected sample F (j) is a sample located between the sample groups constituting the sample row A, and such a continuous set of samples is referred to as a sample set. That is, in the above example, the first sample set F (1),..., F (T-2), the second sample set F (T + 2),. , F (3T-2), fourth sample set F (3T + 2), ..., F (4T-2), fifth sample set F (4T + 2),..., F (5T-2), sixth sample set F (5T + 2),... F (N) are arranged in order from the end of the sample sequence A, and these samples constitute the sample sequence B. .

要するに、この例であれば、入力されたサンプル列F(j)(1≦j≦N)は、F(T-1),F(T),F(T+1),F(2T-1),F(2T),F(2T+1),F(3T-1),F(3T),F(3T+1),F(4T-1),F(4T),F(4T+1),F(5T-1),F(5T),F(5T+1),F(1),…,F(T-2),F(T+2),…,F(2T-2),F(2T+2),…,F(3T-2),F(3T+2),…,F(4T-2),F(4T+2),…,F(5T-2),F(5T+2),…,F(N)に並べ替えられることになる(図6参照)。   In short, in this example, the input sample sequence F (j) (1 ≦ j ≦ N) is F (T−1), F (T), F (T + 1), F (2T−1). ), F (2T), F (2T + 1), F (3T-1), F (3T), F (3T + 1), F (4T-1), F (4T), F (4T + 1 ), F (5T-1), F (5T), F (5T + 1), F (1), ..., F (T-2), F (T + 2), ..., F (2T-2) , F (2T + 2), ..., F (3T-2), F (3T + 2), ..., F (4T-2), F (4T + 2), ..., F (5T-2), F (5T + 2), ..., F (N) are rearranged (see Fig. 6).

なお、低周波数帯域では、音響信号の周期性や基本周波数に対応するサンプルやその整数倍のサンプル以外のサンプルでも、各サンプルは振幅やパワーが大きな値を持つことが多い。そこで、最低の周波数から所定の周波数fまでの各周波数に対応するサンプルの並べ替えを行わないようにしてもよい。例えば、所定の周波数fをqT+αとすれば、並べ替え前のサンプルF(1),…,F(qT+α)を並べ替えず、並べ替え前のF(qT+α+1)以降のサンプルを並べ替えの対象とする。αは0以上かつTよりもある程度小さい整数(例えばT/2を超えない整数)に予め設定されている。ここでqは2以上の整数であってもよい。あるいは、並べ替え前の最低周波数に対応するサンプルから連続するP個のサンプルF(1),…,F(P)を並べ替えないようにして、並べ替え前のF(P+1)以降のサンプルを並べ替えの対象としてもよい。この場合、所定の周波数fはPである。並べ替えの対象となるサンプルの集まりに対する並べ替えの基準は上述のとおりである。なお、第1の所定の周波数が設定されている場合、所定の周波数f(第2の所定の周波数)は第1の所定の周波数よりも小さい。   Note that, in the low frequency band, each sample often has a large value in amplitude or power, even if it is a sample other than a sample corresponding to the periodicity and fundamental frequency of the acoustic signal or a sample that is an integer multiple of the sample. Therefore, the rearrangement of samples corresponding to each frequency from the lowest frequency to the predetermined frequency f may not be performed. For example, if the predetermined frequency f is qT + α, the samples F (1),..., F (qT + α) before rearrangement are not rearranged, and after F (qT + α + 1) before rearrangement. This sample is subject to sorting. α is set in advance to an integer greater than or equal to 0 and somewhat smaller than T (for example, an integer not exceeding T / 2). Here, q may be an integer of 2 or more. Alternatively, P samples F (1),..., F (P) from the sample corresponding to the lowest frequency before rearrangement are not rearranged, and after F (P + 1) before rearrangement Samples may be sorted. In this case, the predetermined frequency f is P. The criteria for the rearrangement for the collection of samples to be rearranged are as described above. Note that when the first predetermined frequency is set, the predetermined frequency f (second predetermined frequency) is smaller than the first predetermined frequency.

例えば、並べ替え前のサンプルF(1),…,F(T+1)を並べ替えず、並べ替え前のF(T+2)以降のサンプルを並べ替えの対象とする場合、上述の並べ替えの基準に従うと、入力されたサンプル列F(j)(1≦j≦N)は、F(1),…,F(T+1),F(2T-1),F(2T),F(2T+1),F(3T-1),F(3T),F(3T+1),F(4T-1),F(4T),F(4T+1),F(5T-1),F(5T),F(5T+1),F(T+2),…,F(2T-2),F(2T+2),…,F(3T-2),F(3T+2),…,F(4T-2),F(4T+2),…,F(5T-2),F(5T+2),…,F(N)に並べ替えられることになる(図7参照)。   For example, when samples F (1),..., F (T + 1) before rearrangement are not rearranged and samples after F (T + 2) before rearrangement are to be rearranged, the above-described arrangement is performed. According to the replacement criteria, the input sample sequence F (j) (1 ≦ j ≦ N) is F (1),..., F (T + 1), F (2T-1), F (2T), F (2T + 1), F (3T-1), F (3T), F (3T + 1), F (4T-1), F (4T), F (4T + 1), F (5T-1 ), F (5T), F (5T + 1), F (T + 2), ..., F (2T-2), F (2T + 2), ..., F (3T-2), F (3T + 2), ..., F (4T-2), F (4T + 2), ..., F (5T-2), F (5T + 2), ..., F (N) (Figure) 7).

このように並べ替えられた後のサンプル列は、周波数を横軸とし、サンプルの指標を縦軸とした場合に、サンプルの指標の包絡線が周波数の増大に伴って下降傾向を示すことになる。この理由として、周波数領域のサンプル列は音響信号、特に音声信号や楽音信号の特徴として、一般的に高周波成分が少ないという事実が挙げられる。換言すれば、並べ替え部5は、サンプルの指標の包絡線が周波数の増大に伴って下降傾向を示すように入力されたサンプル列に含まれる少なくとも一部のサンプルを並べ替えると言ってもよい。   In the sample sequence after such rearrangement, when the frequency is on the horizontal axis and the sample index is on the vertical axis, the envelope of the sample index shows a downward trend as the frequency increases. . The reason for this is the fact that the frequency domain sample train generally has few high-frequency components as a characteristic of an acoustic signal, particularly an audio signal or a musical sound signal. In other words, the reordering unit 5 may reorder at least some of the samples included in the input sample sequence so that the envelope of the sample index shows a downward trend as the frequency increases. .

さらに、ここでは低域側に、周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプルを集める並べ替えを行ったが、逆に高域側に、周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプルを集める並べ替えを行ってもよい。この場合、サンプル列Aではサンプル群が逆順で並べられ、サンプル列Bではサンプルセットが逆順で並べられ、低域側にサンプル列Bが配置されサンプルBの後ろにサンプル列Aが配置される。つまり、上述の例であれば、低域側から、第6のサンプルセットF(5T+2),…F(N)、第5のサンプルセットF(4T+2),…,F(5T-2)、第4のサンプルセットF(3T+2),…,F(4T-2)、第3のサンプルセットF(2T+2),…,F(3T-2)、第2のサンプルセットF(T+2),…,F(2T-2)、第1のサンプルセットF(1),…,F(T-2)、第5のサンプル群F(5T-1),F(5T),F(5T+1)、第4のサンプル群F(4T-1),F(4T),F(4T+1)、第3のサンプル群F(3T-1),F(3T),F(3T+1)、第2のサンプル群F(2T-1),F(2T),F(2T+1)、第1のサンプル群F(T-1),F(T),F(T+1)の順番でサンプルが並べられる。
このように並べ替えられた後のサンプル列は、周波数を横軸とし、サンプルの指標を縦軸とした場合に、サンプルの指標の包絡線が周波数の増大に伴って増大傾向を示すことになる。換言すれば、並べ替え部5は、サンプルの指標の包絡線が周波数の増大に伴って増大傾向を示すように入力されたサンプル列に含まれる少なくとも一部のサンプルを並べ替えると言ってもよい。
Further, here, on the low frequency side, one or a plurality of consecutive samples including samples corresponding to periodicity or fundamental frequency, and one or a plurality of consecutive samples including samples corresponding to an integer multiple of periodicity or fundamental frequency However, on the high frequency side, one or a plurality of consecutive samples including samples corresponding to periodicity or fundamental frequency and integer multiples of periodicity or fundamental frequency are supported. Reordering may be performed to collect one or a plurality of consecutive samples including the sample. In this case, the sample group is arranged in the reverse order in the sample row A, the sample set is arranged in the reverse order in the sample row B, the sample row B is arranged on the low frequency side, and the sample row A is arranged behind the sample B. That is, in the above example, the sixth sample set F (5T + 2),... F (N), the fifth sample set F (4T + 2),. 2), fourth sample set F (3T + 2), ..., F (4T-2), third sample set F (2T + 2), ..., F (3T-2), second sample set F (T + 2), ..., F (2T-2), first sample set F (1), ..., F (T-2), fifth sample group F (5T-1), F (5T ), F (5T + 1), fourth sample group F (4T-1), F (4T), F (4T + 1), third sample group F (3T-1), F (3T), F (3T + 1), second sample group F (2T-1), F (2T), F (2T + 1), first sample group F (T-1), F (T), F ( Samples are arranged in the order of (T + 1).
In the sample sequence after such rearrangement, when the frequency is on the horizontal axis and the sample index is on the vertical axis, the envelope of the sample index shows a tendency to increase as the frequency increases. . In other words, the reordering unit 5 may reorder at least some of the samples included in the input sample sequence so that the envelope of the sample index shows an increasing tendency with increasing frequency. .

間隔Tは整数ではなく小数(たとえば5.0、5.25、5.5、5.75)であってもよい。この場合、例えば、R(qT)をqTを四捨五入した値として、F(R(qT-1)),F(R(qT)),F(R(qT+1))が選択されることになる。   The interval T may be a decimal number (for example, 5.0, 5.25, 5.5, 5.75) instead of an integer. In this case, for example, F (R (qT-1)), F (R (qT)), and F (R (qT + 1)) are selected with R (qT) rounded off qT. Become.

[間隔Tの決定方法]
間隔Tは、入力されたサンプル列に応じて、つまりフレームごとに、値を設定することが好ましい。フレームごとに間隔Tを決定する方法として、例えば、サンプルの指標(絶対値や二乗値)の周期性を探索し、平均絶対値や平均二乗値の偏りが大きくなるように間隔Tを設定する方法を採用してもよい。
[How to determine the interval T]
It is preferable to set a value for the interval T according to the input sample sequence, that is, for each frame. As a method of determining the interval T for each frame, for example, a method of searching for periodicity of sample indices (absolute value or square value) and setting the interval T so that the bias of the average absolute value or the mean square value becomes large. May be adopted.

間隔Tの決定方法として種々考えられるが、ここでは間隔Tを決定する具体的手順の一例を説明する。Tを周波数領域の周期(間隔)の候補パラメータとし、Tに対応して選択されるサンプル群に含まれる全てのサンプルの指標を加算してE(T)を求める。ここではサンプルの指標を|F(j)|と表す。Tに対応して選択されるサンプル群に含まれる全てのサンプルの番号jの集合をHとすると、E(T)=Σj∈H|F(j)|である。上述の具体例であれば、E(T)=Σj∈H|F(j)|=F(T-1)+F(T)+F(T+1)+F(2T-1)+F(2T)+F(2T+1)+F(3T-1)+F(3T)+F(3T+1)+F(4T-1)+F(4T)+F(4T+1)+F(5T-1)+F(5T)+F(5T+1)である。他方、全てのサンプルの指標の和Dを求める。つまり、D=Σj=1 N|F(j)|である。そして、間隔Tの決定基準として、サンプルの平均絶対値振幅AVE_E=E(T)/card(H)と、サンプル列全体の平均絶対値振幅AVE_D=D/Nを求める。ここでcard(H)は集合Hの要素数を表す。そして、AVE_Eが最大となるようなT_MAXを探し、さらにAVE_Eの最大値AVE_E_MAXがAVE_E_MAX>AVE_D*2を満足する場合に、周期性成分への集中が明確であると判断して、このときのT_MAXを間隔Tとする。 Various methods for determining the interval T can be considered. Here, an example of a specific procedure for determining the interval T will be described. Using T as a candidate parameter for the frequency domain period (interval), E (T) is obtained by adding indexes of all samples included in the sample group selected corresponding to T. Here, the index of the sample is represented as | F (j) |. If the set of all samples number j included in the sample group selected corresponding to T is H, then E (T) = Σj∈H | F (j) |. In the above example, E (T) = Σ j∈H | F (j) | = F (T-1) + F (T) + F (T + 1) + F (2T-1) + F (2T) + F (2T + 1) + F (3T-1) + F (3T) + F (3T + 1) + F (4T-1) + F (4T) + F (4T + 1) + F (5T-1) + F (5T) + F (5T + 1). On the other hand, the sum D of indexes of all samples is obtained. That is, D = Σ j = 1 N | F (j) |. Then, as a determination criterion for the interval T, the average absolute value amplitude AVE_E = E (T) / card (H) of the sample and the average absolute value amplitude AVE_D = D / N of the entire sample sequence are obtained. Here, card (H) represents the number of elements of the set H. Then, find T_MAX that maximizes AVE_E, and if the maximum value AVE_E_MAX of AVE_E satisfies AVE_E_MAX> AVE_D * 2, it is determined that the concentration on the periodic component is clear, and T_MAX at this time Is the interval T.

このような方法に限定されず、例えば、周波数領域の周期(間隔)Tを、符号化装置100内の図示しない別の手段によって求めた基本周波数や時間領域のピッチ周期を変換して求めてもよい。また、上述のような周期性を利用する間隔Tの決定に限らず、サンプル群を低域側に集める場合にはサンプル列Bの後半に、サンプル群を高域側に集める場合にはサンプル列Bの前半に、0の振幅を持つサンプルが長く続くように間隔Tを決定する方法を採用してもよい。   For example, the frequency domain period (interval) T may be obtained by converting the fundamental frequency obtained by another means (not shown) in the encoding apparatus 100 or the time domain pitch period. Good. Further, not only the determination of the interval T using the periodicity as described above, but when the sample group is collected on the low frequency side, in the latter half of the sample sequence B, and when the sample group is collected on the high frequency side, the sample sequence In the first half of B, a method of determining the interval T so that a sample having an amplitude of 0 continues for a long time may be adopted.

また、並べ替え部5は予め設定された複数のTの値のそれぞれに基づいてサンプル列の並べ替えを実施するという方法を採用してもよい。   The rearrangement unit 5 may adopt a method of rearranging the sample strings based on each of a plurality of preset T values.

[集めるサンプルの個数]
また、ここでは、各サンプル群に含まれるサンプルの個数が、周期性や基本周波数ないしその整数倍に対応するサンプル(以下、「中心サンプル」という)とその前後1サンプルの計3サンプルであるという固定された個数の例を示したが、サンプル群に含まれるサンプルの個数やサンプルインデックスを可変とする場合には、サンプル群に含まれるサンプルの個数とサンプルインデックスの組み合わせが異なる複数の選択肢の中から選択された一つを表す情報も補助情報に含める。
例えば、選択肢として、
(1)中心サンプルのみ、F(qT)
(2)中心サンプルとその前後1サンプルの計3サンプル、F(qT-1),F(qT),F(qT+1)
(3)中心サンプルとその前2サンプルの計3サンプル、F(qT-2),F(qT-1),F(qT)
(4)中心サンプルとその前3サンプルの計4サンプル、F(qT-3),F(qT-2),F(qT-1),F(qT)
(5)中心サンプルとその後2サンプルの計3サンプル、F(qT),F(qT+1),F(qT+2)
(6)中心サンプルとその後3サンプルの計4サンプル、F(qT),F(qT+1),F(qT+2),F(qT+3)
が設定されている場合に、(4)が選択されたならば、この(4)が選択されたことを表す情報が補助情報に含められる。この例であれば、選択された選択肢を表す情報として3ビットあれば十分である。
[Number of samples to collect]
In addition, here, the number of samples included in each sample group is a total of three samples: a sample corresponding to periodicity, a fundamental frequency or an integer multiple thereof (hereinafter referred to as “center sample”) and one sample before and after that. An example of a fixed number is shown. However, when the number of samples included in the sample group and the sample index are variable, the number of samples included in the sample group and the combination of sample indexes are different from the other options. Information indicating one selected from the above is also included in the auxiliary information.
For example, as an option,
(1) Center sample only, F (qT)
(2) A total of 3 samples, center sample and 1 sample before and after it, F (qT-1), F (qT), F (qT + 1)
(3) A total of 3 samples, F (qT-2), F (qT-1), F (qT), including the central sample and the previous 2 samples
(4) A total of 4 samples including the central sample and the previous 3 samples, F (qT-3), F (qT-2), F (qT-1), F (qT)
(5) A total of 3 samples, F (qT), F (qT + 1), F (qT + 2), center sample and then 2 samples
(6) 4 samples, F (qT), F (qT + 1), F (qT + 2), F (qT + 3), center sample and 3 samples after that
Is set, if (4) is selected, information indicating that (4) is selected is included in the auxiliary information. In this example, 3 bits are sufficient as information representing the selected option.

以上で、周期性並べ替え処理の説明を終える。   This is the end of the description of the periodicity rearrangement process.

さて、並べ替え処理の変形例1では、並べ替え部5は、フレームごとに、周期性並べ替え処理とスペクトル包絡並べ替え処理を組み合わせて実行する。具体的には、並べ替え部5は、[1]まず周期性並べ替え処理を行い並べ替え後のサンプル列を得て、[2]次いで周期性並べ替え処理で得られたサンプル列に対して、スペクトル包絡並べ替え処理を適用する。   In the first modification of the rearrangement process, the rearrangement unit 5 executes the periodicity rearrangement process and the spectrum envelope rearrangement process in combination for each frame. Specifically, the rearrangement unit 5 [1] first performs a periodic rearrangement process to obtain a sample string after the rearrangement, and [2] then applies to the sample string obtained by the periodic rearrangement process. Apply the spectral envelope reordering process.

このとき、[2]におけるスペクトル包絡並べ替え処理では、(1)周期性並べ替え処理で得られたサンプル列の全てのサンプルを含み、かつ、(2)この周期性並べ替え処理で得られたサンプル列に含まれる“一部”のサンプルについて、音声音響ディジタル信号の線形予測係数に基づくパワースペクトル包絡係数列に含まれる係数であって各サンプルに対応する係数の大きい順または小さい順に当該各サンプルを並べ替えたもの、を並べ替え後のサンプル列として出力する。周期性並べ替え処理で得られたサンプル列に含まれる“全部”のサンプルをパワースペクトル包絡係数列に基づく並べ替えの対象とするならば、[1]の処理を実施せずに単にスペクトル包絡並べ替え処理を行った場合と同じ結果になるので、[2]のスペクトル包絡並べ替え処理では、周期性並べ替え処理で得られたサンプル列に含まれる“一部”のサンプルをパワースペクトル包絡係数列に基づく並べ替えの対象とすることが好ましい。   At this time, in the spectral envelope rearrangement process in [2], (1) all samples of the sample sequence obtained by the periodic rearrangement process are included, and (2) obtained by this periodic rearrangement process. For “partial” samples included in the sample sequence, the coefficients included in the power spectrum envelope coefficient sequence based on the linear prediction coefficient of the audio-acoustic digital signal, and the samples corresponding to each sample in descending order of coefficient. Is output as a sample string after sorting. If “all” samples included in the sample sequence obtained by the periodic reordering process are to be reordered based on the power spectrum envelope coefficient sequence, the spectral envelope reordering is simply performed without performing the processing of [1]. Since the result is the same as when the replacement process is performed, in the spectrum envelope rearrangement process of [2], a “part” sample included in the sample string obtained by the periodicity rearrangement process is used as the power spectrum envelope coefficient sequence. It is preferable to make it the object of the rearrangement based on.

ここで、パワースペクトル包絡係数列に基づく並べ替えの対象となる“一部”のサンプルとは、例えば、<A>「音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、当該音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル」や<B>「最低の周波数から所定の周波数fまでの各周波数に対応するサンプルの並べ替えを行わない場合、最低の周波数から所定の周波数fまでの各周波数に対応するサンプルと、当該周波数f以降の各周波数に対応するサンプルのうち<A>を満たすサンプル」である。   Here, the “partial” sample to be rearranged based on the power spectrum envelope coefficient sequence is, for example, <A> “one or continuous including samples corresponding to the periodicity or fundamental frequency of the acoustic signal. “One or a plurality of consecutive samples including a plurality of samples and samples corresponding to the periodicity of the acoustic signal or an integral multiple of the fundamental frequency” or <B> “each frequency from the lowest frequency to a predetermined frequency f” If the corresponding samples are not rearranged, the sample corresponding to each frequency from the lowest frequency to the predetermined frequency f and the sample satisfying <A> among the samples corresponding to each frequency after the frequency f ” is there.

<A>の場合、上述の例ではサンプル列Aを構成する15個のサンプルF(T-1),F(T),F(T+1),F(2T-1),F(2T),F(2T+1),F(3T-1),F(3T),F(3T+1),F(4T-1),F(4T),F(4T+1),F(5T-1),F(5T),F(5T+1)が[2]のスペクトル包絡並べ替え処理による並べ替えの対象となる。このとき、並べ替え部5は、サンプル列Aを構成する15個のサンプルF(T-1),F(T),F(T+1),F(2T-1),F(2T),F(2T+1),F(3T-1),F(3T),F(3T+1),F(4T-1),F(4T),F(4T+1),F(5T-1),F(5T),F(5T+1)に対応するパワースペクトル包絡係数列に含まれる係数W(T-1),W(T),W(T+1),W(2T-1),W(2T),W(2T+1),W(3T-1),W(3T),W(3T+1),W(4T-1),W(4T),W(4T+1),W(5T-1),W(5T),W(5T+1)の大きい順の並びに一致するように、低域側から15個のサンプルF(T-1),F(T),F(T+1),F(2T-1),F(2T),F(2T+1),F(3T-1),F(3T),F(3T+1),F(4T-1),F(4T),F(4T+1),F(5T-1),F(5T),F(5T+1)を並べる。例えば、W(T)> W(T-1)> W(T+1)> W(2T)> W(2T-1)> W(2T+1)> W(3T)> W(3T-1)> W(3T+1)> W(4T)> W(4T-1)> W(4T+1)> W(5T)> W(5T-1)> W(5T+1)という大小関係があるならば、15個のサンプルF(T-1),F(T),F(T+1),F(2T-1),F(2T),F(2T+1),F(3T-1),F(3T),F(3T+1),F(4T-1),F(4T),F(4T+1),F(5T-1),F(5T),F(5T+1)は、F(T),F(T-1),F(T+1),F(2T),F(2T-1),F(2T+1),F(3T),F(3T-1),F(3T+1),F(4T),F(4T-1),F(4T+1),F(5T),F(5T-1),F(5T+1)という並びに変更される。そして、並べ替え部5は、このサンプルの並びF(T),F(T-1),F(T+1),F(2T),F(2T-1),F(2T+1),F(3T),F(3T-1),F(3T+1),F(4T),F(4T-1),F(4T+1),F(5T),F(5T-1),F(5T+1)の高域側に、[2]の処理で並べ替えの対象とならなかったサンプル列Bを構成するサンプルF(1),…,F(T-2),F(T+2),…,F(2T-2),F(2T+2),…,F(3T-2),F(3T+2),…,F(4T-2),F(4T+2),…,F(5T-2),F(5T+2),…,F(N)を連結したもの、つまりF(T),F(T-1),F(T+1),F(2T),F(2T-1),F(2T+1),F(3T),F(3T-1),F(3T+1),F(4T),F(4T-1),F(4T+1),F(5T),F(5T-1),F(5T+1),F(1),…,F(T-2),F(T+2),…,F(2T-2),F(2T+2),…,F(3T-2),F(3T+2),…,F(4T-2),F(4T+2),…,F(5T-2),F(5T+2),…,F(N)を並べ替え後のサンプル列として出力する。   In the case of <A>, in the above example, the 15 samples F (T-1), F (T), F (T + 1), F (2T-1), F (2T) constituting the sample row A are used. , F (2T + 1), F (3T-1), F (3T), F (3T + 1), F (4T-1), F (4T), F (4T + 1), F (5T- 1), F (5T), and F (5T + 1) are subject to reordering by the spectral envelope reordering process of [2]. At this time, the rearrangement unit 5 includes 15 samples F (T−1), F (T), F (T + 1), F (2T−1), F (2T), F (2T + 1), F (3T-1), F (3T), F (3T + 1), F (4T-1), F (4T), F (4T + 1), F (5T-1 ), F (5T), F (5T + 1) coefficients W (T-1), W (T), W (T + 1), W (2T-1) included in the power spectrum envelope coefficient sequence , W (2T), W (2T + 1), W (3T-1), W (3T), W (3T + 1), W (4T-1), W (4T), W (4T + 1) , W (5T-1), W (5T), 15 samples F (T-1), F (T), F (T + 1), F (2T-1), F (2T), F (2T + 1), F (3T-1), F (3T), F (3T + 1), F (4T-1) , F (4T), F (4T + 1), F (5T-1), F (5T), F (5T + 1) are arranged. For example, W (T)> W (T-1)> W (T + 1)> W (2T)> W (2T-1)> W (2T + 1)> W (3T)> W (3T-1 )> W (3T + 1)> W (4T)> W (4T-1)> W (4T + 1)> W (5T)> W (5T-1)> W (5T + 1) If there are 15 samples F (T-1), F (T), F (T + 1), F (2T-1), F (2T), F (2T + 1), F (3T- 1), F (3T), F (3T + 1), F (4T-1), F (4T), F (4T + 1), F (5T-1), F (5T), F (5T + 1) is F (T), F (T-1), F (T + 1), F (2T), F (2T-1), F (2T + 1), F (3T), F (3T -1), F (3T + 1), F (4T), F (4T-1), F (4T + 1), F (5T), F (5T-1), F (5T + 1) Be changed. The reordering unit 5 then arranges the sample sequences F (T), F (T-1), F (T + 1), F (2T), F (2T-1), F (2T + 1), F (3T), F (3T-1), F (3T + 1), F (4T), F (4T-1), F (4T + 1), F (5T), F (5T-1), On the high frequency side of F (5T + 1), samples F (1),..., F (T-2), F (T +2), ..., F (2T-2), F (2T + 2), ..., F (3T-2), F (3T + 2), ..., F (4T-2), F (4T + 2 ), ..., F (5T-2), F (5T + 2), ..., F (N), that is, F (T), F (T-1), F (T + 1), F (2T), F (2T-1), F (2T + 1), F (3T), F (3T-1), F (3T + 1), F (4T), F (4T-1), F (4T + 1), F (5T), F (5T-1), F (5T + 1), F (1), ..., F (T-2), F (T + 2), ..., F ( 2T-2), F (2T + 2), ..., F (3T-2), F (3T + 2), ..., F (4T-2), F (4T + 2), ..., F (5T- 2), F (5T + 2), ..., F (N) are output as a sample sequence after sorting.

<B>の場合、例えば並べ替え前のサンプルF(1),…,F(T+1)を並べ替えず、並べ替え前のF(T+2)以降のサンプルが周期性並べ替え処理の対象であった上述の例の場合、F(1),…,F(T+1),F(2T-1),F(2T),F(2T+1),F(3T-1),F(3T),F(3T+1),F(4T-1),F(4T),F(4T+1),F(5T-1),F(5T),F(5T+1)が[2]のスペクトル包絡並べ替え処理による並べ替えの対象となる。このとき、並べ替え部5は、F(1),…,F(T+1),F(2T-1),F(2T),F(2T+1),F(3T-1),F(3T),F(3T+1),F(4T-1),F(4T),F(4T+1),F(5T-1),F(5T),F(5T+1)に対応するパワースペクトル包絡係数列に含まれる係数W(1),…,W(T+1),W(2T-1),W(2T),W(2T+1),W(3T-1),W(3T),W(3T+1),W(4T-1),W(4T),W(4T+1),W(5T-1),W(5T),W(5T+1)の大きい順の並びに一致するように、低域側からF(1),…,F(T+1),F(2T-1),F(2T),F(2T+1),F(3T-1),F(3T),F(3T+1),F(4T-1),F(4T),F(4T+1),F(5T-1),F(5T),F(5T+1)を並べる。例えば、W(1)> … > W(T+1)> W(2T)> W(2T-1)> W(2T+1)> W(3T)> W(3T-1)> W(3T+1)> W(4T)> W(4T-1)> W(4T+1)> W(5T)> W(5T-1)> W(5T+1)という大小関係があるならば、F(1),…,F(T+1),F(2T-1),F(2T),F(2T+1),F(3T-1),F(3T),F(3T+1),F(4T-1),F(4T),F(4T+1),F(5T-1),F(5T),F(5T+1)は、F(1),…,F(T+1),F(2T),F(2T-1),F(2T+1),F(3T),F(3T-1),F(3T+1),F(4T),F(4T-1),F(4T+1),F(5T),F(5T-1),F(5T+1)という並びに変更される。そして、並べ替え部5は、このサンプルの並びF(1),…,F(T+1),F(2T),F(2T-1),F(2T+1),F(3T),F(3T-1),F(3T+1),F(4T),F(4T-1),F(4T+1),F(5T),F(5T-1),F(5T+1)の高域側に、[2]の処理で並べ替えの対象とならなかったサンプルF(T+2),…,F(2T-2),F(2T+2),…,F(3T-2),F(3T+2),…,F(4T-2),F(4T+2),…,F(5T-2),F(5T+2),…,F(N)を連結したもの、つまりF(1),…,F(T+1),F(2T),F(2T-1),F(2T+1),F(3T),F(3T-1),F(3T+1),F(4T),F(4T-1),F(4T+1),F(5T),F(5T-1),F(5T+1),F(T+2),…,F(2T-2),F(2T+2),…,F(3T-2),F(3T+2),…,F(4T-2),F(4T+2),…,F(5T-2),F(5T+2),…,F(N)を並べ替え後のサンプル列として出力する。   In the case of <B>, for example, samples F (1),..., F (T + 1) before rearrangement are not rearranged, and samples after F (T + 2) before rearrangement are subjected to periodic rearrangement processing. In the case of the above example that was the target, F (1), ..., F (T + 1), F (2T-1), F (2T), F (2T + 1), F (3T-1), F (3T), F (3T + 1), F (4T-1), F (4T), F (4T + 1), F (5T-1), F (5T), F (5T + 1) are This is the target of rearrangement by the spectral envelope rearrangement process of [2]. At this time, the rearrangement unit 5 performs F (1), ..., F (T + 1), F (2T-1), F (2T), F (2T + 1), F (3T-1), F Supports (3T), F (3T + 1), F (4T-1), F (4T), F (4T + 1), F (5T-1), F (5T), F (5T + 1) The coefficients W (1), ..., W (T + 1), W (2T-1), W (2T), W (2T + 1), W (3T-1), included in the power spectrum envelope coefficient sequence W (3T), W (3T + 1), W (4T-1), W (4T), W (4T + 1), W (5T-1), W (5T), W (5T + 1) F (1), ..., F (T + 1), F (2T-1), F (2T + 1), F (2T + 1), F (3T- 1), F (3T), F (3T + 1), F (4T-1), F (4T), F (4T + 1), F (5T-1), F (5T), F (5T + Line up 1). For example, W (1)>…> W (T + 1)> W (2T)> W (2T-1)> W (2T + 1)> W (3T)> W (3T-1)> W (3T +1)> W (4T)> W (4T-1)> W (4T + 1)> W (5T)> W (5T-1)> W (5T + 1) (1), ..., F (T + 1), F (2T-1), F (2T), F (2T + 1), F (3T-1), F (3T), F (3T + 1) , F (4T-1), F (4T), F (4T + 1), F (5T-1), F (5T), F (5T + 1) are F (1), ..., F (T +1), F (2T), F (2T-1), F (2T + 1), F (3T), F (3T-1), F (3T + 1), F (4T), F (4T -1), F (4T + 1), F (5T), F (5T-1), and F (5T + 1). The reordering unit 5 then arranges this sample sequence F (1),..., F (T + 1), F (2T), F (2T-1), F (2T + 1), F (3T), F (3T-1), F (3T + 1), F (4T), F (4T-1), F (4T + 1), F (5T), F (5T-1), F (5T + 1 ), The samples F (T + 2), ..., F (2T-2), F (2T + 2), ..., F (3T) that were not sorted by the processing in [2] -2), F (3T + 2), ..., F (4T-2), F (4T + 2), ..., F (5T-2), F (5T + 2), ..., F (N) Concatenation, ie F (1), ..., F (T + 1), F (2T), F (2T-1), F (2T + 1), F (3T), F (3T-1), F (3T + 1), F (4T), F (4T-1), F (4T + 1), F (5T), F (5T-1), F (5T + 1), F (T + 2 ), ..., F (2T-2), F (2T + 2), ..., F (3T-2), F (3T + 2), ..., F (4T-2), F (4T + 2), ..., F (5T-2), F (5T + 2), ..., F (N) are output as the sorted sample string.

周期性並べ替え処理によると、パラメータqや間隔Tなどを最適化することで、大きな「指標」(サンプルの振幅など)を持つサンプルが例えば低域側に集中するようになるが、サンプルの実際の振幅値で並べ替えているわけではなく、また、間隔Tという周期性に依存した並べ替えなので、小さな「指標」を持つサンプルが低域側に入り込む可能性が否定できない。また、上述のようにサンプル群で構成されるサンプル列Aに含まれるサンプルのサンプルインデックスの大小関係は元のサンプルインデックスの大小関係と同じであるから、サンプル列Aでは、サンプル列Aに含まれるサンプルの「指標」の大きい順でサンプルが並んでいるとは限らない(換言すれば、サンプル列Aでは、サンプルの「指標」の包絡線に鋭い起伏が存在するかもしれない、ということである)。そこで、周期性並べ替え処理によって集められた大きな「指標」を持つサンプルをパワースペクトル包絡係数列に含まれる係数の大小関係に従ってさらに並べ替えることによって、サンプル列に含まれるサンプルがサンプルの「指標」の大きい順で並ぶ可能性が高まることが期待される。   According to the periodic reordering process, by optimizing the parameter q and interval T, samples with large “index” (sample amplitude, etc.) will be concentrated on the low frequency side, for example. This is not a rearrangement based on the amplitude value, and since the rearrangement relies on the periodicity of the interval T, the possibility that a sample having a small “index” enters the low frequency band cannot be denied. Further, as described above, since the magnitude relationship of the sample indexes of the samples included in the sample column A composed of the sample group is the same as the magnitude relationship of the original sample index, the sample column A is included in the sample column A. Samples are not necessarily arranged in descending order of the “index” of the sample (in other words, in sample row A, there may be a sharp undulation in the envelope of the “index” of the sample. ). Therefore, by further rearranging the samples having a large “index” collected by the periodic rearrangement processing according to the magnitude relation of the coefficients included in the power spectrum envelope coefficient sequence, the samples included in the sample sequence become the “index” of the sample. It is expected that there is a higher possibility that the items will be arranged in descending order.

〈並べ替え処理の変形例2〉
周期性並べ替え処理として、qに関する選択肢、間隔Tに関する選択肢、サンプル群に含まれるサンプルの個数に関する選択肢、サンプル群に含まれるサンプルのサンプルインデックスに関する選択肢などの組み合わせに応じて、種々の周期性並べ替え処理が考えられる。並べ替え処理の変形例2では、このように周期性並べ替え処理として複数のパターンが予め設定されている場合に、各パターンの周期性並べ替え処理を行い並べ替え後のサンプル列を得て、次いで各パターンの周期性並べ替え処理で得られたサンプル列に対してスペクトル包絡並べ替え処理を適用し、この結果の各サンプル列に対して後述の符号化部6によって求められた符号量のうち最小の符号量を与えた並べ替えを選択する。
<Modification 2 of rearrangement processing>
Depending on the combination of options related to q, options related to interval T, options related to the number of samples included in the sample group, options related to the sample index of samples included in the sample group, etc. Replacement processing can be considered. In the second modification of the rearrangement process, when a plurality of patterns are set in advance as the periodic rearrangement process, the periodic rearrangement process of each pattern is performed to obtain a sample string after the rearrangement, Next, spectrum envelope rearrangement processing is applied to the sample sequences obtained by the periodic rearrangement processing of each pattern, and among the code amounts obtained by the encoding unit 6 described later for each sample sequence of this result Select the sort that gave the smallest code amount.

ただし、これらの選択肢の全ての組み合わせは相当の数になることが予想される。これらの選択肢の全ての組み合わせについてスペクトル包絡並べ替え処理を適用すると、最終的な符号量を計算するにはかなりの処理量がかかり、効率の観点から問題となる場合があるかもしれない。このような観点から処理量を削減するために、例えば、次のような近似処理を用いることができる。つまり、並べ替え部5と後述の符号化部6との協働によって、選択肢の全ての組み合わせについて簡易で近似的な方法で符号量を推定し、例えば推定符号量が最小のものから所定の複数の候補を選択する等にて好ましいと推定される複数の周期性並べ替え処理の候補を絞り込み、絞り込まれた周期性並べ替え処理の候補(選択された候補)のそれぞれについて並べ替え後のサンプル列を得て、次いでこれらの周期性並べ替え処理で得られたサンプル列それぞれに対してスペクトル包絡並べ替え処理を適用し、この結果の各サンプル列に対して後述の符号化部6によって求められた符号量のうち最小の符号量を与えた並べ替えを選択するようにしてもよい。   However, all combinations of these options are expected to be significant. When the spectral envelope rearrangement process is applied to all combinations of these options, it takes a considerable amount of processing to calculate the final code amount, which may be a problem from the viewpoint of efficiency. In order to reduce the processing amount from such a viewpoint, for example, the following approximate processing can be used. That is, with the cooperation of the rearrangement unit 5 and the encoding unit 6 described later, the code amount is estimated by a simple and approximate method for all combinations of options. A plurality of periodic rearrangement processing candidates that are presumed to be preferable, for example, are selected, and sample strings after rearrangement for each of the selected periodic rearrangement processing candidates (selected candidates) Then, the spectral envelope rearrangement process is applied to each of the sample sequences obtained by the periodic rearrangement process, and the resultant sample sequence is obtained by the encoding unit 6 described later. You may make it select the rearrangement which gave the minimum code amount among code amounts.

〈並べ替え処理の変形例3〉
並べ替え処理の変形例3では、並べ替え部5は、フレームごとに、周期性並べ替え処理とスペクトル包絡並べ替え処理を組み合わせて実行する。具体的には、並べ替え部5は、[1]まずスペクトル包絡並べ替え処理を行い並べ替え後のサンプル列を得て、[2]次いでスペクトル包絡並べ替え処理で得られたサンプル列に対して、周期性並べ替え処理を適用する。
<Modification 3 of rearrangement processing>
In the third modification of the rearrangement process, the rearrangement unit 5 executes a combination of the periodic rearrangement process and the spectral envelope rearrangement process for each frame. Specifically, the rearrangement unit 5 [1] first performs a spectrum envelope rearrangement process to obtain a sample string after the rearrangement, and [2] next performs a sample sequence obtained by the spectrum envelope rearrangement process. Apply periodic reordering process.

この場合、周期性並べ替え処理において、並べ替えの対象となる番号jの最大値を決定付ける上限Mあるいは第1の所定の周波数を全てのフレームに共通の値とせずに、フレーム毎に異なる上限Mあるいは第1の所定の周波数を設定してもよい。この場合、フレームごとに上限Mあるいは第1の所定の周波数を指定する情報を復号側へ送ればよい。また、並べ替えの対象となる番号jの最大値を指定するのではなく、並べ替えるサンプル群の個数を指定してもよく、この場合、サンプル群の個数をフレーム毎に設定して、サンプル群の個数を指定する情報を復号側へ送ってもよい。もちろん、並べ替えるサンプル群の個数を全てのフレームに共通としてもよい。また、第2の所定の周波数fについても、全てのフレームに共通の値とせずに、フレーム毎に異なる第2の所定の周波数fを設定してもよい。この場合、フレームごとに第2の所定の周波数を指定する情報を復号側へ送ればよい。   In this case, in the periodicity rearrangement process, the upper limit M for determining the maximum value of the number j to be rearranged or the first predetermined frequency is not set to a value common to all frames, and is different for each frame. M or the first predetermined frequency may be set. In this case, information specifying the upper limit M or the first predetermined frequency for each frame may be sent to the decoding side. In addition, instead of specifying the maximum value of the number j to be rearranged, the number of sample groups to be rearranged may be specified. In this case, the number of sample groups is set for each frame, and the sample group is set. May be sent to the decoding side. Of course, the number of sample groups to be rearranged may be common to all frames. In addition, the second predetermined frequency f may be set to a different second predetermined frequency f for each frame without being a value common to all frames. In this case, information specifying the second predetermined frequency for each frame may be sent to the decoding side.

また、この場合、並べ替え部5または後述の符号化部6は、サンプル列の並べ替えを特定する補助情報、すなわち、音響信号の周期性を表す情報、または基本周波数を表す情報、または音響信号の周期性または基本周波数に対応するサンプルと音響信号の周期性または基本周波数の整数倍に対応するサンプルとの間隔Tを表す情報を出力する。例えば間隔Tをフレーム毎に決定する場合は、サンプル列の並べ替えを特定する補助情報もフレーム毎に出力されることになる。サンプル列の並べ替えを特定する補助情報は、周期性、基本周波数または間隔Tをフレーム毎に符号化して得られる。この符号化は固定長符号化であってもよいし、可変長符号化して平均符号量を削減してもよい。可変長符号化する場合は、前フレームの間隔Tと現フレームの間隔Tの差分を可変長符号化した情報を間隔Tを表す情報としもよい。同様に、前フレームの基本周波数と現フレームの基本周波数の差分を可変長符号化した情報を基本周波数を表す情報としてもよい。なお、符号化装置100内の図示しない別の手段によって基本周波数を表す情報が得られている場合は、並べ替え部5ではなく、当該別の手段によって得られた基本周波数を表す情報をサンプル列の並べ替えを特定する補助情報として用いてもよい。また、qを複数の選択肢から選択可能な場合には、qの上限値あるいは上述の上限Mを補助情報に含めてもよい。   Further, in this case, the rearrangement unit 5 or the encoding unit 6 to be described later is auxiliary information for specifying the rearrangement of the sample sequence, that is, information representing the periodicity of the acoustic signal, information representing the fundamental frequency, or acoustic signal. Information indicating the interval T between the sample corresponding to the periodicity or the fundamental frequency of and the sample corresponding to the periodicity of the acoustic signal or the integer multiple of the fundamental frequency is output. For example, when the interval T is determined for each frame, auxiliary information for specifying the rearrangement of the sample sequence is also output for each frame. The auxiliary information for specifying the rearrangement of the sample sequence is obtained by encoding the periodicity, the fundamental frequency, or the interval T for each frame. This encoding may be fixed length encoding or variable length encoding to reduce the average code amount. In the case of variable length encoding, information obtained by variable length encoding the difference between the interval T between the previous frame and the current frame may be used as information indicating the interval T. Similarly, information obtained by variable-length coding the difference between the fundamental frequency of the previous frame and the fundamental frequency of the current frame may be used as information representing the fundamental frequency. If information representing the fundamental frequency is obtained by another means (not shown) in the encoding apparatus 100, the information representing the fundamental frequency obtained by the other means, not the rearrangement unit 5, is sampled. It may be used as auxiliary information for specifying the rearrangement. When q can be selected from a plurality of options, the upper limit value of q or the above upper limit M may be included in the auxiliary information.

〈並べ替え処理の変形例4〉
並べ替え処理の変形例4では、並べ替え部5は、並べ替え処理の変形例1と並べ替え処理の変形例3を独立に行い、最終的に符号量が最小となる並べ替えを選択する。
<Modification 4 of rearrangement process>
In the fourth modification of the rearrangement process, the rearrangement unit 5 performs the first modification of the rearrangement process and the third modification of the rearrangement process independently, and finally selects the rearrangement having the smallest code amount.

〈並べ替え処理の変形例5〉
並べ替え処理の変形例5では、並べ替え部5は、並べ替え処理の変形例3と周期性並べ替え処理を独立に行い、最終的に符号量が最小となる並べ替えを選択する。
<Variation 5 of rearrangement processing>
In the rearrangement process modification 5, the rearrangement unit 5 performs the rearrangement process modification 3 and the periodic rearrangement process independently, and finally selects the rearrangement with the smallest code amount.

〈並べ替え処理の変形例6〉
並べ替え処理の変形例6では、並べ替え部5は、スペクトル包絡並べ替え処理と並べ替え処理の変形例1を独立に行い、最終的に符号量が最小となる並べ替えを選択する。
<Modification 6 of rearrangement process>
In the sixth modification of the rearrangement process, the rearrangement unit 5 performs the spectral envelope rearrangement process and the first modification of the rearrangement process independently, and finally selects the rearrangement that minimizes the code amount.

〈並べ替え処理の変形例7〉
並べ替え処理の変形例7では、並べ替え部5は、スペクトル包絡並べ替え処理と周期性並べ替え処理を独立に行い、最終的に符号量が最小となる並べ替えを選択する。
<Modification 7 of rearrangement process>
In the modification example 7 of the rearrangement process, the rearrangement unit 5 performs the spectral envelope rearrangement process and the periodic rearrangement process independently, and finally selects the rearrangement that minimizes the code amount.

〈並べ替え処理の変形例8〉
周波数領域のサンプル列F(1),…,F(N)の振幅の絶対値の和Σn=1 NF(n)やパワー(振幅の二乗和)Σn=1 N(F(n))2の大きさによって、並べ替えを行うか否かを選択することができる。例えばパワーが予め設定された閾値以上の場合(あるいは、閾値より大きい場合)に並べ替えを行い、パワーが当該閾値未満(あるいは、閾値以下)の場合に並べ替えはしない。そこで、並べ替え処理の変形例8では、並べ替え部5は、符号化装置100内の図示しない別の手段が求めた周波数領域のサンプル列の振幅の絶対値の和やパワー(振幅の二乗和)が予め定められた閾値より大きい場合はサンプル列に対する並べ替えを行って並べ替え後のサンプル列を後述の符号化部6に出力し、そうでない場合はサンプル列に対する並べ替えを行なわずに並べ替え部5に入力されたサンプル列そのものを後述の符号化部6に出力し、後述の符号化部6では並べ替え部5から出力されたサンプル列を可変長符号化する構成としてもよい。この場合、並べ替えの前後によって絶対値の和やパワーは変わらないので、符号列に対応するサンプル列が並べ替えを行ったサンプル列であるか否かを表す情報を出力する必要は無い。ただし、閾値を符号化側と復号側とで共通の値として予め設定しておくこととする。
<Variation 8 of rearrangement processing>
Sum of absolute values of amplitude of sample sequence F (1), ..., F (N) in frequency domain Σ n = 1 N F (n) and power (sum of squares of amplitude) Σ n = 1 N (F (n) ) Depending on the size of 2 , it is possible to select whether or not to perform sorting. For example, rearrangement is performed when the power is equal to or higher than a preset threshold (or larger than the threshold), and rearrangement is not performed when the power is lower than the threshold (or lower than the threshold). Therefore, in Modification Example 8 of the rearrangement process, the rearrangement unit 5 performs the sum of absolute values of amplitudes and powers (sum of squares of amplitudes) of the sample sequences in the frequency domain obtained by other means (not shown) in the encoding device 100. ) Is larger than a predetermined threshold value, the sample sequence is rearranged and the rearranged sample sequence is output to the encoding unit 6 to be described later. Otherwise, the sample sequence is not rearranged. The sample sequence itself input to the replacement unit 5 may be output to the encoding unit 6 described later, and the encoding unit 6 described later may perform variable length encoding on the sample sequence output from the rearrangement unit 5. In this case, since the sum and power of the absolute values do not change before and after the rearrangement, there is no need to output information indicating whether or not the sample sequence corresponding to the code sequence is the sample sequence that has been rearranged. However, the threshold value is set in advance as a common value on the encoding side and the decoding side.

「符号化部6」
次に、符号化部6が、並べ替え部5が出力したサンプル列を符号化し、得られた符号列を出力する(ステップS6)。符号化部6は、並べ替え部5が出力したサンプル列に含まれるサンプルの振幅の偏りに応じて可変長符号化を切り替えて符号化する。つまり、並べ替え部5によってフレーム内で低域側(あるいは高域側)に振幅の大きなサンプルが集められているので、符号化部6はその偏りに適した可変長符号化を行う。並べ替え部5が出力したサンプル列のように、局所的な領域ごとに同等か同程度の振幅を持つサンプルが集まっていると、例えば領域ごとに異なるライスパラメータでライス符号化することによって平均符号量を削減できる。以下、フレーム内で低域側(フレームの先頭に近い側)に振幅の大きなサンプルが集められている場合を例に採って説明する。
"Encoder 6"
Next, the encoding unit 6 encodes the sample sequence output from the rearrangement unit 5 and outputs the obtained code sequence (step S6). The encoding unit 6 performs encoding by switching the variable length encoding in accordance with the amplitude deviation of the samples included in the sample sequence output from the rearrangement unit 5. That is, since the rearrangement unit 5 collects samples with large amplitudes on the low frequency side (or high frequency side) in the frame, the encoding unit 6 performs variable length encoding suitable for the bias. When samples having the same or similar amplitude are collected for each local region as in the sample sequence output by the rearrangement unit 5, for example, the average code is obtained by performing the rice coding with a different rice parameter for each region. The amount can be reduced. Hereinafter, a case where samples having a large amplitude are collected on the low frequency side (side closer to the head of the frame) in the frame will be described as an example.

[符号化の具体例]
具体例として、符号化部6は、大きな振幅を持つサンプルが集まっている領域ではサンプルごとにライス符号化(ゴロム-ライス符号化ともいう)を適用する。この領域以外の領域では、符号化部6は、複数のサンプルをまとめたサンプルの集合に対する符号化にも適するエントロピー符号化(ハフマン符号化や算術符号化など)を適用する。ライス符号化の適用に関して、ライス符号化の適用領域とライスパラメータが固定されていてもよいし、あるいは、ライス符号化の適用領域とライスパラメータの組み合わせが異なる複数の選択肢の中から一つを選択できる構成であってもよい。このような複数の選択肢から一つを選択する際、ライス符号化の選択情報として、例えば下記のような可変長符号(記号""で囲まれたバイナリ値)を使うことができ、符号化部6は選択情報も出力する。
"1":ライス符号化を適用しない
"01":ライス符号化を先頭から1/32の領域にライスパラメータを1として適用する。
"001":ライス符号化を先頭から1/32の領域にライスパラメータを2として適用する。
"0001":ライス符号化を先頭から1/16の領域にライスパラメータを1として適用する。
"00001":ライス符号化を先頭から1/16の領域にライスパラメータを2として適用する。
"00000":ライス符号化を先頭から1/32の領域にライスパラメータを3として適用する。
[Specific examples of encoding]
As a specific example, the encoding unit 6 applies Rice encoding (also referred to as Golomb-Rice encoding) for each sample in a region where samples having large amplitudes are gathered. In a region other than this region, the encoding unit 6 applies entropy encoding (Huffman encoding, arithmetic encoding, etc.) suitable for encoding a set of samples obtained by collecting a plurality of samples. Regarding the application of rice coding, the application area of rice coding and the rice parameters may be fixed, or one of a plurality of options with different combinations of the application area of rice coding and the rice parameters is selected. The structure which can be used may be sufficient. When selecting one of such a plurality of options, for example, a variable length code (binary value surrounded by the symbol "") as shown below can be used as selection information for rice encoding, and the encoding unit 6 also outputs selection information.
"1": Rice coding is not applied
“01”: Rice coding is applied to the 1/32 region from the beginning with the Rice parameter set to 1.
"001": Rice coding is applied as 2 in the 1/32 region from the beginning.
“0001”: Rice coding is applied to the area 1/16 from the head with the Rice parameter set to 1.
"00001": Rice coding is applied to the area 1/16 from the beginning with the Rice parameter set to 2.
“00000”: Rice coding is applied with the Rice parameter set to 3 in the 1/32 region from the beginning.

なお、このような選択肢の中からどれを選択すればよいかを決める方法として、符号化処理で得られる各ライス符号化に対応する符号列の符号量を比較し、最も符号量が小さい選択肢を選択するという方法を採用すればよい。   As a method for deciding which of these options should be selected, the code amount of the code string corresponding to each rice encoding obtained by the encoding process is compared, and the option with the smallest code amount is selected. A method of selecting may be adopted.

また、並べ替え後のサンプル列に0の振幅を持つサンプルが長く続く領域が現れると、0の振幅を持つサンプルの連続数を例えばランレングス符号化することにより平均符号量を削減できる。このような場合、符号化部6は、(1)大きな振幅を持つサンプルが集まっている領域ではサンプルごとにライス符号化を適用し、(2)この領域以外の領域では、(a)0の振幅を持つサンプルが連続する領域では、0の振幅を持つサンプルの連続数を表す符号を出力する符号化を行い、(b)残りの領域では、複数のサンプルをまとめたサンプルの集合に対する符号化にも適するエントロピー符号化(ハフマン符号化や算術符号化など)を適用する。このような場合であっても、上述のようなライス符号化の選択を行ってもよい。また、このような場合、どの領域にランレングス符号化が適用されたかを表す情報も復号側へ伝送される必要があり、例えばこの情報は上記選択情報に含められる。さらに、エントロピー符号化に属する複数の符号化方法を選択肢として用意してある場合には、いずれの符号化を選択したかを特定するための情報も復号側へ伝送される必要があり、例えばこの情報は上記選択情報に含められる。   Further, when a region where samples having an amplitude of 0 continue for a long time appears in the sample sequence after rearrangement, the average code amount can be reduced by, for example, run-length encoding the number of consecutive samples having an amplitude of 0. In such a case, the encoding unit 6 applies (1) Rice encoding for each sample in a region where samples having a large amplitude are gathered, and (2) (a) 0 in regions other than this region. In a region where samples having amplitude are continuous, encoding is performed to output a code representing the number of consecutive samples having amplitude of 0. (b) In the remaining region, encoding is performed on a set of samples in which a plurality of samples are collected. Entropy coding (Huffman coding, arithmetic coding, etc.) is also applied. Even in such a case, the selection of the rice encoding as described above may be performed. In such a case, information indicating to which region run-length encoding has been applied needs to be transmitted to the decoding side. For example, this information is included in the selection information. Further, when a plurality of encoding methods belonging to entropy encoding are prepared as options, information for specifying which encoding is selected needs to be transmitted to the decoding side. Information is included in the selection information.

なお、サンプル列に含まれるサンプルの並べ替えによる利点が無い場合も考えられる。このような場合には並べ替え前のサンプル列を符号化すべきである。そこで、並べ替え部5からは並べ替え前のサンプル列(並べ替えを行っていないサンプル列)も出力し、符号化部6は、並べ替え前のサンプル列と並べ替え後のサンプル列をそれぞれ可変長符号化し、並べ替え前のサンプル列を可変長符号化して得られる符号列の符号量と、並べ替え後のサンプル列を領域ごとに可変長符号化を切り替えて符号化して得られる符号列の符号量とを比較し、並べ替え前のサンプル列の符号量が最小である場合には、並べ替え前のサンプル列を可変長符号化して得られた符号列を出力する。この場合は、符号列に対応するサンプル列がサンプルの並べ替えを行ったサンプル列であるか否かを表す情報も出力する。この情報として1ビットを使えば十分である。   Note that there may be a case where there is no advantage of rearranging the samples included in the sample sequence. In such a case, the sample sequence before rearrangement should be encoded. Therefore, the rearrangement unit 5 also outputs a sample string before rearrangement (a sample string that has not been rearranged), and the encoding unit 6 can change the sample string before rearrangement and the sample string after rearrangement. The code amount of the code string obtained by performing long-length coding and variable-length coding of the sample string before rearrangement, and the code string obtained by switching the sample string after rearrangement by switching variable-length coding for each region When the code amount of the sample sequence before rearrangement is the minimum, the code sequence obtained by variable-length coding the sample sequence before rearrangement is output. In this case, information indicating whether or not the sample sequence corresponding to the code sequence is a sample sequence obtained by rearranging the samples is also output. It is sufficient to use 1 bit as this information.

〈変形例1〉
本発明の実施形態で説明されたサンプル列に含まれるサンプルの並べ替えはパワースペクトル包絡が比較的大きな傾きを持つ(すなわち予測利得が大きい)場合に有効であるので、予め予測利得またはその推定値がある定められた閾値より大きい場合のみサンプル列に含まれるサンプルの並べ替えを適用することに決めておくこともできる。これは予測利得が大きいときには声帯振動や楽器の振動が強く、周期性も高い場合が多いという音声や楽音の性質を利用するものである。予測利得は原音(音声音響ディジタル信号)のエネルギーを予測残差のエネルギーで割ったものである。線形予測係数やPARCOR係数をパラメータとして使う符号化においては、量子化済みのパラメータを符号化装置と復号装置で共通に使うことができる。そこで、例えば、符号化部6は、符号化装置100内の図示しない別の手段によって求めたi次の量子化済PARCOR係数k(i)を用いて、(1-k(i)*k(i))を次数ごとに乗算したものの逆数で表わされる予測利得の推定値を計算し、計算された推定値がある定められた閾値より大きい場合は並べ替え後のサンプル列を可変長符号化して得られた符号列を出力し、そうでない場合は並べ替え前のサンプル列を可変長符号化して得られた符号列を出力する。この場合は、符号列に対応するサンプル列が並べ替えを行ったサンプル列であるか否かを表す情報を出力する必要は無い。すなわち、予測がきかない雑音的音声や無音時には効果が小さい可能性が高いので並べ替えをしないと決めておくほうが復号側へ伝送する情報の符号量や計算の無駄が少なくなる。
<Modification 1>
Since the rearrangement of the samples included in the sample sequence described in the embodiment of the present invention is effective when the power spectrum envelope has a relatively large slope (that is, the prediction gain is large), the prediction gain or its estimated value is obtained in advance. It can also be decided to apply the reordering of the samples contained in the sample sequence only if some larger than a certain threshold. This utilizes the property of voice and musical tone that vocal cord vibration and instrument vibration are strong and the periodicity is often high when the prediction gain is large. The prediction gain is obtained by dividing the energy of the original sound (speech acoustic digital signal) by the energy of the prediction residual. In encoding using a linear prediction coefficient or a PARCOR coefficient as a parameter, a quantized parameter can be used in common by an encoding device and a decoding device. Therefore, for example, the encoding unit 6 uses the i-th quantized PARCOR coefficient k (i) obtained by another means (not shown) in the encoding apparatus 100 to (1-k (i) * k ( i)) is multiplied by each order, and an estimated value of the prediction gain expressed by the reciprocal number is calculated. If the calculated estimated value is larger than a predetermined threshold, the rearranged sample sequence is variable-length encoded. The obtained code string is output, and if not, a code string obtained by variable-length coding the sample string before rearrangement is output. In this case, there is no need to output information indicating whether or not the sample sequence corresponding to the code sequence is a sample sequence that has been rearranged. That is, since it is highly possible that the effect is small when noisy speech or silence is not possible, it is less likely that the amount of code of information to be transmitted to the decoding side and the calculation will be wasted if it is decided not to rearrange.

なお、並べ替え部5において、予測利得または予測利得の推定値の計算を行い、予測利得または予測利得の推定値がある定められた閾値より大きい場合はサンプル列に対する並べ替えを行って並べ替え後のサンプル列を符号化部6に出力し、そうでない場合はサンプル列に対する並べ替えを行なわずに並べ替え部5に入力されたサンプル列そのものを符号化部6に出力し、符号化部6では並べ替え部5から出力されたサンプル列を可変長符号化する構成としてもよい。   Note that the rearrangement unit 5 calculates the prediction gain or the estimated value of the prediction gain, and performs the rearrangement on the sample string when the prediction gain or the estimated value of the prediction gain is larger than a predetermined threshold value. Is output to the encoding unit 6, otherwise, the sample sequence itself input to the rearrangement unit 5 is output to the encoding unit 6 without being rearranged with respect to the sample sequence. The sample sequence output from the rearrangement unit 5 may be variable length encoded.

なお、この構成の場合には、閾値を符号化側と復号側とで共通の値として予め設定しておくこととする。   In the case of this configuration, the threshold value is set in advance as a common value on the encoding side and the decoding side.

〈変形例2〉
変形例2では、符号化部6が、並べ替え部5が出力したサンプル列の可変長符号化に線形予測係数やパワースペクトル包絡係数列や予測利得を利用する。符号化部6は、並べ替え部5が出力したサンプル列に含まれるサンプルの振幅の偏りに応じて可変長符号化を切り替えて符号化する。この際、振幅の大きさによって適応的に符号化することによって符号長を短くすることができる。例えばライス符号を用いる場合、ライスパラメータの値を符号化する振幅によって決定し、周波数領域のサンプル列の振幅に応じて同一のライスパラメータの適用区間を最適に決めて適用区間情報として復号側へ送ってもよいし、同一のライスパラメータの適用区間を固定的に決めておき、スペクトル包絡情報や予測利得に応じて同一のライスパラメータを適用する適用区間を選択してもよい。
<Modification 2>
In the second modification, the encoding unit 6 uses a linear prediction coefficient, a power spectrum envelope coefficient sequence, and a prediction gain for variable-length encoding of the sample sequence output from the rearrangement unit 5. The encoding unit 6 performs encoding by switching the variable length encoding in accordance with the amplitude deviation of the samples included in the sample sequence output from the rearrangement unit 5. At this time, the code length can be shortened by adaptively encoding according to the magnitude of the amplitude. For example, when using a Rice code, the value of the Rice parameter is determined by the amplitude to be encoded, and the application section of the same Rice parameter is optimally determined according to the amplitude of the sample sequence in the frequency domain and sent to the decoding side as application section information. Alternatively, the application section of the same rice parameter may be fixedly determined, and the application section to which the same rice parameter is applied may be selected according to the spectrum envelope information and the prediction gain.

変形例2を具体例を示して説明する。パワースペクトル包絡係数列を大小関係が例えば大きい順になるように並べ替えた場合(低域側でパワースペクトル包絡係数列の係数が大きく、高域側でパワースペクトル包絡係数列の係数が小さい)、図8に示すように並べ替え後のパワースペクトル包絡係数列の傾斜が大きい(つまり、予測利得が大きい)ときには符号化部6は短い区間に同一のライスパラメータを用いるとし、図9に示すように並べ替え後のパワースペクトル包絡係数列の傾斜が小さい(つまり、予測利得が小さい)ときには符号化部6は長い区間で同一のライスパラメータを用いるとする。この規準の下、適用区間で用いるライスパラメータの最適値を決定すればよい(ライスパラメータの算出方法は、例えば、下記参考文献1参照)。
例えば予測利得GPを用いる場合、予め定められた閾値gと予測利得GPとの大小関係に基づいて適用区間の長短を下記のように切り替えることができる。なお、この構成の場合には、閾値を符号化側と復号側とで共通の値として予め設定しておくこととする。
GP≧gの場合:
"1":ライス符号化を適用しない
"01":ライス符号化を先頭から1/32の区間にライスパラメータを1として適用する。
"00":ライス符号化を先頭から1/32の区間にライスパラメータを2として適用する。
GP<gの場合:
"1":ライス符号化を適用しない
"01":ライス符号化を先頭から1/16の区間にライスパラメータを1として適用する。
"00":ライス符号化を先頭から1/16の区間にライスパラメータを2として適用する。
Modification 2 will be described with a specific example. When the power spectrum envelope coefficient sequence is rearranged so that the magnitude relationship is, for example, in descending order (the coefficient of the power spectrum envelope coefficient sequence is large on the low frequency side and the coefficient of the power spectrum envelope coefficient sequence is small on the high frequency side), As shown in FIG. 8, when the gradient of the rearranged power spectrum envelope coefficient sequence is large (that is, the prediction gain is large), the encoding unit 6 uses the same Rice parameter in a short section, and arranges as shown in FIG. Assume that the encoding unit 6 uses the same Rice parameter in a long section when the slope of the power spectrum envelope coefficient sequence after replacement is small (that is, the prediction gain is small). Under this criterion, the optimum value of the rice parameter used in the applicable section may be determined (see the reference document 1 below for the method of calculating the rice parameter).
For example, when the prediction gain GP is used, the length of the application section can be switched as follows based on the magnitude relationship between a predetermined threshold g and the prediction gain GP . In the case of this configuration, the threshold value is set in advance as a common value on the encoding side and the decoding side.
If G P ≧ g:
"1": Rice coding is not applied
“01”: Rice coding is applied with 1 as the Rice parameter in the 1/32 interval from the beginning.
“00”: Rice coding is applied with a Rice parameter of 2 in the 1/32 interval from the beginning.
If G P <g:
"1": Rice coding is not applied
“01”: Rice coding is applied with the Rice parameter set to 1 in the 1/16 interval from the beginning.
“00”: Rice coding is applied with a Rice parameter of 2 in the 1/16 interval from the beginning.

なお、このような選択肢の中からどれを選択すればよいかを決める方法として、符号化部6が、符号化処理で得られる各ライス符号化に対応する符号列の符号量を比較し、最も符号量が小さい選択肢を選択するという方法を採用すればよい。   As a method for determining which of these options should be selected, the encoding unit 6 compares the code amounts of the code strings corresponding to the respective rice encodings obtained by the encoding process, A method of selecting an option with a small code amount may be employed.

なお、ここで例示したライス符号化、エントロピー符号化、ランレングス符号化はいずれも周知であるからその詳細な説明を省略する(例えば参考文献1参照)。
(参考文献1)David Salomon, "Data Compression : The Complete Reference," 3rdedition, Springer-Verlag, ISBN-10: 0-387-40697-2, 2004.
Note that the Rice encoding, the entropy encoding, and the run length encoding exemplified here are all well known, and thus detailed description thereof is omitted (see, for example, Reference 1).
(Reference 1) David Salomon, "Data Compression: The Complete Reference," 3 rd edition, Springer-Verlag, ISBN-10: 0-387-40697-2, 2004.

「復号処理」
続いて図10〜図11を参照して復号処理を説明する。
復号装置200では、符号化装置100による符号化処理と逆順の処理でMDCT係数が再構成される。復号装置200には、フレームごとに、少なくとも、上記線形予測係数あるいは上記パワースペクトル包絡係数列が符号化されて得られた符号列(以下、「補助符号列」という)と、上記利得情報と、並べ替え後の(場合によっては並べ替え前の)上記サンプル列に対応する上記符号列(以下、単に「符号列」という)が入力される。並べ替え前の上記サンプル列に対応する上記符号列が復号装置200に入力される可能性がある実施形態では、サンプル列の並べ替えを行ったか否かを表す情報も復号装置200に入力される。また、符号化装置100から選択情報が出力された場合にはこの選択情報も復号装置200に入力される。また、並べ替え対象としてサンプル列に含まれるサンプルの全部または一部を選択可能な実施形態では、上記対象情報も復号装置200に入力される。このほか、符号化装置100から出力されえる既述の情報は復号装置200に入力され、必要に応じて後述の復号部11による処理や回復部12による処理などに用いられる。
"Decryption"
Next, the decoding process will be described with reference to FIGS.
In the decoding device 200, MDCT coefficients are reconstructed by processing in the reverse order to the encoding processing by the encoding device 100. The decoding apparatus 200 includes, for each frame, at least a code sequence obtained by encoding the linear prediction coefficient or the power spectrum envelope coefficient sequence (hereinafter referred to as “auxiliary code sequence”), the gain information, The code string (hereinafter simply referred to as “code string”) corresponding to the sample string after sorting (possibly before sorting) is input. In an embodiment in which the code sequence corresponding to the sample sequence before rearrangement may be input to the decoding device 200, information indicating whether or not the sample sequence has been rearranged is also input to the decoding device 200. . Further, when selection information is output from the encoding apparatus 100, this selection information is also input to the decoding apparatus 200. In the embodiment in which all or part of the samples included in the sample string can be selected as the sorting target, the target information is also input to the decoding device 200. In addition, the above-described information that can be output from the encoding device 100 is input to the decoding device 200, and is used for processing by the decoding unit 11 and processing by the recovery unit 12, which will be described later, as necessary.

「復号部11」
まず、復号部11が、フレームごとに、入力された符号列を復号して周波数領域のサンプル列を出力する(ステップS11)。選択情報が復号装置200に入力されている場合には、復号部11は、フレームごとに、入力された符号列を選択情報に応じて復号して周波数領域のサンプル列を出力する。当然であるが、符号列を得るために実行された符号化方法に対応する復号方法が実行される。復号部11による復号処理の詳細は符号化装置100の符号化部6による符号化処理の詳細に対応するので、当該符号化処理の説明をここに援用し、実行された符号化に対応する復号が復号部11の行う復号処理であることを明記し、これをもって復号処理の詳細な説明とする。なお、どのような符号化方法が実行されたかは、選択情報が復号装置200に入力されている場合には当該選択情報によって特定され、選択情報が復号装置200に入力されない実施形態であれば事前に符号化側と復号側で符号化方法とそれに対応する復号方法が定められているので、この取り決めによって特定される。選択情報に、例えば、ライス符号化の適用領域とライスパラメータを特定する情報と、ランレングス符号化の適用領域を表す情報と、エントロピー符号化の種類を特定する情報が含まれている場合には、これらの符号化方法に応じた復号方法が入力された符号列の対応する領域に適用される。ライス符号化に対応する復号処理、エントロピー符号化に対応する復号処理、ランレングス符号化に対応する復号処理はいずれも周知であるから説明を省略する(例えば上記参考文献1参照)。
"Decoding unit 11"
First, the decoding unit 11 decodes the input code string for each frame and outputs a frequency-domain sample string (step S11). When the selection information is input to the decoding device 200, the decoding unit 11 decodes the input code string according to the selection information for each frame, and outputs a frequency-domain sample string. Naturally, a decoding method corresponding to the encoding method executed to obtain the code string is executed. The details of the decoding process performed by the decoding unit 11 correspond to the details of the encoding process performed by the encoding unit 6 of the encoding device 100. Therefore, the description of the encoding process is incorporated herein and the decoding corresponding to the executed encoding is performed. Is a decoding process performed by the decoding unit 11, and this is a detailed description of the decoding process. It should be noted that what encoding method has been executed is specified by the selection information when the selection information is input to the decoding apparatus 200, and in advance if the selection information is not input to the decoding apparatus 200. The encoding method and the decoding method corresponding to the encoding method and the decoding method are determined on the encoding side and the decoding side. In the case where the selection information includes, for example, information for specifying an application region and a rice parameter for Rice coding, information indicating an application region for run-length encoding, and information for specifying the type of entropy encoding The decoding method corresponding to these encoding methods is applied to the corresponding region of the input code string. Since the decoding process corresponding to the Rice encoding, the decoding process corresponding to the entropy encoding, and the decoding process corresponding to the run length encoding are all well known, the description thereof is omitted (for example, refer to the above-mentioned Reference 1).

「回復部12」
次に、回復部12が、フレームごとに、補助符号列を復号して得られた線形予測係数を周波数領域に変換して得られるパワースペクトル包絡係数列あるいは補助符号列を復号して得られたパワースペクトル包絡係数列を参照して、復号部11が出力した周波数領域のサンプル列から元のサンプルの並びを得る(ステップS12)。ここで「元のサンプルの並び」とは、符号化装置100の並べ替え部5に入力された「周波数領域のサンプル列」に相当する。補助符号列を復号して得られた線形予測係数を周波数領域に変換してパワースペクトル包絡係数列を得る処理あるいは補助符号列を復号してパワースペクトル包絡係数列を得る処理は、回復部12が行ってもよいし、復号装置200内に在る図示しない他の手段が行ってもよい。パワースペクトル包絡係数列は、後述するステップS15の処理でも用いられるため、再計算のコストを省く観点から、復号装置200内に在る図示しない記憶部に記憶しておけばよい。上述のとおり、符号化装置100の並べ替え部5による並べ替え方法や並べ替え方法に対応する並べ替えの選択肢は種々あるが、並べ替えが実行された場合には実行された並べ替えは一つであり、その並べ替えを特定する情報はパワースペクトル包絡係数列に含まれている。よって、回復部12はパワースペクトル包絡係数列に基づいて復号部11が出力した周波数領域のサンプル列を元のサンプルの並びに戻すことができる。
"Recovery part 12"
Next, the recovery unit 12 is obtained by decoding the power spectrum envelope coefficient sequence or the auxiliary code sequence obtained by converting the linear prediction coefficient obtained by decoding the auxiliary code sequence into the frequency domain for each frame. With reference to the power spectrum envelope coefficient sequence, the original sample sequence is obtained from the frequency domain sample sequence output by the decoding unit 11 (step S12). Here, the “original sample arrangement” corresponds to a “frequency domain sample string” input to the rearrangement unit 5 of the encoding apparatus 100. The recovery unit 12 performs the process of obtaining the power spectrum envelope coefficient sequence by converting the linear prediction coefficient obtained by decoding the auxiliary code string into the frequency domain, or obtaining the power spectrum envelope coefficient sequence by decoding the auxiliary code string. Or other means (not shown) in the decoding apparatus 200 may be used. Since the power spectrum envelope coefficient sequence is also used in the process of step S15 described later, it may be stored in a storage unit (not shown) in the decoding apparatus 200 from the viewpoint of saving the recalculation cost. As described above, there are various sorting options corresponding to the sorting method and the sorting method by the sorting unit 5 of the encoding device 100, but when sorting is performed, only one sorting is performed. The information specifying the rearrangement is included in the power spectrum envelope coefficient sequence. Therefore, the recovery unit 12 can restore the sequence of the original samples to the frequency domain sample sequence output by the decoding unit 11 based on the power spectrum envelope coefficient sequence.

なお、復号装置200にサンプル列の並べ替えを行ったか否かを表す情報が入力されている場合には、回復部12は、当該情報が並べ替えを行ったことを示すものである場合は復号部11が出力した周波数領域のサンプル列を元のサンプルの並びに戻して出力し、当該情報が並べ替えを行っていないことを示すものである場合は復号部11が出力した周波数領域のサンプル列をそのまま出力する。   When information indicating whether or not the sample sequence has been rearranged is input to the decoding apparatus 200, the recovery unit 12 performs decoding if the information indicates that the rearrangement has been performed. The frequency domain sample sequence output by the unit 11 is output after being returned to the original sample, and if the information indicates that no reordering is performed, the frequency domain sample sequence output by the decoding unit 11 is output. Output as is.

また、予測利得または予測利得の推定値の大小により並べ替えを行ったか否かを判断する構成も有り得る。この構成では、回復部12は、例えば、復号装置200内の図示しない別の手段から入力されたi次の量子化済PARCOR係数k(i)を用いて、(1-k(i)*k(i))を次数ごとに乗算したものの逆数で表わされる予測利得の推定値を計算し、計算された推定値がある定められた閾値より大きい場合は復号部11が出力した周波数領域のサンプル列を元のサンプルの並びに戻して出力し、そうでない場合は復号部11が出力した周波数領域のサンプル列をそのまま出力する。   Further, there may be a configuration for determining whether or not rearrangement has been performed based on the prediction gain or the estimated value of the prediction gain. In this configuration, the recovery unit 12 uses, for example, the (1-k (i) * k) using the i-th quantized PARCOR coefficient k (i) input from another means (not shown) in the decoding device 200. (i)) is multiplied for each order to calculate an estimated value of the prediction gain represented by the reciprocal number, and when the calculated estimated value is larger than a predetermined threshold, the frequency domain sample sequence output by the decoding unit 11 Are output after arranging the original samples, and if not, the frequency-domain sample string output by the decoding unit 11 is output as it is.

また、復号部11によって得られた周波数領域のサンプル列F(1),…,F(N)の振幅の絶対値の和Σn=1 NF(n)やパワー(振幅の二乗和)Σn=1 N(F(n))2の大きさによって、並べ替えを行ったか否かを判断する構成も有り得る。この構成では、回復部12は、例えば復号装置200内の図示しない別の手段が求めた周波数領域のサンプル列F(1),…,F(N)のパワーを入力として、当該パワーがある定められた閾値以上の場合には復号部11が出力した周波数領域のサンプル列を元のサンプルの並びに戻して出力し、そうでない場合は復号部11が出力した周波数領域のサンプル列をそのまま出力する。 Also, the sum Σ n = 1 N F (n) of the absolute values of the amplitudes of the frequency domain sample sequences F (1),..., F (N) obtained by the decoding unit 11 and the power (sum of squared amplitudes) Σ Depending on the size of n = 1 N (F (n)) 2 , there may be a configuration for determining whether or not rearrangement has been performed. In this configuration, the recovery unit 12 inputs the power of the frequency domain sample sequence F (1),..., F (N) obtained by, for example, another means (not shown) in the decoding apparatus 200, and determines the power. If it is equal to or greater than the threshold value, the frequency domain sample sequence output by the decoding unit 11 is output after being returned to the original sample. Otherwise, the frequency domain sample sequence output by the decoding unit 11 is output as it is.

回復部12による回復処理の詳細は符号化装置100の並べ替え部5による並べ替え処理の詳細に対応するので、当該並べ替え処理の説明をここに援用し、その並べ替え処理の逆順の処理(逆の並べ替え)が回復部12の行う回復処理であることを明記し、これをもって回復処理の詳細な説明とする。なお、理解の一助のため、(1)復号装置200に対象情報が入力されている、(2)サンプルの並べ替えではサンプルは低域側から並べられる、(3)「パワースペクトル包絡係数列W(1),・・・,W(N)の大きい順」を規準としてサンプル列に含まれるサンプルを並べ替える、と仮定して、上述の並べ替え処理の具体例に対応する回復処理の一例を説明する。   The details of the recovery process performed by the recovery unit 12 correspond to the details of the rearrangement process performed by the rearrangement unit 5 of the encoding device 100. Therefore, the description of the rearrangement process is incorporated herein, and the reverse process of the rearrangement process ( It is specified that the reverse sorting) is the recovery process performed by the recovery unit 12, and this will be a detailed description of the recovery process. For the sake of understanding, (1) the target information is input to the decoding device 200, (2) the samples are arranged from the low frequency side in the rearrangement of samples, (3) “power spectrum envelope coefficient sequence W Assuming that (1), ..., W (N) in descending order are to be used as a criterion, the samples included in the sample sequence are rearranged, and an example of the recovery process corresponding to the above-described specific example of the rearrangement process explain.

まず、補助符号列に基づいて16個の係数W(1),・・・,W(16)を持つパワースペクトル包絡係数列が得られる。対象情報が、サンプル列に含まれるサンプルの全部が並べ替え対象であることを示す場合、パワースペクトル包絡係数列W(1), W(2), W(3), W(4), W(5), W(6), W(7), W(8), W(9), W(10), W(11), W(12), W(13), W(14), W(15), W(16)を大きい順に並べることで次の係数列Γを得る。
---
W(1), W(5), W(3), W(2), W(6), W(4), W(8), W(9), W(7), W(10), W(11), W(12), W(13), W(15), W(14), W(16)
---
この係数列Γの係数が、復号部11が出力した16個のサンプルを持つ周波数領域のサンプル列のサンプルに低域側から1対1で対応している。従って、回復部12は、係数列Γに含まれる係数の元の並びであるパワースペクトル包絡係数列W(1), W(2), W(3), W(4), W(5), W(6), W(7), W(8), W(9), W(10), W(11), W(12), W(13), W(14), W(15), W(16)に一致するように、係数列Γに対応するサンプル列に含まれる16個のサンプルを並べる。この結果、「元のサンプルの並び」であるサンプル列F(1), F(2), F(3), F(4), F(5), F(6), F(7), F(8), F(9), F(10), F(11), F(12), F(13), F(14), F(15), F(16)が得られる。
対象情報が、サンプル列に含まれるサンプルの一部が並べ替え対象であることを示し、例えばサンプル数kとしてk=4を指定している場合、パワースペクトル包絡係数列W(1), W(2), W(3), W(4), W(5), W(6), W(7), W(8), W(9), W(10), W(11), W(12), W(13), W(14), W(15), W(16)の中から大きい順で選択されたk個の係数の大きい順の並びとして次の係数列を得る。
---
W(1), W(5), W(3), W(2)
---
さらに、選択されなかった係数W(4), W(6), W(7), W(8), W(9), W(10), W(11), W(12), W(13), W(14), W(15), W(16)は元の並びを維持してk個のサンプルの並びW(1), W(5), W(3), W(2)の後に(つまり、高域側に)連結されるため、結果として、係数列Ξを得る。
---
W(1), W(5), W(3), W(2), W(4), W(6), W(7), W(8), W(9), W(10), W(11), W(12), W(13), W(14), W(15), W(16)
---
この係数列Ξの係数が、復号部11が出力した16個のサンプルを持つ周波数領域のサンプル列のサンプルに低域側から1対1で対応している。従って、回復部12は、係数列Ξに含まれる係数の元の並びであるパワースペクトル包絡係数列W(1), W(2), W(3), W(4), W(5), W(6), W(7), W(8), W(9), W(10), W(11), W(12), W(13), W(14), W(15), W(16)に一致するように、係数列Ξに対応するサンプル列に含まれる16個のサンプルを並べる。この結果、「元のサンプルの並び」であるサンプル列F(1), F(2), F(3), F(4), F(5), F(6), F(7), F(8), F(9), F(10), F(11), F(12), F(13), F(14), F(15), F(16)が得られる。
First, a power spectrum envelope coefficient sequence having 16 coefficients W (1),..., W (16) is obtained based on the auxiliary code string. When the target information indicates that all the samples included in the sample sequence are to be rearranged, the power spectrum envelope coefficient sequence W (1), W (2), W (3), W (4), W ( 5), W (6), W (7), W (8), W (9), W (10), W (11), W (12), W (13), W (14), W ( 15), W (16) are arranged in descending order to obtain the next coefficient sequence Γ.
---
W (1), W (5), W (3), W (2), W (6), W (4), W (8), W (9), W (7), W (10), W (11), W (12), W (13), W (15), W (14), W (16)
---
The coefficients in the coefficient sequence Γ correspond to the samples in the frequency domain sample sequence having 16 samples output from the decoding unit 11 on a one-to-one basis from the low frequency side. Therefore, the recovery unit 12 uses the power spectrum envelope coefficient sequence W (1), W (2), W (3), W (4), W (5), W (1), which is the original sequence of the coefficients included in the coefficient sequence Γ. W (6), W (7), W (8), W (9), W (10), W (11), W (12), W (13), W (14), W (15), The 16 samples included in the sample sequence corresponding to the coefficient sequence Γ are arranged so as to match W (16). As a result, the sample sequence F (1), F (2), F (3), F (4), F (5), F (6), F (7), F (8), F (9), F (10), F (11), F (12), F (13), F (14), F (15), F (16) are obtained.
The target information indicates that a part of the samples included in the sample sequence is to be rearranged.For example, when k = 4 is specified as the number of samples k, the power spectrum envelope coefficient sequence W (1), W ( 2), W (3), W (4), W (5), W (6), W (7), W (8), W (9), W (10), W (11), W ( 12), W (13), W (14), W (15), W (16) The next coefficient sequence is obtained as a sequence in the order of k coefficients selected in descending order.
---
W (1), W (5), W (3), W (2)
---
In addition, the unselected coefficients W (4), W (6), W (7), W (8), W (9), W (10), W (11), W (12), W (13 ), W (14), W (15), and W (16) maintain the original sequence, and the sequence of k samples W (1), W (5), W (3), and W (2) Since it is connected later (that is, on the high frequency side), a coefficient sequence Ξ is obtained as a result.
---
W (1), W (5), W (3), W (2), W (4), W (6), W (7), W (8), W (9), W (10), W (11), W (12), W (13), W (14), W (15), W (16)
---
The coefficients of the coefficient sequence Ξ correspond to the samples in the frequency domain sample sequence having 16 samples output from the decoding unit 11 on a one-to-one basis from the low frequency side. Therefore, the recovery unit 12 uses the power spectrum envelope coefficient sequence W (1), W (2), W (3), W (4), W (5), W (1), which is the original sequence of the coefficients included in the coefficient sequence Ξ. W (6), W (7), W (8), W (9), W (10), W (11), W (12), W (13), W (14), W (15), The 16 samples included in the sample sequence corresponding to the coefficient sequence Ξ are arranged so as to match W (16). As a result, the sample sequence F (1), F (2), F (3), F (4), F (5), F (6), F (7), F (8), F (9), F (10), F (11), F (12), F (13), F (14), F (15), F (16) are obtained.

なお、並べ替え処理の変形例3,4,5,7では、周期性並べ替え処理によって得られたサンプル列が符号化されたものが復号装置200の入力となる。このような場合には、回復部12は、周期性並べ替え処理に対応する回復処理を行う。例えば、並べ替え部5がサンプル群を低域側に集めてF(T-1),F(T),F(T+1),F(2T-1),F(2T),F(2T+1),F(3T-1),F(3T),F(3T+1),F(4T-1),F(4T),F(4T+1),F(5T-1),F(5T),F(5T+1),F(1),…,F(T-2),F(T+2),…,F(2T-2),F(2T+2),…,F(3T-2),F(3T+2),…,F(4T-2),F(4T+2),…,F(5T-2),F(5T+2),…F(jmax)を出力した上述の例であると、回復部12には復号部11が出力した周波数領域のサンプル列F(T-1),F(T),F(T+1),F(2T-1),F(2T),F(2T+1),F(3T-1),F(3T),F(3T+1),F(4T-1),F(4T),F(4T+1),F(5T-1),F(5T),F(5T+1),F(1),…,F(T-2),F(T+2),…,F(2T-2),F(2T+2),…,F(3T-2),F(3T+2),…,F(4T-2),F(4T+2),…,F(5T-2),F(5T+2),…F(jmax)が入力される。そして、補助情報には、音響信号の周期性を表わす情報、音響信号の基本周波数を表す情報、音響信号の周期性または基本周波数に対応するサンプルと音響信号の周期性または基本周波数の整数倍に対応するサンプルとの間隔を表す情報など(具体的には、例えば、間隔Tに関する情報や、nが1以上5以下の各整数であることを表す情報や、サンプル群には3サンプルが含まれることを特定する情報など)が含められている。従って、回復部12は、この補助情報に基づいて、入力されたサンプル列F(T-1),F(T),F(T+1),F(2T-1),F(2T),F(2T+1),F(3T-1),F(3T),F(3T+1),F(4T-1),F(4T),F(4T+1),F(5T-1),F(5T),F(5T+1),F(1),…,F(T-2),F(T+2),…,F(2T-2),F(2T+2),…,F(3T-2),F(3T+2),…,F(4T-2),F(4T+2),…,F(5T-2),F(5T+2),…F(jmax)を元のサンプルの並びF(j)(1≦j≦jmax)に戻すことができる。なお、例えば並べ替え処理の変形例3のように、周期性並べ替え処理に対応する回復処理で得られたサンプル列が、スペクトル包絡並べ替え処理で得られたサンプル列に対応している場合には、回復部12は、周期性並べ替え処理に対応する回復処理で得られたサンプル列に対して、さらにスペクトル包絡並べ替え処理に対応する回復処理を実行する。   Note that, in the modification examples 3, 4, 5, and 7 of the rearrangement process, an encoded sample sequence obtained by the periodic rearrangement process is input to the decoding apparatus 200. In such a case, the recovery unit 12 performs a recovery process corresponding to the periodicity rearrangement process. For example, the rearrangement unit 5 collects the sample group on the low frequency side and F (T-1), F (T), F (T + 1), F (2T-1), F (2T), F (2T +1), F (3T-1), F (3T), F (3T + 1), F (4T-1), F (4T), F (4T + 1), F (5T-1), F (5T), F (5T + 1), F (1), ..., F (T-2), F (T + 2), ..., F (2T-2), F (2T + 2), ..., F (3T-2), F (3T + 2), ..., F (4T-2), F (4T + 2), ..., F (5T-2), F (5T + 2), ... F (jmax In the above-described example in which the recovery unit 12 outputs the frequency domain sample sequences F (T−1), F (T), F (T + 1), and F (2T− 1), F (2T), F (2T + 1), F (3T-1), F (3T), F (3T + 1), F (4T-1), F (4T), F (4T + 1), F (5T-1), F (5T), F (5T + 1), F (1), ..., F (T-2), F (T + 2), ..., F (2T-2 ), F (2T + 2), ..., F (3T-2), F (3T + 2), ..., F (4T-2), F (4T + 2), ..., F (5T-2), F (5T + 2), ... F (jmax) is input. The auxiliary information includes information representing the periodicity of the acoustic signal, information representing the fundamental frequency of the acoustic signal, periodicity of the acoustic signal or a sample corresponding to the periodicity or fundamental frequency of the acoustic signal and an integer multiple of the periodicity of the acoustic signal or the fundamental frequency. Information indicating the interval with the corresponding sample (specifically, for example, information regarding the interval T, information indicating that n is an integer between 1 and 5, and the sample group includes 3 samples) For example). Therefore, based on this auxiliary information, the recovery unit 12 inputs the sample sequences F (T-1), F (T), F (T + 1), F (2T-1), F (2T), F (2T + 1), F (3T-1), F (3T), F (3T + 1), F (4T-1), F (4T), F (4T + 1), F (5T-1 ), F (5T), F (5T + 1), F (1), ..., F (T-2), F (T + 2), ..., F (2T-2), F (2T + 2) , ..., F (3T-2), F (3T + 2), ..., F (4T-2), F (4T + 2), ..., F (5T-2), F (5T + 2), ... F (jmax) can be returned to the original sample sequence F (j) (1 ≦ j ≦ jmax). In addition, when the sample sequence obtained by the recovery process corresponding to the periodicity rearrangement process corresponds to the sample sequence obtained by the spectrum envelope rearrangement process, for example, as in Modification 3 of the rearrangement process The recovery unit 12 further executes a recovery process corresponding to the spectral envelope rearrangement process on the sample sequence obtained by the recovery process corresponding to the periodicity rearrangement process.

「逆量子化部13」
次に、逆量子化部13が、フレームごとに、回復部12が出力した元のサンプルの並びを逆量子化する(ステップS13)。上述の例に対応させて述べれば、逆量子化によって、符号化装置100の量子化部4に入力された「利得で正規化された重み付け正規化MDCT係数列」が得られる。
"Inverse quantization unit 13"
Next, the inverse quantization unit 13 inversely quantizes the original sample sequence output by the recovery unit 12 for each frame (step S13). If described in correspondence with the above example, the “weighted normalized MDCT coefficient sequence normalized by gain” input to the quantization unit 4 of the encoding apparatus 100 is obtained by inverse quantization.

「利得乗算部14」
次に、利得乗算部14が、フレームごとに、逆量子化部13が出力した「利得で正規化された重み付け正規化MDCT係数列」の各係数に、上記利得情報で特定される利得を乗じて、「正規化された重み付け正規化MDCT係数列」を得る(ステップS14)。
Gain multiplier 14”
Next, the gain multiplication unit 14 multiplies each coefficient of the “weighted normalized MDCT coefficient sequence normalized by gain” output from the inverse quantization unit 13 for each frame by the gain specified by the gain information. Thus, a “normalized weighted normalized MDCT coefficient sequence” is obtained (step S14).

「重み付け包絡逆正規化部15」
次に、重み付け包絡逆正規化部15が、フレームごとに、利得乗算部14が出力した「正規化された重み付け正規化MDCT係数列」の各係数に、パワースペクトル包絡係数列から得られる補正係数を適用することで「MDCT係数列」を得る(ステップS15)。符号化装置100で実行された重み付け包絡正規化処理の例に対応させて具体例を説明すると、重み付け包絡逆正規化部15は、利得乗算部14が出力した「正規化された重み付け正規化MDCT係数列」の各係数に、当該各係数に対応するパワースペクトル包絡係数列の各係数のβ乗(0<β<1)の値W(1)β,・・・,W(N)βを乗算することによって、MDCT係数列の各係数X(1),・・・,X(N)を得る。
“Weighting envelope inverse normalization unit 15”
Next, the correction coefficient obtained from the power spectrum envelope coefficient sequence is added to each coefficient of the “normalized weighted normalized MDCT coefficient sequence” output from the gain multiplication unit 14 for each frame by the weighted envelope denormalization unit 15. Is applied to obtain an “MDCT coefficient sequence” (step S15). A specific example will be described in association with an example of the weighted envelope normalization process executed by the encoding apparatus 100. The weighted envelope denormalization unit 15 outputs “normalized weighted normalization MDCT output from the gain multiplication unit 14”. For each coefficient in the “coefficient sequence”, values W (1) β ,..., W (N) β of β coefficients (0 <β <1) of the coefficients of the power spectrum envelope coefficient sequence corresponding to the coefficients By multiplying, each coefficient X (1),..., X (N) of the MDCT coefficient sequence is obtained.

「時間領域変換部16」
次に、時間領域変換部16が、フレームごとに、重み付け包絡逆正規化部15が出力した「MDCT係数列」を時間領域に変換してフレーム単位の音声音響ディジタル信号を得る(ステップS16)。
"Time domain conversion unit 16"
Next, the time domain conversion unit 16 converts the “MDCT coefficient sequence” output from the weighted envelope inverse normalization unit 15 into the time domain for each frame to obtain a frame-based audio-acoustic digital signal (step S16).

ステップS13,S14,S16の各処理は従来的処理であるから詳細な説明を省略したが、例えば、上記各非特許文献や参考文献2などに詳しい。
(参考文献2)守谷健弘著、「音声符号化」、社団法人電子情報通信学会、1998.
Since each process of steps S13, S14, and S16 is a conventional process, detailed description thereof is omitted.
(Reference 2) Takehiro Moriya, "Speech coding", The Institute of Electronics, Information and Communication Engineers, 1998.

実施形態から明らかなように、パワースペクトル包絡の形状を参考にサンプル列を並べ替えたものを符号化することによって、効率の高い符号化ができる(すなわち平均符号長を小さくできる)。また、サンプル列の並べ替えによって局所領域ごとに同等か同程度の指標を有するサンプルが集中するので、可変長符号化の効率化だけでなく、量子化歪の軽減や符号量の削減が可能となっている。   As is clear from the embodiment, by encoding the sample sequence rearranged with reference to the shape of the power spectrum envelope, highly efficient encoding can be performed (that is, the average code length can be reduced). In addition, samples with the same or similar index are concentrated for each local region by rearranging the sample sequence, so that not only the efficiency of variable-length coding but also the reduction of quantization distortion and the amount of codes can be achieved. It has become.

<符号化装置/復号装置のハードウェア構成例>
上述の実施形態に関わる符号化装置/復号装置は、キーボードなどが接続可能な入力部、液晶ディスプレイなどが接続可能な出力部、CPU(Central Processing Unit)〔キャッシュメモリなどを備えていてもよい。〕、メモリであるRAM(Random Access Memory)やROM(Read Only Memory)と、ハードディスクである外部記憶装置、並びにこれらの入力部、出力部、CPU、RAM、ROM、外部記憶装置間のデータのやり取りが可能なように接続するバスなどを備えている。また必要に応じて、符号化装置/復号装置に、CD−ROMなどの記憶媒体を読み書きできる装置(ドライブ)などを設けるとしてもよい。
<Hardware Configuration Example of Encoding Device / Decoding Device>
The encoding device / decoding device according to the above-described embodiment may include an input unit to which a keyboard or the like can be connected, an output unit to which a liquid crystal display or the like can be connected, a CPU (Central Processing Unit) [cache memory, or the like. ] RAM (Random Access Memory) or ROM (Read Only Memory) and external storage device as a hard disk, and data exchange between these input unit, output unit, CPU, RAM, ROM, and external storage device It has a bus that can be connected. If necessary, the encoding / decoding device may be provided with a device (drive) that can read and write a storage medium such as a CD-ROM.

符号化装置/復号装置の外部記憶装置には、符号化/復号を実行するためのプログラム並びにこのプログラムの処理において必要となるデータなどが記憶されている〔外部記憶装置に限らず、例えばプログラムを読み出し専用記憶装置であるROMに記憶させておくなどでもよい。〕。また、これらのプログラムの処理によって得られるデータなどは、RAMや外部記憶装置などに適宜に記憶される。以下、データやその格納領域のアドレスなどを記憶する記憶装置を単に「記憶部」と呼ぶことにする。   The external storage device of the encoding device / decoding device stores a program for executing encoding / decoding and data necessary for processing of this program [not limited to the external storage device, for example, a program It may be stored in a ROM which is a read-only storage device. ]. Data obtained by the processing of these programs is appropriately stored in a RAM or an external storage device. Hereinafter, a storage device that stores data, addresses of storage areas, and the like is simply referred to as a “storage unit”.

符号化装置の記憶部には、音声音響信号に由来する周波数領域のサンプル列の並べ替えを行うためのプログラム、並べ替えで得られたサンプル列の符号化のためのプログラムなどが記憶されている。   The storage unit of the encoding device stores a program for rearranging the frequency domain sample sequences derived from the audio-acoustic signal, a program for encoding the sample sequences obtained by the rearrangement, and the like. .

復号装置の記憶部には、入力された符号列を復号するためのプログラム、復号で得られたサンプル列を符号化装置で並べ替えが行われる前のサンプル列に回復するためのプログラムなどが記憶されている。   The storage unit of the decoding device stores a program for decoding the input code sequence, a program for restoring the sample sequence obtained by decoding to a sample sequence before being rearranged by the encoding device, and the like. Has been.

符号化装置では、記憶部に記憶された各プログラムとこの各プログラムの処理に必要なデータが必要に応じてRAMに読み込まれて、CPUで解釈実行・処理される。この結果、CPUが所定の機能(並べ替え部、符号化部)を実現することで符号化が実現される。   In the encoding apparatus, each program stored in the storage unit and data necessary for processing each program are read into the RAM as necessary, and are interpreted and executed by the CPU. As a result, the encoding is realized by the CPU realizing a predetermined function (sorting unit, encoding unit).

復号装置では、記憶部に記憶された各プログラムとこの各プログラムの処理に必要なデータが必要に応じてRAMに読み込まれて、CPUで解釈実行・処理される。この結果、CPUが所定の機能(復号部、回復部)を実現することで符号化が実現される。   In the decoding device, each program stored in the storage unit and data necessary for processing each program are read into the RAM as necessary, and are interpreted and executed by the CPU. As a result, the encoding is realized by the CPU realizing a predetermined function (decoding unit, recovery unit).

<補記>
本発明は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記実施形態において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。
<Supplementary note>
The present invention is not limited to the above-described embodiment, and can be appropriately changed without departing from the spirit of the present invention. In addition, the processing described in the above embodiment may be executed not only in time series according to the order of description but also in parallel or individually as required by the processing capability of the apparatus that executes the processing. .

また、上記実施形態において説明したハードウェアエンティティ(符号化装置/復号装置)における処理機能をコンピュータによって実現する場合、ハードウェアエンティティが有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記ハードウェアエンティティにおける処理機能がコンピュータ上で実現される。   When the processing functions in the hardware entity (encoding device / decoding device) described in the above embodiment are realized by a computer, the processing contents of the functions that the hardware entity should have are described by a program. Then, by executing this program on a computer, the processing functions in the hardware entity are realized on the computer.

この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。   The program describing the processing contents can be recorded on a computer-readable recording medium. As the computer-readable recording medium, for example, any recording medium such as a magnetic recording device, an optical disk, a magneto-optical recording medium, and a semiconductor memory may be used. Specifically, for example, as a magnetic recording device, a hard disk device, a flexible disk, a magnetic tape or the like, and as an optical disk, a DVD (Digital Versatile Disc), a DVD-RAM (Random Access Memory), a CD-ROM (Compact Disc Read Only). Memory), CD-R (Recordable) / RW (ReWritable), etc., magneto-optical recording medium, MO (Magneto-Optical disc), etc., semiconductor memory, EEP-ROM (Electronically Erasable and Programmable-Read Only Memory), etc. Can be used.

また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。   The program is distributed by selling, transferring, or lending a portable recording medium such as a DVD or CD-ROM in which the program is recorded. Furthermore, the program may be distributed by storing the program in a storage device of the server computer and transferring the program from the server computer to another computer via a network.

このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。   A computer that executes such a program first stores, for example, a program recorded on a portable recording medium or a program transferred from a server computer in its own storage device. When executing the process, the computer reads a program stored in its own recording medium and executes a process according to the read program. As another execution form of the program, the computer may directly read the program from a portable recording medium and execute processing according to the program, and the program is transferred from the server computer to the computer. Each time, the processing according to the received program may be executed sequentially. Also, the program is not transferred from the server computer to the computer, and the above-described processing is executed by a so-called ASP (Application Service Provider) type service that realizes the processing function only by the execution instruction and result acquisition. It is good. Note that the program in this embodiment includes information that is used for processing by an electronic computer and that conforms to the program (data that is not a direct command to the computer but has a property that defines the processing of the computer).

また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、ハードウェアエンティティを構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。   In this embodiment, a hardware entity is configured by executing a predetermined program on a computer. However, at least a part of these processing contents may be realized by hardware.

Claims (28)

所定の時間区間の音響信号に由来する周波数領域のサンプル列の符号化方法であって、
(1)上記サンプル列の全てのサンプルが含まれ、かつ、
(2)上記サンプル列のうちの上記音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記サンプル列のうちの上記音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるように上記サンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、
を並べ替え後のサンプル列(以下、暫定サンプル列という)とし、
(3)上記暫定サンプル列の全てのサンプルが含まれ、かつ、
(4)上記暫定サンプル列に含まれる少なくとも一部のサンプルを、上記音響信号の線形予測係数に基づくパワースペクトル包絡係数列のうちの当該サンプルに対応する値の絶対値が大きい順または小さい順に並べ替えたもの、
を並べ替え後のサンプル列として出力する並べ替えステップと、
上記並べ替えステップで得られたサンプル列を符号化する符号化ステップと
を有する符号化方法。
A coding method of a frequency domain sample sequence derived from an acoustic signal of a predetermined time interval,
(1) all samples in the sample sequence are included, and
(2) One or a plurality of consecutive samples including samples corresponding to the periodicity or fundamental frequency of the acoustic signal in the sample train, and the periodicity or fundamental frequency of the acoustic signal in the sample train A sample in which at least some of the samples included in the sample sequence are rearranged so that all or some of one or a plurality of consecutive samples including samples corresponding to an integer multiple are collected;
As a sample column after sorting (hereinafter referred to as a provisional sample column)
(3) all samples in the provisional sample row are included, and
(4) Arrange at least a part of the samples included in the provisional sample sequence in descending order of the absolute value of the value corresponding to the sample in the power spectrum envelope coefficient sequence based on the linear prediction coefficient of the acoustic signal. Changed
Sorting step to output as a sample column after sorting,
And a coding step for coding the sample sequence obtained in the rearrangement step.
所定の時間区間の音響信号に由来する周波数領域のサンプル列の符号化方法であって、A coding method of a frequency domain sample sequence derived from an acoustic signal of a predetermined time interval,
(1)上記サンプル列の全てのサンプルが含まれ、かつ、(1) all samples in the sample sequence are included, and
(2)上記サンプル列に含まれる少なくとも一部のサンプルを、上記音響信号の線形予測係数に基づくパワースペクトル包絡係数列のうちの当該サンプルに対応する値の絶対値が大きい順または小さい順に並べ替えたもの、(2) Reorder at least some of the samples included in the sample sequence in descending order of the absolute value of the value corresponding to the sample in the power spectrum envelope coefficient sequence based on the linear prediction coefficient of the acoustic signal. Food,
を並べ替え後のサンプル列(以下、暫定サンプル列という)とし、As a sample column after sorting (hereinafter referred to as a provisional sample column)
(3)上記暫定サンプル列の全てのサンプルが含まれ、かつ、(3) all samples in the provisional sample row are included, and
(4)上記暫定サンプル列のうちの上記音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記暫定サンプル列のうちの上記音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるように上記暫定サンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、(4) One or a plurality of consecutive samples including samples corresponding to the periodicity or fundamental frequency of the acoustic signal in the provisional sample string, and the periodicity or fundamental of the acoustic signal in the provisional sample string A sample obtained by rearranging at least some of the samples included in the provisional sample sequence so that all or some of one or a plurality of consecutive samples including samples corresponding to an integer multiple of the frequency are collected;
を並べ替え後のサンプル列として出力する並べ替えステップと、Sorting step to output as a sample column after sorting,
上記並べ替えステップで得られたサンプル列を符号化する符号化ステップとAn encoding step for encoding the sample sequence obtained in the rearrangement step;
を有する符号化方法。An encoding method comprising:
所定の時間区間の音響信号に由来する周波数領域のサンプル列の符号化方法であって、
(1)上記サンプル列の全てのサンプルが含まれ、かつ、
(2)上記サンプル列に含まれる少なくとも一部のサンプルを、上記音響信号の線形予測係数に基づくパワースペクトル包絡係数列のうちの当該サンプルに対応する値の絶対値が大きい順または小さい順に並べ替えたもの、
を並べ替え後のサンプル列(以下、第1サンプル列という)として出力し、
(3)上記サンプル列の全てのサンプルが含まれ、かつ、
(4)上記サンプル列のうちの上記音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記サンプル列のうちの上記音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるように上記サンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、
を並べ替え後のサンプル列(以下、第2サンプル列という)として出力する並べ替えステップと、
上記第1サンプル列及び上記第2サンプル列をそれぞれ符号化して符号列を得て、得られた符号列のうち符号量が最小の符号列を出力する符号化ステップと
を有する符号化方法。
A coding method of a frequency domain sample sequence derived from an acoustic signal of a predetermined time interval,
(1) all samples in the sample sequence are included, and
(2) Reorder at least some of the samples included in the sample sequence in descending order of the absolute value of the value corresponding to the sample in the power spectrum envelope coefficient sequence based on the linear prediction coefficient of the acoustic signal. Food,
Is output as a sample column after sorting (hereinafter referred to as the first sample column),
(3) all samples in the sample sequence are included, and
(4) One or a plurality of consecutive samples including samples corresponding to the periodicity or fundamental frequency of the acoustic signal in the sample train, and the periodicity or fundamental frequency of the acoustic signal in the sample train A sample in which at least some of the samples included in the sample sequence are rearranged so that all or some of one or a plurality of consecutive samples including samples corresponding to an integer multiple are collected;
A sorting step for outputting as a sample string after sorting (hereinafter referred to as a second sample string);
An encoding method comprising: an encoding step of encoding the first sample sequence and the second sample sequence to obtain a code sequence, and outputting a code sequence having a minimum code amount among the obtained code sequences.
請求項1から請求項3のいずれかに記載の符号化方法であって、
上記所定の時間区間の音響信号に対応する予測利得またはその推定値が予め定められた閾値以上である場合に、上記並べ替えステップが実行され、
上記並べ替えステップが実行されない場合には、符号化ステップでは上記音響信号に由来する周波数領域の上記サンプル列が符号化される
ことを特徴とする符号化方法。
The encoding method according to any one of claims 1 to 3, comprising:
When the prediction gain corresponding to the acoustic signal of the predetermined time interval or the estimated value thereof is equal to or greater than a predetermined threshold, the rearrangement step is executed,
When the rearrangement step is not executed, the encoding step encodes the sample sequence in the frequency domain derived from the acoustic signal in the encoding step.
請求項1から請求項3のいずれかに記載の符号化方法であって、
上記音響信号に由来する周波数領域の上記サンプル列に含まれるサンプルの絶対値和またはパワーが予め定められた閾値以上である場合に、上記並べ替えステップが実行され、
上記並べ替えステップが実行されない場合には、符号化ステップでは上記音響信号に由来する周波数領域の上記サンプル列が符号化される
ことを特徴とする符号化方法。
The encoding method according to any one of claims 1 to 3, comprising:
When the absolute value sum or power of the samples included in the sample sequence in the frequency domain derived from the acoustic signal is equal to or greater than a predetermined threshold, the rearrangement step is executed.
When the rearrangement step is not executed, the encoding step encodes the sample sequence in the frequency domain derived from the acoustic signal in the encoding step.
所定の時間区間の音響信号に由来する周波数領域のサンプル列の符号化方法であって、A coding method of a frequency domain sample sequence derived from an acoustic signal of a predetermined time interval,
上記所定の時間区間の音響信号に対応する予測利得またはその推定値が予め定められた閾値以上である場合に実行される、It is executed when the prediction gain corresponding to the acoustic signal in the predetermined time section or its estimated value is equal to or greater than a predetermined threshold value.
(1)上記サンプル列の全てのサンプルが含まれ、かつ、(1) all samples in the sample sequence are included, and
(2)上記サンプル列に含まれる少なくとも一部のサンプルを、上記音響信号の線形予測係数に基づくパワースペクトル包絡係数列のうちの当該サンプルに対応する値の絶対値が大きい順または小さい順に並べ替えたもの、(2) Reorder at least some of the samples included in the sample sequence in descending order of the absolute value of the value corresponding to the sample in the power spectrum envelope coefficient sequence based on the linear prediction coefficient of the acoustic signal. Food,
を並べ替え後のサンプル列として出力する並べ替えステップと、Sorting step to output as a sample column after sorting,
上記並べ替えステップが実行された場合には、上記並べ替えステップで得られたサンプル列を符号化し、上記並べ替えステップが実行されなかった場合には、上記音響信号に由来する周波数領域の上記サンプル列を符号化する符号化ステップとIf the rearrangement step is executed, the sample sequence obtained in the rearrangement step is encoded. If the rearrangement step is not executed, the sample in the frequency domain derived from the acoustic signal is encoded. An encoding step for encoding the sequence;
を有することを特徴とする符号化方法。An encoding method characterized by comprising:
所定の時間区間の音響信号に由来する周波数領域のサンプル列の符号化方法であって、A coding method of a frequency domain sample sequence derived from an acoustic signal of a predetermined time interval,
上記音響信号に由来する周波数領域の上記サンプル列に含まれるサンプルの絶対値和またはパワーが予め定められた閾値以上である場合に実行される、It is executed when the absolute value sum or power of samples included in the sample sequence in the frequency domain derived from the acoustic signal is equal to or greater than a predetermined threshold value.
(1)上記サンプル列の全てのサンプルが含まれ、かつ、(1) all samples in the sample sequence are included, and
(2)上記サンプル列に含まれる少なくとも一部のサンプルを、上記音響信号の線形予測係数に基づくパワースペクトル包絡係数列のうちの当該サンプルに対応する値の絶対値が大きい順または小さい順に並べ替えたもの、(2) Reorder at least some of the samples included in the sample sequence in descending order of the absolute value of the value corresponding to the sample in the power spectrum envelope coefficient sequence based on the linear prediction coefficient of the acoustic signal. Food,
を並べ替え後のサンプル列として出力する並べ替えステップと、Sorting step to output as a sample column after sorting,
上記並べ替えステップが実行された場合には、上記並べ替えステップで得られたサンプル列を符号化し、上記並べ替えステップが実行されなかった場合には、上記音響信号に由来する周波数領域の上記サンプル列を符号化する符号化ステップとIf the rearrangement step is executed, the sample sequence obtained in the rearrangement step is encoded. If the rearrangement step is not executed, the sample in the frequency domain derived from the acoustic signal is encoded. An encoding step for encoding the sequence;
を有することを特徴とする符号化方法。An encoding method characterized by comprising:
請求項1から請求項のいずれかに記載の符号化方法であって、
上記符号化ステップでは、
上記並べ替えステップで得られたサンプル列のうち、上記所定の時間区間の音響信号に対応する予測利得またはその推定値と予め定められた閾値との大小関係に応じて定まる範囲に含まれるサンプルの集まりに対してライス符号化が適用される
ことを特徴とする符号化方法。
An encoding method according to any one of claims 1 to 7 , comprising:
In the encoding step,
Of the sample sequences obtained in the rearrangement step, the samples included in the range determined according to the magnitude relationship between the prediction gain corresponding to the acoustic signal in the predetermined time interval or the estimated value thereof and a predetermined threshold value. An encoding method, wherein Rice encoding is applied to a group.
入力された符号列を復号する復号方法であって、
所定の時間区間ごとに、
入力された符号列を復号して、周波数領域のサンプル列を得る復号ステップと、
(A)音響信号の周期性を表わす情報、音響信号の基本周波数を表す情報、音響信号の周期性または基本周波数に対応するサンプルと音響信号の周期性または基本周波数の整数倍に対応するサンプルとの間隔を表す情報、のいずれかと、(B)音響信号の線形予測係数に基づくパワースペクトル包絡係数列の大小関係とに従って、上記復号ステップで得られたサンプル列に含まれる少なくとも一部のサンプルを並べ替えて当該音響信号に由来するサンプル列を得る回復ステップと
を有し、
上記復号ステップで得られたサンプル列は、
(1)上記音響信号に由来するサンプル列を構成する全てのサンプルを含み、かつ、
(2)上記音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるように、周波数領域のサンプルが並べられたもの(以下、暫定サンプル列という)に対して、
(3)上記暫定サンプル列を構成する全てのサンプルを含み、かつ、
(4)上記暫定サンプル列に含まれる少なくとも一部のサンプルが、上記パワースペクトル包絡係数列のうちの当該サンプルに対応する値の絶対値が大きい順または小さい順に並べられたものである
ことを特徴とする復号方法。
A decoding method for decoding an input code string, comprising:
Every predetermined time interval
A decoding step of decoding the input code string to obtain a frequency domain sample string;
(A) Information representing the periodicity of the acoustic signal, information representing the fundamental frequency of the acoustic signal, a sample corresponding to the periodicity or fundamental frequency of the acoustic signal, and a sample corresponding to the periodicity of the acoustic signal or an integer multiple of the fundamental frequency And (B) at least some samples included in the sample sequence obtained in the decoding step according to the magnitude relationship of the power spectrum envelope coefficient sequence based on the linear prediction coefficient of the acoustic signal. Reordering to obtain a sample sequence derived from the acoustic signal,
The sample sequence obtained in the decoding step is
(1) includes all samples constituting the sample sequence derived from the acoustic signal, and
(2) One or a plurality of consecutive samples including samples corresponding to the periodicity or fundamental frequency of the acoustic signal and one or a sequence including samples corresponding to an integer multiple of the periodicity or fundamental frequency of the acoustic signal For samples in which frequency domain samples are arranged so that all or some of the samples are collected (hereinafter referred to as provisional sample sequence)
(3) includes all samples constituting the provisional sample sequence, and
(4) At least some of the samples included in the provisional sample sequence are arranged in the order of increasing or decreasing absolute values of values corresponding to the samples in the power spectrum envelope coefficient sequence. A decoding method.
入力された符号列を復号する復号方法であって、A decoding method for decoding an input code string, comprising:
所定の時間区間ごとに、Every predetermined time interval
入力された符号列を復号して、周波数領域のサンプル列を得る復号ステップと、A decoding step of decoding the input code string to obtain a frequency domain sample string;
(A)音響信号の周期性を表わす情報、音響信号の基本周波数を表す情報、音響信号の周期性または基本周波数に対応するサンプルと音響信号の周期性または基本周波数の整数倍に対応するサンプルとの間隔を表す情報、のいずれかと、(B)音響信号の線形予測係数に基づくパワースペクトル包絡係数列の大小関係とに従って、上記復号ステップで得られたサンプル列に含まれる少なくとも一部のサンプルを並べ替えて当該音響信号に由来するサンプル列を得る回復ステップと(A) Information representing the periodicity of the acoustic signal, information representing the fundamental frequency of the acoustic signal, a sample corresponding to the periodicity or fundamental frequency of the acoustic signal, and a sample corresponding to the periodicity of the acoustic signal or an integer multiple of the fundamental frequency And (B) at least some samples included in the sample sequence obtained in the decoding step according to the magnitude relationship of the power spectrum envelope coefficient sequence based on the linear prediction coefficient of the acoustic signal. A recovery step of rearranging to obtain a sample sequence derived from the acoustic signal;
を有し、Have
上記復号ステップで得られたサンプル列は、The sample sequence obtained in the decoding step is
(1)上記音響信号に由来するサンプル列を構成する全てのサンプルを含み、かつ、(1) includes all samples constituting the sample sequence derived from the acoustic signal, and
(2)上記音響信号に由来するサンプル列に含まれる少なくとも一部のサンプルが、上記パワースペクトル包絡係数列のうちの当該サンプルに対応する値の絶対値が大きい順または小さい順に並べられたもの(以下、暫定サンプル列という)に対して、(2) At least a part of samples included in the sample sequence derived from the acoustic signal are arranged in order of increasing or decreasing absolute value of the value corresponding to the sample in the power spectrum envelope coefficient sequence ( (Hereinafter referred to as provisional sample column)
(3)上記暫定サンプル列を構成する全てのサンプルを含み、かつ、(3) includes all samples constituting the provisional sample sequence, and
(4)上記音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるように、上記暫定サンプル列に含まれる少なくとも一部のサンプルが並べられたものである(4) One or a plurality of consecutive samples including samples corresponding to the periodicity or fundamental frequency of the acoustic signal, and one or a sequence including samples corresponding to an integer multiple of the periodicity or fundamental frequency of the acoustic signal At least some of the samples included in the provisional sample column so that all or some of the samples are collected.
ことを特徴とする復号方法。A decoding method characterized by the above.
入力された符号列を復号する復号方法であって、
所定の時間区間ごとに、
入力された符号列を復号して、周波数領域のサンプル列を得る復号ステップと、
上記復号ステップで得られたサンプル列に含まれる少なくとも一部のサンプルを並べ替えて響信号に由来するサンプル列を得る回復ステップと
を有し、
上記復号ステップで得られたサンプル列は、
(1)上記音響信号に由来するサンプル列を構成する全てのサンプルを含み、かつ、
(2)上記音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるように、周波数領域のサンプルが並べられたもの(以下、第1サンプル列という)、
または、
(3)上記音響信号に由来するサンプル列を構成する全てのサンプルを含み、かつ、
(4)上記音響信号に由来するサンプル列に含まれる少なくとも一部のサンプルが、上記音響信号の線形予測係数に基づくパワースペクトル包絡係数列のうちの当該サンプルに対応する値の絶対値が大きい順または小さい順に並べられたもの(以下、第2サンプル列という)、であり、
上記回復ステップは、
(A)上記復号ステップで得られたサンプル列が上記第1サンプル列である場合には、音響信号の周期性を表わす情報、音響信号の基本周波数を表す情報、音響信号の周期性または基本周波数に対応するサンプルと音響信号の周期性または基本周波数の整数倍に対応するサンプルとの間隔を表す情報、のいずれかに従って、上記第1サンプル列に含まれる少なくとも一部のサンプルを並べ替えて上記音響信号に由来するサンプル列を得て、(B)上記復号ステップで得られたサンプル列が上記第2サンプル列である場合には、音響信号の線形予測係数に基づくパワースペクトル包絡係数列の大小関係に従って、上記第2サンプル列に含まれる少なくとも一部のサンプルを並べ替えて上記音響信号に由来するサンプル列を得る
ことを特徴とする復号方法。
A decoding method for decoding an input code string, comprising:
Every predetermined time interval
A decoding step of decoding the input code string to obtain a frequency domain sample string;
And a recovery step of obtaining a sample sequence derived from the acoustic signal by rearranging at least a portion of the sample contained in the sample string obtained in the decoding step,
The sample sequence obtained in the decoding step is
(1) includes all samples constituting the sample sequence derived from the acoustic signal, and
(2) One or a plurality of consecutive samples including samples corresponding to the periodicity or fundamental frequency of the acoustic signal and one or a sequence including samples corresponding to an integer multiple of the periodicity or fundamental frequency of the acoustic signal A sample in which frequency domain samples are arranged so that all or a part of the plurality of samples are collected (hereinafter referred to as a first sample row),
Or
(3) includes all samples constituting a sample train derived from the acoustic signal, and
(4) The order in which the absolute value of the value corresponding to the sample in the power spectrum envelope coefficient sequence based on the linear prediction coefficient of the acoustic signal is larger in at least some of the samples included in the sample sequence derived from the acoustic signal. Or those arranged in ascending order (hereinafter referred to as a second sample column),
The recovery step is
(A) When the sample sequence obtained in the decoding step is the first sample sequence, information representing the periodicity of the acoustic signal, information representing the fundamental frequency of the acoustic signal, periodicity or fundamental frequency of the acoustic signal And at least some of the samples included in the first sample sequence are rearranged according to any one of the information representing the interval between the sample corresponding to and the sample corresponding to the periodicity of the acoustic signal or the integer multiple of the fundamental frequency. When a sample sequence derived from an acoustic signal is obtained and (B) the sample sequence obtained in the decoding step is the second sample sequence, the magnitude of the power spectrum envelope coefficient sequence based on the linear prediction coefficient of the acoustic signal According to the relationship, at least a part of samples included in the second sample sequence is rearranged to obtain a sample sequence derived from the acoustic signal. METHOD issue.
請求項から請求項11のいずれかに記載の復号方法であって、
入力された量子化済PARCOR係数から計算される予測利得またはその推定値が予め定められた閾値以上である場合に、上記回復ステップが実行される
ことを特徴とする復号方法。
A decoding method according to any one of claims 9 to 11 ,
A decoding method, wherein the recovery step is executed when a prediction gain calculated from an input quantized PARCOR coefficient or an estimated value thereof is equal to or greater than a predetermined threshold.
請求項から請求項11のいずれかに記載の復号方法であって、
上記復号ステップで得られたサンプル列に含まれるサンプルの絶対値和またはパワーが予め定められた閾値以上である場合に、上記回復ステップが実行される
ことを特徴とする復号方法。
A decoding method according to any one of claims 9 to 11 ,
A decoding method, wherein the recovery step is executed when the sum of absolute values or power of samples included in the sample sequence obtained in the decoding step is equal to or greater than a predetermined threshold.
入力された符号列を復号する復号方法であって、A decoding method for decoding an input code string, comprising:
所定の時間区間ごとに、Every predetermined time interval
入力された符号列を復号して、周波数領域のサンプル列を得る復号ステップと、A decoding step of decoding the input code string to obtain a frequency domain sample string;
音響信号の線形予測係数に基づくパワースペクトル包絡係数列の大小関係に従って、上記復号ステップで得られたサンプル列に含まれる少なくとも一部のサンプルを並べ替えて当該音響信号に由来するサンプル列を得る回復ステップとRecovery for obtaining a sample sequence derived from the acoustic signal by rearranging at least some of the samples included in the sample sequence obtained in the decoding step according to the magnitude relationship of the power spectrum envelope coefficient sequence based on the linear prediction coefficient of the acoustic signal Step and
を有し、Have
入力された量子化済PARCOR係数から計算される予測利得またはその推定値が予め定められた閾値以上である場合には、上記復号ステップで得られたサンプル列は、When the prediction gain calculated from the input quantized PARCOR coefficient or its estimated value is equal to or greater than a predetermined threshold, the sample sequence obtained in the decoding step is
(1)上記音響信号に由来するサンプル列を構成する全てのサンプルを含み、かつ、(1) includes all samples constituting the sample sequence derived from the acoustic signal, and
(2)上記音響信号に由来するサンプル列に含まれる少なくとも一部のサンプルが、上記パワースペクトル包絡係数列のうちの当該サンプルに対応する値の絶対値が大きい順または小さい順に並べられたものであり、(2) At least some of the samples included in the sample sequence derived from the acoustic signal are arranged in order of increasing or decreasing absolute value of the value corresponding to the sample in the power spectrum envelope coefficient sequence. Yes,
入力された量子化済PARCOR係数から計算される予測利得またはその推定値が予め定められた閾値以上である場合に、上記回復ステップが実行されるWhen the prediction gain calculated from the input quantized PARCOR coefficient or its estimated value is greater than or equal to a predetermined threshold, the recovery step is executed.
ことを特徴とする復号方法。A decoding method characterized by the above.
入力された符号列を復号する復号方法であって、A decoding method for decoding an input code string, comprising:
所定の時間区間ごとに、Every predetermined time interval
入力された符号列を復号して、周波数領域のサンプル列を得る復号ステップと、A decoding step of decoding the input code string to obtain a frequency domain sample string;
音響信号の線形予測係数に基づくパワースペクトル包絡係数列の大小関係に従って、上記復号ステップで得られたサンプル列に含まれる少なくとも一部のサンプルを並べ替えて当該音響信号に由来するサンプル列を得る回復ステップとRecovery for obtaining a sample sequence derived from the acoustic signal by rearranging at least some of the samples included in the sample sequence obtained in the decoding step according to the magnitude relationship of the power spectrum envelope coefficient sequence based on the linear prediction coefficient of the acoustic signal Step and
を有し、Have
上記復号ステップで得られたサンプル列に含まれるサンプルの絶対値和またはパワーが予め定められた閾値以上である場合には、上記復号ステップで得られたサンプル列は、When the absolute value sum or power of the samples included in the sample sequence obtained in the decoding step is equal to or greater than a predetermined threshold, the sample sequence obtained in the decoding step is
(1)上記音響信号に由来するサンプル列を構成する全てのサンプルを含み、かつ、(1) includes all samples constituting the sample sequence derived from the acoustic signal, and
(2)上記音響信号に由来するサンプル列に含まれる少なくとも一部のサンプルが、上記パワースペクトル包絡係数列のうちの当該サンプルに対応する値の絶対値が大きい順または小さい順に並べられたものであり、(2) At least some of the samples included in the sample sequence derived from the acoustic signal are arranged in order of increasing or decreasing absolute value of the value corresponding to the sample in the power spectrum envelope coefficient sequence. Yes,
上記復号ステップで得られたサンプル列に含まれるサンプルの絶対値和またはパワーが予め定められた閾値以上である場合に、上記回復ステップが実行されるThe recovery step is executed when the absolute value sum or power of the samples included in the sample sequence obtained in the decoding step is equal to or greater than a predetermined threshold.
ことを特徴とする復号方法。A decoding method characterized by the above.
請求項から請求項15のいずれかに記載の復号方法であって、
入力された符号列の少なくとも一部はライス符号化によって得られたものであり、
上記復号ステップでは、
入力された量子化済PARCOR係数から計算される予測利得またはその推定値と予め定められた閾値との大小関係に応じて定まる範囲の符号列に対して上記ライス符号化に対応する復号が行われる
ことを特徴とする復号方法。
A decoding method according to any one of claims 9 to 15 ,
At least a part of the input code string is obtained by Rice encoding,
In the decoding step,
Decoding corresponding to the above-mentioned Rice coding is performed on a code string in a range determined according to the magnitude relationship between the prediction gain calculated from the input quantized PARCOR coefficient or an estimated value thereof and a predetermined threshold value. A decoding method characterized by the above.
所定の時間区間の音響信号に由来する周波数領域のサンプル列の符号化装置であって、
(1)上記サンプル列の全てのサンプルが含まれ、かつ、
(2)上記サンプル列のうちの上記音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記サンプル列のうちの上記音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるように上記サンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、
を並べ替え後のサンプル列(以下、暫定サンプル列という)とし、
(3)上記暫定サンプル列の全てのサンプルが含まれ、かつ、
(4)上記暫定サンプル列に含まれる少なくとも一部のサンプルを、上記音響信号の線形予測係数に基づくパワースペクトル包絡係数列のうちの当該サンプルに対応する値の絶対値が大きい順または小さい順に並べ替えたもの、
を並べ替え後のサンプル列として出力する並べ替え部と、
上記並べ替え部によって得られたサンプル列を符号化する符号化部と
を含む符号化装置。
A coding apparatus for a frequency domain sample sequence derived from an acoustic signal of a predetermined time interval,
(1) all samples in the sample sequence are included, and
(2) One or a plurality of consecutive samples including samples corresponding to the periodicity or fundamental frequency of the acoustic signal in the sample train, and the periodicity or fundamental frequency of the acoustic signal in the sample train A sample in which at least some of the samples included in the sample sequence are rearranged so that all or some of one or a plurality of consecutive samples including samples corresponding to an integer multiple are collected;
As a sample column after sorting (hereinafter referred to as a provisional sample column)
(3) all samples in the provisional sample row are included, and
(4) Arrange at least a part of the samples included in the provisional sample sequence in descending order of the absolute value of the value corresponding to the sample in the power spectrum envelope coefficient sequence based on the linear prediction coefficient of the acoustic signal. Changed
A sorting unit that outputs as a sample column after sorting,
And a coding unit that codes the sample sequence obtained by the rearrangement unit.
所定の時間区間の音響信号に由来する周波数領域のサンプル列の符号化装置であって、A coding apparatus for a frequency domain sample sequence derived from an acoustic signal of a predetermined time interval,
(1)上記サンプル列の全てのサンプルが含まれ、かつ、(1) all samples in the sample sequence are included, and
(2)上記サンプル列に含まれる少なくとも一部のサンプルを、上記音響信号の線形予測係数に基づくパワースペクトル包絡係数列のうちの当該サンプルに対応する値の絶対値が大きい順または小さい順に並べ替えたもの、(2) Reorder at least some of the samples included in the sample sequence in descending order of the absolute value of the value corresponding to the sample in the power spectrum envelope coefficient sequence based on the linear prediction coefficient of the acoustic signal. Food,
を並べ替え後のサンプル列(以下、暫定サンプル列という)とし、As a sample column after sorting (hereinafter referred to as a provisional sample column)
(3)上記暫定サンプル列の全てのサンプルが含まれ、かつ、(3) all samples in the provisional sample row are included, and
(4)上記暫定サンプル列のうちの上記音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記暫定サンプル列のうちの上記音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるように上記暫定サンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、(4) One or a plurality of consecutive samples including samples corresponding to the periodicity or fundamental frequency of the acoustic signal in the provisional sample string, and the periodicity or fundamental of the acoustic signal in the provisional sample string A sample obtained by rearranging at least some of the samples included in the provisional sample sequence so that all or some of one or a plurality of consecutive samples including samples corresponding to an integer multiple of the frequency are collected;
を並べ替え後のサンプル列として出力する並べ替え部と、A sorting unit that outputs as a sample column after sorting,
上記並べ替え部によって得られたサンプル列を符号化する符号化部とAn encoding unit that encodes the sample sequence obtained by the rearrangement unit;
を含む符号化装置。An encoding device including:
所定の時間区間の音響信号に由来する周波数領域のサンプル列の符号化装置であって、
(1)上記サンプル列の全てのサンプルが含まれ、かつ、
(2)上記サンプル列に含まれる少なくとも一部のサンプルを、上記音響信号の線形予測係数に基づくパワースペクトル包絡係数列のうちの当該サンプルに対応する値の絶対値が大きい順または小さい順に並べ替えたもの、
を並べ替え後のサンプル列(以下、第1サンプル列という)として出力し、
(3)上記サンプル列の全てのサンプルが含まれ、かつ、
(4)上記サンプル列のうちの上記音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記サンプル列のうちの上記音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるように上記サンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、
を並べ替え後のサンプル列(以下、第2サンプル列という)として出力する並べ替え部と、
上記第1サンプル列及び上記第2サンプル列をそれぞれ符号化して符号列を得て、得られた符号列のうち符号量が最小の符号列を出力する符号化部と
を含む符号化装置。
A coding apparatus for a frequency domain sample sequence derived from an acoustic signal of a predetermined time interval,
(1) all samples in the sample sequence are included, and
(2) Reorder at least some of the samples included in the sample sequence in descending order of the absolute value of the value corresponding to the sample in the power spectrum envelope coefficient sequence based on the linear prediction coefficient of the acoustic signal. Food,
Is output as a sample column after sorting (hereinafter referred to as the first sample column),
(3) all samples in the sample sequence are included, and
(4) One or a plurality of consecutive samples including samples corresponding to the periodicity or fundamental frequency of the acoustic signal in the sample train, and the periodicity or fundamental frequency of the acoustic signal in the sample train A sample in which at least some of the samples included in the sample sequence are rearranged so that all or some of one or a plurality of consecutive samples including samples corresponding to an integer multiple are collected;
A rearrangement unit that outputs a sample string after sorting (hereinafter referred to as a second sample string);
An encoding device comprising: an encoding unit that encodes each of the first sample sequence and the second sample sequence to obtain a code sequence, and outputs a code sequence having a minimum code amount among the obtained code sequences.
所定の時間区間の音響信号に由来する周波数領域のサンプル列の符号化装置であって、A coding apparatus for a frequency domain sample sequence derived from an acoustic signal of a predetermined time interval,
上記所定の時間区間の音響信号に対応する予測利得またはその推定値が予め定められた閾値以上である場合に実行される、It is executed when the prediction gain corresponding to the acoustic signal in the predetermined time section or its estimated value is equal to or greater than a predetermined threshold value.
(1)上記サンプル列の全てのサンプルが含まれ、かつ、(1) all samples in the sample sequence are included, and
(2)上記サンプル列に含まれる少なくとも一部のサンプルを、上記音響信号の線形予測係数に基づくパワースペクトル包絡係数列のうちの当該サンプルに対応する値の絶対値が大きい順または小さい順に並べ替えたもの、(2) Reorder at least some of the samples included in the sample sequence in descending order of the absolute value of the value corresponding to the sample in the power spectrum envelope coefficient sequence based on the linear prediction coefficient of the acoustic signal. Food,
を並べ替え後のサンプル列として出力する並べ替え部と、A sorting unit that outputs as a sample column after sorting,
上記並べ替え部が実行された場合には、上記並べ替え部で得られたサンプル列を符号化し、上記並べ替え部が実行されなかった場合には、上記音響信号に由来する周波数領域の上記サンプル列を符号化する符号化部とWhen the rearrangement unit is executed, the sample sequence obtained by the rearrangement unit is encoded. When the rearrangement unit is not executed, the samples in the frequency domain derived from the acoustic signal are encoded. An encoding unit for encoding the sequence;
を含むことを特徴とする符号化装置。An encoding device comprising:
所定の時間区間の音響信号に由来する周波数領域のサンプル列の符号化装置であって、A coding apparatus for a frequency domain sample sequence derived from an acoustic signal of a predetermined time interval,
上記音響信号に由来する周波数領域の上記サンプル列に含まれるサンプルの絶対値和またはパワーが予め定められた閾値以上である場合に実行される、It is executed when the absolute value sum or power of samples included in the sample sequence in the frequency domain derived from the acoustic signal is equal to or greater than a predetermined threshold value.
(1)上記サンプル列の全てのサンプルが含まれ、かつ、(1) all samples in the sample sequence are included, and
(2)上記サンプル列に含まれる少なくとも一部のサンプルを、上記音響信号の線形予測係数に基づくパワースペクトル包絡係数列のうちの当該サンプルに対応する値の絶対値が大きい順または小さい順に並べ替えたもの、(2) Reorder at least some of the samples included in the sample sequence in descending order of the absolute value of the value corresponding to the sample in the power spectrum envelope coefficient sequence based on the linear prediction coefficient of the acoustic signal. Food,
を並べ替え後のサンプル列として出力する並べ替え部と、A sorting unit that outputs as a sample column after sorting,
上記並べ替え部が実行された場合には、上記並べ替え部で得られたサンプル列を符号化し、上記並べ替え部が実行されなかった場合には、上記音響信号に由来する周波数領域の上記サンプル列を符号化する符号化部とWhen the rearrangement unit is executed, the sample sequence obtained by the rearrangement unit is encoded. When the rearrangement unit is not executed, the samples in the frequency domain derived from the acoustic signal are encoded. An encoding unit for encoding the sequence;
を含むことを特徴とする符号化装置。An encoding device comprising:
入力された符号列を復号する復号装置であって、
所定の時間区間ごとに、
入力された符号列を復号して、周波数領域のサンプル列を得る復号部と、
(A)音響信号の周期性を表わす情報、音響信号の基本周波数を表す情報、音響信号の周期性または基本周波数に対応するサンプルと音響信号の周期性または基本周波数の整数倍に対応するサンプルとの間隔を表す情報、のいずれかと、(B)音響信号の線形予測係数に基づくパワースペクトル包絡係数列の大小関係とに従って、上記復号部によって得られたサンプル列に含まれる少なくとも一部のサンプルを並べ替えて当該音響信号に由来するサンプル列を得る回復部と
を含み、
上記復号部によって得られたサンプル列は、
(1)上記音響信号に由来するサンプル列を構成する全てのサンプルを含み、かつ、
(2)上記音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるように、周波数領域のサンプルが並べられたもの(以下、暫定サンプル列という)に対して、
(3)上記暫定サンプル列を構成する全てのサンプルを含み、かつ、
(4)上記暫定サンプル列に含まれる少なくとも一部のサンプルが、上記パワースペクトル包絡係数列のうちの当該サンプルに対応する値の絶対値が大きい順または小さい順に並べられたものである
ことを特徴とする復号装置。
A decoding device for decoding an input code string,
Every predetermined time interval
A decoding unit that decodes an input code string to obtain a frequency-domain sample string;
(A) Information representing the periodicity of the acoustic signal, information representing the fundamental frequency of the acoustic signal, a sample corresponding to the periodicity or fundamental frequency of the acoustic signal, and a sample corresponding to the periodicity of the acoustic signal or an integer multiple of the fundamental frequency And (B) at least some samples included in the sample sequence obtained by the decoding unit according to the magnitude relationship of the power spectrum envelope coefficient sequence based on the linear prediction coefficient of the acoustic signal. A recovery unit that rearranges and obtains a sample sequence derived from the acoustic signal,
The sample sequence obtained by the decoding unit is
(1) includes all samples constituting the sample sequence derived from the acoustic signal, and
(2) One or a plurality of consecutive samples including samples corresponding to the periodicity or fundamental frequency of the acoustic signal and one or a sequence including samples corresponding to an integer multiple of the periodicity or fundamental frequency of the acoustic signal For samples in which frequency domain samples are arranged so that all or some of the samples are collected (hereinafter referred to as provisional sample sequence)
(3) includes all samples constituting the provisional sample sequence, and
(4) At least some of the samples included in the provisional sample sequence are arranged in the order of increasing or decreasing absolute values of values corresponding to the samples in the power spectrum envelope coefficient sequence. A decoding device.
入力された符号列を復号する復号装置であって、A decoding device for decoding an input code string,
所定の時間区間ごとに、Every predetermined time interval
入力された符号列を復号して、周波数領域のサンプル列を得る復号部と、A decoding unit that decodes an input code string to obtain a frequency-domain sample string;
(A)音響信号の周期性を表わす情報、音響信号の基本周波数を表す情報、音響信号の周期性または基本周波数に対応するサンプルと音響信号の周期性または基本周波数の整数倍に対応するサンプルとの間隔を表す情報、のいずれかと、(B)音響信号の線形予測係数に基づくパワースペクトル包絡係数列の大小関係とに従って、上記復号部によって得られたサンプル列に含まれる少なくとも一部のサンプルを並べ替えて当該音響信号に由来するサンプル列を得る回復部と(A) Information representing the periodicity of the acoustic signal, information representing the fundamental frequency of the acoustic signal, a sample corresponding to the periodicity or fundamental frequency of the acoustic signal, and a sample corresponding to the periodicity of the acoustic signal or an integer multiple of the fundamental frequency And (B) at least some samples included in the sample sequence obtained by the decoding unit according to the magnitude relationship of the power spectrum envelope coefficient sequence based on the linear prediction coefficient of the acoustic signal. A recovery unit for rearranging and obtaining a sample sequence derived from the acoustic signal;
を含み、Including
上記復号部によって得られたサンプル列は、The sample sequence obtained by the decoding unit is
(1)上記音響信号に由来するサンプル列を構成する全てのサンプルを含み、かつ、(1) includes all samples constituting the sample sequence derived from the acoustic signal, and
(2)上記音響信号に由来するサンプル列に含まれる少なくとも一部のサンプルが、上記パワースペクトル包絡係数列のうちの当該サンプルに対応する値の絶対値が大きい順または小さい順に並べられたもの(以下、暫定サンプル列という)に対して、(2) At least a part of samples included in the sample sequence derived from the acoustic signal are arranged in order of increasing or decreasing absolute value of the value corresponding to the sample in the power spectrum envelope coefficient sequence ( (Hereinafter referred to as provisional sample column)
(3)上記暫定サンプル列を構成する全てのサンプルを含み、かつ、(3) includes all samples constituting the provisional sample sequence, and
(4)上記音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるように、上記暫定サンプル列に含まれる少なくとも一部のサンプルが並べられたものである(4) One or a plurality of consecutive samples including samples corresponding to the periodicity or fundamental frequency of the acoustic signal, and one or a sequence including samples corresponding to an integer multiple of the periodicity or fundamental frequency of the acoustic signal At least some of the samples included in the provisional sample column so that all or some of the samples are collected.
ことを特徴とする復号装置。A decoding device characterized by the above.
入力された符号列を復号する復号装置であって、
所定の時間区間ごとに、
入力された符号列を復号して、周波数領域のサンプル列を得る復号部と、
上記復号部によって得られたサンプル列に含まれる少なくとも一部のサンプルを並べ替えて響信号に由来するサンプル列を得る回復部と
を含み、
上記復号部によって得られたサンプル列は、
(1)上記音響信号に由来するサンプル列を構成する全てのサンプルを含み、かつ、
(2)上記音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるように、周波数領域のサンプルが並べられたもの(以下、第1サンプル列という)、
または、
(3)上記音響信号に由来するサンプル列を構成する全てのサンプルを含み、かつ、
(4)上記音響信号に由来するサンプル列に含まれる少なくとも一部のサンプルが、上記音響信号の線形予測係数に基づくパワースペクトル包絡係数列のうちの当該サンプルに対応する値の絶対値が大きい順または小さい順に並べられたもの(以下、第2サンプル列という)、であり、
上記回復部は、
(A)上記復号部によって得られたサンプル列が上記第1サンプル列である場合には、音響信号の周期性を表わす情報、音響信号の基本周波数を表す情報、音響信号の周期性または基本周波数に対応するサンプルと音響信号の周期性または基本周波数の整数倍に対応するサンプルとの間隔を表す情報、のいずれかに従って、上記第1サンプル列に含まれる少なくとも一部のサンプルを並べ替えて上記音響信号に由来するサンプル列を得て、(B)上記復号部によって得られたサンプル列が上記第2サンプル列である場合には、音響信号の線形予測係数に基づくパワースペクトル包絡係数列の大小関係に従って、上記第2サンプル列に含まれる少なくとも一部のサンプルを並べ替えて上記音響信号に由来するサンプル列を得る
ことを特徴とする復号装置。
A decoding device for decoding an input code string,
Every predetermined time interval
A decoding unit that decodes an input code string to obtain a frequency-domain sample string;
And a recovery portion for obtaining a sample sequence derived from the acoustic signal by rearranging at least a portion of the sample contained in the obtained sample sequence by the decoding unit,
The sample sequence obtained by the decoding unit is
(1) includes all samples constituting the sample sequence derived from the acoustic signal, and
(2) One or a plurality of consecutive samples including samples corresponding to the periodicity or fundamental frequency of the acoustic signal and one or a sequence including samples corresponding to an integer multiple of the periodicity or fundamental frequency of the acoustic signal A sample in which frequency domain samples are arranged so that all or a part of the plurality of samples are collected (hereinafter referred to as a first sample row),
Or
(3) includes all samples constituting a sample train derived from the acoustic signal , and
(4) The order in which the absolute value of the value corresponding to the sample in the power spectrum envelope coefficient sequence based on the linear prediction coefficient of the acoustic signal is larger in at least some of the samples included in the sample sequence derived from the acoustic signal. Or those arranged in ascending order (hereinafter referred to as a second sample column),
The recovery part
(A) When the sample sequence obtained by the decoding unit is the first sample sequence, information representing the periodicity of the acoustic signal, information representing the fundamental frequency of the acoustic signal, periodicity or fundamental frequency of the acoustic signal And at least some of the samples included in the first sample sequence are rearranged according to any one of the information representing the interval between the sample corresponding to and the sample corresponding to the periodicity of the acoustic signal or the integer multiple of the fundamental frequency. A sample sequence derived from an acoustic signal is obtained, and (B) when the sample sequence obtained by the decoding unit is the second sample sequence, the magnitude of the power spectrum envelope coefficient sequence based on the linear prediction coefficient of the acoustic signal According to the relationship, at least a part of samples included in the second sample sequence is rearranged to obtain a sample sequence derived from the acoustic signal. No. equipment.
入力された符号列を復号する復号装置であって、A decoding device for decoding an input code string,
所定の時間区間ごとに、Every predetermined time interval
入力された符号列を復号して、周波数領域のサンプル列を得る復号部と、A decoding unit that decodes an input code string to obtain a frequency-domain sample string;
音響信号の線形予測係数に基づくパワースペクトル包絡係数列の大小関係に従って、上記復号部で得られたサンプル列に含まれる少なくとも一部のサンプルを並べ替えて当該音響信号に由来するサンプル列を得る回復部とRecovery for obtaining a sample sequence derived from the acoustic signal by rearranging at least some of the samples included in the sample sequence obtained by the decoding unit according to the magnitude relationship of the power spectrum envelope coefficient sequence based on the linear prediction coefficient of the acoustic signal Department and
を含み、Including
入力された量子化済PARCOR係数から計算される予測利得またはその推定値が予め定められた閾値以上である場合には、上記復号部で得られたサンプル列は、When the prediction gain calculated from the input quantized PARCOR coefficient or its estimated value is equal to or greater than a predetermined threshold, the sample sequence obtained by the decoding unit is
(1)上記音響信号に由来するサンプル列を構成する全てのサンプルを含み、かつ、(1) includes all samples constituting the sample sequence derived from the acoustic signal, and
(2)上記音響信号に由来するサンプル列に含まれる少なくとも一部のサンプルが、上記パワースペクトル包絡係数列のうちの当該サンプルに対応する値の絶対値が大きい順または小さい順に並べられたものであり、(2) At least some of the samples included in the sample sequence derived from the acoustic signal are arranged in order of increasing or decreasing absolute value of the value corresponding to the sample in the power spectrum envelope coefficient sequence. Yes,
入力された量子化済PARCOR係数から計算される予測利得またはその推定値が予め定められた閾値以上である場合に、上記回復部が実行されるWhen the prediction gain calculated from the input quantized PARCOR coefficient or its estimated value is greater than or equal to a predetermined threshold, the recovery unit is executed.
ことを特徴とする復号装置。A decoding device characterized by the above.
入力された符号列を復号する復号装置であって、A decoding device for decoding an input code string,
所定の時間区間ごとに、Every predetermined time interval
入力された符号列を復号して、周波数領域のサンプル列を得る復号部と、A decoding unit that decodes an input code string to obtain a frequency-domain sample string;
音響信号の線形予測係数に基づくパワースペクトル包絡係数列の大小関係に従って、上記復号部で得られたサンプル列に含まれる少なくとも一部のサンプルを並べ替えて当該音響信号に由来するサンプル列を得る回復部とRecovery for obtaining a sample sequence derived from the acoustic signal by rearranging at least some of the samples included in the sample sequence obtained by the decoding unit according to the magnitude relationship of the power spectrum envelope coefficient sequence based on the linear prediction coefficient of the acoustic signal Department and
を含み、Including
上記復号部で得られたサンプル列に含まれるサンプルの絶対値和またはパワーが予め定められた閾値以上である場合には、上記復号部で得られたサンプル列は、When the absolute value sum or power of the samples included in the sample sequence obtained by the decoding unit is equal to or greater than a predetermined threshold, the sample sequence obtained by the decoding unit is
(1)上記音響信号に由来するサンプル列を構成する全てのサンプルを含み、かつ、(1) includes all samples constituting the sample sequence derived from the acoustic signal, and
(2)上記音響信号に由来するサンプル列に含まれる少なくとも一部のサンプルが、上記パワースペクトル包絡係数列のうちの当該サンプルに対応する値の絶対値が大きい順または小さい順に並べられたものであり、(2) At least some of the samples included in the sample sequence derived from the acoustic signal are arranged in order of increasing or decreasing absolute value of the value corresponding to the sample in the power spectrum envelope coefficient sequence. Yes,
上記復号部で得られたサンプル列に含まれるサンプルの絶対値和またはパワーが予め定められた閾値以上である場合に、上記回復部が実行されるThe recovery unit is executed when the absolute value sum or power of the samples included in the sample sequence obtained by the decoding unit is equal to or greater than a predetermined threshold.
ことを特徴とする復号装置。A decoding device characterized by the above.
請求項1から請求項のいずれかに記載された符号化方法または請求項から請求項16のいずれかに記載された復号方法の各ステップをコンピュータに実行させるためのプログラム。 A program for causing a computer to execute each step of the encoding method according to any one of claims 1 to 8 or the decoding method according to any one of claims 9 to 16 . 請求項1から請求項のいずれかに記載された符号化方法または請求項から請求項16のいずれかに記載された復号方法の各ステップをコンピュータに実行させるためのプログラムを記録した、コンピュータが読み取り可能な記録媒体。 A computer in which a program for causing a computer to execute each step of the encoding method according to any one of claims 1 to 8 or the decoding method according to any one of claims 9 to 16 is recorded. Is a readable recording medium.
JP2010277180A 2010-12-13 2010-12-13 Encoding method, decoding method, encoding device, decoding device, program, recording medium Active JP5694751B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010277180A JP5694751B2 (en) 2010-12-13 2010-12-13 Encoding method, decoding method, encoding device, decoding device, program, recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010277180A JP5694751B2 (en) 2010-12-13 2010-12-13 Encoding method, decoding method, encoding device, decoding device, program, recording medium

Publications (2)

Publication Number Publication Date
JP2012128022A JP2012128022A (en) 2012-07-05
JP5694751B2 true JP5694751B2 (en) 2015-04-01

Family

ID=46645161

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010277180A Active JP5694751B2 (en) 2010-12-13 2010-12-13 Encoding method, decoding method, encoding device, decoding device, program, recording medium

Country Status (1)

Country Link
JP (1) JP5694751B2 (en)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014009775A1 (en) 2012-07-12 2014-01-16 Nokia Corporation Vector quantization
ES2754706T3 (en) * 2014-03-24 2020-04-20 Nippon Telegraph & Telephone Encoding method, encoder, program and registration medium
TR201900472T4 (en) * 2014-04-24 2019-02-21 Nippon Telegraph & Telephone Frequency domain parameter array generation method, coding method, decoding method, frequency domain parameter array forming apparatus, coding apparatus, decoding apparatus, program and recording medium.
ES2883848T3 (en) * 2014-05-01 2021-12-09 Nippon Telegraph & Telephone Encoder, decoder, encoding method, decoding method, encoding program, decoding program, and record carrier
ES2838006T3 (en) * 2014-07-28 2021-07-01 Nippon Telegraph & Telephone Sound signal encoding
JP6712643B2 (en) * 2016-09-15 2020-06-24 日本電信電話株式会社 Sample sequence transformation device, signal coding device, signal decoding device, sample sequence transformation method, signal coding method, signal decoding method, and program
JP6475273B2 (en) * 2017-02-16 2019-02-27 ノキア テクノロジーズ オーユー Vector quantization

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3353868B2 (en) * 1995-10-09 2002-12-03 日本電信電話株式会社 Audio signal conversion encoding method and decoding method
JPH10276095A (en) * 1997-03-28 1998-10-13 Toshiba Corp Encoder/decoder
WO2012046685A1 (en) * 2010-10-05 2012-04-12 日本電信電話株式会社 Coding method, decoding method, coding device, decoding device, program, and recording medium

Also Published As

Publication number Publication date
JP2012128022A (en) 2012-07-05

Similar Documents

Publication Publication Date Title
JP5612698B2 (en) Encoding method, decoding method, encoding device, decoding device, program, recording medium
JP5596800B2 (en) Coding method, periodic feature value determination method, periodic feature value determination device, program
JP5603484B2 (en) Encoding method, decoding method, encoding device, decoding device, program, recording medium
US10083703B2 (en) Frequency domain pitch period based encoding and decoding in accordance with magnitude and amplitude criteria
JP5893153B2 (en) Encoding method, encoding device, program, and recording medium
JP5694751B2 (en) Encoding method, decoding method, encoding device, decoding device, program, recording medium
JP5579932B2 (en) Encoding method, apparatus, program, and recording medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130731

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140728

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140805

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140916

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150127

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150205

R150 Certificate of patent or registration of utility model

Ref document number: 5694751

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150