JP4978539B2 - Encoding apparatus, encoding method, and program. - Google Patents
Encoding apparatus, encoding method, and program. Download PDFInfo
- Publication number
- JP4978539B2 JP4978539B2 JP2008099810A JP2008099810A JP4978539B2 JP 4978539 B2 JP4978539 B2 JP 4978539B2 JP 2008099810 A JP2008099810 A JP 2008099810A JP 2008099810 A JP2008099810 A JP 2008099810A JP 4978539 B2 JP4978539 B2 JP 4978539B2
- Authority
- JP
- Japan
- Prior art keywords
- frequency
- unit
- maximum value
- transform coefficient
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
本発明は、デジタル信号を符号化する符号化装置、デジタル信号を符号化する符号化方法、及びデジタル信号処理を行うコンピュータにより実行させるプログラムに関する。 The present invention is an encoding apparatus for encoding a digital signal, the encoding method of encoding a digital signal, a program to be executed by a computer to perform 及 beauty digital signal processing.
人間の聴覚の特性に基づいて音声符号化を行い、この符号化データを復号する音声処理装置が開示されている(例えば、特許文献1乃至4参照)。
A speech processing apparatus that performs speech coding based on human auditory characteristics and decodes the coded data is disclosed (for example, see
この種の音声処理装置は、電子辞書装置のような語学辞書において発音される単語の音声用としても利用される。語学辞書用の音声処理装置では、十分な音質を確保しつつ、16kbps程度のデータレートを確保しなければならない。 This type of speech processing device is also used for speech of words that are pronounced in a language dictionary such as an electronic dictionary device. A speech processing device for a language dictionary must secure a data rate of about 16 kbps while ensuring sufficient sound quality.
本発明は、このような事情に鑑みてなされたもので、データの質を確保しつつ、そのデータの符号化効率を向上させることができる符号化装置、符号化方法、及びプログラムを提供することを目的とする。 The present invention has been made in view of such circumstances, provide while maintaining the quality of the data, the encoding device which can improve the coding efficiency of the data, marks Goka method, the 及 beauty program The purpose is to do.
上記目的を達成するために、本発明の符号化装置は、所定時間長のデジタル信号を、複数のブロックに分割する分割部と、前記各ブロックのデジタル信号をそれぞれ周波数変換し、第1の変換係数群をブロック毎に生成する周波数変換部と、前記周波数変換部で生成された第1の変換係数群を、周波数が高くなるにつれて帯域幅が広くなるような複数の小周波数帯域に分割する帯域分割部と、前記小周波数帯域に属する前記第1の変換係数の絶対値の最大値を、前記小周波数帯域毎に検索し、検索された最大値を周波数順に並べることにより、最大値列を、前記ブロック毎に生成する最大値検索部と、前記各ブロックの最大値列を、最大値列コードブックを用いてベクトル量子化し、求められたインデックスを、時系列順に並べることにより、最大値列インデックスのデータ列を生成する最大値列ベクトル量子化部と、前記最大値列ベクトル量子化部で求めた前記各ブロックの最大値列のインデックスを前記最大値列コードブックを用いて逆量子化し、前記各ブロックのそれぞれの小周波数帯域に属する第1の変換係数群を、当該ブロックに対応する逆量子化値であって当該小周波数帯域の逆量子化値を用いて除算する除算部と、前記除算部で除算された前記各ブロックの第1の変換係数群にそれぞれ含まれる同一周波数の変換係数を、時系列に並び替えることにより、第2の変換係数群を、周波数毎に生成する時系列並び替え部と、前記各周波数の第2の変換係数群を、変換係数コードブックを用いてベクトル量子化し、求められたインデックスを、周波数順に並べることにより、変換係数インデックスのデータ列を生成する変換係数ベクトル量子化部と、前記各周波数の第2の変換係数群の重要度に基づいて、前記変換係数インデックスのデータ列を圧縮し、前記各周波数の第2の変換係数群が符号化対象であるか否かを示すフラグに関する情報を生成するデータ圧縮部と、前記最大値列ベクトル量子化部で生成された最大値列インデックスのデータ列と前記データ圧縮部で生成された前記フラグに関する情報と、前記圧縮されたデータ列とを符号化する符号化部と、を備える。 In order to achieve the above object, an encoding apparatus according to the present invention includes a dividing unit that divides a digital signal having a predetermined time length into a plurality of blocks, a frequency conversion of the digital signal of each block, and a first conversion. A band that divides a frequency conversion unit that generates a coefficient group for each block and a first conversion coefficient group generated by the frequency conversion unit into a plurality of small frequency bands that have a wider bandwidth as the frequency increases. By searching for the maximum value of the absolute value of the first transform coefficient belonging to the small frequency band for each of the small frequency bands, and by dividing the searched maximum values in order of frequency, A maximum value search unit to be generated for each block, and a maximum value sequence of each block is vector-quantized using a maximum value sequence codebook, and the obtained indexes are arranged in time series A maximum value sequence vector quantization unit that generates a data sequence of a maximum value sequence index, and the index of the maximum value sequence of each block obtained by the maximum value sequence vector quantization unit is inverted using the maximum value sequence codebook. A division unit that quantizes and divides a first transform coefficient group belonging to each small frequency band of each block using an inverse quantization value corresponding to the block and using the inverse quantization value of the small frequency band And generating a second transform coefficient group for each frequency by rearranging the transform coefficients of the same frequency included in the first transform coefficient group of each block divided by the division unit in time series A time series rearrangement unit that performs vector quantization on the second transform coefficient group of each frequency using a transform coefficient codebook, and arranges the obtained indexes in order of frequency. Based on the importance of the transform coefficient vector quantization unit that generates the transform coefficient index data string and the second transform coefficient group of each frequency, the transform coefficient index data string is compressed, A data compression unit that generates information on a flag indicating whether or not the transform coefficient group of 2 is an encoding target, a data sequence of the maximum value sequence index generated by the maximum value sequence vector quantization unit, and the data compression An encoding unit that encodes the information about the flag generated by the unit and the compressed data string.
また、前記符号化部により符号化されたデータの符号量が、目標符号量よりも小さいか否かの判定を、その判定が肯定されるまで繰り返す符号量判定部をさらに備え、前記データ圧縮部は、前記符号量判定部の判定が否定された場合に、前記重要度が小さい順に、第2の変換係数群を、符号化対象から削除することにより、前記変換係数インデックスのデータ列を圧縮して、前記フラグに関する情報を生成し、前記符号化部は、前記符号量判定部の判定が肯定されるまで、前記データ圧縮部によって圧縮された前記データ列と、生成された前記フラグに関する情報とを符号化することとしてもよい。 The data compression unit further includes a code amount determination unit that repeats the determination as to whether or not the code amount of the data encoded by the encoding unit is smaller than a target code amount until the determination is positive. When the determination of the code amount determination unit is negative, the data sequence of the transform coefficient index is compressed by deleting the second transform coefficient group from the encoding target in ascending order of importance. The information on the flag is generated, and the encoding unit, the data sequence compressed by the data compression unit until the determination of the code amount determination unit is affirmed , the information on the generated flag, May be encoded.
また、前記データ圧縮部は、前記符号化されるデータの符号量が目標符号量より少なく、かつ、その目標符号量に近い値となるまで、前記重要度が高い順に、前記符号化部の符号化対象となる周波数周波数を選択し、選択された周波数周波数に対応する第2の変換係数群を符号化対象として、前記変換係数インデックスのデータ列を圧縮し、前記フラグに関する情報を生成することとしてもよい。 In addition, the data compression unit is configured such that the code of the encoding unit is in descending order of importance until the code amount of the encoded data is less than the target code amount and is close to the target code amount. Selecting a frequency frequency to be encoded, compressing a data sequence of the conversion coefficient index with a second conversion coefficient group corresponding to the selected frequency frequency as an encoding target, and generating information on the flag Also good.
また、前記データ圧縮部は、前記生成されたフラグを、周波数順に並べることによりフラグ列を形成し、形成されたフラグ列に基づいて、そのフラグ列において同一の値が連続する連続数の数列を前記フラグに関する情報として生成することとしてもよい。 In addition, the data compression unit forms a flag sequence by arranging the generated flags in order of frequency, and based on the formed flag sequence, a continuous number sequence in which the same value continues in the flag sequence. It is good also as producing | generating as the information regarding the said flag.
この場合、前記データ圧縮部は、前記フラグ列において、同一の値が連続する連続数がその上限値に等しい場合には、前記数列において、その連続数と、次の連続数との間に、0を挿入することとしてもよい。 In this case, when the number of consecutive consecutive identical values is equal to the upper limit value in the flag string, the data compression unit, between the number of consecutive numbers in the number sequence and the next consecutive number, It is also possible to insert 0.
また、前記データ圧縮部は、前記フラグ列が、1から開始される場合には、前記数列の先頭に0を挿入することとしてもよい。 The data compression unit may insert 0 at the head of the number sequence when the flag sequence starts from 1.
また、一連の複数の前記所定時間長のデジタル信号に関して前記符号化部によってそれぞれ符号化された符号化データの符号量の和が、全体の目標符号量よりも小さいか否かの判定を、その判定が肯定されるまで繰り返す全体符号量判定部と、前記全体符号量判定部の判定が否定された場合に、前記重要度が全体で最小となる第2の変換係数群に対応する変換係数インデックスを、前記変換係数インデックスのデータ列から除外し、除外された第2の変換係数群に対応する前記フラグを符号化対象でないことを示す値に変更する調整部と、前記変換係数インデックスが除外され、前記フラグが変更された前記所定時間長のデジタル信号に関するデータを再符号化する再符号化部と、をさらに備えることとしてもよい。 In addition, it is determined whether or not the sum of the code amounts of the encoded data encoded by the encoding unit with respect to the series of the plurality of digital signals having the predetermined time length is smaller than the entire target code amount, An overall code amount determination unit that repeats until the determination is affirmative, and a transform coefficient index corresponding to the second transform coefficient group that minimizes the degree of importance overall when the determination of the overall code amount determination unit is denied Are excluded from the transform coefficient index data string, and an adjustment unit that changes the flag corresponding to the excluded second transform coefficient group to a value indicating that it is not an encoding target; and the transform coefficient index is excluded. And a re-encoding unit that re-encodes data related to the digital signal having the predetermined time length in which the flag is changed.
本発明によれば、データの質を確保しつつ、符号化効率を向上させることができる。 According to the present invention, encoding efficiency can be improved while ensuring the quality of data.
≪第1の実施形態≫
次に、本発明の第1の実施形態について図面を参照して詳細に説明する。
<< First Embodiment >>
Next, a first embodiment of the present invention will be described in detail with reference to the drawings.
図1には、本実施形態に係る音声処理装置1の概略的な構成が示されている。このような音声処理装置1としては、例えば、携帯電話機や、電子辞書のような端末装置が想定される。
FIG. 1 shows a schematic configuration of a
音声処理装置1は、音声入出力装置11と、記憶装置12と、ROM13と、RAM14と、CPU15と、を備える。これらは、内部バスを介して接続される。
The
音声入出力装置11は、入力された音声をデジタル信号に変換する。音声入出力装置11は、例えば、入力された音声をサンプリング周波数16kHzでサンプリングし、16ビットで量子化することにより、デジタル信号Sound0を生成する。また、音声入出力装置11は、デジタル信号が供給されると、このデジタル信号に対応する音声を出力する。 The voice input / output device 11 converts the input voice into a digital signal. For example, the voice input / output device 11 generates the digital signal Sound0 by sampling the input voice at a sampling frequency of 16 kHz and quantizing the voice by 16 bits. Further, when a digital signal is supplied, the voice input / output device 11 outputs a voice corresponding to the digital signal.
記憶装置12には、音声入出力装置11によって生成されたデジタル信号Sound0が符号化されたデータが格納される。記憶装置12には、その符号化データを復号するのに必要なデータも格納される。これらのデータについては後述する。 The storage device 12 stores data in which the digital signal Sound0 generated by the audio input / output device 11 is encoded. The storage device 12 also stores data necessary for decoding the encoded data. These data will be described later.
ROM13には、CPU15によって実行される処理に必要なプログラムコードなどの各種データが格納されている。RAM14には、CPU15によって実行される処理に必要なデータが格納される。
The ROM 13 stores various data such as program codes necessary for processing executed by the CPU 15. The
CPU15は、ROM13に格納されたプログラムコードに従って処理を実行する。CPU15による処理の実行により、符号化部16と復号部17とが実現されている。
The CPU 15 executes processing according to the program code stored in the ROM 13. The
符号化部16は、音声入出力装置11によって変換されたデジタル信号の符号化を行う。符号化部16は、図2に示されるように、DC除去部21と、フレーム化部22と、MDCT(Modified Discrete Cosine Transform, 修正離散コサイン変換)部23と、正規化部24と、帯域分割部25と、最大値検索部26と、最大値列ベクトル量子化(VQ)部27と、最大値除算部28と、量子化部29と、時間順並び替え部30と、係数ベクトル量子化(VQ)部31と、エントロピ符号化部32と、符号量比較部33と、データ削除部34と、コードブック50、51と、を備えている。
The
DC除去部21は、図3に示されるように、音声入力装置11が生成したサンプリング周期Tsのデジタル信号Sound0から、直流(DC)成分Xdcを削除する。直流成分Xdcを削除するのは、直流成分Xdcが、音質とは無関係であるためである。DC除去部21は、例えば、高域通過フィルタによって実現することができる。以下の式(1)には、高域通過フィルタの伝達関数H(z)の一例が示されている。 As shown in FIG. 3, the DC removal unit 21 deletes a direct current (DC) component Xdc from the digital signal Sound0 of the sampling period Ts generated by the audio input device 11. The reason why the direct current component Xdc is deleted is that the direct current component Xdc is irrelevant to the sound quality. The DC removal unit 21 can be realized by a high-pass filter, for example. In the following equation (1), an example of the transfer function H (z) of the high-pass filter is shown.
この通知を受けて、フレーム化部22は、記憶装置12に格納されたデジタル信号Sound1を読み出してフレームに分割する。図4には、デジタル信号Sound1のフレーム分割により生成されたフレーム信号(所定時間長のデジタル信号)との関係が模式的に示されている。図4に示されるように、各フレーム信号は、直前のフレーム信号と、時間が一部重複している。この重複時間をTとする。図4には、後述するMDCTの処理単位であるMDCTブロック(1MDCT)も示されている。各MDCTブロックの時間長は2Tとなっている。すなわち、MDCTブロックの重複時間は、その時間長の半分である。また、フレーム間の重複時間も、MDCTブロックの時間長の半分である時間Tとなっている。このようにすれば、複数のフレーム(デジタル信号の全区間)に渡って、各MDCTブロックの時間間隔は、一定となる。 Upon receiving this notification, the framing unit 22 reads the digital signal Sound1 stored in the storage device 12 and divides it into frames. FIG. 4 schematically shows a relationship with a frame signal (a digital signal having a predetermined time length) generated by frame division of the digital signal Sound1. As shown in FIG. 4, each frame signal partially overlaps with the immediately preceding frame signal. Let this overlap time be T. FIG. 4 also shows an MDCT block (1MDCT) which is an MDCT processing unit described later. The time length of each MDCT block is 2T. That is, the MDCT block overlap time is half of its length. The overlap time between frames is also a time T that is half the time length of the MDCT block. In this way, the time interval of each MDCT block is constant over a plurality of frames (all sections of the digital signal).
なお、図4では、1フレームにつきMDCTブロックが4つとなっているが、以下では、1フレームにつき、N個(Nは、2以上の整数)のブロックが生成されるものとして説明する。フレーム化部22は、フレーム分割により生成された複数のフレーム信号を、フレーム単位で、記憶装置12に格納する。そして、フレーム化部22は、MDCT部23に処理開始を通知する。
In FIG. 4, although there are four MDCT blocks per frame, the following description will be made assuming that N blocks (N is an integer of 2 or more) are generated per frame. The framing unit 22 stores a plurality of frame signals generated by frame division in the storage device 12 in units of frames. Then, the framing unit 22 notifies the MDCT
この通知を受けて、分割部及び周波数変換部としてのMDCT部23は、記憶装置12から読み出した各フレーム信号に対して、周波数変換を行う。より具体的には、MDCT部23は、記憶装置12から読み出したフレーム信号を、複数のMDCTブロックに分割し、そのブロック毎に周波数変換を行い、MDCT係数Xk(k;周波数を示す符号)をブロック毎に算出する。MDCT部23は、次の式(2)、式(3)を用いて、MDCT係数Xkを算出する。1回のMDCTで1つのMDCTブロックのMDCT係数Xkが算出される。なお、MDCT係数Xkのタップ長Mは、512タップが理想的である。
Upon receiving this notification, the
この通知を受けて、正規化部24は、各MDCTブロックのMDCT係数Xkを、記憶装置12から読み出す。正規化部24は、各MDCTブロックのMDCT係数Xkを、フレーム単位で、正規化する。正規化部24は、MDCT係数Xkの最大値gainを取得して分離し、各MDCT係数Xkをこの最大値gainで除算することにより、正規化を行う。
Upon receiving this notification, the
より具体的には、正規化部24は、以下の式(4)を用いて、フレーム内における、MDCT係数Xkの最大値gainを取得する。
More specifically, the
次に、正規化部24は、以下の式(5)を用いてMDCT係数の正規化を行う。
Next, the
図5(B)には、正規化されたMDCT係数Xnkの一例が示されている。この正規化により、MDCT係数は、例えば、16ビットから8ビット程度に量子化される。正規化部24は、MDCT係数Xnkを、ブロック毎にまとめて、フレーム単位で、記憶装置12に格納する。また、正規化部24は、最大値gainを記憶装置12に格納する。そして、正規化部24は、帯域分割部25に処理開始を通知する。
In FIG. 5 (B), an example of the normalized MDCT coefficients Xn k is shown. By this normalization, the MDCT coefficient is quantized to, for example, about 16 bits to 8 bits.
この通知を受けて、帯域分割部25は、図5(B)に示されるように、記憶装置12から読み出したMDCT係数Xnkの全周波数帯域を、ブロック毎に、P個(P:2以上の整数)の分割帯域b_p(p;分割帯域の番号)に対数的に分割する(区分けする)。帯域分割部25は、人間の聴覚の特性に合わせて、低域(低周波数帯域)ほど狭く、高域(高周波数帯域)ほど広くなるように、対数的に周波数帯域を分割する。これにより、その分割帯域b_pは、聴覚の特性に即したものとなる。分割帯域の分割数Pは、例えば、16程度であるのが望ましい。
In response to this notification, the
周波数帯域を分割すると、帯域分割部25は、最大値検索部26に処理開始を通知する。
When the frequency band is divided, the
この通知を受けて、最大値検索部26は、図6(A)に示されるように、各周波数帯域b_pに属する、MDCT係数Xnkの絶対値の最大値を検索し、各周波数帯域b_pのその最大値env_pを、ブロック毎に取得する。そして、最大値検索部26は、図6(B)に示されるように、これらの最大値env_pの集合から成る最大値列env[p](p=1〜P)を、ブロック毎に生成する。最大値検索部26は、MDCT係数Xnk及び最大値列env[p](p=1〜P)を、ブロック毎にまとめて、フレーム単位で、記憶装置12に格納する。最大値検索部26は、最大値列ベクトル量子化部27に処理開始を通知する。
In response to this notification, the maximum
この通知を受けて、最大値列ベクトル量子化部27は、記憶装置12から読み出した最大値列env[p]を、ブロック毎にベクトル量子化する。このベクトル量子化には、ROM13に格納されているコードブック50が用いられる。図7(A)には、コードブック50が示されている。図7(A)に示されるように、コードブック50には、最大値列env[p]の次元Pと同じ次元PのべクトルVj(j=1〜q)が、q個登録されている。最大値列ベクトル量子化部27は、このコードブック50を参照して、以下の式(6)の値ejが最小となるインデックスjの値を、ブロック毎に求める。
Upon receiving this notification, the maximum value sequence
この通知を受けて、最大値除算部28は、MDCT係数Xnkと、データ列index1[i]を、記憶装置12から読み出す。そして、最大値除算部28は、各ブロックのそれぞれの分割帯域に属するMDCT係数Xnkを、そのブロックのインデックスindex1[i]に対応するコードブック50の各要素の値(すなわち逆量子化値)であって、その分割帯域に対応する逆量子化値を用いて除算する。これにより、MDCT係数Xek(k=1〜M/2−1)が、ブロック毎に得られる。図8には、この除算により生成された、あるブロックのMDCT係数Xekの一例が示されている。最大値除算部28は、MDCT係数Xekを、ブロック毎にまとめて、フレーム単位で、記憶装置12に格納する。そして、最大値除算部28は、量子化部29に処理開始を通知する。
In response to this notification, the maximum value the
この通知を受けて、量子化部29は、記憶装置12から読み出したMDCT係数Xekを、分割帯域b_p毎に予め設定されている精度(ビット数)で量子化する。図9(A)、図9(B)には、量子化の様子が示されている。量子化部29は、図9(A)に示されるMDCT係数Xekを量子化した結果として、図9(B)に示されるMDCT係数Xqkを取得する。量子化部29は、取得されたMDCT係数Xqkを、記憶装置12に格納する。そして、量子化部29は、時間順並び替え部30に処理開始を通知する。
In response to this notice, the
この通知を受けて、時系列並び替え部としての時間順並び替え部30は、1フレーム内の複数のMDCTブロック各々のMDCT係数群(すなわち第1の変換係数群)に含まれるMDCT係数Xqkを、記憶装置12から読み出す。そして、時間順並び替え部30は、MDCT係数Xqkを、同一周波数のグループに再グループ化し、再グループ化されたMDCT係数群(すなわち第2の変換係数群)について、MDCT係数Xqkを時間順に並び替える。図10(A)、図10(B)には、この並び替えの様子が示されている。図10(A)に示されるように、i(i=1〜N)番目のブロック目のMDCT係数Xqkを、補正係数Xqk,iとする。図10(B)に示されるように、補正係数Xqk,iは、同一周波数のMDCT係数群にグループ化され、時系列順に並び替えられている。ここで、同一周波数の変換係数群の各MDCT係数Xqk,iを各要素とするベクトルを、係数ベクトルFk(k=1〜M/2−1)とする。時間順並び替え部30は、この係数ベクトルFkを、記憶装置12に格納する。そして、時間順並び替え部30は、係数ベクトル量子化部31に処理開始を通知する。
In response to this notification, the time-
この通知を受けて、係数ベクトル量子化部31は、記憶装置12から読み出した係数ベクトルFkを、ベクトル量子化する。このベクトル量子化には、ROM13に格納されたコードブック51が用いられる。図11(A)には、コードブック51が示されている。図11(A)に示されるように、コードブック51には、係数ベクトルFkの次元Nと同じ次元Nの代表ベクトルWjが、s個登録されている。係数ベクトル量子化部31は、このコードブック51を参照して、次の式(7)の値が最小となるインデックスjの値を、周波数(要するにk)毎に求める。
Upon receipt of this notification, the coefficient
この通知を受けて、エントロピ符号化部32は、最大値gainと、最大値列のインデックスのデータ列index1[1]〜index1[N]と、MDCT係数群のインデックスのデータ列index2[k]〜index2[K](初期段階では、K=M/2−1)と、後述する符号数列Ctとを、記憶装置12から読み出す。そして、エントロピ符号化部32は、レンジコーダ、ハフマンコード等のエントロピ符号化方法を用いて、図示しないコード表を用いて、読み込まれたデータをエントロピ符号化し、符号化データを生成する。 Upon receiving this notification, the entropy encoding unit 32 receives the maximum value gain, the index data string index1 [1] to index1 [N] of the maximum value string, and the index data string index2 [k] to MDCT coefficient group index. index2 [K] (K = M / 2-1 in the initial stage) and a code sequence C t described later are read from the storage device 12. Then, the entropy encoding unit 32 uses the entropy encoding method such as a range coder or Huffman code to perform entropy encoding on the read data using a code table (not shown) to generate encoded data.
図12には、エントロピ符号化部32によって符号化されるデータが示されている。図12に示されるように、エントロピ符号化部32によって符号化されるデータとして、符号数列Ctがある。符号数列Ctは、存在フラグFLGkが符号化されたものである。存在フラグFLGkとは、図13に示されるように、各周波数のMDCT係数群が符号化対象であるか否かを示すフラグである。存在フラグFLGkが1であれば、対応する周波数のMDCT係数群は符号化対象であり、存在フラグFLGkが0であれば、その周波数のMDCT係数群は符号化対象ではない。初期段階では、すべての周波数のMDCT係数群が符号化の対象となっているため、図13に示されるように、存在フラグFLGkには、全周波数で1が設定されるようになる。すなわち、存在フラグFLGkの初期値は、すべて1である。 FIG. 12 shows data encoded by the entropy encoding unit 32. As shown in FIG. 12, as the data to be encoded by the entropy encoding unit 32, there is a code sequence C t. The code number sequence C t is obtained by encoding the presence flag FLG k . The presence flag FLG k is a flag indicating whether or not the MDCT coefficient group of each frequency is an encoding target, as shown in FIG. If the presence flag FLG k is 1, the MDCT coefficient group of the corresponding frequency is an encoding target, and if the presence flag FLG k is 0, the MDCT coefficient group of the frequency is not an encoding target. In the initial stage, since MDCT coefficient groups of all frequencies are to be encoded, as shown in FIG. 13, the presence flag FLG k is set to 1 at all frequencies. That is, the initial values of the presence flags FLG k are all 1.
このように、符号化フラグFLGkのフラグ列(以下、適宜、フラグ列FLGkと略述する)は、0と1とからなる数列である。このフラグ列FLGkを、0と1の連続する数で表現することにより、符号化したものが符号数列Ctである。図14(A)、図14(B)には、符号数列Ctの一例が示されている。図14(A)に示されるように、存在フラグ列FLGkにおいて、0と1が連続する数が、順番に、2、2、1、3、3、1、1である場合、符号数列Ctは、{2、2、1、3、3、1、1}となる。 Thus, the flag sequence of the encoding flag FLG k (hereinafter, abbreviated as the flag sequence FLG k as appropriate) is a sequence of 0s and 1s. A code number sequence C t is encoded by expressing this flag sequence FLG k as a continuous number of 0s and 1s. FIG. 14 (A), the in FIG. 14 (B) is an example of a code sequence C t is shown. As shown in FIG. 14 (A), in the presence flag sequence FLG k , when the number of consecutive 0s and 1s is 2, 2, 1, 3, 3, 1, 1 in order, the code sequence C t is {2, 2, 1, 3, 3, 1, 1}.
また、図14(B)に示されるように、フラグ列FLGkにおいて、同一の値が連続する連続数がその上限値に等しい場合には、符号数列Ctにおいて、その連続数と、次の連続数との間に、0が挿入される。 Further, as shown in FIG. 14 (B), in the flag column FLG k, when the continuous number of the same value continues is equal to the upper limit value, the code sequence C t, and the number of consecutive, the following 0 is inserted between the consecutive numbers.
また、図14(B)に示されるように、フラグ列FLGkが、1から開始される場合には、符号数列Ctの先頭に0が挿入される。 As shown in FIG. 14B, when the flag sequence FLG k starts from 1, 0 is inserted at the head of the code sequence C t .
前述のように、初期段階では、存在フラグFLGkは、全て1であるため、符号数列Ctの初期値も一意に決まっている。記憶装置12には、予め、存在フラグFLGkを全て1としたときの符号数列Ctの初期値が格納されている。エントロピ符号化部32は、初回の符号化では、符号数列Ctの初期値を読み出して、それをエントロピ符号化する。 As described above, since the presence flags FLG k are all 1 at the initial stage, the initial value of the code sequence C t is also uniquely determined. The storage device 12 stores in advance the initial value of the code number sequence C t when the presence flags FLG k are all set to 1. In the first encoding, the entropy encoding unit 32 reads an initial value of the code sequence C t and entropy encodes it.
エントロピ符号化部32は、符号化されたデータを、記憶装置12に記憶する。そして、エントロピ符号化部32は、符号量比較部33に対して、処理開始を通知する。
The entropy encoding unit 32 stores the encoded data in the storage device 12. Then, the entropy encoding unit 32 notifies the code
この通知を受けて、符号量比較部33は、記憶装置12に格納された符号データを読み出し、そのデータの符号量と目標符号量とを比較する。この目標符号量は、十分な音質を確保しつつ、16kbps程度のデータレートを確保するために予め設定されている。
Upon receiving this notification, the code
符号量比較部33は、合計符号量と目標符号量とを比較し、合計符号量が目標符号量以下であるか否かを判定する。符号量比較部33は、その判定が否定された場合、その旨をデータ削除部34に通知する。
The code
この通知を受けて、データ削除部34は、符号化されるデータの一部を削除する。まず、データ削除部34は、周波数毎に、MDCT係数群、すなわち各係数ベクトルFkに対応するMDCT係数群の重要度(音質に影響を及ぼす度合い)を算出する。
Upon receiving this notification, the
重要度を算出する最も単純な方法には、周波数毎に合計エネルギgkを算出する方法がある。周波数毎の合計エネルギgkは、次の式(8)によって表される。 The simplest method for calculating the importance is a method for calculating the total energy g k for each frequency. The total energy g k for each frequency is expressed by the following equation (8).
なお、データ削除部34は、エネルギgkに、周波数に依存した重み係数を乗算するようにしても良い。例えば、データ削除部34は、500Hz未満の周波数帯域に属するMDCT係数には、1.3を乗算し、500以上3500Hz未満の周波数帯域に属するMDCT係数には、1.1を乗算し、3500Hz以上の周波数帯の補正係数には、1.0を乗算することができる。すなわち、低域の重みを大きくすることができる。
Note that the
次に、データ削除部34は、図15に示されるように、エネルギgkが最小である周波数に対応する要素を、index2[k]から、削除することにより、index2[k]を圧縮する。さらに、データ削除部34は、エネルギgkの値が0である周波数に対応する存在フラグFLGkを0に設定する。
Next, the
さらに、データ削除部34は、変更された存在フラグFLGkに基づいて、上述した方法を用いて符号数列Ctを生成する。このデータ削除部34によるデータ削除により、値が0となる存在フラグFLGkが増えて、0の連続数が増加し、符号数列Ctの符号長は短くなる。データ削除部34は、圧縮されたindex2[k]と符号数列Ctとを記憶装置12に格納する。そして、データ削除部34は、エントロピ符号化部32に処理開始を通知する。
Further, the
そして、エントロピ符号化部32は、図12に示されるデータを記憶装置12から読み出して、改めてエントロピ符号化を行い、符号化されたデータを、記憶装置12に記憶する。そして、エントロピ符号化部32は、符号量比較部33に処理開始を通知する。
Then, the entropy encoding unit 32 reads out the data shown in FIG. 12 from the storage device 12, performs entropy encoding again, and stores the encoded data in the storage device 12. Then, the entropy encoding unit 32 notifies the code
符号量比較部33は、符号化データの符号量と目標符号量とを再び比較する。このようにして、符号量比較部33における判定が肯定されるまで、データ削除部34におけるデータ削除と、エントロピ符号化部32におけるエントロピ符号化が繰り返される。この繰り返しの過程で、図15に示されるように、エネルギgkの小さい順に、MDCT係数群が、符号化対象から除外され、index2[k]の要素数K(K<M/2−1)が減り、符号数列Ctが減っていくようになり、結果的に、符号化されるデータの符号量が小さくなっていく。
The code
符号量が目標符号量以下となり、符号量比較部33における判定が肯定されると、そのときの符号化データが、符号列として記憶装置12に格納される。
When the code amount becomes equal to or less than the target code amount and the determination in the code
次に、復号部17について説明する。復号部17は、記憶装置12から符号化データを読み出して符号化データを復号し、デジタル音声信号を生成する。復号部17は、図16に示されるように、エントロピ復号部41と、係数逆ベクトル量子化(VQ)部42と、周波数並び替え部43と、逆量子化部44と、最大値列逆ベクトル量子化(VQ)部45と、最大値乗算部46と、ゲイン合成部47と、IMDCT部48と、コードブック50、51とを備える。
Next, the
エントロピ復号部41は、記憶装置12から読み出された符号化データのエントロピ復号を行い、図12に示される各種データを取得する。これらのデータは、記憶装置12に格納される。エントロピ復号部41は、係数逆ベクトル量子化(VQ)部42に、処理開始を通知する。 The entropy decoding unit 41 performs entropy decoding of the encoded data read from the storage device 12, and acquires various data shown in FIG. These data are stored in the storage device 12. The entropy decoding unit 41 notifies the coefficient inverse vector quantization (VQ) unit 42 of the start of processing.
この通知を受けて、係数逆ベクトル量子化(VQ)部42は、符号数列Ctと、index2[k](k=1〜K)とに基づいて、コードブック51を参照して、逆ベクトル量子化を行い、MDCT係数Xqkを生成する。より具体的には、係数逆VQ部42は、まず、図17に示されるように、符号数列Ctに基づいて、存在フラグFLGkを復号する。復号では、存在フラグFLGkが1になっているところに、index2[k](k=1〜K)の各要素が対応する。したがって、係数逆ベクトル量子化(VQ)部42は、復号された存在フラグFLGkを参照し、存在フラグFLGkが0になっている周波数では、係数ベクトルFkを0ベクトルとし、存在フラグFLGkが1になっている周波数では、index2[k]に対応するコードブック51の係数ベクトルを、kの順に、係数ベクトルFkとして設定する。
In response to this notification, the coefficient inverse vector quantization (VQ) unit 42 refers to the
このようにして、係数逆ベクトル量子化(VQ)部42は、すべての周波数におけるMDCT係数群Fkを生成する。図17には、このようにして生成されたMDCT係数群Fkの一例が模式的に示されている。MDCT係数群Fkは、すべての要素が0の係数群か、コードブック51内の係数ベクトルW1〜Wsに対応する係数群かのいずれかとなる。MDCT係数群Fkの1つ1つの要素が、MDCT係数Xqk,iである。係数逆ベクトル量子化(VQ)部42は、MDCT係数Xqk,iを、記憶装置12に格納する。そして、係数逆ベクトル量子化(VQ)部42は、周波数並び換え部43に処理開始を通知する。
In this way, the coefficient inverse vector quantization (VQ) unit 42 generates the MDCT coefficient group F k at all frequencies. FIG. 17 schematically shows an example of the MDCT coefficient group F k generated in this way. The MDCT coefficient group F k is either a coefficient group in which all elements are 0 or a coefficient group corresponding to the coefficient vectors W 1 to W s in the
この通知を受けて、周波数並び換え部43は、記憶装置12に格納されていたMDCT係数Xqk,iを、各ブロックのMDCT係数群、すなわち周波数方向に並び替え、記憶装置12に格納する。そして、周波数並び換え部43は、逆量子化部44に処理開始を通知する。
In response to this notification, the
この通知を受けて、逆量子化部44は、記憶装置12から読み出された各ブロックのMDCT係数Xqkに対し、分割帯域b_p毎に予め設定された精度で逆量子化を行い、MDCT係数Xekをブロック毎に生成する。逆量子化部44は、取得されたMDCT係数Xekを、記憶装置12に格納し、最大値列逆ベクトル量子化(VQ)部45に処理開始を通知する。 In response to this notification, the inverse quantization unit 44 performs inverse quantization on the MDCT coefficient Xq k of each block read from the storage device 12 with an accuracy set in advance for each divided band b_p, and the MDCT coefficient to generate a Xe k for each block. Inverse quantization unit 44, the acquired MDCT coefficients Xe k, stored in the storage device 12, and sends the processing start to the maximum column inverse vector quantization (VQ) unit 45.
この通知を受けて、最大値列逆ベクトル量子化(VQ)部45は、コードブック50を参照して、復号され記憶装置12に格納されている最大値列のデータ列index1[i]に基づいてベクトル逆量子化を行い、最大値列env[p]Nを取得する。最大値列env[p]Nは、記憶装置12に格納される。最大値列逆ベクトル量子化(VQ)部45は、最大値乗算部46に処理開始を通知する。
In response to this notification, the maximum value sequence inverse vector quantization (VQ) unit 45 refers to the
この通知を受けて、最大値乗算部46は、その分割帯域b_pに属するMDCT係数Xekを抽出し、抽出されたMDCT係数Xekと、env[p]に格納された最大値env_pとを乗算する。この乗算により、各ブロックのMDCT係数Xnkが取得される。最大値乗算部46は、取得された各ブロックのMDCT係数Xnkを記憶装置12に格納し、ゲイン合成部47に処理開始を通知する。
Upon receiving this notification, the
この通知を受けて、ゲイン合成部47は、記憶装置12から読み出された各ブロックのMDCT係数Xnkに、復号された最大値gainを乗算し、各ブロックのMDCT係数Xkを取得する。ゲイン合成部47は、取得されMDCT係数Xkを記憶装置12に格納するとともに、IMDCT部48に処理開始を通知する。
In response to this notification, the
IMDCT部48は、記憶装置12から読み出されたMDCT係数Xkに対して、ブロック毎に逆MDCTを行う。IMDCT部48は、さらに、この逆MDCTにより得られた各ブロックのデジタル信号を合成して、デジタル音声信号Sound1を復元する。復元されたデジタル音声信号Sound1は、音声入出力装置11に送られ、再生される。 The IMDCT unit 48 performs inverse MDCT for each block on the MDCT coefficient X k read from the storage device 12. The IMDCT unit 48 further synthesizes the digital signals of the blocks obtained by the inverse MDCT to restore the digital audio signal Sound1. The restored digital audio signal Sound1 is sent to the audio input / output device 11 and reproduced.
次に、本実施形態に係る音声処理装置1の動作について説明する。符号化部16における符号化動作では、まず、図18に示されるように、DC削除部21において直流成分Xdcが削除されたデジタル信号が、MDCT部23においてN個のブロック信号に分割される。1ブロック当たりのサンプル数はMである。
Next, the operation of the
その後、MDCT部23においてブロック毎にMDCTが行われる。図19には、このときの符号量が、模式的に示されている。この時点で、1つの変換係数のビット長が16ビットであるとすると、フレーム単位の符号量は、16×N(ブロック数)×M/2−1(1ブロックあたりの変換係数の数)となっている。
Thereafter, MDCT is performed for each block in the
その後、正規化部24において、MDCT係数の正規化が行われる。正規化が行われると、すべてのMDCT係数のデータ長は、例えば、16ビットから8ビットに短縮され、図20に示されるように、1フレームあたりの符号量は、1/2に短縮される。
Thereafter, the
次に、図21に示されるように、帯域分割部25において、周波数帯域がP個に分割され、それぞれの分割帯域における最大値env[1]〜env[P]が検索される。そして、図22に示されるように、最大値列VQ部27において、求められた最大値列にenv[1]〜env[P]に対するベクトル量子化が行われ、コードブック50を参照して、最大値列のデータ列index1[i](i=1〜N)が生成される。
Next, as shown in FIG. 21, the
次に、最大値除算部28において、最大値env[1]〜env[P]を用いて、MDCT係数の除算が行われる。図23では、index1[i]に対応するコードブック50のベクトルの各要素(逆量子化値)を用いて、各分割帯域に属するMDCT係数が除算される様子が模式的に示されている。この除算により、MDCT係数のビット数はさらに小さくなる。
Next, the maximum
次に、量子化部29におけるMDCT係数の量子化後、図24に示されるように、時間順並び替え部30におけるMDCT係数の並び替えが行われる。なお、量子化では、低域になればなるほど、MDCT変換係数のビット数は増加するようになるが、図24では、図面の錯綜を防止するために、周波数全域にわたって、MDCT変換係数のビット数が同じであるものとしている。そして、図25に示されるように、係数VQ部31において、コードブック51を参照して、MDCT係数のベクトル量子化が行われ、index2[k]が求められる。そして、図26に示されるように、データ削除部34においてエネルギgkが算出され、そのエネルギgkが小さい順にMDCT係数群が削除され、index2[k]が圧縮され、フラグFLGkが変更され、符号数列Ctが圧縮される。
Next, after the quantization of the MDCT coefficients in the
そして、図27に示されるように、エントロピ符号化部32において、gain、index1[i]、index2[k]、Ctが符号化されるようになる。エネルギが小さい順に周波数に対応するMDCT係数群が削除されればされるほど、index2[k]、符号数列Ctのデータ長は短くなり、データ圧縮率が向上する。 Then, as shown in FIG. 27, the entropy encoding unit 32, gain, index1 [i] , index2 [k], C t is to be coded. As the MDCT coefficient group corresponding to the frequency is deleted in ascending order of energy, the data length of the index 2 [k] and the code sequence C t is shortened, and the data compression rate is improved.
次に、復号部17における復号の際には、図28に示されるように、符号数列CtからフラグFLGkが復号される。そして、フラグFLGkと、圧縮されたindex2[k]とに基づいて、index2[k]が復元される。そして、復元されたindex2[k]に基づいて、コードブック51を参照して、各周波数のMDCT係数群が復元される。一方、index1[i]に基づいて、最大値列env[p](env_p)が復元される。そして、分割帯域ごとに、復号されたMDCT係数群と、最大値env_pとが乗算されて、MDCT係数Xqkが復元される。そして、MDCT係数Xnkが、最大値gainと乗算されて、MDCT係数Xkが復元される。復元されたMDCT係数Xkを、逆MDCTすることにより、各ブロックの音声信号が復元され、これらの音声信号がフレーム単位の音声信号に合成される。
Then, upon decoding in the
このように、上述のように符号化されたデータは、復号部17で復号されることにより、16ビットで量子化され、周波数16kHzでサンプリングされた元の音声信号に復元される。この結果、音声処理装置1によって再生される音声の音質は、学習用途に好適なものとなる。
As described above, the data encoded as described above is decoded by the
以上述べたように、本実施形態によれば、エネルギの小さい順にMDCT係数群のデータを削除する。このようにすれば、音質に影響しないデータを優先的に削除することができるようになるので、音質を低下させることなく、符号化効率を高めることができるようになる。 As described above, according to the present embodiment, the data of the MDCT coefficient group is deleted in ascending order of energy. In this way, data that does not affect the sound quality can be preferentially deleted, so that the coding efficiency can be increased without degrading the sound quality.
≪第2の実施形態≫
次に、本発明の第2の実施形態について説明する。本実施形態では、符号化部16の構成が、上記第1の実施形態に係る符号化部16の構成と異なっている。
<< Second Embodiment >>
Next, a second embodiment of the present invention will be described. In the present embodiment, the configuration of the
図29に示されるように、本実施形態に係る符号化部16は、データ削除部34の代わりに符号化周波数選択部35を備えている。また、本実施形態に係る符号化部16では、符号量比較部33が設けられておらず、この比較結果によるループも設けられていない。
As illustrated in FIG. 29, the
符号化周波数選択部35は、エントロピ符号化部32における符号化対象となる周波数を選択する。符号化周波数選択部35は、周波数毎に重要度を算出し、この重要度に基づいて、符号化対象となる周波数を選択する。 The encoding frequency selection unit 35 selects a frequency to be encoded in the entropy encoding unit 32. The encoding frequency selection unit 35 calculates importance for each frequency, and selects a frequency to be encoded based on the importance.
より具体的には、符号化周波数選択部35は、上記式(8)に従ってエネルギgkを算出し、このエネルギgkが高いほど、この周波数の重要度が高いと判定する。そして、符号化周波数選択部35は、重要度の高い順に、符号化対象の周波数を選択する。 More specifically, the encoding frequency selection unit 35 calculates the energy g k according to the above equation (8), and determines that the importance of this frequency is higher as the energy g k is higher. Then, the encoding frequency selection unit 35 selects encoding target frequencies in descending order of importance.
なお、符号化周波数選択部35は、エネルギgkに、周波数に依存した重み係数を乗算するようにしてもよい。例えば、符号化周波数選択部35は、500Hz未満の周波数帯域の周波数のMDCT係数には、1.3を乗算し、500以上3500Hz未満の周波数帯域の周波数のMDCT係数には、1.1を乗算し、3500Hz以上の周波数帯域の周波数のMDCT係数には、1.0を乗算するようにしてもよい。 The encoding frequency selection unit 35 may multiply the energy g k by a frequency-dependent weighting factor. For example, the encoding frequency selection unit 35 multiplies the MDCT coefficient in the frequency band of less than 500 Hz by 1.3, and multiplies the MDCT coefficient in the frequency band of 500 to less than 3500 Hz by 1.1. Then, the MDCT coefficient of the frequency band of 3500 Hz or higher may be multiplied by 1.0.
符号化周波数選択部35は、符号化データの符号量が目標符号量に達したか否かを判別し、符号化データの符号量が目標符号量に達するまで、符号化する周波数を選択する。符号化周波数選択部35は、選択された周波数のMDCT係数群についてのベクトル量子化により得られるインデックスを、周波数順に並び替えることにより、index2[k]を生成する。また、符号化周波数選択部35は、選択された周波数のMDCT係数群に対応するフラグFLGkを1に設定し、残りのフラグFLGkを0に設定する。そして、符号化周波数選択部35は、生成されたフラグFLGkを符号数列Ctに符号化する。符号化周波数選択部35は、index2[k]及び符号数列Ctを記憶装置12に格納する。そして、符号化周波数選択部35は、エントロピ符号化部32に処理開始を通知する。 The encoding frequency selection unit 35 determines whether or not the code amount of the encoded data has reached the target code amount, and selects a frequency to be encoded until the code amount of the encoded data reaches the target code amount. The encoding frequency selection unit 35 generates index2 [k] by rearranging the indexes obtained by vector quantization for the MDCT coefficient group of the selected frequency in order of frequency. Also, the encoding frequency selection unit 35 sets the flag FLG k corresponding to the MDCT coefficient group of the selected frequency to 1, and sets the remaining flag FLG k to 0. Then, the encoding frequency selection unit 35 encodes the generated flag FLG k into a code number sequence C t . The encoding frequency selection unit 35 stores the index 2 [k] and the code number sequence C t in the storage device 12. Then, the encoding frequency selection unit 35 notifies the entropy encoding unit 32 of the start of processing.
エントロピ符号化部32では、上記第1の実施形態と同様に、図12に示されるデータを符号化して、符号化データを生成する。 The entropy encoding unit 32 encodes the data shown in FIG. 12 to generate encoded data, as in the first embodiment.
以上述べたように、本実施形態のように、重要度の低い方からデータを削除するのではなく、重要度の高い方から選択した方が、目標符号量に達するまでに符号化されるデータ量を、少なくすることができるので、符号化に要する時間を短縮することができるようになる。 As described above, instead of deleting data from the lower importance as in the present embodiment, the data selected before reaching the target code amount is selected from the higher importance. Since the amount can be reduced, the time required for encoding can be shortened.
≪第3の実施形態≫
次に、本発明の第3の実施形態について説明する。本実施形態に係る音声処理装置の構成は、上記各実施形態に係る音声処理装置の構成と同じであるので、詳細な説明を省略する。
<< Third Embodiment >>
Next, a third embodiment of the present invention will be described. Since the configuration of the speech processing apparatus according to this embodiment is the same as the configuration of the speech processing apparatus according to each of the above embodiments, detailed description thereof is omitted.
本実施形態では、音声データの圧縮がフレーム単位で行われるだけでなく、複数のフレームにまたがって、音声データの圧縮が行われる。図30には、本実施形態に係る音声処理装置の符号化動作のフローチャートが示されている。まず、CPU15は、ステップ201に示されるように、符号化部16において、上記各実施形態で説明したように、フレーム毎にデジタル音声信号の符号化を行う。ここで、目標符号量は、フレーム毎に変更することができる。次のステップ203では、CPU15は、全フレームが符号化されたか否かを判定する。この判定が否定されれば、CPU15は、ステップ201に戻る。このようにして、全フレームの符号化が行われる。
In the present embodiment, the audio data is compressed not only in units of frames, but also is compressed over a plurality of frames. FIG. 30 shows a flowchart of the encoding operation of the speech processing apparatus according to this embodiment. First, as shown in
ステップ203における判定が肯定されると、CPU15は、ステップ205に進む。ステップ205では、CPU15は、全フレームの符号量の和を算出する。次のステップ207では、CPU15は、符号量の和が、全体の目標符号量以下であるか否かを判定する。この判定が肯定されれば、CPU15は、符号化処理を終了する。一方、この判定が否定されれば、CPU15は、ステップ209に進む。
If the determination in
ステップ209では、CPU15は、重要度が最小であるMDCT係数群を、全フレームから検索する。例えば、図31に示されるように、フレーム1では、5つのMDCT係数群が符号化対象となっており、フレーム2では、4つのMDCT係数群が符号化対象となっており、フレーム3では、4つのMDCT係数群が符号化対象となっているものとする。また、i番目のフレームの周波数kのエネルギをgi,kとする。この場合、CPU15は、すべてのMDCT係数群を、エネルギgi,kの低い順に並べ替え、エネルギgi,kの最小の変換係数群を検索する。図31の例では、フレーム1のMDCT係数群F9のエネルギg1,9が最小となっている。
In
次のステップ211では、CPU15は、エネルギgi,kが最小のMDCT係数群を、符号化対象から除外する。図31の例では、フレーム1の変換係数群F9が、符号化対象から除外されるようになる。次のステップ213では、CPU15は、MDCT係数群が符号化対象から除外されたフレーム全体を再符号化する。図31の例では、フレーム1に関するデータが再符号化されるようになる。
In the
ステップ213を行った後は、CPU15は、ステップ205に戻り、全フレームの符号量の和の算出(ステップ205)、全体の目標符号量との比較(ステップ207)を行う。このようにして、ステップ207における判定が肯定されるまで、ステップ205→207→209→211→213が繰り返される。このようにして、複数のフレームの符号化量が、全体の目標符号化量に抑えられる。
After performing
なお、上記ステップ211では、MDCT係数群を1つずつ除外したが、一度に複数除外するようにしてもよい。
In
本実施形態では、ステップ207が、全体符号量判定部に対応し、ステップ209、211が、調整部に対応し、ステップ213が、再符号化部に対応する。本実施形態によれば、複数のフレーム全体でのデータ圧縮が可能となる。このため、音質を維持するために、データ圧縮率を低くせざるをえないフレームは、データ圧縮率を低くしても、データ圧縮率を高めても音質にさほど影響のないフレームのデータ圧縮率を高めて、全体のデータ圧縮率を向上させることができる。
In the present embodiment,
例えば、各フレームの目標符号量を、16〜20kbpsとし、全体の目標符号量を12kbpsとする。このようにすれば、フレームによっては、音質を低下させないために符号量を20kbps程度とし、データ圧縮率を高めても音質に影響しない他のフレームでのデータ圧縮を高め、全体として符号量を12kbps以下とすることができるようになる。この結果、音質を確保しつつ、そのデータの符号化効率を向上させることができる。 For example, the target code amount of each frame is set to 16 to 20 kbps, and the entire target code amount is set to 12 kbps. In this way, depending on the frame, the code amount is set to about 20 kbps in order not to deteriorate the sound quality, and the data compression in other frames that do not affect the sound quality even if the data compression rate is increased is improved, and the code amount is set to 12 kbps as a whole. It will be possible to: As a result, the coding efficiency of the data can be improved while ensuring the sound quality.
以上詳細に説明したように、上記各実施形態によれば、時間順並び替え部30により、MDCT係数を、周波数毎にグループ化し、エネルギの小さいグループを除去している。これにより、音質を損ねることなく符号化効率を高めることができる。さらに、周波数毎にまとめられたMDCT係数群をベクトル量子化しているので、それらをスカラ量子化するよりも、データ圧縮率を高めることができる。この結果、音質を損なうことなく、符号化効率を高めることができる。
As described above in detail, according to each of the above embodiments, the MDCT coefficients are grouped for each frequency by the time
また、上記各実施形態によれば、最大値列VQ部27において、最大値列インデックスのデータ列をベクトル量子化しているので、それらをスカラ量子化するよりも、データ圧縮率を高めることができる。この結果、音質を損なうことなく、符号化効率を高めることができる。
Further, according to each of the above embodiments, the maximum value
上記各実施形態に係る符号化動作を行うことにより、16KHzサンプリングの音声信号が、学習用途音質を維持したまま、12kbps程度に圧縮可能となる。 By performing the encoding operation according to each of the above embodiments, a 16 KHz sampling audio signal can be compressed to about 12 kbps while maintaining the sound quality for learning use.
また、上記各実施形態によれば、データ削除部34又は符号化周波数選択部35において、フラグ列FLGkが、そのフラグ列FLGkにおいて同一の値が連続する連続数の数列Ctに変換される。これにより、可逆な状態を保ったまま、データ圧縮率をさらに高めることができる。この結果、音質を損なうことなく、符号化効率を高めることができる。
Further, according to the above embodiments, the
また、上記各実施形態によれば、データ削除部34又は符号化周波数選択部35では、フラグ列FLGkにおいて、同一の値が連続する連続数がその上限値に等しい場合には、符号数列Ctにおいて、その連続数と次の連続数との間に、0が挿入される。このように、連続数の上限値を設けるようにすれば、フラグ列FLGkの連続数の出現パターンが、どのようなものであっても、符号数列によるデータ長を、等しく短くすることができるようになる。
Further, according to each of the above embodiments, in the
また、上記各実施形態によれば、データ削除部34又は符号化周波数選択部35では、フラグ列FLGkが、1から開始される場合には、符号数列Ctの先頭に0が挿入される。このようにすれば、フラグ列FLGkに対する可逆なデータ圧縮が可能となる。
Further, according to the above embodiments, the
なお、人間の聴覚の特性上、音声信号の音質を高めるためには、低音域に関わる符号化量をできるだけ多くし、高音域に関わる符号化量を相対的に少なくするのが望ましい。そこで、上記各実施形態では、量子化部におけるビット数や、エネルギgkに乗ずる重みなどを低音域で多くした。このような観点からすると、MDCT係数のベクトル量子化に用いるコードブックを、低音域のものと高音域のものと2つ用意し、低音域のコードブックは、ベクトルの数qを多くし、高音域のコードブックは、ベクトルの数qを相対的に少なくするようにしてもよい。 In order to improve the sound quality of the audio signal, it is desirable to increase the coding amount related to the low sound range as much as possible and relatively reduce the coding amount related to the high sound region in terms of human auditory characteristics. Therefore, in each of the above embodiments, the number of bits in the quantization unit, the weight multiplied by the energy g k , and the like are increased in the low sound range. From this point of view, two codebooks for low-frequency and high-frequency codebooks are prepared for use in vector quantization of MDCT coefficients. The low-frequency codebook increases the number of vectors q, In the codebook of the range, the number q of vectors may be relatively reduced.
なお、上記各実施形態では、周波数変換としてMDCTを適用した。しかし、周波数変換方法としては、MDCTに限られるものではなく、DCTを採用することもできる。 In each of the above embodiments, MDCT is applied as frequency conversion. However, the frequency conversion method is not limited to MDCT, and DCT can also be adopted.
また、上記各実施形態では、プログラムが、それぞれメモリ等に予め記憶されているものとして説明した。しかし、上述の処理を実行させるためのプログラムを、フレキシブルディスク、CD−ROM(Compact Disk Read-Only Memory)、DVD(Digital Versatile Disk)、MO(Magneto Optical disk)などのコンピュータ読み取り可能な記録媒体に格納して配布し、これを別のコンピュータにインストールし、上述の手段として動作させ、あるいは、上述の工程を実行させてもよい。 In each of the above-described embodiments, the program is described as being stored in advance in a memory or the like. However, a program for executing the above-described processing is stored on a computer-readable recording medium such as a flexible disk, a CD-ROM (Compact Disk Read-Only Memory), a DVD (Digital Versatile Disk), or an MO (Magneto Optical disk). It may be stored and distributed, installed in another computer, operated as the above-mentioned means, or the above-mentioned steps may be executed.
さらに、インターネット上のサーバ装置が有するディスク装置等にプログラムを格納しておき、例えば、搬送波に重畳させて、コンピュータにダウンロード等するものとしてもよい。 Furthermore, the program may be stored in a disk device or the like included in a server device on the Internet, and may be downloaded onto a computer by being superimposed on a carrier wave, for example.
なお、本発明は、上記実施形態に限定されず、種々の変形及び応用が可能である。上述のハードウェア構成やブロック構成、フローチャートは例示であって、限定されるものではない。例えば、上記各実施形態では、音声処理装置として、携帯電話や電子辞書を想定して説明した。しかしながら、PHS(Personal Handyphone System)や、PDA(Personal Digital Assistants)、あるいは一般的なパーソナルコンピュータにも、本発明を容易に適用することができる。すなわち、上記実施形態は説明のためのものであり、本願発明の範囲を制限するものではない。 In addition, this invention is not limited to the said embodiment, A various deformation | transformation and application are possible. The above-described hardware configuration, block configuration, and flowchart are examples, and are not limited. For example, in each of the embodiments described above, a mobile phone or an electronic dictionary has been described as the voice processing device. However, the present invention can be easily applied to PHS (Personal Handyphone System), PDA (Personal Digital Assistants), or general personal computers. That is, the said embodiment is for description and does not restrict | limit the scope of the present invention.
1 音声処理装置
11 音声入出力装置
12 記憶装置
13 ROM
14 RAM
15 CPU
16 符号化部
17 復号部
21 DC除去部
22 フレーム化部
23 MDCT部
24 正規化部
25 帯域分割部
26 最大値検索部
27 最大値列ベクトル量子化部
28 最大値除算部
29 量子化部
30 時間順並び替え部
31 係数ベクトル量子化部
32 エントロピ符号化部
33 符号量比較部
34 データ削除部
35 符号化周波数選択部
41 エントロピ復号部
42 係数逆ベクトル量子化部
43 周波数並び替え部
44 逆量子化部
45 最大値列逆ベクトル量子化部
46 最大値乗算部
47 ゲイン合成部
48 IMDCT部
50、51 コードブック
DESCRIPTION OF
14 RAM
15 CPU
16 encoding
Claims (9)
前記各ブロックのデジタル信号をそれぞれ周波数変換し、第1の変換係数群をブロック毎に生成する周波数変換部と、
前記周波数変換部で生成された第1の変換係数群を、周波数が高くなるにつれて帯域幅が広くなるような複数の小周波数帯域に分割する帯域分割部と、
前記小周波数帯域に属する前記第1の変換係数の絶対値の最大値を、前記小周波数帯域毎に検索し、検索された最大値を周波数順に並べることにより、最大値列を、前記ブロック毎に生成する最大値検索部と、
前記各ブロックの最大値列を、最大値列コードブックを用いてベクトル量子化し、求められたインデックスを、時系列順に並べることにより、最大値列インデックスのデータ列を生成する最大値列ベクトル量子化部と、
前記最大値列ベクトル量子化部で求めた前記各ブロックの最大値列のインデックスを前記最大値列コードブックを用いて逆量子化し、前記各ブロックのそれぞれの小周波数帯域に属する第1の変換係数群を、当該ブロックに対応する逆量子化値であって当該小周波数帯域の逆量子化値を用いて除算する除算部と、
前記除算部で除算された前記各ブロックの第1の変換係数群にそれぞれ含まれる同一周波数の変換係数を、時系列に並び替えることにより、第2の変換係数群を、周波数毎に生成する時系列並び替え部と、
前記各周波数の第2の変換係数群を、変換係数コードブックを用いてベクトル量子化し、求められたインデックスを、周波数順に並べることにより、変換係数インデックスのデータ列を生成する変換係数ベクトル量子化部と、
前記各周波数の第2の変換係数群の重要度に基づいて、前記変換係数インデックスのデータ列を圧縮し、前記各周波数の第2の変換係数群が符号化対象であるか否かを示すフラグに関する情報を生成するデータ圧縮部と、
前記最大値列ベクトル量子化部で生成された最大値列インデックスのデータ列と前記データ圧縮部で生成された前記フラグに関する情報と、前記圧縮されたデータ列とを符号化する符号化部と、
を備える符号化装置。 A dividing unit that divides a digital signal having a predetermined time length into a plurality of blocks;
A frequency conversion unit that frequency-converts the digital signal of each block and generates a first conversion coefficient group for each block;
A band dividing unit that divides the first transform coefficient group generated by the frequency converting unit into a plurality of small frequency bands such that the bandwidth increases as the frequency increases;
By searching the maximum value of the absolute value of the first transform coefficient belonging to the small frequency band for each small frequency band, and arranging the searched maximum values in order of frequency, a maximum value string is obtained for each block. A maximum value search unit to be generated;
Maximum value sequence vector quantization that generates a data sequence of the maximum value sequence index by vector quantizing the maximum value sequence of each block using a maximum value sequence codebook and arranging the obtained indexes in time series order And
A first transform coefficient belonging to each small frequency band of each block by inversely quantizing the maximum value sequence index of each block obtained by the maximum value sequence vector quantization unit using the maximum value sequence codebook A division unit that divides the group by using the inverse quantization value corresponding to the block and the inverse quantization value of the small frequency band;
When generating a second transform coefficient group for each frequency by rearranging the transform coefficients of the same frequency included in the first transform coefficient group of each block divided by the division unit in time series A series sorting section;
A transform coefficient vector quantization unit that vector-quantizes the second transform coefficient group of each frequency using a transform coefficient codebook and generates a data string of transform coefficient indexes by arranging the obtained indexes in order of frequency. When,
A flag indicating whether or not the second transform coefficient group of each frequency is a coding target by compressing the data string of the transform coefficient index based on the importance of the second transform coefficient group of each frequency. A data compression unit that generates information about,
An encoding unit that encodes the data sequence of the maximum value sequence index generated by the maximum value sequence vector quantization unit, the information about the flag generated by the data compression unit, and the compressed data sequence;
An encoding device comprising:
前記データ圧縮部は、
前記符号量判定部の判定が否定された場合に、前記重要度が小さい順に、第2の変換係数群を、符号化対象から削除することにより、前記変換係数インデックスのデータ列を圧縮して、前記フラグに関する情報を生成し、
前記符号化部は、
前記符号量判定部の判定が肯定されるまで、前記データ圧縮部によって圧縮された前記データ列と、生成された前記フラグに関する情報とを符号化することを特徴とする請求項1に記載の符号化装置。 A code amount determination unit that repeats the determination of whether or not the code amount of the data encoded by the encoding unit is smaller than the target code amount until the determination is affirmative,
The data compression unit
When the determination of the code amount determination unit is denied, by compressing the data sequence of the transform coefficient index by deleting the second transform coefficient group from the encoding target in order of increasing importance, Generating information about the flag,
The encoding unit includes:
2. The code according to claim 1, wherein the data sequence compressed by the data compression unit and the information on the generated flag are encoded until the determination of the code amount determination unit is affirmed. Device.
前記符号化されるデータの符号量が目標符号量より少なく、かつ、その目標符号量に近い値となるまで、前記重要度が高い順に、前記符号化部の符号化対象となる周波数を選択し、
選択された周波数に対応する第2の変換係数群を符号化対象として、前記変換係数インデックスのデータ列を圧縮し、前記フラグに関する情報を生成することを特徴とする請求項1に記載の符号化装置。 The data compression unit
The frequency to be encoded by the encoding unit is selected in descending order of importance until the code amount of the encoded data is less than the target code amount and close to the target code amount. ,
2. The encoding according to claim 1, wherein the second conversion coefficient group corresponding to the selected frequency is used as an encoding target, and the data sequence of the conversion coefficient index is compressed to generate information on the flag. apparatus.
前記生成されたフラグを、周波数順に並べることによりフラグ列を形成し、
形成されたフラグ列に基づいて、そのフラグ列において同一の値が連続する連続数の数列を前記フラグに関する情報として生成することを特徴とする請求項1に記載の符号化装置。 The data compression unit
Forming a flag string by arranging the generated flags in order of frequency,
2. The encoding apparatus according to claim 1, wherein, based on the formed flag sequence, a continuous number sequence in which the same value continues in the flag sequence is generated as information on the flag.
前記フラグ列において、同一の値が連続する連続数がその上限値に等しい場合には、前記数列において、その連続数と、次の連続数との間に、0を挿入することを特徴とする請求項4に記載の符号化装置。 The data compression unit
In the flag sequence, when the consecutive number of consecutive identical values is equal to the upper limit value, 0 is inserted between the consecutive number and the next consecutive number in the number sequence. The encoding device according to claim 4 .
前記フラグ列が、1から開始される場合には、前記数列の先頭に0を挿入することを特徴とする請求項4又は5に記載の符号化装置。 The data compression unit
The flag sequence will, when starting from 1, the encoding apparatus according to claim 4 or 5, characterized in that inserting a 0 to the beginning of the sequence.
前記全体符号量判定部の判定が否定された場合に、前記重要度が全体で最小となる第2の変換係数群に対応する変換係数インデックスを、前記変換係数インデックスのデータ列から除外し、除外された第2の変換係数群に対応する前記フラグを符号化対象でないことを示す値に変更する調整部と、
前記変換係数インデックスが除外され、前記フラグが変更された前記所定時間長のデジタル信号に関するデータを再符号化する再符号化部と、をさらに備えることを特徴とする請求項1乃至6のいずれか一項に記載の符号化装置。 It is determined whether or not the sum of the code amounts of the encoded data encoded by the encoding unit with respect to the series of the plurality of digital signals having the predetermined time length is smaller than the entire target code amount. An overall code amount determination unit that repeats until affirmed;
When the determination of the overall code amount determination unit is negative, the conversion coefficient index corresponding to the second conversion coefficient group having the minimum importance as a whole is excluded from the data string of the conversion coefficient index and excluded An adjustment unit that changes the flag corresponding to the second transformed coefficient group to a value indicating that it is not an encoding target;
The transform coefficient index is excluded, any of claims 1 to 6, further comprising a, a re-encoding unit for re-encoding the data relating to the flag modified digital signals of said predetermined time length The encoding device according to one item.
前記各ブロックのデジタル信号をそれぞれ周波数変換し、第1の変換係数群をブロック毎に生成する周波数変換工程と、
前記周波数変換工程で生成された第1の変換係数群を、周波数が高くなるにつれて帯域幅が広くなるような複数の小周波数帯域に分割する帯域分割工程と、
前記小周波数帯域に属する前記第1の変換係数の絶対値の最大値を、前記小周波数帯域毎に検索し、検索された最大値を周波数順に並べることにより、最大値列を、前記ブロック毎に生成する最大値検索工程と、
前記各ブロックの最大値列を、最大値列コードブックを用いてベクトル量子化し、求められたインデックスを、時系列順に並べることにより、最大値列インデックスのデータ列を生成する最大値列ベクトル量子化工程と、
前記最大値列ベクトル量子化工程で求めた前記各ブロックの最大値列のインデックスを前記最大値列コードブックを用いて逆量子化し、前記各ブロックのそれぞれの小周波数帯域に属する第1の変換係数群を、当該ブロックに対応する逆量子化値であって当該小周波数帯域の逆量子化値を用いて除算する除算工程と、
前記除算工程で除算された前記各ブロックの第1の変換係数群にそれぞれ含まれる同一周波数の変換係数を、時系列に並び替えることにより、第2の変換係数群を、周波数毎に生成する時系列並び替え工程と、
前記各周波数の第2の変換係数群を、変換係数コードブックを用いてベクトル量子化し、求められたインデックスを、周波数順に並べることにより、変換係数インデックスのデータ列を生成する変換係数ベクトル量子化工程と、
前記各周波数の第2の変換係数群の重要度に基づいて、前記変換係数インデックスのデータ列を圧縮し、前記各周波数の第2の変換係数群が符号化対象であるか否かを示すフラグに関する情報を生成するデータ圧縮工程と、
前記最大値列ベクトル量子化工程で生成された最大値列インデックスのデータ列と前記データ圧縮工程で生成された前記フラグに関する情報と、前記圧縮されたデータ列とを符号化する符号化工程と、
を含む符号化方法。 A dividing step of dividing a digital signal having a predetermined time length into a plurality of blocks;
A frequency conversion step of frequency-converting the digital signal of each block to generate a first conversion coefficient group for each block;
A band dividing step of dividing the first transform coefficient group generated in the frequency converting step into a plurality of small frequency bands such that the bandwidth becomes wider as the frequency becomes higher;
By searching the maximum value of the absolute value of the first transform coefficient belonging to the small frequency band for each small frequency band, and arranging the searched maximum values in order of frequency, a maximum value string is obtained for each block. A maximum value search step to be generated;
Maximum value sequence vector quantization that generates a data sequence of the maximum value sequence index by vector quantizing the maximum value sequence of each block using a maximum value sequence codebook and arranging the obtained indexes in time series order Process,
The first transform coefficient belonging to each small frequency band of each block by inversely quantizing the maximum value sequence index of each block obtained in the maximum value sequence vector quantization step using the maximum value sequence codebook A division step of dividing the group by using the inverse quantization value corresponding to the block and the inverse quantization value of the small frequency band;
When generating the second transform coefficient group for each frequency by rearranging the transform coefficients of the same frequency included in the first transform coefficient group of each block divided in the division step in time series A series rearrangement process;
Transform coefficient vector quantization step of generating a data sequence of transform coefficient indices by vector quantizing the second transform coefficient group of each frequency using a transform coefficient codebook and arranging the obtained indexes in order of frequency When,
A flag indicating whether or not the second transform coefficient group of each frequency is a coding target by compressing the data string of the transform coefficient index based on the importance of the second transform coefficient group of each frequency. A data compression process for generating information about,
An encoding step for encoding the data sequence of the maximum value sequence index generated in the maximum value sequence vector quantization step, the information about the flag generated in the data compression step, and the compressed data sequence;
An encoding method including:
前記各ブロックのデジタル信号をそれぞれ周波数変換し、第1の変換係数群をブロック毎に生成する周波数変換手順と、
前記周波数変換手順で生成された第1の変換係数群を、周波数が高くなるにつれて帯域幅が広くなるような複数の小周波数帯域に分割する帯域分割手順と、
前記小周波数帯域に属する前記第1の変換係数の絶対値の最大値を、前記小周波数帯域毎に検索し、検索された最大値を周波数順に並べることにより、最大値列を、前記ブロック毎に生成する最大値検索手順と、
前記各ブロックの最大値列を、最大値列コードブックを用いてベクトル量子化し、求められたインデックスを、時系列順に並べることにより、最大値列インデックスのデータ列を生成する最大値列ベクトル量子化手順と、
前記最大値列ベクトル量子化手順で求めた前記各ブロックの最大値列のインデックスを前記最大値列コードブックを用いて逆量子化し、前記各ブロックのそれぞれの小周波数帯域に属する第1の変換係数群を、当該ブロックに対応する逆量子化値であって当該小周波数帯域の逆量子化値を用いて除算する除算手順と、
前記除算手順で除算された前記各ブロックの第1の変換係数群にそれぞれ含まれる同一周波数の変換係数を、時系列に並び替えることにより、第2の変換係数群を、周波数毎に生成する時系列並び替え手順と、
前記各周波数の第2の変換係数群を、変換係数コードブックを用いてベクトル量子化し、求められたインデックスを、周波数順に並べることにより、変換係数インデックスのデータ列を生成する変換係数ベクトル量子化手順と、
前記各周波数の第2の変換係数群の重要度に基づいて、前記変換係数インデックスのデータ列を圧縮し、前記各周波数の第2の変換係数群が符号化対象であるか否かを示すフラグに関する情報を生成するデータ圧縮手順と、
前記最大値列ベクトル量子化手順で生成された最大値列インデックスのデータ列と前記データ圧縮手順で生成された前記フラグに関する情報と、前記圧縮されたデータ列とを符号化する符号化手順と、
をコンピュータに実行させるプログラム。 A division procedure for dividing a digital signal of a predetermined time length into a plurality of blocks;
A frequency conversion procedure for frequency-converting the digital signal of each block and generating a first conversion coefficient group for each block;
A band division procedure for dividing the first transform coefficient group generated by the frequency conversion procedure into a plurality of small frequency bands in which the bandwidth becomes wider as the frequency becomes higher;
By searching the maximum value of the absolute value of the first transform coefficient belonging to the small frequency band for each small frequency band, and arranging the searched maximum values in order of frequency, a maximum value string is obtained for each block. The maximum value search procedure to generate,
Maximum value sequence vector quantization that generates a data sequence of the maximum value sequence index by vector quantizing the maximum value sequence of each block using a maximum value sequence codebook and arranging the obtained indexes in time series order Procedure and
A first transform coefficient belonging to each small frequency band of each block by inversely quantizing the maximum value sequence index of each block obtained by the maximum value sequence vector quantization procedure using the maximum value sequence codebook A division procedure for dividing a group by using an inverse quantization value corresponding to the block and using the inverse quantization value of the small frequency band;
When generating the second transform coefficient group for each frequency by rearranging the transform coefficients of the same frequency included in the first transform coefficient group of each block divided by the division procedure in time series Series reordering procedure,
A transform coefficient vector quantization procedure for vector-quantizing the second transform coefficient group of each frequency using a transform coefficient codebook and generating a data sequence of transform coefficient indexes by arranging the obtained indexes in order of frequency. When,
A flag indicating whether or not the second transform coefficient group of each frequency is a coding target by compressing the data string of the transform coefficient index based on the importance of the second transform coefficient group of each frequency. A data compression procedure to generate information about,
An encoding procedure for encoding the data sequence of the maximum value sequence index generated by the maximum value sequence vector quantization procedure, the information about the flag generated by the data compression procedure, and the compressed data sequence;
A program that causes a computer to execute.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008099810A JP4978539B2 (en) | 2008-04-07 | 2008-04-07 | Encoding apparatus, encoding method, and program. |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008099810A JP4978539B2 (en) | 2008-04-07 | 2008-04-07 | Encoding apparatus, encoding method, and program. |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009253706A JP2009253706A (en) | 2009-10-29 |
JP4978539B2 true JP4978539B2 (en) | 2012-07-18 |
Family
ID=41313932
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008099810A Active JP4978539B2 (en) | 2008-04-07 | 2008-04-07 | Encoding apparatus, encoding method, and program. |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4978539B2 (en) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5250591B2 (en) * | 2010-08-12 | 2013-07-31 | 京セラドキュメントソリューションズ株式会社 | Image compression apparatus and method, and image forming apparatus |
WO2012102149A1 (en) * | 2011-01-25 | 2012-08-02 | 日本電信電話株式会社 | Encoding method, encoding device, periodic feature amount determination method, periodic feature amount determination device, program and recording medium |
JP5890963B2 (en) * | 2011-03-17 | 2016-03-22 | 富士通株式会社 | Data storage program and data storage method |
EP2745211B8 (en) | 2011-08-19 | 2019-07-17 | General Harmonics International Inc. | Multi-structural, multi-level information formalization and structuring method, and associated apparatus |
CN112189136B (en) * | 2018-06-01 | 2024-01-09 | 株式会社岛津制作所 | Data processing method and device for equipment analysis |
CN115955250B (en) * | 2023-03-14 | 2023-05-12 | 燕山大学 | College scientific research data acquisition management system |
CN116913057B (en) * | 2023-09-12 | 2023-12-01 | 西安中创博远网络科技有限公司 | Livestock-raising abnormal early warning system based on thing networking |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4009781B2 (en) * | 2003-10-27 | 2007-11-21 | カシオ計算機株式会社 | Speech processing apparatus and speech coding method |
JP4259401B2 (en) * | 2004-06-02 | 2009-04-30 | カシオ計算機株式会社 | Speech processing apparatus and speech coding method |
JP4548348B2 (en) * | 2006-01-18 | 2010-09-22 | カシオ計算機株式会社 | Speech coding apparatus and speech coding method |
-
2008
- 2008-04-07 JP JP2008099810A patent/JP4978539B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2009253706A (en) | 2009-10-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4800645B2 (en) | Speech coding apparatus and speech coding method | |
US7599833B2 (en) | Apparatus and method for coding residual signals of audio signals into a frequency domain and apparatus and method for decoding the same | |
JP4548348B2 (en) | Speech coding apparatus and speech coding method | |
JP4978539B2 (en) | Encoding apparatus, encoding method, and program. | |
JP2012226375A (en) | Lossless audio decoding method and lossless audio decoding apparatus | |
KR20080049116A (en) | Audio coding | |
JP3344962B2 (en) | Audio signal encoding device and audio signal decoding device | |
CN103843062A (en) | Apparatus and method for generating bandwidth extension signal | |
JPWO2006120931A1 (en) | Encoding device, decoding device and methods thereof | |
KR20060135699A (en) | Signal decoding apparatus and signal decoding method | |
JP3344944B2 (en) | Audio signal encoding device, audio signal decoding device, audio signal encoding method, and audio signal decoding method | |
JP2003108197A (en) | Audio signal decoding device and audio signal encoding device | |
US20090210219A1 (en) | Apparatus and method for coding and decoding residual signal | |
CN112970063A (en) | Method and apparatus for rate quality scalable coding with generative models | |
KR100789368B1 (en) | Apparatus and Method for coding and decoding residual signal | |
JP3237178B2 (en) | Encoding method and decoding method | |
JP4009781B2 (en) | Speech processing apparatus and speech coding method | |
JP4578145B2 (en) | Speech coding apparatus, speech decoding apparatus, and methods thereof | |
JP2002091497A (en) | Audio signal encoding method and decoding methods, and storage medium stored with program to execute these methods | |
JP2004246038A (en) | Speech or musical sound signal encoding method, decoding method, encoding device, decoding device, encoding program, and decoding program | |
JP5018557B2 (en) | Encoding device, decoding device, encoding method, decoding method, and program | |
JP2009193015A (en) | Coding apparatus, decoding apparatus, coding method, decoding method, and program | |
JP4054919B2 (en) | Speech processing apparatus and speech coding method | |
JP4626261B2 (en) | Speech coding apparatus and speech coding method | |
JP2005128401A (en) | Speech processor and speech encoding method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110308 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111219 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120104 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120302 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120321 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120403 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150427 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4978539 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |