JP2000151414A - Digital audio encoding device/method and recording medium recording encoding program - Google Patents

Digital audio encoding device/method and recording medium recording encoding program

Info

Publication number
JP2000151414A
JP2000151414A JP10322644A JP32264498A JP2000151414A JP 2000151414 A JP2000151414 A JP 2000151414A JP 10322644 A JP10322644 A JP 10322644A JP 32264498 A JP32264498 A JP 32264498A JP 2000151414 A JP2000151414 A JP 2000151414A
Authority
JP
Japan
Prior art keywords
audio data
sampling
digital audio
data
band
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10322644A
Other languages
Japanese (ja)
Inventor
Tatsuya Murata
達也 村田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP10322644A priority Critical patent/JP2000151414A/en
Publication of JP2000151414A publication Critical patent/JP2000151414A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To provide an encoding device whose constitution can be simplified and whose encoding processing of a digital audio signal can be executed at high speed by providing a sub-band division part setting all audio data of a sub-band pertaining to the specified and above frequency area of a frequency which is N times larger than that of the frequency after up-sampling. SOLUTION: An up-sampling part 11 generates PCM data sampled by a sampling frequency which is N times larger than a prescribed sampling frequency from input PCM data sampled by the prescribed sampling frequency based on up-sampling information N given from outside. A sub-band division part 12 sets all the samplings of a band pertaining to a frequency area which is 1/(2×N) of/above the up-sampled sampling frequency to zero. All samples pertaining to sub-band data are set to zero and are outputted to a bit allocation part 14.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、パソコンや放送な
どのマルチメディア技術分野で用いられているオーディ
オ信号を圧縮符号化して、ディジタルオーディオ符号化
信号を生成するディジタルオーディオ符号化装置、同符
号化方法、及び同符号化プログラムを記録した記録媒体
に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a digital audio encoding apparatus which compresses and encodes an audio signal used in the field of multimedia technology such as personal computers and broadcasting to generate a digital audio encoded signal. The present invention relates to a method and a recording medium on which the encoding program is recorded.

【0002】[0002]

【従来の技術】近年、ディジタル技術の進歩に伴って、
パーソナルコンピュータ(以下、”パソコン”と略称す
る)の性能が著しく向上している。このため、パソコン
においては、従来では困難であったMPEG規格(ISO/
IEC 11172-3,13818-3)に基づいたビットストリームの
再生が可能となり、更にMPEG規格に基づく符号化も
実施できるようになってきた。上記MPEG規格に代表
される高能率圧縮技術では、オーディオ信号の原信号を
帯域分割した後に、各帯域信号を符号化したサブバンド
符号化方式のディジタルオーディオ信号が用いられてい
る。さらに、MPEGオーディオ規格では、ディジタル
オーディオ信号のサンプリング周波数として、32KH
z,44.1KHz,48KHzを規定している。一
方、パソコンや放送などのマルチメディア技術分野で
は、22.05KHzや11.025KHzのサンプリン
グ周波数でサンプリングされたPCMデータをディジタ
ルオーディオ信号として一般的に使用してきた。それゆ
え、パソコンにおいて、上述のMPEGオーディオ規格
に基づくデータ処理を実行するためには、ディジタルオ
ーディオ符号化装置を用いて上記PCMデータを44.
1KHzにアップサンプリングしたデータに変換してか
ら符号化する必要がある。
2. Description of the Related Art In recent years, with the progress of digital technology,
The performance of personal computers (hereinafter abbreviated as "PCs") has been significantly improved. For this reason, in the personal computer, the MPEG standard (ISO / ISO
It has become possible to reproduce a bit stream based on IEC 11172-3, 13818-3), and to carry out encoding based on the MPEG standard. In the high-efficiency compression technology represented by the MPEG standard, a digital audio signal of a sub-band encoding method in which an original signal of an audio signal is divided into bands and each band signal is encoded. Further, according to the MPEG audio standard, the sampling frequency of a digital audio signal is 32 KH.
z, 44.1 KHz and 48 KHz are specified. On the other hand, in the field of multimedia technologies such as personal computers and broadcasting, PCM data sampled at a sampling frequency of 22.05 KHz or 11.025 KHz has been generally used as a digital audio signal. Therefore, in order to execute data processing based on the above-mentioned MPEG audio standard in a personal computer, the PCM data is converted to 44.
It is necessary to convert the data to data up-sampled to 1 KHz before encoding.

【0003】以下、従来のディジタルオーディオ符号化
装置について、図3を用いて具体的に説明する。尚、以
下の説明では、22.05KHzでサンプリングされた
1チャンネル(モノラル)のPCMデータを44.1K
Hzにアップサンプリングして、MPEG1オーディオ
規格に基づいたディジタルオーディオ信号を生成する場
合について説明する。図3は、従来のディジタルオーデ
ィオ符号化装置の主要部の構成を示すブロック図であ
る。図3において、この従来のディジタルオーディオ符
号化装置は、MPEG1オーディオ規格を用いたMPE
Gオーディオ符号化部30と、その前段に設けられ、オ
ーディオ信号の原信号から入力PCMデータを生成する
入力データ生成部(図示せず)に分けられる。さらに、
従来のディジタルオーディオ符号化装置には、入力デー
タ生成部からの入力PCMデータをアップサンプリング
するアップサンプリング部31、及び前記アップサンプ
リング部31からのPCMデータにフィルタ処理を施す
フィルタ処理部32が設けられている。この従来のディ
ジタルオーディオ符号化装置では、入力データ生成部が
元のPCMデータのサンプリング周波数に対して何倍に
アップサンプリングするかを設定して、アップサンプリ
ング情報N(Nは2の階乗)としてアップサンプリング
部31とフィルタ処理部32に出力する。この説明で
は、22.05KHzから44.1KHzにアップサンプ
リングするので、アップサンプリング情報Nは2とな
る。
Hereinafter, a conventional digital audio encoding device will be described in detail with reference to FIG. In the following description, one channel (monaural) PCM data sampled at 22.05 KHz is converted to 44.1K.
A case where a digital audio signal based on the MPEG1 audio standard is generated by upsampling to Hz will be described. FIG. 3 is a block diagram showing a configuration of a main part of a conventional digital audio encoding device. Referring to FIG. 3, this conventional digital audio encoding apparatus is an MPE using the MPEG1 audio standard.
It is divided into a G audio encoding unit 30 and an input data generation unit (not shown) which is provided at the preceding stage and generates input PCM data from an original signal of the audio signal. further,
The conventional digital audio encoding device is provided with an up-sampling unit 31 for up-sampling input PCM data from an input data generating unit, and a filter processing unit 32 for filtering PCM data from the up-sampling unit 31. ing. In this conventional digital audio encoding apparatus, the input data generation unit sets how many times the sampling frequency of the original PCM data is up-sampled, and sets up-sampling information N (N is a factor of 2). Output to the upsampling unit 31 and the filter processing unit 32. In this description, up-sampling is performed from 22.05 KHz to 44.1 KHz.

【0004】アップサンプリング部31は、入力データ
生成部から与えられるアップサンプリング情報N(=
2)を用いて、所定のサンプリング周波数(22.05
KHz)でサンプリングされた入力PCMデータからそ
のN倍のサンプリング周波数(44.1KHz)でサン
プリングされたPCMデータを生成する。具体的には、
アップサンプリング部31は、隣り合う入力PCMデー
タの平均値により補間して、アップサンプリング後のP
CMデータをフィルタ処理部32に出力する。フィルタ
処理部32は、アップサンプリング部31でアップサン
プリングされたPCMデータに対して折り返しノイズを
除去するためにフィルタ処理を行い、MPEGオーディ
オ符号化部30に出力する。
[0004] The upsampling section 31 provides upsampling information N (=) provided from an input data generating section.
2), a predetermined sampling frequency (22.05
KM), and generates PCM data sampled at N times the sampling frequency (44.1 KHz) from the input PCM data sampled at KHz. In particular,
The up-sampling unit 31 interpolates the average value of the adjacent input PCM data to obtain the Ps after the up-sampling.
The CM data is output to the filter processing unit 32. The filter processing unit 32 performs a filtering process on the PCM data up-sampled by the up-sampling unit 31 to remove aliasing noise, and outputs the result to the MPEG audio encoding unit 30.

【0005】ここで、図4を参照して、従来のディジタ
ルオーディオ符号化装置におけるアップサンプリング部
31での補間処理について、詳細に説明する。図4は、
図3に示したアップサンプリング部での補間処理を示す
説明図である。まずMPEG1規格に基づいてオーディ
オ信号を符号化するためには、1チャンネル(モノラ
ル)のオーディオ信号では1152個のPCMデータが
必要であり、2チャンネル(ステレオ)のオーディオ信
号ではその2倍の2304個のPCMデータが必要であ
り、それぞれ1フレーム分のPCMデータと呼ぶことに
する。この説明では1チャンネルの場合を説明している
ので、アップサンプリング部31は1152個のPCM
データ毎にアップサンプリング後のPCMデータをフィ
ルタ処理部32を経てMPEGオーディオ符号化部30
に出力する。従って、アップサンプリング部31では、
図4に示すように、元の入力PCMデータにおいて隣り
合う2つの入力PCMデータの平均値で補間したアップ
サンプリング後のPCMデータを生成する。ここでは、
アップサンプリング部31は2倍のアップサンプリング
を行うので、同図に示すように、1フレーム分のPCM
データと次のフレームの先頭のPCMデータの合計57
7個のPCMデータから1152個のPCMデータを生
成している。このように、アップサンプリング部31に
よって符号化に必要なPCMデータを生成されるが、そ
のPCMデータには、後段のMPEGオーディオ符号化
部30で周波数分割する際に生じる折り返しノイズを含
んでいる。このため、上述のフィルタ処理部32(図
3)は、帯域制限を行って折り返しノイズを除去する。
MPEGオーディオ符号化部30(図3)は、上記帯域
制限された1152個のPCMデータを44.1KHz
でサンプリングしたデータとして符号化する。
Here, with reference to FIG. 4, the interpolation processing in the up-sampling section 31 in the conventional digital audio encoding device will be described in detail. FIG.
FIG. 4 is an explanatory diagram illustrating an interpolation process in the upsampling unit illustrated in FIG. 3. First, in order to encode an audio signal based on the MPEG1 standard, 1 channel (monaural) audio signal requires 1152 pieces of PCM data, and 2 channel (stereo) audio signal is twice as large as 2304 pieces of data. PCM data is required, and each of them is referred to as one frame of PCM data. In this description, the case of one channel is described, so that the up-sampling unit 31 has 1152 PCMs.
The up-sampled PCM data for each data is passed through a filter processor 32 to an MPEG audio encoder 30.
Output to Therefore, in the up-sampling unit 31,
As shown in FIG. 4, upsampled PCM data interpolated by an average value of two adjacent input PCM data in the original input PCM data is generated. here,
Since the up-sampling unit 31 performs double up-sampling, as shown in FIG.
Total 57 of data and PCM data at the head of next frame
1152 pieces of PCM data are generated from the seven pieces of PCM data. As described above, the PCM data necessary for encoding is generated by the up-sampling unit 31, and the PCM data includes aliasing noise generated when the subsequent MPEG audio encoding unit 30 performs frequency division. Therefore, the above-described filter processing unit 32 (FIG. 3) performs band limitation to remove aliasing noise.
The MPEG audio encoder 30 (FIG. 3) converts the band-limited 1152 pieces of PCM data to 44.1 kHz.
Is encoded as data sampled by.

【0006】図3に戻って、MPEGオーディオ符号化
部30を含んだ従来のディジタルオーディオ符号化装置
には、例えば特開平9−134200号公報に記載され
たものが知られている。まずMPEGオーディオ符号化
部30内で利用されている人間の聴覚心理モデルについ
て説明する。つまり、MPEG規格によるオーディオ信
号の圧縮符号化においては、オーディオ信号を受け取る
人間の感覚の性質を利用して、感度の低い細部の情報を
省略し符号(データ)量を低減(圧縮)する知覚符号化
方式を採用している。詳細には、聴覚特性のうちマスキ
ング現象と臨界帯域とを利用して聞き取れないオーディ
オ信号は取り除き、必要なオーディオ信号のみを符号化
してビットを割当てることにより、元のオーディオ信号
より少量のビットで符号化しても、その原音と殆ど同じ
水準の音質を得ることができる。ここで、マスキング現
象とは、オーディオ信号間の干渉により一つのオーディ
オ信号が他のオーディオ信号によりマスキングされて、
全く聞き取れない現象である。また、臨界帯域とは、人
間が音の周波数を区分する一種の単位であって、一般に
24個の帯域に分けられる。これらの帯域のうち高周波
数信号であるほど、その帯域の幅はログ・スケール(対
数単位)で大きくなる。したがって、臨界帯域では、低
周波数信号よりは高周波数信号を区分しにくいものであ
る。MPEGオーディオ符号化部30では上述の聴覚特
性を用いてビットを割り当てを行うため、信号対雑音比
(SNR)と信号対マスク・レベル比(SMR)を求
め、これらの値から更にマスク・レベル対雑音比(MN
R)を計算する。ここで、マスク・レベルとは、聞き取
れない最小の信号レベルである。したがって、このマス
ク・レベル以下の信号にはビットを割り当てを行う必要
はない。
Returning to FIG. 3, a conventional digital audio encoding device including an MPEG audio encoding unit 30 is known, for example, from Japanese Patent Application Laid-Open No. 9-134200. First, a human psychoacoustic model used in the MPEG audio encoding unit 30 will be described. In other words, in the compression encoding of an audio signal according to the MPEG standard, a perceptual code that reduces (compresses) the amount of code (data) by omitting information with low sensitivity and using details of the human sense of receiving the audio signal. Is adopted. More specifically, audio signals that cannot be heard are removed by using the masking phenomenon and the critical band in the auditory characteristics, and only necessary audio signals are encoded and bits are allocated, so that the bits can be encoded with fewer bits than the original audio signal. Even if the sound quality is changed, the same sound quality as the original sound can be obtained. Here, the masking phenomenon means that one audio signal is masked by another audio signal due to interference between audio signals,
It is a phenomenon that cannot be heard at all. Further, the critical band is a kind of unit for dividing the frequency of a sound by a human, and is generally divided into 24 bands. The higher the frequency of these bands, the greater the width of the band on a log scale (logarithmic unit). Therefore, in the critical band, it is more difficult to distinguish high frequency signals than low frequency signals. Since the MPEG audio encoding unit 30 allocates bits using the above-described auditory characteristics, a signal-to-noise ratio (SNR) and a signal-to-mask level ratio (SMR) are obtained. Noise ratio (MN
R) is calculated. Here, the mask level is the minimum signal level that cannot be heard. Therefore, there is no need to assign bits to signals below this mask level.

【0007】MPEGオーディオ符号化部30は、フィ
ルタ処理部32からの帯域制限されたPCMデータに上
記知覚符号化を施すために、図3に示すサブバンド分割
部33、ビット割り当て情報生成部34、ビット割り当
て部35、及び多重化部36により構成されている。サ
ブバンド分割部33は、フィルタ処理部32からの時間
領域のPCMデータを32個の均等なサブバンドに分け
た周波数領域のサブバンドデータに変換する。サブバン
ドデータには、各サブバンドにおいて、12個(レイヤ
Iの場合)、又は36個(レイヤIIの場合)のサンプ
ルを含んでいる。さらに、サブバンド分割部33は、再
生時での音圧レベルを示すスケール・ファクタを入力し
たPCMデータから取得して符号化する。このスケール
・ファクタの個数は全部で64個なので、この情報の符
号化に必要なビット数は6ビットである。さらに、この
情報の符号化方法は各レイヤによって異なり、レイヤI
では、各帯域(サブバンド)に存在する12個のサンプ
ルのうち最大値を求めて、求めた最大値と一致するか、
やや大きい値をその帯域のスケール・ファクタとする。
一方、レイヤIIでは、各帯域に三つのスケール・ファ
クタが存在するため、各スケール・ファクタの類似性を
検討して三つのスケール・ファクタのうち、何個を符号
化するかを決める。すなわち、符号化するスケール・フ
ァクタの数は隣接するスケール・ファクタとの差値の範
囲に応じて異なる。したがって、レイヤIIでは、レイ
ヤIとは異なり、スケール・ファクタを選択するための
付加情報を必要とするが、スケール・ファクタは2ビッ
トで符号化される。
[0007] In order to perform the above-described perceptual encoding on the band-limited PCM data from the filter processing unit 32, the MPEG audio encoding unit 30 includes a sub-band division unit 33, a bit allocation information generation unit 34, It comprises a bit allocating unit 35 and a multiplexing unit 36. The sub-band division unit 33 converts the PCM data in the time domain from the filter processing unit 32 into sub-band data in the frequency domain divided into 32 equal sub-bands. The subband data includes 12 (in the case of layer I) or 36 (in the case of layer II) samples in each subband. Further, the sub-band dividing unit 33 obtains a scale factor indicating a sound pressure level at the time of reproduction from the input PCM data and encodes the scale factor. Since the number of scale factors is 64 in total, the number of bits required for encoding this information is 6 bits. Furthermore, the encoding method of this information differs for each layer,
Then, the maximum value of the twelve samples existing in each band (sub-band) is obtained, and it is determined whether the maximum value matches the obtained maximum value.
A slightly larger value is used as the scale factor of the band.
On the other hand, in Layer II, since there are three scale factors in each band, the similarity of each scale factor is examined to determine how many of the three scale factors are to be coded. That is, the number of scale factors to be encoded differs depending on the range of the difference value between adjacent scale factors. Thus, unlike Layer I, Layer II requires additional information to select the scale factor, but the scale factor is encoded with two bits.

【0008】ビット割り当て情報生成部34は、人間の
聴覚特性を利用して、フィルタ処理部32から入力した
PCMデータから上述の信号対マスク・レベル比(SM
R)を生成する。ビット割り当て情報生成部34の最終
出力値は、各帯域毎にビット割り当ての基準であるビッ
ト割り当て情報(SMR値)としてビット割り当て部3
5に出力される。詳細にいえば、このSMR値は、下記
の一連の九つの段階によって計算される。第1段階では
高速フーリエ変換(FFT)により時間領域のオーディ
オ信号(PCMデータ)を周波数領域に変換し、第2段
階では各帯域の音圧レベルを計算する。第3段階では絶
対マスキング・スレショルド(しきい)値を計算し、第
4段階ではオーディオ信号の有声音と無声音成分を決定
する。第5段階では有声音のうちマスクする音であるマ
スカー(Masker)を決定し、第6段階では各帯域のマス
キング・スレショルド値を計算する。第7段階では全て
の帯域のマスキング・スレショルド値を計算し、第8段
階では各帯域の最小マスキング・スレショルド値を計算
する。そして、第9段階では各帯域のSMR値を計算す
る。
[0008] The bit allocation information generation unit 34 utilizes the human auditory characteristics to convert the PCM data input from the filter processing unit 32 into the aforementioned signal-to-mask level ratio (SM).
R). The final output value of the bit allocation information generator 34 is used as bit allocation information (SMR value) as a bit allocation reference for each band.
5 is output. Specifically, this SMR value is calculated by a series of nine steps as follows. In the first stage, the audio signal (PCM data) in the time domain is converted into the frequency domain by the fast Fourier transform (FFT), and in the second stage, the sound pressure level in each band is calculated. In a third step, an absolute masking threshold value is calculated, and in a fourth step, voiced and unvoiced sound components of the audio signal are determined. In the fifth step, a masker which is a sound to be masked among voiced sounds is determined, and in the sixth step, a masking threshold value of each band is calculated. In the seventh step, masking threshold values of all bands are calculated, and in the eighth step, the minimum masking threshold value of each band is calculated. In the ninth stage, the SMR value of each band is calculated.

【0009】ビット割り当て部35は、サブバンド分割
部33からの各帯域のサブバンドデータにビット割り当
て処理と量子化処理を施して多重化部36に出力する。
ビット割り当て処理では、ビット割り当て情報生成部3
4からのSMR値に基づいて、下記の一連の四つの段階
を繰り返して行い、各帯域の割り当てビット数を求め
る。第1段階では初期の割り当てビットを0とし、第2
段階では各帯域について上記マスク・レベル対雑音比で
あるMNR値を求める。この際、MNR値は、各帯域毎
に信号対雑音比であるSNR値からSMR値を減算する
ことにより算出される。第3段階では各帯域に求められ
たMNR値のうち最小のMNR値をもつ帯域を探し出し
て、その帯域の割り当てビット数を例えば1つ増加し、
第4段階では増加した割り当てビット数が求められる割
り当てビット数を超えないとき、残り他の帯域について
第2及び第3段階を繰り返して行う。また、量子化処理
は、上記ビット割り当て処理に続いて、下記の一連の四
つの段階を繰り返して行われる。第1段階では、各帯域
内のサンプルをスケール・ファクタで割ってXとする。
第2段階では、”A×X+B”(A,Bは所定のテーブ
ル値)を計算する。第3段階では第2段階で計算された
値のうちビット割り当て処理から得られた割り当てビッ
ト数を求め、第4段階では求めた割り当てビット数の最
上位ビット(MSB)を反転させて量子化データとして
出力する。このようにして得られた量子化データに対し
て多重化部36は、MPEG規格に規定されたヘッダ部
等を付加して、MPEGオーディオビットストリームと
して形成して出力する。
[0009] The bit allocation unit 35 performs bit allocation processing and quantization processing on the sub-band data of each band from the sub-band division unit 33, and outputs the result to the multiplexing unit 36.
In the bit allocation process, the bit allocation information generation unit 3
Based on the SMR value from No. 4, the following series of four steps are repeated to determine the number of bits allocated to each band. In the first stage, the initial allocation bits are set to 0, and the second
In the step, an MNR value, which is the above-described mask level-to-noise ratio, is obtained for each band. At this time, the MNR value is calculated by subtracting the SMR value from the SNR value that is the signal-to-noise ratio for each band. In the third stage, a band having the smallest MNR value is searched for among the MNR values obtained for each band, and the number of bits allocated to the band is increased by, for example, one.
In the fourth step, when the increased number of allocated bits does not exceed the required number of allocated bits, the second and third steps are repeated for the remaining other bands. Further, the quantization process is performed by repeating the following four steps following the bit allocation process. In the first stage, the samples in each band are divided by the scale factor to give X.
In the second stage, “A × X + B” (A and B are predetermined table values) is calculated. In the third step, the number of allocated bits obtained from the bit allocation processing among the values calculated in the second step is obtained. In the fourth step, the most significant bit (MSB) of the obtained allocated bit number is inverted to obtain the quantized data. Output as The multiplexing unit 36 adds a header part and the like defined in the MPEG standard to the quantized data thus obtained, and forms and outputs the MPEG audio bit stream.

【0010】以上のように、従来のディジタルオーディ
オ符号化装置では、アップサンプリングした後のPCM
データをフィルタ処理部32で帯域制限して、MPEG
オーディオ符号化部30を用いてMPEGオーディオビ
ットストリームを形成していた。
As described above, in the conventional digital audio encoding device, the upsampled PCM
The data is band-limited by the filter processing unit 32 and MPEG
The MPEG audio bit stream was formed using the audio encoding unit 30.

【0011】[0011]

【発明が解決しようとする課題】上記のような従来のデ
ィジタルオーディオ符号化装置では、折り返しノイズを
除去するために、MPEGオーディオ符号化部の前段に
フィルタ処理部を接続して、アップサンプリング後のP
CMデータの帯域制限(フィルタ処理)を行う必要があ
った。このため、従来のディジタルオーディオ符号化装
置では、当該装置の構成を簡略化することができないと
いう問題点を生じた。さらに、この従来のディジタルオ
ーディオ符号化装置では、MPEGオーディオ符号化部
は周波数成分を含んでいないサブバンドデータについて
も、ビット割り当て処理や量子化処理を行っていた。そ
の結果、従来のディジタルオーディオ符号化装置では、
オーディオ信号の符号化処理の処理効率を向上すること
が困難であり、その符号化処理に多大な時間を要した。
In the conventional digital audio encoding apparatus as described above, in order to remove aliasing noise, a filter processing section is connected in front of the MPEG audio encoding section, and after upsampling, P
It was necessary to limit the band of CM data (filter processing). For this reason, the conventional digital audio encoding device has a problem that the configuration of the device cannot be simplified. Further, in this conventional digital audio encoding device, the MPEG audio encoding unit performs bit allocation processing and quantization processing on subband data that does not include a frequency component. As a result, in the conventional digital audio encoding device,
It was difficult to improve the processing efficiency of the audio signal encoding process, and the encoding process required a great deal of time.

【0012】さらに、従来のディジタルオーディオ符号
化装置では、アップサンプリング部でのアップサンプリ
ングの処理が複雑で、時間を要するという問題点があっ
た。詳細にいえば、従来のディジタルオーディオ符号化
装置では、アップサンプリング部は、1フレーム分のP
CMデータを生成するとき、1フレーム分の入力PCM
データだけでなく、次のフレームの先頭の入力PCMデ
ータを用いていた。具体的には、図4に示したように、
1152番目の最後のPCMデータは、576番目の入
力PCMデータと次のフレームの1番目の入力PCMデ
ータとの平均値により生成していた。このため、このア
ップサンプリング部では、処理対象のフレームだけでな
く、次のフレームの先頭の入力PCMデータを先読み処
理を行って取得する必要があった。さらに、このアップ
サンプリング部では、上述の先読み処理だけでなく、ア
ップサンプリングの処理終了後に先読みした先頭の入力
PCMデータを元のフレームに移動する処理や読み出し
位置情報を先読み処理した分だけ戻すなどの処理を別に
行う必要があった。
Further, the conventional digital audio encoding apparatus has a problem that the up-sampling process in the up-sampling section is complicated and takes time. More specifically, in the conventional digital audio encoding device, the up-sampling unit uses one frame of P
When generating CM data, input PCM for one frame
In addition to the data, the input PCM data at the head of the next frame is used. Specifically, as shown in FIG.
The 1152th last PCM data was generated by the average value of the 576th input PCM data and the 1st input PCM data of the next frame. For this reason, in this upsampling unit, it is necessary to acquire not only the processing target frame but also the leading input PCM data of the next frame by performing a pre-reading process. Further, this up-sampling unit performs not only the pre-reading process described above, but also a process of moving the first input PCM data pre-read after the end of the up-sampling process to the original frame, returning the read position information by the pre-reading process, and the like. Processing had to be performed separately.

【0013】この発明は、上記のような問題点を解決す
るためになされたものであり、当該装置の構成を簡略化
することができ、ディジタルオーディオ信号の符号化処
理を軽減し高速に行うディジタルオーディオ符号化装
置、同符号化方法、及び同符号化プログラムを記録した
記録媒体を提供することを目的とする。
SUMMARY OF THE INVENTION The present invention has been made to solve the above-mentioned problems, and can simplify the structure of the apparatus, reduce the encoding processing of digital audio signals, and perform high-speed digital processing. An object of the present invention is to provide an audio encoding device, an encoding method, and a recording medium on which the encoding program is recorded.

【0014】[0014]

【課題を解決するための手段】本発明のディジタルオー
ディオ符号化装置は、アップサンプリング情報N(Nは
2の階乗)に基づいて、所定のサンプリング周波数でサ
ンプリングされた入力ディジタルオーディオデータをア
ップサンプリングして、N倍のサンプリング周波数でサ
ンプリングされたオーディオデータを生成するアップサ
ンプリング部、及び前記アップサンプリング部からのオ
ーディオデータを所定のサブバンドに分割する帯域分割
処理を施し、さらにアップサンプリング後のN倍のサン
プリング周波数の1/(2×N)以上の周波数領域に属
するサブバンドの全てのオーディオデータをゼロの値に
設定するサブバンド分割部を備えている。このように構
成することにより、当該装置の構成を簡略化することが
でき、ディジタルオーディオ信号の符号化処理を高速に
行うことができる。
According to the present invention, there is provided a digital audio encoding apparatus for up-sampling input digital audio data sampled at a predetermined sampling frequency based on up-sampling information N (N is a factor of 2). Then, an up-sampling unit that generates audio data sampled at N times the sampling frequency and a band division process of dividing the audio data from the up-sampling unit into predetermined subbands are performed. A sub-band division unit is provided for setting all audio data of sub-bands belonging to a frequency region equal to or more than 1 / (2 × N) of the double sampling frequency to a value of zero. With this configuration, the configuration of the device can be simplified, and the encoding process of the digital audio signal can be performed at high speed.

【0015】別の観点による発明のディジタルオーディ
オ符号化装置は、前記入力ディジタルオーディオデータ
の1フレーム分のデータ数をM個(Mは自然数)とした
とき、前記アップサンプリング部が、1番目からM番目
の前記入力ディジタルオーディオデータを用いて、1番
目から(M×N−N)番目までの前記オーディオデータ
を生成し、M番目の前記入力ディジタルオーディオデー
タを(M×N−N+1)番目から(M×N)番目の前記
オーディオデータとするよう構成している。このように
構成することにより、アップサンプリング部での処理を
軽減することができ、ディジタルオーディオ信号の符号
化処理を高速に行うことができる。
In a digital audio encoding apparatus according to another aspect of the present invention, when the number of data for one frame of the input digital audio data is M (M is a natural number), the up-sampling unit sets M data from the first to M. The first to (M × N−N) th audio data are generated by using the first input digital audio data, and the Mth input digital audio data is converted from the (M × N−N + 1) th to (M × N−N + 1) th. (M × N) th audio data. With this configuration, it is possible to reduce the processing in the upsampling unit, and to perform the encoding processing of the digital audio signal at high speed.

【0016】本発明のディジタルオーディオ符号化装置
の符号化方法は、アップサンプリング情報N(Nは2の
階乗)に基づいて、所定のサンプリング周波数でサンプ
リングされた入力ディジタルオーディオデータをアップ
サンプリングして、N倍のサンプリング周波数でサンプ
リングされたオーディオデータを生成するアップサンプ
リングステップ、及び前記アップサンプリングステップ
で生成したオーディオデータを所定のサブバンドに分割
する帯域分割処理を施し、さらにアップサンプリング後
のN倍のサンプリング周波数の1/(2×N)以上の周
波数領域に属するサブバンドの全てのオーディオデータ
をゼロの値に設定するサブバンド分割ステップを備えて
いる。このように構成することにより、当該装置の構成
を簡略化することができ、ディジタルオーディオ信号の
符号化処理を高速に行うことができる。
In the encoding method of the digital audio encoding apparatus according to the present invention, input digital audio data sampled at a predetermined sampling frequency is up-sampled based on up-sampling information N (N is a factor of 2). , An upsampling step of generating audio data sampled at N times the sampling frequency, and a band division process of dividing the audio data generated in the upsampling step into predetermined subbands. Sub-band division step of setting all audio data of sub-bands belonging to a frequency region equal to or more than 1 / (2 × N) of the sampling frequency of the sub-band to zero. With this configuration, the configuration of the device can be simplified, and the encoding process of the digital audio signal can be performed at high speed.

【0017】別の観点による発明のディジタルオーディ
オ符号化装置の符号化方法は、前記入力ディジタルオー
ディオデータの1フレーム分のデータ数をM個(Mは自
然数)としたとき、前記アップサンプリングステップに
おいて、1番目からM番目の前記入力ディジタルオーデ
ィオデータを用いて、1番目から(M×N−N)番目ま
での前記オーディオデータを生成し、M番目の前記入力
ディジタルオーディオデータを(M×N−N+1)番目
から(M×N)番目の前記オーディオデータとしてい
る。このように構成することにより、アップサンプリン
グ部での処理を軽減することができ、ディジタルオーデ
ィオ信号の符号化処理を高速に行うことができる。
According to another aspect of the present invention, there is provided an encoding method for a digital audio encoding apparatus, wherein when the number of data of one frame of the input digital audio data is M (M is a natural number), The first to Mth input digital audio data are used to generate first to (M × N−N) th audio data, and the Mth input digital audio data is generated as (M × N−N + 1). ) -Th to (M × N) -th audio data. With this configuration, it is possible to reduce the processing in the upsampling unit, and to perform the encoding processing of the digital audio signal at high speed.

【0018】本発明の符号化プログラムを記録した記録
媒体は、アップサンプリング情報N(Nは2の階乗)に
基づいて、所定のサンプリング周波数でサンプリングさ
れた入力ディジタルオーディオデータをアップサンプリ
ングして、N倍のサンプリング周波数でサンプリングさ
れたオーディオデータを生成するアップサンプリングス
テップ、及び前記アップサンプリングステップで生成し
たオーディオデータを所定のサブバンドに分割する帯域
分割処理を施し、さらにアップサンプリング後のN倍の
サンプリング周波数の1/(2×N)以上の周波数領域
に属するサブバンドの全てのオーディオデータをゼロの
値に設定するサブバンド分割ステップを備えている。こ
のように構成することにより、当該装置の構成を簡略化
することができ、ディジタルオーディオ信号の符号化処
理を高速に行うことができる。
The recording medium on which the encoding program of the present invention has been recorded up-samples input digital audio data sampled at a predetermined sampling frequency based on up-sampling information N (N is a factor of 2). Performing an up-sampling step of generating audio data sampled at an N-times sampling frequency, and performing a band division process of dividing the audio data generated in the up-sampling step into predetermined subbands; The method includes a subband division step of setting all audio data of subbands belonging to a frequency region equal to or more than 1 / (2 × N) of the sampling frequency to a value of zero. With this configuration, the configuration of the device can be simplified, and the encoding process of the digital audio signal can be performed at high speed.

【0019】別の観点による発明の符号化プログラムを
記録した記録媒体は、前記入力ディジタルオーディオデ
ータの1フレーム分のデータ数をM個(Mは自然数)と
したとき、前記アップサンプリングステップにおいて、
1番目からM番目の前記入力ディジタルオーディオデー
タを用いて、1番目から(M×N−N)番目までの前記
オーディオデータを生成し、M番目の前記入力ディジタ
ルオーディオデータを(M×N−N+1)番目から(M
×N)番目の前記オーディオデータとしている。このよ
うに構成することにより、アップサンプリング部での処
理を軽減することができ、ディジタルオーディオ信号の
符号化処理を高速に行うことができる。
According to another aspect of the present invention, there is provided a recording medium on which an encoding program according to the invention is recorded, wherein the number of data of one frame of the input digital audio data is M (M is a natural number),
The first to Mth input digital audio data are used to generate first to (M × N−N) th audio data, and the Mth input digital audio data is generated as (M × N−N + 1). ) To (M
× N) th audio data. With this configuration, it is possible to reduce the processing in the upsampling unit, and to perform the encoding processing of the digital audio signal at high speed.

【0020】[0020]

【発明の実施の形態】以下、本発明のディジタルオーデ
ィオ符号化装置、及びその符号化方法を示す好ましい実
施例について、図面を参照しながら説明する。尚、以下
の説明では、従来例との比較を容易なものとするため
に、22.05KHzでサンプリングされた1チャンネ
ル(モノラル)のPCMデータを44.1KHzにアッ
プサンプリングして、MPEG1オーディオ規格(ISO/
IEC 11172-3)に基づき符号化するディジタルオーディ
オ符号化装置について例示して説明する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS A preferred embodiment showing a digital audio encoding apparatus and an encoding method according to the present invention will be described below with reference to the drawings. In the following description, in order to facilitate comparison with the conventional example, 1-channel (monaural) PCM data sampled at 22.05 KHz is up-sampled to 44.1 KHz, and the MPEG1 audio standard ( ISO /
A digital audio encoding device that performs encoding based on IEC 11172-3) will be described as an example.

【0021】《実施例》図1は、本発明の実施例である
ディジタルオーディオ符号化装置の主要部の構成を示す
ブロック図である。図1において、本実施例のディジタ
ルオーディオ符号化装置は、MPEG1オーディオ規格
を用いたMPEGオーディオ符号化部10と、その前段
に設けられ、入力PCMデータをアップサンプリングす
るアップサンプリング部11を備えている。入力PCM
データは、図示しない入力データ生成部により、オーデ
ィオ信号の原信号をパルス符号変調して生成されたデー
タである。MPEGオーディオ符号化部10とアップサ
ンプリング部11には、アップサンプリング情報N(N
は2の階乗)が入力される。このアップサンプリング情
報Nは、例えば入力データ生成部によって設定、通知さ
れるものであり、アップサンプリング部11における、
元のPCMデータのサンプリング周波数に対して何倍に
アップサンプリングするかを指定する情報である。この
アップサンプリング情報NをMPEGオーディオ符号化
部10にも通知することにより、図3に示した従来例で
のフィルタ処理部を省略して、当該装置の構成を簡略化
することができ、さらに符号化処理を高速に行うことが
できる(詳細は後述)。尚、以下の説明では、アップサ
ンプリング部11がサンプリング周波数を22.05K
Hzから44.1KHzにアップサンプリングするの
で、アップサンプリング情報Nは2となる。
<< Embodiment >> FIG. 1 is a block diagram showing a configuration of a main part of a digital audio encoding apparatus according to an embodiment of the present invention. In FIG. 1, the digital audio encoding apparatus according to the present embodiment includes an MPEG audio encoding unit 10 using the MPEG1 audio standard, and an up-sampling unit 11 provided at a preceding stage for up-sampling input PCM data. . Input PCM
The data is data generated by an input data generator (not shown) by pulse code modulating the original signal of the audio signal. The up-sampling information N (N
Is the factorial of 2). The up-sampling information N is set and notified by, for example, an input data generation unit.
This information specifies how many times the sampling frequency of the original PCM data is to be upsampled. By notifying the up-sampling information N to the MPEG audio encoding unit 10, the filter processing unit in the conventional example shown in FIG. 3 can be omitted, and the configuration of the device can be simplified. Can be performed at high speed (details will be described later). In the following description, the upsampling unit 11 sets the sampling frequency to 22.05K.
Since the frequency is up-sampled from Hz to 44.1 KHz, the up-sampling information N is 2.

【0022】アップサンプリング部11は、外部から与
えられるアップサンプリング情報N(=2)に基づい
て、所定のサンプリング周波数(22.05KHz)で
サンプリングされた入力PCMデータからそのN倍のサ
ンプリング周波数(44.1KHz)でサンプリングさ
れたPCMデータを生成する。このアップサンプリング
部11は、後に詳述するように、フレーム単位に隣り合
う2つの入力PCMデータの平均値により補間しアップ
サンプリング後のPCMデータを生成して、MPEGオ
ーディオ符号化部10に出力する。これにより、本実施
例のディジタルオーディオ符号化装置では、アップサン
プリング部11の構成を簡略化することができ、その処
理負荷を軽減することができる。
The up-sampling section 11 converts input PCM data sampled at a predetermined sampling frequency (22.05 KHz) based on up-sampling information N (= 2) supplied from the outside into an N-fold sampling frequency (44). Generate PCM data sampled at .1 KHz). As will be described in detail later, the up-sampling unit 11 generates PCM data after up-sampling by interpolating with an average value of two adjacent input PCM data in frame units, and outputs the PCM data to the MPEG audio encoding unit 10. . Thus, in the digital audio encoding device according to the present embodiment, the configuration of the upsampling unit 11 can be simplified, and the processing load thereof can be reduced.

【0023】MPEGオーディオ符号化部10は、アッ
プサンプリング部11に接続されたサブバンド分割部1
2及びビット割り当て情報生成部13と、それらのサブ
バンド分割部12及びビット割り当て情報生成部13に
接続されたビット割り当て部14と、前記ビット割り当
て部14に接続された多重化部15を備えている。サブ
バンド分割部12は、アップサンプリング部11から入
力したPCMデータに帯域分割を施しサブバンドデータ
を生成する。詳細には、サブバンド分割部12は、帯域
分割フィルタを用いて時間領域のPCMデータを32個
の均等なサブバンドに分ける帯域分割を施して、周波数
領域のサブバンドデータsb0〜sb31を生成する。
これらのサブバンドデータsb0〜sb31は入力PC
Mデータのサンプリング周波数(22.5KHz)を低
周波数帯域から順次帯域分割したものであり、各サブバ
ンドデータsb0〜sb31には12個(レイヤIの場
合)、又は36個(レイヤIIの場合)のサンプルを含
んでいる。
The MPEG audio encoding unit 10 includes a subband dividing unit 1 connected to the upsampling unit 11.
2 and a bit allocation information generation unit 13, a bit allocation unit 14 connected to the subband division unit 12 and the bit allocation information generation unit 13, and a multiplexing unit 15 connected to the bit allocation unit 14. I have. The sub-band division unit 12 performs sub-band division on the PCM data input from the up-sampling unit 11 to generate sub-band data. Specifically, the sub-band division unit 12 performs band division to divide time-domain PCM data into 32 equal sub-bands using a band division filter, and generates frequency-domain sub-band data sb0 to sb31. .
These subband data sb0 to sb31 are input PC
The sampling frequency (22.5 KHz) of M data is divided into bands in order from the low frequency band, and each subband data sb0 to sb31 has 12 (in the case of layer I) or 36 (in the case of layer II) Includes samples.

【0024】さらに、サブバンド分割部12は、上記ア
ップサンプリング情報N(=2)を用いて、入力したP
CMデータに含まれていない帯域の全てのサンプルをゼ
ロに設定する。言い換えれば、サブバンド分割部12
は、アップサンプリング後のサンプリング周波数(4
4.1KHz)の1/(2×N)以上の周波数領域、す
なわち11.025KHz以上の周波数領域に属する帯
域の全てのサンプルをゼロに設定する。これにより、サ
ブバンドデータsb16〜sb31に属する全てのサン
プルがゼロに設定されて、ビット割り当て部14に出力
される。さらに、入力PCMデータのサンプリング周波
数(22.5KHz)の1/2よりも高い周波数成分を
カットせずにデータ処理した場合に生じる折り返しノイ
ズの発生を防止することができ、従来例に示したフィル
タ処理部(図3)を省略することができる。
Further, the subband division unit 12 uses the up-sampling information N (= 2) to
All samples in the band not included in the CM data are set to zero. In other words, the sub-band division unit 12
Is the sampling frequency (4
All samples in a band belonging to a frequency region of 1 / (2 × N) or more of (4.1 KHz), that is, a frequency region of 11.25 KHz or more, are set to zero. As a result, all the samples belonging to the sub-band data sb16 to sb31 are set to zero and output to the bit allocation unit 14. Further, it is possible to prevent the generation of aliasing noise that occurs when data processing is performed without cutting a frequency component higher than 1/2 of the sampling frequency (22.5 KHz) of the input PCM data. The processing unit (FIG. 3) can be omitted.

【0025】ビット割り当て情報生成部13は、アップ
サンプリング部11からのPCMデータに基づいて、ビ
ット割り当て情報(SMR値)を生成する。詳細には、
ビット割り当て情報生成部13は、人間の聴覚特性を利
用して、上記PCMデータからビット割り当て情報を生
成しビット割り当て部14に出力する。ビット割り当て
部14は、ビット割り当て情報生成部13からのビット
割り当て情報に基づいて、サブバンド分割部12からの
サブバンドデータsb0〜sb31にビットを割り当て
るビット割り当て処理を施し、さらにサブバンド(帯
域)毎に量子化処理を行って量子化した量子化データを
多重化部15に出力する。尚、サブバンドデータsb1
6〜sb31はゼロに設定されているので、ビット割り
当て部14はビット割り当て処理及び量子化処理を省略
することが可能となり、処理負荷を軽減することができ
る。多重化部15は、ビット割り当て部14からの量子
化データをMPEGオーディオビットストリームとして
形成して出力する。
The bit allocation information generating section 13 generates bit allocation information (SMR value) based on the PCM data from the upsampling section 11. For details,
The bit allocation information generation unit 13 generates bit allocation information from the PCM data using the human auditory characteristics and outputs the generated bit allocation information to the bit allocation unit 14. The bit allocation unit 14 performs a bit allocation process of allocating bits to the subband data sb0 to sb31 from the subband division unit 12 based on the bit allocation information from the bit allocation information generation unit 13, and further performs a subband (band). The quantized data is quantized by performing a quantization process every time and output to the multiplexing unit 15. Note that the sub-band data sb1
Since 6 to sb31 are set to zero, the bit allocation unit 14 can omit the bit allocation processing and the quantization processing, and can reduce the processing load. The multiplexing unit 15 forms and outputs the quantized data from the bit allocation unit 14 as an MPEG audio bit stream.

【0026】尚、上述のビット割り当て情報生成部1
3、ビット割り当て部14、及び多重化部15は、図3
に示した従来例のビット割り当て情報生成部、ビット割
り当て部、及び多重化部とそれぞれ同等な機能をもつよ
うにMPEG1オーディオ規格に基づいて構成されたも
のである。また、上述の説明では、サブバンド分割部1
2は全てのサブバンドデータsb0〜sb31をビット
割り当て部14に出力する構成について説明したが、ゼ
ロを設定したサブバンドデータsb16〜sb31を除
いて、サブバンドデータsb0〜sb15だけをビット
割り当て部14に出力するよう構成してもよい。
The above-mentioned bit allocation information generating section 1
3, the bit allocation unit 14 and the multiplexing unit 15
Are configured based on the MPEG1 audio standard so as to have the same functions as those of the bit allocation information generation unit, bit allocation unit, and multiplexing unit of the conventional example shown in FIG. Also, in the above description, the subband division unit 1
2 describes the configuration in which all the sub-band data sb0 to sb31 are output to the bit allocating unit 14. However, except for the sub-band data sb16 to sb31 in which zero is set, only the sub-band data sb0 to sb15 are output to the bit allocating unit 14. May be output.

【0027】以下、本実施例のディジタルオーディオ符
号化装置の動作について、図1及び図2を用いて説明す
る。図2は、図1に示したアップサンプリング部での補
間処理を示す説明図である。まずMPEG1規格に基づ
いてオーディオ信号を符号化するためには、1チャンネ
ル(モノラル)のオーディオ信号では1152個のPC
Mデータが必要であり、2チャンネル(ステレオ)のオ
ーディオ信号ではその2倍の2304個のPCMデータ
が必要であり、それぞれ1フレーム分のPCMデータと
呼ぶことにする。この説明では1チャンネルの場合を説
明しているので、アップサンプリング部11は1152
個のPCMデータ毎にアップサンプリング後のPCMデ
ータをMPEGオーディオ符号化部10に出力する。さ
らに、アップサンプリング部11は、上述したように、
フレーム単位に隣り合う2つの入力PCMデータの平均
値により補間しアップサンプリング後のPCMデータを
生成している。
Hereinafter, the operation of the digital audio encoding device according to the present embodiment will be described with reference to FIGS. FIG. 2 is an explanatory diagram showing an interpolation process in the upsampling unit shown in FIG. First, in order to encode an audio signal based on the MPEG1 standard, 1152 PCs are used for a one-channel (monaural) audio signal.
M data is required. For a two-channel (stereo) audio signal, 2304 pieces of PCM data are required, which is twice as much, and each of them is called one frame of PCM data. In this description, the case of one channel is described, so that the up-sampling unit 11
The PCM data after upsampling is output to the MPEG audio encoding unit 10 for each piece of PCM data. Further, as described above, the up-sampling unit 11
Interpolation is performed using an average value of two input PCM data adjacent to each other in a frame unit to generate up-sampled PCM data.

【0028】詳細にいえば、元の入力PCMデータの1
フレーム分の個数をM(Mは自然数)としたとき、アッ
プサンプリング部11はアップサンプリング情報Nを用
いて、1番目からM番目の元の入力PCMデータによ
り、1番目から(M×N−N)番目までのPCMデータ
を生成している。さらに、アップサンプリング部11
は、M番目の最後の入力PCMデータを(M×N−N+
1)番目から(M×N)番目のPCMデータとして繰り
返し用いている。具体的には、図2に示すように、アッ
プサンプリング部11は、1番目から576番目の元の
入力PCMデータと、隣り合う2つの入力PCMデータ
の各平均値を求めて、求めた各平均値を元の隣り合う2
つの入力PCMデータの間に補間して、1番目から11
50番目までのアップサンプリング後のPCMデータと
して生成している。例えばアップサンプリング部11
は、1番目、及び2番目の元の入力PCMデータを1番
目、及び3番目のPCMデータとし、それらの平均値を
2番目のPCMデータとしている。さらに、アップサン
プリング部11は、同図に示すように、1151番目、
及び1152番目のPCMデータには、576番目の最
後の入力PCMデータを用いている。
More specifically, one of the original input PCM data
When the number of frames is M (M is a natural number), the up-sampling unit 11 uses the up-sampling information N and outputs the first to (M × N−N) based on the first to M-th original input PCM data. ) -Th PCM data is generated. Further, the up-sampling unit 11
Converts the M-th last input PCM data to (M × N−N +
It is repeatedly used as (1) -th to (M × N) -th PCM data. Specifically, as shown in FIG. 2, the up-sampling unit 11 calculates the average value of the first to 576th original input PCM data and the average value of two adjacent input PCM data, and Value of the original adjacent two
Interpolation between two input PCM data, 1st to 11th
It is generated as PCM data after up-sampling up to the 50th. For example, the upsampling unit 11
Uses the first and second original input PCM data as the first and third PCM data, and sets the average value thereof as the second PCM data. Further, as shown in FIG.
The 576th last input PCM data is used for the 1152th PCM data.

【0029】以上のように、本実施例のアップサンプリ
ング部11は、1フレーム分の入力PCMデータだけを
用いて、そのフレーム分のPCMデータを生成してい
る。このため、本実施例のアップサンプリング部11で
は、従来例のものと異なって次のフレームの先頭の入力
PCMデータが不要となり、そのアップサンプリングの
処理を高速に行うことができる。また、アップサンプリ
ング部11では、最後の入力PCMデータだけを用い
て、(M×N−N+1)番目から(M×N)番目のPC
Mデータを生成しているので、音質の低下を抑制でき
る。
As described above, the up-sampling unit 11 of this embodiment uses only one frame of input PCM data to generate PCM data for that frame. Therefore, unlike the conventional example, the upsampling unit 11 of the present embodiment does not need the input PCM data at the head of the next frame, and can perform the upsampling process at high speed. Further, the upsampling unit 11 uses only the last input PCM data to generate the (M × N−N + 1) th to (M × N) th PCM data.
Since the M data is generated, a decrease in sound quality can be suppressed.

【0030】続いて、サブバンド分割部12は、アップ
サンプリング部11からのPCMデータを32個の均等
なサブバンドに分ける帯域分割を施して、サブバンドデ
ータsb0〜sb31を生成しビット割り当て部14に
出力する。このとき、サブバンド分割部12は、上記ア
ップサンプリング情報N(=2)を用いて、入力したP
CMデータに含まれていない帯域の全てのサンプルをゼ
ロに設定する。次に、ビット割り当て部14は、ビット
割り当て情報生成部13からのビット割り当て情報に基
づいて、サブバンド分割部12から入力したサブバンド
データsb0〜sb31にビット割り当て処理、及び量
子化処理を施し、量子化データを生成する。その後、多
重化部15が、ビット割り当て部14からの量子化デー
タをMPEGオーディオビットストリームに形成して出
力する。尚、ビット割り当て情報生成部13でのビット
割り当て情報を作成する詳細な段階、及びビット割り当
て部14での人間の聴覚特性を利用したビット割り当て
処理と量子化処理の詳細な段階は、従来例のものとそれ
ぞれ同様であるのでそれらの重複した説明は省略する。
Subsequently, the sub-band division unit 12 performs band division for dividing the PCM data from the up-sampling unit 11 into 32 equal sub-bands, generates sub-band data sb0 to sb31, and Output to At this time, the subband dividing unit 12 uses the up-sampling information N (= 2) to
All samples in the band not included in the CM data are set to zero. Next, the bit allocation unit 14 performs a bit allocation process and a quantization process on the sub-band data sb0 to sb31 input from the sub-band division unit 12, based on the bit allocation information from the bit allocation information generation unit 13, Generate quantized data. Thereafter, the multiplexing unit 15 forms the quantized data from the bit allocation unit 14 into an MPEG audio bit stream and outputs the MPEG audio bit stream. The detailed steps of creating bit allocation information in the bit allocation information generation unit 13 and the detailed steps of bit allocation processing and quantization processing using human auditory characteristics in the bit allocation unit 14 are the same as those in the conventional example. Since they are the same as those described above, their duplicate description will be omitted.

【0031】以上のように、本実施例のディジタルオー
ディオ符号化装置では、サブバンド分割部12がアップ
サンプリング情報Nを用いて、入力したPCMデータに
含まれていない帯域(サブバンド)の全てのサンプルを
ゼロに設定している。これにより、本実施例のディジタ
ルオーディオ符号化装置では、図3に示した従来例での
フィルタ処理部を省略して、当該装置の構成を簡略化す
ることができる。さらに、本実施例のディジタルオーデ
ィオ符号化装置では、折り返しノイズを生じることな
く、符号化処理を高速に行うことができる。
As described above, in the digital audio encoding apparatus according to the present embodiment, the sub-band division unit 12 uses the up-sampling information N to perform all of the bands (sub-bands) not included in the input PCM data. The sample is set to zero. As a result, in the digital audio encoding apparatus according to the present embodiment, the filter processing unit in the conventional example shown in FIG. 3 is omitted, and the configuration of the apparatus can be simplified. Furthermore, in the digital audio encoding device of the present embodiment, encoding processing can be performed at high speed without aliasing noise.

【0032】尚、上述の説明では、1チャンネルのPC
MデータをMPEGオーディオ符号化部によって符号化
しMPEGオーディオビットストリームに形成する構成
について説明したが、実施例は1チャンネルのPCMデ
ータに限定されるものではなく、例えばMPEG2オー
ディオ規格(ISO/IEC 13818-3)に規定されたMPEG
マルチチャンネルオーディオ信号を複数チャンネルのオ
ーディオ信号から生成することも可能である。さらに、
本発明は、MPEGオーディオ規格に限定されるもので
はなく、サブバンド符号化方式のディジタルオーディオ
信号であれば、それ以外の高能率圧縮手法に規定された
符号化処理を高速に、かつ簡単な構成で実現することが
可能である。また、上述の実施例におけるディジタルオ
ーディオ符号化装置の符号化方法は、いずれもコンピュ
ータ・プログラム化することができるので、コンピュー
タにより実行可能な記録媒体にて本願の符号化方法を提
供することも可能である。ここでいうところの記録媒体
とは、フロッピーディスク、CD−ROM、DVD、光
磁気ディスク、リムーバブル・ハードディスク、及びフ
ラッシュメモリを含むデータ記録装置である。
In the above description, a one-channel PC
Although the configuration in which the M data is encoded by the MPEG audio encoding unit and formed into an MPEG audio bit stream has been described, the embodiment is not limited to the one-channel PCM data. For example, the MPEG2 audio standard (ISO / IEC 13818- MPEG specified in 3)
It is also possible to generate a multi-channel audio signal from a multi-channel audio signal. further,
The present invention is not limited to the MPEG audio standard. For digital audio signals of the subband encoding system, the encoding process specified by other high-efficiency compression methods can be performed at high speed and with a simple configuration. It is possible to realize with. Further, since any of the encoding methods of the digital audio encoding device in the above-described embodiments can be computer-programmed, it is also possible to provide the encoding method of the present application on a computer-executable recording medium. It is. Here, the recording medium is a data recording device including a floppy disk, a CD-ROM, a DVD, a magneto-optical disk, a removable hard disk, and a flash memory.

【0033】[0033]

【発明の効果】以上のように、本発明のディジタルオー
ディオ符号化装置、及びその符号化方法では、サブバン
ド分割部がアップサンプリング情報を用いて、入力した
入力ディジタルオーディオデータに含まれていない帯域
(サブバンド)の全てのデータをゼロに設定している。
これにより、本発明のディジタルオーディオ符号化装
置、及びその符号化方法では、フィルタ処理部を設ける
ことなく、当該装置の構成を簡略化することができる。
さらに、本発明のディジタルオーディオ符号化装置、及
びその符号化方法では、折り返しノイズを生じることな
く、符号化処理を高速に行うことができる。
As described above, according to the digital audio encoding apparatus and the encoding method of the present invention, the sub-band division unit uses the up-sampling information to use the band not included in the input digital audio data. All data of (subband) is set to zero.
Thus, in the digital audio encoding device and the encoding method of the present invention, the configuration of the device can be simplified without providing a filter processing unit.
Further, with the digital audio encoding device and the encoding method of the present invention, encoding processing can be performed at high speed without generating aliasing noise.

【0034】別の観点による発明のディジタルオーディ
オ符号化装置、及びその符号化方法では、入力ディジタ
ルオーディオデータの1フレーム分のデータ数をM個
(Mは自然数)としたとき、アップサンプリング部が、
1番目からM番目の前記入力ディジタルオーディオデー
タを用いて、1番目から(M×N−N)番目までの前記
オーディオデータを生成し、M番目の前記入力ディジタ
ルオーディオデータを(M×N−N+1)番目から(M
×N)番目の前記オーディオデータとしている。これに
より、この発明のディジタルオーディオ符号化装置、及
びその符号化方法では、アップサンプリング部での処理
を軽減することができ、ディジタルオーディオ信号の符
号化処理を高速に行うことができる。また、本発明の符
号化方法はコンピュータ・プログラム化することができ
るので、本発明の符号化方法をコンピュータにより実行
可能な記録媒体に記録して実施することもできる。
In the digital audio encoding apparatus and the encoding method of the invention according to another aspect, when the number of data of one frame of input digital audio data is M (M is a natural number), the upsampling unit
The first to Mth input digital audio data are used to generate first to (M × N−N) th audio data, and the Mth input digital audio data is generated as (M × N−N + 1). ) To (M
× N) th audio data. Thus, in the digital audio encoding device and the encoding method according to the present invention, the processing in the upsampling unit can be reduced, and the encoding processing of the digital audio signal can be performed at high speed. Further, since the encoding method of the present invention can be made into a computer program, the encoding method of the present invention can be recorded on a computer-executable recording medium and executed.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の実施例であるディジタルオーディオ符
号化装置の主要部の構成を示すブロック図
FIG. 1 is a block diagram showing a configuration of a main part of a digital audio encoding device according to an embodiment of the present invention.

【図2】図1に示したアップサンプリング部での補間処
理を示す説明図
FIG. 2 is an explanatory diagram showing an interpolation process in an up-sampling unit shown in FIG. 1;

【図3】従来のディジタルオーディオ符号化装置の主要
部の構成を示すブロック図
FIG. 3 is a block diagram showing a configuration of a main part of a conventional digital audio encoding device.

【図4】図3に示したアップサンプリング部での補間処
理を示す説明図
FIG. 4 is an explanatory diagram showing an interpolation process in the upsampling unit shown in FIG. 3;

【符号の説明】[Explanation of symbols]

11 アップサンプリング部 12 サブバンド分割部 13 ビット割り当て情報生成部 14 ビット割り当て部 15 多重化部 DESCRIPTION OF SYMBOLS 11 Upsampling part 12 Subband division part 13 Bit allocation information generation part 14 Bit allocation part 15 Multiplexing part

Claims (9)

【特許請求の範囲】[Claims] 【請求項1】 アップサンプリング情報N(Nは2の階
乗)に基づいて、所定のサンプリング周波数でサンプリ
ングされた入力ディジタルオーディオデータをアップサ
ンプリングして、N倍のサンプリング周波数でサンプリ
ングされたオーディオデータを生成するアップサンプリ
ング部、及び前記アップサンプリング部からのオーディ
オデータを所定のサブバンドに分割する帯域分割処理を
施し、さらにアップサンプリング後のN倍のサンプリン
グ周波数の1/(2×N)以上の周波数領域に属するサ
ブバンドの全てのオーディオデータをゼロの値に設定す
るサブバンド分割部、 を備えたことを特徴とするディジタルオーディオ符号化
装置。
1. An input digital audio data sampled at a predetermined sampling frequency is up-sampled based on up-sampling information N (N is a factor of 2), and audio data sampled at N times the sampling frequency And a band division process for dividing the audio data from the up-sampling unit into predetermined sub-bands. Further, the sampling frequency is 1 / (2 × N) or more of N times the sampling frequency after the up-sampling. A digital audio encoding device, comprising: a subband division unit that sets all audio data of a subband belonging to a frequency domain to a value of zero.
【請求項2】 前記入力ディジタルオーディオデータの
1フレーム分のデータ数をM個(Mは自然数)としたと
き、前記アップサンプリング部が、1番目からM番目の
前記入力ディジタルオーディオデータを用いて、1番目
から(M×N−N)番目までの前記オーディオデータを
生成し、M番目の前記入力ディジタルオーディオデータ
を(M×N−N+1)番目から(M×N)番目の前記オ
ーディオデータとするよう構成したことを特徴とする請
求項1に記載のディジタルオーディオ符号化装置。
2. When the number of data for one frame of the input digital audio data is M (M is a natural number), the up-sampling unit uses the first to M-th input digital audio data, The first to (M × N−N) th audio data is generated, and the Mth input digital audio data is used as the (M × N−N + 1) th to (M × N) th audio data. 2. The digital audio encoding device according to claim 1, wherein the digital audio encoding device is configured as described above.
【請求項3】 前記サブバンド分割部が、MPEG規格
に基づいて、入力したオーディオデータを帯域分割する
よう構成されたことを特徴とする請求項1または請求項
2に記載のディジタルオーディオ符号化装置。
3. The digital audio encoding apparatus according to claim 1, wherein the sub-band dividing unit is configured to divide input audio data into bands based on the MPEG standard. .
【請求項4】 アップサンプリング情報N(Nは2の階
乗)に基づいて、所定のサンプリング周波数でサンプリ
ングされた入力ディジタルオーディオデータをアップサ
ンプリングして、N倍のサンプリング周波数でサンプリ
ングされたオーディオデータを生成するアップサンプリ
ングステップ、及び前記アップサンプリングステップで
生成したオーディオデータを所定のサブバンドに分割す
る帯域分割処理を施し、さらにアップサンプリング後の
N倍のサンプリング周波数の1/(2×N)以上の周波
数領域に属するサブバンドの全てのオーディオデータを
ゼロの値に設定するサブバンド分割ステップ、 を備えたことを特徴とするディジタルオーディオ符号化
装置の符号化方法。
4. Up-sampling of input digital audio data sampled at a predetermined sampling frequency based on up-sampling information N (N is a power of 2), and audio data sampled at N times the sampling frequency , And a band division process of dividing the audio data generated in the up-sampling step into predetermined sub-bands, and more than 1 / (2 × N) of N times the sampling frequency after the up-sampling A sub-band division step of setting all audio data of a sub-band belonging to the frequency domain to a value of zero.
【請求項5】 前記入力ディジタルオーディオデータの
1フレーム分のデータ数をM個(Mは自然数)としたと
き、前記アップサンプリングステップにおいて、1番目
からM番目の前記入力ディジタルオーディオデータを用
いて、1番目から(M×N−N)番目までの前記オーデ
ィオデータを生成し、M番目の前記入力ディジタルオー
ディオデータを(M×N−N+1)番目から(M×N)
番目の前記オーディオデータとすることを特徴とする請
求項4に記載のディジタルオーディオ符号化装置の符号
化方法。
5. When the number of data for one frame of the input digital audio data is M (M is a natural number), the first to M-th input digital audio data are used in the upsampling step. The first to (M × N−N) th audio data is generated, and the Mth input digital audio data is converted from the (M × N−N + 1) th to (M × N).
The encoding method of the digital audio encoding device according to claim 4, wherein the audio data is the first audio data.
【請求項6】 前記サブバンド分割ステップにおいて、
MPEG規格に基づいて、入力したオーディオデータを
帯域分割することを特徴とする請求項4または請求項5
に記載のディジタルオーディオ符号化装置の符号化方
法。
6. In the sub-band division step,
6. The input audio data is band-divided based on the MPEG standard.
3. The encoding method of the digital audio encoding device according to item 1.
【請求項7】 アップサンプリング情報N(Nは2の階
乗)に基づいて、所定のサンプリング周波数でサンプリ
ングされた入力ディジタルオーディオデータをアップサ
ンプリングして、N倍のサンプリング周波数でサンプリ
ングされたオーディオデータを生成するアップサンプリ
ングステップ、及び前記アップサンプリングステップで
生成したオーディオデータを所定のサブバンドに分割す
る帯域分割処理を施し、さらにアップサンプリング後の
N倍のサンプリング周波数の1/(2×N)以上の周波
数領域に属するサブバンドの全てのオーディオデータを
ゼロの値に設定するサブバンド分割ステップ、 を備えた符号化プログラムを記録した記録媒体。
7. Up-sampling of input digital audio data sampled at a predetermined sampling frequency based on up-sampling information N (N is a power of 2), and audio data sampled at N times the sampling frequency , And a band division process of dividing the audio data generated in the up-sampling step into predetermined sub-bands, and more than 1 / (2 × N) of N times the sampling frequency after the up-sampling A sub-band division step of setting all audio data of a sub-band belonging to the frequency domain to a value of zero.
【請求項8】 前記入力ディジタルオーディオデータの
1フレーム分のデータ数をM個(Mは自然数)としたと
き、前記アップサンプリングステップにおいて、1番目
からM番目の前記入力ディジタルオーディオデータを用
いて、1番目から(M×N−N)番目までの前記オーデ
ィオデータを生成し、M番目の前記入力ディジタルオー
ディオデータを(M×N−N+1)番目から(M×N)
番目の前記オーディオデータとすることを特徴とする請
求項7に記載の符号化プログラムを記録した記録媒体。
8. When the number of data for one frame of the input digital audio data is M (M is a natural number), in the upsampling step, the first to M-th input digital audio data are used. The first to (M × N−N) th audio data is generated, and the Mth input digital audio data is converted from the (M × N−N + 1) th to (M × N).
8. A recording medium on which the encoding program according to claim 7 is recorded, wherein the encoding data is the first audio data.
【請求項9】 前記サブバンド分割ステップにおいて、
MPEG規格に基づいて、入力したオーディオデータを
帯域分割することを特徴とする請求項7または請求項8
に記載の符号化プログラムを記録した記録媒体。
9. In the sub-band dividing step,
9. The input audio data is divided into bands based on the MPEG standard.
A recording medium on which the encoding program described in 1 is recorded.
JP10322644A 1998-11-12 1998-11-12 Digital audio encoding device/method and recording medium recording encoding program Pending JP2000151414A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10322644A JP2000151414A (en) 1998-11-12 1998-11-12 Digital audio encoding device/method and recording medium recording encoding program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10322644A JP2000151414A (en) 1998-11-12 1998-11-12 Digital audio encoding device/method and recording medium recording encoding program

Publications (1)

Publication Number Publication Date
JP2000151414A true JP2000151414A (en) 2000-05-30

Family

ID=18146012

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10322644A Pending JP2000151414A (en) 1998-11-12 1998-11-12 Digital audio encoding device/method and recording medium recording encoding program

Country Status (1)

Country Link
JP (1) JP2000151414A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005006296A (en) * 2003-05-21 2005-01-06 Sony Corp Data processing apparatus, encoding apparatus and method, decoding apparatus and method, and program
JP2005038000A (en) * 2003-07-15 2005-02-10 Nohmi Bosai Ltd Flame detector
JP2008026912A (en) * 2004-12-13 2008-02-07 Fraunhofer Ges Zur Foerderung Der Angewandten Forschung Ev Method for generating display of calculation result which is linearly dependent on square value

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005006296A (en) * 2003-05-21 2005-01-06 Sony Corp Data processing apparatus, encoding apparatus and method, decoding apparatus and method, and program
JP4496467B2 (en) * 2003-05-21 2010-07-07 ソニー株式会社 Data processing apparatus, encoding apparatus, encoding method, decoding apparatus, decoding method, and program
JP2005038000A (en) * 2003-07-15 2005-02-10 Nohmi Bosai Ltd Flame detector
JP2008026912A (en) * 2004-12-13 2008-02-07 Fraunhofer Ges Zur Foerderung Der Angewandten Forschung Ev Method for generating display of calculation result which is linearly dependent on square value
JP2008523450A (en) * 2004-12-13 2008-07-03 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ How to generate a display of calculation results linearly dependent on a square value
US8037114B2 (en) 2004-12-13 2011-10-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method for creating a representation of a calculation result linearly dependent upon a square of a value

Similar Documents

Publication Publication Date Title
JP4625084B2 (en) Shaped diffuse sound for binaural cue coding method etc.
CN103765509B (en) Code device and method, decoding device and method
CA2582485C (en) Individual channel shaping for bcc schemes and the like
JP5101579B2 (en) Spatial audio parameter display
JP5400059B2 (en) Audio signal processing method and apparatus
CN101385075B (en) Apparatus and method for encoding/decoding signal
KR100462615B1 (en) Audio decoding method recovering high frequency with small computation, and apparatus thereof
JP4925671B2 (en) Digital signal encoding / decoding method and apparatus, and recording medium
US20050177360A1 (en) Audio coding
Brandenburg et al. MPEG layer-3
CN104681030A (en) Apparatus and method for encoding/decoding signal
EP1668959A2 (en) Compatible multi-channel coding/decoding
JP2012078866A (en) Audio coding system using characteristics of decoded signal to adapt synthesized spectral components
JP2007017908A (en) Signal encoding apparatus and method, signal decoding apparatus and method, and program and recording medium
JPH1084284A (en) Signal reproducing method and device
JP2011059714A (en) Signal encoding device and method, signal decoding device and method, and program and recording medium
JP2005530206A (en) Audio coding system that uses the characteristics of the decoded signal to fit the synthesized spectral components
US7725323B2 (en) Device and process for encoding audio data
US6463405B1 (en) Audiophile encoding of digital audio data using 2-bit polarity/magnitude indicator and 8-bit scale factor for each subband
JP2000151414A (en) Digital audio encoding device/method and recording medium recording encoding program
Sripada MP3 DECODER in Theory and Practice
JP2001306097A (en) System and device for voice encoding, system and device for voice decoding, and recording medium
JP4403721B2 (en) Digital audio decoder
JP3513879B2 (en) Information encoding method and information decoding method
Chen et al. Fast time-frequency transform algorithms and their applications to real-time software implementation of AC-3 audio codec