JP2820117B2 - Audio coding device - Google Patents

Audio coding device

Info

Publication number
JP2820117B2
JP2820117B2 JP8134812A JP13481296A JP2820117B2 JP 2820117 B2 JP2820117 B2 JP 2820117B2 JP 8134812 A JP8134812 A JP 8134812A JP 13481296 A JP13481296 A JP 13481296A JP 2820117 B2 JP2820117 B2 JP 2820117B2
Authority
JP
Japan
Prior art keywords
step width
quantization step
masking
frame
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP8134812A
Other languages
Japanese (ja)
Other versions
JPH09321628A (en
Inventor
俊之 石野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP8134812A priority Critical patent/JP2820117B2/en
Publication of JPH09321628A publication Critical patent/JPH09321628A/en
Application granted granted Critical
Publication of JP2820117B2 publication Critical patent/JP2820117B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は音声符号化装置に関
し、特に心理聴覚分析を用いる音声符号化装置に関す
る。
[0001] 1. Field of the Invention [0002] The present invention relates to a speech coding apparatus, and more particularly to a speech coding apparatus using psychological auditory analysis.

【0002】[0002]

【従来の技術】図3は従来の一般的な音声符号化装置の
構成を示すブロック図である。
2. Description of the Related Art FIG. 3 is a block diagram showing a configuration of a conventional general speech coding apparatus.

【0003】従来から、心理聴覚分析機能を用いた音声
符号化方式はフレーム単位の符号化を行っており、この
音声符号化装置20では、周波数分割フィルタバンク1
1が入力されたNフレーム目の入力音声信号データを周
波数領域の成分に分割する。一方、心理聴覚分析部17
は、図4の入力音声信号データの構成を説明する説明図
に示すように、Nフレーム目のデータを符号化する場
合、(N−i)フレーム目からNフレーム目までのA領
域の入力音声信号データを、スペクトラム計算部14に
入力して周波数解析を行い、この周波数解析結果と人間
の聴覚特性のマスキング効果とを考慮し、マスキングカ
ーブ予測器15でマスキングカーブを算出し、このマス
キングカーブを基に、量子化ステップ幅予測器16によ
り量子化ステップ幅を予測し、量子化器12が予測され
た量子化ステップ幅で周波数分割フィルタバンク11の
出力するデータの量子化を行っている。
[0003] Conventionally, a speech coding method using a psycho-auditory analysis function has performed coding on a frame-by-frame basis.
The input audio signal data of the Nth frame to which 1 is input is divided into frequency domain components. On the other hand, the psychological hearing analysis unit 17
As shown in the explanatory diagram illustrating the configuration of the input audio signal data in FIG. 4, when encoding data in the Nth frame, the input audio in the A region from the (Ni) frame to the Nth frame is encoded. The signal data is input to the spectrum calculator 14 to perform a frequency analysis, and in consideration of the result of the frequency analysis and the masking effect of the human auditory characteristics, a masking curve predictor 15 calculates a masking curve. Based on this, the quantization step width is predicted by the quantization step width predictor 16, and the quantizer 12 quantizes the data output from the frequency division filter bank 11 with the predicted quantization step width.

【0004】実際の使用例としては、例えば、国際標準
化機構であるISO/IEC JTC1/SC29/W
G11の作業部会(MPEG;Moving Pict
ure Experts Group)の策定した、動
画像の高能率圧縮方式の1つであるMPEG方式の音声
符号化方式の場合、MPEG Audio Layer
I/II/III で用いられている心理聴覚分析部への音声
信号入力データは、Nフレーム目の音声入力信号を符号
化するさい、Nフレーム目のデータと(N−1)フレー
ム目のデータが入力される。この他の心理聴覚分析を用
いた符号化方式としては、MD(ミニ・ディスク)で用
いられているATRAC音声符号化方式や、DCC(デ
ィジタル・コンパクト・カセット)で用いられているP
ASC音声符号化方式等があげられる。
[0004] Practical examples of use include, for example, ISO / IEC JTC1 / SC29 / W which is an international standardization organization.
Working Group of G11 (MPEG; Moving Pict
MPEG Audio Layer, which is one of the high-efficiency compression schemes for moving images, which is formulated by our Experts Group.
The speech signal input data to the psychological auditory analysis unit used in I / II / III is the data of the Nth frame and the data of the (N-1) th frame when the speech input signal of the Nth frame is encoded. Is entered. Other encoding methods using psychological auditory analysis include ATRAC speech encoding methods used in MDs (mini discs) and PRACs used in DCCs (digital compact cassettes).
ASC audio coding system and the like can be mentioned.

【0005】なお、ここでマスキング効果とこれの使用
方法について述べておく。マスキング効果には同時マス
キングと継時マスキングとがあり、継時マスキングの中
には順向、逆向マスキングがある。
[0005] Here, the masking effect and how to use it will be described. The masking effect includes simultaneous masking and successive masking. The successive masking includes forward and backward masking.

【0006】同時マスキングとはマスクする音(マスカ
ー)とマスクされる音(マスキー)が同時に提示される
場合をいう。
[0006] Simultaneous masking refers to a case in which a masking sound (masker) and a masking sound (masky) are presented simultaneously.

【0007】継時マスキングの順向マスキングとは時間
的に先行する音の後続する音へのマスキングであり、逆
向マスキングとは後続する音の先行する音へのマスキン
グである。それぞれのマスキング量は、大阪大学 桑野
氏がジェーエーエス・ジャーナル(JAS Journal )'93・
6月号13〜25頁に「聴覚心理とオーディオ」として発表
された論文の中に示されている。以下に表1として一部
を示す。
The forward masking of successive masking is the masking of a temporally preceding sound to a succeeding sound, and the backward masking is the masking of a subsequent sound to a preceding sound. Mr. Kuwano of Osaka University reported the amount of each masking in JAS Journal '93.
This is shown in a paper published as "Aural Psychology and Audio" in the June issue, pages 13-25. A part is shown as Table 1 below.

【0008】[0008]

【表1】 [Table 1]

【0009】マスキングカーブ予測器15で予測された
マスキングカーブから、人間の聴覚特性でマスキング量
の大きい周波数成分データに対する量子化ステップ幅を
粗く、マスキング量の少ない周波数成分データに対する
量子化ステップ幅を細かく割り当てしてステップ幅を求
めた結果を量子化ステップ幅予測器16から出力する。
From the masking curve predicted by the masking curve predictor 15, the quantization step width for the frequency component data having a large masking amount in the human auditory characteristics is coarse, and the quantization step width for the frequency component data having a small masking amount is fine. The result of the allocation and the step width is output from the quantization step width predictor 16.

【0010】[0010]

【発明が解決しようとする課題】上述した従来の音声符
号化装置は、Nフレーム目のデータを符号化する場合、
符号化されるフレームのデータより前のデータを用いて
心理聴覚分析を行っているため、マスキング効果の内の
順向マスキング効果のみしか利用しないで、マスキング
カーブを求めていることになる。このため求められたマ
スキングカーブは実際にマスキングされる全てのデータ
を解析していないため、最適のマスキングカーブを算出
しているとはいえず、符号化効率が悪いという問題点が
ある。
The conventional speech coding apparatus described above, when coding the data of the Nth frame,
Since the psychoacoustic analysis is performed using the data before the data of the frame to be coded, the masking curve is determined without using only the forward masking effect among the masking effects. For this reason, since the obtained masking curve does not analyze all data actually masked, it cannot be said that an optimum masking curve is calculated, and there is a problem that coding efficiency is poor.

【0011】本発明の目的は、同等の演算量でより符号
化効率を高めることができる音声符号化装置を提供する
ことにある。
It is an object of the present invention to provide a speech coding apparatus capable of increasing coding efficiency with the same amount of calculation.

【0012】[0012]

【課題を解決するための手段】本発明の音声符号化装置
は、一定長の複数のフレームに分割され入力端子を介し
て入力される入力音声信号データを各フレームごとに周
波数分割したデータとする周波数分割手段と、前記一定
長の複数のフレームを受け各フレームごとにスペクトラ
ム解析し最新のフレームに対しこの最新のフレームおよ
びこの最新のフレーム以前のi(i=1,2,…n)個
のフレームのスペクトラム解析の結果とマスキングの効
果を含む人間の聴覚特性とを用いて量子化ステップ幅を
計算する心理聴覚分析手段と、前記周波数分割手段が周
波数分割したデータを前記心理聴覚分析手段が計算した
量子化ステップ幅で量子化する量子化手段と、この量子
化手段が量子化した量子化データを符号化ビット列に多
重化する多重化手段とを備える音声符号化装置におい
て、前記入力端子と前記周波数分割手段および前記心理
聴覚分析手段との間に前記入力音声信号データを一時記
憶する入力音声信号データ記憶手段を設け、前記心理聴
覚分析手段が前記入力音声信号データ記憶手段から量子
化ステップ幅を計算すべきフレームを中に挟む前後のi
個のフレームを受け、前記量子化ステップ幅を計算すべ
きフレームのスペクトラム解析の結果とマスキングの効
果を含む人間の聴覚特性とを用いて量子化ステップ幅を
計算し前記量子化手段に出力する構成である。
SUMMARY OF THE INVENTION A speech encoding apparatus according to the present invention converts input speech signal data, which is divided into a plurality of frames of a fixed length and input via an input terminal, into frequency-divided data for each frame. Frequency dividing means for receiving a plurality of frames of the predetermined length and performing spectrum analysis for each frame, and comparing the latest frame with the latest frame and i (i = 1, 2,... Psychological auditory analysis means for calculating the quantization step width using the result of the spectrum analysis of the frame and the human auditory characteristics including the effect of masking, and the psychological auditory analysis means calculates the frequency-divided data by the frequency dividing means. And a multiplexing means for multiplexing the quantized data quantized by the quantizing means into an encoded bit sequence. Wherein the input audio signal data storage means for temporarily storing the input audio signal data is provided between the input terminal and the frequency division means and the psychological hearing analysis means, wherein the psychological hearing analysis means Are i before and after sandwiching a frame whose quantization step width is to be calculated from the input audio signal data storage means.
Receiving the number of frames, calculating the quantization step width using the result of the spectrum analysis of the frame for which the quantization step width is to be calculated and the human auditory characteristics including the effect of masking, and outputting the result to the quantization means. It is.

【0013】本発明の音声符号化装置は、周波数分割手
段がサブバンド分割フィルタバンク器であってもよい。
In the speech coding apparatus according to the present invention, the frequency division means may be a sub-band division filter bank.

【0014】本発明の音声符号化装置は、周波数分割手
段が変形離散コサイン変換方式(MDCT)であっても
よい。
In the speech coding apparatus of the present invention, the frequency dividing means may be a modified discrete cosine transform (MDCT).

【0015】本発明の音声符号化装置は、心理聴覚分析
手段が入力音声信号データ記憶手段から一定長の複数の
フレームを受け各フレームごとに周波数解析を行うスペ
クトラム計算器と、このスペクトラム計算器の結果と人
間の聴覚特性であるマスキング効果を考慮してマスキン
グカーブを求めるマスキングカーブ予測器と、このマス
キングカーブ予測器で求めたマスキングカーブから量子
化ステップ幅を求める量子化ステップ幅予測器とで構成
してもよい。
The speech coding apparatus according to the present invention is characterized in that a psychoacoustic analysis means receives a plurality of frames of a fixed length from the input speech signal data storage means and performs a frequency analysis for each frame. Consists of a masking curve predictor that calculates the masking curve in consideration of the result and the masking effect that is a human auditory characteristic, and a quantization step width predictor that calculates the quantization step width from the masking curve calculated by the masking curve predictor May be.

【0016】[0016]

【発明の実施の形態】次に、本発明の実施の形態につい
て図面を参照して説明する。
Next, embodiments of the present invention will be described with reference to the drawings.

【0017】図1は本発明の第1の実施の形態を示すブ
ロック図である。
FIG. 1 is a block diagram showing a first embodiment of the present invention.

【0018】本発明の音声符号化装置10は、一定長の
複数のフレームに分割され入力端子9を介して入力され
る入力音声信号データを一時記憶する入力データメモリ
8と、入力音声信号データを各フレームごとに周波数分
割したデータとする周波数分割フィルタバンク1と、入
力データメモリ8から量子化ステップ幅を計算すべきフ
レームを中に挟む前後のi個のフレームを受け該当する
フレームのスペクトラム解析の結果とマスキングの効果
を含む人間の聴覚特性とを用いて量子化ステップ幅を計
算する心理聴覚分析部7と、周波数分割フィルタバンク
1が周波数分割したデータを心理聴覚分析部7が計算し
た量子化ステップ幅で量子化する量子化器2と、量子化
器2が量子化した量子化データを符号化ビット列に多重
化する多重化器3とを備えている。また、心理聴覚分析
部7は、入力データメモリ8から一定長の複数のフレー
ムを受け各フレームごとに周波数解析を行うスペクトラ
ム計算器4と、スペクトラム計算器4の計算結果と人間
の聴覚特性であるマスキング効果とを考慮してマスキン
グカーブを求めるマスキングカーブ予測器5と、マスキ
ングカーブ予測器5で求めたマスキングカーブから量子
化ステップ幅を求める量子化ステップ幅予測器6とを含
んでいる。
The speech encoding apparatus 10 of the present invention comprises: an input data memory 8 for temporarily storing input speech signal data which is divided into a plurality of frames of a fixed length and inputted via an input terminal 9; A frequency-division filter bank 1 that is data that is frequency-divided for each frame, and i frames before and after a frame for which a quantization step width is to be calculated are received from an input data memory 8, and a spectrum analysis of the corresponding frame is performed. Psychological auditory analysis unit 7 that calculates the quantization step width using the result and the human auditory characteristics including the effect of masking, and quantization that psychological auditory analysis unit 7 calculates the frequency-divided data by frequency division filter bank 1. A quantizer 2 for quantizing with a step width, and a multiplexer 3 for multiplexing the quantized data quantized by the quantizer 2 into an encoded bit sequence. It is equipped with a. Further, the psychological auditory analysis unit 7 receives a plurality of frames of a fixed length from the input data memory 8 and performs a frequency analysis for each frame, a calculation result of the spectrum calculator 4, and human auditory characteristics. It includes a masking curve estimator 5 for obtaining a masking curve in consideration of a masking effect, and a quantization step width estimator 6 for obtaining a quantization step width from the masking curve obtained by the masking curve estimator 5.

【0019】次に図1の心理聴覚分析部7のスペクトラ
ム計算器4に入力されるデータと実際に符号化される入
力音声信号データとの関係を図2の入力音声信号データ
の構成を説明する説明図を用いて説明する。名称および
符号は図1に示すのものを用いる。
Next, the relationship between the data input to the spectrum calculator 4 of the psychological auditory analyzer 7 in FIG. 1 and the input audio signal data actually encoded will be described with reference to the configuration of the input audio signal data in FIG. This will be described with reference to an explanatory diagram. The names and reference numerals shown in FIG. 1 are used.

【0020】スペクトラム計算器4に入力される入力音
声信号データは、Nフレーム目を符号化する場合には、
Nフレーム目を中に含む(N−j)フレ−ムから(N+
k)フレーム目までのB領域の入力音声信号データを用
いる。この場合の入力音声信号データは(i+1)×n
個のサンプルからなる。ここでi=j+kである。
The input audio signal data input to the spectrum calculator 4 is as follows when encoding the Nth frame.
From the (N-j) frame that contains the Nth frame inside, (N +
k) The input audio signal data in the B region up to the frame is used. The input audio signal data in this case is (i + 1) × n
Consists of samples. Here, i = j + k.

【0021】このB領域で表される(i+1)×n個の
入力音声信号をスペクトラム計算器4に入力し、周波数
分析を行い、この分析結果をマスキングカーブ予測器5
に入力し、マスキングカーブを求める。続いて、量子化
ステップ幅予測器6が、このマスキングカーブ情報をも
とに量子化ステップ幅を予測することにより、継時マス
キングの順向マスキングと逆向マスキングの両方のマス
キング効果を用いることが可能となる。
The (i + 1) × n input audio signals represented by the B region are input to the spectrum calculator 4 to perform frequency analysis, and the analysis result is used as a masking curve predictor 5
And calculate the masking curve. Subsequently, the quantization step width predictor 6 predicts the quantization step width based on the masking curve information, so that it is possible to use both the forward masking and the backward masking effects of the successive masking. Becomes

【0022】同じ(i+1)×n個のサンプル数を用い
てマスキングカーブを求める場合において、順向マスキ
ングと逆向マスキングの割り合いを変え、最も多くのマ
スキング量を有するマスキングカーブを求めることが可
能であり、この最も多くのマスキング量を持つマスキン
グカーブを用いて量子化ステップ幅を予測し、この予測
した量子化ステップ幅で量子化した量子化データは、同
じデータ量のデータを符号化した場合の中で、最も効率
が良い符号化となる。
When a masking curve is obtained by using the same number of (i + 1) × n samples, it is possible to obtain a masking curve having the largest amount of masking by changing the ratio between forward masking and reverse masking. Yes, the quantization step width is predicted using the masking curve having the largest amount of masking, and the quantized data quantized with the predicted quantization step width is obtained when the data having the same data amount is encoded. Among them, the most efficient encoding is performed.

【0023】なお、これまで、周波数分割手段として周
波数分割フィルタバンク1を用いた例で説明したが、こ
れは、周波数分割手段がサブバンド分割フィルタバンク
器であっても同様に作用し、最も効率が良い符号化を行
うことが可能である。
Although the above description has been made with reference to an example in which the frequency division means uses the frequency division filter bank 1 as the frequency division means, the operation is the same even if the frequency division means is a sub-band division filter bank device, and the most efficient operation is achieved. Can perform good coding.

【0024】また、周波数分割手段が変形離散コサイン
変換方式(MDCT)であっても、同様に、最も効率が
良い符号化を行うことが可能である。
Even if the frequency dividing means is a modified discrete cosine transform method (MDCT), the most efficient coding can be performed similarly.

【0025】[0025]

【発明の効果】以上説明したように、本発明は、量子化
ステップ幅を予測する場合、順向マスキングの効果と逆
向マスキング効果の両方のマスキング効果を組合せて用
いることにより、従来の順向マスキングの効果のみを用
いてマスキングカーブを算出したものに比較して、より
多くのマスキング量を得ることが可能となり、効率の良
い符号化を行うことが可能となるという効果が有る。
As described above, according to the present invention, when predicting the quantization step width, the conventional forward masking effect is obtained by using both the forward masking effect and the backward masking effect in combination. It is possible to obtain a larger amount of masking as compared with the case where a masking curve is calculated using only the effect of (1), and there is an effect that efficient coding can be performed.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の第1の実施の形態を示すブロック図で
ある。
FIG. 1 is a block diagram showing a first embodiment of the present invention.

【図2】本発明の第1の実施の形態の入力音声信号デー
タの構成を説明する説明図である。
FIG. 2 is an explanatory diagram illustrating a configuration of input audio signal data according to the first embodiment of this invention.

【図3】従来の一般的な音声符号化装置の構成を示すブ
ロック図である。
FIG. 3 is a block diagram showing a configuration of a conventional general speech encoding device.

【図4】従来の一般的な音声符号化装置の入力音声信号
データの構成を説明する説明図である。
FIG. 4 is an explanatory diagram illustrating a configuration of input speech signal data of a conventional general speech encoding device.

【符号の説明】[Explanation of symbols]

1 周波数分割フィルタバンク 2 量子化器 3 多重化器 4 スペクトラム計算器 5 マスキングカーブ予測器 6 量子化ステップ幅予測器 7 心理聴覚分析部 8 入力データメモリ 9 入力端子 10 音声符号化装置 DESCRIPTION OF SYMBOLS 1 Frequency division filter bank 2 Quantizer 3 Multiplexer 4 Spectrum calculator 5 Masking curve predictor 6 Quantization step width predictor 7 Psychological auditory analysis part 8 Input data memory 9 Input terminal 10 Voice encoder

───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平8−123490(JP,A) 特開 平8−51366(JP,A) 特開 平8−204575(JP,A) 特開 平8−204574(JP,A) 特開 平7−183818(JP,A) 特開 平3−139923(JP,A) 特開 平6−242797(JP,A) 特開 平6−232825(JP,A) 特開 平6−201744(JP,A) 特開 平8−211899(JP,A) (58)調査した分野(Int.Cl.6,DB名) H03M 7/30 G10L 7/04 G10L 9/18────────────────────────────────────────────────── ─── Continuation of front page (56) References JP-A-8-123490 (JP, A) JP-A-8-51366 (JP, A) JP-A-8-204575 (JP, A) JP-A-8-204 204574 (JP, A) JP-A-7-183818 (JP, A) JP-A-3-139923 (JP, A) JP-A-6-242797 (JP, A) JP-A-6-232825 (JP, A) JP-A-6-201744 (JP, A) JP-A-8-211899 (JP, A) (58) Fields investigated (Int. Cl. 6 , DB name) H03M 7/30 G10L 7/04 G10L 9/18

Claims (4)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 一定長の複数のフレームに分割され入力
端子を介して入力される入力音声信号データを各フレー
ムごとに周波数分割したデータとする周波数分割手段
と、前記一定長の複数のフレームを受け各フレームごと
にスペクトラム解析し最新のフレームに対しこの最新の
フレームおよびこの最新のフレーム以前のi(i=1,
2,…n)個のフレームのスペクトラム解析の結果とマ
スキングの効果を含む人間の聴覚特性とを用いて量子化
ステップ幅を計算する心理聴覚分析手段と、前記周波数
分割手段が周波数分割したデータを前記心理聴覚分析手
段が計算した量子化ステップ幅で量子化する量子化手段
と、この量子化手段が量子化した量子化データを符号化
ビット列に多重化する多重化手段とを備える音声符号化
装置において、前記入力端子と前記周波数分割手段およ
び前記心理聴覚分析手段との間に前記入力音声信号デー
タを一時記憶する入力音声信号データ記憶手段を設け、
前記心理聴覚分析手段が前記入力音声信号データ記憶手
段から量子化ステップ幅を計算すべきフレームを中に挟
む前後のi個のフレームを受け、前記量子化ステップ幅
を計算すべきフレームのスペクトラム解析の結果とマス
キングの効果を含む人間の聴覚特性とを用いて量子化ス
テップ幅を計算し前記量子化手段に出力することを特徴
とする音声符号化装置。
1. A frequency dividing means for dividing input audio signal data, which is divided into a plurality of frames of a fixed length and input through an input terminal, into frequency-divided data for each frame; The spectrum analysis is performed for each of the received frames, and the latest frame and i (i = 1, 1) before this latest frame are compared with the latest frame.
2,... N) psychological auditory analysis means for calculating a quantization step width using a result of spectrum analysis of frames and human auditory characteristics including a masking effect, and data obtained by frequency division by the frequency division means. A speech encoding apparatus comprising: a quantizing means for quantizing with the quantization step width calculated by the psychological auditory analysis means; and a multiplexing means for multiplexing the quantized data quantized by the quantizing means into an encoded bit string. In, provided input voice signal data storage means for temporarily storing the input voice signal data between the input terminal and the frequency division means and the psychological auditory analysis means,
The psychological auditory analysis means receives i frames before and after the frame for which the quantization step width is to be calculated from the input voice signal data storage means, and performs spectrum analysis of the frame for which the quantization step width is to be calculated. A speech coding apparatus comprising: calculating a quantization step width using a result and a human auditory characteristic including a masking effect and outputting the calculated quantization step width to the quantization unit.
【請求項2】 周波数分割手段がサブバンド分割フィル
タバンク器であることを特徴とする請求項1記載の音声
符号化装置。
2. The speech coding apparatus according to claim 1, wherein the frequency division means is a sub-band division filter bank unit.
【請求項3】 周波数分割手段が変形離散コサイン変換
方式(MDCT)であることを特徴とする請求項1記載
の音声符号化装置。
3. The speech coding apparatus according to claim 1, wherein the frequency dividing means is a modified discrete cosine transform (MDCT).
【請求項4】 心理聴覚分析手段が入力音声信号データ
記憶手段から一定長の複数のフレームを受け各フレーム
ごとに周波数解析を行うスペクトラム計算器と、このス
ペクトラム計算器の結果と人間の聴覚特性であるマスキ
ング効果を考慮してマスキングカーブを求めるマスキン
グカーブ予測器と、このマスキングカーブ予測器で求め
たマスキングカーブから量子化ステップ幅を求める量子
化ステップ幅予測器とから成ることを特徴とする請求項
1記載の音声符号化装置。
4. A spectrum calculator which receives a plurality of frames of a fixed length from the input voice signal data storage means and performs frequency analysis for each frame, and a result of the spectrum calculator and human auditory characteristics. A masking curve estimator for obtaining a masking curve in consideration of a certain masking effect, and a quantization step width estimator for obtaining a quantization step width from the masking curve obtained by the masking curve estimator. 2. The speech encoding device according to claim 1.
JP8134812A 1996-05-29 1996-05-29 Audio coding device Expired - Lifetime JP2820117B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8134812A JP2820117B2 (en) 1996-05-29 1996-05-29 Audio coding device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8134812A JP2820117B2 (en) 1996-05-29 1996-05-29 Audio coding device

Publications (2)

Publication Number Publication Date
JPH09321628A JPH09321628A (en) 1997-12-12
JP2820117B2 true JP2820117B2 (en) 1998-11-05

Family

ID=15137083

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8134812A Expired - Lifetime JP2820117B2 (en) 1996-05-29 1996-05-29 Audio coding device

Country Status (1)

Country Link
JP (1) JP2820117B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6363338B1 (en) * 1999-04-12 2002-03-26 Dolby Laboratories Licensing Corporation Quantization in perceptual audio coders with compensation for synthesis filter noise spreading
JP6160072B2 (en) 2012-12-06 2017-07-12 富士通株式会社 Audio signal encoding apparatus and method, audio signal transmission system and method, and audio signal decoding apparatus

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2913700B2 (en) * 1989-10-25 1999-06-28 ソニー株式会社 Highly efficient digital data encoding method.
KR960009936B1 (en) * 1992-10-07 1996-07-25 대우전자 주식회사 Measuring method and apparatus of audio signal distortion
JP3402483B2 (en) * 1993-01-29 2003-05-06 ソニー株式会社 Audio signal encoding device
JP3088580B2 (en) * 1993-02-19 2000-09-18 松下電器産業株式会社 Block size determination method for transform coding device.
KR100269213B1 (en) * 1993-10-30 2000-10-16 윤종용 Method for coding audio signal
KR960012475B1 (en) * 1994-01-18 1996-09-20 대우전자 주식회사 Digital audio coder of channel bit
JPH08123490A (en) * 1994-10-24 1996-05-17 Matsushita Electric Ind Co Ltd Spectrum envelope quantizing device
EP0721257B1 (en) * 1995-01-09 2005-03-30 Daewoo Electronics Corporation Bit allocation for multichannel audio coder based on perceptual entropy
JP3297238B2 (en) * 1995-01-20 2002-07-02 大宇電子株式會▲社▼ Adaptive coding system and bit allocation method
JPH08211899A (en) * 1995-02-06 1996-08-20 Nippon Columbia Co Ltd Method and device for encoding voice

Also Published As

Publication number Publication date
JPH09321628A (en) 1997-12-12

Similar Documents

Publication Publication Date Title
JP3352406B2 (en) Audio signal encoding and decoding method and apparatus
JP4033898B2 (en) Apparatus and method for applying waveform prediction to subbands of a perceptual coding system
US6484140B2 (en) Apparatus and method for encoding a signal as well as apparatus and method for decoding signal
US7752041B2 (en) Method and apparatus for encoding/decoding digital signal
EP0884850A2 (en) Scalable audio coding/decoding method and apparatus
EP0424016A2 (en) Perceptual coding of audio signals
EP0661827A2 (en) Subband filtering using inverse discrete cosine transform
US20060100885A1 (en) Method and apparatus to encode and decode an audio signal
US20040002854A1 (en) Audio coding method and apparatus using harmonic extraction
US20020169601A1 (en) Encoding device, decoding device, and broadcast system
JPH0846518A (en) Information coding and decoding method, information coder and decoder and information recording medium
JP3277699B2 (en) Signal encoding method and apparatus, and signal decoding method and apparatus
US20040098268A1 (en) MPEG audio encoding method and apparatus
JP3088580B2 (en) Block size determination method for transform coding device.
JP2820117B2 (en) Audio coding device
JPH0846516A (en) Device and method for information coding, device and method for information decoding and recording medium
JP4281131B2 (en) Signal encoding apparatus and method, and signal decoding apparatus and method
JP2776300B2 (en) Audio signal processing circuit
US6012025A (en) Audio coding method and apparatus using backward adaptive prediction
US6161088A (en) Method and system for encoding a digital audio signal
JP4721355B2 (en) Coding rule conversion method and apparatus for coded data
JP3454394B2 (en) Quasi-lossless audio encoding device
JP2906483B2 (en) High-efficiency encoding method for digital audio data and decoding apparatus for digital audio data
JPH08179794A (en) Sub-band coding method and device
JP4618823B2 (en) Signal encoding apparatus and method

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19980728

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070828

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080828

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080828

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090828

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090828

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100828

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110828

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110828

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120828

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120828

Year of fee payment: 14

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120828

Year of fee payment: 14

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120828

Year of fee payment: 14

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120828

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120828

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130828

Year of fee payment: 15

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term