JP2005345703A - 音声処理装置及び音声符号化方法 - Google Patents
音声処理装置及び音声符号化方法 Download PDFInfo
- Publication number
- JP2005345703A JP2005345703A JP2004164488A JP2004164488A JP2005345703A JP 2005345703 A JP2005345703 A JP 2005345703A JP 2004164488 A JP2004164488 A JP 2004164488A JP 2004164488 A JP2004164488 A JP 2004164488A JP 2005345703 A JP2005345703 A JP 2005345703A
- Authority
- JP
- Japan
- Prior art keywords
- amplitude
- frequency
- vector quantization
- audio signal
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】音声処理装置100は、ベクトル量子化により得られた符号に対し、逆ベクトル量子化を施し、周波数逆変換を施す。そして、入力された音声信号に対する周波数逆変換により得られた音声信号の最大振幅の比率の逆数を、周波数変換により得られた周波数変換係数に乗算することにより当該周波数変換係数を調整し、その調整された周波数変換係数に対し、ベクトル量子化、逆ベクトル量子化、周波数逆変換を施すことにより得られた音声信号の最大振幅と、前記入力された音声信号の最大振幅を比較する。入力された音声信号の振幅が、周波数逆変換により得られた音声信号の振幅より大きい場合、調整された周波数変換係数に対し、ベクトル量子化を施し、そのベクトル量子化により得られた符号に対し、エントロピー符号化を施す。
【選択図】図1
Description
まず、本実施形態における構成について説明する。
Fj={0,0,…,0}; |Fj|2<t (6)
max_x=MAX(xi) ;i=0,…,N-1 (7)
max_y=MAX(yi) ;i=0,…,N-1 (8)
ここで、MAXは最大値をとる関数である。従って、入力波形に対する再生波形の最大振幅の比率は、max_y/max_xとなる。
以下では、本実施形態で適用されるエントロピー符号化の例として、ハフマン符号化、レンジコーダによる符号化について説明する。
ハフマン符号化とは、出現頻度の高い記号には短い符号を割り当て、出現頻度の低い記号には長い符号を割り当てることで、全体のデータ量を圧縮する方式である。例えば、4つの記号{a、b、c、d}からなる100文字のデータがあったとする。全ての記号に同じ長さの2進数の符号(固定長符号)を割り当てる場合、4つの記号を表すには2ビットが必要であるため、100文字のデータ量は、2[bit]×100=200[bit]となる。
符号化前の元信号に含まれる記号の集合をS={si|i=1,…,n}とし、各記号siの出現確率をpiとする。また、元信号に含まれる各記号siを予め決められた順番に並べ替えた記号列{s1、s2、…、sn}において、記号sk(k≧2)より前に並んでいる各記号の出現確率の合計をGkとする。即ち、Gkは、式(10)のように表される。
range'=range×pk (11)
low'=low+range×Gk (12)
式(11)及び式(12)で算出されたrange'、low'が、次の信号が入力されたときのrange、lowとなる。
gk'=gk+1 (17)
エントロピー符号化部8は、出現確率gkの加算に伴い、cum、出現確率pi、Giを再計算し、生起確率テーブル81を更新する。エントロピー符号化部8は、これらの処理を、入力信号がなくなるまで行い、最後の信号が入力されたときに算出されたrange、lowに基づいて決定される範囲low〜low+rangeの間の値を符号値として出力する。
まず、図9のフローチャートを参照して、音声処理装置100において実行される音声圧縮処理について説明する。
図10の振幅調整処理では、MDCT係数の調整後に、入力波形と再生波形の最大振幅の比較を行うようにしたが、以下では、図10の振幅調整処理の変形例として、MDCT係数の調整を、再生波形の最大振幅が入力波形の最大振幅より大きい場合にのみ行う場合の振幅調整処理について図11のフローチャートを参照して説明する。
2 DC除去部
3 フレーム化部
4 レベル調整部
5 周波数変化部
6 周波数並べ替え部
7 ベクトル量子化部(第1のベクトル量子化部、第2のベクトル量子化部)
7a 高域用VQテーブル
7b 低域用VQテーブル
8 エントロピー符号化部
81 生起確率テーブル
9 レートコントローラ
10 データ削除部
11 逆ベクトル量子化部
12 周波数逆変換部
13 振幅比較部
14 係数調整部
100 音声処理装置
Claims (8)
- 入力された音声信号をフレームに分割するフレーム化部と、
前記フレーム化部により得られたフレーム毎に、フレームに含まれる音声信号の振幅の最大値に基づいて音声信号のレベルを調整するレベル調整部と、
前記レベル調整部によりレベルが調整された音声信号に対し、周波数変換を施す周波数変換部と、
前記周波数変換により得られた周波数変換係数に対し、ベクトル量子化を施す第1のベクトル量子化部と、
前記第1のベクトル量子化部により得られたベクトル量子化符号に対し、逆ベクトル量子化を施す逆ベクトル量子化部と、
前記逆ベクトル量子化部により得られた周波数変換係数に対し、周波数逆変換を施す周波数逆変換部と、
前記入力された音声信号の振幅に対する前記周波数逆変換により得られた音声信号の振幅の比率の逆数を、前記周波数変換により得られた周波数変換係数に乗算することにより当該周波数変換係数を調整する係数調整部と、
前記係数調整部により調整された周波数変換係数に対し、前記ベクトル量子化、前記逆ベクトル量子化、前記周波数逆変換を施すことにより得られた音声信号の振幅と、前記入力された音声信号の振幅を比較する振幅比較部と、
前記入力された音声信号の振幅が、前記周波数逆変換により得られた音声信号の振幅より大きい場合、前記係数調整部により調整された周波数変換係数に対し、ベクトル量子化を施す第2のベクトル量子化部と、
前記第2のベクトル量子化部により得られたベクトル量子化符号に対し、エントロピー符号化を施すエントロピー符号化部と、
を備えることを特徴とする音声処理装置。 - 前記周波数逆変換により得られた音声信号の振幅が、前記入力された音声信号の振幅より大きい場合、前記エントロピー符号化部は、前記第1のベクトル量子化部により得られたベクトル量子化符号に対し、エントロピー符号化を施すことを特徴とする請求項1に記載の音声処理装置。
- 前記振幅比較部は、前記周波数逆変換により得られた音声信号の振幅の最大値と、前記入力された音声信号の振幅の最大値を比較し、
前記第2のベクトル量子化部は、前記入力された信号の振幅の最大値が、前記周波数逆変換により得られた音声信号の振幅の最大値より大きい場合に、前記調整された周波数変換係数に対してベクトル量子化を施すことを特徴とする請求項1又は2に記載の音声処理装置。 - 入力された音声信号をフレームに分割するフレーム化部と、
前記フレーム化部により得られたフレーム毎に、フレームに含まれる音声信号の振幅の最大値に基づいて音声信号のレベルを調整するレベル調整部と、
前記レベル調整部によりレベルが調整された音声信号に対し、周波数変換を施す周波数変換部と、
前記周波数変換により得られた周波数変換係数に対し、ベクトル量子化を施す第1のベクトル量子化部と、
前記第1のベクトル量子化部により得られたベクトル量子化符号に対し、逆ベクトル量子化を施す逆ベクトル量子化部と、
前記逆ベクトル量子化部により得られた周波数変換係数に対し、周波数逆変換を施す周波数逆変換部と、
前記周波数逆変換により得られた音声信号の振幅と、前記入力された音声信号の振幅を比較する振幅比較部と、
前記周波数逆変換により得られた音声信号の振幅が、前記入力された音声信号の振幅より大きい場合、当該入力された音声信号の振幅に対する当該周波数逆変換により得られた音声信号の振幅の比率の逆数を、前記周波数変換により得られた周波数変換係数に乗算することにより当該周波数変換係数を調整する係数調整部と、
前記係数調整部において調整された周波数変換係数に対し、ベクトル量子化を施す第2のベクトル量子化部と、
前記第2のベクトル量子化部により得られたベクトル量子化符号に対し、エントロピー符号化を施すエントロピー符号化部と、
を備えることを特徴とする音声処理装置。 - 前記入力された音声信号の振幅が、前記周波数逆変換により得られた音声信号の振幅より大きい場合、前記エントロピー符号化部は、前記第1のベクトル量子化部により得られた周波数変換係数に対し、エントロピー符号化を施すことを特徴とする請求項4に記載の音声処理装置。
- 前記振幅比較部は、前記周波数逆変換により得られた音声信号の振幅の最大値と、前記入力された音声信号の振幅の最大値を比較し、
前記係数調整部は、当該入力された音声信号に対する当該周波数逆変換により得られた音声信号の振幅の最大値の比率の逆数を、前記周波数変換により得られた周波数変換係数に乗算することを特徴とする請求項4又は5に記載の音声処理装置。 - 入力された音声信号をフレームに分割し、
前記フレーム毎に、フレームに含まれる音声信号の振幅の最大値に基づいて音声信号のレベルを調整し、
レベルが調整された音声信号に対し、周波数変換を施し、
前記周波数変換により得られた周波数変換係数に対し、ベクトル量子化を施し、
前記ベクトル量子化により得られたベクトル量子化符号に対し、逆ベクトル量子化を施し、
前記逆ベクトル量子化により得られた周波数変換係数に対し、周波数逆変換を施し、
前記入力された音声信号の振幅に対する前記周波数逆変換により得られた音声信号の振幅の比率の逆数を、前記周波数変換により得られた周波数変換係数に乗算することにより当該周波数変換係数を調整し、
前記調整された周波数変換係数に対し、前記ベクトル量子化、前記逆ベクトル量子化、前記周波数逆変換を施すことにより得られた音声信号の振幅と、前記入力された音声信号の振幅を比較し、
前記入力された音声信号の振幅が、前記周波数逆変換により得られた音声信号の振幅より大きい場合、前記調整された周波数変換係数に対し、ベクトル量子化を施し、
前記ベクトル量子化により得られたベクトル量子化符号に対し、エントロピー符号化を施すことを特徴とする音声符号化方法。 - 入力された音声信号をフレームに分割し、
フレーム毎に、フレームに含まれる音声信号の振幅の最大値に基づいて音声信号のレベルを調整し、
レベルが調整された音声信号に対し、周波数変換を施し、
前記周波数変換により得られた周波数変換係数に対し、ベクトル量子化を施し、
前記ベクトル量子化により得られたベクトル量子化符号に対し、逆ベクトル量子化を施し、
前記逆ベクトル量子化により得られた周波数変換係数に対し、周波数逆変換を施し、
前記周波数逆変換により得られた音声信号の振幅と、前記入力された音声信号の振幅を比較し、
前記周波数逆変換により得られた音声信号の振幅が、前記入力された音声信号の振幅より大きい場合、当該入力された音声信号の振幅に対する当該周波数逆変換により得られた音声信号の振幅の比率の逆数を、前記周波数変換により得られた周波数変換係数に乗算することにより当該周波数変換係数を調整し、
前記調整された周波数変換係数に対し、ベクトル量子化を施し、
前記ベクトル量子化により得られたベクトル量子化符号に対し、エントロピー符号化を施すことを特徴とする音声符号化方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004164488A JP4054919B2 (ja) | 2004-06-02 | 2004-06-02 | 音声処理装置及び音声符号化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004164488A JP4054919B2 (ja) | 2004-06-02 | 2004-06-02 | 音声処理装置及び音声符号化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005345703A true JP2005345703A (ja) | 2005-12-15 |
JP4054919B2 JP4054919B2 (ja) | 2008-03-05 |
Family
ID=35498157
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004164488A Active JP4054919B2 (ja) | 2004-06-02 | 2004-06-02 | 音声処理装置及び音声符号化方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4054919B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008015357A (ja) * | 2006-07-07 | 2008-01-24 | Toshiba Corp | 符号化装置 |
-
2004
- 2004-06-02 JP JP2004164488A patent/JP4054919B2/ja active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008015357A (ja) * | 2006-07-07 | 2008-01-24 | Toshiba Corp | 符号化装置 |
Also Published As
Publication number | Publication date |
---|---|
JP4054919B2 (ja) | 2008-03-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7599833B2 (en) | Apparatus and method for coding residual signals of audio signals into a frequency domain and apparatus and method for decoding the same | |
JP4800645B2 (ja) | 音声符号化装置、及び音声符号化方法 | |
JP4548348B2 (ja) | 音声符号化装置及び音声符号化方法 | |
JP6452759B2 (ja) | 先進量子化器 | |
US6593872B2 (en) | Signal processing apparatus and method, signal coding apparatus and method, and signal decoding apparatus and method | |
JPH09127990A (ja) | 音声符号化方法及び装置 | |
JP4978539B2 (ja) | 符号化装置、符号化方法及びプログラム。 | |
JP2007504503A (ja) | 低ビットレートオーディオ符号化 | |
JP3344944B2 (ja) | オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法 | |
US20090210219A1 (en) | Apparatus and method for coding and decoding residual signal | |
JP4259401B2 (ja) | 音声処理装置及び音声符号化方法 | |
JP4009781B2 (ja) | 音声処理装置及び音声符号化方法 | |
JP4359949B2 (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
JP4054919B2 (ja) | 音声処理装置及び音声符号化方法 | |
JP3237178B2 (ja) | 符号化方法及び復号化方法 | |
JPH05265499A (ja) | 高能率符号化方法 | |
JP4626261B2 (ja) | 音声符号化装置及び音声符号化方法 | |
JP2002091497A (ja) | オーディオ信号符号化方法、復号化方法及びそれらの方法を実行するプログラム記憶媒体 | |
JP2005128401A (ja) | 音声処理装置及び音声符号化方法 | |
JP2712925B2 (ja) | 音声処理装置 | |
JP4373693B2 (ja) | 音響信号の階層符号化方法および階層復号化方法 | |
JP3453116B2 (ja) | 音声符号化方法及び装置 | |
JP4024185B2 (ja) | デジタルデータ符号化装置 | |
JP2006126592A (ja) | 音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法 | |
JP3747357B2 (ja) | 楽音信号の符号化装置及び復号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20071101 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20071113 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20071126 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4054919 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101221 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101221 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111221 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111221 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121221 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121221 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131221 Year of fee payment: 6 |