JP2005128401A - 音声処理装置及び音声符号化方法 - Google Patents
音声処理装置及び音声符号化方法 Download PDFInfo
- Publication number
- JP2005128401A JP2005128401A JP2003365973A JP2003365973A JP2005128401A JP 2005128401 A JP2005128401 A JP 2005128401A JP 2003365973 A JP2003365973 A JP 2003365973A JP 2003365973 A JP2003365973 A JP 2003365973A JP 2005128401 A JP2005128401 A JP 2005128401A
- Authority
- JP
- Japan
- Prior art keywords
- unit
- frequency
- speech
- signal
- frequency conversion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【解決手段】音声処理装置100は、QMF(Quadrature Mirror Filter)3により入力された音声信号を高域と低域に分割し、その分割された音声信号の振幅を正規化し、その正規化された音声信号に対し、FFT等の周波数変換を施す。そして、周波数変換により得られた変換係数の絶対値を減少させる処理を行い、その変換係数が処理された音声信号に対し、ベクトル量子化を施し、ベクトル量子化により得られた信号に対し、エントロピー符号化を施して出力する。
【選択図】図1
Description
まず、本実施形態における構成について説明する。
L=XA+XB (2)
H=XA−XB (3)
ここで、XA、XBは、式(4)、式(5)のように定義される。
x'i=xi/gain (6)
ここで、gain=MAX{xi|i=1,…,N}(MAXは、最大値を得る関数)である。
量子化されたXk=Xk/r (10)
以下では、本実施形態で適用されるエントロピー符号化の例として、ハフマン符号化、レンジコーダによる符号化について説明する。
ハフマン符号化とは、出現頻度の高い記号には短い符号を割り当て、出現頻度の低い記号には長い符号を割り当てることで、全体のデータ量を圧縮する方式である。例えば、4つの記号{a、b、c、d}からなる100文字のデータがあったとする。全ての記号に同じ長さの2進数の符号(固定長符号)を割り当てる場合、4つの記号を表すには2ビットが必要であるため、100文字のデータ量は、2[bit]×100=200[bit]となる。
符号化前の元信号に含まれる記号の集合をS={si|i=1,…,n}とし、各記号siの出現確率をpiとする。また、元信号に含まれる各記号siを予め決められた順番に並べ替えた記号列{s1、s2、…、sn}において、記号sk(k≧2)より前に並んでいる各記号の出現確率の合計をFkとする。即ち、Fkは、式(12)のように表される。
range'=range×pk (13)
low'=low+range×Fk (14)
式(13)及び式(14)で算出されたrange'、low'が、次の信号が入力されたときのrange、lowとなる。
fk'=fk+1 (19)
エントロピー符号化部10は、出現確率fkの加算に伴い、cum、出現確率pi、Fiを再計算し、生起確率テーブル81を更新する。エントロピー符号化部10は、これらの処理を、入力信号がなくなるまで行い、最後の信号が入力されたときに算出されたrange、lowに基づいて決定される範囲low〜low+rangeの間の値を符号値として出力する。
まず、図9のフローチャートを参照して、音声処理装置100において実行される音声圧縮処理について説明する。以下のフローチャートでは、エントロピー符号化として、レンジコーダによる符号化が用いられる場合を示す。
2 DC除去部
3 QMF
4 フレーム化部
5 正規化部
6 周波数変化部
7 変換係数処理部
8 周波数並べ替え部
9 ベクトル量子化部
9a VQテーブル
10 エントロピー符号化部
81 生起確率テーブル
11 レートコントローラ
100 音声処理装置
Claims (10)
- 入力された音声信号を直交ミラーフィルタにより高域と低域に分割するフィルタ部と、
前記フィルタ部により分割された音声信号の振幅を正規化する正規化部と、
前記正規化部により正規化された音声信号に対し、周波数変換を施す周波数変換部と、
前記周波数変換により得られた音声信号に対し、ベクトル量子化を施すベクトル量子化部と、
前記ベクトル量子化により得られた音声信号に対し、エントロピー符号化を施すエントロピー符号化部と、
を備えることを特徴とする音声処理装置。 - 前記周波数変換部は、周波数変換として離散フーリエ変換を用いることを特徴とする請求項1に記載の音声処理装置。
- 前記周波数変換部は、周波数変換として変形離散コサイン変換を用いることを特徴とする請求項1に記載の音声処理装置。
- 前記周波数変換により得られた変換係数の絶対値を減少させる処理を行う変換係数処理部を備え、
前記ベクトル量子化部は、前記変換係数処理部により処理された音声信号に対し、ベクトル量子化を施すことを特徴とする請求項1〜3の何れか一項に記載の音声処理装置。 - 前記変換係数処理部は、前記周波数変換により得られた変換係数にスカラー量子化を施すことを特徴とする請求項4に記載の音声処理装置。
- 前記変換係数処理部は、前記周波数変換により得られた変換係数のうち、絶対値が予め設定された閾値以下である変換係数の絶対値を減少させる処理を行うことを特徴とする請求項4に記載の音声処理装置。
- 前記エントロピー符号化部は、エントロピー符号化としてハフマン符号化を用いることを特徴とする請求項1〜6の何れか一項に記載の音声処理装置。
- 前記エントロピー符号化部は、エントロピー符号化としてレンジコーダによる符号化を用いることを特徴とする請求項1〜6の何れか一項に記載の音声処理装置。
- 前記エントロピー符号化部は、入力信号を示す各記号の出現確率を格納した生起確率テーブルを有し、記号の入力に伴って前記生起確率テーブルを更新することを特徴とする請求項8に記載の音声処理装置。
- 入力された音声信号を直交ミラーフィルタにより高域と低域に分割し、
前記分割された音声信号の振幅を正規化し、
前記正規化された音声信号に対し、周波数変換を施し、
前記周波数変換により得られた音声信号に対し、ベクトル量子化を施し、
前記ベクトル量子化により得られた音声信号に対し、エントロピー符号化を施すことを特徴とする音声符号化方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003365973A JP2005128401A (ja) | 2003-10-27 | 2003-10-27 | 音声処理装置及び音声符号化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003365973A JP2005128401A (ja) | 2003-10-27 | 2003-10-27 | 音声処理装置及び音声符号化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005128401A true JP2005128401A (ja) | 2005-05-19 |
JP2005128401A5 JP2005128401A5 (ja) | 2006-07-06 |
Family
ID=34644463
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003365973A Pending JP2005128401A (ja) | 2003-10-27 | 2003-10-27 | 音声処理装置及び音声符号化方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005128401A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9257129B2 (en) | 2013-03-28 | 2016-02-09 | Fujitsu Limited | Orthogonal transform apparatus, orthogonal transform method, orthogonal transform computer program, and audio decoding apparatus |
US9800987B2 (en) | 2006-03-07 | 2017-10-24 | Samsung Electronics Co., Ltd. | Binaural decoder to output spatial stereo sound and a decoding method thereof |
CN112289328A (zh) * | 2020-10-28 | 2021-01-29 | 北京百瑞互联技术有限公司 | 一种确定音频编码码率的方法及系统 |
-
2003
- 2003-10-27 JP JP2003365973A patent/JP2005128401A/ja active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9800987B2 (en) | 2006-03-07 | 2017-10-24 | Samsung Electronics Co., Ltd. | Binaural decoder to output spatial stereo sound and a decoding method thereof |
US10182302B2 (en) | 2006-03-07 | 2019-01-15 | Samsung Electronics Co., Ltd. | Binaural decoder to output spatial stereo sound and a decoding method thereof |
US10555104B2 (en) | 2006-03-07 | 2020-02-04 | Samsung Electronics Co., Ltd. | Binaural decoder to output spatial stereo sound and a decoding method thereof |
US9257129B2 (en) | 2013-03-28 | 2016-02-09 | Fujitsu Limited | Orthogonal transform apparatus, orthogonal transform method, orthogonal transform computer program, and audio decoding apparatus |
CN112289328A (zh) * | 2020-10-28 | 2021-01-29 | 北京百瑞互联技术有限公司 | 一种确定音频编码码率的方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7599833B2 (en) | Apparatus and method for coding residual signals of audio signals into a frequency domain and apparatus and method for decoding the same | |
CN1905010B (zh) | 编码音频数据的设备和方法及解码音频数据的设备和方法 | |
JP4800645B2 (ja) | 音声符号化装置、及び音声符号化方法 | |
US6593872B2 (en) | Signal processing apparatus and method, signal coding apparatus and method, and signal decoding apparatus and method | |
JPH09127990A (ja) | 音声符号化方法及び装置 | |
CN111179946A (zh) | 无损编码方法和无损解码方法 | |
US20040002854A1 (en) | Audio coding method and apparatus using harmonic extraction | |
JP4978539B2 (ja) | 符号化装置、符号化方法及びプログラム。 | |
JP2009512895A (ja) | スペクトル・ダイナミックスに基づく信号コーディング及びデコーディング | |
JP2006031016A (ja) | 音声コーディング/デコーディング方法及びその装置 | |
US20090210219A1 (en) | Apparatus and method for coding and decoding residual signal | |
Kumar et al. | The optimized wavelet filters for speech compression | |
EP0954853A1 (en) | A method of encoding a speech signal | |
JP4009781B2 (ja) | 音声処理装置及び音声符号化方法 | |
US20040083094A1 (en) | Wavelet-based compression and decompression of audio sample sets | |
JP3237178B2 (ja) | 符号化方法及び復号化方法 | |
JP2005128401A (ja) | 音声処理装置及び音声符号化方法 | |
JP4259401B2 (ja) | 音声処理装置及び音声符号化方法 | |
JPH05265499A (ja) | 高能率符号化方法 | |
JP2004302259A (ja) | 音響信号の階層符号化方法および階層復号化方法 | |
JP4626261B2 (ja) | 音声符号化装置及び音声符号化方法 | |
JP4054919B2 (ja) | 音声処理装置及び音声符号化方法 | |
JP4373693B2 (ja) | 音響信号の階層符号化方法および階層復号化方法 | |
JP2712925B2 (ja) | 音声処理装置 | |
JPH10260698A (ja) | 信号符号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060522 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060522 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090402 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090428 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20091006 |