JP4516345B2 - 音声符号化情報処理装置および音声符号化情報処理プログラム - Google Patents
音声符号化情報処理装置および音声符号化情報処理プログラム Download PDFInfo
- Publication number
- JP4516345B2 JP4516345B2 JP2004118361A JP2004118361A JP4516345B2 JP 4516345 B2 JP4516345 B2 JP 4516345B2 JP 2004118361 A JP2004118361 A JP 2004118361A JP 2004118361 A JP2004118361 A JP 2004118361A JP 4516345 B2 JP4516345 B2 JP 4516345B2
- Authority
- JP
- Japan
- Prior art keywords
- speech
- frequency coefficient
- coding information
- speech coding
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
この実施形態の説明では、音声符号化情報処理装置について、第一実施形態から第六実施形態までの6個の実施形態を説明することとし、まず、第一実施形態から第六実施形態までのそれぞれの音声符号化情報処理装置の構成の説明、動作の説明を順次行うこととする。
図1は、音声符号化情報処理装置のブロック図である。
この図1に示すように、音声符号化情報処理装置1は、複数の音声符号化情報(音声ストリーム)が入力され、これらの音声符号化情報(複数の音声符号化情報を音声符号化情報群という)を、周波数領域で加算して処理するもので、周波数係数変換手段3と、周波数係数加算手段5と、音声符号化情報変換手段7とを備えている。
スケールファクター値は、DCT係数の値を制御する値の一つであり、量子化精度を制御する値である。
量子化値は、DCT係数を浮動小数点形式で表現した場合の仮数値(常用対数の正の小数部分)を指すものである。
グローバルゲインおよびスケールファクターゲインは、量子化精度をどのくらいにしているかを示している係数(量子化係数)のことであり、音声符号化情報の周波数帯域毎に量子化係数を変化させて、精度を変化させるためのものである。
周波数係数加算手段5は、周波数係数変換手段3で音声符号化情報(音声ストリーム)が変換された周波数係数を、ブロック単位で加算するものである。この実施形態では、周波数係数変換手段3は、音声符号化情報として、AACの音声ストリームを入力しており、この場合、1024周波数係数が1ブロック単位となる。加算する周波数係数は、予め周波数係数変換手段3で付加しておいたスケールファクター値のインデックスが同じもの同士である。つまり、S_A[sb]=S_B[sb]の条件を満たす場合に、新しい量子化値(加算した周波数係数)x_quant_new[I]=R_A[I]+R_B[I]で表すことができる。
ビットストリームマルチプレクサ部7bは、周波数係数変換手段3で分離された当初の音声符号化情報(音声ストリーム)に含まれていたヘッダ情報と、ノイズレスコーディング部7aで符号化された符号化データ(ハフマン符号語)とを、所定の形式に従って、並べ替えて出力するものである。
次に、図7に示すフローチャートを参照して、図1に示した音声符号化情報処理装置1の動作について説明する(適宜、図1参照)。
まず、音声符号化情報処理装置1は、入力された音声符号化情報(音声ストリーム)群を、周波数係数変換手段3によって、周波数係数に変換する(ステップS1)。続いて、音声符号化情報処理装置1は、周波数係数加算手段5によって、周波数係数を加算する(ステップS2)。
図2は、音声符号化情報処理装置(第二実施形態)のブロック図である。
この図2に示すように、音声符号化情報処理装置1Aは、複数の音声符号化情報(音声ストリーム)が入力され、これらの音声符号化情報を、周波数領域で加算する際に、量子化精度を制御しながら処理するもので、周波数係数変換手段3と、周波数係数加算手段5Aと、音声符号化情報変換手段7Aとを備えている。図1に示した音声符号化情報処理装置1の構成と同じ構成については、同一の符号を付して、その説明を省略する。
・・・数式(2)
つまり、このレート歪みコントローラ部7dは、許容される量子化ノイズの大きさ内において、必要なビット数が、使用可能なビット数を下回るまで、スケールファクター値の計算と、量子化値の計算とを繰り返し行って、所定の値以下になるように、ビットレートを削減していくものである。
次に、図8に示すフローチャートを参照して、図2に示した音声符号化情報処理装置1Aの動作について説明する(適宜、図2参照)。
まず、音声符号化情報処理装置1Aは、入力された音声符号化情報(音声ストリーム)群を、周波数係数変換手段3によって、周波数係数に変換する(ステップS11)。続いて、音声符号化情報処理装置1Aは、周波数係数加算手段5Aによって、量子化精度を制御しつつ、周波数係数を加算する(ステップS12)。
図3は、音声符号化情報処理装置(第三実施形態)のブロック図である。
この図3に示すように、音声符号化情報処理装置1Bは、複数の音声符号化情報(音声ストリーム)が入力され、これらの音声符号化情報(複数の音声符号化情報を音声符号化情報群という)に対して、周波数領域で外部ゲインを乗算してから加算して処理するもので、周波数係数変換手段3と、周波数係数乗算手段(ゲイン乗算手段)9と、周波数係数加算手段5と、音声符号化情報変換手段7とを備えている。図1に示した音声符号化情報処理装置1の構成と同じ構成については、同一の符号を付して、その説明を省略する。
次に、図9に示すフローチャートを参照して、図3に示した音声符号化情報処理装置1Bの動作について説明する(適宜、図3参照)。
まず、音声符号化情報処理装置1Bは、入力された音声符号化情報(音声ストリーム)群を、周波数係数変換手段3によって、周波数係数に変換する(ステップS21)。続いて、音声符号化情報処理装置1Bは、周波数係数乗算手段9によって、周波数係数に外部ゲインを乗算する(ステップS22)。
図4は、音声符号化情報処理装置(第四実施形態)のブロック図である。
この図4に示すように、音声符号化情報処理装置1Cは、複数の音声符号化情報(音声ストリーム)が入力され、これらの音声符号化情報を、周波数領域で、外部ゲインを乗算してから加算する際に、量子化精度を制御しながら処理するもので、周波数係数変換手段3と、周波数係数乗算手段(ゲイン乗算手段)9Cと、周波数係数加算手段5Aと、音声符号化情報変換手段7Aとを備えている。図2、図3に示した音声符号化情報処理装置1A、1Bの構成と同じ構成については、同一の符号を付して、その説明を省略する。
次に、図10に示すフローチャートを参照して、図4に示した音声符号化情報処理装置1Cの動作について説明する(適宜、図4参照)。
まず、音声符号化情報処理装置1Cは、入力された音声符号化情報(音声ストリーム)群を、周波数係数変換手段3によって、周波数係数に変換する(ステップS31)。続いて、音声符号化情報処理装置1Cは、周波数係数乗算手段9Cによって、周波数係数に外部ゲインを乗算する(ステップS32)。
図5は、音声符号化情報処理装置(第五実施形態)のブロック図である。
この図5に示すように、音声符号化情報処理装置1Dは、複数の音声符号化情報(音声ストリーム)が入力され、これらの音声符号化情報を任意の接続点で接続させると共に、接続させた音声符号化情報を、周波数領域で外部ゲインを乗算してから加算処理するもので、接続点制御手段11と、周波数係数変換手段3と、周波数係数乗算手段9と、周波数係数加算手段5と、音声符号化情報変換手段7と、音声符号化情報切替手段13とを備えている。図3に示した音声符号化情報処理装置1Bの構成と同じ構成については、同一の符号を付して、その説明を省略する。
なお、この接続点制御入力信号は、音声フレーム番号を特定したものである。
次に、図11に示すフローチャートを参照して、図5に示した音声符号化情報処理装置1Dの動作について説明する(適宜、図5参照)。
まず、音声符号化情報処理装置1Dは、入力された音声符号化情報(音声ストリーム)群について、音声符号化情報それぞれの接続点近傍であるか否かを、接続点制御手段11により接続点制御入力信号に従って判断する(ステップS41)。音声符号化情報それぞれの接続点近傍であると判断された場合(ステップS41、Yes)、音声符号化情報は、周波数係数変換手段3に入力され、音声符号化情報それぞれの接続点近傍であると判断されなかった場合(ステップS41、No)、音声符号化情報は、音声符号化情報切替手段13に入力される。
図6は、音声符号化情報処理装置(第六実施形態)のブロック図である。
この図6に示すように、音声符号化情報処理装置1Eは、複数の音声符号化情報(音声ストリーム)が入力され、これらの音声符号化情報を任意の接続点で接続させると共に、接続させた音声符号化情報を、周波数領域で外部ゲインを乗算してから加算処理する際に、量子化精度を制御しながら行うもので、接続点制御手段11と、周波数係数変換手段3と、周波数係数乗算手段9と、周波数係数加算手段5Aと、音声符号化情報変換手段7Aと、音声符号化情報切替手段13とを備えている。図2、図5に示した音声符号化情報処理装置1A、1Dの構成と同じ構成については、同一の符号を付して、その説明を省略する。
次に、図12に示すフローチャートを参照して、図6に示した音声符号化情報処理装置1Eの動作について説明する(適宜、図6参照)。
まず、音声符号化情報処理装置1Eは、入力された音声符号化情報(音声ストリーム)群について、音声符号化情報それぞれの接続点近傍であるか否かを、接続点制御手段11により接続点制御入力信号に従って判断する(ステップS51)。音声符号化情報それぞれの接続点近傍であると判断された場合(ステップS51、Yes)、音声符号化情報は、周波数係数変換手段3に入力され、音声符号化情報それぞれの接続点近傍であると判断されなかった場合(ステップS51、No)、音声符号化情報は、音声符号化情報切替手段13に入力される。
3 周波数係数変換手段
5、5A 周波数係数加算手段
5a 量子化精度制御部(量子化精度制御手段)
7、7A 音声符号化情報変換手段
9、9C 周波数係数乗算手段(ゲイン乗算手段)
11 接続点制御手段
13 音声符号化情報切替手段
Claims (3)
- 音声を符号化した音声符号化情報が複数集まってなる音声符号化情報群を周波数係数に変換して加算した後、前記音声符号化情報に変換する音声符号化情報処理装置であって、
入力された前記音声符号化情報群を周波数係数に変換する周波数係数変換手段と、
この周波数係数変換手段によって変換された周波数係数に、前記音声符号化情報それぞれの出力比率となるゲインを乗算するゲイン乗算手段と、
このゲイン乗算手段から出力された周波数係数を加算する周波数係数加算手段と、
この周波数係数加算手段によって加算された周波数係数を音声符号化情報に変換する音声符号化情報変換手段と、を備え、
前記ゲイン乗算手段は、前記音声符号化情報のそれぞれに予め含まれている量子化精度情報を変更することで、前記ゲインを乗算する際の計算量を削減し、
前記周波数係数加算手段は、前記周波数係数を加算する際に、前記周波数係数の量子化精度を制御する量子化精度制御手段を備え、
前記量子化精度制御手段は、2つの前記音声符号化情報のそれぞれに予め含まれているスケールファクター値の差分にゲインと前記2つの前記音声符号化情報のうちの一方を変換した前記周波数係数とを乗じた値に、前記2つの前記音声符号化情報のうちの他方を変換した前記周波数係数を加えて量子化値を算出することで、前記量子化精度の計算量を削減することを特徴とする音声符号化情報処理装置。 - 前記音声符号化情報それぞれの接続する箇所を示す接続点近傍で、当該音声符号化情報を接続する接続点制御手段と、
この接続点制御手段で制御された接続点近傍で接続された音声符号化情報を、切り替えて出力する音声符号化情報切替手段と、
を備えることを特徴とする請求項1に記載の音声符号化情報処理装置。 - 音声を符号化した音声符号化情報が複数集まってなる音声符号化情報群を周波数係数に変換して加算した後、前記音声符号化情報に変換する装置を、
入力された前記音声符号化情報群を周波数係数に変換する周波数係数変換手段、
この周波数係数変換手段によって変換された周波数係数に、前記音声符号化情報それぞれの出力比率となるゲインを乗算するゲイン乗算手段、
このゲイン乗算手段から出力された周波数係数を加算する周波数係数加算手段、
この周波数係数加算手段によって加算された周波数係数を音声符号化情報に変換する音声符号化情報変換手段、として機能させ、
前記ゲイン乗算手段は、前記音声符号化情報のそれぞれに予め含まれている量子化精度情報を変更することで、前記ゲインを乗算する際の計算量を削減し、
前記周波数係数加算手段は、前記周波数係数を加算する際に、前記周波数係数の量子化精度を制御する量子化精度制御手段を備え、
前記量子化精度制御手段は、2つの前記音声符号化情報のそれぞれに予め含まれているスケールファクター値の差分にゲインと前記2つの前記音声符号化情報のうちの一方を変換した前記周波数係数とを乗じた値に、前記2つの前記音声符号化情報のうちの他方を変換した前記周波数係数を加えて量子化値を算出することで、前記量子化精度の計算量を削減することを特徴とする音声符号化情報処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004118361A JP4516345B2 (ja) | 2004-04-13 | 2004-04-13 | 音声符号化情報処理装置および音声符号化情報処理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004118361A JP4516345B2 (ja) | 2004-04-13 | 2004-04-13 | 音声符号化情報処理装置および音声符号化情報処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005301002A JP2005301002A (ja) | 2005-10-27 |
JP4516345B2 true JP4516345B2 (ja) | 2010-08-04 |
Family
ID=35332597
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004118361A Expired - Fee Related JP4516345B2 (ja) | 2004-04-13 | 2004-04-13 | 音声符号化情報処理装置および音声符号化情報処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4516345B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4997781B2 (ja) * | 2006-02-14 | 2012-08-08 | 沖電気工業株式会社 | ミックスダウン方法およびミックスダウン装置 |
JP4823001B2 (ja) * | 2006-09-27 | 2011-11-24 | 富士通セミコンダクター株式会社 | オーディオ符号化装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62235996A (ja) * | 1986-04-07 | 1987-10-16 | 東洋通信機株式会社 | 合成音質変化方法 |
JPH09198796A (ja) * | 1996-01-17 | 1997-07-31 | Hitachi Ltd | 音響信号記録再生装置およびそれを用いたビデオカメラ |
JP2001142497A (ja) * | 1999-11-11 | 2001-05-25 | Sony Corp | ディジタル信号処理装置および処理方法、ディジタル信号記録装置および記録方法、並びに記録媒体 |
JP2002073090A (ja) * | 2000-08-25 | 2002-03-12 | Hitachi Ltd | 音声再生装置 |
JP2002314429A (ja) * | 2001-04-12 | 2002-10-25 | Sony Corp | 信号処理装置および信号処理方法 |
JP2002539477A (ja) * | 1999-03-11 | 2002-11-19 | ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア | 再帰デジタルオシレータを使用してデジタルオーディオ信号の加法合成を行う装置および方法 |
-
2004
- 2004-04-13 JP JP2004118361A patent/JP4516345B2/ja not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62235996A (ja) * | 1986-04-07 | 1987-10-16 | 東洋通信機株式会社 | 合成音質変化方法 |
JPH09198796A (ja) * | 1996-01-17 | 1997-07-31 | Hitachi Ltd | 音響信号記録再生装置およびそれを用いたビデオカメラ |
JP2002539477A (ja) * | 1999-03-11 | 2002-11-19 | ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア | 再帰デジタルオシレータを使用してデジタルオーディオ信号の加法合成を行う装置および方法 |
JP2001142497A (ja) * | 1999-11-11 | 2001-05-25 | Sony Corp | ディジタル信号処理装置および処理方法、ディジタル信号記録装置および記録方法、並びに記録媒体 |
JP2002073090A (ja) * | 2000-08-25 | 2002-03-12 | Hitachi Ltd | 音声再生装置 |
JP2002314429A (ja) * | 2001-04-12 | 2002-10-25 | Sony Corp | 信号処理装置および信号処理方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2005301002A (ja) | 2005-10-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3391686B2 (ja) | 符号化されたオーディオ信号を復号する方法及び装置 | |
JP5161212B2 (ja) | Itu−tg.711規格と相互動作が可能なマルチレイヤ埋め込みコーデックにおける雑音成形デバイスおよび方法 | |
KR101508819B1 (ko) | 멀티 모드 오디오 코덱 및 이를 위해 적응된 celp 코딩 | |
JP5608660B2 (ja) | エネルギ保存型マルチチャネルオーディオ符号化 | |
RU2423740C2 (ru) | Устройство и способ окончательной обработки спектральных значений и кодирующее устройство и декодер для аудиосигналов | |
JP5404412B2 (ja) | 符号化装置、復号装置およびこれらの方法 | |
CN103187065B (zh) | 音频数据的处理方法、装置和系统 | |
US7610195B2 (en) | Decoding of predictively coded data using buffer adaptation | |
US6593872B2 (en) | Signal processing apparatus and method, signal coding apparatus and method, and signal decoding apparatus and method | |
US8055499B2 (en) | Transmitter and receiver for speech coding and decoding by using additional bit allocation method | |
Watson et al. | Design and implementation of AAC decoders | |
JP4516345B2 (ja) | 音声符号化情報処理装置および音声符号化情報処理プログラム | |
JP2003332914A (ja) | ディジタル信号符号化方法、復号化方法、これらの装置及びプログラム | |
WO2004097798A1 (ja) | 音声復号化装置、音声復号化方法、プログラム、記録媒体 | |
JP5451603B2 (ja) | デジタルオーディオ信号の符号化 | |
JP4721355B2 (ja) | 符号化データの符号化則変換方法および装置 | |
JP5019437B2 (ja) | オーディオビットレート変換方法および装置 | |
JP3453116B2 (ja) | 音声符号化方法及び装置 | |
JP4273062B2 (ja) | 符号化方法、符号化装置、復号化方法及び復号化装置 | |
JP4409733B2 (ja) | 符号化装置、符号化方法、及びその記録媒体 | |
JP2001306095A (ja) | オーディオ符号化装置及びオーディオ符号化方法 | |
JPH0774642A (ja) | 線形予測係数補間装置 | |
Robinson et al. | Audio Decoding on the C54X | |
JPH05165498A (ja) | 音声符号化方法 | |
JPH09269798A (ja) | 音声符号化方法および音声復号化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070226 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20091111 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091201 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100126 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100222 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100420 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100514 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130521 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140521 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |