JP5098453B2 - 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム - Google Patents
音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム Download PDFInfo
- Publication number
- JP5098453B2 JP5098453B2 JP2007155308A JP2007155308A JP5098453B2 JP 5098453 B2 JP5098453 B2 JP 5098453B2 JP 2007155308 A JP2007155308 A JP 2007155308A JP 2007155308 A JP2007155308 A JP 2007155308A JP 5098453 B2 JP5098453 B2 JP 5098453B2
- Authority
- JP
- Japan
- Prior art keywords
- maximum value
- band
- frequency component
- medium
- range
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
デジタル音声信号について、所定の時間区分毎に、所定の帯域幅を有する小区画帯域毎の周波数成分の値を求める離散スペクトル変換手段と、
聴覚特性に合わせて予め設定された所定の数の連続する前記小区画帯域から構成される各中区画帯域について、前記所定の時間区分毎に、該中区画帯域に属する周波数成分の値のうちの最大値を検索する最大値検索手段と、
前記離散スペクトル変換手段が求めた周波数成分の値を前記最大値検索手段により中区画帯域毎に検索された最大値により除算し規格化された周波数成分を算出する規格化手段と、
前記最大値検索手段により検索された現時間区分の最大値を1つ前の時間区分の最大値で除算して比率を求める最大値比率算出手段と、
前記規格化手段で算出された規格化された周波数成分と前記最大値比率算出手段で求めた比率を量子化してエントロピ符号化して出力する符号化手段と、
を備えたことを特徴とする。
デジタル音声信号について、所定の時間区分毎に、所定の帯域幅を有する小区画帯域毎の周波数成分の値を求める離散スペクトル変換手段と、聴覚特性に合わせて予め設定された所定の数の連続する前記小区画帯域から構成される各中区画帯域について、前記所定の時間区分毎に、該中区画帯域に属する周波数成分の値のうちの最大値を検索する最大値検索手段と、前記離散スペクトル変換手段が求めた周波数成分の値を前記最大値検索手段により中区画帯域毎に検索された最大値により除算し規格化された周波数成分を算出する規格化手段と、前記最大値検索手段により検索された現時間区分の最大値を1つ前の時間区分の最大値で除算して比率を求める最大値比率算出手段と、前記規格化手段で算出された規格化された周波数成分と前記最大値比率算出手段で求めた比率を量子化してエントロピ符号化して出力する符号化手段と、を備えた音声符号化装置から出力された符号を受信する受信手段と、
前記符号から、前記エントロピ符号化に対応する復号方法により、前記所定の時間区分毎に、前記規格化された周波数成分と前記中区画帯域毎の比率とを復号する復号手段と、
復号された前記中区画帯域の比率を1つ前の時間区分で得られた中区画帯域の最大値に乗算することで現時間区分の中区画帯域の最大値を算出し、当該最大値を前記復号された中区画帯域の規格化された周波数成分に乗算して現時間区分の周波数成分を復元する逆変形手段と、
前記復元された周波数成分から前記音声信号を復元する離散スペクトル逆変換手段と、
を備えたことを特徴とする。
図1に、本実施形態に係る音声符号化兼復号装置111を示す。該装置としては、例えば、携帯電話機が想定される。
以下では、本発明の実施形態1の変形例に係る音声符号化兼復号装置について述べる。装置の概要は、実施形態1に係る音声符号化兼復号装置111と同様である。
以下では、本発明の実施形態2に係る音声符号化兼復号装置について述べる。装置の概要は、実施形態1に係る音声符号化兼復号装置111と同様である。また、送信機と受信機とが行う演算及び両者間で授受される情報の概要は、図4〜図6を参照しつつ説明した実施形態1の場合と、ほぼ同様である。
以下では、本発明の実施形態2の変形例に係る音声符号化兼復号装置について述べる。装置の概要は、実施形態1に係る音声符号化兼復号装置111と同様である。
Claims (12)
- デジタル音声信号について、所定の時間区分毎に、所定の帯域幅を有する小区画帯域毎の周波数成分の値を求める離散スペクトル変換手段と、
聴覚特性に合わせて予め設定された所定の数の連続する前記小区画帯域から構成される各中区画帯域について、前記所定の時間区分毎に、該中区画帯域に属する周波数成分の値のうちの最大値を検索する最大値検索手段と、
前記離散スペクトル変換手段が求めた周波数成分の値を前記最大値検索手段により中区画帯域毎に検索された最大値により除算し規格化された周波数成分を算出する規格化手段と、
前記最大値検索手段により検索された現時間区分の最大値を1つ前の時間区分の最大値で除算して比率を求める最大値比率算出手段と、
前記規格化手段で算出された規格化された周波数成分と前記最大値比率算出手段で求めた比率を量子化してエントロピ符号化して出力する符号化手段と、
を備えたことを特徴とする音声符号化装置。 - 前記中区画帯域に低域から順に中区画識別用整数を割り当て、前記中区画帯域の中心周波数の対数が、前記中区画識別用整数に線型的に依存するように前記中区画帯域を構成する中区画帯域構成手段をさらに備える、
請求項1に記載の音声符号化装置。 - 前記離散スペクトル変換手段は、
MDCT(Modified Discrete Cosine Transform)を用いる、
ことを特徴とする請求項1又は2に記載の音声符号化装置。 - デジタル音声信号について、所定の時間区分毎に、所定の帯域幅を有する小区画帯域毎の周波数成分の値を求める離散スペクトル変換手段と、聴覚特性に合わせて予め設定された所定の数の連続する前記小区画帯域から構成される各中区画帯域について、前記所定の時間区分毎に、該中区画帯域に属する周波数成分の値のうちの最大値を検索する最大値検索手段と、前記離散スペクトル変換手段が求めた周波数成分の値を前記最大値検索手段により中区画帯域毎に検索された最大値により除算し規格化された周波数成分を算出する規格化手段と、前記最大値検索手段により検索された現時間区分の最大値を1つ前の時間区分の最大値で除算して比率を求める最大値比率算出手段と、前記規格化手段で算出された規格化された周波数成分と前記最大値比率算出手段で求めた比率を量子化してエントロピ符号化して出力する符号化手段と、を備えた音声符号化装置から出力された符号を受信する受信手段と、
前記符号から、前記エントロピ符号化に対応する復号方法により、前記所定の時間区分毎に、前記規格化された周波数成分と前記中区画帯域毎の比率とを復号する復号手段と、
復号された前記中区画帯域の比率を1つ前の時間区分で得られた中区画帯域の最大値に乗算することで現時間区分の中区画帯域の最大値を算出し、当該最大値を前記復号された中区画帯域の規格化された周波数成分に乗算して現時間区分の周波数成分を復元する逆変形手段と、
前記復元された周波数成分から前記音声信号を復元する離散スペクトル逆変換手段と、
を備えたことを特徴とする音声復号装置。 - デジタル音声信号について、所定の時間区分毎に、所定の帯域幅を有する小区画帯域毎の周波数成分の値を求める離散スペクトル変換ステップと、
聴覚特性に合わせて予め設定された所定の数の連続する前記小区画帯域から構成される各中区画帯域について、前記所定の時間区分毎に、該中区画帯域に属する周波数成分の値のうちの最大値を検索する最大値検索ステップと、
前記離散スペクトル変換ステップで求めた周波数成分の値を前記最大値検索ステップにより中区画帯域毎に検索された最大値により除算し規格化された周波数成分を算出する規格化ステップと、
前記最大値検索ステップにより検索された現時間区分の最大値を1つ前の時間区分の最大値で除算して比率を求める最大値比率算出ステップと、
前記規格化ステップで算出された規格化された周波数成分と前記最大値比率算出ステップで求めた比率を量子化してエントロピ符号化して出力する符号化ステップと、
から構成されることを特徴とする音声符号化方法。 - 前記中区画帯域に低域から順に中区画識別用整数を割り当て、前記中区画帯域の中心周波数の対数が、前記中区画識別用整数に線型的に依存するように前記中区画帯域を構成する中区画帯域構成ステップをさらに備える、
請求項5に記載の音声符号化方法。 - 前記離散スペクトル変換ステップは、
MDCT(Modified Discrete Cosine Transform)を用いる、
ことを特徴とする請求項5又は6に記載の音声符号化方法。 - デジタル音声信号について、所定の時間区分毎に、所定の帯域幅を有する小区画帯域毎の周波数成分の値を求める離散スペクトル変換手段と、聴覚特性に合わせて予め設定された所定の数の連続する前記小区画帯域から構成される各中区画帯域について、前記所定の時間区分毎に、該中区画帯域に属する周波数成分の値のうちの最大値を検索する最大値検索手段と、前記離散スペクトル変換手段が求めた周波数成分の値を前記最大値検索手段により中区画帯域毎に検索された最大値により除算し規格化された周波数成分を算出する規格化手段と、前記最大値検索手段により検索された現時間区分の最大値を1つ前の時間区分の最大値で除算して比率を求める最大値比率算出手段と、前記規格化手段で算出された規格化された周波数成分と前記最大値比率算出手段で求めた比率を量子化してエントロピ符号化して出力する符号化手段と、を備えた音声符号化装置から出力された符号を受信する受信ステップと、
前記符号から、前記エントロピ符号化に対応する復号方法により、前記所定の時間区分毎に、前記規格化された周波数成分と前記中区画帯域毎の比率とを復号する復号ステップと、
復号された前記中区画帯域の比率を1つ前の時間区分で得られた中区画帯域の最大値に乗算することで現時間区分の中区画帯域の最大値を算出し、当該最大値を前記復号された中区画帯域の規格化された周波数成分に乗算して現時間区分の周波数成分を復元する逆変形ステップと、
前記復元された周波数成分から前記音声信号を復元する離散スペクトル逆変換ステップと、
から構成されることを特徴とする音声復号方法。 - コンピュータに、
デジタル音声信号について、所定の時間区分毎に、所定の帯域幅を有する小区画帯域毎の周波数成分の値を求める離散スペクトル変換ステップと、
聴覚特性に合わせて予め設定された所定の数の連続する前記小区画帯域から構成される各中区画帯域について、前記所定の時間区分毎に、該中区画帯域に属する周波数成分の値のうちの最大値を検索する最大値検索ステップと、
前記離散スペクトル変換ステップで求めた周波数成分の値を前記最大値検索ステップにより中区画帯域毎に検索された最大値により除算し規格化された周波数成分を算出する規格化ステップと、
前記最大値検索ステップにより検索された現時間区分の最大値を1つ前の時間区分の最大値で除算して比率を求める最大値比率算出ステップと、
前記規格化ステップで算出された規格化された周波数成分と前記最大値比率算出ステップで求めた比率を量子化してエントロピ符号化して出力する符号化ステップと、
を実行させることを特徴とするプログラム。 - 前記中区画帯域に低域から順に中区画識別用整数を割り当て、前記中区画帯域の中心周波数の対数が、前記中区画識別用整数に線型的に依存するように前記中区画帯域を構成する中区画帯域構成ステップをさらに実行させる、
請求項9に記載のプログラム。 - 前記離散スペクトル変換ステップは、
MDCT(Modified Discrete Cosine Transform)を用いる、
ことを特徴とする請求項9又は10に記載のプログラム。 - コンピュータに、
デジタル音声信号について、所定の時間区分毎に、所定の帯域幅を有する小区画帯域毎の周波数成分の値を求める離散スペクトル変換手段と、聴覚特性に合わせて予め設定された所定の数の連続する前記小区画帯域から構成される各中区画帯域について、前記所定の時間区分毎に、該中区画帯域に属する周波数成分の値のうちの最大値を検索する最大値検索手段と、前記離散スペクトル変換手段が求めた周波数成分の値を前記最大値検索手段により中区画帯域毎に検索された最大値により除算し規格化された周波数成分を算出する規格化手段と、前記最大値検索手段により検索された現時間区分の最大値を1つ前の時間区分の最大値で除算して比率を求める最大値比率算出手段と、前記規格化手段で算出された規格化された周波数成分と前記最大値比率算出手段で求めた比率を量子化してエントロピ符号化して出力する符号化手段と、を備えた音声符号化装置から出力された符号を受信する受信ステップと、
前記符号から、前記エントロピ符号化に対応する復号方法により、前記所定の時間区分毎に、前記規格化された周波数成分と前記中区画帯域毎の比率とを復号する復号ステップと、
復号された前記中区画帯域の比率を1つ前の時間区分で得られた中区画帯域の最大値に乗算することで現時間区分の中区画帯域の最大値を算出し、当該最大値を前記復号された中区画帯域の規格化された周波数成分に乗算して現時間区分の周波数成分を復元する逆変形ステップと、
前記復元された周波数成分から前記音声信号を復元する離散スペクトル逆変換ステップと、
を実行させることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007155308A JP5098453B2 (ja) | 2007-06-12 | 2007-06-12 | 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007155308A JP5098453B2 (ja) | 2007-06-12 | 2007-06-12 | 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008309875A JP2008309875A (ja) | 2008-12-25 |
JP5098453B2 true JP5098453B2 (ja) | 2012-12-12 |
Family
ID=40237560
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007155308A Expired - Fee Related JP5098453B2 (ja) | 2007-06-12 | 2007-06-12 | 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5098453B2 (ja) |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02153639A (ja) * | 1988-12-06 | 1990-06-13 | Fujitsu Ltd | 帯域分割正規化制御方式 |
JPH0822298A (ja) * | 1994-07-07 | 1996-01-23 | Sharp Corp | 符号化装置および復号化装置 |
JPH08251031A (ja) * | 1995-03-07 | 1996-09-27 | Mitsubishi Electric Corp | 符号器および復号器 |
JP2001094433A (ja) * | 1999-09-17 | 2001-04-06 | Matsushita Electric Ind Co Ltd | サブバンド符号化・復号方法 |
US7016502B2 (en) * | 2000-12-22 | 2006-03-21 | Sony Corporation | Encoder and decoder |
JP2002374171A (ja) * | 2001-06-15 | 2002-12-26 | Sony Corp | 符号化装置および方法、復号装置および方法、記録媒体、並びにプログラム |
-
2007
- 2007-06-12 JP JP2007155308A patent/JP5098453B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2008309875A (ja) | 2008-12-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4396683B2 (ja) | 音声符号化装置、音声符号化方法、及び、プログラム | |
KR102194557B1 (ko) | 에너지 무손실 부호화방법 및 장치, 오디오 부호화방법 및 장치, 에너지 무손실 복호화방법 및 장치, 및 오디오 복호화방법 및 장치 | |
CN110459231B (zh) | 产生hoa信号的混合的空间/系数域表示的方法和设备 | |
EP3046105B1 (en) | Lossless coding method | |
US11335355B2 (en) | Estimating noise of an audio signal in the log2-domain | |
KR102512359B1 (ko) | 에너지 무손실 부호화방법 및 장치, 신호 부호화방법 및 장치, 에너지 무손실 복호화방법 및 장치, 및 신호 복호화방법 및 장치 | |
JP2009533716A (ja) | オーディオ符号化並びに復号化における励起の処理 | |
KR101361933B1 (ko) | 오디오 인코딩에서 주파수 대역 신호 에너지를 기초로 한 주파수 대역 스케일 팩터 결정 | |
KR101363206B1 (ko) | 인터채널과 시간적 중복감소를 이용한 오디오 신호 인코딩 | |
EP1249837A2 (en) | A method for decompressing a compressed audio signal | |
JP5098453B2 (ja) | 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム | |
JP2003233397A (ja) | オーディオ符号化装置、オーディオ符号化プログラム及びオーディオ符号化データ伝送装置 | |
CN117789737A (zh) | 一种优化sbc编码器的方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100521 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111128 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111213 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120206 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120828 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120910 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151005 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5098453 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |