JP2005338637A - オーディオ信号符号化装置及び方法 - Google Patents
オーディオ信号符号化装置及び方法 Download PDFInfo
- Publication number
- JP2005338637A JP2005338637A JP2004159981A JP2004159981A JP2005338637A JP 2005338637 A JP2005338637 A JP 2005338637A JP 2004159981 A JP2004159981 A JP 2004159981A JP 2004159981 A JP2004159981 A JP 2004159981A JP 2005338637 A JP2005338637 A JP 2005338637A
- Authority
- JP
- Japan
- Prior art keywords
- scale factor
- signal
- value
- frequency band
- spectrum signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
Abstract
【解決手段】 オーディオ信号符号化装置1において、スケールファクタ調整部15は、正規化後量子化前の正規化スペクトル信号のサブバンド毎のスペクトル係数の平均エネルギと、量子化後の量子化スペクトル信号のサブバンド毎のスペクトル係数の平均エネルギとを比較し、両者に不一致が見られる場合、例えば量子化後のサブバンドのエネルギが減少している場合には、正規化後量子化前のエネルギに近付くようにそのサブバンドにおけるスケールファクタを調整する。また、スケールファクタ調整部15は、サブバンド位置や局所的なスペクトル特徴(例えばトーナリティ)に応じて、スケールファクタの調整の可否、或いはスケールファクタの調整量等を決定する。
【選択図】 図1
Description
上記正規化スペクトル信号及び上記量子化スペクトル信号に基づいて、上記正規化手段で用いられたスケールファクタの値を調整するスケールファクタ調整手段と、各量子化スペクトル信号と上記正規化手段で用いられたスケールファクタ又は上記スケールファクタ調整手段によって調整されたスケールファクタとを少なくとも符号化する符号化手段とを備え、上記スケールファクタ調整手段は、上記正規化スペクトル信号のエネルギと上記量子化スペクトル信号のエネルギとの差分絶対値を周波数帯域毎に第1の閾値と比較し、該差分絶対値が該第1の閾値よりも大きい場合には、該エネルギの差分絶対値が第2の閾値以内となるように、上記正規化手段で用いられたスケールファクタの値を調整することを特徴とする。
Claims (8)
- 入力されたオーディオ信号を複数の周波数帯域に分割する帯域分割手段と、
各周波数帯域のオーディオ信号をスペクトル信号に変換するスペクトル変換手段と、
各スペクトル信号をスケールファクタを用いて正規化し、正規化スペクトル信号を生成する正規化手段と、
各正規化スペクトル信号を量子化し、量子化スペクトル信号を生成する量子化手段と、
上記正規化スペクトル信号及び上記量子化スペクトル信号に基づいて、上記正規化手段で用いられたスケールファクタの値を調整するスケールファクタ調整手段と、
各量子化スペクトル信号と上記正規化手段で用いられたスケールファクタ又は上記スケールファクタ調整手段によって調整されたスケールファクタとを少なくとも符号化する符号化手段とを備え、
上記スケールファクタ調整手段は、上記正規化スペクトル信号のエネルギと上記量子化スペクトル信号のエネルギとの差分絶対値を周波数帯域毎に第1の閾値と比較し、該差分絶対値が該第1の閾値よりも大きい場合には、該エネルギの差分絶対値が第2の閾値以内となるように、上記正規化手段で用いられたスケールファクタの値を調整する
ことを特徴とするオーディオ信号符号化装置。 - 上記スケールファクタ調整手段は、所定の境界よりも高域の周波数帯域においてのみ上記正規化手段で用いられたスケールファクタの値を調整することを特徴とする請求項1記載のオーディオ信号符号化装置。
- 上記スケールファクタ調整手段は、上記正規化スペクトル信号の周波数帯域毎のトーナリティ、又は上記正規化スペクトル信号の周波数帯域毎のトーナリティ及び上記量子化スペクトル信号の周波数帯域毎のトーナリティに基づいて、スケールファクタを調整するか否かを決定することを特徴とする請求項1記載のオーディオ信号符号化装置。
- 上記スケールファクタ調整手段は、上記正規化スペクトル信号の周波数帯域毎のトーナリティ及び上記量子化スペクトル信号の周波数帯域毎のトーナリティに基づいて、上記第2の閾値を設定することを特徴とする請求項1記載のオーディオ信号符号化装置。
- 入力されたオーディオ信号を複数の周波数帯域に分割する帯域分割工程と、
各周波数帯域のオーディオ信号をスペクトル信号に変換するスペクトル変換工程と、
各スペクトル信号をスケールファクタを用いて正規化し、正規化スペクトル信号を生成する正規化工程と、
各正規化スペクトル信号を量子化し、量子化スペクトル信号を生成する量子化工程と、
上記正規化スペクトル信号及び上記量子化スペクトル信号に基づいて、上記正規化工程で用いられたスケールファクタの値を調整するスケールファクタ調整工程と、
各量子化スペクトル信号と上記正規化工程で用いられたスケールファクタ又は上記スケールファクタ調整工程にて調整されたスケールファクタとを少なくとも符号化する符号化工程とを有し、
上記スケールファクタ調整工程では、上記正規化スペクトル信号のエネルギと上記量子化スペクトル信号のエネルギとの差分絶対値を周波数帯域毎に第1の閾値と比較し、該差分絶対値が該第1の閾値よりも大きい場合には、該エネルギの差分絶対値が第2の閾値以内となるように、上記正規化工程で用いられたスケールファクタの値を調整する
ことを特徴とするオーディオ信号符号化方法。 - 上記スケールファクタ調整工程では、所定の境界よりも高域の周波数帯域においてのみ上記正規化工程で用いられたスケールファクタの値を調整することを特徴とする請求項5記載のオーディオ信号符号化方法。
- 上記スケールファクタ調整工程では、上記正規化スペクトル信号の周波数帯域毎のトーナリティ、又は上記正規化スペクトル信号の周波数帯域毎のトーナリティ及び上記量子化スペクトル信号の周波数帯域毎のトーナリティに基づいて、スケールファクタを調整するか否かを決定することを特徴とする請求項5記載のオーディオ信号符号化方法。
- 上記スケールファクタ調整工程では、上記正規化スペクトル信号の周波数帯域毎のトーナリティ及び上記量子化スペクトル信号の周波数帯域毎のトーナリティに基づいて、上記第2の閾値を設定することを特徴とする請求項5記載のオーディオ信号符号化方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004159981A JP4168976B2 (ja) | 2004-05-28 | 2004-05-28 | オーディオ信号符号化装置及び方法 |
US11/132,985 US7627469B2 (en) | 2004-05-28 | 2005-05-19 | Audio signal encoding apparatus and audio signal encoding method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004159981A JP4168976B2 (ja) | 2004-05-28 | 2004-05-28 | オーディオ信号符号化装置及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005338637A true JP2005338637A (ja) | 2005-12-08 |
JP4168976B2 JP4168976B2 (ja) | 2008-10-22 |
Family
ID=35426531
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004159981A Expired - Fee Related JP4168976B2 (ja) | 2004-05-28 | 2004-05-28 | オーディオ信号符号化装置及び方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US7627469B2 (ja) |
JP (1) | JP4168976B2 (ja) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008015357A (ja) * | 2006-07-07 | 2008-01-24 | Toshiba Corp | 符号化装置 |
EP1968046A1 (en) | 2007-03-09 | 2008-09-10 | Fujitsu Limited | Encoding device and encoding method |
JP2008242029A (ja) * | 2007-03-27 | 2008-10-09 | Casio Comput Co Ltd | 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム |
JP2010526346A (ja) * | 2007-05-08 | 2010-07-29 | サムスン エレクトロニクス カンパニー リミテッド | オーディオ信号の符号化及び復号化方法並びにその装置 |
US8073687B2 (en) | 2007-09-12 | 2011-12-06 | Fujitsu Limited | Audio regeneration method |
US8244524B2 (en) | 2007-07-04 | 2012-08-14 | Fujitsu Limited | SBR encoder with spectrum power correction |
JP2013504781A (ja) * | 2009-09-11 | 2013-02-07 | スリング メディア ピーブイティー エルティーディー. | チャネル間及び一時的冗長度抑圧を用いた音声信号符号化 |
JP2014507688A (ja) * | 2011-05-25 | 2014-03-27 | ▲ホア▼▲ウェイ▼技術有限公司 | 信号分類方法および信号分類デバイス、ならびに符号化/復号化方法および符号化/復号化デバイス |
US9076440B2 (en) | 2008-02-19 | 2015-07-07 | Fujitsu Limited | Audio signal encoding device, method, and medium by correcting allowable error powers for a tonal frequency spectrum |
CN105103226A (zh) * | 2013-01-29 | 2015-11-25 | 弗劳恩霍夫应用研究促进协会 | 低复杂度音调自适应音频信号量化 |
JP2017161648A (ja) * | 2016-03-08 | 2017-09-14 | Kddi株式会社 | 音声符号化装置、方法及びプログラム |
CN110739001A (zh) * | 2013-07-22 | 2020-01-31 | 弗朗霍夫应用科学研究促进协会 | 支持变换长度切换的频域音频编码器、解码器、编码和解码方法 |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4734859B2 (ja) * | 2004-06-28 | 2011-07-27 | ソニー株式会社 | 信号符号化装置及び方法、並びに信号復号装置及び方法 |
CN102684628B (zh) | 2006-04-27 | 2014-11-26 | 杜比实验室特许公司 | 修正音频动态处理器的参数的方法以及执行该方法的设备 |
US8010370B2 (en) * | 2006-07-28 | 2011-08-30 | Apple Inc. | Bitrate control for perceptual coding |
US8032371B2 (en) * | 2006-07-28 | 2011-10-04 | Apple Inc. | Determining scale factor values in encoding audio data with AAC |
KR101355376B1 (ko) * | 2007-04-30 | 2014-01-23 | 삼성전자주식회사 | 고주파수 영역 부호화 및 복호화 방법 및 장치 |
WO2009093714A1 (ja) * | 2008-01-24 | 2009-07-30 | Nippon Telegraph And Telephone Corporation | 符号化方法、復号化方法、それらの装置、及びそれらのプログラムと記録媒体 |
WO2010028301A1 (en) * | 2008-09-06 | 2010-03-11 | GH Innovation, Inc. | Spectrum harmonic/noise sharpness control |
WO2010028297A1 (en) * | 2008-09-06 | 2010-03-11 | GH Innovation, Inc. | Selective bandwidth extension |
US8532983B2 (en) * | 2008-09-06 | 2013-09-10 | Huawei Technologies Co., Ltd. | Adaptive frequency prediction for encoding or decoding an audio signal |
WO2010031003A1 (en) | 2008-09-15 | 2010-03-18 | Huawei Technologies Co., Ltd. | Adding second enhancement layer to celp based core layer |
WO2010031049A1 (en) * | 2008-09-15 | 2010-03-18 | GH Innovation, Inc. | Improving celp post-processing for music signals |
ES2715191T3 (es) | 2011-02-14 | 2019-06-03 | Fraunhofer Ges Forschung | Codificación y decodificación de posiciones de impulso de pistas de una señal de audio |
WO2012110448A1 (en) * | 2011-02-14 | 2012-08-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result |
TWI469136B (zh) | 2011-02-14 | 2015-01-11 | Fraunhofer Ges Forschung | 在一頻譜域中用以處理已解碼音訊信號之裝置及方法 |
KR101617816B1 (ko) | 2011-02-14 | 2016-05-03 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 스펙트럼 도메인 잡음 형상화를 사용하는 선형 예측 기반 코딩 방식 |
ES2706148T3 (es) * | 2012-12-13 | 2019-03-27 | Fraunhofer Ges Forschung | Dispositivo de codificación de audio vocal, dispositivo de decodificación de audio vocal, procedimiento de codificación de audio vocal, y procedimiento de decodificación de audio vocal |
RU2608447C1 (ru) * | 2013-01-29 | 2017-01-18 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Устройство и способ для генерирования расширенного по частоте сигнала, используя временное сглаживание поддиапазонов |
ES2742420T3 (es) | 2013-12-02 | 2020-02-14 | Huawei Tech Co Ltd | Método y aparato de codificación |
AU2015291897B2 (en) * | 2014-07-25 | 2019-02-21 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Acoustic signal encoding device, acoustic signal decoding device, method for encoding acoustic signal, and method for decoding acoustic signal |
WO2018133043A1 (zh) * | 2017-01-20 | 2018-07-26 | 华为技术有限公司 | 量化器与量化方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR960003628B1 (ko) * | 1993-12-06 | 1996-03-20 | Lg전자주식회사 | 디지탈신호의 부호화/복호화 방법 및 장치 |
JPH08335979A (ja) * | 1995-06-06 | 1996-12-17 | Hashimoto Corp | 留守番電話装置付携帯電話システム |
JP2002196792A (ja) * | 2000-12-25 | 2002-07-12 | Matsushita Electric Ind Co Ltd | 音声符号化方式、音声符号化方法およびそれを用いる音声符号化装置、記録媒体、ならびに音楽配信システム |
US20050010396A1 (en) * | 2003-07-08 | 2005-01-13 | Industrial Technology Research Institute | Scale factor based bit shifting in fine granularity scalability audio coding |
US7460990B2 (en) * | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
-
2004
- 2004-05-28 JP JP2004159981A patent/JP4168976B2/ja not_active Expired - Fee Related
-
2005
- 2005-05-19 US US11/132,985 patent/US7627469B2/en not_active Expired - Fee Related
Cited By (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008015357A (ja) * | 2006-07-07 | 2008-01-24 | Toshiba Corp | 符号化装置 |
EP1968046A1 (en) | 2007-03-09 | 2008-09-10 | Fujitsu Limited | Encoding device and encoding method |
JP2008224902A (ja) * | 2007-03-09 | 2008-09-25 | Fujitsu Ltd | 符号化装置および符号化方法 |
US8073050B2 (en) | 2007-03-09 | 2011-12-06 | Fujitsu Limited | Encoding device and encoding method |
JP2008242029A (ja) * | 2007-03-27 | 2008-10-09 | Casio Comput Co Ltd | 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム |
JP2010526346A (ja) * | 2007-05-08 | 2010-07-29 | サムスン エレクトロニクス カンパニー リミテッド | オーディオ信号の符号化及び復号化方法並びにその装置 |
US8244524B2 (en) | 2007-07-04 | 2012-08-14 | Fujitsu Limited | SBR encoder with spectrum power correction |
US8073687B2 (en) | 2007-09-12 | 2011-12-06 | Fujitsu Limited | Audio regeneration method |
US9076440B2 (en) | 2008-02-19 | 2015-07-07 | Fujitsu Limited | Audio signal encoding device, method, and medium by correcting allowable error powers for a tonal frequency spectrum |
JP2013504781A (ja) * | 2009-09-11 | 2013-02-07 | スリング メディア ピーブイティー エルティーディー. | チャネル間及び一時的冗長度抑圧を用いた音声信号符号化 |
JP2014507688A (ja) * | 2011-05-25 | 2014-03-27 | ▲ホア▼▲ウェイ▼技術有限公司 | 信号分類方法および信号分類デバイス、ならびに符号化/復号化方法および符号化/復号化デバイス |
CN105103226B (zh) * | 2013-01-29 | 2019-04-16 | 弗劳恩霍夫应用研究促进协会 | 低复杂度音调自适应音频信号量化 |
JP2016510426A (ja) * | 2013-01-29 | 2016-04-07 | フラウンホーファーゲゼルシャフトツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. | 低複雑度の調性適応音声信号量子化 |
JP2017151454A (ja) * | 2013-01-29 | 2017-08-31 | フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. | 低複雑度の調性適応音声信号量子化 |
CN105103226A (zh) * | 2013-01-29 | 2015-11-25 | 弗劳恩霍夫应用研究促进协会 | 低复杂度音调自适应音频信号量化 |
JP2019164367A (ja) * | 2013-01-29 | 2019-09-26 | フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. | 低複雑度の調性適応音声信号量子化 |
US10468043B2 (en) | 2013-01-29 | 2019-11-05 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Low-complexity tonality-adaptive audio signal quantization |
US11094332B2 (en) | 2013-01-29 | 2021-08-17 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Low-complexity tonality-adaptive audio signal quantization |
US11694701B2 (en) | 2013-01-29 | 2023-07-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Low-complexity tonality-adaptive audio signal quantization |
CN110739001A (zh) * | 2013-07-22 | 2020-01-31 | 弗朗霍夫应用科学研究促进协会 | 支持变换长度切换的频域音频编码器、解码器、编码和解码方法 |
US11862182B2 (en) | 2013-07-22 | 2024-01-02 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Frequency-domain audio coding supporting transform length switching |
CN110739001B (zh) * | 2013-07-22 | 2024-02-27 | 弗朗霍夫应用科学研究促进协会 | 支持变换长度切换的频域音频编码器、解码器、编码和解码方法 |
JP2017161648A (ja) * | 2016-03-08 | 2017-09-14 | Kddi株式会社 | 音声符号化装置、方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
US7627469B2 (en) | 2009-12-01 |
JP4168976B2 (ja) | 2008-10-22 |
US20050267744A1 (en) | 2005-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4168976B2 (ja) | オーディオ信号符号化装置及び方法 | |
US11250862B2 (en) | Apparatus and method for decoding or encoding an audio signal using energy information values for a reconstruction band | |
US10685660B2 (en) | Voice audio encoding device, voice audio decoding device, voice audio encoding method, and voice audio decoding method | |
US5737718A (en) | Method, apparatus and recording medium for a coder with a spectral-shape-adaptive subband configuration | |
JP4296752B2 (ja) | 符号化方法及び装置、復号方法及び装置、並びにプログラム | |
EP1701452B1 (en) | System and method for masking quantization noise of audio signals | |
CN109313908B (zh) | 用于对音频信号进行编码的音频编码器以及方法 | |
EP1600946A1 (en) | Method and apparatus for encoding/decoding a digital signal | |
US6604069B1 (en) | Signals having quantized values and variable length codes | |
JPH0846518A (ja) | 情報符号化方法及び復号化方法、情報符号化装置及び復号化装置、並びに情報記録媒体 | |
US6199038B1 (en) | Signal encoding method using first band units as encoding units and second band units for setting an initial value of quantization precision | |
US9548057B2 (en) | Adaptive gain-shape rate sharing | |
JP4734859B2 (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
Truman et al. | Efficient bit allocation, quantization, and coding in an audio distribution system | |
JP4297078B2 (ja) | 復号方法及び装置 | |
JP4024185B2 (ja) | デジタルデータ符号化装置 | |
JP7483792B2 (ja) | 符号化オーディオ信号を復号する復号装置および復号方法 | |
Boland et al. | Hybrid LPC And discrete wavelet transform audio coding with a novel bit allocation algorithm | |
Bosi | MPEG audio compression basics | |
JPH05114863A (ja) | 高能率符号化装置及び復号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080313 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080715 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080728 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110815 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110815 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110815 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120815 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120815 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130815 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |