JP5812998B2 - オーディオコーデックにおけるラウドネスおよびシャープネスの補償のための方法および装置 - Google Patents
オーディオコーデックにおけるラウドネスおよびシャープネスの補償のための方法および装置 Download PDFInfo
- Publication number
- JP5812998B2 JP5812998B2 JP2012539847A JP2012539847A JP5812998B2 JP 5812998 B2 JP5812998 B2 JP 5812998B2 JP 2012539847 A JP2012539847 A JP 2012539847A JP 2012539847 A JP2012539847 A JP 2012539847A JP 5812998 B2 JP5812998 B2 JP 5812998B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- signal portion
- band
- bandwidth
- speech signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
- G10L19/265—Pre-filtering, e.g. high frequency emphasis prior to encoding
Description
構成された手段を備える。最後に、デコーダ装置は、少なくとも前記第1の信号部分にもとづいて前記第2の信号部分を復元する手段と、前記調整済みの第1の信号部分と前記復元される第2の信号部分とを組み合わせ、全体として知覚されるラウドネスおよびシャープネスが改善された復元スピーチ信号を生成する手段とを備える。
H(z)=α・z−2+β・z−1−γ+β・z+1+α・z+2 (1)
によって達成でき、ここで好ましい係数は、α=0.1、β=0、およびγ=0.85である。
H(z)=α・z−1−β+α・z+1 (2)
であって、好ましい係数は、α=0.06およびβ=0.66であり、
あるいは
H(z)=1−μ・z−1 (3)
であって、好ましい係数は、μ=0.2である。
によって定義すると、ラウドネスおよびシャープネスを、以下のように定めることができる[6]。
として定められ、ここで正規化係数E*は、静寂のしきい値の逆数または外耳−中耳の周波数応答に関係できる(図7を参照)。励振Eを、信号波形を周波数ドメインへと変換し、周波数ビンを重要な周波数帯へとまとめることによって計算することができる。
Claims (14)
- 所定の帯域幅に限られた復元スピーチ信号について知覚されるラウドネスおよびシャープネスを改善する方法であって、
前記スピーチ信号を用意するステップ(S10)と、
少なくとも前記所定の帯域幅のうちの第1の帯域部分にもとづく第1の信号部分と、前記所定の帯域幅のうちの第2の帯域部分にもとづく第2の信号部分とに、前記スピーチ信号を分割するステップ(S20)と、
前記第1の帯域部分の範囲内の少なくとも所定の周波数または周波数区間を強調するように、前記第1の信号部分を調整するステップ(S30)と、
少なくとも前記調整した第1の信号部分にもとづいて前記第2の信号部分を復元するステップ(S40)と、
前記調整した第1の信号部分と前記復元した第2の信号部分とを組み合わせて(S50)、全体として知覚されるラウドネスおよびシャープネスが改善された復元スピーチ信号を生成するステップと
を含む方法。 - 前記調整するステップ(S30)が、
前記第1の信号部分をフィルタ処理するステップを含み、前記第1の帯域部分の選択された周波数に向かって第1の信号部分のエネルギの少なくとも一部を分配すると同時に、前記第1の帯域部分の選択された高周波数区間に向かって第1の信号部分のエネルギの少なくとも別の一部を分配する、請求項1に記載の方法。 - 前記フィルタ処理するステップ(S30)が以下のフィルタ関数H(z):
H(z)=α・z−2+β・z−1−γ+β・z+1+α・z+2
に従って実行される、請求項2に記載の方法。 - 係数α=0.1、β=0、γ=0.85である、請求項3に記載の方法。
- 前記フィルタ処理するステップ(S30)が以下のフィルタ関数H(z):
H(z)=α・z−1−β+α・z+1
に従って実行される、請求項2に記載の方法。 - 係数α=0.06およびβ=0.66である、請求項5に記載の方法。
- 前記フィルタ処理するステップ(S30)が以下のフィルタ関数H(z):
H(z)=1−μ・z−1
に従って実行される、請求項2に記載の方法。 - 係数μ=0.2である、請求項7に記載の方法。
- 自然の外耳−中耳の反応にもとづいて、前記第1の帯域部分の範囲内の前記周波数を選択するさらなるステップを含む、請求項2に記載の方法。
- 前記第1の帯域部分が、前記用意されるスピーチ信号の低周波数帯(LB)に相当し、前記第2の帯域部分が、前記用意されるスピーチ信号の高周波数帯(HB)に相当する、請求項1〜9のいずれか1項に記載の方法。
- 前記調整するステップ(S30)が、低周波数帯(LB)をプレフィルタ処理するステップにもとづいており、前記第2の信号部分を復元するステップ(S40)が、帯域拡張(BWE)または低域通過フィルタ処理にもとづく、請求項10に記載の方法。
- 所定の帯域幅に限られた復元スピーチ信号について知覚されるラウドネスおよびシャープネスを改善するためのシステムであって、
前記スピーチ信号を生成する手段(10)と、
少なくとも前記所定の帯域幅のうちの第1の帯域部分にもとづく第1の信号部分と、前記所定の帯域幅のうちの第2の帯域部分にもとづく第2の信号部分とに、前記スピーチ信号を分割する手段(20)と、
前記第1の帯域部分の範囲内の少なくとも所定の周波数または周波数区間を強調するように、前記第1の信号部分を調整する手段(30)と、
少なくとも前記調整した第1の信号部分にもとづいて前記第2の信号部分を復元する手段(40)と、
前記調整した第1の信号部分と前記復元した第2の信号部分とを組み合わせ、全体として知覚されるラウドネスおよびシャープネスが改善された復元スピーチ信号を生成する手段(50)と
を備えるシステム。 - 前記手段(30)が、プレフィルタ処理によって前記第1の信号部分を調整するように構成され、前記第1の信号部分が、前記スピーチ信号の低周波数帯(LB)に相当し、前記手段(40)が、帯域拡張(BWE)または低域通過フィルタ処理にもとづいて、前記スピーチ信号の高周波数帯(HB)を復元する、請求項12に記載のシステム。
- 通信システムにおいて所定の帯域幅に限られたスピーチ信号を処理するためのデコーダ装置(2)であって、
少なくとも前記所定の帯域幅のうちの第1の帯域部分にもとづく第1の信号部分と、前記所定の帯域幅のうちの第2の帯域部分にもとづく第2の信号部分とに、生成されたスピーチ信号を分割することによって得られる第1の信号部分を受信する手段(25)と、
前記第1の帯域部分の範囲内の少なくとも所定の周波数または周波数区間を強調するように、前記受信される第1の信号部分を調整する手段(30)と、
少なくとも前記調整した第1の信号部分にもとづいて前記第2の信号部分を復元する手段(40)と、
前記調整済みの第1の信号部分と前記復元される第2の信号部分とを組み合わせ、全体として知覚されるラウドネスおよびシャープネスが改善された復元スピーチ信号を生成する手段(50)と
を備えるデコーダ装置(2)。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US26271409P | 2009-11-19 | 2009-11-19 | |
US61/262,714 | 2009-11-19 | ||
PCT/SE2010/050746 WO2011062535A1 (en) | 2009-11-19 | 2010-06-29 | Methods and arrangements for loudness and sharpness compensation in audio codecs |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2013511741A JP2013511741A (ja) | 2013-04-04 |
JP2013511741A5 JP2013511741A5 (ja) | 2013-07-18 |
JP5812998B2 true JP5812998B2 (ja) | 2015-11-17 |
Family
ID=44059833
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012539847A Active JP5812998B2 (ja) | 2009-11-19 | 2010-06-29 | オーディオコーデックにおけるラウドネスおよびシャープネスの補償のための方法および装置 |
Country Status (7)
Country | Link |
---|---|
US (1) | US9031835B2 (ja) |
EP (1) | EP2502229B1 (ja) |
JP (1) | JP5812998B2 (ja) |
CN (1) | CN102725791B (ja) |
CA (1) | CA2780962C (ja) |
ES (1) | ES2645415T3 (ja) |
WO (1) | WO2011062535A1 (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB201210373D0 (en) * | 2012-06-12 | 2012-07-25 | Meridian Audio Ltd | Doubly compatible lossless audio sandwidth extension |
EP2704142B1 (en) * | 2012-08-27 | 2015-09-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for reproducing an audio signal, apparatus and method for generating a coded audio signal, computer program and coded audio signal |
US9711156B2 (en) | 2013-02-08 | 2017-07-18 | Qualcomm Incorporated | Systems and methods of performing filtering for gain determination |
US9620134B2 (en) | 2013-10-10 | 2017-04-11 | Qualcomm Incorporated | Gain shape estimation for improved tracking of high-band temporal characteristics |
US10614816B2 (en) | 2013-10-11 | 2020-04-07 | Qualcomm Incorporated | Systems and methods of communicating redundant frame information |
US10083708B2 (en) | 2013-10-11 | 2018-09-25 | Qualcomm Incorporated | Estimation of mixing factors to generate high-band excitation signal |
US9384746B2 (en) | 2013-10-14 | 2016-07-05 | Qualcomm Incorporated | Systems and methods of energy-scaled signal processing |
US10163447B2 (en) | 2013-12-16 | 2018-12-25 | Qualcomm Incorporated | High-band signal modeling |
BR112016014104B1 (pt) | 2013-12-19 | 2020-12-29 | Telefonaktiebolaget Lm Ericsson (Publ) | método de estimativa de ruído de fundo, estimador de ruído de fundo, detector de atividade de som, codec, dispositivo sem fio, nó de rede, meio de armazenamento legível por computador |
WO2016057530A1 (en) | 2014-10-10 | 2016-04-14 | Dolby Laboratories Licensing Corporation | Transmission-agnostic presentation-based program loudness |
US9590580B1 (en) | 2015-09-13 | 2017-03-07 | Guoguang Electric Company Limited | Loudness-based audio-signal compensation |
US11925433B2 (en) * | 2020-07-17 | 2024-03-12 | Daniel Hertz S.A. | System and method for improving and adjusting PMC digital signals to provide health benefits to listeners |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1986003873A1 (en) * | 1984-12-20 | 1986-07-03 | Gte Laboratories Incorporated | Method and apparatus for encoding speech |
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
US6889182B2 (en) * | 2001-01-12 | 2005-05-03 | Telefonaktiebolaget L M Ericsson (Publ) | Speech bandwidth extension |
CA2388352A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for frequency-selective pitch enhancement of synthesized speed |
CA2388439A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
JP2005010621A (ja) * | 2003-06-20 | 2005-01-13 | Matsushita Electric Ind Co Ltd | 音声帯域拡張装置及び帯域拡張方法 |
US7676362B2 (en) * | 2004-12-31 | 2010-03-09 | Motorola, Inc. | Method and apparatus for enhancing loudness of a speech signal |
US7813931B2 (en) * | 2005-04-20 | 2010-10-12 | QNX Software Systems, Co. | System for improving speech quality and intelligibility with bandwidth compression/expansion |
KR101171098B1 (ko) * | 2005-07-22 | 2012-08-20 | 삼성전자주식회사 | 혼합 구조의 스케일러블 음성 부호화 방법 및 장치 |
CA2558595C (en) * | 2005-09-02 | 2015-05-26 | Nortel Networks Limited | Method and apparatus for extending the bandwidth of a speech signal |
JP5055759B2 (ja) | 2005-12-16 | 2012-10-24 | 沖電気工業株式会社 | 帯域変換信号生成器及び帯域拡張装置 |
JP4747835B2 (ja) * | 2005-12-27 | 2011-08-17 | ヤマハ株式会社 | オーディオ再生の効果付加方法およびその装置 |
US8260620B2 (en) * | 2006-02-14 | 2012-09-04 | France Telecom | Device for perceptual weighting in audio encoding/decoding |
TW200743382A (en) | 2006-05-03 | 2007-11-16 | Cybervision Inc | Video signal generator |
JP4918841B2 (ja) | 2006-10-23 | 2012-04-18 | 富士通株式会社 | 符号化システム |
US8229106B2 (en) * | 2007-01-22 | 2012-07-24 | D.S.P. Group, Ltd. | Apparatus and methods for enhancement of speech |
US8527265B2 (en) * | 2007-10-22 | 2013-09-03 | Qualcomm Incorporated | Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs |
KR101235830B1 (ko) * | 2007-12-06 | 2013-02-21 | 한국전자통신연구원 | 음성코덱의 품질향상장치 및 그 방법 |
US8433582B2 (en) * | 2008-02-01 | 2013-04-30 | Motorola Mobility Llc | Method and apparatus for estimating high-band energy in a bandwidth extension system |
JP5326311B2 (ja) * | 2008-03-19 | 2013-10-30 | 沖電気工業株式会社 | 音声帯域拡張装置、方法及びプログラム、並びに、音声通信装置 |
JP4783412B2 (ja) * | 2008-09-09 | 2011-09-28 | 日本電信電話株式会社 | 信号広帯域化装置、信号広帯域化方法、そのプログラム、その記録媒体 |
-
2010
- 2010-06-29 US US13/510,333 patent/US9031835B2/en active Active
- 2010-06-29 CA CA2780962A patent/CA2780962C/en active Active
- 2010-06-29 CN CN201080052229.XA patent/CN102725791B/zh active Active
- 2010-06-29 WO PCT/SE2010/050746 patent/WO2011062535A1/en active Application Filing
- 2010-06-29 EP EP10831864.3A patent/EP2502229B1/en active Active
- 2010-06-29 JP JP2012539847A patent/JP5812998B2/ja active Active
- 2010-06-29 ES ES10831864.3T patent/ES2645415T3/es active Active
Also Published As
Publication number | Publication date |
---|---|
US20120221326A1 (en) | 2012-08-30 |
CA2780962C (en) | 2017-09-05 |
ES2645415T3 (es) | 2017-12-05 |
WO2011062535A1 (en) | 2011-05-26 |
EP2502229A4 (en) | 2013-06-19 |
US9031835B2 (en) | 2015-05-12 |
CN102725791A (zh) | 2012-10-10 |
CN102725791B (zh) | 2014-09-17 |
EP2502229A1 (en) | 2012-09-26 |
CA2780962A1 (en) | 2011-05-26 |
EP2502229B1 (en) | 2017-08-09 |
JP2013511741A (ja) | 2013-04-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5812998B2 (ja) | オーディオコーデックにおけるラウドネスおよびシャープネスの補償のための方法および装置 | |
JP6595099B2 (ja) | 符号化されたオーディオメタデータに基づくラウドネス等化及びdrc中の動的等化 | |
RU2381571C2 (ru) | Синтезирование монофонического звукового сигнала на основе кодированного многоканального звукового сигнала | |
JP5224017B2 (ja) | オーディオ符号化装置、オーディオ符号化方法およびオーディオ符号化プログラム | |
EP1334484B1 (en) | Enhancing the performance of coding systems that use high frequency reconstruction methods | |
JP3579047B2 (ja) | オーディオ復号装置と復号方法およびプログラム | |
EP1327242B1 (en) | Error concealment in relation to decoding of encoded acoustic signals | |
JP4984983B2 (ja) | 符号化装置および符号化方法 | |
RU2491658C2 (ru) | Синтезатор аудиосигнала и кодирующее устройство аудиосигнала | |
JP4899359B2 (ja) | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 | |
AU2001284608A1 (en) | Error concealment in relation to decoding of encoded acoustic signals | |
JP2011059714A (ja) | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 | |
JP4736812B2 (ja) | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 | |
KR20060113999A (ko) | 정보 신호의 양자화 방법 및 장치 | |
JP6228298B2 (ja) | エネルギー調整モジュールを備えた帯域幅拡大モジュールを有するオーディオ復号器 | |
JP2006293400A (ja) | 符号化装置および復号化装置 | |
US20130085762A1 (en) | Audio encoding device | |
JP2016206244A (ja) | 符号化装置、符号化方法、及びプログラム | |
JP5098492B2 (ja) | 信号処理装置及び信号処理方法、並びにプログラム | |
WO2021200151A1 (ja) | 送信装置、送信方法、受信装置、及び受信方法 | |
JP2007178529A (ja) | 符号化オーディオ信号再生装置及び符号化オーディオ信号再生方法 | |
JP2005148539A (ja) | オーディオ信号符号化装置およびオーディオ信号符号化方法 | |
JP3692959B2 (ja) | 電子透かし情報埋め込み装置 | |
JP5569476B2 (ja) | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 | |
JP2011118215A (ja) | 符号化装置、符号化方法、プログラムおよび電子機器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130531 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130531 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140603 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140827 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150127 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150410 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150818 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150915 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5812998 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |