JP2016539355A5 - - Google Patents

Download PDF

Info

Publication number
JP2016539355A5
JP2016539355A5 JP2016521700A JP2016521700A JP2016539355A5 JP 2016539355 A5 JP2016539355 A5 JP 2016539355A5 JP 2016521700 A JP2016521700 A JP 2016521700A JP 2016521700 A JP2016521700 A JP 2016521700A JP 2016539355 A5 JP2016539355 A5 JP 2016539355A5
Authority
JP
Japan
Prior art keywords
signal
gain shape
highband
subframes
determination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016521700A
Other languages
English (en)
Other versions
JP2016539355A (ja
JP6262337B2 (ja
Filing date
Publication date
Priority claimed from US14/508,486 external-priority patent/US9620134B2/en
Application filed filed Critical
Publication of JP2016539355A publication Critical patent/JP2016539355A/ja
Publication of JP2016539355A5 publication Critical patent/JP2016539355A5/ja
Application granted granted Critical
Publication of JP6262337B2 publication Critical patent/JP6262337B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Claims (30)

  1. 高調波的に拡張された信号の第1の複数のサブフレームのエネルギーレベル少なくとも部分的に基づいて、音声信号のハイバンド部分に関連するハイバンド残差信号の第2の複数のサブフレームのエネルギーレベル少なくとも部分的に基づいて、または任意のそれらの組合せで、第1の利得形状パラメータの第1の決定を発話符号器において行うことと、
    記第1の利得形状パラメータに少なくとも部分的に基づいてハイバンド励振信号を生成することと、
    前記ハイバンド励振信号に基づいて合成ハイバンド信号を生成することと、
    前記合成ハイバンド信号に基づいておよび前記音声信号の前記ハイバンド部分に基づいて第2の利得形状パラメータの第2の決定行うことと、
    記第1の利得形状パラメータと前記第2の利得形状パラメータとを前記音声信号の符号化バージョンに挿入することと
    を備える方法。
  2. 前記第1の決定は、第1の利得形状推定器段階において行われ、前記第2の決定は、第2の利得形状推定器段階において行われ、前記第2の利得形状推定器段階は、前記第1の利得形状推定器段階とは異なる、請求項1に記載の方法。
  3. 前記第1の決定、前記第2の決定、および前記挿入することは、モバイル通信デバイスを備えるデバイスにおいて行われる、請求項1に記載の方法。
  4. 前記第1の利得形状パラメータは、線形予測残差ドメインにおいて決定され、前記第2の利得形状パラメータは、線形予測合成ドメインにおいて決定され、前記高調波的に拡張された信号、非線形高調波拡張により前記音声信号のローバンド部分から生成される、請求項1に記載の方法。
  5. 修正済みの高調波的に拡張された信号を生成するために前記第1の利得形状パラメータに基づいて前記高調波的に拡張された信号を調整することと、
    ここにおいて、前記ハイバンド励振信号を生成することは、前記修正済みの高調波的に拡張された信号に少なくとも部分的に基づく、
    前記合成ハイバンド信号を生成するために、前記ハイバンド励振信号に線形予測合成演算を行うことと、
    前記第2の利得形状パラメータに基づいて前記合成ハイバンド信号を調整することと
    をさらに備える、請求項1に記載の方法。
  6. 前記ハイバンド励振信号は、前記修正済みの高調波的に拡張された信号および変調された雑音信号に基づいて生成される、請求項5に記載の方法。
  7. 第1の複数のサブフレームを生成するために前記高調波的に拡張された信号のローバンドフレームをサンプリングすること、または
    第2の複数のサブフレームを生成するために前記ハイバンド残差信号の対応するハイバンドフレームをサンプリングすること
    さらに備える、請求項に記載の方法。
  8. 前記高調波的に拡張された信号を調整すること、前記第2の複数のサブフレームの対応するサブフレームのエネルギーレベルに近づくように前記第1の複数のサブフレームの特定のサブフレームを拡大縮小することを備える、請求項に記載の方法。
  9. 前記第2の複数のサブフレームは、前記ハイバンドフレームが有声フレームであるという決定に応じて第1の数のサブフレームを含み、前記第2の複数のサブフレームは、前記ハイバンドフレームが有声フレームではないという決定に応じて前記第1の数のサブフレームよりも少ない第2の数のサブフレームを含む、請求項に記載の方法。
  10. 前記第1の複数のサブフレームと前記第2の複数のサブフレームとが、有声フレームと無声フレームの両方について同数のサブフレームを含み、前記第1の複数のサブフレームおよび前記第2の複数のサブフレームは、ローバンドコアサンプルレートが12.8キロヘルツ(kHz)である場合、4つのサブフレームを含み、前記第1の複数のサブフレームおよび前記第2の複数のサブフレームは、前記ローバンドコアサンプルレートが16kHzである場合、5つのサブフレームを含む、請求項に記載の方法。
  11. 前記第1の決定、前記第2の決定、および前記挿入することは、固定ロケーションデータユニットを備えるデバイスにおいて行われる、請求項に記載の方法。
  12. 高調波的に拡張された信号の第1の複数のサブフレームのエネルギーレベル少なくとも部分的に基づいて、音声信号のハイバンド部分に関連するハイバンド残差信号の第2の複数のサブフレームのエネルギーレベル少なくとも部分的に基づいて、または任意のそれらの組合せで、第1の利得形状パラメータを決定するように構成された第1の利得形状推定器と、
    記第1の利得形状パラメータに少なくとも部分的に基づいてハイバンド励振信号を生成するように構成されたハイバンド励振発生器と、
    合成ハイバンド信号を生成するために前記ハイバンド励振信号に線形予測合成演算を行うように構成された線形予測合成器と、
    前記合成ハイバンド信号に基づいておよび前記音声信号の前記ハイバンド部分に基づいて第2の利得形状パラメータを決定するように構成された第2の利得形状推定器と、
    記第1の利得形状パラメータと前記第2の利得形状パラメータとを前記音声信号の符号化バージョンに挿入するように構成された回路と
    を備える装置。
  13. 前記第1の利得形状パラメータは、線形予測残差ドメインにおいて決定され、前記回路は、マルチプレクサを含み、前記高調波的に拡張された信号は、非線形高調波拡張により前記音声信号のローバンド部分から生成される、請求項12に記載の装置。
  14. アンテナと、
    前記アンテナに結合され、前記音声信号を受信するように構成された受信機と、
    をさらに備える、請求項12に記載の装置。
  15. 前記第1の利得形状推定器、前記第2の利得形状推定器、前記回路、および前記受信機に結合されたプロセッサをさらに備え、ここにおいて、前記プロセッサは、モバイル通信デバイスに統合される、請求項14に記載の装置。
  16. 前記第1の利得形状推定器、前記第2の利得形状推定器、前記回路、および前記受信機に結合されたプロセッサをさらに備え、ここにおいて、前記プロセッサは、固定ロケーションデータユニットに統合される、請求項14に記載の装置。
  17. 修正済みの高調波的に拡張された信号を生成するために前記第1の利得形状パラメータに基づいて前記高調波的に拡張された信号を調整するように構成された第1の利得形状調整器をさらに備え、ここにおいて、前記第1の利得形状推定器
    第1の複数のサブフレームを生成するために前記高調波的に拡張された信号のローバンドフレームをサンプリングし、または、
    第2の複数のサブフレームを生成するために前記ハイバンド残差信号の対応するハイバンドフレームをサンプリングする
    うにさらに構成される、請求項12に記載の装置。
  18. 前記第1の複数のサブフレームは、前記ハイバンドフレームが有声フレームであるという決定に応じて第1の数のサブフレームを含み、前記第1の複数のサブフレームは、前記ハイバンドフレームが有声フレームではないという決定に応じて前記第1の数のサブフレームよりも少ない第2の数のサブフレームを含む、請求項17に記載の装置。
  19. 前記第1の複数のサブフレームは、前記ハイバンドフレームが有声フレームであるという決定に応じて16個のサブフレームを含む、請求項17に記載の装置。
  20. 前記ハイバンド励振発生器は、前記修正済みの高調波的に拡張された信号および変調された雑音信号に基づいて、ハイバンド励振信号を生成するように構成される、請求項17に記載の装置。
  21. 前記高調波的に拡張された信号のローバンドフレームに基づいて、前記高調波的に拡張された信号を調整するように構成された第1の利得形状調整器と、
    前記第2の利得形状パラメータに基づいて前記合成ハイバンド信号を調整するように構成された第2の利得形状調整器
    をさらに備える、請求項12に記載の装置。
  22. 発話符号器からの符号化音声信号を発話復号器において受信することと、
    ここにおいて、前記符号化音声信号が、
    第1の決定に基づく第1の利得形状パラメータと、前記第1の決定は、前記発話符号器において生成された第1の高調波的に拡張された信号の第1の複数のサブフレームのエネルギーレベル少なくとも部分的に基づく、前記発話符号器において生成されたハイバンド残差信号の第2の複数のサブフレームのエネルギーレベル少なくとも部分的に基づく、または任意のそれらの組合せである
    第2の決定に基づく第2の利得形状パラメータと、前記第2の決定は、前記発話符号器において生成された第1の合成ハイバンド信号に基づくおよび音声信号のハイバンド部分に基づくここにおいて、前記合成ハイバンド信号は、前記第1の利得形状パラメータに少なくとも部分的に基づく、第1のハイバンド励振信号に基づくものである、
    を備える、
    記第1の利得形状パラメータに基づいておよび前記第2の利得形状パラメータに基づいて前記符号化音声信号から前記音声信号を再生することと
    を備える方法。
  23. 前記発話復号器において前記音声信号を再生することが、
    前記符号化音声信号のローバンド励振を非直線的に拡張することに基づいて第2の高調波的に拡張された信号を生成することと、
    正済みの第2の高調波的に拡張された信号を得るために前記第1の利得形状パラメータに基づいて前記第2の高調波的に拡張された信号を調整することと
    前記修正済みの第2の高調波的に拡張された信号に基づいて第2のハイバンド励振信号を生成することと、
    第2の合成ハイバンド信号を生成するために、前記第2のハイバンド励振信号に線形予測合成演算を行うことと、
    前記第2の利得形状パラメータに基づいて前記第2の合成ハイバンド信号を調整することと
    を備える、請求項22に記載の方法。
  24. 前記受信することおよび前記再生することは、モバイル通信デバイスを備えるデバイスにおいて行われる、請求項22に記載の方法。
  25. 前記受信することおよび前記再生することは、固定ロケーションデータユニットを備えるデバイスにおいて行われる、請求項22に記載の方法。
  26. 発話復号器を含むシステムであって、前記発話復号器は、
    発話符号器からの符号化音声信号を受信することと、ここにおいて、前記符号化音声信号が、
    第1の決定に基づく第1の利得形状パラメータと、前記第1の決定は、前記発話符号器において生成された第1の高調波的に拡張された信号の第1の複数のサブフレームのエネルギーレベル少なくとも部分的に基づく、前記発話符号器において生成されたハイバンド残差信号の第2の複数のサブフレームのエネルギーレベル少なくとも部分的に基づく、または任意のそれらの組合せである
    第2の決定に基づく第2の利得形状パラメータと、前記第2の決定は、前記発話符号器において生成された第1の合成ハイバンド信号に基づくおよび音声信号のハイバンド部分に基づくここにおいて、前記第1の合成ハイバンド信号は、前記第1の利得形状パラメータに少なくとも部分的に基づく、第1のハイバンド励振信号に基づくものである、
    を備える、
    記第1の利得形状パラメータに基づいておよび前記第2の利得形状パラメータに基づいて前記符号化音声信号から前記音声信号を再生することと
    を行うように構成されるシステム
  27. アンテナと、
    前記アンテナに結合され、前記符号化音声信号を受信するように構成された受信機と、
    をさらに備える、請求項26に記載のシステム
  28. 前記受信機に結合されたプロセッサをさらに備え、ここにおいて、前記プロセッサおよび前記受信機は、モバイル通信デバイスに統合される、請求項27に記載のシステム
  29. 前記受信機に結合されたプロセッサをさらに備え、ここにおいて、前記プロセッサおよび前記受信機は、固定ロケーションデータユニットに統合される、請求項27に記載のシステム
  30. 前記符号化音声信号のローバンド励振に基づいて第2の高調波的に拡張された信号を生成するように構成された非線形励振発生器と、
    第2の修正済みの高調波的に拡張された信号を得るために前記第1の利得形状パラメータに基づいて前記第2の高調波的に拡張された信号を調整するように構成された第1の利得形状調整器と
    前記修正済みの第2の高調波的に拡張された信号に基づいて第2のハイバンド励振信号を生成するように構成されたハイバンド励振発生器と、
    を備える、請求項26に記載のシステム
JP2016521700A 2013-10-10 2014-10-08 ハイバンド時間的特性の改善された追跡のための利得形状推定 Active JP6262337B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201361889434P 2013-10-10 2013-10-10
US61/889,434 2013-10-10
US14/508,486 2014-10-07
US14/508,486 US9620134B2 (en) 2013-10-10 2014-10-07 Gain shape estimation for improved tracking of high-band temporal characteristics
PCT/US2014/059753 WO2015054421A1 (en) 2013-10-10 2014-10-08 Gain shape estimation for improved tracking of high-band temporal characteristics

Publications (3)

Publication Number Publication Date
JP2016539355A JP2016539355A (ja) 2016-12-15
JP2016539355A5 true JP2016539355A5 (ja) 2017-07-13
JP6262337B2 JP6262337B2 (ja) 2018-01-17

Family

ID=52810401

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016521700A Active JP6262337B2 (ja) 2013-10-10 2014-10-08 ハイバンド時間的特性の改善された追跡のための利得形状推定

Country Status (21)

Country Link
US (1) US9620134B2 (ja)
EP (1) EP3055860B1 (ja)
JP (1) JP6262337B2 (ja)
KR (1) KR101828193B1 (ja)
CN (1) CN105593933B (ja)
AU (1) AU2014331903B2 (ja)
CA (1) CA2925572C (ja)
CL (1) CL2016000819A1 (ja)
DK (1) DK3055860T3 (ja)
ES (1) ES2774334T3 (ja)
HK (1) HK1219344A1 (ja)
HU (1) HUE047305T2 (ja)
MX (1) MX350816B (ja)
MY (1) MY183940A (ja)
NZ (1) NZ717833A (ja)
PH (1) PH12016500470B1 (ja)
RU (1) RU2648570C2 (ja)
SA (1) SA516370898B1 (ja)
SI (1) SI3055860T1 (ja)
TW (1) TWI604440B (ja)
WO (1) WO2015054421A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR3011408A1 (fr) * 2013-09-30 2015-04-03 Orange Re-echantillonnage d'un signal audio pour un codage/decodage a bas retard
US9984699B2 (en) 2014-06-26 2018-05-29 Qualcomm Incorporated High-band signal coding using mismatched frequency ranges
US9659564B2 (en) * 2014-10-24 2017-05-23 Sestek Ses Ve Iletisim Bilgisayar Teknolojileri Sanayi Ticaret Anonim Sirketi Speaker verification based on acoustic behavioral characteristics of the speaker
US10109284B2 (en) * 2016-02-12 2018-10-23 Qualcomm Incorporated Inter-channel encoding and decoding of multiple high-band audio signals
US10825467B2 (en) * 2017-04-21 2020-11-03 Qualcomm Incorporated Non-harmonic speech detection and bandwidth extension in a multi-source environment
US10431231B2 (en) * 2017-06-29 2019-10-01 Qualcomm Incorporated High-band residual prediction with time-domain inter-channel bandwidth extension
US10847172B2 (en) * 2018-12-17 2020-11-24 Microsoft Technology Licensing, Llc Phase quantization in a speech encoder
US10957331B2 (en) * 2018-12-17 2021-03-23 Microsoft Technology Licensing, Llc Phase reconstruction in a speech decoder

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9512284D0 (en) * 1995-06-16 1995-08-16 Nokia Mobile Phones Ltd Speech Synthesiser
US6233554B1 (en) * 1997-12-12 2001-05-15 Qualcomm Incorporated Audio CODEC with AGC controlled by a VOCODER
US6141638A (en) 1998-05-28 2000-10-31 Motorola, Inc. Method and apparatus for coding an information signal
US7117146B2 (en) 1998-08-24 2006-10-03 Mindspeed Technologies, Inc. System for improved use of pitch enhancement with subcodebooks
US7272556B1 (en) 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
GB2342829B (en) 1998-10-13 2003-03-26 Nokia Mobile Phones Ltd Postfilter
CA2252170A1 (en) * 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
US6449313B1 (en) 1999-04-28 2002-09-10 Lucent Technologies Inc. Shaped fixed codebook search for celp speech coding
US6704701B1 (en) 1999-07-02 2004-03-09 Mindspeed Technologies, Inc. Bi-directional pitch enhancement in speech coding systems
AU2001241475A1 (en) 2000-02-11 2001-08-20 Comsat Corporation Background noise reduction in sinusoidal based speech coding systems
US6760698B2 (en) 2000-09-15 2004-07-06 Mindspeed Technologies Inc. System for coding speech information using an adaptive codebook with enhanced variable resolution scheme
WO2002023536A2 (en) 2000-09-15 2002-03-21 Conexant Systems, Inc. Formant emphasis in celp speech coding
US6766289B2 (en) 2001-06-04 2004-07-20 Qualcomm Incorporated Fast code-vector searching
JP3457293B2 (ja) 2001-06-06 2003-10-14 三菱電機株式会社 雑音抑圧装置及び雑音抑圧方法
US6993207B1 (en) 2001-10-05 2006-01-31 Micron Technology, Inc. Method and apparatus for electronic image processing
US7146313B2 (en) 2001-12-14 2006-12-05 Microsoft Corporation Techniques for measurement of perceptual audio quality
US7047188B2 (en) 2002-11-08 2006-05-16 Motorola, Inc. Method and apparatus for improvement coding of the subframe gain in a speech coding system
US20050004793A1 (en) 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
US7788091B2 (en) 2004-09-22 2010-08-31 Texas Instruments Incorporated Methods, devices and systems for improved pitch enhancement and autocorrelation in voice codecs
JP2006197391A (ja) 2005-01-14 2006-07-27 Toshiba Corp 音声ミクシング処理装置及び音声ミクシング処理方法
CN101180677B (zh) * 2005-04-01 2011-02-09 高通股份有限公司 用于宽频带语音编码的系统、方法和设备
MX2007012185A (es) * 2005-04-01 2007-12-11 Qualcomm Inc Metodo y aparato para cuantificacion de vector de una representacion de envoltura espectral.
CN101199004B (zh) 2005-04-22 2011-11-09 高通股份有限公司 用于增益因数平滑的系统、方法及设备
US8280730B2 (en) 2005-05-25 2012-10-02 Motorola Mobility Llc Method and apparatus of increasing speech intelligibility in noisy environments
DE102006022346B4 (de) 2006-05-12 2008-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalcodierung
US8682652B2 (en) 2006-06-30 2014-03-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
US9009032B2 (en) 2006-11-09 2015-04-14 Broadcom Corporation Method and system for performing sample rate conversion
BRPI0720266A2 (pt) 2006-12-13 2014-01-28 Panasonic Corp Dispositivo de decodificação de aúdio e método de ajuste de potência
US20080208575A1 (en) 2007-02-27 2008-08-28 Nokia Corporation Split-band encoding and decoding of an audio signal
KR101413968B1 (ko) 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
AU2009267531B2 (en) * 2008-07-11 2013-01-10 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. An apparatus and a method for decoding an encoded audio signal
US8484020B2 (en) 2009-10-23 2013-07-09 Qualcomm Incorporated Determining an upperband signal from a narrowband signal
ES2645415T3 (es) 2009-11-19 2017-12-05 Telefonaktiebolaget Lm Ericsson (Publ) Métodos y disposiciones para la compensación de volumen y nitidez en códecs de audio
US8600737B2 (en) 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
US8738385B2 (en) 2010-10-20 2014-05-27 Broadcom Corporation Pitch-based pre-filtering and post-filtering for compression of audio signals
WO2012158157A1 (en) 2011-05-16 2012-11-22 Google Inc. Method for super-wideband noise supression
CN102802112B (zh) 2011-05-24 2014-08-13 鸿富锦精密工业(深圳)有限公司 具有音频文件格式转换功能的电子装置
PL3624119T3 (pl) * 2011-10-28 2022-06-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Urządzenie kodujące i sposób kodowania

Similar Documents

Publication Publication Date Title
JP2016539355A5 (ja)
US10186272B2 (en) Bandwidth extension with line spectral frequency parameters
TWI587290B (zh) 用以生成舒緩雜訊適應性頻譜形狀的裝置及方法、以及相關電腦程式
KR101785885B1 (ko) 적응적 대역폭 확장 및 그것을 위한 장치
ES2656022T3 (es) Detección y codificación de altura tonal muy débil
KR101892662B1 (ko) 스피치 처리를 위한 무성음/유성음 결정
JP2017506767A (ja) 話者辞書に基づく発話モデル化のためのシステムおよび方法
JP6262337B2 (ja) ハイバンド時間的特性の改善された追跡のための利得形状推定
CN107958670B (zh) 用于确定编码模式的设备以及音频编码设备
CN105612578B (zh) 用于信号处理的方法和设备
JP2016504637A5 (ja)
EP3281197B1 (en) Audio encoder and method for encoding an audio signal
AU2015295679B2 (en) Apparatus and method for comfort noise generation mode selection