DK2954523T3 - Systemer og fremgangsmåder til udførelse af filtrering til forstærkningsbestemmelse - Google Patents

Systemer og fremgangsmåder til udførelse af filtrering til forstærkningsbestemmelse Download PDF

Info

Publication number
DK2954523T3
DK2954523T3 DK13753450.9T DK13753450T DK2954523T3 DK 2954523 T3 DK2954523 T3 DK 2954523T3 DK 13753450 T DK13753450 T DK 13753450T DK 2954523 T3 DK2954523 T3 DK 2954523T3
Authority
DK
Denmark
Prior art keywords
band
lsp
audio signal
inter
signal
Prior art date
Application number
DK13753450.9T
Other languages
English (en)
Inventor
Venkatraman Srinivasa Atti
Venkatesh Krishnan
Vivek Rajendran
Stephane Pierre Villette
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Application granted granted Critical
Publication of DK2954523T3 publication Critical patent/DK2954523T3/da

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/03Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Claims (12)

1. Fremgangsmåde omfattende at: bestemme, baseret på spektral information svarende til et audiosignal der omfatter en lavbånddel og en højbånddel, at audiosignalet omfatter en komponent svarende til en artefakt-genererende tilstand; filtrere højbånddelen af audiosignalet for at generere et filtreret højbånd-output baseret på et inter-line spektralt par (LSP) afstand associeret med højbånddelen af audiosignalet; og generere et kodet signal, hvor generering af det kodede signal omfatter at bestemme forstærkningsinformation baseret på et forhold af en første energi svarende til det filtrerede højbånd-output til en anden energi svarende til et syntetiseret højbåndsignal genereret baseret på lavbånddelen og et moduleret støjsignal signal eller lavbånddelen for at reducere en hørbar effekt af den artefakt-genererende tilstand.
2. Fremgangsmåden ifølge krav 1, hvor at filtrere højbånddelen af audiosignalet omfatter at filtrere højbånddelen under anvendelse af lineære prædiktion-koeffici-enter (LPCs) associeret med højbånddelen af audiosignalet for at generere et LPC-filtreret højbånd-output.
3. Fremgangsmåden ifølge krav 1, yderligere omfattende at bestemme en inter-LSP-afstand associeret med en ramme af audiosignalet.
4. Fremgangsmåden ifølge krav 3, hvor inter-LSP-afstanden er associeret med rammen er en mindste af en flerhed af inter-LSP-afstande svarende til en flerhed af LSP'er genereret under lineær prædiktiv kodning (LPC) af rammen.
5. Fremgangsmåden ifølge krav 3, hvor filtreringen udføres under anvendelse af en adaptive vægtningsfaktor, hvilken fremgangsmåde yderligere omfatter at bestemme den adaptive vægtningsfaktor baseret på inter-LSP-afstanden associeret med rammen, hvor at filtrere højbånddelen af audiosignalet kan omfatte påføring af den adaptive vægtningsfaktor til højbånd-lineære prædiktion-koefficienter.
6. Fremgangsmåden ifølge krav 5, hvor afbildningen er en af: en lineær afbildning; adaptiv baseret på mindst én afen sampling-hastighed eller en frekvens svarende til den artefakt-genererende tilstand, et signal-til-støj-forhold eller en prædiktion-forstærkning efter lineær prædiktion-analyse.
7. Fremgangsmåden ifølge krav 3, hvor audiosignalet bestemmes til at omfatte komponenten i respons til inter-LSP-afstanden associeret med rammen der er mindre end en første tærskelværdi.
8. Fremgangsmåden ifølge krav 3, yderligere omfattende at bestemme et gennemsnits-inter-LSP-afstand baseret på inter-LSP-afstanden associeret med rammen og mindst en anden inter-LSP-afstand associeret med mindst en anden ramme af audiosignalet.
9. Fremgangsmåden ifølge krav 7, yderligere omfattende at bestemme inter-LSP-afstanden associeret med rammen, hvor inter-LSP-afstanden associeret med rammen er en mindste af en flerhed af inter-LSP-afstande svarende til en flerhed af LSP'er genereret under lineær prædiktiv kodning (LPC) af rammen.
10. Fremgangsmåden ifølge krav 9, hvor højbånddelen af audiosignalet er filtreret i respons til inter-LSP-afstanden associeret med at rammen er: mindre end en første tærskelværdi, eller mindre end en anden tærskelværdi og mindst en af: en gennemsnits-inter-LSP-afstand der er mindre end en tredje tærskelværdi, gennemsnits-inter-LSP-afstanden baseret på inter-LSP-afstanden associeret med rammen og mindst en anden inter-LSP-afstand associeret med mindst en anden ramme af audiosignalet; eller højbånd-filtrere svarende til en anden ramme af audiosignalet er aktiveret, den anden ramme foregående rammen af audiosignalet.
11. Apparat omfattende: organ til at bestemme, baseret på spektral information svarende til et audiosignal der omfatter en lavbånddel og en højbånddel, at audiosignalet omfatter en komponent svarende til en artefakt-genererende tilstand; organ til at filtrere en højbånddel af audiosignalet til at generere et filtreret højbånd-output baseret på et inter-line spektralt par (LSP)-afstand associeret med højbånddelen af audiosignalet; og organ til at generere et kodet signal, hvor organet til at generere det kodede signal omfatter organ til at bestemme forstærkningsinformation baseret på et forhold af en første energi svarende til det filtrerede højbånd-output til en anden energi svarende til lavbånddelen for at reducere en hørbar effekt af den artefakt-genererende tilstand.
12. Ikke-transistorisk computer-læsbart medium omfattende instruktioner der, når de udføres af en computer, forårsager computeren til at udføre fremgangsmåden ifølge et hvilket som helst af kravene 1 til 10.
DK13753450.9T 2013-02-08 2013-08-06 Systemer og fremgangsmåder til udførelse af filtrering til forstærkningsbestemmelse DK2954523T3 (da)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361762807P 2013-02-08 2013-02-08
US13/959,188 US9711156B2 (en) 2013-02-08 2013-08-05 Systems and methods of performing filtering for gain determination
PCT/US2013/053806 WO2014123579A1 (en) 2013-02-08 2013-08-06 Systems and methods of performing filtering for gain determination

Publications (1)

Publication Number Publication Date
DK2954523T3 true DK2954523T3 (da) 2019-03-25

Family

ID=51298066

Family Applications (1)

Application Number Title Priority Date Filing Date
DK13753450.9T DK2954523T3 (da) 2013-02-08 2013-08-06 Systemer og fremgangsmåder til udførelse af filtrering til forstærkningsbestemmelse

Country Status (23)

Country Link
US (1) US9711156B2 (da)
EP (1) EP2954523B1 (da)
JP (1) JP6456847B2 (da)
KR (1) KR101891872B1 (da)
CN (1) CN104969291B (da)
AU (1) AU2013377885B2 (da)
BR (1) BR112015019040B1 (da)
CA (1) CA2896814C (da)
DK (1) DK2954523T3 (da)
ES (1) ES2715847T3 (da)
HK (1) HK1211377A1 (da)
HU (1) HUE042387T2 (da)
IL (1) IL239719A (da)
MY (1) MY171188A (da)
PH (1) PH12015501516B1 (da)
PL (1) PL2954523T3 (da)
PT (1) PT2954523T (da)
RU (1) RU2643628C2 (da)
SG (1) SG11201505067TA (da)
SI (1) SI2954523T1 (da)
UA (1) UA116371C2 (da)
WO (1) WO2014123579A1 (da)
ZA (1) ZA201506577B (da)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104301064B (zh) 2013-07-16 2018-05-04 华为技术有限公司 处理丢失帧的方法和解码器
CN105761723B (zh) * 2013-09-26 2019-01-15 华为技术有限公司 一种高频激励信号预测方法及装置
US9697843B2 (en) 2014-04-30 2017-07-04 Qualcomm Incorporated High band excitation signal generation
CN106683681B (zh) 2014-06-25 2020-09-25 华为技术有限公司 处理丢失帧的方法和装置
CN104217726A (zh) * 2014-09-01 2014-12-17 东莞中山大学研究院 一种无损音频压缩编码方法及其解码方法
US10049684B2 (en) 2015-04-05 2018-08-14 Qualcomm Incorporated Audio bandwidth selection
US10020002B2 (en) 2015-04-05 2018-07-10 Qualcomm Incorporated Gain parameter estimation based on energy saturation and signal scaling
US9380150B1 (en) * 2015-09-16 2016-06-28 Captioncall, Llc Methods and devices for automatic volume control of a far-end voice signal provided to a captioning communication service
SG11201808684TA (en) * 2016-04-12 2018-11-29 Fraunhofer Ges Forschung Audio encoder for encoding an audio signal, method for encoding an audio signal and computer program under consideration of a detected peak spectral region in an upper frequency band
GB2582749A (en) * 2019-03-28 2020-10-07 Nokia Technologies Oy Determination of the significance of spatial audio parameters and associated encoding
US11321047B2 (en) 2020-06-11 2022-05-03 Sorenson Ip Holdings, Llc Volume adjustments

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6263307B1 (en) 1995-04-19 2001-07-17 Texas Instruments Incorporated Adaptive weiner filtering using line spectral frequencies
US6453289B1 (en) 1998-07-24 2002-09-17 Hughes Electronics Corporation Method of noise reduction for speech codecs
KR20000047944A (ko) * 1998-12-11 2000-07-25 이데이 노부유끼 수신장치 및 방법과 통신장치 및 방법
US7110953B1 (en) 2000-06-02 2006-09-19 Agere Systems Inc. Perceptual coding of audio signals using separated irrelevancy reduction and redundancy reduction
US7478042B2 (en) 2000-11-30 2009-01-13 Panasonic Corporation Speech decoder that detects stationary noise signal regions
KR100935961B1 (ko) * 2001-11-14 2010-01-08 파나소닉 주식회사 부호화 장치 및 복호화 장치
US20050004793A1 (en) * 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
CN101048649A (zh) * 2004-11-05 2007-10-03 松下电器产业株式会社 可扩展解码装置及可扩展编码装置
CN101107650B (zh) * 2005-01-14 2012-03-28 松下电器产业株式会社 语音切换装置及语音切换方法
US20080243496A1 (en) * 2005-01-21 2008-10-02 Matsushita Electric Industrial Co., Ltd. Band Division Noise Suppressor and Band Division Noise Suppressing Method
ES2358125T3 (es) * 2005-04-01 2011-05-05 Qualcomm Incorporated Procedimiento y aparato para un filtrado de antidispersión de una señal ensanchada de excitación de predicción de velocidad de ancho de banda.
CA2603255C (en) * 2005-04-01 2015-06-23 Qualcomm Incorporated Systems, methods, and apparatus for wideband speech coding
CN101213590B (zh) * 2005-06-29 2011-09-21 松下电器产业株式会社 可扩展解码装置及丢失数据插值方法
WO2007037361A1 (ja) * 2005-09-30 2007-04-05 Matsushita Electric Industrial Co., Ltd. 音声符号化装置および音声符号化方法
DE102006022346B4 (de) 2006-05-12 2008-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalcodierung
CN101089951B (zh) * 2006-06-16 2011-08-31 北京天籁传音数字技术有限公司 频带扩展编码方法及装置和解码方法及装置
US8682652B2 (en) 2006-06-30 2014-03-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
US8725499B2 (en) * 2006-07-31 2014-05-13 Qualcomm Incorporated Systems, methods, and apparatus for signal change detection
CA2678476A1 (fr) * 2007-02-20 2008-09-04 Airbus France Procede de realisation d'un revetement pour le traitement acoustique incorporant une structure alveolaire avec une forme complexe et revetement pour le traitement acoustique ainsiobtenu
US8554550B2 (en) * 2008-01-28 2013-10-08 Qualcomm Incorporated Systems, methods, and apparatus for context processing using multi resolution analysis
GB0822537D0 (en) * 2008-12-10 2009-01-14 Skype Ltd Regeneration of wideband speech
JP4932917B2 (ja) * 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
US8484020B2 (en) * 2009-10-23 2013-07-09 Qualcomm Incorporated Determining an upperband signal from a narrowband signal
JP5812998B2 (ja) 2009-11-19 2015-11-17 テレフオンアクチーボラゲット エル エム エリクソン(パブル) オーディオコーデックにおけるラウドネスおよびシャープネスの補償のための方法および装置
JP5535241B2 (ja) * 2009-12-28 2014-07-02 三菱電機株式会社 音声信号復元装置および音声信号復元方法
US8600737B2 (en) * 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
US8738385B2 (en) 2010-10-20 2014-05-27 Broadcom Corporation Pitch-based pre-filtering and post-filtering for compression of audio signals
EP2710590B1 (en) 2011-05-16 2015-10-07 Google, Inc. Super-wideband noise supression

Also Published As

Publication number Publication date
UA116371C2 (uk) 2018-03-12
MY171188A (en) 2019-09-30
RU2015138109A (ru) 2017-03-16
SI2954523T1 (sl) 2019-04-30
PT2954523T (pt) 2019-03-25
AU2013377885B2 (en) 2019-07-18
IL239719A (en) 2016-11-30
JP6456847B2 (ja) 2019-01-23
HUE042387T2 (hu) 2019-06-28
PL2954523T3 (pl) 2019-05-31
CA2896814C (en) 2018-08-14
ES2715847T3 (es) 2019-06-06
BR112015019040B1 (pt) 2021-12-07
US9711156B2 (en) 2017-07-18
JP2016511436A (ja) 2016-04-14
CN104969291A (zh) 2015-10-07
ZA201506577B (en) 2018-08-29
WO2014123579A1 (en) 2014-08-14
IL239719A0 (en) 2015-08-31
RU2643628C2 (ru) 2018-02-02
BR112015019040A2 (pt) 2017-07-18
US20140229171A1 (en) 2014-08-14
KR101891872B1 (ko) 2018-08-24
EP2954523B1 (en) 2018-12-19
EP2954523A1 (en) 2015-12-16
HK1211377A1 (en) 2016-05-20
PH12015501516A1 (en) 2015-09-21
CA2896814A1 (en) 2014-08-14
CN104969291B (zh) 2018-10-26
PH12015501516B1 (en) 2015-09-21
AU2013377885A1 (en) 2015-07-23
KR20150116881A (ko) 2015-10-16
SG11201505067TA (en) 2015-08-28

Similar Documents

Publication Publication Date Title
DK2954523T3 (da) Systemer og fremgangsmåder til udførelse af filtrering til forstærkningsbestemmelse
DK2954524T3 (da) Systemer og fremgangsmåder til forstærkningskontrol
US9858941B2 (en) Selective phase compensation in high band coding of an audio signal
DK3055861T3 (da) Vurdering af blandingsfaktorer til at generere højbånd-exciteringssignal
US9620134B2 (en) Gain shape estimation for improved tracking of high-band temporal characteristics
DK2954525T3 (da) System og fremgangsmåder til gennemføring af støjmodulation og forstærkningsjustering