TWI484479B - 用於低延遲聯合語音及音訊編碼中之錯誤隱藏之裝置和方法 - Google Patents

用於低延遲聯合語音及音訊編碼中之錯誤隱藏之裝置和方法 Download PDF

Info

Publication number
TWI484479B
TWI484479B TW101104539A TW101104539A TWI484479B TW I484479 B TWI484479 B TW I484479B TW 101104539 A TW101104539 A TW 101104539A TW 101104539 A TW101104539 A TW 101104539A TW I484479 B TWI484479 B TW I484479B
Authority
TW
Taiwan
Prior art keywords
spectral
value
values
frame
filter
Prior art date
Application number
TW101104539A
Other languages
English (en)
Other versions
TW201248616A (en
Inventor
Jeremie Lecomte
Martin Dietz
Michael Schnabel
Ralph Sperschneider
Original Assignee
Fraunhofer Ges Forschung
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Ges Forschung filed Critical Fraunhofer Ges Forschung
Publication of TW201248616A publication Critical patent/TW201248616A/zh
Application granted granted Critical
Publication of TWI484479B publication Critical patent/TWI484479B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/03Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • G10L19/107Sparse pulse excitation, e.g. by using algebraic codebook
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • G10L19/13Residual excited linear prediction [RELP]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Detection And Prevention Of Errors In Transmission (AREA)

Description

用於低延遲聯合語音及音訊編碼中之錯誤隱藏之裝置和方法
本發明係與音訊信號處理有關,以及係特別論及一種用於低延遲聯合語音及音訊編碼中之錯誤隱藏的裝置和方法(LD-USAC)。
音訊信號處理,已有多方面之進步,以及係變得益形重要。在音訊信號處理中,低延遲聯合語音和編碼,係旨在提供一些適用於音訊、語音、和語音與音訊之任何混合的編碼技術。此外,LD-USAC旨在確保一個有關該編碼成之音訊信號的高品質。相較於USAC(聯合語音和音訊編碼),LD-USAC中之延遲會被降低。
當編碼音訊資料時,一個LD-USAC編碼器,會檢查該要被編碼之音訊信號。該LD-USAC編碼器,係藉由編碼一個預測濾波器之線性預測性濾波器係數,來編碼該音訊信號。依據上述要被一個特定之音訊訊框編碼的音訊資料,該LD-USAC編碼器會決定,是否要使用ACELP(先進碼激式線性預測)來編碼,或者該音訊資料,是否要使用TCX(變換編碼激勵)來編碼。雖然ACEL使用了LP濾波器係數(線性預測性濾波器係數)、適性碼本指標、和代數碼本指標、和適性與代數碼本增益,TCX係使用一些有關一個修飾式離散餘弦變換(MDCT)之LP濾波器係數、能量參數、和量化指標。
在該解碼器側上面,該LD-USAC解碼器會決定,已被採用來編碼一個當前之音訊信號訊框的音訊資料者,係 ACELP或TCX。該解碼器接著會據此來解碼該音訊信號訊框。
有時,資訊傳輸會失敗。舉例而言,一個傳送器所傳輸之音訊信號訊框,係正帶有錯誤而到達一個接收器,或者全然未到達,或者該訊框延遲到達。
在此等情況中,錯誤隱藏可能會變為有必要,以確保漏失的或錯誤的音訊資料可被取代。此就一些具有實時規範之應用而言係特別真確,因為請求重新傳輸該有錯誤或漏失之訊框,或許可能會違反一些低延遲規範。
然而,其他音訊應用所使用之現有隱藏技術,經常會建立因一些合成假像所造成之人為音訊。
所以,本發明的一個目的,旨在就一個音訊信號訊框有關之錯誤隱藏,提供一些改進之觀念。本發明之目的在解決上,係藉由如申請專利範圍第1項之裝置,藉由如申請專利範圍第15項之方法,以及藉由如申請專利範圍第16項之電腦程式。
有一個就音訊信號產生一些頻譜取代值之裝置提供。此種裝置包含一個緩衝器單元,其可儲存一些有關一個先前接收無誤之音訊訊框的先前之頻譜值。此外,該裝置包含一個隱藏訊框產生器,其可在一個當前之音訊訊框並未被接收到或有錯誤時,產生該等頻譜取代值。該先前接收無誤之音訊訊框,包含有濾波器資訊,此濾波器資訊,係與一個可表示一個預測濾波器之穩定性的濾波器穩定性值 相聯結。該隱藏訊框產生器經調適,可基於該等先前之頻譜值,以及基於該濾波器穩定性值,來產生該等頻譜取代值。
本發明基於之發現是,雖然一個先前接收無誤之訊框的先前之頻譜值,可能會被用作錯誤隱藏,針對此等值,應有一個漸隱被實施,以及該漸隱應取決於該信號之穩定性。一個信號愈不穩定,該漸隱之實施便應愈快。
在一個實施例中,該隱藏訊框產生器經調適,可能藉由隨機顛倒先前之頻譜值的符號,來產生該等頻譜取代值。
依據又一個實施例,該隱藏訊框產生器經配置,可能藉由在該濾波器穩定性值,具有一個第一值時,使每個先前之頻譜值,乘以一個第一增益因數,以及在該濾波器穩定性值,具有一個小於該第一值之第二值時,使每個先前之頻譜值,乘以一個第二增益因數,來產生該等頻譜取代值。
在另一個實施例中,該隱藏訊框產生器經調適,可能基於該濾波器穩定性值,來產生該等頻譜取代值,其中,該先前接收無誤之音訊訊框,包含該預測濾波器之第一預測性濾波器係數,其中,該先前接收無誤之音訊訊框的前趨訊框,包含一些第二預測性濾波器係數,以及其中,該濾波器穩定性值,係取決於該第一預測性濾波器係數,以及取決於該第二預測性濾波器係數。
依據一個實施例,該隱藏訊框產生器經調適,可能基於該先前接收無誤之音訊訊框的第一預測性濾波器係數, 以及基於該先前接收無誤之音訊訊框的前趨訊框之第二預測性過濾器係數,來決定該濾波器穩定性值。
在另一實施例中,該隱藏訊框產生器經調適,可能基於該濾波器穩定性值,來產生該等頻譜取代值,其中,該濾波器穩定性值,係取決於一個距離計量LSFdist ,以及其中,該距離計量LSFdist 在定義上,係藉由公式:
其中,u+1指明該先前接收無誤之音訊訊框的第一預測性濾波器係數之總數,以及其中,u+1亦指明該先前接收無誤之音訊訊框的前趨訊框之第二預測性濾波器係數的總數,其中,f i 指明該等第一預測性濾波器係數的第i個濾波器係數,以及其中,f i (p ) 指明該等第二預測性濾波器係數的第i個濾波器係數。
依據一個實施例,該隱藏訊框產生器經調適,可能進一步基於與該先前接收到之無誤音訊訊框相關聯的訊框類別資訊,來產生該等頻譜取代值。舉例而言,該訊框類別資訊指出,該先前接收無誤之音訊訊框,會被分類為"人為肇端"、"肇端"、"有聲變遷"、"無聲變遷"、"無聲或有聲"。
在另一實施例中,該隱藏訊框產生器經調適,可能自有一個最後之無誤音訊訊框,已到達該接收器起,進一步基於若干未到達一個接收器處或有錯誤之連續訊框,來產生該等頻譜取代值,其中,自該最後無誤之音訊訊框,已到達該接收器起,並無其他無誤之音訊訊框,到達該接收 器處。
依據另一實施例,該隱藏訊框產生器經調適,可能計算一個漸隱因數,以及可能基於該濾波器穩定性值,以及基於未到達該接收器處或有錯誤之連續訊框的數目。此外,該隱藏訊框產生器經調適,可能藉由使該漸隱因數,乘以至少某些先前之頻譜值,或者乘以至少某一群組之中間值的某些值,來產生該等頻譜取代值,其中,每個中間值,係取決於至少一個先前之頻譜值。
在又一個實施例中,該隱藏訊框產生器經調適,可能基於該等先前之頻譜值、基於該濾波器穩定性值、以及亦基於一個時域雜訊修整之預測增益,來產生該等頻譜取代值。
依據又一實施例,有一個音訊信號解碼器提供。該音訊信號解碼器,可能包含一個用以解碼彼等頻譜音訊信號值之裝置,和一個依據上文所說明的一個實施例用以產生一些頻譜取代值之裝置。上述用以解碼頻譜音訊信號值之裝置經調適,可能基於一個先前接收無誤之音訊訊框,來解碼一個音訊信號之頻譜值。此外,上述用以解碼頻譜音訊信號值之裝置進一步經調適,可能將該音訊信號之頻譜值,儲存進上述用以產生頻譜取代值之裝置的緩衝器單元內。上述用以產生頻譜取代值之裝置經調適,可能在一個當前之音訊訊框未被接收到或有錯誤時,基於該緩衝器單元內所儲存之頻譜值,來產生該等頻譜取代值。
此外,有一個依據另一個實施例之音訊信號解碼器提 供。該音訊信號解碼器,包含一個用以基於一個接收無誤之音訊訊框來產生一些第一中間頻譜值的解碼器單元、一個用以針對該等第一中間頻譜值來實施時域雜訊修整而得到一些第二中間頻譜值之時域雜訊修整單元、一個用以依據該等第一中間頻譜值和該等第二中間頻譜值來計算該時域雜訊修整的一個預測增益之預測增益計算器、一個用以在一個當前之音訊訊框未被接收到或有錯誤時依據上文所說明之實施例來產生一些頻譜取代值的裝置、和一個值選擇器,其可在該預測增益大於或等於一個臨界值時,將該等第一中間頻譜值,儲存進上述用以產生一些頻譜取代值之裝置的緩衝器單元內,或者可在該預測增益小於該臨界值時,將該等第二中間頻譜值,儲存進上述用以產生一些頻譜取代值之裝置的緩衝器單元內。
此外,依據另一實施例,有另一個音訊信號解碼器提供。該音訊信號解碼器,包含一個用以基於一個接收無誤之音訊訊框來產生一些產生成之頻譜值的第一解碼器模組、一個用以依據上文所說明之實施例來產生一些頻譜取代值的裝置、和一個用以處理該等產生成之頻譜值的處理模組,其係藉由實施時域雜訊修整、應用雜訊充填、以及/或者應用一個全局增益,來得到該解碼成之音訊信號的頻譜音訊值。上述用以產生頻譜取代值之裝置經調適,可能產生一些頻譜取代值,以及在一個當前之訊框並未被接收到或有錯誤時,將彼等饋進該處理模組內。
有些較佳之實施例,將會提供在所附申請專利範圍中。
圖式簡單說明
下文中,本發明之較佳實施例,將參照所附諸圖加以說明,其中:第1圖例示依據一個實施例就一個音訊信號取得一些頻譜取代值的一個裝置;第2圖例示另一個實施例就一個音訊信號取得一些頻譜取代值之裝置;第3a-3c圖例示依據一個實施例的一個增益因數與先前之頻譜值的乘法運算;第4a圖例示一個包含某一在一個時域中之肇端的信號部分之重複性;第4b圖例示一個時域中之穩定信號部分的重複性;第5a-5b圖例示一些範例,其中,依據一個實施例,一些產生成之增益因數,係應用至第3a圖之頻譜值;第6圖例示依據一個實施例之音訊信號解碼器;第7圖例示依據另一實施例之音訊信號解碼器;而第8圖則例示依據又一個實施例之音訊信號解碼器。
第1圖例示一個用以就一個音訊信號產生一些頻譜取代值之裝置100。此種裝置100包含一個緩衝器單元110,其可儲存一些與一個先前接收無誤之音訊訊框相關的先前之頻譜值。此外,該裝置100包含一個隱藏訊框產生器120,其可在一個當前之音訊訊框並未被接收到或有錯誤時,產生該等頻譜取代值。該先前接收無誤之音訊訊框,包含有 濾波器資訊,此濾波器資訊,係與一個可表示一個預測濾波器之穩定性的濾波器穩定性值相聯結。該隱藏訊框產生器120經調適,可基於該等先前之頻譜值,以及基於該濾波器穩定性值,來產生該等頻譜取代值。
該先前接收無誤之音訊訊框,舉例而言,可能包含該等先前之頻譜值。舉例而言,該等先前之頻譜值,可能係包含在上述成某種編碼成之形式的先前接收無誤之音訊訊框。
或者,該等先前之頻譜值舉例而言,可能為一些可能已藉由修飾一些包含在該等先前接收無誤之音訊訊框內的值所產生之值,舉例而言,該音訊信號之頻譜值。舉例而言,上述先前接收無誤之音訊訊框內所包含的值,可能已藉由使彼等各乘以一個增益因數,得到該等先前之頻譜值,而加以修飾。
或者,該等先前之頻譜價值,舉例而言,可能為一些可能已基於一些包含在該等先前接收無誤之音訊訊框內的值而產生出之值。舉例而言,每個先前之頻譜值,可能已藉由採用至少某些包含在該先前接收無誤之音訊訊框內的值產生出,以致於每個先前之頻譜值,係取決於至少某些包含在該先前接收無誤之音訊訊框內的值。舉例而言,該先前接收無誤之音訊訊框內所包含的值,可能已被用來產生一個中間信號。舉例而言,上述產生出之中間信號的頻譜值,可能會被視為上述有關該先前接收無誤之音訊訊框的先前之頻譜值。
箭頭105指明的是,該等先前之頻譜值,為儲存在該緩衝器單元110中。
該隱藏訊框產生器120,在一個當前之音訊訊框,並未被及時接收到或有錯誤時,可能會產生該等頻譜取代值。舉例而言,一個發射器,可能傳送一個當前之音訊訊框,給一個接收器,其中舉例而言,可能會設置上述用以得到頻譜取代值之裝置100。然而,該當前之音訊訊框,並不會到達該接收器處,舉例而言,由於任何種類之傳輸錯誤。或者,該傳輸之當前音訊訊框,被該接收器接收到,但舉例而言,由於某種擾亂,舉例而言,在傳輸期間,該當前之音訊訊框會有錯誤。在此等或其他情況中,該隱藏訊框產生器120,就錯誤隱藏而言係有需要。
就此而言,該隱藏訊框產生器120經調適,可在一個當前之音訊訊框並未被接收到或有錯誤時,基於至少某些先前之頻譜值,而產生該等頻譜取代值。依據一些實施例,該先前接收無誤之音訊訊框,係假定包含濾波器資料,此濾波器資訊,係與一個可表示此濾波器資訊所界定之預測濾波器的穩定性之濾波器穩定性值相聯結。舉例而言,該音訊訊框,可能包含一些預測性濾波器係數,舉例而言,線性預測性濾波器係數,而作為濾波器資訊。
該隱藏訊框產生器120進一步經調適,可基於該等先前之頻譜值,以及基於該濾波器穩定性值,來產生該等頻譜取代值。
舉例而言,該等頻譜取代值在產生上,可能基於該等 先前之頻譜值,以及基於該濾波器穩定性值,其中,每個該先前之頻譜值,會乘以一個增益因數,其中,該增益因數之值,係取決於該濾波器穩定性值。舉例而言,當該濾波器穩定性值,在一個第二種情況中,為小於在一個第一種情況中時,該增益因數在該第二種情況中,可能會小於在該第一種情況中。
依據另一實施例,該等頻譜取代值在產生上,可能基於該等先前之頻譜值,以及基於該濾波器穩定性值。一些中間值在產生上,可能藉由修飾該等先前之頻譜值,舉例而言,藉由隨機顛倒該等先前之頻譜值的符號,以及藉由使每個中間值,乘以一個增益因數,其中,該增益因數之值,係取決於該濾波器穩定性值。舉例而言,當該濾波器穩定性值,在一個第二種情況中,係小於在一個第一種情況中時,該增益因數在該第二種情況中,可能小於在該第一種情況中。
依據又一實施例,該等先前之頻譜值,可能會被採用來產生一個中間信號,以及藉由針對該中間信號,應用一個線性預測濾波器,可能產生一個頻域合成信號。接著,上述產生出之合成信號的每個頻譜值,可能乘以一個增益因數,其中,該增益因數之值,係取決於該濾波器穩定性值。誠如上文所示,若該濾波器穩定性值,在一個第二種情況中,為小於在一個第一種情況中時,該增益因數在該第二種情況中,可能會小於在該第一種情況中。
茲將詳細解釋一個例示在第2圖中之特定實施例。一個 第一訊框101,會到達一個接收器側處,其中可能設置一個用以取得頻譜取代值之裝置100。在該接收器側上面,該音訊訊框會經檢查是否為無誤。舉例而言,一個無誤之音訊訊框,為該音訊訊框內所包含之所有音訊資料為無誤的一個音訊訊框。就此一目的而言,在該接收器側上面,可能採用一些構件(未示出),其可決定一個接收到之訊框是否無誤。對此一目的而言,可能採用一些最先進技術水平的錯誤識別技術,諸如一些可測試該接收到之音訊資料是否符合一個接收到之核對位元或一個接收到之核對和的構件。或者,該錯誤偵測構件,可能採用一個循環冗餘核對(CRC),來測試該接收到之音訊資料,是否符合一個接收到之CRC值。任何其他用以測試之技術,亦可能會被採用,而無論一個接收到之音訊訊框是否為無誤。
該第一音訊訊框101,包含一個音訊資料102。此外,該第一音訊訊框,包含一個核對資料103。舉例而言,該核對資料,可能為一個核對位元、一個核對和、或一個CRC值,其可能會被採用在該接收器側上面,以測試該接收到之音訊訊框101是否為無誤(為一個無誤之訊框)。
若該音訊訊框101已被決定為無誤,則一些與該無誤之音訊訊框相關聯的值,舉例而言,與該音訊資料102相關聯的值,將會儲存在該緩衝器單元110內,而作為"先前之頻譜值"。此等值舉例而言,可能為上述被編碼在該音訊訊框內之音訊信號的頻譜值。或者,該等儲存在上述緩衝器單元內之值,舉例而言,可能為一些用以處理及/或修飾該 音訊訊框內所儲存經編碼之值所成的中間值。或者,一個信號,舉例而言,一個在該頻域中之合成信號,可能係基於該音訊訊框經編碼之值而產生出,以及該產生成之信號的頻譜值,可能會儲存在該緩衝器單元110內。將該等先前之頻譜值,儲存進該緩衝器單元110內,係以箭頭105來指明。
此外,該音訊訊框101之音訊資料102,係被使用在該接收器側上面,以解碼上述編碼成之音訊信號(未示出)。上述已被解碼之音訊信號部分,接著可能會在該接收器側上面被重播。
緊接處理音訊訊框101之後,該接收器側,會期待次一音訊訊框111(亦包含音訊資料112和核對資料113)到達該接收器側。然而,舉例而言,正當該音訊訊框111被傳輸(如115中所顯示)之際,有意外之事發生。此係以116來例示。舉例而言,可能會有一個連接受到擾亂,以致於該音訊訊框111之位元,在傳輸期間可能會受到無心之修飾,或者,舉例而言,該音訊訊框111,可能全然未到達該接收器側。
在此種情況中,係需要隱藏。舉例而言,當在一個接收器側上面,重播一個基於接收到之音訊訊框所產生的音訊信號時,應有一些技術被採用來遮蔽一個漏失之訊框。舉例而言,應有一些觀念來界定,當一個需要重播之音訊信號的當前音訊訊框,未到達該接收器側或有錯誤時,應如何動作。
該隱藏訊框產生器120經調適,可提供一些錯誤隱藏。 在第2圖中,該隱藏訊框產生器120會受到通告,一個當前之訊框並未被接收到或者為有錯誤。在該接收器側上面,可能會採用一些構件(未示出),以指示該隱藏訊框產生器120,隱藏為有必要(此係藉由虛線箭頭117來顯示)。
為實施錯誤隱藏,該隱藏訊框產生器120,可能請求某些或所有與上述來自該緩衝器單元110之先前接收無誤的訊框101相關聯之先前的頻譜值,舉例而言,先前之音訊值。此項請求係以箭頭118來例示。如同在第2圖之範例中,該先前接收無誤之訊框,舉例而言,可能為最後接收無誤之訊框,舉例而言,音訊訊框101。然而,在該接收器側上面,亦可能採用一個不同之無誤訊框,而作為先前接收無誤之訊框。
該隱藏訊框產生器,接著會接收上述與來自如119中所顯示之緩衝器單元110的先前接收無誤之音訊訊框(舉例而言,音訊訊框101)相關聯的(某些或所有)之先前的頻譜值。舉例而言,在多重訊框漏失之情況中,該緩衝器會或完全或部份地被更新。在一個實施例中,該等由箭頭118和119所例示之步驟在實現上,在於可能使該隱藏訊框產生器120,載入來自該緩衝器單元110之先前之頻譜值。
該隱藏訊框產生器120,接著會基於至少某些先前之頻譜值,來產生一些頻譜取代值。由此,收聽者應不會變為知道有一個或多個音訊訊框漏失,以使上述重播所建立之聲音印象,不會受到擾亂。
有一個達成隱藏之簡單方式,為僅僅使用該等值,舉 例而言,將身為該最後之無誤訊框的頻譜值,作為上述漏失的或有錯誤的當前訊框之頻譜取代值。
然而,尤其是在肇端之情況中,舉例而言,當聲音音量突然有了顯著之變化時,會有一些特定之問題存在。舉例而言,在一個雜訊脈衝串之情況中,僅僅是重複該最後訊框之先前的頻譜值,該雜訊脈衝串將亦會被重複。
相形之下,若該音訊信號相當穩定,舉例而言,其音量並無顯著變化,或者,舉例而言,其頻譜值並無顯著變化,則上述基於該先前接收到之音訊資料而人為產生的當前音訊信號部分之效應,舉例而言,重複該先前接收到之音訊信號部分,就一位收聽者而言,或將會失真較少。
有些實施例係基於此項發現。該隱藏訊框產生器120,係基於至少某些先前之頻譜值,以及基於上述可表示一個與該音訊信號相關聯之預測濾波器的穩定性之濾波器穩定性值,灰產生一些頻譜取代值。因此,該隱藏訊框產生器120,會將該音訊信號之穩定性納入考慮,舉例而言,上述與該先前接收無誤之訊框相關聯的音訊信號之穩定性。
就此而言,該隱藏訊框產生器120,或可能改變一個應用至該先前之頻譜值上面的增益因數之值。舉例而言,每個先前之頻譜值,會乘以該增益因數。此在例示上係參照第3a-3c圖。
在第3a圖中,係例示在應用一個原始之增益因數前的一個與先前接收無誤之訊框相關聯的音訊信號之某些頻譜線。舉例而言,該原始之增益因數,可能為一個在該音訊 訊框內所傳輸之增益因數。在該接收器側上面,若該接收到之訊框為無錯誤,舉例而言,該解碼器經配置,可能會以該原始增益因數g,乘上該音訊信號的每個頻譜值,使得到一個經修飾之頻譜。此係顯示在第3b圖中。
在第3b圖中,係說明一些以一個原始之增益因數g乘上第3a圖之頻譜線所產生的頻譜線。為單純之理由計,該原始增益因數g,係假定為2.0(g=2.0)。第3a和3b圖例示一個已無須隱藏之實況。
在第3c圖中,係假定一個當前之訊框並未被接收到或有錯誤的實況。在此一情況中,勢必要有一些取代向量產生出。就此而言,上述已儲存在一個緩衝器單元內而與先前接收無誤之訊框相關聯的先前之頻譜值,可能會被用來產生該等頻譜取代值。
在第3c圖之範例中,該等頻譜取代值在產生上,係假定基於該等接收到之值,但該原始增益因數係經修飾過。
有一個不同而小於第3b圖之情況中被用來放大該等接收到之值的增益因數的增益因數,被用來產生該等頻譜取代值的。藉由此,會達成一個漸隱。
舉例而言,上述使用在第3c圖所例示之實況中的修飾式增益因數,可能為該原始增益因數的75%,舉例而言0.75.2.0=1.5。藉由以該(經縮小)修飾過之增益因數,乘上每個頻譜值,可實施一個漸隱,因為上述用來乘每個頻譜值之修飾過的增益因數gact =1.5,係小於該無誤情況中用來乘該等頻譜值之原始增益因數(增益因數gprev =2.0)。
本發明除其他因數外,所基於的發現是,當該重複性音訊信號部分不穩定時,比起在該重複性音訊信號部分為穩定時之情況,重複一個先前接收無誤之訊框的值,係被感知為失真較多。此係例示在第4a和4b圖中。
舉例而言,若該先前接收無誤之訊框,包含一個肇端,則該肇端很可能要加以複製。第4a圖例示一個音訊信號部分,其中,上述與最後接收無誤之訊框相聯結的音訊信號部分中,有一個暫態發生。在第4a和4b圖中,該橫坐標係表示時間,該縱坐標係表示該音訊信號之幅度值。
410所指明之信號部分,係與有關最後接收無誤之訊框相關聯的音訊信號相關。區域420中之虛線係表示,若與該先前接收無誤之訊框相關聯的值,或將僅僅是被複製,以及被使用作一個取代訊框之頻譜取代值時,該時域中之曲線的可能連續線。誠如可見到的是,該收聽者可能會感知為失真之暫態,很可能要使重複。
相形之下,第4b圖例示該信號為相當穩定的一個範例。在第4b圖中,係例示一個與該最後接收無誤之訊框相關聯的音訊信號。在第4b圖之信號部分中,並無暫態發生。再次地,橫坐標表示時間,縱坐標表示該音訊信號之幅度。區域430係與上述聯結該最後接收無誤之訊框相關聯的信號部分。區域440中之虛線係表示,若該先前接收無誤之訊框的值,或將被複製,以及被使用作一個取代訊框之頻譜取代值時,該時域中之曲線的可能連續線。在該音訊信號為相當穩定之此種情況中,相較於如第4a圖中所例示重複 一個肇端之情況中,重複該最後之信號部分,就一個收聽者而言,似乎是更可被接受。
本發明基於之發現是,彼等頻譜取代值,可能係基於一個先前之音訊訊框的先前接收到之值來產生,但一個取決於一個音訊信號部分之穩定性的預測濾波器之穩定性,亦應加以考慮。就此而言,一個濾波器穩定性值,應被納入考慮。該濾波器穩定性值,舉例而言,可能表示該預測濾波器之穩定性。
在LD-USAC中,該等預測濾波器係數,舉例而言,線性預測濾波器係數,可能係在一個編碼器側上面被決定,以及可能會在音訊訊框內,傳送給該接收器。
在該解碼器側上面,該解碼器接著會接收該等預測性濾波器係數,舉例而言,該先前接收無誤之訊框的預測性濾波器係數。此外,該解碼器可能早已接收到該先前接收到之訊框的前趨訊框之預測性濾波器係數,以及舉例而言,可能已儲存了此等預測性濾波器係數。該先前接收無誤之訊框的前趨訊框,係緊接該先前接收無誤之訊框前的訊框。該隱藏訊框產生器,接著可能會基於該先前接收無誤之訊框的預測性濾波器係數,以及基於該先前接收無誤之訊框的前趨訊框之預測性過濾器係數,來決定該濾波器穩定性值。
在下文中,係呈現該濾波器穩定性值之決定,其係依據一個特別適用於LD-USAC之實施例。所考慮之穩定性值,係取決於一些預測性濾波器係數,舉例而言,在窄帶 之情況中的10個預測性濾波器係數,或者,舉例而言,在寬帶之情況中的16個預測性濾波器係數,其可能已在一個先前接收無誤之訊框內被傳輸。此外,該先前接收無誤之訊框的前趨訊框之預測性濾波器係數,亦會被納入考慮,舉例而言,在窄帶之情況中的10個進一步預測性濾波器係數,(或者,舉例而言,在寬帶之情況中的16個進一步預測性濾波器係數)。
舉例而言,第k個預測濾波器,可能已在該編碼器側上面,藉由計算一個自相關,來加以計算,而使: 其中,s’為一個窗取之語音信號,舉例而言,已針對該語音信號應用一個窗取後應被編碼之語音信號。t舉例而言可能為383。或者,t可能具有其他值,諸如191或95。
在其他實施例中,與其計算一個自相關,最先進技術水平知名之Levinson-Durbin演算法,係可能替代地加以採用,舉例而言,見,[3]:3GPP,"語音編解碼器語音處理功能;適性多速率寬帶(AMR-WB)語音編解碼器;轉碼功能"(Speech codec speech processing functions;Adaptive Multi-Rate-Wideband(AMR-WB)speech codec;Transcoding functions" 2009年,V9.0.0,3GPP TS 26.190。
誠如早已陳述的,該等預測性濾波器係數f if i (p) ,可能已分別在該先前接收無誤之訊框和該先前接收無誤之訊 框的前趨訊框內,傳送給該接收器。
在該解碼器側上面,線頻譜頻率距離計量(LSF距離計量)LSFdist ,接著在計算上可能採用公式: u可能為該先前接收無誤之訊框的預測濾波器之數目減1。舉例而言,若該先前接收無誤之訊框,具有10個預測性濾波器係數,則舉例而言,u=9。該先前接收無誤之訊框的預測性濾波器係數之數目,通常係與該先前接收無誤之訊框的前趨訊框中之預測性濾波器係數的數目相同。
該穩定性值接著在計算上,可能依據公式:v可能為一個整數。舉例而言,v在窄帶之情況中,可能為156250。在另一實施例中,v在寬帶之情況中,可能為400000。
若θ為1或接近1,θ被視為係表示一個非常穩定之預測濾波器。
若θ為0或接近0,θ被視為係表示一個非常不穩定之預測濾波器。
該隱藏訊框產生器經調適,在一個當前之音訊訊框,並未被接收到或有錯誤時,可能基於一個先前接收無誤之訊框的先前之頻譜值,來產生該等頻譜取代值。此外,該 隱藏訊框產生器經調適,如上文已說明過的,可能基於該先前接收無誤之訊框的預測性濾波器係數f i ,以及亦基於該先前接收無誤之訊框的預測性濾波器係數f i (p) ,來計算一個穩定性值θ。
在一個實施例中,該隱藏訊框產生器經調適,可能使用該濾波器穩定性值,舉例而言,藉由修飾一個原始增益因數,來產生一個產生成之增益因數,以及會針對上述有關該音訊訊框之先前的頻譜值,應用該產生成之增益因數,以得到該等頻譜取代值。在其他實施例中,該隱藏訊框產生器經調適,可針對一些導自該等先前之頻譜值的值,應用該產生成之增益因數。
舉例而言,該隱藏訊框產生器,可能以一個漸隱因數,乘一個接收到之增益因數,而產生該經修飾之增益因數,其中,該漸隱因數係取決於該濾波器穩定性值。
舉例而言,令吾等假定,一個音訊信號訊框中接收到之增益因數,舉例而言,具有該值2.0。該增益因數,通常係被用來乘該先前之頻譜值,以得到一些經修飾之頻譜值。為應用一個漸隱,一個經修飾之增益因數,係依據該穩定性值θ而產生出。
舉例而言,若該穩定性值θ=1,則該預測濾波器,被視為係非常穩定。若上述應被重建之訊框,為第一個漏失之訊框,該漸隱因數接著可能會被設定為0.85。因此,該經修飾之增益因數為0.85.2.0=1.7.。該先前接收到之訊框的每個接收到之頻譜值,接著係乘以一個經修飾之增益因數1.7 而非2.0(該接收到之增益因數),以產生該等頻譜取代值。
第5a圖例示一個產生成之增益因數1.7應用至第3a圖之頻譜值的一個範例。
然而,舉例而言,若該穩定性值θ=0,則該預測濾波器,會被視為非常不穩定。若上述應被重建之訊框,為第一個漏失之訊框,該漸隱因數接著可能會被設定為0.65。因此,該經修飾之增益因數為0.65.2.0=1.3。該先前接收到之訊框的每個接收到之頻譜值,接著係乘以一個經修飾之增益因數1.3而非2.0(該接收到之增益因數),以產生該等頻譜取代值。
第5b圖例示一個產生成之增益因數1.3應用至第3a圖之頻譜值的一個範例。當第5b圖之範例中的增益因數,小於在第5a圖之範例中時,第5b圖中之幅度,亦會小於在第5a圖之範例中。
依據該值θ,可能應用不同之策略,其中,θ或可能為任何在0與1間之值。
舉例而言,一個值θ0.5可能會被理解為1,以致於該漸隱因數會具有該相同之值,彷彿θ或將為1,舉例而言,該漸隱因數為0.85。一個值θ<0.5,可能會被理解為0,以致於該漸隱因數會具有該相同之值,彷彿θ或將為0,舉例而言,該漸隱因數為0.65。
依據另一實施例,若θ之值係在0與1之間,該漸隱因數之值,或可能替代選擇地加上內插。舉例而言,假定若θ為1,該漸隱因數之值便為0.85,以及若θ為0,該漸隱因數之值便為 0.65,則該漸隱因數在計算上,可能依據公式:漸隱因數=0.65+θ.0.2;就0<θ<1.而言
在另一實施例中,該隱藏訊框產生器經調適,可進一步基於與該先前接收無誤之訊框相關聯的訊框類別資訊,來產生該等頻譜取代值。上述有關該類別之資訊,可能由一個編碼器來決定。該編碼器接著可能編碼該音訊訊框中之訊框類別資訊。該解碼器在解碼該先前接收無誤之訊框時,接著或可能解碼該訊框類別資訊。
或者,該解碼器本身可能藉由檢查該音訊訊框,來決定該訊框類別資訊。
此外,該解碼器經配置,可能基於來自該編碼器之資訊,以及基於該接收之音訊資料的檢查,來決定該訊框類別資訊,該檢查係由該解碼器本身來實施。
該訊框類別舉例而言,可能表示該訊框是否被分類為"人為肇端"、"肇端"、"有聲變遷"、"無聲變遷"、"無聲"和"有聲"。
舉例而言,"肇端"或可能表示,該先前接收到之音訊訊框,係包含一個肇端。舉例而言,"有聲"或可能表示,該先前接收到之音訊訊框,係包含有聲資料。舉例而言,"無聲"或可能表示,該先前接收到之音訊訊框,係包含無聲資料。舉例而言,"有聲變遷"或可能表示,該先前接收到之音訊訊框,係包含有聲資料,但相較於該先前接收到之音訊訊框的前趨訊框,該音調確實有改變。舉例而言,"人為肇端"或可能表示,該先前接收到之音訊訊框的能量 已被提高(因此,舉例而言,建立一個人為肇端)。舉例而言,"無聲變遷"或可能表示,該先前接收到之音訊訊框,係包含無聲資料,但該無聲聲音將要改變。
依據該先前接收到之音訊訊框,該穩定性值θ和接續之抹除訊框的數目、該衰減增益,舉例而言,該漸隱因數,舉例而言,可能會被界定如下:
依據一個實施例,該隱藏訊框產生器,可能藉由使一個接收到之增益因數,乘以上述基於該濾波器穩定性值及基於該訊框類別所決定之漸隱因數,來產生一個經修飾之增益因數。接著,該等先前之頻譜值,舉例而言,可能乘以該經修飾之增益因數,以得到一些頻譜取代值。
該隱藏訊框產生器,可能再次經調適,使亦進一步基於該訊框類別資訊,來產生該等頻譜取代值。
依據一個實施例,該隱藏訊框產生器經調適,可能進一步依據未到達該接收器處或有錯誤之連續訊框的數目, 來產生該等頻譜取代值。
在一個實施例中,該隱藏訊框產生器經調適,可能基於該濾波器穩定性值,以及基於未到達該接收器處或有錯誤之連續訊框的數目,來計算一個漸隱因數。
該隱藏訊框產生器,可能再次經調適,藉由使該漸隱因數,乘以至少某些先前之頻譜值,來產生該等頻譜取代值。
或者,該隱藏訊框產生器經調適,可能藉由使該漸隱因數,乘以至少某一群組之中間值的某些值,來產生該等頻譜取代值。每個中間值,係取決於至少一個先前之頻譜值。舉例而言,該群組之中間值,可能已藉由修飾該等先前之頻譜值而產生出。或者,一個在該頻域中之合成信號,可能已基於該等先前之頻譜值而產生出,以及該合成信號之頻譜值,可能會形成該群組之中間值。
在另一實施例中,該漸隱因數,可能乘以一個原始增益因數,以得到一個產生成之增益因數。此產生成之增益因數,接著係乘以至少某些先前之頻譜值,或者乘以先前所提及之群組的中間值之某些值,使得到該等頻譜取代值。
該漸隱因數之值,係取決於該濾波器穩定性值,以及基於上述連續之漏失或有錯誤的訊框之數目,以及舉例而言,可能具有該等值:
此處,"接續之漏失/有錯誤的訊框之數目=1"係表示,該漏失/有錯誤之訊框的緊接前趨訊框為無誤。
誠如可見的是,在上述之範例中,該漸隱因數,可能基於該最後之漸隱因數,在每次有一個訊框未到達或有錯誤時被更新。舉例而言,若一個漏失/有錯誤之訊框的緊接前趨訊框為無誤,則在上述之範例中,該漸隱因數為0.8。若該後繼之訊框亦屬漏失或有錯誤,該漸隱因數,係基於該先前之漸隱因數,藉由使該先前之漸隱因數,乘以一個更新因數0.65:漸隱因數=0.8.0.65=0.52、等等,來加以更新。
某些或所有先前之頻譜值,可能乘以該漸隱因數本身。
或者,該漸隱因數,可能乘以一個原始增益因數,使取得一個產生成之增益因數。此產生成之增益因數,可能接著乘以每一個(或某些)先前之頻譜值(或導自該等先前之頻譜值的中間值),使得到該等頻譜取代值。
理應注意的是,該漸隱因數,亦可能取決於該濾波器穩定性值。舉例而言,若該濾波器穩定性值,為1.0、0.5、或任何其他值,上述之列表可能亦包含該漸隱因數有關之 定義,舉例而言:
彼等中間濾波器穩定性值有關之漸隱因值,可能會被近似化。
在另一實施例中,該漸隱因數在決定上,可能採用一個公式,其係藉由基於該濾波器穩定性值,以及基於一些未到達該接收器處或有錯誤之連續訊框的數目,來計算該漸隱因數。
誠如上文所說明,該緩衝器單元內所儲存之先前的頻譜值,可能為一些頻譜值。為避免所產生之失真假像,該隱藏訊框產生器,如同上文所解釋,可能基於一個濾波器穩定性值,來產生該等頻譜取代值。
然而,此種產生成之信號部分的取代值,可能仍具有一個重複性特徵。所以,依據一個實施例,進一步提議的是,藉由隨機顛倒該等頻譜值之符號,來修飾該等先前之頻譜值,舉例而言,該先前接收到之訊框的頻譜值。舉例而言,該隱藏訊框產生器,可就每個先前之頻譜值隨機地決定,該頻譜值之符號是否要被顛倒,舉例而言,該頻譜值是否要乘以-1。藉由此,該被取代之音訊信號訊框相對 於其前趨訊框的重複性特徵會被降低。
在下文中,係說明依據一個實施例之LD-USAC解碼器中的隱藏。在此一實施例中,恰在該LD-USAC解碼器實施該最後之頻率對時間的轉換之前,該隱藏係正作用於該頻譜資料。
在此種實施例中,一個到達之音訊訊框的值,係被用來藉由產生一個在頻域中之合成信號,來解碼該編碼成之音訊信號。就此而言,一個在該頻域中之中間信號,係基於該到達之音訊訊框的值而產生出。雜訊充填係針對該等被量化至零之值加以實施。
該編碼成之預測性濾波器係數,可界定一個預測濾波器,其接著係應用至該中間信號,使產生上述表示頻域中之解碼/重建成的音訊信號之合成信號。
第6圖例示依據一個實施例之音訊信號解碼器。此音訊信號解碼器,依據上文所說明的一個實施例,係包含一個用以解碼一些頻譜音訊信號值610之裝置,和一個用以產生一些頻譜取代值620之裝置。
上述用以解碼一些頻譜音訊信號值610之裝置,誠如剛剛說明的,可在有一個無錯誤之音訊訊框到達時,產生該解碼成之音訊信號的頻譜值。
在第6圖之實施例中,該合成信號之頻譜值,可能接著使儲存進上述用以產生彼等頻譜取代值之裝置620的緩衝器單元內。該解碼成之音訊信號的此等頻譜值,業已基於該接收無誤之音訊訊框而被解碼,以及因而與該先前接收 無誤之音訊訊框相關。
當有一個當前之訊框漏失或有錯誤時,上述用以產生頻譜取代值之裝置620,係告知需要該等頻譜取代值。上述用以產生頻譜取代值之裝置620的隱藏訊框產生器,依據上文所說明的一個實施例,接著會產生一些頻譜取代值。
舉例而言,上述來自最後之良好訊框的頻譜值,係藉由隨機顛倒彼等之符號,而被該隱藏訊框產生器稍加修飾。接著,有一個漸隱應用至此等頻譜值。該漸隱可能基於該先前之預測濾波器的穩定性,以及基於接續之漏失訊框的數目。該等產生成之頻譜取代值,接著係用作該音訊信號有關之頻譜值,以及接著實施一個頻率對時間變換,使得到一個時域音訊信號。
在LD-USAC中,加上在USAC和MPEG-4(MPEG=動畫專家小組)中,可能採用時域雜訊修整(TNS)。藉由時域雜訊修整,雜訊之細時間結構會受到控制。在一個解碼器側上面,有一個濾波器運作,會基於雜訊修整資訊,使應用至該頻譜資料上面。
有關時域雜訊修整之更多資訊,舉例而言,可見於:[4]:ISO/IEC 14496-3:2005:資訊科技-視聽物件編碼-第3部分:音訊,2005年
彼等實施例基於的發現是,在一個肇端/暫態之情況中,TNS係高度活動。因此,藉由決定TNS是否為高度活動,可估計一個肇端/暫態是否存在。
依據一個實施例,TNS具有的一個預測增益,係在該 接收器側上面加以計算。在該接收器側上面,首先,一個接收無誤之音訊訊框的接收到之頻譜值,經處理可得到一些第一中間頻譜值ai 。接著,會實施TNS,以及藉由此,會得到一些第二中間頻譜值b。就該等第一中間頻譜值,會計算一個第一能量值E1 ,以及就該等第二中間頻譜值,會計算一些第二能量值E2 。為得到該TNS之預測增益gTNS ,該第二能量值,可能除以該第一能量值。
舉例而言,gTNS 可能係被界定為:gTNS =E2 /E1 (n=所考慮之頻譜值的數目)
依據一個實施例,該隱藏訊框產生器經調適,在針對一個先前接收無誤之訊框,實施一個時域雜訊修整時,係基於該等先前之頻譜值,基於該濾波器穩定性值,以及亦基於該時域雜訊修整之預測增益,來產生該等頻譜取代值。依據另一實施例,該隱藏訊框產生器經調適,可進一步基於接續之漏失或有錯誤的訊框之數目,來產生該等頻譜取代值。
該預測增益愈高,該漸隱便應愈快速。舉例而言,考慮一個濾波器穩定性值0.5,以及假定該預測增益很高,舉例而言,gTNS =6;則一個漸隱因數,舉例而言,可能為0.65(= 快速之漸隱)。相形之下,再次地,考慮一個濾波器穩定性值0.5,但係假定該預測增益很低,舉例而言,1.5;則一個漸隱因數,舉例而言,可能為0.95(=緩慢之漸隱)。
該TNS之預測增益,亦可能會影響到,何者值應儲存進一個用以產生一些頻譜取代值之裝置的緩衝器單元內。
若該預測增益gTNS ,低於某一定之臨界值(舉例而言,臨界值=5.0),則上述在已應用該TNS後之頻譜值,係使儲存進該緩衝器單元內,而作為一些先前之頻譜值。在一個漏失的或有錯誤的訊框之情況中,該等頻譜取代值,係基於此等先前之頻譜值而產生出。
否則,若該預測增益gTNS ,大於或等於該對臨界值,上述在已應用該TNS前之頻譜值,係使儲存進該緩衝器單元內,而作為一些先前之頻譜值。在一個漏失的或有錯誤的訊框之情況中,該等頻譜取代值,係基於此等先前之頻譜值而產生出。
在任何情況中,針對此等先前之頻譜值,並不會應用TNS。
因此,第7圖例示依據一個對應之實施例的音訊信號解碼器。該音訊信號解碼器,包含一個以一個接收無誤之訊框來產生一些第一中間頻譜值的解碼器單元710。此外,該音訊信號解碼器,包含一個用以針對該等第一中間頻譜值來實施時域雜訊修整而得到一些第二中間頻譜值之時域雜訊修整單元720。此外,該音訊信號解碼器,包含一個用以依據該等第一中間頻譜值和第二中間頻譜值來計算該時域 雜訊修整之預測增益的預測增益計算器730。此外,該音訊信號解碼器,包含一個依據上文所說明之實施例的裝置740,其可在一個當前之音訊訊框,並未被收到或有錯誤時,產生一些頻譜取代值。此外,該音訊信號解碼器,包含一個值選擇器750,其可在該預測增益,大於或等於一個臨界值時,將該等第一中間頻譜值,儲存進上述用以產生一些頻譜取代值之裝置740的緩衝器單元745內,或者在該預測增益,小於該臨界值時,將該等第二中間頻譜值,儲存進上述用以產生一些頻譜取代值之裝置740的緩衝器單元745內。
該臨界值舉例而言,可能為一個預定之值。舉例而言,該臨界值可能係在該音訊信號解碼器中被預先界定。
依據另一實施例,恰在該第一解碼步驟之後,以及在實施任何雜訊充填、全局增益、和/或TNS之前,係針對該頻譜資料而實施隱藏。
此一實施例係描述在第8圖中。第8圖例示依據又一個實施例之解碼器。該解碼器包含一個第一解碼器模組810。此第一解碼器模組810經調適,可基於一個接收無誤之音訊訊框,來產生一些產生成之頻譜值。該等產生成之頻譜值,接著係使儲存進一個用以產生一些頻譜取代值之裝置820的緩衝器單元內。此外,該等產生成之頻譜值,係使輸入進一個處理模組830內,其可藉由實施TNS,藉由應用雜訊充填,以及/或者藉由應用一個全局增益,來處理該等產生成之頻譜值,使得到該解碼成之音訊信號的頻譜音訊 值。若有一個當前之訊框漏失或有錯誤,上述用以產生一些頻譜取代值之裝置820,可產生該等頻譜取代值,以及可將彼等饋入該處理模組830內。
依據第8圖中所例示之實施例,該解碼器模組或該處理模組,實施隱藏之情況中的某些或所有之下列諸步驟:該等頻譜值,舉例而言,來自該最後之良好訊框,係藉由隨機顛倒彼等之符號而略加修飾。在一個進一步之步驟中,雜訊充填係基於隨機雜訊,針對該等被量化至零之頻率解析單元(spectral bins)而加以實施。在另一步驟中,該雜訊因數,係相較於該先前接收無誤之訊框而略加調適。
在一個進一步之步驟中,頻譜雜訊修整在完成上,係藉由應用頻域中之LPC編碼式(LPC=線性預測性編碼)之加權式頻譜封包。舉例而言,該最後接收無誤之訊框的LPC係數,可能會被使用。在另一實施例中,可能會使用一些平均化之LPC係數。舉例而言,該等最後三個接收無誤之訊框的一個被考慮之LPC係數的最後三值之平均值,可能會就一個濾波器之每一LPC係數而產生出,以及係可能應用該等平均化之LPC係數。
在一個後繼之步驟中,針對此等頻譜值,可能應用一個漸隱。該漸隱可能依據接續之漏失或有錯誤的訊框之數目,以及依據該先前之LP濾波器的穩定性。此外,該預測增益資訊,可能會被用來影響該漸隱。該預測增益愈高,該漸隱便可能愈快速。第8圖之實施例,比起第6圖之實施例,係略微複雜,但可提供較佳之音訊品質。
雖然已在一個裝置之環境背景中說明了某些特徵,很明顯的是,此等觀點亦表示該對應之方法的說明,其中,一個區塊或裝置,係對應於一個方法步驟或一個方法步驟之特徵。類似地,一些在一個方法步驟之環境背景中加以說明的觀點,亦表示一個對應裝置之對應區塊或項目或特徵的說明。
依據某一定實現體規範,本發明之實施例,可使體現在硬體或軟體中。該實現體在執行上,可使用一個數位儲存媒體,舉例而言,一個其上儲存有一些電子可讀取式控制信號之磁片、DVD、CD、ROM、PROM、EPROM、EEPROM、或快閃記憶體,其可與一個可程式規劃式電腦系統協動(或有能力協動),以執行該對應之方法。
某些依據本發明之實施例,包含一個具有一些電子可讀取式控制信號之資料載體,其係有能力與一個可程式規劃式電腦系統協動,以執行本說明書所說明的一個方法。
通常,本發明之實施例,可使體現為一個具有程式碼之電腦程式產品,該程式碼在運作上,可於該電腦程式產品,在一個電腦上面運行時,執行該等方法中的一個。該程式碼舉例而言,可能係儲存在一個機器可讀取式載體上面。
其他實施例包含上述用以執行本說明書所說明的一個方法之電腦程式,其係儲存在一個機器可讀取式載體或一個非暫時性儲存媒體上面。
換言之,該原創性方法的一個實施例,因而係一個具 有一個程式碼之電腦程式,其可於該電腦程式產品,在一個電腦上面運行時,執行本說明書所說明的一個方法。
該等原創性方法之又一實施例,因而係一個資料載體(或一個數位儲存媒體,或一個電腦可讀取式媒體),其包含記錄其上而用以執行本說明書所說明的一個方法之電腦程式。
本原創性方法之又一實施例,因而係一個資料流,或一個表示上述用以執行本說明書所說明的一個方法之電腦程式的信號序列。該資料串流或該信號序列經配置,舉例而言,可能經由一個資料通訊連線,舉例而言,經由網際網路,或透過一個無線電通道,而使轉移。
又一個實施例包含一個經配置或經調適可執行本說明書所說明的一個方法之處理構件,舉例而言,一個電腦、或一個可程式規劃式邏輯裝置。
一個進一步之實施例,包含一個電腦,其上安裝有上述用以執行本說明書所說明的一個方法之電腦程式。
在某些實施例中,一個可程式規劃式邏輯裝置(舉例而言,一個現場可規劃邏輯閘陣列),可能會被用來執行本說明書所說明之方法的某些或所有功能性。在某些實施例中,一個現場可規劃邏輯閘陣列,可能與一個微處理器協動,以執行本說明書所說明的一個方法。通常,該等方法最好係由任何硬體裝置來執行。
上文所說明之實施例,係僅為例示本發明之原理。理應瞭解的是,本說明書所說明之佈置和細節的修飾體和變 更形式,將為本技藝之專業人士所明瞭。所以,其係意使僅受限於將近之申請專利範圍的界定範圍,以及非受限於本說明書之實施例的說明內容和解釋所呈現之特定細節。
文獻:
[1]:3GPP,"音訊編解碼器處理功能;外延式適性多速率寬帶(AMR-WB+)編解碼器;轉碼功能",2009年,3GPP TS 26.290。
[2]:USAC編解碼器(聯合語音/音頻編碼(USAC),ISO/IEC CD 23003-3註明日期2010年九月24日。
[3]:3GPP,"語音編解碼器語音處理功能;適性多速率寬帶(AMR-WB)語音編解碼器;轉碼功能"(Speech codec speech processing functions;Adaptive Multi-Rate-Wideband(AMR-WB)speech codec;Transcoding functions" 2009年,V9.0.0,3GPP TS 26.190。
[4]:ISO/IEC 14496-3:2005:資訊科技-視聽物件編碼-第3部分:音訊,2005年
[5]:ITU-T G.718(06-2008)規範
100‧‧‧頻譜取代值產生裝置
101‧‧‧第一音訊訊框
102‧‧‧音訊資料
103‧‧‧核對資料
105‧‧‧先前之頻譜值
110‧‧‧緩衝器單元
111‧‧‧音訊訊框
112‧‧‧音訊資料
113‧‧‧核對資料
115‧‧‧箭頭
116‧‧‧箭頭
117‧‧‧隱藏必要
118‧‧‧請求先前值
119‧‧‧先前之頻譜值
120‧‧‧隱藏訊框產生器
125‧‧‧產生成之頻譜取代值
410‧‧‧信號部分
420‧‧‧區域
430‧‧‧信號部分
440‧‧‧區域
610‧‧‧頻譜音訊信號值解碼裝置
620‧‧‧頻譜取代值產生裝置
710‧‧‧解碼器單元
720‧‧‧時域雜訊修整單元
730‧‧‧預測增益計算器
740‧‧‧頻譜取代值產生裝置
745‧‧‧緩衝器單元
750‧‧‧值選擇器
810‧‧‧第一解碼器模組
820‧‧‧頻譜取代值產生裝置
830‧‧‧處理模組
第1圖例示依據一個實施例就一個音訊信號取得一些頻譜取代值的一個裝置;第2圖例示另一個實施例就一個音訊信號取得一些頻譜取代值之裝置;第3a-3c圖例示依據一個實施例的一個增益因數與先前之頻譜值的乘法運算; 第4a圖例示一個包含某一在一個時域中之肇端的信號部分之重複性;第4b圖例示一個時域中之穩定信號部分的重複性;第5a-5b圖例示一些範例,其中,依據一個實施例,一些產生成之增益因數,係應用至第3a圖之頻譜值;第6圖例示依據一個實施例之音訊信號解碼器;第7圖例示依據另一實施例之音訊信號解碼器;而第8圖則例示依據又一個實施例之音訊信號解碼器。
100‧‧‧頻譜取代值產生裝置
105‧‧‧先前之頻譜值
110‧‧‧緩衝器單元
119‧‧‧先前之頻譜值
120‧‧‧隱藏訊框產生器
125‧‧‧產生成之頻譜取代值

Claims (16)

  1. 一種用以就音訊信號產生頻譜取代值之裝置,其包含:一個緩衝器單元,其可儲存一些與一個先前接收無誤之音訊訊框相關的先前之頻譜值;和一個隱藏訊框產生器,其可在一個當前之音訊訊框並未被接收到或有錯誤時,產生該等頻譜取代值,其中,該先前接收無誤之音訊訊框包含濾波器資訊,此濾波器資訊係與一個指示一個預測濾波器之穩定性的濾波器穩定性值相關聯,以及其中,該隱藏訊框產生器適於基於該等先前之頻譜值,以及基於該濾波器穩定性值,來產生該等頻譜取代值。
  2. 如申請專利範圍第1項之裝置,其中,該隱藏訊框產生器適於藉由隨機顛倒先前之頻譜值的符號,來產生該等頻譜取代值。
  3. 如申請專利範圍第1或2項之裝置,其中,該隱藏訊框產生器組配來藉由在該濾波器穩定性值具有一個第一值時,使每個先前之頻譜值乘以一個第一增益因數,以及在該濾波器穩定性值具有一個小於該第一值之第二值時,使每個先前之頻譜值乘以一個第二增益因數,來產生該等頻譜取代值。
  4. 如申請專利範圍第1項之裝置,其中,該隱藏訊框產生器適於基於該濾波器穩定性值,來產生該等頻譜取代值,其中,該先前接收無誤之音訊訊框包含該預測濾波器之第一預測性濾波器係數,其中,該先前接收無誤之 音訊訊框的前驅訊框包含一些第二預測性濾波器係數,以及其中,該濾波器穩定性值係取決於該等第一預測性濾波器係數,以及取決於該等第二預測性濾波器係數。
  5. 如申請專利範圍第4項之裝置,其中,該隱藏訊框產生器適於基於該先前接收無誤之音訊訊框的第一預測性濾波器係數,以及基於該先前接收無誤之音訊訊框的前驅訊框之第二預測性過濾器係數,來決定該濾波器穩定性值。
  6. 如申請專利範圍第4項之裝置,其中,該隱藏訊框產生器適於基於該濾波器穩定性值,來產生該等頻譜取代值,其中,該濾波器穩定性值係取決於一個距離計量LSFdist ,以及其中,該距離計量LSFdist 在界定上係藉由公式: 其中,u+1指明該先前接收無誤之音訊訊框的第一預測性濾波器係數之總數,以及其中,u+1亦指明該先前接收無誤之音訊訊框的前驅訊框之第二預測性濾波器係數的總數,其中,f i 指明該等第一預測性濾波器係數的第i個濾波器係數,以及其中,f i (p ) 指明該等第二預測性濾波器係數的第i個濾波器係數。
  7. 如申請專利範圍第1項之裝置,其中,該隱藏訊框產生器適於進一步基於與該先前接收無誤之音訊訊框相關 聯的訊框類別資訊,來產生該等頻譜取代值。
  8. 如申請專利範圍第7項之裝置,其中,該隱藏訊框產生器適於基於該訊框類別資訊,來產生該等頻譜取代值,其中,該訊框類別資訊指明,該先前接收無誤之音訊訊框係被分類為"人為肇端"、"肇端"、"有聲變遷"、"無聲變遷"、"無聲"或"有聲"。
  9. 如申請專利範圍第1項之裝置,其中,該隱藏訊框產生器適於自一個最後之無誤音訊訊框已到達一接收器起,進一步基於若干未到達該接收器處或有錯誤之連續訊框,來產生該等頻譜取代值,其中,自該最後之無誤音訊訊框已到達該接收器起,並無其他無誤之音訊訊框到達該接收器處。
  10. 如申請專利範圍第9項之裝置,其中,該隱藏訊框產生器適於基於該濾波器穩定性值,以及基於未到達該接收器處或有錯誤之連續訊框的數目,來計算一個漸隱因數,以及其中,該隱藏訊框產生器適於藉由使該漸隱因數乘以至少某些先前之頻譜值,或者乘以至少某一群組之中間值的某些值,來產生該等頻譜取代值,其中,每個中間值係取決於至少一個先前之頻譜值。
  11. 如申請專利範圍第1項之裝置,其中,該隱藏訊框產生器適於基於該等先前之頻譜值、基於該濾波器穩定性值、以及亦基於一個時域雜訊修整之預測增益,來產生該等頻譜取代值。
  12. 一種音訊信號解碼器,其包含:一個用以解碼頻譜音訊信號值之裝置,和一個如申請專利範圍第1至11項中任一項用以產生頻譜取代值之裝置,其中,上述用以解碼頻譜音訊信號值之裝置適於基於一個先前接收無誤之音訊訊框,來解碼一個音訊信號之頻譜值,其中,上述用以解碼頻譜音訊信號值之裝置進一步適於將該音訊信號之該等頻譜值,儲存進上述用以產生頻譜取代值之裝置的緩衝器單元內,以及其中,上述用以產生頻譜取代值之裝置適於在一個當前之音訊訊框未被接收到或有錯誤時,基於該緩衝器單元內所儲存之該等頻譜值,來產生該等頻譜取代值。
  13. 一種音訊信號解碼器,其包含:一個用以基於一個接收無誤之音訊訊框來產生一些第一中間頻譜值的解碼器單元,一個用以針對該等第一中間頻譜值來實施時域雜訊修整而得到一些第二中間頻譜值之時域雜訊修整單元,一個用以依據該等第一中間頻譜值和該等第二中間頻譜值來計算該時域雜訊修整的一個預測增益之預測增益計算器,一個如申請專利範圍第1至11項中任一項之裝置,用以在一個當前之音訊訊框未被接收到或有錯誤時產生一些頻譜取代值,和 一個值選擇器,其若該預測增益大於或等於一個臨界值,將該等第一中間頻譜值儲存進用以產生一些頻譜取代值之該裝置的緩衝器單元內,或者若該預測增益小於該臨界值,將該等第二中間頻譜值儲存進用以產生一些頻譜取代值之該裝置的緩衝器單元內。
  14. 一種音訊信號解碼器,其包含:一個用以基於一個接收無誤之音訊訊框來產生一些生成的頻譜值之第一解碼模組,一個根據申請專利範圍第1至11項中任一項用以產生頻譜取代值之裝置,和一個用以處理該等生成之頻譜值的處理模組,其係藉由實施時域雜訊修整、應用雜訊充填、或者應用一個全局增益,以得到該解碼成之音訊信號的頻譜音訊值,其中,用以產生頻譜取代值之該裝置適於可產生一些頻譜取代值,以及在一個當前之訊框並未被接收到或有錯誤時,將彼等饋進該處理模組內。
  15. 一種用以就音訊信號產生頻譜取代值之方法,其包括:儲存一些與一個先前接收無誤之音訊訊框相關聯的先前之頻譜值,以及當一個當前之音訊訊框並未被接收到或有錯誤時,產生該等頻譜取代值,其中,該先前接收無誤之音訊訊框包含濾波器資訊,此濾波器資訊係與一個指示該濾波器資訊所界定之預測濾波器的穩定性之濾波器穩定性值相聯結,其中,該等頻譜取代值係基於該等先前 之頻譜值以及基於該濾波器穩定性值產生。
  16. 一種電腦程式,其在由一個電腦或信號處理器執行時,體現如申請專利範圍第15項之方法。
TW101104539A 2011-02-14 2012-02-13 用於低延遲聯合語音及音訊編碼中之錯誤隱藏之裝置和方法 TWI484479B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201161442632P 2011-02-14 2011-02-14
PCT/EP2012/052395 WO2012110447A1 (en) 2011-02-14 2012-02-13 Apparatus and method for error concealment in low-delay unified speech and audio coding (usac)

Publications (2)

Publication Number Publication Date
TW201248616A TW201248616A (en) 2012-12-01
TWI484479B true TWI484479B (zh) 2015-05-11

Family

ID=71943602

Family Applications (1)

Application Number Title Priority Date Filing Date
TW101104539A TWI484479B (zh) 2011-02-14 2012-02-13 用於低延遲聯合語音及音訊編碼中之錯誤隱藏之裝置和方法

Country Status (19)

Country Link
US (1) US9384739B2 (zh)
EP (1) EP2661745B1 (zh)
JP (1) JP5849106B2 (zh)
KR (1) KR101551046B1 (zh)
CN (1) CN103620672B (zh)
AR (1) AR085218A1 (zh)
AU (1) AU2012217215B2 (zh)
BR (1) BR112013020324B8 (zh)
CA (1) CA2827000C (zh)
ES (1) ES2539174T3 (zh)
HK (1) HK1191130A1 (zh)
MX (1) MX2013009301A (zh)
MY (1) MY167853A (zh)
PL (1) PL2661745T3 (zh)
RU (1) RU2630390C2 (zh)
SG (1) SG192734A1 (zh)
TW (1) TWI484479B (zh)
WO (1) WO2012110447A1 (zh)
ZA (1) ZA201306499B (zh)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130144632A1 (en) 2011-10-21 2013-06-06 Samsung Electronics Co., Ltd. Frame error concealment method and apparatus, and audio decoding method and apparatus
US9741350B2 (en) * 2013-02-08 2017-08-22 Qualcomm Incorporated Systems and methods of performing gain control
WO2014202784A1 (en) * 2013-06-21 2014-12-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for improved signal fade out for switched audio coding systems during error concealment
CN108364657B (zh) 2013-07-16 2020-10-30 超清编解码有限公司 处理丢失帧的方法和解码器
ES2659838T3 (es) * 2013-10-31 2018-03-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decodificador de audio y método para proporcionar una información de audio decodificada usando un ocultamiento de errores en base a una señal de excitación de dominio de tiempo
SG10201709062UA (en) * 2013-10-31 2017-12-28 Fraunhofer Ges Forschung Audio decoder and method for providing a decoded audio information using an error concealment modifying a time domain excitation signal
EP3063761B1 (en) * 2013-10-31 2017-11-22 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung E.V. Audio bandwidth extension by insertion of temporal pre-shaped noise in frequency domain
EP2922054A1 (en) 2014-03-19 2015-09-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and corresponding computer program for generating an error concealment signal using an adaptive noise estimation
EP2922056A1 (en) 2014-03-19 2015-09-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and corresponding computer program for generating an error concealment signal using power compensation
EP2922055A1 (en) * 2014-03-19 2015-09-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and corresponding computer program for generating an error concealment signal using individual replacement LPC representations for individual codebook information
WO2015174912A1 (en) * 2014-05-15 2015-11-19 Telefonaktiebolaget L M Ericsson (Publ) Audio signal classification and coding
NO2780522T3 (zh) * 2014-05-15 2018-06-09
CN105225666B (zh) 2014-06-25 2016-12-28 华为技术有限公司 处理丢失帧的方法和装置
EP2980790A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for comfort noise generation mode selection
EP2980792A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an enhanced signal using independent noise-filling
CN110444219B (zh) * 2014-07-28 2023-06-13 弗劳恩霍夫应用研究促进协会 选择第一编码演算法或第二编码演算法的装置与方法
JP6883047B2 (ja) * 2016-03-07 2021-06-02 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 適切に復号されたオーディオフレームの復号化表現の特性を使用する誤り隠蔽ユニット、オーディオデコーダ、および関連する方法およびコンピュータプログラム
RU2711108C1 (ru) * 2016-03-07 2020-01-15 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Блок маскирования ошибок, аудиодекодер и соответствующие способ и компьютерная программа, подвергающие затуханию замаскированный аудиокадр согласно разным коэффициентам затухания для разных полос частот
EP3427256B1 (en) * 2016-03-07 2020-04-08 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Hybrid concealment techniques: combination of frequency and time domain packet loss concealment in audio codecs
KR20180037852A (ko) * 2016-10-05 2018-04-13 삼성전자주식회사 영상 처리 장치 및 그 제어방법
EP3382700A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for post-processing an audio signal using a transient location detection
KR20200097594A (ko) 2019-02-08 2020-08-19 김승현 유연하고 자유롭고 집중적인 집진기
WO2020164752A1 (en) 2019-02-13 2020-08-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio transmitter processor, audio receiver processor and related methods and computer programs
WO2020165260A1 (en) * 2019-02-13 2020-08-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-mode channel coding with mode specific coloration sequences
CN112992160B (zh) * 2021-05-08 2021-07-27 北京百瑞互联技术有限公司 一种音频错误隐藏方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6757654B1 (en) * 2000-05-11 2004-06-29 Telefonaktiebolaget Lm Ericsson Forward error correction in speech coding
US20050154584A1 (en) * 2002-05-31 2005-07-14 Milan Jelinek Method and device for efficient frame erasure concealment in linear predictive based speech codecs
TW200703234A (en) * 2005-01-31 2007-01-16 Qualcomm Inc Frame erasure concealment in voice communications
WO2007073604A1 (en) * 2005-12-28 2007-07-05 Voiceage Corporation Method and device for efficient frame erasure concealment in speech codecs
TW200729156A (en) * 2005-12-19 2007-08-01 Dolby Lab Licensing Corp Improved correlating and decorrelating transforms for multiple description coding systems
TW200943792A (en) * 2008-04-15 2009-10-16 Qualcomm Inc Channel decoding-based error detection

Family Cites Families (182)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2225321T3 (es) * 1991-06-11 2005-03-16 Qualcomm Incorporated Aparaato y procedimiento para el enmascaramiento de errores en tramas de datos.
US5408580A (en) 1992-09-21 1995-04-18 Aware, Inc. Audio compression system employing multi-rate signal analysis
SE502244C2 (sv) * 1993-06-11 1995-09-25 Ericsson Telefon Ab L M Sätt och anordning för avkodning av ljudsignaler i ett system för mobilradiokommunikation
SE501340C2 (sv) * 1993-06-11 1995-01-23 Ericsson Telefon Ab L M Döljande av transmissionsfel i en talavkodare
BE1007617A3 (nl) 1993-10-11 1995-08-22 Philips Electronics Nv Transmissiesysteem met gebruik van verschillende codeerprincipes.
US5657422A (en) 1994-01-28 1997-08-12 Lucent Technologies Inc. Voice activity detection driven noise remediator
US5784532A (en) 1994-02-16 1998-07-21 Qualcomm Incorporated Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system
US5684920A (en) 1994-03-17 1997-11-04 Nippon Telegraph And Telephone Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein
US5568588A (en) 1994-04-29 1996-10-22 Audiocodes Ltd. Multi-pulse analysis speech processing System and method
KR100419545B1 (ko) 1994-10-06 2004-06-04 코닌클리케 필립스 일렉트로닉스 엔.브이. 다른코딩원리들을이용한전송시스템
US5537510A (en) 1994-12-30 1996-07-16 Daewoo Electronics Co., Ltd. Adaptive digital audio encoding apparatus and a bit allocation method thereof
SE506379C3 (sv) 1995-03-22 1998-01-19 Ericsson Telefon Ab L M Lpc-talkodare med kombinerad excitation
JP3317470B2 (ja) 1995-03-28 2002-08-26 日本電信電話株式会社 音響信号符号化方法、音響信号復号化方法
US5659622A (en) 1995-11-13 1997-08-19 Motorola, Inc. Method and apparatus for suppressing noise in a communication system
US5848391A (en) 1996-07-11 1998-12-08 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Method subband of coding and decoding audio signals using variable length windows
JP3259759B2 (ja) 1996-07-22 2002-02-25 日本電気株式会社 音声信号伝送方法及び音声符号復号化システム
JPH10124092A (ja) 1996-10-23 1998-05-15 Sony Corp 音声符号化方法及び装置、並びに可聴信号符号化方法及び装置
US5960389A (en) 1996-11-15 1999-09-28 Nokia Mobile Phones Limited Methods for generating comfort noise during discontinuous transmission
JPH10214100A (ja) 1997-01-31 1998-08-11 Sony Corp 音声合成方法
US6134518A (en) 1997-03-04 2000-10-17 International Business Machines Corporation Digital audio signal coding using a CELP coder and a transform coder
JP3223966B2 (ja) 1997-07-25 2001-10-29 日本電気株式会社 音声符号化/復号化装置
US6070137A (en) 1998-01-07 2000-05-30 Ericsson Inc. Integrated frequency-domain voice coding using an adaptive spectral enhancement filter
EP0932141B1 (en) 1998-01-22 2005-08-24 Deutsche Telekom AG Method for signal controlled switching between different audio coding schemes
GB9811019D0 (en) 1998-05-21 1998-07-22 Univ Surrey Speech coders
US6173257B1 (en) 1998-08-24 2001-01-09 Conexant Systems, Inc Completed fixed codebook for speech encoder
US6439967B2 (en) * 1998-09-01 2002-08-27 Micron Technology, Inc. Microelectronic substrate assembly planarizing machines and methods of mechanical and chemical-mechanical planarization of microelectronic substrate assemblies
SE521225C2 (sv) 1998-09-16 2003-10-14 Ericsson Telefon Ab L M Förfarande och anordning för CELP-kodning/avkodning
US6317117B1 (en) 1998-09-23 2001-11-13 Eugene Goff User interface for the control of an audio spectrum filter processor
US7272556B1 (en) 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
US7124079B1 (en) 1998-11-23 2006-10-17 Telefonaktiebolaget Lm Ericsson (Publ) Speech coding with comfort noise variability feature for increased fidelity
FI114833B (fi) 1999-01-08 2004-12-31 Nokia Corp Menetelmä, puhekooderi ja matkaviestin puheenkoodauskehysten muodostamiseksi
DE19921122C1 (de) * 1999-05-07 2001-01-25 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Verschleiern eines Fehlers in einem codierten Audiosignal und Verfahren und Vorrichtung zum Decodieren eines codierten Audiosignals
CN1145928C (zh) 1999-06-07 2004-04-14 艾利森公司 用参数噪声模型统计量产生舒适噪声的方法及装置
JP4464484B2 (ja) 1999-06-15 2010-05-19 パナソニック株式会社 雑音信号符号化装置および音声信号符号化装置
US6236960B1 (en) 1999-08-06 2001-05-22 Motorola, Inc. Factorial packing method and apparatus for information coding
US6636829B1 (en) * 1999-09-22 2003-10-21 Mindspeed Technologies, Inc. Speech communication system and method for handling lost frames
KR100711047B1 (ko) 2000-02-29 2007-04-24 퀄컴 인코포레이티드 폐루프 멀티모드 혼합영역 선형예측 (mdlp) 음성 코더
JP2002118517A (ja) 2000-07-31 2002-04-19 Sony Corp 直交変換装置及び方法、逆直交変換装置及び方法、変換符号化装置及び方法、並びに復号装置及び方法
FR2813722B1 (fr) * 2000-09-05 2003-01-24 France Telecom Procede et dispositif de dissimulation d'erreurs et systeme de transmission comportant un tel dispositif
US6847929B2 (en) 2000-10-12 2005-01-25 Texas Instruments Incorporated Algebraic codebook system and method
CA2327041A1 (en) 2000-11-22 2002-05-22 Voiceage Corporation A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals
US20050130321A1 (en) 2001-04-23 2005-06-16 Nicholson Jeremy K. Methods for analysis of spectral data and their applications
KR100464369B1 (ko) 2001-05-23 2005-01-03 삼성전자주식회사 음성 부호화 시스템의 여기 코드북 탐색 방법
US20020184009A1 (en) 2001-05-31 2002-12-05 Heikkinen Ari P. Method and apparatus for improved voicing determination in speech signals containing high levels of jitter
US20030120484A1 (en) 2001-06-12 2003-06-26 David Wong Method and system for generating colored comfort noise in the absence of silence insertion description packets
US6879955B2 (en) 2001-06-29 2005-04-12 Microsoft Corporation Signal modification based on continuous time warping for low bit rate CELP coding
US6941263B2 (en) 2001-06-29 2005-09-06 Microsoft Corporation Frequency domain postfiltering for quality enhancement of coded speech
US7711563B2 (en) * 2001-08-17 2010-05-04 Broadcom Corporation Method and system for frame erasure concealment for predictive speech coding based on extrapolation of speech waveform
DE10140507A1 (de) 2001-08-17 2003-02-27 Philips Corp Intellectual Pty Verfahren für die algebraische Codebook-Suche eines Sprachsignalkodierers
KR100438175B1 (ko) 2001-10-23 2004-07-01 엘지전자 주식회사 코드북 검색방법
CA2365203A1 (en) 2001-12-14 2003-06-14 Voiceage Corporation A signal modification method for efficient coding of speech signals
US6646332B2 (en) * 2002-01-18 2003-11-11 Terence Quintin Collier Semiconductor package device
CA2388358A1 (en) 2002-05-31 2003-11-30 Voiceage Corporation A method and device for multi-rate lattice vector quantization
CA2388352A1 (en) 2002-05-31 2003-11-30 Voiceage Corporation A method and device for frequency-selective pitch enhancement of synthesized speed
US7302387B2 (en) 2002-06-04 2007-11-27 Texas Instruments Incorporated Modification of fixed codebook search in G.729 Annex E audio coding
DE60303689T2 (de) 2002-09-19 2006-10-19 Matsushita Electric Industrial Co., Ltd., Kadoma Audiodecodierungsvorrichtung und -verfahren
JP2006502426A (ja) 2002-10-11 2006-01-19 ノキア コーポレイション ソース制御された可変ビットレート広帯域音声の符号化方法および装置
US7343283B2 (en) 2002-10-23 2008-03-11 Motorola, Inc. Method and apparatus for coding a noise-suppressed audio signal
US7363218B2 (en) 2002-10-25 2008-04-22 Dilithium Networks Pty. Ltd. Method and apparatus for fast CELP parameter mapping
KR100463419B1 (ko) 2002-11-11 2004-12-23 한국전자통신연구원 적은 복잡도를 가진 고정 코드북 검색방법 및 장치
KR100465316B1 (ko) 2002-11-18 2005-01-13 한국전자통신연구원 음성 부호화기 및 이를 이용한 음성 부호화 방법
KR20040058855A (ko) 2002-12-27 2004-07-05 엘지전자 주식회사 음성 변조 장치 및 방법
US7249014B2 (en) 2003-03-13 2007-07-24 Intel Corporation Apparatus, methods and articles incorporating a fast algebraic codebook search technique
US20050021338A1 (en) 2003-03-17 2005-01-27 Dan Graboi Recognition device and system
WO2004090870A1 (ja) 2003-04-04 2004-10-21 Kabushiki Kaisha Toshiba 広帯域音声を符号化または復号化するための方法及び装置
US7318035B2 (en) 2003-05-08 2008-01-08 Dolby Laboratories Licensing Corporation Audio coding systems and methods using spectral component coupling and spectral component regeneration
ATE486348T1 (de) 2003-06-30 2010-11-15 Koninkl Philips Electronics Nv Verbesserung der qualität von dekodierten audio mittels hinzufügen von geräusch
CA2475282A1 (en) * 2003-07-17 2005-01-17 Her Majesty The Queen In Right Of Canada As Represented By The Minister Of Industry Through The Communications Research Centre Volume hologram
US20050091041A1 (en) 2003-10-23 2005-04-28 Nokia Corporation Method and system for speech coding
US20050091044A1 (en) 2003-10-23 2005-04-28 Nokia Corporation Method and system for pitch contour quantization in audio coding
RU2374703C2 (ru) 2003-10-30 2009-11-27 Конинклейке Филипс Электроникс Н.В. Кодирование или декодирование аудиосигнала
SE527669C2 (sv) * 2003-12-19 2006-05-09 Ericsson Telefon Ab L M Förbättrad felmaskering i frekvensdomänen
DE102004007200B3 (de) * 2004-02-13 2005-08-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiocodierung
CA2457988A1 (en) 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
FI118834B (fi) 2004-02-23 2008-03-31 Nokia Corp Audiosignaalien luokittelu
FI118835B (fi) 2004-02-23 2008-03-31 Nokia Corp Koodausmallin valinta
JP4744438B2 (ja) * 2004-03-05 2011-08-10 パナソニック株式会社 エラー隠蔽装置およびエラー隠蔽方法
WO2005096274A1 (fr) 2004-04-01 2005-10-13 Beijing Media Works Co., Ltd Dispositif et procede de codage/decodage audio ameliores
GB0408856D0 (en) 2004-04-21 2004-05-26 Nokia Corp Signal encoding
CN1954364B (zh) 2004-05-17 2011-06-01 诺基亚公司 带有不同编码帧长度的音频编码
US7649988B2 (en) 2004-06-15 2010-01-19 Acoustic Technologies, Inc. Comfort noise generator using modified Doblinger noise estimate
US8160274B2 (en) 2006-02-07 2012-04-17 Bongiovi Acoustics Llc. System and method for digital signal processing
US7630902B2 (en) 2004-09-17 2009-12-08 Digital Rise Technology Co., Ltd. Apparatus and methods for digital audio coding using codebook application ranges
KR100656788B1 (ko) 2004-11-26 2006-12-12 한국전자통신연구원 비트율 신축성을 갖는 코드벡터 생성 방법 및 그를 이용한 광대역 보코더
TWI253057B (en) 2004-12-27 2006-04-11 Quanta Comp Inc Search system and method thereof for searching code-vector of speech signal in speech encoder
BRPI0607251A2 (pt) 2005-01-31 2017-06-13 Sonorit Aps método para concatenar um primeiro quadro de amostras e um segundo quadro subseqüente de amostras, código de programa executável por computador, dispositivo de armazenamento de programa, e, arranjo para receber um sinal de áudio digitalizado
US20070147518A1 (en) 2005-02-18 2007-06-28 Bruno Bessette Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX
US8155965B2 (en) 2005-03-11 2012-04-10 Qualcomm Incorporated Time warping frames inside the vocoder by modifying the residual
KR100982638B1 (ko) 2005-04-01 2010-09-15 콸콤 인코포레이티드 고대역 시간 왜곡을 위한 시스템들, 방법들, 및 장치들
WO2006126844A2 (en) 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding an audio signal
US7707034B2 (en) 2005-05-31 2010-04-27 Microsoft Corporation Audio codec post-filter
RU2296377C2 (ru) 2005-06-14 2007-03-27 Михаил Николаевич Гусев Способ анализа и синтеза речи
JP2008546341A (ja) 2005-06-18 2008-12-18 ノキア コーポレイション 非連続音声送信の際の擬似背景ノイズパラメータ適応送信のためのシステム及び方法
KR100851970B1 (ko) 2005-07-15 2008-08-12 삼성전자주식회사 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치
US7610197B2 (en) 2005-08-31 2009-10-27 Motorola, Inc. Method and apparatus for comfort noise generation in speech communication systems
RU2312405C2 (ru) 2005-09-13 2007-12-10 Михаил Николаевич Гусев Способ осуществления машинной оценки качества звуковых сигналов
US7953605B2 (en) * 2005-10-07 2011-05-31 Deepen Sinha Method and apparatus for audio encoding and decoding using wideband psychoacoustic modeling and bandwidth extension
US7720677B2 (en) 2005-11-03 2010-05-18 Coding Technologies Ab Time warped modified transform coding of audio signals
WO2007080211A1 (en) 2006-01-09 2007-07-19 Nokia Corporation Decoding of binaural audio signals
MX2008009088A (es) 2006-01-18 2009-01-27 Lg Electronics Inc Aparato y metodo para codificar y descodificar señal.
CN101371296B (zh) 2006-01-18 2012-08-29 Lg电子株式会社 用于编码和解码信号的设备和方法
US8032369B2 (en) 2006-01-20 2011-10-04 Qualcomm Incorporated Arbitrary average data rates for variable rate coders
US7668304B2 (en) * 2006-01-25 2010-02-23 Avaya Inc. Display hierarchy of participants during phone call
FR2897733A1 (fr) 2006-02-20 2007-08-24 France Telecom Procede de discrimination et d'attenuation fiabilisees des echos d'un signal numerique dans un decodeur et dispositif correspondant
FR2897977A1 (fr) * 2006-02-28 2007-08-31 France Telecom Procede de limitation de gain d'excitation adaptative dans un decodeur audio
US20070253577A1 (en) 2006-05-01 2007-11-01 Himax Technologies Limited Equalizer bank with interference reduction
US7873511B2 (en) 2006-06-30 2011-01-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
JP4810335B2 (ja) 2006-07-06 2011-11-09 株式会社東芝 広帯域オーディオ信号符号化装置および広帯域オーディオ信号復号装置
WO2008007700A1 (fr) * 2006-07-12 2008-01-17 Panasonic Corporation Dispositif de décodage de son, dispositif de codage de son, et procédé de compensation de trame perdue
EP2040251B1 (en) * 2006-07-12 2019-10-09 III Holdings 12, LLC Audio decoding device and audio encoding device
US7933770B2 (en) 2006-07-14 2011-04-26 Siemens Audiologische Technik Gmbh Method and device for coding audio data based on vector quantisation
CN102096937B (zh) 2006-07-24 2014-07-09 索尼株式会社 毛发运动合成器系统和用于毛发/皮毛流水线的优化技术
US7987089B2 (en) 2006-07-31 2011-07-26 Qualcomm Incorporated Systems and methods for modifying a zero pad region of a windowed frame of an audio signal
EP2054877B1 (en) * 2006-08-15 2011-10-26 Broadcom Corporation Updating of decoder states after packet loss concealment
US7877253B2 (en) * 2006-10-06 2011-01-25 Qualcomm Incorporated Systems, methods, and apparatus for frame erasure recovery
DE102006049154B4 (de) 2006-10-18 2009-07-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kodierung eines Informationssignals
USRE50009E1 (en) 2006-10-25 2024-06-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating audio subband values and apparatus and method for generating time-domain audio samples
US8468015B2 (en) * 2006-11-10 2013-06-18 Panasonic Corporation Parameter decoding device, parameter encoding device, and parameter decoding method
JP5171842B2 (ja) 2006-12-12 2013-03-27 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 時間領域データストリームを表している符号化および復号化のための符号器、復号器およびその方法
FR2911228A1 (fr) 2007-01-05 2008-07-11 France Telecom Codage par transformee, utilisant des fenetres de ponderation et a faible retard.
KR101379263B1 (ko) 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
FR2911426A1 (fr) 2007-01-15 2008-07-18 France Telecom Modification d'un signal de parole
US7873064B1 (en) * 2007-02-12 2011-01-18 Marvell International Ltd. Adaptive jitter buffer-packet loss concealment
JP4708446B2 (ja) 2007-03-02 2011-06-22 パナソニック株式会社 符号化装置、復号装置およびそれらの方法
US8306813B2 (en) 2007-03-02 2012-11-06 Panasonic Corporation Encoding device and encoding method
JP5596341B2 (ja) * 2007-03-02 2014-09-24 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 音声符号化装置および音声符号化方法
JP2008261904A (ja) * 2007-04-10 2008-10-30 Matsushita Electric Ind Co Ltd 符号化装置、復号化装置、符号化方法および復号化方法
US8630863B2 (en) 2007-04-24 2014-01-14 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding audio/speech signal
CN101388210B (zh) 2007-09-15 2012-03-07 华为技术有限公司 编解码方法及编解码器
US9653088B2 (en) 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
KR101513028B1 (ko) 2007-07-02 2015-04-17 엘지전자 주식회사 방송 수신기 및 방송신호 처리방법
US8185381B2 (en) 2007-07-19 2012-05-22 Qualcomm Incorporated Unified filter bank for performing signal conversions
CN101110214B (zh) 2007-08-10 2011-08-17 北京理工大学 一种基于多描述格型矢量量化技术的语音编码方法
US8428957B2 (en) 2007-08-24 2013-04-23 Qualcomm Incorporated Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands
ES2823560T3 (es) 2007-08-27 2021-05-07 Ericsson Telefon Ab L M Análisis/síntesis espectral de baja complejidad utilizando resolución temporal seleccionable
JP4886715B2 (ja) 2007-08-28 2012-02-29 日本電信電話株式会社 定常率算出装置、雑音レベル推定装置、雑音抑圧装置、それらの方法、プログラム及び記録媒体
WO2009033288A1 (en) 2007-09-11 2009-03-19 Voiceage Corporation Method and device for fast algebraic codebook search in speech and audio coding
CN100524462C (zh) * 2007-09-15 2009-08-05 华为技术有限公司 对高带信号进行帧错误隐藏的方法及装置
US8576096B2 (en) 2007-10-11 2013-11-05 Motorola Mobility Llc Apparatus and method for low complexity combinatorial coding of signals
KR101373004B1 (ko) 2007-10-30 2014-03-26 삼성전자주식회사 고주파수 신호 부호화 및 복호화 장치 및 방법
CN101425292B (zh) 2007-11-02 2013-01-02 华为技术有限公司 一种音频信号的解码方法及装置
DE102007055830A1 (de) 2007-12-17 2009-06-18 Zf Friedrichshafen Ag Verfahren und Vorrichtung zum Betrieb eines Hybridantriebes eines Fahrzeuges
CN101483043A (zh) 2008-01-07 2009-07-15 中兴通讯股份有限公司 基于分类和排列组合的码本索引编码方法
CN101488344B (zh) 2008-01-16 2011-09-21 华为技术有限公司 一种量化噪声泄漏控制方法及装置
DE102008015702B4 (de) 2008-01-31 2010-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
US8000487B2 (en) 2008-03-06 2011-08-16 Starkey Laboratories, Inc. Frequency translation by high-frequency spectral envelope warping in hearing assistance devices
FR2929466A1 (fr) 2008-03-28 2009-10-02 France Telecom Dissimulation d'erreur de transmission dans un signal numerique dans une structure de decodage hierarchique
EP2107556A1 (en) 2008-04-04 2009-10-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio transform coding using pitch correction
US8768690B2 (en) 2008-06-20 2014-07-01 Qualcomm Incorporated Coding scheme selection for low-bit-rate applications
PT2410522T (pt) 2008-07-11 2018-01-09 Fraunhofer Ges Forschung Codificador de sinal de áudio, método para codificar um sinal de áudio e programa de computador
PL2346029T3 (pl) 2008-07-11 2013-11-29 Fraunhofer Ges Forschung Koder sygnału audio, sposób kodowania sygnału audio i odpowiadający mu program komputerowy
ES2683077T3 (es) 2008-07-11 2018-09-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada
MY154452A (en) 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
EP2144230A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
CA2730355C (en) 2008-07-11 2016-03-22 Guillaume Fuchs Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme
WO2010003563A1 (en) 2008-07-11 2010-01-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder for encoding and decoding audio samples
US8352279B2 (en) 2008-09-06 2013-01-08 Huawei Technologies Co., Ltd. Efficient temporal envelope coding approach by prediction between low band signal and high band signal
WO2010031049A1 (en) 2008-09-15 2010-03-18 GH Innovation, Inc. Improving celp post-processing for music signals
US8798776B2 (en) 2008-09-30 2014-08-05 Dolby International Ab Transcoding of audio metadata
DE102008042579B4 (de) * 2008-10-02 2020-07-23 Robert Bosch Gmbh Verfahren zur Fehlerverdeckung bei fehlerhafter Übertragung von Sprachdaten
EP3640941A1 (en) 2008-10-08 2020-04-22 Fraunhofer Gesellschaft zur Förderung der Angewand Multi-resolution switched audio encoding/decoding scheme
KR101315617B1 (ko) 2008-11-26 2013-10-08 광운대학교 산학협력단 모드 스위칭에 기초하여 윈도우 시퀀스를 처리하는 통합 음성/오디오 부/복호화기
CN101770775B (zh) 2008-12-31 2011-06-22 华为技术有限公司 信号处理方法及装置
ES2904373T3 (es) 2009-01-16 2022-04-04 Dolby Int Ab Transposición armónica mejorada de producto cruzado
JP2012516462A (ja) 2009-01-28 2012-07-19 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ オーディオエンコーダ、オーディオデコーダ、符号化されたオーディオ情報、オーディオ信号を符号化および復号化する方法およびコンピュータ・プログラム
US8457975B2 (en) 2009-01-28 2013-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program
EP2214165A3 (en) 2009-01-30 2010-09-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for manipulating an audio signal comprising a transient event
CN103366755B (zh) 2009-02-16 2016-05-18 韩国电子通信研究院 对音频信号进行编码和解码的方法和设备
ES2374486T3 (es) 2009-03-26 2012-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dispositivo y método para manipular una señal de audio.
KR20100115215A (ko) 2009-04-17 2010-10-27 삼성전자주식회사 가변 비트율 오디오 부호화 및 복호화 장치 및 방법
EP3352168B1 (en) 2009-06-23 2020-09-16 VoiceAge Corporation Forward time-domain aliasing cancellation with application in weighted or original signal domain
CN101958119B (zh) 2009-07-16 2012-02-29 中兴通讯股份有限公司 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法
CA2778382C (en) 2009-10-20 2016-01-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio signal encoder, audio signal decoder, method for encoding or decoding an audio signal using an aliasing-cancellation
BR122020024243B1 (pt) 2009-10-20 2022-02-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E. V. Codificador de sinal de áudio, decodificador de sinal de áudio, método para prover uma representação codificada de um conteúdo de áudio e método para prover uma representação decodificada de um conteúdo de áudio.
TWI455114B (zh) 2009-10-20 2014-10-01 Fraunhofer Ges Forschung 多模式音訊編解碼器及其適用碼簿激發線性預測編碼技術
CN102081927B (zh) 2009-11-27 2012-07-18 中兴通讯股份有限公司 一种可分层音频编码、解码方法及系统
US8423355B2 (en) 2010-03-05 2013-04-16 Motorola Mobility Llc Encoder for audio signal including generic audio and speech frames
US8428936B2 (en) 2010-03-05 2013-04-23 Motorola Mobility Llc Decoder for audio signal including generic audio and speech frames
CN103069484B (zh) 2010-04-14 2014-10-08 华为技术有限公司 时/频二维后处理
WO2011147950A1 (en) 2010-05-28 2011-12-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low-delay unified speech and audio codec
EP2676262B1 (en) 2011-02-14 2018-04-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Noise generation in audio codecs
AR085362A1 (es) 2011-02-14 2013-09-25 Fraunhofer Ges Forschung Aparato y metodo para procesar una señal de audio decodificada en un dominio espectral

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6757654B1 (en) * 2000-05-11 2004-06-29 Telefonaktiebolaget Lm Ericsson Forward error correction in speech coding
US20050154584A1 (en) * 2002-05-31 2005-07-14 Milan Jelinek Method and device for efficient frame erasure concealment in linear predictive based speech codecs
TW200703234A (en) * 2005-01-31 2007-01-16 Qualcomm Inc Frame erasure concealment in voice communications
TW200729156A (en) * 2005-12-19 2007-08-01 Dolby Lab Licensing Corp Improved correlating and decorrelating transforms for multiple description coding systems
WO2007073604A1 (en) * 2005-12-28 2007-07-05 Voiceage Corporation Method and device for efficient frame erasure concealment in speech codecs
TW200943792A (en) * 2008-04-15 2009-10-16 Qualcomm Inc Channel decoding-based error detection

Also Published As

Publication number Publication date
JP5849106B2 (ja) 2016-01-27
US9384739B2 (en) 2016-07-05
CN103620672A (zh) 2014-03-05
HK1191130A1 (zh) 2014-07-18
MY167853A (en) 2018-09-26
CA2827000C (en) 2016-04-05
SG192734A1 (en) 2013-09-30
EP2661745A1 (en) 2013-11-13
MX2013009301A (es) 2013-12-06
EP2661745B1 (en) 2015-04-08
RU2013142135A (ru) 2015-03-27
KR101551046B1 (ko) 2015-09-07
RU2630390C2 (ru) 2017-09-07
ES2539174T3 (es) 2015-06-26
PL2661745T3 (pl) 2015-09-30
BR112013020324A2 (pt) 2018-07-10
AR085218A1 (es) 2013-09-18
WO2012110447A1 (en) 2012-08-23
CA2827000A1 (en) 2012-08-23
BR112013020324B1 (pt) 2021-06-29
JP2014506687A (ja) 2014-03-17
AU2012217215B2 (en) 2015-05-14
KR20140005277A (ko) 2014-01-14
US20130332152A1 (en) 2013-12-12
ZA201306499B (en) 2014-05-28
TW201248616A (en) 2012-12-01
CN103620672B (zh) 2016-04-27
BR112013020324B8 (pt) 2022-02-08
AU2012217215A1 (en) 2013-08-29

Similar Documents

Publication Publication Date Title
TWI484479B (zh) 用於低延遲聯合語音及音訊編碼中之錯誤隱藏之裝置和方法
AU2017265038B2 (en) Audio decoder and method for providing a decoded audio information using an error concealment based on a time domain excitation signal
US8428938B2 (en) Systems and methods for reconstructing an erased speech frame
US10290308B2 (en) Audio decoder and method for providing a decoded audio information using an error concealment modifying a time domain excitation signal
US8473301B2 (en) Method and apparatus for audio decoding
US7877253B2 (en) Systems, methods, and apparatus for frame erasure recovery
CN113544773B (zh) 用于lc3隐藏的解码器和解码方法
JP2007065679A (ja) 音声復号器におけるフレームエラー隠蔽に対する改善されたスペクトルパラメータ代替
KR102192999B1 (ko) 적절히 디코딩된 오디오 프레임의 디코딩된 표현의 특성을 사용하는 에러 은닉 유닛, 오디오 디코더, 및 관련 방법과 컴퓨터 프로그램
JP2018511086A (ja) オーディオ信号を符号化するためのオーディオエンコーダー及び方法
Mertz et al. Voicing controlled frame loss concealment for adaptive multi-rate (AMR) speech frames in voice-over-IP.