TW201248616A - Apparatus and method for error concealment in low-delay unified speech and audio coding - Google Patents

Apparatus and method for error concealment in low-delay unified speech and audio coding Download PDF

Info

Publication number
TW201248616A
TW201248616A TW101104539A TW101104539A TW201248616A TW 201248616 A TW201248616 A TW 201248616A TW 101104539 A TW101104539 A TW 101104539A TW 101104539 A TW101104539 A TW 101104539A TW 201248616 A TW201248616 A TW 201248616A
Authority
TW
Taiwan
Prior art keywords
value
spectral
frame
values
audio
Prior art date
Application number
TW101104539A
Other languages
English (en)
Other versions
TWI484479B (zh
Inventor
Jeremie Lecomte
Martin Dietz
Michael Schnabel
Ralph Sperschneider
Original Assignee
Fraunhofer Ges Forschung
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Ges Forschung filed Critical Fraunhofer Ges Forschung
Publication of TW201248616A publication Critical patent/TW201248616A/zh
Application granted granted Critical
Publication of TWI484479B publication Critical patent/TWI484479B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/03Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • G10L19/107Sparse pulse excitation, e.g. by using algebraic codebook
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • G10L19/13Residual excited linear prediction [RELP]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Detection And Prevention Of Errors In Transmission (AREA)

Description

201248616 六、發明說明: 【發明所屬技術領域】 本發明係與音訊信號處理有關,以及係特別論及一種 用於低延遲聯合語音及音訊編碼中之錯誤隱藏的裝置和方 法(LD-USAC)。 Γ Jl 音訊信號處理’已有多方面之進步,以及係變得益形 重要。在音訊信號處理中,低延遲聯合語音和編碼,係旨 在提供一些適用於音訊、語音、和語音與音訊之任何混合 的編碼技術。此外,LD-USAC旨在確保一個有關該編碼成 之音訊信號的高品質。相較於USAC(聯合語音和音訊編 碼),LD-USAC中之延遲會被降低。 當編碼音訊資料時,一個LD-USAC編碼器,會檢查該 要被編碼之音訊信號。該LD-USAC編碼器,係藉由編碼— 個預測濾波器之線性預測性濾波器係數’來編碼該音訊信 號。依據上述要被一個特定之音訊訊框編碼的音訊資料, 該LD-USAC編碼器會決定,是否要使用ACELP(先進碼激式 線性預測)來編碼,或者該音訊資料,是否要使用TCX(變換 編碼激勵)來編碼《雖然ACEL使用了 LP濾波器係數(線性預 測性濾波器係數)、適性碼本指標、和代數碼本指標、和適 性與代數碼本增益,TCX係使用一些有關一個修飾式離散 餘弦變換(MDCT)之LP濾波器係數、能量參數、和量化指標。 在該解碼器側上面,該LD-USAC解碼器會決定,已被 採用來編碼一個當前之音訊信號訊框的音訊資料者,係 201248616 ACELP或TCX。該解碼器接著會據此來解碼該音訊信號訊 框。 有時,資訊傳輸會失敗。舉例而言,_個傳送器所傳 輸之音訊信號訊框,係正帶有錯誤而到達一個接收器,戈 者全然未到達,或者該訊框延遲到達。 在此等情況中,錯誤隱藏可能會變為有必要,以確保 漏失的或錯誤的音訊資料可被取代。此就一些具有實時規 範之應用而言係特別真確,因為請求重新傳輸該有錯誤或 漏失之訊框’或許可能會違反一些低延遲規範。 然而’其他音訊應用所使用之現有隱藏技術,經常會 建立因一些合成假像所造成之人為音訊。 C 明内容;3 所以,本發明的一個目的,旨在就一個音訊信號訊框 有關之錯誤隱藏’提供一些改進之觀念。本發明之目的在 解決上’係藉由如申請專利範圍第丨項之裝置,藉由如申請 專利範圍第15項之方法,以及藉由如申請專利範圍第16項 之電腦程式。 有一個就音訊信號產生一些頻譜取代值之裝置提供。 此種裝置包含一個緩衝器單元,其可儲存一些有關一個先 前接收無誤之音訊訊框的先前之頻譜值。此外,該裝置包 含一個隱藏訊框產生器,其可在一個當前之音訊訊框並未 被接收到或有錯誤時,產生該等頻譜取代值。該先前接收 無誤之音訊訊框,包含有濾波器資訊,此濾波器資訊,係 與一個可表示一個預測濾波器之穩定性的濾波器穩定性值 4 201248616 相聯結。該隱藏訊框產生器經調適,可基於該等先前之頻 譜值,以及基於該濾波器穩定性值,來產生該等頻譜取代 值。 本發明基於之發現是,雖然一個先前接收無誤之訊框 的先前之頻譜值,可能會被用作錯誤隱藏,針對此等值, 應有一個漸隱被實施,以及該漸隱應取決於該信號之穩定 性。一個信號愈不穩定,該漸隱之實施便應愈快。 在一個實施例中’該隱藏訊框產生器經調適,可能藉 由隨機顛舰前之賴制符號,來產生料賴取代值。 依據又一個實施例,該隱藏訊框產生器經配置,可能 藉由在該濾波器穩定性值,具有一個第一值時,使每個先 前之頻譜值,乘以-個第-增錢數,以及在該遽波器穩 定性值’具有-個小於該第_值之第二值時,使每個先前 之頻譜值,乘以-㈣二增益因數,來產生該等頻譜取代 值。 在另一個實施例令,該隱藏訊框產生器經調適,可能 基於S亥濾波器穩定性值,來產生該等頻譜取代值,其中, 遠先刖接收無誤之音訊訊框,包含該預測遽波器之第一預 測性濾波器係數’其中,該先前接收無誤之音訊訊框的前 趨訊框’包含-些第二預測性渡波器係數,以及其中,該 滤波器穩定性值,係取決於該第一預測性渡波器係數,以 及取決於該第二預測性濾波器係數。 依據一個實施例,該隱藏訊框產生器經調適,可能基 於該先前接收無誤之音訊訊框的第—預測性遽波器係數, 201248616 以及基於該先前接收無誤之音訊訊框的前趨訊框之第二預 測性過遽器係數’來決定該滤波器穩定性值。 在另一實施例中,該隱藏訊框產生器經調適,可能基 於該濾波器穩定性值’來產生該等頻譜取代值,其中,該 濾波器穩定性值,係取決於一個距離計量LSFdist,以及其 中’該距離计量LSFdiSt在定義上,係藉由公式: LSFdist=±(fi-f^f <=〇 其中,U+1指明該先前接收無誤之音訊訊框的第一預測 性濾波器係數之總數,以及其中,U+1亦指明該先前接收無 誤之音訊訊框的前趨訊框之第二預測性濾波器係數的總 數,其中,力指明該等第一預測性濾波器係數的第i個濾波 器係數’以及其中,/;⑷指明該等第二預測性驗器係數的 第i個濾波器係數。 依據一個實施例,該隱藏訊框產生器經調適,可能進 -步基於與該先前接收狀無誤音訊訊框相關的訊框類 別資訊’來產生料觸取代值,例而言,該訊框類別 資訊指出,縣前接收無誤之音訊訊框,會被分類為,,人為 肇端"、"肇端·,、"有聲變遷,,、,,無聲變遷,,、”無聲或有聲,,。 在另一實施例中,該隱藏訊框產生器經調適,可能自 有個最後之無s吳音訊訊框,已到達該接收器起,進一步 基於若干未到達-個接收器處或有錯誤之連續訊框,來產 生該等頻譜取代值,其中,自該最後無誤之音訊訊框,已 到達該接收轉’並無其他無誤之音訊訊框,到達該接收 6 201248616 器處。 ^ 乃—貫施例,該隱藏訊框產生器經調適,可能計 個漸隱因數,以及可能基於該濾波器穩定性值,以及 土於未到達該接收器處或有錯誤之連續訊框的數目。此 °亥^藏訊框產生器經調適’可能藉由使該漸隱因數’ 11 乂至> 某些先前之頻譜值,或者乘以至少某一群組之中 1值的某些值,來產生該等頻譜取代值,其中,每個中間 值’係取決於至少—贿前之頻譜值。 在又一個實施例中,該隱藏訊框產生器經調適,玎能 於"亥等先前之頻譜值、基於該濾波器穩定性值、以及亦 土、—個時域雜訊修整之預測增益,來產生該等頻譜取代 值。 ^丄依據又一實施例,有一個音訊信號解碼器提供❶該音 =破解碼’可能包含m解碼彼等頻譜音訊信號 值之裝置,和一個依據上文所說明的一個實施例用以產生 -頻&取代值之裝置。上述用以解碼頻譜音訊信號值之 裝置經調適’可能基於一個先前接收無誤之音訊訊框,來 解碼—個音訊信號之頻譜值。此外,上述用以解碼頻谱音 ^信號值之裝置進-步經調適,可能將該音訊信號之頻譜 ’儲存進上述用以纽頻譜取代值之裝置的緩衝器單元 ^上述^產生頻譜取魏之裝置經調適,可能在一個 1之音訊訊框未被接收到或有錯誤時,祕該緩衝器抑 疋内所儲存之頻譜值,來產生該等頻譜取代值。 早 此外,有-個依據另-個實施例之音訊信號解碼器提 201248616 供。該音訊信號解碼器,包含—個用以基於_個接收無誤 之音訊訊框來產生-些第一中間頻譜值的解碼器單元、一 個用以針對該等第—中間頻譜值來實施時域雜訊修整而得 到-些第二中間頻譜值之時域雜訊修整單元、—個用以依 據該等第-中間頻|普值和該等第二中間頻譜值來計算該時 域雜訊修整的’預測增益之預測增益計算器、一個用以 在-個當前之音IfUfL縣被接㈣或枝辦依據上文所 說明之實施例來產生-些頻譜取代值的裝置和—個值選 擇器’其可在該_增益大於或等於—舰界值時 等第-中間頻譜值,儲存進上述用以產生_些頻譜取代值 之裝置的緩衝n單元内’或者可在該預測增益小於該臨界 值時,將該等第二中間頻譜值,儲存進上述用以產生一些 頻譜取代值之裝置的緩衝器單元内。 一 此外,依據另—實施例,有另一個音訊信號解碼器提 供。該音訊信_碼!!,包含—㈣以基於—個接收無誤 之音訊訊框來產生-些產生成之頻譜值的第—解碼器模 組、-個用以依據上文所說明之實施例來產生一些頻譜取 代值的裝置、和以處理料產生成之頻譜值的處理 模組’其係藉由實施時域雜訊修整、應用雜訊充填、以及 /或者應用-個全局増益,來得到該解碼成之音訊信號的 頻4音雜。上述用以產生頻譜取代值之裝置經調適,可 >=*產生1頻》日取代值,以及在一個當前之訊框並未被接 收到或有錯誤時,將彼等饋進該處理模組内。 有些較佳之實施例’將會提供在賴中請專利範圍中。 8 201248616 圖式簡單說明 下文中,本發明之較佳實施例,將參照所附諸圖加以 說明,其中: 第1圖例示依據一個實施例就一個音訊信號取得一些 頻譜·取代值的一個裝置; 第2圖例示另一個實施例就一個音訊信號取得一些頻 言普取代值之裝置; 第3a-3c圖例示依據一個實施例的一個增益因數與先前 之頻譜值的乘法運算; 第4 a圖例示一個包含某一在一個時域中之肇端的信號 部分之重複性; 第4b圖例示一個時域中之穩定信號部分的重複性; 第5a-5b圖例示一些範例,其中,依據—個實施例,一 些產生成之増益因數,係應用至第3a圖之頻譜值; 第6圖例示依據一個實施例之音訊信號解碼器; 第7圖例示依據另一實施例之音訊信號解碼器;而 第8圖則例示依據又一個實施例之音訊信號解碼器。 【實施方式】 第1圖例示一個用以就一個音訊信號產生一些頻譜取 代值之裝_置1〇〇。此種裝置1〇〇包含一個緩衝器單元U〇,其 可儲存一些與—個先前接收無誤之音訊訊框相關的先前之 頻譜值。此外,該裝置100包含一個隱藏訊框產生器12〇, 其可在一個當前之音訊訊框並未被接收到或有錯誤時,產 生該等頻譜取代值。該先前接收無誤之音訊訊框,包含有 201248616 濾波器資訊,此濾波器資訊,係與一個可表示一個預測濾 波器之穩定性的濾波器穩定性值相聯結。該隱藏訊框產生 器120經調適,可基於該等先前之頻譜值,以及基於該濾波 器穩定性值,來產生該等頻譜取代值。 該先前接收無誤之音訊訊框,舉例而言,可能包含該 等先前之頻譜值。舉例而言,該等先前之頻譜值,可能係 包含在上述成某種編碼成之形式的先前接收無誤之音訊訊 框。 或者,該等先前之頻譜值舉例而言,可能為一些可能 已藉由修飾一些包含在該等先前接收無誤之音訊訊框内的 值所產生之值,舉例而言,該音訊信號之頻譜值。舉例而 言,上述先前接收無誤之音訊訊框内所包含的值,可能已 藉由使彼等各乘以一個增益因數,得到該等先前之頻譜 值,而加以修飾。 或者,該等先前之頻譜價值,舉例而言,可能為一些 可能已基於一些包含在該等先前接收無誤之音訊訊框内的 值而產生出之值。舉例而言,每個先前之頻譜值,可能已 藉由採用至少某些包含在該先前接收無誤之音訊訊框内的 值產生出,以致於每個先前之頻譜值,係取決於至少某些 包含在該先前接收無誤之音訊訊框内的值。舉例而言,該 先前接收無誤之音訊訊框内所包含的值,可能已被用來產 生一個中間信號。舉例而言,上述產生出之中間信號的頻 譜值,可能會被視為上述有關該先前接收無誤之音訊訊框 的先前之頻譜值。 10 201248616 箭頭ι〇5指明的是,該等先前之頻譜值,為儲存在該緩 衝器單元110中。 该隱藏訊框產生II12G’在—個當前之音訊訊框,並未 被及時接收到或有錯誤時,可能會產生該等頻譜取代值。 舉例而言,-個發㈣,可能傳送—個#前之音訊訊框, 給一個接收器’其中舉例而言,可能會設置上述用以得到 頻譜取代值之裝置100。'然而,該當前之音訊訊框 ’並不會 到達該接收n處,舉勤言’由於任何_之傳輸錯誤。 或者’該傳輸之當前音訊訊框,被該接收器接收到,但舉 例而言,由於某種擾亂’舉例而言,在傳輸期間,該當前 之音訊訊㈣有錯誤。在鱗或其他情況中,該隱藏訊框 產生器120 ’就錯誤隱藏而言係有需要。 就此而言’該隱藏訊框產生器12〇經調適,可在一個當 前之音訊訊框並未被接收到或有錯誤時,基於至少某些先 則之頻》’a i τ?ή產生該4頻譜取代值。依據—些實施例, δ亥先别接收無誤之音訊訊框,係假定包含濾波器資料,此 遽波器資訊’係與-個可表示此濾波器資訊所界定之預測 濾波器的穩定性之濾波器穩定性值相聯結。舉例而言,該 音訊訊框,可能包含一些預測性濾波器係數,舉例而言, 線性預測性濾波器係數,而作為濾波器資訊。 該隱藏訊框產生器120進一步經調適,可基於該等先前 之頻譜值,以及基於該濾波器穩定性值,來產生該等頻譜 取代值》 舉例而言,該等頻譜取代值在產生上,可能基於該等 201248616 先前之頻错值,以及基於城波_定性值,其中,每個 該先前之頻譜值,會乘以一個增益因數,其中,該增益因 數之值’係取決於域波_定性值。舉例而言,當該滤 波器穩定性值,在-個第二種情況中,為小於在一個第一 種情況中時,該增㈣數在該第二種情況中,可能會小於 在該第一種情況中。 依據另-實施例,該等頻譜取代值在產生上,可能基 於該等先前之頻譜值’以絲於_刻敎性值…些 中間值在產生上’可能藉由修飾該等先前之頻譜值舉例 而:’藉由隨機顛倒該等切之頻譜值的符號,以及藉由 使每個中間值,乘以—個增益因數,其中,該增益因數之 值’係取決於該遽波器德定性值。舉例而言,當該滤波器 穩疋社值在-個第__種情況中,係小於在—個第一種情 況中時’該增益因數在該第二種情財,可能小於在該第 一種情況中。 依據又-實施例,該等先前之頻譜值,可能會被採用 來產生-個巾恥號,m藉自針㈣巾間㈣,應用一 個線性預職波器,可能產生—個頻域合成信號。接著, 上述產生出之合成信號的每個頻譜值,可能乘以一個增益 因數,其巾’朗仙數之值’錄決於喊波器穩定性 值。誠如上文所示,若該濾波器穩定性值,在一個第二種 情況中’為小於在-個第—種情況中時,該增益因數在該 第二種情況中,可能會小於在該第—種情況中。 茲將洋細解釋一個例示在第2圓中之特定實施例。一個 12 201248616 第況框101,會到達一個 用以取得頻譜取代㈣置10嗔,其中可能設置-個 訊訊框會經檢二在該接收器側上面,該音 訊框,為該音;訊框内個無誤之音訊 個音訊訊框。就此一目的而士 25孔貧料為無誤的— 採用-些構件(未-屮、甘D在接收器側上面’可能 誤。掛V ’其可決定—個接收到之訊框是否無 ^ ^ 二最先進技術水平的錯 7 fl肖如—些可職軸收狀音tflf料是否符 ::個接:到之核對位元或-個接㈣之核對和的::: (1=誤偵測構件’可能採用-個循環冗餘核對 ’來料該接收到之音訊資料,是否符合— =值。任何其他用以測試之技術,亦可能會被採用; 而無确-個接收到之音訊訊框是否為無誤。 該第包含—個音訊資料102。此外, 框,包3 一個核對資料103。舉例而言,哕枋 對資料,可能為-健驗元、1核對和、或—個= 值立其可能會娜时該接收器側上面,關試該接收到 之音訊訊框1岐否為無誤(為—個無誤之訊框)。 若該音訊訊框101已被決定為無誤,則-些與該盈誤 音訊訊框相關聯的值,舉例而言’與該音訊資侧相關= 的值’將會儲存在該緩衝器單,而㈣ ^ 譜值”。此等值舉例而言,可能為上述被編碼在該音2= 内之音則,號的頻譜值。或者,料儲存在上述緩衝器。。 /0内之值’舉例而言’可能為一些用以處理及/或修飾= 13 201248616 音訊訊框内所儲存經編碼之值所成的中間值。或者,一個 L號舉例而。,-個在該頻域中之合成信號,可能係基 於該音訊訊框經編碼之值而產生出,以及該產生成之信號 的頻譜值,可能會料在該_㈣元。將該等先前 之頻譜值’儲存進該缓種f 留-,, 发友衝盗早兀11〇内,係以箭頭105來指 明。 此外’該音訊訊框101之音訊資料繼,係被使用在該 接收器側上面,以解碼上述編碼成之音訊信號(未示出)。上 述已被解碼之音訊«科,接著可能會在祕收器側上 面被重播。 緊接處理音訊訊框101之後,該接收器側,會期待次一 音訊訊框111(亦包含音訊資料112和核對資料113)到達該接 收器側。然而,舉例而言,正當該音訊訊框lu被傳輸(如115 中所顯示)之際,有意外之事發生。此係以116來例示。舉 例而言,可能會有一個連接受到擾亂,以致於該音訊訊框 111之位元,在傳輸期間可能會受到無心之修飾,或者,舉 例而言’該音訊訊框m ’可能全然未到達該接收器側。 在此種情況中’係需要隱藏。舉例而言,當在—個接 收器側上面,重播一個基於接收到之音訊訊框所產生的音 訊信號時’應有一些技術被採用來遮蔽一個漏失之訊框。 舉例而言’應有一些觀念來界定,當一個需要重播之音訊 k號的當刖音§fl §孔框,未到達該接收器側或有錯誤時,鼻 如何動作。 該隱藏訊框產生器120經調適,可提供一些錯誤隱藏。 201248616 在第2圖中’該隱藏訊框產生器12〇會受到通告,一個當前 之訊框並未被接㈣或者為有錯誤。在該接㈣側上面, 可能會採用-些構件(未示出),以指示該隱藏訊框產生器 120,隱藏為有必要(此係藉由虛線箭頭117來顯示)。 為實施錯誤隱藏,該隱藏訊框產生器12G,可能請求某 些或所有與上述來自該緩衝n單元11G之先前接收無誤的 訊框101相關聯之先前的頻譜值,舉例而言,先前之音訊 值。此項凊求係以箭頭118來例示。如同在第2圖之範例中, '亥先則接收無誤之訊框,舉例而言,可能為最後接收無誤 之訊框,舉例而言,音訊訊框1〇1。然而,在該接收器側上 面,亦可能採用一個不同之無誤訊框,而作為先前接收無 誤之訊框。 s玄隱藏訊框產生器,接著會接收上述與來自如119中所 顯不之緩衝器單元110的先前接收無誤之音訊訊框(舉例而 舌,音訊訊框101)相關聯的(某些或所有)之先前的頻譜值。 舉例而言,在多重訊框漏失之情況中,該緩衝器會或完全 或部份地被更新。在一個實施例中,該等由箭頭118和119 所例示之步驟在實現上,在於可能使該隱藏訊框產生器 12〇 ,載入來自該緩衝器單元1丨〇之先前之頻譜值。 該隱藏訊框產生器120,接著會基於至少某些先前之頻 4值,來產生一些頻譜取代值。由此,收聽者應不會變為 知道有一個或多個音訊訊框漏失,以使上述重播所建立之 聲音印象,不會受到擾亂。 有一個達成隱藏之簡單方式,為僅僅使用該等值,舉 15 201248616 例而言,將身為該最後之無誤訊框的頻譜值,作為上述漏 失的或有錯誤的當前訊框之頻譜取代值。 然而,尤其是在肇端之情況中,舉例而言,當聲音音 量突然有了顯著之變化時,會有一些特定之問題存在。舉 例而言,在一個雜訊脈衝串之情況中,僅僅是重複該最後 訊框之先前的頻譜值,該雜訊脈衝串將亦會被重複。 相形之下,若該音訊信號相當穩定,舉例而言,其音 量並無顯著變化,或者,舉例而言,其頻譜值並無顯著變 化,則上述基於該先前接收到之音訊資料而人為產生的當 前音訊信號部分之效應,舉例而言,重複該先前接收到之 音訊信號部分,就一位收聽者而言,或將會失真較少。 有些實施例係基於此項發現。該隱藏訊框產生器120, 係基於至少某些先前之頻譜值,以及基於上述可表示一個 與該音訊信號相關聯之預測濾波器的穩定性之濾波器穩定 性值,灰產生一些頻譜取代值。因此,該隱藏訊框產生器 120,會將該音訊信號之穩定性納入考慮,舉例而言,上述 與該先前接收無誤之訊框相關聯的音訊信號之穩定性。 就此而言,該隱藏訊框產生器120,或可能改變一個應 用至該先前之頻譜值上面的增益因數之值。舉例而言,每 個先前之頻譜值,會乘以該增益因數。此在例示上係參照 第3a-3c圖。 在第3a圖中,係例示在應用一個原始之增益因數前的 一個與先前接收無誤之訊框相關聯的音訊信號之某些頻譜 線。舉例而言,該原始之增益因數,可能為一個在該音訊 16 201248616 訊框内所傳輸之增益因數。在該接收器側上面,若該接收 到之訊框為無錯誤,舉例而言,該解碼器經配置,可能會 以該原始增益因數g,乘上該音訊信號的每個頻譜值,使得 到一個經修飾之頻譜。此係顯示在第北圖中。 在第3b圖中,係說明一些以—個原始之增益因數g乘上 第3a圖之頻譜線所產生的頻譜線。為單純之理由計該原 始增益因數g,係假定為2.0(g=2.0)。第3&和3b圖例示一個已 無須隱藏之實況。 在第3c圖中’係假定-個當前之訊框並未被接收到或 有錯誤的實況。在此-❸兄巾,勢必要有—錄代向量產 生出。就此而言,上述已儲存在—個緩衝器單元内而與先 前接收無誤之訊框相_的先前之頻譜值,可能會被用來 產生該等頻譜取代值。 在第3c圖之範例中,該等頻譜取代值在產生上,係假 定基於該等接收到之值,但該原始増益因數係經修餅過。又 有-個不同而小於第3b圖之情況 接收到之㈣增制數的增益因數,被^產生該等= 取代值的。藉由此,會達成一個漸隱。 ,% 舉例而言,上述使用在第义圖所例 式増益因數,可能為該原始增益因數的75%;舉例= 〇^.〇 = i.5。藉由以該(經縮小)修飾過之増益因 δ 每個頻譜值,可實施一個漸隱, e皿 乘上 值之修飾過的增益因數以5,係小於每個頻譜 乘該等頻讀值之原始增益因數(増益動Λ’’、、=、月/兄中用來 皿致·§ΡΓβν=2·0)。 17 201248616 本發明除其他因數外,所基於的發現是,當該重複性 音訊信號部分不穩定時,比起在該重複性音訊信號部分為 穩定時之情況,重複一個先前接收無誤之訊框的值,係被 感知為失真較多。此係例示在第4a和4b圖中。 舉例而言,若該先前接收無誤之訊框,包含一個肇端, 則該肇端很可能要加以複製。第4a圖例示一個音訊信號部 分,其中,上述與最後接收無誤之訊框相聯結的音訊信號 部分中,有一個暫態發生。在第4a和4b圖中,該橫坐標係 表示時間,該縱坐標係表示該音訊信號之幅度值。 410所指明之信號部分,係與有關最後接收無誤之訊框 相關聯的音訊信號相關。區域420中之虛線係表示,若與該 先前接收無誤之訊框相關聯的值,或將僅僅是被複製,以 及被使用作一個取代訊框之頻譜取代值時,該時域中之曲 線的可能連續線。誠如可見到的是,該收聽者可能會感知 為失真之暫態,很可能要使重複。 相形之下,第4b圖例示該信號為相當穩定的一個範 例。在第4b圖中,係例示一個與該最後接收無誤之訊框相 關聯的音訊信號。在第4b圖之信號部分中,並無暫態發生。 再次地,橫坐標表示時間,縱坐標表示該音訊信號之幅度。 區域430係與上述聯結該最後接收無誤之訊框相關聯的信 號部分。區域440中之虛線係表示,若該先前接收無誤之訊 框的值,或將被複製,以及被使用作一個取代訊框之頻譜 取代值時,該時域中之曲線的可能連續線。在該音訊信號 為相當穩定之此種情況中,相較於如第4a圖中所例示重複 18 201248616 一個肇端之情況中,重複該最後之信號部分,就一個收聽 者而言,似乎是更可被接受。 本發明基於之發現是,彼等頻譜取代值,可能係基於 一個先前之音訊訊框的先前接收到之值來產生,但一個取 決於一個音訊信號部分之穩定性的預測濾波器之穩定性, 亦應加以考慮。就此而言,一個遽波器穩定性值,應被納 入考慮。該慮波器穩定性值,舉例而言,可能表示該預測 濾、波器之穩定性。 在LD-USAC中,該等預測濾波器係數,舉例而言,線 性預測濾波器係數,可能係在一個編碼器側上面被決定, 以及可能會在音訊訊框内,傳送給該接收器。 在該解碼器側上面,該解碼器接著會接收該等預測性 濾波器係數,舉例而言,該先前接收無誤之訊框的預測性 濾波器係數。此外,該解碼器可能早已接收到該先前接收 到之訊框的前趨訊框之預測性濾波器係數,以及舉例而 言,可能已儲存了此等預測性濾波器係數。該先前接收無 誤之訊框的前趨訊框,係緊接該先前接收無誤之訊框前的 訊框。該隱藏訊框產生器,接著可能會基於該先前接收無 誤之訊框的預測性濾波器係數,以及基於該先前接收無誤 之訊框的前趨訊框之預測性過濾器係數,來決定該濾波器 穩定性值。 在下文中,係呈現該濾波器穩定性值之決定,其係依 據一個特別適用於LD-USAC之實施例。所考慮之穩定性 值,係取決於一些預測性濾波器係數,舉例而言,在窄帶 19 201248616 之情況中的Η)個預測性遽波ϋ係數,或者,舉例而言,在 寬帶之情況令的16個預測性濾波 : 共可迠已在一個 ;月’接收無誤之訊框内被傳輸1外,該切接收無誤之 訊框的前趨訊框之制性m餘,亦會被納入考慮, ,例而言,在窄帶之情況_的_進—步預測性據波器係 丈’(或者’舉例而言’在寬帶之情況中的16個 性遽波器係數)。 舉例而言,第k個預測濾波器,可能已在該編碼器側上 面,藉由計算一個自相關,來加以計算,而使: t 八=Σ5’⑻·^("-幻 n=k 其中,S’為一個窗取之語音信號,舉例而言,已針對該語音 信號應用—個窗取後應被編碼之語音信號。t舉例而言可能 為383。或者,t可能具有其他值,諸如191或95。 在其他實施例中,與其計算一個自相關,最先進技術 水平知名之Levinson-Durbin演算法,係可能替代地加以採 用,舉例而言,見, [3]: 3GPP,π語音編解碼器語音處理功能;適性多速率 寬帶(AMR-WB) s吾音編解碼器;轉碼功能’’(speech codec speech processing functions; Adaptive Multi-Rate -Wideband (AMR-WB) speech codec; Transcoding functions" 2009年,V9.0.0,3GPPTS 26.190。 誠如早已陳述的,該等預測性濾波器係數/和/f,可 能已分別在該先前接收無誤之訊框和該先前接收無誤之訊 20 201248616 框的前趨訊框内,傳送給該接收器。 在該解碼器側上面,線頻譜頻率距離計量(LSF距離計 量)LSFdist,接著在計算上可能採用公式: LSFd,,tSf「fiP、f ί=0 U可能為該先前接收無誤之訊框的預測濾波器之數目減1。 舉例而言,若該先前接收無誤之訊框,具有10個預測性濾 波器係數,則舉例而言,u=9。該先前接收無誤之訊框的預 測性濾波器係數之數目,通常係與該先前接收無誤之訊框 的前趨訊框中之預測性濾波器係數的數目相同。 該穩定性值接著在計算上,可能依據公式: Θ = 0 若(1.25-LSFdist/v)<0 Θ = 1 若(1.25-LSFdist/v)> 1 θ= 1.25-LSFdist/ν 0 <(1.25-LSFdist/v)< 1 v可能為一個整數。舉例而言,v在窄帶之情況中,可能為 156250。在另一實施例中,ν在寬帶之情況中,可能為 400000。 若Θ為1或接近1,Θ被視為係表示一個非常穩定之預測 渡波器。 若Θ為0或接近0,Θ被視為係表示一個非常不穩定之預 測渡波器。 該隱藏訊框產生器經調適,在一個當前之音訊訊框, 並未被接收到或有錯誤時,可能基於一個先前接收無誤之 訊框的先前之頻譜值,來產生該等頻譜取代值。此外,該 21 201248616 隱藏訊框產生器經調適,如上文已說明過的,可能基於該 先則接收無誤之訊框的預測性濾波器係數乂,以及亦基於 該先前接收無誤之訊框的預測性濾波器係數乂⑹,來計算一 個穩定性值θ。 在個貫施例中,該隱藏訊框產生器經調適,可能使 用該遽波n穩定性值,舉例^言,藉由修飾—個原始增益 因數’來產生-個產生成之增益因數,以及會針對上述有 關該音訊訊框之先前的頻譜值,應用該產生成之增益因 數,以得到該等頻譜取代值。在其他實施例中,該隱藏訊 框產生器經調適,可針對一些導自該等先前之頻譜值的 值,應用該產生成之增益因數。 舉例而s,該隱藏訊框產生器,可能以一個漸隱因數, 乘個接收到之增益因數,而產生該經修飾之增益因數, 其中,該漸隱因數係取決於該濾波器穩定性值。 舉例而言’令吾等假定,一個音訊信號訊框中接收到 之增益因數’舉例而言,具有該值2〇β該增益因數,通常 係被用來㈣先前之頻譜值,以得到—些經修飾之頻譜 值。為應用-個漸隱’-個經修飾之增益因數,係依據該 穩定性值Θ而產生出。 舉例而言,若該穩定性值〇=卜則該預測渡波器,被視 為係非常穩定。若上述應被重建之訊框,為第一個漏失之 訊框,該漸隱因數接著可能會被設定為〇85。因此,該經 修飾之增益因數為0·85·2·0=1·7,。該先前接收到之訊框的每 個接收到之頻譜值’接著係乘以—個經修飾之增益因數17 22 201248616 而非2.〇(該接收到之增益因數),以產生該等頻譜取代值。 ,第5a圖例示-個產生成之増益因幻7應用至“圖之 頻譜值的一個範例。 、然而,舉例而言’若該穩定性值θ=〇,則該預測渡波器, 會被視為非常*穩定。若上述應被重建之訊框,為第一個 漏失之訊框’該漸隱因數接著可能會被設定為㈣。因此, 該經修飾之增益隨為觀m該切接收到之訊框 的母個接收到之頻譜值,接著係乘以—個經修飾之增益因 數1_3而非2.0(該接收到之增益因數),以產生該等賴取代 值。 曰 2圖例示-個產生成之增益因數13應用至奸圖之 頻谱值的-個範例。當第_之範例中的增益因數,小於 在第5a圖之範例中時,第5b圖中 圖之_卜 巾以’亦會小於在第5a 依據該制,可能應用不同之策略 任何在_間之值。 -巾Θ或可月,為 因數Hi言’―個值θ^·5可能會被理解為1,以致於該漸隱 數=之值,彷彿θ或將為^舉例而言,咖 數=:°.5’可能會被理解為。,以致於該漸隱因 =有該相同之值,彷彿θ或將為。,舉例而言,該漸隱因數 值實施例,糾之值係在0與1之間,該漸隱因數之 代選擇地加上内插。舉·言,假定•該 漸隱因數之值便為,以及若e為0,該漸隱因數之值便為 23 201248616 0.65,則該漸隱因數在計算上,可能依據公式: 漸隱因數=0·65+θ·0.2; 就0<θ<1·而言 在另一實施例中,該隱藏訊框產生器經調適,可進一 步基於與該先前接收無誤之訊框相關聯的訊框類別資訊, 來產生該等頻譜取代值。上述有關該類別之資訊,可能由 一個編碼器來決定。該編碼器接著可能編碼該音訊訊框中 之訊框類別資訊。該解碼器在解碼該先前接收無誤之訊框 時,接著或可能解碼該訊框類別資訊。 或者,該解碼器本身可能藉由檢查該音訊訊框,來決 定該訊框類別資訊。 此外,該解碼器經配置,可能基於來自該編碼器之資 訊,以及基於該接收之音訊資料的檢查,來決定該訊框類 別資訊,該檢查係由該解碼器本身來實施。 該訊框類別舉例而言,可能表示該訊框是否被分類為 "人為肇端”、’'肇端"、”有聲變遷”無聲變遷"、"無聲” 和’'有聲”。 舉例而言,”肇端”或可能表示,該先前接收到之音訊 訊框,係包含一個肇端。舉例而言,”有聲”或可能表示, 該先前接收到之音訊訊框,係包含有聲資料。舉例而言, "無聲’'或可能表示,該先前接收到之音訊訊框,係包含無 聲資料。舉例而言,”有聲變遷”或可能表示,該先前接收 到之音訊訊框,係包含有聲資料,但相較於該先前接收到 之音訊訊框的前趨訊框,該音調確實有改變。舉例而言, ”人為肇端”或可能表示,該先前接收到之音訊訊框的能量 24 201248616 已被提高(因此,舉例而言,建立一個人為肇端)。舉例而言, ”無聲變遷”或可能表示,該先前接收到之音訊訊框,係包 含無聲資料,但該無聲聲音將要改變。 依據該先前接收到之音訊訊框,該穩定性值θ和接續之 抹除訊框的數目、該衰減增益,舉例而言,該漸隱因數, 舉例而言,可能會被界定如下: 最後接收之良好訊框 接續之抹除訊框的數目 衰減增益 (舉例而言,漸隱因數) 人為肇端 0.6 肇端 <3 0.2 · Θ + 0.8 肇端 >3 0.5 有聲變遷 0.4 無聲變遷 >1 0.8 無聲變遷 =1 0.2 · Θ + 0.75 無聲 =2 0.2 · Θ + 0.6 無聲 >2 0.2 · Θ + 0.4 無聲 =1 0.2 · Θ + 0.8 有聲 =2 0.2 · Θ + 0.65 有聲 >2 0.2 ·θ+ 0.5 依據一個實施例,該隱藏訊框產生器,可能藉由使一 個接收到之增益因數,乘以上述基於該濾波器穩定性值及 基於該訊框類別所決定之漸隱因數,來產生一個經修飾之 增益因數。接著,該等先前之頻譜值,舉例而言,可能乘 以該經修飾之增益因數,以得到一些頻譜取代值。 該隱藏訊框產生器,可能再次經調適,使亦進一步基 於該訊框類別資訊,來產生該等頻譜取代值。 依據一個實施例,該隱藏訊框產生器經調適,可能進 一步依據未到達該接收器處或有錯誤之連續訊框的數目, 25 201248616 來產生該等頻譜取代值。 在一個實施例中,該隱藏訊框產生器經調適,可能基 於該濾.波器穩定性值,以及基於未到達該接收器處或有錯 誤之連續訊框的數目,來計算一個漸隱因數。 該隱藏訊框產生器,可能再次經調適,藉由使該漸隱 因數,乘以至少某些先前之頻譜值,來產生該等頻譜取代 值。 或者,該隱藏訊框產生器經調適,可能藉由使該漸隱 因數,乘以至少某一群組之中間值的某些值,來產生該等 頻譜取代值。每個中間值,係取決於至少一個先前之頻譜 值。舉例而言,該群組之中間值,可能已藉由修飾該等先 前之頻譜值而產生出。或者,一個在該頻域中之合成信號, 可能已基於該等先前之頻譜值而產生出,以及該合成信號 之頻譜值,可能會形成該群組之中間值。 在另一實施例中,該漸隱因數,可能乘以一個原始增 益因數,以得到一個產生成之增益因數。此產生成之增益 因數,接著係乘以至少某些先前之頻譜值,或者乘以先前 所提及之群組的中間值之某些值,使得到該等頻譜取代值。 該漸隱因數之值,係取決於該濾波器穩定性值,以及 基於上述連續之漏失或有錯誤的訊框之數目,以及舉例而 言,可能具有該等值: 26 201248616
某些或所有先前之頻譜值,可能乘以該漸隱因數本身。 b或者,該漸隱因數,可能乘以—個原始增益因數,使 取=個產生成之增益因數。此產生成之增益因數,可能 接者乘以母-個(或某些)先前之賴值(或導自該等先前之 頻譜值的中間值),使得_等賴取代值。 ^應注意的是,軸隱隨,村能取決於該_器 '值。舉例而言,若誠波器穩定性值,為H0.5、 或{何其他值’上述之列表可能亦包含該漸隱因數有關之 27 201248616 定義,舉例而言: 濾波器穩定性值 接續之漏失/有錯誤的 訊框之數目 漸隱因數 1.0 1 1.0 1.0 2 1.0 · 0.85 = 0.85 1.0 3 0.85 · 0.75 = 0.64 1.0 4 0.64 · 0.75 = 0.48 1.0 5 0.48 · 0.75 = 0.36 彼等中間濾波器穩定性值有關之漸隱因值,可能會被 近似化。 在另一實施例中,該漸隱因數在決定上,可能採用一 個公式,其係藉由基於該濾波器穩定性值,以及基於一些 未到達該接收器處或有錯誤之連續訊框的數目,來計算該 漸隱因數。 誠如上文所說明,該緩衝器單元内所儲存之先前的頻 譜值,可能為一些頻譜值。為避免所產生之失真假像,該 隱藏訊框產生器,如同上文所解釋,可能基於一個濾波器 穩定性值,來產生該等頻譜取代值。 然而,此種產生成之信號部分的取代值,可能仍具有 一個重複性特徵。所以,依據一個實施例,進一步提議的 是,藉由隨機顛倒該等頻譜值之符號,來修飾該等先前之 頻譜值,舉例而言,該先前接收到之訊框的頻譜值。舉例 而言,該隱藏訊框產生器,可就每個先前之頻譜值隨機地 決定,該頻譜值之符號是否要被顛倒,舉例而言,該頻譜 值是否要乘以-1。藉由此,該被取代之音訊信號訊框相對 28 201248616 於其前趨訊框的重複性特徵會被降低。 在下文中,係說明依據一個實施例之LD usac解碼器 中的隱藏。在此-實施例中,恰在該⑶仍^解碼器實施 Z後之頻率對時間的轉換之前,該隱藏係正作㈣該頻 ,在此種實施例中,-個到達之音訊訊框的值,係被用 來藉由產生—個在頻域中之合成信號,來解碼該編碼成: 音訊信號。就此而言,—個在該頻域中之中間信號,係基 於。亥到達之音訊訊框的值而產生出。雜訊充填係針該二 被量化至零之值加以實施。 w 該編碼成之預測性濾波器係數,可界定一個預測濾、 益’其接著係應紐該巾間錢,使產生上述表示頻域= 之解竭/$建成的音訊信號之合成信號。 5 第6圖例示依據一個實施例之音訊信號解碼器。此音^ 仏號解碼器’依據上文所說明的_個實施例,係包含—: 用以解碼—些頻譜音訊信號值61G之裝置,和—個用固 些頻譜取代值620之裝置。 上述用以解碼一些頻譜音訊信號值6 剛笱日日AA n 衣罝,喊如剛 °的,可在有一個無錯誤之音訊訊框到達時,產生Λ 解碼成之音訊信號的頻譜值。 Λ 在第6圖之實施例中,該合成信號之頻譜值可能接著 =存進上述用以產生彼等頻譜取代值之裝置心緩: =早元内。該解碼成之音訊信號的此等頻譜值,業已美於 該接收無誤之音訊訊框而被解碼,以及因而與該先前接收 29 201248616 無誤之音訊訊框相關。 當有一個當前之訊框漏失或有錯誤時,上述用以產生 頻譜取代值之裝置620,係告知需要該等頻譜取代值。上述 用以產生頻譜取代值之裝置62〇的隱藏訊框產生器,依據上 文所說明的—個實施例接著會產生—些頻譜取代值。 舉例而言’上述來自最後之良好訊框的頻譜值,係藉 由隨機顛倒彼等之符號,而被該隱藏訊框產生器稍加修 飾。接著,有一個漸隱應用至此等頻譜值。該漸隱可能基 於該先前之預賴波H的就性,以及基於接續之漏失訊 框的數目。該等產生成之頻譜取代值,接著係用作該音訊 信號有關之頻譜值,以及接著實施—個頻率對時間變換, 使得到一個時域音訊信號。 在LD-USAC中’加上在USAC和MpEG_4(MpEG==動晝 專家小組)巾,可能採料義絲整(TNS卜藉由時域雜 訊修整,雜訊之細時間結構會受到控制。在-個解碼器侧 上面’有一個遽波器運作,會基於雜訊修整資訊,使應用 至該頻譜資料上面。 有關時域雜訊修整之更多資訊,舉例而言,可見於: [4]]SO/IEC 14496·3:2005:資訊科技-視聽物件編碼第 3部分:音訊,2005年 彼等實施例基於的發現是,在一個肇端/暫態之情況 中,TNS係高度活動。因此’藉由決定TNS是否為高度活動, 可估計一個肇端/暫態是否存在。 依據一個實施例,TNS具有的一個預測增益,係在該 30 201248616 接收器側上面加以計算 接收無誤之音訊訊j上面’首先’一個 、妾收到之頻譜值,經處理可得到一 :=二間頻譜值ai。接著,會實施TNS,以及藉由此,會 :些第—中間頻譜值b。就該等第一中間頻譜值,會計 Γ個第—能量值Ει,以及賴等第二中_譜值,會計 异”—能量值E2。為得到該TNS之預測增益“,該第 一旎置值,可能除以該第一能量值。 舉例而言,gTNS可能係被界定為:
gTNS E2 /E, Ε2=Σ^= +b^+... +b2 /=1 n £ι=Σα-2= a\ +a\+... +a2n /=1 n (n=所考慮之頻譜值的數目) 依據一個實施例,該隱藏訊框產生器經調適,在針對 個先刖接收無誤之訊框’實施一個時域雜訊修整時,係 基於該等先前之觸值,基於該m穩定性值,以及亦 基於該時域雜訊修整之預測增益,來產生該等頻譜取代 值。依據另一實施例,該隱藏訊框產生器經調適,可進一 步基於接續之漏失或有錯誤的訊框之數目,來產生該等頻 譜取代值。 該預測增益愈高’該漸隱便應愈快速。舉例而言,考 慮一個濾波器穩定性值0.5,以及假定該預測增益报高,舉 例而言’ gTNS = 6;則一個漸隱因數,舉例而言,可能為〇 65(= 31 201248616 快速之漸隱)。相形之下,再次地,考慮一個濾波器穩定性 值0.5,但係假定該預測增益很低’舉例而言,15 ;則—個 漸隱因數,舉例而言,可能為〇.95(=緩慢之漸隱)。 該TNS之預測增益,亦可能會影響到,何者值應儲存 進一個用以產生一些頻譜取代值之裝置的緩衝器單元内。 若該預測增益gTNS,低於某一定之臨界值(舉例而言, 臨界值=5.0),則上述在已應用該TNS後之頻譜值,係使儲 存進該緩衝器單元内,而作為一些先前之頻譜值。在—個 漏失的或有錯誤的訊框之情況中,該等頻譜取代值,係基 於此等先前之頻譜值而產生出。 否則,若s亥預測增益gTNs,大於或等於該對臨界值,上 述在已應肋TNS前之頻譜值,錢儲存進賴衝器單元 内而作為I先前之頻譜值。在-個漏失的或有錯誤的 訊框之情財,料縣取代值,錄減等先前之頻级 值而產生出。 a TNS在任何情財’料此等先前之頻譜值,並不會應用 一 °、佩徊到·應之實施例的音訊十 =產Γ訊信號解碼器’包含-個以-個軸 第-中間頻難的解碼器單 :實包含一個用以針對該等第-中㈣ 來貫施時域雜訊修整而得 訊修整單元72〇 ^ 中間頻譜值之Κ 依據料η該音贿號解碼器,包含一你 依據料第-巾_魏和第二巾 32 201248616 雜爪修整之預測增益的賴増益計算H73G。此外,該音訊 乜唬解碼器,包含一個依據上文所說明之實施例的裝置 740 ’其可在-個當前之音訊訊框,並未被收到或有錯誤 時’產生-些頻譜取代值。料,該音減號解碼器,包 S個值選擇器75〇,其可在該預測增益,大於或等於一個 臨界值時,將該等第-中間頻譜值,儲存進上述用以產生 些頻4取代值之裝置740的緩衝器單元745内,或者在該 預測增益,小於減界值時,將料第二中間頻譜值,儲 存進上述用以產生—些頻譜取代值之裝置740的緩衝器單 元745内。 該臨界值舉例而言’可能為—個預定之值。舉例而言, 3亥臨界值可能係在該音訊錢解碼器巾被預先界定。 依據另-實施例’恰在該第一解碼步驟之後,以及在 實施任何雜訊充填、全局增益、和ATNS之前,係針對 該頻譜資料而實施隱藏。 此—實施例係描述在第8圖中。第8圖例示依據又一個 實施例之解碼[該解碼器包含—個第—解碼器模組⑽。 此第-解碼器模組81G經調適’可基於—個接收無誤之音訊 訊框,來產生-些產生成之_值。該等產生成之頻譜值, 接著係使儲存進一個用以產生一些頻譜取代值之裝置 的緩衝器單元内。此外,該等產生狀賴值,係使輸入 進-個處理模組83G内,討藉由實施而,藉由應用雜訊 充填,以及/或者藉由應用—個全局增益,來處理該等產 生成之頻譜值’使得到該解碼成之音訊信號的頻譜音訊 33 201248616 值。若有-個當前之訊㈣失或有料 些頻譜取代值之裝置82G,可 、相以產生一 將彼等饋人該處理馳8_。㈣頻譜取代值,以及可 依據第8圖中所例示之實施例, 模組’實施隱藏之情況中的某 ^ .”$、組或該處理 該等頻譜值,舉例而古,2 列諸步驟: 藉由隨機類倒彼等之符號:略:::最:之良好訊框,係 驟中,雜訊充填係基於隨機雜訊步之步 頻率解析單元(_㈣而力: U貫施。在另一步驟中, 關數,係相較於該先前接收無誤之訊框而略加調適。 在-個進-步之步驟中,頻譜雜訊修整在完成上係 藉由應用頻域中之LPC編碼式(Lpc《性預測性編碼)之 加權式頻譜封包。舉例而言,該最後接收無誤之訊框的Μ 係數’可能會被使用。在另-實施例中,可能會使用-些 平均化之LPC魏。舉例㈣,料最後三個接收無誤之 訊枢的-個被考慮之LPC係數的最後三值之平均值,可能 會就-铺波II之每-LPC係數而產生出,以及係可能應 用該等平均化之LPC係數。 在-個後繼之步驟t,針對此等頻譜值,可能應用一 個漸隱。该漸隱可旎依據接續之漏失或有錯誤的訊框之數 目,以及依據該先前之LP濾波器的穩定性。此外,該預測 增益資訊’可能會被用來影響該漸隱。該預測增益愈高, 該漸隱便可能愈快速。第8圖之實施例’比起第6圖之實施 例,係略微複雜’但可提供較佳之音訊品質。 34 201248616 雖然已在一個裝置之環境背景中說明了某些特徵,很 明顯的是,此等觀點亦表示該對應之方法的說明,其中, 一個區塊或裝置,係對應於一個方法步驟或一個方法步驟 之特徵。類似地,一些在一個方法步驟之環境背景中加以 說明的觀點,亦表示一個對應裝置之對應區塊或項目或特 徵的說明。 依據某一定實現體規範,本發明之實施例,可使體現 在硬體或軟體中。該實現體在執行上,可使用一個數位儲 存媒體,舉例而言,一個其上儲存有一些電子可讀取式控 制信號之磁片、DVD、CD、ROM、PROM、EPROM、 EEPROM、或快閃記憶體,其可與一個可程式規劃式電月遂 系統協動(或有能力協動),以執行該對應之方法。 某些依據本發明之實施例,包含一個具有一些電子可 讀取式控制信號之資料載體,其係有能力與一個可程式規 劃式電腦系統協動,以執行本說明書所說明的一個方法。 通常,本發明之實施例,可使體現為一個具有程式碼 之電腦程式產品,該程式碼在運作上,可於該電腦程式產 品,在一個電腦上面運行時,執行該等方法中的一個。該 程式碼舉例而言,可能係儲存在一個機器可讀取式載體上 面。 其他實施例包含上述用以執行本說明書所說明的一個 方法之電腦程式,其係儲存在一個機器可讀取式載體或一 個非暫時性儲存媒體上面。 換言之,該原創性方法的一個實施例,因而係一個具 35 201248616 有一個程式碼之電腦程式,其可於該電腦程式產品,在一 個電腦上面運行時,執行本說明書所說明的一個方法。 該等原創性方法之又-實施例,因而係_個資料载體 (或個數位儲存媒體,或一個電腦可讀取式媒體),其包含 記錄其上而用以執行本說明書所說明的一個方法之電腦程 式。 本原創性方法之又一實施例,因而係一個資料流,或 一個表示上述用以執行本說明書所說明的—個方法之電腦 程式的信號序列。該資料串流或該信號序列經配置,舉例 而言,可能經由一個資料通訊連線’舉例而言,經由網際 網路’或透過一個無線電通道,而使轉移。 又—個實施例包含一個經配置或經調適可執行本説明 書所說明的一個方法之處理構件,舉例而言,—個電腦、 或一個可程式規劃式邏輯裝置。 —個進一步之實施例,包含一個電腦,其上安裝有上 述用以執行本說明書所說明的一個方法之電腦程式。 在某些實施例中,一個可程式規劃式邏輯裝置(舉例而 舌,一個現場可規劃邏輯閘陣列),可能會被用來執行本說 明書所說明之方法的某些或所有功能性。在某些實施例 中,—個現場可規劃邏輯閘陣列,可能與一個微處理器協 動’以執行本說明書所說明的一個方法。通常,該等方法 最:好係由任何硬體裝置來執行。 上文所說明之實施例,係僅為例示本發明之原理。理 應瞭解的是,本說明書所說明之佈置和細節的修飾體和變 36 201248616 。所以,其係意使 圍,以及非受限於 所呈現之特定細節。 更形式,將為本技藝之專業人士所明瞭。 僅受限於將近之中請專利範_界定範匿 本說明書之實施例的說明内容和解釋所呈 文獻:
率寬帶(AMR-WB+)編解碼器; 26.290。 命爽埋功能;外延式適性多迷 :轉碼功能|,,2009年,3GPPTS [2]: USAC編解碼器(聯合語音/音頻編碼(usac), ISO/IEC CD 23003-3註明日期2010年九月24日。 [3] : 3GPP語音編解碼器語音處理功能;適性多速率 寬帶(AMR-WB)語音編解碼器;轉碼功能”(Speech c〇dec speech processing functions; Adaptive Multi-Rate -Wideband (AMR-WB) speech codec; Transcoding functions" 2009年,V9.0.0,3GPPTS 26.190。 [4] : ISO/IEC 14496-3:2005:資訊科技-視聽物件編碼-第 3部分:音訊,2005年 [5] : ITU-T G.718 (06-2008)規範 I:圖式簡單說明3 第1圖例示依據一個實施例就一個音訊信號取得一些 頻譜取代值的一個裝置; 第2圖例示另一個實施例就一個音訊信號取得一些頻 譜取代值之裝置; 第3a-3c圖例示依據一個實施例的一個增益因數與先前 之頻譜值的乘法運算; 37 201248616 第4 a圖例示一個包含某一在一個時域 部分之重祕; 的信號 第4b圖例示一個時域中之穩定信號部分的重複性. 第5a-5b圖例示一些範例,其中,依據—個實施例,— 些產生成之增益因數,係應用至第3a圖之頻譜值· 第6圖例示依據一個實施例之音訊信號解碼器. 第7圖例示依據另一 實施例之音訊錢解竭器;而 第8圖則例示依據又 一個實施例之音訊信號 【主要元件符號說明】 100··.頻譜取代值產生裝置 41〇··.信號部分 101..·第一音訊訊框 420…區域 102...音訊資料 430·.·信號部分 103…核對資料 440…區域 105...先前之頻譜值 110··.緩衝器單元 610·.·頻譜音訊信號值解碼裝 620…頻譜取代值產生裝置 111…音訊訊框 710·.·解碼器單元 112···音訊資料 720···時域雜訊修整單元 113…核對資料 730.·.預測增益計算器 115…箭頭 740…頻譜取代值產生裝置 116…箭頭 745…緩衝器單元 117.·.隱滅必要 750·..值選擇器 118.·.凊求先前值 810…第一解碼器模組 119...先刚之頻譜值 820···頻譜取代值產生裝置 120…隱藏訊框產生器 125…產生成之頻譜取代值 83〇.··處理模組 38

Claims (1)

  1. 201248616 七、申請專利範圍: 1. 一種用以就一個音訊信號產生一些頻譜取代值之裝置, 其包含: -個緩衝科元’其可儲存-些與_個先前接收無 誤之音訊訊框相關的先前之頻譜值;和 一個I5急藏訊框產生器,其可在一個當前之音訊訊框 並未被接收到或有錯誤時,產生該等頻譜取代值,其 中,該先前接收無誤之音訊訊框,包含一些濾波器資 訊’此濾、波器資訊,係與-個可表示—個預測瀘波器之 穩疋性㈣波^穩定性值相聯結,以及其巾,該隱藏訊 框產生器經調適’可基於該等先前之頻豸值以及基於 該濾波器穩定性值,來產生該等頻譜取代值。 2. 如申請專利範圍第w之裝置,其中,該隱藏訊框產生 器經調適,可藉由隨機顛倒先前之頻譜值的符號,來產 生該等頻譜取代值。 3·如申請專利範圍第_項之裝置,其中,該隱藏訊框產 生器經配置,可藉由在«波器穩定性值,具有-個第 值時,使每個先前之頻譜值,乘以一個第一增益因 數,以及在該濾波器穩定性值,具有一個小於該第一值 之第二值時,使每個先前之頻譜值,乘以一個第二增益 因數,來產生該等頻譜取代值。 4.如申請專利範圍任一前項之裝置,其中,該隱藏訊框產 生器經調適,可基於該濾波器穩定性值,來產生該等頻 譜取代值,其t,該先前接收無誤之音訊訊框,包含該 39 201248616 預測濾波器之第一預測性濾波器係數,其中,該先前接 收無誤之音訊訊框的前趨訊框,包含一些第二預測性濾 波器係數,以及其中,該濾波器穩定性值,係取決於該 第一預測性濾波器係數,以及取決於該第二預測性濾波 器係數。 5·如申請專利範圍第4項之裝置,其中,該隱藏訊框產生 器經調適,可基於該先前接收無誤之音訊訊框的第一預 測性濾波器係數,以及基於該先前接收無誤之音訊訊框 的前趨訊框之第二預測性過濾器係數,來決定該濾波器 穩定性值。 6·如申請專利範圍第4或5項之裝置,其中,該隱藏訊框產 生器經調適,可基於該濾波器穩定性值,來產生該等頻 譜取代值,其中,該濾波器穩定性值,係取決於一個距 離計量LSFdist,以及其中,該距離計量在界定上, 係藉由公式: /=0 其中,U+1指明該先前接收無誤之音訊訊框的第一預測 ! 生;慮波器係數之總數’以及其中,U+1亦指明該先前接 收無誤之音訊訊框的前趨訊框之第二預測性滤波器係 數的總數,其中’/;·指明該等第一預測性濾波器係數的 第1個m係數’以及其巾n明該等第二預測性 濾波器係數的第i個濾波器係數。 7.如申請專利範圍任-前項之裝置,其中,該隱藏訊框產 40 201248616 生器經調適,可進一步基於與該先前接收無誤之音、^ 框相關聯的訊框類別資訊,來產生該等頻譜取代值D 8·如申請專利範圍第7項之裝置,其中,該隱藏訊樞產生 器經調適’可基於該訊框類別資訊’來產生該等頻1 代值,其中,該訊框類別資訊指明,該先前接收無^ 音訊訊框,係被分類為"人為肇端"、”肇端,,、, t , 有聲變遷丨,、 "無聲變遷”、"無聲”或"有聲"。 9.如:請專利任—前項之裝置,其中,該隱藏訊 生器經調適’可自有—個最後之無誤音訊訊框, 該接收器起,進-步基於若干未到達-個接收器處或^ 錯誤之連續訊框,來產生該等頻譜取代值,其中,自+ 最後之無誤音訊訊框,已到達該接收器起,, 誤之音訊訊框,到達該接收器處。 …他無 iO·如申請專利範圍第9項之裝置, 伯4藏訊框產生器經調適,可基於魏波器穩定 ,以及基於未到it該接收_或有錯誤之連續訊框 的數目,來計算一個漸隱因數,以及 經調適’可藉由使該漸隱因 1至少某些先前之頻譜值,或者乘以至少某一群 二之中間值的某些值’來產生該等頻譜取代值,其中, n母個偷,_1切之頻譜值。 申請專利範圍任一前項之裝置,其中,該隱藏訊框產 =經調適:可基於該等先前之頻譜值、基於該滤波器 疋杜值u及亦基於—個時域雜訊修整之預測增益, 41 201248616 來產生該等頻譜取代值。 12. —種音訊信號解碼器,其包含: 一個用以解碼彼等頻譜音訊信號值之裝置,和 一個如申請專利範圍第1至10項任一項用以產生一 些頻譜取代值之裝置, 其中,上述用以解碼頻譜音訊信號值之裝置經調 適,可基於一個先前接收無誤之音訊訊框,來解碼一個 音訊信號之頻譜值,其中,上述用以解碼頻譜音訊信號 值之裝置進一步經調適,可將該音訊信號之頻譜值,儲 存進上述用以產生頻譜取代值之裝置的緩衝器單元 内,以及 其中,上述用以產生頻譜取代值之裝置經調適,可 在一個當前之音訊訊框未被接收到或有錯誤時,基於該 緩衝器單元内所儲存之頻譜值,來產生該等頻譜取代 值。 13. —種音訊信號解碼器,其包含: 一個用以基於一個接收無誤之音訊訊框來產生一 些第一中間頻譜值的解碼器單元, 一個用以針對該等第一中間頻譜值來實施時域雜 訊修整而得到一些第二中間頻譜值之時域雜訊修整單 元, 一個用以依據該等第一中間頻譜值和該等第二中 間頻譜值來計算該時域雜訊修整的一個預測增益之預 測增益計算器, 42 201248616 一個用以如申請專利範圍第1至11項任一項在一個 當前之音訊訊框未被接收到或有錯誤時產生一些頻譜 取代值的裝置,和 一個值選擇器,其可在該預測增益大於或等於一個 臨界值時,將該等第一中間頻譜值,儲存進上述用以產 生一些頻譜取代值之裝置的緩衝器單元内,或者可在該 預測增益小於該臨界值時,將該等第二中間頻譜值,儲 存進上述用以產生一些頻譜取代值之裝置的緩衝器單 元内。 14. 一種音訊信號解碼器,其包含: 一個用以基於一個接收無誤之音訊訊框來產生一 些產生成的頻譜值之第一解碼器模組, 一個用以如申請專利範圍第1至11項任一項而產生 一些頻譜取代值之裝置,和 一個用以處理該等產生成之頻譜值的處理模組,其 係藉由實施時域雜訊修整、應用雜訊充填、或者應用一 個全局增益,以得到該解碼成之音訊信號的頻譜音訊 值, 其中,上述用以產生頻譜取代值之裝置經調適,可 產生一些頻譜取代值,以及在一個當前之訊框並未被接 收到或有錯誤時,將彼等饋進該處理模組内。 15. —種用以就一個音訊信號產生一些頻譜取代值之方 法,其包括: 儲存一些與一個先前接收無誤之音訊訊框相關聯 43 £ 201248616 的先前之頻譜值,以及 當一個當前之音訊訊框並未被接收到或有錯誤 時,產生該等頻譜取.代值,其中,該先前接收無誤之音 訊訊框,包含一些濾波器資訊,此濾波器資訊,係與一 個可表示該濾波器資訊所界定之預測濾波器的穩定性 之濾波器穩定性值相聯結,其中,該等頻譜取代值在產 生上,係基於該等先前之頻譜值,以及基於該濾波器穩 定性值。 16. —種電腦程式,其可在此電腦程式被一個電腦或信號處 理器執行時,體現如申請專利範圍第15項之方法。 44
TW101104539A 2011-02-14 2012-02-13 用於低延遲聯合語音及音訊編碼中之錯誤隱藏之裝置和方法 TWI484479B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201161442632P 2011-02-14 2011-02-14
PCT/EP2012/052395 WO2012110447A1 (en) 2011-02-14 2012-02-13 Apparatus and method for error concealment in low-delay unified speech and audio coding (usac)

Publications (2)

Publication Number Publication Date
TW201248616A true TW201248616A (en) 2012-12-01
TWI484479B TWI484479B (zh) 2015-05-11

Family

ID=71943602

Family Applications (1)

Application Number Title Priority Date Filing Date
TW101104539A TWI484479B (zh) 2011-02-14 2012-02-13 用於低延遲聯合語音及音訊編碼中之錯誤隱藏之裝置和方法

Country Status (19)

Country Link
US (1) US9384739B2 (zh)
EP (1) EP2661745B1 (zh)
JP (1) JP5849106B2 (zh)
KR (1) KR101551046B1 (zh)
CN (1) CN103620672B (zh)
AR (1) AR085218A1 (zh)
AU (1) AU2012217215B2 (zh)
BR (1) BR112013020324B8 (zh)
CA (1) CA2827000C (zh)
ES (1) ES2539174T3 (zh)
HK (1) HK1191130A1 (zh)
MX (1) MX2013009301A (zh)
MY (1) MY167853A (zh)
PL (1) PL2661745T3 (zh)
RU (1) RU2630390C2 (zh)
SG (1) SG192734A1 (zh)
TW (1) TWI484479B (zh)
WO (1) WO2012110447A1 (zh)
ZA (1) ZA201306499B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI748339B (zh) * 2019-02-13 2021-12-01 弗勞恩霍夫爾協會 用於包括全訊框丟失隱匿及部分訊框丟失隱匿的lc3隱匿之解碼器及解碼方法
US12039986B2 (en) 2019-02-13 2024-07-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder and decoding method for LC3 concealment including full frame loss concealment and partial frame loss concealment

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI610296B (zh) 2011-10-21 2018-01-01 三星電子股份有限公司 訊框錯誤修補裝置及音訊解碼裝置
US9741350B2 (en) * 2013-02-08 2017-08-22 Qualcomm Incorporated Systems and methods of performing gain control
MY181026A (en) 2013-06-21 2020-12-16 Fraunhofer Ges Forschung Apparatus and method realizing improved concepts for tcx ltp
CN104301064B (zh) 2013-07-16 2018-05-04 华为技术有限公司 处理丢失帧的方法和解码器
JP6396459B2 (ja) * 2013-10-31 2018-09-26 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 周波数領域における時間的予備整形雑音の挿入によるオーディオ帯域幅拡張
PL3336840T3 (pl) * 2013-10-31 2020-04-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dekoder audio i sposób dostarczania zdekodowanej informacji audio z wykorzystaniem maskowania błędów modyfikującego sygnał pobudzenia w dziedzinie czasu
PT3285255T (pt) 2013-10-31 2019-08-02 Fraunhofer Ges Forschung Descodificador de áudio e método para fornecer uma informação de áudio descodificada utilizando uma ocultação de erro baseada num sinal de excitação no domínio de tempo
EP2922055A1 (en) 2014-03-19 2015-09-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and corresponding computer program for generating an error concealment signal using individual replacement LPC representations for individual codebook information
EP2922054A1 (en) 2014-03-19 2015-09-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and corresponding computer program for generating an error concealment signal using an adaptive noise estimation
EP2922056A1 (en) 2014-03-19 2015-09-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and corresponding computer program for generating an error concealment signal using power compensation
WO2015174912A1 (en) * 2014-05-15 2015-11-19 Telefonaktiebolaget L M Ericsson (Publ) Audio signal classification and coding
NO2780522T3 (zh) * 2014-05-15 2018-06-09
CN106683681B (zh) 2014-06-25 2020-09-25 华为技术有限公司 处理丢失帧的方法和装置
EP2980792A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an enhanced signal using independent noise-filling
EP2980790A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for comfort noise generation mode selection
AU2015258241B2 (en) * 2014-07-28 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for selecting one of a first encoding algorithm and a second encoding algorithm using harmonics reduction
BR112018067944B1 (pt) * 2016-03-07 2024-03-05 Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V Unidade de ocultação de erro, método de ocultação de erro,decodificador de áudio, codificador de áudio, método para fornecer uma representação de áudio codificada e sistema
WO2017153299A2 (en) * 2016-03-07 2017-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Error concealment unit, audio decoder, and related method and computer program fading out a concealed audio frame out according to different damping factors for different frequency bands
ES2870959T3 (es) * 2016-03-07 2021-10-28 Fraunhofer Ges Forschung Unidad de ocultación de error, decodificador de audio y método relacionado y programa informático que usa características de una representación decodificada de una trama de audio decodificada apropiadamente
KR20180037852A (ko) * 2016-10-05 2018-04-13 삼성전자주식회사 영상 처리 장치 및 그 제어방법
EP3382700A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for post-processing an audio signal using a transient location detection
KR20200097594A (ko) 2019-02-08 2020-08-19 김승현 유연하고 자유롭고 집중적인 집진기
WO2020165260A1 (en) * 2019-02-13 2020-08-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-mode channel coding with mode specific coloration sequences
CN112992160B (zh) * 2021-05-08 2021-07-27 北京百瑞互联技术有限公司 一种音频错误隐藏方法及装置

Family Cites Families (188)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE294441T1 (de) * 1991-06-11 2005-05-15 Qualcomm Inc Vocoder mit veränderlicher bitrate
US5408580A (en) 1992-09-21 1995-04-18 Aware, Inc. Audio compression system employing multi-rate signal analysis
SE501340C2 (sv) * 1993-06-11 1995-01-23 Ericsson Telefon Ab L M Döljande av transmissionsfel i en talavkodare
SE502244C2 (sv) * 1993-06-11 1995-09-25 Ericsson Telefon Ab L M Sätt och anordning för avkodning av ljudsignaler i ett system för mobilradiokommunikation
BE1007617A3 (nl) 1993-10-11 1995-08-22 Philips Electronics Nv Transmissiesysteem met gebruik van verschillende codeerprincipes.
US5657422A (en) 1994-01-28 1997-08-12 Lucent Technologies Inc. Voice activity detection driven noise remediator
US5784532A (en) 1994-02-16 1998-07-21 Qualcomm Incorporated Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system
US5684920A (en) 1994-03-17 1997-11-04 Nippon Telegraph And Telephone Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein
US5568588A (en) 1994-04-29 1996-10-22 Audiocodes Ltd. Multi-pulse analysis speech processing System and method
CN1090409C (zh) 1994-10-06 2002-09-04 皇家菲利浦电子有限公司 采用不同编码原理的传送系统
US5537510A (en) 1994-12-30 1996-07-16 Daewoo Electronics Co., Ltd. Adaptive digital audio encoding apparatus and a bit allocation method thereof
SE506379C3 (sv) 1995-03-22 1998-01-19 Ericsson Telefon Ab L M Lpc-talkodare med kombinerad excitation
JP3317470B2 (ja) 1995-03-28 2002-08-26 日本電信電話株式会社 音響信号符号化方法、音響信号復号化方法
US5659622A (en) 1995-11-13 1997-08-19 Motorola, Inc. Method and apparatus for suppressing noise in a communication system
US5848391A (en) 1996-07-11 1998-12-08 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Method subband of coding and decoding audio signals using variable length windows
JP3259759B2 (ja) 1996-07-22 2002-02-25 日本電気株式会社 音声信号伝送方法及び音声符号復号化システム
JPH10124092A (ja) 1996-10-23 1998-05-15 Sony Corp 音声符号化方法及び装置、並びに可聴信号符号化方法及び装置
US5960389A (en) 1996-11-15 1999-09-28 Nokia Mobile Phones Limited Methods for generating comfort noise during discontinuous transmission
JPH10214100A (ja) 1997-01-31 1998-08-11 Sony Corp 音声合成方法
US6134518A (en) 1997-03-04 2000-10-17 International Business Machines Corporation Digital audio signal coding using a CELP coder and a transform coder
JP3223966B2 (ja) 1997-07-25 2001-10-29 日本電気株式会社 音声符号化/復号化装置
US6070137A (en) 1998-01-07 2000-05-30 Ericsson Inc. Integrated frequency-domain voice coding using an adaptive spectral enhancement filter
ATE302991T1 (de) 1998-01-22 2005-09-15 Deutsche Telekom Ag Verfahren zur signalgesteuerten schaltung zwischen verschiedenen audiokodierungssystemen
GB9811019D0 (en) 1998-05-21 1998-07-22 Univ Surrey Speech coders
US6173257B1 (en) 1998-08-24 2001-01-09 Conexant Systems, Inc Completed fixed codebook for speech encoder
US6439967B2 (en) * 1998-09-01 2002-08-27 Micron Technology, Inc. Microelectronic substrate assembly planarizing machines and methods of mechanical and chemical-mechanical planarization of microelectronic substrate assemblies
SE521225C2 (sv) 1998-09-16 2003-10-14 Ericsson Telefon Ab L M Förfarande och anordning för CELP-kodning/avkodning
US6317117B1 (en) 1998-09-23 2001-11-13 Eugene Goff User interface for the control of an audio spectrum filter processor
US7272556B1 (en) 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
US7124079B1 (en) 1998-11-23 2006-10-17 Telefonaktiebolaget Lm Ericsson (Publ) Speech coding with comfort noise variability feature for increased fidelity
FI114833B (fi) 1999-01-08 2004-12-31 Nokia Corp Menetelmä, puhekooderi ja matkaviestin puheenkoodauskehysten muodostamiseksi
DE19921122C1 (de) * 1999-05-07 2001-01-25 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Verschleiern eines Fehlers in einem codierten Audiosignal und Verfahren und Vorrichtung zum Decodieren eines codierten Audiosignals
CN1145928C (zh) 1999-06-07 2004-04-14 艾利森公司 用参数噪声模型统计量产生舒适噪声的方法及装置
JP4464484B2 (ja) 1999-06-15 2010-05-19 パナソニック株式会社 雑音信号符号化装置および音声信号符号化装置
US6236960B1 (en) 1999-08-06 2001-05-22 Motorola, Inc. Factorial packing method and apparatus for information coding
US6636829B1 (en) * 1999-09-22 2003-10-21 Mindspeed Technologies, Inc. Speech communication system and method for handling lost frames
ES2269112T3 (es) 2000-02-29 2007-04-01 Qualcomm Incorporated Codificador de voz multimodal en bucle cerrado de dominio mixto.
US6757654B1 (en) * 2000-05-11 2004-06-29 Telefonaktiebolaget Lm Ericsson Forward error correction in speech coding
JP2002118517A (ja) 2000-07-31 2002-04-19 Sony Corp 直交変換装置及び方法、逆直交変換装置及び方法、変換符号化装置及び方法、並びに復号装置及び方法
FR2813722B1 (fr) * 2000-09-05 2003-01-24 France Telecom Procede et dispositif de dissimulation d'erreurs et systeme de transmission comportant un tel dispositif
US6847929B2 (en) 2000-10-12 2005-01-25 Texas Instruments Incorporated Algebraic codebook system and method
CA2327041A1 (en) 2000-11-22 2002-05-22 Voiceage Corporation A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals
US7901873B2 (en) 2001-04-23 2011-03-08 Tcp Innovations Limited Methods for the diagnosis and treatment of bone disorders
KR100464369B1 (ko) 2001-05-23 2005-01-03 삼성전자주식회사 음성 부호화 시스템의 여기 코드북 탐색 방법
US20020184009A1 (en) 2001-05-31 2002-12-05 Heikkinen Ari P. Method and apparatus for improved voicing determination in speech signals containing high levels of jitter
US20030120484A1 (en) 2001-06-12 2003-06-26 David Wong Method and system for generating colored comfort noise in the absence of silence insertion description packets
US6879955B2 (en) 2001-06-29 2005-04-12 Microsoft Corporation Signal modification based on continuous time warping for low bit rate CELP coding
US6941263B2 (en) 2001-06-29 2005-09-06 Microsoft Corporation Frequency domain postfiltering for quality enhancement of coded speech
US7711563B2 (en) * 2001-08-17 2010-05-04 Broadcom Corporation Method and system for frame erasure concealment for predictive speech coding based on extrapolation of speech waveform
DE10140507A1 (de) 2001-08-17 2003-02-27 Philips Corp Intellectual Pty Verfahren für die algebraische Codebook-Suche eines Sprachsignalkodierers
KR100438175B1 (ko) 2001-10-23 2004-07-01 엘지전자 주식회사 코드북 검색방법
CA2365203A1 (en) 2001-12-14 2003-06-14 Voiceage Corporation A signal modification method for efficient coding of speech signals
US6646332B2 (en) * 2002-01-18 2003-11-11 Terence Quintin Collier Semiconductor package device
CA2388352A1 (en) 2002-05-31 2003-11-30 Voiceage Corporation A method and device for frequency-selective pitch enhancement of synthesized speed
CA2388439A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
CA2388358A1 (en) 2002-05-31 2003-11-30 Voiceage Corporation A method and device for multi-rate lattice vector quantization
US7302387B2 (en) 2002-06-04 2007-11-27 Texas Instruments Incorporated Modification of fixed codebook search in G.729 Annex E audio coding
EP1543307B1 (en) 2002-09-19 2006-02-22 Matsushita Electric Industrial Co., Ltd. Audio decoding apparatus and method
RU2331933C2 (ru) 2002-10-11 2008-08-20 Нокиа Корпорейшн Способы и устройства управляемого источником широкополосного кодирования речи с переменной скоростью в битах
US7343283B2 (en) 2002-10-23 2008-03-11 Motorola, Inc. Method and apparatus for coding a noise-suppressed audio signal
US7363218B2 (en) 2002-10-25 2008-04-22 Dilithium Networks Pty. Ltd. Method and apparatus for fast CELP parameter mapping
KR100463419B1 (ko) 2002-11-11 2004-12-23 한국전자통신연구원 적은 복잡도를 가진 고정 코드북 검색방법 및 장치
KR100465316B1 (ko) 2002-11-18 2005-01-13 한국전자통신연구원 음성 부호화기 및 이를 이용한 음성 부호화 방법
KR20040058855A (ko) 2002-12-27 2004-07-05 엘지전자 주식회사 음성 변조 장치 및 방법
US7249014B2 (en) 2003-03-13 2007-07-24 Intel Corporation Apparatus, methods and articles incorporating a fast algebraic codebook search technique
US20050021338A1 (en) 2003-03-17 2005-01-27 Dan Graboi Recognition device and system
WO2004090870A1 (ja) 2003-04-04 2004-10-21 Kabushiki Kaisha Toshiba 広帯域音声を符号化または復号化するための方法及び装置
US7318035B2 (en) 2003-05-08 2008-01-08 Dolby Laboratories Licensing Corporation Audio coding systems and methods using spectral component coupling and spectral component regeneration
US7548852B2 (en) 2003-06-30 2009-06-16 Koninklijke Philips Electronics N.V. Quality of decoded audio by adding noise
CA2475282A1 (en) * 2003-07-17 2005-01-17 Her Majesty The Queen In Right Of Canada As Represented By The Minister Of Industry Through The Communications Research Centre Volume hologram
US20050091044A1 (en) 2003-10-23 2005-04-28 Nokia Corporation Method and system for pitch contour quantization in audio coding
US20050091041A1 (en) 2003-10-23 2005-04-28 Nokia Corporation Method and system for speech coding
KR101106026B1 (ko) 2003-10-30 2012-01-17 돌비 인터네셔널 에이비 오디오 신호 인코딩 또는 디코딩
SE527669C2 (sv) * 2003-12-19 2006-05-09 Ericsson Telefon Ab L M Förbättrad felmaskering i frekvensdomänen
DE102004007200B3 (de) * 2004-02-13 2005-08-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiocodierung
CA2457988A1 (en) 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
FI118834B (fi) 2004-02-23 2008-03-31 Nokia Corp Audiosignaalien luokittelu
FI118835B (fi) 2004-02-23 2008-03-31 Nokia Corp Koodausmallin valinta
JP4744438B2 (ja) * 2004-03-05 2011-08-10 パナソニック株式会社 エラー隠蔽装置およびエラー隠蔽方法
WO2005096274A1 (fr) 2004-04-01 2005-10-13 Beijing Media Works Co., Ltd Dispositif et procede de codage/decodage audio ameliores
GB0408856D0 (en) 2004-04-21 2004-05-26 Nokia Corp Signal encoding
MXPA06012617A (es) 2004-05-17 2006-12-15 Nokia Corp Codificacion de audio con diferentes longitudes de cuadro de codificacion.
US7649988B2 (en) 2004-06-15 2010-01-19 Acoustic Technologies, Inc. Comfort noise generator using modified Doblinger noise estimate
US8160274B2 (en) 2006-02-07 2012-04-17 Bongiovi Acoustics Llc. System and method for digital signal processing
US7630902B2 (en) 2004-09-17 2009-12-08 Digital Rise Technology Co., Ltd. Apparatus and methods for digital audio coding using codebook application ranges
KR100656788B1 (ko) 2004-11-26 2006-12-12 한국전자통신연구원 비트율 신축성을 갖는 코드벡터 생성 방법 및 그를 이용한 광대역 보코더
TWI253057B (en) 2004-12-27 2006-04-11 Quanta Comp Inc Search system and method thereof for searching code-vector of speech signal in speech encoder
RU2405217C2 (ru) 2005-01-31 2010-11-27 Скайп Лимитед Способ взвешенного сложения с перекрытием
US7519535B2 (en) * 2005-01-31 2009-04-14 Qualcomm Incorporated Frame erasure concealment in voice communications
US20070147518A1 (en) 2005-02-18 2007-06-28 Bruno Bessette Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX
US8155965B2 (en) 2005-03-11 2012-04-10 Qualcomm Incorporated Time warping frames inside the vocoder by modifying the residual
EP1864281A1 (en) 2005-04-01 2007-12-12 QUALCOMM Incorporated Systems, methods, and apparatus for highband burst suppression
EP1905002B1 (en) 2005-05-26 2013-05-22 LG Electronics Inc. Method and apparatus for decoding audio signal
US7707034B2 (en) 2005-05-31 2010-04-27 Microsoft Corporation Audio codec post-filter
RU2296377C2 (ru) 2005-06-14 2007-03-27 Михаил Николаевич Гусев Способ анализа и синтеза речи
EP1897085B1 (en) 2005-06-18 2017-05-31 Nokia Technologies Oy System and method for adaptive transmission of comfort noise parameters during discontinuous speech transmission
KR100851970B1 (ko) 2005-07-15 2008-08-12 삼성전자주식회사 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치
US7610197B2 (en) 2005-08-31 2009-10-27 Motorola, Inc. Method and apparatus for comfort noise generation in speech communication systems
RU2312405C2 (ru) 2005-09-13 2007-12-10 Михаил Николаевич Гусев Способ осуществления машинной оценки качества звуковых сигналов
US7953605B2 (en) * 2005-10-07 2011-05-31 Deepen Sinha Method and apparatus for audio encoding and decoding using wideband psychoacoustic modeling and bandwidth extension
US7720677B2 (en) 2005-11-03 2010-05-18 Coding Technologies Ab Time warped modified transform coding of audio signals
US7536299B2 (en) 2005-12-19 2009-05-19 Dolby Laboratories Licensing Corporation Correlating and decorrelating transforms for multiple description coding systems
US8255207B2 (en) * 2005-12-28 2012-08-28 Voiceage Corporation Method and device for efficient frame erasure concealment in speech codecs
WO2007080211A1 (en) 2006-01-09 2007-07-19 Nokia Corporation Decoding of binaural audio signals
EP1984911A4 (en) 2006-01-18 2012-03-14 Lg Electronics Inc DEVICE AND METHOD FOR SIGNAL CODING AND DECODING
CN101371297A (zh) 2006-01-18 2009-02-18 Lg电子株式会社 用于编码和解码信号的设备和方法
US8032369B2 (en) 2006-01-20 2011-10-04 Qualcomm Incorporated Arbitrary average data rates for variable rate coders
US7668304B2 (en) * 2006-01-25 2010-02-23 Avaya Inc. Display hierarchy of participants during phone call
FR2897733A1 (fr) 2006-02-20 2007-08-24 France Telecom Procede de discrimination et d'attenuation fiabilisees des echos d'un signal numerique dans un decodeur et dispositif correspondant
FR2897977A1 (fr) * 2006-02-28 2007-08-31 France Telecom Procede de limitation de gain d'excitation adaptative dans un decodeur audio
US20070253577A1 (en) 2006-05-01 2007-11-01 Himax Technologies Limited Equalizer bank with interference reduction
US7873511B2 (en) 2006-06-30 2011-01-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
JP4810335B2 (ja) 2006-07-06 2011-11-09 株式会社東芝 広帯域オーディオ信号符号化装置および広帯域オーディオ信号復号装置
JP5190363B2 (ja) * 2006-07-12 2013-04-24 パナソニック株式会社 音声復号装置、音声符号化装置、および消失フレーム補償方法
JP5052514B2 (ja) * 2006-07-12 2012-10-17 パナソニック株式会社 音声復号装置
US7933770B2 (en) 2006-07-14 2011-04-26 Siemens Audiologische Technik Gmbh Method and device for coding audio data based on vector quantisation
CN102096937B (zh) 2006-07-24 2014-07-09 索尼株式会社 毛发运动合成器系统和用于毛发/皮毛流水线的优化技术
US7987089B2 (en) 2006-07-31 2011-07-26 Qualcomm Incorporated Systems and methods for modifying a zero pad region of a windowed frame of an audio signal
EP2054879B1 (en) * 2006-08-15 2010-01-20 Broadcom Corporation Re-phasing of decoder states after packet loss
US7877253B2 (en) * 2006-10-06 2011-01-25 Qualcomm Incorporated Systems, methods, and apparatus for frame erasure recovery
DE102006049154B4 (de) 2006-10-18 2009-07-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kodierung eines Informationssignals
PT2109098T (pt) 2006-10-25 2020-12-18 Fraunhofer Ges Forschung Aparelho e método para gerar amostras de áudio de domínio de tempo
WO2008056775A1 (fr) * 2006-11-10 2008-05-15 Panasonic Corporation Dispositif de décodage de paramètre, dispositif de codage de paramètre et procédé de décodage de paramètre
KR101016224B1 (ko) 2006-12-12 2011-02-25 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 인코더, 디코더 및 시간 영역 데이터 스트림을 나타내는 데이터 세그먼트를 인코딩하고 디코딩하는 방법
FR2911228A1 (fr) 2007-01-05 2008-07-11 France Telecom Codage par transformee, utilisant des fenetres de ponderation et a faible retard.
KR101379263B1 (ko) 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
FR2911426A1 (fr) 2007-01-15 2008-07-18 France Telecom Modification d'un signal de parole
US7873064B1 (en) * 2007-02-12 2011-01-18 Marvell International Ltd. Adaptive jitter buffer-packet loss concealment
EP2128855A1 (en) * 2007-03-02 2009-12-02 Panasonic Corporation Voice encoding device and voice encoding method
JP4708446B2 (ja) 2007-03-02 2011-06-22 パナソニック株式会社 符号化装置、復号装置およびそれらの方法
JP5241701B2 (ja) 2007-03-02 2013-07-17 パナソニック株式会社 符号化装置および符号化方法
JP2008261904A (ja) * 2007-04-10 2008-10-30 Matsushita Electric Ind Co Ltd 符号化装置、復号化装置、符号化方法および復号化方法
US8630863B2 (en) 2007-04-24 2014-01-14 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding audio/speech signal
CN101388210B (zh) 2007-09-15 2012-03-07 华为技术有限公司 编解码方法及编解码器
US9653088B2 (en) 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
KR101513028B1 (ko) 2007-07-02 2015-04-17 엘지전자 주식회사 방송 수신기 및 방송신호 처리방법
US8185381B2 (en) 2007-07-19 2012-05-22 Qualcomm Incorporated Unified filter bank for performing signal conversions
CN101110214B (zh) 2007-08-10 2011-08-17 北京理工大学 一种基于多描述格型矢量量化技术的语音编码方法
US8428957B2 (en) 2007-08-24 2013-04-23 Qualcomm Incorporated Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands
ES2748843T3 (es) 2007-08-27 2020-03-18 Ericsson Telefon Ab L M Análisis/síntesis espectral de baja complejidad utilizando resolución temporal seleccionable
JP4886715B2 (ja) 2007-08-28 2012-02-29 日本電信電話株式会社 定常率算出装置、雑音レベル推定装置、雑音抑圧装置、それらの方法、プログラム及び記録媒体
WO2009033288A1 (en) 2007-09-11 2009-03-19 Voiceage Corporation Method and device for fast algebraic codebook search in speech and audio coding
CN100524462C (zh) * 2007-09-15 2009-08-05 华为技术有限公司 对高带信号进行帧错误隐藏的方法及装置
US8576096B2 (en) 2007-10-11 2013-11-05 Motorola Mobility Llc Apparatus and method for low complexity combinatorial coding of signals
KR101373004B1 (ko) 2007-10-30 2014-03-26 삼성전자주식회사 고주파수 신호 부호화 및 복호화 장치 및 방법
CN101425292B (zh) 2007-11-02 2013-01-02 华为技术有限公司 一种音频信号的解码方法及装置
DE102007055830A1 (de) 2007-12-17 2009-06-18 Zf Friedrichshafen Ag Verfahren und Vorrichtung zum Betrieb eines Hybridantriebes eines Fahrzeuges
CN101483043A (zh) 2008-01-07 2009-07-15 中兴通讯股份有限公司 基于分类和排列组合的码本索引编码方法
CN101488344B (zh) 2008-01-16 2011-09-21 华为技术有限公司 一种量化噪声泄漏控制方法及装置
DE102008015702B4 (de) 2008-01-31 2010-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
US8000487B2 (en) 2008-03-06 2011-08-16 Starkey Laboratories, Inc. Frequency translation by high-frequency spectral envelope warping in hearing assistance devices
FR2929466A1 (fr) 2008-03-28 2009-10-02 France Telecom Dissimulation d'erreur de transmission dans un signal numerique dans une structure de decodage hierarchique
EP2107556A1 (en) 2008-04-04 2009-10-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio transform coding using pitch correction
US8879643B2 (en) * 2008-04-15 2014-11-04 Qualcomm Incorporated Data substitution scheme for oversampled data
US8768690B2 (en) 2008-06-20 2014-07-01 Qualcomm Incorporated Coding scheme selection for low-bit-rate applications
ES2683077T3 (es) 2008-07-11 2018-09-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada
ES2379761T3 (es) 2008-07-11 2012-05-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Proporcinar una señal de activación de distorsión de tiempo y codificar una señal de audio con la misma
MY154452A (en) 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
ES2401487T3 (es) 2008-07-11 2013-04-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y procedimiento para la codificación/decodificación de una señal de audio utilizando un esquema de conmutación de generación de señal ajena
EP2144230A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
PL2346030T3 (pl) 2008-07-11 2015-03-31 Fraunhofer Ges Forschung Koder audio, sposób kodowania sygnału audio oraz program komputerowy
CA2871498C (en) 2008-07-11 2017-10-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder and decoder for encoding and decoding audio samples
US8352279B2 (en) 2008-09-06 2013-01-08 Huawei Technologies Co., Ltd. Efficient temporal envelope coding approach by prediction between low band signal and high band signal
US8577673B2 (en) 2008-09-15 2013-11-05 Huawei Technologies Co., Ltd. CELP post-processing for music signals
US8798776B2 (en) 2008-09-30 2014-08-05 Dolby International Ab Transcoding of audio metadata
DE102008042579B4 (de) * 2008-10-02 2020-07-23 Robert Bosch Gmbh Verfahren zur Fehlerverdeckung bei fehlerhafter Übertragung von Sprachdaten
EP2345030A2 (en) 2008-10-08 2011-07-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-resolution switched audio encoding/decoding scheme
KR101315617B1 (ko) 2008-11-26 2013-10-08 광운대학교 산학협력단 모드 스위칭에 기초하여 윈도우 시퀀스를 처리하는 통합 음성/오디오 부/복호화기
CN101770775B (zh) 2008-12-31 2011-06-22 华为技术有限公司 信号处理方法及装置
BR122019023704B1 (pt) 2009-01-16 2020-05-05 Dolby Int Ab sistema para gerar um componente de frequência alta de um sinal de áudio e método para realizar reconstrução de frequência alta de um componente de frequência alta
US8457975B2 (en) 2009-01-28 2013-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program
ES2567129T3 (es) 2009-01-28 2016-04-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificador de audio, decodificador de audio, información de audio codificada, métodos para la codificación y decodificación de una señal de audio y programa de ordenador
EP2214165A3 (en) 2009-01-30 2010-09-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for manipulating an audio signal comprising a transient event
CN102396024A (zh) 2009-02-16 2012-03-28 韩国电子通信研究院 使用自适应正弦波脉冲编码的用于音频信号的编码/解码方法及其设备
EP2234103B1 (en) 2009-03-26 2011-09-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Device and method for manipulating an audio signal
KR20100115215A (ko) 2009-04-17 2010-10-27 삼성전자주식회사 가변 비트율 오디오 부호화 및 복호화 장치 및 방법
EP3352168B1 (en) 2009-06-23 2020-09-16 VoiceAge Corporation Forward time-domain aliasing cancellation with application in weighted or original signal domain
CN101958119B (zh) 2009-07-16 2012-02-29 中兴通讯股份有限公司 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法
CA2862715C (en) 2009-10-20 2017-10-17 Ralf Geiger Multi-mode audio codec and celp coding adapted therefore
TWI430263B (zh) 2009-10-20 2014-03-11 Fraunhofer Ges Forschung 音訊信號編碼器、音訊信號解碼器、使用混疊抵消來將音訊信號編碼或解碼之方法
PL2473995T3 (pl) 2009-10-20 2015-06-30 Fraunhofer Ges Forschung Koder sygnału audio, dekoder sygnału audio, sposób dostarczania zakodowanej reprezentacji treści audio, sposób dostarczania dekodowanej reprezentacji treści audio oraz program komputerowy do wykorzystania w zastosowaniach z małym opóźnieniem
CN102081927B (zh) 2009-11-27 2012-07-18 中兴通讯股份有限公司 一种可分层音频编码、解码方法及系统
US8428936B2 (en) 2010-03-05 2013-04-23 Motorola Mobility Llc Decoder for audio signal including generic audio and speech frames
US8423355B2 (en) 2010-03-05 2013-04-16 Motorola Mobility Llc Encoder for audio signal including generic audio and speech frames
CN103069484B (zh) 2010-04-14 2014-10-08 华为技术有限公司 时/频二维后处理
TW201214415A (en) 2010-05-28 2012-04-01 Fraunhofer Ges Forschung Low-delay unified speech and audio codec
AR085895A1 (es) 2011-02-14 2013-11-06 Fraunhofer Ges Forschung Generacion de ruido en codecs de audio
EP2676268B1 (en) 2011-02-14 2014-12-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing a decoded audio signal in a spectral domain

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI748339B (zh) * 2019-02-13 2021-12-01 弗勞恩霍夫爾協會 用於包括全訊框丟失隱匿及部分訊框丟失隱匿的lc3隱匿之解碼器及解碼方法
US11875806B2 (en) 2019-02-13 2024-01-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-mode channel coding
US12009002B2 (en) 2019-02-13 2024-06-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio transmitter processor, audio receiver processor and related methods and computer programs
US12039986B2 (en) 2019-02-13 2024-07-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder and decoding method for LC3 concealment including full frame loss concealment and partial frame loss concealment

Also Published As

Publication number Publication date
AR085218A1 (es) 2013-09-18
BR112013020324B8 (pt) 2022-02-08
US9384739B2 (en) 2016-07-05
CN103620672B (zh) 2016-04-27
KR101551046B1 (ko) 2015-09-07
TWI484479B (zh) 2015-05-11
WO2012110447A1 (en) 2012-08-23
HK1191130A1 (zh) 2014-07-18
ES2539174T3 (es) 2015-06-26
MY167853A (en) 2018-09-26
KR20140005277A (ko) 2014-01-14
EP2661745A1 (en) 2013-11-13
ZA201306499B (en) 2014-05-28
AU2012217215A1 (en) 2013-08-29
RU2630390C2 (ru) 2017-09-07
RU2013142135A (ru) 2015-03-27
JP5849106B2 (ja) 2016-01-27
PL2661745T3 (pl) 2015-09-30
JP2014506687A (ja) 2014-03-17
EP2661745B1 (en) 2015-04-08
BR112013020324A2 (pt) 2018-07-10
SG192734A1 (en) 2013-09-30
CN103620672A (zh) 2014-03-05
BR112013020324B1 (pt) 2021-06-29
US20130332152A1 (en) 2013-12-12
AU2012217215B2 (en) 2015-05-14
CA2827000A1 (en) 2012-08-23
CA2827000C (en) 2016-04-05
MX2013009301A (es) 2013-12-06

Similar Documents

Publication Publication Date Title
TW201248616A (en) Apparatus and method for error concealment in low-delay unified speech and audio coding
US11462221B2 (en) Apparatus and method for generating an adaptive spectral shape of comfort noise
JP5405659B2 (ja) 消去されたスピーチフレームを再構成するためのシステムおよび方法
JP6306175B2 (ja) 時間ドメイン励振信号に基づくエラーコンシールメントを用いて、復号化されたオーディオ情報を提供するオーディオデコーダおよび復号化されたオーディオ情報を提供する方法
JP6306177B2 (ja) 時間ドメイン励振信号を修正するエラーコンシールメントを用いて、復号化されたオーディオ情報を提供する、オーディオデコーダおよび復号化されたオーディオ情報を提供する方法
KR20200081467A (ko) 인코딩 및 디코딩 오디오 신호들