TWI476760B - 用以使用暫態檢測及品質結果將音訊信號的部分編碼之裝置與方法 - Google Patents
用以使用暫態檢測及品質結果將音訊信號的部分編碼之裝置與方法 Download PDFInfo
- Publication number
- TWI476760B TWI476760B TW101104538A TW101104538A TWI476760B TW I476760 B TWI476760 B TW I476760B TW 101104538 A TW101104538 A TW 101104538A TW 101104538 A TW101104538 A TW 101104538A TW I476760 B TWI476760 B TW I476760B
- Authority
- TW
- Taiwan
- Prior art keywords
- encoding
- audio signal
- algorithm
- signal
- transient
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 title claims description 95
- 230000001052 transient effect Effects 0.000 title claims description 88
- 238000001514 detection method Methods 0.000 title claims description 37
- 238000000034 method Methods 0.000 title claims description 32
- 238000004422 calculation algorithm Methods 0.000 claims description 165
- 238000004590 computer program Methods 0.000 claims description 8
- 238000001914 filtration Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 claims description 4
- 230000007704 transition Effects 0.000 description 11
- 238000005259 measurement Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 6
- 238000005070 sampling Methods 0.000 description 6
- 230000003068 static effect Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 238000012935 Averaging Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 230000005284 excitation Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000013139 quantization Methods 0.000 description 3
- 238000012876 topography Methods 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 210000004704 glottis Anatomy 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
- G10L19/025—Detection of transients or attacks for time/frequency resolution switching
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/03—Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
- G10L19/07—Line spectrum pair [LSP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
- G10L19/107—Sparse pulse excitation, e.g. by using algebraic codebook
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
- G10L19/13—Residual excited linear prediction [RELP]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/69—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Algebra (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
本發明係有關音訊編碼,以及係特別論及交換式音訊編碼,其中,就不同之時間部分,係使用不同之編碼演算法,來產生該編碼成之信號。
一些可就不同之音訊信號部分而決定不同之編碼演算法的交換式音訊編碼器係為所習見。有一個範例為一個界定在國際標準3GPP TS 26.290 V6.1.0 2004-12中所謂之擴展型寬頻調適性多位元率編解碼器或AMR-WB+編解碼器。在此技術性專利說明書中,係說明該編碼概念,其係基於AMR-WB編解碼器,藉由添加TCX(變換編碼激發)、頻寬擴展、和立體聲,來擴展該ACELP(代數碼激式線性預測)。該AMR-WB+音訊編解碼器,係在一個內部取樣頻率FS下,處理一些等於2048個樣本之輸入訊框。該內部取樣頻率,係受限於12,800至38,400 Hz之範圍。該等2048個樣本訊框,係被分割成兩個臨界取樣等頻帶。此會產生兩個對應於低頻(LF)和高頻(HF)帶的1024個樣本之超級訊框。每個超級訊框,係被分割成四個256-樣本訊框。該內部取樣率下之取樣,係藉由使用一個可重新取樣該輸入信號之可變取樣轉換方案來獲致。該等LF和HF信號,接著係使用兩個不同之解決方案來加以編碼。該LF信號係基於交換式ACELP和TCX,而使用"核心"編碼器/解碼器,來加以編碼及解碼。在該ACELP模態中,所使用為該標準化AMR-WB
編解碼器。該HF信號係使用一個頻寬擴展(BWE)方法,以相當少之位元(16位元/訊框)來加以編碼。
自編碼器傳輸至解碼器之參數,係該等模態選定位元、該等LF參數和HF信號參數。每個1024-樣本超級訊框有關之參數,係被分解成四個同等大小之封包。當該輸入信號為立體聲時,該等左右聲道,係使結合成一個ACELP-TCX編碼有關的一些單聲道信號,而該立體聲編碼,會接收兩者之輸入聲道。在該AMR-WB+解碼器結構中,該等LF和HF頻帶,係分開加以解碼。接著,該等頻帶係結合成一個合成濾波器組。若該輸出係僅受限於單聲道,該等立體聲參數便會被省略,以及該解碼器會在單聲道模態中運作。
該AMR-WB+編解碼器,在編碼該LF信號時,會就該等ACELP和TCX模態兩者,應用LP(線性預測)分析。該等LP係數,係在每個64-樣本子訊框下以線性方式加以內插。該LP分析取音框,係一個長度384樣本之半餘弦。該編碼模態係基於閉迴路合成分析法(ABS)來加以選擇。就ACELP訊框而言,唯有256個樣本訊框會被考慮,而在TCX模態中,可能會有256、512、或1024個樣本訊框。該ACELP編碼,係包括長期預測(LTP)分析合成代數碼本激勵。在該TCX模態中,一個知覺上加權之信號,係在該變換域中加以處理。該傅立葉變換之加權信號,係使用分割式多權量柵格量化(代數向量量化)來加以量化。該變換係在1024、512、或256個樣本取音框中加以計算。該激勵信號,係透
過該逆加權濾波器,藉由逆濾波一個量化加權之信號,而加以恢復。為決定某一定之音訊信號部分,是否要使用該ACELP模態或該TCX模態來加以編碼,會使用一個閉迴路模態選擇或一個開迴路模態選擇。在一個閉迴路模態選擇中,會使用11個接續之嘗試。緊跟一個嘗試之後,在兩個要被比較之模態間,會作出一個模態選擇。該選擇標準,係該加權之音訊信號與該合成之加權音訊信號間的平均節段SNR(信號雜訊比)。因此,該編碼器會執行一個在兩者編碼演算法中的完整編碼,一個依據兩者編碼演算法的完整解碼,以及繼而編碼/解碼兩者運作之結果,係使與該原始信號作比較。因此,就每個編碼演算法而言,亦即,一方面是ACELP,以及另一方面是TCX,會得到一個節段SNR值,以及會使用上述藉由就該個別之子訊框橫跨該節段SNR值而平均化使橫跨一個訊框所決定而具有較佳之節段SNR值或具有較佳之平均節段SNR值的編碼演算法。
有一個附加之交換式音訊編碼方案,為所謂之USAC編碼器(USAC=聯合語音音頻編碼)。此編碼演算法,係說明在ISO/IEC 23003-3中。該一般性結構可說明如下。首先,其中有一個常見之前/後處理系統,其具有一個可操控立體聲或多聲道處理MPEG環場功能單元和一個用以產生該輸入信號之較高音訊頻率的參數示值之增強型SBR單元。接著,其中具有兩條分支,一個包括先進型音訊編碼(AAC)工具路徑,以及另一個包括線性預測編碼(LP或LPC域)式路徑,其復賦有之特色是,該LPC殘差係或以頻域表示或以
時域表示。所有就AAC和LPC兩者所傳輸之頻譜,係表示在緊接量化和算術編碼後之MDCT域中。該時域表示係使用一個ACELP激勵編碼方案。該解碼器之功能,為要找出該位元流酬載中之量化音訊頻譜或時域表示的敘述,以及要解碼該等量化值和其他重建資訊。因此,該編碼器會執行兩個決策。第一項決策為要執行頻域對線性預測域模態決策有關之信號分類。第二項決策為要在線性預測域(LPD)內,決定某一信號部分,為或使用ACELP或使用TCX來加以編碼。
為在需要極低延遲之實況中,應用一個交換式音訊編碼方案,勢必要特別留意變換式編碼部分,因為此等編碼部分,會導入一個取決於該變換長度和取音框設計之特定延遲。所以,該USAC編碼概念,由於上述具有某一涉及變遷式取音框的相當可觀之變換長度和長度調適性(亦知名為區塊交換)的改進型AAC編碼分支所致,並不適用於極低延遲應用。
另一方面,該AMR-WB+編碼概念,由於該編碼器側要被使用的究為ACELP或TCX之決策所致,被發現會很是棘手。ACELP可提供一個良好之編碼,但在某一信號部分不適合該ACELP編碼模態時,可能會有顯著之音訊品質問題產生。因此,就品質之理由而言,一旦該輸入信號未包含語音,人們或許會傾向於使用TCX。然而,在低位元率下過多地使用TCX,將會造成一些位元率問題,因為TCX提供的是一個相當低之編碼增益。所以,當人們注視該編碼
增益時,一旦有可能,彼等或許會使用ACELP,但正如先前所陳述,此會由於ACELP舉例而言就音樂和類似靜態信號而言並非最佳之事實,而造成一些音訊品質之問題。
該節段SNR計算,係一種品質計量,其可僅基於該結果,亦即,該原始之信號或該經編碼/解碼之信號間的SNR是否較佳,來決定該較佳之編碼模態,以致使用一個較佳之SNR中所產生的編碼演算法。然而,此始終勢必要在位元率限制條件下運作。所以,僅使用一個品質計量,諸如舉例而言,該節段SNR計量,已發現並不會總會在品質與位元率之間,產生最佳之折衷處理。
本發明之目的,係為提供一個用以編碼部份之音訊信號的先進概念。
此目的之達成,係藉由一種依據專利申請項第1項可編碼部份之音訊信號的裝置,或藉由一種依據專利申請項第14項可編碼部份之音訊信號的方法。
本發明基於之研究結果是,一個適用於較多暫態信號部分之第一編碼演算法與一個適用於較多靜態信號部分之第二編碼演算法間的較佳決策,可在該決策不但基於一個品質計量而且附加地基於一個暫態偵測結果時得到。雖然該品質計量僅著眼於與該原始信號相關之編碼/解碼鏈的結果,該暫態偵測結果,係附加地單單取決於該原始輸入音訊信號之分析。因此,上述最後決定究要以何者編碼演算法來編碼一個音訊信號部分之兩者計量,亦即,一方面
之品質結果和另一方面之暫態偵測結果,的一個組合,已發現會在一方面之編碼增益與另一方面之音訊品質間,導致一個改善之折衷處理。
一個用以編碼一個音訊信號部分使就該音訊信號部分得到一個編碼成之音訊信號的裝置,包含一個暫態偵測器,其可決定一個暫態信號是否位於該音訊信號部分,使得到一個暫態偵測結果。該裝置進一步包含一個編碼器級段,其可針對該音訊信號,執行一個第一編碼演算法,此第一編碼演算法,係具有一個第一特性,以及可針對該音訊信號,執行一個第二編碼演算法,此第二編碼演算法,係具有一個不同於該第一特性之第二特性。在一個實施例中,上述與第一編碼演算法相關聯之第一特性,係較適合較多暫態之信號,以及上述與第二編碼演算法相關聯之第二特性,係較適合較多靜態之信號。典型地,該第一編碼演算法,係一個ACELP編碼演算法,以及該第二編碼演算法,係一個TCX編碼演算法,其可能基於一個改進型離散餘弦變換、FFT變換、或任何其他變換或濾波器組。此外,有一個處理器,被設置來決定何者編碼演算法所產生編碼成之音訊信號,更近似該音訊信號部分,以得到一個品質結果。此外,係設有一個控制器,其中,該控制器經配置,可決定該音訊信號部分有關編碼成之音訊信號在產生上,或藉由該第一編碼演算法,或藉由該第二編碼演算法。依據本發明,該控制器經配置,可執行此決策,使不僅基於該品質結果,而且附加地基於該暫態偵測結果。
在一個實施例中,該控制器經配置,可決定該第二編碼演算法,雖然當該暫態偵測結果,指出一個非暫態信號時,該品質結果係指出該第一編碼演算法有關的一個較佳品質。此外,該控制器經配置,可決定該第一編碼演算法,雖然當該暫態偵測結果,指出一個暫態信號時,該品質結果係指出該第二編碼演算法有關的一個較佳品質。
在又一實施例中,該暫態結果可在其中否定該品質結果之此一決策,係使用一個遲滯功能加以增強,以致於唯有當該第一編碼演算法已為之決定的較早信號部分之數目,小於某一預定數目時,該第二編碼演算法方會被決定。類似地,唯有當該第二編碼演算法在過去已為之決定的較早信號部分之數目,小於某一預定數目時,該第一編碼演算法方會被決定。一個出自該遲滯處理之優點是,彼等編碼模態間轉變之數目,就某些輸入信號而言會被縮減。該信號中之關鍵點處的轉變過於頻繁,就低位元率而言可能會清楚地產生一些可聽聞之假像。此等假像之可能性,係藉由體現該遲滯作用而使縮減。
在又一個實施例中,當該品質結果,就一個演算法編碼,指出一個有說服力之品質優點時,該品質結果相對於暫態偵測結果係屬有利。接著,上述比起另一個編碼演算法具有好甚多之品質結果的編碼演算法會被選定,而無論該信號是否為一個暫態信號。另一方面,當兩者編碼演算法間之品質差異並非如此高時,該暫態偵測結果可變為決定性。就此一目的而言,較佳的是不僅決定一個二元品質
結果,而且決定一個定量性品質結果。一個二元品質結果,或將僅指出何者編碼演算法,會產生一個較佳之品質,而一個定量性品質結果,不僅會決定何者編碼演算法,會產生一個較佳之品質,而且會決定該對應之編碼演算法究有多好。另一方面,人們或亦可使用一個定量性暫態偵測結果,而一個二元暫態偵測結果,基本上或將同樣是充份的。
因此,一方面相對於位元率間之良好折衷處理,以及另一方面相對於品質,本發明可提供一個特殊之優點,因為就暫態信號而言,上述產生較低品質之編碼演算法會被選定。當該品質結果有利於舉例而言TCX決策時,該ACELP模態仍然會被採用,其或可能會產生一個約略降低之音訊品質,但最終會產生一個與使用該ACELP模態相關聯之較高的編碼增益。
另一方面,當該品質結果有利於一個ACELP訊框時,一個TCX決策仍然會就非暫態信號被採用。因此,該約略降低之編碼增益會被接受,使有利於一個較佳之音訊品質。
因此,本發明會在品質與位元率之間,產生一個改進之折衷處理,此基於之事實是,所考慮的不僅是該被編碼再被解碼之信號的品質,但除此之外,該實際要被編碼之輸入信號,亦會相對於其暫態特性加以分析,以及此暫態分析之結果會被使用,使附加地影響有關一個較適合暫態信號之演算法或一個較適合靜態信號之演算法的決策。
本發明之又一實施例,繼而係藉由參照所附繪圖來加
以例示,其中:第1圖例示依據一個實施例用以編碼部份之音訊信號的裝置之方塊圖;第2圖例示一個有關兩個不同之編碼演算法的列表和彼等適用之信號;第3圖例示該等品質狀況、暫態狀況、和遲滯狀況方面之概觀,彼等可彼此獨立地加以應用,但彼等較佳的是加以聯合地應用;第4圖例示一個可指出就不同之處境是否執行一個轉變的狀態表;第5圖例示一個用以決定一個實施例中之暫態結果的流程圖;第6a圖例示一個用以決定一個實施例中之品質結果的流程圖;第6b圖例示針對第6a圖之品質結果的更多細節;而第7圖則例示依據一個實施例用以編碼之裝置的更加詳細之方塊圖。
第1圖例示一個用以編碼在一條輸入線路10處所提供之音訊信號部分的裝置。該音訊信號部分,係輸入進一個暫態偵測器12內,以偵測是否有暫態信號位於該音訊信號部分內,使在線路14上面,得到一個暫態偵測結果。此外,有一個編碼器級段16提供,其中,該編碼器級段經配置,可針對該音訊信號,執行一個第一編碼演算法,該第一編
碼演算法,具有一個第一特性。此外,該編碼器級段16經配置,可針對該音訊信號,執行一個第二編碼演算法,其中,該第二編碼演算法,具有一個不同於第一特性之第二特性。
附加地,該裝置包含一個處理器18,其可決定該等第一和第二編碼演算法中,何者編碼演算法,會產生一個編碼成而更近似該原始音訊信號部分之音訊信號。該處理器18係基於該線路20上面之此一決策,來產生一個品質結果。該線路20上面之品質結果和該線路14上面之暫態偵測結果兩者,會提供給一個控制器22。該控制器22經配置,可決定就該音訊信號部分編碼成之音訊信號,為或由該第一編碼演算法來產生,或由該第二編碼演算法來產生。就此一決策而言,不僅是該品質結果20會被使用,而且該暫態偵測結果14亦會被使用。此外,有一個輸出介面24,可選擇地提供,其中,該輸出介面,會輸出一個編碼成之音訊信號,而舉例而言,作為一個在線路26上面編碼成之信號的位元流或不同之示值。
在一個實現體中,在該編碼器級段16,藉由合成處理來執行一項分析的情況中,該編碼器級段16,會接收此音訊信號之同一部分,以及會藉由該第一編碼演算法,來編碼此音訊信號部分,使得到該音訊信號部分之第一編碼成之示值。此外,該編碼器級段,會使用該第二編碼演算法,來產生該音訊信號之同一部分的編碼成之示值。此外,該編碼器級段16,在藉由合成處理之此一分析中,係包含就
該等第一編碼演算法和第二編碼演算法兩者有關之解碼器。有一個對應之解碼器,使用一個與該第一編碼演算法相關聯之解碼演算法,來解碼該第一編碼成之示值。此外,有一個用以執行又一個與該第二編碼演算法相關聯之解碼演算法的解碼器提供,以致最終該編碼器級段,不僅擁有兩個與該音訊信號之同一部分有關的編碼成之示值,而且亦擁有兩個與該線路10上面之原始音訊信號的同一部分有關之解碼成的示值。該兩解碼成之信號,接著會經由線路28提供給該處理器,以及該處理器會使兩者解碼之示值,與經由輸入端30得到之原始音訊信號的同一部分相比較。接著,每個編碼演算法有關之節段SNR會被決定。此所謂之品質結果,在一個實施例中,提供的不僅是該較佳之編碼演算法的示值,亦即,一個已產生一個較佳之SNR的為該第一編碼演算法或該第二編碼演算法之二元信號。附加地,該品質結果會指出一個定量性資訊,亦即,該對應之編碼演算法究有多好,舉例而言多少分貝。
在此一處境中,該控制器在完全取決於該品質結果20時,會經由線路32,來存取該編碼器級段,而使該編碼器級段,將該對應之編碼演算法早經儲存的編碼成之示值,轉送給該輸出介面24,以致該編碼成之示值,可表示該編碼成之音訊信號中的原始音訊信號之對應部分。
或者,當該處理器18,執行一個開迴路模態,以決定該品質結果時,兩者編碼演算法,並非必然要應用至一個且同一個音訊信號部分。取而代之的是,該處理器18,會
決定何者編碼演算法屬較佳,以及接著,該編碼器級段16,係經由線路28加以控制,使僅應用該處理器所指出之編碼演算法,以及接著,該被選定之編碼演算法所產生的此一編碼成之示值,會經由該線路34,提供給該輸出介面24。
取決於該編碼器級段16之特定實現體,兩者編碼演算法,可能會在該LPC域中運作。在此一狀況中,諸如就ACELP為該第一編碼演算法以及TCX為該第二編碼演算法而言,會有一個常見之LPC預處理被執行。此LPC預處理,可能包括該音訊信號部分之LPC分析,其可決定該音訊信號部分有關之LPC係數。接著,有一個LPC分析濾波器,係使用該被決定之LPC係數來加以調整,以及該原始音訊信號,會被此LPC分析濾波器濾波。接著,該編碼器級段,會計算該LPC分析濾波器之輸出與該音訊輸入信號間的一個逐樣本之差異,藉以計算該LPC殘差信號,其接著會歷經一個開迴路模態中之第一編碼演算法或第二編碼演算法,或者其係如先前所說明,在一個閉迴路模態中,提供給兩者編碼演算法。或者,該LPC濾波器所為之濾波,和該殘差信號之逐樣本決策,可以該USAC標準中所說明之FDNS(頻域雜訊成形)技術來替換。
第2圖例示該編碼器級段之較佳實現體。就該第一編碼演算法而言,上述具有一個CELP編碼特性之ACELP編碼演算法會被使用。此外,此編碼演算法,係較適合暫態信號。該第二編碼演算法,具有某一編碼特性,其可使此第二編碼演算法,較適合非暫態信號。典型地,有一個類似TCX
之變換激勵編碼演算法會被使用,以及特言之,一個TCX 20編碼演算法係屬較佳,其具有一個20 ms之訊框長度(由於重疊所致,取音框長度可較高),其使得第1圖中所例示之編碼概念,特別適合低延遲實現體,彼等在一些即時實況中係屬必需,諸如一些其中如在電話應用中以及特別是在行動電話或蜂巢式電話應用中具有雙通路通訊之實況。
然而,本發明在該等第一和第二編碼演算法之其他組合中,係附加地屬有用。典型地,上述較適合暫態信號之第一編碼演算法,可能包含任何習見之時域編碼器,諸如使用GSM之編碼器(G.729),或任何其他時域編碼器。另一方面,該非暫態信號編碼演算法,可為任何習見之變換域編碼器,諸如MP3、AAC、AC3、或任何其他變換或濾波器排組式音訊編碼演算法。然而,就一個低延遲實現體而言,一方面是ACELP和另一方面是TCX之組合,其中,特別地,該TCX編碼器,可使基於一個FFT,或甚至更佳的是基於一個MDCT,而較佳的是具有一個短取音框長度。因此,兩者編碼演算法,係在上述藉由使用一個LPC分析濾波器使該音訊信號變換成該LPC域而取得之LPC域中運作。然而,該ACELP接著會在LPC-"時"-域中運作,而該TCX編碼器,會在該LPC-"頻"-域中運作。
繼而,第1圖之控制器22的較佳實現體,係在第3圖之環境背景中加以討論。
較佳的是,上述類似ACELP之第一編碼演算法與上述類似TCX 20之第二編碼演算法間的轉變,係使用三種條件
來執行。該第一條件係第1圖之品質結果20所表示之品質條件。該第二條件係第1圖之線路14上面的暫態偵測結果所表示之暫態條件。該第三條件係一個遲滯條件,其係取決於該控制器22過去所為之決策,亦即,有關該音訊信號之較早部分。
該品質條件在體現上,可在該品質條件指出該第一編碼演算法與該第二編碼演算法間的一個大品質距離時,執行一個至該較高品質編碼演算法之轉變。舉例而言,當一個編碼演算法被決定,優於另一個編碼演算法時,舉例而言,多達一個dB SNR差異時,則該品質條件會決定一個轉變,或者換個角度而論,就該音訊信號實際考慮之部分,實際使用之編碼演算法,而無關乎任何暫態偵測或遲滯處境。
然而,當該品質條件,僅指出一個在兩者編碼演算法間之小品質距離時,諸如一或以下dB SNR差異之品質距離,而在該暫態偵測結果指出,該較低品質編碼演算法,係符合該音訊信號特性時,亦即,無論該音訊信號是否為暫態,有一個轉變至該較低品質編碼演算法可能會發生。然而,當該暫態偵測結果指出,該較低品質編碼演算法,並不符合該音訊信號特性時,則該較高之品質編碼演算法,勢必要被使用。在後者之情況中,再一次,該品質條件會決定該結果,但唯有當該較低品質編碼演算法與該音訊信號之暫態/靜態處境間的一個特定匹配並未配合在一起時。
該遲滯條件在與該暫態條件之組合中,係特別有用,亦即,其中,唯有當少於最後N個訊框已以另一個演算法加以編碼時,方會執行至該較低品質編碼演算法之轉變。在一些較佳之實施例中,N係等於五個訊框,但同樣可使用的,是其他較佳地低於或等於N個訊框或信號部分之值,彼等各包含某一超過以128個樣本為例之最小數目的樣本。
第4圖例示一個取決於某一定處境之狀態改變表。左欄指出就TCX或ACELP而言之較早訊框的數目為大於N或小於N之處境。
最後一行指出其中是否就TCX而言有一個大品質距離,或就ACELP而言有一個大品質距離。在此兩處境中,彼等係頭兩欄,以一個"X"表示之情況,會有一個改變被執行,以"0"表示之情況,則無改變被執行。
此外,該最後兩欄指出的處境是,當就TCX有一個小品質距離被決定時,以及當有一個暫態信號被偵測到時,或者當就ACELP有一個小品質距離被決定,以及該信號部分被偵測為屬非暫態時。
該最後兩欄之頭兩行兩者指出,當較早訊框之數目大於10時,該品質結果係屬決定性。因此,當其中就一個編碼演算法有一個來自過去之有說服力的指示時,則該暫態偵測亦下會發揮作用。
然而,當正在該兩編碼演算法中的一個之中編碼的較早訊框之數目小於N時,有一個在欄位40處所指出就暫態信號自TCX至ACELP之轉變會被執行。附加地,如欄位41所
指出,有一個自ACELP至TCX之改變會被執行,即使是當由於吾等具有一個非暫態信號之事實所致,其中存在一個有利於ACELP之小品質距離時。當該最後LCLP訊框之數目小於N時,後繼之訊框亦會以ACELP來編碼,以及因而如欄位42處所指出,並不需要轉變。附加地,當TCX訊框之數目小於N時,以及當其中就ACELP存在一個小品質距離,以及該信號為非暫態時,當前之訊框便會使用TCX來編碼,以及如欄位43處所指出,並不需要轉變。因此,該遲滯之影響,藉由比較欄位42、43與此兩欄位上方的四個欄位,係清楚可見。
因此,本發明較佳的是,藉由一個暫態偵測器之輸出,來影響該閉迴路決策有關之遲滯。所以,如同在AMR-WB+中,其中無論採用的是TCX或ACELP,並不會有一個純閉迴路決策存在。取而代之的是,該閉迴路計算,會受到該暫態偵測結果之影響,亦即,每一個暫態信號部分,係在該音訊信號中被決定。所以,無論被計算的為一個ACELP訊框或一個TCX訊框之決策,並不僅取決於該閉迴路計算,或者一般而言,該品質結果卻是附加地取決於一個是否偵測到一個暫態。
換言之,該用以決定就當前之訊框究要使用何者編碼演算法之遲滯,可使表示如下:當就TCX而言之品質結果,略小於就ACELP而言之品質結果時,以及在當前考慮之信號部分,或者僅僅是當前之訊框,並非為暫態時,則TCX會被使用而非ACELP。
另一方面,當就ACELP而言之品質結果,略小於就TCX而言之品質結果時,以及當該訊框為暫態時,則所使用為ACELP而非TCX。較佳的是,有一個平坦度計量,係被計算為該暫態偵測結果,其係一個定量性數字。當該平坦度大於或等於某一定值時,則該訊框會被決定為屬暫態。另一方面,當該平坦度小於此臨界值時,則該訊框係被決定為非暫態。就一個臨界值而言,平坦度計量為二係屬較佳,而該平坦度之計算,係更詳細地說明於第5圖中。
此外,就該品質結果而言,一個定量性計量係屬較佳。當一個SNR計量,或者特別地,一個節段SNR計量被使用時,則如先前使用之術語"略小於",可能意謂小於一分貝。因此,當就TCX和ACELP而言之SNR,彼此差異較大時,或者換個角度而論,當兩者SNR值間之絕對差異,大於一分貝時,則第3圖之品質條件,會單獨就該當前之音訊信號部分,而決定該編碼演算法。
上文所說明之決策,在該等過去的或較早的訊框之TCX或ACELP的暫態偵測或遲滯輸出或SNR,包括在該假設之條件中時,可進一步加以精心製作。因此,有一個遲滯被建立,其就一個實施例而言,在第3圖中係例示為條件3。特言之,第3圖例示的變更形式係當該遲滯輸出,亦即,有關過去之決策,被用來修飾該暫態條件時。
或者,一個基於較早之TCX或ACELP-SNR的進一步遲滯條件可能包括的是,一個有關該較低品質編碼演算法之決策,係唯有當相對於該較早之訊框的SNR差異之改變,
為低於某一所舉為例之臨界值時,方會被執行。一個進一步之實施例,在該暫態偵測結果,為一個定量性數字時,可能包含一個或多個較早訊框有關之暫態偵測結果的用法。接著,一個至該較低品質編碼演算法之轉變,舉例而言,可能唯有當自較早之訊框至當前之訊框的定量性暫態偵測結果之改變,為再一次低於一個臨界值時,方會被執行。此等用以進一步修飾第3圖中之遲滯條件3的數字之其他組合,可證明係屬有用,以得到一方面為該位元率與另一方面為該音訊品質間之較佳折衷處理。
此外,如第3圖之環境背景中所例示及如先前所說明之遲滯條件可代替或附加又一個遲滯加以使用,後者舉例而言,係基於該等ACELP和TCX編碼演算法之內部分析資料。
繼而,係參照第5圖,來例示第1圖之線路14上面的暫態偵測結果之較佳決策。
在步驟50中,上述類似在線路10上面之PCM輸入信號的時域音訊信號,係經高通濾波,使得到一個高通濾波之音訊信號。接著,在步驟52中,上述可使等於該音訊信號部分之高通濾波信號的訊框,係被細分為以八個為例之多數子區塊。接著,在步驟54中,每個子區塊有關的一個能量值會被計算。此能量計算可包括平方化該子區塊中的每個樣本值,和繼而使該等平均化與否之平方化的樣本相加。接著,在步驟56中,係形成相鄰子區塊之配對。該等配對可包括:一個包含第一和第二子區塊之第一配對、一
個包含第二和第三子區塊之第二配對、一個包含第三和第四子區塊之第三配對、等等。附加地,一個包含該較早之訊框的最後子區塊和該當前之訊框的第一子區塊之配對,同樣可被使用。或者,有其他形成配對之方式可被執行,諸如舉例而言,僅形成第一和第二子區塊之配對、第三和第四子區塊之配對、等等。接著,亦如在第5圖之區塊56中所概括,每個子區塊配對之較高的能量值會被選定,以及如步驟58所概括,係使除以該子區塊配對之較低能量值。接著,如第5圖之區塊60中所概括,步驟58就一個訊框而言之所有結果係使相結合。此結合可能包括使區塊58之結果相加及平均化,其中,該相加結果係除以配對數目,諸如當每個子區塊有八個配對在區塊56中被決定時的八個。區塊60之結果係該平坦度計量,其會被該控制器22使用,以決定一個信號部分是否為暫態。當該平坦度計量,大於或等於2時,會有一個暫態信號部分被偵測到,而當該平坦度計量低於2時,會有一個信號,被決定為非暫態或靜態。然而,其他在1.5與3間之臨界值,同樣可被使用,但2之臨界值已顯示會提供最佳之結果。
理當注意的是,其他之暫態偵測器同樣可被使用。一些暫態信號,可能附帶包含有聲語音信號。傳統上,一些暫態信號係包含鼓掌狀信號或響板或一些由談話字元"p"或"t"或等等得到之信號所組成的語言爆破音。然而,一些類似"a"、"e"、"i"、"o"、"u"之元音,在傳統解決方案中,並非意謂為暫態信號,因為彼等具有週期性聲門化或音調
脈波之特性。然而,由於元音亦表示一些有聲語音信號,元音就本發明而言,亦被考慮為暫態信號。此等信號之偵測在完成上,除第5圖之程序外或替代地,可藉由一些可辨別有聲語音與無聲語音之語音偵測器,或者藉由評估與一個音訊信號相關聯之元資料,以及將該對應之部分為一個暫態或非暫態部分,指示給一個元資料評估器。
繼而,第6a圖在說明上係為例示第三種計算第1圖之線路20上面之品質結果的方式,亦即,該處理器18如何做較佳之配置。
在區塊61中,係說明一個閉迴路程序,其中,就每個多數之可能性而言,一個部分係使用該等第一和第二編碼演算法,來加以編碼及解碼。接著,在步驟63中,一個類似節段SNR之計量,係依據該等編碼及再次解碼之音訊信號與該原始信號間的差異來計算。此計量係就兩者編碼演算法加以計算。
接著,一個使用個別之節段SNR的平均節段SNR,係在步驟65中加以計算,以及此計算會就兩者編碼演算法再次加以執行,以致最終在步驟65中,會就該音訊信號之同一部分,產生兩個不同之平均SNR值。此等有關一個訊框之節段SNR值間的差異,係被用作第1圖之線路20上面的定量性品質結果。
第6b圖例示兩個方程式,其中,上部方程式係被用在區塊63中,以及下部方程式係被用在區塊65中。χ w
代表該加權之音訊信號,以及代表該編碼及再次解碼之加權信
號。
在區塊65中所執行之平均化,係橫跨一個訊框之平均化,其中,每個訊框係包含許多子訊框NSF
,以及四個此等訊框,共同形成一個超訊框。因此,一個超訊框包含1024個樣本,一個個別之訊框,包含2056個樣本,以及第6b圖中之上部方程式或步驟63為之執行的每個子訊框,包含64個樣本。在區塊63中所使用之上部方程式中,n為樣本數目指數,以及N為該子訊框中等於63之最大樣本數目,而指示一個子訊框,為具有64個樣本。
第7圖例示本原創性類似第1圖之實施例用以編碼的裝置之又一實施例,以及相同之參考數字,係指明類似之元件。然而,第7圖例示該編碼器級段16之較詳細的表示圖,其包含一個用以執行加權和LPC分析/濾波之預處理器16a,以及此預處理器區塊16a,會將線路70上面之LPC資料,給該輸出介面24。此外,第1圖之編碼器級段16,包含16b處之第一編碼演算法和16c處之第二編碼演算法,彼等分別為該ACELP編碼演算法和該TCX編碼演算法。
此外,該編碼器級段16,可能或包含一個連接在該等區塊16d、16c前面之開關16d,或包含一個連接在該等區塊16b、16c後面之開關16e,其中,"前面"和"後面"係指稱信號流動方向,其自第7圖之頂部至底部,至少相對於區塊16a至16e。區塊16d將不會出現在一個閉迴路決策中。在此情況中,唯有開關16e將會出現,因為該等編碼演算法16b、16c兩者,係針對該音訊信號的一個且同一部分而運作,以
及該被選定之編碼演算法的結果,將會被取出,以及會轉送給該輸出介面24。
然而,若一個開迴路決策或任何其他決策之執行,係在兩者編碼演算法針對一個且同一信號而運作之前,則該開關16e將不會出現,但該開關16d將會出現,以及該音訊信號的每個部分,將僅會使用該等區塊16b、16c中的一個來編碼。
此外,特別是就閉迴路模態而言,兩者區塊之輸出,如線路71、72所指明,係連接至該等處理器和控制器區塊18、22。該開關控制,係經由線路73、74,自該等處理器和控制器區塊18、22,至該等對應之開關16d、16e,而使發生。再次地,依據該實現體,該等線路73、74中,通常將僅有一個會在該處。
所以,該編碼成之音訊信號26,且姑不論其他資料,係包含一個ACELP或TCX之結果,其通常將會加上冗餘性編碼,諸如在輸入進該輸出介面24內之前,藉由Huffman編碼或算術編碼。附加地,該LPC資料70,會提供給該輸出介面24,以使納入該編碼成之音訊信號。此外,較佳的是將一個編碼模態決策,附加地包括進該編碼成之音訊信號內,後者會對一個解碼器指示,該音訊信號之當前部分,為一個ACELP或TCX部分。
雖然某些形貌已在一個裝置之環境背景中加以說明,此等形貌很明顯亦表示該對應方法之說明,其中,一個區塊或裝置,係相對於一個方法步驟或一個方法步驟之特
徵。類似地,在一個方法步驟之環境背景中說明的形貌,亦表示一個對應之區塊或項目或一個對應之裝置的特徵之說明。
依據某一定實現體之規範,本發明之實施例,可體現在硬體或軟體中。該實現體在執行上,可使用一個數位儲存媒體,舉例而言,其上儲存有電子可讀取式控制信號之磁片、DVD、CD、ROM、PROM、EPROM、EEPROM、或快閃記憶體,彼等可與一個可程式規劃式電腦系統協動(或者有能力協動),以執行該對應之方法。
某些依據本發明之實施例,包含一個具有電子可讀取式控制信號之非暫時性資料載送器,其係有能力與一個可程式規劃式電腦系統協動,以執行本說明書所說明之方法中的一個。
通常,本發明之實施例,可使體現為一個程式碼之電腦程式產品,該程式碼在運作上,可使該電腦程式產品,在一部電腦上面運行時,執行該等方法中的一個。該程式碼舉例而言,可能係儲存在一部機器可讀取式載體上面。
其他實施例包括上述用以執行本說明書所說明之方法中的一個之電腦程式,其係儲存在一部機器可讀取式載體上面。
換言之,本原創性方法的一個實施例,因而為一個電腦程式,其具有一個程式碼,其在該電腦程式在一部電腦上面運行時,可執行本說明書所說明之方法中的一個。
所以,本原創性方法之又一實施例,為一個資料載體
(或一個數位儲存媒體,或一個電腦可讀取式媒體),其上記錄有上述用以執行本說明書所說明之方法中的一個之電腦程式。
所以,本原創性方法之又一實施例,為一個代表該用以執行本說明書所說明之方法中的一個之電腦程式的資料串流或信號序列。該資料串流或信號序列,舉例而言,經配置可能使經由一個資料通訊連接,舉例而言,經由網際網路,來加以轉移。
又有一個實施例,包括一個處理構件,舉例而言,一個電腦、或一個可程式規劃式邏輯裝置,其經配置或經調適可執行本說明書所說明之方法中的一個。
又有一個實施例,包括一個電腦,其上安裝有上述用以執行本說明書所說明之方法中的一個之電腦程式。
在某些實施例中,一個可程式規劃式邏輯裝置(舉例而言,一個現場可規劃邏輯閘陣列),可能被用來執行本說明書所說明之方法的某些或所有功能性。在某些實施例中,一個現場可規劃邏輯閘陣列,可能與一個微處理器協動,以執行本說明書所說明之方法中的一個。通常,該等方法較佳的是由任何硬體裝置來執行。
上文所說明之實施例,係僅為例示本發明之原理。理應瞭解的是,本說明書所說明之佈置的修飾體和變更形式和細節,將為本技藝之其他專業人士所明瞭。所以,其預期係僅受限於緊接之專利申請項之界定範圍,而非受限於本說明書中之實施例的說明和解釋所呈現之特定細節。
10‧‧‧音訊信號
12‧‧‧暫態偵測器
14‧‧‧暫態檢測結果
16‧‧‧編碼器級段
16b‧‧‧第一編碼演算法(ACELP)
16c‧‧‧第二編碼演算法(TCX)
16d‧‧‧開關
16e‧‧‧開關
18‧‧‧處理器
20‧‧‧品質結果
22‧‧‧控制器
24‧‧‧輸出介面
26‧‧‧編碼成之音訊信號
28‧‧‧線路
30‧‧‧輸入端
32‧‧‧線路
34‧‧‧線路
40-43‧‧‧欄位
50-60,61,63,65‧‧‧運作
71,72,73,74‧‧‧線路
第1圖例示依據一個實施例用以編碼部份之音訊信號的裝置之方塊圖;第2圖例示一個有關兩個不同之編碼演算法的列表和彼等適用之信號;第3圖例示該等品質狀況、暫態狀況、和遲滯狀況方面之概觀,彼等可彼此獨立地加以應用,但彼等較佳的是加以聯合地應用;第4圖例示一個可指出就不同之處境是否執行一個轉變的狀態表;第5圖例示一個用以決定一個實施例中之暫態結果的流程圖;第6a圖例示一個用以決定一個實施例中之品質結果的流程圖;第6b圖例示針對第6a圖之品質結果的更多細節;而第7圖則例示依據一個實施例用以編碼之裝置的更加詳細之方塊圖。
10‧‧‧音訊信號
12‧‧‧暫態偵測器
14‧‧‧暫態檢測結果
16‧‧‧編碼器級段
18‧‧‧處理器
20‧‧‧品質結果
22‧‧‧控制器
24‧‧‧輸出介面
26‧‧‧編碼成之音訊信號
28‧‧‧線路
30‧‧‧輸入端
32‧‧‧線路
34‧‧‧線路
Claims (15)
- 一種用以編碼音訊信號之部分以得到針對該音訊信號之該部分的編碼音訊信號之裝置,其包含:一個暫態檢測器,用以檢測一個暫態信號是否位於該音訊信號之該部分內以取得一個暫態檢測結果;一個編碼器級段,用以針對該音訊信號執行一個第一編碼演算法,該第一編碼演算法具有一個第一特性,以及用以針對該音訊信號執行一個第二編碼演算法,該第二編碼演算法具一個第二特性,該第二特性係不同於該第一特性;一個處理器,用以決定哪一個編碼演算法相對於其它編碼演算法導致對該音訊信號之該部分係較佳近似的一編碼音訊信號,以得到一個品質結果;和一個控制器,用以基於該暫態檢測結果和該品質結果,來決定針對該音訊信號之該部分的編碼音訊信號是否要由該第一編碼演算法或要由該第二編碼演算法來產生。
- 如請求項1之裝置,其中該編碼器級段組配以使用對暫態信號提供一第一位元率或一第一信號雜訊比(SNR)的該第一編碼演算法,及對暫態信號提供一第二位元率或一第二信號雜訊比的該第二編碼演算法,其中該第一位元率低於該第二位元率或者該第一信號雜訊比大於該第二信號雜訊比。
- 如請求項2之裝置,其中具有該第一特性的該第一編碼 演算法為一個ACELP編碼演算法,以及其中具有該第二特性的該第二編碼演算法為一個變換編碼演算法。
- 如請求項1之裝置,其中,該控制器經組配用以在該暫態檢測結果指出一個非暫態信號時決定該第二編碼演算法,雖然該品質結果就該第一編碼演算法指出一較佳品質。
- 如請求項1之裝置,其中,該控制器經組配用以在該暫態檢測結果指出一個暫態信號時決定該第一編碼演算法,雖然該品質結果就該第二編碼演算法指出一較佳品質。
- 如請求項4之裝置,其中該控制器組配來唯有在該品質結果指出該等編碼演算法間之品質差異為小於一個臨界值差異值時,方會決定該第二編碼演算法或該第一編碼演算法。
- 如請求項6之裝置,其中該臨界值係等於或小於3dB,以及其中,兩者編碼演算法有關之品質結果,係使用該音訊信號與該音訊信號的一個經編碼且再次解碼版本間之SNR計算值,來加以計算。
- 如請求項4之裝置,其中該控制器組配來,當已就該等第一或第二編碼演算法而決定之較早信號部分的數目小於一預定之數目時,只會決定該第二編碼演算法或該第一編碼演算法。
- 如請求項8之裝置,其中該控制器組配來使用小於10之一預定值。
- 如請求項1之裝置,其中,該控制器組配用以應用一個遲滯處理,而使該第二編碼演算法或該第一編碼演算法只被決定在:當該較低之品質結果指出就該第二編碼演算法或該第一編碼演算法而言為一較低品質時、當分別具有該第一編碼演算法或該第二編碼演算法之較早信號部分的數目等於或小於一預定數目時、以及當該暫態檢測結果指出包括非暫態和暫態之兩個可能狀態的一預定狀態時。
- 如請求項1之裝置,其中該暫態檢測器組配置來執行下列諸步驟:高通濾波該音訊信號以得到一個高通濾波之信號區段;將該高通濾波之信號區段細分成多數之子區塊;就各子區塊計算一能量;結合各對相鄰子區塊之能量值以得到各對的一個結果;以及結合該等配對之結果以得到該暫態檢測結果。
- 如請求項1之裝置,其中該編碼器級段進一步包含一個LPC濾波級段,用以決定來自該音訊信號之LPC係數,以便使用由該等LPC係數所決定之LPC分析濾波器來濾波該音訊信號,使決定一個殘差信號,其中該第一編碼演算法或該第二編碼演算法係應用至該殘差信號,以及其中該編碼音訊信號進一步包含該等LPC係數之資訊。
- 如請求項1之裝置, 其中該編碼級段包含一個連接至該等第一編碼演算法和第二編碼演算法之開關,或者包含一個隨後連接至該等第一編碼演算法和第二編碼演算法之開關,其中該開關係受到該控制器所控制。
- 一種將音訊信號之部分編碼的方法,用來就該音訊信號之該部分得到編碼音訊信號,其包括:檢測一個暫態信號是否位於該音訊信號之該部分內以得到一個暫態檢測結果;針對該音訊信號執行一個第一編碼演算法,該第一編碼演算法具有一個第一特性,以及針對該音訊信號執行一個第二編碼演算法,該第二編碼演算法具有一個第二特性,該第二特性係不同於該第一特性;決定哪一個編碼演算法相對於其它編碼演算法導致對該音訊信號之該部分係較佳近似的一編碼音訊信號,以得到一個品質結果;以及基於該暫態檢測結果和該品質結果,來決定就該音訊信號之該部分的該編碼音訊信號是否要由該第一編碼演算法或要由該第二編碼演算法來產生。
- 一種具有程式碼之電腦程式,該程式碼在一個電腦上運行時可執行如請求項14之將音訊信號之部分編碼的方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161442632P | 2011-02-14 | 2011-02-14 | |
PCT/EP2012/052396 WO2012110448A1 (en) | 2011-02-14 | 2012-02-13 | Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201301265A TW201301265A (zh) | 2013-01-01 |
TWI476760B true TWI476760B (zh) | 2015-03-11 |
Family
ID=71943603
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW101104538A TWI476760B (zh) | 2011-02-14 | 2012-02-13 | 用以使用暫態檢測及品質結果將音訊信號的部分編碼之裝置與方法 |
Country Status (19)
Country | Link |
---|---|
US (1) | US9620129B2 (zh) |
EP (1) | EP2676270B1 (zh) |
JP (1) | JP5914527B2 (zh) |
KR (2) | KR101525185B1 (zh) |
CN (1) | CN103493129B (zh) |
AR (2) | AR085217A1 (zh) |
AU (1) | AU2012217216B2 (zh) |
BR (1) | BR112013020588B1 (zh) |
CA (2) | CA2827266C (zh) |
ES (1) | ES2623291T3 (zh) |
MX (1) | MX2013009304A (zh) |
MY (1) | MY166006A (zh) |
PL (1) | PL2676270T3 (zh) |
PT (1) | PT2676270T (zh) |
RU (1) | RU2573231C2 (zh) |
SG (1) | SG192714A1 (zh) |
TW (1) | TWI476760B (zh) |
WO (1) | WO2012110448A1 (zh) |
ZA (1) | ZA201306842B (zh) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2951820B1 (en) * | 2013-01-29 | 2016-12-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for selecting one of a first audio encoding algorithm and a second audio encoding algorithm |
JP6250071B2 (ja) | 2013-02-21 | 2017-12-20 | ドルビー・インターナショナル・アーベー | パラメトリック・マルチチャネル・エンコードのための方法 |
TWI671734B (zh) | 2013-09-12 | 2019-09-11 | 瑞典商杜比國際公司 | 在包含三個音訊聲道的多聲道音訊系統中之解碼方法、編碼方法、解碼裝置及編碼裝置、包含用於執行解碼方法及編碼方法的指令之非暫態電腦可讀取的媒體之電腦程式產品、包含解碼裝置及編碼裝置的音訊系統 |
AU2015258241B2 (en) * | 2014-07-28 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for selecting one of a first encoding algorithm and a second encoding algorithm using harmonics reduction |
TWI602172B (zh) * | 2014-08-27 | 2017-10-11 | 弗勞恩霍夫爾協會 | 使用參數以加強隱蔽之用於編碼及解碼音訊內容的編碼器、解碼器及方法 |
JP7257975B2 (ja) | 2017-07-03 | 2023-04-14 | ドルビー・インターナショナル・アーベー | 密集性の過渡事象の検出及び符号化の複雑さの低減 |
CN117037814A (zh) | 2017-08-10 | 2023-11-10 | 华为技术有限公司 | 时域立体声参数的编码方法和相关产品 |
US10586546B2 (en) | 2018-04-26 | 2020-03-10 | Qualcomm Incorporated | Inversely enumerated pyramid vector quantizers for efficient rate adaptation in audio coding |
US10573331B2 (en) * | 2018-05-01 | 2020-02-25 | Qualcomm Incorporated | Cooperative pyramid vector quantizers for scalable audio coding |
EP3719799A1 (en) * | 2019-04-04 | 2020-10-07 | FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. | A multi-channel audio encoder, decoder, methods and computer program for switching between a parametric multi-channel operation and an individual channel operation |
CN110767243A (zh) * | 2019-11-04 | 2020-02-07 | 重庆百瑞互联电子技术有限公司 | 一种音频编码方法、装置及设备 |
CN115881139A (zh) * | 2021-09-29 | 2023-03-31 | 华为技术有限公司 | 编解码方法、装置、设备、存储介质及计算机程序 |
WO2024110562A1 (en) * | 2022-11-23 | 2024-05-30 | Telefonaktiebolaget Lm Ericsson (Publ) | Adaptive encoding of transient audio signals |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030009325A1 (en) * | 1998-01-22 | 2003-01-09 | Raif Kirchherr | Method for signal controlled switching between different audio coding schemes |
US20050240399A1 (en) * | 2004-04-21 | 2005-10-27 | Nokia Corporation | Signal encoding |
US20070171931A1 (en) * | 2006-01-20 | 2007-07-26 | Sharath Manjunath | Arbitrary average data rates for variable rate coders |
US20080137881A1 (en) * | 2006-02-07 | 2008-06-12 | Anthony Bongiovi | System and method for digital signal processing |
TW201040943A (en) * | 2009-03-26 | 2010-11-16 | Fraunhofer Ges Forschung | Device and method for manipulating an audio signal |
TW201103009A (en) * | 2009-01-30 | 2011-01-16 | Fraunhofer Ges Forschung | Apparatus, method and computer program for manipulating an audio signal comprising a transient event |
Family Cites Families (239)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS56135754A (en) | 1980-03-26 | 1981-10-23 | Nippon Denso Co Ltd | Method of controlling current feeding time period at the time of acceleration |
US4711212A (en) | 1985-11-26 | 1987-12-08 | Nippondenso Co., Ltd. | Anti-knocking in internal combustion engine |
BR9206143A (pt) | 1991-06-11 | 1995-01-03 | Qualcomm Inc | Processos de compressão de final vocal e para codificação de taxa variável de quadros de entrada, aparelho para comprimir im sinal acústico em dados de taxa variável, codificador de prognóstico exitado por córdigo de taxa variável (CELP) e descodificador para descodificar quadros codificados |
US5408580A (en) | 1992-09-21 | 1995-04-18 | Aware, Inc. | Audio compression system employing multi-rate signal analysis |
SE501340C2 (sv) | 1993-06-11 | 1995-01-23 | Ericsson Telefon Ab L M | Döljande av transmissionsfel i en talavkodare |
BE1007617A3 (nl) | 1993-10-11 | 1995-08-22 | Philips Electronics Nv | Transmissiesysteem met gebruik van verschillende codeerprincipes. |
US5657422A (en) | 1994-01-28 | 1997-08-12 | Lucent Technologies Inc. | Voice activity detection driven noise remediator |
US5784532A (en) | 1994-02-16 | 1998-07-21 | Qualcomm Incorporated | Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system |
US5684920A (en) | 1994-03-17 | 1997-11-04 | Nippon Telegraph And Telephone | Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein |
US5568588A (en) | 1994-04-29 | 1996-10-22 | Audiocodes Ltd. | Multi-pulse analysis speech processing System and method |
KR100419545B1 (ko) | 1994-10-06 | 2004-06-04 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 다른코딩원리들을이용한전송시스템 |
JP3304717B2 (ja) | 1994-10-28 | 2002-07-22 | ソニー株式会社 | ディジタル信号圧縮方法及び装置 |
EP0720316B1 (en) | 1994-12-30 | 1999-12-08 | Daewoo Electronics Co., Ltd | Adaptive digital audio encoding apparatus and a bit allocation method thereof |
SE506379C3 (sv) | 1995-03-22 | 1998-01-19 | Ericsson Telefon Ab L M | Lpc-talkodare med kombinerad excitation |
US5727119A (en) | 1995-03-27 | 1998-03-10 | Dolby Laboratories Licensing Corporation | Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase |
JP3317470B2 (ja) * | 1995-03-28 | 2002-08-26 | 日本電信電話株式会社 | 音響信号符号化方法、音響信号復号化方法 |
US5659622A (en) | 1995-11-13 | 1997-08-19 | Motorola, Inc. | Method and apparatus for suppressing noise in a communication system |
US5890106A (en) | 1996-03-19 | 1999-03-30 | Dolby Laboratories Licensing Corporation | Analysis-/synthesis-filtering system with efficient oddly-stacked singleband filter bank using time-domain aliasing cancellation |
US5848391A (en) | 1996-07-11 | 1998-12-08 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Method subband of coding and decoding audio signals using variable length windows |
JP3259759B2 (ja) | 1996-07-22 | 2002-02-25 | 日本電気株式会社 | 音声信号伝送方法及び音声符号復号化システム |
JP3622365B2 (ja) | 1996-09-26 | 2005-02-23 | ヤマハ株式会社 | 音声符号化伝送方式 |
JPH10124092A (ja) | 1996-10-23 | 1998-05-15 | Sony Corp | 音声符号化方法及び装置、並びに可聴信号符号化方法及び装置 |
US5960389A (en) | 1996-11-15 | 1999-09-28 | Nokia Mobile Phones Limited | Methods for generating comfort noise during discontinuous transmission |
JPH10214100A (ja) * | 1997-01-31 | 1998-08-11 | Sony Corp | 音声合成方法 |
US6134518A (en) | 1997-03-04 | 2000-10-17 | International Business Machines Corporation | Digital audio signal coding using a CELP coder and a transform coder |
JPH10276095A (ja) | 1997-03-28 | 1998-10-13 | Toshiba Corp | 符号化器及び復号化器 |
SE512719C2 (sv) | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
JP3223966B2 (ja) | 1997-07-25 | 2001-10-29 | 日本電気株式会社 | 音声符号化/復号化装置 |
US6070137A (en) | 1998-01-07 | 2000-05-30 | Ericsson Inc. | Integrated frequency-domain voice coding using an adaptive spectral enhancement filter |
GB9811019D0 (en) | 1998-05-21 | 1998-07-22 | Univ Surrey | Speech coders |
DE19827704C2 (de) | 1998-06-22 | 2000-05-11 | Siemens Ag | Verfahren zur zylinderselektiven Klopfregelung einer Brennkraftmaschine |
US6173257B1 (en) | 1998-08-24 | 2001-01-09 | Conexant Systems, Inc | Completed fixed codebook for speech encoder |
US6439967B2 (en) | 1998-09-01 | 2002-08-27 | Micron Technology, Inc. | Microelectronic substrate assembly planarizing machines and methods of mechanical and chemical-mechanical planarization of microelectronic substrate assemblies |
SE521225C2 (sv) | 1998-09-16 | 2003-10-14 | Ericsson Telefon Ab L M | Förfarande och anordning för CELP-kodning/avkodning |
US6317117B1 (en) | 1998-09-23 | 2001-11-13 | Eugene Goff | User interface for the control of an audio spectrum filter processor |
US7272556B1 (en) | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
US7124079B1 (en) | 1998-11-23 | 2006-10-17 | Telefonaktiebolaget Lm Ericsson (Publ) | Speech coding with comfort noise variability feature for increased fidelity |
FI114833B (fi) | 1999-01-08 | 2004-12-31 | Nokia Corp | Menetelmä, puhekooderi ja matkaviestin puheenkoodauskehysten muodostamiseksi |
DE19921122C1 (de) | 1999-05-07 | 2001-01-25 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Verschleiern eines Fehlers in einem codierten Audiosignal und Verfahren und Vorrichtung zum Decodieren eines codierten Audiosignals |
JP2003501925A (ja) | 1999-06-07 | 2003-01-14 | エリクソン インコーポレイテッド | パラメトリックノイズモデル統計値を用いたコンフォートノイズの生成方法及び装置 |
JP4464484B2 (ja) | 1999-06-15 | 2010-05-19 | パナソニック株式会社 | 雑音信号符号化装置および音声信号符号化装置 |
US6236960B1 (en) | 1999-08-06 | 2001-05-22 | Motorola, Inc. | Factorial packing method and apparatus for information coding |
US6636829B1 (en) | 1999-09-22 | 2003-10-21 | Mindspeed Technologies, Inc. | Speech communication system and method for handling lost frames |
CN1266674C (zh) | 2000-02-29 | 2006-07-26 | 高通股份有限公司 | 闭环多模混合域线性预测语音编解码器和处理帧的方法 |
DE10012956A1 (de) | 2000-03-16 | 2001-09-20 | Bosch Gmbh Robert | Vorrichtung und Verfahren zur Regelung des Energieangebots für die Zündung einer Brennkraftmaschine |
US6757654B1 (en) | 2000-05-11 | 2004-06-29 | Telefonaktiebolaget Lm Ericsson | Forward error correction in speech coding |
JP2002118517A (ja) | 2000-07-31 | 2002-04-19 | Sony Corp | 直交変換装置及び方法、逆直交変換装置及び方法、変換符号化装置及び方法、並びに復号装置及び方法 |
FR2813722B1 (fr) | 2000-09-05 | 2003-01-24 | France Telecom | Procede et dispositif de dissimulation d'erreurs et systeme de transmission comportant un tel dispositif |
US6847929B2 (en) | 2000-10-12 | 2005-01-25 | Texas Instruments Incorporated | Algebraic codebook system and method |
US6636830B1 (en) | 2000-11-22 | 2003-10-21 | Vialta Inc. | System and method for noise reduction using bi-orthogonal modified discrete cosine transform |
CA2327041A1 (en) | 2000-11-22 | 2002-05-22 | Voiceage Corporation | A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals |
US20050130321A1 (en) | 2001-04-23 | 2005-06-16 | Nicholson Jeremy K. | Methods for analysis of spectral data and their applications |
US7136418B2 (en) | 2001-05-03 | 2006-11-14 | University Of Washington | Scalable and perceptually ranked signal coding and decoding |
US7206739B2 (en) | 2001-05-23 | 2007-04-17 | Samsung Electronics Co., Ltd. | Excitation codebook search method in a speech coding system |
US20020184009A1 (en) | 2001-05-31 | 2002-12-05 | Heikkinen Ari P. | Method and apparatus for improved voicing determination in speech signals containing high levels of jitter |
US20030120484A1 (en) | 2001-06-12 | 2003-06-26 | David Wong | Method and system for generating colored comfort noise in the absence of silence insertion description packets |
DE10129240A1 (de) | 2001-06-18 | 2003-01-02 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Verarbeiten von zeitdiskreten Audio-Abtastwerten |
US6879955B2 (en) | 2001-06-29 | 2005-04-12 | Microsoft Corporation | Signal modification based on continuous time warping for low bit rate CELP coding |
US6941263B2 (en) | 2001-06-29 | 2005-09-06 | Microsoft Corporation | Frequency domain postfiltering for quality enhancement of coded speech |
US7711563B2 (en) | 2001-08-17 | 2010-05-04 | Broadcom Corporation | Method and system for frame erasure concealment for predictive speech coding based on extrapolation of speech waveform |
DE10140507A1 (de) | 2001-08-17 | 2003-02-27 | Philips Corp Intellectual Pty | Verfahren für die algebraische Codebook-Suche eines Sprachsignalkodierers |
KR100438175B1 (ko) | 2001-10-23 | 2004-07-01 | 엘지전자 주식회사 | 코드북 검색방법 |
CA2365203A1 (en) | 2001-12-14 | 2003-06-14 | Voiceage Corporation | A signal modification method for efficient coding of speech signals |
US6934677B2 (en) | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
US7240001B2 (en) | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
JP3815323B2 (ja) | 2001-12-28 | 2006-08-30 | 日本ビクター株式会社 | 周波数変換ブロック長適応変換装置及びプログラム |
DE10200653B4 (de) | 2002-01-10 | 2004-05-27 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Skalierbarer Codierer, Verfahren zum Codieren, Decodierer und Verfahren zum Decodieren für einen skalierten Datenstrom |
US6646332B2 (en) | 2002-01-18 | 2003-11-11 | Terence Quintin Collier | Semiconductor package device |
CA2388358A1 (en) | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for multi-rate lattice vector quantization |
CA2388439A1 (en) | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
CA2388352A1 (en) | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for frequency-selective pitch enhancement of synthesized speed |
US7302387B2 (en) | 2002-06-04 | 2007-11-27 | Texas Instruments Incorporated | Modification of fixed codebook search in G.729 Annex E audio coding |
KR100462611B1 (ko) * | 2002-06-27 | 2004-12-20 | 삼성전자주식회사 | 하모닉 성분을 이용한 오디오 코딩방법 및 장치 |
US20040010329A1 (en) | 2002-07-09 | 2004-01-15 | Silicon Integrated Systems Corp. | Method for reducing buffer requirements in a digital audio decoder |
DE10236694A1 (de) | 2002-08-09 | 2004-02-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren |
US7502743B2 (en) | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
US7299190B2 (en) | 2002-09-04 | 2007-11-20 | Microsoft Corporation | Quantization and inverse quantization for audio |
KR100728428B1 (ko) | 2002-09-19 | 2007-06-13 | 마츠시타 덴끼 산교 가부시키가이샤 | 오디오 디코딩 장치 및 오디오 디코딩 방법 |
WO2004034379A2 (en) | 2002-10-11 | 2004-04-22 | Nokia Corporation | Methods and devices for source controlled variable bit-rate wideband speech coding |
US7343283B2 (en) | 2002-10-23 | 2008-03-11 | Motorola, Inc. | Method and apparatus for coding a noise-suppressed audio signal |
US7363218B2 (en) | 2002-10-25 | 2008-04-22 | Dilithium Networks Pty. Ltd. | Method and apparatus for fast CELP parameter mapping |
KR100463419B1 (ko) | 2002-11-11 | 2004-12-23 | 한국전자통신연구원 | 적은 복잡도를 가진 고정 코드북 검색방법 및 장치 |
KR100463559B1 (ko) | 2002-11-11 | 2004-12-29 | 한국전자통신연구원 | 대수 코드북을 이용하는 켈프 보코더의 코드북 검색방법 |
KR100465316B1 (ko) | 2002-11-18 | 2005-01-13 | 한국전자통신연구원 | 음성 부호화기 및 이를 이용한 음성 부호화 방법 |
KR20040058855A (ko) | 2002-12-27 | 2004-07-05 | 엘지전자 주식회사 | 음성 변조 장치 및 방법 |
JP4191503B2 (ja) | 2003-02-13 | 2008-12-03 | 日本電信電話株式会社 | 音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、および復号化プログラム |
AU2003208517A1 (en) | 2003-03-11 | 2004-09-30 | Nokia Corporation | Switching between coding schemes |
US7249014B2 (en) | 2003-03-13 | 2007-07-24 | Intel Corporation | Apparatus, methods and articles incorporating a fast algebraic codebook search technique |
US20050021338A1 (en) | 2003-03-17 | 2005-01-27 | Dan Graboi | Recognition device and system |
KR100556831B1 (ko) | 2003-03-25 | 2006-03-10 | 한국전자통신연구원 | 전역 펄스 교체를 통한 고정 코드북 검색 방법 |
WO2004090870A1 (ja) | 2003-04-04 | 2004-10-21 | Kabushiki Kaisha Toshiba | 広帯域音声を符号化または復号化するための方法及び装置 |
US7318035B2 (en) | 2003-05-08 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Audio coding systems and methods using spectral component coupling and spectral component regeneration |
DE10321983A1 (de) | 2003-05-15 | 2004-12-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Einbetten einer binären Nutzinformation in ein Trägersignal |
DE602004029786D1 (de) | 2003-06-30 | 2010-12-09 | Koninkl Philips Electronics Nv | Verbesserung der qualität von dekodierten audio mittels hinzufügen von geräusch |
DE10331803A1 (de) | 2003-07-14 | 2005-02-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Umsetzen in eine transformierte Darstellung oder zum inversen Umsetzen der transformierten Darstellung |
US7565286B2 (en) | 2003-07-17 | 2009-07-21 | Her Majesty The Queen In Right Of Canada, As Represented By The Minister Of Industry, Through The Communications Research Centre Canada | Method for recovery of lost speech data |
DE10345996A1 (de) | 2003-10-02 | 2005-04-28 | Fraunhofer Ges Forschung | Vorrichtung und Verfahren zum Verarbeiten von wenigstens zwei Eingangswerten |
DE10345995B4 (de) | 2003-10-02 | 2005-07-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Verarbeiten eines Signals mit einer Sequenz von diskreten Werten |
US7418396B2 (en) | 2003-10-14 | 2008-08-26 | Broadcom Corporation | Reduced memory implementation technique of filterbank and block switching for real-time audio applications |
US20050091044A1 (en) | 2003-10-23 | 2005-04-28 | Nokia Corporation | Method and system for pitch contour quantization in audio coding |
US20050091041A1 (en) | 2003-10-23 | 2005-04-28 | Nokia Corporation | Method and system for speech coding |
JP4966013B2 (ja) | 2003-10-30 | 2012-07-04 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ信号のエンコードまたはデコード |
EP1711938A1 (en) | 2004-01-28 | 2006-10-18 | Koninklijke Philips Electronics N.V. | Audio signal decoding using complex-valued data |
EP1714456B1 (en) * | 2004-02-12 | 2014-07-16 | Core Wireless Licensing S.à.r.l. | Classified media quality of experience |
DE102004007200B3 (de) | 2004-02-13 | 2005-08-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audiocodierung |
CA2457988A1 (en) | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
FI118835B (fi) * | 2004-02-23 | 2008-03-31 | Nokia Corp | Koodausmallin valinta |
FI118834B (fi) | 2004-02-23 | 2008-03-31 | Nokia Corp | Audiosignaalien luokittelu |
WO2005086138A1 (ja) | 2004-03-05 | 2005-09-15 | Matsushita Electric Industrial Co., Ltd. | エラー隠蔽装置およびエラー隠蔽方法 |
WO2005096274A1 (fr) | 2004-04-01 | 2005-10-13 | Beijing Media Works Co., Ltd | Dispositif et procede de codage/decodage audio ameliores |
AU2004319556A1 (en) | 2004-05-17 | 2005-11-24 | Nokia Corporation | Audio encoding with different coding frame lengths |
JP4168976B2 (ja) * | 2004-05-28 | 2008-10-22 | ソニー株式会社 | オーディオ信号符号化装置及び方法 |
US7649988B2 (en) | 2004-06-15 | 2010-01-19 | Acoustic Technologies, Inc. | Comfort noise generator using modified Doblinger noise estimate |
MX2007003063A (es) * | 2004-09-17 | 2007-05-16 | Koninkl Philips Electronics Nv | Codificacion combinada de audio que minimiza la distorsion perceptual. |
US7630902B2 (en) * | 2004-09-17 | 2009-12-08 | Digital Rise Technology Co., Ltd. | Apparatus and methods for digital audio coding using codebook application ranges |
KR100656788B1 (ko) | 2004-11-26 | 2006-12-12 | 한국전자통신연구원 | 비트율 신축성을 갖는 코드벡터 생성 방법 및 그를 이용한 광대역 보코더 |
TWI253057B (en) | 2004-12-27 | 2006-04-11 | Quanta Comp Inc | Search system and method thereof for searching code-vector of speech signal in speech encoder |
US7519535B2 (en) | 2005-01-31 | 2009-04-14 | Qualcomm Incorporated | Frame erasure concealment in voice communications |
JP5202960B2 (ja) | 2005-01-31 | 2013-06-05 | スカイプ | 通信システムにおけるフレームの連結方法 |
CN100593197C (zh) | 2005-02-02 | 2010-03-03 | 富士通株式会社 | 信号处理方法和装置 |
US20070147518A1 (en) * | 2005-02-18 | 2007-06-28 | Bruno Bessette | Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX |
US8155965B2 (en) | 2005-03-11 | 2012-04-10 | Qualcomm Incorporated | Time warping frames inside the vocoder by modifying the residual |
NZ562182A (en) | 2005-04-01 | 2010-03-26 | Qualcomm Inc | Method and apparatus for anti-sparseness filtering of a bandwidth extended speech prediction excitation signal |
JP4767069B2 (ja) | 2005-05-02 | 2011-09-07 | ヤマハ発動機株式会社 | 鞍乗型車両のエンジン制御装置及びそのエンジン制御方法 |
US8577686B2 (en) | 2005-05-26 | 2013-11-05 | Lg Electronics Inc. | Method and apparatus for decoding an audio signal |
US7707034B2 (en) | 2005-05-31 | 2010-04-27 | Microsoft Corporation | Audio codec post-filter |
RU2296377C2 (ru) | 2005-06-14 | 2007-03-27 | Михаил Николаевич Гусев | Способ анализа и синтеза речи |
ES2629727T3 (es) | 2005-06-18 | 2017-08-14 | Nokia Technologies Oy | Sistema y método para la transmisión adaptativa de parámetros de ruido de confort durante la transmisión de habla discontinua |
JP5032314B2 (ja) | 2005-06-23 | 2012-09-26 | パナソニック株式会社 | オーディオ符号化装置、オーディオ復号化装置およびオーディオ符号化情報伝送装置 |
FR2888699A1 (fr) | 2005-07-13 | 2007-01-19 | France Telecom | Dispositif de codage/decodage hierachique |
KR100851970B1 (ko) | 2005-07-15 | 2008-08-12 | 삼성전자주식회사 | 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치 |
US7610197B2 (en) | 2005-08-31 | 2009-10-27 | Motorola, Inc. | Method and apparatus for comfort noise generation in speech communication systems |
RU2312405C2 (ru) | 2005-09-13 | 2007-12-10 | Михаил Николаевич Гусев | Способ осуществления машинной оценки качества звуковых сигналов |
US20070174047A1 (en) | 2005-10-18 | 2007-07-26 | Anderson Kyle D | Method and apparatus for resynchronizing packetized audio streams |
US7720677B2 (en) | 2005-11-03 | 2010-05-18 | Coding Technologies Ab | Time warped modified transform coding of audio signals |
US7536299B2 (en) | 2005-12-19 | 2009-05-19 | Dolby Laboratories Licensing Corporation | Correlating and decorrelating transforms for multiple description coding systems |
US8255207B2 (en) | 2005-12-28 | 2012-08-28 | Voiceage Corporation | Method and device for efficient frame erasure concealment in speech codecs |
WO2007080211A1 (en) | 2006-01-09 | 2007-07-19 | Nokia Corporation | Decoding of binaural audio signals |
CN101371295B (zh) | 2006-01-18 | 2011-12-21 | Lg电子株式会社 | 用于编码和解码信号的设备和方法 |
KR20080101873A (ko) | 2006-01-18 | 2008-11-21 | 연세대학교 산학협력단 | 부호화/복호화 장치 및 방법 |
US7668304B2 (en) | 2006-01-25 | 2010-02-23 | Avaya Inc. | Display hierarchy of participants during phone call |
FR2897733A1 (fr) | 2006-02-20 | 2007-08-24 | France Telecom | Procede de discrimination et d'attenuation fiabilisees des echos d'un signal numerique dans un decodeur et dispositif correspondant |
FR2897977A1 (fr) | 2006-02-28 | 2007-08-31 | France Telecom | Procede de limitation de gain d'excitation adaptative dans un decodeur audio |
US7556670B2 (en) | 2006-03-16 | 2009-07-07 | Aylsworth Alonzo C | Method and system of coordinating an intensifier and sieve beds |
US20070253577A1 (en) | 2006-05-01 | 2007-11-01 | Himax Technologies Limited | Equalizer bank with interference reduction |
EP1852848A1 (en) * | 2006-05-05 | 2007-11-07 | Deutsche Thomson-Brandt GmbH | Method and apparatus for lossless encoding of a source signal using a lossy encoded data stream and a lossless extension data stream |
US7873511B2 (en) | 2006-06-30 | 2011-01-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
JP4810335B2 (ja) | 2006-07-06 | 2011-11-09 | 株式会社東芝 | 広帯域オーディオ信号符号化装置および広帯域オーディオ信号復号装置 |
WO2008007699A1 (en) | 2006-07-12 | 2008-01-17 | Panasonic Corporation | Audio decoding device and audio encoding device |
US8255213B2 (en) | 2006-07-12 | 2012-08-28 | Panasonic Corporation | Speech decoding apparatus, speech encoding apparatus, and lost frame concealment method |
US7933770B2 (en) | 2006-07-14 | 2011-04-26 | Siemens Audiologische Technik Gmbh | Method and device for coding audio data based on vector quantisation |
CN102096937B (zh) | 2006-07-24 | 2014-07-09 | 索尼株式会社 | 毛发运动合成器系统和用于毛发/皮毛流水线的优化技术 |
US7987089B2 (en) | 2006-07-31 | 2011-07-26 | Qualcomm Incorporated | Systems and methods for modifying a zero pad region of a windowed frame of an audio signal |
WO2008022184A2 (en) | 2006-08-15 | 2008-02-21 | Broadcom Corporation | Constrained and controlled decoding after packet loss |
US7877253B2 (en) | 2006-10-06 | 2011-01-25 | Qualcomm Incorporated | Systems, methods, and apparatus for frame erasure recovery |
US8036903B2 (en) | 2006-10-18 | 2011-10-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system |
US8126721B2 (en) | 2006-10-18 | 2012-02-28 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
US8417532B2 (en) | 2006-10-18 | 2013-04-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
DE102006049154B4 (de) | 2006-10-18 | 2009-07-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Kodierung eines Informationssignals |
US8041578B2 (en) | 2006-10-18 | 2011-10-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
KR101056253B1 (ko) | 2006-10-25 | 2011-08-11 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 오디오 서브밴드 값을 생성하는 장치 및 방법과 시간 영역 오디오 샘플을 생성하는 장치 및 방법 |
DE102006051673A1 (de) | 2006-11-02 | 2008-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale |
CA2672165C (en) * | 2006-12-12 | 2014-07-29 | Ralf Geiger | Encoder, decoder and methods for encoding and decoding data segments representing a time-domain data stream |
FR2911228A1 (fr) | 2007-01-05 | 2008-07-11 | France Telecom | Codage par transformee, utilisant des fenetres de ponderation et a faible retard. |
KR101379263B1 (ko) | 2007-01-12 | 2014-03-28 | 삼성전자주식회사 | 대역폭 확장 복호화 방법 및 장치 |
FR2911426A1 (fr) | 2007-01-15 | 2008-07-18 | France Telecom | Modification d'un signal de parole |
US7873064B1 (en) | 2007-02-12 | 2011-01-18 | Marvell International Ltd. | Adaptive jitter buffer-packet loss concealment |
JP5596341B2 (ja) | 2007-03-02 | 2014-09-24 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 音声符号化装置および音声符号化方法 |
MY152167A (en) | 2007-03-02 | 2014-08-15 | Panasonic Corp | Encoding device and encoding method |
JP4708446B2 (ja) | 2007-03-02 | 2011-06-22 | パナソニック株式会社 | 符号化装置、復号装置およびそれらの方法 |
DE102007063635A1 (de) * | 2007-03-22 | 2009-04-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren zur zeitlichen Segmentierung eines Videos in Videobildfolgen und zur Auswahl von Keyframes für das Auffinden von Bildinhalten unter Einbeziehung einer Subshot-Detektion |
JP2008261904A (ja) | 2007-04-10 | 2008-10-30 | Matsushita Electric Ind Co Ltd | 符号化装置、復号化装置、符号化方法および復号化方法 |
US8630863B2 (en) | 2007-04-24 | 2014-01-14 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding and decoding audio/speech signal |
CN101388210B (zh) | 2007-09-15 | 2012-03-07 | 华为技术有限公司 | 编解码方法及编解码器 |
ES2529292T3 (es) | 2007-04-29 | 2015-02-18 | Huawei Technologies Co., Ltd. | Método de codificación y de decodificación |
US8706480B2 (en) | 2007-06-11 | 2014-04-22 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder for encoding an audio signal having an impulse-like portion and stationary portion, encoding methods, decoder, decoding method, and encoding audio signal |
US9653088B2 (en) | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
KR101513028B1 (ko) | 2007-07-02 | 2015-04-17 | 엘지전자 주식회사 | 방송 수신기 및 방송신호 처리방법 |
US8185381B2 (en) | 2007-07-19 | 2012-05-22 | Qualcomm Incorporated | Unified filter bank for performing signal conversions |
CN101110214B (zh) | 2007-08-10 | 2011-08-17 | 北京理工大学 | 一种基于多描述格型矢量量化技术的语音编码方法 |
US8428957B2 (en) | 2007-08-24 | 2013-04-23 | Qualcomm Incorporated | Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands |
MX2010001763A (es) | 2007-08-27 | 2010-03-10 | Ericsson Telefon Ab L M | Analisis/sintesis espectral de baja complejidad utilizando la resolucion temporal seleccionable. |
JP4886715B2 (ja) | 2007-08-28 | 2012-02-29 | 日本電信電話株式会社 | 定常率算出装置、雑音レベル推定装置、雑音抑圧装置、それらの方法、プログラム及び記録媒体 |
WO2009033288A1 (en) | 2007-09-11 | 2009-03-19 | Voiceage Corporation | Method and device for fast algebraic codebook search in speech and audio coding |
CN100524462C (zh) | 2007-09-15 | 2009-08-05 | 华为技术有限公司 | 对高带信号进行帧错误隐藏的方法及装置 |
US8576096B2 (en) | 2007-10-11 | 2013-11-05 | Motorola Mobility Llc | Apparatus and method for low complexity combinatorial coding of signals |
KR101373004B1 (ko) | 2007-10-30 | 2014-03-26 | 삼성전자주식회사 | 고주파수 신호 부호화 및 복호화 장치 및 방법 |
CN101425292B (zh) | 2007-11-02 | 2013-01-02 | 华为技术有限公司 | 一种音频信号的解码方法及装置 |
DE102007055830A1 (de) | 2007-12-17 | 2009-06-18 | Zf Friedrichshafen Ag | Verfahren und Vorrichtung zum Betrieb eines Hybridantriebes eines Fahrzeuges |
CN101483043A (zh) | 2008-01-07 | 2009-07-15 | 中兴通讯股份有限公司 | 基于分类和排列组合的码本索引编码方法 |
CN101488344B (zh) * | 2008-01-16 | 2011-09-21 | 华为技术有限公司 | 一种量化噪声泄漏控制方法及装置 |
DE102008015702B4 (de) | 2008-01-31 | 2010-03-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals |
WO2009109373A2 (en) | 2008-03-04 | 2009-09-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus for mixing a plurality of input data streams |
US8000487B2 (en) | 2008-03-06 | 2011-08-16 | Starkey Laboratories, Inc. | Frequency translation by high-frequency spectral envelope warping in hearing assistance devices |
JP2009224850A (ja) | 2008-03-13 | 2009-10-01 | Toshiba Corp | 無線通信装置 |
FR2929466A1 (fr) | 2008-03-28 | 2009-10-02 | France Telecom | Dissimulation d'erreur de transmission dans un signal numerique dans une structure de decodage hierarchique |
EP2107556A1 (en) | 2008-04-04 | 2009-10-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio transform coding using pitch correction |
US8423852B2 (en) | 2008-04-15 | 2013-04-16 | Qualcomm Incorporated | Channel decoding-based error detection |
US8768690B2 (en) * | 2008-06-20 | 2014-07-01 | Qualcomm Incorporated | Coding scheme selection for low-bit-rate applications |
MX2011000375A (es) | 2008-07-11 | 2011-05-19 | Fraunhofer Ges Forschung | Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada. |
EP2346030B1 (en) | 2008-07-11 | 2014-10-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, method for encoding an audio signal and computer program |
PL3002750T3 (pl) | 2008-07-11 | 2018-06-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Koder i dekoder audio do kodowania i dekodowania próbek audio |
ES2683077T3 (es) | 2008-07-11 | 2018-09-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada |
PL2311033T3 (pl) | 2008-07-11 | 2012-05-31 | Fraunhofer Ges Forschung | Dostarczanie sygnału aktywującego dopasowanie czasowe i kodowanie sygnału audio z jego użyciem |
AU2009267518B2 (en) | 2008-07-11 | 2012-08-16 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme |
EP2144230A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
MY154452A (en) | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
US8380498B2 (en) | 2008-09-06 | 2013-02-19 | GH Innovation, Inc. | Temporal envelope coding of energy attack signal by using attack point location |
US8352279B2 (en) | 2008-09-06 | 2013-01-08 | Huawei Technologies Co., Ltd. | Efficient temporal envelope coding approach by prediction between low band signal and high band signal |
US8577673B2 (en) | 2008-09-15 | 2013-11-05 | Huawei Technologies Co., Ltd. | CELP post-processing for music signals |
US8798776B2 (en) | 2008-09-30 | 2014-08-05 | Dolby International Ab | Transcoding of audio metadata |
DE102008042579B4 (de) | 2008-10-02 | 2020-07-23 | Robert Bosch Gmbh | Verfahren zur Fehlerverdeckung bei fehlerhafter Übertragung von Sprachdaten |
EP3640941A1 (en) | 2008-10-08 | 2020-04-22 | Fraunhofer Gesellschaft zur Förderung der Angewand | Multi-resolution switched audio encoding/decoding scheme |
KR101315617B1 (ko) | 2008-11-26 | 2013-10-08 | 광운대학교 산학협력단 | 모드 스위칭에 기초하여 윈도우 시퀀스를 처리하는 통합 음성/오디오 부/복호화기 |
CN101770775B (zh) | 2008-12-31 | 2011-06-22 | 华为技术有限公司 | 信号处理方法及装置 |
CA3162807C (en) | 2009-01-16 | 2024-04-23 | Dolby International Ab | Cross product enhanced harmonic transposition |
AU2010209756B2 (en) | 2009-01-28 | 2013-10-31 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio coding |
US8457975B2 (en) | 2009-01-28 | 2013-06-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program |
KR101441474B1 (ko) | 2009-02-16 | 2014-09-17 | 한국전자통신연구원 | 적응적 정현파 펄스 코딩을 이용한 오디오 신호의 인코딩 및 디코딩 방법 및 장치 |
US8363597B2 (en) | 2009-04-09 | 2013-01-29 | Qualcomm Incorporated | MAC architectures for wireless communications using multiple physical layers |
KR20100115215A (ko) * | 2009-04-17 | 2010-10-27 | 삼성전자주식회사 | 가변 비트율 오디오 부호화 및 복호화 장치 및 방법 |
ES2673637T3 (es) * | 2009-06-23 | 2018-06-25 | Voiceage Corporation | Cancelación prospectiva de solapamiento en dominio de tiempo con aplicación en dominio de señal ponderada u original |
JP5267362B2 (ja) * | 2009-07-03 | 2013-08-21 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラムならびに映像伝送装置 |
CN101958119B (zh) | 2009-07-16 | 2012-02-29 | 中兴通讯股份有限公司 | 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法 |
US8635357B2 (en) * | 2009-09-08 | 2014-01-21 | Google Inc. | Dynamic selection of parameter sets for transcoding media data |
EP2491555B1 (en) | 2009-10-20 | 2014-03-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multi-mode audio codec |
AU2010309838B2 (en) | 2009-10-20 | 2014-05-08 | Dolby International Ab | Audio signal encoder, audio signal decoder, method for encoding or decoding an audio signal using an aliasing-cancellation |
BR122020024243B1 (pt) | 2009-10-20 | 2022-02-01 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E. V. | Codificador de sinal de áudio, decodificador de sinal de áudio, método para prover uma representação codificada de um conteúdo de áudio e método para prover uma representação decodificada de um conteúdo de áudio. |
CN102081927B (zh) | 2009-11-27 | 2012-07-18 | 中兴通讯股份有限公司 | 一种可分层音频编码、解码方法及系统 |
US8423355B2 (en) | 2010-03-05 | 2013-04-16 | Motorola Mobility Llc | Encoder for audio signal including generic audio and speech frames |
US8428936B2 (en) | 2010-03-05 | 2013-04-23 | Motorola Mobility Llc | Decoder for audio signal including generic audio and speech frames |
CN103069484B (zh) | 2010-04-14 | 2014-10-08 | 华为技术有限公司 | 时/频二维后处理 |
TW201214415A (en) | 2010-05-28 | 2012-04-01 | Fraunhofer Ges Forschung | Low-delay unified speech and audio codec |
FR2963254B1 (fr) | 2010-07-27 | 2012-08-24 | Maurice Guerin | Dispositif et procede pour laver des surfaces internes d?une enceinte |
MX2013009305A (es) | 2011-02-14 | 2013-10-03 | Fraunhofer Ges Forschung | Generacion de ruido en codecs de audio. |
ES2529025T3 (es) | 2011-02-14 | 2015-02-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y método para procesar una señal de audio decodificada en un dominio espectral |
WO2013023046A1 (en) | 2011-08-10 | 2013-02-14 | Thompson Automotive Labs Llc | Methods and apparatus for engine analysis and remote engine analysis |
WO2013075753A1 (en) * | 2011-11-25 | 2013-05-30 | Huawei Technologies Co., Ltd. | An apparatus and a method for encoding an input signal |
KR20130134193A (ko) | 2012-05-30 | 2013-12-10 | 삼성전자주식회사 | 컨커런트 서비스를 제공하기 위한 전자 장치 및 방법 |
-
2012
- 2012-02-13 CA CA2827266A patent/CA2827266C/en active Active
- 2012-02-13 PT PT127070480T patent/PT2676270T/pt unknown
- 2012-02-13 JP JP2013553892A patent/JP5914527B2/ja active Active
- 2012-02-13 CN CN201280014994.1A patent/CN103493129B/zh active Active
- 2012-02-13 MX MX2013009304A patent/MX2013009304A/es active IP Right Grant
- 2012-02-13 AU AU2012217216A patent/AU2012217216B2/en active Active
- 2012-02-13 KR KR1020137024069A patent/KR101525185B1/ko active IP Right Grant
- 2012-02-13 BR BR112013020588-1A patent/BR112013020588B1/pt active IP Right Grant
- 2012-02-13 EP EP12707048.0A patent/EP2676270B1/en active Active
- 2012-02-13 MY MYPI2013002989A patent/MY166006A/en unknown
- 2012-02-13 PL PL12707048T patent/PL2676270T3/pl unknown
- 2012-02-13 CA CA2920964A patent/CA2920964C/en active Active
- 2012-02-13 KR KR1020147032302A patent/KR101562281B1/ko active IP Right Grant
- 2012-02-13 RU RU2013142072/08A patent/RU2573231C2/ru active
- 2012-02-13 ES ES12707048.0T patent/ES2623291T3/es active Active
- 2012-02-13 AR ARP120100470A patent/AR085217A1/es active IP Right Grant
- 2012-02-13 SG SG2013060900A patent/SG192714A1/en unknown
- 2012-02-13 WO PCT/EP2012/052396 patent/WO2012110448A1/en active Application Filing
- 2012-02-13 TW TW101104538A patent/TWI476760B/zh active
-
2013
- 2013-08-14 US US13/966,688 patent/US9620129B2/en active Active
- 2013-09-11 ZA ZA2013/06842A patent/ZA201306842B/en unknown
-
2014
- 2014-11-19 AR ARP140104355A patent/AR098480A2/es active IP Right Grant
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030009325A1 (en) * | 1998-01-22 | 2003-01-09 | Raif Kirchherr | Method for signal controlled switching between different audio coding schemes |
US20050240399A1 (en) * | 2004-04-21 | 2005-10-27 | Nokia Corporation | Signal encoding |
US20070171931A1 (en) * | 2006-01-20 | 2007-07-26 | Sharath Manjunath | Arbitrary average data rates for variable rate coders |
US20080137881A1 (en) * | 2006-02-07 | 2008-06-12 | Anthony Bongiovi | System and method for digital signal processing |
TW201103009A (en) * | 2009-01-30 | 2011-01-16 | Fraunhofer Ges Forschung | Apparatus, method and computer program for manipulating an audio signal comprising a transient event |
TW201040943A (en) * | 2009-03-26 | 2010-11-16 | Fraunhofer Ges Forschung | Device and method for manipulating an audio signal |
Also Published As
Publication number | Publication date |
---|---|
PL2676270T3 (pl) | 2017-07-31 |
JP5914527B2 (ja) | 2016-05-11 |
CN103493129A (zh) | 2014-01-01 |
ES2623291T3 (es) | 2017-07-10 |
TW201301265A (zh) | 2013-01-01 |
US9620129B2 (en) | 2017-04-11 |
KR101525185B1 (ko) | 2015-06-02 |
SG192714A1 (en) | 2013-09-30 |
US20130332177A1 (en) | 2013-12-12 |
BR112013020588A2 (pt) | 2018-07-10 |
CA2827266C (en) | 2017-02-28 |
RU2573231C2 (ru) | 2016-01-20 |
AR085217A1 (es) | 2013-09-18 |
RU2013142072A (ru) | 2015-03-27 |
MY166006A (en) | 2018-05-21 |
AU2012217216B2 (en) | 2015-09-17 |
CA2827266A1 (en) | 2012-08-23 |
EP2676270A1 (en) | 2013-12-25 |
AR098480A2 (es) | 2016-06-01 |
KR20140139630A (ko) | 2014-12-05 |
MX2013009304A (es) | 2013-10-03 |
WO2012110448A1 (en) | 2012-08-23 |
KR20130126708A (ko) | 2013-11-20 |
BR112013020588B1 (pt) | 2021-07-13 |
CA2920964C (en) | 2017-08-29 |
KR101562281B1 (ko) | 2015-10-22 |
JP2014510303A (ja) | 2014-04-24 |
EP2676270B1 (en) | 2017-02-01 |
AU2012217216A1 (en) | 2013-09-26 |
PT2676270T (pt) | 2017-05-02 |
ZA201306842B (en) | 2014-05-28 |
CN103493129B (zh) | 2016-08-10 |
CA2920964A1 (en) | 2012-08-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI476760B (zh) | 用以使用暫態檢測及品質結果將音訊信號的部分編碼之裝置與方法 | |
US11676611B2 (en) | Audio decoding device and method with decoding branches for decoding audio signal encoded in a plurality of domains | |
JP5551693B2 (ja) | エイリアシングスイッチスキームを用いてオーディオ信号を符号化/復号化するための装置および方法 | |
KR101771828B1 (ko) | 오디오 인코더, 오디오 디코더, 인코딩된 오디오 정보를 제공하기 위한 방법, 디코딩된 오디오 정보를 제공하기 위한 방법, 컴퓨터 프로그램 및 신호 적응적 대역폭 확장을 이용한 인코딩된 표현 | |
KR101452722B1 (ko) | 신호 부호화 및 복호화 방법 및 장치 | |
TWI479478B (zh) | 用以使用對齊的預看部分將音訊信號解碼的裝置與方法 | |
RU2627102C2 (ru) | Декодер для формирования аудиосигнала с улучшенной частотной характеристикой, способ декодирования, кодер для формирования кодированного сигнала и способ кодирования с использованием компактной дополнительной информации для выбора | |
KR101792712B1 (ko) | 주파수 도메인 내의 선형 예측 코딩 기반 코딩을 위한 저주파수 강조 | |
KR20110055545A (ko) | 오디오 샘플 인코드 및 디코드용 오디오 인코더 및 디코더 |