TWI595480B - 用以處理音訊信號之方法及裝置、音訊解碼器及音訊編碼器 - Google Patents
用以處理音訊信號之方法及裝置、音訊解碼器及音訊編碼器 Download PDFInfo
- Publication number
- TWI595480B TWI595480B TW104122578A TW104122578A TWI595480B TW I595480 B TWI595480 B TW I595480B TW 104122578 A TW104122578 A TW 104122578A TW 104122578 A TW104122578 A TW 104122578A TW I595480 B TWI595480 B TW I595480B
- Authority
- TW
- Taiwan
- Prior art keywords
- filter
- current frame
- filtered
- filtering
- frame
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 88
- 230000005236 sound signal Effects 0.000 title claims description 88
- 238000012545 processing Methods 0.000 title claims description 39
- 238000001914 filtration Methods 0.000 claims description 52
- 238000004590 computer program Methods 0.000 claims description 8
- 230000001373 regressive effect Effects 0.000 claims description 5
- 230000004044 response Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 9
- 230000007774 longterm Effects 0.000 description 8
- 238000007796 conventional method Methods 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/03—Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/09—Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0264—Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0011—Long term prediction filters, i.e. pitch estimation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/02—Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
- G11B27/031—Electronic editing of digitised analogue information signals, e.g. audio or video signals
- G11B27/038—Cross-faders therefor
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/06—Receivers
- H04B1/10—Means associated with receiver for limiting or suppressing noise or interference
- H04B1/1027—Means associated with receiver for limiting or suppressing noise or interference assessing signal quality or detecting noise/interference for the received signal
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Stereophonic System (AREA)
Description
本發明係關於音訊信號領域,更明確地說係關於用以處理包含複數個音訊框之一音訊信號的方法,其中在連續的過濾音訊框之間的間斷性被減低或略去。
在音訊信號處理領域中,一音訊信號係可以由於各種理由而過濾,例如,長期預測濾波器係可以使用於音訊信號編碼器中,以減輕或甚至完全地抑制音訊信號中之一組諧波。
音訊信號包含複數個音訊框,並且該等訊框係使用長期預測濾波器而過濾。當考慮一音訊信號之二個連續的訊框(一過去訊框和一目前訊框)時,具有一組參數c之一線性濾波器H(z)係使用於過濾該音訊信號。更明確地說,該過去訊框係使用一第一組參數c 0 以藉由濾波器H(z)而過濾,其將產生一所謂的過濾過去訊框。該目前訊框係使用
一組參數c 1 藉由該濾波器H(z)而過濾,其將產生一過濾目前訊框。圖1展示用以依據一習知方法而處理一音訊信號之連續訊框的方塊圖。包含複數個音訊框之一音訊信號100被提供。該音訊信號100係供應至一濾波器方塊102並且音訊信號100之一目前訊框n被過濾。該濾波器方塊,除了接收音訊信號100之外,也接收用於音訊信號之目前訊框的一組濾波器參數c n 。該濾波器方塊102過濾該音訊信號之目前訊框n並且輸出包含連續過濾訊框之一過濾音訊信號104。於圖1中,過濾目前訊框n、過濾過去訊框n-1以及過濾第二最後訊框n-2係分解地展示。該等過濾訊框是分解地表示於圖1中,在該等過濾訊框間具有分別的間隙用以分解地表明可以藉由過濾處理程序而引介於該等過濾訊框之間的一間斷性106a、106b。該濾波器方塊102使用用於一過去訊框n-1和一目前訊框n之分別的濾波器參數c 0 和c 1 而導致音訊信號之訊框的過濾。大體上,濾波器方塊102可以是一線性濾波器H(z),並且對於此一線性濾波器H(z)之一範例是上面所提的長期預測濾波器H(z)=1-g.z-T其中該等濾波器參數是增益“g”以及間距遲滯“T”。在更一般之形式中,該長期預測濾波器係可以如下所示地說明:H(z)=1-g.A(z).z-T其中A(z)是一FIR濾波器。一長期預測濾波器係可以使用以減弱或甚至完全抑制一音訊信號中之一組諧波。但是,當使用此一長期預測濾波器時以及當過去訊框濾波器參數
c 0 是不同於目前訊框濾波器參數c 1 時,在過濾的過去訊框n-1和過濾的目前訊框n之間有高機率引介一間斷性106a、106b(參看圖1)。這間斷性可能在過濾的音訊信號104中產生一人工產物,例如,一“滴答聲”。
因此,鑑於上述導致間斷性之連續訊框的過濾之問題,依序地,其可能產生非所需的人工產物,需要有移除一可能的間斷性之一技術。關於一音訊信號之過濾訊框的間斷性之移除的許多先前技術方法是本技術中所習知。
假使線性濾波器H(z)是一FIR濾波器,目前訊框係藉由目前訊框之濾波器參數c 1 而過濾以供產生一過濾的目前訊框。此外,該目前訊框之一開始部份係藉由過去訊框c 0 之濾波器參數而過濾以供產生一過濾的訊框部份,並且接著一疊加或交叉衰褪操作係在過濾目前訊框和過濾訊框部份之開始部份上進行。圖2展示用於移除一間斷性之處理連續音訊框的此一習見方法之一方塊圖。當比較至圖1時,濾波器方塊102包含用以進行疊加或交叉衰褪操作之一進一步的處理方塊108。在過濾音訊信號104中,在連續過濾訊框之間將是沒有或只有一減低之間斷性,如分解地表明於展示連續過濾訊框n、n-1以及n-2之圖2中,而無圖1之間隙。
在其他先前技術方法中,濾波器H(z)可以是具有一遞迴部份之一濾波器,例如,一IIR濾波器。在此一情況下,如上述關於圖2之方法係依據一樣本接著樣本方
式而應用。在一第一步驟中,處理開始於係藉由產生一第一過濾樣本之過去訊框n-1的濾波器參數c 0 而過濾的目前訊框n之開始部份的第一樣本。該樣本也藉由產生一第二過濾樣本之目前訊框n的濾波器參數c 1 而過濾。接著,疊加或交叉衰褪操作係基於產生過濾目前訊框n之對應樣本之第一和第二過濾樣本而進行。接著,下一個樣本被處理並且上述步驟重複,直至目前訊框n之開始部份的最後樣本係已被處理為止。目前訊框n之其餘樣本係藉由目前訊框n之濾波器參數c 1 而過濾。
用以自連續過濾訊框移除一間斷性之上述習知方法的範例被說明,例如,在US 5,012,517A中,關於一轉換編碼器之脈絡;在EP 0732687A2中,關於一語音帶寬擴充器之脈絡;在US 5,999,899A中,關於一轉換音訊編碼器之脈絡;或在US 7,353,168B2中,關於一解碼語音後濾波器之脈絡。
雖然上面方法有效地用以移除非所需的信號間斷性,因為這些方法操作於目前訊框之一特定部份上,開始部份,為了有效,該訊框部份長度必須是充分地長,例如,於20ms之一訊框長度的情況中,訊框部份或開始部份長度可能是5ms之長度。在某些情況中,這可能是太長,特別是在過去訊框濾波器參數c 0 將不適用於應用至目前訊框之情況中,並且這可能導致額外之人工產物。一範例是具有快速改變間距之一諧波音訊信號,以及一長期預測濾波器,其係設計以減低諧波之振幅。因此,從一訊框至下
一個訊框之間距遲滯是不同的。具有於目前訊框中預估之間距的長期預測濾波器將有效地減低目前訊框中之諧波振幅,但是如果使用於音訊信號之間距是不同的另一訊框中(例如,下一個訊框之開始部份),其將不減低諧波之振幅。它甚至可能因減低信號中之非諧波相關成分的振幅,引入信號中之一失真,而使事情變得更糟。
本發明之一目的是提供一改進方法,其用以移除在過濾音訊框之中的間斷性而不會於過濾音訊信號中產生任何可能的失真。
這目的可藉由依據獨立的申請專利範圍之一方法和一裝置而達成。
本發明提供用以處理一音訊信號之方法,該方法包括使用線性預測濾波器,移除在該音訊信號之一過濾過去訊框以及一過濾目前訊框之間的一間斷性。
線性預測濾波器可以被定義如
其中M是濾波器階數並且a m 是濾波器係數(其中a 0=1)。這種濾波器也是習知為線性預測編碼(LPC)。
依據實施例,方法包括藉由利用一信號修改過濾目前訊框之一開始部份以過濾音訊信號之目前訊框以及
移除間斷性,該信號是藉由線性預測過濾一預定信號所得到,而該線性預測濾波器的啟始狀態是依據該過去訊框之一最後部份所界定。
依據實施例,線性預測濾波器之等啟始狀態係依據使用過濾該目前訊框之一組濾波器參數而過濾之未過濾過去訊框的一過去部份而界定。
依據實施例,方法包括在該過濾或該非過濾音訊信號上估計該線性預測濾波器。
依據實施例,估計線性預測濾波器包括使用萊文森-杜賓(Levinson-Durbin)演算法而基於該音訊信號之該過去或該目前訊框或基於該音訊信號之該過去過濾訊框以估計該濾波器。
依據實施例,線性預測濾波器包括一音訊編解碼器之一線性預測濾波器。
依據實施例,移除間斷性包括處理過濾目前訊框之開始部份,其中該目前訊框之該開始部份具有較小於或等於該目前訊框中樣本總數目之一預定數目樣本,並且其中處理該目前訊框之該開始部份包括自該過濾目前訊框之該開始部份減去一零-輸入-響應(ZIR)之一開始部份。
依據實施例,方法包括使用一非遞迴濾波器,例如一FIR濾波器,而過濾該音訊信號之該目前訊框,以供產生該過濾目前訊框。
依據實施例,方法包括使用一遞迴濾波器,例如,一IIR濾波器,依據一樣本接樣本基礎而處理該音訊
信號之該未過濾目前訊框,並且其中處理該目前訊框之該開始部份的一樣本包括下列步驟:使用該目前訊框的該等濾波器參數而藉由該遞迴濾波器以過濾該樣本,以供產生一過濾樣本,以及自該過濾樣本減去一對應的ZIR樣本,以供產生該過濾目前訊框之對應的樣本。
依據實施例,過濾和減去程序係重複直至該目前訊框之該開始部份中的最後樣本被處理為止,並且其中該方法進一步地包括使用該目前訊框之該等濾波器參數而藉由該遞迴濾波器以過濾該目前訊框中之其餘樣本。
依據實施例,方法包括產生該ZIR,其中產生該ZIR包括下列步驟:藉由係使用於用以過濾該目前訊框之該濾波器以及該等濾波器參數以過濾該未過濾過去訊框之M個最後樣本以供產生一第一部份之過濾信號,其中M是該線性預測濾波器階數,自該第一部份之過濾信號減去該過濾過去訊框之該M個最後樣本,使用該過去訊框之該等濾波器參數而過濾,以供產生一第二部份之過濾信號,以及藉由以該線性預測濾波器和等於該第二部份之過濾信號的啟始狀態而過濾零樣本之一訊框,而產生一線性預測濾波器之一ZIR。
依據實施例,方法包括窗化該ZIR,以至於其之振幅更快地減少至零。
本發明是基於發明人之發現,用以移除信號間斷性的習見方法中之導致上述額外之不需要的失真之確認問題,主要地由於目前訊框或其之至少一部份之處理是基於對於過去訊框之濾波器參數。依據本發明之方法,這可被避免,亦即,本發明方法不藉由過去訊框之濾波器參數而過濾目前訊框之一部份,並且因此避免上述之問題。依據實施例,用以移除間斷性,一LPC濾波器(線性預測濾波器)係使用於移除該間斷性。該LPC濾波器可以於音訊信號上被預估並且因此其是音訊信號之頻譜形狀的良好模式,因而,當使用該LPC濾波器時,音訊信號之頻譜形狀將遮蓋該間斷性。在一實施例中,該LPC濾波器可以依據該非過濾音訊信號或依據係藉由上述之一線性濾波器H(z)而過濾的一音訊信號而預估。依據實施例,該LPC濾波器可以藉由使用音訊信號(例如,目前訊框及/或過去訊框)、以及萊文森-德賓(Levinson-Durbin)演算法而預估。其也可以使用該萊文森-德賓演算法而僅依據過去之過濾訊框信號而計算。
再於其他實施例中,用以處理音訊信號之一音訊編解碼器可以使用一線性濾波器H(z)並且也可以使用一LPC濾波器,量化或不是量化的,例如,以於一轉換為基礎之音訊編解碼器中形成量化雜訊。於此一實施例中,這現有的LPC濾波器可以直接地被使用以使間斷性平順,而不需要預估一新的LPC濾波器所需之額外的複雜性。
100‧‧‧音訊信號
102‧‧‧濾波器方塊
104‧‧‧過濾音訊信號
106a、106b‧‧‧間斷性
108‧‧‧處理方塊
110、112‧‧‧處理方塊
200‧‧‧編碼器
202‧‧‧輸入
204‧‧‧音訊信號
206‧‧‧編碼處理器
208‧‧‧輸出
210‧‧‧天線
212‧‧‧音訊信號無線發送
214‧‧‧編碼音訊信號
250‧‧‧解碼器
252‧‧‧輸入
254‧‧‧天線
256‧‧‧解碼處理器
258‧‧‧解碼音訊信號
260‧‧‧輸出
S100-S104‧‧‧音訊信號之目前訊框處理步驟
S200-S204‧‧‧產生ZIR樣本之處理步驟
S300-S308‧‧‧處理過濾目前訊框開始部份之步驟
S400-S402‧‧‧處理過濾目前訊框開始部份之步驟
在下面,本發明實施例將參考附圖而說明,於附圖中:圖1展示依據一習見方法而用以處理一音訊信號之連續訊框的方塊圖,圖2展示用以處理移除一間斷性之連續音訊框的另一習見方法之方塊圖,圖3展示用以發送音訊信號的一系統之簡化方塊圖,該系統是實行本發明用以移除在編碼器端及/或在解碼器端之一音訊信號的連續訊框之間的一間斷性之方法,圖4展示依據一實施例而揭示本發明用以移除在一音訊信號的連續訊框之間的一間斷性之方法的流程圖,圖5展示依據本發明實施例用以處理一目前音訊框(儘管間斷性之移除而仍可避免輸出信號中非所需的失真)之分解方塊圖,圖6展示代表用以產生ZIR之圖5中的方塊功能之流程圖,圖7展示代表圖5中用以在濾波器方塊包括類似於一IIR過濾法之一遞迴過濾法的情況中,處理過濾目前訊框開始部份之方塊功能性的流程圖,以及圖8展示代表圖5中用以在濾波器方塊包括類似於一FIR濾波器之一非遞迴過濾法的情況中,處理過濾目前訊框開始部份之方塊功能性的流程圖。
在下面,本發明方法之實施例將進一步地詳細被說明,並且應注意到,具有相同或相似功能性之附圖元件是藉由相同參考標號而表示。
圖3展示用以在編碼器端及/或在解碼器端實行本發明方法而發送音訊信號之系統的簡化方塊圖。圖3之系統包括在一輸入202接收一音訊信號204之一編碼器200。該編碼器包含一編碼處理器206,其接收音訊信號204以及產生在編碼器之一輸出208所提供的一編碼音訊信號。該編碼處理器係可以程式規劃或建立,以實行本發明方法而用以處理所接收的音訊信號之連續音訊框以避免間斷性。在其他實施例中,編碼器不需要是一發送系統之部份,但是,其可以是產生編碼音訊信號之一獨立設備,或其可以是一音訊信號發送器之部份。依據一實施例,編碼器200可以包括一天線210以允許音訊信號之無線發送,如表明於212。在其他實施例中,編碼器200可以使用一有線連接線而輸出在輸出208所提供之編碼音訊信號,例如,如在參考標號214所表明。
圖3之系統進一步地包括一解碼器250,其具有一輸入252,該輸入252,例如,經由有線的線路214或經由一天線254而接收將藉由編碼器250而處理之一編碼音訊信號。編碼器250包括一解碼處理器256,其操作於編碼信號上以及在一輸出260提供一解碼音訊信號258。解碼處理器256係可以實行以依據本發明方法而操作於以避免間斷性之方式被過濾之連續訊框上。在其他實施例中,解碼器
不需要是一發送系統之部份,然而,其可以是用以解碼被編碼之音訊信號的一獨立設備,或其可以是一音訊信號接收器之部份。
在下面,將進一步地詳細說明,可以實行於編碼處理器206和解碼處理器256之至少一者的本發明實施例之方法。圖4展示依據本發明一實施例之方法而用以處理音訊信號之一目前訊框的流程圖。目前訊框之處理將被說明,並且過去訊框是假定先前藉由下面說明之相同技術而處理。依據本發明,在步驟S100中,音訊信號之一目前訊框被接收。在步驟S102中,目前訊框被過濾,例如,以如上所述關於圖1和2之方式(參看濾波器方塊102)。依據本發明方法,在該過濾過去訊框n-1和該過濾目前訊框n之間的一間斷性(參看圖1或2)將使用線性預測濾波器而移除,如表明於步驟S104。依據一實施例,線性預測濾波器可以如下所述地定義:
其中M是濾波器階數並且a m 是濾波器係數(其中a 0=1)。這種濾波器也是習知為線性預測編碼(LPC)。依據實施例,該過濾目前訊框藉由應用線性預測濾波器至該過濾目前訊框之至少一部份而被處理。間斷性可以藉由利用一信號而修改過濾目前訊框之一開始部份而移除,該信號是藉由線性預測過濾一預定信號所得到,而該線性預測濾波器
的啟始狀態是依據該過去訊框之一最後部份所界定。該線性預測濾波器之該等啟始狀態可以依據使用過濾該目前訊框之該組濾波器參數而過濾之該過去訊框的一過去部份而界定。由於本發明方法不需要藉由使用於過去訊框之一濾波器係數以過濾一音訊信號之目前訊框,那是有利的,並且因而將可避免如上述參看圖2所述的先前技術方法時所遭遇,由於用於該目前訊框以及用於該過去訊框之濾波器參數的錯配而出現問題。
圖5展示依據本發明實施例用以處理音訊信號之一目前音訊框的分解方塊圖,其不論間斷性之移除而亦能避免輸出信號中非所需的失真。於圖5中,如圖1和2中之相同參考標號亦被使用。音訊信號100之一目前訊框n被接收,音訊信號100之各個訊框具有複數個樣本。音訊信號100之目前訊框n藉由濾波器方塊102而處理。當比較至圖1和2之先前技術方法時,依據關於圖5之如上所述實施例,該過濾目前訊框係進一步地依據ZIR樣本而處理,如分解地藉由方塊110所展示。依據一實施例,基於過去訊框n-1,以及基於一LPC濾波器,該ZIR樣本被產生,如分解地藉由方塊112所展示。
接著處理方塊110和112之功能性將進一步更詳細地被說明。圖6展示代表用以產生ZIR樣本之處理方塊112的功能性之流程圖。如上所述,一音訊信號100之訊框係使用用於分別的訊框所選擇或所判定之濾波器參數c以藉由一線性濾波器H(z)而過濾。濾波器H(z)可以是一遞迴
濾波器,例如,一ILR濾波器,或其可以是一非遞迴濾波器,例如,一FIR濾波器。在處理方塊112中,一LPC濾波器係被使用,其可能是或可能不是被量化。該LPC濾波器之階數是M並且可以於過濾或非過濾音訊信號上被預估或也可以係使用於一音訊編解碼器中之LPC濾波器。在一第一步驟S200中,過去訊框n-1之M(M=該LPC濾波器之階數)個最後樣本,使用目前訊框n之濾波器參數或係數c 1 以藉由該濾波器H(z)而過濾。步驟S200因而產生過濾信號之一第一部份。在步驟S202中,過濾過去訊框n-1之M個最後樣本(過去訊框之M個最後樣本係使用過去訊框n-1之濾波器參數或係數c 0 而過濾)係自藉由步驟S200所提供的過濾信號之第一部份被減去,因而產生過濾信號之一第二部份。在步驟S204中,具有階數M之LPC濾波器被應用,更明確地說,在步驟S204中,LPC濾波器之一個零輸入響應(ZIR)藉由過濾零樣本之一訊框而產生,其中濾波器之啟始狀態是等於過濾信號之第二部份,因而產生該ZIR。依據實施例,該ZIR可以窗化,以至於其之振幅更快地減少至0。
如上面關於圖5之所述,ZIR係應用於處理方塊110中,如同使用線性濾波器H(z),一遞迴濾波器,如一IIR濾波器之情況,其功能性係參考圖7之流程圖而被說明。依據關於圖5所說明之實施例,用以移除在目前訊框和過去訊框之間的間斷性而避免非所需的失真,過濾目前訊框n包括以一樣本接樣本基礎地處理(過濾)目前訊框n,其中開始部份之樣本依據本發明方法而處理。更明確地
說,目前訊框n的一開始部份之M樣本被處理,並且在一第一步驟S300,變量m是設定至0。在下一個步驟S302中,目前訊框n之樣本m係使用濾波器H(z)以及用於目前訊框n之濾波器係數或參數c 1 而過濾。因此,除了習見的方法之外,依據本發明方法,目前訊框是不使用來自過去訊框之係數而過濾,而是僅使用來自目前訊框之係數,其不論間斷性是否被移除,因而避免存在於習見方法中之非所需的失真。步驟S302產生一過濾樣本m,並且在步驟S304中,對應至樣本m的ZIR樣本係自產生過濾目前訊框n的對應樣本之過濾樣本m被減去。在步驟S306中,判定目前訊框n之開始部份的最後樣本M是否被處理。在不是開始部份的所有M樣本已被處理之情況中,變量m被增量並且方法步驟S302至S306被重複以供用於目前訊框n之下一個樣本。一旦開始部份的所有M個樣本被處理,在步驟S308,目前訊框n之其餘樣本係使用目前訊框之濾波器參數c 1 而過濾,因而提供依據本發明方法而處理之過濾目前訊框n,以當在連續訊框之間的間斷性移除之同時,避免非所需的失真。
依據另一實施例,線性濾波器H(z)是一非遞迴濾波器,類似於一FIR濾波器,並且ZIR,如上面關於圖5之所述,係應用於處理方塊110中。這實施例之功能性將參考圖8之流程圖而說明。在步驟S400,目前訊框n,是使用用於目前訊框之濾波器係數或參數c 1 以藉由濾波器H(z)而過濾。因此,除了習見的方法之外,依據本發明方法,
目前訊框是不使用來自過去訊框之係數而過濾,而是僅使用來自目前訊框之係數,其不論間斷性是否移除,因而避免存在於習見方法之非所需的失真。在步驟S402中,ZIR之一開始部份係自過濾目前訊框之一對應的開始部份被減去,因而提供具有依據本發明方法而過濾/處理之開始部份的過濾目前訊框n並且其餘部份僅使用用於目前訊框之濾波器係數或參數c 1 而過濾,因而當在連續訊框之間的間斷性移除之同時,避免非所需的失真。
本發明方法係可以應用於如上所述之當音訊信號被過濾時的情況中。依據實施例,本發明方法也可以應用在解碼器端,例如,當使用一音訊編解碼器後濾波器以減低在信號諧波之間的編碼雜訊位準時。依據一實施例,為了在解碼器處理音訊框,後濾波器可以是如下所示:H(z)=(1-B(z))/(1-A(z).z-T)其中B(z)和A(z)是二個FIR濾波器,並且H(z)濾波器參數是FIR濾波器B(z)和A(z)之係數,而且T表明間距遲滯。於此一情節中,該濾波器也可能引介在兩個過濾訊框之間的一間斷性,例如,當過去濾波器訊框參數c 0 是不同於目前訊框濾波器參數c 1 時,並且此一間斷性可能在過濾音訊信號104中產生一人工產物,例如,一“滴答聲”。這間斷性藉由處理過濾目前訊框而移除,如上面之詳細說明。
雖然上述概念之一些論點已說明於一裝置之脈絡中,應明白這些論點也代表對應的方法之一說明,其中一方塊或設備對應至一方法步驟或一方法步驟之一特點。
類似地,一方法步驟之脈絡中所述論點也代表一對應的方塊之一說明或一對應的裝置之項目或特點。
取決於特定實行例之需要,本發明實施例可以硬體或以軟體而實行。該實行例可以使用一數位儲存媒體而進行,例如,具有電子式可讀取控制信號儲存在其上之一軟式磁碟片、一DVD、一藍光碟、一CD、一ROM、一PROM、一EPROM、一EEPROM或一快閃記憶體,其與一可程控電腦系統協作(或是可協作),以至於分別的方法可被進行。因此,該數位儲存媒體可以是電腦可讀取的。
依據本發明,一些實施例包括一資料載體,其具有電子式可讀取控制信號,其是可與一可程控電腦系統協作,以至於此處說明的方法之一者係可被進行。
通常,本發明實施例係可以實行作為具有一程式碼之一電腦程式產品,該程式碼是可操作而當該電腦程式產品執行於一電腦上時用以進行該等方法之一者。該程式數碼可以,例如,儲存於一機器可讀取載體上。
其他實施例包括電腦程式,其用以進行此處說明之儲存於一機器可讀取載體上的該等方法之一者。
換言之,因此,本發明方法之一實施例是具有一程式碼之一電腦程式,當該電腦程式執行於一電腦上時,其用以進行此處說明的該等方法之一者。
因此,本發明方法之進一步的實施例是,一資料載體(或一數位儲存媒體、或一電腦可讀取媒體),其包括(記錄在其上)用以進行此處說明的該等方法之一者的電
腦程式。
因此,本發明方法之進一步的實施例是,一資料流或一序列之信號,其代表用以進行此處說明的該等方法之一者的電腦程式。該資料流或該等序列信號可以,例如,係組態以透過一資料通訊連接(例如,經由網際網路)而轉移。
進一步的一實施例包括一處理構件,例如,一電腦、或一可程控邏輯設備,其係組態或調適而用於進行此處說明的該等方法之一者。
進一步的一實施例包括一電腦,其具有安裝在其上之電腦程式而用以進行此處說明的該等方法之一者。
在一些實施例中,一可程控邏輯設備(例如,一場式可程控閘陣列)係可以使用以進行此處說明的該等方法之一些或所有的功能。在一些實施例中,一場式可程控閘陣列可以與一微處理機協作,以便進行此處說明的該等方法之一者。通常,該等方法最好是藉由任何硬體裝置而進行。
上述之實施例僅是作為本發明原理之例示。熟習本技術者應了解,此處說明之配置和細節可以有修改和變化。因此,其之含義是僅受限定於待決之申請專利範圍的範疇,並且不受限定於藉由此處實施例之說明和敘述所呈現之特定細節。
100‧‧‧音訊信號
102‧‧‧濾波器方塊
104‧‧‧過濾音訊信號
110、112‧‧‧處理方塊
Claims (15)
- 一種用以處理一音訊信號之方法,該方法包括:使用線性預測過濾來移除在該音訊信號之一過濾過去訊框以及一過濾目前訊框之間的一不連續性,其中該方法包括過濾該音訊信號之該目前訊框以及藉由利用一信號修改該過濾目前訊框之一開始部份以移除該不連續性,該信號是藉由線性預測過濾一預定信號所得到,而該線性預測濾波器的啟始狀態係依據使用過濾該目前訊框之一組濾波器參數而過濾之未過濾過去訊框的一最後部份而界定。
- 如請求項1的方法,進一步地包括在過濾或非過濾之該音訊信號上估計該線性預測濾波器。
- 如請求項2之方法,其中估計該線性預測濾波器包括使用萊文森-杜賓(Levinson-Durbin)演算法而基於該音訊信號之該過去及/或該目前訊框或基於該音訊信號之該過去過濾訊框以估計該濾波器。
- 如請求項1的方法,其中該線性預測濾波器包括一音訊編解碼器之一線性預測濾波器。
- 如請求項1的方法,其中移除該不連續性包括處理該過濾目前訊框之該開始部份,其中該目前訊框之該開始部份具有較小於或等於該目前訊框中樣本總數目之一預定數目樣本,並且其中處理該目前訊框之該開始部份包 括自該過濾目前訊框之該開始部份減去一零-輸入-響應(ZIR)之一開始部份。
- 如請求項5之方法,其包括使用一非遞迴濾波器而過濾該音訊信號之該目前訊框,以供產生該過濾目前訊框。
- 如請求項5之方法,其包括使用一遞迴濾波器依據一樣本接樣本基礎而處理該音訊信號之該未過濾目前訊框,並且其中處理該目前訊框之該開始部份的一樣本包括下列步驟:使用該目前訊框的該等濾波器參數而以該遞迴濾波器過濾該樣本,以供產生一過濾樣本,以及自該過濾樣本減去一對應的ZIR樣本,以供產生該過濾目前訊框之對應的樣本。
- 如請求項7之方法,其中過濾和減去程序係重複直至該目前訊框之該開始部份中的最後樣本被處理為止,並且其中該方法進一步地包括使用該目前訊框之該等濾波器參數而以該遞迴濾波器過濾該目前訊框中之其餘樣本。
- 如請求項5的方法,其包括產生該ZIR,其中產生該ZIR包括下列步驟:以使用於過濾該目前訊框之該濾波器以及該等濾波器參數過濾該未過濾過去訊框之M個最後樣本以供產生一第一部份之過濾信號,其中M是該線性預測濾波器之階數,自該第一部份之過濾信號減去該過濾過去訊框之 該M個最後樣本,使用該過去訊框之該等濾波器參數而過濾,以供產生一第二部份之過濾信號,以及藉由以該線性預測濾波器和等於該第二部份之過濾信號的啟始狀態而過濾零樣本之一訊框,產生一線性預測濾波器之一ZIR。
- 如請求項9之方法,其包括窗化該ZIR,致使其振幅更快地減少至零。
- 一種非暫態電腦程式產品,其包括儲存指令之一電腦可讀取媒體,當該等指令於一電腦上執行時,則實行如請求項1至10之任一項的方法。
- 一種用以處理一音訊信號之裝置,該裝置包括:組配來使用線性預測過濾的一處理器,其用以移除在該音訊信號的一過濾過去訊框和一過濾目前訊框之間的一不連續性,其中該處理器係組配來過濾該音訊信號的目前訊框並藉由利用一信號修改該過濾目前訊框之一開始部份移除該不連續性,該信號係藉由線性預測過濾一預定信號所得到,而線性預測濾波器的啟始狀態係依據使用過濾該目前訊框之一組濾波器參數而過濾之未過濾過去訊框的一最後部份而界定。
- 一種用以處理一音訊信號之裝置,該裝置係組配來依據如請求項1至10之任一項的方法而操作。
- 一種音訊解碼器,其包括如請求項12或13之裝置。
- 一種音訊編碼器,其包括如請求項12或13之裝置。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP14178821.6A EP2980796A1 (en) | 2014-07-28 | 2014-07-28 | Method and apparatus for processing an audio signal, audio decoder, and audio encoder |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201606754A TW201606754A (zh) | 2016-02-16 |
TWI595480B true TWI595480B (zh) | 2017-08-11 |
Family
ID=51224879
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW104122578A TWI595480B (zh) | 2014-07-28 | 2015-07-13 | 用以處理音訊信號之方法及裝置、音訊解碼器及音訊編碼器 |
Country Status (18)
Country | Link |
---|---|
US (5) | US20170133028A1 (zh) |
EP (6) | EP2980796A1 (zh) |
JP (4) | JP6503051B2 (zh) |
KR (5) | KR102459857B1 (zh) |
CN (2) | CN113012704B (zh) |
AR (1) | AR101287A1 (zh) |
AU (1) | AU2015295709B2 (zh) |
CA (6) | CA3193309A1 (zh) |
ES (4) | ES2685984T3 (zh) |
HK (1) | HK1259289A1 (zh) |
MX (1) | MX362737B (zh) |
MY (1) | MY179016A (zh) |
PL (4) | PL4030426T3 (zh) |
PT (3) | PT3175452T (zh) |
RU (1) | RU2665282C1 (zh) |
SG (1) | SG11201700684YA (zh) |
TW (1) | TWI595480B (zh) |
WO (1) | WO2016015950A1 (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2980796A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for processing an audio signal, audio decoder, and audio encoder |
WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
EP3483884A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
EP3483880A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Temporal noise shaping |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
EP3483883A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
WO2019091573A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters |
EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
CN117040487B (zh) * | 2023-10-08 | 2024-01-02 | 武汉海微科技有限公司 | 音频信号处理的滤波方法、装置、设备及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080215317A1 (en) * | 2004-08-04 | 2008-09-04 | Dts, Inc. | Lossless multi-channel audio codec using adaptive segmentation with random access point (RAP) and multiple prediction parameter set (MPPS) capability |
WO2011085483A1 (en) * | 2010-01-13 | 2011-07-21 | Voiceage Corporation | Forward time-domain aliasing cancellation using linear-predictive filtering |
Family Cites Families (47)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4969192A (en) * | 1987-04-06 | 1990-11-06 | Voicecraft, Inc. | Vector adaptive predictive coder for speech and audio |
US5012517A (en) | 1989-04-18 | 1991-04-30 | Pacific Communication Science, Inc. | Adaptive transform coder having long term predictor |
CA2568984C (en) * | 1991-06-11 | 2007-07-10 | Qualcomm Incorporated | Variable rate vocoder |
US5784532A (en) * | 1994-02-16 | 1998-07-21 | Qualcomm Incorporated | Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system |
EP0732687B2 (en) | 1995-03-13 | 2005-10-12 | Matsushita Electric Industrial Co., Ltd. | Apparatus for expanding speech bandwidth |
JP3653826B2 (ja) * | 1995-10-26 | 2005-06-02 | ソニー株式会社 | 音声復号化方法及び装置 |
US5960389A (en) * | 1996-11-15 | 1999-09-28 | Nokia Mobile Phones Limited | Methods for generating comfort noise during discontinuous transmission |
SE9700772D0 (sv) * | 1997-03-03 | 1997-03-03 | Ericsson Telefon Ab L M | A high resolution post processing method for a speech decoder |
FR2762464B1 (fr) * | 1997-04-16 | 1999-06-25 | France Telecom | Procede et dispositif de codage d'un signal audiofrequence par analyse lpc "avant" et "arriere" |
GB2326572A (en) | 1997-06-19 | 1998-12-23 | Softsound Limited | Low bit rate audio coder and decoder |
US7072832B1 (en) | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
GB2356538A (en) * | 1999-11-22 | 2001-05-23 | Mitel Corp | Comfort noise generation for open discontinuous transmission systems |
US6584438B1 (en) * | 2000-04-24 | 2003-06-24 | Qualcomm Incorporated | Frame erasure compensation method in a variable rate speech coder |
US7353168B2 (en) | 2001-10-03 | 2008-04-01 | Broadcom Corporation | Method and apparatus to eliminate discontinuities in adaptively filtered signals |
US20040098255A1 (en) * | 2002-11-14 | 2004-05-20 | France Telecom | Generalized analysis-by-synthesis speech coding method, and coder implementing such method |
CN100471072C (zh) * | 2002-11-21 | 2009-03-18 | 日本电信电话株式会社 | 数字信号处理方法 |
US7613606B2 (en) * | 2003-10-02 | 2009-11-03 | Nokia Corporation | Speech codecs |
CA2457988A1 (en) | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
JP4606264B2 (ja) * | 2005-07-19 | 2011-01-05 | 三洋電機株式会社 | ノイズキャンセラ |
EP2030199B1 (en) * | 2006-05-30 | 2009-10-28 | Koninklijke Philips Electronics N.V. | Linear predictive coding of an audio signal |
CN101197134A (zh) * | 2006-12-05 | 2008-06-11 | 华为技术有限公司 | 消除编码模式切换影响的方法和装置以及解码方法和装置 |
US8000969B2 (en) * | 2006-12-19 | 2011-08-16 | Nuance Communications, Inc. | Inferring switching conditions for switching between modalities in a speech application environment extended for interactive text exchanges |
CN101231850B (zh) * | 2007-01-23 | 2012-02-29 | 华为技术有限公司 | 编解码方法及装置 |
US8069051B2 (en) * | 2007-09-25 | 2011-11-29 | Apple Inc. | Zero-gap playback using predictive mixing |
CN101527138B (zh) | 2008-03-05 | 2011-12-28 | 华为技术有限公司 | 超宽带扩展编码、解码方法、编解码器及超宽带扩展系统 |
ES2895268T3 (es) * | 2008-03-20 | 2022-02-18 | Fraunhofer Ges Forschung | Aparato y método para modificar una representación parametrizada |
EP2144171B1 (en) * | 2008-07-11 | 2018-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder for encoding and decoding frames of a sampled audio signal |
EP2346030B1 (en) * | 2008-07-11 | 2014-10-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, method for encoding an audio signal and computer program |
MY156654A (en) * | 2008-07-11 | 2016-03-15 | Fraunhofer Ges Forschung | Audio encoder and decoder for encoding frames of sampled audio signals |
WO2010003532A1 (en) * | 2008-07-11 | 2010-01-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme |
KR20100007738A (ko) * | 2008-07-14 | 2010-01-22 | 한국전자통신연구원 | 음성/오디오 통합 신호의 부호화/복호화 장치 |
CN101355692B (zh) * | 2008-07-30 | 2013-03-20 | 浙江大学 | 一种实时跟踪运动目标区域的智能监控装置 |
WO2010036061A2 (en) * | 2008-09-25 | 2010-04-01 | Lg Electronics Inc. | An apparatus for processing an audio signal and method thereof |
ES2825032T3 (es) * | 2009-06-23 | 2021-05-14 | Voiceage Corp | Cancelación de solapamiento de dominio de tiempo directo con aplicación en dominio de señal original o ponderado |
KR101734948B1 (ko) * | 2009-10-09 | 2017-05-12 | 삼성전자주식회사 | 파워 헤드룸 보고, 자원 할당 및 전력 제어 방법 |
BR112012009447B1 (pt) * | 2009-10-20 | 2021-10-13 | Voiceage Corporation | Codificador de sinal de áudio, decodificador de stnai, de áudio, método para codificar ou decodificar um sinal de áudio usando um cancelamento de aliasing |
US8423355B2 (en) * | 2010-03-05 | 2013-04-16 | Motorola Mobility Llc | Encoder for audio signal including generic audio and speech frames |
BR122021002104B1 (pt) * | 2010-07-08 | 2021-11-03 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E. V. | Codificador que utiliza cancelamento de serrilhado futuro |
CN101976566B (zh) * | 2010-07-09 | 2012-05-02 | 瑞声声学科技(深圳)有限公司 | 语音增强方法及应用该方法的装置 |
US8738385B2 (en) * | 2010-10-20 | 2014-05-27 | Broadcom Corporation | Pitch-based pre-filtering and post-filtering for compression of audio signals |
FR2969805A1 (fr) * | 2010-12-23 | 2012-06-29 | France Telecom | Codage bas retard alternant codage predictif et codage par transformee |
US9037456B2 (en) * | 2011-07-26 | 2015-05-19 | Google Technology Holdings LLC | Method and apparatus for audio coding and decoding |
CN102368385B (zh) * | 2011-09-07 | 2013-08-14 | 中科开元信息技术(北京)有限公司 | 后向块自适应Golomb-Rice编解码方法及装置 |
US9043201B2 (en) * | 2012-01-03 | 2015-05-26 | Google Technology Holdings LLC | Method and apparatus for processing audio frames to transition between different codecs |
JP6126006B2 (ja) * | 2012-05-11 | 2017-05-10 | パナソニック株式会社 | 音信号ハイブリッドエンコーダ、音信号ハイブリッドデコーダ、音信号符号化方法、及び音信号復号方法 |
EP2980797A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, method and computer program using a zero-input-response to obtain a smooth transition |
EP2980796A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for processing an audio signal, audio decoder, and audio encoder |
-
2014
- 2014-07-28 EP EP14178821.6A patent/EP2980796A1/en not_active Withdrawn
-
2015
- 2015-07-03 KR KR1020217029645A patent/KR102459857B1/ko active IP Right Grant
- 2015-07-03 CA CA3193309A patent/CA3193309A1/en active Pending
- 2015-07-03 PT PT15732290T patent/PT3175452T/pt unknown
- 2015-07-03 EP EP22160064.6A patent/EP4030426B1/en active Active
- 2015-07-03 KR KR1020197018895A patent/KR102304326B1/ko active IP Right Grant
- 2015-07-03 EP EP18182785.8A patent/EP3407351B1/en active Active
- 2015-07-03 ES ES15732290.0T patent/ES2685984T3/es active Active
- 2015-07-03 CA CA3193316A patent/CA3193316A1/en active Pending
- 2015-07-03 SG SG11201700684YA patent/SG11201700684YA/en unknown
- 2015-07-03 ES ES22160064T patent/ES2960422T3/es active Active
- 2015-07-03 CA CA3193319A patent/CA3193319A1/en active Pending
- 2015-07-03 CA CA2955674A patent/CA2955674C/en active Active
- 2015-07-03 KR KR1020177005450A patent/KR101997006B1/ko active IP Right Grant
- 2015-07-03 MX MX2017001245A patent/MX362737B/es active IP Right Grant
- 2015-07-03 JP JP2017504689A patent/JP6503051B2/ja active Active
- 2015-07-03 EP EP19209351.6A patent/EP3654333B1/en active Active
- 2015-07-03 AU AU2015295709A patent/AU2015295709B2/en active Active
- 2015-07-03 PL PL22160064.6T patent/PL4030426T3/pl unknown
- 2015-07-03 MY MYPI2017000131A patent/MY179016A/en unknown
- 2015-07-03 EP EP23179786.1A patent/EP4235667A3/en active Pending
- 2015-07-03 CA CA3193302A patent/CA3193302A1/en active Pending
- 2015-07-03 PL PL18182785T patent/PL3407351T3/pl unknown
- 2015-07-03 ES ES19209351T patent/ES2914632T3/es active Active
- 2015-07-03 WO PCT/EP2015/065219 patent/WO2016015950A1/en active Application Filing
- 2015-07-03 CN CN202110100360.9A patent/CN113012704B/zh active Active
- 2015-07-03 KR KR1020237043141A patent/KR20230173744A/ko active Application Filing
- 2015-07-03 CA CA3193306A patent/CA3193306A1/en active Pending
- 2015-07-03 PT PT181827858T patent/PT3407351T/pt unknown
- 2015-07-03 EP EP15732290.0A patent/EP3175452B1/en active Active
- 2015-07-03 ES ES18182785T patent/ES2773690T3/es active Active
- 2015-07-03 KR KR1020227036973A patent/KR102615475B1/ko active IP Right Grant
- 2015-07-03 PL PL15732290T patent/PL3175452T3/pl unknown
- 2015-07-03 PL PL19209351T patent/PL3654333T3/pl unknown
- 2015-07-03 RU RU2017105447A patent/RU2665282C1/ru active
- 2015-07-03 PT PT192093516T patent/PT3654333T/pt unknown
- 2015-07-03 CN CN201580040572.5A patent/CN106575507B/zh active Active
- 2015-07-13 TW TW104122578A patent/TWI595480B/zh active
- 2015-07-23 AR ARP150102337A patent/AR101287A1/es active IP Right Grant
-
2017
- 2017-01-23 US US15/412,920 patent/US20170133028A1/en active Granted
-
2019
- 2019-01-30 HK HK19101650.8A patent/HK1259289A1/zh unknown
- 2019-03-22 JP JP2019054137A patent/JP6864382B2/ja active Active
-
2021
- 2021-03-26 JP JP2021052578A patent/JP7202545B2/ja active Active
-
2022
- 2022-01-20 US US17/580,578 patent/US12014746B2/en active Active
- 2022-02-03 US US17/592,423 patent/US11869525B2/en active Active
- 2022-12-08 JP JP2022196100A patent/JP7509859B2/ja active Active
-
2023
- 2023-06-22 US US18/339,915 patent/US12033648B2/en active Active
- 2023-12-12 US US18/537,655 patent/US20240135943A1/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080215317A1 (en) * | 2004-08-04 | 2008-09-04 | Dts, Inc. | Lossless multi-channel audio codec using adaptive segmentation with random access point (RAP) and multiple prediction parameter set (MPPS) capability |
TW200935401A (en) * | 2008-01-30 | 2009-08-16 | Dts Inc | Lossless multi-channel audio codec using adaptive segmentation with random access point (RAP) and multiple prediction parameter set (MPPS) capability |
WO2011085483A1 (en) * | 2010-01-13 | 2011-07-21 | Voiceage Corporation | Forward time-domain aliasing cancellation using linear-predictive filtering |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI595480B (zh) | 用以處理音訊信號之方法及裝置、音訊解碼器及音訊編碼器 |