TWI441162B - 音訊信號合成器、音訊信號編碼器、用於產生合成音訊信號及資料流的方法、電腦可讀取媒體及電腦程式 - Google Patents
音訊信號合成器、音訊信號編碼器、用於產生合成音訊信號及資料流的方法、電腦可讀取媒體及電腦程式 Download PDFInfo
- Publication number
- TWI441162B TWI441162B TW098122891A TW98122891A TWI441162B TW I441162 B TWI441162 B TW I441162B TW 098122891 A TW098122891 A TW 098122891A TW 98122891 A TW98122891 A TW 98122891A TW I441162 B TWI441162 B TW I441162B
- Authority
- TW
- Taiwan
- Prior art keywords
- signal
- audio signal
- frequency band
- patching
- spectral
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 title claims description 196
- 238000000034 method Methods 0.000 title claims description 54
- 238000004590 computer program Methods 0.000 title claims description 10
- 230000015572 biosynthetic process Effects 0.000 title description 4
- 238000003786 synthesis reaction Methods 0.000 title description 4
- 238000004422 calculation algorithm Methods 0.000 claims description 161
- 230000003595 spectral effect Effects 0.000 claims description 132
- 238000001228 spectrum Methods 0.000 claims description 68
- 238000012545 processing Methods 0.000 claims description 40
- 230000010076 replication Effects 0.000 claims description 28
- 238000005070 sampling Methods 0.000 claims description 16
- 238000001914 filtration Methods 0.000 claims description 11
- 230000005540 biological transmission Effects 0.000 claims description 10
- 230000002123 temporal effect Effects 0.000 claims description 2
- 230000002194 synthesizing effect Effects 0.000 claims 1
- 230000008439 repair process Effects 0.000 description 26
- 238000010586 diagram Methods 0.000 description 12
- 238000005538 encapsulation Methods 0.000 description 11
- 239000002131 composite material Substances 0.000 description 9
- 238000013139 quantization Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000007547 defect Effects 0.000 description 4
- 230000003111 delayed effect Effects 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 230000003362 replicative effect Effects 0.000 description 2
- 230000017105 transposition Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000011049 filling Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000013138 pruning Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Stereophonic System (AREA)
- Circuit For Audible Band Transducer (AREA)
- Reverberation, Karaoke And Other Acoustics (AREA)
Description
本發明有關於用於產生一合成音訊信號的一音訊信號合成器、一音訊信號編碼器及包含一經編碼音訊信號的一資料流。
自然的音訊編碼及語音編碼是音訊信號編解碼的兩個主要類別。自然的音訊編碼器通常用於在中位元率下的音樂或任意信號且大體上提供寬音訊頻寬。語音編碼器基本上限於語音複製且可在極低位元率下使用。寬頻語音在窄帶語音上提供一主要的主觀品質改良。增加該頻寬不僅改良了語音的自然度,而且改良了該揚聲器的辨識及可懂性。因而寬頻語音編碼在下一代的電話系統中將是一重要的課題。而且,由於多媒體領域的極大發展,音樂及其他非語音信號在電話系統以及儲存上的高品質的傳輸及對於例如無線電/電視(TV)傳輸或其他廣播系統上的傳輸是一想要的特性。
為了大量地減小位元率,源編碼可使用分帶感知音訊編解碼器來執行。此等自然音訊編解碼在該信號中採用感知不相關及統計冗餘。關於所給定的位元率限制,僅單單利用上述是不足的,取樣率會被減小。通常也降低合成位準的量,允許偶爾可聽見的量化失真,且透過二或更多個通道的聯合立體聲編碼或參數編碼使立體聲場退化。此等方法的過多使用導致惱人的感知下降。為了改良該編碼性能,諸如頻譜帶複製(SBR)的頻帶擴展方法作為用以在一HFR(高頻重建)式編解碼中產生高頻信號的一有效方法。
在複製該等高頻信號過程中,某一轉換可用於例如低頻信號且該等經轉換的信號接著作為高頻信號予以插入。此過程還被稱為修補且可使用不同的轉換。MPEG-4音訊標準對所有音訊信號僅使用了一種修補演算法。因此,其缺乏使該修補適應於不同的信號或編碼方案的靈活性。
另一方面,該MPEG-4標準提供對再生高頻帶的一複雜處理,其中用了許多重要的SBR參數。此等重要的SBR參數是頻譜包封的資料、用於增加於該再生頻譜部分的雜訊基準的資料、使該再生高頻之音調適應於該原始高頻之音調的反濾波工具的資訊及額外的頻譜帶複製處理資料(諸如缺漏諧波的資料)等。在濾波器組域內對由連續帶通信號之一修補所提供之經複製的頻譜的既定處理被證實可有效地提供高品質且在關於處理功率、記憶體需求及功率需求的合理資源下可實施。
另一方面,如同該經修補信號的另一處理的發生,修補發生在同一濾波器組中,所以在該修補操作與該修補操作之結果的另一處理之間具有極大關係。因而,在此結合的方法中,不同修補演算法的實施是有問題的。
第WO 98/57436號案揭露了用於與頻譜包封調整相結合之頻譜帶複製中的換位方法。
第WO 02/052545號案教示了信號可被分類為似脈衝列或似非脈衝列,且基於此分類一適應的切換換位器予以提出。該切換換位器平行地執行二修補演算法,且一混合單元依據該分類(脈衝列或非脈衝列)合併二經修補的信號。在該等換位器之間的實際切換或混合根據包封及控制資料執行於一包封調整濾波器組中。另外,對於似脈衝列組信號,該基帶信號轉換至一濾波器組域內,一頻率變換操作被執行且該頻率變換之結果的一包封調整被執行。這是結合修補/進一步一處理的方法。對於似非脈衝列信號,一頻域換位器(FD換位器)被提供且該頻域換位器的結果接著被轉換為該濾波器組域,其中該包封調整獲執行。因而,一方面具有結合修補/進一步一處理的方法,且在另一方面具有位於供該包封調整發生之該濾波器組外的一頻域換位器的實現及彈性對於彈性及實現的可能性是有問題的。
本發明的一目的是提供一提供改良的品質且允許有效實施的合成器。
此目的藉由根據申請專利範圍第1項之該合成器、根據申請專利範圍第9項之一編碼器、根據申請專利範圍第13項之用於產生一合成音訊信號的一方法或根據申請專利範圍第14項之用於產生一資料流的一方法來實現。
本發明是基於一方面該修補操作及另一方面該修補操作之輸出的另一處理必須完全地在獨立域中執行的發現。這對一方面在一修補發生器內最佳化不同的修補演算法,及另一方面不管根本的修補演算法是什麼總是使用同一包封調整提供了彈性。因而,在該頻譜域(其中該包封調整發生)之外任何經修補之信號的產生允許完全地獨立於後續SBR之另一處理將不同的修補演算法應用於不同的信號部分,且設計者不必考慮來自包封調整的修補演算法的細節或不必考慮某一包封調整之修補演算法的細節。相反地,頻譜帶複製的不同成分,即一方面該修補操作及另一方面該修補結果的另一操作可相互獨立地予以執行。這意味著在整個頻譜帶複製中,修補演算法單獨地予以執行,而具有修補及該等剩餘SBR操作可相互獨立地予以最佳化的結果,且因而對於未來的修補演算法等是有彈性的,該等修補演算法可容易地予以應用而不用改變在一頻譜域中(其中未發生任何修補)所執行之該修補結果之另一處理的任何參數。
因為其允許將不同的修補演算法容易地應用於信號部分,使得該基帶信號的每一信號部分由以最佳方式適於此信號部分的修補演算法來修補,所以本發明提供一改良的品質。另外,仍可使用操作於濾波器組中且既定及已經存在於諸如該MPEG-4 HE-AAC之許多應用中的直接、有效且高品質的包封調整工具。透過將該等修補演算法與進一步的處理分離,使得沒有修補演算法應用於供該修補結果之進一步處理執行的該濾波器組域中,該修補結果之既定的進一步處理可應用於所有可得的修補演算法中。然而,可取捨地,該修補也可在該濾波器組及其他域中予以執行。
另外,因為對於低階的應用可使用要求較少資源的修補演算法,而對於高階的應用可使用要求較多資源的修補演算法,這產生一較好的音訊品質,所以此特徵提供了可縮放性。可選擇地,該等修補演算法可保持相同,但該修補結果之進一步處理的複雜性可適用於不同的需要。例如,對於低階的應用,可用該頻譜包封調整之一降低的頻率解析度,而對於高階的應用,可用提供一較好品質的一較好的頻率解析度,但也需要增加記憶體、處理器及電力消耗的資源,特別在移動裝置中。因為該修補工具不依賴於該頻譜包封調整工具,且相反亦然,所以所有這些可不牽扯相對應之其他工具而予以完成。相反地,該修補產生與透過藉由諸如一濾波器組轉換為一頻譜表示之該經修補之原始資料的處理的分離已證實為一最佳的特徵。
根據本發明之一第一層面,一音訊信號合成器產生具有一第一頻帶及源於該第一頻帶之一第二經合成頻帶的一合成音訊信號。該音訊信號合成器包含一修補產生器、一頻譜轉換器、一原始信號處理器及一結合器。該修補產生器執行至少二個不同的修補演算法,其中每一修補演算法使用具有該第一頻帶中之信號成分的一音訊信號產生具有該第二經合成頻帶中之信號成分的一原始信號。該修補產生器適用於根據一第一時間部分的一控制資訊選擇該等至少二個不同修補演算法之一個且根據不同於該第一時間部分之一第二時間部分的該控制資訊選擇該等至少二個不同修補演算法之另一個,以獲得該第一及該第二時間部分的原始信號。該頻譜轉換器將該原始信號轉換為一原始信號頻譜表示。該原始信號處理器根據頻譜域頻譜帶複製參數處理該原始信號頻譜表示以獲得一經調整的原始信號頻譜表示。該結合器將具有該第一頻帶中之信號成分的一音訊信號或源於該音訊信號的一信號與該經調整之原始信號頻譜表示或與源於該經調整之原始信號頻譜表示的另一信號相結合以獲得該合成音訊信號。
在另一實施例中,該音訊信號合成器受組配使得該等至少二個修補演算法因為在該第一頻帶中之一頻率下該音訊信號的一信號成分被修補為該第二頻帶中的一目標頻率且目標頻率對於二修補演算法有所不同而相互不同。該修補產生器可更適用於對於二修補演算法均操作於時域中。
根據本發明之另一層面,一音訊信號編碼器由一音訊信號產生包含在一第一頻帶中該音訊信號的成分、控制資訊及頻譜帶複製參數的一資料流。該音訊信號編碼器包含一頻率選擇濾波器、一產生器及一控制資訊產生器。該頻率選擇濾波器產生在該第一頻帶中該音訊信號的成分。該產生器由在一第二頻帶中該音訊信號的成分產生該頻譜帶複製參數。該控制資訊產生器產生該控制資訊,該控制資訊從一第一或一第二不同修補演算法中識別一較佳修補演算法。每一修補演算法使用在該第一頻帶中該音訊信號的成分產生具有在該第二經複製頻帶中之信號成分的一原始信號。
根據本發明之又一層面,於連接於一電腦之一傳輸線上傳輸的一音訊信號位元流,包含在該第一頻帶中一經編碼之音訊信號、控制資訊及該等頻譜帶複製參數。
因而,本發明與用於在頻譜帶複製中不同修補演算法之間之切換的一方法相關,其中所使用的修補演算法在編碼器端依據該編碼器所做出的一決定而定,且在解碼器端依據該位元流中所傳輸的資訊而定。透過使用一頻譜帶複製(SBR),該等高頻成分的產生可例如透過將一QMF濾波器組(QMF=正交鏡像濾波器)中的低頻信號成分複製於高頻帶上來完成。此複製也可稱為修補且根據本發明之實施例,此修補也可由操作於時域中的可選擇的方法來替代或補充。該等可選擇的修補演算法的範例是:
(1). 提升取樣(例如透過該頻譜之鏡像);
(2). 相位音訊編碼器;
(3). 非線性失真;
(4). 在該QMF域中透過改變該QMF頻帶次序鏡像該頻譜;
(5). 模型驅動(特別地對於語音);及
(6). 調變
該等可選擇的修補演算法也可於該編碼器中執行,以獲得由例如SBR工具所使用的如雜訊填充、相濾波、遺漏諧波等的該等頻譜帶複製參數。根據實施例,在一修補產生器內的該修補演算法被替代而仍使用該等剩餘的頻譜帶複製工具。
修補演算法的具體選擇依據所施予之音訊信號而定。例如,該相位音訊編碼器極度地改變語音信號的特徵,且因而該相位音訊編碼器不對例如語音或類語音信號提供一適當的修補演算法。因此,依據該音訊信號類型,一修補產生器從用於產生該高頻帶之修補的不同可能性中選擇一修補演算法。例如,該修補產生器可在該習知的SBR工具(QMF頻帶的複製)與該相位音訊編碼器或任何其他修補演算法之間切換。
相較於該習知的SBR實施(例如實施於MPEG-4中),本發明之實施例從而使用用於產生高頻信號的修補產生器。該修補產生器不僅可操作於該頻率中,而且可操作於時域中且如下執行修補演算法:鏡像及/或提升取樣及/或一相位音訊編碼器及/或非線性失真。該頻譜帶複製是否在該頻域或在該時域中完成,依據具體信號(即其是信號可適應)而定,下面將詳細解釋。
頻譜帶複製依賴於此事實:對於許多目的,僅傳輸在一核心頻帶內的一音訊信號且在該解碼器中產生在該較高頻帶中的信號成分是足夠的。因為例如對於語音及音樂,高頻率成分通常與在該核心頻帶中的該等低頻帶成分具有一相關性,所以產生的音訊信號將仍維持一高的感知品質。因而,透過使用產生遺漏高頻成分的一適當的修補演算法,可能獲得高感知品質的一音訊信號。同時,因為僅在該核心頻帶內的音訊信號被壓縮編碼且傳輸至該解碼器,所以該等較高頻帶的參數驅動產生導致該位元率顯著降低以編碼一音訊信號。對於該等剩餘的頻率成分,僅傳輸在產生該原始高頻帶信號之一估計的過程中控制該解碼器的控制資訊及頻譜帶複製參數。所以,嚴格來說,這一過程包括三層面:(i)參數HF帶的估計(SBR參數的計算),(ii)該原始修補的產生(實際修補)及(iii)進一步一處理的提供(例如雜訊基準調整)。
該核心頻帶可由所謂的交越頻率來定義,其定義了該頻帶內之一臨界值,且最高至到臨界值,該音訊信號之編碼被執行。該核心編碼器編碼在由該交越頻率所限制之該核心頻帶內的該音訊信號。開始於該交越頻率,該等信號成分將由該頻譜帶複製產生。在使用用於該頻譜帶複製之習知的方法中,通常發生一些信號在該核心編碼器之交越頻率處包含不必要的缺陷。
透過使用本發明之實施例,可能判定出一避免此等缺陷或至少以不具有一感知影響之方式修改此等缺陷的修補演算法。例如,透過使用鏡像作為時域中的修補演算法,該頻譜帶複製相似於AMR-WB+內的頻帶擴展(BWE)(擴展自適應多率寬頻編解碼)予以執行。此外,依據該信號改變該修補演算法的可能性提供了有例如對於語音及音樂使用不同的頻帶擴展的可能。但是對於不能明確地識別之如音樂或語音(即混合信號)的一信號,該修補演算法可在短時間區段內改變。例如,對於任何給定的時間區段,一較佳的修補演算法可用於修補。此較佳的修補演算法可由該編碼器判定,該編碼器可例如將每一經處理之方塊的輸入資料修補結果與該原始音訊信號進行比較。這顯著地改良了由該音訊信號合成器所產生之生成音訊信號的感知品質。
本發明的另一優點在於將該修補產生器與可包含標準SBR工具之該原始信號處理器分離。由於此分離,可使用可包含一反濾波、增加一雜訊基準或遺漏諧波或其他的通常的SBR工具。因而,該等標準的SBR工具仍可使用而該修補可彈性地予以調整。此外,因為該等標準的SBR工具使用於頻域中,將該修補產生器與該等SBR工具分離,所以允許該修補在該頻域中或在該時域中計算。
本發明將透過舉例說明來予以描述。參照下面的詳細描述,以及參照附加圖式,本發明的特徵將更容易予以理解及明白,其中:第1圖顯示根據本發明之實施例,一音訊信號處理的一方塊圖;第2圖顯示根據實施例,該修補產生器的一方塊圖;第3圖顯示操作於該時域中的該結合器的一方塊圖;第4a至4d圖示意地繪示不同修補演算法的範例;第5a至5b圖繪示該相位語音編碼器及透過複製的該修補;第6a至6d圖顯示用於處理該經編碼音訊流以輸出PCM取樣的方塊圖;及第7a至7c圖顯示根據另一實施例之一音訊編碼器的方塊圖。
下面的實施例僅是對用於改良例如與一音訊解碼器一同使用之頻譜帶複製的本發明之原理的說明性描述。應理解的是在此所描述之安排及細節的修改及變化對於在該技藝中具有通常知識者而言是清楚的。因而,其不打算由透過在此對實施例的描述及解釋所呈現的特定細節而被限制。
第1圖顯示用於產生具有一第一頻帶及源於該第一頻帶之一第二經複製之頻帶的一合成音訊信號105的一音訊信號合成器。該音訊合成器包含用於執行至少二個不同修補演算法的一修補產生器110,其中每一修補演算法使用具有在該第一頻帶中之信號成分的該音信信號105產生具有在該第二經複製之頻帶中之信號成分的一原始信號115。該修補產生器110適用於根據一第一時間部分的一控制資訊112選擇至少二個不同修補演算法中之一個,且根據不同於該第一時間部分之一第二時間部分的控制資訊112選擇該等至少二個不同修補演算法之另一個,以獲得該第一及該第二時間部分下的原始信號115。該音訊信號合成器更包含用於將該原始信號115轉換為包含在一第一子帶、一第二子帶等中之成分的一原始頻譜表示125的一頻譜轉換器120。該音訊信號合成器更包含用於根據頻譜域頻譜帶複製參數132處理該原始頻譜表示125以獲得一經調整之原始信號頻譜表示135的原始信號處理器130。該音訊信號合成器更包含用於將具有該第一頻帶中之信號成分的該音訊信號105或源於該音訊信號105之一信號與該經調整之原始信號頻譜表示135或與源於該經調整之原始信號頻譜表示135的另一信號相結合以獲得該合成音訊信號145的一結合器140。
在另一些實施例中,該結合器140適用於使用如源於該音訊信號105的信號該原始信號頻譜表示125。由該結合器所使用之源於該音訊信號的該信號也可是由諸如一分析濾波器組之一時間/頻譜轉換器所處理的音訊信號或由操作於時域中或頻譜域中的一修補產生器所產生的一低頻帶信號或一經延遲的信號或透過一提升取樣操作處理過的音訊信號使得將被結合的該等信號具有相同的基本取樣率。
在又一實施例中,該音訊信號合成器更包含用於分析具有該第一頻帶201中之信號成分的該音訊信號105的一特徵且用以提供識別該第一修補演算法或該第二修補演算法之該控制資訊112的一分析器。
在另一些實施例中,該分析器適用於識別具有一定程度聲音之一時間部分的一非諧波修補演算法或該音訊信號105中之一可區別時間部分的一諧波修補演算法。
在又一些實施例中,該音訊信號105與元資料一起編碼為一資料流,且其中該修補產生器110適用於從該資料流中的元資料中獲得該控制資訊112。
在又一些實施例中,該頻譜轉換器120包含一分析濾波器組或該等至少二個不同修補演算法包含一相位語音編碼器演算法或一提升取樣修補演算法或一非線性失真修補演算法或一複製演算法。
在又一些實施例中,該原始資訊處理器130適用於執行該等頻譜帶的一能量調整或在該等頻譜帶的一反濾波或用以將一雜訊基準增加至該頻譜帶中或用以將遺漏諧波增加至該頻譜帶中。
第2圖顯示包含接收該控制資訊112及該音訊信號105的一控制器及修補裝置113的該修補產生器110的更多細節的一方塊圖。該控制器111適用於基於該控制資訊112選擇一修補演算法。該修補產生器110包含執行一第一演算法1的一第一修補裝置113a、執行一第二修補演算法2的一第二修補裝置113b等。大體上,該修補產生器110包含與有用的修補演算法一樣多的修補裝置113。例如,該修補產生器110可包含二、三、四或多於四的修補裝置113。在該控制器111已基於該控制資訊112選擇該等修補裝置113之一之後,該控制器111將該音訊信號105傳輸至該等修補裝置113中的其中一個,以執行該修補演算法且輸出包含該經複製之頻帶202、203中之信號成分的該原始信號115。
第3圖顯示該結合器140的更多細節的一方塊圖,其中該結合器140包含一合成濾波器組141、一延遲器143及一加法器147。該經調整的原始信號135輸入於由該經調整的原始信號135(例如在該頻譜表示中)產生在該時域135t內之一經調整的原始信號(時域原始信號)的該合成濾波器組141中。該基帶音訊信號105輸入於該延遲器143中,該延遲器143適用於藉由一定時段來延遲該基帶信號105且輸出該經延遲的基帶信號105d。該經延遲的基帶信號105d及該時域經調整的原始信號135t由該加法器147相加,產生由該結合器140輸出的該合成音訊信號145。在該延遲器143中的延遲依據該音訊信號合成器的處理演算法而定,以實現該時域經調整的原始信號135t與經延遲的基帶信號105d將對應於同一時間(同步)。
第4a至4d圖顯示由該修補產生器110中之該修補裝置113所使用的不同的修補演算法。如以上所解釋,該修補演算法產生在該經複製頻域中的一經修補信號。在第4圖所顯示的該等實施例中,一第一頻帶201延伸至一第二頻帶202(或第二經複製頻帶)開始時的交越頻率fmax
,且該第二頻帶202延伸至二倍的該交越頻率2*fmax
。超過此頻率,一第三頻帶203(或第三經複製頻帶)開始。該第一頻帶201可包含前述的核心頻帶。
在第4圖中,四個修補演算法作為範例予以顯示。在第4a圖中的第一修補演算法包含一鏡像或提升取樣,一第二修補演算法包含一複製或調製且顯示於第4b圖中,一第三修補演算法包含一相位音訊編碼器且顯示於第4c圖中,且包含一失真的一第四修補演算法顯示於第4d圖中。
顯示於第4a圖中的鏡像被執行使得該第二頻帶202中的經修補信號透過在該交越頻率fmax
處鏡像該第一頻帶201而獲得。該第三頻域203中之經修補信號依次透過鏡像在該第二頻帶202中的信號而獲得。因為該第二頻帶202中的信號已經是一經鏡像的信號,所以在該第三頻帶203中的信號也可簡單地透過將該第一頻帶201中的音訊信號105移位至該第三頻帶203中而獲得。
第4圖所顯示的一第二修補演算法實施複製(或調製)信號。在此實施例中,該第二頻帶202中的信號透過將該第一頻帶201中的信號移位(複製)至該第二頻帶202中而獲得。類似地,該第三頻帶203中的信號也可透過將該第一頻帶201中的信號移位至該第三頻帶203中而獲得。
第4c圖顯示使用一相位音訊編碼器作為修補演算法的一實施例。該經修補信號由後續步驟產生,其中一第一步產生二倍之最高頻率2*fmax
以上的信號成分且第二步產生三倍之最高頻率3*fmax
以上的信號成分等。一相位音訊編碼器以一係數n(n=2、3、4...)乘以取樣頻率而產生該取樣值在核心頻帶(第一頻帶201)的n倍頻率範圍的延展。
使用失真(例如透過將信號平方)的修補演算法顯示於第4d圖中。失真可透過許多方式獲得。一簡單的方式是平方該信號位準以產生較高的頻率成分。失真的另一可能做法是透過剪除(例如透過切除在某一臨界值之上的信號)而獲得。而且在這種情況下,將產生高頻率成分。基本上習知之方法中之任何失真處理可用於此處。
第5a圖更詳細地顯示一相位音訊解碼器的修補演算法。如前所述,該第一頻帶201延伸至該第二頻帶202(其結束於例如二倍的最高頻率2*fmax
處)開始時的最高頻率fmax
(交越頻率)。在該第二頻帶202之後,該第三頻帶203開始且可延伸至例如三倍的最高頻率3*fmax
。
為了簡易性,第5a圖顯示該音訊信號105之具有八個頻率線105a、105b、...、105h的一頻譜(位準P是頻率f的函數)。從八個線105a、105b、...、105h中,該相位音訊編碼器透過根據所顯示之箭頭移位該等線而產生一新信號。該移位相對應於前述的乘法。詳細來說,該第一線105a移位至該第二線105b,該第二線移位至該第四線等,以此類推,直至移位至該第十六線(該第二頻域202中的最後一條線)的該第八線105h。這相對應於乘二。為了產生達三倍最高頻率3*fmax
的線,該等線的所有頻率可與三相乘,即第一線105a移位至第三線105c,第二線105b移位至第六線等,以此類推,直到移位至第二十四線(第三頻帶203中的最後一條線)的第八線105h。顯然地透過此相位音訊編碼器,該等線不再是等距的,但擴展至較高頻率。
第5b圖更詳細地顯示複製的修補。再次,位準P作為頻率f的函數予以顯示,其中八線在該第一頻帶201中,其等被複製於該第二頻帶202中且也複製於該第三頻帶203中。這一複製恰意味著該第一頻帶201中的第一線105a也可成為該第二頻帶202及該第三頻帶203中的第一線。因此,該經複製頻帶202及203之每一個的第一線可由該第一頻帶201中的同一線來複製。類似地,這也適用於其他線。因此,整個頻帶被予以複製。
第4及5圖所顯示之不同的修補演算法可不同地應用於該時域中或該頻域中且包含可用於不同應用中的不同優點或缺點。
例如,頻域中的鏡像顯示於第4a圖中。在時域中,該鏡像可透過由一整數係數來增加取樣率(其可透過在每一對現存取樣之間插入額外的取樣來完成)而予以執行。此等額外的取樣不是從該音訊信號中獲得,而是由該系統引入且包含例如接近於或等於零的值。在最簡單的情況下,如果僅將一個額外取樣引入二現存取樣之間,那麼一加倍數量的取樣被實現意味著一加倍的取樣率。如果引入大於一個的另一些取樣(例如以一等距的方式),那麼該取樣率將因而增加且因此該頻率頻譜也增加。大體上,在每一二個現存的取樣之間的另一些取樣的數量可是任何數目n(n=2、3、4...),其增加了該取樣率n+1倍。額外取樣的插入產生在奈奎斯特頻率(其在一給定取樣率下指定可表示的最高頻率)下對頻譜的鏡像。因而,該基帶頻譜(該第一頻帶中的頻譜)的頻域透過此方式被直接地鏡像於下一頻帶中。可取捨地,此鏡像可與一可能的低通濾波及/或一頻譜成形相結合。
此修補演算法的優點可概括如下。使用這一方法,與在頻域中使用相似的方法相比更好地保留了信號時間結構。而且,藉由頻譜鏡像頻率,接近於奈奎斯特頻率的線被映射到也是接近於奈奎斯特頻率的線上。這是一優點,因為在鏡像該等頻譜之後,鏡像頻域(即該原始音訊信號105的奈奎斯特頻率)周圍的區域在許多方面上很相似,例如關於頻譜平坦度的性質、該音調性質、該積聚或頻率點的不同等。透過這一方法,該頻譜例如透過使用複製技術以一更為適度的方式繼續至下一頻率帶,其中完全源於該原始頻譜中之不同區域且因而顯示極為不同之特徵的頻率區域相互接近地結束。在複製中:該第一取樣再次成為該經複製帶中的第一取樣,然而在鏡像中該最後取樣成為該經複製帶中的第一取樣。該頻譜較軟式的連續性可依序降低由其他修補演算法所產生之經重建頻譜的非連續特徵所造成的感知缺陷。
最後,包含一大量諧波的信號例如在較低頻率區域(第一頻帶201)中。此等諧波在該頻譜中以局部高峰的形式出現。然而,在該頻譜的較高部分僅有極少的諧波存在,或換句話說,在該頻譜的較高部分中諧波的數量較少。透過簡單地使用對該頻譜的一複製,這將致使在具有一大量諧波的該頻譜的較低部分中一經複製的信號被直接地複製到在該原始信號中僅具有極少諧波的較高頻率區域中。因此,該原始信號及該經複製信號的較高頻帶中,關於諧波的數量極為不同,這是不期望的且應當避免。
鏡像的修補演算法也可應用於頻域中(例如於QMF區域中),在這種情況下,該等頻帶的次序是相反的使得發生一從後至前的重排序。此外,對於子帶取樣,必須形成一複數共軛值以使每一取樣的虛部改變符號。這產生在該子帶內該頻譜的一反相。
此修補演算法包含對於該修補邊界的一高靈活性,因為該頻譜的一鏡像不一定在奈奎斯特頻率下完成,而也可在任何子帶邊界下執行。
然而,在修補邊沿處可能不會發生鄰近QMF頻帶之間的頻疊相消,這是可以或不可以容忍的。
透過擴展或透過使用該相位音訊編碼器(參見第4c或5a圖),頻率結構以諧波形式被正確地延伸至高頻域,因為該基帶201以頻譜形式以由一或多個相位音訊編碼器所執行的偶數倍擴展,且因為該基帶201中的頻譜成分與額外所產生之頻譜成分相結合。
如果該基帶201已經例如透過僅使用一極低的位元率強制地限制於頻寬中,那麼此修補演算法是較佳的。因此,該等較高頻率成分的重建已經以一相對低的頻率開始。在這種情況下,一典型的交越頻率小於大約5kHz(或更有甚者小於4kHz)。在這一區域中,人耳對由於諧波不正確定位而產生的不諧和音極為敏感。這可導致“非自然”音調的印象。此外,頻譜接近地相間隔的音調(具有大於30Hz至300Hz的一頻譜距離)是被感知為刺耳的音調。該基帶201之頻率結構的一諧波連續避免了此等不正確及不愉悅的聽覺印象。
在以複製方式的第三修補演算法(參見第4c或5b圖)中,頻譜區域是以子帶方式被複製到一較高頻率區或被複製到將被複製的頻率區。而且複製依賴於觀察,其對所有修補演算法來說都是正確的,即該等較高頻率信號的頻譜性質在許多方面相似於該等基帶信號的性質。相互僅有極少的偏差。此外,典型地,人耳在高頻(典型地以大約5kHz開始)中,尤其對於一不精確的頻譜映射極為不敏感。事實上,大體上這是頻譜帶複製的主要關鍵點。特別地,複製包含其可容易且快速實施的優點。
因為該頻譜的複製可在任何子帶邊沿下執行,所以此修補演算法對於該修補之邊沿也具有一高靈活性。
最後,失真的修補演算法(參見第4d圖)可包含透過剪除、限制、平方等產生諧波。如果例如一擴展信號在頻譜上是非常稀疏的排列(例如在利用了上面所提及的相位音訊編碼器修補演算法之後),那麼該擴展頻譜可取捨地由一失真信號額外地予以填補以避免不想要的頻率空洞,這是可能的。
第6a至6d圖顯示執行於一音訊解碼器中的音訊信號合成器的不同實施例。
在第6a圖所顯示之實施例中,一經編碼信號流345輸入一位元流負載解格式器350中,其一方面分離出一經編碼的音訊信號355且另一方面分離出額外資訊375。該經編碼的音訊信號335輸入於一例如產生第一頻帶201之經解碼音訊信號105的AAC核心解碼器360中。該音訊信號105輸入於一包含例如32個頻帶且產生在頻域中的音訊信號10532
的分析32頻帶QMF組370中。較佳的是該修補產生器僅輸出一高頻帶信號作為原始信號且不輸出低頻帶信號。另一方式是,如果方塊110中的修補演算法也產生低頻帶信號,較佳的是對輸入至方塊130a的輸入信號進行高通濾波。
該頻域音訊信號10532
輸入於在此實施例中產生頻域(QMF域)之修補的該修補產生器110中。產生的原始信號頻譜表示125輸入於可例如產生一雜訊基準、重建遺漏諧波或執行一相反濾波的一SBR工具130a中。
另一方面,該額外資訊375輸入於一位元流剖析器380中,其分析該額外資訊以獲得不同的子資訊385且將它們輸入例如擷取出控制資訊112及頻譜帶複製參數132的一霍夫曼解碼與反量化單元390中。該控制資訊112輸入於該SBR工具中,且該等頻譜帶複製參數132輸入於該SBR工具130a和一包封調整器130b中。該包封調整器130b可操作地調整所產生之修補的包封。因此,該包封調整器130b產生經調整的原始信號135且將其輸入將該經調整之原始信號135與頻域中的該音訊信號10532
相結合的一合成QMF組140中。該合成QMF組可包含例如64頻帶且透過結合二信號(該經調整之原始信號135及該頻域音訊信號10532
)產生合成音訊信號145(例如PCM取樣的一輸出,PCM=脈衝代碼調變)。
此外,第6a圖顯示可實施用於該修補產生器110之QMF頻譜資料輸出上之習知的頻譜帶複製方法的SBR工具130a。第6a圖所顯示之用於頻域中的該修補演算法可例如對在頻域內的頻譜資料使用簡單的鏡像或複製(參見第4a圖及第4b圖)。
此通常結構與先前技藝中習知的解碼器一致,但是實施例中由該修補產生器110替代了習知的修補產生器,該修補產生器110受組配以執行用以改良音訊信號的感知品質之不同的可適性修補演算法。此外,實施例也可使用在時域內的一修補演算法且不一定要是在第6a圖所顯示之頻域中的修復。
第6b圖顯示本發明之實施例,其中該修補產生器110可在頻域內以及在時域內使用一修補演算法。第6b圖所顯示之解碼器同樣包含該位元流負載解格式器350、該AAC核心解碼器360、該位元流剖析器380及該霍夫曼解碼與反量化單元390。因而,在第6b圖所顯示之實施例中,該經編碼音訊流345再次輸入於一方面產生該經編碼音訊信號355且將其與該額外資訊375分離的該位元流負載解格式器350中,該額外資訊375然後由該位元流剖析器380剖析以分離出輸入於該霍夫曼解碼與反量化單元390中的不同資訊385。另一方面,該經編碼音訊信號355輸入於該AAC核心解碼器360中。
現在,實施例區分出這兩種情況:該修補產生器110在頻域(以下以點信號線表示)內或在時域(以下以虛線信號線表示)內操作。
如果該修補產生器操作於時域中,那麼該AAC核心解碼器360的輸出輸入於該修復產生器110中(虛線音訊信號105)且其輸出被傳輸至該分析濾波器組370。該分析濾波器組370的輸出是輸入於SBR工具130a中(其是該原始信號調整器130的一部分)以及合成QMF組140中的原始信號頻譜表示125。
如果在另一方面,該修補演算法使用頻域(如第6a圖所顯示),那麼該AAC核心解碼器360的輸出經由點線的音訊信號105輸入於分析QMF組360中,該分析QMF組360依序產生一頻域音訊信號10532
且將該音訊信號10532
傳輸至該修補產生器110及該分析QMF組140(點線)。該修補產生器110再次產生一原始信號表示125且將此信號傳輸至SBR工具130a。
因此,該實施例使用該等點線執行一第一處理模式(頻域修補)或使用該等虛線執行一第二處理模式(時域修補),其中在其他功能元件之間所有實線均用於二處理模式中。
該修補產生器的時間處理模式(虛線)較佳的是該修補產生器的輸出包括低頻帶信號及高頻帶信號,即該修補產生器的輸出信號是由該低頻帶信號及該高頻帶信號組成的寬頻信號。該低頻帶信號輸入於方塊140中且該高頻帶信號輸入於方塊130a中。該等頻帶的分離可於該分析組370中執行,但也可以另一方式予以執行。另外,該AAC解碼器的輸出信號可直接地輸送至方塊370使得該修補產生器輸出信號的低頻帶部分根本未予以使用且該原始低頻帶部分用於該結合器104中。
在該頻域處理模式中(點線),該修補產生器較佳地僅輸出高頻帶信號,且該原始低頻帶信號直接地輸送至方塊370從而輸送至該合成組140。可選擇地,該修補產生器也可產生一全頻帶輸出信號且將低頻帶信號輸送至方塊104。
同樣,該霍夫曼解碼與反量化單元390產生頻譜帶複製參數132及輸入於該修補產生器110中的控制資訊112。此外,該等頻譜帶複製參數132傳輸至該包封調整器130b且至該等SBR工具130a。該包封調整器130b的輸出是在該結合器140(合成QMF組)中與該頻譜帶音訊信號10532
(對於頻域修補而言)或與原始信號頻譜代表125(對於時域修補而言)相結合以產生如前所述包含輸出PCM取樣的合成音訊信號145的經調整原始信號135。
而且,在此實施例中,該修補產生器110使用該等修補演算法之一(例如第4a至4d圖所顯示)以透過使用在該第一頻帶201中之基帶產生在該第二頻帶202中或在該第三頻帶203中的音訊信號。僅在該第一頻帶201中的音訊信號取樣於該經編碼出流345中被編碼且該等遺漏取樣透過使用頻譜帶複製方法而予以產生。
第6c圖顯示在時域中該修補演算法的一實施例。對比於第6a圖,第6c圖所顯示之該實施例因該修補產生器110及該分析QMF組120的位置而不同。該解碼系統之所有的剩餘元件與第6a圖所顯示的一樣且因此在此省略了重複的描述。
該修補產生器110從該AAC核心解碼器360接收音訊信號105,且執行在時域內之修補以產生輸入於該頻譜轉換器120(例如包含64頻帶的一分析QMF組)中的原始信號115。有許多可能性的是,如果該修補產生器110透過在現存的取樣之間引入額外的取樣(例如接近於零值)來執行修補,那麼由該修補產生器110所執行之在時域中的一修補演算法產生包含加倍取樣率的一原始信號115。該頻譜轉換器120的輸出是輸入於原始信號調整器130的原始信號頻譜代表125,原始信號調整器130如前所述一方面包含SBR工具130a,另一方面包含包封調整器130b。如前面該等實施例所顯示,該包封調整器的輸出包含在該結合器140中在頻域105f與音訊信號相結合的經調整原始信號135,且該結合器140如前所述又包含例如64頻帶的合成QMF組。
因此,主要的不同是,例如鏡像執行於時域中且較高頻率資料在該信號115輸入於該分析64頻帶濾波器組120中之前已經予以重建,這意味著該信號已經包含加倍取樣率(在雙率SBR中)。在此修補操作之後,可使用又包含一相反濾波、增加一雜訊基準或增加遺漏諧波的一常態SBR工具。雖然高頻區域的重建發生於時域中,但是一分析/合成執行於QMF域中使得該等剩餘SBR機制仍可予以使用。
在第6c圖之實施例中,該修補產生器較佳地輸出包含低頻帶信號及高頻帶信號的一全頻帶信號(原始信號)。可選擇地,該修補產生器僅輸出例如由高通濾波而獲得的高頻帶部分,且該AAC核心解碼器輸出105直接地輸送至該QMF組120。
在又一實施例中,該修補產生器110包含一時域輸入介面及/或一時域輸出介面(時域介面),此方塊中的處理可發生於諸如一QMF域或諸如一DFT、FFT、DCT、DST或任何其他頻域的任何域中。接著,該時域輸入介面連接於一時間/頻率轉換器或大體上連接於一轉換器用於從時域轉換為一頻譜表示。接著,該頻譜表示使用操作於頻域資料上之至少二個不同修補演算法來處理。可選擇地,一第一修補演算法操作於頻域中且一第二修補演算法操作於時域中。該經修補頻域資料被轉換回接著經由該時域輸出介面輸入於方塊120中的一時域表示。在該實施例中,其中線上信號115不包含全頻帶,而僅包含低頻帶,該濾波較佳地在將該頻譜信號轉換於時域之前於頻域中執行。
較佳地,方塊110中的頻譜解析度高於由方塊120所獲得的頻譜解析度。在一實施例中,方塊110中的頻譜解析度至少是方塊120中的頻譜解析度的兩倍。
透過將由本實施例所實施的修補演算法隔離於一單獨功能方塊中,可能完全不依賴於該等SBR工具的使用而應用任何頻譜複製方法。在一可選擇的實施中,也可能平行地將該AAC解碼器信號輸入於一32頻帶的分析濾波器組中,並透過時域中的修補產生高頻成分。基帶與該等經修補信號將僅在該等QMF分析之後相結合。
第6d圖顯示這樣一實施例,其中該修補執行於時域中。相似於第6c圖所顯示之實施例,而在此實施例中與第6a圖的不同包含該修補產生器110以及該等分析濾波器組的位置。特別地,該AAC核心解碼器360、該位元流負載解格式器350以及該位元流剖析器308及該霍夫曼解碼與反量化單元390與第6a圖所顯示之實施例中的相同且在此再次省略重複的描述。
第6d圖所顯示之該實施例分支出由該解碼器360所輸出的音訊信號105且將該音訊信號105輸入於該修補產生器110以及該分析32頻帶QMF組370中。該分析32頻帶QMF組370(更進一步的轉換器370)進一步產生原始信號頻譜表示123。該修補產生器110又執行時域內之一修補且產生輸入於該頻譜轉換器120(又可包含64頻帶的一分析QMF濾波器組)中的一原始信號115。該頻譜轉換器120產生在本實施例中包含第一頻帶201中之頻率成分及該第二或第三頻帶202、203中之經複製頻帶的原始信號頻譜表示125。而且,此實施例包含適用於使該分析32頻帶濾波器組370的輸出與該原始信號頻譜表示125相加以獲得一經結合的原始信號頻譜表示126的一加法器124。該加法器124也可大體上是受組配以將該等基帶成分(在第一頻帶201中的成分)從該原始信號頻譜表示125中減去的一結合器124。因此,該加法器124可受組配以加一反向信號或可選擇地可包含一可取捨的反相器以使來自該分析32頻帶濾波器組370的輸出信號反相。
在基頻帶201中的頻率成分被示範地減少之後,該輸出再次輸入於該頻譜帶複製工具130a中,該產生的信號依次向前至該包封調整器130b中。該包封調整器130b再次產生在該結合器140中與該分析32頻帶濾波器組370的輸出相結合使得該結合器140將該等經修補頻率成分(例如在第二及第三頻帶202、203中)與由該分析32頻帶濾波器組370輸出的該等基帶成分相結合的經調整原始信號135。再次,該結合器140可包含產生合成音訊信號(包含例如輸出PCM取樣)的64頻帶的一合成QMF濾波器組。
在第6d圖實施例中,該修補產生器較佳地輸出包含低頻帶信號及高頻帶信號的一全頻帶信號(原始信號)。可選擇地,該修補產生器僅輸出例如由高通濾波所獲得之用於輸送至方塊120的頻帶部分,且如第6d圖所顯示直接將該AAC輸出輸送至該QMF組370。另外,因為此信號僅包含高頻帶,所以不需要該減法器124且將方塊120的輸出直接輸送至方塊130a。此外,該方塊370不需要輸出至該減法器124。
在又一實施例中,該修補產生器110包含一時域輸入介面及/或一時域輸出介面(時域介面),且此方塊中的處理可發生於諸如一QMF域或諸如一DFT、FFT、DCT、MDCT、DST或任何其他頻域的任何域中。接著,該時域輸入介面連接於一時間/頻率轉換器或大體上連接於一轉換器用於從時域轉換為一頻譜表示。接著,該頻譜表示使用操作於頻域資料上之至少二個不同修補演算法來處理。可選擇地,一第一修補演算法操作於頻域中且一第二修補演算法操作於時域中。該經修補的頻域資料被轉換回接著經由該時域輸出介面輸入於方塊120中的一時域表示。
較佳地,方塊110中的頻譜解析度高於由方塊120所獲得的頻譜解析度。在一實施例中,方塊110中的頻譜解析度至少是方塊120中的頻譜解析度的兩倍。
第6a至6d圖涵蓋了該解碼器結構且特別地包含了在該解碼器結構內的修補產生器110。為了使該解碼器及特別地該修補產生器110能夠產生或複製較高的頻率成分,該編碼器可將額外的資訊傳輸至該解碼器,其中該額外資訊112一方面提供可例如用以決定修補演算法的控制資訊且此外提供將由該等頻譜帶複製工具130a所使用的頻譜帶複製參數132。
另一些實施例還包含用於產生具有一第一頻帶及源於該第一頻帶201的一第二經複製頻帶202的一合成音訊信號145的一方法。該方法包含執行至少二個不同的修補演算法,將該原始信號115轉換為一原始信號頻譜表示125,處理該原始信號頻譜表示125。每一修補演算法使用具有第一頻帶201中之信號成分的一音訊信號105產生具有第二經複製頻帶202中之信號成分的一原始信號115。該修補被執行,使得該等至少二個修補演算法之一個根據一第一時間部分的一控制資訊112而選定,且該等至少二個修補演算法之另一個根據不同於該第一時間部分的一第二時間部分的該控制資訊112而選定,以獲得該第一及該第二時間部分的原始信號115。該原始信號頻譜表示125的處理根據頻譜域頻譜帶複製參數132來執行以獲得一經調整的原始信號頻譜表示135。最後,該方法包含將具有該第一帶201中之信號成分的音訊信號105或源於該音訊信號105的一信號與該經調整之原始信號頻譜表示135或與源於該經調整之原始信號頻譜表示135的另一信號相結合,以獲得該合成音訊信號145。
第7a、7b及7c圖包含該編碼器的實施例。
第7a圖顯示編碼一音訊信號305以產生依次輸入於第6a至6d圖所顯示之該等解碼器中的經編碼音訊信號345的一編碼器。第7a圖所顯示之編碼器包含供該音訊信號305輸入的一低通濾波器310(或一通用頻率選擇濾波器)及一高通濾波器320。該低通濾波器310分離該第一頻帶201內的音訊信號成分,然而該高通濾波器320分離剩餘的頻率成分,例如該第二頻帶202及另一些頻帶中的頻率成分。因而,該低通濾波器310產生一低通經濾波信號315且該高通濾波器320輸出一高通經濾波音訊信號325。該低通經濾波音訊信號315輸入於可包含例如一AAC編碼器的一音訊編碼器330中。
此外,該低通經濾波音訊信號315輸入於適用於產生該控制資訊112使得依序由該修補產生器110所選定的一較佳修補演算法可獲識別的一控制資訊產生器340中。該高通經濾波音訊信號325輸入於一頻譜帶資料產生器328中,該頻譜帶資料產生器328產生一方面輸入於修補選擇器之頻譜帶參數132。而且,第7a圖的編碼器包含接收來自該音訊編碼器330的經編碼音訊信號、來自該頻譜帶複製資料產生器328的頻譜帶複製參數132及來自該控制資訊產生器340的控制資訊112的一格式器343。
該等頻譜帶複製參數132可依據修補方法而定,即對於不同的修補演算法,該等頻譜帶參數可不同或可相同,且可以不一定為所有的修補演算法判定該等SBR參數132(下面第7c圖顯示的一實施例僅一組SBR參數132需要予以計算)。因而,該頻譜帶產生器328可為不同的修補演算法產生不同的頻譜帶參數132且因而該等頻譜帶參數132可包含適用於該第一修補演算法的第一SBR參數132a、適用於該第二修補演算法的第二SBR參數132b、適用於該第三修補演算法的第三SBR參數132c等。
第7b圖更詳細地顯示該控制資訊產生器340的一實施例。該控制資訊產生器340接收該低通經濾波信號315及該等SBR參數132。該低通經濾波信號315可輸入於一第一修補單元342a、一第二修補單元342b及其他修補單元(未顯示)中。修補單元342的數量可例如與由該解碼器中修補產生器110可執行之修補演算法的數量相一致。該等修補單元342的輸出包含該第一修補單元342a的一第一經修補音訊信號344a、該第二修補單元342b的一第二經修補音訊信號344b等。包含該第二頻帶202中之原始成分的該經修補音訊信號344輸入於一頻譜帶複製工具方塊346中。同樣,頻譜帶複製工具方塊346的數量可例如等於修補演算法的數量或等於修補單元342的數量。該等頻譜帶複製參數132也輸入於該頻譜帶複製工具方塊346(SBR工具方塊)中,使得該第一SBR工具方塊346a接收該等第一SBR參數132a及該第一經修補信號344a。該第二SBR工具方塊346b接收該等第二SBR參數132b及該第二經修補信號344b。該等頻譜帶複製工具方塊346在該等複製參數132的基礎產生包含該第二及/或第三頻帶202及203內之較高的頻率成分的經複製音訊信號347。
最後,該控制資訊產生器340包含適用於將該原始音訊信號305且特別地是該音訊信號305之較高頻率成分與該經複製之音訊信號347進行比較的比較單元。同樣,該比較可對每一修補演算法執行以便一第一比較單元348a將該音訊信號305與由該第一SBR工具方塊346a所輸出的一第一經複製之音訊信號347a進行比較。類似地,一第二比較單元348b將該音訊信號305與來自該第二SBR工具方塊346b的一第二經複製之音訊信號347b進行比較。該等比較單元348判定該等高頻帶中該等經複製音訊信號347與該原始音訊信號305的偏差,以便最後一評估單元349可比較在該原始音訊信號305與使用不同修補演算法之該等經修補音訊信號347之間的偏差,且由此判定一較佳的修補演算法或一些適合的或不適合的修補演算法。該控制資訊112包含允許識別該等較佳修補演算法之一的資訊。該控制資訊112可包含例如可在該原始音訊信號305與該經複製音訊信號347之間之最小偏差的基礎上予以判定的該較佳修補演算法的一識別號。可選擇地,該控制資訊112可提供在該音訊信號305與該經修補音訊信號347之間達成充分一致的多個修補演算法或修補演算法的評比。該評估可例如針對於感知品質而執行,使得該經複製音訊信號347在一理想的情況下人類無法區別於或接近無法區別於該原始音訊信號305。
第7c圖顯示該編碼器的另一實施例,其中同樣,將該音訊信號305輸入,但是也可取捨地將元資料306輸入於該編碼器中。該原始音訊信號305再次輸入於一低通濾波器310中且於一高通濾波器320中。該低通濾波器310的輸出再次輸入於一音訊編碼器330中且該高通濾波器320的輸出輸入於一SBR資料產生器328中。而且,該編碼器包含一元資料處理單元309及/或其輸出發送至控制資訊產生器340的一分析單元(或用於分析之裝置)307。元資料處理單元309受組配以關於一適合的修補演算法分析該元資料306。該分析單元307可例如判定該音訊信號305內暫態的或脈衝群或非脈衝群段的數量及強度。基於該元資料處理單元309的輸出及/或該分析工具307的輸出,該控制資訊產生器340可再次判定一較佳的修補演算法或產生修補演算法的評比,且編碼該控制資訊112內的此資訊。該格式器343將再次將該控制資訊112、該頻譜帶複製參數132以及該經編碼音訊信號355結合於一經編碼音訊流345內。
用於分析的裝置307提供例如該音訊信號的特性且可適用於識別對於具有一聲音程度之一時間部分的非諧波信號成分或對於一可區別時間部分的一諧波信號成分。如果該音訊信號305是純粹的語音或聲音,那麼聲音的程度高,然而對於聲音與例如音樂的一混合,聲音的程度較低。該SBR參數132的計算可依賴於此特徵及該較佳修補演算法來執行。
又一實施例包含一方法,該方法產生包含在一第一頻帶201中一音訊信號205的成分、控制資訊112及頻譜帶複製參數132的一資料流345。該方法包含頻率選擇濾波該音訊信號305以產生在該第一頻帶201中該音訊信號305的成分。該方法更包含由在一第二頻帶202中該音訊信號305的成分產生該頻譜帶複製參數132。最後,該方法包含產生從一第一或一第二不同修補演算法中識別一較佳修補演算法的控制資訊112,其中每一修補演算法使用在該第一頻帶201中該音訊信號305的成分產生具有在該第二經複製之頻帶202中之信號成分的一原始信號115。
雖然第6a至6d圖中的一些實施例已予以特別地說明使得在低頻帶與經調整高頻帶之間的結合執行於頻域中,但是應注意的是該結合也可執行於時域中。最後,該核心解碼器輸出信號可用於(在用於補償由於修補及調整所導致的處理延遲的一可能必要的延遲級的輸出)時域中,且於濾波器組域中受調整的高頻帶可轉換回時域中成為一不具有低頻帶部分而具有高頻帶部分的信號。在第6圖的實施例中,此信號將僅包含最高的32子帶,且此信號至時域的一轉換產生一時域高頻帶信號。接著,二信號可諸如透過一逐取樣相加結合於時域中以獲得將予以數位/類比轉換且輸送至一揚聲器的例如PCM取樣作為一輸出信號。
雖然在一裝置的上下文中已對一些層面予以描述,但是要清楚的是此等層面也可表現相對應之方法的描述,其中一方塊或裝置相對應於一方法步驟或一方法步驟的一特徵。相似地,一方法步驟之上下文中所描述的層面也可表示對一相對應之方塊或項目或一相對應之裝置之特徵的描述。
該說明性的經編碼音訊信號或位元流可儲存於一數位儲存媒體上或可傳輸至諸如一無線傳輸媒體或諸如網際網路之一有線傳輸媒體的一傳輸媒體上。
根據某些實施要求,本發明之實施例可實施於軟體中或硬體中。該實施可使用具有儲存於其上之電氣可讀控制信號的例如一軟碟、一DVD、一CD、一ROM、一PROM、一EPROM、一EEPROM或一快閃(FLASH)記憶體的一數位儲存媒體來實施,該數位儲存媒體與一可規劃電腦系統相協作(或能夠協作)使得各個方法予以執行。
根據該發明,一些實施例包含具有電氣可讀控制信號的一資料載體,該資料載體能夠與一可規劃電腦系統相協作,使得在此所描述之該等方法之一予以執行。大體上,本發明之實施例可作為具有一程式碼的一電腦程式產品而予以實施,當該電腦產品執行於一電腦上時該電腦碼可操作地用於執行該等方法之一。該程式碼可例如儲存於一機械可讀載體中。其他實施例包含用於執行在此所描述之該等方法之一且儲存於一機械可讀載體上的電腦程式。換句話說,該說明性之方法的一實施例從而是具有一電腦程式碼之用於在該電腦程式執行於一電腦上時執行在此所描述之該等方法之一的一電腦程式。從而該等說明性方法的又一實施例是包含儲存於其上之用於執行在此所描述之該等方法之一的一電腦程式的一資料載體(或一數位儲存媒體或一電腦可讀媒體)。從而該等說明性方法的又一實施例是表示用於執行在此所描述之該等方法之一的該電腦程式的一資料流或一序列信號。該資料流或該序列信號可例如受組配以經由該一資料通訊連接(例如經由該網際網路)予以傳輸。又一實施例包含受組配以或適用於執行在此所描述之該等方法之一的例如一電腦或一可規劃邏輯裝置的一處理裝置。又一實施例包含具有安裝於其上之用於執行在此所描述之該等方法之一的電腦程式的一電腦。在一些實施例中,一可規劃邏輯裝置(例如一場可規劃閘陣列)可用以執行在此所描述之該等方法的一些或所有功能。在一些實施例中,一場可規劃閘陣列可與一微處理器相協作以執行在此所描述之該等方法之一。大體上,該等方法較佳地藉由任何硬體裝置來執行。
上面所描述的實施例僅是對本發明之原理的說明。應理解的是在此所描述之該等安排及該等細節的修改及變化對於在該技藝中具有通常知識者是清楚的。因而,其僅打算由隨後的申請專利範圍的範圍來限制而不打算由在此實施例之描述及解釋所呈現的特定細節來限制。
105...合成音訊信號
10532
...音訊信號
105a...頻率線/第一線
105b...頻率線/第二線
105c...頻率線/第三線
105d...基帶信號
110...修補產生器
111...控制器
112...控制資訊
113a...第一修補裝置
113b...第二修補裝置
115...原始信號
120...頻譜轉換器
123...另一原始信號頻譜表示
124...加法器
125...原始頻譜表示/原始信號頻譜表示
126...經結合之原始信號頻譜表示
130...原始信號處理器
130a...SBR工具
130b...包封調整器
132...頻譜域頻譜帶複製參數/頻譜帶複製參數
135...經調整的原始信號
135t...時域
140...結合器/合成QMF組
141...分析濾波器組
143...延遲器
145...合成音訊信號
147...加法器
201...第一頻帶
202...第二頻帶
203...第三頻帶
305...音訊信號
306...元資料
307...分析單元
309...元資料處理單元
310...低通濾波器
315...低通經濾波音訊信號
320...高通濾波器
325...高通經濾波音訊信號
328...頻譜帶資料產生器
330...音訊編碼器
340...控制資訊產生器
342a...第一修補單元
342b...第二修補單元
343...格式器
344a...第一經修補音訊信號
344b...第二經修補音訊信號
345...經編碼信號流/經編碼音訊信號
346a...第一SBR工具方塊
346b...第二SBR工具方塊
347a...第一經複製之音訊信號
347b...第二經複製之音訊信號
348a...第一比較單元
348b...第二比較單元
349...評估單元
350...位元流負載解格式器
355...經編碼的音訊信號
360...AAC核心解碼器
370...分析QMF組
375...額外資訊
380...位元流剖析器
385...子資訊
390...霍夫曼解碼與反量化單元
fmax
...交越頻率
第1圖顯示根據本發明之實施例,一音訊信號處理的一方塊圖;
第2圖顯示根據實施例,該修補產生器的一方塊圖;
第3圖顯示操作於該時域中的該結合器的一方塊圖;
第4a至4d圖示意地繪示不同修補演算法的範例;
第5a至5b圖繪示該相位語音編碼器及透過複製的該修補;
第6a至6d圖顯示用於處理該經編碼音訊流以輸出PCM取樣的方塊圖;及
第7a至7c圖顯示根據另一實施例之一音訊編碼器的方塊圖。
105‧‧‧合成音訊信號
110‧‧‧修補產生器
112‧‧‧控制資訊
115‧‧‧原始信號
120‧‧‧頻譜轉換器
125‧‧‧原始頻譜表示/原始信號頻譜表示
130‧‧‧原始信號處理器
132‧‧‧頻譜域頻譜帶複製參數/頻譜帶
複製參數
135‧‧‧經調整的原始信號
140‧‧‧結合器
145‧‧‧合成音訊信號
Claims (15)
- 一種音訊信號合成器,其用於產生具有一第一頻帶及源於該第一頻帶的一第二經合成頻帶的一合成音訊信號,包含:一修補產生器,其用於執行至少二個不同的修補演算法,其中該等修補演算法之每一者使用具有該第一頻帶中之信號成分的一音訊信號產生具有該第二經合成頻帶中之信號成分的一原始信號,且其中該修補產生器適用於響應於一第一時間部分的一控制資訊選擇該等至少二個不同修補演算法之其中一個,且響應於不同於該第一時間部分的一第二時間部分的該控制資訊選擇該等至少二個不同修補演算法之另一個,以獲得該第一及該第二時間部分的該原始信號;一頻譜轉換器,其用於將該原始信號轉換為一原始信號頻譜表示;一原始信號處理器,其用於響應於頻譜域頻譜帶複製參數處理該原始信號頻譜表示,以獲得一經調整之原始信號頻譜表示;及一結合器,其用於將具有該第一頻帶中之信號成分的該音訊信號或源於該音訊信號之一信號與該經調整之原始信號頻譜表示或與源於該經調整之原始信號頻譜表示的另一信號相結合,以獲得該合成音訊信號。
- 如申請專利範圍第1項所述之音訊信號合成器,其中該等至少二個修補演算法相互不相同,其不同處在該第一 頻帶中之一頻率下該音訊信號的一信號成分被修補為該第二頻帶中的一目標頻率,且對於二修補演算法而言,該目標頻率是不同的。
- 如申請專利範圍第1項或申請專利範圍第2項所述之音訊信號合成器,其中該修補產生器對於二修補演算法均適用於操作於時域中,或其中該修補產生器包含用於將一時域信號轉換為一頻譜表示的一轉換器、用於將該頻譜表示中的一信號轉換至時域的一轉換器及一時域輸出介面,其中該修補產生器對於至少一修補演算法是適用於操作於頻譜域中。
- 如申請專利範圍第1項所述之音訊信號合成器,其中該修補產生器適用於產生該原始信號,使得該原始信號包含在該第一頻帶中的另一些信號成分,且該等信號成分具有大於輸入於該修補產生器之該音訊信號的取樣率的一取樣率,且其中該頻譜轉換器適用於將該第二頻帶中的信號成分及該第一頻帶中的另一些信號成分轉換為該原始信號頻譜表示。
- 如申請專利範圍第4項所述之音訊信號合成器,更包含另一頻譜轉換器及另一結合器,該另一頻譜轉換器適用於將具有該第一頻帶中之信號成分的該音訊信號轉換為另一原始信號頻譜表示,且該另一結合器適用於將該原始信號頻譜表示與該另一原始信號頻譜表示相結合以獲得一經結合的原始信號頻譜表示,且其中該原始信號處理器適用於處理該經結合的原始信號頻譜表示。
- 如申請專利範圍第1項所述之音訊信號合成器,其中該結合器適用於使用源於該音訊信號之信號、該另一原始信號頻譜表示。
- 如申請專利範圍第1項所述之音訊信號合成器,其中該音訊信號及該控制資訊係編碼於一資料流中,更包含一解格式器,該解格式器受組配以從該資料流中獲得該控制資訊。
- 如申請專利範圍第1項所述之音訊信號合成器,其中該音訊信號及該頻譜帶複製參數係編碼於一資料流中,且其中該原始信號處理器適用於從該資料流中獲得該頻譜帶複製參數。
- 一種音訊信號編碼器,其用於由一音訊信號產生包含在一第一頻帶中該音訊信號的成分、控制資訊及頻譜帶複製參數的一資料流,包含:一頻率選擇濾波器,其用以產生在該第一頻帶中該音訊信號的該等成分;一產生器,其用於由在一第二頻帶中該音訊信號的該等成分產生該頻譜帶複製參數;一控制資訊產生器,其用以產生該控制資訊,該控制資訊從一第一或一第二不同的修補演算法中識別一較佳的修補演算法,其中該等修補演算法之每一者使用在該第一頻帶中該音訊信號之該等成分產生具有該第二經複製頻帶中之信號成分的一原始信號。
- 如申請專利範圍第9項所述之音訊信號編碼器,更包含 用於分析該音訊信號以提供該音訊信號之特性的一裝置,用於分析的該裝置適用於識別具有一聲音程度之一時間部分的非諧波信號成分或一可區分的時間部分的一諧波信號成分。
- 如申請專利範圍第9項或申請專利範圍第10項所述之音訊信號編碼器,其中該控制資訊產生器適用於透過將該音訊信號與經修補之音訊信號進行比較,以對該第一及對該第二修補演算法識別較佳的修補演算法,其中透過響應於頻譜帶複製參數由一頻譜帶複製工具施以原始信號調整,而從與該等第一及第二修補演算法相關的不同的原始信號得出不同地經修補音訊信號。
- 一種電腦可讀取媒體,其具有資料流儲存於其間,該資料流用於在一傳輸線上傳輸或用於儲存,該資料流包含:一經編碼音訊信號,其在該第一頻帶中;控制資訊,該控制資訊從一第一或一第二不同的修補演算法中識別一修補演算法,其中該等修補演算法之每一者使用在該第一頻帶中該經編碼音訊信號的該等成分產生具有一第二經複製頻帶中之信號成分的一原始信號;及頻譜帶複製參數。
- 一種用於產生一合成音訊信號的方法,該合成音訊信號具有一第一頻帶及源於該第一頻帶之一第二經複製頻帶,該方法包含以下步驟: 執行至少二個不同的修補演算法,其中該等修補演算法之每一者使用具有該第一頻帶中之信號成分的一音訊信號產生具有該第二經複製頻帶中之信號成分的一原始信號,且其中執行該修補使得該等至少二個不同修補演算法其中之一係響應於一第一時間部分的一控制資訊而選定,且該等至少二個不同修補演算法之另一個係響應於不同於該第一時間部分之一第二時間部分的該控制資訊而選定,以獲得該第一及該第二時間部分的該原始信號;將該原始信號轉換為一原始信號頻譜表示;響應於頻譜域頻譜帶複製參數處理該原始信號頻譜表示以獲得一經調整之原始信號頻譜表示;及將具有該第一頻帶中之信號成分的該音訊信號或源於該音訊信號的一信號與該經調整之原始信號頻譜表示或與源於該經調整之原始信號頻譜表示的另一信號相結合,以獲得該合成音訊信號。
- 一種用於產生一資料流的方法,該資料流包含在一第一頻帶中一音訊信號的成分、控制資訊及頻譜帶複製參數,該方法包含以下步驟:頻率選擇過濾該音訊信號以產生在該第一頻帶中該音訊信號的該等成分;由在一第二頻帶中該音訊信號的該等成分產生該頻譜帶複製參數;產生從一第一或一第二不同修補演算法中識別一 較佳修補演算法的該控制資訊,其中該等修補演算法之每一者使用在該第一頻帶中該音訊信號的該等成分產生具有該第二經複製之頻帶中之信號成分的一原始信號。
- 一種電腦程式,其用於當於一處理器上執行時,執行申請專利範圍13項或申請專利範圍14項所述之方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US7983908P | 2008-07-11 | 2008-07-11 | |
US10382008P | 2008-10-08 | 2008-10-08 | |
PCT/EP2009/004451 WO2010003539A1 (en) | 2008-07-11 | 2009-06-19 | Audio signal synthesizer and audio signal encoder |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201009807A TW201009807A (en) | 2010-03-01 |
TWI441162B true TWI441162B (zh) | 2014-06-11 |
Family
ID=41120013
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW098122891A TWI441162B (zh) | 2008-07-11 | 2009-07-07 | 音訊信號合成器、音訊信號編碼器、用於產生合成音訊信號及資料流的方法、電腦可讀取媒體及電腦程式 |
Country Status (16)
Country | Link |
---|---|
US (3) | US8731948B2 (zh) |
EP (1) | EP2301026B1 (zh) |
JP (1) | JP5244971B2 (zh) |
KR (1) | KR101223835B1 (zh) |
CN (1) | CN102089816B (zh) |
AR (1) | AR072864A1 (zh) |
AU (1) | AU2009267525B2 (zh) |
BR (1) | BRPI0910792B1 (zh) |
CA (1) | CA2730198C (zh) |
CO (1) | CO6341675A2 (zh) |
ES (1) | ES2796552T3 (zh) |
MX (1) | MX2011000372A (zh) |
RU (1) | RU2491658C2 (zh) |
TW (1) | TWI441162B (zh) |
WO (1) | WO2010003539A1 (zh) |
ZA (1) | ZA201009208B (zh) |
Families Citing this family (49)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2346029B1 (en) * | 2008-07-11 | 2013-06-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, method for encoding an audio signal and corresponding computer program |
MX2011000372A (es) | 2008-07-11 | 2011-05-19 | Fraunhofer Ges Forschung | Sintetizador de señales de audio y codificador de señales de audio. |
WO2010069885A1 (en) * | 2008-12-15 | 2010-06-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and bandwidth extension decoder |
EP2239732A1 (en) | 2009-04-09 | 2010-10-13 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for generating a synthesis audio signal and for encoding an audio signal |
RU2452044C1 (ru) | 2009-04-02 | 2012-05-27 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Устройство, способ и носитель с программным кодом для генерирования представления сигнала с расширенным диапазоном частот на основе представления входного сигнала с использованием сочетания гармонического расширения диапазона частот и негармонического расширения диапазона частот |
CO6440537A2 (es) * | 2009-04-09 | 2012-05-15 | Fraunhofer Ges Forschung | Aparato y metodo para generar una señal de audio de sintesis y para codificar una señal de audio |
CN101566940B (zh) * | 2009-05-25 | 2012-02-29 | 中兴通讯股份有限公司 | 实现无线数据终端通用串行总线音频传输的方法及装置 |
JP5754899B2 (ja) | 2009-10-07 | 2015-07-29 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
US9838784B2 (en) | 2009-12-02 | 2017-12-05 | Knowles Electronics, Llc | Directional audio capture |
EP2362375A1 (en) * | 2010-02-26 | 2011-08-31 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for modifying an audio signal using harmonic locking |
JP5671823B2 (ja) * | 2010-03-24 | 2015-02-18 | 株式会社Jvcケンウッド | 高調波生成方法、高調波生成装置、及び、プログラム |
JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5719922B2 (ja) * | 2010-04-13 | 2015-05-20 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | サンプルごとに正確なオーディオ信号表現のための方法、エンコーダ及びデコーダ |
JP5609737B2 (ja) | 2010-04-13 | 2014-10-22 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
US8798290B1 (en) | 2010-04-21 | 2014-08-05 | Audience, Inc. | Systems and methods for adaptive signal equalization |
US9558755B1 (en) | 2010-05-20 | 2017-01-31 | Knowles Electronics, Llc | Noise suppression assisted automatic speech recognition |
JP6075743B2 (ja) | 2010-08-03 | 2017-02-08 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
ES2530957T3 (es) | 2010-10-06 | 2015-03-09 | Fraunhofer Ges Forschung | Aparato y método para procesar una señal de audio y para proporcionar una mayor granularidad temporal para un códec de voz y de audio unificado combinado (USAC) |
JP5707842B2 (ja) | 2010-10-15 | 2015-04-30 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
JP5714180B2 (ja) | 2011-05-19 | 2015-05-07 | ドルビー ラボラトリーズ ライセンシング コーポレイション | パラメトリックオーディオコーディング方式の鑑識検出 |
JP6073887B2 (ja) * | 2011-08-17 | 2017-02-01 | テレフオンアクチーボラゲット エルエム エリクソン(パブル) | エンコーダケイパビリティの動的シグナリングの仕組み |
JP6155274B2 (ja) * | 2011-11-11 | 2017-06-28 | ドルビー・インターナショナル・アーベー | 過剰サンプリングされたsbrを使ったアップサンプリング |
US9380320B2 (en) * | 2012-02-10 | 2016-06-28 | Broadcom Corporation | Frequency domain sample adaptive offset (SAO) |
US9212946B2 (en) * | 2012-06-08 | 2015-12-15 | General Electric Company | Campbell diagram displays and methods and systems for implementing same |
KR101920029B1 (ko) | 2012-08-03 | 2018-11-19 | 삼성전자주식회사 | 모바일 장치 및 제어방법 |
ES2549953T3 (es) * | 2012-08-27 | 2015-11-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y método para la reproducción de una señal de audio, aparato y método para la generación de una señal de audio codificada, programa de ordenador y señal de audio codificada |
EP3203471B1 (en) * | 2013-01-29 | 2023-03-08 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder for generating a frequency enhanced audio signal, method of decoding, encoder for generating an encoded signal and method of encoding using compact selection side information |
US9060223B2 (en) * | 2013-03-07 | 2015-06-16 | Aphex, Llc | Method and circuitry for processing audio signals |
RU2740690C2 (ru) * | 2013-04-05 | 2021-01-19 | Долби Интернешнл Аб | Звуковые кодирующее устройство и декодирующее устройство |
KR20190134821A (ko) * | 2013-04-05 | 2019-12-04 | 돌비 인터네셔널 에이비 | 스테레오 오디오 인코더 및 디코더 |
EP2830045A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Concept for audio encoding and decoding for audio channels and audio objects |
EP2830047A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for low delay object metadata coding |
EP2830061A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
JP6531649B2 (ja) | 2013-09-19 | 2019-06-19 | ソニー株式会社 | 符号化装置および方法、復号化装置および方法、並びにプログラム |
CN105849801B (zh) | 2013-12-27 | 2020-02-14 | 索尼公司 | 解码设备和方法以及程序 |
US20150350784A1 (en) * | 2014-04-03 | 2015-12-03 | Uma Satish Doshi | Music adaptive speaker system and method |
EP2963649A1 (en) | 2014-07-01 | 2016-01-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio processor and method for processing an audio signal using horizontal phase correction |
EP2980792A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating an enhanced signal using independent noise-filling |
CN106448688B (zh) | 2014-07-28 | 2019-11-05 | 华为技术有限公司 | 音频编码方法及相关装置 |
WO2016040885A1 (en) | 2014-09-12 | 2016-03-17 | Audience, Inc. | Systems and methods for restoration of speech components |
CN107210824A (zh) | 2015-01-30 | 2017-09-26 | 美商楼氏电子有限公司 | 麦克风的环境切换 |
WO2016141023A1 (en) | 2015-03-03 | 2016-09-09 | Dolby Laboratories Licensing Corporation | Enhancement of spatial audio signals by modulated decorrelation |
TWI693595B (zh) * | 2015-03-13 | 2020-05-11 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
TW202242853A (zh) * | 2015-03-13 | 2022-11-01 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
JP6611042B2 (ja) * | 2015-12-02 | 2019-11-27 | パナソニックIpマネジメント株式会社 | 音声信号復号装置及び音声信号復号方法 |
KR20210005164A (ko) | 2018-04-25 | 2021-01-13 | 돌비 인터네셔널 에이비 | 고주파 오디오 재구성 기술의 통합 |
CA3238615A1 (en) | 2018-04-25 | 2019-10-31 | Dolby International Ab | Integration of high frequency reconstruction techniques with reduced post-processing delay |
GB202203733D0 (en) * | 2022-03-17 | 2022-05-04 | Samsung Electronics Co Ltd | Patched multi-condition training for robust speech recognition |
CN114882867B (zh) * | 2022-04-13 | 2024-05-28 | 天津大学 | 基于滤波器组频率区分的深度网络波形合成方法及装置 |
Family Cites Families (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
US5898605A (en) | 1997-07-17 | 1999-04-27 | Smarandoiu; George | Apparatus and method for simplified analog signal record and playback |
US6782360B1 (en) | 1999-09-22 | 2004-08-24 | Mindspeed Technologies, Inc. | Gain quantization for a CELP speech coder |
US6978236B1 (en) * | 1999-10-01 | 2005-12-20 | Coding Technologies Ab | Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching |
US7742927B2 (en) * | 2000-04-18 | 2010-06-22 | France Telecom | Spectral enhancing method and device |
SE0001926D0 (sv) * | 2000-05-23 | 2000-05-23 | Lars Liljeryd | Improved spectral translation/folding in the subband domain |
SE0004818D0 (sv) * | 2000-12-22 | 2000-12-22 | Coding Technologies Sweden Ab | Enhancing source coding systems by adaptive transposition |
JP3870193B2 (ja) * | 2001-11-29 | 2007-01-17 | コーディング テクノロジーズ アクチボラゲット | 高周波再構成に用いる符号器、復号器、方法及びコンピュータプログラム |
JP3864098B2 (ja) | 2002-02-08 | 2006-12-27 | 日本電信電話株式会社 | 動画像符号化方法、動画像復号方法、及びこれらの方法の実行プログラムとこれらの実行プログラムを記録した記録媒体 |
KR20050021484A (ko) * | 2002-07-16 | 2005-03-07 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 코딩 |
ATE543179T1 (de) | 2002-09-04 | 2012-02-15 | Microsoft Corp | Entropische kodierung mittels anpassung des kodierungsmodus zwischen niveau- und lauflängenniveau-modus |
DE10252327A1 (de) * | 2002-11-11 | 2004-05-27 | Siemens Ag | Verfahren zur Erweiterung der Bandbreite eines schmalbandig gefilterten Sprachsignals, insbesondere eines von einem Telekommunikationsgerät gesendeten Sprachsignals |
US20040138876A1 (en) * | 2003-01-10 | 2004-07-15 | Nokia Corporation | Method and apparatus for artificial bandwidth expansion in speech processing |
KR100917464B1 (ko) * | 2003-03-07 | 2009-09-14 | 삼성전자주식회사 | 대역 확장 기법을 이용한 디지털 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치 |
US7460990B2 (en) * | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
JP4241417B2 (ja) | 2004-02-04 | 2009-03-18 | 日本ビクター株式会社 | 算術復号化装置、および算術復号化プログラム |
JP4495209B2 (ja) | 2004-03-12 | 2010-06-30 | ノキア コーポレイション | 符号化済みマルチチャンネルオーディオ信号に基づくモノオーディオ信号の合成 |
FI119533B (fi) * | 2004-04-15 | 2008-12-15 | Nokia Corp | Audiosignaalien koodaus |
DE602005013906D1 (de) * | 2005-01-31 | 2009-05-28 | Harman Becker Automotive Sys | Bandbreitenerweiterung eines schmalbandigen akustischen Signals |
JP4438663B2 (ja) | 2005-03-28 | 2010-03-24 | 日本ビクター株式会社 | 算術符号化装置及び算術符号化方法 |
KR100713366B1 (ko) | 2005-07-11 | 2007-05-04 | 삼성전자주식회사 | 모폴로지를 이용한 오디오 신호의 피치 정보 추출 방법 및그 장치 |
US7539612B2 (en) | 2005-07-15 | 2009-05-26 | Microsoft Corporation | Coding and decoding scale factor information |
JP4211780B2 (ja) | 2005-12-27 | 2009-01-21 | 三菱電機株式会社 | デジタル信号符号化装置、デジタル信号復号装置、デジタル信号算術符号化方法、およびデジタル信号算術復号方法 |
US7953604B2 (en) * | 2006-01-20 | 2011-05-31 | Microsoft Corporation | Shape and scale parameters for extended-band frequency coding |
JP2007300455A (ja) | 2006-05-01 | 2007-11-15 | Victor Co Of Japan Ltd | 算術符号化装置、および算術符号化装置におけるコンテキストテーブル初期化方法 |
US8010352B2 (en) * | 2006-06-21 | 2011-08-30 | Samsung Electronics Co., Ltd. | Method and apparatus for adaptively encoding and decoding high frequency band |
JP2008098751A (ja) | 2006-10-06 | 2008-04-24 | Matsushita Electric Ind Co Ltd | 算術符号化装置及び算術復号化装置 |
US7912729B2 (en) * | 2007-02-23 | 2011-03-22 | Qnx Software Systems Co. | High-frequency bandwidth extension in the time domain |
US8015368B2 (en) * | 2007-04-20 | 2011-09-06 | Siport, Inc. | Processor extensions for accelerating spectral band replication |
MX2011000372A (es) | 2008-07-11 | 2011-05-19 | Fraunhofer Ges Forschung | Sintetizador de señales de audio y codificador de señales de audio. |
PL3300076T3 (pl) | 2008-07-11 | 2019-11-29 | Fraunhofer Ges Forschung | Koder audio i dekoder audio |
-
2009
- 2009-06-19 MX MX2011000372A patent/MX2011000372A/es active IP Right Grant
- 2009-06-19 CN CN2009801270950A patent/CN102089816B/zh active Active
- 2009-06-19 WO PCT/EP2009/004451 patent/WO2010003539A1/en active Application Filing
- 2009-06-19 BR BRPI0910792-4A patent/BRPI0910792B1/pt active IP Right Grant
- 2009-06-19 EP EP09776790.9A patent/EP2301026B1/en active Active
- 2009-06-19 ES ES09776790T patent/ES2796552T3/es active Active
- 2009-06-19 RU RU2011101616/08A patent/RU2491658C2/ru active
- 2009-06-19 AU AU2009267525A patent/AU2009267525B2/en active Active
- 2009-06-19 CA CA2730198A patent/CA2730198C/en active Active
- 2009-06-19 JP JP2011516984A patent/JP5244971B2/ja active Active
- 2009-06-19 KR KR1020117000298A patent/KR101223835B1/ko active IP Right Grant
- 2009-07-07 AR ARP090102549A patent/AR072864A1/es active IP Right Grant
- 2009-07-07 TW TW098122891A patent/TWI441162B/zh active
-
2010
- 2010-12-22 ZA ZA2010/09208A patent/ZA201009208B/en unknown
- 2010-12-29 CO CO10164067A patent/CO6341675A2/es active IP Right Grant
-
2011
- 2011-01-11 US US13/004,248 patent/US8731948B2/en active Active
-
2014
- 2014-04-10 US US14/250,139 patent/US10014000B2/en active Active
-
2018
- 2018-06-06 US US16/001,572 patent/US10522168B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
AR072864A1 (es) | 2010-09-29 |
EP2301026B1 (en) | 2020-03-04 |
JP2011527447A (ja) | 2011-10-27 |
US10014000B2 (en) | 2018-07-03 |
CN102089816B (zh) | 2013-01-30 |
US20110173006A1 (en) | 2011-07-14 |
US10522168B2 (en) | 2019-12-31 |
US8731948B2 (en) | 2014-05-20 |
CO6341675A2 (es) | 2011-11-21 |
CA2730198C (en) | 2014-09-16 |
BRPI0910792A2 (pt) | 2015-10-06 |
AU2009267525B2 (en) | 2012-12-20 |
TW201009807A (en) | 2010-03-01 |
WO2010003539A1 (en) | 2010-01-14 |
CA2730198A1 (en) | 2010-01-14 |
EP2301026A1 (en) | 2011-03-30 |
ES2796552T3 (es) | 2020-11-27 |
KR101223835B1 (ko) | 2013-01-17 |
US20140222434A1 (en) | 2014-08-07 |
ZA201009208B (en) | 2011-10-26 |
US20180350387A1 (en) | 2018-12-06 |
AU2009267525A1 (en) | 2010-01-14 |
JP5244971B2 (ja) | 2013-07-24 |
CN102089816A (zh) | 2011-06-08 |
KR20110040817A (ko) | 2011-04-20 |
RU2491658C2 (ru) | 2013-08-27 |
MX2011000372A (es) | 2011-05-19 |
BRPI0910792B1 (pt) | 2020-03-24 |
RU2011101616A (ru) | 2012-07-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI441162B (zh) | 音訊信號合成器、音訊信號編碼器、用於產生合成音訊信號及資料流的方法、電腦可讀取媒體及電腦程式 | |
US11915712B2 (en) | Audio encoder and decoder using a frequency domain processor, a time domain processor, and a cross processing for continuous initialization | |
CN111554310B (zh) | 用频谱域智能间隙填充编码或解码音频信号的设备及方法 | |
KR101424944B1 (ko) | 오디오 인코더 및 대역폭 확장 디코더 | |
JP6992024B2 (ja) | 独立したノイズ充填を用いた強化された信号を生成するための装置および方法 | |
TW201419269A (zh) | 用以再現音訊信號之裝置及方法、用以產生編碼音訊信號之裝置及方法、電腦程式、與編碼音訊信號 | |
KR101430335B1 (ko) | 가이드된 대역폭 확장 및 블라인드 대역폭 확장을 이용하여 광대역 신호를 생성하는 장치, 방법 및 컴퓨터 프로그램 | |
KR102649124B1 (ko) | 후처리 지연을 저감시킨 고주파 재구성 기술의 통합 | |
KR20190085144A (ko) | 오디오 신호의 고주파 재구성을 위한 하모닉 트랜스포저의 하위호환형 통합 | |
JP2019502948A (ja) | 符号化されたオーディオ信号を処理するための装置および方法 | |
TW202343436A (zh) | 用於執行一音訊信號之高頻重建之方法、音訊處理單元及非暫時性電腦可讀媒體 |