TW202125502A - 支援一組不同丟失消隱工具之音訊解碼器 - Google Patents
支援一組不同丟失消隱工具之音訊解碼器 Download PDFInfo
- Publication number
- TW202125502A TW202125502A TW109131872A TW109131872A TW202125502A TW 202125502 A TW202125502 A TW 202125502A TW 109131872 A TW109131872 A TW 109131872A TW 109131872 A TW109131872 A TW 109131872A TW 202125502 A TW202125502 A TW 202125502A
- Authority
- TW
- Taiwan
- Prior art keywords
- audio signal
- loss
- audio
- blanking
- audio decoder
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 claims abstract description 156
- 230000003595 spectral effect Effects 0.000 claims abstract description 90
- 238000001228 spectrum Methods 0.000 claims abstract description 78
- 238000000034 method Methods 0.000 claims description 69
- 238000001514 detection method Methods 0.000 claims description 34
- 238000011084 recovery Methods 0.000 claims description 27
- 230000000737 periodic effect Effects 0.000 claims description 20
- 238000005259 measurement Methods 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 13
- 230000010363 phase shift Effects 0.000 claims description 11
- 230000015572 biosynthetic process Effects 0.000 claims description 7
- 230000004048 modification Effects 0.000 claims description 7
- 238000012986 modification Methods 0.000 claims description 7
- 238000003786 synthesis reaction Methods 0.000 claims description 7
- 230000003252 repetitive effect Effects 0.000 claims description 6
- 230000001419 dependent effect Effects 0.000 claims description 2
- 230000004044 response Effects 0.000 claims description 2
- 230000002123 temporal effect Effects 0.000 abstract description 8
- 101100408464 Caenorhabditis elegans plc-1 gene Proteins 0.000 description 12
- 238000006243 chemical reaction Methods 0.000 description 6
- 238000003066 decision tree Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 101100520231 Caenorhabditis elegans plc-3 gene Proteins 0.000 description 4
- 230000007774 longterm Effects 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 238000006467 substitution reaction Methods 0.000 description 4
- 230000001960 triggered effect Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000003756 stirring Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 102100026205 1-phosphatidylinositol 4,5-bisphosphate phosphodiesterase gamma-1 Human genes 0.000 description 1
- 101100190617 Arabidopsis thaliana PLC2 gene Proteins 0.000 description 1
- 101100408456 Arabidopsis thaliana PLC8 gene Proteins 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 101100464304 Caenorhabditis elegans plk-3 gene Proteins 0.000 description 1
- 101000691599 Homo sapiens 1-phosphatidylinositol 4,5-bisphosphate phosphodiesterase gamma-1 Proteins 0.000 description 1
- 101100093534 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) RPS1B gene Proteins 0.000 description 1
- 238000013019 agitation Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000001831 conversion spectrum Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/81—Detection of presence or absence of voice signals for discriminating voice from music
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3059—Digital compression and data reduction techniques where the original information is represented by a subset or similar information, e.g. lossy compression
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/60—General implementation details not specific to a particular type of compression
- H03M7/6005—Decoder aspects
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/60—Network streaming of media packets
- H04L65/75—Media network packet handling
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/60—Network streaming of media packets
- H04L65/75—Media network packet handling
- H04L65/756—Media network packet handling adapting media to device capabilities
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Electrophonic Musical Instruments (AREA)
- Stereo-Broadcasting Methods (AREA)
Abstract
如果指派/選擇係基於下列兩個度量來完成,則可採用導致一更愉悅丟失消隱之一方式,將一音訊解碼器之不同丟失消隱工具之相位集之一者指派給要從一資料流解碼之音訊信號之一部分,該部分受丟失影響,亦即從該組不同丟失消隱工具選擇:已定之一第一度量對音訊信號之一頻譜之一頻譜矩心之一頻譜位置進行測量、以及已定之一第二度量對音訊信號之一時間可預測性進行測量。指派或選擇之丟失消隱工具可接著用於恢復該音訊信號之該部分。
Description
本申請案涉及支援一組不同丟失消隱工具之音訊解碼器。
封包丟失消隱(PLC)係用於音訊編解碼,以使丟失或損毀之封包在從編碼器傳輸至解碼器期間消隱。PLC是在解碼器側進行,並且藉由將轉換域中或時域中之已解碼信號外插來運作。理想情況下,消隱信號應該無實物,並且應該具有與遺漏信號相同之頻譜特性。
如[2]及[4]中所述,錯誤穩健音訊編解碼大致具有用於各種信號類型之多種消隱方法,例如:用於單音信號之語音為一實例,用於多音信號或雜訊信號之音樂為一實例。選擇係基於一組信號特徵,該等信號特徵係予以傳送且解碼自位元流、或在解碼器中估計。
音調式PLC技巧對於語音及單音信號大致產生良好結果。這些方法假設信號為局部平穩,並且使用一外插音調週期藉由合成一週期信號來恢復丟失信號。這些技巧係廣泛用於CELP式語音編碼,諸如ITU-T G.718 [2]。其亦可用於PCM編碼,諸如用於ITU-T G.711 [3],並且近來係應用於DECT式音訊編碼,最妥實例為3GPP EVS標準[4]中之TCX時域消隱TCX TD-PLC。
音調滯後係用於音調式PLC之主要參數。此參數可予以在編碼器側估計,並且予以編碼成位元流。在這種狀況中,最後良好訊框之音調滯後係用於消隱目前丟失訊框,諸如[2]及[4]中所述。如果位元流中沒有音調滯後,則可對已解碼信號,藉由運行一音調偵檢演算法,在解碼器側估計音調滯後,諸如[3]中所述。
對於非週期性、非聲調、似雜訊信號,已發現一低複雜度技巧有效,其稱為具有符號攪拌之訊框重複。其基於重複最後訊框,並且將頻譜係數乘以一隨機產生正負號,以使丟失訊框消隱。可在3GPP EVS標準[4]中發現具有正負號攪拌之MDCT訊框重複之一項實例。
對於聲調多音信號或複雜音樂信號,使用一種以預測任何偵檢到之聲調分量之頻譜係數之相位為基礎之方法。此方法顯示對平穩聲調信號之一致性改善。聲調分量由亦存在於先前所接收訊框中之峰值所組成。屬於聲調分量之頻譜係數之相位係從最後所接收訊框之功率譜測定。可在3GPP EVS標準[4]中發現聲調MDCT消隱之一項實例。
綜上所述,已知不同PLC方法,但這些方法係特定用於某些情況,亦即用於某些音訊特性。也就是說,支援這些PLC方法其中數種之一音訊編碼器應該具有用以在遭遇訊框或封包丟失時選擇最適合PLC方法之一機制。該最適合PLC方法是用於該丟失信號最不引人注目之代換方法。
本申請案之目的是提供一種音訊解碼概念,其允許包含一組不同丟失消隱工具之一音訊解碼器實現一改良型丟失消隱。
此目的係藉由本申請案之獨立項之標的內容來達成。
本發明之想法係基於以下發現:如果指派/選擇係基於下列兩個度量來完成,則可採用導致一更愉悅丟失消隱之一方式,將一音訊解碼器之不同丟失消隱工具之相位集之一者指派給要從一資料流解碼之音訊信號之一部分,該部分受丟失影響,亦即從該組不同丟失消隱工具選擇:已定之一第一度量對音訊信號之一頻譜之一頻譜矩心之一頻譜位置進行測量、以及已定之一第二度量對音訊信號之一時間可預測性進行測量。指派或選擇之丟失消隱工具可接著用於恢復該音訊信號之該部分。
舉例來說,基於前述第一及第二度量,可將第一及第二丟失消隱工具之一者指派給丟失部分,其中一第一者被組配用以使用取決於從資料流推導出之一音調值之一週期性之一週期信號,藉由音訊信號合成來恢復音訊信號,以及第二丟失消隱工具可被組配用以藉由偵檢該音訊信號之聲調頻譜分量、在該等聲調頻譜分量處進行相位偵檢、以及藉由在取決於該相位偵檢對該等信號之間的一相互相移進行調整下,組合取決於該等聲調頻譜分量之該等週期性信號所進行之音訊信號合成,來恢復音訊信號。換句話說,基於第一及第二度量,可將一聲調頻域PLC工具及一聲調時域PLC工具其中一者指派給丟失部分。
根據一實施例,對於一丟失部分,分階段進行指派/選擇:測定對音訊信號之頻譜之一聲調性進行測量之一第三度量,以及將出自該組不同丟失消隱工具之一或多丟失消隱工具之第一及第二子集其中一者指派給丟失部分,並且僅在將一或多丟失消隱工具之第一子集指派給丟失部分時,才基於出自此第一子集之第一及第二度量,為丟失部分指派一個PLC工具。否則,從第二子集中進行指派/選擇。
圖1根據本申請案之一實施例,展示一音訊解碼器。如圖中所示,音訊解碼器10被組配用以從一資料流14解碼一音訊信號12。可根據任何適合的音訊編解碼,諸如一時域式音訊編解碼或一頻域式音訊編解碼,將音訊信號12編碼成資料流14。可分別以訊框18之時間部分16為單位,將音訊信號12編碼成資料流14。更精確地說,可在時間上將音訊信號12細分成重疊或非重疊時間部分或間隔16,其各對應於將資料流14細分之訊框18中之某一者。各訊框18編碼一對應時間部分16。舉例來說,一部分18可含有關於線性預測係數之資訊,其描述對應部分16內音訊信號之一頻譜包絡。另外,訊框18可內有編碼之頻譜係數,該等頻譜係數描述部分16內音訊信號12要定型之一頻譜,該頻譜舉例來說,係由音訊解碼器10根據該訊框中所含有之線性預測係數來定型。一重疊相加程序也可能由音訊解碼器10用於從資料流14重構音訊信號12。當然,該等可能性也將適用於本文中所提僅為了易於理解而運用之實例。
資料流14可由音訊解碼器10以封包形式接收,亦即以封包為單位。將資料流14細分成訊框18本身代表一種封包化,亦即訊框18代表封包。另外,可將資料流14包成一傳輸流或媒體檔案格式之封包,但這裡不再詳細檢驗這種情況。反而,應足以陳述由音訊解碼器10對資料流14之接收易遭逢資料或信號丟失,下文中稱為封包丟失。也就是說,資料流14之某連續部分20可能在傳輸期間丟失,因音訊解碼器10沒收到,致使對應部分遺漏,而且無法用於音訊解碼器10。結果是,音訊解碼器10遺漏資料流14中為了將對應於部分20之一部分22重構之資訊。換句話說,音訊解碼器10無法根據例如在音訊解碼器之一音訊解碼核心24中實施之一正常音訊解碼程序將部分22從資料流14重構,因為資料流14之部分20有遺漏。反而,為了處理此類遺漏部分20,音訊解碼器10包含PLC工具28之一集合26,以便藉由一代換信號30恢復或合成部分22內之音訊信號12。集合26所包含之PLC工具28之差異在於其對於不同音訊信號特性之適合性。也就是說,將某一PLC工具用於恢復音訊信號12之某一部分22內之一信號代換30時之煩擾程度取決於該部分22處之音訊信號特性,並且集合26內之PLC工具28針對某一組音訊信號特性顯示相互不同之煩擾程度。因此,音訊解碼器10包含一指派器32,其將封包丟失消隱工具28之集合26之一者指派給音訊信號12受一封包丟失影響之部分22,諸如資料流14之丟失部分22。指派器32嘗試將最妥PLC工具28指派給部分22,亦即導致最低煩擾之一者。
藉由使用指派器32為部分22指派之PLC工具28所取得之一代換信號30,一旦指派器32已將某一PLC工具28指派給音訊信號12之一丟失部分22,音訊解碼器10便使用指派之PLC工具28來恢復音訊信號之此部分22,藉此代換此部分22內之音訊信號12,因為如果對應資料流部分22不會丟失,則會將其從音訊資料流14重構。
如上述,向某一丟失部分22指派一特定PLC工具28應該具有信號相依性,以便使丟失消隱盡可能地不造成煩擾。然而,信號相依性受限於資料流14在丟失資料流部分20前之部分,並且根據本文中所述之實施例,指派器32動作如下。
為了更加詳細解釋這一點,請參照圖2。圖2展示某一遺漏部分22之整體指派程序可能是由可能存在於音訊解碼器10中之一丟失偵檢器34所觸發。特別的是,如果由丟失偵檢器34進行之丟失偵檢36顯露資料流14之某部分20遺漏或丟失,如在38處檢查者,則觸發以下指派程序。進行一測定40,以便測定對音訊信號之一頻譜之一頻譜矩心之一頻譜位置進行測量之一第一度量42。也就是說,指派器32測定音訊信號之一頻譜之一質心之一頻譜位置,請參照圖3。音訊解碼器先於資料流順序,從資料流14之丟失部分20前之一部分44,取回音訊信號之一頻譜46。如以上對照圖1所述,資料流14可能內有採用任何方式在頻譜域中編碼之音訊信號12,以使得指派器32不需要頻譜分解也能取得頻譜46。舉例來說,在丟失部分20之前,資料流14之一最近接收之訊框18或多於一個最近取回之訊框18的頻譜係數係用於取得頻譜46。如果使用多於一個訊框18,則可藉由取平均來取得由指派器32所使用之頻譜46。為了進行測定40,測定此頻譜46之質心,即對頻譜46之一頻譜位置48進行測量之一度量42。稍後介紹一特定實例。
再者,由丟失偵檢所觸發之指派程序包含音訊信號之一時間可預測性之一測定50,以便取得此時間可預測性之一度量52,細節請參照圖4。如其中所示,根據一實施例,時間可預測性偵檢50可依賴於如從資料流14推導出直到信號部分22之解碼信號或音訊信號12,信號部分22由於丟失資料流14之部分20而遺漏。換句話說,時間可預測性偵檢50可基於緊接在丟失部分22前之部分50內之音訊信號12,其丟失有待消隱,並且其係解碼自資料流14之部分44。時間可預測性偵檢50可採用如下方式完成:度量52係用於信號部分50之自相似性或自相關之一度量,如圖4中54處所示。透過度量52所測量之信號50之自相似性所針對之相互位移s可由指派器32採用不同方式來測定。舉例來說,指派器32可檢驗資料流14之丟失部分20前之部分44內一或多個訊框18中輸送之一對應音調參數。也就是說,可用以測量自相似性之相互位移s可對應於一音調週期,該音調週期具有基於資料流14中之一參數(即部分44)所測定之一音調。該音調週期位移處之自相似性或相關性56可用作為第二度量52。
顯然,可分別切換進行測定40及50之順序,或可同時進行兩偵檢。基於度量42及52,進行一指派60。此指派60選擇兩個PLC工具28之一用於部分22之丟失消隱。接著將此PLC工具,即所指派之一者62,用於部分22之丟失消隱。
作為一簡要說明,應知,諸PLC工具28 (藉由指派60在之間進行選擇)之數量可大於2。
然而,根據下文進一步概述之一實施例,可將圖2之PLC工具PLC 1描述為1,藉其使用聲調時域封包丟失消隱來取得或恢復代換信號30,即部分22內之音訊信號估計。換句話說,PLC 1可以是單音部分之音訊信號恢復專用之一封包丟失消隱。PLC 1可使用一週期性之一週期信號來恢復一音訊信號12之一遺漏部分22內之一音訊信號,該週期信號取決於從資料流推導出之一音調參數或音調值,亦即,推導自資料流14之部分44,即資料流14之丟失部分20前之部分44。
第二PLC工具PLC 2可專用於恢復多音類型之音訊信號。此第二PLC工具PLC 2之消隱可基於聲調頻域封包丟失消隱。
請參照圖5及6,將簡要解釋PLC 1及PLC 2之一可能實作態樣。
圖5繪示PLC 1。資料流14之丟失部分20前之部分44內一訊框18中輸送之一音調參數或音調值66係用於設定一週期信號70之一週期性或週期長度68,接著將其用於形成一代換、或用於消隱音訊信號12之部分22內之丟失。音調參數或音調值66可存在於資料流14中,以便由音訊解碼器10在正常音訊解碼之狀況中,亦即無信號丟失之狀況中,用於控制例如一諧波濾波工具或類似者。也就是說,無論如何,參數66都可存在於資料流14中。否則,根據圖5進行PLC 1之PLC工具28可藉由分析來測定音調週期68,諸如藉由分析丟失部分22前面之已解碼信號50來測定,或藉由分析諸如圖3所示頻譜46等頻譜之最近可存取版本來測定。
圖6根據一實施例,繪示PLC 2。在這裡,負責進行PLC 2之PLC工具28舉例來說,使用如從資料流14之部分44取得之一個或兩個或更多最近取得之頻譜,以便偵檢或測定其中之聲調頻譜分量,即頻譜46中之峰值72、或分別在某一數量連序頻譜或訊框18之頻譜中該位置或足夠類似位置處出現之頻譜46中之峰值72。足夠類似位置可以是頻譜距離低於某一臨界值之位置。峰值72之頻譜位置代表聲調頻譜分量,並且在這裡,於這些頻譜位置處,相位偵檢係例如藉由使用、或例如藉由評估音訊信號之功率譜來進行。接著,在內有信號丟失要消隱之時間部分22內,形成一信號組合,其週期性取決於聲調頻譜分量,以便產出增補信號30,其中該等組合信號之間的一相互相移係取決於相位偵檢來調整。舉例來說,為各聲調分量72測定相位,或僅測定這些聲調分量之間的相位差,並且形成一信號作為部分22內之代換30,其係藉由這些聲調分量72來合成,並且遵從相位差或相位。該組合可在頻譜域中形成,並且藉由逆轉換來推導代換信號30,或是在時域中直接藉由新增例如適當相互位移之信號來形成,該相互相移反映所測定之相互相移。
如下文更加詳述,指派60可採用以下方式完成:選擇或將PLC 1指派給部分22而導致更有可能頻譜位置48越低則時間可預測性越高,反之亦然,指派或選擇PLC 2而導致更有可能頻譜位置48越高則時間可預測性越低。一更高頻譜位置對應於一更高頻率,並且一更低頻譜位置對應於一更低頻率。藉此,依照這種方式,在部分22對應於已丟失語音之狀況中更可能選擇PLC1,並且在部分22與多音信號或音樂有關之狀況中更可能選擇PLC2。
為了完整起見,圖7展示可延伸圖2之指派程序。特別的是,如圖2所示,指派60係藉由將指派60之指派或選擇限制在PLC工具28之一子集80上來完成。PLC工具28之集合26可含有一或多個PLC工具28之再一子集,諸如子集82,並且在受丟失偵檢36觸發時,一聲調性偵檢84可先由指派器32使用,以便測定部分圖22是否有關於一聲調部分。聲調性測定84產出一聲調性度量或指示符86,並且此聲調性度量指示符86可藉由使用資料流14之部分44內之一或多個參數在84中取得,舉例如藉由檢驗部分44內之最近訊框18是否包含某一音調參數來取得,諸如是否包含如圖5所述之一音調值66。倘若不存在,這可解讀為為音訊信號目前為非聲調信號之一指示,並且倘若存在音調參數66,這可解讀為指出音訊信號目前為聲調信號。接著,此指示為聲調性度量86。使用度量86在88處區別音訊信號是否是為聲調信號,並且如果其為非聲調信號,則指派給部分22之PLC 62係指派自子集82。圖7繪示一個PLC工具28係由子集82所包含,並且選擇的是這個PLC工具。然而,在這裡,甚至可再從子集82進行再一選擇。如果在88處確認聲調性,則相對如以上對照圖2所述之子集80,進行基於測定40及50之指派60。
PLC 3可以是非音調PLC,諸如藉由使用具有或不具有重複修改之訊框重複來恢復用於一部分22之音訊信號之一PLC,這時重複修改可如上述涉及正負號攪拌,即一最近所接收頻譜之頻譜係數之一隨機正負號反轉,諸如接著受逆轉換並用於推導代換信號30之頻譜46。
圖8根據例如對應於圖7之一方式,視覺化用於在PLC工具28中進行選擇之一決策樹。進行決策A及B以從經設計用於不同信號類型之三種PLC方法PLC 1至PLC 3中,決定要用於某一遺漏信號部分22之方法,以便獲得最妥消隱效能。第一決策為決策A,係基於聲調性。如果信號變為非聲調性,則將PLC 3用於消隱。如果為聲調性,則採用決策B。決策B以上述對照圖2及7之方式,基於度量42及52,檢查聲調信號特性,取決於該等特性,選擇PLC 1或PLC 2中之一者。如上述,PLC 1可以是用於單音及/或語音信號之一聲調時域PLC,而PLC 2則可以是用於一多音及/或音樂信號之一聲調頻域PLC。
因此,圖8之決策樹將決策視覺化,可為不同信號類型,在三種PLC方法之間採取該等決策,以獲得最妥消隱效能。可藉由檢查一信號類型分類,亦即藉由將其用作為一聲調性指示符之一指示、或藉由從其推導出該聲調性指示符,來完成決策A,其可對應於圖7之檢查88。信號類型分類可能存在於各訊框18中,並且指出各訊框之一訊框類別。可在編碼器側對其進行計算,並且在位元流14中將其傳送至音訊解碼器。甚至替代地,可在解碼器側對其進行計算。然而,訊框類別之計算非常複雜,並且可要求由於訊框類別之一訊框相依性而在每個訊框中計算所有特徵。因此,對於低複雜度應用,如果使用一更簡單方法則可為較佳。如上述,有些音調參數66之存在性或不存在性可用作為指示符86。
基於測定40及52而對應於指派60之決策B在PLC#1與PLC#2之間產出一良好選擇。在[6]中,此一選擇已基於頻譜包絡之一穩定性測量而完成,其與信號之短期平穩性相關。然而,一信號越平穩,PLC#1及PLC#2兩聲調PLC方法之效能便都越好。這意味著平穩性因此不是一適用於選擇最佳聲調消隱方法之準則。平穩性特徵非常良好地指出聲調性,然而,其無法辨別語音/單音與多音/音樂。
如上述,有可能使用由指派器32所表示之一PLC分類器來進行圖8之決策樹,其可在一逐訊框基礎上操作而無任何訊框間相依性,因此僅需要一低複雜度。其僅在一訊框丟失之狀況下才可計算其分類特徵42及52,如38處所偵檢或檢查者,因此不在諸訊框18之中的無誤差訊框中新增一內在複雜度偏移。
決策A可基於一聲調性指示符86來完成,其可以是最後良好接收之音訊訊框中一音調值之存在性。決策B可藉由使用在最後良好接收之音訊訊框上計算之頻譜矩心48及一長期預測增益56來完成。
決策B可在最適合單音及似語音信號之一音調式時域消隱方法PLC#1與最適合多音或複雜音樂信號之頻域方法PLC#2之間切換。決策B之分類之一優點導因於以下事實:
•頻譜矩心對於語音信號係處於非常低頻譜位置,而對於音樂信號係處於更高頻譜位置;
•長期預測增益較高對於如語音信號之單音及平穩信號為高增益,而對於如聲調或複雜音樂信號之多音或更不平穩信號為低增益。
因此,特徵42及52兩者之一加權組合可用於決策B及指派程序60,並且導致語音/單音與多音/複雜音樂信號之一可靠區別。同時,可保持低複雜度。
如果音訊解碼器接收一已損毀訊框,或如果訊框丟失,亦即遭遇一丟失部分20,如38處偵檢者,則可進行以下操作,其中亦參照圖2:
a. 在88處,進行決策A,是否將如PLC#2或PLC#1之一聲調消隱方法用於消隱代表部分20之丟失/損毀之訊框、或消隱對應部分22之丟失。決策A係基於一聲調性指示符68,可對其使用位元流中最後良好訊框中一音調值66之存在性。
b. 對於一否定決策A,不使用聲調PLC。反而,在那種狀況中使用另一PLC方法,即PLC#3。同樣可使用具有正負號攪拌之訊框重複。
c. 對於一肯定決策A,將兩種聲調PLC方法PLC#1及PLC#2之一用於消隱丟失/損毀之訊框。兩種PLC方法可以是時域音調式PLC,諸如[4]之TCX TD-PLC,或可以是頻域聲調消隱,諸如[4]中之聲調MDCT消隱,其中對應說明係以參考方式併入本文。
對於一肯定決策A,特徵42及52可採用以下方式,基於最後良好訊框來計算:
作為特徵或度量52,一長期預測增益:
可予以在50中運算,其中係最後良好訊框之音調值,並且係最後良好訊框之最後已解碼時間樣本,以及𝑁 = 𝑇𝑐 , & 𝑇𝑐 < 𝑁𝐹𝑁𝐹 , & 𝑒𝑙𝑠𝑒 #
其中可以是一有限值,如最大音調值或一訊框長度(例如:10 ms)。
對照以上說明,應做出一些註記。舉例來說,頻譜(測量其頻譜矩心以取得第一度量42)可以是一所謂的加權版本,諸如一預加強版本。舉例來說,將此類加權用於使量化雜訊適應於心理聲學掩蔽臨界值。換句話說,第一度量42可能測量音訊信號之一心理聲學換算頻譜之一頻譜矩心之一頻譜位置48。這在正常音訊解碼編碼之下層音訊解碼核心24涉及資料流14內有採用任何方式在頻譜域中編碼之音訊信號12 (亦即在加權域中編碼)的狀況中可能尤其有助益。另外或替代地,頻譜(測量其頻譜矩心以取得第一度量42)不一定是以如音訊解碼核心24中用於轉變到時域之頻譜解析度一般高之一頻譜所代表者。反而,其可更高或更低。甚至另外或替代地,應知,音訊信號之頻譜亦以換算因子彰顯其本身。可能在資料流14中,連同頻譜係數,傳送此類換算因子,以便一起形成音訊信號之頻譜之一編碼表示型態。對於某一部分22,頻譜係數係根據換算因子來換算。頻譜係數比換算因子更多。舉例來說,將各換算因子指派給數個頻譜帶之一,即所謂的換算因子頻譜帶,音訊信號之頻寬係劃分成該等換算因子頻譜帶。因此,相較於資料流14中用以對量化頻譜係數進行編碼之頻譜解析度,該等換算因子依據某更低頻譜解析度下之包絡為某一部分定義音訊信號之頻譜。甚而有可能資料流14中用以編碼該等換算因子之頻譜解析度甚低於解碼核心24用以對頻譜係數進行去量化之頻譜解析度。舉例來說,解碼核心24可能使編碼成資料流14之換算因子經受頻譜內插,以取得如編碼成資料流者更高頻譜解析度之內插換算因子,並且將該等內插換算因子用於去量化。編碼成資料流之換算因子及內插換算因子中之任一者可能用作為音訊信號之頻譜,其頻譜矩心係藉由第一度量42來測量。這意味著在藉由使已解碼音訊信號經受會更進一步增加工作量之一額外頻譜分解來為矩心測量取得頻譜之狀況中,相較於以任何更高解析度進行矩心測量,諸如以用來將頻譜係數編碼之解析度、或某其他解析度進行矩心測量,矩心測量變為要測定相當有運算效率,因為要進行用以測定第一度量之運算操作量低。因此,舉一具體實例來說,可基於已編碼降低取樣換算因子SNS (頻譜雜訊整形)將第一及第二度量運算如下:
作為第二度量,可能根據下式來運算一長期預測增益:
其中係最後已解碼時間樣本,並且可以是一預定長度值,諸如有限值,如最大音調值或一訊框長度(例如:10 ms),例如
其中係最小音調值。因此,第二度量將會在最近所接收部分處配合其本身予以運算為已解碼音訊時間信號之自相似性,以音調相互位移。
作為第二度量,可將一頻譜矩心運算為:
其中係取樣率,以及
並且係不均勻頻帶索引,即為了各頻帶而定義下及上頻率邊界之頻帶索引,所採用之一方式係使得相關聯下與上邊界之間的差異所定義之頻帶寬度彼此不同,諸如隨著頻率增加而增加,但該差異屬於任選。可能將該等頻帶索引定義成與音訊信號之取樣率/頻率具有相依性。再者,
其中係儲存在最後良好訊框之位元流中之換算因子向量,以及係一預定傾斜因子,可能將其設為預設值,並且有可能端視音訊信號之取樣頻率而定。套用項,以反過來在線性域中獲得在對數域中編碼之換算因子。套用項以反轉編碼器側預加強濾波器,其稱為去強濾波器。
在編碼器側計算並在位元流中傳輸換算因子向量。其係測定於MDCT係數每個頻帶之能量上,其中該等頻帶為不均勻,並且遵循感知相關巴克量度(低頻中較小,高頻中較大)。將能量修勻、預加強及轉換到對數域之後,在編碼器側,將該等能量從64個參數降低取樣至16個參數,以形成換算因子向量,之後將其編碼並在位元流中傳輸。因此,係為了音訊信號之一頻譜46之一頻譜矩心之一頻譜位置48所用之一度量,在這裡係基於其頻譜粗略取樣版本來測定,亦即基於SNS參數來測定。
接著,可憑藉準則及來完成各種PLC方法之中的決定或選擇。如果(其意味著聲調性指示符),則可能選擇具有正負號攪拌之訊框重複。否則,將值計算如下:𝑐𝑙𝑎𝑠𝑠 =764032768 𝑥𝑐𝑜𝑟𝑟 − 𝑠𝑐 − 511232768
7
如果,則可能選擇時域音調式PLC方法;否則,選擇頻域聲調消隱。
因此,包含不同丟失消隱工具28之一集合26且用於將一音訊信號12從資料流14解碼之音訊解碼器可被組配用以藉由從資料流之一最近非丟失部分中之換算因子推導出頻譜來測定40對音訊信號之一頻譜46之一頻譜矩心之一頻譜位置48進行測量之第一度量42、測定50對音訊信號之一時間可預測性進行測量之一第二度量52、基於該等第一及第二度量將不同丟失消隱工具28之集合26之一者62指派32給音訊信號12受丟失影響之一部分22、以及使用指派給部分22之一個丟失消隱工具62來恢復音訊信號之部分22。如所述,頻譜之推導可能涉及使編碼成資料流之換算因子經受頻譜內插。另外或替代地,其可經受去強濾波,亦即其可能乘以一去強濾波器之轉移函數。所產生之換算因子可接著經受頻譜矩心測量。接著也可施用上述所有其他細節。也就是說,為了敘述並非旨在排他之實例:不同丟失消隱工具之集合26可包含單音部分之音訊信號恢復所用之一第一丟失消隱工具、及多音部分之音訊信號恢復所用之一第二丟失消隱工具,並且該音訊解碼器可被組配用以在基於該等第一及第二度量將該組不同丟失消隱工具之該一者指派給該音訊信號之該部分時,將該第一丟失消隱工具指派給更可能該頻譜矩心之該頻譜位置越低則該時間可預測性越高之部分,以及將該第二丟失消隱工具指派給更可能該頻譜矩心之該頻譜位置越高則該時間可預測性越低之部分。另外或替代地,該音訊解碼器可被組配用以在基於該等第一及第二度量將該組不同丟失消隱工具之一者指派給該音訊信號受丟失影響之一部分22時,對該等第一及第二度量42、52進行一求和,以便取得一純量總和值並且將該純量總和值定限。
雖然已在一用具的背景下說明一些態樣,清楚可知的是,這些態樣也代表對應方法之說明,其中一程序塊或裝置對應於一方法步驟或一方法步驟之一特徵。類似的是,以一方法步驟為背景說明之態樣也代表一對應方塊或一對應設備之項目或特徵的說明。此等方法步驟中有一些或全部可藉由(或使用)一硬體用具來執行,舉例如:一微處理器、一可規劃電腦或一電子電路。在一些實施例中,最重要之方法步驟中有一或多者可藉由此一設備來執行。
取決於某些實作態樣要求,本發明之實施例可實施成硬體或軟體。此實作態樣可使用一數位儲存媒體來進行,例如軟式磁片、藍光(Blu-Ray)、CD、ROM、PROM、EPROM、EEPROM或快閃記憶體,此數位儲存媒體上有儲存電子可讀控制信號,此等電子可讀控制信號與一可規劃電腦系統相配合(或能夠相配合)而得以進行各別方法。因此,數位儲存媒體可以是電腦可讀。
根據本發明之一些實施例包含有一具有電子可讀控制信號之資料載體,此等電子可讀控制信號能夠與一可規劃電腦系統相配合而得以進行本文中所述方法之一。
一般而言,本發明之實施例可實施成一具有一程式碼之電腦程式產品,當此電腦程式產品在一電腦上執行時,此程式碼係運作來進行此等方法之一。此程式碼可例如儲存在一機器可讀載體上。
其他實施例包含有用於進行本方法所述方法之一、儲存在一機器可讀載體上之電腦程式。
換句話說,本發明之一實施例因此係一電腦程式,此電腦程式具有一程式碼,當此電腦程式在一電腦上運行時,此程式碼係用於進行本文中所述方法之一。
本發明此等方法之再一實施例因此係一資料載體(或一數位儲存媒體、或一電腦可讀媒體),其包含有、上有記錄用於進行本文中所述方法之一的電腦程式。此資料載體、數位儲存媒體或經記錄媒體典型係有形及/或非暫時性。
本方法之再一實施例因此係一資料流或一信號串,其代表用於進行本文中所述方法之一的電腦程式。此資料流或信號串可例如組配來經由一資料通訊連線來轉移,例如經由網際網路轉移。
再一實施例包含有例如一電腦之一處理手段、或一可規劃邏輯裝置,係組配來或適用於進行本文中所述方法之一。
再一實施例包含有一電腦,此電腦具有安裝於其上用於進行本文中所述方法之一的電腦程式。
根據本發明之再一實施例包含一設備或一系統,其係組配來(例如以電子方式或以光學方式)將用於本文中所述其中一種方法之一電腦程式轉移至一接收器。此接收器舉例而言,可以是一電腦、一行動裝置、一記憶體裝置或類似物。此用具或系統舉例而言,可包含有一用於轉移此電腦程式至此接收器的檔案伺服器。
在一些實施例中,一可規劃邏輯裝置(例如一可現場規劃閘陣列)可用於進行本文中所述方法之功能的一些或全部。在一些實施例中,一可現場規劃閘陣列可與一微處理器相配合,以便進行本文中所述方法之一。一般而言,此等方法較佳的是藉由任何硬體用具來進行。
本文中所述之設備可使用一硬體設備、或使用一電腦、或使用一硬體設備與一電腦之一組合來實施。
本文中所述之設備、或本文中所述設備之任何組件可予以至少部分實施成硬體及/或軟體。
本文中所述之方法可使用一硬體設備、或使用一電腦、或使用一硬體設備與一電腦之一組合來進行。
本文中所述之方法、或本文中所述設備之任何組件可予以至少部分藉由硬體及/或藉由軟體來進行。
上述實施例對於本發明之原理而言只具有說明性。瞭解的是,本文中所述布置與細節的修改及變例對於所屬技術領域中具有通常知識者將會顯而易見。因此,意圖是僅受限於待決專利請求項之範疇,並且不受限於藉由本文中實施例之說明及解釋所介紹之特定細節。
由上述討論,將可理解,本發明可以多種實施例形式體現,包含但不限於下列:
一種用於從資料流解碼音訊信號之音訊解碼器,該音訊解碼器包含一組不同丟失消隱工具,並且被組配用以:
測定對該音訊信號之一頻譜之一頻譜矩心之一頻譜位置進行測量之一第一度量,
測定對該音訊信號之一時間可預測性進行測量之一第二度量,
基於該等第一及第二度量,將該組不同丟失消隱工具之一者指派給該音訊信號受丟失影響之一部分,以及
使用指派給該部分之一個丟失消隱工具來恢復該音訊信號之該部分。
如實施例1之音訊解碼器,其中該組不同丟失消隱工具包含下列一或多者:
一第一丟失消隱工具,供使用取決於從該資料流推導出之一音調值之一週期性之一週期信號,藉由音訊信號合成來進行音訊信號恢復,以及
一第二丟失消隱工具,供藉由偵檢該音訊信號之聲調頻譜分量、在該等聲調頻譜分量處進行相位偵檢、以及藉由組合取決於該等聲調頻譜分量之該等週期性信號與取決於該相位偵檢對該等信號之間的一相互相移進行調整所進行之音訊信號合成,來進行音訊信號恢復,以及
一第三丟失消隱工具,供藉由使用訊框重複來進行音訊信號恢復,有或沒有重複修改。
如實施例1或2之音訊解碼器,其中該組不同丟失消隱工具包含:
一第一丟失消隱工具,供進行單音部分之音訊信號恢復,以及
一第二丟失消隱工具,供進行多音部分之音訊信號恢復。
如實施例1或2之音訊解碼器,其中該組不同丟失消隱工具包含:
一第一丟失消隱工具,供使用聲調時域封包丟失消隱進行音訊信號恢復,以及
一第二丟失消隱工具,供使用聲調頻域封包丟失消隱進行音訊信號恢復。
如實施例1或2之音訊解碼器,其中該組不同丟失消隱工具包含:
一第一丟失消隱工具,供使用取決於從該資料流推導出之一音調值之一週期性之一週期信號,藉由音訊信號合成來進行音訊信號恢復,以及
一第二丟失消隱工具,供藉由偵檢該音訊信號之聲調頻譜分量、在該等聲調頻譜分量處進行相位偵檢、以及藉由組合取決於該等聲調頻譜分量之該等週期性信號與取決於該相位偵檢對該等信號之間的一相互相移進行調整所進行之音訊信號合成,來進行音訊信號恢復。
如實施例5之音訊解碼器,其中該音訊解碼器被組配用以:
藉由使用該資料流中輸送之一最近音調參數作為該音調值,從該資料流推導出該音調值。
如實施例5或6之音訊解碼器,其中該音訊解碼器被組配用以:
藉由識別從該資料流之一最近非丟失部分推導出之一或多個連序頻譜中之共置峰值,來進行該等聲調頻譜分量之該偵檢。
如實施例7之音訊解碼器,其中該資料流在頻譜域中有編碼在該資料流內之該最近非丟失部分。
如實施例3至8中任一項之音訊解碼器,
其中該音訊解碼器被組配用以在基於該等第一及第二度量將該組不同丟失消隱工具之該一者指派給該音訊信號之該部分時,將該第一丟失消隱工具指派給更可能該頻譜矩心之該頻譜位置越低且該時間可預測性越高之部分,以及將該第二丟失消隱工具指派給更可能該頻譜矩心之該頻譜位置越高且該時間可預測性越低之部分。
如前述實施例中任一項之音訊解碼器,其被組配用以:
進行丟失偵檢以偵檢受丟失影響之部分,
回應於偵檢到受丟失影響之該部分之該丟失偵檢,對於該部分進行該等第一及第二度量之該測定,以及禁止對於不受丟失影響之部分進行該測定。
如實施例1至10中任一項之音訊解碼器,其更被組配用以:
測定一聲調性指示符,其指出該音訊信號之一聲調性,
基於該聲調性指示符,將出自該組不同丟失消隱工具之一或多個丟失消隱工具之相互不相交的第一及第二子集其中一者指派給該音訊信號之該部分,以及
如果使用指派給該部分之該一個丟失消隱工具,憑藉進行該音訊信號之該部分之該恢復,將該第一子集指派給該部分,則從一或多個丟失消隱工具之該第一子集,基於該等第一及第二度量,藉由將該組不同丟失消隱工具指派給該音訊信號之該部分,來基於該等第一及第二度量,進行該組不同丟失消隱工具之一者向該音訊信號之該部分的該指派,以及如果將該等丟失消隱工具之該第二子集指派給該部分,則使用出自該等丟失消隱工具之該第二子集之一者,來進行該音訊信號之該部分之該恢復。
如實施例11之音訊解碼器,其中該音訊解碼器被組配用以:
使用該資料流中輸送之一參數作為該第三度量。
如實施例11或12之音訊解碼器,其中該音訊解碼器被組配用以:
使用該資料流之一最近非丟失訊框中一音調參數之一存在性或不存在性作為該第三度量。
如實施例11至13中任一項之音訊解碼器,其中該組不同丟失消隱工具包含:
一第一丟失消隱工具,供使用取決於從該資料流推導出之一音調值之一週期性之一週期信號,藉由音訊信號合成來進行音訊信號恢復,以及
一第二丟失消隱工具,供藉由偵檢該音訊信號之聲調頻譜分量、在該等聲調頻譜分量處進行相位偵檢、以及藉由組合取決於該等聲調頻譜分量之該等週期性信號與取決於該相位偵檢對該等信號之間的一相互相移進行調整所進行之音訊信號合成,來進行音訊信號恢復,以及
一第三丟失消隱工具,供藉由使用訊框重複來進行音訊信號恢復,有或沒有重複修改,
其中該第二子集中包括該第三丟失消隱工具,並且該第一子集中包括該第二及該等第一與第二丟失消隱工具。
如前述實施例中任一項之音訊解碼器,其被組配用以藉由諸頻譜分量位置值之一加權總和來測定該第一度量,各加權於該各別頻譜分量位置值使用該音訊信號之該頻譜。
如前述實施例中任一項之音訊解碼器,其被組配用以藉由對該音訊信號之一自相似性進行測量之一相關性度量來測定該第二度量。
如前述實施例中任一項之音訊解碼器,其被組配用以藉由從該音訊信號推導出一音調來測定該第二度量,以及測定該第二度量作為以取決於該音調之一時間位移對該音訊信號之一自相關進行測量之一相關性度量。
如前述實施例中任一項之音訊解碼器,其被組配用以在基於該等第一及第二度量將該組不同丟失消隱工具之一者指派給該音訊信號受丟失影響之一部分時,對該等第一及第二度量進行一求和,以便取得一純量總和值並且將該純量總和值定限。
一種用於在從資料流音訊解碼音訊信號時進行丟失消隱之方法,該方法包含
測定對該音訊信號之一頻譜之一頻譜矩心之一頻譜位置進行測量之一第一度量,
測定對該音訊信號之一時間可預測性進行測量之一第二度量,
基於該等第一及第二度量,將一組不同丟失消隱工具之一者指派給該音訊信號受丟失影響之一部分,以及
使用指派給該部分之一個丟失消隱工具來恢復該音訊信號之該部分。
一種具有程式碼之電腦程式,用於當該程式碼在一處理器上運行時執行如實施例19之一方法。
[1] 3GPP TS 26.445; Codec for Enhanced Voice Services (EVS); Detailed algorithmic description。
[2] ITU-T G.718 : Frame error robust narrow-band and wideband embedded variable bit-rate coding of speech and audio from 8-32 kbit/s。
[3] ITU-T G.711 Appendix I: A high quality low-complexity algorithm for packet loss concealment with G.711。
[4] 3GPP TS 26.447; Codec for Enhanced Voice Services (EVS); Error concealment of lost packets。
[5] Method and device for efficient frame erasure concealment in speech codecs; WO2007073604 (A1) ― 2007-07-05
[6] Selecting a Packet Loss Concealment Procedure; EP3111624 A1 – 2017-01-04
10:音訊解碼器
12:音訊信號
14:資料流
16:時間部分
18:訊框
20:連續部分
22:重構部分
24:音訊解碼核心
26:集合
28:PLC工具
30:代換信號
32:指派器
34:丟失偵檢器
36:丟失偵檢
38、88:檢查
40、50:測定
42、52:度量
44:部分
46:頻譜
48:頻譜位置
54:用於信號部分之自相似性或自相關之度量
56:自相似性或相關性
60:指派
62:PLC
66:音調參數
68:週期性或週期長度
70:週期信號
72:峰值
80、82:子集
84:聲調性測定
86:聲調性度量或指示符
本申請案之有助益態樣為申請專利範圍附屬項之主旨。下文對照圖式提出本申請案之較佳實施例,該等圖式中:
圖1 根據本申請案之一實施例,採用一示意性方式,展示一音訊解碼器的一方塊圖;
圖2 根據一實施例,展示圖1之音訊解碼器之指派器32之一操作模式的一流程圖;
圖3 根據一實施例,針對測定用於圖2中PLC指派之第一度量,繪示一頻譜矩心偵檢的一示意圖;
圖4 根據一實施例,展示一示意圖,其針對測定用於圖2之PLC指派之第二度量,繪示時間可預測性偵檢;
圖5 繪示一示意圖,用於說明圖2之PLC 1之操作模式;
圖6 根據一實施例,展示一示意圖,其繪示PLC 2之一操作模式。
圖7 根據一實施例,展示圖2之指派操作之一修改版本的一流程圖,其經延伸以便為封包丟失消隱PLC 1至PLC 3,從一組PLC工具進行一指派;以及
圖8 展示一決策樹,用於在三個PLC工具之中做決定,圖7之實施例對應於該決策樹。
10:音訊解碼器
12:音訊信號
14:資料流
16:時間部分
18:訊框
20:連續部分
22:重構部分
24:音訊解碼核心
26:集合
28:PLC工具
30:代換信號
32:指派器
34:丟失偵檢器
Claims (20)
- 一種用於從資料流解碼音訊信號之音訊解碼器,該音訊解碼器包含一組不同丟失消隱工具,並且被組配用以: 測定對該音訊信號之一頻譜之一頻譜矩心之一頻譜位置進行測量之一第一度量, 測定對該音訊信號之一時間可預測性進行測量之一第二度量, 基於該等第一及第二度量,將該組不同丟失消隱工具之一者指派給該音訊信號受丟失影響之一部分,以及 使用指派給該部分之一個丟失消隱工具來恢復該音訊信號之該部分。
- 如請求項1之音訊解碼器,其中該組不同丟失消隱工具包含下列一或多者: 一第一丟失消隱工具,供使用取決於從該資料流推導出之一音調值之一週期性之一週期信號,藉由音訊信號合成來進行音訊信號恢復,以及 一第二丟失消隱工具,供藉由偵檢該音訊信號之聲調頻譜分量、在該等聲調頻譜分量處進行相位偵檢、以及藉由組合取決於該等聲調頻譜分量之該等週期性信號與取決於該相位偵檢對該等信號之間的一相互相移進行調整所進行之音訊信號合成,來進行音訊信號恢復,以及 一第三丟失消隱工具,供藉由使用訊框重複來進行音訊信號恢復,有或沒有重複修改。
- 如請求項1或2之音訊解碼器,其中該組不同丟失消隱工具包含: 一第一丟失消隱工具,供進行單音部分之音訊信號恢復,以及 一第二丟失消隱工具,供進行多音部分之音訊信號恢復。
- 如請求項1至3中任一項之音訊解碼器,其中該組不同丟失消隱工具包含: 一第一丟失消隱工具,供使用聲調時域封包丟失消隱進行音訊信號恢復,以及 一第二丟失消隱工具,供使用聲調頻域封包丟失消隱進行音訊信號恢復。
- 如請求項1至4中任一項之音訊解碼器,其中該組不同丟失消隱工具包含: 一第一丟失消隱工具,供使用取決於從該資料流推導出之一音調值之一週期性之一週期信號,藉由音訊信號合成來進行音訊信號恢復,以及 一第二丟失消隱工具,供藉由偵檢該音訊信號之聲調頻譜分量、在該等聲調頻譜分量處進行相位偵檢、以及藉由組合取決於該等聲調頻譜分量之該等週期性信號與取決於該相位偵檢對該等信號之間的一相互相移進行調整所進行之音訊信號合成,來進行音訊信號恢復。
- 如請求項5之音訊解碼器,其中該音訊解碼器被組配用以: 藉由使用該資料流中輸送之一最近音調參數作為該音調值,從該資料流推導出該音調值。
- 如請求項5或6之音訊解碼器,其中該音訊解碼器被組配用以: 藉由識別從該資料流之一最近非丟失部分推導出之一或多個連序頻譜中之共置峰值,來進行該等聲調頻譜分量之該偵檢。
- 如請求項7之音訊解碼器,其中該資料流在頻譜域中有編碼在該資料流內之該最近非丟失部分。
- 如請求項1之音訊解碼器, 其中該音訊解碼器被組配用以在基於該等第一及第二度量將該組不同丟失消隱工具之該一者指派給該音訊信號之該部分時,將一第一丟失消隱工具指派給更可能該頻譜矩心之該頻譜位置越低且該時間可預測性越高之部分,以及將一第二丟失消隱工具指派給更可能該頻譜矩心之該頻譜位置越高且該時間可預測性越低之部分。
- 如請求項3之音訊解碼器,其被組配用以: 進行丟失偵檢以偵檢受丟失影響之部分, 回應於偵檢到受丟失影響之該部分之該丟失偵檢,對於該部分進行該等第一及第二度量之該測定,以及禁止對於不受丟失影響之部分進行該測定。
- 如請求項3之音訊解碼器,其更被組配用以: 測定一聲調性指示符,其指出該音訊信號之一聲調性, 基於該聲調性指示符,將出自該組不同丟失消隱工具之一或多個丟失消隱工具之相互不相交的第一及第二子集其中一者指派給該音訊信號之該部分,以及 如果使用指派給該部分之該一個丟失消隱工具,憑藉進行該音訊信號之該部分之該恢復,將該第一子集指派給該部分,則從一或多個丟失消隱工具之該第一子集,基於該等第一及第二度量,藉由將該組不同丟失消隱工具指派給該音訊信號之該部分,來基於該等第一及第二度量,進行該組不同丟失消隱工具之一者向該音訊信號之該部分的該指派,以及如果將該等丟失消隱工具之該第二子集指派給該部分,則使用出自該等丟失消隱工具之該第二子集之一者,來進行該音訊信號之該部分之該恢復。
- 如請求項11之音訊解碼器,其中該音訊解碼器被組配用以: 使用該資料流中輸送之一參數作為該第三度量。
- 如請求項11之音訊解碼器,其中該音訊解碼器被組配用以: 使用該資料流之一最近非丟失訊框中一音調參數之一存在性或不存在性作為該第三度量。
- 如請求項11之音訊解碼器,其中該組不同丟失消隱工具包含: 一第一丟失消隱工具,供使用取決於從該資料流推導出之一音調值之一週期性之一週期信號,藉由音訊信號合成來進行音訊信號恢復,以及 一第二丟失消隱工具,供藉由偵檢該音訊信號之聲調頻譜分量、在該等聲調頻譜分量處進行相位偵檢、以及藉由組合取決於該等聲調頻譜分量之該等週期性信號與取決於該相位偵檢對該等信號之間的一相互相移進行調整所進行之音訊信號合成,來進行音訊信號恢復,以及 一第三丟失消隱工具,供藉由使用訊框重複來進行音訊信號恢復,有或沒有重複修改, 其中該第二子集中包括該第三丟失消隱工具,並且該第一子集中包括該第二及該等第一與第二丟失消隱工具。
- 如請求項1之音訊解碼器,其被組配用以藉由諸頻譜分量位置值之一加權總和來測定該第一度量,各加權於該各別頻譜分量位置值使用該音訊信號之該頻譜。
- 如請求項1之音訊解碼器,其被組配用以藉由對該音訊信號之一自相似性進行測量之一相關性度量來測定該第二度量。
- 如請求項1之音訊解碼器,其被組配用以藉由從該音訊信號推導出一音調來測定該第二度量,以及測定該第二度量作為以取決於該音調之一時間位移對該音訊信號之一自相關進行測量之一相關性度量。
- 如請求項3之音訊解碼器,其被組配用以在基於該等第一及第二度量將該組不同丟失消隱工具之一者指派給該音訊信號受丟失影響之一部分時,對該等第一及第二度量進行一求和,以便取得一純量總和值並且將該純量總和值定限。
- 一種用於在從資料流音訊解碼音訊信號時進行丟失消隱之方法,該方法包含 測定對該音訊信號之一頻譜之一頻譜矩心之一頻譜位置進行測量之一第一度量, 測定對該音訊信號之一時間可預測性進行測量之一第二度量, 基於該等第一及第二度量,將一組不同丟失消隱工具之一者指派給該音訊信號受丟失影響之一部分,以及 使用指派給該部分之一個丟失消隱工具來恢復該音訊信號之該部分。
- 一種具有程式碼之電腦程式,用於當該程式碼在一處理器上運行時執行如請求項19之一方法。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP17201142.1A EP3483878A1 (en) | 2017-11-10 | 2017-11-10 | Audio decoder supporting a set of different loss concealment tools |
EP17201142.1 | 2017-11-10 | ||
WOPCT/EP2018/080198 | 2018-11-05 | ||
PCT/EP2018/080198 WO2019091924A1 (en) | 2017-11-10 | 2018-11-05 | Audio decoder supporting a set of different loss concealment tools |
Publications (2)
Publication Number | Publication Date |
---|---|
TW202125502A true TW202125502A (zh) | 2021-07-01 |
TWI776236B TWI776236B (zh) | 2022-09-01 |
Family
ID=60301924
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW107139910A TWI704554B (zh) | 2017-11-10 | 2018-11-09 | 支援一組不同丟失消隱工具之音訊解碼器 |
TW109131872A TWI776236B (zh) | 2017-11-10 | 2018-11-09 | 支援一組不同丟失消隱工具之音訊解碼器 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW107139910A TWI704554B (zh) | 2017-11-10 | 2018-11-09 | 支援一組不同丟失消隱工具之音訊解碼器 |
Country Status (19)
Country | Link |
---|---|
US (1) | US11315580B2 (zh) |
EP (3) | EP3483878A1 (zh) |
JP (1) | JP7073492B2 (zh) |
KR (1) | KR102424897B1 (zh) |
CN (1) | CN111630591B (zh) |
AR (1) | AR113571A1 (zh) |
AU (1) | AU2018363136B2 (zh) |
BR (1) | BR112020009117A2 (zh) |
CA (1) | CA3082268C (zh) |
ES (1) | ES2933273T3 (zh) |
FI (1) | FI3707705T3 (zh) |
MX (1) | MX2020004791A (zh) |
PL (1) | PL3707705T3 (zh) |
PT (1) | PT3707705T (zh) |
RU (1) | RU2759092C1 (zh) |
SG (1) | SG11202004223RA (zh) |
TW (2) | TWI704554B (zh) |
WO (1) | WO2019091924A1 (zh) |
ZA (1) | ZA202002522B (zh) |
Family Cites Families (170)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3639753A1 (de) | 1986-11-21 | 1988-06-01 | Inst Rundfunktechnik Gmbh | Verfahren zum uebertragen digitalisierter tonsignale |
US5012517A (en) | 1989-04-18 | 1991-04-30 | Pacific Communication Science, Inc. | Adaptive transform coder having long term predictor |
US5233660A (en) | 1991-09-10 | 1993-08-03 | At&T Bell Laboratories | Method and apparatus for low-delay celp speech coding and decoding |
JPH05281996A (ja) | 1992-03-31 | 1993-10-29 | Sony Corp | ピッチ抽出装置 |
IT1270438B (it) | 1993-06-10 | 1997-05-05 | Sip | Procedimento e dispositivo per la determinazione del periodo del tono fondamentale e la classificazione del segnale vocale in codificatori numerici della voce |
US5581653A (en) | 1993-08-31 | 1996-12-03 | Dolby Laboratories Licensing Corporation | Low bit-rate high-resolution spectral envelope coding for audio encoder and decoder |
JP3402748B2 (ja) | 1994-05-23 | 2003-05-06 | 三洋電機株式会社 | 音声信号のピッチ周期抽出装置 |
JPH0811644A (ja) | 1994-06-27 | 1996-01-16 | Nissan Motor Co Ltd | ルーフモール取付構造 |
US6167093A (en) | 1994-08-16 | 2000-12-26 | Sony Corporation | Method and apparatus for encoding the information, method and apparatus for decoding the information and method for information transmission |
DE69619284T3 (de) | 1995-03-13 | 2006-04-27 | Matsushita Electric Industrial Co., Ltd., Kadoma | Vorrichtung zur Erweiterung der Sprachbandbreite |
US5781888A (en) | 1996-01-16 | 1998-07-14 | Lucent Technologies Inc. | Perceptual noise shaping in the time domain via LPC prediction in the frequency domain |
WO1997027578A1 (en) | 1996-01-26 | 1997-07-31 | Motorola Inc. | Very low bit rate time domain speech analyzer for voice messaging |
US5812971A (en) | 1996-03-22 | 1998-09-22 | Lucent Technologies Inc. | Enhanced joint stereo coding method using temporal envelope shaping |
JPH1091194A (ja) | 1996-09-18 | 1998-04-10 | Sony Corp | 音声復号化方法及び装置 |
US6570991B1 (en) * | 1996-12-18 | 2003-05-27 | Interval Research Corporation | Multi-feature speech/music discrimination system |
KR100261253B1 (ko) | 1997-04-02 | 2000-07-01 | 윤종용 | 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치 |
GB2326572A (en) | 1997-06-19 | 1998-12-23 | Softsound Limited | Low bit rate audio coder and decoder |
AU9404098A (en) | 1997-09-23 | 1999-04-12 | Voxware, Inc. | Scalable and embedded codec for speech and audio signals |
JP3344962B2 (ja) | 1998-03-11 | 2002-11-18 | 松下電器産業株式会社 | オーディオ信号符号化装置、及びオーディオ信号復号化装置 |
US6507814B1 (en) | 1998-08-24 | 2003-01-14 | Conexant Systems, Inc. | Pitch determination using speech classification and prior pitch estimation |
US7272556B1 (en) | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
EP1139665A1 (en) | 2000-03-29 | 2001-10-04 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for changing the output delay of audio or video data encoding |
US6735561B1 (en) | 2000-03-29 | 2004-05-11 | At&T Corp. | Effective deployment of temporal noise shaping (TNS) filters |
US6665638B1 (en) | 2000-04-17 | 2003-12-16 | At&T Corp. | Adaptive short-term post-filters for speech coders |
US7395209B1 (en) | 2000-05-12 | 2008-07-01 | Cirrus Logic, Inc. | Fixed point audio decoding system and method |
US7353168B2 (en) | 2001-10-03 | 2008-04-01 | Broadcom Corporation | Method and apparatus to eliminate discontinuities in adaptively filtered signals |
US6785645B2 (en) * | 2001-11-29 | 2004-08-31 | Microsoft Corporation | Real-time speech and music classifier |
US20030187663A1 (en) | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
US7447631B2 (en) | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
US7433824B2 (en) | 2002-09-04 | 2008-10-07 | Microsoft Corporation | Entropy coding by adapting coding between level and run-length/level modes |
US7502743B2 (en) | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
JP4287637B2 (ja) | 2002-10-17 | 2009-07-01 | パナソニック株式会社 | 音声符号化装置、音声符号化方法及びプログラム |
KR101049751B1 (ko) | 2003-02-11 | 2011-07-19 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 코딩 |
KR20030031936A (ko) | 2003-02-13 | 2003-04-23 | 배명진 | 피치변경법을 이용한 단일 음성 다중 목소리 합성기 |
ATE503246T1 (de) | 2003-06-17 | 2011-04-15 | Panasonic Corp | Empfangsvorrichtung, sendevorrichtung und übertragungssystem |
WO2004114134A1 (en) * | 2003-06-23 | 2004-12-29 | Agency For Science, Technology And Research | Systems and methods for concealing percussive transient errors in audio data |
US7620545B2 (en) | 2003-07-08 | 2009-11-17 | Industrial Technology Research Institute | Scale factor based bit shifting in fine granularity scalability audio coding |
WO2005027096A1 (en) | 2003-09-15 | 2005-03-24 | Zakrytoe Aktsionernoe Obschestvo Intel | Method and apparatus for encoding audio |
US7009533B1 (en) | 2004-02-13 | 2006-03-07 | Samplify Systems Llc | Adaptive compression and decompression of bandlimited signals |
KR20050087956A (ko) | 2004-02-27 | 2005-09-01 | 삼성전자주식회사 | 무손실 오디오 부호화/복호화 방법 및 장치 |
DE102004009949B4 (de) | 2004-03-01 | 2006-03-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Ermitteln eines Schätzwertes |
DE102004009954B4 (de) | 2004-03-01 | 2005-12-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Verarbeiten eines Multikanalsignals |
WO2005086139A1 (en) | 2004-03-01 | 2005-09-15 | Dolby Laboratories Licensing Corporation | Multichannel audio coding |
JP4744438B2 (ja) | 2004-03-05 | 2011-08-10 | パナソニック株式会社 | エラー隠蔽装置およびエラー隠蔽方法 |
US7392195B2 (en) | 2004-03-25 | 2008-06-24 | Dts, Inc. | Lossless multi-channel audio codec |
KR100956877B1 (ko) | 2005-04-01 | 2010-05-11 | 콸콤 인코포레이티드 | 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 방법 및장치 |
US7539612B2 (en) | 2005-07-15 | 2009-05-26 | Microsoft Corporation | Coding and decoding scale factor information |
US7546240B2 (en) | 2005-07-15 | 2009-06-09 | Microsoft Corporation | Coding with improved time resolution for selected segments via adaptive block transformation of a group of samples from a subband decomposition |
KR20070037945A (ko) | 2005-10-04 | 2007-04-09 | 삼성전자주식회사 | 오디오 신호의 부호화/복호화 방법 및 장치 |
KR100888474B1 (ko) | 2005-11-21 | 2009-03-12 | 삼성전자주식회사 | 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법 |
US7805297B2 (en) * | 2005-11-23 | 2010-09-28 | Broadcom Corporation | Classification-based frame loss concealment for audio signals |
US9123350B2 (en) * | 2005-12-14 | 2015-09-01 | Panasonic Intellectual Property Management Co., Ltd. | Method and system for extracting audio features from an encoded bitstream for audio classification |
US8255207B2 (en) | 2005-12-28 | 2012-08-28 | Voiceage Corporation | Method and device for efficient frame erasure concealment in speech codecs |
CN101395661B (zh) | 2006-03-07 | 2013-02-06 | 艾利森电话股份有限公司 | 音频编码和解码的方法和设备 |
US8150065B2 (en) | 2006-05-25 | 2012-04-03 | Audience, Inc. | System and method for processing an audio signal |
ATE447227T1 (de) | 2006-05-30 | 2009-11-15 | Koninkl Philips Electronics Nv | Linear-prädiktive codierung eines audiosignals |
CN1983909B (zh) | 2006-06-08 | 2010-07-28 | 华为技术有限公司 | 一种丢帧隐藏装置和方法 |
US8015000B2 (en) * | 2006-08-03 | 2011-09-06 | Broadcom Corporation | Classification-based frame loss concealment for audio signals |
EP2054882B1 (en) | 2006-08-15 | 2011-01-19 | Dolby Laboratories Licensing Corporation | Arbitrary shaping of temporal noise envelope without side-information |
FR2905510B1 (fr) | 2006-09-01 | 2009-04-10 | Voxler Soc Par Actions Simplif | Procede d'analyse en temps reel de la voix pour le controle en temps reel d'un organe numerique et dispositif associe |
CN101140759B (zh) | 2006-09-08 | 2010-05-12 | 华为技术有限公司 | 语音或音频信号的带宽扩展方法及系统 |
DE102006049154B4 (de) | 2006-10-18 | 2009-07-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Kodierung eines Informationssignals |
KR101292771B1 (ko) * | 2006-11-24 | 2013-08-16 | 삼성전자주식회사 | 오디오 신호의 오류은폐방법 및 장치 |
JPWO2008072701A1 (ja) | 2006-12-13 | 2010-04-02 | パナソニック株式会社 | ポストフィルタおよびフィルタリング方法 |
FR2912249A1 (fr) | 2007-02-02 | 2008-08-08 | France Telecom | Codage/decodage perfectionnes de signaux audionumeriques. |
JP4871894B2 (ja) | 2007-03-02 | 2012-02-08 | パナソニック株式会社 | 符号化装置、復号装置、符号化方法および復号方法 |
EP2015293A1 (en) | 2007-06-14 | 2009-01-14 | Deutsche Thomson OHG | Method and apparatus for encoding and decoding an audio signal using adaptively switched temporal resolution in the spectral domain |
JP5618826B2 (ja) | 2007-06-14 | 2014-11-05 | ヴォイスエイジ・コーポレーション | Itu.t勧告g.711と相互運用可能なpcmコーデックにおいてフレーム消失を補償する装置および方法 |
JP4928366B2 (ja) | 2007-06-25 | 2012-05-09 | 日本電信電話株式会社 | ピッチ探索装置、パケット消失補償装置、それらの方法、プログラム及びその記録媒体 |
JP4572218B2 (ja) | 2007-06-27 | 2010-11-04 | 日本電信電話株式会社 | 音楽区間検出方法、音楽区間検出装置、音楽区間検出プログラム及び記録媒体 |
US20110116542A1 (en) | 2007-08-24 | 2011-05-19 | France Telecom | Symbol plane encoding/decoding with dynamic calculation of probability tables |
CN101790757B (zh) | 2007-08-27 | 2012-05-30 | 爱立信电话股份有限公司 | 语音与音频信号的改进的变换编码 |
CN100524462C (zh) | 2007-09-15 | 2009-08-05 | 华为技术有限公司 | 对高带信号进行帧错误隐藏的方法及装置 |
JP5547081B2 (ja) | 2007-11-02 | 2014-07-09 | 華為技術有限公司 | 音声復号化方法及び装置 |
WO2009066869A1 (en) | 2007-11-21 | 2009-05-28 | Electronics And Telecommunications Research Institute | Frequency band determining method for quantization noise shaping and transient noise shaping method using the same |
KR101162275B1 (ko) | 2007-12-31 | 2012-07-04 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
CN102057424B (zh) | 2008-06-13 | 2015-06-17 | 诺基亚公司 | 用于经编码的音频数据的错误隐藏的方法和装置 |
MX2011000369A (es) | 2008-07-11 | 2011-07-29 | Ten Forschung Ev Fraunhofer | Codificador y decodificador de audio para codificar marcos de señales de audio muestreadas. |
EP2144230A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
EP2144231A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme with common preprocessing |
PL2346030T3 (pl) | 2008-07-11 | 2015-03-31 | Fraunhofer Ges Forschung | Koder audio, sposób kodowania sygnału audio oraz program komputerowy |
US8577673B2 (en) | 2008-09-15 | 2013-11-05 | Huawei Technologies Co., Ltd. | CELP post-processing for music signals |
TWI419148B (zh) | 2008-10-08 | 2013-12-11 | Fraunhofer Ges Forschung | 多解析度切換音訊編碼/解碼方案 |
GB2466673B (en) | 2009-01-06 | 2012-11-07 | Skype | Quantization |
CA2750795C (en) | 2009-01-28 | 2015-05-26 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, encoded audio information, methods for encoding and decoding an audio signal and computer program |
EP2392003B1 (en) * | 2009-01-30 | 2013-01-02 | Telefonaktiebolaget LM Ericsson (publ) | Audio signal quality prediction |
JP4945586B2 (ja) * | 2009-02-02 | 2012-06-06 | 株式会社東芝 | 信号帯域拡張装置 |
US20100223061A1 (en) | 2009-02-27 | 2010-09-02 | Nokia Corporation | Method and Apparatus for Audio Coding |
EP2239732A1 (en) * | 2009-04-09 | 2010-10-13 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for generating a synthesis audio signal and for encoding an audio signal |
JP4932917B2 (ja) | 2009-04-03 | 2012-05-16 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
FR2944664A1 (fr) | 2009-04-21 | 2010-10-22 | Thomson Licensing | Dispositif et procede de traitement d'images |
US8352252B2 (en) * | 2009-06-04 | 2013-01-08 | Qualcomm Incorporated | Systems and methods for preventing the loss of information within a speech frame |
US8428938B2 (en) * | 2009-06-04 | 2013-04-23 | Qualcomm Incorporated | Systems and methods for reconstructing an erased speech frame |
KR20100136890A (ko) | 2009-06-19 | 2010-12-29 | 삼성전자주식회사 | 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법 |
CN101958119B (zh) | 2009-07-16 | 2012-02-29 | 中兴通讯股份有限公司 | 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法 |
ES2441069T3 (es) | 2009-10-08 | 2014-01-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decodificador multimodo para señal de audio, codificador multimodo para señal de audio, procedimiento y programa de computación que usan un modelado de ruido en base a linealidad-predicción-codificación |
WO2011044700A1 (en) | 2009-10-15 | 2011-04-21 | Voiceage Corporation | Simultaneous time-domain and frequency-domain noise shaping for tdac transforms |
WO2011048118A1 (en) | 2009-10-20 | 2011-04-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio signal encoder, audio signal decoder, method for providing an encoded representation of an audio content, method for providing a decoded representation of an audio content and computer program for use in low delay applications |
PT2491553T (pt) | 2009-10-20 | 2017-01-20 | Fraunhofer Ges Forschung | Codificador de áudio, descodificador de áudio, método para codificar uma informação de áudio, método para descodificar uma informação de áudio e programa de computador que utiliza uma redução iterativa de tamanho de intervalo |
US7978101B2 (en) | 2009-10-28 | 2011-07-12 | Motorola Mobility, Inc. | Encoder and decoder using arithmetic stage to compress code space that is not fully utilized |
US8207875B2 (en) | 2009-10-28 | 2012-06-26 | Motorola Mobility, Inc. | Encoder that optimizes bit allocation for information sub-parts |
KR101761629B1 (ko) | 2009-11-24 | 2017-07-26 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
MX2012008075A (es) | 2010-01-12 | 2013-12-16 | Fraunhofer Ges Forschung | Codificador de audio, decodificador de audio, metodo para codificar e informacion de audio, metodo para decodificar una informacion de audio y programa de computacion utilizando una modificacion de una representacion de un numero de un valor de contexto numerico previo. |
US20110196673A1 (en) * | 2010-02-11 | 2011-08-11 | Qualcomm Incorporated | Concealing lost packets in a sub-band coding decoder |
EP2375409A1 (en) | 2010-04-09 | 2011-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction |
FR2961980A1 (fr) | 2010-06-24 | 2011-12-30 | France Telecom | Controle d'une boucle de retroaction de mise en forme de bruit dans un codeur de signal audionumerique |
EP3422346B1 (en) | 2010-07-02 | 2020-04-22 | Dolby International AB | Audio encoding with decision about the application of postfiltering when decoding |
ES2937066T3 (es) | 2010-07-20 | 2023-03-23 | Fraunhofer Ges Forschung | Decodificador de audio, procedimiento y programa informático para decodificación de audio |
US9082416B2 (en) | 2010-09-16 | 2015-07-14 | Qualcomm Incorporated | Estimating a pitch lag |
US8738385B2 (en) | 2010-10-20 | 2014-05-27 | Broadcom Corporation | Pitch-based pre-filtering and post-filtering for compression of audio signals |
AR085794A1 (es) | 2011-02-14 | 2013-10-30 | Fraunhofer Ges Forschung | Prediccion lineal basada en esquema de codificacion utilizando conformacion de ruido de dominio espectral |
US9270807B2 (en) | 2011-02-23 | 2016-02-23 | Digimarc Corporation | Audio localization using audio signal encoding and recognition |
KR101748760B1 (ko) | 2011-03-18 | 2017-06-19 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. | 오디오 콘텐츠를 표현하는 비트스트림의 프레임들 내의 프레임 요소 배치 |
MX2013012301A (es) | 2011-04-21 | 2013-12-06 | Samsung Electronics Co Ltd | Aparato para cuantificar coeficientes de codificacion predictiva lineal, aparato de codificacion de sonido, aparato para decuantificar coeficientes de codificacion predictiva lineal, aparato de decodificacion de sonido y dispositivo electronico para los mismos. |
EP2707873B1 (en) | 2011-05-09 | 2015-04-08 | Dolby International AB | Method and encoder for processing a digital stereo audio signal |
FR2977439A1 (fr) | 2011-06-28 | 2013-01-04 | France Telecom | Fenetres de ponderation en codage/decodage par transformee avec recouvrement, optimisees en retard. |
FR2977969A1 (fr) | 2011-07-12 | 2013-01-18 | France Telecom | Adaptation de fenetres de ponderation d'analyse ou de synthese pour un codage ou decodage par transformee |
US9363339B2 (en) | 2011-07-12 | 2016-06-07 | Hughes Network Systems, Llc | Staged data compression, including block level long range compression, for data streams in a communications system |
CN103493130B (zh) * | 2012-01-20 | 2016-05-18 | 弗劳恩霍夫应用研究促进协会 | 用以利用正弦代换进行音频编码及译码的装置和方法 |
WO2013149672A1 (en) | 2012-04-05 | 2013-10-10 | Huawei Technologies Co., Ltd. | Method for determining an encoding parameter for a multi-channel audio signal and multi-channel audio encoder |
US20130282373A1 (en) | 2012-04-23 | 2013-10-24 | Qualcomm Incorporated | Systems and methods for audio signal processing |
US9026451B1 (en) | 2012-05-09 | 2015-05-05 | Google Inc. | Pitch post-filter |
WO2013183977A1 (ko) | 2012-06-08 | 2013-12-12 | 삼성전자 주식회사 | 프레임 에러 은닉방법 및 장치와 오디오 복호화방법 및 장치 |
GB201210373D0 (en) | 2012-06-12 | 2012-07-25 | Meridian Audio Ltd | Doubly compatible lossless audio sandwidth extension |
FR2992766A1 (fr) | 2012-06-29 | 2014-01-03 | France Telecom | Attenuation efficace de pre-echos dans un signal audionumerique |
CN102779526B (zh) | 2012-08-07 | 2014-04-16 | 无锡成电科大科技发展有限公司 | 语音信号中基音提取及修正方法 |
US9406307B2 (en) | 2012-08-19 | 2016-08-02 | The Regents Of The University Of California | Method and apparatus for polyphonic audio signal prediction in coding and networking systems |
US9293146B2 (en) | 2012-09-04 | 2016-03-22 | Apple Inc. | Intensity stereo coding in advanced audio coding |
US9280975B2 (en) | 2012-09-24 | 2016-03-08 | Samsung Electronics Co., Ltd. | Frame error concealment method and apparatus, and audio decoding method and apparatus |
CN103714821A (zh) * | 2012-09-28 | 2014-04-09 | 杜比实验室特许公司 | 基于位置的混合域数据包丢失隐藏 |
US9401153B2 (en) | 2012-10-15 | 2016-07-26 | Digimarc Corporation | Multi-mode audio recognition and auxiliary data encoding and decoding |
EP2757558A1 (en) | 2013-01-18 | 2014-07-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Time domain level adjustment for audio signal decoding or encoding |
FR3001593A1 (fr) | 2013-01-31 | 2014-08-01 | France Telecom | Correction perfectionnee de perte de trame au decodage d'un signal. |
RU2628144C2 (ru) * | 2013-02-05 | 2017-08-15 | Телефонактиеболагет Л М Эрикссон (Пабл) | Способ и устройство для управления маскировкой потери аудиокадров |
TWI530941B (zh) | 2013-04-03 | 2016-04-21 | 杜比實驗室特許公司 | 用於基於物件音頻之互動成像的方法與系統 |
AU2014283389B2 (en) | 2013-06-21 | 2017-10-05 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for improved concealment of the adaptive codebook in ACELP-like concealment employing improved pulse resynchronization |
EP2830061A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
EP2830055A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Context-based entropy coding of sample values of a spectral envelope |
KR101831289B1 (ko) * | 2013-10-18 | 2018-02-22 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. | 오디오 신호의 스펙트럼의 스펙트럼 계수들의 코딩 |
US9906858B2 (en) | 2013-10-22 | 2018-02-27 | Bongiovi Acoustics Llc | System and method for digital signal processing |
KR101940740B1 (ko) * | 2013-10-31 | 2019-01-22 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 시간 도메인 여기 신호를 변형하는 오류 은닉을 사용하여 디코딩된 오디오 정보를 제공하기 위한 오디오 디코더 및 방법 |
EP3063761B1 (en) | 2013-10-31 | 2017-11-22 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung E.V. | Audio bandwidth extension by insertion of temporal pre-shaped noise in frequency domain |
BR112016010197B1 (pt) | 2013-11-13 | 2021-12-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificador para codificar um sinal áudio, sistema de transmissão de áudio e método para determinar os valores de correção |
GB2524333A (en) | 2014-03-21 | 2015-09-23 | Nokia Technologies Oy | Audio signal payload |
ES2827278T3 (es) * | 2014-04-17 | 2021-05-20 | Voiceage Corp | Método, dispositivo y memoria no transitoria legible por ordenador para codificación y decodificación predictiva linealde señales sonoras en la transición entre tramas que tienen diferentes tasas de muestreo |
US9396733B2 (en) | 2014-05-06 | 2016-07-19 | University Of Macau | Reversible audio data hiding |
NO2780522T3 (zh) | 2014-05-15 | 2018-06-09 | ||
EP2963649A1 (en) | 2014-07-01 | 2016-01-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio processor and method for processing an audio signal using horizontal phase correction |
US9685166B2 (en) | 2014-07-26 | 2017-06-20 | Huawei Technologies Co., Ltd. | Classification between time-domain coding and frequency domain coding |
PT3000110T (pt) | 2014-07-28 | 2017-02-15 | Fraunhofer Ges Forschung | Seleção de um de entre um primeiro algoritmo de codificação e um segundo algoritmo de codificação com o uso de redução de harmônicos. |
WO2016016724A2 (ko) | 2014-07-28 | 2016-02-04 | 삼성전자 주식회사 | 패킷 손실 은닉방법 및 장치와 이를 적용한 복호화방법 및 장치 |
EP2980799A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing an audio signal using a harmonic post-filter |
EP2980798A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Harmonicity-dependent controlling of a harmonic filter tool |
EP2980796A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for processing an audio signal, audio decoder, and audio encoder |
EP2988300A1 (en) | 2014-08-18 | 2016-02-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Switching of sampling rates at audio processing devices |
WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
EP3067886A1 (en) | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
US10049684B2 (en) | 2015-04-05 | 2018-08-14 | Qualcomm Incorporated | Audio bandwidth selection |
US9886963B2 (en) | 2015-04-05 | 2018-02-06 | Qualcomm Incorporated | Encoder selection |
JP6422813B2 (ja) | 2015-04-13 | 2018-11-14 | 日本電信電話株式会社 | 符号化装置、復号装置、これらの方法及びプログラム |
US9978400B2 (en) * | 2015-06-11 | 2018-05-22 | Zte Corporation | Method and apparatus for frame loss concealment in transform domain |
US9837089B2 (en) | 2015-06-18 | 2017-12-05 | Qualcomm Incorporated | High-band signal generation |
US10847170B2 (en) | 2015-06-18 | 2020-11-24 | Qualcomm Incorporated | Device and method for generating a high-band signal from non-linearly processed sub-ranges |
KR20170000933A (ko) | 2015-06-25 | 2017-01-04 | 한국전기연구원 | 시간 지연 추정을 이용한 풍력 터빈의 피치 제어 시스템 |
US9830921B2 (en) | 2015-08-17 | 2017-11-28 | Qualcomm Incorporated | High-band target signal control |
WO2017039422A2 (ko) | 2015-09-04 | 2017-03-09 | 삼성전자 주식회사 | 음질 향상을 위한 신호 처리방법 및 장치 |
US9978381B2 (en) | 2016-02-12 | 2018-05-22 | Qualcomm Incorporated | Encoding of multiple audio signals |
US10219147B2 (en) | 2016-04-07 | 2019-02-26 | Mediatek Inc. | Enhanced codec control |
US10283143B2 (en) | 2016-04-08 | 2019-05-07 | Friday Harbor Llc | Estimating pitch of harmonic signals |
CN107103908B (zh) | 2017-05-02 | 2019-12-24 | 大连民族大学 | 复调音乐多音高估计方法及伪双谱在多音高估计中的应用 |
-
2017
- 2017-11-10 EP EP17201142.1A patent/EP3483878A1/en not_active Withdrawn
-
2018
- 2018-11-05 CA CA3082268A patent/CA3082268C/en active Active
- 2018-11-05 WO PCT/EP2018/080198 patent/WO2019091924A1/en active Search and Examination
- 2018-11-05 PT PT187966700T patent/PT3707705T/pt unknown
- 2018-11-05 CN CN201880086169.XA patent/CN111630591B/zh active Active
- 2018-11-05 MX MX2020004791A patent/MX2020004791A/es unknown
- 2018-11-05 BR BR112020009117-0A patent/BR112020009117A2/pt unknown
- 2018-11-05 AU AU2018363136A patent/AU2018363136B2/en active Active
- 2018-11-05 SG SG11202004223RA patent/SG11202004223RA/en unknown
- 2018-11-05 JP JP2020526135A patent/JP7073492B2/ja active Active
- 2018-11-05 FI FIEP18796670.0T patent/FI3707705T3/fi active
- 2018-11-05 PL PL18796670.0T patent/PL3707705T3/pl unknown
- 2018-11-05 EP EP22202282.4A patent/EP4152316A1/en active Pending
- 2018-11-05 EP EP18796670.0A patent/EP3707705B1/en active Active
- 2018-11-05 KR KR1020207015512A patent/KR102424897B1/ko active IP Right Grant
- 2018-11-05 ES ES18796670T patent/ES2933273T3/es active Active
- 2018-11-05 RU RU2020118968A patent/RU2759092C1/ru active
- 2018-11-09 TW TW107139910A patent/TWI704554B/zh active
- 2018-11-09 TW TW109131872A patent/TWI776236B/zh active
- 2018-11-12 AR ARP180103302A patent/AR113571A1/es active IP Right Grant
-
2020
- 2020-05-06 US US16/867,834 patent/US11315580B2/en active Active
- 2020-05-07 ZA ZA2020/02522A patent/ZA202002522B/en unknown
Also Published As
Publication number | Publication date |
---|---|
CN111630591B (zh) | 2023-08-08 |
TWI704554B (zh) | 2020-09-11 |
PL3707705T3 (pl) | 2023-02-20 |
TW201923749A (zh) | 2019-06-16 |
WO2019091924A1 (en) | 2019-05-16 |
EP3707705A1 (en) | 2020-09-16 |
SG11202004223RA (en) | 2020-06-29 |
JP7073492B2 (ja) | 2022-05-23 |
CA3082268C (en) | 2022-11-22 |
KR20200077575A (ko) | 2020-06-30 |
AU2018363136B2 (en) | 2021-10-07 |
MX2020004791A (es) | 2020-10-05 |
KR102424897B1 (ko) | 2022-07-25 |
EP3483878A1 (en) | 2019-05-15 |
PT3707705T (pt) | 2022-12-19 |
US20200265846A1 (en) | 2020-08-20 |
FI3707705T3 (fi) | 2023-01-31 |
AU2018363136A1 (en) | 2020-05-28 |
US11315580B2 (en) | 2022-04-26 |
EP3707705B1 (en) | 2022-10-19 |
EP4152316A1 (en) | 2023-03-22 |
RU2759092C1 (ru) | 2021-11-09 |
CN111630591A (zh) | 2020-09-04 |
AR113571A1 (es) | 2020-05-20 |
BR112020009117A2 (pt) | 2020-10-13 |
CA3082268A1 (en) | 2019-05-16 |
TWI776236B (zh) | 2022-09-01 |
ES2933273T3 (es) | 2023-02-03 |
ZA202002522B (en) | 2021-05-26 |
JP2021502608A (ja) | 2021-01-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20190385624A1 (en) | Methods for improving high frequency reconstruction | |
US10475455B2 (en) | Method and apparatus for obtaining spectrum coefficients for a replacement frame of an audio signal, audio decoder, audio receiver, and system for transmitting audio signals | |
RU2441286C2 (ru) | Способ и устройство для обнаружения звуковой активности и классификации звуковых сигналов | |
KR100986957B1 (ko) | 토널 컴포넌트들을 감지하는 시스템들, 방법들, 및 장치들 | |
CN105654958B (zh) | 用于高频带宽扩展的对信号进行编码和解码的设备和方法 | |
KR101376762B1 (ko) | 디코더 및 대응 디바이스에서 디지털 신호의 반향들의 안전한 구별과 감쇠를 위한 방법 | |
CN110197667B (zh) | 对音频信号的频谱执行噪声填充的装置 | |
AU2015295519B2 (en) | Harmonicity-dependent controlling of a harmonic filter tool | |
PT2888737T (pt) | Aparelho e método para reproduzir um sinal de áudio, aparelho e método para gerar um sinal de áudio codificado, programa de computador e sinal de áudio codificado | |
JP4980325B2 (ja) | 広帯域オーディオ信号の符号化/復号化装置およびその方法 | |
MXPA06011957A (es) | Codificacion de senales. | |
AU2018363701B2 (en) | Encoding and decoding audio signals | |
JP2016507087A (ja) | 利得制御を行うシステムおよび方法 | |
CN107221334B (zh) | 一种音频带宽扩展的方法及扩展装置 | |
TWI704554B (zh) | 支援一組不同丟失消隱工具之音訊解碼器 | |
EP4120253A1 (en) | Integral band-wise parametric coder |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
GD4A | Issue of patent certificate for granted invention patent |