TW202101426A - 音訊發送器處理器、音訊接收器處理器及相關方法與電腦程式 - Google Patents

音訊發送器處理器、音訊接收器處理器及相關方法與電腦程式 Download PDF

Info

Publication number
TW202101426A
TW202101426A TW109104393A TW109104393A TW202101426A TW 202101426 A TW202101426 A TW 202101426A TW 109104393 A TW109104393 A TW 109104393A TW 109104393 A TW109104393 A TW 109104393A TW 202101426 A TW202101426 A TW 202101426A
Authority
TW
Taiwan
Prior art keywords
codewords
frame
predefined
audio
information
Prior art date
Application number
TW109104393A
Other languages
English (en)
Other versions
TWI745862B (zh
Inventor
愛德瑞恩 托馬斯克
雷夫 史派史奈德
珍恩 布特
亞歷山大 奇齊卡林斯基
曼法德 路茲奇
Original Assignee
弗勞恩霍夫爾協會
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from EP19156997.9A external-priority patent/EP3697005A1/en
Application filed by 弗勞恩霍夫爾協會 filed Critical 弗勞恩霍夫爾協會
Publication of TW202101426A publication Critical patent/TW202101426A/zh
Application granted granted Critical
Publication of TWI745862B publication Critical patent/TWI745862B/zh

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/004Arrangements for detecting or preventing errors in the information received by using forward error control
    • H04L1/0041Arrangements at the transmitter end
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0324Details of processing therefor
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M13/00Coding, decoding or code conversion, for error detection or error correction; Coding theory basic assumptions; Coding bounds; Error probability evaluation methods; Channel models; Simulation or testing of codes
    • H03M13/03Error detection or forward error correction by redundancy in data representation, i.e. code words containing more digits than the source words
    • H03M13/05Error detection or forward error correction by redundancy in data representation, i.e. code words containing more digits than the source words using block codes, i.e. a predetermined number of check bits joined to a predetermined number of information bits
    • H03M13/07Arithmetic codes
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M13/00Coding, decoding or code conversion, for error detection or error correction; Coding theory basic assumptions; Coding bounds; Error probability evaluation methods; Channel models; Simulation or testing of codes
    • H03M13/03Error detection or forward error correction by redundancy in data representation, i.e. code words containing more digits than the source words
    • H03M13/05Error detection or forward error correction by redundancy in data representation, i.e. code words containing more digits than the source words using block codes, i.e. a predetermined number of check bits joined to a predetermined number of information bits
    • H03M13/13Linear codes
    • H03M13/15Cyclic codes, i.e. cyclic shifts of codewords produce other codewords, e.g. codes defined by a generator polynomial, Bose-Chaudhuri-Hocquenghem [BCH] codes
    • H03M13/151Cyclic codes, i.e. cyclic shifts of codewords produce other codewords, e.g. codes defined by a generator polynomial, Bose-Chaudhuri-Hocquenghem [BCH] codes using error location or error correction polynomials
    • H03M13/1515Reed-Solomon codes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B17/00Monitoring; Testing
    • H04B17/30Monitoring; Testing of propagation channels
    • H04B17/309Measuring or estimating channel quality parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/0001Systems modifying transmission characteristics according to link quality, e.g. power backoff
    • H04L1/0009Systems modifying transmission characteristics according to link quality, e.g. power backoff by adapting the channel coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/0001Systems modifying transmission characteristics according to link quality, e.g. power backoff
    • H04L1/0023Systems modifying transmission characteristics according to link quality, e.g. power backoff characterised by the signalling
    • H04L1/0032Without explicit signalling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/004Arrangements for detecting or preventing errors in the information received by using forward error control
    • H04L1/0041Arrangements at the transmitter end
    • H04L1/0042Encoding specially adapted to other signal generation operation, e.g. in order to reduce transmit distortions, jitter, or to improve signal shape
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/004Arrangements for detecting or preventing errors in the information received by using forward error control
    • H04L1/0045Arrangements at the receiver end
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/004Arrangements for detecting or preventing errors in the information received by using forward error control
    • H04L1/0045Arrangements at the receiver end
    • H04L1/0046Code rate detection or code type detection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/004Arrangements for detecting or preventing errors in the information received by using forward error control
    • H04L1/0045Arrangements at the receiver end
    • H04L1/0047Decoding adapted to other signal detection operation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/004Arrangements for detecting or preventing errors in the information received by using forward error control
    • H04L1/0056Systems characterized by the type of code used
    • H04L1/0057Block codes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/0078Avoidance of errors by organising the transmitted data in a format specifically designed to deal with errors, e.g. location
    • H04L1/0083Formatting with frames or packets; Protocol or part of protocol for error control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/0078Avoidance of errors by organising the transmitted data in a format specifically designed to deal with errors, e.g. location
    • H04L1/0084Formats for payload data
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/08Arrangements for detecting or preventing errors in the information received by repeating transmission, e.g. Verdan system

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Pure & Applied Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Electromagnetism (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Error Detection And Correction (AREA)
  • Detection And Prevention Of Errors In Transmission (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Alarm Systems (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Color Television Systems (AREA)

Abstract

一種用於使用一音訊訊框之經編碼音訊資料產生一誤差防護訊框之音訊發送器處理器,該音訊訊框之該經編碼音訊資料包含一第一量之資訊單元及一第二量之資訊單元,該音訊發送器處理器包含:一訊框建構器,其用於建構具有定義一預定義總數目之碼字之參考位置之一碼字光柵的一碼字訊框,其中該訊框建構器經組配以寫入該第一量之資訊單元中起始於該等碼字之一第一預定義子集之參考位置處之該等資訊單元;及寫入該第二量之資訊單元中起始於該等碼字之一第二預定義子集之參考位置處之該等資訊單元,其中該訊框建構器經組配以判定該第一量之資訊單元與該第二量之資訊單元之間的一邊界,使得該第二量之資訊單元中之一起始資訊單元與一碼字邊界重合;及一誤差保護寫碼器,其用於處理該等碼字之該第一預定義子集中之該等碼字中之一或多者以獲得一第一處理結果或用於處理該等碼字之該第二預定義子集中之該等碼字中之一或多者以獲得一第二處理結果並用於將該第一處理結果或該第二處理結果與該預定義數目之碼字相加以獲得表示該誤差防護訊框之多個經處理碼字,或用於單獨地處理該等碼字之該第一預定義子集或該等碼字之該第二預定義子集中的該等碼字以獲得表示該誤差防護訊框之多個經處理碼字。

Description

音訊發送器處理器、音訊接收器處理器及相關方法與電腦程式
發明領域
本發明係關於音訊處理,且特定言之,係關於適用於諸如無線通道之易錯發送通道之上下文中之音訊處理應用程式。
發明背景
美國專利5,852,469揭示動畫寫碼及/或解碼系統及可變長度寫碼及/或解碼系統。編碼器具有用於分割自編碼器提供至多個碼字串中之碼流之分割器及用於自頭部至末尾在正向方向上配置該等多個碼字串中之至少一者及自末尾至頭部在後向方向上配置其他碼字串中之至少一者的記錄器。可變長度寫碼系統包括用於儲存多個碼字使得碼字對應於源符號之碼字表。且編碼器選擇對應於來自碼字表之源符號輸入的碼字且用於輸出所選碼字以作為寫碼資料。該等多個碼字可按前向及後向方向中之任一者經解碼。該等多個碼字經組配使得可藉由碼字之預定權重(在二進位碼情況下)、碼字中「1」或「0」之數目來偵測程式碼之間的停頓。
EP 1155498 B1揭示用於產生或讀取包含多個光柵點以作為參考點之資料串流之概念,其中第一集合中每一碼字之至少一部分起始於區段之光柵點處在第一寫入方向上寫入,且碼字之第二集合中一碼字之至少一部分自區段之第二光柵點開始在與第一寫入方向相反的第二寫入方向上寫入至資料串流中。在第二集合之碼字並未或未完全擬合至區段中的情況下,根據預定規則將並未擬合至經指派區段中的此碼字之至少一部分或此碼字之剩餘部分之一部分寫入至不同的未完全佔據的區段中。
此程序確保誤差傳播限於二個光柵點之間的空間。
MPEG-4第3部分音訊[1]定義使用位元分片算術寫碼之BSAC,其中心理聲學相關性在音訊訊框內線性地降低。
MPEG-4第3部分音訊[1]定義對於AAC之位元流有效負載之誤差敏感度類別([1]中之表4.94):
類別 有效負載 必選 導致/可導致一個例項/ 描述
0 主要 CPE/立體層 常用旁側資訊
1 主要 ICS 通道相依性旁側資訊
2 主要 ICS 誤差恢復縮放因數資料
3 主要 ICS TNS資料
4 主要 ICS 頻譜資料
5 擴展 EPL 擴展類型/資料元素版本
6 擴展 EPL DRC資料
7 擴展 EPL 位元填充
8 擴展 EPL ANC資料
9 擴展 EPL SBR資料
相關資料隨後儲存於對應誤差敏感度種類之例項中以形成ER AAC有效負載,其隨後可單獨地使用前向誤差校正或偵測手段來保護。將資料元素固定歸於各類別經指定。由於熵寫碼,這導致具有可變長度之種類。需要發送彼等長度以允許ER AAC有效負載之解碼,這會產生額外開銷。
DRM[2]定義AAC之位元流有效負載之超訊框以允許不相等誤差保護(aac_super_frame)。超訊框由預定義數目(5或10)個AAC訊框組成。假定AAC訊框之在心理聲學上較重要位元可用於位元流有效負載之開始處。因此,前N個位元(例如,200個位元)自每一訊框分出且連續儲存在超訊框之開始處。彼等位元隨後受CRC保護。彼等訊框之剩餘位元隨後在無保護之情況下經儲存。由於固定量之資料始終被視為敏感的,因此不需要發送長度資訊來解碼受保護有效負載(當然,需要超訊框中之個別訊框之長度資訊,但這不在當前考慮範疇內)。
藉由如MPEG-4第3部分音訊所描述之BSAC產生之訊框已經藉由心理聲學相關性排序;其以最重要位元開始且以最不重要位元結束。此係由於頻譜線之所有位元之算術編碼/解碼的較高計算複雜度。
由於用於如MPEG-4第3部分中所描述之AAC之方法之性質,各種誤差敏感度類別之例項具有可變長度。這對於迴旋程式碼不成問題,但對於需要固定量之資料受保護之區塊程式碼而言為不適合的。
DRM方法僅在位元流有效負載已經基於個別位元之心理聲學重要性配置時起作用。
發明概要
本發明之一目標為提供一種用於產生誤差防護訊框或用於處理所接收誤差防護訊框之經改良且仍然高效的概念。
此目標藉由如請求項1之音訊發送器處理器、如請求項23之音訊接收器處理器、如請求項44之音訊發送處理之方法、如請求項45之音訊接收處理之方法,或如請求項46之電腦程式實現。
一種用於產生誤差防護訊框之音訊發送器處理器使用對應於音訊訊框之經編碼音訊資料,其中此經編碼音訊資料包含諸如位元或位元組之第一量之資訊單元及第二量之資訊單元。訊框建構器建構具有定義預定義總數目之碼字之參考位置之碼字光柵的訊框,其中該訊框建構器經組配以寫入該第一量之資訊單元中起始於碼字之第一預定義子集之參考位置處之資訊單元並寫入該第二量之資訊單元中起始於碼字之第二預定義子集之參考位置之資訊單元,其中該訊框建構器判定該第一量之資訊單元與該第二量之資訊單元之間的邊界,使得該第二量之資訊單元中之起始資訊單元與碼字邊界重合。音訊發送器處理器具有誤差保護寫碼器,其用於單獨地處理預定義總數目之碼字以獲得表示誤差防護訊框之多個經處理碼字及/或用於處理第一預定義子集中之碼字中之一或多者以獲得第一處理結果及/或用於處理第二預定義子集中之碼字中之一或多者以獲得第二處理結果以及用於將第一處理結果或第二處理結果與預定義數目之碼字相加以獲得該等多個經處理碼字。
在接收器側,一種用於處理所接收誤差防護訊框之音訊接收器處理器包含用於接收誤差防護訊框之接收器介面。該音訊接收器處理器包含用於處理該誤差防護訊框以獲得經編碼音訊訊框之誤差保護處理器。特定言之,該誤差保護處理器經組配以檢查經編碼音訊訊框之碼字之第一預定義子集是否包含誤差。該音訊接收器處理器包含誤差隱匿器或誤差隱匿指示器,其經組配以在碼字之第一預定義子集中偵測到誤差之情況下執行(全)訊框丟失隱匿操作或產生及轉遞指示在遠端地點處進行訊框丟失隱匿操作之誤差隱匿指示。
由於一方面碼字之第一預定義子集及另一方面碼字之第二預定義子集之獨立處理且在接收器側藉由使用關於碼字之第一預定義子集之資訊,獲得對於誤差防護訊框之產生之極其高效處理及對於誤差檢查之處理,由於第一集合中碼字之預定義子集經預定義,且因此,解碼器已知不具有任何特定額外發信,諸如大概每一訊框之發信位元。這並非必需的;替代地,由於編碼器使用第一碼字之預定義子集以用於寫入第一量之資訊單元且由於接收器或音訊接收器處理器依賴於此預定義,因此一方面提供高效誤差保護且另一方面提供高效誤差檢查。
較佳地,接收側之誤差保護處理允許對碼字之第一子集中之二者或多於二著而非來自第二集合之任何碼字進行諸如散列值之處理結果之單獨計算,且同時,僅自碼字之第二預定義子集中之碼字計算散列值而無需來自第一集合之任何碼字允許解碼器側之高效誤差檢查處理,由於僅某一量而非所有碼字必須用於散列驗證。在接收器處理的極早期,可判定訊框中是否出現嚴重誤差,使得最終產生全訊框丟失隱匿操作之要求,或是否僅相對較不重要音訊資料已經受到發送誤差影響,使得對於此類型誤差之定址僅需要品質高得多的部分訊框丟失隱匿操作或根本不需要隱匿操作。
由於本發明經由特定訊框建構操作在一方面音訊編碼與另一方面誤差保護處理之間形成橋樑,極其高效且極其高品質且智慧型誤差處理程序由於對具有第一量之資料之碼字之第一預定義子集及具有第二量之資料之碼字之第二預定義子集的單獨誤差保護處理可應用於解碼器側。較佳地,第一量之資料為在心理聲學上較重要之資料或為旁側資訊及任擇的TNS資料及較低頻譜值之最高與最低有效位元,而第二量之資料通常包含較高頻率之最高與最低有效位元,其自心理聲學視角對於音訊感知並非決定性的。通常處於第二量之資訊單元中之其他資訊單元為殘餘資料,其在算術編碼器之位元消耗尚未完全消耗可用位元預算的條件下產生。
特定言之,將第一量之資訊單元及第二量之資訊單元寫入至第一與第二預定義子集中(其中第一量之資訊單元與第二量之資訊單元之間的邊界置於碼字邊界處)確保在相較於諸如碼字之第二預定義子集的較不重要之碼字較重要之碼字(亦即,碼字之第一預定義子集)之間發現明顯間隔。在藉由音訊寫碼器施加之寫碼操作為信號相依性寫碼操作(其對於藉由控制寫碼操作並藉由計算額外殘餘位元經調適成固定訊框光柵之訊框,最終產生音訊資料之可變長度結果)之情境下,舉例而言,第一量之資訊單元與第二量之資訊單元之間的邊界在訊框之間動態地改變。儘管如此,諸如低頻資料之在心理聲學上較重要之資料包括於第一預定義子集中,且因此,在發送器側,僅檢查碼字之第一預定義子集產生將執行全訊框丟失隱匿之情形,但一旦在接收器側已經判定已經接收到碼字之第一預定義子集而無任何誤差,接著僅將進行另一處理,諸如檢查碼字之第二預定義子集。因此,一旦判定碼字之第一預定義子集具有誤差,就在不耗費任何資源之情況下執行全訊框丟失隱匿操作,諸如先前訊框之重複或前一訊框或任何類似訊框之修改重複以供進一步處理所接收錯誤訊框。
接收器處理器包含訊框讀取器,其用於根據識別碼字之第一預定義子集及碼字之第二預定義子集的預定義訊框讀取程序而讀取經編碼音訊訊框。已經藉由編碼器側訊框建構器施加之任何音訊資料處理的次序可撤消/重新配置或對於直接讀取程序為解碼器所已知,使得當對於此第一預定義子集及甚至對於第二預定義子集已經偵測到無誤差情況時,在第二預定義子集之無誤差情況亦已經判定之情況下,解碼器可至少相對於第一預定義子集剖析所接收訊框。
通常僅必須在判定碼字之第一預定義子集之無誤差情形之後激活訊框讀取器。誤差保護處理器僅必須知曉藉由誤差保護處理器輸出之資料訊框中碼字之第一預定義子集之部位,但出於誤差檢查的目的,不必知曉已經在哪些方向上將任何資料寫入至由碼字表示之對應位置中。
較佳地,在心理聲學上較不重要之資料位於訊框中可在訊框之左邊界處或訊框之右邊界處之特定位置處或位於訊框內預定義數目之碼字/參考位置處。需要分離在心理聲學上較重要之資料與在心理聲學上較不重要之資料或需要在音訊訊框內重新配置在心理聲學上較重要之資料及在心理聲學上較不重要之資料。
舉例而言,當藉由尚未經定製以與某一誤差保護處理器協作之預定義及標準化音訊解碼器產生經編碼音訊資料之訊框時,重新配置必需使該資料與給定誤差保護及偵測方案一致。此重新配置允許取決於在心理聲學上較重要資料及在心理聲學上較不重要資料之可用性的個別訊框丟失隱匿程序。
較佳實施例之詳細說明
隨後,論述本發明在某些上下文中之較佳實施。
位元在編碼程序期間基於其心理聲學相關性按時間順序而非空間順序寫入。首先寫入最重要資料,最後寫入最不重要資料。然而,「正常」音訊訊框內在心理聲學上較不重要位元之位置可取決於基礎寫碼資料在訊框之間有所不同。此可例如由於自二側將資料寫入至訊框中,而同時自一側寫入算術寫碼資料且自另一側寫入藉由其他方式寫碼之資料。此方法之實例為LC3編解碼器。
設想具有二個種類之位元之系統。將位元流有效負載細分為二個種類係基於其相對於輸出之相關性來進行: • 將在心理聲學上較不重要-其失真允許部分訊框丟失隱匿之位元歸於一類; • 將在心理聲學上較重要-其變形需要全訊框丟失隱匿之位元歸於另一類。
進行此操作的原因為取決於二個種類之可用性,設想不同隱匿策略。彼等二個不同的隱匿策略隨後被稱為全訊框丟失隱匿及部分訊框丟失隱匿: • 若涵蓋在心理聲學上較重要位元之類別丟失,則發生全訊框丟失隱匿。涵蓋在心理聲學上較不重要位元之類別之可用性並不重要-其資料未經評估。在該情況下,當前訊框之資料不可用,因此完全基於所接收之最末訊框合成訊框。 • 若涵蓋在心理聲學上較重要位元之類別可用,但涵蓋在心理聲學上較不重要資料之類別丟失,則可發生部分訊框丟失隱匿。在該情況下,在心理聲學上較重要資料可用且可用以重構訊框-僅在心理聲學上較不重要資料需要基於完整接收之最末訊框合成。在許多情形下,部分訊框丟失隱匿意欲相較於全訊框丟失隱匿提供較佳品質(亦即較少假影)。
二個種類之大小例如由通道寫碼器預定義。
前向誤差偵測及校正方案較佳地利用里德所羅門碼且按碼字粒度起作用,而每一碼字由多個半位元組(4位元,亦被稱作半八位元組)組成。在當前情況(LC3)下,一個碼字由13至15個半位元組組成。在一較佳實施例中,此類前向誤差偵測及校正方案提供各種程度之誤差偵測及校正,取決於所花費之額外開銷,例如 • 每一碼字4個半位元組之額外開銷允許校正2個半位元組(誤差保護模式3); • 每一碼字6個半位元組之額外開銷允許校正3個半位元組(誤差保護模式4)。
對於給定總體位元率,淨位元率取決於所選誤差保護模式-誤差偵測及校正能力愈高,可用淨位元率愈小。
二個種類均需要個別誤差偵測。考慮到給定通道寫碼組配,較佳地將一類之所有位元儲存至某一數目個碼字中,並將另一類別之所有位元儲存至剩餘數目之碼字中。
將位元流有效負載內之位元細分為各種類使得某一數目個碼字始終包含一類位元,而剩餘數目之碼字包含另一類別之位元。
如之前所陳述,在心理聲學上較不重要位元之位置可取決於基礎寫碼資料在訊框之間有所不同。
然而,目標為使一定量之在心理聲學上較不重要位元經分離以供重新配置(允許結合由通道編解碼器提供之固定碼字大小及位置的個別誤差保護及偵測)。
必須自適應地在逐訊框基礎上進行重新配置。對於此重新配置,不應需要額外旁側資訊(例如,長度資訊)來恢復重新配置或解碼重新配置之位元流有效負載。
位元流有效負載通常經寫入使得寫入及讀取常式可以高效方式實施。心理聲學重要性通常不發揮作用,這會引起位元流有效負載,其中在心理聲學上較不重要位元與在心理聲學上較重要位元經混合。為了在之前提及之給定要求之上下文中允許高效前向誤差保護,此位元流有效負載次佳且需要重新配置。
由於在心理聲學上較不重要位元之位置可取決於基礎寫碼資料在訊框之間有所不同,因此直接映射至固定碼字大小及位置為不可能的。因此,在直接了當的方法中,相關位元重新配置如下: • 在心理聲學上較不重要位元儲存在預分類位元流有效負載之一端。 • 在心理聲學上較重要位元儲存在預分類位元流有效負載之另一端。
基於誤差保護模式及通道-經編碼訊框之大小靜態地導出在心理聲學上較不重要位元之數目。
然而,動態地導出在心理聲學上較不重要位元之部位。自適應重新配置規則經預定義,使得不需要額外旁側資訊來撤銷解碼器側之重新配置。自適應規則確保在心理聲學上最不重要位元始終儲存在位元流之所選側之遠端處,且同時確保解碼器確切地知曉如何恢復原始位元流有效負載。
一方面,此重新配置在「正常」位元流有效負載已經藉由編碼器完全寫入之後可作為後處理步驟進行且在解碼旁側資訊(其從未為重新配置之部分)之後並在剩餘「正常」有效負載藉由解碼器讀取之前可作為預處理步驟進行。
另一方面,此重新配置亦可在編碼程序期間進行,從而直接在適合的位置處寫入經編碼位元;及在解碼程序期間進行,從而直接自適合的位置讀取位元。
應注意,在心理聲學上較不重要位元及在心理聲學上較重要位元至專用碼字之任何指派均為可能的。在心理聲學上較不重要位元至最左碼字之指派及在心理聲學上較重要位元至最右碼字之指派僅為一個較佳實施例。因此,取決於所選指派,重新配置亦可以不同方式進行。唯一前提條件為指派經預定義,使得解碼器可恢復該程序而無需位元流中之額外資訊。
可考慮以下應用情境: 1.應寫入音訊訊框使得在心理聲學上較不重要位元收集於位元流之一端上: a.開始自二側寫入至為較高有效位元提供之區域中。 b.在二個寫入指標彼此會合時終止。 c.繼續自二側寫入至為較低有效位元提供之區域中。 2.音訊訊框以「正常」方式寫入但應經重新配置,使得在心理聲學上較不重要位元收集於位元流之一端上: a.開始自二側讀取及剖析訊框。 b.在為較高有效位元提供之位元之量經讀取時終止:在心理聲學上較不重要位元為二個讀取指標之間的剩餘位元。 c.將直至左邊指標之資料與二個指標之間的資料交換。 3.音訊訊框經寫入使得在心理聲學上較不重要位元收集於位元流之一端上,但應以「正常」方式重新配置: a.開始自二側讀取訊框。若在心理聲學上較不重要位元應儲存在位元流之左側處,則用於自左側讀取在心理聲學上較重要位元之起始點可來源於(意謂:等於)為在心理聲學上較不重要位元提供之位元之數目。若在心理聲學上較不重要位元應儲存在位元流之右側處,則用於自右側讀取在心理聲學上較重要位元之起始點可來源於為在心理聲學上較不重要位元提供之位元之數目及總計位元之數目。 b.在二個寫入指標彼此會合時終止。 c.將直至用於讀取在心理聲學上較重要位元之起始點(參見a.)之資料與此起始點與二個指標之會合點之間的資料交換。 4.音訊訊框經寫入使得在心理聲學上較不重要位元收集於位元流之一端上,應經讀取: a.開始自二側讀取訊框。若在心理聲學上較不重要位元應儲存在位元流之左側處,則用於自左側讀取在心理聲學上較重要位元之起始點可來源於為在心理聲學上較不重要位元提供之位元之數目。若在心理聲學上較不重要位元應儲存在位元流之右側處,則用於自右側讀取在心理聲學上較重要位元之起始點可來源於為在心理聲學上較不重要位元提供之位元之數目及總計位元之數目。 b.在二個寫入指標彼此會合時終止。 c.繼續自二側讀取訊框之剩餘部分。用於自右側讀取在心理聲學上較不重要位元之起始點與用於自左側讀取在心理聲學上較重要位元之起始點(參見a.)相同。
圖5說明根據本發明之一較佳實施例的音訊發送器處理器。音訊發送器處理器較佳包含訊框建構器506及誤差保護寫碼器508。
至音訊發送器處理器中之輸入為一定量的經編碼音訊資料,諸如來源於輸入至音訊編碼器500 (其通常為可變長度音訊編碼器)中之音訊資料之訊框的音訊資料。音訊編碼器所需的位元量取決於待編碼信號,但在較佳實施中,通常呈經編碼音訊資料之訊框形式的音訊資料之輸出為固定長度訊框。因此,音訊編碼器通常按可變品質進行編碼,使得難以編碼之待編碼音訊資料之訊框最終在經編碼音訊資料中由較低品質表示來表示,而易於編碼之待編碼音訊資料之訊框(亦即對於某一品質位準可編碼具有較低數目之位元)最終在音訊編碼器500之輸出處由較高品質表示來表示。
通常,對於音訊資料之某一(例如時域)部分之音訊編碼器之輸出包含第一量之資訊單元及第二量之資訊單元。在50%重疊相加情形之情況下,時域部分之大小為訊框大小(亦即新近輸入至編碼器中或藉由解碼器之重疊相加階段輸出之音訊樣本之數目)之二倍。
圖5中之訊框建構器506 (其可例如包含重新配置器502及隨後連接之訊框寫入器504或可在不存在任何中間表示問題之情況下例如僅由訊框寫入器組成)經組配以用於建構具有定義訊框之一總數目之預定義碼字之參考位置的碼字光柵的訊框。舉例而言,關於圖9a、圖9b、圖9c說明此訊框,其中給定不同碼字配置,且其中例如預定義碼字之參考位置指示為豎直線且彼等參考位置為碼字的起始或碼字的結束或這二者。此等參考位置或光柵點並不需要任何特定資訊單元但由一些資料寫入至的某一位元或位元組位置給定。因此,參考位置或光柵點並不引發任何額外開銷且通常標記用於誤差保護處理器之碼字之起始或結束。
根據本發明,訊框建構器經組配以寫入第一量之資訊單元中起始於碼字之第一預定義子集之參考位置處的資訊單元。
寫入該第二量之資訊單元中起始於碼字之第二預定義子集之參考位置處之資訊單元。特定言之,訊框建構器506經組配以判定該第一量之資訊單元與該第二量之資訊單元之間的邊界,使得該第二量之資訊單元中之起始資訊單元與碼字邊界重合。因此,獲得第一量之資訊單元與第二量之資訊單元之間的明顯間隔及一方面對發送器側及另一方面對接收器側之對應相關聯誤差保護程序。
音訊發送器處理器另外包含誤差保護寫碼器508,其用於單獨地處理預定義數目之碼字以獲得表示誤差防護訊框之多個經處理碼字。對於此程序,誤差保護寫碼器可包含熵相加或區塊編碼器,諸如里德所羅門編碼器。替代地或另外,誤差保護寫碼器可包含另一非碼字單獨處理裝置,諸如CRC或散列值處理器,其處理第一預定義子集中碼字中之一或多者以獲得諸如第一散列值之第一處理結果或處理第二預定義子集中碼字中之一或多者以獲得諸如第二散列值之第二處理結果且用於將處理結果或第一及第二處理結果中之一者與預定義數目之碼字相加以獲得該等多個經處理碼字。第一處理結果僅來源於第一預定義子集且第二處理結果僅來源於第二預定義子集。較佳地,誤差保護處理之次序使得自尚未經受任何誤差冗餘處理之碼字,諸如在至里德所羅門或任何其他誤差保護區塊編碼器中之輸入處的碼字計算第一及第二處理結果。較佳地,將第一及第二處理結果與呈單獨額外碼字或至第一或第二集合內仍然可用之空的空間的碼字之第一與第二預定義集合以及碼字與處理結果(諸如受里德所羅門編碼器處理器保護的散列值)相加。
將藉由圖5之誤差保護寫碼器508獲得之誤差防護訊框轉遞至較佳無線發送器,諸如符合數位增強無線電話(DECT)標準之裝置。因此,此發送器510將誤差防護訊框發送出至(無線)易錯通道中。
較佳地,訊框建構器506經組配以基於該第二預定子集之資訊容量而判定該第一量之資訊單元與該第二量之資訊單元之間的邊界,使得該第二預定子集之該資訊容量等於該第二量之資訊單元中資訊單元之量。一旦訊框寫入器504已寫入等於全訊框之資料之總量且小於第二預定義子集之容量的量的資料,第一量之資料之音訊訊框完成且第二量之資料起始於碼字之第二預定義子集中碼字之起始處。
用於產生第一與第二量之資訊單元之音訊編碼器500或源編碼器依賴於逐訊框處理且使用音訊信號之預定義時間部分。資訊單元包含義務資訊單元之集合,諸如藉由算術編碼器或一般而言可變長度編碼器產生之資料。資訊單元具有提供音訊信號之時間部分之改良品質表示的可變數目之殘餘資訊單元,且在算術編碼器尚未完成位元預算時將此資料寫入至位元流中。源編碼器500經組配以用於使用可變長度寫碼規則,從而針對預定義時間部分產生信號相依性數目之資訊單元。訊框建構器經組配以建構經編碼音訊訊框,使得經編碼音訊訊框在經編碼資訊單元中具有固定大小,且音訊編碼器500經組配以將可變數目之殘餘資訊單元判定為預定義訊框大小與義務位元之數目之間的差。
較佳地,訊框建構器504經組配以在訊框之間信號自適應地判定第一量之資訊單元與第二量之資訊單元之間的邊界,使得取決於訊框之音訊信號,該邊界表示與訊框之不同音訊資訊相關或藉由音訊解碼器以不同方式解譯之邊界資訊單元。較佳地,該邊界資訊單元係指且表示譜域音訊寫碼器中之某一頻譜值或頻譜值之某一組合,如音訊編碼器500內較佳地所使用且稍後將針對編碼器關於圖21論述並針對解碼器關於圖22論述。
在本發明之較佳實施中,訊框寫入器504或一般而言訊框建構器506經組配以將第一量之資訊單元寫入至在圖6中之600處經識別之第一預定義子集中。在步驟601中,一旦以資訊單元填充第一子集,判定第一與第二量之資訊單元之間的邊界。如項目602中所指示,將第二量之資訊單元寫入至碼字之第二預定義子集中。
較佳地,如圖7中所說明,碼字之第一預定義子集具有一碼字次序及指定參考位置。碼字之第二預定義子集同樣如此,亦較佳地具有一碼字次序及參考位置。
圖9a說明在碼字之訊框內配置碼字之預定義子集之第一可能性。在圖9a實施例中,碼字之第一子集為碼字4、5、6、7且碼字之第二子集為碼字1、2、3。
接收第二量之資訊單元(其較佳地為在心理聲學上較不重要音訊資料)之碼字之第二子集中之碼字均定位成彼此鄰近且在訊框起始位置處。接收第一量之資訊單元(其較佳地為在心理聲學上較重要音訊資料)之碼字之第一子集中之碼字均定位成彼此鄰近且在訊框結束位置處。
碼字之第一預定義子集藉由訊框中之第四碼字及自碼字4至碼字5、自碼字5至碼字6及自碼字6至碼字7之碼字之次序或序列預定義。第一預定義子集針對寫入方向識別碼字及碼字之次序。訊框建構器經組配以在較佳實施例中寫入碼字之第一子集,亦即起始於碼字之參考位置處之如由箭頭指示之碼字4、5、6、7。自左至右之寫入操作起始於作為參考位置之第四碼字之起始處且在相反方向上之寫入起始於作為參考位置之第七碼字之結束處,亦即訊框結束位置處。第二預定義子集亦針對寫入方向對應地識別碼字及碼字之次序。
碼字之第二子集藉由訊框中之第一碼字及自第一碼字至第二碼字及自第二碼字至第三碼字之次序或序列預定義。在碼字或子集均彼此鄰近之情況下,次序或序列資訊隱含地藉由寫入或讀取方向給定。同樣,在自左至右之左側方向上之寫入在第一碼字之訊框起始位置處且自第二子集之右端,亦即自碼字3之寫入在該方向上自第三碼字之末端起始直至訊框起始位置。
自然地,第一子集及第二子集中碼字之數目可自由選擇,且第二子集中碼字之數目愈高,全訊框丟失隱匿之必要性愈低。然而,必須確保第一子集中碼字之數目足夠大以使得可在第二子集中之所有碼字或例如第二子集之圖9a實施例中之碼字1及3如可由圖13中所說明的音訊接收器處理器偵測為錯誤的時,進行具有可接受品質之部分訊框丟失隱匿。
圖9b說明第一預定義子集及第二預定義子集之替代實施。同樣,二個子集定義彼此鄰近之碼字,但第一預定義子集現與訊框起始位置對準且碼字之第二預定義子集現與訊框結束位置對準。
圖9c說明另一替代方案,其中第一子集與第二子集配置成彼此不鄰近,亦即第二子集中之一碼字(亦即碼字2)穿插於二個碼字,亦即第一預定義子集之碼字1與碼字3之間。圖9c同樣指示個別碼字之寫入方向,且顯而易見,舉例而言,自二側寫入碼字編號5,且當情況如此時,用於寫入碼字之第二子集之寫入指標將在碼字編號5內之某一地點處彼此會合。
在圖9a至圖9c之實施例中,碼字表示上方之箭頭指示隨後關於圖8論述的在應用二個寫入指標之較佳實施時的寫入方向。特定言之,如關於圖9a至圖9c所論述,訊框建構器5經組配以在經編碼音訊資料之訊框之一側處使用預定義數目之鄰近碼字以作為碼字之第二子集,如例如圖9a中所說明;或在經編碼音訊資料之訊框之另一側處使用第一預定義數目之鄰近碼字以作為碼字之第一子集,如例如關於圖9a或圖9b所說明,其中碼字之第一預定義數目與碼字之第二預定義數目之總和等於碼字之總計預定義數目。替代地,如圖9c中所說明,第一子集中之至少一個碼字位於第二子集中之二個碼字之間,或反之亦然。
較佳地,訊框建構器506經組配以使用碼字之第一子集之參考位置將第一量之資訊單元寫入至第一預定義子集中,且一旦第一預定義子集經填充,就在第二預定義子集之參考位置處寫入第二量之資訊單元,且訊框建構器506經組配以將邊界判定為寫入至第一預定義子集中之最末碼字中的最末資訊單元或寫入於第二預定義子集中之第一碼字之參考位置處的第一資訊單元。較佳地,第一及第二量之資訊單元經選擇,以此方式使得第一量之資訊單元中之所有或至少大多數資訊單元相較於第二量之資訊單元中之大多數或所有資訊單元在心理聲學上較重要。
替代地或另外,且如關於發送器側所論述,當僅第二量之資訊單元中之資訊單元經偵測為損壞的時,僅在音訊接收器處理器中設想部分訊框丟失隱匿,且其中當第一量之資訊單元中之資訊單元被判定為損壞的時,在音訊接收器處理器中設想全訊框丟失隱匿。
如隨後關於圖1或圖2所論述,經編碼資訊單元來自選自由以下各者組成的類別群組的至少二個類別:固定長度旁側資訊、可變長度旁側資訊、時間雜訊塑形資訊、頻譜之第一頻率部分之一或多個最高有效位元、頻譜之第二頻率部分之一或多個最高有效位元(其中第二頻率部分高於第一頻率部分)、第一頻率部分之一或多個最低有效位元或正負號位元、第二頻率部分之一或多個最低有效位元或正負號位元,以及殘餘位元,其中若由音訊編碼器產生,則將固定長度旁側資訊、可變長度旁側資訊、時間雜訊塑形資訊、頻譜中第一頻率部分之該一或多個最高有效位元及第一頻率部分之該一或多個最低有效位元或正負號位元用作用於第一量之資訊單元之類別,且其中將第二頻率部分之最高有效位元、第二頻率部分之該一或多個最低有效位元或正負號資訊單元,或殘餘位元用作用於第二量之資訊單元之類別。
在圖8中所說明的一較佳實施例中,使用二個寫入指標810、812。第一寫入指標810經組配以按第一寫入方向操作及寫入,且第二寫入指標812經組配以按第二寫入方向操作及寫入,該第二寫入方向與第一寫入方向相反。用於第一寫入指標之資料係藉由第一經控制輸入獲得且例如獲取自輸入緩衝器802,其中存在任何可想像形式之音訊編碼器輸出資料或其中存在所指定中間格式,諸如標準化格式,例如針對LC3 (低複雜度通信編解碼器)音訊編碼器關於圖1所論述。
在第一實例情況下,輸入緩衝器中之資料直接來自編碼器。在此情況下,將資料視為來自編碼器。在此第一實例情況之實例中,編碼器在第一經控制輸入804中針對譜線或譜條元組寫入LSB及正負號並在第二經控制輸入806中針對此同一譜條或譜線元組寫入MSB。
在第二實例情況下,資料源於已經寫入之訊框。接著,控制器應用位元流或訊框剖析器讀取位元流或訊框並將資料按讀取/剖析次序提供至經控制輸入。在此第二實例情況之實例中,剖析器針對譜線或譜線元組讀取LSB及正負號並將此資料提供至第一經控制輸入804中且剖析器針對此同一譜線或譜線元組讀取MSB並將此資料提供至第二經控制輸入806中。
存在第二經控制輸入806,其亦存取輸入緩衝器802且將資料提供至經組配以按第二(相反)方向寫入之第二寫入指標812。控制器800經組配以至少控制第一寫入指標810與第二寫入指標812且較佳地另外控制輸入804、806。控制器接收第二集合中碼字之數目或對應地較不重要資訊單元之數目,亦即碼字之第二預定義子集中碼字之容量以作為輸入。控制器較佳地具有關於預定義第一與第二子集及相關聯次序之所儲存資訊,亦即關於訊框中之碼字數目/位置及/或各別子集之碼字次序之資訊。
控制器800控制該等輸入804、806。控制器另外針對第一量之資訊單元將第一與第二指標設定至訊框中之起始位置/位址。指標810遞增而指標812同步地遞減。
控制器800偵測到第一子集中之所有碼字均被寫入至輸出緩衝器中且控制器針對第二量之資訊單元設定第一與第二指標之起始位置/位址,且隨後同步地遞增/遞減寫入指標以便另外執行第二量之資訊單元之寫入。較佳地,藉由該控制器800進行之程序之次序如圖8中所指示但亦可執行不同次序。然而,基於何時寫入第一量之資訊單元判定第二量之資訊單元的起始為在訊框之間判定第一與第二量之資訊單元之自動且低效且複雜度較低的方式,即使音訊編碼器正以音訊信號相依性方式操作。
訊框建構器存在若干應用,如關於圖10及圖11所論述。特定言之,圖10說明執行直寫時的程序。在步驟100中,訊框建構器自音訊編碼器接收經編碼音訊資料並判定碼字之第一預定義子集。自二側寫入且在寫入指標彼此會合時終止寫入,如項目101處所指示。繼續寫入至碼字之第二預定義子集中直至寫入所有資訊單元。特定言之,如102處所指示,繼續針對第二預定義子集在訊框之起始或結束處至少相對於一個寫入指標進行寫入。
訊框建構器亦可用於重新配置已經存在之位元流,諸如LC3位元流格式。在此程序中,經編碼音訊訊框以指定/標準化中間格式存在,其中舉例而言,第一集合之所有碼字或第二集合之所有碼字在最後重新配置訊框之左側或右側處定位成彼此鄰近。
在步驟200中,判定第一預定義子集。在步驟202中,自二側讀取及剖析中間格式。在步驟204中,當第一預定義子集中資訊單元之容量經讀取時,終止讀取及剖析。在步驟206中,在例如稍後將詳細論述的圖3中所說明的特定實施例中,藉由交換直至左側指標之資料與指標之間的資料來寫入訊框。在步驟206中僅進行圖11實施例中之寫入操作,由於步驟202至204僅提及讀取及剖析及進行其他程序。寫入不一定必須為遞增或遞減寫入,如關於圖10所論述之直寫,但藉由交換某些連續量之資訊單元來進行寫入。
圖12說明圖5中所說明的誤差保護寫碼器508之較佳實施。在第一步驟210中,誤差保護處理器508僅自碼字之第一預定義子集計算第一散列值而無需來自碼字之第二子集之任何碼字。在步驟212中,僅自第二預定義子集計算出第二散列值,亦即無需來自第一預定義子集之任何碼字。
在步驟214中,將第一及第二散列值添加至訊框之子集,如214處所指示。在步驟216中,對子集及散列值執行諸如里德所羅門寫碼之區塊寫碼以便獲得誤差防護訊框,其被轉遞至較佳無線發送器510 (例如符合DECT之發送器)。
圖21說明諸如音訊編碼器500之典型音訊編碼器或源編碼器,但音訊編碼器500亦可由任何其他音訊編碼器實施,任何其他音訊編碼器以可變長度方式操作,亦即針對音訊信號之時間部分產生一定量的位元,當品質保持相同時,該量在訊框之間有所不同。
將音訊信號輸入至分析開窗程式52中,該分析開窗程式較佳地以重疊方式操作,亦即具有低於窗口之時間長度的時間提前值。此資料為訊框之(經開窗)時間部分且被輸入至較佳地實施為修改型離散餘弦變換(MDCT)的時間-頻率變換54中。
在區塊56中,執行由對頻率之預測組成的任擇的時間雜訊塑形操作。TNS階段56之輸出為預測殘餘值,且另外,TNS旁側資訊較佳地輸出至熵寫碼器60 (其為可變長度熵寫碼器,諸如算術寫碼器)中。MDCT輸出頻譜值或TNS頻譜殘餘值經量化器58量化使得可或可不以心理聲學方式控制,且將經量化資料輸入至諸如算術寫碼器之可變長度熵寫碼器。音訊編碼器另外包含用於產生殘餘位元之殘餘寫碼器,該等殘餘位元為必要的以便在可變長度熵寫碼器並未完全消耗可用位元預算時藉由額外位元填充訊框。可使用或可不使用之其他特徵為雜訊填充、全域增益應用或頻譜雜訊塑形。在區塊60之輸出處,位元流多工器經配置以自區塊60接收資料,其可為MSB、LSB及正負號以及其他資料。
在圖22中所說明的解碼器側,可變長度熵解碼器在此,其同樣為例如算術解碼器。將可變長度熵解碼器之結果輸入至反量化器74中且當TNS處理可用時或當未執行TNS時由逆TNS處理器處理反量化器74之輸出,將反量化器74之輸出轉遞至逆頻率-時間變換,其例如可為逆MDCT變換,如圖22中之78處所指示。將區塊78之輸出轉遞至合成開窗程式及重疊/相加處理器80,其最後獲得時域經解碼音訊信號。由逆TNS處理器74使用之TNS資料通常來源於位元流且甚至較佳地來源於可變長度熵解碼器,但亦可使用其他方式以便編碼及處理並發送資料。
隨後,關於圖1至圖4論述本發明之較佳實施。此實施例依賴於圖9a中所說明的碼字之第一與第二預定義子集之次序及配置,但同樣亦適用於其他配置。後一實施例給出直至一位元層級之清楚的細節,但當然,特定圖式僅為實施例,且顯然,亦可使用其他詳細圖式/數字。
在此部分內例示性地聚焦於使資料與給定誤差保護及偵測方案一致的重新配置情境,從而允許取決於在心理聲學上較重要資料及在心理聲學上較不重要資料之可用性的個別訊框丟失隱匿程序。
基於LC3位元流有效負載解釋較佳實施例。此位元流有效負載可粗略地細分成以下類別(參見前文): 1.旁側資訊,固定部分(純紅)及可變部分(紅白相間) 2.TNS,經算術編碼(TNSarith ) 3.頻譜之MSB,經算術編碼(MSB Specarith ) 4.頻譜之LSB及正負號(LSB-Sign Spec) 5.殘餘
應注意,頻譜藉助於頻譜元組編碼,而每一元組表示二個後續頻譜線。
箭頭指示寫入及讀取方向。寫入/讀取次序如下: 1.自右向左寫入旁側資訊之固定部分。 2.自右向左寫入旁側資訊之可變部分。 3.自左至右寫入經算術寫碼TNS資料。 4.同步地寫入頻譜之經算術寫碼MSB以及頻譜之LSB及正負號(逐條譜線,自表示最低頻率之譜線開始),而自左至右寫入經算術寫碼MSB且自右向左寫入LSB及正負號(未經算術寫碼)。 5.若彼等二個資料部分之間仍然存在位元,則自右向左寫入殘餘位元。
儘管類別1及2始終被視為在心理聲學上為重要的,但類別3至5一般被視為在心理聲學上較不重要。然而,對於此區域內之所有彼等位元,相關性並非不變的: • 表示殘餘之位元最不重要; • 表示頻譜元組之位元在心理聲學上較不重要,所涵蓋頻譜線表示之頻率較高,亦即 • 表示涵蓋具有較高頻率之頻譜線之頻譜元組的位元較低有效; • 表示涵蓋具有較低頻率之頻譜線之頻譜元組的位元較高有效。
圖1及圖2展示位元基於其心理聲學相關性之分配。紅色指示高相關性;綠色指示低相關性。存在二個過渡階段,且這二者在逐訊框基礎上動態地改變。
位元流中最後寫入之位元為在心理聲學上最不重要之位元。其部位為可變的。可在藉由檢查寫入或讀取(及剖析)位元流時直接判定位置直至剩餘給定數目之待處理為在心理聲學上較不重要之位元。此給定數目涵蓋殘餘及某一數目個頻譜線之位元(MSB以及LSB及正負號)。頻譜之覆蓋範圍開始於表示最高頻率之頻譜線。較不重要位元之給定數目愈高,較高頻率愈低,其在彼等較不重要位元失真時可成功地經解碼。
待處理為在心理聲學上較不重要之碼字之數目
Figure 02_image001
及正被處理為在心理聲學上較不重要之位元之量為調諧參數。較佳地自誤差保護碼之特性判定此調諧參數。對於LC3中之一個實施例,最佳大小已經取決於保護強度(誤差保護模式
Figure 02_image003
)及槽大小
Figure 02_image005
以實驗方式導出以作為誤差保護碼之特性之實例,其指定通道經編碼訊框之大小,亦即以位元組為單位的總體訊框大小。此以下式體現:
Figure 02_image007
圖3給出在重新配置以及指派至由通道編解碼器提供之碼字之前及之後的音訊訊框之實例。其亦展示解碼器側之對經重新配置位元流有效負載之剖析。
在此實例中之總體位元率在10 ms成框下為76800位元/秒,從而產生每一訊框96個位元組。對於此訊框長度,通道編解碼器提供13個碼字:具有7位元組之總體大小之3個碼字及具有7.5位元組之總體大小之10個碼字。在誤差保護模式4 (=3位元組保護額外開銷)下,前向誤差校正(fec)額外開銷為39位元組,從而使得有效負載之57位元組分為具有具有4位元組之淨大小之3個碼字及具有4.5位元組之淨大小之10個碼字。
圖3A展示分離成57位元組封包,從而產生456總計位元[0:455]之一個訊框之位元流有效負載。紅色區塊對應於靜態旁側資訊,而紅色/白色形狀區域對應於動態旁側資訊,其可取決於經寫碼資料在訊框之間有所不同。
被視為較低有效之位元以藍色展示,藉由位元邊界b_left及b_right定界(在給定實例中,b_left = 184,b_right = 315)。此區域與殘餘位元重疊且另外涵蓋自最高頻率開始之自「MSB Specarith 」及自「LSB+Sign Spec」之位元。自「MSB Specarith 」之位元之數目通常高於自「LSB+Sign Spec」之位元之數目,由於相較於編碼LSB及正負號通常消耗每一譜線之較多位元來編碼MSB。
「MSB Specarith 」直至b_left (自左至右寫入,以綠色展示)及「LSB+Sign Spec」直至b_right (自右向左寫入,以白色展示)共同表示直至此點經編碼之自零赫茲直至最高頻率的頻譜元組。若再一個頻譜元組應被視為在心理聲學上較不重要,則至少一個邊界將向外移動;若再一個頻譜元組應被視為在心理聲學上較重要,則至少一個邊界將向內移動。
圖3B展示在重新配置之後的訊框:將藍色部分[184:315]與綠色部分[0:183]交換。應注意,藍色部分之大小可小於、等於或大於綠色部分。
圖3C顯示如輸入至通道編解碼器中之13個碼字之有效負載。
圖3D展示所接收位元流有效負載。其例示性地展示二個失真碼字。
圖3E展示解碼程序。其例示性地展示封裝於二個位元邊界be_bp_left與be_bp_right之間的失真位元。由在此範圍內之位元表示之頻譜元組之頻率區間應藉由部分訊框丟失隱匿合成。
顯然,將位元流有效負載內之位元歸於二個設想種類並不會直接映射至由通道寫碼器提供之碼字。
在給定實例中,將圖3A中b_left與b_right之間的部分[184:315]歸於第二種類,而將其他位元[0:183]及[316:455]歸於第一種類。此處,圖3A中歸於第二種類[184:315]之位元在不增大第二種類之碼字之數目的情況下並不擬合於圖3C中之碼字結構中。第二種類將部分地位於碼字6[184:203]中,完全位於碼字7至9[204:311]中且部分地位於碼字10[312:315]中。因此,如圖3B中所示需要重新配置:現第二種類[0:131]完美地擬合至前四個碼字1至4中。
在給定實例中,4個碼字屬於第二種類且9個碼字屬於第一種類。待儲存於任一種類中之位元之數目受此種類之碼字提供之有效負載位元之量限制。在給定實例中,碼字1至3各自提供4位元組之有效負載,而碼字4至13各自提供4.5位元組之有效負載。這使得 • 對於在心理聲學上較不重要位元,3*4位元組+1*4.5位元組=16.5位元組,且 • 對於在心理聲學上較重要位元,9*4.5位元組=40.5位元組。
儘管在心理聲學上較不重要位元之數目(
Figure 02_image009
)經預定,但邊界(b_left及b_right)之部位在逐訊框基礎上改變。在重新配置之後,彼等位元始終位於同一點處,這使得能夠進行高效通道寫碼。
在編碼器側處,位元流
Figure 02_image011
重新配置如下:
Figure 02_image013
其中
Figure 02_image015
為以位元為單位的訊框之淨大小且
Figure 02_image009
為較低有效位元之數目。
在解碼器側,邊界b_right (其為讀取「1.MSB Specarith 」及「1.LSB+Sign Spec」之二個指標彼此會合處之邊界(參見圖3E))在解碼位元流時判定。在心理聲學上較不重要位元之數目自前向誤差保護組配(誤差保護模式及碼字之數目
Figure 02_image001
)已知。訊框
Figure 02_image017
在解碼器側之重新配置如下進行:
Figure 02_image019
若位元誤差未施加於
Figure 02_image017
訊框上,則
Figure 02_image011
等於
Figure 02_image021
如之前所指示,重新配置可作為後處理步驟或直接在寫入/讀取程序期間進行。
以下參數為靜態的: 1.槽大小
Figure 02_image005
指定以八位元組(位元組)為單位的通道經編碼訊框之大小。在給定實例中,
Figure 02_image023
。 2.
Figure 02_image025
指定用於編碼資料訊框之碼字之數目
Figure 02_image027
在給定實例中,
Figure 02_image029
。 3.參數
Figure 02_image031
,其針對
Figure 02_image033
定義,指定半八位元組(亦即半位元組)中第i碼字之長度且由下式給定:
Figure 02_image035
在給定實例中,
Figure 02_image037
。應注意,在圖3C中以不同方式進行列舉。 4.參數
Figure 02_image039
,其指定誤差保護模式m 下(RS)-碼i 之漢明距離,由下式給定:
Figure 02_image041
其中
Figure 02_image043
。在給定實例中,
Figure 02_image045
。 5.經指派用於在心理聲學上較不重要位元之碼字之數目基於訊框長度及誤差保護模式(參見上文)導出。在給定實例中,
Figure 02_image047
。 6.以半八位元組為單位的部分隱匿區塊之大小可導出為
Figure 02_image049
在給定實例中,
Figure 02_image051
。 7.較不重要位元之數目(block_size)可導出為:
Figure 02_image053
在給定實例中,
Figure 02_image055
。 8.因此,寫入TNS資料之起始點為已知的(自左側起16.5個位元組)。
需要在編碼器側針對每一訊框進行以下操作: 1.自位元流有效負載之右端開始自右向左寫入旁側資訊之固定部分。 2.自旁側資訊之固定部分之左端開始自右向左寫入旁側資訊之可變部分。 3.自位元流有效負載之左端block_size開始自左至右寫入TNS資料。 4.自TNS資料之右端開始自左至右寫入頻譜資料之MSB「1.MSB Specarith 」直至b_left+block_size-1=b_right;以及自旁側資訊之左端開始自右向左寫入頻譜資料之LSB及正負號「1.LSB+Sign Spec」直至b_left+block_size。應注意,b_left及b_right預先並不已知。 5.當讀取「1.MSB Specarith 」及「1.LSB+Sign Spec」之二個指標彼此會合(參見圖3E中之箭頭)時,判定邊界b_left+block_size-1=b_right。 6.繼續自位元流有效負載之左側邊界開始自左至右寫入頻譜資料之MSB「2.MSB Specarith 」;以及繼續自block_size-1開始自右向左寫入頻譜資料之LSB及正負號「2.LSB+Sign Spec」。 7.自頻譜資料之LSB及正負號之左端開始自右向左寫入殘餘。
解碼器側之讀取可類似於編碼器側之所描述寫入進行。
圖3說明寫入或讀取重新配置位元流有效負載之此程序。圖3A展示「正常」位元流有效負載,而圖3B展示重新配置位元流有效負載。如上文所概述,此重新配置位元流有效負載可緊接著經寫入或讀取。替代地,重新配置亦可作為編碼器側之後處理或作為解碼器側之預處理執行。然而,需要針對此重新配置程序如下剖析位元流: • 初始次序à重新配置次序:需要藉由計數待寫入之剩餘位元發現b_left及b_right-到達邊界,若此數目等於block_size。 • 重新配置次序à初始次序:需要藉由觀察讀取「1.MSB Specarith 」及「1.LSB+Sign Spec」之指標發現b_right-到達邊界,當二個指標彼此會合時。
儘管表示在心理聲學上較不重要位元之位元之範圍由通道編解碼器預定,但b_left及b_right可在任意位元位置上。
在一個較佳實施例中,算術編碼器/解碼器按位元組粒度操作。在此實例中,b_left已經降至位元組邊界。此反映於圖3A中,其中b_left=184。
然而,由於基礎通道寫碼器(圖3C)按半位元組(4位元)粒度操作,block_size可並非位元組之倍數且因此b_right可能亦未降至位元組邊界上。在此情況下,將在如上文所描述之重新配置之後出現不匹配。在給定實例中,此不匹配可見於位元組17[128:135]中(圖3E),其中算術解碼器將必須在並非位元組邊界之位元位置132處開始解碼。
為解決此問題,block_size現導出為:
Figure 02_image057
圖4展示關於此實施例之實例,考慮到如圖3中所給定之相同參數。此處,block_size=136位元,亦即b_right現亦在位元組邊界上,從而導致位元位置136處之算術解碼器之起始點變為整數位元組位置17處(圖4E,算術解碼器以解碼TNSarith 開始)。位元組17[132:135]之右側半位元組(藍白相間顯示)現含有正被處理為在心理聲學上較不重要之位元,但將其指派給意欲涵蓋在心理聲學上較重要資料之碼字。此具有以下效應: • 若碼字5中存在不可校正位元誤差,則將藉由全訊框丟失隱匿合成全訊框,即使誤差僅影響位元組17之右側半位元組,亦即位元[132:135]。 • 若碼字5至13為良好的而碼字4中存在不可校正位元誤差(其可僅位於位元組17之左側半位元組,亦即位元[128:132]中),則位元組17之右側半位元組可仍然經解碼,如在良好碼字5中經寫碼那樣。
應注意, •  b_left可略微移位至下一左側位元組邊界,若其並非類似於圖3中給定之實例已經處於位元組邊界上。 • 屬於在心理聲學上較不重要資料之頻譜元組之數目可略微增大,而屬於在心理聲學上較重要資料之頻譜元組之數目可對應地略微減小。因此,在一些受損情形下,可發生可經解碼之頻率元組之數目小於半位元組/位元粒度情況下。然而,品質方面此將具有邊緣影響,但允許算術編碼器/解碼器之更高效實施。
儘管以上實例解決了粒度彼此呈整數關係之情形,但在粒度之非整數關係的情況下或在算術編碼器粒度低於誤差保護粒度的情況下使用類似處理。
位元流重新配置(在心理聲學上較不重要位元與在心理聲學上較重要位元之間隔)之較佳方法之特徵為藉由音訊編碼器/解碼器按時間順序而非空間順序寫入或讀取位元,自高重要性位元開始且以低重要性位元結束,由於二個位元流寫入器同時寫入至位元流中或二個位元流讀取器同時自位元流讀取(在當前情況下按不同方向),且由於當寫入或讀取一定量之資料時,在定位有彼等二個寫入或讀取指標之處給定可變長度寫碼-無先驗資訊。一旦寫入此量之資料或一旦此量之資料經剖析(亦即讀取及評估),就會得知此類部位,由於一定量之資料經寫入或讀取,或由於二個指標在寫入或讀取期間彼此會合。
儘管作為後或預處理之重新配置在編碼步驟之後或在解碼步驟之前為可能的,但重新配置位元流之直寫或讀取為較佳,由於重新配置需要額外剖析步驟。
隨後,關於圖13至圖20論述與解碼器或接收器側相關之本發明之較佳實施例。
圖13說明用於處理所接收誤差防護訊框之音訊接收器處理器。音訊接收器處理器包含接收器介面300,其用於接收誤差防護訊框且用於將誤差防護訊框輸出至誤差保護處理器302。誤差保護處理器302經組配以用於處理誤差防護訊框以獲得經編碼音訊訊框。特定言之,誤差保護處理器接收關於第一或第二預定義子集之資訊,且較佳地僅接收關於第一預定義子集且甚至僅屬於第一預定義子集之碼字的資訊。此資訊足以使得誤差保護處理器302可檢查來源於誤差保護處理器302之經編碼音訊訊框之碼字之預定義子集是否包含誤差。
誤差保護處理器302處理誤差防護訊框、輸出具有碼字之訊框且另外產生通常為固定長度訊框之具有碼字之訊框在碼字之第一預定義子集內是否具有誤差的資訊。
在此上下文中,將提及輸入至圖5之音訊發送器處理器之誤差保護寫碼器508中的碼字或藉由音訊接收器處理器之誤差保護處理器302輸出之碼字亦可被視為有效負載碼字,並且藉由音訊接收器處理器之誤差保護處理器302輸出之碼字或輸入至圖5之音訊發送器處理器之誤差保護寫碼器508中的碼字僅被稱為碼字。
該音訊接收器處理器包含誤差隱匿器或誤差隱匿指示器304,其經組配以在碼字之第一預定義子集中偵測到誤差之情況下執行訊框丟失隱匿操作或產生將在例如遠端地點處執行此誤差隱匿操作之指示。
音訊接收器處理器包含訊框讀取器306及隨後連接之音訊解碼器308。訊框讀取器306可受誤差保護處理器302或誤差隱匿器或誤差隱匿指示器304控制。特定言之,在誤差保護處理器302在碼字之第一預定義子集中判定引起通常全訊框丟失隱匿之誤差的情況下,訊框讀取器306及音訊解碼器308可經控制,以此方式使得此等區塊不必再對此訊框進行操作。
在誤差保護處理器302在碼字之第二預定義子集中而非碼字之第一預定義子集中判定誤差的情況下,訊框讀取器306經控制以在碼字之第一預定義子集中進行讀取,但可跳過碼字之第二預定義子集之讀取,此係由於已經偵測到誤差或至少可跳過已經偵測到誤差之某一碼字之讀取(若並非碼字之第二預定義子集中之所有碼字均為錯誤的)。
在誤差保護處理器302已判定二個碼字子集均無誤差,亦即並不含有尚未被誤差保護處理器程序校正之任何誤差的情況下,訊框讀取器306經組配以使用關於第一與第二預定義子集之預定義資訊來讀取第一與第二預定義子集中之經編碼音訊資料且訊框讀取器306出於藉由音訊解碼器308處理的目的可以任何形式或指定中間格式輸出所讀取音訊資料。
當誤差隱匿器或誤差隱匿指示器304已經受誤差保護處理器302控制以執行部分訊框丟失隱匿時,誤差隱匿器可產生合成音訊資料並將合成音訊資料轉遞至音訊解碼器308,使得音訊解碼器可使用此隱匿資料,諸如較高頻譜值或殘餘資料,而非第二碼字之第二集合中經發送但受誤差影響之音訊資料。取決於實施,圖13中之誤差隱匿器或誤差隱匿指示器304或訊框丟失隱匿器使用來自一或多個先前訊框之資料,且隱匿器304可整合至音訊解碼器中使得二個功能性彼此整合。在誤差隱匿指示器情況下,在遠離誤差保護處理器之地點處進行隱匿,且音訊解碼器自裝置304接收指示以執行隱匿。
較佳地,誤差防護訊框具有二個誤差保護階段。第一誤差保護階段為藉由區塊寫碼器,諸如發送器側之里德所羅門編碼器引入之冗餘。另一及第二保護線為對於一方面碼字之第一預定義子集及另一方面碼字之第二預定義子集之一或多個散列碼之計算。
儘管誤差保護處理器,及特定言之,諸如誤差保護處理器所應用之里德所羅門碼之區塊碼可偵測及校正若干誤差,但情況可為一些誤差在無任何偵測及無任何校正之情況下在里德所羅門解碼後繼續存在或誤差校正具有在錯誤方向上「經校正」之誤差。為了亦發現此等誤差,使用藉由里德所羅門解碼操作輸出之所發送散列執行散列驗證及此發送散列值與來源於碼字之經解碼的第一(或第二)預定義子集之散列值的比較。
在圖14中說明較佳實施。在步驟400中,執行里德所羅門解碼以及誤差偵測/校正。此程序產生具有碼字及較佳地實施為散列值之所發送第一與第二結果值的經解碼訊框。在步驟402中,自第一預定義子集計算第一散列值,且在步驟404中,將計算出的第一散列值與所發送第一散列值進行比較。在二個散列值相等的情況下,程序繼續進行至步驟406。然而,在二個散列值並不相等的情況下,已經偵測到誤差且終止處理並啟動全訊框丟失隱匿,如步驟408中所指示。
然而,當已經判定第一散列值與所發送第一散列值彼此相等時,執行步驟406,其中計算第二散列值並將其與所發送第二散列值進行比較。在二個散列值並不相等的情況下,應用步驟410中所指示之程序,亦即執行部分訊框丟失隱匿。然而,當判定關於碼字之第二預定義子集之二個散列值相等時,訊框讀取器及音訊解碼器經控制以執行無誤差解碼操作。圖14中所說明的程序較佳藉由誤差隱匿器或誤差隱匿指示器304及/或藉由誤差保護處理器302實施。
圖15說明圖14之區塊410中所說明的部分訊框丟失隱匿之較佳實施。在步驟420中,判定是否僅來自碼字之第二預定義子集中之所有碼字的一或多個碼字為錯誤的。為此目的,舉例而言,自諸如里德所羅門解碼器之區塊解碼器或每一碼字之CRC檢查接收到資訊。通常,里德所羅門解碼器將指示碼字之第二預定義子集中之該碼字或哪一碼字為錯誤的。舉例而言,區塊420指示僅一個或二個碼字為錯誤的而預定義碼字之第二集合中之其他碼字為正確的。此等其他未損壞碼字之資料儘可能用於正常解碼或部分隱匿。在步驟422中,讀取第二子集之該一或多個非錯誤區塊或碼字。
在步驟424中,判定該一或多個錯誤碼字反映哪一含義,諸如頻譜範圍或殘餘資料。為此目的,關於碼字之第二預定義子集之碼字次序及參考位置之資訊為有用的。步驟424判定錯誤碼字之含義,使得步驟426可合成錯誤區塊之隱匿資料,諸如藉由區塊424判定之頻譜範圍。替代地,一種誤差隱匿亦可為僅跳過已經指示為損壞的殘餘資料使得將在非錯誤碼字情況下獲得之殘餘解碼及對應品質改良在僅殘餘資料損壞的非難以解決的情形下並非簡單地執行為一種誤差隱匿程序。
然而,在判定某一頻譜範圍損壞的情況下,藉由區塊426產生對於此頻譜範圍之隱匿資料。
在區塊428中,來自第一預定義子集之讀取資料及來自第二預定義子集之碼字之正確資料以及隱匿資料經組合與解碼以便最後獲得由部分訊框丟失隱匿程序產生之音訊信號之時間部分(訊框)的經解碼音訊信號。
圖16說明由區塊424執行之程序之一般表示。藉由使用錯誤資料剖析位元流,判定關於此等資料表示哪些頻譜值的資料含義以便獲得隱匿頻譜範圍。然而,並不使用此等資料之實際值,由於其已經判定為錯誤的。程序在步驟424及426之後的結果將為獲得非錯誤頻譜範圍資料,直至對於隱匿邊界與最大頻率之間的頻譜範圍存在由合成/隱匿資料替代之隱匿邊界及錯誤頻譜資料。然而,在其他實施例中,情況可為隱匿頻譜範圍並未完全擴展至最大邊界而是僅涵蓋隱匿邊界與低於音訊解碼器所需的最大頻率的另一邊界之間的某一頻譜範圍。音訊解碼器仍然接收隱匿邊界與最大頻率之間正確接收的資料。
在一實施例中,誤差隱匿器或誤差隱匿指示器304經組配以產生替代資料,且此資料接著經解碼或通常由解碼器連同非錯誤資料一起使用。在另一實施例中,誤差隱匿器或誤差隱匿指示器304僅產生誤差隱匿指示,且此指示藉由諸如圖13之解碼器308之音訊解碼器評估,如由區塊304與308之間的連接線所示,其中連接線攜載誤差隱匿指示。音訊解碼器接著諸如使用來自先前訊框或試探性程序或其他相關程序之資料採取必要的誤差隱匿措施而無需特定音訊解碼操作(但一般而言,誤差隱匿指示「經解碼」或解譯)。
圖17說明使用如相對於圖1、圖2、圖3或圖4所論述或如藉由圖21中之音訊編碼器所獲得之資料的情形。在步驟430中,對應於正確的最高有效位元之最高頻率被判定為隱匿邊界。替代地,MSB及LSB/正負號位元之最高頻率之最大值亦可判定為隱匿邊界(434)。
在步驟432中,完全地或使用可能獲得之LSB或正負號位元合成較高頻率值:儘管較高頻率MSB位元損壞,但LSB或正負號位元仍然可供用於對應於損壞的MSB位元得此類頻譜值。在步驟436中,當錯誤資料涵蓋相較於隱匿邊界較低頻率值之LSB或正負號位元時,亦合成錯誤資料。合成程序之輸出為在圖16中示意性地說明的隱匿頻譜範圍之呈頻譜值形式之合成/隱匿資料。
圖18說明圖13之訊框讀取器306之較佳實施。訊框讀取器較佳包含輸入緩衝器442及輸出緩衝器452或至音訊解碼器之直接輸出。訊框讀取器306包含控制器440、在第一讀取方向上操作之第一經控制輸入指標444及在第二讀取方向上操作之第二經控制輸入指標446。第一經控制輸入指標444可饋入第一寫入指標448且第二經控制輸入指標446可饋入第二寫入指標450。
如在圖8中之800處所說明之編碼器側之對應控制器,接收器側之指標實施之控制器440亦接收關於第二預定義子集中碼字數目之資訊或關於在心理聲學上較不重要之資訊單元之總數目或容量之資訊。
另外,控制器440可在如相對於圖17所論述儘可能使用來自碼字之第二預定義子集之資料的情況下自誤差保護處理器接收第二子集中之錯誤碼字之指示。若情況並非如此,且若判定碼字之第二預定義子集中之至少一個碼字為錯誤的,且因此,碼字之第二預定義子集所涵蓋之所有頻譜資料均由誤差隱匿操作產生為合成或隱匿資料,則並不需要自誤差保護處理器至控制器440之任何控制。
儘管如此,控制器440之程序類似於圖8之控制器800,但交換寫入與讀取之概念。特定言之,圖18中之控制器440例如針對資料交換或藉由按增量寫入而控制寫入點。在如圖19之上下文中所論述進行配置之情況下進行該資料交換,同時針對圖20中所說明的直接解碼執行遞增/遞減程序。
控制器440針對第一量之資訊單元設定訊框中第一與第二指標之起始位置/位址且接著同步地遞增/遞減輸入(讀取)指標。控制器440偵測到第一子集中之所有碼字讀取自輸入緩衝器且隨後針對第二量之資訊單元設定第一與第二指標之起始位置/位址並同步地遞增/遞減讀取指標直至所有剩餘資料經讀取。
在第一實例情況下,自解碼器請求寫入至輸出緩衝器452中之資料,由於僅解碼器,且特定言之熵解碼器及/或殘餘解碼器知曉需要來自哪一指標之多少資訊單元或位元。在實例中,解碼器視熵解碼器需要自第一寫入指標448接收譜線或譜線元組之LSB及正負號並自第二寫入指標450接收此同一譜線或譜線元組之MSB。
在第二實例情況下,資料將寫入至某一訊框中。接著,控制器應用語法經控制位元流或訊框讀取器以用於基於某一訊框語法經由指標444、446自輸入緩衝器442讀取位元,且該資料接著經由區塊448及450寫入至輸出緩衝器452或發送裝置中。在實例中,語法經控制位元流或訊框讀取器經由例如指標446讀取譜線或譜線元組之LSB及正負號並經由區塊450將讀取資料寫入至緩衝器452中,且語法經控制位元流或訊框讀取器經由例如指標448讀取此同一譜線或譜線元組之MSB並經由區塊448將讀取資料寫入至輸出緩衝器452中。
因此,在一較佳實施例中,圖13之音訊解碼器308通常包含剖析器及呈現器。剖析器將由之圖22區塊71及72組成且呈現器將包括之圖22剩餘區塊,由於在此實施例中,在無算術或一般熵解碼之情況下無法判定多少經編碼位元為例如譜線或譜線元組之MSB部分或譜線或譜線元組之MSB/正負號部分所必要。在轉碼操作情況下,在無後續呈現器之情況下使用剖析器,由於轉碼操作輸出相較於輸入訊框以不同語法寫入之訊框。
圖19說明當例如控制器440或一般而言圖13之訊框讀取器306執行重新配置操作時的較佳實施。在步驟456中,輸入(讀取)指標之起始位置判定為使得碼字之第一預定義子集經讀取。在此程序中,舉例而言,情況為將碼字之第二子集收集於訊框之起始或結束處之鄰近碼字中。步驟456接收數個第二碼字或第二量之資訊單元以作為輸入。另外,在碼字之第二預定義子集位於訊框末端處之情況下,步驟456亦需要每一訊框之資訊單元之總數目。
在步驟458中,程序在讀取指標彼此會合時終止,且在此情況下,判定訊框中之會合位置。在步驟460中,將直至起始位置以供讀取之資料與此位置與會合位置之間的資料交換。
在區塊460之輸出處,已獲得經指定/標準化中間訊框格式。
圖20說明出於直接解碼目的的訊框讀取器306之程序。步驟470再次接收數個第二碼字或第二量之資訊單元。步驟470可需要每一訊框之資訊單元之總數目。接著,判定輸入(讀取)指標之起始位置以讀取第一預定義子集。步驟470以及步驟456控制讀取指標444、446。在步驟472中,程序在讀取指標彼此會合且獲得會合部位時終止。在步驟474中,繼續自二側對剩餘部分進行讀取,其中在相反方向上用於讀取之起始點為第一步驟中判定之起始點。在區塊474之輸出處,針對直接解碼應用程式獲得音訊解碼器之資料。
儘管已在設備之上下文中描述一些態樣,但顯然,此等態樣亦表示對應方法之描述,其中區塊或裝置對應於方法步驟或方法步驟之特徵。類似地,方法步驟之上下文中所描述的態樣亦表示對應設備之對應區塊或項目或特徵的描述。
取決於某些實施要求,本發明之實施例可在硬體或軟體中實施。可使用數位儲存媒體來執行該實施,該媒體例如軟性磁碟、DVD、CD、ROM、PROM、EPROM、EEPROM或快閃記憶體,該媒體上儲存有電子可讀控制信號,該等電子可讀控制信號與可程式化電腦系統協作(或能夠協作)以使得執行各別方法。
根據本發明之一些實施例包含具有電子可讀取控制信號之資料載體,其能夠與可程式化電腦系統協作,使得執行本文中所描述之方法中的一者。
一般而言,本發明之實施例可實施為具有程式碼之電腦程式產品,當電腦程式產品運行於電腦上時,程式碼操作性地用於執行該等方法中之一者。程式碼可(例如)儲存於機器可讀載體上。
其他實施例包含用於執行本文中描述的方法中之一者之電腦程式,其儲存於機器可讀載體或非暫時性儲存媒體上。
換言之,因此,本發明方法之實施例為具有當電腦程式運行於電腦上時,用於執行本文中所描述之方法中的一者的程式碼之電腦程式。
因此,本發明方法之另一實施例係資料載體(或數位儲存媒體,或電腦可讀媒體),該資料載體包含記錄於其上的用於執行本文中所描述之方法中之一者的電腦程式。
因此,本發明之方法之另一實施例為表示用於執行本文中所描述之方法中的一者之電腦程式之資料串流或信號序列。資料串流或信號序列可(例如)經組配以經由資料通信連接(例如,經由網際網路)而傳送。
另一實施例包含處理構件,例如經組配或調適以執行本文中所描述之方法中之一者的電腦或可程式化邏輯裝置。
另一實施例包含電腦,該電腦具有安裝於其上之用於執行本文中所描述之方法中之一者的電腦程式。
在一些實施例中,可程式化邏輯裝置(例如,場可程式化閘陣列)可用以執行本文中所描述之方法的功能性中之一些或全部。在一些實施例中,場可程式化閘陣列可與微處理器協作,以便執行本文中所描述之方法中之一者。一般而言,該等方法較佳由任何硬體設備執行。
上述實施例僅說明本揭露內容之原理。應理解,對本文中所描述之配置及細節的修改及變化將對熟習此項技術者顯而易見。因此,意圖為僅受到接下來之專利申請專利範圍之範疇限制,而不受到藉由本文中之實施例之描述及解釋所呈現的特定細節限制。參考文獻
[1] "ISO/IEC14496-3 MPEG-4 Information technology — Coding of audio-visual objects - Part 3: Audio," 2009.
[2] "ETSI ES 201 980 Digital Radio Mondiale; System Specification," 2014.
[3] "ETSI TR 103 590 V1.1.1 (2018-09) "Digital Enhanced Cordless Telecommunications (DECT); Study of Super Wideband Codec in DECT for narrowband, wideband and super-wideband audio communication including options of low delay audio connections (lower than 10 ms framing)".
52:分析開窗程式 54:時間-頻率變換 56:TNS階段/區塊 58:量化器 60:熵寫碼器 71,72,78,428:區塊 74:反量化器 80:重疊/相加處理器 100,200,202,204,206,210,212,214,216,400,402,404,406,408,410,420,422,424,426,430,432,434,436,456,458,460,470,472,474,601:步驟 101,602:項目 300:接收器介面 302:誤差保護處理器 304:誤差隱匿指示器/區塊 306:訊框讀取器 308:音訊解碼器/區塊 440,800:控制器 442,802:輸入緩衝器 444:第一經控制輸入指標 446:第二經控制輸入指標 448:第一寫入指標/區塊 450:第二寫入指標/區塊 452:輸出緩衝器 500:音訊編碼器 502:重新配置器 504:訊框寫入器 506:訊框建構器 508:誤差保護寫碼器 510:發送器 804:第一經控制輸入/輸入 806:第二經控制輸入/輸入 810:第一寫入指標 812:第二寫入指標
隨後關於隨附圖式來論述本發明之較佳實施例,在隨附圖式中: 圖1為最初LC3位元流有效負載之實例之說明; 圖2說明在圖1中給定之實例LC3位元流有效負載之位元基於其心理聲學相關性之分配; 圖3說明LC3位元流有效負載重新配置之實例; 圖4說明藉由按位元組粒度操作之算術編碼器/解碼器之LC3位元流有效負載重新配置之另一實例; 圖5說明音訊發送器處理器之較佳實施; 圖6說明用於實施訊框建構之程序; 圖7說明由圖5之訊框建構器執行之較佳程序; 圖8說明訊框建構器之較佳程序; 圖9a至圖9c說明藉由圖5之訊框建構器建構之訊框內碼字之第一預定義子集及碼字之第二預定義子集之部位的示意性表示; 圖10說明藉由訊框建構器直寫訊框之較佳實施; 圖11說明圖5之訊框建構器之重新配置程序之較佳實施; 圖12說明圖5之誤差保護寫碼器之較佳實施; 圖13說明根據本發明之音訊接收器處理器之較佳實施; 圖14說明誤差保護處理器及誤差隱匿器之較佳程序; 圖15說明誤差保護處理器及誤差隱匿器之另一較佳實施; 圖16說明部分訊框丟失隱匿之隱匿頻譜範圍之示意性表示; 圖17說明部分訊框丟失隱匿之另一實施; 圖18說明圖13之訊框讀取器之較佳實施; 圖19說明用於執行將所接收的資料重新配置為特定標準所需的訊框格式之訊框讀取器,諸如標準化音訊解碼器之較佳實施; 圖20說明藉由用於直接讀取誤差防護訊框之音訊資料之訊框讀取器進行的較佳程序; 圖21說明圖5之音訊編碼器之較佳實施;且 圖22說明圖13之音訊解碼器之較佳實施。
500:音訊編碼器
502:重新配置器
504:訊框寫入器
506:訊框建構器
508:誤差保護寫碼器
510:發送器

Claims (46)

  1. 一種用於使用一音訊訊框之經編碼音訊資料產生一誤差防護訊框之音訊發送器處理器,該音訊訊框之該經編碼音訊資料包含一第一量之資訊單元及一第二量之資訊單元,該音訊發送器處理器包含: 一訊框建構器,其用於建構具有定義一預定義總數目之碼字之參考位置之一碼字光柵的一碼字訊框,其中該訊框建構器經組配以 寫入該第一量之資訊單元中起始於該等碼字之一第一預定義子集之參考位置處之該等資訊單元;及 寫入該第二量之資訊單元中起始於該等碼字之一第二預定義子集之參考位置處之該等資訊單元, 其中該訊框建構器經組配以判定該第一量之資訊單元與該第二量之資訊單元之間的一邊界,使得該第二量之資訊單元中之一起始資訊單元與一碼字邊界重合;及 一誤差保護寫碼器,其 用於處理該等碼字之該第一預定義子集中之該等碼字中之一或多者以獲得一第一處理結果或用於處理該等碼字之該第二預定義子集中之該等碼字中之一或多者以獲得一第二處理結果並用於將該第一處理結果或該第二處理結果與該預定義數目之碼字相加以獲得表示該誤差防護訊框之多個經處理碼字,或 用於單獨地處理該等碼字之該第一預定義子集或該等碼字之該第二預定義子集中之該等碼字以獲得表示該誤差防護訊框之多個經處理碼字。
  2. 如請求項1之音訊發送器處理器, 其中該訊框建構器經組配以基於該第二預定義子集之一資訊容量而判定該第一量之資訊單元與該第二量之資訊單元之間的該邊界,使得該等碼字之該第二預定義子集之該資訊容量等於該第二量之資訊單元中資訊單元之量。
  3. 如請求項1或2之音訊發送器處理器,其進一步包含: 一源編碼器,其用於使用一音訊信號之一預定義時間部分產生該第一及該第二量之資訊單元,其中該等資訊單元包含數個義務資訊單元及一可變數目之殘餘資訊單元,其中該源編碼器經組配以用於使用一可變長度寫碼規則針對該預定義時間部分產生一信號相依性數目之該等義務資訊單元, 其中該訊框建構器經組配以建構該碼字訊框,使得該碼字訊框具有一固定大小之資訊單元,且 其中該音訊編碼器經組配以將殘餘資訊單元之該可變數目判定為等於來源於該碼字訊框之資訊單元之該固定大小與義務資訊單元之數目的差的一資訊量。
  4. 如請求項1至3中任一項之音訊發送器處理器, 其中該訊框建構器經組配以在碼字訊框之間信號自適應地判定該第一量之資訊單元與該第二量之資訊單元之間的該邊界,使得取決於一碼字訊框之該音訊信號,該邊界表示關於該碼字訊框之不同音訊資訊或由一音訊解碼器以不同方式解譯之一經編碼資訊單元。
  5. 如請求項1至4中任一項之音訊發送器處理器, 其中該訊框建構器經組配以在該經編碼音訊資料之該碼字訊框之一側處使用一第二預定義數目之鄰近碼字以作為該等碼字之該第二子集、在該經編碼音訊資料之該碼字訊框之另一側處使用一第一預定義數目之鄰近碼字以作為該等碼字之該第一預定義子集,且其中該第一預定義數目與該第二預定義數目之一總和等於碼字之該預定義總數目,或 其中該等碼字之該第二預定義子集中之至少一個碼字位於該等碼字之該第一預定義子集中之二個碼字之間,或反之亦然。
  6. 如請求項1至5中任一項之音訊發送器處理器,其中該訊框建構器經組配以 使用該等碼字之該第一預定義子集之參考位置將該第一量之資訊單元寫入至該等碼字之該第一預定義子集中, 一旦該等碼字之該第一預定義子集經填充,就使用該等碼字之該第二預定義子集之參考位置寫入該第二量之資訊單元,且 其中該訊框建構器經組配以將該邊界判定為寫入至該等碼字之該第一預定義子集中之一最末碼字中的該資訊單元或判定為寫入於該等碼字之該第二預定義子集中之一第一碼字之一參考位置處的該第一資訊單元。
  7. 如請求項1至6中任一項之音訊發送器處理器, 其中該訊框建構器經組配以在起始於該第一預定義數目之碼字中之至少二個碼字之參考位置處之一第一寫入方向上及在起始於該第一預定義數目之碼字中之至少二個其他碼字之參考位置處之一第二相反寫入方向上寫入該第一量之資訊單元中之該等資訊單元,或 其中該訊框建構器經組配以在起始於該第二預定義數目之碼字中之至少二個碼字之參考位置處之一第一寫入方向上及在起始於該第二預定義數目之碼字中之至少二個其他碼字之參考位置處之一第二相反寫入方向上寫入該第二量之資訊單元中之該等資訊單元。
  8. 如請求項1至7中任一項之音訊發送器處理器, 其中該訊框建構器經組配以寫入該第一量之資訊單元及該第二量之資訊單元中之資訊單元,其中至少該第一量之資訊單元中之該等資訊單元中之大多數相較於該第二量之資訊單元中之該等資訊單元中之大多數在心理聲學上更為重要,或 其中當僅該第二量之資訊單元中之資訊單元被判定為損壞時,僅在一音訊接收器處理器中設想一部分訊框丟失隱匿,且其中當該第一量之資訊單元中之資訊單元被判定為損壞時,在該音訊接收器處理器中設想一全訊框丟失隱匿。
  9. 如請求項1至8中任一項之音訊發送器處理器,其進一步包含用於產生至少二個類別之資訊單元之一源編碼器,該至少二個類別選自由以下各者組成的群組:固定長度旁側資訊、可變長度旁側資訊、時間雜訊塑形資訊、一頻譜中該頻譜之一第一頻率部分之一或多個最高有效位元、相較於該第一頻率部分具有較高頻率之一第二頻率部分之一或多個最高有效位元、一第一頻率部分之一或多個最低有效位元或正負號位元、一第二頻率部分之一或多個最低有效位元或正負號位元、相較於該第一頻率部分具有較高頻率之該第二頻率部分、及殘餘位元, 其中若藉由該源編碼器產生為一類別,則該固定長度旁側資訊、該可變長度旁側資訊、該時間雜訊塑形資訊、一頻譜中之該第一頻率部分之該一或多個最高有效位元、及一第一頻率部分之該等最低有效位元或正負號位元位於該第一量之資訊單元中,且其中若藉由該源編碼器產生為一類別,則至少該第二頻率部分之該一或多個最高有效位元、一第二頻率部分之該一或多個最低有效位元或正負號位元及該等殘餘位元中之一者處於該第二量之該等資訊單元中。
  10. 如請求項1至9中任一項之音訊發送器處理器, 其中該訊框建構器經組配以使用一第一寫入指標及一第二寫入指標, 其中該訊框建構器經組配以使該第一寫入指標在自該碼字訊框中之一較低資訊單元位置至該碼字訊框中之一較高資訊單元位置之一方向上遞增, 其中該訊框建構器經組配以使該第二寫入指標在自該碼字訊框中之一較高資訊位置至該碼字訊框中之一較低資訊位置之一方向上遞減, 其中該訊框建構器經組配以在指示該等碼字之該第一預定義子集中之碼字之一預定義序列中之一第一碼字之一起始的一參考位置處啟動該第一寫入指標, 其中該訊框建構器經組配以在指示碼字之該預定義第一集合中之碼字之該預定義第一序列中之一最末碼字之一結束的一參考位置處啟動該第二寫入指標, 其中該訊框建構器經組配以在由該第一寫入指標指示之該等位置處寫入來自該第一量之資訊單元的屬於資訊單元之一或多個第一類別之資訊單元,且 其中該訊框建構器經組配以在由該第二寫入指標指示之該等位置處寫入來自該第一量之資訊單元的屬於資訊單元之一或多個第二類別之資訊單元,直至該第一寫入指標與該第二寫入指標在一會合資訊單元位置處彼此會合, 其中在該會合資訊單元位置處之該資訊單元表示該第一量之資訊單元與該第二量之資訊單元之間的該邊界。
  11. 如請求項10之音訊發送器處理器, 其中該訊框建構器經組配以將該第一指標設定至指示該等碼字之該第二預定義子集中之碼字之一第二預定義序列中之一第一碼字之該起始的一參考位置, 將該第二寫入指標設定至指示該等碼字之該第二預定義子集中之碼字之該第二預定義序列中之一最末碼字之該結束的一參考位置,及 使用該第一寫入指標寫入來自該第二量之資訊單元的一或多個第三類別之資訊單元並使用該第二寫入指標寫入來自該第二量之資訊單元的一或多個第四類別之資訊單元。
  12. 如請求項10或11之音訊發送器處理器,其中資訊單元之該一或多個第一類別包含時間雜訊塑形資訊及/或一頻譜中之一第一頻率部分之一或多個最高有效位元中之至少一者,或 其中資訊單元之該一或多個第二類別包含固定或可變長度旁側資訊、及該第一頻率部分之最低有效位元或正負號位元中之至少一者,或 其中資訊單元之該一或多個第三類別包含一第二頻率部分之最高有效位元中之至少一者,或 其中資訊單元之該一或多個第四類別包含該第二頻率部分之最低有效位元或正負號位元及殘餘資料中之至少一者。
  13. 如請求項10至12之音訊發送器處理器, 其中該訊框建構器經組配以使用來源於相對於頻率以一遞升次序排序之頻譜值直至該會合資訊單元處之一頻譜值或頻譜值之一組合的最高有效位元以作為該一或多個第一類別, 使用來源於頻譜值直至該會合資訊單元之該頻譜值或頻譜值之該組合的最低有效位元或正負號位元以作為該一或多個第二類別; 使用與處於或高於該會合資訊單元處之該值之一頻率相關聯的一或多個最高有效位元以作為該一或多個第三類別;以及 使用與處於或高於與該會合資訊單元相關聯之該頻率值之頻率相關聯的最低有效位元或正負號位元以作為該第四類別。
  14. 如請求項13之音訊發送器處理器, 其中該訊框建構器經組配以寫入該一或多個第一類別及該一或多個第二類別,或彼此同步地寫入該一或多個第三類別及該一或多個第四類別,使得藉由該第一寫入指標寫入一頻譜值或頻譜值之一組合之該至少一或多個最高有效位元及在藉由該等寫入指標寫入來自另一頻譜值或頻譜值之另一組合的資訊單元之前寫入同一頻譜值或頻譜值之同一組合之該一或多個最低有效位元或正負號位元。
  15. 如請求項1至14中任一項之音訊發送器處理器,其進一步包含用於產生呈自一起始位置延伸至一結束位置之一中間表示的該經編碼音訊資料之一源編碼器,其中該訊框建構器經組配以將呈該中間表示之該經編碼音訊資料重新配置成由該等碼字之該第一預定義子集與該第二預定義子集表示之該次序。
  16. 如請求項15之音訊發送器處理器, 其中該訊框建構器經組配以自該起始位置及該結束位置進行讀取及剖析,直至獲得由該等碼字之該第一預定義子集之一容量表示的一預定義量之資訊單元,及 將經讀取及剖析之該等資訊單元寫入至該等碼字之該第一預定義子集中並將在由該容量判定之該預定義量經讀取及剖析時所獲得之中間資訊單元之間的剩餘資訊單元寫入至該等碼字之該第二預定義子集中。
  17. 如請求項16之音訊發送器處理器,其中經編碼時間雜訊塑形資料、旁側資訊資料及最高有效資料部分及最低有效資料部分經讀取並寫入至該等碼字之該第一預定義子集,且其中高於一特定頻率之頻譜值之該最高有效資料部分及該最低有效資料部分以及殘餘資料被寫入至該等碼字之該第二預定義子集中。
  18. 如請求項1至17中任一項之音訊發送器處理器, 其中該等碼字之該第二預定義子集中之碼字之一數目來源於該誤差保護碼之一特性,及/或該等多個經處理碼字之一總大小。
  19. 如請求項1至18中任一項之音訊發送器處理器,其中該誤差保護寫碼器經組配以 計算該第一處理結果以作為一第一散列值, 計算該第二處理結果以作為一第二散列值, 將該第一散列值添加至該等碼字之該第一預定義子集及將該第二散列值添加至該等碼字之該第二預定義子集,以及 應用一逐碼字區塊碼以獲得該等誤差防護碼字。
  20. 如請求項1至19中任一項之音訊發送器處理器, 其進一步包含一音訊編碼器,該音訊編碼器具有以資訊單元之一第一粒度產生最小大小資料部分之一算術編碼器, 其中該誤差保護寫碼器經組配以以資訊單元之一第二粒度操作, 其中該第一粒度不同於該第二粒度。
  21. 如請求項20之音訊發送器處理器, 其中該第一粒度大於該第二粒度,且 其中在該第一預定義子集中之一第一碼字之一參考位置處,定位有對應於該第一粒度與該第二粒度之間的一粒度差的一自適應量之資訊單元。
  22. 如請求項21之音訊發送器處理器,其中該第一粒度大於該第二粒度且呈一整數比率,且其中位於該等碼字之該第二預定義子集中之一碼字之一參考位置處的該自適應量之資訊單元連同資料一起表示藉由該算術編碼器輸出之該最小大小資料部分。
  23. 一種用於處理一誤差防護訊框之音訊接收器處理器,其包含: 一接收器介面,其用於接收該誤差防護訊框以獲得一所接收誤差防護訊框; 一誤差保護處理器,其用於處理該所接收誤差防護訊框以獲得一經編碼音訊訊框,其中該誤差保護處理器經組配以檢查該經編碼音訊訊框之碼字之一第一預定義子集中之一碼字是否包含一誤差,以及 一誤差隱匿器或一誤差隱匿指示器,其經組配以在該等碼字之該第一預定義子集中偵測到一誤差之情況下執行一訊框丟失隱匿操作或產生一訊框丟失隱匿指示。
  24. 如請求項23之音訊接收器處理器, 其中該誤差保護處理器經組配以檢查該經編碼音訊訊框之碼字之一第二預定義子集是否包含一誤差,且 其中該誤差隱匿器或該誤差隱匿指示器經組配以執行一部分訊框丟失隱匿操作或產生一部分訊框丟失隱匿指示以用於隱匿該等碼字之該第二預定義子集中之該誤差。
  25. 如請求項23或24之音訊接收器處理器,其進一步包含用於解碼該等碼字之該第一預定義子集中包括之該經編碼音訊資料之一音訊解碼器,其中該音訊解碼器經組配以受該誤差保護處理器控制以在該誤差保護處理器並未定位該等碼字之該第一預定義子集中之一誤差時執行解碼。
  26. 如請求項23至25中任一項之音訊接收器處理器, 其中該誤差保護處理器經組配以將一區塊解碼操作施加至該所接收誤差防護訊框以獲得該等碼字之一經解碼之第一預定義子集及該等碼字之一經解碼之第二預定義子集, 其中若該區塊解碼操作並未發信號通知存在一誤差,則該誤差保護處理器經組配以 自該等碼字之該第一預定義子集計算一第一散列值,及 將該第一散列值與一所接收第一散列值進行比較, 其中該誤差保護處理器經組配以判定當該第一散列值與該所接收第一散列值彼此並不一致時,該等碼字之該第一預定義子集中存在一誤差,或判定當該第一散列值與該所接收第一散列值一致時,該等碼字之該第一預定義子集無誤差。
  27. 如請求項23至26中任一項之音訊接收器處理器, 其中該誤差保護處理器經組配以將一區塊解碼操作施加至該所接收誤差防護訊框以獲得該等碼字之一經解碼之第一預定義子集及該等碼字之一經解碼之第二預定義子集, 其中若該區塊解碼操作並未發信號通知存在一誤差,則該誤差保護處理器經組配以 自該等碼字之該第二預定義子集計算一第二散列值,及 將該第二散列值與一所接收第二散列值進行比較, 其中該誤差保護處理器經組配以判定當該第二散列值與該所接收第二散列值彼此並不一致時,該等碼字之該第二預定義子集中存在一誤差,或判定當該第二散列值與該所接收第二散列值一致時,該等碼字之該第二預定義子集無誤差。
  28. 如請求項26或27之音訊接收器處理器,其中該區塊解碼操作包含一里德所羅門(Reed-Solomon)解碼操作。
  29. 如請求項23至28中任一項之音訊接收器處理器, 其中該誤差保護處理器經組配以檢查該等碼字之該第二預定義子集是否僅在該等碼字之該第一預定義子集之該檢查並未偵測到一誤差時包含一誤差。
  30. 如請求項23至29中任一項之音訊接收器處理器, 其中該誤差保護處理器經組配以偵測該等碼字之該第二預定義子集中之一或多個特定碼字是否包含一誤差,及該等碼字之該第二預定義子集中之任一碼字是否為一無誤差碼字,且 其中該誤差隱匿器經組配以產生該一或多個特定碼字之替代資料或一誤差隱匿指示,且 其中該音訊接收器處理器包含一音訊解碼器,該音訊解碼器用於解碼該等碼字之該第一預定義子集中包括之音訊資料及該等碼字之該第二預定義子集中之該等無誤差碼字中之一或多者中包括的音訊資料,以及該一或多個特定碼字之該替代資料,或 其中該音訊接收器處理器包含用於解碼該等碼字之該第一預定義子集中包括之音訊資料及該等碼字之該第二預定義子集中之該等無誤差碼字中之一或多者中包括之音訊資料的一音訊解碼器,且其中該音訊解碼器經組配以接收該誤差隱匿指示及回應於該誤差隱匿指示採取一誤差隱匿措施。
  31. 如請求項23至30中任一項之音訊接收器處理器,其進一步包含一訊框讀取器,該訊框讀取器用於根據識別該等碼字之該第一預定義子集及該等碼字之一第二預定義子集之一預定義訊框讀取程序讀取該經編碼音訊訊框。
  32. 如請求項31之音訊接收器處理器, 其中該訊框讀取器經組配以讀取一第一量之資訊單元中起始於該等碼字之該第一預定義子集中之碼字之參考點處之資訊單元直至讀取來自該等碼字之該第一預定義子集中之所有碼字的該等資訊單元,及 讀取一第二量之資訊單元中起始於該等碼字之該第二預定義子集中之碼字之參考點處的資訊單元, 該音訊接收器處理器進一步包含一音訊解碼器,其中該音訊解碼器經組配以解碼該第一量之資訊單元及該第二量之資訊單元之一級聯以便獲得用於該經編碼音訊訊框之經解碼音訊資料。
  33. 如請求項31或32之音訊接收器處理器, 其中該訊框讀取器經組配以在該經編碼音訊資料之該碼字訊框之一側處使用一第二預定義數目之鄰近碼字以作為該等碼字之該第二子集、在該經編碼音訊資料之該碼字訊框之另一側處使用一第一預定義數目之鄰近碼字以作為該等碼字之該第一預定義子集,且其中該第一預定義數目與該第二預定義數目之一總和等於碼字之該預定義總數目,或 其中該等碼字之該第二預定義子集中之至少一個碼字位於該等碼字之該第一預定義子集中之二個碼字之間,或反之亦然。
  34. 如請求項31至33中任一項之音訊接收器處理器, 其中該訊框讀取器經組配以在起始於該第一預定義數目之碼字中之至少二個碼字之參考位置處之一第一讀取方向上及在起始於該第一預定義數目之碼字中之至少二個其他碼字之參考位置處之一第二相反讀取方向上讀取該第一量之資訊單元中之該等資訊單元,或 其中該訊框讀取器經組配以在起始於該第二預定義數目之碼字中之至少二個碼字之參考位置處之一第一讀取方向上及在起始於該第二預定義數目之碼字中之至少二個其他碼字之參考位置處之一第二相反讀取方向上讀取該第二量之資訊單元中之該等資訊單元。
  35. 如請求項31至34中任一項之音訊接收器處理器, 其中該訊框讀取器經組配以讀取該第一量之資訊單元及該第二量之資訊單元中之資訊單元,其中至少該第一量之資訊單元中之該等資訊單元中之大多數相較於該第二量之資訊單元中之該等資訊單元中之大多數在心理聲學上更為重要,或 其中當僅該第二量之資訊單元中之資訊單元被判定為損壞時,僅由該誤差隱匿器執行一部分訊框丟失隱匿,且其中當該第一量之資訊單元中之資訊單元被判定為損壞時,由該誤差隱匿器執行一全訊框丟失隱匿。
  36. 如請求項31至35中任一項之音訊接收器處理器,其進一步包含用於解碼至少二個類別之資訊單元之一源解碼器,該至少二個類別選自由以下各者組成的群組:固定長度旁側資訊、可變長度旁側資訊、時間雜訊塑形資訊、一頻譜中之該頻譜之一第一頻率部分之一或多個最高有效位元、相較於該第一頻率部分具有較高頻率之一第二頻率部分之一或多個最高有效位元、一第一頻率部分之一或多個最低有效位元或正負號位元、一第二頻率部分之一或多個最低有效位元或正負號位元、相較於該第一頻率部分具有較高頻率之該第二頻率部分、及殘餘位元, 其中若可供用於藉由該源解碼器解碼為一類別,則該固定長度旁側資訊、該可變長度旁側資訊、該時間雜訊塑形資訊、一頻譜中之該第一頻率部分之該一或多個最高有效位元,及一第一頻率部分之該等最低有效位元或正負號位元位於該第一量之資訊單元中,且其中若可供用於藉由該源解碼器解碼為一類別,則該第二頻率部分之該一或多個最高有效位元、一第二頻率部分之該一或多個最低有效位元或正負號位元及該等殘餘位元中之至少一者處於該第二量之該等資訊單元中。
  37. 如請求項31至36中任一項之音訊接收器處理器,其中該訊框讀取器經組配以 使用一第一讀取指標及一第二讀取指標, 使該第一讀取指標在自該碼字訊框中之一較低資訊單元位置至該碼字訊框中之一較高資訊單元位置之一方向上遞增, 使該第二讀取指標在自該碼字訊框中之一較高資訊位置至該碼字訊框中之一較低資訊位置之一方向上遞減, 在指示該等碼字之該第一預定義子集中之碼字之一預定義序列中之一第一碼字之一起始的一參考位置處啟動該第一讀取指標, 在指示碼字之該預定義第一集合中之碼字之該預定義第一序列中之一最末碼字之一結束的一參考位置處啟動該第二讀取指標, 在由該第一讀取指標指示之該等位置處讀取來自該第一量之資訊單元的屬於一或多個第一類別之資訊單元之資訊單元,以及 在由該第二讀取指標指示之該位置處讀取來自該第一量之資訊單元的屬於一或多個第二類別之資訊單元之資訊單元直至該第一讀取指標與該第二讀取指標在一會合資訊單元位置處彼此會合, 其中在該會合資訊單元位置處之該資訊單元表示該第一量之資訊單元與該第二量之資訊單元之間的一邊界。
  38. 如請求項37之音訊接收器處理器, 其中該訊框讀取器經組配以將該第一讀取指標設定至指示該等碼字之該第二預定義子集中之碼字之一第二預定義序列中之一第一碼字之一起始的一參考位置, 將該第二讀取指標設定至指示該等碼字之該第二預定義子集中之碼字之該第二預定義序列中之一最末碼字之該結束的一參考位置,及 使用該第一讀取指標讀取來自該第二量之資訊單元的一或多個第三類別之資訊單元並使用該第二讀取指標讀取來自該第二量之資訊單元的一或多個第四類別之資訊單元。
  39. 如請求項37或38之音訊接收器處理器, 其中該訊框讀取器經組配以使用來源於相對於頻率以一遞升次序排序之頻譜值直至該會合資訊單元處之一頻譜值或頻譜值之一組合的最高有效位元以作為該一或多個第一類別, 使用來源於頻譜值直至該會合資訊單元之該頻譜值或頻譜值之該組合的最低有效位元或正負號位元以作為該一或多個第二類別; 使用與處於或高於該會合資訊單元處之該值之一頻率相關聯的一或多個最高有效位元以作為該一或多個第三類別;以及 使用與處於或高於與該會合資訊單元相關聯之該頻率值之頻率相關聯的最低有效位元或正負號位元以作為該第四類別。
  40. 如請求項39之音訊接收器處理器, 其中該訊框讀取器經組配以讀取該一或多個第一類別及該一或多個第二類別,或彼此同步地讀取該一或多個第三類別及該一或多個第四類別,使得藉由該第一讀取指標讀取一頻譜值或頻譜值之一組合之該至少一或多個最高有效位元及在藉由該等讀取指標讀取來自另一頻譜值或頻譜值之另一組合的資訊單元之前讀取同一頻譜值或頻譜值之同一組合之該一或多個最低有效位元或正負號位元。
  41. 如請求項31至40中任一項之音訊接收器處理器, 其中該訊框讀取器經組配以按一第一讀取方向使用一第一讀取指標及按一第二讀取方向使用一第二指標,其中該經編碼音訊訊框具有一訊框起始位置及一訊框結束位置,其中該訊框讀取器經組配以將該第一指標設定於來源於該等碼字之該第二預定義子集中包括之資訊單元之一數目的該第一指標起始位置處及將該第二指標設定於該訊框結束位置處,其中該等碼字之該第一預定義子集均位於具有該訊框結束位置之該經編碼音訊訊框之一側處, 其中該訊框讀取器經組配以 使用使該第一讀取指標在對應讀取方向上遞增及使該第二讀取指標在對應讀取方向上遞減而進行讀取, 當該第一讀取指標及該第二讀取指標在一會合位置處彼此會合時終止,以及 交換該訊框起始位置與該第一指標起始位置之間的資訊單元與該第一指標起始位置與該會合位置之間的該等資訊單元,使得一重新配置之經編碼音訊訊框自該重新配置音訊訊框之該起始按以下次序包含在該第一指標起始位置與該會合點之間讀取之資訊單元、該訊框起始位置與該第一指標起始位置之間的該經編碼音訊訊框之資訊單元、及該會合位置與該訊框結束位置之間的該經編碼音訊訊框之資訊單元,且 其進一步包含一音訊解碼器,該音訊解碼器經預設以解碼具有按該重新配置之經編碼音訊訊框之該次序的該經編碼音訊資料的該重新配置經編碼音訊訊框,或 其進一步包含用於將該重新配置之經編碼音訊訊框發送至一遠端部位之一發送器裝置。
  42. 如請求項31至40中任一項之音訊接收器處理器, 其中該訊框讀取器經組配以按一第一讀取方向使用一第一讀取指標及按一第二讀取方向使用一第二指標,其中該經編碼音訊訊框具有一訊框起始位置及一訊框結束位置,其中該訊框讀取器經組配以將該第二指標設定於來源於該等碼字之該第二預定義子集中包括之資訊單元之一數目及該經編碼音訊訊框之資訊單元之一總數目的一第二指標起始位置處及將該第一讀取指標設定於該訊框起始位置處,其中該等碼字之該第一預定義子集均位於具有該訊框起始位置之該經編碼音訊訊框之一側處, 其中該訊框讀取器經組配以 使用使該第一讀取指標在對應讀取方向上遞增及使該第二讀取指標在對應讀取方向上遞減而進行讀取, 當該第一讀取指標及該第二讀取指標在一會合位置處彼此會合時終止,以及 交換該訊框結束位置與該第二指標起始位置之間的資訊單元與該第二指標起始位置與該會合位置之間的該等資訊單元,使得一重新配置之經編碼音訊訊框自該重新配置之經編碼音訊訊框之一起始按以下次序包含在該訊框起始位置與該會合位置之間的資訊單元、該訊框結束位置與該第二指標起始位置之間的該經編碼音訊訊框之資訊單元、及該會合位置與該第二指標起始位置之間的該經編碼音訊訊框之資訊單元。
  43. 如請求項23至42中任一項之音訊接收器處理器,其進一步包含一音訊解碼器,該音訊解碼器具有以資訊單元之一第一粒度接收一最小資料大小部分之一算術解碼器, 其中該誤差保護處理器經組配以以一第二粒度操作,其中該第一粒度大於該第二粒度, 其中在該等碼字之該第一預定義子集中之一第一碼字之一參考位置處,定位有對應於該第一粒度與該第二粒度之間的一粒度差的一自適應量之資訊單元, 其中位於該第二預定義子集中之一碼字之一參考位置處的該自適應量之資訊單元連同資料一起形成待輸入至該算術解碼器中之該最小資料大小部分,且 其中該訊框讀取器經組配以在藉由該第一碼字之該參考位置加上該自適應量之該大小判定的該第一碼字中之一位置處開始讀取用於該等碼字之該第一預定義子集之資訊單元。
  44. 一種使用一音訊訊框之經編碼音訊資料產生一誤差防護訊框之方法,該音訊訊框之該經編碼音訊資料包含一第一量之資訊單元及一第二量之資訊單元,該方法包含: 建構具有定義一預定義總數目之碼字之參考位置之一碼字光柵的一碼字訊框,其中該建構包含: 寫入該第一量之資訊單元中起始於該等碼字之一第一預定義子集之參考位置處之該等資訊單元;及 寫入該第二量之資訊單元中起始於該等碼字之一第二預定義子集之參考位置處之該等資訊單元, 判定該第一量之資訊單元與該第二量之資訊單元之間的一邊界,使得該第二量之資訊單元中之一起始資訊單元與一碼字邊界重合;及 執行一誤差保護處理,包含: 處理該等碼字之該第一預定義子集中之該等碼字中之一或多者以獲得一第一處理結果或處理該等碼字之該第二預定義子集中之該等碼字中之一或多者以獲得一第二處理結果並將該第一處理結果或該第二處理結果與該預定義數目之碼字相加以獲得表示該誤差防護訊框之多個經處理碼字,或 單獨地處理該等碼字之該第一預定義子集或該等碼字之該第二預定義子集中之該等碼字以獲得表示該誤差防護訊框之多個經處理碼字。
  45. 一種處理一誤差防護訊框之方法,其包含: 接收該誤差防護訊框以獲得一所接收誤差防護訊框; 藉由該所接收誤差防護訊框執行一誤差保護處理以獲得一經編碼音訊訊框,其中該誤差保護處理包含檢查該經編碼音訊訊框之碼字之一第一預定義子集中之一碼字是否包含一誤差,以及 在該等碼字之該第一預定義子集中偵測到一誤差之情況下執行一訊框丟失隱匿操作。
  46. 一種電腦程式,其用於在運行於一電腦或一處理器上時執行如請求項44或請求項45之一方法。
TW109104393A 2019-02-13 2020-02-12 音訊發送器處理器、音訊接收器處理器及相關方法與電腦程式 TWI745862B (zh)

Applications Claiming Priority (14)

Application Number Priority Date Filing Date Title
EP19157042 2019-02-13
EP19157036 2019-02-13
EP19157036.5 2019-02-13
EP19156997.9A EP3697005A1 (en) 2019-02-13 2019-02-13 Multi-mode channel coding with mode specific coloration sequences
EP19156997.9 2019-02-13
EP19157047 2019-02-13
EP19157047.2 2019-02-13
EP19157042.3 2019-02-13
WOPCT/EP2019/065172 2019-06-11
PCT/EP2019/065205 WO2020164752A1 (en) 2019-02-13 2019-06-11 Audio transmitter processor, audio receiver processor and related methods and computer programs
WOPCT/EP2019/065209 2019-06-11
WOPCT/EP2019/065205 2019-06-11
PCT/EP2019/065172 WO2020164751A1 (en) 2019-02-13 2019-06-11 Decoder and decoding method for lc3 concealment including full frame loss concealment and partial frame loss concealment
PCT/EP2019/065209 WO2020164753A1 (en) 2019-02-13 2019-06-11 Decoder and decoding method selecting an error concealment mode, and encoder and encoding method

Publications (2)

Publication Number Publication Date
TW202101426A true TW202101426A (zh) 2021-01-01
TWI745862B TWI745862B (zh) 2021-11-11

Family

ID=66776368

Family Applications (4)

Application Number Title Priority Date Filing Date
TW109104392A TWI785309B (zh) 2019-02-13 2020-02-12 多模式通道寫碼技術
TW109104394A TWI797422B (zh) 2019-02-13 2020-02-12 選擇錯誤消隱模式之解碼器與解碼方法及編碼器與編碼方法
TW109104393A TWI745862B (zh) 2019-02-13 2020-02-12 音訊發送器處理器、音訊接收器處理器及相關方法與電腦程式
TW109104396A TWI748339B (zh) 2019-02-13 2020-02-12 用於包括全訊框丟失隱匿及部分訊框丟失隱匿的lc3隱匿之解碼器及解碼方法

Family Applications Before (2)

Application Number Title Priority Date Filing Date
TW109104392A TWI785309B (zh) 2019-02-13 2020-02-12 多模式通道寫碼技術
TW109104394A TWI797422B (zh) 2019-02-13 2020-02-12 選擇錯誤消隱模式之解碼器與解碼方法及編碼器與編碼方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
TW109104396A TWI748339B (zh) 2019-02-13 2020-02-12 用於包括全訊框丟失隱匿及部分訊框丟失隱匿的lc3隱匿之解碼器及解碼方法

Country Status (13)

Country Link
US (5) US20210366498A1 (zh)
EP (7) EP3925103A1 (zh)
JP (7) JP7472154B2 (zh)
KR (7) KR20230147747A (zh)
CN (3) CN113491079A (zh)
AU (8) AU2020223488A1 (zh)
BR (4) BR112021015608A2 (zh)
CA (7) CA3129610A1 (zh)
MX (4) MX2021009731A (zh)
SG (4) SG11202108672XA (zh)
TW (4) TWI785309B (zh)
WO (3) WO2020164752A1 (zh)
ZA (4) ZA202105721B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018178877A1 (en) 2017-03-27 2018-10-04 Clearpath Robotics, Inc. Systems and methods for autonomous lineside parts delivery to an assembly line process
CN112151044A (zh) * 2020-09-23 2020-12-29 北京百瑞互联技术有限公司 在lc3音频编码器中自动调节蓝牙播放设备频响曲线的方法、装置及存储介质
CN112735446B (zh) * 2020-12-30 2022-05-17 北京百瑞互联技术有限公司 在lc3音频码流中添加额外信息的方法、系统及介质
US20220342582A1 (en) * 2021-04-27 2022-10-27 Microchip Technology Inc. System and method for double data rate (ddr) chip-kill recovery
CN112992160B (zh) * 2021-05-08 2021-07-27 北京百瑞互联技术有限公司 一种音频错误隐藏方法及装置
US11934696B2 (en) 2021-05-18 2024-03-19 Microchip Technology Inc. Machine learning assisted quality of service (QoS) for solid state drives
US20230326473A1 (en) * 2022-04-08 2023-10-12 Digital Voice Systems, Inc. Tone Frame Detector for Digital Speech

Family Cites Families (101)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL8402411A (nl) * 1984-08-02 1986-03-03 Philips Nv Inrichting voor het korrigeren en maskeren van fouten in een informatiestroom, en weergeeftoestel voor het weergeven van beeld en/of geluid voorzien van zo een inrichting.
JP2998254B2 (ja) * 1990-04-17 2000-01-11 松下電器産業株式会社 可変長符号化データの伝送方法
EP0453229B1 (en) * 1990-04-17 1997-06-18 Matsushita Electric Industrial Co., Ltd. Method for transmission of variable length code
US5230003A (en) * 1991-02-08 1993-07-20 Ericsson-Ge Mobile Communications Holding, Inc. Decoding system for distinguishing different types of convolutionally-encoded signals
JP2746033B2 (ja) 1992-12-24 1998-04-28 日本電気株式会社 音声復号化装置
JP3171973B2 (ja) * 1993-01-07 2001-06-04 株式会社東芝 音声符号化の誤り制御方法
JP3328093B2 (ja) 1994-07-12 2002-09-24 三菱電機株式会社 エラー訂正装置
US6104754A (en) 1995-03-15 2000-08-15 Kabushiki Kaisha Toshiba Moving picture coding and/or decoding systems, and variable-length coding and/or decoding system
JP2003289539A (ja) 1995-03-15 2003-10-10 Toshiba Corp 動画像符号化装置および方法
EP1802129A3 (en) 1995-03-15 2008-10-22 Kabushiki Kaisha Toshiba Moving picture coding and/or decoding systems
WO1997011535A1 (en) * 1995-09-22 1997-03-27 Pacific Communication Sciences, Inc. Cellular communication system with multiple code rates
US6415398B1 (en) 1995-09-29 2002-07-02 Kabushiki Kaisha Toshiba Coding system and decoding system
GB2311699B (en) * 1996-03-29 2000-09-20 Nokia Mobile Phones Ltd Method and apparatus for digital communication
JP3583551B2 (ja) * 1996-07-01 2004-11-04 松下電器産業株式会社 誤り補償装置
JPH10233692A (ja) * 1997-01-16 1998-09-02 Sony Corp オーディオ信号符号化装置および符号化方法並びにオーディオ信号復号装置および復号方法
JP3184868B2 (ja) * 1997-06-05 2001-07-09 株式会社日立製作所 Webページの真正性確認システム
US6279133B1 (en) * 1997-12-31 2001-08-21 Kawasaki Steel Corporation Method and apparatus for significantly improving the reliability of multilevel memory architecture
US6405338B1 (en) * 1998-02-11 2002-06-11 Lucent Technologies Inc. Unequal error protection for perceptual audio coders
US6256487B1 (en) 1998-09-01 2001-07-03 Telefonaktiebolaget Lm Ericsson (Publ) Multiple mode transmitter using multiple speech/channel coding modes wherein the coding mode is conveyed to the receiver with the transmitted signal
JP2000123083A (ja) * 1998-10-15 2000-04-28 Sony Corp 情報提供システムおよび方法、並びに提供媒体
AU754877B2 (en) * 1998-12-28 2002-11-28 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Method and devices for coding or decoding an audio signal or bit stream
DE19907728C2 (de) 1999-02-23 2001-03-01 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Erzeugen eines Datenstroms und Vorrichtung und Verfahren zum Lesen eines Datenstroms
FI107676B (fi) * 1999-06-21 2001-09-14 Nokia Mobile Phones Ltd Menetelmä ja järjestely tietyn signaalinkäsittelymetodin käyttämiseksi informaation välittämiseen
US6570509B2 (en) * 2000-03-03 2003-05-27 Motorola, Inc. Method and system for encoding to mitigate decoding errors in a receiver
EP1199709A1 (en) * 2000-10-20 2002-04-24 Telefonaktiebolaget Lm Ericsson Error Concealment in relation to decoding of encoded acoustic signals
US6810078B2 (en) * 2000-12-08 2004-10-26 Prairiecomm, Inc. Blind rate determination
US6970506B2 (en) 2001-03-05 2005-11-29 Intervideo, Inc. Systems and methods for reducing frame rates in a video data stream
US6694474B2 (en) * 2001-03-22 2004-02-17 Agere Systems Inc. Channel coding with unequal error protection for multi-mode source coded information
EP1471756B8 (en) * 2002-01-31 2012-02-15 Research in Motion Limited Information communication method
US7266750B1 (en) * 2002-07-10 2007-09-04 Maxtor Corporation Error recovery strategies for iterative decoders
US7536305B2 (en) * 2002-09-04 2009-05-19 Microsoft Corporation Mixed lossless audio compression
US6985856B2 (en) * 2002-12-31 2006-01-10 Nokia Corporation Method and device for compressed-domain packet loss concealment
US7356748B2 (en) * 2003-12-19 2008-04-08 Telefonaktiebolaget Lm Ericsson (Publ) Partial spectral loss concealment in transform codecs
WO2005086436A1 (ja) * 2004-03-03 2005-09-15 Mitsubishi Denki Kabushiki Kaisha パケット転送装置、パケット転送ネットワークシステム、および、端末装置
CN1989548B (zh) 2004-07-20 2010-12-08 松下电器产业株式会社 语音解码装置及补偿帧生成方法
US7738561B2 (en) * 2004-11-16 2010-06-15 Industrial Technology Research Institute MPEG-4 streaming system with adaptive error concealment
KR20060101889A (ko) * 2005-03-22 2006-09-27 엘지전자 주식회사 디지털 오디오의 신호 처리 방법 및 장치
JP4261506B2 (ja) * 2005-03-31 2009-04-30 株式会社東芝 無線通信装置及び適法制御方法
US7177804B2 (en) 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
US7411528B2 (en) * 2005-07-11 2008-08-12 Lg Electronics Co., Ltd. Apparatus and method of processing an audio signal
US7623725B2 (en) * 2005-10-14 2009-11-24 Hewlett-Packard Development Company, L.P. Method and system for denoising pairs of mutually interfering signals
CN101331733B (zh) 2005-12-16 2011-12-07 杜比瑞典公司 用于使用后续数据帧中的数据来产生和解释具有一系列段的数据流的设备和方法
WO2007084475A2 (en) * 2006-01-17 2007-07-26 Thomson Licensing Methods and apparatus for low complexity error resilient motion estimation and coding mode selection
KR100763207B1 (ko) 2006-05-03 2007-10-04 삼성전자주식회사 비압축 aⅴ 데이터를 송수신하는 방법, 장치, 및 전송프레임 구조
US8798172B2 (en) * 2006-05-16 2014-08-05 Samsung Electronics Co., Ltd. Method and apparatus to conceal error in decoded audio signal
US7610195B2 (en) 2006-06-01 2009-10-27 Nokia Corporation Decoding of predictively coded data using buffer adaptation
EP1901496B1 (en) 2006-09-12 2010-09-01 Panasonic Corporation Link adaptation dependent on control signaling
KR101292771B1 (ko) * 2006-11-24 2013-08-16 삼성전자주식회사 오디오 신호의 오류은폐방법 및 장치
KR100862662B1 (ko) * 2006-11-28 2008-10-10 삼성전자주식회사 프레임 오류 은닉 방법 및 장치, 이를 이용한 오디오 신호복호화 방법 및 장치
KR101291193B1 (ko) * 2006-11-30 2013-07-31 삼성전자주식회사 프레임 오류은닉방법
CN101569198A (zh) * 2007-05-07 2009-10-28 松下电器产业株式会社 解码装置以及解码方法
US20080301536A1 (en) * 2007-05-31 2008-12-04 Interdigital Technology Corporation Channel coding and rate matching for lte control channels
CN100524462C (zh) 2007-09-15 2009-08-05 华为技术有限公司 对高带信号进行帧错误隐藏的方法及装置
CN101261833B (zh) * 2008-01-24 2011-04-27 清华大学 一种使用正弦模型进行音频错误隐藏处理的方法
US8301440B2 (en) * 2008-05-09 2012-10-30 Broadcom Corporation Bit error concealment for audio coding systems
JP2009276890A (ja) 2008-05-13 2009-11-26 Hitachi Systems & Services Ltd データ通信の誤り検出方法
KR101228165B1 (ko) * 2008-06-13 2013-01-30 노키아 코포레이션 프레임 에러 은폐 방법, 장치 및 컴퓨터 판독가능한 저장 매체
WO2010000303A1 (en) * 2008-06-30 2010-01-07 Nokia Corporation Speech decoder with error concealment
KR101250309B1 (ko) 2008-07-11 2013-04-04 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 에일리어싱 스위치 기법을 이용하여 오디오 신호를 인코딩/디코딩하는 장치 및 방법
PL2304719T3 (pl) * 2008-07-11 2017-12-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Koder audio, sposoby dostarczania strumienia audio oraz program komputerowy
KR101756834B1 (ko) 2008-07-14 2017-07-12 삼성전자주식회사 오디오/스피치 신호의 부호화 및 복호화 방법 및 장치
EP2329654B1 (en) * 2008-09-26 2014-08-06 Telegent Systems, Inc. Devices of digital video reception and output having error detection and concealment circuitry and techniques
TWI580272B (zh) 2009-01-30 2017-04-21 英特矽爾美國有限公司 混合格式媒體傳輸的系統及方法
EP2408132A4 (en) * 2009-03-09 2014-07-09 Fujitsu Ltd DATA TRANSFER DEVICE AND DATA TRANSFER DEVICE CONTROL METHOD
US8300979B2 (en) * 2009-07-29 2012-10-30 Hewlett-Packard Development Company, L.P. Method and system for robust universal denoising of noisy data sets
US8625692B2 (en) * 2009-09-28 2014-01-07 Samsung Electronics Co., Ltd. Transmission/reception apparatus and method for improving throughput in a multi-input multi-output communication system
RU2591011C2 (ru) * 2009-10-20 2016-07-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Кодер аудиосигнала, декодер аудиосигнала, способ кодирования или декодирования аудиосигнала с удалением алиасинга (наложения спектров)
US8428959B2 (en) * 2010-01-29 2013-04-23 Polycom, Inc. Audio packet loss concealment by transform interpolation
EP2362658A1 (en) * 2010-02-26 2011-08-31 Research In Motion Limited Encoding and decoding methods and devices employing dual codesets
EP2614592B1 (en) * 2010-09-09 2018-06-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Entropy encoding and decoding scheme
CN102034478B (zh) * 2010-11-17 2013-10-30 南京邮电大学 基于压缩感知和信息隐藏的语音保密通信系统设计方法
BR112013020324B8 (pt) * 2011-02-14 2022-02-08 Fraunhofer Ges Forschung Aparelho e método para supressão de erro em fala unificada de baixo atraso e codificação de áudio
CN102163430B (zh) * 2011-05-06 2012-09-26 中国科学技术大学苏州研究院 采用信息隐藏技术进行amr-wb语音编码或解码的方法
CN103688306B (zh) * 2011-05-16 2017-05-17 谷歌公司 对被编码为连续帧序列的音频信号进行解码的方法和装置
JP2012242785A (ja) * 2011-05-24 2012-12-10 Sony Corp 信号処理装置、信号処理方法、およびプログラム
KR102172279B1 (ko) 2011-11-14 2020-10-30 한국전자통신연구원 스케일러블 다채널 오디오 신호를 지원하는 부호화 장치 및 복호화 장치, 상기 장치가 수행하는 방법
US9203757B2 (en) * 2012-03-22 2015-12-01 Texas Instruments Incorporated Network throughput using multiple reed-solomon blocks
PL2874149T3 (pl) * 2012-06-08 2024-01-29 Samsung Electronics Co., Ltd. Sposób i urządzenie do ukrywania błędu ramki oraz sposób i urządzenie do dekodowania audio
US9823745B1 (en) * 2012-08-30 2017-11-21 Atheer, Inc. Method and apparatus for selectively presenting content
US10147232B2 (en) * 2012-08-30 2018-12-04 Atheer, Inc. Method and apparatus for selectively presenting content
WO2014045739A1 (ja) * 2012-09-19 2014-03-27 富士フイルム株式会社 画像処理装置、撮像装置、画像処理方法及び画像処理プログラム
CN107481725B (zh) 2012-09-24 2020-11-06 三星电子株式会社 时域帧错误隐藏设备和时域帧错误隐藏方法
KR101726205B1 (ko) 2012-11-07 2017-04-12 돌비 인터네셔널 에이비 감소된 복잡성 변환기 snr 계산
TWM487509U (zh) * 2013-06-19 2014-10-01 杜比實驗室特許公司 音訊處理設備及電子裝置
CA2916150C (en) 2013-06-21 2019-06-18 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method realizing improved concepts for tcx ltp
MX355091B (es) * 2013-10-18 2018-04-04 Fraunhofer Ges Forschung Concepto para codificar una señal de audio y decodificar una señal de audio usando información de conformación espectral relacionada con la voz.
PT3285254T (pt) 2013-10-31 2019-07-09 Fraunhofer Ges Forschung Descodificador de áudio e método para fornecer uma informação de áudio descodificada utilizando uma ocultação de erro com base num sinal de excitação no domínio de tempo
EP2922056A1 (en) * 2014-03-19 2015-09-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and corresponding computer program for generating an error concealment signal using power compensation
NO2780522T3 (zh) 2014-05-15 2018-06-09
CN104021769B (zh) * 2014-05-30 2016-06-15 京东方科技集团股份有限公司 一种移位寄存器、栅线集成驱动电路及显示屏
TWI602172B (zh) * 2014-08-27 2017-10-11 弗勞恩霍夫爾協會 使用參數以加強隱蔽之用於編碼及解碼音訊內容的編碼器、解碼器及方法
KR102547480B1 (ko) 2014-12-09 2023-06-26 돌비 인터네셔널 에이비 Mdct-도메인 에러 은닉
US20160171740A1 (en) 2014-12-15 2016-06-16 Calay Venture S.à r.l. Real-time method for collaborative animation
US10756997B2 (en) 2015-09-28 2020-08-25 Cybrook Inc. Bandwidth adjustment for real-time video transmission
WO2017081874A1 (ja) 2015-11-13 2017-05-18 株式会社日立国際電気 音声通信システム
WO2017129270A1 (en) 2016-01-29 2017-08-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for improving a transition from a concealed audio signal portion to a succeeding audio signal portion of an audio signal
CN109313905B (zh) * 2016-03-07 2023-05-23 弗劳恩霍夫应用研究促进协会 隐藏音频帧丢失的错误隐藏单元、音频解码器及相关方法
CN109155134B (zh) * 2016-03-07 2023-05-23 弗劳恩霍夫应用研究促进协会 隐藏音频帧丢失的错误隐藏单元、音频解码器和相关方法
BR112018067944B1 (pt) * 2016-03-07 2024-03-05 Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V Unidade de ocultação de erro, método de ocultação de erro,decodificador de áudio, codificador de áudio, método para fornecer uma representação de áudio codificada e sistema
EP3273602B1 (en) * 2016-07-19 2022-01-26 MediaTek Inc. Low complexity rate matching design for polar codes
US10312945B2 (en) * 2017-02-13 2019-06-04 Lg Electronics Inc. Channel coding method using concatenated code structure and apparatus therefor

Also Published As

Publication number Publication date
KR20230098370A (ko) 2023-07-03
CA3129610A1 (en) 2020-08-20
JP2023145493A (ja) 2023-10-11
KR102640740B1 (ko) 2024-02-27
KR102662188B1 (ko) 2024-05-03
EP3924963A1 (en) 2021-12-22
JP7358490B2 (ja) 2023-10-10
ZA202105722B (en) 2022-07-27
TWI748339B (zh) 2021-12-01
MX2021009731A (es) 2021-09-08
KR20230147747A (ko) 2023-10-23
TWI745862B (zh) 2021-11-11
AU2020220383C1 (en) 2023-07-06
WO2020164753A1 (en) 2020-08-20
KR20210125555A (ko) 2021-10-18
JP2022520609A (ja) 2022-03-31
WO2020164752A1 (en) 2020-08-20
US20210375295A1 (en) 2021-12-02
SG11202108673QA (en) 2021-09-29
KR20210125534A (ko) 2021-10-18
AU2023204176A1 (en) 2023-07-20
JP7472154B2 (ja) 2024-04-22
KR20210118948A (ko) 2021-10-01
AU2023226770A1 (en) 2023-09-28
EP4109444A1 (en) 2022-12-28
BR112021016022A2 (pt) 2021-10-05
JP2022521487A (ja) 2022-04-08
CN113491080A (zh) 2021-10-08
AU2020221993A1 (en) 2021-10-07
BR112021015608A2 (pt) 2021-10-05
US20230274750A1 (en) 2023-08-31
AU2020221602A1 (en) 2021-10-07
CA3129616A1 (en) 2020-08-20
ZA202105721B (en) 2022-07-27
AU2023204659A1 (en) 2023-08-03
WO2020164751A1 (en) 2020-08-20
JP2023175750A (ja) 2023-12-12
JP2022520608A (ja) 2022-03-31
EP4369334A2 (en) 2024-05-15
BR112021015533A2 (pt) 2021-10-05
KR20210143177A (ko) 2021-11-26
TW202044779A (zh) 2020-12-01
AU2020220383B2 (en) 2023-04-13
SG11202108674TA (en) 2021-09-29
CN113490981A (zh) 2021-10-08
KR102637530B1 (ko) 2024-02-19
AU2020220383A1 (en) 2021-10-07
JP7348297B2 (ja) 2023-09-20
US20210385012A1 (en) 2021-12-09
MX2021009733A (es) 2021-09-08
SG11202108672XA (en) 2021-09-29
TW202044777A (zh) 2020-12-01
CA3205152A1 (en) 2020-08-20
BR112021015532A2 (pt) 2021-10-05
AU2020221993B2 (en) 2023-05-18
CA3128781A1 (en) 2020-08-20
US11875806B2 (en) 2024-01-16
AU2023216863A1 (en) 2023-09-07
EP3925103A1 (en) 2021-12-22
ZA202105719B (en) 2022-06-29
CN113544773A (zh) 2021-10-22
TW202044231A (zh) 2020-12-01
US20210366498A1 (en) 2021-11-25
KR20230147748A (ko) 2023-10-23
TWI797422B (zh) 2023-04-01
EP4239924A3 (en) 2023-11-15
US20230230606A1 (en) 2023-07-20
MX2021009728A (es) 2021-10-13
US20220014310A1 (en) 2022-01-13
AU2020223488A1 (en) 2021-10-07
EP3925105A2 (en) 2021-12-22
CN113491079A (zh) 2021-10-08
CA3231332A1 (en) 2020-08-20
CA3128783A1 (en) 2020-08-20
JP2024026178A (ja) 2024-02-28
EP3925104A2 (en) 2021-12-22
SG11202108537YA (en) 2021-09-29
EP4239924A2 (en) 2023-09-06
MX2021009729A (es) 2021-10-26
TWI785309B (zh) 2022-12-01
CA3231339A1 (en) 2020-08-20
JP2022520816A (ja) 2022-04-01
ZA202105720B (en) 2022-07-27

Similar Documents

Publication Publication Date Title
TWI745862B (zh) 音訊發送器處理器、音訊接收器處理器及相關方法與電腦程式
TWI484479B (zh) 用於低延遲聯合語音及音訊編碼中之錯誤隱藏之裝置和方法
KR101570589B1 (ko) 워터마킹된 신호를 인코딩 및 검출하는 디바이스들
KR100942860B1 (ko) 특정된 엔트리 포인트를 가진 세그먼트로 데이터 스트림을 생성하고 해석하는 장치, 방법 및 이들을 기록한 컴퓨터로 읽을 수 있는 매체
TWI480860B (zh) 音訊編碼中之訊框元件長度傳輸技術
WO2020165262A2 (en) Audio transmitter processor, audio receiver processor and related methods and computer programs
CN105009208B (zh) 用于音频编码中的dtx拖尾的方法和装置
US12009002B2 (en) Audio transmitter processor, audio receiver processor and related methods and computer programs
RU2782730C1 (ru) Процессор передатчика звуковых сигналов, процессор приемника звуковых сигналов и связанные с ними способы и носители данных