TW202205260A - 串流一致式位元容錯性 - Google Patents

串流一致式位元容錯性 Download PDF

Info

Publication number
TW202205260A
TW202205260A TW110112445A TW110112445A TW202205260A TW 202205260 A TW202205260 A TW 202205260A TW 110112445 A TW110112445 A TW 110112445A TW 110112445 A TW110112445 A TW 110112445A TW 202205260 A TW202205260 A TW 202205260A
Authority
TW
Taiwan
Prior art keywords
group
value
parity
quantized values
values
Prior art date
Application number
TW110112445A
Other languages
English (en)
Inventor
理查 圖爾納
梅根 露西 塔賈特
羅倫 沃傑西艾薩克
賈斯汀 杭特
Original Assignee
美商高通公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 美商高通公司 filed Critical 美商高通公司
Publication of TW202205260A publication Critical patent/TW202205260A/zh

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/004Arrangements for detecting or preventing errors in the information received by using forward error control
    • H04L1/0041Arrangements at the transmitter end
    • H04L1/0042Encoding specially adapted to other signal generation operation, e.g. in order to reduce transmit distortions, jitter, or to improve signal shape
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/004Arrangements for detecting or preventing errors in the information received by using forward error control
    • H04L1/0056Systems characterized by the type of code used
    • H04L1/0061Error detection codes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M13/00Coding, decoding or code conversion, for error detection or error correction; Coding theory basic assumptions; Coding bounds; Error probability evaluation methods; Channel models; Simulation or testing of codes
    • H03M13/03Error detection or forward error correction by redundancy in data representation, i.e. code words containing more digits than the source words
    • H03M13/05Error detection or forward error correction by redundancy in data representation, i.e. code words containing more digits than the source words using block codes, i.e. a predetermined number of check bits joined to a predetermined number of information bits
    • H03M13/09Error detection only, e.g. using cyclic redundancy check [CRC] codes or single parity bit
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M13/00Coding, decoding or code conversion, for error detection or error correction; Coding theory basic assumptions; Coding bounds; Error probability evaluation methods; Channel models; Simulation or testing of codes
    • H03M13/03Error detection or forward error correction by redundancy in data representation, i.e. code words containing more digits than the source words
    • H03M13/05Error detection or forward error correction by redundancy in data representation, i.e. code words containing more digits than the source words using block codes, i.e. a predetermined number of check bits joined to a predetermined number of information bits
    • H03M13/13Linear codes
    • H03M13/15Cyclic codes, i.e. cyclic shifts of codewords produce other codewords, e.g. codes defined by a generator polynomial, Bose-Chaudhuri-Hocquenghem [BCH] codes
    • H03M13/151Cyclic codes, i.e. cyclic shifts of codewords produce other codewords, e.g. codes defined by a generator polynomial, Bose-Chaudhuri-Hocquenghem [BCH] codes using error location or error correction polynomials
    • H03M13/1515Reed-Solomon codes
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M13/00Coding, decoding or code conversion, for error detection or error correction; Coding theory basic assumptions; Coding bounds; Error probability evaluation methods; Channel models; Simulation or testing of codes
    • H03M13/29Coding, decoding or code conversion, for error detection or error correction; Coding theory basic assumptions; Coding bounds; Error probability evaluation methods; Channel models; Simulation or testing of codes combining two or more codes or code structures, e.g. product codes, generalised product codes, concatenated codes, inner and outer codes
    • H03M13/2957Turbo codes and decoding
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M13/00Coding, decoding or code conversion, for error detection or error correction; Coding theory basic assumptions; Coding bounds; Error probability evaluation methods; Channel models; Simulation or testing of codes
    • H03M13/37Decoding methods or techniques, not specific to the particular type of coding provided for in groups H03M13/03 - H03M13/35
    • H03M13/39Sequence estimation, i.e. using statistical methods for the reconstruction of the original codes
    • H03M13/41Sequence estimation, i.e. using statistical methods for the reconstruction of the original codes using the Viterbi algorithm or Viterbi processors

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Probability & Statistics with Applications (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Error Detection And Correction (AREA)

Abstract

描述了用於壓縮音頻資料的方法、設備、非瞬態計算機可讀媒體和系統。這些技術涉及:獲得音頻訊號的數位化樣本序列;使用該數位化樣本序列來執行轉換以生成多條譜線;從該多條譜線獲得譜線群;以及量化該譜線群以生成經量化值群。量化該譜線群以生成經量化值群可以包括:對從該譜線群中選擇的譜線執行專用捨入運算;以及使用該專用捨入運算來將針對經量化值群計算的群奇偶校驗值強制為預定奇偶校驗值。可以輸出基於經量化值群的一個或多個資料幀。

Description

串流一致式位元容錯性
本公開關於串流一致式位元容錯性。
本公開的各方面涉及對音頻資料的壓縮和解壓縮。用於音頻訊號的現代編碼器和解碼器一般採用高效的基於轉換的技術來對音頻資料進行有損壓縮/解壓縮。例如,某些codec編碼器和解碼器基於轉換(諸如改進離散餘弦轉換(MDCT))。經編碼輸出通常被提供給通道(諸如傳輸通道或儲存通道)。在該通道的另一側,經編碼輸出被解碼以生成原始音頻訊號的再現。該通道通常與雜訊相關聯並且可能引入位元錯誤,這可能使所再現的音頻訊號的質量降級。對抗此類位元錯誤的一種辦法是重傳經編碼輸出。然而,重傳與延遲相關聯,這是不合宜的,對於諸如視頻會議、多媒體串流、音頻呼叫等的上下文中的實況音頻傳輸之類的應用而言尤甚。此外,已經存在用於對音頻資料的壓縮和解壓縮的標準。納入現有標準的許多設備已經被部署在現場。採用全新壓縮/解壓縮方案的新設備可能無法與此類現有設備交互操作,這削減了新壓縮/解壓縮方案的有用性。由此,存在對於用於減少對音頻資料的壓縮和解壓縮中的位元錯誤和等待時間(優選地以與實現已經存在的音頻資料壓縮/解壓縮標準的設備相容的方式)的改進技術的顯著需求。
描述了涉及用於壓縮音頻資料的技術,尤其涉及串流一致式位元容錯性的某些實施例。串流一致式技術可以在不改變串流的性質或結構的情況下改造經編碼音頻資料串流,從而允許基於管控該串流的規範的任何解碼器實現對其進行解碼。位元容錯性指的能夠從位元錯誤復原的能力,諸如檢錯、糾錯等的能力。根據各個實施例,資料壓縮技術可以包括獲得音頻訊號的數位化樣本序列;使用該數位化樣本序列來執行轉換以生成多條譜線;從該多條譜線獲得譜線群;以及量化該譜線群以生成經量化值群。量化該譜線群以生成經量化值群可以包括:對從該譜線群中選擇的譜線執行專用捨入運算;以及使用該專用捨入運算來將針對經量化值群計算的群奇偶校驗值強制為預定奇偶校驗值。該資料壓縮技術可以進一步包括輸出基於經量化值群的一個或多個資料幀。
可以對與所選譜線相關聯的預捨入值執行該專用捨入運算。該預捨入值可以包括浮點值或定點值。經量化值群可以包括整數或定點值群。該專用捨入運算可以使用於捨入與所選譜線相關聯的預捨入值的捨入方向翻轉以將針對經量化值群計算的群奇偶校驗值強制為預定奇偶校驗值。
與該譜線群中的其他譜線相比,所選譜線可被選擇以與具有到兩個最接近的可能經量化值之間的中點的最小距離的預捨入值相關聯。所選譜線可以是基於有利於較高頻率譜線的選擇偏倚來選擇的。例如,與具有到兩個最接近的可能經量化值之間的中點的第一距離的第一預捨入值相關聯的第一譜線同與具有到兩個最接近的可能經量化值之間的中點的第二距離的第二預捨入值相關聯的第二譜線之間的平局中,該第一距離等於該第二距離,該第一譜線可被選擇以與該轉換中比該第二譜線高的頻率槽相關聯。
在一個實施例中,該譜線群可以包括與第一頻率槽和第一預捨入值相關聯的第一譜線以及與第二頻率槽和第二預捨入值相關聯的第二譜線。該第一頻率槽可以對應於該轉換中比該第二頻率槽高的頻率槽。該第一預捨入值可以對應於兩個最接近的可能經量化值之間的第一距離,而該第二預捨入值可以對應於兩個最接近的可能經量化值之間的第二距離,該第二距離小於該第一距離。相比於該第二譜線仍然可以選擇該第一譜線。
該一個或多個資料幀可以包括基於經量化值群的碼字群。可以使用算術編碼從經量化值群生成該碼字群。針對經量化值群中的至少一個經量化值,該一個或多個資料幀可以進一步包括捨入殘差值。針對經量化值群中的至少一個經量化值,該一個或多個資料幀可以進一步包括奇偶校驗殘差值。該捨入殘差值和該奇偶校驗殘差值可代替填充位元被插入在一個或多個資料幀中。
該專用捨入運算可被用來將從來自該多條譜線中的譜線群序列量化的經量化值群序列強制成具有預定奇偶校驗值序列。預定奇偶校驗值序列可被用作水印。水印可以象徵對專用捨入運算的使用。水印還可以象徵在一個或多個資料幀中存在一個或多個奇偶校驗殘差值。此外,水印可以與實現用於壓縮音頻資料的方法的設備的特定供應者相關聯。
該一個或多個資料幀可以維持與用於音頻資料壓縮的現有標準的相容性。
還描述了與用於解壓縮音頻資料的技術有關的某些實施例。資料解壓縮技術可以包括:獲得一個或多個資料幀;基於該一個或多個資料幀來獲得經量化值群,其中經量化值群源自壓縮側量化過程,該壓縮側量化過程涉及對譜線執行專用捨入運算以將針對經量化值群計算的奇偶校驗值強制為預定奇偶校驗值;針對經量化值群計算接收側奇偶校驗值;將計算出的接收側奇偶校驗值與用於經量化值群的預定奇偶校驗值進行比較;響應於檢測到計算出的接收側奇偶校驗值與用於經量化值群的預定奇偶校驗值之間的差異而執行位元錯誤運算以檢測或糾正該一個或多個資料幀中的至少一個位元錯誤;在計及對該一個或多個資料幀中的該至少一個位元錯誤的檢測或糾正的情況下基於經量化值群來估計譜線群;使用包括該譜線群的多條譜線執行逆轉換以生成數位化樣本序列;以及輸出該數位化樣本序列作為音頻訊號的數位表示。該一個或多個資料幀可以包括碼字群,並且可以通過利用該碼字群的多次傳輸來執行位元錯誤運算以檢測或糾正該碼字群中的至少一個位元錯誤。該碼字群中的至少一個位元錯誤可以通過以下操作來糾正:獲得該碼字群的多次傳輸;生成該碼字群的多個經重構版本;以及基於(1)與該碼字群的一個經重構版本相關聯的計算出的接收側奇偶校驗值與(2)該預定奇偶校驗值之間的匹配來從該碼字群的多個經重構版本中選擇該碼字群的該一個經重構版本。
指示可能位元錯誤的位置的弱位元遮罩(mask)可以通過比較該碼字群的多次傳輸來生成。該碼字群的多個經重構版本中的每一者可以通過改變由該弱位元遮罩指示的位元位置中的一者處的位元來重構。該碼字群的多次傳輸可以包括(1)該碼字群的原始傳輸和(2)該碼字群的一次或多次重傳。該一個或多個資料幀可以包括用於該碼字群的一個或多個循環冗餘校驗(CRC)值。該碼字群的一次或多次重傳中的每一者可以由與該碼字群的先前傳輸相關聯的失敗CRC觸發。可以使用算術解碼從該碼字群生成經量化值群。針對經量化值群中的至少一個經量化值,該一個或多個資料幀可以進一步包括捨入殘差值。針對經量化值群中的至少一個經量化值,該一個或多個資料幀可以進一步包括奇偶校驗殘差值。可以從該一個或多個資料幀中的填充位元的位置提取捨入殘差值和奇偶校驗殘差值。可以通過計及該捨入殘差值和該奇偶校驗殘差值以增加的解析度來估計來自該譜線群的譜線。該捨入殘差值可以指示針對該譜線的第一估計值範圍,並且該奇偶校驗殘差值可以指示針對該譜線的與該第一估計範圍毗鄰的第二估計值範圍。該譜線可以基於該第二估計值範圍來估計。
現在將參照形成其一部分的附圖描述若干解說性實施例。儘管下面描述了可以實現本公開的一個或多個方面的特定實施例,但是可以使用其他實施例並且可以進行各種修改而不會脫離本公開的範圍或所附申請專利範圍的精神。 整體系統
圖1呈現了可以納入本公開的一個或多個實施例的系統100的簡化圖。系統100解說了包括發射側和接收側的音頻訊號傳播的單向路徑。雖然解說了僅單向路徑,但是在許多應用中同時實現相反方向上的另一路徑,從而得到雙向佈置。如所示的,系統100在發射側包括麥克風102、取樣和類比數位(A/D)轉換單元104、codec編碼器106、可選的通道編碼器108、以及發射機110。發射機的輸出被發送到通道112,其可以表示傳輸通道或儲存通道。系統100在接收側進一步包括接收機114、可選的通道解碼器116、codec解碼器118、數位類比(D/A)轉換和訊號重構單元120、以及揚聲器122。
在發射側,麥克風102從環境中捕捉聲音並將該聲波轉換成類比電訊號。該類比電訊號被發送到取樣和A/D轉換單元104,取樣和A/D轉換單元104根據取樣頻率來對該類比電訊號進行取樣,並通過利用取樣和量化方案(諸如脈沖編碼調變(PCM))來量化每個樣本。這產生了表示原始音頻訊號的數位化樣本。取樣和A/D轉換單元104可以在A/C轉換之前和/或之後對訊號應用濾波和其他訊號調節技術。樣本和A/D轉換單元104將數位化樣本發送到codec編碼器106。codec編碼器106對數位化樣本執行有損壓縮以生成經壓縮數位資料。經壓縮數位資料被發送到可選的通道編碼器108,可選的通道編碼器108可以使用經壓縮數位資料執行通道編碼以生成通道位元或碼元。可以實現不同類型的通道編碼技術,包括前向糾錯(FEC)編碼。可選的通道編碼器108將通道位元/碼元發送到發射機110。替換地,沒有通道編碼器被使用。在該情形中,經壓縮數位資料可被直接發送到發射機110而不執行任何通道編碼,並且經壓縮數位資料可被用作通道位元/碼元。發射機110以適用於通道112的方式來處理通道位元/碼元。例如,發射機110可以在通道上發送經調變載波訊號之前將通道位元/碼元調變到載波訊號上。
通道112可以表示傳輸通道、儲存通道或其他通道。傳輸通道可以是有線或無線通道,例如越空通道。發射機110可以使用發射天線越空發送經調變載波訊號。儲存通道可以包括儲存媒體,可以在其上「寫入」並且隨後檢索通道位元/碼元。例如,發射機110可以利用寫入設備將通道位元/碼元寫入儲存媒體,這些通道位元/碼元在其中可被保留。通道112可能使通道位元/碼元遭受雜訊、干擾和其他劣化,從而引入錯誤。
在接收側,接收機114從通道112接收通道位元/碼元。接收機114解調或以其他方式處理從通道112接收的訊號以生成接收到的通道位元/碼元。例如,接收機114可以利用天線來接收經調變載波訊號並執行解調以產生接收到的通道位元/碼元。在另一示例中,接收機114可以利用讀取設備來從作為儲存通道的通道112中讀取通道位元/碼元。接收到的通道位元/碼元被發送到可選的通道解碼器116,可選的通道解碼器116可以執行通道解碼,例如,FEC解碼,以將接收到的通道位元/碼元轉換成經壓縮數位資料。經壓縮數位資料被發送到codec解碼器118。替換地,沒有通道解碼器被使用。在該情形中,通道位元/碼元被直接發送到codec解碼器118而不執行任何通道解碼,並且通道位元/碼元可被用作經壓縮數位資料。codec解碼器118對經壓縮數位資料執行解壓縮,以生成音頻資料的數位化樣本。數位化樣本被發送到D/A和重構單元120,D/A和重構單元120執行數位類比轉換和重構(諸如濾波和/或解讀)以生成類比電訊號。類比電訊號被發送到揚聲器122,揚聲器122可以基於類比電訊號來產生聲波並將聲波投射到環境中。 DCT/MDCT 轉換
圖2呈現了根據本公開的各個實施例的codec編碼器106的方塊圖。如所示的,codec編碼器106包括離散餘弦轉換(DCT)編碼器202和量化器單元204。例如,從圖1中所示的樣本和A/D轉換單元104獲得數位化樣本,並將其發送到DCT編碼器202。雖然示出了DCT編碼器,但是可以在其他實施例中使用基於不同類型轉換的轉換編碼器。DCT編碼器202對數位化樣本執行DCT轉換,以將數位化音頻資料從時域轉換到頻域。DCT轉換的輸出包括轉換係數,此處一般稱為「譜線」。每條譜線包括反映對應頻率槽內的數位化音頻資料的幅度的數值。頻率槽的數目可以取決於實現而變化。在一些實施例中,DCT編碼器202在每次轉換操作中生成至多達400條譜線(即,用於400個不同的頻率槽)。
在實踐中,DCT編碼器202對時間受限的數位化樣本塊執行此類轉換操作。在一些實施例中,相繼的數位化樣本塊可以在時間上交疊。DCT編碼器202可以對每個數位化樣本塊執行轉換操作以針對每個數位化樣本塊生成例如至多達400(或更多)條譜線。DCT編碼器202可以對第一數位化樣本塊、隨後第二數位化樣本塊、隨後第三數位化樣本塊等執行此類操作,以生成第一組譜線、第二組譜線、第三組譜線,依此類推。
僅作為示例,以下描述了經修改的離散餘弦轉換(MDCT)實現。此處,對於塊t,2N個時域樣本xt (k) ,k = 0, …, 2N ̶ 1被用來計算N條譜線Xt (m) ,m = 0, …, N ̶ 1。在該示例中,兩個相繼塊交疊達50%,因此每個塊處理N個新時域樣本。加窗函數w(k) ,k = 0, …, 2N ̶ 1可被用來平滑這些交疊的數位化樣本塊。該示例中的MDCT可被表達為:
Figure 02_image001
(式1)
Figure 02_image003
在本公開中,術語「譜線」一般指基於音頻訊號的轉換輸出並且不限於在上式1中作為示例提供的特定定義。可以針對DCT轉換或MDCT轉換採用譜線的其他定義。此外,可以針對非DCT類型的轉換採用譜線的其他定義。 量化和資料幀組裝
量化器單元204從DCT編碼器202獲得每組譜線並生成包括經壓縮音頻資料的資料幀。量化器單元204對每組譜線執行量化,以壓縮音頻資料。量化程度越大,實現的壓縮就越多。術語「資料幀」在本文中通常被用來指經壓縮音頻資料的組織或佈置。資料幀可以但不一定涉及經壓縮音頻資料可以如何被打包或以其他方式佈置成用於下游傳輸。雖然根據本公開的特定實施例描述了資料幀的特定示例,但是經壓縮資料在資料幀內的組織不必限於所呈現的實施例中所示的格式。以下更詳細地描述了量化器單元204的解說性操作。
圖3解說了根據本公開的一實施例的量化器單元204的某些內部組件的示例。量化通過捨入表示譜線的值以生成經量化值來執行。捨入之前的值可被稱為「預捨入」值。在一些實施例中,每個預捨入值可以是浮點值。在其他實施例中,每個預捨入值可以是定點值。捨入之後的值可被稱為「經量化」值。在一些實施例中,每個經量化值可以是整數。在其他實施例中,每個經量化值可以是定點值。在以下解說性示例中,每個預捨入值被示為浮點值,而每個經量化值被示為整數。然而,本文中所公開的用於利用捨入來強制實現奇偶校驗要求的技術可被用於表達為定點值的預捨入值和/或表達為定點值的經量化值。回到圖3,量化器單元204可以包括除法單元302、捨入單元304和算術編碼器306。此處,量化器單元204通過使用全域增益縮放每條譜線隨後捨入所得到的經增益調整值(其可被表達為浮點值)來執行量化以生成經量化值。此處,每個經量化值都是整數。例如,譜線可被發送到除法單元302。全域增益值(例如,10)也可被發送到除法單元302。除法單元302執行除法運算。在該示例中,譜線值被除以10。除法單元302可以輸出表示經增益調整譜線值的浮點值。浮點值被發送到捨入單元304,捨入單元304對浮點值執行捨入運算以生成整數值。可以使用標準捨入規則來執行捨入運算,例如,將浮點值x捨入到最接近的整數值y。如果浮點值x正好落在兩個整數值y與y+1之間的中間,則可以使用平局打破約定,諸如在平局的情形中總是向上取整,即,y =x + 0.5(或在平局的情形中總是向下取整,即,y =x – 0.5)。捨入單元304對浮點值執行捨入運算,從而生成整數值。捨入單元304還可以生成與捨入運算相關聯的捨入殘差值、以及奇偶校驗殘差值(在稍後部分中描述)。
圖4呈現了使用標準捨入規則執行的譜線量化所得到的量化誤差的示例的表400。示出了譜線量化的四個示例。四條譜線分別具有為105、201、174和139的值。每個譜線值除以為10的全域增益值。除法生成四個浮點值10.5、20.1、17.4和13.9。使用標準捨入規則經由捨入來量化四個浮點值以生成分別具有為11、20、17和14的值的四個整數。每次量化都與量化誤差相關聯,分別為0.5、0.1、0.4和0.1。表400中還示出了四個捨入殘差值,分別為-1、+1、+1和-1。每個捨入殘差值(被示為-1或+1值)指示實際浮點值沿實數軸相對於作為捨入運算結果獲得的整數值所位於的方向。換言之,捨入殘差值指示經量化值(即,整數值)是高於還是低於實際值(即,浮點值)。每個捨入殘差值可以可任選地隨每個整數值(或代表整數值的碼字)一起通過傳輸或儲存通道來發送。這樣做提供了關於經量化值的附加資訊,在通道的另一側的codec解碼器處重構每條譜線時該附加資訊向每條譜線增加額外解析度。
參照回到圖3,在執行量化以生成代表譜線的經量化值之後,量化器單元204可以執行源編碼以對經量化值進行編碼。源編碼操作可以根據合適的源編碼方案來將經量化值轉換成碼字。在本公開的一個實施例中,算術代碼被用作源編碼方案。算術編碼指一類編碼方案,它將整個消息編碼成代表分數值q 的代碼串,其中0.0 ≤q < 1.0.。編碼算法是逐碼元遞歸的,即,它在每次疊代或遞歸時對一個資料碼元進行操作和編碼(解碼)。在每次遞歸時,該算法相繼地劃分數軸的在0.0與1.0之間的區間,並保留其中這些分區中的一者作為新區間。碼元的子區間的大小與該碼元將成為消息中的下一碼元的估計概率成比例。如圖3中所示,算術編碼器306從捨入單元304獲得經量化值,每個經量化值表示經量化譜線。算術編碼器306基於經量化值來輸出經編碼碼字。因為每個經量化值可能具有不同的出現概率,所以經編碼碼字(即,代碼串)的級聯的總長度是可變的。可以將填充位元附加到可變長度算術代碼串,以形成固定長度的資料幀(如果固定長度的資料幀是合宜的話)。
圖3進一步解說了量化器單元204對資料幀的構造。在所示的示例中,針對每條譜線,資料幀可以包括對應於代表譜線的經量化值的算術編碼的碼字。對於每條譜線,資料幀可以可任選地包括與對該譜線執行的量化相關聯的捨入殘差值。捨入殘差值可以採用為+1或-1的值,這可以分別使用「1」位元或「0」位元來表示。如果在資料幀中有額外空間可用(即,如果存在填充位元),則捨入殘差值可代替一個或多個填充位元被添加,以在通道的接收側為譜線的重構提供額外解析度。此外,對於譜線群,資料幀可以可任選地包括奇偶校驗殘差值。以下部分更詳細地描述了此類奇偶校驗殘差值的生成。資料幀可以進一步包括附加填充位元、一個或多個指示每條譜線的正符號或負符號的符號位元、以及報頭,該報頭可以包括諸如在資料壓縮操作中所使用的各種控制參數的資訊。
在圖3中所示的實施例中,量化器單元204執行量化功能和資料幀構建功能。在其他實施例中,除量化器單元之外,單獨的幀組裝單元可被用來構造資料幀。 使用奇偶校驗的容錯性
根據本公開的各個實施例,通過向每個經量化譜線群添加低成本奇偶校驗來提供容錯性。低成本奇偶校驗可以通過利用對譜線群中的一條譜線的專用捨入運算來實現。專用捨入運算可被用來將針對經量化譜線群計算的群奇偶校驗值強制為預定奇偶校驗值。
再次參照圖4中,示出了對四條譜線的量化。在一簡單示例,譜線群可由這4條譜線組成,它們對應於為10.5、20.1、17.4和13.9的浮點值。專用捨入運算可被用來量化從譜線群中選擇的一條特定譜線。標準捨入運算可被用來量化該群中的剩餘譜線。對所選譜線的專用捨入運算的此類使用可以將針對整個經量化譜線群計算的奇偶校驗值強制為預定值。專用捨入運算通過翻轉用於捨入浮點數的捨入方向來這樣做。也就是說,通過選取「向上捨入」而非「向下捨入」(或「向下捨入」而非「向上捨入」),專用捨入運算將所得到的經量化值改變為偶數而非奇數(或奇數而非偶數),從而翻轉為整個經量化譜線群計算的所得到的奇偶校驗值。以此方式,專用捨入運算可被用來將群奇偶校驗值強制為預定值(例如,「0」或「1」)。
例如,具有為10.5的浮點值的譜線可被捨入(根據標準捨入運算)成整數值11,得到量化誤差為0.5。如果為10.5的浮點值改為被捨入成10(根據專用捨入運算),以將群奇偶校驗值強制為特定預定值,則量化誤差將仍為0.5。由此,為10.5的浮點值是應用專用捨入運算的出色候選。在該情形中,與使用專用捨入運算而非標準捨入運算相關聯的附加成本為零。無論哪種方式,捨入誤差都為0.5。
作為不同的示例,具有為17.4的浮點值的譜線可被捨入(根據標準捨入運算)成整數值17,得到量化誤差為0.4。如果浮點值17.4被改為捨入成18(根據專用捨入運算),以將群奇偶校驗值強制為特定預定值,則量化誤差將為0.6。由此,為17.4的浮點值是應用專用捨入運算的不太合宜的候選(與10.5相比)。在該情形中,與使用專用捨入運算而非標準捨入運算相關聯的額外成本對應於所招致的額外量化誤差量,即,0.2,其為0.4與0.6之差。
根據一實施例,與該群中的其他譜線相比,其浮點值最靠近兩個最接近的可能經量化值(在該情形中為兩個最接近的整數)之間的中點的譜線被選為對其執行專用捨入運算的譜線。換言之,其量化導致最大量化誤差的譜線被選擇來接收專用捨入運算。在圖4中所示的解說性譜線群中,具有浮點值10.5的譜線(其具有最大量化誤差)被選擇來接收專用捨入運算。
對於圖4中所示的四條譜線的群,可以將群奇偶校驗值計算為四個整數值11、20、17、14之和的奇偶校驗值。該和對應於為「0」的群奇偶校驗值(即,偶校驗)。如果決定要將群奇偶校驗值強制為「0」,則沒有額外步驟是必需的。然而,如果決定要將群奇偶校驗值強制為「1」(即,奇校驗),則可以對與最大量化誤差相關聯的所選譜線(在該情形中,為具有浮點值10.5的譜線)執行專用捨入運算。此處,專用捨入運算將浮點值10.5量化成整數值10而非11。這使為整個四條經量化譜線的群計算的群奇偶校驗值從「0」翻轉為「1」。由此實現了期望的群奇偶校驗值。
根據一附加實施例,對其執行專用捨入運算的特定譜線的選擇可以通過引入有利於較高頻率譜線的選擇偏倚(bias)來進一步細化。該偏倚可以導致性能提高,因為與在較低頻率譜線中引入的相同幅度的捨入誤差相比,在較高頻率譜線中引入的捨入誤差可以導致較佳音頻質量。在一具體實施例中,此類頻率偏倚可以用作先前所描述的基於捨入誤差幅度的譜線選擇過程中的「平局打破者」。
假定在譜線群中,第一譜線與第二譜線之間在它們各自的捨入誤差的幅度方面存在平局。例如,第一譜線具有為10.6的浮點值,而第二譜線具有為8.6的浮點值。在這兩種情形中,到兩個最接近的可能經量化值(在該情形中為兩個最接近的整數)之間的中點(即,分別為10.5和8.5)的距離為0.1。兩條譜線均等同地接近兩個最接近整數之間的理想中點。第一譜線和第二譜線將具有相同的量化誤差幅度,並且將在哪一個是被選為對其執行專用捨入運算的譜線的較佳候選方面打成平局。在此類場景中,頻率偏倚可被用來打破平局。如先前所提及的,當執行轉換(諸如MDCT)時,所得到的譜線對應於頻率槽。每條譜線包括反映數位化音頻資料在此轉換的對應頻率槽內的幅度的數值。繼續相同的示例,第一譜線與對應於第一頻率的槽相關聯,而第二譜線與對應於第二頻率的槽相關聯。如果第一頻率沿頻譜高於第二頻率,則第一譜線可優於第二譜線地被選取為對其執行專用捨入運算的所選譜線。此類技術可以進一步改進用於強制群奇偶校驗值的系統並導致較佳音頻性能。
在其他示例中,可能以更複雜的方式引入有利於較高頻率譜線的選擇偏倚。在一些示例中,與較大捨入誤差但較高頻率槽相關聯的譜線可被選擇,以提高整體音頻性能。因此,可以在與為了其較高頻率選擇譜線相關聯的音頻性能增益與為了其較低捨入誤差幅度選擇譜線相關聯的性能損失之間作出折衷。在一個實現中,此類性能增益和損失被量化成具體值,並且基於此類值執行評估以決定音頻性能折衷。例如,第一譜線可以與第一頻率槽以及位於離兩個最接近的整數之間的中點有第一距離處的第一浮點值相關聯。第二譜線可以與第二頻率槽以及位於離兩個最接近的可能經量化值之間的中點有第二距離處的第二浮點值相關聯。在該頻譜中,第一頻率槽可以比第二頻率槽高Δf KHz。然而,與第一浮點值相比,第二浮點數可能離最接近的可能經量化值之間的理想中點值比第一浮點數更接近ΔM 。例如,通過使用查找表,該選擇過程可以確定,在相關頻率範圍處,為Δf KHz的頻率差轉化為捨入相關音頻性能差P1。同時,另一查找表可以揭示,在相關頻率範圍處,為ΔM 的捨入誤差差轉化為音頻性能差P2。如果P1 > P2,則選擇過程可以優於第二譜線地選擇第一譜線作為該群中對其應用專用捨入運算的譜線。否則,則選擇過程可以優於第一譜線地選擇第二譜線作為該群中對其應用專用捨入運算的譜線。
根據本公開的又一附加實施例,每個群的大小(即,每個群中所包含的譜線數目)可以是預定的,並基於對競爭性考慮因素的平衡來選取。在一方面,群大小越小,提供的位元容錯性保護就越多。這是因為較小的群大小生成較少的碼字,這意味著使用群奇偶校驗值的知識來檢測或糾正位元錯誤的位元位置較少。因此,與具有較大群大小的群相比,對於具有較小群大小的群而言,由群奇偶校驗值所提供的位元錯誤檢測或糾正預期是更強的。另一方面,群大小越小,在群中找到大量化誤差的機會就越低。由此,較小群大小意味著與在所選譜線上使用專用捨入運算相關聯的額外成本可能更大。換言之,群大小越小,找到理想候選(諸如圖4中所解說的具有浮點值10.5的譜線)(或接近理想的候選),以用於應用專用捨入運算而具有很少或不具有懲罰的機會就越低。
使用本文中所公開的位元容錯性技術生成的資料幀可以維持與一種或多種現有音頻資料壓縮標準的相容性。此類現有標準可以基於僅使用標準捨入運算對譜線的量化。使用專用捨入運算(例如,為了強制特定群奇偶校驗值)生成的資料幀可能僅在如下的一個所選譜線方面有所不同,該一個所選譜線具有從選取「向上捨入」而非「向下捨入」(或選取「向下捨入」而非「向上捨入」)而得到的經量化值。通常,這相當於針對譜線群中的一個所選譜線的量化誤差上的微小差異。根據使用標準捨入運算的現有音頻資料壓縮標準構建的codec解碼器可以接收和解壓縮源自納入本文中所公開的用於強制群奇偶校驗值的技術的發射機的資料幀。類似地,納入本文中所公開的技術的codec解碼器可以接收和解壓縮源自根據使用標準捨入運算的現有音頻資料壓縮標準構建的發射機的資料幀。由此,當前所公開的用於位元容錯性的技術可以促成與基於現有音頻資料壓縮標準構建的設備的可互操作性。
本文中所公開的位元容錯性技術的益處涉及累積性奇偶校驗。算術編碼的串流的特徵在於資料可能需要按次序被讀取。當錯誤出現時,codec編碼器中所使用的編碼方案可能導致經編碼碼元/碼字的長度變化。當這種情形發生時,錯誤之後的奇偶校驗檢查很可能失敗。本文中所公開的奇偶校驗方案可以確保在當前譜線群之前和包括當前譜線群的所有資料的完好性。因此,奇偶校驗檢查方案可以保護每個譜線群中除最後一個群之外的不止一個位元錯誤。
更一般而言,奇偶校驗檢查方案可被應用於除譜線之外還包括其他類型資訊的資料群。只要發送了資料群,並且在每個群內都存在要被量化的值,就可以採用使用專用捨入規則來強制用於每個群的奇偶校驗值的方式。實際上,可以對不是譜線而是正在發送的資料群的一部分的資料執行專用操作。
在前述實施例中,為便於解說,描述了對譜線的標量量化。在其他實施例中,可以利用更高級的量化技術。例如,代替簡單的標量量化,可以使用非線性量化查找表、向量量化(例如,金字塔向量量化)、藉由合成的量化、字典查找等。更先進的量化技術可能增加複雜性,但是也可能改進壓縮,例如,在提供更佳音頻性能的方面。僅作為一示例,在向量量化的情形中,k個譜線的序列可被視為k維向量[x1 , x2 , …, xk ]並通過從一組k維向量[y1 , y2 , … , yn ]中選取最接近的匹配向量來量化,其中n<k。所公開的奇偶校驗方案可被應用於使用此類高級量化技術所獲得的經量化值。
此外,在前述實施例中,為便於解說,譜線量化和源編碼(即,熵編碼)是作為兩個單獨的步驟來描述的。在其他實施例中,譜線量化和源/熵編碼可被合併成組合步驟。例如,構成字母表的一組有效碼字可被創建。譜線值可以直接映射到碼字上,以使得經量化值被反映在字母表中(例如,通過使用卷積碼)。在構建碼字和映射時可以計及針對量化的各種考慮因素,諸如量化誤差和頻率偏倚等。
另外,在前述實施例中,奇偶校驗已經以偶數位元值與奇數位元值之間的選擇的方式進行了描述。在其他實施例中,奇偶校驗可被更廣泛地定義為在多個可能的經源/熵編碼的碼元(例如,碼字)中選擇的抉擇。選擇一個特定的經源/熵編碼的碼元的抉擇反映了「奇偶校驗」被強制實現。成本函數可被用來選擇最小化量化誤差、實現頻率偏倚等但仍維持期望奇偶校驗值的經源/熵編碼的碼元。此類技術可能非常適合於涉及霍夫曼(Huffman)編碼、非對稱數值系統(ANS)編碼等的實現,以作為源/熵編碼方案。 奇偶校驗殘差
圖5呈現了解說根據本公開的一實施例的奇偶校驗殘差值的生成的表500。圖5中所示的示例是基於選擇不同譜線來應用專用捨入運算以強制群奇偶校驗值的場景。例如,可以考慮具有為20.1、17.4、13.9和12.3的浮點值的替換譜線群。在該替換譜線群中,量化這些浮點值分別得到為20、17、14和12的經量化值。量化誤差分別為0.1、0.4、0.1和0.3。具有最大量化誤差的譜線為與浮點值17.4相對應的譜線,該譜線被選擇為對其執行專用捨入運算的譜線。經量化值20、17、14和12之和對應於為「1」的群奇偶校驗值(即,奇校驗)。如果決定要將群奇偶校驗值強制為「0」(即,偶校驗),則可以對浮點值17.4應用專用捨入運算。
參照圖5,使用標準捨入運算,浮點值17.4將被捨入為經量化值17。這對應於量化誤差0.4和捨入殘差值+1。捨入殘差值為+1指示實際浮點值沿實數軸相對於經量化值17位於正方向。具體地,捨入殘差值+1指示針對譜線的估計範圍為[17, 17.5)。捨入殘差值+1可被包括在資料幀中,以支持在通道另一側的codec解碼器處執行的對譜線的重構中的增加的解析度。
然而,為了將群奇偶校驗值強制為「0」,取而代之地使用專用捨入運算。作為結果,浮點值17.4被捨入為經量化值18。這對應於量化誤差0.6連帶捨入殘差-1。-1的捨入殘差值指示實際浮點值沿實數軸相對於經量化值18位於負方向。具體地,捨入殘差值-1指示針對譜線的估計範圍為[17.5, 18)。
還在圖5中示出的是奇偶校驗殘差值。奇偶校驗殘差值為0指示未曾使用專用捨入運算。在此類情形中,由捨入殘差指示的估計範圍仍然有效。相反,奇偶校驗殘差值為1指示已經使用了專用捨入運算。在該情形中,由捨入殘差指示的估計範圍可能不再有效。相反,奇偶校驗殘差值1聯合捨入殘差值-1一起指示譜線的新估計範圍[17,17.5)。
新估計範圍背後的邏輯可被描述如下。根據本實施例,捨入殘差值為-1僅指示實際浮點值沿實數軸相對於經量化值18位於負方向。換言之,浮點值點值被「向上捨入」以達到經量化值18。但是,在沒有更多資訊的情況下,浮點值是否被「向上捨入」為經量化值18是不清楚的,原因如下: (1)使用標準捨入運算進行量化:在該情形中,浮點數的估計範圍將為[17.5, 18),或者 (2)使用專用捨入運算進行量化:在該情形中,浮點數的估計範圍將為[17, 17.5)。
知曉奇偶校驗殘差值解決了這種歧義性。具體地,奇偶校驗殘差值為1指示使用了專用捨入運算。由此,譜線值的新估計範圍被確定為[17,17.5)。以上解說了捨入殘差值的示例,該捨入殘差值指示針對該譜線的第一估計值範圍,並且該奇偶校驗殘差值指示針對該譜線的與該第一估計範圍毗鄰的第二估計範圍的值。
如先前所討論的,取決於在資料幀的填充位元中是否有空間可用,資料幀可以可任選地包括捨入殘差值和奇偶校驗殘差值之一或兩者。在圖5中所示的示例中,使用專用捨入運算將浮點值17.4捨入成經量化值18。如果資料幀中既不包括捨入殘差值也不包括奇偶校驗殘差值,則codec解碼器可能只能夠基於[17.5,18.5)的範圍來估計譜線的值。如果資料幀中僅包括捨入殘差值但不包括含奇偶校驗殘差值,則codec解碼器可以基於[17.5, 18)的範圍來估計譜線的值。最後,如果資料幀中包括捨入殘差值和奇偶校驗殘差值兩者,則codec解碼器可以基於[17, 17.5)的範圍來估計譜線的值,即具有更高解析度。 加水印
經量化譜線群的序列可以以這種方式進行奇偶校驗調整以實現預定奇偶校驗值序列。例如,可以決定每個經量化譜線群將被強制成具有群奇偶校驗值「0」(即,偶校驗)。通過將每個經量化譜線群強制成具有群奇偶校驗值「0」,通道的發射側在經壓縮資料中提供群奇偶校驗值的期望模式(在本例中為全「0」)。具有了群奇偶校驗值的預期模式,通道的接收側可以使用此類知識來檢測或糾正位元錯誤,如在以下部分中更詳細地討論的。
群奇偶校驗值的預期模式可被用作水印。水印可以提供各種功能。在一個實施例中,水印象徵專用捨入運算的使用。響應於檢測到此類水印,通道的接收側可以利用群奇偶校驗來檢測或糾正位元錯誤。附加地或替換地,水印可以象徵在資料幀中存在一個或多個奇偶校驗殘差值。響應於檢測到此類水印,通道的接收機側可以從資料幀中檢索奇偶校驗殘差值並使用該奇偶校驗殘差值來以增加的解析度重構所選譜線。附加地或替換地,水印可以與音頻資料壓縮方法體系的特定供應者相關聯。此類水印的存在可以指示生成承載水印的經壓縮音頻資料的設備的製造或設計來源。 資料幀分解和去量化
圖6呈現了根據本公開的各個實施例的codec解碼器118的方塊圖。如所示的,codec解碼器118包括去量化器單元602和離散餘弦逆轉換(逆DCT)單元604。例如,從圖1中所示的可選的通道解碼器116獲得資料幀,並發送到去量化器單元602。替換地,如果沒有通道解碼器被實現,則資料幀可以直接從圖1中所示的接收機114獲得。去量化器單元602獲得包括經壓縮音頻資料的資料幀並生成譜線組。以下呈現了對去量化器單元602的更詳細描述。
圖7解說了根據本公開的一實施例的去量化器單元602的某些內部組件的示例。如所示的,去量化器單元602可以包括算術解碼器702和頻譜估計器704。去量化器單元602從每個資料幀中提取資料的各個部分,以估計表示經壓縮音頻資料的諸譜線組。可以從資料幀中提取經算術編碼的碼字並將其轉發到算術解碼器702。算術解碼器702將碼字轉換成經量化值(例如,整數或定點數)。每個經量化值可以代表經量化譜線。
在執行去量化之前,去量化器單元602可以利用對用於每個經量化值群的群奇偶校驗值的知識來檢測或糾正位元錯誤。具體地,去量化器單元602可以為從資料幀獲得的經量化值群計算接收側奇偶校驗值。去量化器單元602可以將用於經量化值群的接收側奇偶校驗值與已知的用於經量化值群的預定奇偶校驗值進行比較。去量化器單元602可以響應於檢測到用於經量化值群的計算出的接收側群奇偶校驗值與用於經量化值群的預定群奇偶校驗值之間的差異而執行一個或多個位元錯誤運算以檢測或糾正該資料幀中的至少一個位元錯誤。 位元錯誤檢測和糾正
圖8A和8B解說了根據本公開的一個實施例的使用群奇偶校驗值的檢錯和糾錯的簡化示例。此處,四條經量化譜線的群連帶預定群奇偶校驗值一起發送。圖8A示出了將譜線的可能經量化值映射到對應碼字的示例碼本800。為便於解說,呈現了固定長度的碼字。在不同的實現中,可以使用可變長度的碼字,如先前在算術代碼的情形中所提及的。具體而言,碼字的長度可以基於每個碼字的出現概率而變化。碼本800包含四個碼字:0x42、0x67、0xC3和0xD3,它們分別對應於四個可能的經量化譜線值,即,整數8、4、11和14。圖8B呈現了示出通道的發射側如何量化對應於四個不同頻率槽的四條譜線的細節的表810。每條譜線被量化成碼本800中所見的四個可能經量化值8、4、11或14之一。對於每條譜線,表810示出了全域增益、除以全域增益後的值、經量化值、為強制奇偶校驗的新經量化值、碼字和碼字的二進制版本。另外,表810示出了四個經量化值(即,整數)的列之和為33,其具有奇校驗。表810還示出了強制群奇偶校驗的四個新經量化值的列之和為34,其為偶校驗。
此處,假定預定群奇偶校驗值為「0」(即,偶校驗)。也就是說,在通道的發射側,群奇偶校驗值被強制為偶校驗。如在表810中所看見的,具有浮點值10.5的譜線被選擇以供專用捨入運算,以將群奇偶校驗值強制為偶校驗。取代將浮點值10.5捨入成經量化值10的是,將該浮點值捨入成新的經量化值11。這將四個新的經量化值之和強制成34,其具有偶校驗,滿足預定群奇偶校驗值要求。
在發射機處生成的簡單資料封包可以為: 11000011110000110100001001100111 + CRC
此處,該封包包括取自碼本800的各種碼字的級聯,其對應於譜線群的經量化值。另外,循環冗餘校驗(CRC)值也被附加到封包並被傳送。在傳統的codec辦法中,資料封包可能已經被發送了數次(諸如3、5或7次)。由於具有該封包的如此多的傳輸的益處,接收硬體(例如,在圖1中所示的接收機114中)可以能夠使用多數表決來修復該封包。也就是說,如果大多數傳輸(例如,7次傳輸中的4次)產生相同的碼字串,則可以選取經重複的碼字串作為經修復的封包。相反,通過使用根據本公開的實施例的預定群奇偶校驗值,以較少次傳輸進行封包修復可以是可能的。在下述示例中,資料最初被傳送並且被重傳僅一次,這不允許接收硬體自行修復該封包。然而,接收硬體會生成「弱位元遮罩」並將其轉發給codec解碼器。使用弱位元遮罩和對用於經量化譜線群的預定奇偶校驗值的知識,codec解碼器能夠修復封包並恢復用於經量化譜線的正確值。
出於解說性目的,以下呈現了一些基本場景。在發射機處生成的簡單資料封包在通道上被發送。通道可能有雜訊並引入位元錯誤。此處,資料封包的初始傳輸經歷位元錯誤。在接收機處看到以下封包(位元錯誤帶下劃線): 1100001111000011010000100110 1 111 + CRC
當接收側硬體解碼該封包時,CRC失敗。這觸發了該封包的重傳。這一次,該封包的重傳在不同的位元位置引入了位元錯誤(位元錯誤帶下劃線): 110 1 0011110000110100001001100111 + CRC
再一次,當接收側硬體解碼該封包時,CRC失敗。作為響應,接收側硬體生成弱位元遮罩。弱位元遮罩示出了封包的兩次傳輸有所不同的所有位元位置。弱位元遮罩隨接收到的封包之一一起被發送到codec解碼器。該示例的弱位元遮罩如下所示: 0001 0000000000000000000000001 000 修復示例 1 使用最後接收到的封包
在第一修復示例中,最後接收到的封包(即,第二次傳輸)被用來重構原始封包。再次,最後接收到的封包為: 11010011110000110100001001100111
這對應於經解碼的碼字: 0xD3 0xC3 0x42 0x67
使用碼本800查找這些經解碼的碼字會產生經量化頻譜值群: 14, 11, 8, 4 (奇偶校驗 = 奇) → 不正確。
該經量化頻譜值群具有奇校驗,這不是期望的群奇偶校驗值。作為第一步,codec解碼器可以嘗試改變弱位元遮罩中的第一位元。這樣做會產生新封包: 11000011110000110100001001100111
這對應於經解碼的碼字: 0xC3 0xC3 0x42 0x67
使用碼本800查找這些經解碼的碼字會產生經量化頻譜值群: 11, 11, 8, 4 (奇偶校驗 = 偶) → 正確。
該經量化頻譜值群具有偶校驗,這是期望的群奇偶校驗值。這確認了經量化頻譜值群是正確的。
示例 2 使用第一個接收到的封包
在第二修復示例中,第一個接收到的封包(即,初始傳輸)被用來重構原始封包。再次,第一個接收到的封包為: 11000011110000110100001001101111
這對應於經解碼的碼字: 0xC3 0xC3 0x42 0x6F
注意到,0x6F不是有效的碼字(即,它不存在於碼本800中)。這指示存在錯誤。作為第一步,codec解碼器可以嘗試改變弱位元遮罩中的第一位元。這樣做會產生新封包: 11010011110000110100001001101111
這對應於經解碼的碼字: 0xD3 0xC3 0x42 0x6F
0x6F仍然不是有效的碼字,這指示錯誤仍然存在。現在codec解碼器可以嘗試改變弱位元遮罩中的下一位元。這樣做會產生不同的新封包: 11000011110000110100001001100111
這對應於經解碼的碼字: 0xC3 0xC3 0x42 0x67
使用碼本800查找這些經解碼的碼字會產生經量化頻譜值群: 11, 11, 8, 4 (奇偶校驗 = 偶) → 正確。
該經量化頻譜值群具有偶校驗,這是期望的群奇偶校驗值。這確認了經量化頻譜值群是正確的。
以上示例解說了codec解碼器可以生成碼字群的多個經重構版本,並基於(1)與該碼字群的經重構版本相關聯的計算出的接收側奇偶校驗值與(2)預定群奇偶校驗值之間的匹配來選擇該碼字群的經重構版本之一。位元檢錯和糾錯技術可以利用附加資訊,諸如從多次傳輸的比較、CRC結果、用來編碼經量化譜線的碼本的知識等生成的弱位元遮罩。再次參照圖7,去量化器單元602可以使用諸如上述那些技術來檢測或糾正位元錯誤,以生成每個經量化譜線群的經糾正版本。
在上述某些實施例中,CRC被用來標識和/或以其他方式處置錯誤。然而,本公開的技術並不限於採納CRC的使用的實現。附加地或替換地,可以使用其他類型的糾錯編碼方案,包括Reed-Solomon碼、turbo碼、Viterbi算法等。
現在更詳細地描述去量化。根據本公開的實施例,去量化器單元602中的頻譜估計器704接收表示譜線的經量化值、捨入殘差值和奇偶校驗殘差值(如果它們可用的話)以及全域增益值(例如,10)。基於這些值,頻譜估計器704估計諸譜線組的去量化版本。根據各個實施例,經去量化譜線可被表示為浮點值或定點值。頻譜估計器704可以使用諸如內插、濾波等操作來這樣做,以構造諸譜線組。本質上,頻譜估計器704嘗試執行由通道的發射側的量化器單元204執行的量化步驟的逆操作。 DCT/MDCT 轉換
回到圖6,逆DCT單元604接收由去量化器單元602生成的經去量化譜線。如所討論的,代表全範圍頻率槽的一組譜線可以包括至多達400(或更多)條譜線。每條譜線可以對應於特定頻率槽並且可以反映對應頻率槽內的數位化音頻資料的幅度。逆DCT單元604可以對每組譜線執行逆轉換操作以生成音頻資料的時間受限的數位化樣本塊。例如,改進離散餘弦逆轉換(逆MDCT)可被表達為:
Figure 02_image005
(式2)
Figure 02_image007
式2中所呈現的逆MDCT操作對應於先前所討論的式1中所呈現的MDCT操作。由逆DCT單元604生成的經解壓縮音頻資料的數位化樣本被發送到圖1中所示的D/A和重構單元120。
如先前參照圖1所討論的,   D/A和重構單元120接收經解壓縮音頻資料的數位化樣本並執行數位類比轉換和重構(諸如濾波和/或解讀)以生成類比電訊號。類比電訊號被發送到揚聲器122,揚聲器122可以基於類比電訊號來產生聲波並將聲波投射到環境中。
圖9A呈現了解說根據本公開的一實施例的用於壓縮音頻資料的過程900和子過程920的流程圖。過程900包括步驟902、904、906、908和910。子過程920包括步驟922和924。在步驟902中,獲得音頻訊號的數位化樣本序列。這些數位化樣本可以例如從圖1中所示的樣本和A/D單元104獲得。在步驟904中,使用該數位化樣本序列來執行轉換,以生成多條譜線。該轉換可以是例如由圖2中的DCT單元202執行的MDCT。在步驟906中,從該多條譜線中獲得譜線群。解說性群在圖4中示出。在步驟908中,量化該譜線群以生成經量化值群。此處,量化該譜線群以生成經量化值群可以包括子過程920中的步驟。更具體地,在步驟922中,對從譜線群中選擇的譜線執行專用捨入運算。在步驟924中,使用該專用捨入運算來將針對經量化值群計算的群奇偶校驗值強制為預定奇偶校驗值。例如,在與圖3和圖4有關的描述中解說了使用此類專用捨入運算來將群奇偶校驗值強制為預定奇偶校驗值。返回過程900,在步驟910中,基於經量化值群輸出一個或多個資料幀。此類輸出的資料幀的示例在圖3中示出。
圖9B呈現了解說根據本公開的一實施例的用於解壓縮音頻資料的過程940的流程圖。過程940包括步驟942、944、946、948、950、952、954和956。在步驟942中,獲得一個或多個資料幀。例如,可以從圖1中的RX單元114或通道解碼器單元116獲得資料幀。在步驟944中,基於該一個或多個資料幀來獲得經量化值群。例如,可以獲得這些經量化值,作為圖7中所示的整數值。在步驟946中,針對經量化值群計算接收側奇偶校驗值。在步驟948中,將計算出的接收側奇偶校驗值與用於經量化值群的預定奇偶校驗值進行比較。在步驟950中,響應於檢測到計算出的接收側奇偶校驗值與用於經量化值群的預定奇偶校驗值之間的差異而執行位元錯誤運算以檢測或糾正該一個或多個資料幀中的至少一個位元錯誤。此類奇偶校驗值計算、比較和在位元錯誤運算中的使用的示例在圖8A和8B的上下文中進行描述。在步驟952中,在計及對該一個或多個資料幀中的該至少一個位元錯誤的檢測或糾正的情況下基於經量化值群來估計譜線群。該譜線群可以例如由圖7中的頻譜估計器單元704來估計。在步驟954中,可以使用包括該譜線群的多條譜線執行逆轉換以生成數位化樣本序列。該逆轉換可以例如由圖6中的逆DCT單元604來執行。在步驟956中,該數位化樣本序列可以作為音頻訊號的數位表示輸出。該數位化樣本序列可以例如由圖1中的codec解碼器118來輸出。
圖10是用戶裝備(UE)1000的實施例的方塊圖,UE 1000可以如本文所描述的實施例中所描述的並且與圖1-9相關聯地利用。UE 1000可以實現由圖1中的系統100演示的音頻路徑的各部分。在特定音頻路徑中,UE 1000的第一實例可以用作發射側,而UE 1000的第二實例可以用作接收側。在此類示例中,UE 1000的第一實例可以實現系統100的發射側組件,包括圖1中所示的麥克風102、取樣和A/D單元104、codec編碼器106、通道編碼器108以及發射硬體110。UE 1000的第二實例可以實現系統100的接收側組件,包括圖1中所示的接收機114、通道解碼器116、codec解碼器118、D/A和重構單元120以及揚聲器122。UE 1000也支持雙向通訊。由此,可以在相反方向上同時建立第二音頻路徑。在第二音頻路徑中,US 1000的第二實例可以用作發射側,並且UE 1000的第一實例可以用作接收側,以類似和鏡像的方式利用UE 1000的兩個實例內的組件。
應當注意,圖10僅旨在提供UE 1000的各種組件的一般性解說,UE 1000的各種組件中的任一者或全部可以被合適地利用。換言之,因為UE可在功能性上廣泛地變化,所以它們可以僅包括圖10中所示的組件的一部分。在一些實例中,由圖10所解說的組件可被局部化成單個實體設備和/或分佈在可設置在不同實體位置處的各種聯網設備之間。
UE 1000被示為包括可經由匯流排1005電耦接(或者可以合適地以其他方式處於通訊)的硬體元件。硬體元件可以包括(諸)處理單元1010,其可以包括但不限於一個或多個通用處理器、一個或多個專用處理器(諸如數位訊號處理(DSP)晶片、圖形加速處理器、專用積體電路(ASIC)等等)、和/或可被配置成執行本文中所描述的一個或多個方法的其它處理結構或裝置。如圖10中所示,一些實施例可取決於期望的功能性而具有單獨的DSP 1020。例如,處理單元和/或DSP 1020可以實現圖1中所示的codec編碼器106、通道編碼器108、通道解碼器116和代碼解碼器118。
UE 1000還可以包括一個或多個輸入設備1070,其可以包括但不限於一個或多個觸控螢幕、觸控板、麥克風、按鈕、撥號盤、開關等。例如,輸入設備1070可以包括圖1中所示的麥克風102以及取樣和A/C單元104。另外,UE 1000還可以包括一個或多個輸出設備1015,其可以包括但不限於一個或多個顯示器、發光二極體(LED)、揚聲器等。例如,輸出設備1015可以包括圖1中所示的D/A和重構單元120以及揚聲器122。
UE 1000還可包括無線通訊介面1030,該無線通訊介面1030可以包括但不限於數據機、網路卡、紅外線通訊設備、無線通訊設備、和/或晶片組(諸如藍牙®設備、IEEE 802.11設備、IEEE 802.15.4設備、WiFi設備、WiMAX™設備、蜂窩通訊設施等)等等,它們可以使得UE 1000能夠如本文中關於圖1-9所描述的那樣經由網路進行通訊。無線通訊介面1030可以准許與網路、eNB、ng-eNB、gNB、和/或其他網路組件、計算機系統、和/或本文中所描述的任何其他電子設備傳達資料。可以經由發送和/或接收無線訊號1034的一個或多個無線通訊天線1032來執行通訊。根據一些實施例,(諸)無線通訊天線1032可以包括多個離散的天線、天線陣列或其任何組合。
取決於所期望的功能性,無線通訊介面1030可以包括單獨的收發機、接收機和發射機、或收發機、發射機、和/或接收機的任何組合,以與基站(例如,eNB、ng-eNB和/或gNB)和其他地面收發機(諸如無線設備和存取點)進行通訊。例如,無線通訊介面1030可以實現圖1中所示的發射機110和接收機114。UE 1000可以與不同的資料網路進行通訊,這些資料網路可以包括各種網路類型。例如,無線廣域網(WWAN)可以是分碼多存取(CDMA)網路、分時多存取(TDMA)網路、分頻多存取(FDMA)網路、正交分頻多存取(OFDMA)網路、單載波分頻多存取(SC-FDMA)網路、WiMax(IEEE 802.16)等。CDMA網路可以實現一個或多個無線電存取技術(RAT),諸如cdma2000、寬頻CDMA(WCDMA)等。Cdma2000包括IS-95、IS-2000、和/或IS-856標準。TDMA網路可實現全球移動通訊系統(GSM)、數位高級行動電話系統(D-AMPS)、或某個其他RAT。OFDMA網路可以採用LTE、高級LTE、新無線電(NR)等等。在來自3GPP的文檔中描述了5G、LTE、高級LTE、NR、GSM、以及WCDMA。Cdma2000在來自名為「第三代夥伴項目2」(3GPP2)的組織的文獻中描述。3GPP和3GPP2文獻是公眾可獲取的。無線區域網(WLAN)也可以是IEEE 802.11x網路,而無線個域網(WPAN)可以是藍牙網路、IEEE 802.15x或某個其他類型的網路。本文中所描述的技術也可被用於WWAN、WLAN、和/或WPAN的任何組合。
UE 1000可進一步包括(諸)感測器1040。此類感測器可包括但不限於一個或多個慣性感測器(例如,(諸)加速度計、(諸)陀螺儀、和或其它慣性測量單元(IMU)、(諸)相機、(諸)磁力計、指南針、(諸)高度計、(諸)麥克風、(諸)鄰近度感測器、(諸)光感測器、氣壓計等,其中一些可被用於補充和/或促成本文中所描述的功能性。
UE 1000的各實施例還可以包括GNSS接收機1080,其能夠使用GNSS天線1082(在一些實現中可以與(諸)天線1032組合)從一個或多個GNSS衛星(例如,SV 190)接收訊號1084。此類定位可被用來補充和/或納入本文中所描述的技術。GNSS接收機1080可以使用常規技術來從GNSS系統(諸如全球定位系統(GPS)、伽利略、GLONASS、Compass、日本上方的準天頂衛星系統(QZSS)、印度上方的印度地區性導航衛星系統(IRNSS)、中國上方的北斗等)的GNSS SV(例如,SV 190)提取UE 1000的定位。此外,GNSS接收機1080可使用與一個或多個全球性和/或地區性導航衛星系統相關聯或者以其他方式被啟用以與一個或多個全球性和/或區域性導航衛星系統聯用的各種擴增系統(例如,基於衛星的擴增系統(SBAS))。作為示例而非限定,SBAS可包括提供完整性資訊、差分校正等的擴增系統,諸如舉例而言廣域擴增系統(WAAS)、歐洲對地靜止導航覆蓋服務(EGNOS)、多功能衛星擴增系統(MSAS)、GPS輔助地理擴增導航或GPS和地理擴增導航系統(GAGAN)等。由此,如本文中所使用的,GNSS可包括一個或多個全球性和/或地區性導航衛星系統和/或擴增系統的任何組合,並且GNSS訊號可包括GNSS、類GNSS、和/或與此類一個或多個GNSS相關聯的其他訊號。
UE 1000可進一步包括記憶體1060和/或與記憶體1060處於通訊。記憶體1060可包括但不限於本地和/或網路可訪問儲存、磁盤驅動器、驅動器陣列、光學儲存設備、固態儲存設備(諸如隨機存取記憶體(「RAM」)和/或唯讀記憶體(「ROM」)),其可以是可編程的、可快閃更新的等等。此類儲存設備可被配置成實現任何合適的資料儲存,包括但不限於各種文件系統、資料庫結構、和/或諸如此類。
UE 1000的記憶體1060還可包括軟體元件(未示出),這些軟體元件包括操作系統、設備驅動程式、可執行庫、和/或其他代碼(諸如一個或多個應用程式),這些軟體元件可包括由各個實施例提供的計算機程式、和/或可被設計成實現由其他實施例提供的方法、和/或配置由其他實施例提供的系統,如本文中所描述的。僅作為示例,關於以上討論的功能性描述的一個或多個規程可被實現為可由UE 1000執行的代碼和/或指令(例如,使用(諸)處理單元1010)。在一方面,那麼此類代碼和/或指令可以被用來配置和/或適配通用計算機(或者其他設備)來執行根據所描述的方法的一個或多個操作。
將對本領域技術人員顯而易見的是,可根據具體要求來作出實質性變型。例如,也可使用定制的硬體,和/或可在硬體、軟體(包括便攜式軟體,諸如小應用程式等)、或這兩者中實現特定元件。此外,可以採用到其他計算設備(諸如網路輸入/輸出設備)的連接。
參照附圖,可包括記憶體的組件可包括非瞬態機器可讀媒體。如本文中所使用的術語「機器可讀媒體」和「計算機可讀媒體」是指參與提供使機器以特定方式操作的資料的任何儲存媒體。在上文提供的實施例中,在向處理單元和/或(諸)其他設備提供指令/代碼以供執行時可能涉及各種機器可讀媒體。附加地或替換地,機器可讀媒體可以被用於儲存和/或攜帶此類指令/代碼。在許多實現中,計算機可讀媒體是實體和/或有形儲存媒體。此類媒體可採取許多種形式,包括但並不限於非易失性媒體、易失性媒體、和傳輸媒體。計算機可讀媒體的常見形式包括例如:磁性和/或光學媒體、穿孔卡、紙帶、具有孔圖案的任何其他實體媒體、RAM、PROM、EPROM、FLASH-EPROM、任何其他記憶體晶片或卡帶、下文中所描述的載波、或計算機能從其讀取指令和/或代碼的任何其他媒體。
本文所討論的方法、系統和設備是示例。各個實施例可合適地省略、替代、或添加各種規程或組件。例如,參考某些實施例所描述的特徵可在各種其他實施例中被組合。實施例的不同方面和要素可以按類似方式組合。本文中提供的附圖的各種組件可被體現在硬體和/或軟體中。而且,技術會演進,並且因此許多要素是示例,其不會將本公開的範圍限定於那些特定示例。
主要出於普遍使用的原因,將此類訊號稱為位元、資訊、值、元素、碼元、字符、變量、項、數量、數位等已證明有時是方便的。然而,應當理解,所有這些或類似術語要與合適實體量相關聯且僅僅是便利性標簽。除非另外具體聲明,否則如從以上討論顯而易見的,應領會,貫穿本說明書,利用諸如「處理」、「計算」、「演算」、「確定」、「查明」、「標識」、「關聯」、「測量」、「執行」等術語的討論是指特定裝置(諸如專用計算機或類似的專用電子計算設備)的動作或過程。因此,在本說明書的上下文中,專用計算機或類似的專用電子計算設備能夠操縱或轉換通常表示為該專用計算機或類似的專用電子計算設備的記憶體、暫存器、或其他資訊儲存設備、傳輸設備、或顯示設備內的實體量、電子量、電氣量或磁性量的訊號。
如本文中所使用的術語「和」和「或」可包括還預期至少部分地取決於使用此類術語的上下文的各種含義。另外,本文所使用的術語「一個或多個」可被用於描述單體的任何特徵、結構或特性,或者可被用於描述特徵、結構或特性的某種組合。然而,應當注意,這僅是解說性示例,並且所要求保護的主題內容不限於此示例。此外,術語「以下中的至少一者」如果被用於關聯一列表,諸如A、B或C,則可被解讀為表示A、B和/或C的任何組合,諸如A、AB、AA、AAB、AABBCCC等。
已描述了若干實施例,可以使用各種修改、替換構造和等價物而不會脫離本公開的精神。例如,以上元件可以僅是較大系統的組件,其中其他規則可優先於本發明的應用或者以其他方式修改本發明的應用。此外,可以在考慮以上要素之前、期間或之後採取數個步驟。相應地,以上描述並不限制本公開的範圍。
102:麥克風 104:取樣和A/D轉換單元 106:CODEC編碼器 108:通道編碼器 110:發射機 112:通道 114:接收機 116:通道解碼器、 118:CODEC解碼器 120:D/A和重構單元 122:揚聲器 204:量化器單元/量化器 302:除法單元 304:捨入 306:算術編碼器 602:去量化器 604:逆DCT 702:算術解碼器 704:頻譜估計器 900:過程 902, 904, 906, 908, 910:步驟 920:子過程 922, 924:步驟 940:過程 942, 944, 946, 948, 950, 952, 954, 956:步驟 1000:用戶裝備(UE) 1005:匯流排 1010:(諸)處理單元 1015:(諸)輸出設備 1020:DSP 1030:無線通訊介面 1032:無線通訊天線 1034:無線訊號 1040:(諸)感測器 1060:記憶體 1070:(諸)輸入設備 1080:GNSS接收機 1082:GNSS天線 1084:訊號
通過示例解說了本公開的各方面。
圖1呈現了可以納入本公開的一個或多個實施例的系統的簡化圖。
圖2呈現了根據本公開的各個實施例的codec編碼器的方塊圖;
圖3解說了根據本公開的一實施例的量化器單元的某些內部組件的示例。
圖4呈現了使用標準捨入規則執行的譜線量化所得到的量化誤差的示例的表。
圖5呈現了解說根據本公開的一實施例的奇偶校驗殘差值的生成的表。
圖6呈現了根據本公開的各個實施例的codec解碼器的方塊圖;
圖7解說了根據本公開的一實施例的去量化器單元的某些內部組件的示例。
圖8A示出了將譜線的可能經量化值映射到對應碼字的示例碼本。
圖8B呈現了示出通道的發射側可以如何量化對應於四個不同頻率槽的四條譜線的細節的表。
圖9A呈現了解說根據本公開的一實施例的用於壓縮音頻資料的過程和子過程的流程圖。
圖9B呈現了解說根據本公開的一實施例的用於解壓縮音頻資料的過程的流程圖。
圖10是用戶裝備(UE)的實施例的方塊圖,該UE可以如本文並且與圖1至圖9相關聯地所描述的實施例中所描述地來利用。
204:量化器單元
302:除法單元
304:捨入
306:算術編碼器

Claims (60)

  1. 一種用於壓縮音頻資料的方法,包括: 獲得音頻訊號的數位化樣本序列; 使用所述數位化樣本序列來執行轉換以生成多條譜線; 從所述多條譜線獲得譜線群; 量化所述譜線群以生成經量化值群; 其中量化所述譜線群以生成所述經量化值群包括: 對從所述譜線群中選擇的譜線執行專用捨入運算;以及 使用所述專用捨入運算來將針對所述經量化值群計算的群奇偶校驗值強制為預定奇偶校驗值;以及 基於所述經量化值群來輸出一個或多個資料幀。
  2. 如請求項1所述的方法,其中: 所述專用捨入運算是對與所選譜線相關聯的預捨入值執行的, 所述預捨入值包括浮點值或定點值,並且 所述經量化值群包括整數或定點值群。
  3. 如請求項2所述的方法,其中所述專用捨入運算使用於捨入與所選譜線相關聯的所述預捨入值的捨入方向翻轉,以將針對所述經量化值群計算的所述群奇偶校驗值強制為所述預定奇偶校驗值。
  4. 如請求項3所述的方法,其中所選譜線被選擇為與所述譜線群中的其他譜線相比,與具有到兩個最接近的可能經量化值之間的中點的最小距離的預捨入值相關聯。
  5. 如請求項4所述的方法,其中所選譜線是基於有利於較高頻率譜線的選擇偏倚來選擇的。
  6. 如請求項5所述的方法,其中在與具有到兩個最接近的可能經量化值之間的中點的第一距離的第一預捨入值相關聯的第一譜線同與具有到兩個最接近的可能經量化值之間的中點的第二距離的第二預捨入值相關聯的第二譜線之間的平局中,其中所述第一距離等於所述第二距離,則所述第一譜線被選擇以與所述轉換中比所述第二譜線高的頻率槽相關聯。
  7. 如請求項5所述的方法, 其中所述譜線群包括與第一頻率槽和第一預捨入值相關聯的第一譜線以及與第二頻率槽和第二預捨入值相關聯的第二譜線, 其中所述第一頻率槽對應於所述轉換中比所述第二頻率槽高的頻率槽, 其中所述第一預捨入值對應於兩個最接近的可能經量化值之間的第一距離,並且所述第二預捨入值對應於兩個最接近的可能經量化值之間的第二距離,所述第二距離小於所述第一距離,並且 其中所述第一譜線優於所述第二譜線被選擇。
  8. 如請求項1所述的方法,其中所述一個或多個資料幀包括基於所述經量化值群的碼字群。
  9. 如請求項8所述的方法,其中所述碼字群是使用算術編碼從所述經量化值群生成的。
  10. 如請求項8所述的方法,其中針對所述經量化值群中的至少一個經量化值,所述一個或多個資料幀進一步包括捨入殘差值。
  11. 如請求項10所述的方法,其中針對所述經量化值群中的所述至少一個經量化值,所述一個或多個資料幀進一步包括奇偶校驗殘差值。
  12. 如請求項11所述的方法,其中所述捨入殘差值和所述奇偶校驗殘差值代替填充位元被插入在所述一個或多個資料幀中。
  13. 如請求項1所述的方法,其中所述專用捨入運算被用來將從來自所述多條譜線中的譜線群序列量化的經量化值群序列強制成具有預定奇偶校驗值序列。
  14. 如請求項13所述的方法,其中所述預定奇偶校驗值序列被用作水印。
  15. 如請求項14所述的方法,其中所述水印象徵對所述專用捨入運算的使用。
  16. 如請求項15所述的方法,其中所述水印象徵在所述一個或多個資料幀中存在一個或多個奇偶校驗殘差值。
  17. 如請求項14所述的方法,其中所述水印與實現所述用於壓縮音頻資料的方法的設備的特定供應者相關聯。
  18. 如請求項1所述的方法,其中所述一個或多個資料幀維持與用於音頻資料壓縮的現有標準的相容性。
  19. 一種用於解壓縮音頻資料的方法,包括: 獲得一個或多個資料幀; 基於所述一個或多個資料幀來獲得經量化值群,其中所述經量化值群源自壓縮側量化過程,所述壓縮側量化過程涉及對譜線執行專用捨入運算以將針對所述經量化值群計算的奇偶校驗值強制為預定奇偶校驗值; 計算用於所述經量化值群的接收側奇偶校驗值; 將計算出的接收側奇偶校驗值與用於所述經量化值群的所述預定奇偶校驗值進行比較; 響應於檢測到計算出的接收側奇偶校驗值與用於所述經量化值群的所述預定奇偶校驗值之間的差異而執行位元錯誤運算以檢測或糾正所述一個或多個資料幀中的至少一個位元錯誤; 在計及對所述一個或多個資料幀中的所述至少一個位元錯誤的檢測或糾正的情況下基於所述經量化值群來估計譜線群; 使用包括所述譜線群的多條譜線執行逆轉換以生成數位化樣本序列;以及 輸出所述數位化樣本序列作為音頻訊號的數位表示。
  20. 如請求項19所述的方法,其中: 所述一個或多個資料幀包括碼字群,並且 所述位元錯誤運算被執行以檢測或糾正所述碼字群中的至少一個位元錯誤。
  21. 如請求項20所述的方法,其中所述碼字群中的所述至少一個位元錯誤通過以下操作來糾正: 獲得所述碼字群的多次傳輸; 生成所述碼字群的多個經重構版本;以及 基於(1)與所述碼字群的一個經重構版本相關聯的計算出的接收側奇偶校驗值與(2)所述預定奇偶校驗值之間的匹配來從所述碼字群的所述多個經重構版本中選擇所述碼字群的所述一個經重構版本。
  22. 如請求項21所述的方法, 其中指示可能位元錯誤的位置的弱位元遮罩是通過比較所述碼字群的所述多次傳輸來生成的;並且 其中所述碼字群的所述多個經重構版本中的每一者是通過改變由所述弱位元遮罩指示的位元位置中的一者處的位元來重構的。
  23. 如請求項22所述的方法, 其中所述碼字群的所述多次傳輸包括(1)所述碼字群的原始傳輸和(2)所述碼字群的一次或多次重傳。
  24. 如請求項23所述的方法,其中所述碼字群的所述一次或多次重傳中的每一者是由與所述碼字群的先前傳輸相關聯的失敗CRC觸發的。
  25. 如請求項20所述的方法,其中所述經量化值群是使用算術解碼從所述碼字群生成的。
  26. 如請求項20所述的方法,其中針對所述經量化值群中的至少一個經量化值,所述一個或多個資料幀進一步包括捨入殘差值。
  27. 如請求項26所述的方法,其中針對所述經量化值群中的所述至少一個經量化值,所述一個或多個資料幀進一步包括奇偶校驗殘差值。
  28. 如請求項27所述的方法,其中所述捨入殘差值和所述奇偶校驗殘差值是從所述一個或多個資料幀中填充位元的位置提取的。
  29. 如請求項27所述的方法,其中來自所述譜線群的譜線是通過計及所述捨入殘差值和所述奇偶校驗殘差值來以增加的解析度估計的。
  30. 如請求項29所述的方法, 其中所述捨入殘差值指示針對所述譜線的第一估計值範圍,並且所述奇偶校驗殘差值指示針對所述譜線的與所述第一估計範圍毗鄰的第二估計值範圍,並且 其中所述譜線是基於所述第二估計值範圍來估計的。
  31. 如請求項19所述的方法,其中奇偶校驗值序列是從基於所述一個或多個資料幀獲得的經量化值群序列來計算的。
  32. 如請求項31所述的方法,其中所述預定奇偶校驗值序列被用作水印。
  33. 如請求項32所述的方法,其中所述水印象徵在所述一個或多個資料幀中存在一個或多個奇偶校驗殘差值。
  34. 一種用於壓縮音頻資料的編碼器,包括: 轉換計算設備,其被配置成接收音頻訊號的數位化樣本序列,並使用所述音頻訊號的所述數位化樣本序列來計算轉換以生成多條譜線;以及 量化器,其被配置成從所述多條譜線獲得譜線群,並量化所述譜線群以生成經量化值群, 其中所述量化器被配置成通過對從所述譜線群中選擇的譜線執行專用捨入運算來量化所述譜線群以生成所述經量化值群, 其中所述量化器被配置成使用所述專用捨入運算來將針對所述經量化值群計算的群奇偶校驗值強制為預定奇偶校驗值,並且 其中所述量化器被進一步配置成基於所述經量化值群來輸出一個或多個資料幀。
  35. 如請求項34所述的編碼器,其中: 所述量化器被配置成對與所選譜線相關聯的預捨入值執行所述專用捨入運算, 所述預捨入值包括浮點值或定點值,並且 所述經量化值群包括整數或定點值群。
  36. 如請求項35所述的編碼器,其中所述專用捨入運算使用於捨入與所選譜線相關聯的所述預捨入值的捨入方向翻轉,以將針對所述經量化值群計算的所述群奇偶校驗值強制為所述預定奇偶校驗值。
  37. 如請求項36所述的編碼器,其中所選譜線被選擇為與所述譜線群中的其他譜線相比,與具有到兩個最接近的可能經量化值之間的中點的最小距離的預捨入值相關聯。
  38. 如請求項37所述的編碼器,其中所選譜線是基於有利於較高頻率譜線的選擇偏倚來選擇的。
  39. 如請求項38所述的編碼器,其中在與具有到兩個最接近的可能經量化值之間的中點的第一距離的第一預捨入值相關聯的第一譜線同與具有到兩個最接近的可能經量化值之間的中點的第二距離的第二預捨入值相關聯的第二譜線之間的平局中,其中所述第一距離等於所述第二距離,則所述第一譜線被選擇以與所述轉換中比所述第二譜線高的頻率槽相關聯。
  40. 如請求項38所述的編碼器, 其中所述譜線群包括與第一頻率槽和第一預捨入值相關聯的第一譜線以及與第二頻率槽和第二預捨入值相關聯的第二譜線, 其中所述第一頻率槽對應於所述轉換中比所述第二頻率槽高的頻率槽, 其中所述第一預捨入值對應於兩個最接近的可能經量化值之間的第一距離,並且所述第二預捨入值對應於兩個最接近的可能經量化值之間的第二距離,所述第二距離小於所述第一距離,並且 其中所述第一譜線優於所述第二譜線被選擇。
  41. 如請求項34所述的編碼器,其中所述一個或多個資料幀包括基於所述經量化值群的碼字群。
  42. 如請求項41所述的編碼器,其中所述量化器被配置成使用算術編碼從所述經量化值群生成所述碼字群。
  43. 如請求項41所述的編碼器,其中針對所述經量化值群中的至少一個經量化值,所述一個或多個資料幀進一步包括捨入殘差值。
  44. 如請求項43所述的編碼器,其中針對所述經量化值群中的所述至少一個經量化值,所述一個或多個資料幀進一步包括奇偶校驗殘差值。
  45. 如請求項44所述的編碼器,其中所述量化器被配置成將所述捨入殘差值和所述奇偶校驗殘差值代替填充位元插入在所述一個或多個資料幀中。
  46. 如請求項35所述的編碼器,其中所述量化值被配置成使用所述專用捨入運算來將從來自所述多條譜線中的譜線群序列量化的經量化值群序列強制成具有預定奇偶校驗值序列。
  47. 一種用於解壓縮音頻資料的解碼器,包括: 去量化器,其被配置成接收一個或多個資料幀,並基於所述一個或多個資料幀來獲得經量化值群,其中所述經量化值群源自壓縮側量化過程,所述壓縮側量化過程涉及對譜線執行專用捨入運算以將針對所述經量化值群計算的奇偶校驗值強制為預定奇偶校驗值, 其中所述去量化器被進一步配置成計算用於所述經量化值群的接收側奇偶校驗值, 其中所述去量化器被進一步配置成將計算出的接收側奇偶校驗值與用於所述經量化值群的所述預定奇偶校驗值進行比較, 其中所述去量化器被進一步配置成響應於檢測到計算出的接收側奇偶校驗值與用於所述經量化值群的所述預定奇偶校驗值之間的差異而執行位元錯誤運算以檢測或糾正所述一個或多個資料幀中的至少一個位元錯誤,以及 其中所述去量化器被進一步配置成在計及對所述一個或多個資料幀中的所述至少一個位元錯誤的檢測或糾正的情況下基於所述經量化值群來估計譜線群;以及 逆轉換計算設備,其被配置成使用包括所述譜線群的多條譜線執行逆轉換以生成並輸出數位化樣本序列作為音頻訊號的數位表示。
  48. 如請求項47所述的解碼器,其中: 所述一個或多個資料幀包括碼字群,並且 所述位元錯誤運算被執行以檢測或糾正所述碼字群中的至少一個位元錯誤。
  49. 如請求項48所述的解碼器,其中所述去量化器被配置成通過以下操作來糾正所述碼字群中的所述至少一個位元錯誤: 獲得所述碼字群的多次傳輸; 生成所述碼字群的多個經重構版本;以及 基於(1)與所述碼字群的一個經重構版本相關聯的計算出的接收側奇偶校驗值與(2)所述預定奇偶校驗值之間的匹配來從所述碼字群的所述多個經重構版本中選擇所述碼字群的所述一個經重構版本。
  50. 如請求項49所述的解碼器, 其中所述去量化器被配置成通過比較所述碼字群的所述多次傳輸來生成指示可能位元錯誤的位置的弱位元遮罩;以及 其中所述去量化器被配置成通過改變由所述弱位元遮罩指示的位元位置中的一者處的位元來重構所述碼字群的所述多個經重構版本中的每一者。
  51. 如請求項48所述的解碼器,其中所述去量化器被配置成使用算術解碼從所述碼字群生成整數群。
  52. 如請求項48所述的解碼器,其中針對所述經量化值群中的至少一個經量化值,所述一個或多個資料幀進一步包括捨入殘差值。
  53. 如請求項52所述的解碼器,其中針對所述經量化值群中的所述至少一個經量化值,所述一個或多個資料幀進一步包括奇偶校驗殘差值。
  54. 如請求項53所述的解碼器,其中所述去量化器被配置成從所述一個或多個資料幀中填充位元的位置中提取所述捨入殘差值和所述奇偶校驗殘差值。
  55. 如請求項53所述的解碼器,其中所述去量化器被配置成通過計及所述捨入殘差值和所述奇偶校驗殘差值以增加的解析度來估計來自所述譜線群的譜線。
  56. 如請求項55所述的解碼器, 其中所述捨入殘差值指示針對所述譜線的第一估計值範圍,並且所述奇偶校驗殘差值指示針對所述譜線的與所述第一估計範圍毗鄰的第二估計值範圍,並且 其中所述去量化器被配置成基於所述第二估計值範圍來估計所述譜線。
  57. 一種其中儲存供一個或多個處理單元執行的指令的非瞬態計算機可讀媒體,包括用於以下操作的指令: 獲得音頻訊號的數位化樣本序列; 使用所述數位化樣本序列來執行轉換以生成多條譜線; 從所述多條譜線獲得譜線群; 量化所述譜線群以生成經量化值群; 其中用於量化所述譜線群以生成所述經量化值群的指令包括用於以下操作的指令: 對從所述譜線群中選擇的譜線執行專用捨入運算;以及 使用所述專用捨入運算來將針對所述經量化值群計算的群奇偶校驗值強制為預定奇偶校驗值;以及 基於所述經量化值群來輸出一個或多個資料幀。
  58. 一種其中儲存供一個或多個處理單元執行的指令的非瞬態計算機可讀媒體,包括用於以下操作的指令: 獲得一個或多個資料幀; 基於所述一個或多個資料幀來獲得經量化值群,其中所述經量化值群源自壓縮側量化過程,所述壓縮側量化過程涉及對譜線執行專用捨入運算以將針對所述經量化值群計算的奇偶校驗值強制為預定奇偶校驗值; 計算用於所述經量化值群的接收側奇偶校驗值; 將計算出的接收側奇偶校驗值與用於所述經量化值群的所述預定奇偶校驗值進行比較; 響應於檢測到計算出的接收側奇偶校驗值與用於所述經量化值群的所述預定奇偶校驗值之間的差異而執行位元錯誤運算以檢測或糾正所述一個或多個資料幀中的至少一個位元錯誤; 在計及對所述一個或多個資料幀中的所述至少一個位元錯誤的檢測或糾正的情況下基於所述經量化值群來估計譜線群; 使用包括所述譜線群的多條譜線執行逆轉換以生成數位化樣本序列;以及 輸出所述數位化樣本序列作為音頻訊號的數位表示。
  59. 一種用於壓縮音頻資料的系統,包括: 用於獲得音頻訊號的數位化樣本序列的構件; 用於使用所述數位化樣本序列來執行轉換以生成多條譜線的構件; 用於從所述多條譜線獲得譜線群的構件; 用於量化所述譜線群以生成經量化值群的構件; 其中用於量化所述譜線群以生成所述經量化值群的構件包括: 用於對從所述譜線群中選擇的譜線執行專用捨入運算的構件;以及 用於使用所述專用捨入運算來將針對所述經量化值群計算的群奇偶校驗值強制為預定奇偶校驗值的構件;以及 用於基於所述經量化值群來輸出一個或多個資料幀的構件。
  60. 一種用於解壓縮音頻資料的系統,包括: 用於獲得一個或多個資料幀的構件; 用於基於所述一個或多個資料幀來獲得經量化值群的構件,其中所述經量化值群源自壓縮側量化過程,所述壓縮側量化過程涉及對譜線執行專用捨入運算以將針對所述經量化值群計算的奇偶校驗值強制為預定奇偶校驗值; 用於計算用於所述經量化值群的接收側奇偶校驗值的構件; 用於將計算出的接收側奇偶校驗值與用於所述經量化值群的所述預定奇偶校驗值進行比較的構件; 用於響應於檢測到計算出的接收側奇偶校驗值與用於所述經量化值群的所述預定奇偶校驗值之間的差異而執行位元錯誤運算以檢測或糾正所述一個或多個資料幀中的至少一個位元錯誤的構件; 用於在計及對所述一個或多個資料幀中的所述至少一個位元錯誤的檢測或糾正的情況下基於所述經量化值群來估計譜線群的構件; 用於使用包括所述譜線群的多條譜線執行逆轉換以生成數位化樣本序列的構件;以及 用於輸出所述數位化樣本序列作為音頻訊號的數位表示的構件。
TW110112445A 2020-06-11 2021-04-06 串流一致式位元容錯性 TW202205260A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US16/899,532 US11348594B2 (en) 2020-06-11 2020-06-11 Stream conformant bit error resilience
US16/899,532 2020-06-11

Publications (1)

Publication Number Publication Date
TW202205260A true TW202205260A (zh) 2022-02-01

Family

ID=75674966

Family Applications (1)

Application Number Title Priority Date Filing Date
TW110112445A TW202205260A (zh) 2020-06-11 2021-04-06 串流一致式位元容錯性

Country Status (9)

Country Link
US (2) US11348594B2 (zh)
EP (1) EP4165631A1 (zh)
JP (1) JP2023529655A (zh)
KR (1) KR20230023634A (zh)
CN (1) CN115702452A (zh)
BR (1) BR112022024307A2 (zh)
CL (1) CL2022003498A1 (zh)
TW (1) TW202205260A (zh)
WO (1) WO2021252051A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11348594B2 (en) 2020-06-11 2022-05-31 Qualcomm Incorporated Stream conformant bit error resilience

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5822458A (en) * 1995-02-06 1998-10-13 The Regents Of The University Of California Precomputing and encoding compressed image enhancement instructions
EP1104969B1 (en) 1999-12-04 2006-06-14 Deutsche Thomson-Brandt Gmbh Method and apparatus for decoding and watermarking a data stream
US7986441B2 (en) 2007-04-04 2011-07-26 Wong Technologies L.L.C. Embedding watermark into halftone image with low distortion using parity values for overlapping groups of candidate sites
EP2146343A1 (en) * 2008-07-16 2010-01-20 Deutsche Thomson OHG Method and apparatus for synchronizing highly compressed enhancement layer data
US20110075724A1 (en) * 2009-09-29 2011-03-31 Qualcomm Incorporated Encoding parameters with unit sum
US9190065B2 (en) * 2012-07-15 2015-11-17 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for three-dimensional audio coding using basis function coefficients
ES2613747T3 (es) * 2013-01-08 2017-05-25 Dolby International Ab Predicción basada en modelo en un banco de filtros críticamente muestreado
AU2014211539B2 (en) * 2013-01-29 2017-04-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Low-complexity tonality-adaptive audio signal quantization
US9690656B2 (en) * 2015-02-27 2017-06-27 Microsoft Technology Licensing, Llc Data encoding on single-level and variable multi-level cell storage
US10225562B1 (en) * 2017-08-21 2019-03-05 Google Llc Embedding information about EOB positions
US11348594B2 (en) 2020-06-11 2022-05-31 Qualcomm Incorporated Stream conformant bit error resilience

Also Published As

Publication number Publication date
US11823692B2 (en) 2023-11-21
CL2022003498A1 (es) 2023-08-18
US11348594B2 (en) 2022-05-31
US20220284911A1 (en) 2022-09-08
CN115702452A (zh) 2023-02-14
WO2021252051A1 (en) 2021-12-16
KR20230023634A (ko) 2023-02-17
US20210390966A1 (en) 2021-12-16
JP2023529655A (ja) 2023-07-11
EP4165631A1 (en) 2023-04-19
BR112022024307A2 (pt) 2022-12-27

Similar Documents

Publication Publication Date Title
TWI466102B (zh) 用以使經編碼音訊資料之錯誤消隱的方法和裝置
TWI587640B (zh) 用於音訊/視訊樣本向量之錐型向量量化檢索/解檢索之方法及裝置
TWI474660B (zh) 用於編碼及偵測浮水印信號之裝置
KR101548846B1 (ko) 워터마킹된 신호의 적응적 인코딩 및 디코딩을 위한 디바이스
US20050192799A1 (en) Lossless audio decoding/encoding method, medium, and apparatus
US10504525B2 (en) Adaptive forward error correction redundant payload generation
US20100324914A1 (en) Adaptive Encoding of a Digital Signal with One or More Missing Values
EP2673773B1 (en) Devices, methods, computer program for generating, and decoding a watermarked audio signal
JP5123516B2 (ja) 復号装置、符号化装置、復号方法及び符号化方法
JP2022520609A (ja) オーディオ送信プロセッサ、オーディオ受信プロセッサ、および関連方法ならびにコンピュータプログラム
TW201216254A (en) Coding and decoding a transient frame
TWI392267B (zh) 提供線性消除碼之方法與裝置
US11823692B2 (en) Stream conformant bit error resilience
US8781023B2 (en) Method and apparatus for improving transmission of data on a bandwidth expanded channel
CN110770822A (zh) 音频信号编码和解码
JP2006229693A (ja) 符号化装置、復号化装置、送信装置、受信装置および符号化方法
KR100947065B1 (ko) 무손실 오디오 부호화/복호화 방법 및 장치
JP2000244460A (ja) 伝送路誤り符号付加・検出装置