TWI363563B - Encoder, decoder and methods for encoding and decoding data segments representing a time-domain data stream - Google Patents

Encoder, decoder and methods for encoding and decoding data segments representing a time-domain data stream Download PDF

Info

Publication number
TWI363563B
TWI363563B TW096147145A TW96147145A TWI363563B TW I363563 B TWI363563 B TW I363563B TW 096147145 A TW096147145 A TW 096147145A TW 96147145 A TW96147145 A TW 96147145A TW I363563 B TWI363563 B TW I363563B
Authority
TW
Taiwan
Prior art keywords
data
time domain
frequency domain
domain
encoded
Prior art date
Application number
TW096147145A
Other languages
English (en)
Other versions
TW200841743A (en
Inventor
Ralf Geiger
Max Neuendorf
Yoshikazu Yokotani
Nikolaus Rettelbach
Juergen Herre
Stephan Geyersberger
Original Assignee
Fraunhofer Ges Forschung
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Ges Forschung filed Critical Fraunhofer Ges Forschung
Publication of TW200841743A publication Critical patent/TW200841743A/zh
Application granted granted Critical
Publication of TWI363563B publication Critical patent/TWI363563B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/31Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7847Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content
    • G06F16/7864Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content using domain-transform features, e.g. DCT or wavelet transform coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/2368Multiplexing of audio and video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/238Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
    • H04N21/2383Channel coding or modulation of digital bit-stream, e.g. QPSK modulation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/266Channel or content management, e.g. generation and management of keys and entitlement messages in a conditional access system, merging a VOD unicast channel into a multicast channel
    • H04N21/2662Controlling the complexity of the video stream, e.g. by scaling the resolution or bitrate of the video stream based on the client capabilities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • H04N21/4341Demultiplexing of audio and video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/438Interfacing the downstream path of the transmission network originating from a server, e.g. retrieving encoded video stream packets from an IP network
    • H04N21/4382Demodulation or channel decoding, e.g. QPSK demodulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Databases & Information Systems (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

1363563 九、發明說明: 【發明所屬之技術領域】 本發明係屬於編碼的領域,其中將被編碼的資料之不 同的特性,係使用於編碼率,如同例如在視頻以及音頻編 碼中的情況。 【先前技術】 當前技術的編碼策略利用將被編碼之資料串流的特 性。例如,在音頻編碼中,使用感知模型,以在幾乎不會 有顯著的品質降低,以及當重新播放時不會有降級的情況 下,對原始資料進行壓縮。現代的感知音頻編碼架構,舉 例而言,例如 MPEG 2/4 AAC(MPEG = Moving Pictures Expert Group,動畫專家群,AAC = Advanced Audio Coding,進階音 頻編碼),參照動畫以及相伴音頻的同屬編碼:進階音頻編 碼,國際標準 13818-7,ISO/IEC JTC1/SC29/WG11 動畫專家 群,1 997,可以使用濾波器組,例如該修正型離散餘弦變 換(Modified Discrete Cosine Transform,MDCT),用以在頻 域中表示該音頻信號。 在頻域中,可以依據感知模型,進行頻率係數的量化, 這樣的編碼器,對於一般的音頻信號類型’例如音樂,可 以提供優越的感知音頻品質。另一方面,現代的語音編碼 器,舉例而言,例如 ACELP(ACELP = Algebraic Code Excited Linear Prediction,代數碼激發線性預測),使用一種預測的 方式,並且利用此種方式可以在時域中表示該音頻/語音信 號。這樣的語音編碼器,可以建立人類的語音製作程序, 1363563 亦即人類聲道之特性的模型,並且因此可以利用較低的位 元率即可達成優越的語音信號的性能。反之,感知音頻編 碼器,對於以低位元率編碼的語音,無法達到語音編碼器 所能提供之性能水準,並且使用語音編碼器來表示一般的 音頻信號/音樂,會造成顯著的品質減損。 傳統的槪念提供一種階層式的組合,其中全部的局部 編碼器總是有作用的,亦即時域以及頻域編碼器,以及該 最終的輸出信號係藉著,組合該等局部編碼器對於一個給 定的處理過之時間資訊框的貢獻,計算而得。階層式編碼 的一個普遍的實例,係MPEG-4可擴縮語音/音頻編碼,具 有一語音編碼器作爲該基底層,以及一濾波器組爲基礎之 強化層,參見 Bernhard Grill, Karlheinz Brandenburg, “A T wo - or Three Stage Bit-Rate Scalable Audio Coding System,"(一種兩階段或者三階段的位元率可擴縮音頻編 碼系統),預印本第4132號,第99次AES會議(西元1995 年九月)。 傳統的頻域編碼器可以利用 MDCT濾波器組。因爲 MDCT優秀的特性,其已經成爲用於傳統的感知音頻編碼 器之最具優勢的濾波器組。舉例而言,其可以在處理的區 塊之間,提供平滑的交錯淡出。既使例如由於頻譜係數的 量化使得在每一個處理區塊中的信號皆以不同的方式改變 的情況中,也不會產生因爲該視窗型重疊/加法運算,由於 區塊與區塊之間的突然轉移,所造成的區塊人爲效應。該 1363563 MDCT係使用時域混疊效應消去(time-domain aliasing cancellation,TDAC)的槪念。 該MDCT係一種以第四類型的離散餘弦變換爲基礎的 傅立葉相關變換,具有部分重疊之額外的性質。其係設計 用以在一較大的資料集合的連續區塊中執行,其中相鄰的 區塊係互相重疊的,使得一個區塊的後半部,係與下一個 區塊的前半部重疊。這樣的重疊,除了該DCT的能量緊密 品質之外,係使得MDCT對於信號壓縮的應用係特別有吸 引力的,因爲其有助於避免起源於區塊邊界的該人爲效 應。作爲一種重疊型變換,與其它的傅立葉相關的變換相 較之下,該MDCT係有些許不尋常,在於其輸出的個數僅 有輸入個數的一半,而非與輸入個數相同。特別地,2N個 實數係轉換成N個實數,其中N係一個正整數。 該反MDCT也稱之爲IMDCT,因爲輸入與輸出個數不 相同,在乍看之下,該MDCT似乎是不可逆的。然而,可 以藉著加上隨後的數個重疊區塊之重疊IMDCTs,使得誤差 可以消去並且恢復原始的資料,亦即達成TDAC,以達成完 美的可逆性。 利用這種方法,在一濾波器組的輸出處的頻譜値的個 數,會等於在其輸入處的時域輸入値的個數,這同時也稱 之爲臨界取樣(critical sampling)。 MDCT濾波器組可以提供一種高頻率選擇性,並且能 夠得到高的編碼增益。區塊以及臨界採樣的重疊特性,可 1363563 以藉著使用時域混疊效應消除技術而達成,參見I. princen, A. Bradley, “Analysis/Synthesis Filter Band Design Based on Time Domain Aliasing Cancellation,"(基於時域混疊效 應消除之分析/合成濾波器組設計)IEEE Trans. ASSP, ASSP-34(5 ): 1 1 5 3 - 1 1 6 1,西元 1 986 年。第 4 圖描繪 MDCT 的這些效應,第4圖係顯示一個MDCT輸入信號,係以沿 著在頂端的一個時間軸400上的一個脈衝來表示。該輸入 信號400接著再利用兩個連續的視窗化程序,以及MDCT 區塊進行轉換,其中該等視窗410,係描繪於第4圖中該輸 入信號400的下方。該等反轉換之後的個別的視窗型信號, 係在第4圖中以該等時間線420以及425顯示。 在該反MDCT之後,該第一區塊係可產生具有正號的 一個混疊成分420,該第二區塊係產生具有相同的大小但是 具有負號的一個混疊成分425,這些混疊成分在這兩個輸出 信號420以及425相加之後對消,如同在第4圖的底部, 在該最終輸出430處所顯示的。 在『延伸適應性多速率寬頻(Extended Adaptive Multi-Rate—Wideband,AMR-WB + )編解碼器』3GPP TS 26.290V6.3.0 , 2005 -06 技術規範中,係載明該 AMR-WB + (AMR-WB = Adaptive M u 11 i - R a t e W i de b a n d)編解碼 器。依據第5.2節,該AMR-WB +核心的編碼演算法,係以 一混合 ACELP/TCX(TCX = Transform Coded Excitation,變換 編碼激發)模型爲基礎。對於輸入信號的每一個區塊,該編 1363563 :編碼 :一種 。該 TCX 型的 變換 :編碼 > 可 疊程 ,及對 1此, :經過 丨入樣 5_0中 第三 )。每 的重 ,,該 碼器可以利用開迴路或者閉迴路的模式,決定哪一種 模式,亦即ACELP或者TCX,係最佳的。該ACELP係 時域、預測編碼器,最適合於語音以及暫態信號 AMR-WB編碼器係用於ACELP模式中。另一方面,該 模型係一種變換爲基礎的編碼器,並且較爲適合於典 音樂樣本。
更具體而言,該 AMR-WB+使用離散傅立葉 (Discrete Fourier Transform,DCT),用於該 TCX 轉換 模式。爲了在相鄰的區塊之間,達成一種平滑的轉移 以使用一個視窗化以及重疊程序。此視窗化以及重 序,對於不同的編碼模式(TCX/ACELP)之間的轉移,以 於連續的TCX資訊框之間的轉移兩者皆係必要的。g 該DFT與該視窗化以及重疊程序合在一起係表示並沐 臨界取樣的一濾波器組。該濾波器組產生較該新的鞴 本數量更多的頻率數値,參見在3GPP TS 26.290V6.: 的第 4 圖(3GPP = Third Generation Partnership Project, 代夥伴計畫,TS = Technical Specification,技術規範 一個TCX資訊框,係使用該資訊框長度的八分之一 疊,該資訊框長度係等於新的輸入樣本的個數;因Itt DFT對應的長度係爲該資訊框長度的9/8。
考慮在該TCX中的該非臨界取樣的DFT濾波器組,亦 即,在該濾波器組的輸出處之頻譜値的個數係大於在其輸 入處之時域輸入値的個數,此頻域編碼模式係與例如AAC 1363563 (A AC = Advanced Audio Coding,進階音頻編碼)等使用 MDCT,一種臨界取樣的重疊變換之音頻編解碼器不同的。 杜比 E(Dolby E)編解碼器,係在 Fielder, Louis D.; Todd, Craig C., “The Design of a Video Friendly Audio Coding System for Distributing Applications,” (用於分散式應用 之適合於視頻之音頻編碼系統的設計)論文編號1 7-008, AES第17次國際會議:高品質音頻編碼(西元1 999年八 月),以及 Fielder, Louis D·; Davidson, Grant A·, “Audio Coding Tools for Digital Television Distribution,” (用於 數位電視散佈之音頻編碼工具)預印本第5104號,AES第 108次會議(西元2000年一月)中敘述,該杜比E編解碼器 係使用MDCT濾波器組。在此編碼架構的設計中,其焦點 係特別放在,在該編碼領域中直接進行編輯的可能性。爲 了達成這個目標,係使用特殊的無混疊效應的視窗。在這 些視窗的邊界,不同的信號部分之平滑的交錯淡出或者疊 接係可能的。在前文中所參考的文件中,例如參照” The Design of a Video Friendly Audio Coding System for Distribution 'Applications,”第三節中所槪略描述的,這在 僅單純地使用會引入時域混疊效應的一般的MDCT視窗時 係不可能的。然而,其中也指出,爲了移除混疊效應,所 需要的代價係變換係數的數量增加,這個結果係指出所得 到的濾波器組將不在具有臨界取樣的性質。 【發明內容】 -10- 1363563 本發明的目的係提供一種更有 解碼資料區段的槪念。 此目的可以利用如申請專利範 碼的裝置、如申請專利範圍第 22 法、如申請專利範圍第24項之一種 串流的裝置以及如申請專利範圍第 編碼過的資料串流的方法來達成。 本發明係基於可以藉由分別使 編碼器以及解碼器,以有效的利用 碼槪念的這個發現。可以藉著將時 換至頻域,並且藉著將轉換之後所 收到的已經解碼過的頻域資料組合 該時間混疊效應的問題。所需要的 施行於資料區段的重疊視窗之重疊 領域的變化而減低。當使用時域編 時域編碼切換或者切換至時域編碼 區域的視窗係有利的。 本發明的數個具體實施例可以 碼以及解碼槪念,對於全部的輸入 號以及音樂信號,皆可以達成更加 例可以善加利用組合多種編碼方法 碼槪念的優點。具體實施例可以有 礎以及時域爲基礎的編碼槪念,形 效率的’用於編碼以及 圍第1項之一種用以解 項之一種用以解碼的方 用以產生編碼過的資料 35項之一種用以產生 用組合式的時域與頻域 更有效率的編碼以及解 域資料在該解碼器中轉 得到的頻域資料與所接 在一起’以有效的對抗 間接費用可以藉著改變 區域,使其適合於編碼 碼時,以及當各自地從 時,採用具有較小重疊 提供一種通用的音頻編 信號類型,例如語音信 改進的性能。具體實施 ,例如時域以及頻域編 效地組合濾波器組爲基 成單一的方案。本發明 -11 - 1363563 的數個具體實施例可以得到一種組合式的編解碼器,可以 例如在用於音樂類型的音頻內容的音頻編解碼器,以及用 於語音類型的內容之語音編解碼器之間切換,具體實施例 可以頻繁地使用這種切換機制,特別係對於混合的內容。 本發明的數個具體實施例,係具備在切換時不會產生 人爲效應的優點。在許多具體實施例中,對於一個切換程 序,額外的傳送資料或者額外的編碼樣本的總量,可以最 小化以避免在此運作階段中,減低效率性。利用此種方式, 局部編碼器的切換式組合的槪念,係與全部的局部編碼器 總是在作用中的該階層式組合不同的。 【實施方式】 在下文中,本發明的數個具體實施例,將參考於所伴 隨的圖示,更詳細的敘述。 第la圖顯示一種裝置1〇〇,用以解碼表示一時域資料 串流、在時域中或者在頻域中編碼的資料區段、在頻域中 編碼並且具有表示時域資料樣本的重疊且連續的區塊之連 續資料區塊的一個資料區段的多數個資料區段的。這個資 料串流可以例如對應於一音頻串流’其中該等資料區塊中 的一部分係在時域中編碼’並且其它的部分係在頻域中編 碼。在頻域中編碼的資料區塊或者區段’可以表示重疊的 資料區塊之時域資料樣本。 該裝置100包含一時域解碼器110,用以解碼在時域中 編碼之資料區段。此外’該裝置100包含—處理器120 ’用 -12- 1363563 以處理在頻域中編碼之該資料區段,以及該時域解® 的輸出資料,以獲得重疊的時域資料區塊。此外, 100包含一種重疊/加法組合器13〇,用以組合該等 時域資料區塊,以獲者該時域資料串流的該等已解 資料區段。 第lb圖係描繪該裝置100的另一個具體實施例 體實施例中,該處理器120可以包含一種頻域解碼f 用以解碼在頻域中編碼之資料區段,以獲得頻域 段。此外,在數個具體實施例中,該處理器120可 —時域至頻域轉換器124,用以轉換該時域解碼器1 輸出資料,以獲得轉換過的頻域資料區段。 此外,在數個具體實施例中,該處理器120可 一種頻域組合器126,用以組合該等頻域區段以及該 之後的頻域資料區段,以獲得一頻域資料串流。該 120,可以另外再包含一種頻域至時域轉換器128, 該頻域資料串流,轉換成重疊的時域資料區塊,這 資料區塊之後可以接著利用該重疊/加法組合器1 30 —*起。 數個具體實施例可以在完全每有修改的情況下 係在沒有放棄任何臨界取樣特性的情況下,使用一 濾波器組,如同例如在MPEG-4 AAC中所使用的。 體實施例可以提供最佳的編碼效率,數個具體實施 達成平滑的轉移,轉移至已建立之MDCT視窗相容 I 器 1 10 該裝置 重疊的 碼過之 丨。在具 蓉 122, 資料區 以包含 10的該 以包含 等轉換 處理器 用以將 些時域 組合在 ,特別 MDCT 數個具 例可以 之時域 1363563 編解碼器,同時並不會引入額外的切換人爲效應,並且僅 需要最小的間接費用。 數個具體實施例可以將該時域的混疊效應維持在該濾 波器組中,並且刻意地將對應的時域混疊效應,引入至由 該時域編解碼器編碼的該等信號部分。因此,該時域混疊 效應所得到的成分可以互相抵銷,以如同在該等MDCT頻 譜的兩個連續的資訊框中相同的方式》 第lc圖係描繪裝置100的另一種具體實施例,依據第 lc圖,該頻域解碼器 122可以包含一種重新量化階段 122 a。此外,該時域至頻域轉換器124可以包含一種餘弦 調變濾波器組,一種延伸重疊變換,一種低延遲濾波器組 或者一多相濾波器組。在第lc圖中所示之該具體實施例, 係描繪該時域至頻域轉換器 124可以包含一種 MDCT 124a。 此外,第lc圖描繪該頻域組合器126可包含一加法器 126a。如第lc圖所示,該頻域至時域轉換器128可以分別 包含一餘弦調變濾波器組,以及一反MDCT 128a。包含時 域編碼以及頻域編碼資料區段之該資料串流,可以利用一 編碼器來產生,該編碼器將在下文中更詳細地描述。頻域 編碼與時域編碼之間的切換,可以藉著利用一頻域編碼器 編碼該輸入信號的一些部分,以及利用一時域編碼器編碼 —些輸入信號的部分而達成。在第lc圖中所描繪之該裝置 100的具體實施例,係闡明對應的用於解碼之裝置1〇〇 -14- 1363563 - 的主要的結構。在其它的具體實施例中,該重新量化122a - 以及該反修正型離散餘弦變換128a可以代表頻域解碼器。 • 如同在第lc圖中所示,對於其中係由該時域解碼器 110所接管的信號部分,該時域解碼器Π0的時域輸出’可 以利用順向MDCT 124a進行變換。該時域解碼器可以利用 —預測濾波器,以解碼該時域編碼資料。此處’在該MDCT 124a的輸入會引入一些重疊,且從而會引入一些間接費 用。在下文中,將敘述一些具體實施例,可以減低或者最 ® 小化這個間接費用。 理論上,第lc圖中所示之該具體實施例也包含運算模 式,其中的兩個編解碼器可以平行地運作。在數個具體實 施例中,該處理器120可以適合於處理平行地在時域以及 在頻域中編碼的一個資料區段。以此方式,該信號的一部 分可以在頻域中編碼,另一部分可以在時域中編碼,類似 於一階層式的編碼方式。所得到的該等信號,之後接著在 φ 頻域中加在一起,與該頻域組合器126a進行比較。然而, 數個具體實施例可以執行操作模式,其中係完全地在兩個 編解碼器之間進行切換,並且僅具有較佳的最小數量的樣 * 本,其中這兩個編解碼器都是在作用中的,以獲得最佳的 . 可能效率。 在第lc圖中,該時域解碼器110的輸出係經過該MDCT 124a進行轉換,接著再利用該IMDCT 128a轉換。在另一 個具體實施例中,這兩個步驟可以有利地組合成一個單一 -15- 1363563 步驟,以降低複雜度。第Id圖係描繪裝置100的一個具體 實施例,以說明此種方法》第Id圖中所示之該裝置100, 說明該處理器120可以包含一種計算器129,用於依據該時 域解碼器110的輸出資料,計算重疊的時域資料區塊。該 處理器120或者該計算器129可以適合於依據該時域解碼 器110的該輸出資料,個別地重製該頻域至時域轉換器128 的一種性質,或者一種重疊性質,亦即該處理器120或者 計算器129可以重製時域資料區塊的一重疊特性,類似於 由該頻域至時域轉換器128所產生的的一重疊特性。此外., 該處理器120或者計算器129,可以適合於依據該時域解碼 器110的輸出資料,重製時域混疊效應,類似於由該頻域 至時域轉換器128所引入之時域混疊效應。 之後,該頻域至時域轉換器128可改變以適合於將由 該頻域解碼器122所提供之該等頻域資料區段,轉換成重 疊的時域資料區塊》該重疊/加法組合器1 30可以適用於組 合由該頻域至時域轉換器128以及該計算器129所提供之 資料區塊,以獲得該時域資料串流之該等已解碼的資料區 段。 該計算器129,可包含一種時域混疊效應階段129a, 其如圖在第le圖中的該具體實施例中所描繪的。該時域混 疊效應階段129a可以適用於該.時域解碼器的時間混疊效應 輸出資料,以獲得該等重疊的時域資料區塊。 對於該時域編碼資料,該MDCT以及該IMDCT的組 -16- 1363563 合,可以使具體實施例中該程序,在結構以及計算複雜度 兩者之上更爲簡化,因爲在這些具體實施例中,僅剩下該 時域混疊效應(time-domain aliasing,TNA)程序。适個有效 率的程序,可以基於一些觀察。該等2N的樣本的輸入區段 的該視窗型MDCT,可以分解成三個步驟。 第一,將該輸入信號乘上一分析視窗。 第二,接著,所得到的結果從2N個樣本摺疊成N個 樣本。對於該MDCT,此程序係意味著該等樣本的第一個 四分之一係以反向的時間順序,與該等樣本的第二個四分 之一組合,亦即減去,以及該等樣本的第四個四分之一, 係以反向的時間順序,與該等樣本的第三個四分之一組 合,亦即相加。所得到的結果係爲在該信號的修改過的第 二以及第三個四分之一中的該時間混疊、下降取樣的信 號,包含N個樣本。 第三,接著該下降取樣的信號利用正交的似DCT變換 進行轉換,將N個輸入映射成爲N個輸出樣本,以形成該 最終的MDCT輸出。 N個頻譜樣本的輸入序列之該視窗型IMDCT重建,也 可以同樣地分解成三個步驟。 第一,N個頻譜樣本的該輸入序列,係利用正交的反 似DCT變換進行轉換,將N個輸入映射成爲N個輸出樣本。 第二,所得到的該等結果,從N個樣本展開成2N個 樣本,係將經過該反DCT變換之後的該等數値,寫入至一 1363563 個2N樣本的輸出緩衝區的第二以及第三個四分之一 ’並且 各自地將該第一個四分之一塡滿該第二個四分之一的該時 間反轉且倒轉過的版本,以及將該第四個四分之一塡滿該 第三個四分之一的時間反轉的版本。 第三,所得到的2N個樣本,乘上該合成視窗,以形成 該視窗型IMDCT輸出。 因此,該視窗型MDCT以及該視窗型IMDCT的一序 連,可在數個具體實施例中,藉著該視窗型MDCT的第一 以及第二步驟,以及該視窗型IMDCT的第二以及第三步驟 所構成的一個序列可有效率地執行。該MDCT的第三步 驟,以及該IMDCT的第一步驟,在數個具體實施例中係可 以完全地省略的,因爲它們係相對於彼此之間的反運算, 且從而互相抵銷。其餘的步驟可以僅在時域中執行,且因 此使用此種方式之具體實施例,在計算複雜度上可以顯著 地降低。 對於一個區塊的MDCT,以及連貫的IMDCT,該第MDCT 的第二以及第三步驟,以及該IMDCT的第二以及第三步 驟,可以寫成係與下列的稀疏的2Nx2N矩陣相乘之乘法。 1 -1 0 Λ Λ 0 0 Ν Μ IV Ν 0 Μ Ν -1 1 0 八 Λ 0 0 Λ Λ 0 1 1 Μ Μ 0 Ν Μ Μ Ν 0 0 Λ 八 0 1 1 -18- 1363563 換句話說,該計算器129係可適用於將該時域解碼器 110的輸出分割成包含2N個連續的樣本之計算器區段,依 據分析視窗函數施加權値於該等2N個樣本,以相反的順序 從第二的N/2個樣本中減去第一N/2個樣本,以相反的順 序將最後的N/2個樣本加至第三的N/2個樣本,倒轉第二 以及第三N/2個樣本,以第二的N/2個樣本的時間反轉且 倒轉的版本取代第一的N/2個樣本,以第三的N/2個樣本 的時間反轉的版本取代第四的N/2個樣本,以及依據一種 合成視窗函數施加權値與該等2N個樣本。 在其它的具體實施例中,該重疊/加法組合器1 30可以 適合於依據一合成視窗函數,施加權値於由該頻域至時域 轉換器128所提供之重疊時域資料區塊。此外,該重疊/加 法組合器130可以適合於依據一合成視窗函數施加權値, 該合成視窗函數係已經過適當調整,以適合於連續的重疊 時域資料區塊的重疊區域的大小。 該計算器129係可適合於依據一種分析視窗函數,施 加權値於該等2N個樣本,該分析視窗函數係已經過適當調 整,以適合於連續的重疊時域資料區塊的重疊區域的大 小,並且該計算器係可進一步改變,以適合於依據一合成 視窗函數,施加權値於該等2N個樣本,該合成視窗函數係 已經過適當調整,以適合於該重疊區域的大小。 在數個具體實施例中,在頻域中編碼的兩個連續的時 域資料區塊的一個重疊區域的大小,可以大於其中的一個 區塊係在頻域中編碼且另一個區塊是在時域中編碼的兩個 -19- 1363563 連續的時域資料區塊的一個重疊區域的大小。 在數個具體實施例中,該等資料區塊的大小 合於該等重疊區域的大小。在數個具體實施例中 現有效率的組合式MDCT/IMDCT程序,亦即包含 化、摺疊與展開以及分析視窗化等操作的一個區 此外,在許多具體實施例中,在實際的實現架構 步驟之中的一些步驟可以部分地或者完全地組合 如第If圖中所示之裝置1〇〇的另一個具體實 描繪裝置100可以進一步包含用於該處理器120 疊/加法組合器130的一種旁路140,係可適用於 中編碼的該等資料區段中發生非重疊的連續時域 時,旁路該處理器120,以及該重疊/加法組合器 有多個資料區段係在時域中進行編碼,亦即並不 至頻域以解碼連續的資料區段,可以在沒有任何 況之下,傳送這些資料區段。對於這些情況,第 示之該等具體實施例,可以旁路該處理器120,以 /加法組合器1 30。在數個具體實施例中,區塊之擇 可以依據該等AAC規範來決定。 第2a圖係顯示一種裝置200的一個具體實施 依據一時域資料串流,以產生已編碼的資料串流 資料串流具有一個信號的多數個樣本。該時域資 可以係例如對應於音頻信號,包含語音片段以 段,或者同時包含這兩者。該裝置200包含區 210,用以從該資料串流,提供資料區段,兩個連 ,可以適 ,可以實 分析視窗 塊 TDA。 中,這些 在一起。 施例,係 以及該重 當在時域 資料區塊 130。若 需要轉換 重疊的情 1 f圖中所 及該重疊 3的重疊, 丨例,用於 ,該時域 料串流, 及音樂片 段處理器 續的資料 -20- 1363563 區段具有第一或者第二重疊區域,該第二重疊區域係小於 該第一重疊區域。該裝置200進一步包含時域編碼器220, 用以編碼在時域中的資料區段’以及頻域編碼器230,用於 依據第一或者一種第二視窗函數,以施加權値於該時域資 料串流的樣本’從而獲得視窗型資料區段,該第一以及該 第二視窗函數係可適合於該第一以及該第二重疊區域,並 且適合於在頻域中編碼該視窗資料區段。 此外’該裝置2 00包含時域資料分析器24 0,用以決定 相伴於一資料區段的一傳輸指示,以及一控制器250,用以 控制該裝置’使得對於具有第一轉移指示的資料區段,該 時域編碼器220的輸出資料係包含在該已編碼的資料串流 中’並且對於具有第二轉移指示的資料區段,該頻域編碼 器230的輸出資料係包含在該已編碼的資料串流中。 在數個具體實施例中,該時域資料分析器240可以適 合用於從該時域資料串流中,或者從由該區段處理器210 所提供之資料區段中,判定該轉移指示這些具體實施例係 顯示於第2b圖中。在第2b圖中,說明該時域資料分析器 24 0係可耦合於該區段處理器210的輸入,以利於從該時域 資料串流中判定該轉移指示。在另一具體實施例中,該時 域資料分析器240可以耦合於該區段處理器210的輸出, 以利於從該等資料區段中,判定該轉移指示。在數個具體 實施例中,該時域資料分析器240,可以直接地耦合於該區 段處理器210,以利於從由該區段處理器直接地提供的資料 -21- 1363563 中,判定該轉移指示。這些具體實施例在第2b圖中以 表不。 在具體實施例中,該時域資料分析器240係可適 決定轉移量測,該轉移量測係依據在該時域資料串流 者該等資料區段中的一暫態性的水準而定,其中該轉 示器可以指示該暫態性水準是否超過一事先決定的 値。 第2c圖係描繪該裝置200的另一個具體實施例在 圖中所示之該等具體實施例’該區段處理器210係可 合於提供具有該第一以及該第二重疊區域之資料區段 時域編碼器220可以適合於編碼全部的資料區段,該 編碼器230可以適用於編碼全部的視窗型資料區段, 該控制器250係可以適合於控制該時域編碼器220,以 頻域編碼器220以及該頻域編碼器230,使得對於具有 轉移指示之資料區段,該時域編碼器22 0的輸出資料 包含在該已編碼的資料串流中,以及對於具有第二轉 示之資料區段,該頻域編碼器2 30的輸出資料係包含 已編碼的資料串流中。在其它的具體實施例中,該時 碼器220以及該頻域編碼器230兩者的輸出資料,皆 包含在該已編碼的資料串流中。該轉移指示器可 示,一個資料區段較佳係相伴於或者關連於一語音 或者係一音樂信號。在數個具體實施例中,該頻域編 230,可以用於更類似於音樂得資料區段,並且該時域 虛線 合於 中或 移指 臨界 第2c 以適 ,該 頻域 以及 及該 第一 ,係 移指 在該 域編 可以 以指 信號 碼器 編碼 -22- 1363563 • 器220可以用於更類似於語音的資料區段。在數個具體實 施例中’可以使用平丫了式的編碼,例如對於具有背景音樂 - 的一類似語音的音頻信號。 在第2c圖中所描繪的該具體實施例中,該控制器250 控制在該裝置200之內的多個元件可以想到多種可能性。 不同的可能的方法,在第2c圖中係以虛線來表示。舉例而 言,該控制器250可以耦合於該時域編碼器220,以及該頻 域編碼器230,以選擇哪一個編碼器應該依據該轉移指示, ® 產生已編碼的輸出。在另一具體實施例中,該控制器250 可以控制在該時域編碼器220以及該頻域編碼器230的該 等輸出的一切換。 在這樣的具體實施例中,該時域編碼器220以及該頻 域編碼器2 3 0兩者皆可以編碼全部的資料區段,以及該控 制器250可以適合用於透過前述的耦合於該等編碼器的輸 出之該開關,分別依據編碼效率以及該轉移指示,選擇哪 φ 一個已編碼的資料區段,必須包含在該已編碼的資料串流 中。在其它的具體實施例中,該控制器250可以適合用於 控制該區段處理器2 10,用以提供該等資料區段給該時域編 ’ 碼器220,或者該頻域編碼器230。該控制器25 0也可以控 - 制該區段處理器210,以設定用於一資料區段的重疊區域。 在其它的具體實施例中,該控制器250也可以適合用於控 制在分別在該區段處理器2 1 0以及該時域編碼器220之間 的開關,以及在該區段處理器210以及該頻域編碼器2 30 -23- 1363563 之間的開關。該控制器250接著可以影響該開關,以分別 指示資料區段至這些解碼器之中的一個,或者至這兩個編 碼器。該控制器250可以進一步適用於設定該視窗化函數, 用於該頻域編碼器230,以及該等重疊區域與編碼策略。 此外,在數個具體實施例中,該頻域編碼器230可以 適用於依據AAC規範,施加視窗函數的權値。該頻域編碼 器230可以適用於將一視窗型資料區段轉換至頻域,以獲 得一頻域資料區段》此外,該頻域編碼器230可以適合於 量化該等頻域資料區段,以及進一步地該頻域編碼器230 係可以適合於依據一感知模型,以評估該等頻域資料區段》 該頻域編碼器230係可以適合於使用餘弦調變濾波器 組、延伸重疊變換、低延遲濾波器組或者多相濾波器組, 以獲得該等頻域資料區段。 該頻域編碼器230,可以適合於利用MDCT以獲得該等 頻域資料區段。該時域編碼器220可以適合於使用預測模 型,用以編碼該等資料區段。 在其中在該頻域編碼器230中的MDCT操作於一所謂 的長區塊模式中的一些具體實施例中,亦即用於編碼非暫 態輸入信號的該正規的運作模式,相較於AAC規範,該切 換程序所引入的間接費用可能很高。對於僅有一個資訊 框,亦即N個樣本的一個長度/框架率’係必須使用該時域 編碼器220,以取代該頻域編碼器230進行編碼時的該等情 況而言,可能是真實的。 -24- 1363563 之後,該MDCT的全部的該等輸入數値,必須利用該 時域編碼器22 0進行編碼,亦即在該頻域解碼器110的輸 出所得到的2N個樣本。因此,可能引入N個額外的樣本 之間接費用。第3a至3d圖係個別描繪區段的一些可被理 解的重疊區域,以及可應用的視窗化函數。可能必須利用 該時域編碼器2 20對2N個樣本進行編碼,以取代頻域編碼 資料的一個區塊。第3 a圖係描繪一實例,其中頻域編碼資 料區塊使用實線表示,以及時域編碼資料係使用虛線表 示。在該等視窗化函數之下,描繪資料區段,其可以在頻 域中編碼(實線方塊‘),或者在時域中編碼(虛線方塊)。在第 3b至第3d圖中,也將參考於這種表示。 第3a圖係描繪資料係在頻域中編碼,被一個在時域中 編碼的資料區段所中斷,並且在其之後的該資料區段係再 一次地在頻域中編碼的該種情況。爲了提供對於消除由於 該頻域編碼器230所引起的該時域混疊效應所需要的該時 域資料,當從頻域切換至時域時,重疊的區段大小的一半 係必要的,從該時域切換回去頻域時同樣的需求也成立。 假設在第3 a圖中,該時域編碼資料區段的大小爲2N,則 在開始以及在結束時,其係與該頻域編碼資料之間有著N/2 個樣本的重疊。 .假設若接下來有多於一個以上的資訊框係可以使用該 t 時域編碼器220進行編碼,則對於該時域編碼部分的間接 費用係維持在N個樣本。如同在第3b圖中所描繪的,其中 -25- 1363563 mm連續的資訊框係在時域中編碼,並且在時域中編碼, mi在該等時域編碼部分的開始以及結束的該等重疊區 域’具有相同的重疊,如同先前參考於第3a圖所解釋的。 第3b圖顯示在兩個資訊框係以時域編碼器22〇編碼的情況 中’該重疊的結構。在此情況中,有3N個樣本必須利用該 時域編碼器220進行編碼。
此間接費用在數個具體實施例中,可以例如依據在 AAC中所使用的結構,利用視窗切換來降低。第3c圖描繪 —種典型的長 '開始、短以及停止視窗的序列,如同在A AC 中所使用的。從第3c圖,可以看出來該等視窗大小 '該等 資料區段大小,且因此該等重疊區域的大小,係會隨著不 同的視窗而改變。在第3c圖中所描繪的該序列,係爲上述 的該序列的一實例。 具體實施例不應該侷限於AAC視窗大小的視窗,然 而,具體實施例可以利用具有不同的重疊區域的視窗,以 及不同的區間之視窗的優點。在數個具體實施例中,轉移 至短視窗’或者從短視窗轉移,可以使用一種減低的重疊, 如周,例如在下述文獻中所揭露的:Bernd Edler, Codierung von Audiosignalen mit iiberlappender Transformation und adaptiven Fensterfunktionen," Frequenz,Vol. 43,No. 9,p. 252-256, September 1989’ 以及 Generic Audio Coding of Moving Pictures and Associated Audio: Advanced Audio Coding(動畫與相伴音頻的同屬音 -26- 1363563 頻編碼:進階音頻編碼),國際標準12818-7,ISO/IEC JTC1/SC29/WG1 1動畫專家群,西元1 997年,可以用於一 些具體實施例中,用於減低轉移至時域編碼區域,或者從 時域編碼區域轉移所需要的間接費用,如同在第3d圖中所 描繪的。第3d圖係描繪四個資料區段,其中前兩個以及最 後一個資料區段係在頻域中編碼,而第三個區段係在時域 中編碼。當從頻域切換至時域時,係使用具有減低的重疊 大小之不同的視窗,利用此方式可以減低該間接費用。 在數個具體實施例中,該轉移可以基於與A AC中所 使用的完全相同之開始與停止視窗。對於轉移至時域編碼 區域,或者從時域編碼區域轉移所對應的該等視窗,係僅 具有小區域重疊的視窗。如此一來,該間接費用,亦即由 於該切換程序所需要額外傳送的數値的個數,可以明顯地 降低。一般而言,對於具有Νμ個樣本的視窗重疊之每一 次轉移,該間接費用可能係Nd/2。因此,對於類似AAC, 具有N <^=10 24的一正規的完全重疊視窗的一轉移,對於 該左側,亦即該淡入視窗,會帶來1 024/2 = 5 1 2個樣本的 間接費用,以及對於該右側,亦即該淡出視窗’會帶來 1 0 24/2 = 5 1 2個樣本的間接費用,轉移所造成的全部間接費 用爲1 024( = N)個樣本。選擇一減低重疊的視窗,例如具有 ^1。^=128的該等AAC短區塊視窗,僅會造成128個樣本的 整體間接費用。 具體實施例可以在該頻域編碼器230中使用一濾波器 -27- 1363563 組,例如,舉例而言該廣爲使用的MDCT濾波器組;然而, 其它的具體實施例也可以其它的餘弦調變濾波器組爲基 礎,與頻域編解碼器一起使用。這可以包含該MDCT的導 數衍生,例如延伸重疊變換,或者低延遲濾波器組以及例 如,舉例而言,在MPEG-l-Layer-1/2/3音頻編解碼器中所 使用的多相濾波器組。在一些具體實施例中,向前/向後濾 波器組操作的有效率的實現架構,可以考慮在該濾波器組 中所使用的特定類型的視窗以及摺疊/展開程序。對於每種 類型的調變濾波器組,該分析階段可以利用一種前置處理 步驟以及用於調變的一區塊變換,亦即似DCT或者DFT, 有效率地實現。在數個具體實施例中,該對應的合成階段, 可以使用該對應的反變換以及一個後處理步驟來實現。在 數個具體實施例中,也可以僅使用該前置步驟以及該後處 理步驟,用於該等時域編碼信號部分。 本發明的數個具體實施例所提供的優點,使得一更佳 的編碼效率可以達成,因爲在時域編碼器2 20以及頻域編 碼器230之間的切換,可以在僅引入非常低的間接費用的 情況下完成。僅有在接下來的時域編碼的信號部分中,在 數個具體實施例中的重疊係可以被完全忽略的。該裝置100 的數個具體實施例,係使得該編碼資料串流的對應的解碼 係爲可能的。 利用這些方法,具體實施例提供的優點,對於例如一 種音頻信號’可以分別利用一個更低的編碼率以達成相同 -28- 1363563 的品質,以及利用相同的編碼率可以達成更高的品質,因 爲個別的編碼器可以適應於在該音頻信號中的該暫態效 應。 依據本發明方法某些特定的實施需求,本發明方法的 具體實施例可以使用硬體、軟體或者這兩者的組合來實 現。該實現架構的實行係可以使用數位儲存媒介,該數位 儲存媒介特別係指碟片CD、DVD或者其它的具有電氣可讀 取控制訊號儲存在其上的碟片,該數位儲存媒介在一可程 式電腦系統、處理器或者積體電路的共同配合執行之下, 使得本發明的該等方法可以實行。因此,大體而言,本發 明的具體實施例,係一具有程式碼儲存在一機器可讀取承 載體(carrier)上的電腦程式產品;當該電腦程式產品在一電 腦、處理器或者積體電路上執行時,該程式碼可以有效的 實行本發明該等方法的一具體實施例。換句話說,該等發 明方法的數個具體實施例因此係具有一程式碼的電腦程 式,當該電腦程式碼在一電腦、處理器或者積體電路上執 行時,可以實行本發明該等方法的至少一個具體實施例。 雖然在前面中,均參考於特別的具體實施例’進行特 別的陳述與描述,但是應該被瞭解的是’在該技術中所使 用的各種技巧,在不偏離本發明精神以及範圍的情況下’ 任何熟悉該項技術所屬之領域者’可以在其形式上以及細 節上做各種不同的改變。應該被瞭解的是’在不偏離於此 所揭露以及於接下來的專利申請範圍中所界定的廣泛槪念 -29- 1363563 ,之下,可以進行各種不同的改變以使其適用於不同的具體 * 實施例。 • 【圖式簡單說明】 第la圖顯示一種用於解碼的裝置之一具體實施例; 第lb圖顯示—種用於解碼的裝置之另一具體實施例; 第lc圖顯示一種用於解碼的裝置之另—具體實施例; 第Id圖顯示一種用於解碼的裝置之另一具體實施例; 第le圖顯示一種用於解碼的裝置之另—具體實施例: ® 第If圖顯示一種用於解碼的裝置之另一具體實施例; 第2a圖顯示—種用於解碼的裝置之另—具體實施例; 第2b圖顯示一種用於解碼的裝置之另一具體實施例: 第2c圖顯示一種用於解碼的裝置之另一具體實施例; 第3a圖係描繪在一個視窗的區間中,當在頻域以及時 域編碼之間切換時之重疊區域; 第3b圖係描繪在兩個視窗的區間中,當在頻域以及時 φ 域編碼之間切換時之重疊區域; 第3c圖係描繪具有不同的重疊區域之多重視窗; 第3d圖係描繪在一具體實施例中,使用具有不同的重 * 疊區域之視窗;以及 - 第4圖係描繪當使用MDCT時,時域混疊效應的消除 過程。 【主要元件符號說明】 100 解碼裝置 110 時域解碼器 -30- 1363563
120 處 理 器 122 頻 域 解 碼 器 122a 重 新 里 化 124 時 域 至 頻 域 轉 換 器 124a 修 正 型 離 散 餘 弦 變 換 126 頻 域 組 合 器 126a 加 法 器 128 頻 域 至 時 域 轉 換 器 128a 反 修 正 型 離 散 餘 弦 變 換 129 計 算 器 129a 時 域 混 疊 效 應 階 段 130 重 疊 /力口法組合器 200 編 碼 裝 置 2 10 段 處 理 器 220 時 域 編 碼 器 230 頻 域 編 碼 器 240 時 域 資 料 分 析 器 250 控 制 器 400 修 正 型 離 散 餘 弦 變 換 輸 入 4 10 視 窗 420 反 修 正 型 離 散 餘 弦 變 換 輸 出 第 一視 窗 425 反 修 正 型 離 散 餘 弦 變 換 輸 出 第 二視 窗 430 輸 出 信 號 -31 -

Claims (1)

1363563 卜。年Ιλ月1〇日修正本 修正本 第096147145號「用以編碼及解碼代表時域資料流之資料 區段的編碼器、解碼器及方法」專利案 (201 1年12月20日修正) 十、申請專利範圍: 1. 一種用以解碼代表時域資料串流之資料區段的裝置,資 料區段在時域中或者在頻域中編碼,在頻域中編碼之資 料區段具有連續的資料區塊’代表連續且重疊之多數個 時域資料樣本區塊,該裝置包含: 時域解碼器’用以解碼在時域中編碼之資料區段; 處理器’用以處理在頻域中編碼之該資料區段以及該 時域解碼器之輸出資料’以獲得數個重疊的時域資料區 塊;以及 重疊/加法組合器,用以組合該等重疊時域資料區塊, 以獲得該時域資料串流的解碼資料區段。 2.如申請專利範圍第1項之裝置,其中該處理器包含頻域 解碼器’用以解碼在頻域中被編碼的資料區段,以獲得 頻域資料區段。 3, 如申請專利範圍第1項之裝置,其中該處理器可適合於 平行地處理在時域中以及在頻域中編碼之資料區段。 4. 如申請專利範圍第2項之裝置,其中該處理器包含時域 至頻域轉換器,用以轉換該時域解碼器的輸出資料,以 獲得轉換過的頻域資料區段。 5.如申請專利範圍第4項之裝置,其中該處理器包含一頻 域組合器,用以組合該等頻域資料區段以及該等轉換之 1363563 修正本 後的頻域資料區段,以獲得一種頻域資料串流。 6. 如申請專利範圍第5項之裝置,其中該處理器包含頻域 至時域轉換器,用以將該頻域資料串流轉換成重疊的時 域資料區塊。 7. 如申請專利範圍第2項之裝置,其中該頻域解碼器進一 步包含重新量化階段(re-quantization stage)。 8. 如申請專利範圍第4項之裝置,其中該時域至頻域轉換 器包含餘弦調變濾波器組、延伸重疊變換、低延遲濾波 器組、多相濾波器組或者修改過的離散餘弦變換。 9. 如申請專利範圍第5項之裝置,其中該頻域組合器包含 加法器。 ’ 10. 如申請專利範圍第6項之裝置,其中該頻域至時域轉換 器包含餘弦調變濾波器組,或者修改過的反離散餘弦變 換。 11. 如申請專利範圍第1項之裝置,其中該時域解碼器可適 合於使用預測濾波器組,以對於在該時域中編碼之資料 區段進行解碼。 12. 如申請專利範圍第1項之裝置,其中該處理器包含計算 器,用於依據該時域解碼器的輸出資料,以計算重疊的 時域資料區塊。 1 3 ·如申請專利範圍第1 2項之裝置,其中該計算器可以適 合於依據該時域解碼器的輸出資料,重製該頻域至時域 轉換器的重疊性質。 1363563 修正本 14. 如申請專利範圍第13項之裝置,其中該計算器可適用 於依據該時域解碼器的輸出資料,以重製該頻域至時域 轉換器的時域混疊特性。 15. 如申請專利範圍第6項之裝置,其中該頻域至時域轉換 器可以適用於將由該頻域解碼器所提供之該等頻域資料 區段轉換成重疊時域資料區塊。 1 6 ·如申請專利範圍第1 5項之裝置,其中該重疊/加法組合 φ 器可適合於組合由該頻域至時域轉換器以及該計算器所 提供之該等重疊時域資料區塊,以獲得該時域資料串流 的解碼資料區段。 17·如申請專利範圍第8項之裝置,其中該計算器包含時域 混疊效應階段,用於該時域解碼器的輸出資料之時間混 疊’以獲得該等重疊的時域資料區塊。 18.如申請專利範圍第12項之裝置,其中該計算器可以適 合於 ® 將該時域解碼器的輸出,分割成包含2N個連續樣本 之計算器區段, 依據一分析視窗函數,將權値施加於該等2 N個樣本, 以相反的順序,從第二的N/2個樣本中,減去第一的 N/2個樣·本, 以相反的順序,將最後的N / 2個樣本,加到第三部份 的N/2個樣本中, 反轉該等第二以及第三的N/2個樣本, 1363563 修正本 以第二的N/2個樣本之該時間反轉以及倒轉版本,取 代第一的N/2個樣本, 以第三的N/2個樣本之時間反轉版本,取代第四 的N/2個樣本,以及 依據一種合成視窗函數,施加權値於該等2/N個樣本。 19.如申請專利範圍第6項之裝置,其中該重疊/加法組合器 可適合於依據一合成視窗函數,施加權値於由該頻域至 時域轉換器所提供之重疊的時域資料區塊。 2 0.如申請專利範圍第19項之裝置,其中該重疊/加法組合 器可適合於依據一合成視窗函數,施加權値,該合成視 窗函數係調整成連續重疊時域資料區塊的重疊區域的大 小。 21. 如申請凑利範圍第20項之裝置,其中該計算器可適合 於依據一分析視窗函數,施加權値於該等2N個樣本, 該分析視窗函數係調整成連續重疊時域資料區塊的重疊 區域的大小,且其中該計算器係可適合於依據一合成視 窗函數,施加權値於該等2N個樣本’該合成視窗函數 係調整成該重疊區域的大小。 22. 如申請專利範圍第1項之裝置,其中在頻域中被編碼之 兩個連續的時域資料區塊的大小’係大於當兩個連續的 時域資料區塊其中的一個在頻域中被編碼以及另—個在 時域中被編碼時的一個重疊區域的大小。 23. 如申請專利範圍第1項之裝置,其中資料區塊的該重疊 1363563 修正本 區域依據該等AAC規範來決定。 24. 如申請專利範圍第1項之裝置,其中進一步包含一旁 路,用於該處理器以及該重疊/加法組合器,該旁路可適 用於當在時域中被編碼之資料區段中發生非重疊之連續 時域資料區塊時,以旁路該處理器以及該重疊/加法組合 器。 25. —種用以解碼代表時域資料串流之資料區段的方法,資 φ 料區段在時域中或者在頻域中被編碼,在頻域中被編碼 之資料區段,具有連續的資料區塊,代表連續且重疊之 多數個時域資料樣本區塊,該方法包含下列步驟: 解碼在時域中被編碼之資料區段; 處理在頻域中被編碼之該資料區段以及該時域解碼 器之輸出資料,以獲得數個重疊的時域資料區塊;以及 組合該等重疊時域資料區塊,以獲得該時域資料串& 的已解碼資料區段。 ® 26.—種用以使電腦產生經編碼資料串流的電腦程式,該電 腦程式具有程式碼,當該程式碼在該電腦上執行時,_ 行如申請專利範圍第2 5項之方法。 27 . —種用於依據時域資料串流以產生經編碼資料串流的 裝置,該時域資料串流具有信號的多數個樣本,該裝置 包含: —區段處理器’用以提供來自於該資料串流之資料區 段,兩個連續的資料區段具有第一以及第二重疊區域, 1363563 修正本 該第二重疊區域係小於該第一重疊區域; 一時域編碼器,用以在時域中編碼一視窗型資料區 段; 一頻域編碼器,用於依據第一或者第二視窗函數,對 該時域資料串流的數個樣本施加權値,以獲得—視窗型 資料區段,該第一以.及該第二視窗函數係可用於該第一 以及該第一重疊區域’該頻域編碼器係可適用於在該頻 Φ 域中編碼一視窗型資料區段; 一時域資料分析器,用以決定相關於資料區段之轉變 指示;以及 一控制器,用以控制該裝置,使得對於具有第一轉變 指不之資料區段而言,該時域編碼器的輸出資料包含在 該編碼資料串流中,以及對於具有第二轉變指示之資料 區段而言,該頻域編碼器的輸出資料包含在該編碼資料 串流中。 ® 28.如申請專利範圍第27項之裝置/其中該時域資料分析 器可適合於從該時域資料串流中、該等資料區段中或者 從直接由該區段處理器所提供的資料中,判定該轉變指 示。 29 .如申請專利範圍第27項之裝置1其中該時域資料分析 器可適用於決定轉變量測’該轉變量測係依據在該時域 資料串流或者該資料區段中的該暫態水準’且其中該轉 變指示器係指示暫態的水準是否超過一事先決定的臨界 1363563 修正本 値。 30. 如申請專利範圍第.27項之裝置,其中該區段處理器可 適合於提供具有該第一以及該第二重疊區域之資料區 段, 該時域編碼器可適用於編碼該等資料區段, 該頻域編碼器可適合於編碼該等視窗型資料區段,以 及 φ 該控制器可適合於控制該時域編碼器以及該頻域編 碼器’使得對於具有一第一轉變指示之資料區段而言, 該時域編碼器的輸出資料包含在該編碼資料串流中,以 及對於具有一第二轉變指示之視窗型資料區段而言,該 頻域編碼器的輸出資料包含在該編碼資料串流中。 31. 如申請專利範圍第27項之裝置,其中該控制器可適用 於控制該區段處理器,以提供該等資料區段該該時域編 碼器或者該頻域編碼器。 • 32.如申請專利範圍第27項之裝置,其中該頻域編碼器係 可適合於依據該等AAC規範,施加視窗函數的權値。 3 3 .如申請專利範圍第27項之裝置,其中該頻域編碼器係 可適用於將一視窗型資料區段轉換至頻域,以獲得一頻 域資料區段。 34. 如申請專利範圍第33項之裝置,其中該頻域編碼器係 '可適合於量化該頻域資料區段。 35. 如申請專利範圍第34項之裝置,其中該頻域編碼器可 1363563 修正本 適用於依據一感知模型評估該頻域資料。 36_如申請專利範圍第35項之裝置,其中該頻域編碼器可 適合於使用餘弦調變濾波器組、延伸重疊變換、低延遲 濾波器組或者多相濾波器組,以獲得該等頻域資料區段。 37. 如申請專利範圍第33項之裝置,其中該頻域編碼器可 適合於使用修改過的離散餘弦變換,以獲得該等頻域資 料區段。 38. 如申請專利範圍第27項之裝置,其中該時域編碼器可 適合於使用預測濾波器組,以編碼該等資料區段。 3 9 _ —種依據時域資料串流,以產生編碼資料串流的方法, 該時域資料串流具有一信號的多數個樣本,該方法包含 下列步驟: 提供來自於該資料串流之資料區段,兩個連續的資料 區段具有第一以及第二重疊區域,該第二重疊區域係小 於該第一重疊區域; 段 區 料 資 等 該 於 m彔 相 定 決 段 區 料 資 1 碼 編 中 域 時 在 變及 轉以 之, 示 指 者 或 域第 時該 該 ’ 至段 値區 權料 加資 施型 ’ 窗 數視 函得 窗獲 視以 二, 第本 者樣 或個 一 數 第的 一 流 據串 依料 資 函 窗 視該 _/在 第及 該以及 及,以 以域; 一 區碼 頻 疊編 重行 二進 第段 該區 及料 以資 一型 第 該 於 用 可 數 域 窗 視 該 對 中 料 資 出 輸 之 碼 編 被 中 域 使時 11該 制在 控, 有 具 於 對 得 第 轉 而串 段料 區資 料碼 資編 之該 .示在 指含 變包 1363563 修正本 流中,以及對於具有一第二轉變指示之資料區段而言, 在該頻域中編碼之輸出資料包含在該編碼資料串流中。 4 0.—種用以使電腦產生經編碼資料串流的電腦程式,該電 腦程式具有一種程式碼,當該程式碼在該電腦上執行 時,執行如申請專利範圍第39項之方法。
TW096147145A 2006-12-12 2007-12-11 Encoder, decoder and methods for encoding and decoding data segments representing a time-domain data stream TWI363563B (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US86967006P 2006-12-12 2006-12-12
PCT/EP2007/010665 WO2008071353A2 (en) 2006-12-12 2007-12-07 Encoder, decoder and methods for encoding and decoding data segments representing a time-domain data stream

Publications (2)

Publication Number Publication Date
TW200841743A TW200841743A (en) 2008-10-16
TWI363563B true TWI363563B (en) 2012-05-01

Family

ID=39410130

Family Applications (1)

Application Number Title Priority Date Filing Date
TW096147145A TWI363563B (en) 2006-12-12 2007-12-11 Encoder, decoder and methods for encoding and decoding data segments representing a time-domain data stream

Country Status (20)

Country Link
US (8) US8818796B2 (zh)
EP (1) EP2052548B1 (zh)
JP (1) JP5171842B2 (zh)
KR (1) KR101016224B1 (zh)
CN (2) CN102395033B (zh)
AT (1) ATE547898T1 (zh)
AU (1) AU2007331763B2 (zh)
BR (2) BRPI0718738B1 (zh)
CA (1) CA2672165C (zh)
ES (1) ES2383217T3 (zh)
HK (2) HK1126602A1 (zh)
IL (1) IL198725A (zh)
MX (1) MX2009006201A (zh)
MY (1) MY148913A (zh)
NO (1) NO342080B1 (zh)
PL (1) PL2052548T3 (zh)
RU (1) RU2444071C2 (zh)
TW (1) TWI363563B (zh)
WO (1) WO2008071353A2 (zh)
ZA (1) ZA200903159B (zh)

Families Citing this family (73)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8630863B2 (en) * 2007-04-24 2014-01-14 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding audio/speech signal
WO2008151137A2 (en) * 2007-06-01 2008-12-11 The Trustees Of Columbia University In The City Of New York Real-time time encoding and decoding machines
WO2009006405A1 (en) 2007-06-28 2009-01-08 The Trustees Of Columbia University In The City Of New York Multi-input multi-output time encoding and decoding machines
EP2077550B8 (en) * 2008-01-04 2012-03-14 Dolby International AB Audio encoder and decoder
EP3002751A1 (en) 2008-07-11 2016-04-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder for encoding and decoding audio samples
MX2011000369A (es) * 2008-07-11 2011-07-29 Ten Forschung Ev Fraunhofer Codificador y decodificador de audio para codificar marcos de señales de audio muestreadas.
ES2683077T3 (es) * 2008-07-11 2018-09-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada
AU2009267518B2 (en) 2008-07-11 2012-08-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme
RU2515704C2 (ru) 2008-07-11 2014-05-20 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Аудиокодер и аудиодекодер для кодирования и декодирования отсчетов аудиосигнала
MX2011000375A (es) 2008-07-11 2011-05-19 Fraunhofer Ges Forschung Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada.
EP2144230A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
WO2010003521A1 (en) * 2008-07-11 2010-01-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and discriminator for classifying different segments of a signal
PL2146344T3 (pl) * 2008-07-17 2017-01-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Sposób kodowania/dekodowania sygnału audio obejmujący przełączalne obejście
CN102216982A (zh) * 2008-09-18 2011-10-12 韩国电子通信研究院 在基于修正离散余弦变换的译码器与异质译码器间转换的编码设备和解码设备
JP5555707B2 (ja) * 2008-10-08 2014-07-23 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン マルチ分解能切替型のオーディオ符号化及び復号化スキーム
FR2936898A1 (fr) * 2008-10-08 2010-04-09 France Telecom Codage a echantillonnage critique avec codeur predictif
WO2010044593A2 (ko) 2008-10-13 2010-04-22 한국전자통신연구원 Mdct 기반 음성/오디오 통합 부호화기의 lpc 잔차신호 부호화/복호화 장치
KR101649376B1 (ko) * 2008-10-13 2016-08-31 한국전자통신연구원 Mdct 기반 음성/오디오 통합 부호화기의 lpc 잔차신호 부호화/복호화 장치
KR101315617B1 (ko) * 2008-11-26 2013-10-08 광운대학교 산학협력단 모드 스위칭에 기초하여 윈도우 시퀀스를 처리하는 통합 음성/오디오 부/복호화기
US9384748B2 (en) 2008-11-26 2016-07-05 Electronics And Telecommunications Research Institute Unified Speech/Audio Codec (USAC) processing windows sequence based mode switching
US8457975B2 (en) 2009-01-28 2013-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program
WO2011013980A2 (en) 2009-07-27 2011-02-03 Lg Electronics Inc. A method and an apparatus for processing an audio signal
WO2011034374A2 (en) * 2009-09-17 2011-03-24 Lg Electronics Inc. A method and an apparatus for processing an audio signal
US20110087494A1 (en) * 2009-10-09 2011-04-14 Samsung Electronics Co., Ltd. Apparatus and method of encoding audio signal by switching frequency domain transformation scheme and time domain transformation scheme
KR101137652B1 (ko) * 2009-10-14 2012-04-23 광운대학교 산학협력단 천이 구간에 기초하여 윈도우의 오버랩 영역을 조절하는 통합 음성/오디오 부호화/복호화 장치 및 방법
BR112012009032B1 (pt) * 2009-10-20 2021-09-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. Codificador de sinal de áudio, decodificador de sinal de áudio, método para prover uma representação codificada de um conteúdo de áudio, método para prover uma representação decodificada de um conteúdo de áudio para uso em aplicações de baixo retardamento
RU2591011C2 (ru) * 2009-10-20 2016-07-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Кодер аудиосигнала, декодер аудиосигнала, способ кодирования или декодирования аудиосигнала с удалением алиасинга (наложения спектров)
CN105355209B (zh) 2010-07-02 2020-02-14 杜比国际公司 音高增强后置滤波器
PL3451333T3 (pl) 2010-07-08 2023-01-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Koder wykorzystujący kasowanie aliasingu w przód
KR101826331B1 (ko) * 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
EP3023985B1 (en) 2010-12-29 2017-07-05 Samsung Electronics Co., Ltd Methods for audio signal encoding and decoding
US9807424B2 (en) 2011-01-10 2017-10-31 Qualcomm Incorporated Adaptive selection of region size for identification of samples in a transition zone for overlapped block motion compensation
WO2012109407A1 (en) 2011-02-09 2012-08-16 The Trustees Of Columbia University In The City Of New York Encoding and decoding machine with recurrent neural networks
SG185519A1 (en) * 2011-02-14 2012-12-28 Fraunhofer Ges Forschung Information signal representation using lapped transform
MX2013009304A (es) * 2011-02-14 2013-10-03 Fraunhofer Ges Forschung Aparato y metodo para codificar una porcion de una señal de audio utilizando deteccion de un transiente y resultado de calidad.
ES2529025T3 (es) 2011-02-14 2015-02-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y método para procesar una señal de audio decodificada en un dominio espectral
MY159444A (en) * 2011-02-14 2017-01-13 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V Encoding and decoding of pulse positions of tracks of an audio signal
ES2639646T3 (es) 2011-02-14 2017-10-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificación y decodificación de posiciones de impulso de pistas de una señal de audio
SG192745A1 (en) 2011-02-14 2013-09-30 Fraunhofer Ges Forschung Noise generation in audio codecs
CA2827335C (en) 2011-02-14 2016-08-30 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Audio codec using noise synthesis during inactive phases
CA2827000C (en) 2011-02-14 2016-04-05 Jeremie Lecomte Apparatus and method for error concealment in low-delay unified speech and audio coding (usac)
TWI488177B (zh) 2011-02-14 2015-06-11 Fraunhofer Ges Forschung 使用頻譜域雜訊整形之基於線性預測的編碼方案
SG192721A1 (en) 2011-02-14 2013-09-30 Fraunhofer Ges Forschung Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion
FR2977439A1 (fr) * 2011-06-28 2013-01-04 France Telecom Fenetres de ponderation en codage/decodage par transformee avec recouvrement, optimisees en retard.
US10075471B2 (en) 2012-06-07 2018-09-11 Amazon Technologies, Inc. Data loss prevention techniques
US9590959B2 (en) 2013-02-12 2017-03-07 Amazon Technologies, Inc. Data security service
US10084818B1 (en) 2012-06-07 2018-09-25 Amazon Technologies, Inc. Flexibly configurable data modification services
US9286491B2 (en) 2012-06-07 2016-03-15 Amazon Technologies, Inc. Virtual service provider zones
US10210341B2 (en) * 2013-02-12 2019-02-19 Amazon Technologies, Inc. Delayed data access
US9547771B2 (en) 2013-02-12 2017-01-17 Amazon Technologies, Inc. Policy enforcement with associated data
US9608813B1 (en) 2013-06-13 2017-03-28 Amazon Technologies, Inc. Key rotation techniques
US9300464B1 (en) 2013-02-12 2016-03-29 Amazon Technologies, Inc. Probabilistic key rotation
US9367697B1 (en) 2013-02-12 2016-06-14 Amazon Technologies, Inc. Data security with a security module
US10467422B1 (en) 2013-02-12 2019-11-05 Amazon Technologies, Inc. Automatic key rotation
US9705674B2 (en) 2013-02-12 2017-07-11 Amazon Technologies, Inc. Federated key management
US10211977B1 (en) 2013-02-12 2019-02-19 Amazon Technologies, Inc. Secure management of information using a security module
ES2634621T3 (es) 2013-02-20 2017-09-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y procedimiento para generar una señal de audio o imagen codificada o para descodificar una señal de audio o imagen codificada en presencia de transitorios utilizando una parte de superposición múltiple
CN105556601B (zh) * 2013-08-23 2019-10-11 弗劳恩霍夫应用研究促进协会 用于使用交叠范围中的组合来处理音频信号的装置及方法
CN104681034A (zh) 2013-11-27 2015-06-03 杜比实验室特许公司 音频信号处理
US9397835B1 (en) 2014-05-21 2016-07-19 Amazon Technologies, Inc. Web of trust management in a distributed system
US9438421B1 (en) 2014-06-27 2016-09-06 Amazon Technologies, Inc. Supporting a fixed transaction rate with a variably-backed logical cryptographic key
US10116418B2 (en) 2014-08-08 2018-10-30 University Of Florida Research Foundation, Incorporated Joint fountain coding and network coding for loss-tolerant information spreading
US9866392B1 (en) 2014-09-15 2018-01-09 Amazon Technologies, Inc. Distributed system web of trust provisioning
KR101626280B1 (ko) * 2014-11-05 2016-06-01 주식회사 디오텍 합성음의 고조파 성분 제거 방법 및 장치
US10469477B2 (en) 2015-03-31 2019-11-05 Amazon Technologies, Inc. Key export techniques
WO2017050398A1 (en) * 2015-09-25 2017-03-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and methods for signal-adaptive switching of the overlap ratio in audio transform coding
WO2017053490A1 (en) * 2015-09-25 2017-03-30 Microsemi Semiconductor (U.S.) Inc. Acoustic echo path change detection apparatus and method
US10230388B2 (en) * 2015-12-30 2019-03-12 Northwestern University System and method for energy efficient time domain signal processing
WO2017161124A1 (en) * 2016-03-16 2017-09-21 University Of Florida Research Foundation, Incorporated System for video streaming using delay-aware fountain codes
WO2017161122A1 (en) * 2016-03-16 2017-09-21 University Of Florida Research Foundation, Incorporated System for live video streaming using delay-aware fountain codes
EP3276620A1 (en) 2016-07-29 2018-01-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Time domain aliasing reduction for non-uniform filterbanks which use spectral analysis followed by partial synthesis
CN110574024A (zh) * 2017-04-28 2019-12-13 索尼公司 信息处理设备和信息处理方法
WO2020132142A1 (en) * 2018-12-18 2020-06-25 Northwestern University System and method for pipelined time-domain computing using time-domain flip-flops and its application in time-series analysis

Family Cites Families (92)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2085680T5 (es) * 1989-01-27 2002-10-16 Dolby Lab Licensing Corp Asignacion adaptativa de bits para un codificador y un descodificador de audio.
US5230038A (en) * 1989-01-27 1993-07-20 Fielder Louis D Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5109417A (en) * 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
DE3902948A1 (de) 1989-02-01 1990-08-09 Telefunken Fernseh & Rundfunk Verfahren zur uebertragung eines signals
CN1062963C (zh) * 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
US5327518A (en) * 1991-08-22 1994-07-05 Georgia Tech Research Corporation Audio analysis/synthesis system
SG45281A1 (en) * 1992-06-26 1998-01-16 Discovision Ass Method and arrangement for transformation of signals from a frequency to a time domain
US5570455A (en) 1993-01-19 1996-10-29 Philosophers' Stone Llc Method and apparatus for encoding sequences of data
EP0707763B1 (en) 1993-07-07 2001-08-29 Picturetel Corporation Reduction of background noise for speech enhancement
US5651090A (en) 1994-05-06 1997-07-22 Nippon Telegraph And Telephone Corporation Coding method and coder for coding input signals of plural channels using vector quantization, and decoding method and decoder therefor
US5615299A (en) 1994-06-20 1997-03-25 International Business Machines Corporation Speech recognition using dynamic features
TW271524B (zh) 1994-08-05 1996-03-01 Qualcomm Inc
ES2143673T3 (es) 1994-12-20 2000-05-16 Dolby Lab Licensing Corp Metodo y aparato para aplicar una prediccion de formas de onda a subbandas de un sistema codificador perceptual.
JP3158932B2 (ja) 1995-01-27 2001-04-23 日本ビクター株式会社 信号符号化装置及び信号復号化装置
US5669484A (en) * 1996-01-24 1997-09-23 Paulson; Tom J. Protective cover for the mini-slide knob of dimmers with mini-slide knobs
US5809459A (en) 1996-05-21 1998-09-15 Motorola, Inc. Method and apparatus for speech excitation waveform coding using multiple error waveforms
US6134518A (en) * 1997-03-04 2000-10-17 International Business Machines Corporation Digital audio signal coding using a CELP coder and a transform coder
KR100261253B1 (ko) 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치
US6064954A (en) 1997-04-03 2000-05-16 International Business Machines Corp. Digital audio signal coding
WO1999010719A1 (en) 1997-08-29 1999-03-04 The Regents Of The University Of California Method and apparatus for hybrid coding of speech at 4kbps
US6006179A (en) * 1997-10-28 1999-12-21 America Online, Inc. Audio codec using adaptive sparse vector quantization with subband vector classification
RU2214047C2 (ru) * 1997-11-19 2003-10-10 Самсунг Электроникс Ко., Лтд. Способ и устройство для масштабируемого кодирования/декодирования аудиосигналов
US6249766B1 (en) 1998-03-10 2001-06-19 Siemens Corporate Research, Inc. Real-time down-sampling system for digital audio waveform data
US6085163A (en) * 1998-03-13 2000-07-04 Todd; Craig Campbell Using time-aligned blocks of encoded audio in video/audio applications to facilitate audio switching
US6119080A (en) * 1998-06-17 2000-09-12 Formosoft International Inc. Unified recursive decomposition architecture for cosine modulated filter banks
US7272556B1 (en) * 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
US6188987B1 (en) 1998-11-17 2001-02-13 Dolby Laboratories Licensing Corporation Providing auxiliary information with frame-based encoded audio information
US6311154B1 (en) * 1998-12-30 2001-10-30 Nokia Mobile Phones Limited Adaptive windows for analysis-by-synthesis CELP-type speech coding
US6226608B1 (en) * 1999-01-28 2001-05-01 Dolby Laboratories Licensing Corporation Data framing for adaptive-block-length coding system
US6640209B1 (en) * 1999-02-26 2003-10-28 Qualcomm Incorporated Closed-loop multimode mixed-domain linear prediction (MDLP) speech coder
US6449592B1 (en) 1999-02-26 2002-09-10 Qualcomm Incorporated Method and apparatus for tracking the phase of a quasi-periodic signal
US7020285B1 (en) * 1999-07-13 2006-03-28 Microsoft Corporation Stealthy audio watermarking
US6604070B1 (en) 1999-09-22 2003-08-05 Conexant Systems, Inc. System of encoding and decoding speech signals
CA2809775C (en) * 1999-10-27 2017-03-21 The Nielsen Company (Us), Llc Audio signature extraction and correlation
US6868377B1 (en) * 1999-11-23 2005-03-15 Creative Technology Ltd. Multiband phase-vocoder for the modification of audio or speech signals
FR2802329B1 (fr) 1999-12-08 2003-03-28 France Telecom Procede de traitement d'au moins un flux binaire audio code organise sous la forme de trames
JP3630609B2 (ja) 2000-03-29 2005-03-16 パイオニア株式会社 音声情報再生方法ならびに装置
US20020049586A1 (en) 2000-09-11 2002-04-25 Kousuke Nishio Audio encoder, audio decoder, and broadcasting system
US7010480B2 (en) 2000-09-15 2006-03-07 Mindspeed Technologies, Inc. Controlling a weighting filter based on the spectral content of a speech signal
US7020605B2 (en) * 2000-09-15 2006-03-28 Mindspeed Technologies, Inc. Speech coding system with time-domain noise attenuation
US7472059B2 (en) * 2000-12-08 2008-12-30 Qualcomm Incorporated Method and apparatus for robust speech classification
US6738739B2 (en) 2001-02-15 2004-05-18 Mindspeed Technologies, Inc. Voiced speech preprocessing employing waveform interpolation or a harmonic model
US7283954B2 (en) 2001-04-13 2007-10-16 Dolby Laboratories Licensing Corporation Comparing audio using characterizations based on auditory events
US6658383B2 (en) * 2001-06-26 2003-12-02 Microsoft Corporation Method for coding speech and music signals
US7333929B1 (en) * 2001-09-13 2008-02-19 Chmounk Dmitri V Modular scalable compressed audio data stream
JP3750583B2 (ja) 2001-10-22 2006-03-01 ソニー株式会社 信号処理方法及び装置、並びに信号処理プログラム
WO2003077425A1 (fr) 2002-03-08 2003-09-18 Nippon Telegraph And Telephone Corporation Procedes de codage et de decodage signaux numeriques, dispositifs de codage et de decodage, programme de codage et de decodage de signaux numeriques
US7366659B2 (en) 2002-06-07 2008-04-29 Lucent Technologies Inc. Methods and devices for selectively generating time-scaled sound signals
JP4022111B2 (ja) 2002-08-23 2007-12-12 株式会社エヌ・ティ・ティ・ドコモ 信号符号化装置及び信号符号化方法
US7295970B1 (en) 2002-08-29 2007-11-13 At&T Corp Unsupervised speaker segmentation of multi-speaker speech data
JP4676140B2 (ja) 2002-09-04 2011-04-27 マイクロソフト コーポレーション オーディオの量子化および逆量子化
JP3870880B2 (ja) 2002-09-04 2007-01-24 住友電装株式会社 導線と圧接端子との接続構造
US7424434B2 (en) * 2002-09-04 2008-09-09 Microsoft Corporation Unified lossy and lossless audio compression
EP1554716A1 (en) * 2002-10-14 2005-07-20 Koninklijke Philips Electronics N.V. Signal filtering
US20070112573A1 (en) 2002-12-19 2007-05-17 Koninklijke Philips Electronics N.V. Sinusoid selection in audio encoding
AU2003208517A1 (en) * 2003-03-11 2004-09-30 Nokia Corporation Switching between coding schemes
JP2004302259A (ja) * 2003-03-31 2004-10-28 Matsushita Electric Ind Co Ltd 音響信号の階層符号化方法および階層復号化方法
US8311809B2 (en) 2003-04-17 2012-11-13 Koninklijke Philips Electronics N.V. Converting decoded sub-band signal into a stereo signal
US7325023B2 (en) * 2003-09-29 2008-01-29 Sony Corporation Method of making a window type decision based on MDCT data in audio encoding
BR122018007834B1 (pt) 2003-10-30 2019-03-19 Koninklijke Philips Electronics N.V. Codificador e decodificador de áudio avançado de estéreo paramétrico combinado e de replicação de banda espectral, método de codificação avançada de áudio de estéreo paramétrico combinado e de replicação de banda espectral, sinal de áudio avançado codificado de estéreo paramétrico combinado e de replicação de banda espectral, método de decodificação avançada de áudio de estéreo paramétrico combinado e de replicação de banda espectral, e, meio de armazenamento legível por computador
WO2005055201A1 (en) 2003-12-01 2005-06-16 Aic A highly optimized method for modelling a windowed signal
FR2865310A1 (fr) 2004-01-20 2005-07-22 France Telecom Procede de restauration de partiels d'un signal sonore
US7516064B2 (en) * 2004-02-19 2009-04-07 Dolby Laboratories Licensing Corporation Adaptive hybrid transform for signal analysis and synthesis
US7596486B2 (en) * 2004-05-19 2009-09-29 Nokia Corporation Encoding an audio signal using different audio coder modes
US7649988B2 (en) * 2004-06-15 2010-01-19 Acoustic Technologies, Inc. Comfort noise generator using modified Doblinger noise estimate
KR100608062B1 (ko) 2004-08-04 2006-08-02 삼성전자주식회사 오디오 데이터의 고주파수 복원 방법 및 그 장치
US8326606B2 (en) 2004-10-26 2012-12-04 Panasonic Corporation Sound encoding device and sound encoding method
GB2420846B (en) * 2004-12-04 2009-07-08 Ford Global Technologies Llc A cooling system for a motor vehicle engine
US20070147518A1 (en) * 2005-02-18 2007-06-28 Bruno Bessette Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX
US7840411B2 (en) * 2005-03-30 2010-11-23 Koninklijke Philips Electronics N.V. Audio encoding and decoding
US7418394B2 (en) * 2005-04-28 2008-08-26 Dolby Laboratories Licensing Corporation Method and system for operating audio encoders utilizing data from overlapping audio segments
US7571104B2 (en) 2005-05-26 2009-08-04 Qnx Software Systems (Wavemakers), Inc. Dynamic real-time cross-fading of voice prompts
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US7546240B2 (en) 2005-07-15 2009-06-09 Microsoft Corporation Coding with improved time resolution for selected segments via adaptive block transformation of a group of samples from a subband decomposition
KR100643310B1 (ko) 2005-08-24 2006-11-10 삼성전자주식회사 음성 데이터의 포먼트와 유사한 교란 신호를 출력하여송화자 음성을 차폐하는 방법 및 장치
US7953605B2 (en) 2005-10-07 2011-05-31 Deepen Sinha Method and apparatus for audio encoding and decoding using wideband psychoacoustic modeling and bandwidth extension
KR100647336B1 (ko) 2005-11-08 2006-11-23 삼성전자주식회사 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법
CN1963917A (zh) 2005-11-11 2007-05-16 株式会社东芝 评价语音的分辨力、说话人认证的注册和验证方法及装置
US7805297B2 (en) * 2005-11-23 2010-09-28 Broadcom Corporation Classification-based frame loss concealment for audio signals
EP1855436A1 (en) 2006-05-12 2007-11-14 Deutsche Thomson-Brandt Gmbh Method and apparatus for encrypting encoded audio signal
US8010352B2 (en) 2006-06-21 2011-08-30 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band
US8036903B2 (en) 2006-10-18 2011-10-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system
DE102006051673A1 (de) 2006-11-02 2008-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale
KR101434198B1 (ko) * 2006-11-17 2014-08-26 삼성전자주식회사 신호 복호화 방법
KR100964402B1 (ko) 2006-12-14 2010-06-17 삼성전자주식회사 오디오 신호의 부호화 모드 결정 방법 및 장치와 이를 이용한 오디오 신호의 부호화/복호화 방법 및 장치
KR101334366B1 (ko) 2006-12-28 2013-11-29 삼성전자주식회사 오디오 배속 재생 방법 및 장치
KR100883656B1 (ko) 2006-12-28 2009-02-18 삼성전자주식회사 오디오 신호의 분류 방법 및 장치와 이를 이용한 오디오신호의 부호화/복호화 방법 및 장치
KR101403340B1 (ko) 2007-08-02 2014-06-09 삼성전자주식회사 변환 부호화 방법 및 장치
US8050934B2 (en) 2007-11-29 2011-11-01 Texas Instruments Incorporated Local pitch control based on seamless time scale modification and synchronized sampling rate conversion
KR101441896B1 (ko) 2008-01-29 2014-09-23 삼성전자주식회사 적응적 lpc 계수 보간을 이용한 오디오 신호의 부호화,복호화 방법 및 장치
US8364481B2 (en) 2008-07-02 2013-01-29 Google Inc. Speech recognition with parallel recognition tasks
EP2631906A1 (en) 2012-02-27 2013-08-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Phase coherence control for harmonic signals in perceptual audio codecs

Also Published As

Publication number Publication date
HK1126602A1 (en) 2009-09-04
JP2010512550A (ja) 2010-04-22
US10714110B2 (en) 2020-07-14
ES2383217T3 (es) 2012-06-19
MY148913A (en) 2013-06-14
ZA200903159B (en) 2010-07-28
US20170249952A1 (en) 2017-08-31
EP2052548A2 (en) 2009-04-29
US9653089B2 (en) 2017-05-16
US20150179183A1 (en) 2015-06-25
NO20092506L (no) 2009-09-10
MX2009006201A (es) 2009-06-22
US20140222442A1 (en) 2014-08-07
CN102395033B (zh) 2014-08-27
IL198725A (en) 2016-03-31
US20200335117A1 (en) 2020-10-22
US11581001B2 (en) 2023-02-14
CA2672165A1 (en) 2008-06-19
KR101016224B1 (ko) 2011-02-25
TW200841743A (en) 2008-10-16
US20230154475A1 (en) 2023-05-18
US20100138218A1 (en) 2010-06-03
AU2007331763B2 (en) 2011-06-30
US9355647B2 (en) 2016-05-31
US8812305B2 (en) 2014-08-19
BRPI0718738A2 (pt) 2015-03-24
US8818796B2 (en) 2014-08-26
IL198725A0 (en) 2010-02-17
BRPI0718738B1 (pt) 2023-05-16
JP5171842B2 (ja) 2013-03-27
NO342080B1 (no) 2018-03-19
US11961530B2 (en) 2024-04-16
CN101589623A (zh) 2009-11-25
ATE547898T1 (de) 2012-03-15
CA2672165C (en) 2014-07-29
US9043202B2 (en) 2015-05-26
RU2009117569A (ru) 2011-01-20
WO2008071353A2 (en) 2008-06-19
BR122019024992B1 (pt) 2021-04-06
KR20090085655A (ko) 2009-08-07
BRPI0718738A8 (pt) 2018-10-16
US20130282389A1 (en) 2013-10-24
WO2008071353A3 (en) 2008-08-21
CN102395033A (zh) 2012-03-28
EP2052548B1 (en) 2012-02-29
HK1168706A1 (zh) 2013-01-04
CN101589623B (zh) 2013-03-13
US20160225383A1 (en) 2016-08-04
RU2444071C2 (ru) 2012-02-27
PL2052548T3 (pl) 2012-08-31
AU2007331763A1 (en) 2008-06-19

Similar Documents

Publication Publication Date Title
TWI363563B (en) Encoder, decoder and methods for encoding and decoding data segments representing a time-domain data stream
EP3268958B1 (en) Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
EP2849180B1 (en) Hybrid audio signal encoder, hybrid audio signal decoder, method for encoding audio signal, and method for decoding audio signal
US20100100390A1 (en) Audio encoding apparatus, audio decoding apparatus, and audio encoded information transmitting apparatus
TW200836492A (en) Device and method for postprocessing spectral values and encoder and decoder for audio signals
WO2013061584A1 (ja) 音信号ハイブリッドデコーダ、音信号ハイブリッドエンコーダ、音信号復号方法、及び音信号符号化方法