TWI483619B - 一種媒體訊號的編碼/解碼方法及其裝置 - Google Patents

一種媒體訊號的編碼/解碼方法及其裝置 Download PDF

Info

Publication number
TWI483619B
TWI483619B TW098104750A TW98104750A TWI483619B TW I483619 B TWI483619 B TW I483619B TW 098104750 A TW098104750 A TW 098104750A TW 98104750 A TW98104750 A TW 98104750A TW I483619 B TWI483619 B TW I483619B
Authority
TW
Taiwan
Prior art keywords
spatial information
signal
channel
downmix
decoding
Prior art date
Application number
TW098104750A
Other languages
English (en)
Other versions
TW200939792A (en
Inventor
Hyen O Oh
Hee Suk Pang
Dong Soo Kim
Jae Hyun Lim
Yang Won Jung
Original Assignee
Lg Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lg Electronics Inc filed Critical Lg Electronics Inc
Publication of TW200939792A publication Critical patent/TW200939792A/zh
Application granted granted Critical
Publication of TWI483619B publication Critical patent/TWI483619B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/233Processing of audio elementary streams
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

一種媒體訊號的編碼/解碼方法及其裝置
本發明係關於一種媒體訊號之處理裝置及其方法。
本發明中,媒體訊號包含音頻訊號以及視頻訊號。以下描述中,音頻訊號被解釋作為例子。
當前,二通道訊號之產生以及使用最為頻繁。但是,多通道訊號之使用也逐漸增加。以下描述中,包含至少三個通道之音頻訊號被稱為多通道訊號,以區別於二通道訊號。通常,編碼器壓縮多通道訊號為單音或立體聲降混訊號,而並非單獨地壓縮多通道訊號之通道。編碼器之降混單元透過降混多通道而擷取空間資訊。編碼器傳送經過壓縮的降混訊號及空間資訊至解碼器,或者將其儲存於儲存媒介中。空間資訊用於由經過壓縮的降混訊號重新建立初始的多通道訊號。如果使用編碼器及解碼器以壓縮及重新建立二通道訊號,則編碼器由二通道訊號產生降混訊號以及空間資訊,然後傳送包含降混訊號及空間資訊之位元流至解碼器。解碼器升混被傳送之位元流以產生初始的二通道訊號。如果使用編碼器及解碼器以壓縮及重新建立多通道訊號,則編碼器由多通道訊號產生降混訊號及空間資訊,然後傳送包含降混訊號及空間資訊之位元流至解碼器。然後,解碼器升混被傳送之位元流以產生初始的多通道訊號。
因此,本發明的目的在於提供一種媒體訊號之處理裝置及其方法,藉以避免習知技術之限制及缺點所產生之一或多個問題。
本發明的目的在於提供一種編碼方法及裝置,可產生空間資訊,由其重新建立之音頻訊號之音頻品質接近降混前的音頻訊號。
本發明的另一目的在於提供一種編碼方法及裝置,可提供且產生位元流,其中包含用於產生二通道訊號之空間資訊以及用於產生多通道訊號之空間資訊。
本發明的另一目的在於提供一種解碼方法及裝置,可選擇性地產生二通道訊號或者多通道訊號。
本發明從位元流中擷取降混訊號,並且還從位元流中擷取第一空間資訊及第二空間資訊至少其中之一。本發明提供一種方法及裝置,使用擷取的空間資訊以及擷取的降混訊號產生特別的多通道。
本發明可提供一種編碼方法及裝置,用於產生空間資訊以使得重新建立之音頻訊號之音頻品質接近降混前之音頻訊號。
本發明可提供一種位元流,其中包含用於產生二通道訊號之空間資訊以及用於產生多通道訊號之空間資訊。並且,本發明可提供產生此位元流之編碼方法及裝置。
本發明可提供一種解碼方法及裝置,能夠選擇性地產生二通道訊號或多通道訊號。
為了獲得本發明的這些目的和其他優點,現對本發明作具體化和概括性的描述,本發明之一種媒體訊號之處理方法包含以下步驟:從位元流中擷取降混訊號;從位元流中擷取第一空間資訊及第二空間資訊至少其中之一;以及使用擷取的空間資訊及降混訊號產生多通道。
為了進一步獲得本發明的這些目的和其他優點,本發明之一種媒體訊號之處理方法包含以下步驟:由多通道訊號產生第一降混訊號;由第一降混訊號產生第二降混訊號;使用多通道及第一降混訊號或者多通道及第二降混訊號產生第一空間資訊;使用第一降混訊號及第二降混訊號產生第二空間資訊;以及產生包含第一空間資訊及第二空間資訊之位元流。
為了進一步獲得本發明的這些目的和其他優點,本發明之一種媒體訊號之處理方法包含以下步驟:由多通道產生第一降混訊號;由第一降混訊號產生第二降混訊號;編碼第二降混訊號;解碼此經過編碼的第二降混訊號;使用第一降混訊號及經過解碼的第二降混訊號產生第二空間資訊;以及使用多通道及經過解碼的第二降混訊號產生第一空間資訊。
為了進一步獲得本發明的這些目的和其他優點,本發明之一種媒體訊號之處理方法包含以下步驟:由多通道產生第一降混訊號;由第一降混訊號產生第二降混訊號;編碼第二降混訊號;解碼經過編碼的第二降混訊號;使用第一降混訊號及經過解碼的第二降混訊號產生第二空間資訊;使用經過解碼的第二降混訊號及第二空間資訊產生修正的第一降混訊號;以及使用修正的第一降混訊號及多通道產生第一空間資訊。
為了進一步獲得本發明的這些目的和其他優點,本發明之一種訊號處理裝置包含:降混訊號擷取單元,從位元流中擷取降混訊號;資訊擷取單元,從位元流中擷取第二空間資訊及第一空間資訊至少其中之一,其中第二空間資訊用於由降混訊號產生兩個通道,第一空間資訊用於由降混訊號產生至少三個通道;以及通道產生單元,使用擷取之資訊及降混訊號產生或者兩個通道或者至少三個通道。
為了進一步獲得本發明的這些目的和其他優點,本發明之一種位元流結構包含第一空間資訊以及第二空間資訊,其中第一空間資訊擷取於由多通道產生包含至少兩通道之第一降混訊號期間,第二空間資訊擷取於由第一降混訊號產生第二降混訊號期間。
為了進一步獲得本發明的這些目的和其他優點,本發明之一種儲存媒介包含此位元流結構。
為了進一步獲得本發明的這些目的和其他優點,本發明之一種訊號處理裝置包含:第一降混單元,由多通道產生第一降混訊號;第二降混單元,由第一降混訊號產生第二降混訊號;第一空間資訊產生單元,使用多通道及第一降混訊號或者多通道及第二降混訊號產生第一空間資訊;第二空間資訊產生單元,使用第一降混訊號及第二降混訊號產生第二空間資訊;以及多工單元,產生包含第一空間資訊及第二空間資訊之位元流。
為了進一步獲得本發明的這些目的和其他優點,本發明之一種訊號處理裝置包含:降混單元,由多通道產生降混訊號,編碼單元,編碼此降混訊號;解碼單元,解碼此經過編碼的降混訊號;以及空間資訊產生單元,使用多通道及解碼的降混訊號產生空間資訊。
現在結合附圖所示之例子對本發明的較佳實施例作詳細說明。為了便於理解本發明,音頻訊號之編碼方法及裝置解釋於音頻訊號之解碼方法及裝置之前。但是,本發明之解碼方法及裝置並非受限於以下描述中所解釋的編碼方法及裝置。並且,本發明可應用於使用空間資訊產生兩通道的編碼方案、使用空間資訊產生多通道的編碼方案、第三層壓縮方法(MPEGIII;MP3)以及先進音頻編碼(advanced audio coding;AAC)
用於壓縮兩通道訊號之編碼裝置接收二通道訊號,降混此接收訊號為單音訊號,並且擷取用於指示兩通道訊號之相關性之空間資訊。用於壓縮多通道訊號之編碼裝置降混多通道訊號為一或兩個音頻訊號,並且擷取用於指示多通道訊號之相關性之資訊。編碼裝置能夠透過降混多通道訊號產生二通道訊號訊號,或者透過再次降混二通道訊號產生單音訊號。此實施例中,編碼裝置於降混多通道訊號為二通道訊號期間從多通道訊號與二通道訊號之間的關係中擷取空間資訊,或者於降混二通道訊號為單音訊號期間從二通道訊號與單音訊號之間的關係中擷取空間資訊。編碼裝置能夠單獨地傳送用於重新建立二通道訊號之空間資訊以及用於重新建立多通道訊號之空間資訊至解碼裝置。或者,編碼裝置產生的位元流包含用於重新建立二通道訊號之空間資訊以及用於重新建立多通道訊號之空間資訊,然後傳送位元流至解碼裝置。如果解碼裝置可產生的訊號或者為二通道訊號或者為多通道訊號,位元流包含用於重新建立二通道訊號之空間資訊及用於重新建立多通道訊號之空間資訊,已經接收此位元流之解碼裝置僅僅從此位元流中擷取重新建立可產生的通道訊號所用之空間資訊,然後能夠使用擷取的空間資訊重新建立通道訊號。如果解碼裝置能夠重新建立二通道訊號以及多通道訊號,解碼裝置僅僅從位元流中擷取產生使用者選擇之通道訊號所需之空間資訊,然後能夠使用擷取之空間資訊產生使用者選擇之通道訊號。
以下結合「第1圖」及「第2圖」解釋產生位元流之編碼方法及裝置,其中位元流包含用於重新建立二通道訊號之空間資訊以及用於重新建立多通道訊號之空間資訊。
「第1圖」係為本發明實施例之第一編碼裝置之方塊圖。
請參考「第1圖」,第一編碼裝置包含第一降混單元100、第二降混單元110、降混訊號編碼單元120、第一空間資訊產生單元130、第二空間資訊產生單元140以及多工單元150。
第一降混單元100接收多通道訊號,然後降混接收的訊號為第一降混訊號,第一降混訊號的通道少於多通道訊號的通道。第二降混單元110降混第一降混訊號為第二降混訊號,第二降混訊號的通道少於第一降混訊號的通道。
第一降混單元100及第二降混單元110均可使用一至二(one-to-two;OTT)盒或者二至三(two-to-three;TTT)盒以轉換兩通道為一通道或者轉換三通道為兩通道。一至二盒或者二至三盒為概念盒,包含於音頻訊號之解碼裝置中,以用於使用降混訊號及空間資訊產生多通道。一至二盒使用空間資訊轉換一個訊號為兩個訊號。二至三盒使用空間資訊轉換兩個訊號為三個訊號。以下描述中,一至二盒或者二至三盒被稱為訊號轉換單元。為了對應音頻訊號解碼裝置所用的一至二盒或者二至三盒,一至二盒或者二至三盒被包含於音頻訊號編碼裝置的第一降混單元100或者第二降混單元110中,以用於由輸入的多通道而輸出一或兩個降混訊號。
第一/第二降混訊號可人工地產生,而非由第一降混單元100/第二降混單元110產生。因為第二降混訊號中包含的通道少於第一降混訊號的通道,如果第二降混訊號為單音訊號,則第一降混訊號應該包含至少兩個通道。如果第一降混訊號為二通道訊號,則多通道訊號應該包含至少三個通道。
降混訊號編碼單元120壓縮第二降混訊號,然後發送壓縮的降混訊號至多工單元150。第一空間資訊產生單元130使用多通道訊號及第二降混訊號產生第一空間資訊,然後發送第一空間資訊至多工單元150。
空間資訊係為降混通道訊號時指示通道關係之資訊。解碼裝置使用空間資訊以由降混訊號重新建立初始的通道訊號。降混多通道訊號產生的第一空間資訊包含通道等級差值(channel level differences;CLD)、通道間相關係數(interchannel correlations;ICC)、通道預測係數(channel prediction coefficients;CPC)等。通道等級差值指示音頻訊號之間的能量差值。通道間相關係數指示音頻訊號之間的相關性或者相似性。通道預測係數表示使用另一訊號預測音頻訊號的係數。第二空間資訊產生單元140使用第一降混訊號及第二降混訊號產生第二空間資訊,然後發送第二空間資訊至多工單元150。如果第一降混訊號係為二通道訊號,則第二空間資訊可包含指示兩個通道之間能量差值之通道間強度差值(interchannel intensity differnce;IID)、指示兩個通道之間相位差值之通道間相位差值(interchannel phase difference;IPD)、指示兩個通道之間相關性之通道間相關係數等。
空間資訊係為依照預定的樹狀結構擷取於降混通道訊號期間的資訊。此實施例中,預定的樹狀結構意味著解碼裝置及編碼裝置之間所同意的樹狀結構。空間資訊能夠包含樹狀結構資訊。此實施例中的樹狀結構資訊係為一種類型的樹狀結構的資訊。依照這種類型的樹狀結構,可改變多通道的數目、各通道的降混序列等。
多工單元150產生包含第一空間資訊及第二空間資訊之位元流,然後傳送產生的位元流至解碼裝置,或者連同降混訊號傳送或者與降混訊號單獨傳送。
編碼裝置能夠以脈碼調變(Pulse Code Modulation;PCM)之訊號格式傳送第二降混訊號至解碼裝置。此實施例中,多工單元150產生包含第一空間資訊及第二空間資訊之位元流,然後傳送產生的位元流至解碼裝置,或者連同脈碼調變訊號傳送或者與脈碼調變訊號單獨傳送。如果一同傳送脈碼調變訊號及空間資訊至解碼裝置,多工單元150透過將第一空間資訊及第二空間資訊嵌入脈碼調變訊號中而產生位元流,然後傳送產生的位元流至解碼裝置。
編碼裝置能夠於位元流中插入識別符。此實施例中,識別符指示被傳送的位元流中是否包含用於產生二通道訊號之第二空間資訊、用於產生多通道訊號之第一空間資訊,或者同時包含第一空間資訊及第二空間資訊。
「第2圖」係為本發明另一實施例之第二編碼裝置之方塊圖。
請參考「第2圖」,第二編碼裝置包含第一降混單元200、第二降混單元210、降混訊號編碼單元220、第一空間資訊產生單元230、第二空間資訊產生單元240以及多工單元250。
第一降混單元200接收多通道訊號,然後降混接收的訊號為第一降混訊號,其中包含的通道少於多通道訊號的通道。第二降混單元210降混第一降混訊號為第二降混訊號,其中包含的通道少於第一降混訊號的通道。
降混訊號編碼單元220壓縮第二降混訊號,然後發送壓縮的訊號至多工單元250。第二降混訊號可以脈碼調變之訊號格式被傳送至解碼裝置,無須通過降混訊號編碼單元220。
第一空間資訊產生單元230使用多通道訊號及第一降混訊號產生第一空間資訊。第二空間資訊產生單元240使用第一降混訊號及第二降混訊號產生第二空間資訊。第一空間資訊產生單元230及第二空間資訊產生單元240各自發送第一空間資訊及第二空間資訊至多工單元250。
透過多工壓縮的降混訊號、第一空間資訊以及第二空間資訊,多工單元250產生位元流,然後傳送產生的位元流至解碼裝置。
編碼裝置單獨地產生降混訊號流、第一空間資訊流以及第二空間資訊流,然後各自傳送此分離流至解碼裝置。或者,編碼裝置產生包含第一空間資訊及第二空間資訊之位元流,然後連同降混訊號傳送產生的位元流至解碼裝置。
第二編碼裝置與第一編碼裝置不同,其中第一編碼裝置使用多通道訊號及第二降混訊號產生第一空間資訊,而第二編碼裝置使用多通道訊號及第一降混訊號產生第一空間資訊。因此,第一編碼裝置產生的第一空間資訊與第二編碼裝置產生的第一空間資訊不同。
解碼裝置接收「第1圖」或「第2圖」解釋的編碼裝置所產生的降混訊號及空間資訊,並且使用空間資訊及降混訊號重新建立二通道訊號或多通道訊號。解碼裝置解碼由編碼裝置編碼且傳送的降混訊號,然後使用經過解碼的降混訊號及空間資訊重新建立二通道訊號或者多通道訊號。因此,解碼裝置重新建立的音頻訊號在音頻品質上與降混前的音頻訊號不同。為了避免這種情況,編碼裝置可使用降混訊號產生空間資訊,其中降混訊號用於解碼裝置重新建立音頻訊號。
下面結合「第3圖」以及「第4圖」解釋一種編碼方法及裝置,使用降混訊號產生空間資訊,其中降混訊號用於解碼裝置重新建立音頻訊號。
「第3圖」係為本發明實施例之使用經過解碼之降混訊號產生空間資訊之第三編碼裝置。
請參考「第3圖」,第三編碼裝置包含第一降混單元300、第二降混單元310、降混訊號編碼單元320、降混訊號解碼單元330、第一空間資訊產生單元350、第二空間資訊產生單元340以及多工單元360。
第三編碼裝置包含降混訊號解碼單元330,與第一編碼裝置不同。
第一降混單元300降混多通道訊號為第一降混訊號,第二降混單元310降混第一降混訊號為第二降混訊號。降混訊號編碼單元320編碼第二降混訊號。降混訊號解碼單元330解碼經過編碼的第二降混訊號。第二空間資訊產生單元340使用第一降混訊號及經過解碼的第二降混訊號產生第二空間資訊。
第一編碼裝置與第三編碼裝置具有共同特徵,均使用第一降混訊號與第二降混訊號之間的相關性產生第二空間資訊。但是,第三編碼裝置與第一編碼裝置不同,第一編碼裝置使用第二降混單元110所降混的第二降混訊號產生第二空間資訊,而第三編碼裝置編碼第二降混訊號,解碼經過編碼的第二降混訊號,然後使用經過解碼的第二降混訊號產生第二空間資訊。第一編碼裝置產生的第二空間資訊與第三編碼裝置產生的第二空間資訊不同。
第一空間資訊產生單元350使用多通道訊號及經過解碼的第二降混訊號產生第一空間資訊。與第一編碼裝置使用第二降混訊號產生第一空間資訊不同,第三編碼裝置編碼第二降混訊號,再次解碼經過編碼的訊號,然後使用經過解碼的第二降混訊號產生第一空間資訊。因此,第一編碼裝置與第三編碼裝置彼此不同。第一編碼裝置之第一空間資訊也與第三編碼裝置之第一空間資訊不同。
多工單元360多工經過編碼的降混訊號、第一空間資訊以及第二空間資訊,然後傳送多工訊號至解碼裝置。
解碼裝置解碼由編碼裝置編碼且傳送的第二降混訊號,然後透過應用第一空間資訊及第二空間資訊至少其中之一至經過解碼之降混訊號,以重新建立二通道訊號或者多通道訊號。因此,解碼裝置重新建立之通道訊號之音頻品質比較接近編碼裝置降混前之音頻訊號。
「第4圖」係為本發明另一實施例之使用經過解碼之降混訊號產生空間資訊之第四編碼裝置之方塊圖。
請參考「第4圖」,第四編碼裝置包含第一降混單元400、第二降混單元410、降混訊號編碼單元420、降混訊號解碼單元430、第一空間資訊產生單元460、第二空間資訊產生單元440、第一降混訊號產生單元450以及多工單元470。
第四編碼裝置包含降混訊號解碼單元430以及第一降混訊號產生單元450,與第二編碼裝置不同。
第一降混單元400降混多通道訊號為第一降混訊號,第二降混單元410降混第一降混訊號為第二降混訊號。降混訊號編碼單元420編碼第二降混訊號,然後將其發送至降混訊號解碼單元430。降混訊號解碼單元430解碼經過編碼的降混訊號,然後將其發送至第二空間資訊產生單元440。第二空間資訊產生單元440使用第一降混訊號及經過解碼的第二降混訊號產生第二空間資訊。
第四編碼裝置與第二編碼裝置不同,第二編碼裝置使用未經過編碼及解碼的第二降混訊號產生第二空間資訊,第四編碼裝置產生第二空間資訊所用之降混訊號,首先經過降混訊號編碼單元420編碼,然後又經過降混訊號解碼單元430解碼。
第一降混訊號產生單元450使用降混訊號解碼單元430所解碼的第二降混訊號以及第二空間資訊產生修正的第一降混訊號。修正的第一降混訊號與第一降混單元400所降混的第一降混訊號不同,其中修正的第一降混訊號由經過編碼及重新解碼的第二降混訊號以及使用經過編碼及重新解碼的第二降混訊號產生的第二空間資訊所產生。
第一空間資訊產生單元460使用修正的第一降混訊號以及多通道訊號產生第一空間資訊。第一空間資訊產生單元460與第二編碼裝置不同,第二編碼裝置使用完整的第一降混訊號產生第一空間資訊,而第一空間資訊產生單元460使用第一降混資訊訊號產生單元450所產生的修正的第一降混訊號產生第一空間資訊。第一空間資訊產生單元460產生的第一空間資訊與第二編碼裝置產生的第一空間資訊不同。多工單元470產生的位元流同時包含第一空間資訊及第二空間資訊。
第四編碼裝置傳送包含空間資訊之位元流至解碼裝置,或者連同第二降混訊號傳送或者各自單獨傳送。
「第5圖」係為本發明實施例之音頻訊號之位元流之示意圖。
請參考「第5圖」,本發明之音頻訊號包含降混訊號500以及空間資訊訊號600。音頻訊號以其中排列有若干框的基本流(elementary stream;ES)的形式存在。
降混訊號500及空間資訊訊號600可各自以不同的基本流形式被傳送至解碼裝置。或者,它們也可以一種基本流的形式被傳送,其中共同組合有降混訊號500及空間資訊訊號600。如果以組合形式傳送降混訊號500及空間資訊訊號600至解碼裝置,空間資訊訊號600可包含於降混訊號500之附加資料或者延伸資料的位置。
音頻訊號可包含編碼解碼器之識別符,使得解碼裝置能夠無須解碼音頻訊號即可識別出音頻編碼解碼器所用之基本資訊。編碼解碼器識別符係為指示編碼音頻訊號時使用何種編碼方案之資訊。編碼解碼器識別符可包含於空間資訊訊號600之標頭610或者空間資訊620中。並且編碼解碼器識別符可包含空間資訊識別符。此實施例中,空間資訊識別符係為指示位元流是否包含第二空間資訊或第一空間資訊,或者同時包含第一空間資訊及第二空間資訊之資訊,其中第二空間資訊用於由音頻訊號產生二通道訊號,第一空間資訊用於由音頻訊號產生多通道訊號。因此,解碼裝置能夠使用空間資訊識別符偵測出可產生自降混訊號等的音頻訊號的類型。
空間資訊訊號600可包含標頭610及空間資訊620。或者,空間資訊訊號600可包含僅僅包含空間資訊620而不包含標頭610。即,空間資訊訊號600能夠使用包含標頭610的框或者不包含標頭610的框。
如果音頻訊號包含產生多通道訊號之空間資訊以及產生二通道訊號之空間資訊,則標頭610可包含二通道訊號標頭611及多通道訊號標頭613。
如果解碼裝置重新建立的訊號為二通道訊號,則解碼裝置解碼第二空間資訊623,以使用二通道訊號標頭611產生二通道訊號,然後使用經過解碼的第二空間資訊623重新建立二通道訊號。
如果解碼裝置重新建立的訊號為多通道訊號,則解碼裝置解碼空間資訊以使用多通道訊號標頭613產生多通道訊號。重新建立多通道訊號之空間資訊可包含第二空間資訊623及第一空間資訊621。如果解碼裝置重新建立二通道訊號,然後由重新建立的二通道訊號重新建立多通道訊號,則可逐步地重新建立多通道訊號,首先使用第二空間資訊623重新建立二通道訊號,然後由二通道訊號使用第一空間資訊621重新建立多通道訊號。空間資訊訊號也可包含前述之樹狀結構資訊。
「第6圖」係為本發明實施例之第一解碼裝置之方塊圖。
請參考「第6圖」,第一解碼裝置包含解多工單元700、降混訊號解碼單元720、二通道訊號產生單元710以及多通道訊號產生單元730。
解多工單元700剖析降混訊號,然後發送經過剖析的訊號至降混訊號解碼單元720。降混訊號可為單音訊號。降混訊號可為頻域上的訊號。頻域可為正交鏡像濾波器(Quadrature Mirror Filter;QMF)域。
降混訊號解碼單元720解碼降混訊號,然後完整地輸出經過解碼的降混訊號。降混訊號解碼單元720使用空間資訊升混此降混訊號為二通道訊號或者多通道訊號,然後輸出經過升混的訊號。如果降混訊號為脈碼調變訊號,則降混訊號可完整地輸出,無須通過降混訊號解碼單元720。
解碼裝置能夠使用位元流中包含的空間資訊識別符偵測出位元流中包含何種空間資訊。
如果降混訊號為單音訊號,並且第一解碼裝置產生的訊號為二通道訊號與多通道訊號其中之一,則解碼裝置使用空間資訊識別符判定此降混訊號是否為能產生二通道訊號或者多通道訊號之訊號。如果解碼裝置判定位元流中同時包含用於產生二通道訊號之空間資訊以及用於產生多通道訊號之空間資訊,則解碼裝置僅僅從用於產生二通道訊號之空間資訊以及用於產生多通道訊號之空間資訊中擷取用於產生特定訊號之空間資訊,然後可使用擷取之資訊產生通道訊號。
如果降混訊號為脈碼調變訊號,則第一空間資訊621及第二空間資訊623可透過嵌於降混訊號中而被傳送。此實施例中,解多工單元700能夠從降混訊號中擷取第一空間資訊621以及第二空間資訊623。
如果解碼裝置僅僅能夠產生二通道訊號,解碼裝置之解多工單元700從傳送的空間資訊中剖析用於產生二通道訊號之第二空間資訊623,然後發送經過剖析的資訊至二通道訊號產生單元710。如果解碼裝置僅僅能夠產生多通道訊號,解碼裝置之解多工單元700從傳送的空間資訊中剖析用於產生多通道訊號之第一空間資訊621,然後發送經過剖析的資訊至多通道訊號產生單元730。就是說,如果解碼裝置由降混訊號及空間資訊直接地產生多通道訊號,而非由二通道訊號產生多通道訊號,則解碼裝置無須使用第二空間資訊623。因此,解碼裝置僅僅擷取第一空間資訊621以供使用。
如果解碼裝置能夠產生二通道訊號以及多通道訊號,則解碼裝置可透過接收來自使用者之控制資訊而擷取適當的空間資訊,以用於產生使用者選擇的通道訊號。
如果解碼裝置產生的訊號為二通道訊號或者使用者選擇產生二通道訊號,則二通道訊號產生單元710使用解多工單元700所分析且發送之第二空間資訊623以及經過解碼之降混訊號產生二通道訊號,然後輸出產生的訊號。使用訊號轉換單元(圖中未表示)尤其是一至二盒,二通道訊號產生單元710透過升混單音降混訊號產生二通道訊號。此實施例中,多通道訊號產生單元730不需要作業。解多工單元700可產生識別符以控制多通道訊號產生單元730之作業,並且發送產生的識別符至多通道訊號產生單元730。下文中,控制二通道訊號產生單元710以及多通道訊號產生單元730之作業之識別符被稱為作業控制識別符。依照接收自解多工單元700之作業控制識別符,多通道訊號產生單元730不作業。並且無須考慮第一空間資訊621。
如果解碼裝置產生的訊號為多通道訊號或者使用者選擇產生多通道訊號,則多通道訊號產生單元730使用第一空間資訊621產生多通道訊號,然後輸出產生的訊號。多通道訊號產生單元730使用複數個訊號轉換單元以升混降混訊號。如前所述,訊號轉換單元包含一至二盒或二至三盒。此實施例中,因為二通道訊號產生單元710無須作業,所以解多工單元700產生作業控制識別符,然後發送產生的作業控制識別符至二通道訊號產生單元710,以控制二通道訊號產生單元710之作業。依照作業控制識別符,二通道訊號產生單元710不作業。並且無須考慮第二空間資訊623。
解碼裝置更可包含修正的空間資訊產生單元(圖中未表示)。修正空間資訊產生單元使用空間資訊以識別修正空間資訊之類型,且根據空間資訊產生所識別類型之修正空間資訊。此實施例中,修正空間資訊係為使用空間資訊新產生的空間資訊。修正空間資訊可透過組合空間資訊而產生。修正空間資訊產生單元能夠使用空間資訊中包含的樹狀結構資訊、輸出通道資訊等產生修正空間資訊。輸出通道資訊係為揚聲器互連於解碼裝置所用之資訊,可包含輸出通道之數目、各輸出通道之位置資訊等。輸出通道資訊事先由製造商輸入解碼裝置或者可由使用者輸入。
解碼裝置使用樹狀結構資訊及輸出通道資訊判定編碼裝置降混的初始多通道數目是否等於將要產生的通道數目。下文中,編碼裝置降混的初始多通道被稱為第一多通道。如果編碼裝置降混的第一多通道的數目與將要產生的多通道數目不同,解碼裝置能夠使用修正空間資訊產生單元修正空間資訊。此實施例中,可透過組合前述之通道等級差值、通道間相關係數、通道預測係數、通道間相位差值等產生修正空間資訊。解碼裝置能夠使用修正空間資訊以及降混訊號產生與第一多通道數目不同的多通道。
「第7圖」係為本發明另一實施例之第二解碼裝置之方塊圖。
請參考「第7圖」,第二解碼裝置包含解多工單元800、降混訊號解碼單元810、二通道訊號產生單元820以及多通道訊號產生單元830。
解多工單元800從編碼裝置傳送之位元流或者儲存媒介中記錄之位元流中分析降混訊號,然後發送經過分析的訊號至降混訊號解碼單元810。
降混訊號解碼單元810解碼降混訊號並且輸出解碼訊號為單音訊號或者使用空間資訊產生二通道訊號或多通道訊號。
如果解碼裝置能夠產生二通道訊號,或者雖然解碼裝置能夠產生二通道訊號及多通道訊號但是使用者選擇產生二通道訊號,則解多工單元800擷取第二空間資訊623以產生二通道訊號,然後發送擷取之資訊至二通道訊號產生單元820。
二通道訊號產生單元820使用第二空間資訊623及經過解碼之降混訊號產生二通道訊號。
因為第二空間資訊623被應用至頻域上的降混訊號,所以為了解碼裝置能夠輸出二通道訊號,二通道訊號應該被轉換為時域上的訊號。解碼裝置能夠使用快速傅立葉轉換(fast Fourier transform;FFT)、離散傅立葉轉換(discrete Fourier transform;DFT)、正交鏡像濾波器或者混合功能(hybrid function)等以轉換時域為頻域,反之亦然。解碼裝置輸出經過域轉換之二通道訊號。
如果解碼裝置僅僅產生二通道訊號,則無須產生多通道訊號。因此,解多工單元800產生令多通道訊號產生單元830不作業之作業控制識別符,然後發送產生的識別符至多通道訊號產生單元830。依照作業控制識別符,多通道訊號產生單元830不作業。並且,無須考慮產生多通道訊號所用之第一空間資訊621。
如果解碼裝置能夠產生多通道訊號或者使用者選擇產生多通道訊號,解多工單元800擷取產生多通道訊號所用之空間資訊。與第一解碼裝置不同,因為第二解碼裝置使用二通道訊號產生多通道訊號,所以解多工單元800一同擷取產生二通道訊號之第二空間資訊623以及由二通道訊號產生多通道訊號之第一空間資訊621。因此,第一解碼裝置使用之第一空間資訊與第二解碼裝置使用之第一空間資訊有所區別。尤其地,第二解碼裝置使用的第二空間資訊係為由二通道訊號產生多通道訊號所需之空間資訊,而第一解碼裝置使用之第一空間資訊係為由降混訊號產生多通道訊號所需之空間資訊。
二通道訊號產生單元820使用第二空間資訊623及解碼的降混訊號產生二通道訊號,然後發送產生的訊號至多通道訊號產生單元830。
多通道訊號產生單元830能夠使用二通道訊號產生單元820發送之二通道訊號以及解多工單元800擷取之第一空間資訊621產生多通道訊號。如果二通道訊號的產生以及多通道訊號的產生被執行於相同的域例如頻域之上,則多通道訊號產生單元830能夠使用頻域上的二通道訊號產生多通道訊號。此實施例中,頻域包含正交鏡像濾波器域、混合域等。尤其地,透過應用第一空間資訊621至未轉換為時域的二通道訊號,多通道訊號產生單元830可產生多通道訊號。此實施例中,無須轉換二通道訊號為時域上的訊號。並且,使用者能夠透過第一解碼裝置或第二解碼裝置等選擇及使用二通道訊號或者多通道訊號。
雖然本發明以前述之實施例揭露如上,然其並非用以限定本發明。在不脫離本發明之精神和範圍內,所為之更動與潤飾,均屬本發明之專利保護範圍之內。關於本發明所界定之保護範圍請參照所附之申請專利範圍。
100、200、300、400...第一降混單元
110、210、310、410...第二降混單元
120、220、320、420...降混訊號編碼單元
130、230、350、460...第一空間資訊產生單元
140、240、340、440...第二空間資訊產生單元
150、250、360、470...多工單元
330、430...降混訊號解碼單元
450...第一降混訊號產生單元
500...降混訊號
600...空間資訊訊號
610...標頭
611...二通道訊號標頭
613...多通道訊號標頭
620...空間資訊
621...第一空間資訊
623...第二空間資訊
700、800...解多工單元
710、820...二通道訊號產生單元
720、810...降混訊號解碼單元
730、830...多通道訊號產生單元
第1圖所示係為本發明實施例之第一編碼裝置之方塊圖;
第2圖所示係為本發明另一實施例之第二編碼裝置之方塊圖;
第3圖所示係為本發明實施例之使用經過解碼之降混訊號產生空間資訊之第三編碼裝置之方塊圖;
第4圖所示係為本發明另一實施例之使用經過解碼之降混訊號產生空間資訊之第三編碼裝置之方塊圖;
第5圖所示係為本發明實施例之音頻訊號之位元流之示意圖;
第6圖所示係為本發明實施例之第一解碼裝置之方塊圖;以及
第7圖所示係為本發明另一實施例之第二解碼裝置之方塊圖。
700...解多工單元
710...二通道訊號產生單元
720...降混訊號解碼單元
730...多通道訊號產生單元

Claims (13)

  1. 一種媒體訊號的解碼方法,包括:從一位元流中擷取一降混訊號,其中該位元流包含:第一空間資訊與第二空間資訊;從該位元流中擷取該第一空間資訊與該第二空間資訊至少其中之一,其中該第一空間資訊係為用以產生包含至少三通道之一多通道音頻訊號的資訊,其中該第二空間資訊係為用以產生包含兩通道之一立體聲音頻訊號的資訊;以及使用該降混訊號與擷取的該第一或第二空間資訊產生該多通道音頻訊號與該立體聲音頻訊號中的至少一個,其中當產生該多通道音頻訊號時,透過該第一空間資訊升混該降混訊號而無須考慮該第二空間資訊,當產生該立體聲音頻訊號時,透過該第二空間資訊升混該降混訊號而無須考慮該第一空間資訊。
  2. 如請求項1所述之媒體訊號的解碼方法,更包括:修正該第一空間資訊或該第二空間資訊,以及其中使用修正的該第一空間資訊或修正的該第二空間資訊與該降混訊號產生該多通道音頻訊號或該立體聲音頻訊號。
  3. 如請求項2所述之媒體訊號的解碼方法,其中修正的該第一空間資訊或修正的該第二空間資訊藉由結合該第一空間資訊或該第二空間資訊而產生。
  4. 如請求項2所述之媒體訊號的解碼方法,其中該降混訊號係由 降混一第一多通道所產生的一訊號,及其中使用修正的該第一空間資訊或修正的該第二空間資訊與該降混訊號產生的該音頻訊號的通道數量不同於該第一多通道的通道數量。
  5. 如請求項1所述之媒體訊號的解碼方法,其中每一該第一空間資訊與每一該第二空間資訊包括至少一項通道等級差值、通道間相關係數、通道預測係數與通道間相位差值。
  6. 如請求項1所述之媒體訊號的解碼方法,其中該降混訊號包括一單音訊號。
  7. 如請求項1所述之媒體訊號的解碼方法,其中係依據一使用者的選擇或一裝置執行該方法產生的一通道類型,進行該第一空間資訊或該第二空間資訊之擷取以及該多通道音頻訊號的多通道或該立體聲音頻訊號的立體聲通道之產生。
  8. 一種媒體訊號的編碼方法,包括:藉由降混一多通道音頻訊號產生一降混訊號;使用該多通道音頻訊號與該降混訊號產生用以根據該多通道音頻訊號解碼包含至少三通道之該多通道音頻訊號的一第一空間資訊及用以解碼一立體聲訊號的一第二空間資訊,其中當產生該多通道音頻訊號時,透過該第一空間資訊升混該降混訊號而無須考慮該第二空間資訊,當產生該立體聲訊號時,透過該第二空間資訊升混該降混訊號而無須考慮該第一空間資訊;以及 產生包含該第一空間資訊與該第二空間資訊之一位元流。
  9. 一種解碼媒體訊號的裝置,包括:一降混訊號擷取單元,從一位元流中擷取一降混訊號;一空間資訊擷取單元,從該位元流中擷取一第二空間資訊及一第一空間資訊至少其中之一,其中該第二空間資訊用以從該降混訊號產生包含兩通道之一立體聲訊號,該第一空間資訊用以從該降混訊號產生包含至少三通道之一多通道音頻訊號;以及一通道產生單元,使用該降混訊號與擷取的該第一或第二資訊其中之一產生該立體聲訊號或該多通道音頻訊號,其中當產生該多通道音頻訊號時,透過該第一空間資訊升混該降混訊號而無須考慮該第二空間資訊,當產生該立體聲訊號時,透過該第二空間資訊升混該降混訊號而無須考慮該第一空間資訊。
  10. 如請求項9所述之解碼媒體訊號的裝置,其中該空間資訊擷取單元更包括一空間資訊修正單元,藉由修正經過擷取的該第一或第二空間資訊產生一修正第一空間資訊或一修正第二空間資訊。
  11. 如請求項10所述之解碼媒體訊號的裝置,其中該修正第一空間資訊或該修正第二空間資訊係藉由結合該第一空間資訊或該第二空間資訊所產生。
  12. 如請求項10所述之解碼媒體訊號的裝置,其中該降混訊號係藉由降混一第一多通道所產生的一訊號, 及其中使用該修正第一空間資訊或該修正第二空間資訊與該降混訊號產生該多通道的通道數量不同於該第一多通道的通道數量。
  13. 一種編碼媒體訊號的裝置,包括:一降混單元,藉由降混一多通道音頻訊號產生一降混訊號;一空間資訊產生單元,產生用以解碼包含至少三通道之該多通道音頻訊號之一第一空間資訊與用以解碼包含兩通道之一立體聲訊號之一第二空間資訊,其中當產生該多通道音頻訊號時,透過該第一空間資訊升混該降混訊號而無須考慮該第二空間資訊,當產生該立體聲訊號時,透過該第二空間資訊升混該降混訊號而無須考慮該第一空間資訊;以及一多工單元,產生包含該第一空間資訊及該第二空間資訊之一位元流。
TW098104750A 2006-03-30 2007-03-30 一種媒體訊號的編碼/解碼方法及其裝置 TWI483619B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US78717206P 2006-03-30 2006-03-30
US78751606P 2006-03-31 2006-03-31

Publications (2)

Publication Number Publication Date
TW200939792A TW200939792A (en) 2009-09-16
TWI483619B true TWI483619B (zh) 2015-05-01

Family

ID=38563837

Family Applications (2)

Application Number Title Priority Date Filing Date
TW096111697A TWI340600B (en) 2006-03-30 2007-03-30 Method for processing an audio signal, method of encoding an audio signal and apparatus thereof
TW098104750A TWI483619B (zh) 2006-03-30 2007-03-30 一種媒體訊號的編碼/解碼方法及其裝置

Family Applications Before (1)

Application Number Title Priority Date Filing Date
TW096111697A TWI340600B (en) 2006-03-30 2007-03-30 Method for processing an audio signal, method of encoding an audio signal and apparatus thereof

Country Status (7)

Country Link
US (1) US8626515B2 (zh)
EP (1) EP1999745B1 (zh)
JP (1) JP2009532712A (zh)
KR (1) KR20080071971A (zh)
HK (1) HK1127665A1 (zh)
TW (2) TWI340600B (zh)
WO (1) WO2007114594A1 (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2128856A4 (en) * 2007-10-16 2011-11-02 Panasonic Corp DEVICE FOR PRODUCING A STREAM AND DECODING DEVICE AND CORRESPONDING METHOD
KR101505831B1 (ko) * 2007-10-30 2015-03-26 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 방법 및 장치
KR20110022251A (ko) * 2009-08-27 2011-03-07 삼성전자주식회사 스테레오 오디오의 부호화, 복호화 방법 및 장치
CN102484547A (zh) 2009-09-01 2012-05-30 松下电器产业株式会社 数字广播发送装置、数字广播接收装置以及数字广播收发系统
SG178320A1 (en) 2010-06-09 2012-03-29 Panasonic Corp Bandwidth extension method, bandwidth extension apparatus, program, integrated circuit and audio decoding apparatus
KR101842258B1 (ko) * 2011-09-14 2018-03-27 삼성전자주식회사 신호 처리 방법, 그에 따른 엔코딩 장치, 및 그에 따른 디코딩 장치
EP2757559A1 (en) 2013-01-22 2014-07-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for spatial audio object coding employing hidden objects for signal mixture manipulation
WO2015186535A1 (ja) * 2014-06-06 2015-12-10 ソニー株式会社 オーディオ信号処理装置および方法、符号化装置および方法、並びにプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998018230A2 (en) * 1996-10-24 1998-04-30 Sgs-Thomson Microelectronics Asia Pacific (Pte) Ltd Audio decoder with an adaptive frequency domain downmixer
CN1669359A (zh) * 2002-07-12 2005-09-14 皇家飞利浦电子股份有限公司 音频编码
WO2005112002A1 (ja) * 2004-05-19 2005-11-24 Matsushita Electric Industrial Co., Ltd. オーディオ信号符号化装置及びオーディオ信号復号化装置

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5166685A (en) 1990-09-04 1992-11-24 Motorola, Inc. Automatic selection of external multiplexer channels by an A/D converter integrated circuit
US5632005A (en) 1991-01-08 1997-05-20 Ray Milton Dolby Encoder/decoder for multidimensional sound fields
DE4217276C1 (zh) 1992-05-25 1993-04-08 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung Ev, 8000 Muenchen, De
DE4236989C2 (de) 1992-11-02 1994-11-17 Fraunhofer Ges Forschung Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle
DE69428939T2 (de) 1993-06-22 2002-04-04 Thomson Brandt Gmbh Verfahren zur Erhaltung einer Mehrkanaldekodiermatrix
DE69433258T2 (de) 1993-07-30 2004-07-01 Victor Company of Japan, Ltd., Yokohama Raumklangsignalverarbeitungsvorrichtung
ATE183049T1 (de) 1994-02-25 1999-08-15 Henrik Moller Binaurale synthese, kopfbezogene ubertragungsfunktionen und ihre verwendungen
JP3397001B2 (ja) 1994-06-13 2003-04-14 ソニー株式会社 符号化方法及び装置、復号化装置、並びに記録媒体
US5703584A (en) 1994-08-22 1997-12-30 Adaptec, Inc. Analog data acquisition system
JPH08123494A (ja) 1994-10-28 1996-05-17 Mitsubishi Electric Corp 音声符号化装置、音声復号化装置、音声符号化復号化方法およびこれらに使用可能な位相振幅特性導出装置
JPH08202397A (ja) 1995-01-30 1996-08-09 Olympus Optical Co Ltd 音声復号化装置
JP3088319B2 (ja) 1996-02-07 2000-09-18 松下電器産業株式会社 デコード装置およびデコード方法
US6711266B1 (en) 1997-02-07 2004-03-23 Bose Corporation Surround sound channel encoding and decoding
US6307941B1 (en) 1997-07-15 2001-10-23 Desper Products, Inc. System and method for localization of virtual sound
CA2325482C (en) 1998-03-25 2009-12-15 Lake Technology Limited Audio signal processing method and apparatus
US6574339B1 (en) 1998-10-20 2003-06-03 Samsung Electronics Co., Ltd. Three-dimensional sound reproducing apparatus for multiple listeners and method thereof
JP3346556B2 (ja) 1998-11-16 2002-11-18 日本ビクター株式会社 音声符号化方法及び音声復号方法
KR100416757B1 (ko) 1999-06-10 2004-01-31 삼성전자주식회사 위치 조절이 가능한 가상 음상을 이용한 스피커 재생용 다채널오디오 재생 장치 및 방법
KR20010009258A (ko) 1999-07-08 2001-02-05 허진호 가상 멀티 채널 레코딩 시스템
US20010030736A1 (en) 1999-12-23 2001-10-18 Spence Stuart T. Film conversion device with heating element
US6973130B1 (en) 2000-04-25 2005-12-06 Wee Susie J Compressed video signal including information for independently coded regions
WO2004019656A2 (en) 2001-02-07 2004-03-04 Dolby Laboratories Licensing Corporation Audio channel spatial translation
JP3566220B2 (ja) 2001-03-09 2004-09-15 三菱電機株式会社 音声符号化装置、音声符号化方法、音声復号化装置及び音声復号化方法
US7583805B2 (en) 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
EP1470550B1 (en) 2002-01-30 2008-09-03 Matsushita Electric Industrial Co., Ltd. Audio encoding and decoding device and methods thereof
EP1341160A1 (en) 2002-03-01 2003-09-03 Deutsche Thomson-Brandt Gmbh Method and apparatus for encoding and for decoding a digital information signal
ES2323294T3 (es) 2002-04-22 2009-07-10 Koninklijke Philips Electronics N.V. Dispositivo de decodificacion con una unidad de decorrelacion.
JP4296752B2 (ja) 2002-05-07 2009-07-15 ソニー株式会社 符号化方法及び装置、復号方法及び装置、並びにプログラム
EP1439524B1 (en) 2002-07-19 2009-04-08 NEC Corporation Audio decoding device, decoding method, and program
AU2003273981A1 (en) 2002-10-14 2004-05-04 Thomson Licensing S.A. Method for coding and decoding the wideness of a sound source in an audio scene
EP1554716A1 (en) 2002-10-14 2005-07-20 Koninklijke Philips Electronics N.V. Signal filtering
US20060120534A1 (en) 2002-10-15 2006-06-08 Jeong-Il Seo Method for generating and consuming 3d audio scene with extended spatiality of sound source
US7698006B2 (en) 2002-10-15 2010-04-13 Electronics And Telecommunications Research Institute Apparatus and method for adapting audio signal according to user's preference
KR100917464B1 (ko) 2003-03-07 2009-09-14 삼성전자주식회사 대역 확장 기법을 이용한 디지털 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치
US7447317B2 (en) 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
US7805313B2 (en) 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
SE0402650D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
US7787631B2 (en) 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
US7903824B2 (en) 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
KR100878371B1 (ko) * 2005-04-19 2009-01-15 돌비 스웨덴 에이비 공간적 오디오 파라미터들의 효율적인 부호화를 위한에너지 종속 양자화
US20070055510A1 (en) * 2005-07-19 2007-03-08 Johannes Hilpert Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding
US7974713B2 (en) * 2005-10-12 2011-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Temporal and spatial shaping of multi-channel audio signals
KR100888474B1 (ko) * 2005-11-21 2009-03-12 삼성전자주식회사 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998018230A2 (en) * 1996-10-24 1998-04-30 Sgs-Thomson Microelectronics Asia Pacific (Pte) Ltd Audio decoder with an adaptive frequency domain downmixer
CN1669359A (zh) * 2002-07-12 2005-09-14 皇家飞利浦电子股份有限公司 音频编码
WO2005112002A1 (ja) * 2004-05-19 2005-11-24 Matsushita Electric Industrial Co., Ltd. オーディオ信号符号化装置及びオーディオ信号復号化装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
J. Herre, "The Reference Model Architecture for MPEG Spatial Audio Coding, " Audio Engineering Society 118th Convention 20050528. *

Also Published As

Publication number Publication date
US8626515B2 (en) 2014-01-07
EP1999745B1 (en) 2016-08-31
EP1999745A4 (en) 2010-03-31
TW200939792A (en) 2009-09-16
WO2007114594A1 (en) 2007-10-11
KR20080071971A (ko) 2008-08-05
EP1999745A1 (en) 2008-12-10
US20090164227A1 (en) 2009-06-25
HK1127665A1 (en) 2009-10-02
TWI340600B (en) 2011-04-11
JP2009532712A (ja) 2009-09-10
TW200746842A (en) 2007-12-16

Similar Documents

Publication Publication Date Title
JP4601669B2 (ja) マルチチャネル信号またはパラメータデータセットを生成する装置および方法
KR101276849B1 (ko) 오디오 신호의 처리 방법 및 장치
TWI483619B (zh) 一種媒體訊號的編碼/解碼方法及其裝置
US20070168183A1 (en) Audio distribution system, an audio encoder, an audio decoder and methods of operation therefore
KR20080032146A (ko) 파라메트릭 멀티 채널 오디오 코딩과 매트릭스 서라운드멀티 채널 코딩 사이의 갭을 브릿징하는 개념
JP2011209745A (ja) マルチチャンネル・エンコーダ
US8271291B2 (en) Method and an apparatus for identifying frame type
Cheng et al. A spatial squeezing approach to ambisonic audio compression
JP5113151B2 (ja) メディア信号処理装置及びその方法
KR20130093798A (ko) 다채널 신호 부호화 및 복호화 장치 및 방법
KR20070031212A (ko) 오디오 신호의 인코딩/디코딩 방법 및 장치
KR101434834B1 (ko) 다채널 오디오 신호의 부호화/복호화 방법 및 장치
TWI489886B (zh) 音頻訊號解碼方法及其裝置
KR20070031213A (ko) 오디오 신호의 인코딩/디코딩 방법 및 장치
KR20070075237A (ko) 멀티채널 오디오 신호의 인코딩 및 디코딩 방법
KR20070031214A (ko) 오디오 신호의 인코딩/디코딩 방법 및 장치
KR20150045879A (ko) 공간 필터를 이용한 다채널 오디오 부호화/복호화 장치 및 방법
KR20070108314A (ko) 오디오 신호의 인코딩/디코딩 방법 및 장치

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees