TWI447708B - An audio signal processing system, an audio signal decoding device, and a processing method and program thereof - Google Patents

An audio signal processing system, an audio signal decoding device, and a processing method and program thereof Download PDF

Info

Publication number
TWI447708B
TWI447708B TW099117632A TW99117632A TWI447708B TW I447708 B TWI447708 B TW I447708B TW 099117632 A TW099117632 A TW 099117632A TW 99117632 A TW99117632 A TW 99117632A TW I447708 B TWI447708 B TW I447708B
Authority
TW
Taiwan
Prior art keywords
frequency domain
output
window
signal
acoustic signal
Prior art date
Application number
TW099117632A
Other languages
English (en)
Other versions
TW201123172A (en
Inventor
Minoru Tsuji
Toru Chinen
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of TW201123172A publication Critical patent/TW201123172A/zh
Application granted granted Critical
Publication of TWI447708B publication Critical patent/TWI447708B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

音響信號處理系統、音響信號解碼裝置、以及其處理方法及程式
本發明係關於一種音響信號處理系統,本發明特別係關於一種對經編碼之音響信號進行降混之音響信號處理系統、音響信號解碼裝置、以及其處理方法及使電腦執行該方法之程式。
先前,作為音響信號編碼裝置通常係使用如下者:將複數個輸入通道之音響信號轉換成頻域,並對上述經轉換之頻域信號進行編碼,藉此生成音響編碼資料。因此,藉由對上述經編碼之音響編碼資料進行解碼,將頻域信號轉換為時域信號並作為輸出音響信號輸出之音響信號解碼裝置正廣泛普及。
此種音響信號解碼裝置存在很多具備如下功能者:根據用以使輸出音響信號之輸出通道數量低於輸入通道數量之加權係數,將輸出音響信號根據小於輸入通道數量之輸出通道數量而輸出。例如,提出有如下編碼聲音解碼裝置:於將各輸入通道之頻域信號轉換為時域信號之前,使用上述加權係數進行加權相加,藉此將輸出通道數量之解碼聲音輸出(例如參照專利文獻1)。
該編碼聲音解碼裝置中,根據表示各頻域信號相關之轉換長度之轉換函數選擇資訊,針對每個該轉換長度使輸入通道之頻域信號關聯而進行加權相加。其原因在於,若對各輸入通道之頻域信號所實施之開窗處理不相同,則無法對輸入通道之頻域信號進行加權相加(混合)。
[先前技術文獻] [專利文獻]
[專利文獻1]專利第3279228號公報(圖1)
上述先前技術中,藉由對頻域信號進行加權相加,可使頻域信號之通道數量小於輸入通道數量,故可削減用以將頻域信號轉換為時域信號之運算處理。然而,上述先前技術僅以各通道之頻域信號相關之轉換長度之種類作為判斷基準,來判斷頻域中之加權相加可否進行,故存在只要轉換長度相同,即便對頻域信號所實施之視窗形狀不同亦會混合之情形。
例如,於AAC(Advanced Audio Coding,進階音訊編碼)方式中,根據輸入音響信號之特性不僅可變更轉換長度亦可變更視窗形狀之種類。因此,若僅根據頻域信號之轉換長度來判斷頻域中之混合可否進行,有時會將視窗形狀不同之頻域信號彼此混合,無法生成適當的輸出音響信號。
本發明係鑒於此種情況開發而成者,其目的在於實現適當的輸出音響信號之生成,且削減伴隨自頻域向時域之信號轉換處理之音響信號解碼裝置的運算量。
本發明係為解決上述問題開發而成者,其第1態樣係一種音響信號解碼裝置以及其處理方法及使電腦執行該方法之程式,該音響信號解碼裝置包括:輸出控制部,其以根據包含對複數個輸入通道之音響信號實施有開窗處理之頻域信號相關之視窗函數之種類所表示的視窗形狀之視窗資訊,將該視窗資訊彼此相同之上述頻域信號彼此同時輸出之方式而加以控制;頻域混合部,其根據降混資訊將上述視窗資訊相同之上述輸入通道之頻域信號彼此混合,並作為輸出通道數量小於上述輸入通道數量之頻域信號而輸出;以及輸出音生成部,其將自上述頻域混合部輸出之上述輸出通道之頻域信號轉換為時域信號,對上述經轉換之時域信號實施上述開窗處理,藉此生成上述輸出通道之音響信號。藉此帶來如下作用:根據降混資訊將包含視窗函數之種類所表示之視窗形狀之視窗資訊彼此相同的頻域信號彼此混合,藉此間輸出通道數量小於輸入通道數量之頻域信號轉換為時域信號,生成輸出通道數量之音響信號。
又,該第1態樣中,上述頻域混合部亦可針對上述複數個視窗資訊中之各組合,根據上述降混資訊將上述輸入通道之頻域信號加以混合,上述輸出音生成部將實施有上述開窗處理之上述各組合之上述時域信號相加,藉此生成上述輸出通道之上述音響信號。藉此帶來如下作用:藉由頻域混合部,針對複數個視窗資訊中之各組合,根據降混資訊將頻域信號相加,由此生成輸出通道之音響信號。該情形時,上述輸出控制部於上述複數個視窗資訊中之上述組合之數量與上述輸出通道數量之乘法值小於上述輸入通道數量時,亦可將上述輸入通道之上述頻域信號彼此同時輸出至上述頻域混合部。藉此,只要視窗資訊中之組合之數量與輸出通道數量之積算值小於輸入通道數量,便可根據降混資訊,將輸入通道之頻域信號加以混合,由此生成輸出通道之頻域信號。
又,於該第1態樣中,上述輸出控制部亦可根據包含表示基於上述輸入通道之音響信號而設定之視窗之種類之開窗形式的上述視窗資訊,控制上述頻域信號之輸出,上述輸出音生成部根據上述視窗資訊所表示之上述開窗形式及視窗函數之種類,對上述輸出通道之上述頻域信號實施上述開窗處理,藉此生成上述輸出通道之上述音響信號。藉此帶來如下作用:根據視窗資訊中之開窗形式及視窗形狀之組合將各通道之頻域信號彼此混合,生成輸出通道之頻域信號,將上述經生成之頻域信號轉換為時域信號,並且根據視窗資訊實施開窗處理,藉此生成音響信號。於該情形時,上述輸出控制部亦可根據相對於上述開窗形式中之前半部分及後半部分之上述視窗形狀所表示之上述視窗資訊,控制上述頻域信號之輸出。藉此帶來如下作用:藉由輸出控制部,根據相對於開窗形式中之轉換長度之前半部分及後半部分之視窗形狀所表示之視窗資訊,而切換頻域信號之輸出。
又,本發明之第2態樣為一種音響信號處理系統,其包括音響信號編碼裝置及音響信號解碼裝置,該音響信號編碼裝置包括:開窗處理部,其對複數個輸入通道之音響信號實施開窗處理,生成包含上述開窗處理中之視窗函數之種類所表示之視窗形狀的視窗資訊;及頻率轉換部,其將自上述開窗處理部所輸出之上述音響信號轉換成頻域,藉此生成頻域信號;該音響信號解碼裝置包括:輸出控制部,其以將自上述音響信號編碼裝置輸出之上述輸入通道之上述頻域信號相關之上述視窗資訊彼此相同的上述頻域信號彼此同時輸出之方式而加以控制;頻域混合部,其根據降混資訊將上述視窗資訊相同之上述輸入通道之頻域信號彼此混合,並作為輸出通道數量小於上述輸入通道數量之頻域信號而輸出;及輸出音生成部,其將自上述頻域混合部輸出之上述輸出通道之頻域信號轉換為時域信號,並對上述經轉換之時域信號實施上述開窗處理,藉此生成上述輸出通道之音響信號。藉此帶來如下作用:將藉由根據降混資訊而混合由音響信號編碼裝置所生成之輸入通道之頻域信號中之、視窗資訊彼此一致之頻域信號彼此而生成的輸出通道數量之頻域信號轉換為時域信號,對上述經轉換之時域信號實施開窗處理,生成輸出通道之音響信號。
根據本發明,發揮如下效果:可實現適當的輸出音響信號之生成,且可削減伴隨自頻域向時域之信號轉換處理之音響信號解碼裝置的運算量。
以下,對用以實施本發明之形態(以下,稱為實施形態)進行說明。說明係按照以下順序而進行。
1. 第1實施形態(降混控制:根據視窗資訊將時域中之降混處理與頻域中之降混處理切換之例)
2. 第2實施形態(降混控制:根據視窗資訊僅根據頻域信號而進行降混處理之例)
3. 第3實施形態(降混控制:根據視窗資訊之組合數量將時域中之降混處理與頻域中之降混處理切換之例)
<1. 第1實施形態>
[音響信號編碼裝置之構成例]
圖1係表示本發明之第1實施形態中之音響信號處理系統之一構成例的方塊圖。音響信號處理系統100包括:音響信號編碼裝置200,其對複數個輸入通道數量之音響信號進行編碼;以及音響信號解碼裝置300,其對上述經編碼之音響信號進行解碼,並根據小於輸入通道數量之輸出通道數量而加以輸出。又,音響信號處理系統100包括將自音響信號解碼裝置300輸出之2個通道之音響信號作為音波而輸出之2個右通道揚聲器110及左通道揚聲器120。
音響信號編碼裝置200係將自輸入端子101至105所輸入之5個通道之音響信號轉換為數位信號,並對上述經轉換之數位信號進行編碼者。該音響信號編碼裝置200中,自輸入端子101供給右環繞通道(Rs)之音響信號,自輸入端子102供給右通道(R)之音響信號,自輸入端子103供給中心通道(C)之音響信號。進而,該音響信號編碼裝置200中,自輸入端子104供給左通道(L)之音響信號,自輸入端子105供給左環繞通道(Ls)之音響信號。
該音響信號編碼裝置200對來自輸入端子101至105之輸入通道數量為5個通道之音響信號之各個進行編碼。又,音響信號編碼裝置200將上述經編碼之各音響信號、該編碼相關之資訊等多工化,並作為音響編碼資料經由編碼字串傳輸線301而供給至音響信號解碼裝置300。
音響信號解碼裝置300係藉由對自編碼字串傳輸線301供給之音響編碼資料進行解碼,而生成小於輸入通道數量之輸出通道數量即2個通道之音響信號者。該音響信號解碼裝置300自音響編碼資料中提取經編碼之音響信號,對上述經提取之5個通道之音響編碼資料進行解碼,藉此生成2個通道之音響信號。
又,音響信號解碼裝置300將上述已生成之2個通道之音響信號中、一個右通道之音響信號經由信號線111而輸出至右通道揚聲器110。又,音響信號解碼裝置300將另一個左通道之音響信號經由信號線121而輸出至左通道揚聲器120。
如此,音響信號處理系統100中,藉由音響信號解碼裝置300而對音響信號編碼裝置200中經編碼之5個通道之音響信號進行解碼,藉此將2個通道之音響信號輸出至揚聲器110及120。再者,音響信號處理系統100係申請專利範圍中記載之音響信號處理系統之一例。
再者,此處作為一例,將輸入通道數量及輸出通道數量分別假想為5個通道及2個通道而進行了說明,但並非限定於此。本發明之實施形態中,只要輸出通道數量小於輸入通道即可,例如輸入通道數量為3個通道,輸出通道數量為1個通道者亦可。其次,以下參照圖式對音響信號編碼裝置200之具體的構成例進行說明。
[音響信號編碼裝置200之構成例]
圖2係表示本發明之第1實施形態中之音響信號編碼裝置200之一構成例的方塊圖。此處作為一例,假想藉由AAC之規格而實現之音響信號編碼裝置200。
音響信號編碼裝置200包括開窗處理部211至215、MDCT(Modified Discrete Cosine Transform,修正離散餘弦轉換)部231至235、量化部241至245、編碼字串生成部250、以及降混資訊接受部260。
開窗處理部211至215係根據自輸入端子101至105所輸入之各輸入通道之音響信號之特性,對各輸入通道之音響信號實施開窗處理者。亦即,開窗處理部211對右環繞通道之音響信號實施開窗處理,開窗處理部212對右通道之音響信號實施開窗處理,開窗處理部213對中心通道之音響信號實施開窗處理。又,開窗處理部214對左通道之音響信號實施開窗處理,開窗處理部215對左環繞通道之音響信號實施開窗處理。
具體而言,開窗處理部211至215利用一定器件對音響信號進行取樣,生成上述經取樣之2048個樣品之離散信號即時域信號作為訊框。該開窗處理部211至215相對於前一個訊框偏移僅1/2訊框(1024個樣品)而生成下一個訊框。
亦即,該開窗處理部211至215以前一個訊框之後半部分(1/2訊框)與下一個訊框之前半部分重複之方式而生成下一個訊框。藉此,可抑制藉由MDCT部231至235中之修正離散餘弦轉換(MDCT:Modified Discrete Cosine Transform)而生成之頻域信號的資料量。
又,開窗處理部211至215為了抑制藉由將音響信號分割成訊框而產生之變形,對訊框實施開窗處理。具體而言,該開窗處理部211至215藉由AAC之規定,根據各通道之時域信號之特性,選擇表示4個視窗之種類之開窗形式中之相對於1個訊框之開窗形式。
該開窗處理部211至215對上述經選擇之開窗形式中之前半部分及後半部分,分別選擇表示2個視窗函數之種類之視窗形狀中任一視窗形狀。此時,開窗處理部211至215為了抵消前後之訊框間之連接變形,選擇與前一個訊框之後半部分之視窗形狀相同者,來作為目前之訊框之前半部分之視窗形狀。亦即,開窗處理部211至215相對於前後之訊框間重複之部分而選擇相同之視窗形狀。
該開窗處理部211至215根據上述經選擇之開窗形式及相對於該形式之前半部分及後半部分之視窗形狀,對時域信號實施開窗處理,並且生成表示該開窗形式及視窗形狀之組合之視窗資訊。
又,開窗處理部211至215將實施有該開窗處理之時域信號之各個供給至MDCT部231至235。與此同時,開窗處理部211至215為了於音響信號解碼裝置300中生成音響信號,而將輸入通道之各個之視窗資訊經由視窗資訊線221至225供給至編碼字串生成部250。再者,開窗處理部211至215為申請專利範圍中記載之音響信號編碼裝置中之開窗處理部之一例。
MDCT部231至235係將自開窗處理部211至215之各個所供給之時域信號轉換為頻域之信號者。亦即,MDCT部231至235將自開窗處理部211至215所輸出之音響信號轉換成頻域,藉此生成頻域信號。具體而言,該MDCT部231至235藉由MDCT處理而轉換時域信號,藉此生成MDCT係數即頻域信號(頻譜)。
又,MDCT部231至235將上述經生成之頻域信號即實施有開窗處理之頻域信號之各個供給至量化部241至245。再者,MDCT部231至235為申請專利範圍中記載之音響信號編碼裝置中之頻率轉換部之一例。
量化部241至245係將自各輸入通道所對應之MDCT部231至235所供給之頻域信之各個量化者。該量化部241至245例如根據人之聽覺特性進行量化,並且考慮聽覺特性之遮蔽效果進行量化雜訊之控制。又,量化部241至245將上述經量化之頻域信號之各個供給至編碼字串生成部250。
降混資訊接受部260係接受用以使輸出通道數量小於輸入通道數量之降混資訊者。該降混資訊接受部260例如接受用以設定相對於各輸入通道之加權係數之降混係數之數值。該降混資訊接受部260將上述已接受之降混資訊輸出至編碼字串生成部250。再者,此處,表示了於音響信號編碼裝置200中設定降混資訊之例,但亦可於音響信號解碼裝置300中設定降混資訊。
編碼字串生成部250係對來自量化部241至245之經量化之頻域信號、來自開窗處理部211至215之視窗資訊、及來自降混資訊接受部260之降混資訊進行編碼,而生成1個編碼字串者。該編碼字串生成部250分別對各輸入通道之經量化之頻域信號進行編碼,藉此生成音響編碼資料。
又,編碼字串生成部250將上述經編碼之各輸入通道之視窗資訊及降混資訊多工於音響編碼資料中,藉此作為1個編碼字串(位元流)供給至編碼字串傳輸線301。
如此,音響信號編碼裝置200根據各輸入通道之音響信號,選擇MDCT轉換中之複數個組合之開窗處理中之1個開窗處理,對時域信號實施上述經選擇之開窗處理。又,音響信號編碼裝置200將實施有該開窗處理之頻域信號及與該頻域信號相關之視窗資訊經多工化之音響編碼資料,經由編碼字串傳輸線301而傳輸至音響信號解碼裝置300。此處,關於藉由開窗處理部211至215而分別生成之視窗資訊之組合,以下將參照圖式簡單說明。
[藉由開窗處理部211至215而生成之視窗資訊之例]
圖3係表示藉由本發明之第1實施形態中之開窗處理部211至215而生成之視窗資訊中的開窗形式及視窗形狀之組合之一例的圖。此處,作為視窗資訊270中之組合,表示了開窗形式271與相對於該開窗形式271之前半部分及後半部分之視窗形狀272之組合。
開窗形式271中,作為視窗之種類,表示了4個開窗形式(LONG_WINDOW、START_WINDOW、SHORT_WINDOW、STOP_WINDOW)。又,開窗形式271中分別概念性地表示了相對於1個訊框之開窗形式。此處,開窗形式271之實線部分與視窗形狀272中之前半部分對應,開窗形式271中之虛線部分與視窗形狀272中之後半部分對應。
該開窗形式271中,基本上係根據輸入通道之音響信號之特性,而選擇LONG_WINDOW及SHORT_WINDOW中之任一者。該開窗形式271中之LONG_WINDOW係於該MDCT之轉換區間即轉換長度為2048個樣品,且音響信號之位準變動較小之情形時所選擇的開窗形式。
另一方面,開窗形式271中之SHORT_WINDOW係於該MDCT之轉換長度為256個樣品,且如起音般音響信號之位準急遽變化之情形時選擇。此處,表示了8個SHORT_WINDOW,此係因為,於選擇SHORT_WINDOW之情形時,對1個訊框使用8個SHORT_WINDOW而生成頻域信號。藉此,與LONG_WINDOW相比可準確地生成輸入通道之音響信號之頻率成分,因此即便為音響信號之信號位準急遽變化之訊框,亦可抑制聽覺上的雜訊。
又,該開窗形式271中,為了隨著LONG_WINDOW與SHORT_WINDOW之切換,抑制所鄰接之訊框間之連接變形,而選擇START_WINDOW或STOP_WINDOW。該開窗形式271中之START_WINDOW係於該MDCT之轉換長度為2048個樣品,且自LONG_WINDOW切換為SHORT_WINDOW時所選擇之開窗形式。例如,於檢測出起音之情形時,在選擇SHORT_WINDOW之前選擇START_WINDOW。
又,開窗形式271中之STOP_WINDOW係於該MDCT之轉換長度為2048個樣品,且自SHORT_WINDOW切換為LONG_WINDOW時所選擇之開窗形式。亦即,在因起音部分結束而選擇LONG_WINDOW之前選擇STOP_WINDOW。
視窗形狀272中之前半部分及後半部分中,作為適用於開窗形式之視窗函數之種類,表示了2個視窗形狀(正弦及KBD)。此處所謂之視窗形狀272中之前半部分及後半部分,係指於時間軸上,相對於開窗形式271中之目前之轉換區間,與前一個轉換區間重複之區間為前半部分,與後一個轉換區間重複之區間為後半部分。
所謂該視窗形狀272中之正弦,表示選擇正弦視窗作為視窗函數。所謂視窗形狀272中之KBD,表示選擇凱撒貝索衍生(KBD:Kaiser-Bessel derived)視窗作為視窗函數。再者,MDCT處理中,為了抑制連接變形,必須對與目前之訊框中之前一個轉換區間重複之部分(前半部分或後半部分),選擇與適用於前一個轉換區間之視窗形狀相同者。
如此,於視窗資訊270中,根據4個開窗形式及適用於該開窗形式中之前半部分及後半部分之2個視窗形狀選擇開窗處理,因此存在最多16種組合281至296。此處,輸入通道為5個通道,因此視窗資訊270中之組合之數量最多為5種。其次,以下參照圖式對音響信號解碼裝置300之構成例進行說明。
[音響信號解碼裝置300之一構成例]
圖4係表示本發明之第1實施形態中之音響信號解碼裝置300之一構成例的方塊圖。
音響信號解碼裝置300包括編碼字串分離部310、解碼‧反量化部320、輸出控制部340、輸出切換部351至355、加算部361及362、時域合成部400、以及頻域合成部500。又,時域合成部400包括IMDCT‧開窗處理部411至415及時域混合部420。
進而,頻域合成部500包括頻域混合部510及輸出音生成部520。該輸出音生成部520包括IMDCT‧開窗處理部521及522。
編碼字串分離部310係將自編碼字串傳輸線301所供給之編碼字串分離者。該編碼字串分離部310根據自編碼字串傳輸線301所供給之編碼字串,將編碼字串分離為輸入通道之音響編碼資料、各輸入通道之視窗資訊、及降混資訊。
又,編碼字串分離部310將各輸入通道之音響編碼資料及視窗資訊供給至解碼‧反量化部320。亦即,該編碼字串分離部310將右環繞通道之音響編碼資料供給至信號線321,將右通道之音響編碼資料供給至信號線322,將中心通道之音響編碼資料供給至信號線323。進而,該編碼字串分離部310將左通道之音響編碼資料供給至信號線324,將左環繞通道之音響編碼資料供給至信號線325。
又,編碼字串分離部310經由視窗資訊線311而將各輸入通道之視窗資訊供給至輸出控制部340。又,編碼字串分離部310經由降混資訊線312而將降混資訊供給至時域混合部420及頻域混合部510。
解碼‧反量化部320係藉由對各輸入通道之音響編碼資料進行解碼並將其等反量化,而生成MDCT係數即頻域信號者。該解碼‧反量化部320根據輸出控制部340之控制,將上述經生成之各輸入通道之頻域信號及視窗資訊供給至時域合成部400或頻域合成部500之任一者。
具體而言,該解碼‧反量化部320將上述經生成之各輸入通道之頻域信號分別供給至輸出切換部351至355。亦即,該解碼‧反量化部320將右環繞通道之頻域信號供給至信號線331,將右通道之頻域信號供給至信號線332,將中心通道之頻域信號供給至信號線333。進而,該解碼‧反量化部320將左通道之頻域信號供給至信號線334,將左環繞通道之頻域信號供給至信號線335。
輸出切換部351至355係用以根據來自輸出控制部340之控制,將來自信號線331至335之頻域信號輸出至時域合成部400或頻域合成部500中之任一者之開關。該輸出切換部351至355根據來自輸出控制部340之控制,將輸入通道之所有頻域信號同時輸出至IMDCT‧開窗處理部411至415或頻域混合部510中之任一者。
輸出控制部340係根據自視窗資訊線311所供給之各輸入通道之視窗資訊中所包含之開窗形式及視窗形狀,切換輸出切換部351至355之連接者。亦即,輸出控制部340根據圖3所示之視窗資訊中之開窗形式及相對於該開窗形式中之前半部分及後半部分之視窗形狀之組合,控制輸入通道之頻域信號之輸出目的地。
該輸出控制部340判斷各輸入通道之視窗資訊是否彼此一致。而且,於所有視窗資訊一致之情形時,輸出控制部340控制輸出切換部351至355,以將信號線331至335與頻域混合部510之間連接。
另一方面,於所有視窗資訊不一致之情形時,輸出控制部340控制輸出切換部351至355以將信號線331至335與IMDCT‧開窗處理部411至415之間連接。亦即,輸出控制部340根據包含表示視窗函數之種類之視窗形狀之視窗資訊,控制輸出切換部351至355以將視窗資訊彼此相同之頻域信號彼此同時輸出至頻域混合部510。再者,輸出控制部340係申請專利範圍中記載之輸出控制部之一例。
時域合成部400係於將輸入通道之頻域信號之各個轉換為時域信號之後,根據來自編碼字串分離部310之降混資訊,將輸入通道之時域信號合成為輸出通道之時域信號者。亦即,該時域合成部400於將5個通道之頻域信號轉換為頻域信號之後,根據降混資訊將5個通道之時域信號合成為2個通道之時域信號。
IMDCT‧開窗處理部411至415係根據自信號線331至335所供給之頻域信號及視窗資訊,生成輸入通道之時域信號者。該IMDCT‧開窗處理部411至415根據視窗資訊中所包含之開窗形式藉由反修正離散餘弦轉換(IMDCT:Inverse MDCT),而將各頻域信號轉換為時域信號。
又,IMDCT‧開窗處理部411至415根據來自編碼字串分離部310之視窗資訊,對上述經轉換之時域信號實施開窗處理。又,IMDCT‧開窗處理部411至415將該實施有開窗處理之時域信號之各個供給至時域混合部420。
時域混合部420係根據來自編碼字串分離部310之降混資訊,將自IMDCT‧開窗處理部411至415所供給之5個通道之時域信號加以混合,藉此生成2個通道之時域信號者。亦即,時域混合部420根據來自編碼字串分離部310之降混資訊與輸入通道之時域信號,生成小於輸入通道之輸出通道之時域信號。
該時域混合部420藉由AAC之規定,例如根據下式將5個通道之時域信號加以混合生成2個通道之時域信號。
[數1]
此處,Rs、R、C、L、Ls表示右環繞通道、右通道、中心通道、左通道、左環繞通道之輸入通道之時域信號。又,R'及L'表示右通道及左通道之輸出通道之時域信號。
又,A係降混係數,自1/、1/2、1/2‧、0之4個中選擇。此處,假想該降混係數A係根據音響編碼資料中所包含之資訊而設定。
如此,時域混合部420根據來自編碼字串分離部310之式1相關之降混資訊,將5個通道之時域信號加權相加(混合),藉此生成小於輸入通道數量之2個通道之時域信號。如此,此處將根據降混資訊生成小於輸入通道數量之輸出通道數量之信號之動作稱為降混。
又,時域混合部420將上述經生成之2個通道之時域信號作為2個通道之音響信號輸出至加算部361及362。亦即,時域混合部420將右通道之音響信號輸出至加算部361,將左通道之音響信號輸出至加算部362。
頻域合成部500係根據來自編碼字串分離部310之降混資訊,將視窗資訊全部相同之輸入通道之頻域信號合成為輸出通道之頻域信號,將上述經合成之頻域信號轉換為時域信號者。亦即,該頻域合成部500根據降混資訊將5個通道之頻域信號合成為2個通道之頻域信號,將該2個通道之頻域信號轉換為時域信號。
頻域混合部510係根據來自編碼字串分離部310之降混資訊,將來自信號線331至335之視窗資訊全部相同之5個通道之頻域信號加以混合,藉此生成2個通道之頻域信號者。該頻域混合部510根據來自降混資訊線312之式1相關之降混資訊,將5個通道之頻域信號加權相加(混合),藉此生成小於輸入通道數量之2個通道之頻域信號。藉此,可將輸出至輸出音生成部520中之頻域信號由5個通道削減為2個通道。
又,該頻域混合部510將根據來自編碼字串分離部310之降混資訊而生成之2個通道之輸出通道之頻域信號輸出至輸出音生成部520。亦即,該頻域混合部510根據降混資訊,將包含視窗形狀之視窗資訊相同之輸入通道之頻域信號彼此混合,作為小於輸入通道數量之輸出通道數量之頻域信號而輸出。該頻域混合部510將右通道之頻域信號輸出至IMDCT‧開窗處理部521,將左通道之頻域信號輸出至IMDCT‧開窗處理部522。再者,頻域混合部510係申請專利範圍中記載之頻域混合部之一例。
輸出音生成部520係將自頻域混合部510所輸出之輸出通道之頻域信號轉換為時域信號,對上述經轉換之時域信號實施開窗處理,藉此生成輸出通道之音響信號者。亦即,輸出音生成部520根據視窗資訊所表示之開窗形式及視窗函數之種類對輸出通道之頻域信號實施開窗處理,藉此,生成輸出通道之音響信號。再者,輸出音生成部520係申請專利範圍中記載之輸出音生成部之一例。
IMDCT‧開窗處理部521及522係根據自頻域混合部510所輸出之視窗資訊,將輸出通道之頻域信號轉換為時域信號者。該IMDCT‧開窗處理部521及522根據頻域混合部510之視窗資訊,對上述經轉換之時域信號實施開窗處理。再者,於視窗資訊中所包含之視窗形狀不一致之情形時,無法一致地特定視窗形狀,因此無法將頻域信號適當地轉換為時域信號。又,於視窗資訊中所包含之開窗形式不一致之情形時,開窗形式之轉換長度亦不同,因此無法將頻域信號轉換為時域信號。
又,IMDCT‧開窗處理部521及522將該實施有開窗處理之時域信號之各個作為輸出通道之音響信號而輸出至加算部361及362。亦即,IMDCT‧開窗處理部521將右通道之實施有開窗處理之時域信號作為右通道之音響信號輸出至加算部361。又,IMDCT‧開窗處理部522將左通道之實施有開窗處理之時域信號作為左通道之音響信號輸出至加算部362。
加算部361及362係將來自時域合成部400或頻域合成部500之輸出之任一者輸出者。該加算部361及362藉由輸出控制部340,將信號線331至335之連接切換至時域合成部400之情形時,將來自時域混合部420之輸出通道之音響信號輸出至信號線111及121。
又,於藉由輸出控制部340將信號線331至335之連接切換至頻域合成部500之情形時,將來自輸出音生成部520之輸出通道之音響信號輸出至信號線111及121。
如此,藉由設置輸出控制部340,可判斷包含表示輸入通道中之視窗函數之種類之視窗形狀之視窗資訊是否彼此一致。因此,只要輸入通道之視窗資訊全部一致時,便可使該視窗資訊一致之頻率信號彼此關聯而輸出至頻域合成部500。亦即,可防止使實施有視窗形狀不同之開窗處理之頻域信號彼此關聯而輸出至頻域合成部500。
藉此,於視窗資訊全部一致之情形時,可藉由頻域混合部510而將頻域信號減少至小於輸入通道之輸出通道數量,因此與時域合成部400相比可削減IMDCT之運算量。
[音響信號解碼裝置300之動作例]
其次,參照圖式對本發明之第1實施形態中之音響信號解碼裝置300之動作進行說明。
圖5係表示本發明之第1實施形態中之音響信號解碼裝置300之編碼字串之解碼方法之處理工序例的流程圖。
首先,藉由編碼字串分離部310,將自編碼字串傳輸線301所供給之編碼字串分離為輸入通道之音響編碼資料、輸入通道之視窗資訊、降混資訊等(步驟S911)。接著,藉由解碼‧反量化部320,對輸入通道之音響編碼資料進行解碼(步驟S912)。繼而,藉由解碼‧反量化部320,將經解碼之音響編碼資料反量化,藉此生成頻域信號(步驟S913)。
其次,藉由輸出控制部340,根據來自編碼字串分離部310之各輸入通道之視窗資訊中所包含之視窗形式及視窗形狀,判斷輸入通道之視窗資訊是否全部一致(步驟S914)。並且,於所有視窗資訊一致之情形時,藉由輸出控制部340,切換輸出切換部351至355之連接以將輸入通道所有頻域信號輸出至頻域合成部500(步驟S919)。
亦即,藉由輸出控制部340,根據包含視窗函數之種類所表示之視窗形狀之視窗資訊,控制輸出切換部351至355以使該視窗資訊彼此相同之頻域信號彼此關聯而輸出。再者,步驟S914及S919係申請專利範圍中記載之輸出控制工序之一例。
之後,藉由頻域混合部510,根據來自編碼字串分離部310之降混資訊將輸入通道數量之頻域信號加以混合,生成輸出通道數量之頻域信號(步驟S921)。亦即,藉由頻域混合部510,根據降混資訊將輸入通道之頻域信號彼此混合,並作為小於輸入通道數量之輸出通道數量之頻域信號而加以輸出。再者,步驟S921係申請專利範圍中記載之頻域混合工序之一例。
而且,藉由IMDCT‧開窗處理部521及522,藉由IMDCT處理轉換2個輸出通道之頻域信號,作為時域信號而生成(步驟S922)。繼而,藉由IMDCT‧開窗處理部521及522,對上述經生成之時域信號實施開窗處理,作為輸出通道之音響信號而輸出(步驟S923)。
亦即,藉由輸出音生成部520,將來自頻域混合部510之輸出通道之頻域信號轉換為時域信號,對上述經轉換之時域信號實施開窗處理,藉此生成輸出通道之音響信號。再者,步驟S922及S923係申請專利範圍中記載之輸出音生成工序之一例。
另一方面,於步驟S914中,於所有視窗資訊不一致之情形時,藉由輸出控制部340,切換輸出切換部351至355之連接以將輸入通道所有頻域信號輸出至時域合成部400(步驟S915)。之後,藉由IMDCT‧開窗處理部411至415,藉由IMDCT處理而轉換5個輸入通道之頻域信號,作為時域信號而生成(步驟S916)。
繼而,藉由IMDCT‧開窗處理部411至415,對上述經生成之時域信號實施開窗處理,作為輸入通道數量之時域信號而輸出(步驟S917)。接著,藉由時域混合部420,根據來自編碼字串分離部310之降混資訊將輸入通道數量之時域信號加以混合,作為輸出通道之音響信號而輸出(步驟S918),編碼字串之解碼方法之處理結束。
如此,本發明之第1實施形態中,於視窗資訊中所包含之視窗形狀及開窗形式全部一致之情形時,將輸入通道之頻域信號全部混合,藉此,可生成小於輸入通道數量之輸出通道數量之頻域信號。藉此,頻域信號之通道數量變少,因此可削減用以自頻域信號轉換為時域信號之時域轉換(IMDCT)之運算處理。
再者,此處作為一例,對於輸入通道之視窗資訊全部一致之情形時將頻域信號加以混合之例進行了說明,但即便於視窗資訊全部不一致之情形時,亦可將頻域信號加以混合,藉此適當地生成音響信號。其次,以下參照圖式將如下音響信號解碼裝置之例作為第2實施形態進行說明:即便於所有視窗資訊不一致之情形時,亦不設置時域合成部400而生成輸出通道之音響信號。
<2. 第2實施形態>
[音響信號解碼裝置之構成例]
圖6係表示本發明之第2實施形態中之音響信號解碼裝置之一構成例的方塊圖。音響信號解碼裝置600包括頻域合成部700來代替圖4所示之音響信號解碼裝置300中之輸出控制部340、輸出切換部351至355、時域合成部400、頻域合成部500、加算部361及加算部362。此處,除頻域合成部700以外之構成與圖4所示者相同,因此附加與圖4相同之符號並省略此處之詳細說明。
頻域合成部700包括輸出控制部710、第1至第16頻域混合部721至723、及輸出音生成部730。又,輸出音生成部730包括與右通道對應之第1至第16 IMDCT‧開窗處理部731至733、與左通道對應之第1至第16 IMDCT‧開窗處理部741至743、以及加算部751及752。
輸出控制部710係針對複數個視窗資訊中之開窗形式與視窗形狀之各組合,進行控制以使輸入通道之頻域信號彼此與對應於該組合之第1至第16頻域混合部721至723之任一者關聯而輸出者。再者,輸出控制部710係申請專利範圍中記載之輸出控制部之一例。
該輸出控制部710包括與各輸入通道對應之第1至第5輸出選擇部711至715。第1至第5輸出選擇部711至715係根據來自編碼字串分離部310之視窗資訊中所包含之視窗形狀及開窗形式之組合,選擇自解碼‧反量化部320所供給之輸入通道之頻域信號之輸出目的地者。該第1輸出選擇部711例如根據右環繞通道之視窗資訊中之開窗形式及視窗形狀之組合,選擇相對於自解碼‧反量化部320所供給之右環繞通道之頻域信號之輸出目的地。
又,第1至第5輸出選擇部711至715根據視窗資訊中之組合,將與該組合對應之第1至第16頻域混合部721至723之任一者作為上述經選擇之輸出目的地,而供給來自解碼‧反量化部320之頻域信號。例如,第1輸出選擇部711根據右環繞通道之視窗資訊中之組合,將右環繞通道之頻域信號輸出至與該組合對應之任一第1至第16頻域混合部721至723。又,第1至第5輸出選擇部711至715將視窗資訊供給至與該組合對應之第1至第16頻域混合部721至723之任一者。
第1至第16頻域混合部721至723係與圖4所示之頻域混合部510相同者。該第1至第16頻域混合部721至723係針對複數個視窗資訊中之組合,根據自編碼字串分離部310經由降混資訊線312所供給之降混資訊,將輸入通道之頻域信號加以混合者。該第1至第16頻域混合部721至723將上述經混合之輸入通道之頻域信號根據小於輸入通道數量之輸出通道數量而輸出至第1至第16 IMDCT‧開窗處理部731至733及741至743。
第1頻域混合部721例如根據來自第1至第4輸出選擇部711至714之頻域信號與降混資訊,將右及左通道之頻域信號分別輸出至第1 IMDCT‧開窗處理部731及741。又,第16頻域混合部723例如根據來自第5輸出選擇部715之左環繞通道之頻域信號與降混資訊,將左通道之頻域信號輸出至第16 IMDCT‧開窗處理部743。
又,第1至第16頻域混合部721至723將來自輸出控制部710之視窗資訊輸出至第1至第16 IMDCT‧開窗處理部731至733及741至743。再者,第1至第16頻域混合部721至723係申請專利範圍中記載之頻域混合部之一例。
輸出音生成部730係將自第1至第16頻域混合部721至723所輸出之輸出通道之頻域信號轉換為時域信號,並對上述經轉換之時域信號實施開窗處理者。該輸出音生成部730將該實施有開窗處理之時域信號針對各輸出通道相加,藉此,生成輸出通道之音響信號。再者,輸出音生成部730係申請專利範圍中記載之輸出音生成部之一例。
第1至第16 IMDCT‧開窗處理部731至733係根據來自第1至第16頻域混合部721至723之右通道之頻域信號及視窗資訊,將輸出通道之頻域信號轉換為時域信號者。該第1至第16 IMDCT‧開窗處理部731至733根據來自第1至第16頻域混合部721至723之視窗資訊,對上述經轉換之時域信號實施開窗處理。
又,第1至第16 IMDCT‧開窗處理部731至733將該實施有開窗處理之時域信號之各個輸出至加算部751。亦即,第1至第16 IMDCT‧開窗處理部731至733將右通道之實施有開窗處理之時域信號輸出至加算部751。
第1至第16 IMDCT‧開窗處理部741至743係根據來自第1至第16頻域混合部721至723之左通道之頻域信號及視窗資訊,將該左通道之頻域信號轉換為時域信號者。該第1至第16 IMDCT‧開窗處理部741至743根據來自第1至第16頻域混合部721至723之視窗資訊,對上述經轉換之時域信號實施開窗處理。又,第1至第16 IMDCT‧開窗處理部741至743將該實施有開窗處理之時域信號之各個輸出至加算部752。
加算部751及752係將自第1至第16 IMDCT‧開窗處理部731至733及741至743所輸出之時域信號相加,藉此生成輸出通道之音響信號者。該加算部751將來自第1至第16 IMDCT‧開窗處理部731至733之時域信號相加,藉此將右通道之音響信號經由信號線111而輸出。該加算部752將來自第1至第16 IMDCT‧開窗處理部741至743之時域信號相加,藉此將左通道之音響信號經由信號線121而輸出。
如此,設置與視窗資訊中之各組合對應之第1至第16頻域混合部721至723,將輸入通道之頻域信號加以混合,藉此生成輸出通道之音響信號。此處,以下參照圖式對藉由第1至第5輸出選擇部711至715而選擇之輸出目的地之例進行簡單說明。
[輸出控制部710之輸出目的地之選擇例]
圖7係表示本發明之第2實施形態中之第1至第5輸出選擇部711至715之輸出目的地之選擇例的圖。此處,表示了針對視窗資訊761中之各組合之頻域信號輸出目的地762。
視窗資訊761中表示了藉由音響信號編碼裝置200中之開窗處理部211至215而實施之開窗處理相關之開窗形式及視窗形狀的組合。該視窗資訊761中之組合之數量如圖3所述為16種。頻域信號輸出目的地762中表示了針對視窗資訊761中之各組合之輸入通道之頻域信號之輸出目的地。
於該例中,視窗資訊中所表示之開窗形式為LONG_WINDOW,視窗形狀中之前半部分及後半部分均為正弦視窗時,第1至第5輸出選擇部711至715將頻域信號輸出至第1頻域混合部721。
如此,藉由第1至第5輸出選擇部711至715,針對視窗資訊761中之各組合而選擇輸出目的地,因此可使視窗資訊相同之頻域信號彼此與第1至第16頻域混合部721至723關聯而輸出。其次,參照圖式對該例中之第1至第16 IMDCT‧開窗處理部731至733及741至743中之開窗處理之例進行說明。
[各IMDCT‧開窗處理部中之開窗處理例]
圖8係表示本發明之第2實施形態中之第1至第16 IMDCT‧開窗處理部731至733及741至743之開窗處理相關之例的圖。此處,假想根據圖7所示之視窗資訊761及頻域信號輸出目的地762之對應關係,第1至第5輸出選擇部711至715選擇頻域信號之輸出目的地。
此處,表示了藉由第1至第16 IMDCT‧開窗處理部731至733及741至743而實施之開窗處理相關的開窗形式771及視窗形狀772。該例中,第1 IMDCT‧開窗處理部731及741對時域信號實施開窗形式為LONG_WINDOW、該開窗形式中之前半部分及後半部分適用正弦視窗之視窗形狀的開窗處理。
如此,第1至第16 IMDCT‧開窗處理部731至733及741至743根據來自輸出控制部710之輸入通道之頻域信號及視窗資訊生成輸出通道之頻域信號。
[音響信號解碼裝置600之動作例]
其次,參照圖式對本發明之第2實施形態中之音響信號解碼裝置600之動作進行說明。
圖9係表示本發明之第2實施形態中之音響信號解碼裝置600之編碼字串之解碼方法之處理工序例的流程圖。
首先,藉由編碼字串分離部310,將自編碼字串傳輸線301所供給之編碼字串,分離為輸入通道之音響編碼資料、輸入通道之視窗資訊、降混資訊等(步驟S931)。接著,藉由解碼‧反量化部320,對輸入通道之音響編碼資料進行解碼(步驟S932)。繼而,藉由解碼‧反量化部320,將上述經解碼之音響編碼資料反量化,藉此生成頻域信號(步驟S933)。
其次,藉由輸出控制部710,根據包含視窗形狀之複數個視窗資訊,將該視窗資訊中之組合彼此相同之頻域信號彼此同時輸出至與各組合對應之第1至第16頻域混合部721至723(步驟S934)。再者,步驟S934係申請專利範圍中記載之輸出控制工序之一例。
之後,藉由第1至第16頻域混合部721至723,針對視窗資訊中之各組合,根據降混資訊與輸入通道之頻域信號,生成輸出通道之頻域信號(步驟S935)。亦即,藉由第1至第16頻域混合部721至723,根據來自編碼字串分離部310之降混資訊,將相同之組合之頻域信號彼此混合,作為小於輸入通道數量之輸出通道數量之頻域信號而輸出。再者,步驟S935係申請專利範圍中記載之頻域混合工序之一例。
而且,藉由第1至第16 IMDCT‧開窗處理部731至733及741至744,對來自第1至第16頻域混合部721至723之輸出通道之頻域信號實施IMDCT處理(步驟S936)。亦即,藉由第1至第16 IMDCT‧開窗處理部731至733,將來自第1至第16頻域混合部721至723之右通道之頻域信號之各個藉由IMDCT處理轉換而生成為時域信號。與此同時,藉由第1至第16 IMDCT‧開窗處理部741至743,將來自第1至第16頻域混合部721至723之左通道之頻域信號之各個藉由IMDCT處理轉換而生成為時域信號。
繼而,藉由IMDCT‧開窗處理部731至733及741至743之各個,對上述經生成之時域信號實施開窗處理(步驟S937)。而且,藉由加算部751及752,將來自第1至第16 IMDCT‧開窗處理部731至733之實施有開窗處理之時域信號針對各輸出通道相加,藉此作為音響信號而輸出(步驟S938)。
亦即,藉由輸出音生成部730,將來自第1至第16頻域混合部721至723之輸出通道之頻域信號轉換為時域信號,並對上述經轉換之時域信號實施開窗處理,藉此生成輸出通道之音響信號。藉此,藉由音響信號編碼裝置而生成之編碼字串之解碼方法中之處理工序結束。再者,步驟S936至S938係申請專利範圍中記載之輸出音生成工序之一例。
如此,本發明之第2實施形態中,藉由輸出控制部710使與視窗資訊之各組合關聯之頻域信號彼此根據降混資訊而分別混合。而且,將上述經混合之頻域信號轉換為時域信號,將上述經轉換之時域信號之各個針對各輸出通道相加,藉此生成輸出通道之音響信號。藉此,與第1實施形態不同,即便所有視窗資訊不一致,亦可根據輸入通道之頻域信號與降混資訊,生成輸出通道之音響信號。
再者,該例中,輸入通道之視窗資訊中之組合之數量較多時,與將輸入通道之時域信號降混之情形相比存在IMDCT處理之運算量增加之情形。例如,於5個通道之視窗資訊中僅2個通道之視窗資訊一致時,視窗資訊中之組合之數量為4,自第1至第16頻域混合部721至723所輸出之頻域信號為8個(組合之數量×輸出通道數量)。因此,第1至第16 IMDCT‧開窗處理部731至733及741至743對8個通道之頻域信號實施IMDCT處理。
另一方面,於將時域信號降混之情形時,對輸入通道數量為5個通道之頻域信號實施IMDCT處理。因此,將頻域信號降混會導致IMDCT處理之運算量增加。相對於此,與將輸入通道之時域信號降混之情形相比以使IMDCT處理之運算量不增加而進行改良者為第3實施形態。
<3. 第3實施形態>
[音響信號解碼裝置之一構成例]
圖10係表示本發明之第3實施形態中之音響信號解碼裝置之一構成例的方塊圖。音響信號解碼裝置800包括圖7所示之頻域合成部700及輸出控制部840,來代替圖4所示之輸出控制部340及頻域合成部500。此處,除頻域合成部700及輸出控制部840以外之構成與圖4所示者相同,因此附加與圖4相同之符號並省略此處之說明。進而,頻域合成部700之功能與圖7所示者相同,因此省略此處之說明。又,輸出控制部840與圖4所示之輸出控制部340對應。
輸出控制部840係根據輸入通道之視窗資訊中之組合之數量,進行控制以將來自解碼‧反量化部320之所有輸入通道之頻域信號輸出至時域合成部400或頻域合成部700之其中一者。該輸出控制部840根據來自視窗資訊線311之各輸入通道之視窗資訊算出視窗資訊中之組合之數量。該輸出控制部840例如於5個視窗資訊中僅2個視窗資訊一致之情形時,算出視窗資訊中之組合之數量為4。
又,輸出控制部840判斷上述經算出之組合之數量與輸出通道數量相乘之值是否小於輸入通道數量。亦即,輸出控制部840判斷來自視窗資訊線311之各輸入通道之視窗資訊中之組合之數量與輸出通道數量相乘之值是否小於輸入通道數量。
而且,輸出控制部840於該相乘之值小於輸入通道數量之情形時,控制輸出切換部351至355,以將各輸入通道之頻域信號同時輸出至頻域合成部700中之輸出控制部710。亦即,輸出控制部840根據輸入通道之視窗資訊中之組合之數量,使視窗資訊之組合相同之輸入通道之頻域信號彼此關聯而輸出至第1至第16頻域混合部721至723。
另一方面,輸出控制部840於該相乘之值為輸入通道數量以上之情形時,控制輸出切換部351至355,以將各輸入通道之頻域信號輸出至時域合成部400中之IMDCT‧開窗處理部411至415。再者,輸出控制部840係申請專利範圍中記載之輸出控制部之一例。
如此,藉由設置輸出控制部840,可於視窗資訊中之組合之數量與輸出通道數量相乘之值為輸入通道數量以上之情形時,切換為時域合成部400中之降混處理。
[音響信號解碼裝置800之動作例]
其次,參照圖式對本發明之第3實施形態中之音響信號解碼裝置800之動作進行說明。
圖11係表示本發明之第3實施形態中之音響信號解碼裝置800之編碼字串之解碼方法之處理工序例的流程圖。
首先,藉由編碼字串分離部310,將自編碼字串傳輸線301所供給之編碼字串,分離為輸入通道之音響編碼資料、輸入通道之視窗資訊、降混資訊等(步驟S941)。接著,藉由解碼‧反量化部320,對輸入通道之音響編碼資料進行解碼(步驟S942)。繼而,藉由解碼‧反量化部320,將經解碼之音響編碼資料反量化,藉此生成頻域信號(步驟S943)。
其次,藉由輸出控制部840,算出來自編碼字串分離部310之各輸入通道之視窗資訊中所包含之視窗形式及視窗形狀之組合之數量N(步驟S944)。繼而,判斷視窗資訊中之組合之數量N與輸出通道數量相乘之值是否小於輸入通道數量(步驟S945)。而且,於判斷為小於輸入通道數量之情形時,輸出控制部840切換輸出切換部351至355之連接,以將輸入通道所有頻域信號輸出至頻域合成部700(步驟S951)。
亦即,藉由輸出控制部840,根據包含視窗函數之種類所表示之視窗形狀之視窗資訊,控制輸出切換部351至355以將該視窗資訊彼此相同之頻域信號彼此同時輸出。藉此,將自解碼‧反量化部320所輸出之輸入通道之頻域信號之全部供給至頻域合成部700。再者,步驟S945及S951係申請專利範圍中記載之輸出控制工序之一例。
之後,藉由輸出控制部710,根據來自視窗資訊線311之視窗資訊,將該視窗資訊中之組合彼此相同之頻域信號彼此同時輸出至與各組合對應之第1至第16頻域混合部721至723。然後,藉由第1至第16頻域混合部721至723,針對視窗資訊中之各組合,根據降混資訊與輸入通道之頻域信號,生成輸出通道之頻域信號(步驟S952)。
亦即,藉由第1至第16頻域混合部721至723,根據來自編碼字串分離部310之降混資訊,將相同之組合之頻域信號彼此混合,作為小於輸入通道數量之輸出通道數量之頻域信號而輸出。再者,步驟S952係申請專利範圍中記載之頻域混合工序之一例。
接著,藉由第1至第16 IMDCT‧開窗處理部731至733及741至744,對來自第1至第16頻域混合部721至723之輸出通道之頻域信號實施IMDCT處理(步驟S953)。亦即,藉由第1至第16 IMDCT‧開窗處理部731至733,將來自第1至第16頻域混合部721至723之右通道之頻域信號之各個藉由IMDCT處理轉換而生成為時域信號。與此同時,藉由第1至第16 IMDCT‧開窗處理部741至743,將來自第1至第16頻域混合部721至723之左通道之頻域信號之各個藉由IMDCT處理轉換而生成為時域信號。
繼而,藉由IMDCT‧開窗處理部731至733及741至743之各個,對所生成之時域信號實施開窗處理(步驟S954)。而且,藉由加算部751及752,將來自第1至第16 IMDCT‧開窗處理部731至733之實施有開窗處理之時域信號針對各輸出通道相加,藉此,作為音響信號而輸出(步驟S955)。
亦即,藉由輸出音生成部730,將來自第1至第16頻域混合部721至723之輸出通道之頻域信號轉換為時域信號,並對上述經轉換之時域信號實施開窗處理,藉此生成輸出通道之音響信號。再者,步驟S953至S955係申請專利範圍中記載之輸出音生成工序之一例。
另一方面,於步驟S945中,於相乘之值小於輸入通道數量之情形時,藉由輸出控制部840,控制輸出切換部351至355以將輸入通道所有頻域信號輸出至時域合成部400(步驟S946)。之後,藉由IMDCT‧開窗處理部411至415,將5個輸入通道之頻域信號藉由IMDCT處理轉換而生成為時域信號(步驟S947)。
繼而,藉由IMDCT‧開窗處理部411至415,對上述經生成之時域信號實施開窗處理,作為輸入通道數量之時域信號而輸出(步驟S948)。而且,藉由時域混合部420,根據來自編碼字串分離部310之降混資訊將輸入通道數量之時域信號加以混合,作為輸出通道之音響信號而輸出(步驟S949),編碼字串之解碼方法之處理結束。
如此,本發明之第3實施形態中,於頻域合成部700中之IMDCT處理之運算量與時域合成部400相比變大之情形時,可切換為時域合成部400之處理。藉此,與本發明之第2實施形態相比,可防止IMDC處理之運算量增加至必要以上。
如此,根據本發明之實施形態,可減少向時域信號之轉換之運算處理,並且可根據包含視窗形狀視窗資訊適當地生成輸出通道之音響信號。
再者,本發明之實施形態係表示用以將本發明具體化之一例者,如本發明之實施形態中所明示般,本發明之實施形態中之事項與申請專利範圍中之發明特定事項具有分別對應之關係。同樣地,申請專利範圍中之發明特定事項與附加有與其相同之名稱之本發明之實施形態中之事項具有分別對應之關係。然而,本發明並非限定於實施形態者,於不脫離本發明之主旨之範圍內可藉由對實施形態實施各種變形而具體化。
又,本發明之實施形態中所說明之處理工序既可作為具有該等一系列之工序之方法而實現,且亦可作為用以使電腦執行該等一系列之工序之程式或記憶該程式之記錄媒體而實現。作為該記錄媒體,例如可使用CD(Compact Disc,緊密光碟)、MD(MiniDisc,小型磁碟)、DVD(Digital Versatile Disc,數位多功能光碟)、記憶卡、藍光光碟(Blu-ray Disc(註冊商標))等。
100...音響信號處理系統
101、102、103、104、105...輸入端子
110...右通道揚聲器
111、121...信號線
120...左通道揚聲器
200、600、800...音響信號編碼裝置
211~215...開窗處理部
231~235...MDCT部
241~245...量化部
250...編碼字串生成部
260...降混資訊接受部
300...音響信號解碼裝置
301...編碼字串傳輸線
310...編碼字串分離部
320...解碼‧反量化部
340、710、840...輸出控制部
361、362、751、752...加算部
400...時域合成部
411~415、521、522、731~733、741~743...IMDCT‧開窗處理部
420...時域混合部
500、721~723...頻域合成部
510...頻域混合部
520、730...輸出音生成部
700...頻域合成部
711~715...輸出選擇部
圖1係表示本發明之第1實施形態中之音響信號處理系統之一構成例的方塊圖。
圖2係表示本發明之第1實施形態中之音響信號編碼裝置200之一構成例的方塊圖。
圖3係表示藉由本發明之第1實施形態中之開窗處理部211至215而生成之視窗資訊之組合之一例的圖。
圖4係表示本發明之第1實施形態中之音響信號解碼裝置300之一構成例的方塊圖。
圖5係表示本發明之第1實施形態中之音響信號解碼裝置300之編碼字串之解碼方法之處理工序例的流程圖。
圖6係表示本發明之第2實施形態中之音響信號解碼裝置之一構成例的方塊圖。
圖7係表示本發明之第2實施形態中之第1至第5輸出選擇部711至715之輸出目的地之選擇例的圖。
圖8係表示本發明之第2實施形態中之第1至第16 IMDCT‧開窗處理部731至733及741至743之開窗處理相關之例的圖。
圖9係表示本發明之第2實施形態中之音響信號解碼裝置600之編碼字串之解碼方法之處理工序例的流程圖。
圖10係表示本發明之第3實施形態中之音響信號解碼裝置之一構成例的方塊圖。
圖11係表示本發明之第3實施形態中之音響信號解碼裝置800之編碼字串之解碼方法之處理工序例的流程圖。
100...音響信號處理系統
101、102、103、104、105...輸入端子
110...右通道揚聲器
111、121...信號線
120...左通道揚聲器
200...音響信號編碼裝置
300...音響信號解碼裝置
301...編碼字串傳輸線

Claims (7)

  1. 一種音響信號解碼裝置,其包括:輸出控制部,其以根據包含對複數個輸入通道之音響信號實施有開窗處理之頻域信號相關之視窗函數之種類所表示的視窗形狀之視窗資訊,將該視窗資訊彼此相同之上述頻域信號彼此同時輸出之方式而加以控制;頻域混合部,其根據降混資訊將上述視窗資訊相同之上述輸入通道之頻域信號彼此混合,並作為輸出通道數量小於上述輸入通道數量之輸出通道之頻域信號而輸出;以及輸出音生成部,其將自上述頻域混合部輸出之上述輸出通道之頻域信號轉換為時域信號,並對上述經轉換之時域信號實施上述開窗處理,藉此生成上述輸出通道之音響信號;且上述輸出控制部根據包含表示基於上述輸入通道之音響信號而設定之視窗之種類之開窗形式的上述視窗資訊,控制上述頻域信號之輸出;上述輸出音生成部根據上述視窗資訊所表示之上述開窗形式及視窗函數之種類,對上述輸出通道之上述頻域信號實施上述開窗處理,藉此生成上述輸出通道之上述音響信號。
  2. 如請求項1之音響信號解碼裝置,其中上述頻域混合部針對上述複數個視窗資訊中之各組合根據上述降混資訊將上述輸入通道之頻域信號加以混 合,上述輸出音生成部將實施有上述開窗處理之上述各組合之上述時域信號相加,藉此生成上述輸出通道之上述音響信號。
  3. 如請求項2之音響信號解碼裝置,其中上述輸出控制部於上述複數個視窗資訊中之上述組合之數量與上述輸出通道數量之乘法值小於上述輸入通道數量之情形時,將上述輸入通道之上述頻域信號彼此同時輸出至上述頻域混合部。
  4. 如請求項1之音響信號解碼裝置,其中上述輸出控制部根據相對於上述開窗形式中之前半部分及後半部分之上述視窗形狀所表示之上述視窗資訊,而控制上述頻域信號之輸出。
  5. 一種音響信號處理系統,其包括音響信號編碼裝置及音響信號解碼裝置,上述音響信號編碼裝置包括:開窗處理部,其對複數個輸入通道之音響信號實施開窗處理,生成包含上述開窗處理中之視窗函數之種類所表示之視窗形狀的視窗資訊;及頻率轉換部,其將自上述開窗處理部所輸出之上述音響信號轉換成頻域,藉此生成頻域信號;上述音響信號解碼裝置包括:輸出控制部,其以將自上述音響信號編碼裝置輸出之上述輸入通道之上述頻域信號相關之上述視窗資訊彼此相同的上述頻域信號彼此同時輸出之方式而加以控制;頻域混合部,其根據降混 資訊將上述視窗資訊相同之上述輸入通道之頻域信號彼此混合,並作為輸出通道數量小於上述輸入通道數量之輸出通道之頻域信號而輸出;及輸出音生成部,其將自上述頻域混合部輸出之上述輸出通道之頻域信號轉換為時域信號,並對上述經轉換之時域信號實施上述開窗處理,藉此生成上述輸出通道之音響信號;且上述輸出控制部根據包含表示基於上述輸入通道之音響信號而設定之視窗之種類之開窗形式的上述視窗資訊,控制上述頻域信號之輸出;上述輸出音生成部根據上述視窗資訊所表示之上述開窗形式及視窗函數之種類,對上述輸出通道之上述頻域信號實施上述開窗處理,藉此生成上述輸出通道之上述音響信號。
  6. 一種音響信號解碼方法,其包括:輸出控制工序,其以根據包含對複數個輸入通道之音響信號實施有開窗處理之頻域信號相關之視窗函數之種類所表示的視窗形狀之視窗資訊,將該視窗資訊彼此相同之上述頻域信號彼此同時輸出之方式而加以控制;頻域混合工序,其根據降混資訊將上述視窗資訊相同之上述輸入通道之頻域信號彼此混合,並作為輸出通道數量小於上述輸入通道數量之輸出通道之頻域信號而輸出;以及輸出音生成工序,其將藉由上述頻域混合工序而輸出之上述輸出通道之頻域信號轉換為時域信號,並對上述 經轉換之時域信號實施上述開窗處理,藉此生成上述輸出通道之音響信號;且上述輸出控制工序根據包含表示基於上述輸入通道之音響信號而設定之視窗之種類之開窗形式的上述視窗資訊,控制上述頻域信號之輸出;上述輸出音生成工序根據上述視窗資訊所表示之上述開窗形式及視窗函數之種類,對上述輸出通道之上述頻域信號實施上述開窗處理,藉此生成上述輸出通道之上述音響信號。
  7. 一種使電腦執行如下工序之程式:輸出控制工序,其以根據包含對複數個輸入通道之音響信號實施有開窗處理之頻域信號相關之視窗函數之種類所表示的視窗形狀之視窗資訊,將該視窗資訊彼此相同之上述頻域信號彼此同時輸出之方式而加以控制;頻域混合工序,其根據降混資訊將上述視窗資訊相同之上述輸入通道之頻域信號彼此混合,並作為輸出通道數量小於上述輸入通道數量之輸出通道之頻域信號而輸出;以及輸出音生成工序,其將藉由上述頻域混合工序而輸出之上述輸出通道之頻域信號轉換為時域信號,並對上述經轉換之時域信號實施上述開窗處理,藉此生成上述輸出通道之音響信號;且上述輸出控制工序根據包含表示基於上述輸入通道之音響信號而設定之視窗之種類之開窗形式的上述視窗資 訊,控制上述頻域信號之輸出;上述輸出音生成工序根據上述視窗資訊所表示之上述開窗形式及視窗函數之種類,對上述輸出通道之上述頻域信號實施上述開窗處理,藉此生成上述輸出通道之上述音響信號。
TW099117632A 2009-06-23 2010-06-01 An audio signal processing system, an audio signal decoding device, and a processing method and program thereof TWI447708B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009148220A JP5365363B2 (ja) 2009-06-23 2009-06-23 音響信号処理システム、音響信号復号装置、これらにおける処理方法およびプログラム

Publications (2)

Publication Number Publication Date
TW201123172A TW201123172A (en) 2011-07-01
TWI447708B true TWI447708B (zh) 2014-08-01

Family

ID=43386407

Family Applications (1)

Application Number Title Priority Date Filing Date
TW099117632A TWI447708B (zh) 2009-06-23 2010-06-01 An audio signal processing system, an audio signal decoding device, and a processing method and program thereof

Country Status (9)

Country Link
US (1) US8825495B2 (zh)
EP (1) EP2426662B1 (zh)
JP (1) JP5365363B2 (zh)
KR (1) KR20120031930A (zh)
CN (1) CN102119413B (zh)
BR (1) BRPI1004287A2 (zh)
RU (1) RU2011104718A (zh)
TW (1) TWI447708B (zh)
WO (1) WO2010150635A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5903758B2 (ja) * 2010-09-08 2016-04-13 ソニー株式会社 信号処理装置および方法、プログラム、並びにデータ記録媒体
US9905236B2 (en) * 2012-03-23 2018-02-27 Dolby Laboratories Licensing Corporation Enabling sampling rate diversity in a voice communication system
AU2013284705B2 (en) 2012-07-02 2018-11-29 Sony Corporation Decoding device and method, encoding device and method, and program
US20150100324A1 (en) * 2013-10-04 2015-04-09 Nvidia Corporation Audio encoder performance for miracast
WO2015173422A1 (de) * 2014-05-15 2015-11-19 Stormingswiss Sàrl Verfahren und vorrichtung zur residualfreien erzeugung eines upmix aus einem downmix
CN113035210A (zh) * 2021-03-01 2021-06-25 北京百瑞互联技术有限公司 一种lc3音频混合方法、装置及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW519629B (en) * 1999-01-28 2003-02-01 Dolby Lab Licensing Corp Data framing for adaptive-block-length coding system
CN1496007A (zh) * 1995-09-29 2004-05-12 �ձ�������ʽ���� 音频译码装置
US20070067162A1 (en) * 2003-10-30 2007-03-22 Knoninklijke Philips Electronics N.V. Audio signal encoding or decoding

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2710852B2 (ja) 1990-03-28 1998-02-10 ホーヤ株式会社 ガラス成形体の製造装置及び製造方法
JP3761639B2 (ja) * 1995-09-29 2006-03-29 ユナイテッド・モジュール・コーポレーション オーディオ復号装置
JP4213708B2 (ja) 1995-09-29 2009-01-21 ユナイテッド・モジュール・コーポレーション オーディオ復号装置
JP3279228B2 (ja) 1997-08-09 2002-04-30 日本電気株式会社 符号化音声復号装置
JP3806770B2 (ja) 2000-03-17 2006-08-09 松下電器産業株式会社 窓処理装置および窓処理方法
JP3966814B2 (ja) 2002-12-24 2007-08-29 三洋電機株式会社 簡易再生方法とこの方法に利用可能な簡易再生装置、復号方法、復号装置
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
EP2077550B8 (en) * 2008-01-04 2012-03-14 Dolby International AB Audio encoder and decoder

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1496007A (zh) * 1995-09-29 2004-05-12 �ձ�������ʽ���� 音频译码装置
TW519629B (en) * 1999-01-28 2003-02-01 Dolby Lab Licensing Corp Data framing for adaptive-block-length coding system
US20070067162A1 (en) * 2003-10-30 2007-03-22 Knoninklijke Philips Electronics N.V. Audio signal encoding or decoding

Also Published As

Publication number Publication date
EP2426662B1 (en) 2017-03-08
US20120116780A1 (en) 2012-05-10
WO2010150635A1 (ja) 2010-12-29
JP2011007823A (ja) 2011-01-13
CN102119413A (zh) 2011-07-06
KR20120031930A (ko) 2012-04-04
RU2011104718A (ru) 2012-08-20
JP5365363B2 (ja) 2013-12-11
BRPI1004287A2 (pt) 2016-02-23
CN102119413B (zh) 2013-03-27
US8825495B2 (en) 2014-09-02
TW201123172A (en) 2011-07-01
EP2426662A4 (en) 2012-12-19
EP2426662A1 (en) 2012-03-07

Similar Documents

Publication Publication Date Title
US11705137B2 (en) Apparatus for encoding and decoding of integrated speech and audio
JP5934922B2 (ja) 復号装置
TWI447708B (zh) An audio signal processing system, an audio signal decoding device, and a processing method and program thereof
KR101975066B1 (ko) 신호 처리 장치 및 방법, 및 컴퓨터 판독가능 기록 매체
CN104798131B (zh) 用于空间音频对象编码中信号相依缩放变换的编码器、解码器及方法
US20090210239A1 (en) Method for Encoding and Decoding Object-Based Audio Signal and Apparatus Thereof
TWI476762B (zh) Audio decoding device, audio decoding method, audio decoding program, audio coding device, audio coding method, and audio coding program
KR101261677B1 (ko) 음성/음악 통합 신호의 부호화/복호화 장치
TWI476760B (zh) 用以使用暫態檢測及品質結果將音訊信號的部分編碼之裝置與方法
JP6457625B2 (ja) 独立したノイズ充填を用いた強化された信号を生成するための装置および方法
US20080059203A1 (en) Audio Encoding Device, Decoding Device, Method, and Program
JP2007304258A (ja) オーディオ信号符号化およびその復号化装置、方法ならびにプログラム
JPWO2021260826A5 (zh)
JPWO2021260825A5 (zh)
JP2005284162A (ja) 信号符号化装置、信号復号装置、信号符号化方法、及び、信号復号方法

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees