TWI509596B - A sound signal processing device, a sound coding device, and a sound decoding device - Google Patents

A sound signal processing device, a sound coding device, and a sound decoding device Download PDF

Info

Publication number
TWI509596B
TWI509596B TW099135730A TW99135730A TWI509596B TW I509596 B TWI509596 B TW I509596B TW 099135730 A TW099135730 A TW 099135730A TW 99135730 A TW99135730 A TW 99135730A TW I509596 B TWI509596 B TW I509596B
Authority
TW
Taiwan
Prior art keywords
qmf
acoustic signal
coefficient
adjustment
sequence
Prior art date
Application number
TW099135730A
Other languages
English (en)
Other versions
TW201137859A (en
Inventor
Tomokazu Ishikawa
Takeshi Norimatsu
Kok Seng Chong
Huan Zhou
Haishan Zhong
Original Assignee
Panasonic Ip Corp America
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Ip Corp America filed Critical Panasonic Ip Corp America
Publication of TW201137859A publication Critical patent/TW201137859A/zh
Application granted granted Critical
Publication of TWI509596B publication Critical patent/TWI509596B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

聲響信號處理裝置、聲響編碼裝置及聲響解碼裝置 發明領域
本發明係關於將聲響信號及聲音信號(以下稱為聲響信號)作數位信號處理的聲響信號處理裝置。
發明背景
以將聲響信號在時間軸上作壓縮或作擴展的技術而言,有一種稱為相角音碼器(Phase Vocoder)的技術。非專利文獻1所揭示的相角音碼器裝置係在經數位化的聲響信號適用高速傅立葉轉換(FFT:Fast Fourier Transform)或短時間傅立葉轉換(STFT:Short Time Fourier Transform),在頻率領域實現時間方向的伸縮處理(時間擴展處理)、及音高轉換處理(音高調節處理)等。
音高(pitch)亦被稱為音高頻率,意指聲音的高低。時間擴展處理係不會改變聲響信號的音高而將聲響信號的時間長作伸縮的處理。音高調節處理係頻率調變處理之例,係不會改變聲響信號的時間長而改變聲響信號的音高的處理。音高調節處理亦被稱為音高擴展處理。
若聲響信號的再生速度被單純變更時,聲響信號的時間長及音高之雙方即被變更。另一方面,亦會有未改變音高而作時間伸縮後的聲響信號的再生速度被變更,藉此使聲響信號的時間長恢復原狀,而僅有聲響信號的音高被轉換的情形。因此,在音高調節(pitch shift)處理係有包含時間擴展處理的情形。相反地,在時間擴展處理亦有包含音高調節處理的情形。如上所示時間擴展處理與音高調節處理係具有對應關係。
時間擴展處理係無須改變將輸入聲響信號作FFT所得的頻譜信號的局部頻譜特性,而可使輸入聲響信號的繼續時間(再生時間)改變。其原理如以下所示。
(a)執行時間擴展處理的聲響信號處理裝置係首先將輸入聲響信號分割成一定時間間隔,每間隔一定時間(例如每隔1024取樣]即進行解析。此時,聲響信號處理裝置係在作分割後的時間單位內,每隔比分割時間單位為更短的時間間隔(例如128取樣)使其重疊來處理輸入聲響信號。在此,將所重疊的時間間隔稱為躍程尺寸(Hop Size)。
在第30A圖中,輸入信號的躍程尺寸為Ra 。此外,藉由相角音碼器處理所被計算出的輸出聲響信號亦成為時間間隔重疊一定取樣數的聲響信號。在第30B圖中,輸出聲響信號的躍程尺寸為Rs 。若作時間擴展時,成為Rs >Ra ,若作時間壓縮時,則成為Rs <Ra 。在此,以時間擴展的情形(Rs >Ra )為例加以說明。將時間擴展的比例r定義如式1所示。
[數式1]
(b)如上所述,分割成一定時間間隔且呈重疊狀態的各時間區塊信號大部分具有在時間上呈同調(Coherent)的型式(pattern)。因此,聲響信號處理裝置係對各時間區塊信號施行頻率轉換。典型而言,聲響信號處理裝置係將輸入的各時間區塊信號作頻率轉換而調整相位資訊。之後,聲響信號處理裝置係將頻率領域的信號恢復成時間領域的信號,來作為輸出的時間區塊信號。
按照上述原理,至此為止的古典相角音碼器裝置係使用STFT來進行對頻率領域的轉換,在頻率領域的各種調整處理之後,進行短時間傅立葉逆轉換。接著,藉此實現時間轉換及音高調節處理。接著,針對STFT基礎的處理加以說明。
(1)解析
首先,聲響信號處理裝置係按每個以躍程尺寸Ra 所重疊的時間區塊單位,執行窗長L的解析窗函數。具體而言,聲響信號處理裝置係將各區塊使用FFT而轉換成頻率領域。例如,uRa (uN)的點的頻率特性係藉由式2予以計算出。
[數式2]
在此,h(n)係解析窗函數,k係表示頻率指數,以範圍而言,為k=0,...,L-1。此外,WL mk 係藉由:
[數式3]
予以計算出。
(2)調整
如上所示所計算出的頻率信號的相位資訊,亦即調整前的相位資訊係設為φ(uRa ,k)。在調整相(phase)中,聲響信號處理裝置係以下列方法來計算頻率指數為k的頻率成分ω(uRa ,k)。
首先,為了計算頻率成分ω(uRa ,k),聲響信號處理裝置係按照式3來計算屬於呈連續的解析點的(u-1)Ra 與uRa 的相位信號的增加部分Δφk u
[數式4]
由於以時間間隔Ra 來計算增加部分Δφk u ,因此聲響信號處理裝置係可按照式4來計算各頻率成分ω(uRa ,k)。
[數式5]
接著,聲響信號處理裝置係藉由式5來計算合成點uRs 的相位。
ψ(uRs ,k)=ψ((u-1)Rs ,k)+Rs ‧ω(uRa ,k) (式5)
(3)再合成
聲響信號處理裝置係對所有頻率指數計算出藉由FFT所計算出的頻率信號的振幅∣X(uRa ,k)∣與調整後的相位φ(uRs ,k)。接著,聲響信號處理裝置係使用逆FFT轉換,將頻率信號與時間信號再合成。再合成係按照式6來執行。
[數式6]
聲響信號處理裝置係將予以再合成的時間區塊信號插入在合成點uRs 。接著,聲響信號處理裝置係藉由將經合成輸出的信號、及在之前的區塊作合成輸出的信號進行重疊加算,而生成時間擴展信號。與前區塊之合成輸出的重疊加算係顯示於式7。
[數式7]
上述的3個步驟亦關於解析點(u+1) Ra 予以施行。接著,上述3個步驟係對所有輸入信號區塊反覆進行。以該結果而言,聲響信號處理裝置係可計算以擴展比Rs /Ra 作時間擴展後的信號。
其中,為了補正經時間擴展的信號的振幅方向的調變(時間上的擺動),窗函數h(m)係必須滿足電力補償(power-complemntary)條件。
以與時間擴展相對應的處理而言,有音高調節處理。音高調節處理係未改變信號的經過時間而改變信號的音高的方法。改變數位聲響信號的音高的簡單方法係將輸入信號作抽減(resample)。音高調節處理亦可與時間擴展處理加以組合。例如,聲響信號處理裝置亦可在時間擴展處理之後,在原本的輸入信號的時間長作resample。
另一方面,亦存在有直接照原樣計算音高調節處理的手法。計算音高調節處理的手法,一般而言係有發生相較於在時間軸的resample處理為極為惡劣的副作用的情形,但是在本發明中並不詳述該內容。
其中,時間擴展的處理係有藉由擴展比,而形成為時間壓縮處理的情形。因此,在此,時間擴展的表現係表示時間伸縮,包含時間壓縮。
(先前技術文獻) (非專利文獻)
(非專利文獻1)Improved Phase Vocoder Time-Scale Modification of Audio(IEEE Trans ASP Vol. 7 No.3,May 1989)
但是,如上所述,為了以由FFT及逆FFT所構成的古典相角音碼器裝置來實現高品質的時間擴展,必須設定較為細微的躍程尺寸。因此,結果必須以龐大的次數來實施FFT及逆FFT,運算量較大。
此外,聲響信號處理裝置係有在時間擴展處理之後,執行與時間擴展處理不同的處理的情形。此時,聲響信號處理裝置係必須將時間領域的信號轉換成解析用領域的信號。例如,以如上所示之解析用領域而言,係有在時間軸方向與頻率軸方向之雙方具有成分的QMF(Quadrature Mirror Filter)領域。QMF領域由於在時間軸方向與頻率軸方向之雙方具有成分,因此亦有被稱為合成複領域、合成頻率領域、子頻帶領域、或頻率子頻帶領域等的情形。
一般而言,複QMF濾波器組(filterbank)係將時間領域的信號轉換成在時間軸與頻率軸之雙方具有成分的合成複領域的手法之一。典型而言,QMF濾波器組係被使用在Spectral Band Replication(SBR)技術、Parametric Stereo(PS)、及Spatial Audio Coding(SAC)等參數型(Parametric Based)的音頻編碼方法。在該等編碼所使用的QMF濾波器組係具有將按每個子頻帶以複數個值所表現的頻率領域的信號作2倍超取樣(oversampling)的特性。此係用以未發生折返失真而實現處理子頻帶頻率領域的信號的規格。
以下再稍微詳加敘述。QMF解析濾波器組係將輸入信號的實數值的離散時間信號x(n)轉換成子頻帶頻率領域的複信號sk (n)。sk (n)係藉由式8予以計算出。
[數式8]
在此,p(n)係具有low-pass特性的L-1次原型濾波器的脈衝響應。α係相位參數,M係子頻帶數。此外,k係表示子頻帶的指數,k=0,1,...,M-1。
在此,將藉由QMF解析濾波器組而被分割成子頻帶頻帶的信號的信號稱為QMF係數。QMF係數大部分在參數編碼手法中,在合成處理的前階段作調整。
QMF合成濾波器組係藉由將QMF係數前頭的M個係數墊零(zero padding)(將值以0填埋),來計算出子頻帶信號s’k (n)。接著,QMF合成濾波器組係按照式9來計算出時間信號x’(n)。
[數式9]
在此,β係表示相位參數。
在以上案例,以大致滿足輸入的實數值信號x(n)的再合成可能條件(perfect reconstruction)的方式,設計出以實數值所構成的線性相位原型濾波器係數p(n)及相位參數。
如上所述,QMF轉換係時間軸方向與頻率軸方向的混合轉換。亦即,可抽出信號所含的頻率成分、及表示每個時間的頻率變化的資訊。接著,頻率成分係可按照子頻帶及單位時間來作抽出。在此,將單位時間稱為時槽。
在第31圖中詳細圖示。實數的輸入信號係被分割成長度L及躍程尺寸M相重疊的區塊。在QMF解析處理中,各區塊係被轉換成M個複子頻帶信號形成為1個時槽的形式(第31圖的上段)。如此一來,時間領域的L取樣的信號被轉換成L個複QMF係數。該複QMF係數係如第31圖的中段所示,由L/M個時槽及M個子頻帶所構成。各時槽係使用比該時槽更為之前的(L/M-1)個時槽的QMF係數,以QMF合成處理而與M個實數時間信號相合成(第31圖的下段)。
與上述STFT同樣地,聲響信號處理裝置係可藉由時間解析力與頻率解析力原本的組合,在QMF領域計算出某瞬間的頻率信號。
此外,聲響信號處理裝置係可從由L/M個時槽及M個子頻帶所構成的複QMF係數區塊,來計算與某時槽的相位資訊相鄰接的時槽的相位資訊之間的相位差。例如,某時槽的相位資訊與相鄰接的時槽的相位資訊之間的相位差係以式10予以計算出。
(式10)
Δφ(n,k)=φ(n,k)-φ(n-1,k) (式10)
在此,φ(n,k)係表示相位資訊。n係表示時槽指數,n=0,1,...,L/M-1。k係表示子頻帶指數,k=0,1,...,M-1。
在時間擴展處理之後,會有聲響信號在如上所示之QMF領域予以信號處理的情形。但是,此時,聲響信號處理裝置係除了伴隨運算量大的FPT及逆FFT的時間擴展處理以外,亦必須要進行將時間領域的信號轉換成QMF領域的信號的處理。因此,運算量會更加增加。
因此,本發明之目的在提供一種可以低運算量來實現聲響信號處理的聲響信號處理裝置。
為解決上述課題,本發明之聲響信號處理裝置係使用預定的調整係數而將輸入聲響信號列進行轉換的聲響信號處理裝置,其具備有:濾波器組,使用QMF(Quadrature Mirror Filter)解析濾波器,將前述輸入聲響信號列轉換成QMF係數列;及調整部,使前述QMF係數列依據前述預定的調整係數來進行調整。
藉此,在QMF領域實行聲響信號處理。因此,由於未使用運算量較大之習知的聲響信號處理,因此運算量會減低。
此外,亦可前述調整部係由經調整的前述QMF係數列,以可獲得以預定的時間伸縮比作時間伸縮的前述輸入聲響信號列的方式,依據表示前述預定的時間伸縮比的前述預定的調整係數來調整前述QMF係數列。
藉此,相當於聲響信號的時間伸縮的處理係在QMF領域被執行。因此,由於未使用運算量較大之習知的時間伸縮處理,因此運算量會減低。
此外,亦可前述調整部係由經調整的前述QMF係數列,以可獲得以預定的頻率調變比作頻率調變的前述輸入聲響信號列的方式,依據表示前述預定的頻率調變比的前述預定的調整係數來調整前述QMF係數列。
藉此,相當於聲響信號的頻率調變的處理係在QMF領域被執行。因此,由於未使用運算量較大之習知的頻率調變處理,因此運算量會減低。
此外,亦可前述濾波器組係將前述輸入聲響信號列按每個時間間隔逐次轉換成前述QMF係數列,藉此生成每隔前述時間間隔的前述QMF係數列,前述調整部係具備有:計算電路,按每個前述時間間隔所生成的前述QMF係數列的每個時槽及每個子頻帶計算出相位資訊;及調整電路,使每個前述時槽及每個前述子頻帶的前述相位資訊依據前述預定的調整係數來進行調整,藉此調整前述QMF係數列。
藉此,QMF係數的相位資訊係按照調整係數而被適當調整。
此外,亦可前述調整電路係按每個前述子頻帶,使依據前述QMF係數列的最初時槽的前述相位資訊、與前述預定的調整係數所計算出的值,加上每個前述時槽的前述相位資訊,藉此調整每個前述時槽的前述相位資訊。
藉此,相位資訊係按每個時槽,按照調整係數來作適當調整。
此外,亦可前述計算電路係另外按每個前述時間間隔所生成的前述QMF係數列的每個前述時槽及每個前述子頻帶來計算出振幅資訊,前述調整電路係另外使每個前述時槽及每個前述子頻帶的前述振幅資訊依據前述預定的調整係數來進行調整,藉此調整前述QMF係數列。
藉此,QMF係數的振幅資訊係按照調整係數來作適當調整。
此外,亦可前述調整部係另外具備有頻帶限制部,其係在前述QMF係數列調整前或調整後,由前述QMF係數列取出與預先訂定的頻帶寬度相對應的新的QMF係數列。
藉此,僅取得所需頻率頻帶的QMF係數。
此外,亦可前述調整部係將調整前述QMF係數列的比例按每個子頻帶作加權,且按每個前述子頻帶調整前述QMF係數列。
藉此,按照頻率頻帶,來適當調整QMF係數。
此外,亦可前述調整部係另外具備有領域轉換群,其在前述QMF係數列調整前或調整後,將前述QMF係數列轉換成時間及頻率的解析力不同的新的QMF係數列。
藉此,QMF係數列係被轉換成具有與處理相對應的子頻帶數的QMF係數列。
此外,亦可前述調整部係由調整前的前述QMF係數列檢測過渡成分,將所檢測出的前述過渡成分由調整前的前述QMF係數列取出,調整所取出的前述過渡成分,將經調整的前述過渡成分恢復成調整後的前述QMF係數列,藉此調整前述QMF係數列。
藉此,抑制因不適於時間擴展處理的過渡成分所造成的影響。
此外,亦可前述聲響信號處理裝置係另外具備有:高域生成部,由調整後的前述QMF係數列,使用預先訂定的轉換係數,生成屬於與比與調整前的前述QMF係數列相對應的頻率頻帶為更高的高頻率頻帶相對應的新的QMF係數列的高域係數列;及高域補充部,使用屬於與前述脫落頻帶的兩側相鄰接的頻帶的前述高域係數列,來補充屬於前述高頻率頻帶之中未藉由前述高域生成部來生成前述高域係數列的頻率頻帶的脫落頻帶的係數。
藉此,取得與高頻率頻帶相對應的QMF係數。
此外,本發明之聲響編碼裝置係將第1聲響信號列進行編碼的聲響編碼裝置,亦可具備有:第1濾波器組,使用QMF(Quadrature Mirror Filter)解析濾波器,將前述第1聲響信號列轉換成第1QMF係數列;減頻取樣部,藉由將前述第1聲響信號列進行減頻取樣,而生成第2聲響信號列;第1編碼部,將前述第2聲響信號列進行編碼;第2濾波器組,使用QMF解析濾波器,將前述第2聲響信號列轉換成第2QMF係數列;調整部,使前述第2QMF係數列依據預定的調整係數來進行調整;第2編碼部,藉由將前述第1QMF係數列與經調整的前述第2QMF係數列作比較,生成解碼所使用的參數,來對前述參數進行編碼;及重疊部,將經編碼的前述第2聲響信號列、及經編碼的前述參數加以重疊。
藉此,使用在QMF領域的聲響信號處理,來編碼聲響信號。因此,由於未使用運算量較大的習知聲響信號處理,因此運算量會減低。此外,藉由在QMF領域的聲響信號處理所得的QMF係數並不會被轉換成時間領域的聲響信號,而被使用在後段的處理。因此,更加減低運算量。
此外,本發明之聲響解碼裝置,係由所被輸入的位元流,將第1聲響信號列進行解碼的聲響解碼裝置,亦可具備有:分離部,由所被輸入的前述位元流,分離成經編碼的參數與經編碼的第2聲響信號列;第1解碼部,將經編碼的前述參數進行解碼;第2解碼部,將經編碼的前述第2聲響信號列進行解碼;第1濾波器組,使用QMF(Quadrature Mirror Filter)解析濾波器,將藉由前述第2解碼部所被解碼的前述第2聲響信號列轉換成QMF係數列;調整部,使前述QMF係數列依據預定的調整係數來進行調整;高域生成部,使用經解碼的前述參數,由調整後的前述QMF係數列,生成屬於與比與調整前的前述QMF係數列相對應的頻率頻帶更高的高頻率頻帶相對應的新的QMF係數列的高域係數列;及第2濾波器組,使用QMF合成濾波器,將前述高域係數列、及調整前的前述QMF係數列轉換成時間領域的前述第1聲響信號列。
藉此,使用在QMF領域的聲響信號處理,來編碼聲響信號。因此,由於未使用運算量較大的習知聲響信號處理,因此運算量會減低。此外,藉由在QMF領域的聲響信號處理所得的QMF係數並不會被轉換成時間領域的聲響信號,而被使用在後段的處理。因此,更加減低運算量。
此外,本發明之聲響信號處理方法係使用預定的調整係數,將輸入聲響信號列進行轉換的聲響信號處理方法,亦可包含:轉換步驟,使用QMF(Quadrature Mirror Filter)解析濾波器,將前述輸入聲響信號列轉換成QMF係數列;及調整步驟,使前述QMF係數列依據前述預定的調整係數來進行調整。
藉此,本發明之聲響信號處理裝置被作為聲響信號處理方法加以實現。
此外,本發明之聲響編碼方法係將第1聲響信號列進行編碼的聲響編碼方法,亦可包含:第1轉換步驟,使用QMF(Quadrature Mirror Filter)解析濾波器,將前述第1聲響信號列轉換成第1QMF係數列;減頻取樣步驟,藉由將前述第1聲響信號列進行減頻取樣,生成第2聲響信號列;第1編碼步驟,將前述第2聲響信號列進行編碼;第2轉換步驟,使用QMF解析濾波器,將前述第2聲響信號列轉換成第2QMF係數列;調整步驟,使前述第2QMF係數列依據預定的調整係數來進行調整;第2編碼步驟,將前述第1QMF係數列與經調整的前述第2QMF係數列作比較,藉此生成解碼所使用的參數,而將前述參數進行編碼;及重疊步驟,將經編碼的前述第2聲響信號列與經編碼的前述參數進行重疊。
藉此,本發明之聲響編碼裝置被作為聲響編碼方法加以實現。
此外,本發明之聲響解碼方法係由所被輸入的位元流,將第1聲響信號列進行解碼的聲響解碼方法,亦可包含:分離步驟,由所被輸入的前述位元流,分離成經編碼的參數與經編碼的第2聲響信號列;第1解碼步驟,將經編碼的前述參數進行解碼;第2解碼步驟,將經編碼的前述第2聲響信號列進行解碼;第1轉換步驟,使用QMF(Quadrature Mirror Filter)解析濾波器,將藉由前述第2解碼步驟所被解碼的前述第2聲響信號列轉換成QMF係數列;調整步驟,使前述QMF係數列依據預定的調整係數來進行調整;高域生成步驟,使用經解碼的前述參數,由調整後的前述QMF係數列,生成屬於與比與調整前的前述QMF係數列相對應的頻率頻帶更高的高頻率頻帶相對應的新的QMF係數列的高域係數列;及第2轉換步驟,使用QMF合成濾波器,將前述高域係數列、及調整前的前述QMF係數列轉換成時間領域的前述第1聲響信號列。
藉此,本發明之聲響解碼裝置被作為聲響解碼方法加以實現。
此外,本發明之程式亦可為用以使電腦執行前述聲響信號處理方法所包含的步驟的程式。
藉此,本發明之聲響信號處理方法被作為程式加以實現。
此外,本發明之程式亦可為用以使電腦執行前述聲響編碼方法所包含的步驟的程式。
藉此,本發明之聲響編碼方法被作為程式加以實現。
此外,本發明之程式亦可為用以使電腦執行前述聲響解碼方法所包含的步驟的程式。
藉此,本發明之聲響解碼方法被作為程式加以實現。
此外,本發明之積體電路係使用預定的調整係數,來轉換輸入聲響信號列的積體電路,亦可具備有:濾波器組,使用QMF(Quadrature Mirror Filter)解析濾波器,將前述輸入聲響信號列轉換成QMF係數列;及調整部,使前述QMF係數列依據預定的調整係數來進行調整。
藉此,本發明之聲響信號處理裝置被作為積體電路加以實現。
此外,本發明之積體電路係將第1聲響信號列進行編碼的積體電路,亦可具備有:第1濾波器組,使用QMF(Quadrature Mirror Filter)解析濾波器,將前述第1聲響信號列轉換成第1QMF係數列;減頻取樣部,藉由將前述第1聲響信號列進行減頻取樣而生成第2聲響信號列;第1編碼部,將前述第2聲響信號列進行編碼;第2濾波器組,使用QMF解析濾波器,將前述第2聲響信號列轉換成第2QMF係數列;調整部,使前述第2QMF係數列依據預定的調整係數來進行調整;第2編碼部,將前述第1QMF係數列與經調整的前述第2QMF係數列作比較,藉此生成解碼所使用的參數,來對前述參數進行編碼;及重疊部,將經編碼的前述第2聲響信號列與經編碼的前述參數加以重疊。
藉此,本發明之聲響編碼裝置被作為積體電路加以實現。
此外,本發明之積體電路係由所被輸入的位元流,將第1聲響信號列進行解碼的積體電路,亦可具備有:分離部,由所被輸入的前述位元流,分離成經編碼的參數與經編碼的第2聲響信號列;第1解碼部,將經編碼的前述參數進行解碼;第2解碼部,將經編碼的前述第2聲響信號列進行解碼;第1濾波器組,使用QMF(Quadrature Mirror Filter)解析濾波器,將藉由前述第2解碼部所被解碼的前述第2聲響信號列轉換成QMF係數列;調整部,使前述QMF係數列依據預定的調整係數來進行調整;高域生成部,使用經解碼的前述參數,由調整後的前述QMF係數列,生成屬於與比與調整前的前述QMF係數列相對應的頻率頻帶更高的高頻率頻帶相對應的新的QMF係數列的高域係數列;及第2濾波器組,使用QMF合成濾波器,將前述高域係數列、及調整前的前述QMF係數列轉換成時間領域的前述第1聲響信號列。
藉此,本發明之聲響解碼裝置被作為積體電路加以實現。
藉由本發明,可以低運算量來實現聲響信號處理。
圖式簡單說明
第1圖係顯示實施形態1之聲響信號處理裝置的構成圖。
第2圖係顯示實施形態1之時間擴展處理的說明圖。
第3圖係顯示聲響解碼裝置的構成圖。
第4圖係顯示實施形態1之頻率調變電路的構成圖。
第5A圖係顯示實施形態2之QMF係數區塊的說明圖。
第5B圖係顯示在QMF領域之每個時槽的能量分布圖。
第5C圖係顯示在QMF領域之每個子頻帶的能量分布圖。
第6A圖係顯示對應過渡成分的時間擴展處理的第1模式的說明圖。
第6B圖係顯示對應過渡成分的時間擴展處理的第2模式的說明圖。
第6C圖係顯示對應過渡成分的時間擴展處理的第3模式的說明圖。
第7A圖係顯示實施形態2之過渡成分抽出處理的說明圖。
第7B圖係顯示實施形態2之過渡成分挿入處理的說明圖。
第8圖係顯示過渡位置與QMF相位遷移比例的線性關係圖。
第9圖係顯示實施形態2之時間擴展處理的流程圖。
第10圖係顯示實施形態2之時間擴展處理的變形例的流程圖。
第11圖係顯示實施形態3之時間擴展處理的說明圖。
第12圖係顯示實施形態4之時間擴展處理的說明圖。
第13圖係顯示實施形態5之聲響信號處理裝置的構成圖。
第14圖係顯示實施形態5之聲響信號處理裝置之第1變形例的構成圖。
第15圖係顯示實施形態5之聲響信號處理裝置之第2變形例的構成圖。
第16A圖係顯示藉由重新取樣處理予以音高調節處理後的輸出的圖。
第16B圖係顯示藉由時間擴展處理所被期待的輸出的圖。
第16C圖係顯示藉由時間擴展處理而錯誤輸出的圖。
第17圖係顯示實施形態6之聲響信號處理裝置的構成圖。
第18圖係顯示實施形態6之QMF領域轉換處理的概念圖。
第19圖係顯示實施形態6之頻率調變處理的流程圖。
第20A圖係顯示QMF原型濾波器的振幅響應的圖。
第20B圖係顯示頻率與振幅的關係圖。
第21圖係顯示實施形態6之聲響編碼裝置的構成圖。
第22圖係顯示音質評估的說明圖。
第23A圖係顯示實施形態7之聲響信號處理裝置的構成圖。
第23B圖係顯示實施形態7之聲響信號處理裝置的處理的流程圖。
第24圖係顯示實施形態7之聲響信號處理裝置之變形例的構成圖。
第25圖係顯示實施形態7之聲響編碼裝置的構成圖。
第26圖係顯示實施形態7之聲響編碼裝置的處理的流程圖。
第27圖係顯示實施形態7之聲響解碼裝置的構成圖。
第28圖係顯示實施形態7之聲響解碼裝置的處理的流程圖。
第29圖係顯示實施形態7之聲響解碼裝置之變形例的構成圖。
第30A圖係顯示時間擴展處理前之聲響信號之狀態的說明圖。
第30B圖係顯示時間擴展處理後之聲響信號之狀態的說明圖。
第31圖係顯示QMF解析處理及QMF合成處理的說明圖。
用以實施發明之形態
以下,一面參照圖示,一面說明本發明之實施形態。
(實施形態1)
實施形態1之聲響信號處理裝置係對所被輸入的聲響信號,進行QMF轉換,進行相位調整,且施行逆QMF轉換,藉此實現時間擴展處理。
第1圖係實施形態1之聲響信號處理裝置的構成圖。首先,QMF解析濾波器組901係將所被輸入的聲響信號轉換成QMF係數X(m,n)。在此,m係表示子頻帶指數,n係表示時槽指數。調整電路902係調整利用轉換所得的QMF係數。以下關於以調整電路902的調整加以說明。式11係將調整前的各QMF係數,使用各自的振幅及相位來予以表現。
[數式10]
X (m ,n )=r (m ,n )‧exp(ja (m ,n )) (式11)
r(m,n)係表示振幅資訊,a(m,n)係表示相位資訊。調整電路902係將相位資訊a(m,n)調整為相位資訊
[數式11]
。調整電路902係藉由調整後的相位資訊與調整前的振幅資訊r(m,n),按照式12來計算新的QMF係數。
[數式12]
最後,QMF合成濾波器組903係將在式12中所計算出的新QMF係數轉換成時間信號。以下關於調整相位資訊的手法加以說明。
在實施形態1中,QMF基礎的時間擴展處理係由以下所示之步驟所構成。亦即,時間擴展處理係由:(1)調整相位資訊的步驟、及(2)根據QMF轉換的加法定理,執行在QMF領域的重疊加算的步驟所構成。
以下係關於時間擴展的說明,將2L取樣的實數值的時間信號以擴展係數s進行時間擴展時之例。QMF解析濾波器組901係將例如2L取樣的實數值的時間信號,轉換成由2L/M個時槽及M個子頻帶所構成的2L個QMF係數。亦即,QMF解析濾波器組901係將2L取樣的實數值的時間信號轉換成合成頻率領域的QMF係數。
以與STFT基礎的時間擴展方法相同的方式,藉由QMF轉換所計算出的QMF係數係在調整相位資訊的前段,容易受到解析窗函數的影響。在實施形態1中,以下列3步驟來實現對QMF係數的轉換。
(1)藉由解析窗函數h(n)(窗長L)被轉換成QMF領域用,計算出QMP領域用的解析窗函數H(v,k)(由L/M個時槽與M個子頻帶所構成)。
(2)所計算出的解析窗函數H(v,k)係藉由下式而簡化。
[數式13]
(3)QMF解析濾波器組901係藉由X(m,k)=X(m,k)‧H0 (w)(在此,w=mod(m,L/M)、mod()係計算出剩餘的運算)而計算出QMF係數。
原本的QMF係數係如第2圖的上段所示以L/M個時槽,由躍程尺寸按每1時槽作重疊的L/M+1個QMF區塊所構成。
調整電路902係為了確實避免相位資訊呈非連續,而將調整前的各QMF區塊的相位資訊進行調整,而構成新的QMF區塊。亦即,當第μ個與第μ+1個QMF區塊相重疊時,新QMF區塊的相位資訊係必須在μ‧s取樣點中確保連續性(s為擴展係數)。此若以時間領域言之,相當於確保跳點μ‧M‧s(μN)中的連續性。
調整電路902係將調整前的各QMF區塊的相位資訊φu(k),由屬於複數的QMF係數X(u,k)(時槽指數u=0,...,2L/M-1,子頻帶指數k=0,1,...,M-1)所計算出。如第2圖的中段所示,調整電路902係將各QMF區塊由時槽由舊到新的順序來進行運算,而生成新的QMF區塊。各QMF區塊係分別以不同的模樣圖示。第2圖係顯示以2時槽份的躍程尺寸錯開的處理的情形。
第n個(n=1,...,L/M+1)新QMF區塊的相位資訊係表現為φu (n) (k)(時槽指數u=0,...,L/M-1,子頻帶指數k=0,1,...,M-1)。新的相位資訊φu (n) (k)係因時間擴展後的新QMF區塊被重新配置在何處而不同。
第1個QMF區塊X(1) (u,k)(u=0,...,L/M-1)被重新配置時,該QMF區塊的新相位資訊φu (1) (k)係與調整前的QMF區塊的相位資訊φu (k)相同。亦即,新的相位資訊φu (1) (k)係以φu (1) (k)=φu (k) (u=0,...,L/M-1,k=0,1,...,M-1)予以計算出。
第2個QMF區塊X(2) (u,k)(u=0,...,L/M-1)係移動s時槽的躍程尺寸而予以重新配置(第2圖係顯示2時槽的情形)。此時,區塊前頭的頻率成分係必須與第1個新QMF區塊X(1 )(u,k)的第s個時槽呈連續。因此,X(2) (u,k)的第1個時槽的頻率成分係與原本的QMF區塊的第2個時槽的頻率成分相一致。亦即,新的相位資訊φu (2) (k)係以φ0 (2) (k)=φ0 (1) (k)+Δφ1 (k)予以計算出。
由於第1個時槽的相位資訊改變,因此剩下的相位資訊亦按照原本的QMF區塊的相位資訊來作調整。亦即,新的相位資訊φu (2) (k)係以φu (2) (k)=φu-1 (2) (k)+Δφu+1 (k)(u=0,...,L/M-1)予以計算出。
在此,Δφu (k)係以Δφu (k)=φu (k)-φu-1 (k)予以計算出,為調整前的QMF區塊的相位差。
調整電路902係將以上過程反覆L/M+1次,生成調整後的QMF區塊。亦即,第m個(m=3,...,L/M+1)新QMF區塊的調整後的相位資訊φu (m) (k)係在式13及式14中予以計算出。
Ψ0 (m) (k)=Ψ0 (m-1) (k)+Δφm-1 (k) (式13)
Ψu (m) (k)=Ψu-1 (m) (k)+Δφm+u-1 (k)(u=1,...,L/M-1)(式14)
調整電路902係在新QMF區塊的振幅資訊使用原本的QMF區塊的振幅資訊,藉此可計算出新QMF區塊的QMF係數。
調整電路902亦可藉由依QMF領域的第偶數個子頻帶與第奇數個子頻帶而異的調整方法,來調整相位資訊。例如,在諧波構造強(音調強)的聲響信號中,係在QMF領域中,相位差資訊(Δφ(n,k)=φ(n,k)-φ(n-1,k))按每個頻率成分而異。此時,調整電路902係藉由式15來決定瞬時頻率成分ω(n,k)。
[數式14]
在此,princarg(α)係表示α的轉換,定義成如式16所示。
princarg(a)=mod(α+π,-2π)+π (式16)
mod(a,b)係表示將a除以b的餘數。
若將該等彙整,上述相位調整方法中的相位差資訊Δφu (k)係藉由式17予以計算出。
[數式15]
此外,QMF合成濾波器組903係為了削減時間擴展處理的運算量,亦可不對新QMF區塊的各個適用QMF合成處理。取而代之,QMF合成濾波器組903係將新QMF區塊作重疊加算,對所得的信號,適用QMF合成處理。
以與STFT基礎的擴展處理相同的方式,藉由QMF轉換所計算出的QMF係數係在進行重疊加算的前階段,容易受到合成窗函數的影響。因此,與上述解析窗函數同樣地,合成窗函數係藉由X(n+1) (u,k)=X(n+1) (u,k)‧H0 (w)(在此為w=mod(u,L/M))來實現。
在QMF轉換中係成立加法定理,因此L/M+1個所有QMF區塊係可以s時槽的躍程尺寸作重疊加算。重疊加算結果的Y(u,k)係以式18予以計算出。
Y(ns+u,k)=Y(ns+u,k)+X(n+1) (u,k)(n=0,...,L/M、u=1,...,L/M,k=0,1,...,M-1) (式18)
QMF合成濾波器組903係藉由在上述Y(u,k)適用QMF合成濾波器,而可生成最終時間擴展後的聲響信號。可對原本的信號施行s倍的時間擴展處理,由Y(u,k)的時間指數u的範圍亦可明顯得知。
如上述式12所示,在實施形態1中,調整電路902係在QMF領域進行相位調整及振幅調整。至此亦如所述所示,QMF解析濾波器組901係將按每個單位時間作區分的聲響信號以QMF濾波器逐次轉換成QMF係數(QMF區塊)。接著,調整電路902係以按照預先指定的擴展率(s倍,例如s=2,3,4等)而保持每個相鄰QMF區塊的相位及振幅的連續性的方式,來調整各QMF區塊的振幅及相位。藉此實現相角音碼器處理。
QMF合成濾波器組903係將在QMF領域作相角音碼器處理的QMF係數轉換成時間領域的信號。藉此,可得被擴展成s倍的時間領域的聲響信號。此外,藉由時間擴展處理的後段的信號處理,QMF係數會有較為方便的情形。例如,亦可對在QMF領域作相角音碼器處理的QMF係數施行根據SBR技術的頻帶擴大處理等任何聲響處理。接著,後段的信號處理之後,QMF合成濾波器組903亦可採取轉換成時間領域之聲響信號的構成。
第3圖所示構成係如上所示之組合之一例。此係將在QMF領域的相角音碼器處理、與聲響信號的頻帶擴大技術加以組合的聲響解碼裝置之一例。以下說明使用相角音碼器處理的聲響解碼裝置的構成。
分離部1201係將輸入的位元流分離成供高域生成之用的參數、及供低域解碼之用的編碼資訊。參數解碼部1207係將供高域生成之用的參數進行解碼。解碼部1202係由供低域解碼之用的編碼資訊,將低域成分的聲響信號進行解碼。QMF解析濾波器組1203係將經解碼的聲響信號轉換成QMF領域的聲響信號。
頻率調變電路1205及時間擴展電路1204係對QMF領域的聲響信號施行前述相角音碼器處理。之後,高域生成電路1206係使用供高域生成之用的參數來生成高域頻率成分的信號。等高線調整電路1208係對高域成分的頻率等高線進行調整。QMF合成濾波器組1209係將QMF領域中的低域成分及高域成分的聲響信號轉換成時間領域的聲響信號。
其中,在上述低域成分的編碼處理或解碼處理亦可使用MPEG-AAC方式、MPEG-Layer3等聲響編碼方式,或者亦可使用ACELP等聲音編碼方式。
此外,調整電路902亦可在QMF領域進行相角音碼器處理時,在藉由式12所為之調整後的QMF係數的計算,按每個QMF區塊之子頻帶指數進行加權運算。藉此,調整電路902亦可利用具有按每個子頻帶指數而異的值的調變係數來進行調變。例如,在與高域頻率相對應的子頻帶指數中,會有在擴展時失真變大的聲響信號。調整電路902亦可使用如減小聲響信號的調變係數。
此外,以在QMF領域進行相角音碼器處理的其他構成而言,聲響信號處理裝置亦可在QMF解析濾波器組901的後段另外具備有其他QMF解析濾波器組。僅以QMF解析濾波器組901會有低域的頻率解析力低的情形。此時,即使對包含較多低域成分的聲響信號施行相角音碼器處理,亦未獲得充分的效果。
因此,為了使低域成分的頻率解析力提升,亦可使用供解析低域部分(例如QMF解析濾波器組901的輸出所包含的全QMF區塊的一半)之用的其他QMF解析濾波器組。藉此,頻率解析力會提升為2倍。結果,調整電路902係施行如上所述之在QMF領域的相角音碼器(Phase Vocoder)處理。藉此,在維持音質的情形下,運算量及記憶體消耗量的削減效果會變高。
第4圖係顯示使QMF領域的解析力提升的構成例圖。QMF合成濾波器組2401係暫時以QMF合成濾波器將輸入的聲響信號合成。之後,QMF解析濾波器組2402係以2倍解析度的QMF解析濾波器來計算QMF係數。並列構成對形成為2倍解析力的QMF領域的信號進行2倍的時間擴展、及2倍、3倍或4倍的音高調節處理的相角音碼器處理電路(第1時間擴展電路2403、第2時間擴展電路2404及第3時間擴展電路2405)。
接著,各相角音碼器處理電路係以2倍的解析度,統一進行擴展比例不同的相角音碼器處理。接著,合併電路2406係將經相角音碼器處理的信號合成。
藉由QMF濾波器所為之相角音碼器處理係由上述可知,與STFT基礎的相角音碼器處理相比較,並不需要使用運算量較大的FFT處理。因此,存在有可大幅削減運算量的顯著效果。
(實施形態2)
以實施形態2而言,敘述將藉由實施形態1所記載之區塊基礎所得之時間軸擴展方法加以擴張的形態。實施形態2之聲響信號處理裝置係具備有與第1圖所示實施形態1之聲響信號處理裝置相同的構成要素。接著,為了避免因上述相位資訊的不連續所造成的影響,相位資訊的計算係以下列2種方法來進行。
(a)調整電路902係以在調整後的QMF區塊中,相重疊的時槽的相位資訊在區塊間呈連續的方式調整相位資訊。亦即,調整電路902係藉由φ0 (m) (k)=φ0 (m-1) (k)+Δφm-1 (k)來調整相位資訊。
(b)調整電路902係在調整後的各QMF區塊中,以在區塊內呈連續的時槽間,相位資訊呈連續的方式來調整相位資訊。亦即,調整電路902係藉由φu (m) (k)=φu-1 (m) (k)+Δφm+u-1 (k)(在此,u=1,...,L/M-1)來調整相位資訊。
上述中,相位資訊的調整方法係假定按照音調較強的成分,相位資訊由調整前的QMF區塊產生變化。
但是,實際上,上述假定並不一定經常正確。典型而言,當原本的信號為在聲響上呈過渡的信號時,上述假定並不正確。過渡信號係在時間領域有尖銳的攻擊音等非固定形式的信號。藉由在相位資訊與頻率成分之間假定一定的關係,可知如下情形。亦即,若離散地大量包含有音調強的成分,而且在短時間間隔的期間包含有間隔大的頻率成分時,會難以處理過渡信號。結果,藉由伸縮處理,會生成具有可感覺的聲響上的失真的輸出信號。
在實施形態2中,為了處理將包含大量過渡信號的信號進行擴展處理時所發生的上述問題,伴隨實施形態1之相位資訊之調整的時間伸縮處理被變形成可與音調強的信號與過渡信號之雙方相對應的時間伸縮處理。
首先,調整電路902係將有可能成為潛在問題的時間伸縮處理除外,因此以QMF領域來檢測過渡信號所包含的過渡成分。
檢測過渡狀態的手法係有各種手法,在為數眾多的文獻中所揭示。在實施形態2中係顯示檢測在QMF區塊之過渡響應的2個簡單手法。
第5A圖係用以關於對藉由QMF轉換所計算出的QMF區塊X(u,k)(2L/M個時槽、M個子頻帶)進行時間擴展的情形加以說明的說明圖。第1個手法係按照每個前述QMF區塊的能量值的變化來檢測過渡狀態的方法,第2個手法係在頻率軸檢測每個QMF區塊的振幅值的變化的方法。
第1個檢測方法係如下所示。調整電路902係如第5B圖所示,按各QMF區塊的每個時槽來計算能量值E0 ~E2L/M-1 。第5C圖係顯示每個子頻帶的能量值的圖。調整電路902係按每個時槽將能量值的差分計算為dEu =Eu+1 -Eu (在此,u=0,...,2L/M-2)。藉由預定的臨限值T0 ,若為
[數式16]
的情形,在第i個時槽中檢測過渡成分。
第2個檢測方法係如下所示。QMF區塊所包含的所有時槽及子頻帶的振幅為A(u,k)時,關於各時槽,振幅資訊的等高線被計算為:
[數式17]
。若藉由預定的臨限值T1 與T2 ,Fi >T1
[數式18]
時,則在第i個時槽中檢測過渡成分。
若在第u0 個時槽檢測到過渡成分時,上述相位資訊的擴展處理係對包含第u0 個時槽的新QMF區塊予以修正。
擴展處理的修正係有2個目的。其一係為了在任意相位資訊擴展處理中,避開第u0 個時槽的處理。另一者係為了在假設第u0 個時槽未被作任何處理而予以略過時,保持QMF區塊內及QMF區塊間的連續性。為了達成該等2個目的,前述相位資訊擴展處理係修正成如下所示。
在第m個新QMF區塊(m=2,...,L/M+1)中,其相位φu (m) (k)係如下所示。
(a)若為m<u0 <m+L/M-1的情形,為了擔保在QMF區塊內的相位資訊的連續性,相位φu (m) (k)係以下式予以計算(第6A圖)。
[數式19]
(b)若為m=u0 而且mod(u0 ,s)=0的情形,為了由任意相位資訊處理來避開第u0 個時槽的處理,相位φ0 (m) (k)係以下式予以計算(第6B圖)。
[數式20]
此外,為了擔保在QMF區塊間之相位資訊的連續性,相位φ1 (m) (k)係以下式予以計算。
[數式21]
(c)若為m=u0 而且mod(u0 ,s)≠0的情形,為了由任意相位資訊處理來避開第u0 個時槽的處理,相位φ0 (m) (k)係以下式予以計算(第6C圖)。
[數式22]
此外,為了擔保在QMF區塊間的相位資訊的連續性,相位φ1 (m) (k)係以下式予以計算。
[數式23]
實際上,由聲響的觀點來看,對上述過渡信號的擴展處理並不理想的情形亦不少。調整電路902亦可取代不對過渡信號進行擴展處理,而在由QMF區塊去除掉過渡信號成分之後再施行擴展處理,對經擴展處理的QMF區塊,送回才剛去除掉的過渡信號。
在第7A圖及第7B圖係顯示上述處理。在此,說明藉由QMF轉換所計算出的QMF區塊信號X(u,k)(假定具有L/M個時槽及M個子頻帶)予以時間擴展的情形,而且以上述過渡信號檢測方法在第u0 個時槽檢測出過渡信號的情形。各區塊的時間擴展係以下列步驟予以實施。
(1)調整電路902係由QMF區塊去除第u0 個時槽成分,將所取出的第u0 個時槽進行填塞“0”或作“內挿”處理。
(2)調整電路902係將新QMF區塊的信號按照上述擴展方法而擴展至s‧L/M個時槽。
(3)調整電路902係將在上述(1)中所去除的時槽的信號,插入在以上述(2)作擴展後的區塊的位置(第s‧u0 個時槽的位置)。
在此,上述手法亦為第s‧u0 個時槽非為對過渡響應成分之適當位置時的單純例。此係由於QMF轉換的時間解析力較低之故。
為了實現更為高音質的時間擴展電路,必須將上述單純化之例加以擴張。接著,必須要有過渡響應成分的正確位置。實際上,QMF領域的若干資訊、例如振幅資訊及相位遷移資訊等係有用於用以特定過渡響應成分的正確位置。
過渡響應成分的位置(以下稱為過渡位置)係以藉由檢測各QMF區塊的信號的振幅成分及相位遷移資訊之各個的2個步驟來作特定為佳。說明僅在t0 時刻存在脈衝(impulse)成分的情形。脈衝成分係過渡響應成分的典型例。
首先,調整電路902係藉由在QMF頻帶計算出各QMF區塊的振幅資訊,來進行過渡位置t0 的粗略推定。
若考慮到上述QMF轉換的手續,可知如下情形。亦即,由於進行解析窗處理,因此脈衝成分係跨及QMF領域的複數時槽而造成影響。藉由解析該等時槽的振幅值分布,可知存在有以下2個情形。
(1)若第n0 個時槽具有較高能量(振幅值的平方)時,調整電路902係作為(n0 -5)‧64-32<t0 <(n0 -5)‧64+32來推定過渡位置t0
(2)若第n0 -1個與第n0 個時槽為大致相同能量時,調整電路902係作為t0 =(n0 -5)‧64-32來推定過渡位置t0
(n0-5)係表示在QMF解析濾波器組901使其延遲5個時槽份。此外,上述(2)的情形下,調整電路902係可僅藉由振幅解析來正確決定過渡位置。
接著,上述(1)的情形下,調整電路902係可藉由使用QMF頻帶的相位資訊,而更有效率地決定過渡位置t0
以下,說明對第n0 個時槽內的相位資訊φ(n0 ,k)(k=0,1,...,M-1)進行解析的情形。以2π作巡迴(round)的相位資訊φ(n0 ,k)的遷移比例係必須在過渡位置t0 、與最接近過渡位置t0 的左(在時間上為過去)時槽、或者第n0 個時槽的中間位置之間具有完全線性關係。亦即,成立k‧Δt=C0 -g0 。在此,相位遷移比例為
[數式24]
unwrap(P)係使弧度相位P以2π作巡迴,而修正π以上之變化的函數。C0 為常數。
Δt係過渡位置t0 、與最接近過渡位置t0 的左(在時間上為過去)時槽、或者第n0 個時槽的距離。亦即,Δt係藉由式19予以計算出。
[數式25]
上述參數之例係藉由式20所示之值。
[數式26]
第8圖係顯示位於過渡位置t0 與QMF相位遷移比例g0 之間的線性關係圖。如第8圖所示,只要n0 (能量最高的時槽的指數)為固定,則t0 與g0 係以一對一相對應。
根據上述,說明其他例。此係在QMF領域中,在正在進行時間擴展處理的期間處理過渡成分的手法。若與上述簡易手法相比較,本手法係在以下方面具有優點。亦即,本手法係可正確檢測原本的信號的過渡位置。此外,本手法亦可連存在經時間擴展的過渡成分的時槽連同適當的相位資訊一起檢測出。本手法的詳細內容記載如下。其中,本手法的順序亦在第9圖中顯示為流程圖。
QMF解析濾波器組901係接收所被輸入的時間信號x(n)(S2001)。QMF解析濾波器組901係由作為時間擴展對象的時間信號x(n),計算QMF區塊X(m,k)(S2002)。在此,X(m,k)的振幅為r(m,k),相位資訊為φ(m,k)。當在該QMF區塊包含過渡成分的信號時,最適時間擴展手法係如下所示。
(a)調整電路902係根據能量分布,藉由式21來檢測存在過渡信號的時槽m0 (S2003)。
[數式27]
(b)調整電路902係推定存在過渡響應的時槽之中過渡響應較為顯著的時槽的相位遷移比例
[數式28]
(S2004)。亦即,調整電路902係推定時槽的相位角ω0 與相位遷移比例
[數式29]
(c)調整電路902係以式22來計算多項式殘差。
[數式30]
(d)調整電路902係按照式23來決定過渡位置t0 (S2005)。
[數式31]
在此,常數K係K=0.0491。
(e)調整電路902係按照式24來決定呈過渡狀態的領域(S2006)。
[數式32]
調整電路902係使用純量值,在呈過渡狀態的領域內,按照式25來減小QMF係數(S2007)。
[數式33]
α為小的值,例如α=0.001。
(f)調整電路902係對未呈過渡狀態的QMF區塊施行平常的時間擴展處理(S2008)。
(g)調整電路902係如下所示,計算過渡位置s‧t0 中的新的時槽及相位遷移比例。
<i>調整電路902係藉由m1 =ceil((s‧t0 -32)/64)+5來計算出經時間擴展的時槽指數m1 (S2009)。在此,ceil係四捨五入成最為接近的整數的處理。
<ii>調整電路902係按照式26來計算過渡位置、與新時槽最為接近的左(在時間上為過去)的位置的距離。
Δt1 =s‧t0 -(m1 -5)‧64+32 (式26)
<iii>調整電路902係以式27來計算新的相位遷移比例。
[數式34]
(h)調整電路902係將過渡響應顯著的時槽m1 下的QMF係數重新合成。
時槽m1 的振幅係繼承擴展前的時槽m0 的振幅。調整電路902根據新的相位遷移比例與相位差,藉由式28來計算出相位資訊(S2010)。
[數式35]
接著,調整電路902係以式29來計算出新的QMF係數(S2011)。
[數式36]
(i)調整電路902係以式30來決定新的過渡領域(S2013)。[數式37]
(j)在重新決定的過渡領域[數式38]
中包含有複數時槽時,調整電路902係藉由式31而將該等時槽的相位重新調整(S2015)。[數式39]
接著,調整電路902係按照式32而將由如上所示所調整的時槽所構成的QMF區塊係數重新合成。[數式40]
最後,調整電路902係輸出經時間擴展處理的QMF區塊(S2012)。
以運算量的觀點來看,為了檢測過渡位置所執行的上述(a)~(d)亦可直接利用時間領域下的過渡響應檢測手法來置換。例如,用以在時間領域檢測過渡位置的過渡位置檢測部(未圖示)被配置在QMF解析濾波器組901的前段。接著,以在時間領域下的過渡響應檢測手法而言為典型的順序係如下所示。
(1)過渡位置檢測部係將時間信號x(n)=(n=0,1,...,N‧L0 -1)分割成長度L0 的N個區段。
(2)過渡位置檢測部係將各區段的能量計算為如下所示。
[數式41]
(3)過渡位置檢測部係將全體區段的能量按照E1t (i)=α‧E1t (i-1)+(1-α)‧Es (i)來計算。
(4)若Es (i)/E1t (i)>R1 ,Es (i)>R2 ,則過渡位置檢測部係判斷第i個區段係包含有過渡響應成分的過渡區段。在此,R1 及R2 係預定的臨限值。
(5)過渡位置檢測部係藉由t0 =(i+0.5)‧L0 計算出過渡區段的正中位置來作為最終過渡位置的概算位置。
若使用時間領域的過渡成分檢測,第9圖的流程圖係變更成如第10圖所示。
其中,與實施形態1同樣地,亦可為將實施形態2之聲響信號處理與QMF領域下之其他聲響處理加以組合的構成。例如,QMF解析濾波器組901係將按每個單位時間作區隔的聲響信號以QMF濾波器逐次轉換成QMF係數(QMF區塊)。接著,調整電路902係以按照預先指定的擴展率(s倍,例如s=2,3,4等)來保持相鄰每個QMF區塊的相位及振幅的連續性的方式,調整各QMF區塊的振幅及相位。藉此,實現相角音碼器處理。
QMF合成濾波器組903係將在QMF領域經相角音碼器處理的QMF係數轉換成時間領域的信號。藉此可得被擴展為s倍的時間領域的聲響信號。此外,藉由時間擴展處理的後段的信號處理,會有QMF係數較為方便的情形。例如,亦可對在QMF領域經相角音碼器處理的QMF係數施行根據SBR技術的頻帶擴大處理等任何聲響處理。接著,在後段的信號處理之後,QMF合成濾波器組903亦可採取轉換成時間領域之聲響信號的構成。
第3圖所示之構成係如上所示之組合之一例。此係將在QMF領域的相角音碼器處理、與聲響信號的頻帶擴大技術加以組合之聲響解碼裝置之一例。以下說明使用相角音碼器處理的聲響解碼裝置的構成。
分離部1201係將輸入的位元流分離成供高域生成之用的參數與供低域解碼之用的編碼資訊。參數解碼部1207係將供高域生成之用的參數進行解碼。解碼部1202係由供低域解碼之用的編碼資訊將低域成分的聲響信號進行解碼。QMF解析濾波器組1203係將經解碼的聲響信號轉換成QMF領域的聲響信號。
頻率調變電路1205及時間擴展電路1204係對QMF領域的聲響信號施行前述相角音碼器處理。之後,高域生成電路1206係使用供高域生成之用的參數而生成高域頻率成分的信號。等高線調整電路1208係調整高域成分的頻率等高線。QMF合成濾波器組1209係將QMF領域中的低域成分及高域成分的聲響信號轉換成時間領域的聲響信號。
其中,在上述低域成分的編碼處理或解碼處理係可使用MPEG-AAC方式、MPEG-Layer3等聲響編碼方式,或者亦可使用ACELP等聲音編碼方式。
此外,以QMF領域進行相角音碼器處理的其他構成而言,聲響信號處理裝置亦可在QMF解析濾波器組901的後段另外具備有其他QMF解析濾波器組。若僅以QMF解析濾波器組901,會有低域的頻率解析力低的情形。此時,即使對包含較多低域成分的聲響信號施行相角音碼器處理,亦無法獲得充分效果。
因此,為了使低域成分的頻率解析力提升,亦可使用用以解析低域部分(例如QMF解析濾波器組901的輸出所包含的全QMF區塊的一半)的其他QMF解析濾波器組。藉此,頻率解析力提升為2倍。此外,調整電路902係施行如上所述在QMF領域的相角音碼器處理。藉此,在維持音質的情形下,直接提高運算量及記憶體消耗量的削減效果。
第4圖係顯示使QMF領域的解析力提升的構成例圖。QMF合成濾波器組2401係將輸入的聲響信號暫時以QMF合成濾波器加以合成。之後,QMF解析濾波器組2402係以2倍解析度的QMF解析濾波器來計算QMF係數。對已形成為2倍分解析度的的QMF領域的信號,並列構成進行2倍的時間擴展、及進行2倍、3倍或4倍的音高調節處理的相角音碼器處理電路(第1時間擴展電路2403、第2時間擴展電路2404及第3時間擴展電路2405)。
接著,各相角音碼器處理電路係以2倍的解析度,統一進行擴展比例不同的相角音碼器處理。接著,合併電路2406係將經相角音碼器處理的信號加以合成。
其中,實施形態2之聲響信號處理裝置亦可具備如下所示之構成。
調整電路902亦可按照輸入的聲響信號的音調(聲響調波構造的大小)與聲響信號的過渡特性而靈活調整。調整電路902亦可藉由在QMF領域的係數檢測過渡信號,來調整相位資訊。調整電路902亦可以確保相位資訊之連續性的方式,而且以QMF領域的係數的過渡信號成分不會變化的方式來調整相位資訊。調整電路902係亦可將與避開時間伸縮的過渡信號成分相關連的QMF係數,恢復成將過渡信號成分作擴展或壓縮的QMF係數,藉此調整相位資訊。
聲響信號處理裝置亦可另外具備有:檢測輸入信號之過渡特性的檢測部、及施行將藉由檢測部所檢測出的過渡成分減弱的處理的衰減器。衰減器係被配備在調整相位的前段。調整電路902係在時間擴展處理後,將已施行減弱處理的過渡成分擴張。衰減器亦可藉由調整頻率領域的係數的振幅值,來減弱過渡成分。
調整電路902亦可針對經時間擴展的過渡成分,使頻率領域的振幅增加,來調整相位,藉此將經時間擴展的過渡成分擴張。
(實施形態3)
實施形態3之聲響信號處理裝置係對所被輸入的聲響信號進行QMF轉換,對QMF係數進行相位調整及振幅調整,藉此實現時間擴展及頻率調變處理。
實施形態3之聲響信號處理裝置係具備有與第1圖所示實施形態1之聲響信號處理裝置相同的構成要素。QMF解析濾波器組901係將輸入的聲響信號轉換成QMF係數X(m,n)。調整電路902係調整QMF係數。調整前的QMF係數X(m,n)係使用振幅及相位,表現成如式33所示。[數式42]X (m ,n )=r (m,n )‧exp(ja (m ,n )) (式33)相位資訊a(m,n)係利用調整電路902予以調整而成為下式:[數式43]
。調整電路902係藉由調整後的相位資訊與原本的振幅資訊r(m,n),按照式34來計算新QMF係數。[數式44]
最後,QMF合成濾波器組903係將以式34所計算出的新QMF係數轉換成時間信號。其中,實施形態3之聲響信號處理裝置亦可未施行QMF合成濾波器,而將新QMF係數直接照原樣輸出至後段的其他聲響信號處理裝置。後段的聲響信號處理裝置係例如執行根據SBR技術的聲響信號處理等。
與實施形態1不同之處在於,如第11圖所示,若時間擴展係數為s,在原本的QMF頻帶的時槽之後被插入(s-1)個假想時槽。
此時,調整電路902係必須維持原本的聲響信號的音高。此外,調整電路902係必須以避開聽感上的音質劣化的方式來計算出相位資訊。例如,若將原本的QMF區塊的相位資訊設為φn (k)(時槽指數n=1,...,L/M、子頻帶指數k=0,1,...,M-1)時,調整電路902係以式35來計算上述假想時槽中之調整後的新的相位資訊。
Ψq (k)=Ψq-1 (k)+Δφn (k)(q=s‧(n-1)+1,...,s‧n、n=1,...,L/M) (式35)在此,與實施形態1同樣地,計算出相位差Δφn (k)=φn (k)-φn-1 (k)。此外,相位差Δφn (k)亦可以式36來計算出。[數式45]
所被挿入的時槽的振幅資訊係利用以在所挿入的交界部呈連續的方式,將在前的時槽與在後的時槽之間作線性補充(內挿)的值所構成。例如,若將原本的QMF區塊設為an (k),所被挿入的假想時槽的振幅資訊係藉由式37予以線性補充。[數式46]
QMF合成濾波器組903係將藉由如上所示插入假想時槽所構成的新QMF區塊與實施形態1同樣地轉換成時間領域的信號。藉此,計算出作時間擴展的信號。其中,如上所述,實施形態3之聲響信號處理裝置亦可未施行QMF合成濾波器組,而將新QMF係數直接照原樣輸出至後段的聲響信號處理裝置。實施形態3之聲響信號處理裝置亦未使用FFT運算,與STFT基礎的相角音碼器處理相比,以壓倒性少的運算量來實現同等的效果。
(實施形態4)
實施形態4之聲響信號處理裝置係對所被輸入的聲響信號,進行QMF轉換,且對QMF係數進行相位調整。接著,實施形態4之聲響信號處理裝置係藉由按每一個子頻帶來處理原本的QMF區塊,藉此實現時間擴展處理。實施形態4之聲響信號處理裝置係具備有與第1圖所示實施形態1之聲響信號處理裝置相同的構成要素。QMF解析濾波器組901係將輸入的聲響信號轉換成QMF係數X(m,n)。調整電路902係調整QMF係數。調整前的QMF係數X(m,n)係使用振幅及相位而表現成如式38所示。
[數式47]X (m ,n )=r (m ,n )‧exp(ja (m ,n )) (式38)相位資訊a(m,n)係以調整電路902予以調整,而成為下式:[數式48]。調整電路902係藉由調整後的相位資訊與原本的振幅資訊r(m,n),按照式39來計算新的QMF係數。[數式49]
最後,QMF合成濾波器組903係將在式39所計算出的新QMF係數轉換成時間信號。其中,實施形態4之聲響信號處理裝置亦可未施行QMF合成濾波,而將新QMF係數直接照原樣輸出至後段的其他聲響信號處理裝置。後段的聲響信號處理裝置係例如執行根據SBR技術的聲響信號處理等。
在QMF轉換係會有將所被輸入的聲響信號轉換成具有時間特性的合成頻率領域的作用。因此,STFT基礎的時間擴展手法亦可適用於QMF區塊的時間特性。
與實施形態1不同之處在於,如第12圖所示,將原本的QMF區塊按每個子頻帶進行時間擴展。原本的QMF區塊係由L/M個時槽與M個子頻帶所構成。各QMF區塊由M個純量值所構成,各純量值係將經時資訊以L/M個的係數構成。
在實施形態4中,STFT基礎的時間擴展手法係對各子頻帶的純量值直接適用。亦即,調整電路902係將各子頻帶的純量值進行連續FFT轉換,調整相位資訊,而施行逆FFT。藉此,調整電路902係計算新的子頻帶的純量值。其中,該時間擴展處理由於按每個子頻帶來執行,因此運算量並不大。
例如,若時間擴展係數為2時(將聲響信號擴展為2倍的時間時),調整電路902係按每個躍程尺寸Ra 而反覆上述的處理。結果,實現原本的QMF區塊的子頻帶包含2‧L/M個係數的時間擴展。調整電路902係藉由反覆上述步驟,可將原本的QMF區塊轉換成2倍長度的QMF區塊。
QMF合成濾波器組903係將如此所得之新QMF區塊與時間信號加以合成。藉此,實施形態4之聲響信號處理裝置係可將原本的時間信號作時間擴展成具有其2倍長度的時間信號。其中,在此,將實施形態4之聲響信號處理方法稱為子頻帶基礎的時間擴展手法。
以上,根據複數個實施形態來敘述使用3個不同手法的時間擴展處理。表1係將該等運算量(複雜性評估:Complexity Measurement)的大小加以整理的比較表。
可知3個時間擴展手法的運算量均比古典STFT基礎的時間擴展手法為非常少。此係基於若以STFT基礎的時間擴展手法,係進行以內部進行迴圈的處理之故。在QMF基礎中並未進行如上所示之迴圈處理。
(實施形態5)
在實施形態5中,與實施形態1~4相同地,實現在QMF領域的時間擴展。不同之處在於,如第13圖所示,在QMF領域調整QMF係數之處。
QMF解析濾波器組1001係為了實現時間伸縮及頻率調變之雙方,而將輸入聲響信號轉換成QMF係數。接著,調整電路1002係與實施形態1~4同樣地,進行所得QMF係數的相位調整。
接著,QMF頻帶轉換器1003係將經調整的QMF係數轉換成新QMF係數。帶通濾波器1004係視需要而在QMF領域實施頻帶限制。頻帶限制係在使折返失真減低時為所需。最後,QMF合成濾波器組1005係將新QMF係數轉換成時間領域的信號。
其中,實施形態5之聲響信號處理裝置亦可未施行QMF合成濾波,而將新QMF係數直接照原樣輸出至後段的其他聲響信號處理裝置。後段的聲響信號處理裝置係執行例如根據SBR技術的聲響信號處理等。以上為實施形態5的概要。
第14圖所示之構成係藉由將QMF頻帶的相位及振幅進行轉換處理,來實現設為對象的聲響信號的時間伸縮處理及頻率調變處理的構成。
首先,QMF解析濾波器組1801為了實現時間伸縮及頻率調變之雙方,而將聲響信號轉換成QMF係數。頻率調變電路1803係對如此所得的QMF係數,在QMF領域實施頻率調變處理。屬於帶通濾波器的頻帶限制濾波器1802在頻率調變處理前,有為了去除折返失真而施加頻帶限制的情形。
接著,頻率調變電路1803係將相位轉換處理及振幅轉換處理對複數QMF區塊連續適用,藉此進行頻率調變處理。接著,時間擴展電路1804係進行藉由頻率調變處理所生成的QMF係數的時間伸縮處理。時間伸縮處理係以與實施形態1等相同的方法來實現。
其中,雖然被記載有頻率調變電路1803與時間擴展電路1804依序作連接的構成,但是該等接續順序並非侷限於此。亦即,亦可在時間擴展電路1804執行時間伸縮處理之後,由頻率調變電路1803施行頻率調變處理。
最後,QMF合成濾波器組1805係將已施行頻率調變處理與時間伸縮處理的QMF係數轉換成新的聲響信號。新的聲響信號係與原本的聲響信號作比較,而形成為朝時間軸方向及頻率軸方向作伸縮的信號。
其中,第14圖所示之聲響信號處理裝置亦可未施行QMF合成濾波,而將新QMF係數直接照原樣輸出至後段的其他聲響信號處理裝置。後段的聲響信號處理裝置係執行例如根據SBR技術的聲響信號處理等。在實施形態1~4中係顯示時間擴展方法。實施形態5之聲響信號處理裝置的構成係在該等實施形態之聲響信號處理裝置的構成加上藉由音高擴展處理所為之頻率調變處理的構成。用以將時間或頻率調整成理想狀態有幾種手法。但是,古典音高擴展處理,亦即將經時間擴展的信號作重新取樣(抽減)的方法若照原樣並無法適用在頻率調變處理。
第14圖所示之聲響信號處理裝置係在藉由QMF解析濾波器組1801所為之處理之後,在QMF領域上實現音高擴展處理。藉由QMF解析濾波器組1801的處理,時間領域的預定的信號成分(特定頻率中的正弦波成分)會成為2個不同的QMF子頻帶的信號。因此,之後,由1個QMF係數區塊,針對頻率與振幅之雙方,將正確的信號成分作分離而進行音高轉換乃極為困難。
因此,實施形態5之聲響信號處理裝置亦可變形成音高擴展處理在更早之前實施的構成。亦即,如第15圖所示,形成為在QMF解析濾波器組的前段,將時間領域的輸入信號重新取樣的構成。在第15圖中,重新取樣部500將聲響信號重新取樣,QMF解析濾波器組504將聲響信號轉換成QMF係數,時間擴展電路505調整QMF係數。
第15圖所示之重新取樣部500係由以下3個模組所構成。亦即,重新取樣部500係具備有:(1)M倍的升頻取樣部501、(2)用以抑制折返失真的低通濾波器502、及(3)D倍的減頻取樣部503。亦即,重新取樣部500係在QMF解析濾波器組504的處理之前,將輸入的原信號重新取樣成係數M/D倍。藉此,重新取樣部500係將全體的QMF領域的頻率成分形成為M/D倍。
若需要複數次音高擴展處理時,例如需要2倍與3倍之雙方的音高擴展處理時,以以下所示之處理為最佳。為了使不同倍率的重新取樣處理整合,需要有具有按照各自的重新取樣處理而不同的延遲量的複數延遲電路。該等延遲電路係在合成被音高擴展處理成2倍或3倍的輸出信號之前,先實施時間調整。
以下說明將包含低域的信號,藉由2倍或3倍的音高擴展處理,將頻率頻帶擴張的情形。為了實現該情形,聲響信號處理裝置係先實施重新取樣處理。第16A圖係顯示經音高擴展處理的輸出的圖。第16A圖的縱軸表示頻率軸,橫軸表示時間軸。
聲響信號處理裝置係藉由重新取樣處理,生成包含低域的信號(第16A圖的最粗黑線)的2倍(第16A圖的粗黑線)及3倍(第16A圖的淺黑線)音高擴展處理後的信號。若在時間領域發生偏移,則在2倍的音高擴展處理信號會有d0 時間的延遲時間,在3倍的音高擴展處理信號會有d1 時間的延遲時間。
聲響信號處理裝置係為了獲得高頻帶的信號,而將原本的信號、具有2倍頻率頻帶的信號、及具有3倍頻率頻帶的信號分別作時間擴展為2倍、3倍及4倍。結果,聲響信號處理裝置係可將該等信號的合成信號如第16B圖所示生成為高頻帶的信號。其中,若發生時間偏移,如第16C圖所示,延遲量的不一致亦直接照原樣被音高擴展,因此在高頻帶信號亦會有發生埋延量不一致的問題的情形。上述複數延遲電路係以減低時間偏移的方式來實施時間調整。亦可照原樣實施上述重新取樣方法。但是,為了更加削減上述處理的運算量,低通濾波器502亦可藉由多相濾波器組來實現。若低通濾波器502的次數較高時,為了削減運算量,亦可根據折疊原理,而在FFT領域實現低通濾波器502。
此外,若M/D<1.0,亦即藉由音高擴展處理而使音高變高時,後段的QMF解析濾波器組504與時間擴展電路505中的運算量會大於重新取樣處理所需的處理量。因此,藉由更換時間擴展及重新取樣處理的順序,使運算量削減。
此外,在第15圖中,重新取樣部500被設在QMF解析濾波器組504的前段。此係基於為了將當對特定音源(例如單一正弦波等)施行音高擴展處理時所發生的音質劣化防止成最小限度之故。在QMF解析濾波器組504的處理後再實施音高調節處理時,原本的聲響信號所包含的正弦波信號會形成為被分離成複數QMF區塊的狀態。因此,若對該信號施行音高調節處理,原本的正弦波信號會擴散至多數QMF區塊。
亦即,對於單一正弦波等特殊音源,若以上述構成進行重新取樣處理者為佳。但是,在一般聲響信號的音高調節處理僅輸入單一正弦波,係幾乎等同沒有。因此,成為運算量增大要因的重新取樣處理亦可予以省略。
此外,聲響信號處理裝置亦可為對藉由QMF解析濾波器組504所得之QMF係數直接施行音高擴展處理的構成。在該構成的情形下,經施行音高擴展處理的聲響信號的品質,若為單一正弦波等特殊音源,會有稍微差劣的情形。但是,具有如上所示構成的聲響信號處理裝置係可對除此之外的一般聲響信號保持充分的品質。鑑於該情形,藉由省略重新取樣處理,而省略處理量非常大的處理部。因此,全體的處理量被削減。
接著,聲響信號處理裝置亦可配合適用用途,而以適當組合來構成。
(實施形態6)
實施形態6之聲響信號處理裝置係與實施形態5相同,進行在QMF領域的時間伸縮及頻率調變處理。在實施形態6中未使用在實施形態5中所使用的重新取樣處理,即為與實施形態5不同之處。實施形態6之聲響信號處理裝置係具備有第13圖所示之聲響信號處理裝置之構成要素。
第13圖所示之聲響信號處理裝置係進行時間伸縮處理及頻率調變處理之雙方。因此,QMF解析濾波器組1001係將聲響信號轉換成QMF係數。接著,調整電路1002係將所得QMF係數如實施形態1~4之記載所示進行相位調整。
接著,QMF領域轉換器1003係將經調整的QMF係數轉換成新QMF係數。帶通濾波器1004係視需要在QMF領域實施頻帶限制。頻帶限制係必須在使折返失真減低時進行。最後,QMF合成濾波器組1005係將新QMF係數轉換成時間領域的信號。
其中,實施形態6之聲響信號處理裝置亦可未施行QMF合成濾波,而將新QMF係數直接照原樣輸出至後段的其他聲響信號處理裝置。後段的聲響信號處理裝置係例如執行根據SBR技術的聲響信號處理等。以上為實施形態6的全體構成。
實施形態6之聲響信號處理裝置係關於藉由音高擴展處理所為之頻率調變處理,進行與實施形態5不同的處理。
為了將音高進行伸縮而藉此施行頻率調變處理,將時間領域的聲響信號重新取樣的手法乃為非常單純。但是,為了抑制折返失真所需之低通濾波器在構成上乃為必須。因此,因低通濾波器而發生延遲。一般而言,為了提高重新取樣處理的精度,必須要有次數較大的低通濾波器。另一方面,若次數較大,則濾波器的延遲會變大。
因此,第17圖所示之實施形態6之聲響信號處理裝置係具備有在QMF領域轉換係數構成的QMF領域轉換器603。接著,藉由QMF領域轉換器603,執行與重新取樣處理不同的音高調節處理。
QMF解析濾波器組601係由輸入的時間信號計算QMF係數。與實施形態1~5同樣地,時間擴展電路602係將所計算出的QMF係數進行時間擴展。QMF領域轉換器603係對經時間擴展的QMF係數施行音高擴展處理。
如第18圖所示,QMF領域轉換器603係未重新使用QMF合成濾波器及QMF解析濾波器,將某QMF領域的QMF係數直接轉換成頻率及時間的解析力分別不同的其他QMF領域的QMF係數。如第18圖所示,QMF領域轉換器603係可將由M個子頻帶及L/M個時槽所構成的某QMF區塊,轉換成由N個子頻帶與L/N個時槽所構成的新QMF區塊。
QMF領域轉換器603係可改變時槽數及子頻帶數。接著,該輸出信號的時間及頻率的解析力係由輸入信號予以變更。因此,為了同時實現時間擴展處理及音高擴展處理之雙方,必須計算出新的時間擴展係數。例如,若將所希望的時間擴展係數設為s,將所希望的音高擴展係數設為w,則新的時間擴展係數係以
[數式50]
予以計算。
第17圖係顯示實現時間擴展處理與音高擴展處理之雙方的構成圖。其中,第17圖所示之聲響信號處理裝置係以時間擴展處理(時間擴展電路602)與音高擴展處理(QMF領域轉換器603)的順序所構成。但是,聲響信號處理裝置亦可為先進行音高擴展處理,之後再進行時間擴展處理的構成。在此,假設有L個輸入取樣。
QMF解析濾波器組601係由L個取樣計算出由M個子頻帶及L/M個時槽所構成的QMF區塊。時間擴展電路602係由如上所示所計算出的QMF區塊的各QMF係數,計算出由M個子頻帶及
[數式51]
個時槽所構成的QMP區塊。最後,QMF領域轉換器603係將經擴展的QMF區塊轉換成由w‧M個子頻帶及s‧L/M個時槽所構成的其他QMF區塊(若w>1.0,最小的M個子頻帶會成為最後的輸出信號)。
QMF領域轉換器603的處理係相當於將QMF合成濾波器組及QMF解析濾波器組的運算處理作數學上的壓縮。聲響信號處理裝置係形成為當使用QMF合成濾波器組及QMF解析濾波器組來進行運算時,在內部包含延遲電路的構成。與其相比,具備有QMF頻帶轉換器603的聲響信號處理裝置係可削減運算延遲及運算量。例如,聲響信號處理裝置係當將子頻帶指數為Sk (k=0,...,M-1)的子頻帶轉換成子頻帶指數S1 (1=0,...,wM-1)時,執行式40的計算。
[數式52]
在此,PM 與PwM 係分別表示QMF解析濾波器組與QMF合成濾波器組的原型函數。
接著,關於音高調節處理之其他例加以敘述。與上述所述之音高調節處理不同,聲響信號處理裝置係如下所示來進行處理。
(a)聲響信號處理裝置係將擴展處理前的QMF區塊所包含的信號的頻率成分進行檢測。
(b)聲響信號處理裝置係藉由預定的轉換係數來將頻率移位。供頻率移位之用的單純方法係將前述轉換係數乘以輸入信號的音高的方法。
(c)聲響信號處理裝置係構成所希望的移位頻率成分下的新QMF區塊。
聲響信號處理裝置係對藉由QMF轉換所被計算出的QMF區塊,藉由式41來計算信號的頻率成分ω(n,k)。
[數式53]
在此,princarg(α)係表示α中的基礎頻率。此外,Δφ(n,k)係Δφ(n,k)=φ(n,k)-φ(n-1,k),表示同一子頻帶k中的2個QMF成分的相位差。
所希望的擴展後的基礎頻率係使用轉換係數P0 (假定P0 >1),作為P0 ‧ω(n,k)予以計算。
音高的擴展及壓縮(一併稱為移位)的本質在於將所希望的頻率成分建構在移位後的QMF區塊上。音高調節處理係如第19圖所示,亦可以下列步驟予以實現。
(a)首先,聲響信號處理裝置係將移位後的QMF區塊初期化(S1301)。聲響信號處理裝置係將所有QMF區塊中的相位φ(n,k)及振幅r1 (n,k)設定為0。
(b)接著,聲響信號處理裝置係將子頻帶反覆轉換係數P0 份,藉此決定子頻帶的交界(S1302)。若為P0 >1,聲響信號處理裝置為了避免折返失真,將較低者的子頻帶交界k1b 作為k1b =0而進行計算,將較高者的子頻帶交界kub 作為kub =floor(M/P0 )而進行計算。
此係因為所有頻率成分均被包含在
[數式54]
之故。
(c)聲響信號處理裝置係對位於[,kub ]的第j個子頻帶,將移位處理後的頻率P0 ‧ω(n,j)映射在指數q(n)=round(P0 ‧ω(n,j))(S1305)。
(d)聲響信號處理裝置係重新建構新的區塊(n,q(n))的相位及振幅(S1306)。在此,聲響信號處理裝置係藉由式42來計算新的振幅。
[數式55]
函數F()容後詳述。
聲響信號處理裝置係藉由式43來計算新的相位。
[數式56]
在此,前提為“包含”df(n)=P0 ‧ω(n,j)-q(n)及φ(n,q(n))的調整。聲響信號處理裝置係加算複數次2π,俾以保證-π≦φ(n,q(n))<π。
(e)聲響信號處理裝置係將關於所希望的頻率成分P0 ‧ω(n,j)的子頻帶指數
[數式57]
映射在藉由式44所計算出的子頻帶(S1307)。
[數式58]
(f)聲響信號處理裝置係重新建構新的區塊
[數式59]
的相位及振幅(S1308)。接著,聲響信號處理裝置係藉由式45而計算出新的振幅。
[數式60]
函數F()容後詳述。
聲響信號處理裝置係藉由式46來計算新的相位。
[數式61]
前提為“包含”
[數式62]
的調整。聲響信號處理裝置係加算複數次2π,俾以保證
[數式63]
(g)聲響信號處理裝置在暫時處理[k1b ,kub ]的範圍所包含的所有子頻帶信號之後,由於P0 >1,因此會有新QMF區塊所包含的值成為“0”的情形。聲響信號處理裝置係對如上所示之區塊,將各自的相位資訊以成為“非0”的方式進行線性補充。此外,聲響信號處理裝置係根據相位資訊來補充各自的振幅(S1310)。
(h)聲響信號處理裝置係將新QMF區塊的振幅及相位資訊轉換成複係數的區塊信號(S1311)。
關於上述振幅調整及補充,在此省略說明。該等雙方係相關於在QMF領域中的信號的頻率成分與振幅之間的關係性之故。
正弦的音調強的信號係如上述(c)及(e)所示,也許會發生2個不同的QMF子頻帶的信號成分。其解析結果,該等2個子頻帶中的振幅的關係係依據QMF解析濾波器組(QMF轉換)的原型濾波器。
例如,QMF解析濾波器組(QMF轉換)係以在MPEGSurround及HE-AAC方式所使用的濾波器組為前提。第20A圖係顯示原型濾波器p(n)(濾波器長640取樣)的振幅響應的圖。為了大致完全達成重新建構性,該振幅響應係在頻率[-0.5,0.5]的外側急遽衰減。以該原型濾波器為基準,具有M個頻帶數的複QMF解析濾波器組的係數係定義為:
[數式64]
此時,複濾波器組係在第k個子頻帶中,以頻率中央成為k+1/2的方式所構成。第20B圖係顯示被抽減的頻率響應的圖。為方便起見,第k-1個子頻帶的振幅特性係在第20B圖的左側以折線表示,第k+1個子頻帶的振幅特性係在第20B圖的右側以折線表示。
如第20B圖所示,在頻率f0 (k-1≦f0 <k+1)的成分中,若為0<df=f0 -(k+1/2)<1,則分別提供第k個與第k+1個子頻帶的2個區塊。此外,若為-1<df=f0 -(k+1/2)<0,則提供第k-1個與第k個子頻帶的2個區塊(參照上述(e))。與其相對應的振幅係依據頻率f0 與第k個子頻帶的中央頻率的差、及子頻帶濾波器的振幅。
子頻帶的振幅F(df)係在-1≦df<1中呈對稱的函數,以
[數式65]
來表示。
2個區塊以相同頻率存在,因此該等相位差係必須滿足下式
[數式66]
。(參照上述(f))
由以上可知,振幅的補充處理並非應該作為線性補充來處理。取而代之,在信號的頻率成分與振幅資訊之間的關係應如上所述。
如上所述,在實施形態6中係進行在QMF領域的相位調整及振幅調整。至此亦如所述所示,聲響信號處理裝置係將按每個單位時間所被區分的聲響信號以QMF濾波器組逐次轉換成QMF領域的係數(QMF區塊)。接著,音響信號處理裝置係以按照預先指定的擴展率(s倍,例如s=2,3,4等)來保持相鄰的每個QMF區塊的相位及振幅的連續性的方式來調整各QMF區塊的振幅及相位。藉此,聲響信號處理裝置係實現相角音碼器處理。
聲響信號處理裝置係將在QMF領域作相角音碼器處理的QMF係數利用QMF合成濾波器組而轉換成時間領域的信號。藉此,可得擴展成s倍的時間領域的聲響信號。此外,會有在後段的其他聲響信號處理裝置使用QMF係數的情形。在如上所示之情形下,後段的其他聲響信號處理裝置亦可對在QMF領域作相角音碼器處理的QMF區塊的係數,施行根據SBR技術的頻帶擴大處理等任何聲響處理。接著,如上所示之後段的其他聲響信號處理裝置亦可利用QMF合成濾波器組而將QMF係數轉換成時間領域的聲響信號。
第3圖所示之構成係該組合之一例。此係將在QMF領域的相角音碼器處理與聲響信號的頻帶擴大技術加以組合的聲響解碼裝置之一例。以下說明使用相角音碼器處理的聲響解碼裝置的構成。
分離部1201係將輸入的位元流分離成供高域生成之用的參數與供低域解碼之用的編碼資訊。參數解碼部1207係將供高域生成之用的參數進行解碼。解碼部1202係由供低域解碼之用的編碼資訊將低域成分的聲響信號進行解碼。QMF解析濾波器組1203係將經解碼的聲響信號轉換成QMF領域的音響信號。
頻率調變電路1205及時間擴展電路1204係對QMF領域的聲響信號施行前述相角音碼器處理。之後,高域生成電路1206係使用供高域生成之用的參數來生成高域頻率成分的信號。等高線調整電路1208係將高域成分的頻率等高線進行調整。QMF合成濾波器組1209係將QMF領域中的低域成分及高域成分的聲響信號轉換成時間領域的聲響信號。
其中,在上述低域成分的編碼處理或解碼處理亦可使用MPEG-AAC方式、MPEG-Layer3等聲響編碼方式,或者可使用ACELP等聲音編碼方式。
此外,當以QMF頻帶進行相角音碼器處理時,關於調變係數r(m,n),亦可按每個QMF區塊的子頻帶指數(m,n)進行加權。藉此,QMF係數係利用按每個子頻帶指數具有不同的值的調變係數予以調變。例如,在與高域頻率相對應的子頻帶指數中,有在擴展時,聲響信號的失真變大的情形。對如上所示之子頻帶指數,使用使擴展比例變小的擴展係數。
此外,以在QMF領域進行相角音碼器處理的其他構成而言,聲響信號處理裝置亦可在QMF解析濾波器組的後段另外具備有其他QMF解析濾波器組。若僅以第1QMF解析濾波器組,會有低域的頻率解析力低的情形。此時,即使對包含較多低域成分的聲響信號施行相角音碼器處理,亦無法獲得充分效果。
因此,為了使低域成分的頻率解析力提升,亦可使用用以解析低域部分(例如第1QMF解析濾波器組的輸出所包含的全QMF區塊的一半)的第2QMF解析濾波器組。藉此,頻率解析力提升為2倍。此外,藉由施行上述在QMF領域的相角音碼器處理,在維持音質的情形下,直接提高運算量及記憶體消耗量的削減效果。
第4圖係顯示使QMF領域的解析力提升的構成例圖。QMF合成濾波器組2401係將輸入的聲響信號暫時以QMF合成濾波器加以合成。之後,QMF解析濾波器組2402係以2倍解析度的QMF解析濾波器來計算QMF係數。對已形成為2倍分解析度的QMF領域的信號,並列構成進行2倍的時間擴展、及進行2倍、3倍或4倍的音高調節處理的相角音碼器處理電路(第1時間擴展電路2403、第2時間擴展電路2404及第3時間擴展電路2405)。
接著,各相角音碼器處理電路係以2倍的解析度,統一進行擴展比例不同的相角音碼器處理。接著,合併電路2406係將經相角音碼器處理的信號加以合成。
關於將至此為止所說明的時間擴展處理及音高擴展處理使用在聲響信號之編碼裝置之例,說明如下。
第21圖係顯示使用時間擴展處理及音高擴展處理來將聲響信號進行編碼的聲響編碼裝置的構成圖。第21圖所示之聲響編碼裝置係將按每個一定數的取樣作分割的聲響信號進行訊框處理。
首先,減頻取樣部1102係將聲響信號進行減頻取樣,藉此生成僅包含低域頻率成分的信號。編碼部1103係將僅包含該低域的聲響信號,使用以MPEG-AAC、MPEG-Layer3或AC3方式等所代表的聲響編碼方式來進行編碼,藉此生成編碼資訊。此外,同時,QMF解析濾波器組1104係將僅包含低域成分的聲響信號轉換成QMF係數。另一方面,QMF解析濾波器組1101係將包含全頻帶成分的聲響信號轉換成QMF係數。
時間擴展電路1105及頻率調變電路1106係將已將僅包含低域成分的聲響信號轉換成QMF領域的信號(QMF係數)調整成如上述複數實施形態所示,而生成高域的假想QMF係數。
參數計算部1107係將上述假想的高域QMF係數、與包含全頻帶成分的QMF係數(實際的QMF係數)作比較,藉此計算出高域成分的等高線資訊。重疊部1108係將所計算出的等高線資訊與編碼資訊相重疊。
第3圖係顯示聲響解碼裝置之構成圖。第3圖所示之聲響解碼裝置係接收以上述音響編碼裝置所編碼的編碼資訊而解碼成聲響信號的裝置。分離部1201係將所接收到的編碼資訊分離成第1編碼資訊與第2編碼資訊。參數解碼部1207係將第2編碼資訊轉換成高域的QMF係數的等高線資訊。另一方面,解碼部1202係由第1編碼資訊,將僅包含低域成分的聲響信號進行解碼。QMF解析濾波器組1203係將經解碼的聲響信號轉換成僅包含低域成分的QMF係數。接著,時間擴展電路1204及頻率調變電路1205係對僅包含該低域成分的QMF係數,如上述複數實施形態所示,將時間及音高進行調整。藉此,生成包含高域成分的假想QMF係數。
等高線調整電路1208及高域生成電路1206係將包含高域成分的假想QMF係數,根據所接收到的第2編碼資訊所包含的等高線資訊來進行調整。QMF合成濾波器組1209係將經調整的QMF係數與低域的QMF係數加以合成。接著,QMF合成濾波器組1209係將所得的合成QMF係數,以QMF合成濾波器轉換成包含低域成分與高域成分之雙方的時間領域的聲響信號。
如上所示,聲響編碼裝置係將時間伸縮比作為編碼資訊來進行傳送。聲響解碼裝置係使用時間伸縮比來將聲響信號進行解碼。藉此,聲響編碼裝置係可按每個訊框使時間伸縮比作各種變化。因此,高域成分的控制變得較為靈活。因此,達成高編碼效率。
第22圖係顯示使用習知的SFTF基礎的時間擴展電路及頻率調變電路的情形、及使用QMF基礎的時間擴展電路及頻率調變電路的情形,進行音質比較實驗的結果的圖。第22圖所示之結果係根據位元率為16kbps、單聲道信號的條件下的實驗。此外,該結果係根據藉由MUSHRA(Multiple Stimuli with Hidden Reference and Anchor)法所為之評估。
在第22圖中,縱軸係表示與STFT方式的音質差,橫軸係表示具有不同的聲響特性的複數音源。由第22圖可知,與SFTF基礎的方式相比較,亦使QMF基礎的方式以大致同等的音質來作編碼及解碼。本實驗中所使用的音源係在編碼及解碼時尤其容易發生劣化的音源。因此可知對於除此之外的一般聲響信號,亦一面具有同等性能,一面進行編碼及解碼。
如上所示,本發明之聲響信號處理裝置係在QMF領域中進行時間擴展處理及音高擴展處理。本發明之聲響信號處理與古典STFT基礎的時間擴展處理及音高擴展處理相比,係使用QMF濾波器予以實現。因此,本發明之聲響信號處理並不需要使用運算量大的FFT,而可以較少的運算量來實現同等的效果。此外,在STFT基礎中,由於需要實施藉由躍程尺寸所為之處理,因此會發生處理延遲。在QMF基礎中,QMF濾波器的處理延遲非常短。因此,本發明之聲響信號處理裝置亦具備有可使處理延遲非常小的優異優點。
(實施形態7)
第23A圖係顯示實施形態7之聲響信號處理裝置的構成圖。第23A圖所示之聲響信號處理裝置係具備有:濾波器組2601及調整部2602。濾波器組2601係進行與第1圖所示之QMF解析濾波器組901等相同的動作。調整部2602係進行與第1圖所示之調整電路902等相同的動作。接著,第23A圖所示之聲響信號處理裝置係使用預定的調整係數來轉換輸入聲響信號列。在此,預定的調整係數係相當於時間伸縮比、頻率調變比、及將該等加以組合的比率的任一者。
第23B圖係顯示第23A圖所示之聲響信號處理裝置的處理的流程圖。濾波器組2601係使用QMF解析濾波器而將輸入聲響信號列轉換成QMF係數列(S2601)。調整部2602係使QMF係數列依據預定的調整係數來進行調整(S2602)。
例如,調整部2602係由經調整的QMF係數列,以可得以預先訂定的時間伸縮比作時間伸縮的輸入聲響信號列的方式,使QMF係數列的相位資訊及振幅資訊依據表示預先訂定的時間伸縮比的調整係數來進行調整。或者,調整部2602係由經調整的QMF係數列,以可得以預先訂定的頻率調變比作頻率調變(音高調節)的輸入聲響信號列的方式,使QMF係數列的相位資訊及振幅資訊依據表示預先訂定的頻率調變比的調整係數來進行調整。
第24圖係顯示第23A圖所示之聲響信號處理裝置之變形例的構成圖。第24圖所示之聲響信號處理裝置係除了第23A圖所示之聲響信號處理裝置以外,另外具備有高域生成部2705及高域補充部2706。此外,調整部2602係具備有:頻帶限制部2701、計算電路2702、調整電路2703及頻帶轉換器2704。
濾波器組2601係將輸入聲響信號列按每個一定時間間隔逐次轉換成QMF係數列,藉此生成每隔一定時間間隔的QMF係數列。計算電路2702係按每隔一定時間間隔所生成的QMF係數列的每個時槽及每個子頻帶,計算出相位資訊及振幅資訊。調整電路2703係使每個時槽及每個子頻帶的相位資訊依據預定的調整係數來進行調整,藉此調整QMF係數列的相位資訊及振幅資訊。
頻帶限制部2701係進行與第14圖所示之頻帶限制濾波器1802相同的動作。亦即,頻帶限制部2701係在QMF係數列調整前,由QMF係數列取出與預先訂定的頻帶寬度相對應的新的QMF係數列。頻帶轉換器2704係進行與第17圖所示之QMF領域轉換器相同的動作。亦即,領域轉換器2704係在QMF係數列調整後,將QMF係數列轉換成時間及頻率的解析力分別不同的新的QMF係數列。
其中,頻帶限制部2701亦可在QMF係數列調整後,由QMF係數列取出與預先訂定的頻帶寬度相對應的新的QMF係數列。此外,領域轉換器2704亦可在QMF係數列調整前,將QMF係數列轉換成時間及頻率的解析力分別不同的新的QMF係數列。
高域生成部2705係進行與第3圖所示之高域生成電路1206相同的動作。亦即,高域生成部2705係由調整後的QMF係數列,使用預先訂定的轉換係數,生成屬於與比與調整前的QMF係數列相對應的頻率頻帶為更高的高頻率頻帶相對應的新的QMF係數列的高域係數列。
高域補充部2706係進行與第3圖所示之等高線調整電路1208相同的動作。亦即,高域補充部2706係將屬於高頻率頻帶中未藉由高域生成部2705來生成高域係數列的頻率頻帶的脫落頻帶的係數,使用屬於與脫落頻帶兩側相鄰接的頻帶的高域係數列來進行補充。
第25圖係顯示實施形態7之聲響編碼裝置的構成圖。第25圖所示之音響編碼裝置係具備有:減頻取樣部2802、第1濾波器組2801、第2濾波器組2804、第1編碼部2803、第2編碼部2807、調整部2806、及重疊部2808。第25圖所示之聲響編碼裝置係進行與第21圖所示之聲響編碼裝置相同的動作。接著,第25圖所示之構成要素係與第21圖所示之構成要素相對應。
亦即,減頻取樣部2802係進行與減頻取樣部1102相同的動作。第1濾波器組2801係進行與QMF解析濾波器組1101相同的動作。第2濾波器組2804係進行與QMF解析濾波器組1104相同的動作。第1編碼部2803係進行與編碼部1103相同的動作。第2編碼部2807係進行與參數計算部1107相同的動作。調整部2806係進行與時間擴展電路1105相同的動作。重疊部2808係進行與重疊部1108相同的動作。
第26圖係顯示第25圖所示之聲響編碼裝置的處理的流程圖。
首先,第1濾波器組2801係使用QMF解析濾波器而將聲響信號列轉換成QMF係數列(S2901)。接著,減頻取樣部2802係藉由將聲響信號列進行減頻取樣,而生成新的聲響信號列(S2902)。接著,第1編碼部2803係將所生成的新的聲響信號列進行編碼(S2903)。接著,第2濾波器組2804係使用QMF解析濾波器而將所生成的新的聲響信號列轉換成第2QMF係數列(S2904)。
接著,調整部2806係使第2QMF係數列依據預定的調整係數來進行調整(S2905)。預定的調整係數係如上所述,係相當於時間伸縮比、頻率調變比、及將該等組合而成的比率的任一者。
接著,第2編碼部2807係藉由將第1QMF係數列與經調整的第2QMF係數列作比較,生成解碼所使用的參數,而將所生成的參數進行編碼(S2906)。接著,重疊部2808係將經編碼的聲響信號列、與經編碼的參數相重疊(S2907)。
第27圖係顯示實施形態7之聲響解碼裝置的構成圖。第27圖所示之聲響解碼裝置係具備有:分離部3001、第1解碼部3007、第2解碼部3002、第1濾波器組3003、第2濾波器組3009、調整部3004及高域生成部3006。第27圖所示之聲響解碼裝置係進行與第3圖所示之聲響解碼裝置相同的動作。接著,第27圖所示之構成要素係與第3圖所示之構成要素相對應。
亦即,分離部3001係進行與分離部1201相同的動作。第1解碼部3007係進行與參數解碼部1207相同的動作。第2解碼部3002係進行與解碼部1202相同的動作。第1濾波器組3003係進行與QMF解析濾波器組1203相同的動作。第2濾波器組3009係進行與QMF合成濾波器組1209相同的動作。調整部3004係進行與時間擴展電路1204相同的動作。高域生成部3006係進行與高域生成電路1206相同的動作。
第28圖係顯示第27圖所示之聲響解碼裝置的處理的流程圖。
首先,分離部3001係由所被輸入的位元流,將經編碼的參數與經編碼的聲響信號列進行分離(S3101)。接著,第1解碼部3007係將經編碼的參數進行解碼(S3101)。接著,第2解碼部3002係將經編碼的聲響信號列進行解碼(S3103)。接著,第1濾波器組3003係使用QMF解析濾波器,將藉由第2解碼部3002所被解碼的聲響信號列轉換成QMF係數列(S3104)。
接著,調整部3004係使QMF係數列依據預定的調整係數來進行調整(S3105)。預定的調整係數係如上所述,相當於時間伸縮比、頻率調變比、及將該等加以組合的比率的任一者。
接著,高域生成部3006係由經調整的QMF係數列,使用經解碼的參數,生成屬於與比與QMF係數相對應的頻率頻帶為更高的高頻率頻帶相對應的新的QMF係數列的高域係數列(S3106)。接著,第2濾波器組3009係使用QMF合成濾波器而將QMF係數列與高域係數列轉換成時間領域的聲響信號列。
第29圖係顯示第27圖所示之聲響解碼裝置之變形例的構成圖。第29圖所示之聲響解碼裝置係具備有:解碼部2501、QMF解析濾波器組2502、頻率調變電路2503、結合部2504、高頻重新建構部2505、及QMF合成濾波器組2506。
解碼部2501係由位元流而將聲響信號進行解碼。QMF解析濾波器組2502係將經解碼後的聲響信號轉換成QMF係數。頻率調變電路2503係對QMF係數施行頻率調變處理。該頻率調變電路2503係具備有第4圖所示之構成要素。如第4圖所示,在頻率調變處理中,以內部執行時間擴展處理。接著,結合部2504係將由QMF解析濾波器組2502所得之QMF係數、及由頻率調變電路2503所得之QMF係數相結合。高頻重新建構部2505係由所結合的QMF係數而將與高域相對應的QMF係數重新建構。QMF合成濾波器組2506係將由高頻重新建構部2505所得之QMF係數轉換成音響信號。
本發明之聲響信號處理裝置與STFT基礎的相角音碼器處理相比,可削減運算量。此外,聲響信號處理裝置係為了在QMF領域輸出信號,而可在SBR技術或Parametric Stereo等參數編碼處理中,解除頻帶轉換的非效率性。接著,聲響信號處理裝置亦可削減領域轉換運算所需之記憶體容量。
以上係根據複數個實施形態來說明本發明之聲響信號處理裝置、聲響編碼裝置及聲響解碼裝置,但是本發明並非限定於該等實施形態。對該等實施形態,該技術領域熟習該項技術者可施行可思及的變形的形態、及將該等實施形態中的構成要素任意組合所實現的其他形態亦被包含在本發明中。
例如,亦可由其他處理部來執行特定的處理部所執行的處理。此外,亦可變更執行處理的順序,亦可並行執行複數的處理。
此外,本發明不僅可作為聲響信號處理裝置、聲響編碼裝置或聲響解碼裝置來加以實現,亦可作為將構成聲響信號處理裝置、聲響編碼裝置或聲響解碼裝置的處理手段作為步驟的方法來加以實現。接著,本發明係可作為使電腦執行該等方法所包含的步驟的程式來加以實現。此外,本發明係可作為記錄有該程式之CD-ROM等電腦可讀取記録媒體來加以實現。
此外,聲響信號處理裝置、聲響編碼裝置或聲響解碼裝置所包含之複數構成要素亦可作為屬於積體電路的LSI(Large Scale Integration)予以實現。該等構成要素係可個別予以1晶片化,亦可以包含一部分或全部的方式予以1晶片化。在此係形成為LSI,但是亦會有因積體度的不同,而被稱為IC(Integrated Circuit)、系統LSI、超級LSI或超LSI的情形。
此外,積體電路化的手法並非侷限於LSI,亦可利用專用電路或通用處理器來實現。亦可利用可程式的FPGA(Field Programmable Gate Array)、或者可將LSI內部的電路單元的連接及設定重新構成的可重新架構處理器(ReConfigurable Processor)。
此外,若藉由半導體技術的進歩或所衍生的其他技術而置換成LSI的積體電路化的技術登場,當然亦可使用該技術,來進行聲響信號處理裝置、聲響編碼裝置或聲響解碼裝置所包含的構成要素的積體電路化。
產業之可利用性
本發明之聲響信號處理裝置係有用於音頻記錄器、音頻播放器、行動電話等。
500...重新取樣部
501...升頻取樣部
502...低通濾波器
503、1102、2802...減頻取樣部
504、601、901、1001、1101、1104、1203、1801、2402、2502...QMF解析濾波器組
505、602、1105、1204、1804...時間擴展電路
603、1003...QMF領域轉換器
902、1002、2703...調整電路
903、1005、1209、1805、2401、2506...QMF合成濾波器組
1004...帶通濾波器
1103...編碼部
1106、1205、1803、2503...頻率調變電路
1107...參數計算部
1108、2808...重疊部
1201、3001...分離部
1202、2501‧‧‧解碼部
1206‧‧‧高域生成電路
1207‧‧‧參數解碼部
1208‧‧‧等高線調整電路
1802‧‧‧頻帶限制濾波器
2403‧‧‧第1時間擴展電路
2404‧‧‧第2時間擴展電路
2405‧‧‧第3時間擴展電路
2406‧‧‧合併電路
2504‧‧‧結合部
2505‧‧‧高頻重新建構部
2601‧‧‧濾波器組
2602、2806、3004‧‧‧調整部
2701‧‧‧頻帶限制部
2702‧‧‧計算電路
2703‧‧‧調整電路
2704‧‧‧領域轉換器
2705、3006‧‧‧高域生成部
2706‧‧‧高域補充部
2801、3003‧‧‧第1濾波器組
2803‧‧‧第1編碼部
2804、3009‧‧‧第2濾波器組
2807‧‧‧第2編碼部
3002‧‧‧第2解碼部
3007‧‧‧第1解碼部
第1圖係顯示實施形態1之聲響信號處理裝置的構成圖。
第2圖係顯示實施形態1之時間擴展處理的說明圖。
第3圖係顯示聲響解碼裝置的構成圖。
第4圖係顯示實施形態1之頻率調變電路的構成圖。
第5A圖係顯示實施形態2之QMF係數區塊的說明圖。
第5B圖係顯示在QMF領域之每個時槽的能量分布圖。
第5C圖係顯示在QMF領域之每個子頻帶的能量分布圖。
第6A圖係顯示對應過渡成分的時間擴展處理的第1模式的說明圖。
第6B圖係顯示對應過渡成分的時間擴展處理的第2模式的說明圖。
第6C圖係顯示對應過渡成分的時間擴展處理的第3模式的說明圖。
第7A圖係顯示實施形態2之過渡成分抽出處理的說明圖。
第7B圖係顯示實施形態2之過渡成分挿入處理的說明圖。
第8圖係顯示過渡位置與QMF相位遷移比例的線性關係圖。
第9圖係顯示實施形態2之時間擴展處理的流程圖。
第10圖係顯示實施形態2之時間擴展處理的變形例的流程圖。
第11圖係顯示實施形態3之時間擴展處理的說明圖。
第12圖係顯示實施形態4之時間擴展處理的說明圖。
第13圖係顯示實施形態5之聲響信號處理裝置的構成圖。
第14圖係顯示實施形態5之聲響信號處理裝置之第1變形例的構成圖。
第15圖係顯示實施形態5之聲響信號處理裝置之第2變形例的構成圖。
第16A圖係顯示藉由重新取樣處理予以音高調節處理後的輸出的圖。
第16B圖係顯示藉由時間擴展處理所被期待的輸出的圖。
第16C圖係顯示藉由時間擴展處理而錯誤輸出的圖。
第17圖係顯示實施形態6之聲響信號處理裝置的構成圖。
第18圖係顯示實施形態6之QMF領域轉換處理的概念圖。
第19圖係顯示實施形態6之頻率調變處理的流程圖。
第20A圖係顯示QMF原型濾波器的振幅響應的圖。
第20B圖係顯示頻率與振幅的關係圖。
第21圖係顯示實施形態6之聲響編碼裝置的構成圖。
第22圖係顯示音質評估的說明圖。
第23A圖係顯示實施形態7之聲響信號處理裝置的構成圖。
第23B圖係顯示實施形態7之聲響信號處理裝置的處理的流程圖。
第24圖係顯示實施形態7之聲響信號處理裝置之變形例的構成圖。
第25圖係顯示實施形態7之聲響編碼裝置的構成圖。
第26圖係顯示實施形態7之聲響編碼裝置的處理的流程圖。
第27圖係顯示實施形態7之聲響解碼裝置的構成圖。
第28圖係顯示實施形態7之聲響解碼裝置的處理的流程圖。
第29圖係顯示實施形態7之聲響解碼裝置之變形例的構成圖。
第30A圖係顯示時間擴展處理前之聲響信號之狀態的說明圖。
第30B圖係顯示時間擴展處理後之聲響信號之狀態的說明圖。
第31圖係顯示QMF解析處理及QMF合成處理的說明圖。
2601...濾波器組
2602...調整部

Claims (22)

  1. 一種聲響信號處理裝置,係按照預定的時間伸縮比及預定的頻率調變比中至少一者而將輸入聲響信號列進行轉換的聲響信號處理裝置,其具備:濾波器組,係使用QMF(Quadrature Mirror Filter)解析濾波器,將前述輸入聲響信號列轉換成QMF係數列者;及調整部,對每個前述QMF係數列的時槽及每個子頻帶算出前述QMF係數列的相位資訊及振幅資訊,且對每個前述時槽及每個前述子頻帶使用調整係數來調整前述相位資訊及前述振幅資訊,以便從前述QMF係數列得到以前述預定的時間伸縮比作時間伸縮之前述輸入聲響信號列,或者得到以前述預定的頻率調變比作頻率調變之前述輸入聲響信號列,該調整係數顯示前述預定的時間伸縮比及前述預定的頻率調變比中至少一者。
  2. 如申請專利範圍第1項之聲響信號處理裝置,其中,前述調整部係由前述相位資訊及前述振幅資訊調整後之前述QMF係數列,以可獲得以前述預定的時間伸縮比作時間伸縮的前述輸入聲響信號列的方式,依據表示前述預定的時間伸縮比的前述調整係數,來調整前述相位資訊及前述振幅資訊。
  3. 如申請專利範圍第1項之聲響信號處理裝置,其中,前述調整部係由前述相位資訊及前述振幅資訊調整後的前述QMF係數列,以可獲得以前述預定的頻率調變比作 頻率調變的前述輸入聲響信號列的方式,依據表示前述預定的頻率調變比的前述調整係數,來調整前述相位資訊及前述振幅資訊。
  4. 如申請專利範圍第1項至第3項中任一項之聲響信號處理裝置,其中,前述濾波器組係將前述輸入聲響信號列按每個時間間隔逐次轉換成前述QMF係數列,藉此生成每隔前述時間間隔的前述QMF係數列,前述調整部係具備有:計算電路,按每個前述時間間隔所生成的前述QMF係數列的每個前述時槽及每個前述子頻帶計算出前述相位資訊;及調整電路,使每個前述時槽及每個前述子頻帶的前述相位資訊依據前述調整係數來進行調整。
  5. 如申請專利範圍第4項之聲響信號處理裝置,其中,前述調整電路係按每個前述子頻帶,使依據前述QMF係數列的最初時槽的前述相位資訊、與前述調整係數所計算出的值,加上每個前述時槽的前述相位資訊,藉此調整每個前述時槽的前述相位資訊。
  6. 如申請專利範圍第4項之聲響信號處理裝置,其中,前述計算電路係進一步按每個前述時間間隔所生成的前述QMF係數列的每個前述時槽及每個前述子頻帶來計算出前述振幅資訊,前述調整電路係進一步使每個前述時槽及每個前述子頻帶的前述振幅資訊依據前述調整係數來進行調 整。
  7. 如申請專利範圍第1項至第3項中任一項之聲響信號處理裝置,其中,前述調整部係進一步具備有頻帶限制部,其係在前述相位資訊及前述振幅資訊調整前或調整後,由前述QMF係數列取出與預先訂定的頻帶寬度相對應的新的QMF係數列。
  8. 如申請專利範圍第1項至第3項中任一項之聲響信號處理裝置,其中,前述調整部係將調整前述相位資訊及前述振幅資訊的比例按每個前述子頻帶作加權,且按每個前述子頻帶調整前述相位資訊及前述振幅資訊。
  9. 如申請專利範圍第1項至第3項中任一項之聲響信號處理裝置,其中,前述調整部係進一步具備有領域轉換器,其在前述相位資訊及前述振幅資訊調整前或調整後,將前述QMF係數列轉換成時間及頻率的解析力不同的新的QMF係數列。
  10. 如申請專利範圍第1項至第3項中任一項之聲響信號處理裝置,其中,前述調整部係由前述相位資訊及前述振幅資訊調整前的前述QMF係數列檢測過渡成分,將所檢測出的前述過渡成分由前述相位資訊及前述振幅資訊調整前的前述QMF係數列取出,調整所取出的前述過渡成分,將經調整的前述過渡成分恢復成前述相位資訊及前述振幅資訊調整後的前述QMF係數列,藉此調整前述QMF係數列。
  11. 如申請專利範圍第1項至第3項中任一項之聲響信號處 理裝置,其中,前述聲響信號處理裝置係進一步具備有:高域生成部,由前述相位資訊及前述振幅資訊調整後的前述QMF係數列,使用預先訂定的轉換係數,生成高域係數列,該高域係數列是對應於高頻率頻帶的新的QMF係數列,該高頻率頻帶比與前述相位資訊及前述振幅資訊調整前的前述QMF係數列相對應的頻率頻帶更高;及高域補充部,使用屬於與脫落頻帶的兩側相鄰接的頻帶的前述高域係數列,來補充前述脫落頻帶的係數,該脫落頻帶是於前述高頻率頻帶之中,未藉由前述高域生成部來生成前述高域係數列的頻率頻帶。
  12. 一種聲響編碼裝置,係將第1聲響信號列進行編碼的聲響編碼裝置,其具備:第1濾波器組,使用QMF(Quadrature Mirror Filter)解析濾波器,將前述第1聲響信號列轉換成第1QMF係數列;減頻取樣部,藉由將前述第1聲響信號列進行減頻取樣,而生成第2聲響信號列;第1編碼部,將前述第2聲響信號列進行編碼;第2濾波器組,使用QMF解析濾波器,將前述第2聲響信號列轉換成第2QMF係數列;調整部,對每個前述第2QMF係數列的時槽及每個子頻帶算出前述第2QMF係數列的相位資訊及振幅資訊,且對每個前述時槽及前述每個子頻帶使用調整係數 來調整前述相位資訊及前述振幅資訊,以便從前述第2QMF係數列得到以預定的時間伸縮比作時間伸縮之前述第2聲響信號列、或者得到以預定的頻率調變比作頻率調變之前述第2聲響信號列,該調整係數顯示前述預定的時間伸縮比及前述預定的頻率調變比中至少一者;第2編碼部,藉由將前述第1QMF係數列與前述相位資訊及前述振幅資訊調整後的前述第2QMF係數列作比較,生成解碼所使用的參數,來對前述參數進行編碼;及重疊部,將經編碼的前述第2聲響信號列、及經編碼的前述參數加以重疊。
  13. 一種聲響解碼裝置,係由所被輸入的位元流,將第1聲響信號列進行解碼的聲響解碼裝置,其具備:分離部,由所被輸入的前述位元流,分離成經編碼的參數與經編碼的第2聲響信號列;第1解碼部,將經編碼的前述參數進行解碼;第2解碼部,將經編碼的前述第2聲響信號列進行解碼;第1濾波器組,使用QMF(Quadrature Mirror Filter)解析濾波器,將藉由前述第2解碼部所被解碼的前述第2聲響信號列轉換成QMF係數列;調整部,對每個前述QMF係數列的時槽及每個子頻帶算出前述QMF係數列的相位資訊及振幅資訊,且對每個前述時槽及每個前述子頻帶使用調整係數來調整前 述相位資訊及前述振幅資訊,以便從前述QMF係數列得到以預定的時間伸縮比作時間伸縮之前述第2聲響信號列、或者得到以預定的頻率調變比作頻率調變之前述第2聲響信號列,該調整係數顯示前述預定的時間伸縮比及前述預定的頻率調變比中至少一者;高域生成部,使用經解碼的前述參數,由前述相位資訊及前述振幅資訊調整後的前述QMF係數列,生成高域係數列,該高域係數列是對應於高頻率頻帶的新的QMF係數列,該高頻率頻帶比與前述相位資訊及前述振幅資訊調整前的前述QMF係數列相對應的頻率頻帶更高;及第2濾波器組,使用QMF合成濾波器,將前述高域係數列、及前述相位資訊及前述振幅資訊調整前的前述QMF係數列轉換成時間領域的前述第1聲響信號列。
  14. 一種聲響信號處理方法,係按照預定的時間伸縮比及預定的頻率調變比中至少一者,將輸入聲響信號列進行轉換的聲響信號處理方法,其包含:轉換步驟,使用QMF(Quadrature Mirror Filter)解析濾波器,將前述輸入聲響信號列轉換成QMF係數列;及調整步驟,對每個前述QMF係數列的時槽及每個子頻帶算出前述QMF係數列的相位資訊及振幅資訊,且對每個前述時槽及每個前述子頻帶使用調整係數來調整前述相位資訊及前述振幅資訊,以便從前述QMF係數列得到以前述預定的時間伸縮比作時間伸縮之前述輸入 聲響信號列、或者得到以前述預定的頻率調變比作頻率調變之前述輸入聲響信號列,該調整係數顯示前述預定的時間伸縮比及前述預定的頻率調變比中至少一者。
  15. 一種聲響編碼方法,係將第1聲響信號列進行編碼的聲響編碼方法,其包含:第1轉換步驟,使用QMF(Quadrature Mirror Filter)解析濾波器,將前述第1聲響信號列轉換成第1QMF係數列;減頻取樣步驟,藉由將前述第1聲響信號列進行減頻取樣,生成第2聲響信號列;第1編碼步驟,將前述第2聲響信號列進行編碼;第2轉換步驟,使用QMF解析濾波器,將前述第2聲響信號列轉換成第2QMF係數列;調整步驟,對每個前述第2QMF係數列的時槽及每個子頻帶算出前述第2QMF係數列的相位資訊及振幅資訊,且對每個前述時槽及每個前述子頻帶使用調整係數來調整前述相位資訊及前述振幅資訊,以便從前述第2QMF係數列得到以預定的時間伸縮比作時間伸縮之前述第2聲響信號列,或者得到以預定的頻率調變比作頻率調變之前述第2聲響信號列,該調整係數顯示前述預定的時間伸縮比及前述預定的頻率調變比中至少一者;第2編碼步驟,將前述第1QMF係數列與前述相位資訊及前述振幅資訊調整後的前述第2QMF係數列作比較,藉此生成解碼所使用的參數,而將前述參數進行編 碼;及重疊步驟,將經編碼的前述第2聲響信號列與經編碼的前述參數進行重疊。
  16. 一種聲響解碼方法,係由所被輸入的位元流,將第1聲響信號列進行解碼的聲響解碼方法,其包含:分離步驟,由所被輸入的前述位元流,分離成經編碼的參數與經編碼的第2聲響信號列;第1解碼步驟,將經編碼的前述參數進行解碼;第2解碼步驟,將經編碼的前述第2聲響信號列進行解碼;第1轉換步驟,使用QMF(Quadrature Mirror Filter)解析濾波器,將藉由前述第2解碼步驟所被解碼的前述第2聲響信號列轉換成QMF係數列;調整步驟,對每個前述QMF係數列的時槽及每個子頻帶算出前述QMF係數列的相位資訊及振幅資訊,且對每個前述時槽及每個前述子頻帶使用調整係數來調整前述相位資訊及前述振幅資訊,以便從前述QMF係數列得到以預定的時間伸縮比作時間伸縮之前述第2聲響信號列,或者得到以預定的頻率調變比作頻率調變之前述第2聲響信號列,該調整係數顯示前述預定的時間伸縮比及前述預定的頻率調變比中至少一者;高域生成步驟,使用經解碼的前述參數,由前述相位資訊及前述振幅資訊調整後的前述QMF係數列,生成屬於與比與前述相位資訊及前述振幅資訊調整前的前 述QMF係數列相對應的頻率頻帶更高的高頻率頻帶相對應的新的QMF係數列的高域係數列;及第2轉換步驟,使用QMF合成濾波器,將前述高域係數列、及前述相位資訊及前述振幅資訊調整前的前述QMF係數列轉換成時間領域的前述第1聲響信號列。
  17. 一種程式,係用以使如申請專利範圍第14項之聲響信號處理方法所包含的步驟執行於電腦的程式。
  18. 一種程式,係用以使如申請專利範圍第15項之聲響信號處理方法所包含的步驟執行於電腦的程式。
  19. 一種程式,係用以使如申請專利範圍第16項之聲響信號處理方法所包含的步驟執行於電腦的程式。
  20. 一種積體電路,係按照預定的時間伸縮比及預定的頻率調變比中至少一者,來轉換輸入聲響信號列的積體電路,其具備:濾波器組,使用QMF(Quadrature Mirror Filter)解析濾波器,將前述輸入聲響信號列轉換成QMF係數列;及調整部,對每個前述QMF係數列的時槽及每個子頻帶算出前述QMF係數列的相位資訊及振幅資訊,且對依每個前述時槽及每個前述子頻帶使用調整係數來調整前述相位資訊及前述振幅資訊,以便從前述QMF係數列得到以前述預定的時間伸縮比作時間伸縮之前述輸入聲響信號列,或者得到以前述預定的頻率調變比作頻率調變之前述輸入聲響信號列,該調整係數顯示前述預定的時間伸縮比及前述預定的頻率調變比中至少一者。
  21. 一種積體電路,係將第1聲響信號列進行編碼的積體電路,其具備:第1濾波器組,使用QMF(Quadrature Mirror Filter)解析濾波器,將前述第1聲響信號列轉換成第1QMF係數列;減頻取樣部,藉由將前述第1聲響信號列進行減頻取樣而生成第2聲響信號列;第1編碼部,將前述第2聲響信號列進行編碼;第2濾波器組,使用QMF解析濾波器,將前述第2聲響信號列轉換成第2QMF係數列;調整部,對每個前述第2QMF係數列的時槽及每個子頻帶算出前述第2QMF係數列的相位資訊及振幅資訊,且對每個前述時槽及每個前述子頻帶使用調整係數來調整前述相位資訊及前述振幅資訊,以便從前述第2QMF係數列得到以預定的時間伸縮比作時間伸縮之前述第2聲響信號列,或者得到以預定的頻率調變比作頻率調變之前述第2聲響信號列,該調整係數顯示前述預定的時間伸縮比及前述預定的頻率調變比中至少一者;第2編碼部,將前述第1QMF係數列與前述相位資訊及前述振幅資訊調整後的前述第2QMF係數列作比較,藉此生成解碼所使用的參數,來對前述參數進行編碼;及重疊部,將經編碼的前述第2聲響信號列與經編碼的前述參數加以重疊。
  22. 一種積體電路,係由所被輸入的位元流,將第1聲響信號列進行解碼的積體電路,其具備:分離部,由所被輸入的前述位元流,分離成經編碼的參數與經編碼的第2聲響信號列;第1解碼部,將經編碼的前述參數進行解碼;第2解碼部,將經編碼的前述第2聲響信號列進行解碼;第1濾波器組,使用QMF(Quadrature Mirror Filter)解析濾波器,將藉由前述第2解碼部所被解碼的前述第2聲響信號列轉換成QMF係數列;調整部,對每個前述QMF係數列的時槽及每個子頻帶算出前述QMF係數列的相位資訊及振幅資訊,且對每個前述時槽及每個前述子頻帶使用調整係數來調整前述相位資訊及前述振幅資訊,以便從前述QMF係數列得到以預定的時間伸縮比作時間伸縮之前述第2聲響信號列,或者得到以預定的頻率調變比作頻率調變之前述第2聲響信號列,該調整係數顯示前述預定的時間伸縮比及前述預定的頻率調變比中至少一者;高域生成部,使用經解碼的前述參數,由前述相位資訊及前述振幅資訊調整後的前述QMF係數列,生成高域係數列,該高域係數列是對應於高頻率頻帶的新的QMF係數列,該高頻率頻帶比與前述相位資訊及前述振幅資訊調整前的前述QMF係數列相對應的頻率頻帶更高;及 第2濾波器組,使用QMF合成濾波器,將前述高域係數列、及前述相位資訊及前述振幅資訊調整前的前述QMF係數列轉換成時間領域的前述第1聲響信號列。
TW099135730A 2009-10-21 2010-10-20 A sound signal processing device, a sound coding device, and a sound decoding device TWI509596B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2009242603 2009-10-21
JP2010005282 2010-01-13
JP2010059784 2010-03-16

Publications (2)

Publication Number Publication Date
TW201137859A TW201137859A (en) 2011-11-01
TWI509596B true TWI509596B (zh) 2015-11-21

Family

ID=43900037

Family Applications (1)

Application Number Title Priority Date Filing Date
TW099135730A TWI509596B (zh) 2009-10-21 2010-10-20 A sound signal processing device, a sound coding device, and a sound decoding device

Country Status (6)

Country Link
US (1) US9026236B2 (zh)
EP (2) EP2704143B1 (zh)
JP (1) JP5422664B2 (zh)
CN (1) CN102257567B (zh)
TW (1) TWI509596B (zh)
WO (1) WO2011048792A1 (zh)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MY152376A (en) * 2010-03-09 2014-09-15 Fraunhofer Ges Forschung Improved magnitude response and temporal alignment in phase vocoder based bandwidth extension for audio signals
JP5807453B2 (ja) * 2011-08-30 2015-11-10 富士通株式会社 符号化方法、符号化装置および符号化プログラム
EP2631906A1 (en) * 2012-02-27 2013-08-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Phase coherence control for harmonic signals in perceptual audio codecs
JP2014041240A (ja) * 2012-08-22 2014-03-06 Pioneer Electronic Corp タイムスケーリング方法、ピッチシフト方法、オーディオデータ処理装置およびプログラム
JP6289507B2 (ja) 2013-01-29 2018-03-07 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ エネルギー制限演算を用いて周波数増強信号を生成する装置および方法
TWI546799B (zh) * 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
US9514761B2 (en) 2013-04-05 2016-12-06 Dolby International Ab Audio encoder and decoder for interleaved waveform coding
US9609451B2 (en) * 2015-02-12 2017-03-28 Dts, Inc. Multi-rate system for audio processing
CN106297813A (zh) * 2015-05-28 2017-01-04 杜比实验室特许公司 分离的音频分析和处理
US9613628B2 (en) 2015-07-01 2017-04-04 Gopro, Inc. Audio decoder for wind and microphone noise reduction in a microphone array system
CN106454449A (zh) * 2016-10-25 2017-02-22 深圳芯智汇科技有限公司 主音箱、从音箱及路由器控制同步播放音频的方法
CN108429713B (zh) * 2017-02-13 2020-06-16 大唐移动通信设备有限公司 一种数据压缩方法及装置
EP3382700A1 (en) 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for post-processing an audio signal using a transient location detection
EP3382701A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for post-processing an audio signal using prediction based shaping
US10726828B2 (en) * 2017-05-31 2020-07-28 International Business Machines Corporation Generation of voice data as data augmentation for acoustic model training
US20190074805A1 (en) * 2017-09-07 2019-03-07 Cirrus Logic International Semiconductor Ltd. Transient Detection for Speaker Distortion Reduction
CN111093302B (zh) * 2019-11-26 2023-05-12 深圳市奋达科技股份有限公司 音箱灯光控制方法和音箱
US11317203B2 (en) * 2020-08-04 2022-04-26 Nuvoton Technology Corporation System for preventing distortion of original input signal
TWI763207B (zh) * 2020-12-25 2022-05-01 宏碁股份有限公司 聲音訊號處理評估方法及裝置
US20230143318A1 (en) * 2021-11-09 2023-05-11 Landis+Gyr Innovations, Inc. Sampling rate converter with line frequency and phase locked loops for energy metering

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5073938A (en) * 1987-04-22 1991-12-17 International Business Machines Corporation Process for varying speech speed and device for implementing said process
WO1998057436A2 (en) * 1997-06-10 1998-12-17 Lars Gustaf Liljeryd Source coding enhancement using spectral-band replication
US20030182106A1 (en) * 2002-03-13 2003-09-25 Spectral Design Method and device for changing the temporal length and/or the tone pitch of a discrete audio signal
WO2006027038A2 (en) * 2004-09-09 2006-03-16 Fujitsu Siemens Computers, Inc. Computer arrangement for providing services for clients over a network
TW200703237A (en) * 2005-04-01 2007-01-16 Qualcomm Inc Systems, methods, and apparatus for wideband speech coding
TW200828269A (en) * 2006-10-16 2008-07-01 Coding Tech Ab Enhanced coding and parameter representation of multichannel downmixed object coding

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3491425B2 (ja) * 1996-01-30 2004-01-26 ソニー株式会社 信号符号化方法
US7627056B1 (en) * 2002-03-29 2009-12-01 Scientific Research Corporation System and method for orthogonally multiplexed signal transmission and reception on a non-contiguous spectral basis
US7160619B2 (en) 2003-10-14 2007-01-09 Advanced Energy Technology Inc. Heat spreader for emissive display device
KR101117336B1 (ko) 2004-05-19 2012-03-08 파나소닉 주식회사 오디오 신호 부호화 장치 및 오디오 신호 복호화 장치
CA2572805C (en) * 2004-07-02 2013-08-13 Matsushita Electric Industrial Co., Ltd. Audio signal decoding device and audio signal encoding device
TWI317933B (en) 2005-04-22 2009-12-01 Qualcomm Inc Methods, data storage medium,apparatus of signal processing,and cellular telephone including the same
DE602006010323D1 (de) 2006-04-13 2009-12-24 Fraunhofer Ges Forschung Audiosignaldekorrelator
DE602007013026D1 (de) 2006-04-27 2011-04-21 Panasonic Corp Audiocodierungseinrichtung, audiodecodierungseinrichtung und verfahren dafür
US7647229B2 (en) * 2006-10-18 2010-01-12 Nokia Corporation Time scaling of multi-channel audio signals
EP2093757A4 (en) * 2007-02-20 2012-02-22 Panasonic Corp MULTIPLEX DECODING DEVICE, MULTIPLEX DECODING METHOD, PROGRAM, AND SEMICONDUCTOR INTEGRATED CIRCUIT
KR101513028B1 (ko) * 2007-07-02 2015-04-17 엘지전자 주식회사 방송 수신기 및 방송신호 처리방법
CA2699316C (en) 2008-07-11 2014-03-18 Max Neuendorf Apparatus and method for calculating bandwidth extension data using a spectral tilt controlled framing
JP5326465B2 (ja) * 2008-09-26 2013-10-30 富士通株式会社 オーディオ復号方法、装置、及びプログラム
AU2010209673B2 (en) * 2009-01-28 2013-05-16 Dolby International Ab Improved harmonic transposition
PL2545553T3 (pl) * 2010-03-09 2015-01-30 Fraunhofer Ges Forschung Urządzenie i sposób do przetwarzania sygnału audio z użyciem zrównania granicy obszaru

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5073938A (en) * 1987-04-22 1991-12-17 International Business Machines Corporation Process for varying speech speed and device for implementing said process
WO1998057436A2 (en) * 1997-06-10 1998-12-17 Lars Gustaf Liljeryd Source coding enhancement using spectral-band replication
US20030182106A1 (en) * 2002-03-13 2003-09-25 Spectral Design Method and device for changing the temporal length and/or the tone pitch of a discrete audio signal
WO2006027038A2 (en) * 2004-09-09 2006-03-16 Fujitsu Siemens Computers, Inc. Computer arrangement for providing services for clients over a network
TW200703237A (en) * 2005-04-01 2007-01-16 Qualcomm Inc Systems, methods, and apparatus for wideband speech coding
TW200828269A (en) * 2006-10-16 2008-07-01 Coding Tech Ab Enhanced coding and parameter representation of multichannel downmixed object coding

Also Published As

Publication number Publication date
TW201137859A (en) 2011-11-01
EP2704143A3 (en) 2014-04-02
EP2360688B1 (en) 2018-12-05
US20120022676A1 (en) 2012-01-26
CN102257567B (zh) 2014-05-07
JP5422664B2 (ja) 2014-02-19
EP2360688A4 (en) 2013-09-04
WO2011048792A1 (ja) 2011-04-28
CN102257567A (zh) 2011-11-23
US9026236B2 (en) 2015-05-05
EP2360688A1 (en) 2011-08-24
EP2704143B1 (en) 2015-01-07
EP2704143A2 (en) 2014-03-05
JPWO2011048792A1 (ja) 2013-03-07

Similar Documents

Publication Publication Date Title
TWI509596B (zh) A sound signal processing device, a sound coding device, and a sound decoding device
JP7475410B2 (ja) サブバンドブロックに基づく高調波移調の改善
RU2582061C2 (ru) Способ расширения ширины полосы, устройство расширения ширины полосы, программа, интегральная схема и устройство декодирования аудио
KR101341115B1 (ko) 적응식 오버샘플링을 사용하는 고주파수 오디오 신호를 발생시키기 위한 장치 및 방법
JP6672322B2 (ja) オーディオ処理のためのマルチレートシステム
JP2020118996A (ja) 高調波転換
JPH0744193A (ja) 高能率符号化方法
JP2013521536A (ja) オーディオ信号用の位相ボコーダに基づく帯域幅拡張方法における改善された振幅応答及び時間的整列のための装置及び方法
KR101333162B1 (ko) Imdct 입력신호를 이용한 오디오 신호의 음정 및 속도 가변 장치 및 방법
RU2813317C1 (ru) Усовершенствованное гармоническое преобразование на основе блока поддиапазонов
RU2772356C2 (ru) Усовершенствованное гармоническое преобразование на основе блока поддиапазонов
AU2023202547A1 (en) Improved Subband Block Based Harmonic Transposition
Azarov et al. High-quality time stretch and pitch shift effects for speech and audio using the instantaneous harmonic analysis
JP2004518164A (ja) オーディオ信号又はスピーチ信号を符号化するパラメトリック・エンコーダ及び方法
AU2017206142A1 (en) Improved Subband Block Based Harmonic Transposition