TW201535356A - 音訊信號之諧波頻寬延展 - Google Patents

音訊信號之諧波頻寬延展 Download PDF

Info

Publication number
TW201535356A
TW201535356A TW104104441A TW104104441A TW201535356A TW 201535356 A TW201535356 A TW 201535356A TW 104104441 A TW104104441 A TW 104104441A TW 104104441 A TW104104441 A TW 104104441A TW 201535356 A TW201535356 A TW 201535356A
Authority
TW
Taiwan
Prior art keywords
signal
frequency band
extended
low
low frequency
Prior art date
Application number
TW104104441A
Other languages
English (en)
Other versions
TWI559298B (zh
Inventor
Subasingha Shaminda Subasingha
Venkatesh Krishnan
Venkatraman S Atti
Vivek Rajendran
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of TW201535356A publication Critical patent/TW201535356A/zh
Application granted granted Critical
Publication of TWI559298B publication Critical patent/TWI559298B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/81Detection of presence or absence of voice signals for discriminating voice from music
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating

Abstract

本發明揭示一種方法,其包括在一器件處將一輸入音訊信號分成至少一低頻帶信號及一高頻帶信號。該低頻帶信號對應於一低頻帶頻率範圍且該高頻帶信號對應於一高頻帶頻率範圍。該方法亦包括選擇複數個非線性處理函數中之一非線性處理函數。該方法進一步包括基於該低頻帶信號及該非線性處理函數產生一第一延展信號。該方法亦包括基於該第一延展信號、該高頻帶信號或兩者產生至少一個調整參數。

Description

音訊信號之諧波頻寬延展 優先權主張
本申請案主張2014年2月13日申請之題為「音訊信號之諧波頻寬延展(HARMONIC BANDWIDTH EXTENSION OF AUDIO SIGNALS)」的美國臨時申請案第61/939,585號之優先權,該案之全部內容以引用之方式併入。
本發明大體上係關於音訊信號之諧波頻寬延展。
技術的進步已產生更小且更強大的計算器件。舉例而言,當前存在多種攜帶型個人計算器件,包括無線計算器件,諸如攜帶型無線電話、個人數位助理(PDA)及傳呼器件,其體積小,重量輕且易於由使用者攜帶。更具體而言,攜帶型無線電話(諸如,蜂巢式電話及網際網路協定(IP)電話)可經由無線網路傳達語音及資料封包。此外,許多此類無線電話包括併入於其中的其他類型之器件。舉例而言,無線電話亦可包括數位靜態攝影機、數位視訊攝影機、數位記錄器及音訊檔案播放器。
在傳統電話系統(例如,公眾交換電話網路(PSTN))中,信號頻寬限於300赫茲(Hz)至3.4千赫茲(kHz)之頻率範圍。在寬頻(WB)應用(諸如,蜂巢式電話及網際網路語音通信協定(VoIP))中,信號頻寬可橫跨50Hz至7kHz之頻率範圍。超寬頻(SWB)寫碼技術支援延展至大約16 kHz之頻寬。將信號頻寬自3.4kHz下之窄頻電話延展至16kHz之SWB電話可改良信號重建構之品質、可懂度及逼真度。
SWB寫碼技術通常涉及編碼及傳輸信號之較低頻率部分(例如,50Hz至7kHz,亦稱為「低頻帶」)。舉例而言,可使用濾波器參數及/或低頻帶激勵信號表示低頻帶。為了改良寫碼效率,可能不完全編碼及傳輸信號之較高頻率部分(例如,7kHz至16kHz,亦稱為「高頻帶」)。接收器可利用信號模型化以產生合成高頻帶信號。在一些實施中,可將與高頻帶相關聯之資料提供至接收器以協助高頻帶合成。此類資料可被稱作「旁側資訊」,且可包括增益資訊、線譜頻率(LSF,亦被稱作線譜對(LSP))等。可藉由比較高頻帶與源自低頻帶之合成高頻帶信號來產生旁側資訊。舉例而言,合成高頻帶信號可基於低頻帶信號及非線性函數。單一非線性函數可用於針對具有相異特性之多個低頻帶信號產生合成高頻帶信號。對具有相異特性之信號應用相同的非線性函數可導致在某些情況下(例如,話音對音樂)產生低品質合成高頻帶信號。結果,合成高頻帶信號可與高頻帶信號弱相關。
揭示用於音訊信號之諧波頻寬延展的系統及方法。編碼器可使用音訊信號之低頻帶部分產生用於在解碼器處重建構音訊信號之高頻帶部分之資訊(例如,調整參數)。舉例而言,編碼器可基於低頻帶部分之特性延展音訊信號之低頻帶部分。經延展之低頻帶部分可具有大於低頻帶部分之頻寬。編碼器可基於經延展之低頻帶部分及高頻帶部分判定調整參數。
編碼器可使用選定非線性處理函數產生經延展之低頻帶部分。可基於音訊信號之低頻帶部分之特性自複數個非線性處理函數選擇該非線性處理函數。音訊信號可對應於特定音訊訊框或封包。若低頻帶部分指示音訊信號為強週期性的(例如,具有強諧波分量及/或對應於 話音),則信號編碼器可選擇較高階非線性函數。若低頻帶部分指示音訊信號為強雜訊的(例如,對應於音樂),則信號編碼器可選擇較低階非線性函數。編碼器可基於高頻帶與經延展之低頻帶部分之比較判定調整參數。
解碼器可自編碼器接收低頻帶資料及調整參數。解碼器可基於低頻帶資料產生合成低頻帶信號。解碼器可基於合成低頻帶信號及選定非線性處理函數產生合成延展低頻帶部分。解碼器可基於合成延展低頻帶部分及調整參數產生合成高頻帶信號。可藉由在解碼器處組合合成低頻帶信號及合成高頻帶信號來產生輸出信號。
在一特定實施例中,一種方法包括在器件處將輸入音訊信號分成至少一低頻帶信號及一高頻帶信號。低頻帶信號對應於低頻帶頻率範圍且高頻帶信號對應於高頻帶頻率範圍。該方法亦包括選擇複數個非線性處理函數中之一非線性處理函數。該方法進一步包括基於低頻帶信號及非線性處理函數產生第一延展信號。該方法亦包括基於第一延展信號、高頻帶信號或兩者產生至少一個調整參數。
在另一特定實施例中,一種方法包括在器件處接收對應於輸入音訊信號之至少一低頻帶信號之低頻帶資料。該方法亦包括解碼低頻帶資料以產生合成低頻帶音訊信號。該方法進一步包括選擇複數個非線性處理函數中之一非線性處理函數。該方法亦包括基於合成低頻帶音訊信號及非線性處理函數產生合成高頻帶音訊信號。
在另一特定實施例中,一種裝置包括記憶體及處理器。該處理器經組態以將輸入音訊信號分成至少一低頻帶信號及一高頻帶信號。低頻帶信號對應於低頻帶頻率範圍且高頻帶信號對應於高頻帶頻率範圍。該處理器亦經組態以選擇複數個非線性處理函數中之一非線性處理函數。該處理器經進一步組態以基於低頻帶信號及非線性處理函數產生第一延展信號。該處理器亦經組態以基於第一延展信號、高頻帶 信號或兩者產生至少一個調整參數。
在另一特定實施例中,一種裝置包括記憶體及處理器。該處理器經組態以接收對應於輸入音訊信號之至少一低頻帶信號之低頻帶資料。該處理器亦經組態以解碼低頻帶資料以產生合成低頻帶音訊信號。該處理器經進一步組態以選擇複數個非線性處理函數中之一非線性處理函數。該處理器亦經組態以基於合成低頻帶音訊信號及非線性處理函數產生合成高頻帶音訊信號。
在另一特定實施例中,電腦可讀儲存器件儲存當由處理器執行時引起該處理器執行包括將輸入音訊信號分成至少一低頻帶信號及一高頻帶信號之操作的指令。低頻帶信號對應於低頻帶頻率範圍且高頻帶信號對應於高頻帶頻率範圍。該等操作亦包括選擇複數個非線性處理函數中之一非線性處理函數。該等操作進一步包括基於低頻帶信號及非線性處理函數產生第一延展信號。該等操作亦包括基於第一延展信號、高頻帶信號或兩者產生至少一個調整參數。
在另一特定實施例中,電腦可讀儲存器件儲存當由處理器執行時引起該處理器執行包括接收對應於輸入音訊信號之至少一低頻帶信號之低頻帶資料之操作的指令。該等操作亦包括解碼低頻帶資料以產生合成低頻帶音訊信號。該等操作進一步包括選擇複數個非線性處理函數中之一非線性處理函數。該等操作亦包括基於合成低頻帶音訊信號及非線性處理函數產生合成高頻帶音訊信號。
由所揭示之實施例中之至少一者提供的特定優點可包括改良輸出信號之合成高頻帶部分之品質。可藉由使用基於低頻帶部分之音訊特性自多個可用非線性處理函數選擇之非線性函數產生合成高頻帶部分來改良輸出信號之品質。選定非線性函數可改良在話音情況及非話音情況(例如,音樂)兩者下編碼器處之輸入信號之高頻帶部分與解碼器處之輸出信號之合成高頻帶部分之間的相關性。本發明之其他態 樣、優點及特徵將在審閱包括以下章節之申請案之後變得顯而易見:【圖式簡單說明】、【實施方式】及【申請專利範圍】。
100‧‧‧編碼器系統
102‧‧‧輸入音訊信號
106‧‧‧諧波性估計器
108‧‧‧低頻帶編碼器
110‧‧‧分析濾波器組
112‧‧‧信號產生器
114‧‧‧濾波器
116‧‧‧混頻器
118‧‧‧非線性處理函數
122‧‧‧低頻帶信號
124‧‧‧高頻帶信號
168‧‧‧低頻帶參數
170‧‧‧諧波性因子
172‧‧‧第二延展信號
174‧‧‧第三延展信號
176‧‧‧雜訊信號
178‧‧‧調整參數
180‧‧‧函數選擇器
182‧‧‧第一延展信號
190‧‧‧參數估計器
200‧‧‧解碼器系統
206‧‧‧諧波性解碼器
208‧‧‧低頻帶解碼器
210‧‧‧合成濾波器組
216‧‧‧高頻帶信號產生器
218‧‧‧非線性處理函數
222‧‧‧合成低頻帶信號
224‧‧‧合成高頻帶信號
268‧‧‧低頻帶資料
270‧‧‧諧波性因子
272‧‧‧第二延展信號
274‧‧‧第三延展信號
276‧‧‧雜訊信號
278‧‧‧輸出音訊信號
282‧‧‧第一延展信號
300‧‧‧系統
400‧‧‧執行音訊信號之諧波頻寬延展的方法
500‧‧‧執行音訊信號之諧波頻寬延展的方法
600‧‧‧無線通信器件
610‧‧‧處理器
622‧‧‧系統單晶片器件
626‧‧‧顯示控制器
628‧‧‧顯示器
630‧‧‧輸入器件
632‧‧‧記憶體
634‧‧‧編解碼器
636‧‧‧揚聲器
638‧‧‧麥克風
640‧‧‧無線控制器
642‧‧‧天線
644‧‧‧電源供應器
660‧‧‧指令
690‧‧‧編碼器
692‧‧‧解碼器
圖1為說明可操作以執行音訊信號之諧波頻寬延展的編碼器系統之一特定實施例的圖;圖2為可操作以執行音訊信號之諧波頻寬延展的解碼器系統之另一特定實施例的圖;圖3為可操作以執行音訊信號之諧波頻寬延展的系統之另一特定實施例的圖;圖4為說明執行音訊信號之諧波頻寬延展的方法之一特定實施例的流程圖;圖5為說明執行音訊信號之諧波頻寬延展的方法之另一特定實施例的流程圖;及圖6為可操作以根據圖1至圖5之系統及方法執行信號處理操作之無線器件的方塊圖。
參看圖1,展示可操作以執行音訊信號之諧波頻寬延展的編碼器系統之特定實施例的圖,且將該系統大體上標示為100。在一特定實施例中,編碼器系統100可整合至編碼(或解碼)系統或裝置中(例如,無線電話或寫碼器/解碼器(CODEC)中)。在其他實施例中,編碼器系統100可整合至機上盒、音樂播放器、視訊播放器、娛樂單元、導航器件、通信器件、個人數位助理(PDA)、固定位置資料單元或電腦中。
應注意,在以下描述中,由圖1之編碼器系統100執行之各種功能經描述為由某些組件或模組執行。組件及模組之此劃分僅為了說明目的且並不被認為係限制性的。在一替代實施例中,由特定組件或模 組執行之功能可在多個組件或模組中劃分。此外,在一替代實施例中,圖1之兩個或兩個以上組件或模組可整合成單一組件或模組。可使用硬體(例如,場可程式化閘陣列(FPGA)器件、特殊應用積體電路(ASIC)、數位信號處理器(DSP)、控制器等)、軟體(例如,可由處理器執行之指令)或其任何組合實施圖1中所說明之每一組件或模組。
編碼器系統100包括耦接至低頻帶編碼器108之分析濾波器組110、諧波性估計器106、信號產生器112及參數估計器190。信號產生器112耦接至濾波器114及混頻器116。信號產生器112可包括函數選擇器180。
在操作期間,分析濾波器組110可接收輸入音訊信號102。舉例而言,輸入音訊信號102可由麥克風或其他輸入器件提供。輸入音訊信號102可包括話音、雜訊、音樂或其組合。輸入音訊信號102可為超寬頻(SWB)信號,其包括在大約50赫茲(Hz)至大約16千赫茲(kHz)之頻率範圍內的資料。分析濾波器組110可基於頻率將輸入音訊信號102分成多個部分。舉例而言,分析濾波器組110可將輸入音訊信號102分成至少一低頻帶信號122及一高頻帶信號124。在一特定實施例中,分析濾波器組110可包括分析濾波器組之集合。分析濾波器組之該集合可將輸入音訊信號102分成至少低頻帶信號122及高頻帶信號124。在一特定實施例中,分析濾波器組110可產生兩個以上輸出。
在圖1之實例中,低頻帶信號122及高頻帶信號124佔用非重疊頻帶。舉例而言,低頻帶信號122及高頻帶信號124可分別佔用50Hz至7kHz及7kHz至16kHz之非重疊頻帶。在一替代實施例中,低頻帶信號122及高頻帶信號124可分別佔用50Hz至8kHz及8kHz至16kHz之非重疊頻帶。在另一替代實施例中,低頻帶信號122及高頻帶信號124重疊(例如,分別為50Hz至8kHz及7kHz至16kHz),此情況可使分析濾波器組110之低通濾波器及高通濾波器具有平滑滾落,如此可簡化設 計且降低低通濾波器及高通濾波器之成本。使低頻帶信號122及高頻帶信號124重疊亦可允許實現接收器處低頻帶及高頻帶信號之平滑混合,如此可產生較少可聞假影。
應注意,儘管圖1之實例說明SWB信號之處理,但此僅為了說明目的且不應被認為係限制性的。在一替代實施例中,輸入音訊信號102可為具有大約50Hz至大約8kHz之頻率範圍之寬頻(WB)信號。在此實施例中,低頻帶信號122可對應於大約50Hz至大約6.4kHz之頻率範圍且高頻帶信號124可對應於大約6.4kHz至大約8kHz之頻率範圍。
分析濾波器組110可將低頻帶信號122提供至低頻帶編碼器108且可將高頻帶信號124提供至參數估計器190。如本文中所描述,參數估計器190可經組態以比較第一延展信號182與高頻帶信號124以產生一或多個調整參數178。如本文中所描述,編碼器系統100可基於低頻帶信號122及一經選定非線性處理函數以產生第一延展信號182。混頻器116可經組態以藉由使用雜訊信號176調變第二延展信號172來產生第一延展信號182。濾波器114可經組態以藉由將來自信號產生器112之第三延展信號174濾波來產生第二延展信號172。
低頻帶編碼器108可自分析濾波器組110接收低頻帶信號122且可產生低頻帶參數168。低頻帶參數168可指示低頻帶信號122之特性。低頻帶參數168可包括低頻帶信號122之與頻譜傾斜、音調增益、滯後、話音模式或其組合相關聯之值。
頻譜傾斜可涉及通帶上頻譜包絡之形狀且可由經量化第一反射係數表示。對於有聲聲音,頻譜能量可隨遞增頻率減少,以使得第一反射係數為負且可能接近-1。無聲聲音可具有一頻譜,該頻譜為平坦的以使得第一反射係數接近零,或在高頻處具有更多能量以使得第一反射係數為正且可能接近+1。
話音模式(亦稱為發聲模式)可指示與低頻帶信號122相關聯之音 訊訊框是表示有聲聲音抑或無聲聲音。話音模式參數可具有基於週期性(例如,零交叉、標準化自相關函數(NACF)、音調增益等)及/或音訊訊框之語音活動之一或多個量測結果(諸如,此類量測結果與臨限值之間的關係)的二進位值。在其他實施中,話音模式參數可具有一或多個其他狀態來指示諸如靜寂或背景雜訊之模式,或靜寂與有聲話音之間的轉變。低頻帶編碼器108可將低頻帶參數168提供至信號產生器112。
在一特定實施例中,信號產生器112可基於低頻帶參數168產生低頻帶信號122。舉例而言,信號產生器112可包括本端解碼器(或解碼器模擬器)。本端解碼器可在接收器件處模擬解碼器之行為。舉例而言,本端解碼器可經組態以解碼低頻帶參數168以產生低頻帶信號122。在一替代實施例中,信號產生器112可自分析濾波器組110接收低頻帶信號122。
函數選擇器180可選擇複數個可用非線性處理函數118中之一非線性處理函數。該複數個可用非線性處理函數118可包括絕對值函數、全波整流函數、半波整流函數、平方函數、立方函數、四冪函數(power of four function)、削波函數或其組合。
函數選擇器180可基於低頻帶信號122之特性選擇非線性處理函數。為了說明,函數選擇器180可基於低頻帶參數168或低頻帶信號122判定特性值。雜訊因子可指示對應於低頻帶信號122之音訊訊框之週期性。舉例而言,雜訊因子可對應於與低頻帶信號122相關聯之音調增益、話音模式、頻譜傾斜、NACF、零交叉或其組合。若雜訊因子滿足第一雜訊臨限值,則函數選擇器180可選擇第一非線性處理函數。舉例而言,若雜訊因子指示低頻帶信號122為強週期性的(例如,對應於話音),則函數選擇器180可選擇高階冪函數(例如,四冪函數)。若雜訊因子滿足第二雜訊臨限值,則函數選擇器180可選擇第二 非線性處理函數。舉例而言,若雜訊因子指示低頻帶信號122並非為極週期性的或為類雜訊的(例如,對應於音樂),則函數選擇器180可選擇低階冪函數(例如,平方函數)。
在一特定實施例中,函數選擇器180可在逐音訊訊框基礎上自複數個可用非線性處理函數118選擇非線性處理函數。此外,可針對輸入音訊信號102之連續訊框選擇不同的非線性處理函數。因此,函數選擇器180可回應於判定與第一音訊訊框相關聯之參數滿足第一條件而選擇複數個非線性處理函數中之第一非線性處理函數,且可回應於判定與第二音訊訊框相關聯之參數滿足第二條件而選擇複數個非線性處理函數中之第二非線性處理函數。作為一說明性實例,可在輸入音訊信號102在電話呼叫期間對應於話音時與在輸入音訊信號102在電話呼叫期間對應於保持音樂時應用不同的非線性處理函數。在一特定實施例中,與訊框相關聯之參數為經選擇以編碼低頻帶信號之寫碼模式、訊框之週期性、訊框中非週期性雜訊之量及對應於訊框之頻譜傾斜中之一者。
信號產生器112可以諧波方式延展低頻帶信號122之頻譜以包括較高頻率範圍(例如,對應於高頻帶信號124之頻率範圍)。舉例而言,信號產生器112可對低頻帶信號122進行增加取樣。低頻帶信號122可經增加取樣以減少應用選定非線性處理函數後之頻疊。在一特定實施例中,信號產生器112可按特定因子(例如,8)對低頻帶信號122進行增加取樣。在一特定實施例中,增加取樣操作可包括對低頻帶信號122進行補零。信號產生器112可藉由將選定非線性處理函數應用於經增加取樣信號來產生第三延展信號174。
濾波器114可自信號產生器112接收第三延展信號174。濾波器114可藉由對第三延展信號174進行濾波來產生第二延展信號172。舉例而言,濾波器114可對第三延展信號174進行減少取樣以使得第二延展信 號172之頻率範圍(例如,7kHz至16kHz)對應於與高頻帶信號124相關聯之頻率範圍。為了說明,濾波器114可將帶通(例如,高通)濾波操作應用於第三延展信號174以產生第二延展信號172。在一特定實施例中,濾波器114可將線性變換(例如,離散餘弦變換(DCT))應用於第三延展信號174且可選擇對應於高頻率範圍(例如,7kHz至16kHz)之變換係數。濾波器114可將第二延展信號172提供至混頻器116。
混頻器116可組合第二延展信號172及雜訊信號176。混頻器116可自雜訊產生器(未展示)接收雜訊信號176。雜訊產生器可經組態以產生單位方差白色偽隨機雜訊信號。在一特定實施例中,雜訊信號176可不為白色且可具有隨頻率變化之功率密度。在一特定實施例中,雜訊產生器可經組態以將雜訊信號176輸出為判定性函數,該函數可在接收器件之解碼器處經複製。舉例而言,雜訊產生器可經組態以產生雜訊信號176作為低頻帶參數168之判定性函數。
混頻器116可組合第一比例之雜訊信號176及第二比例之第二延展信號172。舉例而言,混頻器116可產生第一延展信號182以具有類似於高頻帶信號124之諧波能量與雜訊能量之比率的諧波能量與雜訊能量之比率。混頻器116可基於諧波性因子170判定第一比例及第二比例。舉例而言,若諧波性因子170指示高頻帶信號124與無聲聲音(例如,音樂或雜訊)相關聯,則第一比例可高於第二比例。作為另一實例,若諧波性因子170指示高頻帶信號124與有聲話音相關聯,則第二比例可高於第一比例。在一特定實施例中,混頻器116可自諧波性因子170判定第一比例(或第二比例)且可根據諸如下式之等式導出第二比例(或第一比例):(第一比例)2+(第二比例)2=1, (等式1)。
替代地,混頻器116可基於諧波性因子170自複數個比例對選擇對應比例對,其中預先計算比例對以滿足恆定能量比率,諸如等式 (1)。第一比例之值的範圍可為0.1至0.7且第二比例之值的範圍可為0.7至1.0。
諧波性估計器106可基於輸入音訊信號102之特性(例如,週期性)之估計判定諧波性因子170。在一特定實施例中,諧波性估計器106可基於高頻帶信號124及低頻帶參數168中之至少一者產生諧波性因子170。舉例而言,諧波性估計器106可基於由低頻帶參數168指示之低頻帶信號122之特性(例如,週期性)判定諧波性因子170。為了說明,諧波性估計器106可將與音調增益成比例之值指派至諧波性因子170。作為另一實例,諧波性估計器106可基於話音模式判定諧波性因子170。為了說明,諧波性因子170可回應於指示有聲音訊(例如,話音)之話音模式而具有第一值且可回應於指示無聲音訊(例如,音樂)之話音模式而具有第二值。
作為另一實例,諧波性估計器106可基於高頻帶信號124之特性(例如,週期性)判定諧波性因子170。為了說明,諧波性估計器106可基於高頻帶信號124之自相關係數之最大值判定諧波性因子170,其中在包括一個音調滯後之延遲且不包括零樣本之延遲的搜尋範圍內執行自相關。在一特定實施例中,諧波性估計器106可產生對應於高頻帶信號124之高頻帶濾波器參數且可基於高頻帶濾波器參數判定高頻帶信號124之特性。
在一特定實施例中,諧波性估計器106可基於週期性之另一指示符(例如,音調增益)及臨限值判定諧波性因子170。舉例而言,若由低頻帶參數168指示之音調增益滿足第一臨限值(例如,大於或等於0.5),則諧波性估計器106可對高頻帶信號124執行自相關操作。作為另一實例,若話音模式指示特定狀態(例如,有聲話音),則諧波性估計器106可執行自相關操作。若音調增益不滿足第一臨限值及/或若話音模式指示其他狀態,則諧波性因子170可具有預設值。
諧波性估計器106可基於不同於週期性或除週期性之外的特性判定諧波性因子170。舉例而言,諧波性因子針對具有大音調滯後之話音信號及具有小音調滯後之話音信號可具有不同值。在一特定實施例中,諧波性估計器106可基於在基本頻率之倍數下對高頻帶信號124之能量之量測相對於在其他頻率分量下對高頻帶信號124之能量之量測來判定諧波性因子170。
諧波性估計器106可將諧波性因子170提供至混頻器116。如本文中所描述,混頻器116可基於諧波性因子170產生第一延展信號182。混頻器116可將第一延展信號182提供至參數估計器190。
參數估計器190可基於高頻帶信號124或第一延展信號182中之至少一者產生調整參數178。舉例而言,參數估計器190可基於高頻帶信號124與第一延展信號182之間的關係(諸如,兩個信號之能量之間的差異或比率)產生調整參數178。在一特定實施例中,調整參數178可對應於指示兩個信號之能量之間的差異或比率之一或多個增益調整參數。在一替代實施例中,調整參數178可對應於增益調整參數之經量化指數。在一特定實施例中,調整參數178可包括指示高頻帶信號124之特性之高頻帶參數。在一特定實施例中,參數估計器190可基於高頻帶信號124且不基於第一延展信號182產生調整參數178。
參數估計器190可提供調整參數178且低頻帶編碼器108可將低頻帶參數168提供至多工器(MUX)。MUX可多工調整參數178及低頻帶參數168以產生輸出位元串流。輸出位元串流可表示對應於輸入音訊信號102之經編碼音訊信號。舉例而言,MUX可經組態以將調整參數178插入至輸入音訊信號102之經編碼版本中以在輸入音訊信號102之再現期間實現增益調整。輸出位元串流可由傳輸器傳輸(例如,經由有線、無線或光學通道)及/或經儲存。在接收器件處,可由解多工器(DEMUX)、低頻帶解碼器、高頻帶解碼器及濾波器組執行反向操作 以產生音訊信號(例如,提供至揚聲器或其他輸出器件之輸入音訊信號102之重建構版本),如參看圖2所描述。在一特定實施例中,諧波性估計器106可將諧波性因子170提供至MUX,且MUX可將諧波性因子170包括在輸出位元串流中。
編碼器系統100在編碼器處使用基於低頻帶信號122之特性選擇之非線性處理函數產生合成高頻帶信號(例如,第一延展信號182)。使用選定非線性處理函數可增加在有聲狀況及無聲狀況兩者下合成高頻帶信號與高頻帶信號124之間的相關性。
參看圖2,展示可操作以執行音訊信號之諧波頻寬延展的解碼器系統之特定實施例,且將該系統大體上標示為200。編碼器系統100及解碼器系統200可包括在單一器件或單獨器件中。
在一特定實施例中,解碼器系統200可整合至編碼(或解碼)系統或裝置中(例如,無線電話或寫碼器/解碼器(CODEC)中)。在其他實施例中,解碼器系統200可整合至機上盒、音樂播放器、視訊播放器、娛樂單元、導航器件、通信器件、個人數位助理(PDA)、固定位置資料單元或電腦中。
應注意,在以下描述中,由圖2之解碼器系統200執行之各種功能經描述為由某些組件或模組執行。組件及模組之此劃分僅為了說明目的且並不被認為係限制性的。在一替代實施例中,由特定組件或模組執行之功能可在多個組件或模組中劃分。此外,在一替代實施例中,圖2之兩個或兩個以上組件或模組可整合至單一組件或模組中。可使用硬體(例如,場可程式化閘陣列(FPGA)器件、特殊應用積體電路(ASIC)、數位信號處理器(DSP)、控制器等)、軟體(例如,可由處理器執行之指令)或其任何組合實施圖2中所說明之每一組件或模組。
解碼器系統200包括耦接至信號產生器112之低頻帶解碼器208、濾波器114、混頻器116、高頻帶信號產生器216及合成濾波器組210。
在操作期間,低頻帶解碼器208可接收低頻帶資料268。低頻帶資料268可對應於由圖1之編碼器系統100產生之輸出位元串流。舉例而言,在解碼器系統200處之接收器可接收(例如,經由有線、無線或光學通道)一輸入位元串流。輸入位元串流可對應於由編碼器系統100產生之輸出位元串流。接收器可將輸入位元串流提供至一解多工器(DEMUX)。DEMUX可自輸入位元串流產生低頻帶資料268及調整參數。在一特定實施例中,DEMUX可自輸入位元串流提取一諧波性因子。DEMUX可將低頻帶資料268提供至低頻帶解碼器208。
低頻帶解碼器208可自低頻帶資料268提取低頻帶參數。低頻帶參數可對應於圖1之低頻帶參數168。低頻帶解碼器208可基於該等低頻帶參數產生一合成低頻帶信號222。合成低頻帶信號222可近似於圖1之低頻帶信號122。
信號產生器112可自低頻帶解碼器208接收合成低頻帶信號222。信號產生器112可基於合成低頻帶信號222產生一第三延展信號274,如參看圖1所描述。舉例而言,函數選擇器180可基於合成低頻帶信號222自複數個可用非線性處理函數218選擇一非線性處理函數。信號產生器可延展合成低頻帶信號222且可應用所選定非線性處理函數以產生第三延展信號274。第三延展信號274可近似於圖1之第三延展信號174。在一特定實施例中,函數選擇器180基於所接收之一參數選擇一非線性處理函數。舉例而言,解碼器系統200可接收識別(例如,藉由指數)一特定非線性處理函數之參數,該特定非線性處理函數由編碼器系統(例如,編碼器系統100)應用以編碼一特定音訊訊框或音訊訊框序列。可針對每一訊框或當待使用之非線性處理函數改變時接收此參數。
濾波器114可藉由對第三延展信號274進行濾波來產生第二延展信號272,如參看圖1所描述。第二延展信號272可近似於圖1之第二延展 信號172。
混頻器116可藉由基於諧波性因子270組合雜訊信號276及第二延展信號272來產生第一延展信號282,如參看圖2所描述。雜訊信號276可近似於圖1之雜訊信號176且第一延展信號282可近似於圖1之第一延展信號182。
諧波性解碼器206可接收低頻帶資料268、調整參數178、所接收之諧波性因子(例如,參數)或其組合。舉例而言,諧波性解碼器206可自解碼器系統200之DEMUX接收低頻帶資料268、調整參數178、所接收之諧波性因子或其組合。諧波性解碼器206可基於低頻帶資料268、調整參數178、所接收之諧波性因子或其組合產生諧波性因子270。舉例而言,諧波性解碼器206可自低頻帶資料268提取低頻帶參數。作為另一實例,諧波性解碼器206可自調整參數178提取高頻帶參數。諧波性解碼器206可基於低頻帶參數、高頻帶參數或兩者產生經計算之諧波性因子,如參看圖1所描述。
諧波性解碼器206可將諧波性因子270設定為經計算之諧波性因子或所接收之諧波性因子。在一特定實施例中,諧波性解碼器206可回應於偵測到所接收之諧波性因子中的錯誤而將諧波性因子270設定為經計算之諧波性因子。諧波性解碼器206可回應於判定所接收之諧波性因子與經計算之諧波性因子之間的差異滿足特定臨限值而偵測錯誤。諧波性解碼器206可將諧波性因子270提供至混頻器116。混頻器116可將第一延展信號282提供至高頻帶信號產生器216。
高頻帶信號產生器216可基於調整參數178及第一延展信號282中之至少一者產生合成高頻帶信號224。舉例而言,高頻帶信號產生器216可將調整參數178應用於第一延展信號282以產生合成高頻帶信號224。為了說明,高頻帶信號產生器216可按與調整參數178中之至少一者相關聯之因子來調節第一延展信號282。在一特定實施例中,調 整參數178中之一或多者可對應於增益調整參數。高頻帶信號產生器216可將增益調整參數應用於第一延展信號282以產生合成高頻帶信號224。合成濾波器組210可接收合成高頻帶信號224及合成低頻帶信號222。輸出音訊信號278可由合成濾波器組210提供至揚聲器(或其他輸出器件)及/或經儲存。
解碼器系統200可使用基於指示編碼器處接收之輸入信號的低頻帶部分之特性的低頻帶參數選擇的非線性處理函數實現在解碼器處產生合成高頻帶信號。使用選定非線性處理函數產生合成高頻帶信號可在有聲狀況及無聲狀況兩者下改良合成高頻帶信號與輸入信號之高頻帶部分之間的相關性。
參看圖3,展示可操作以執行音訊信號之諧波頻寬延展的系統之特定實施例,且將該系統大體上標示為300。
在一特定實施例中,系統300(或其部分)可整合至編碼(或解碼)系統或裝置中(例如,無線電話或寫碼器/解碼器(CODEC)中)。在其他實施例中,系統300(或其部分)可整合至機上盒、音樂播放器、視訊播放器、娛樂單元、導航器件、通信器件、個人數位助理(PDA)、固定位置資料單元或電腦中。
應注意,在以下描述中,由圖3之系統300執行之各種功能經描述為由某些組件或模組執行。組件及模組之此劃分僅為了說明目的且並不被認為係限制性的。在一替代實施例中,由特定組件或模組執行之功能可在多個組件或模組中劃分。此外,在一替代實施例中,圖3之兩個或兩個以上組件或模組可整合至單一組件或模組中。可使用硬體(例如,場可程式化閘陣列(FPGA)器件、特殊應用積體電路(ASIC)、數位信號處理器(DSP)、控制器等)、軟體(例如,可由處理器執行之指令)或其任何組合實施圖3中所說明之每一組件或模組。
系統300包括分析濾波器組110、低頻帶編碼器108、諧波性估計 器106、參數估計器190及解碼器系統200。
在操作期間,分析濾波器組110可接收輸入音訊信號102。分析濾波器組110可將輸入音訊信號102分成至少低頻帶信號122及高頻帶信號124。
低頻帶編碼器108可自分析濾波器組110接收低頻帶信號122。低頻帶編碼器108可基於低頻帶信號122判定低頻帶參數168,如參看圖1所描述。低頻帶編碼器108可將低頻帶參數168提供至解碼器系統200。
諧波性估計器106可接收高頻帶信號124且可基於高頻帶信號124產生諧波性因子170。舉例而言,諧波性估計器106可基於指示高頻帶信號124之特性之高頻帶參數產生諧波性因子170,如參看圖1所描述。諧波性估計器106可將諧波性因子170提供至解碼器系統200。
參數估計器190可基於高頻帶信號124產生調整參數178。舉例而言,調整參數178可對應於指示高頻帶信號124之特性的高頻帶參數。參數估計器190可將調整參數178提供至解碼器系統200。解碼器系統200可基於調整參數178、低頻帶參數168、諧波性因子170或其組合產生合成高頻帶信號224,如參看圖2所描述。
系統300使用基於合成低頻帶信號之特性選擇之非線性處理函數實現在解碼器處產生高頻帶信號。系統300可基於高頻帶信號124且不基於低頻帶信號之延展版本產生調整參數178。在一特定實施例中,系統300可藉由節省用於延展輸入音訊信號102及將延展信號與雜訊信號混合的處理時間而比編碼器系統100更快地產生調整參數178。
參看圖4,展示執行音訊信號之諧波頻寬延展的方法之特定實施例的流程圖,且將該方法大體上標示為400。可由圖1之編碼器系統100執行方法400。
方法400可包括在器件處將輸入音訊信號分成至少低頻帶信號及 高頻帶信號(在402處)。低頻帶信號可對應於低頻帶頻率範圍且高頻帶信號可對應於高頻帶頻率範圍。舉例而言,圖1之分析濾波器組110可將輸入音訊信號102分成至少低頻帶信號122及高頻帶信號124,如參看圖1所描述。低頻帶信號122可對應於低頻帶頻率範圍(例如,50赫茲(Hz)至7千赫茲(kHz))且高頻帶信號124可對應於高頻帶頻率範圍(例如,7kHz至16kHz)。
方法400亦可包括選擇複數個非線性處理函數中之一非線性處理函數(在404處)。舉例而言,圖1之函數選擇器180可選擇複數個可用非線性處理函數118中之一特定非線性處理函數,如參看圖1所描述。
方法400可進一步包括基於低頻帶信號及非線性處理函數產生第一延展信號(在406處)。舉例而言,圖1之混頻器116可基於低頻帶信號122及選定非線性處理函數產生第一延展信號182,如參看圖1所描述。
方法400亦可包括基於第一延展信號或高頻帶信號中之至少一者產生至少一個調整參數(在408處)。舉例而言,參數調整器190可基於第一延展信號182或高頻帶信號124中之至少一者產生調整參數178,如參看圖1所描述。
方法400可使用基於低頻帶信號122之特性選擇之非線性處理函數實現在編碼器處產生合成高頻帶信號(例如,第一延展信號182)。使用選定非線性處理函數可增加在有聲狀況及無聲狀況兩者下合成高頻帶信號與高頻帶信號124之間的相關性。
在一特定實施例中,圖4之方法400可經由處理單元(諸如,中央處理單元(CPU)、數位信號處理器(DSP)或控制器)之硬體(例如,場可程式化閘陣列(FPGA)器件、特殊應用積體電路(ASIC)等)或經由韌體器件或其任何組合實施。作為一實例,可由執行指令之處理器(如關於圖6所描述)執行圖4之方法400。
參看圖5,展示執行音訊信號之諧波頻寬延展的方法之特定實施例的流程圖,且將該方法大體上標示為500。可由圖2之解碼器系統200執行方法500。
方法500可包括在器件處接收對應於輸入音訊信號之至少一低頻帶信號之低頻帶資料(在502處)。舉例而言,解碼器系統200之DEMUX可經由接收器接收輸入位元串流,如參看圖2所描述。作為另一實例,低頻帶解碼器208可接收低頻帶資料268,如參看圖2所描述。
方法500亦可包括解碼低頻帶資料以產生合成低頻帶音訊信號(在504處)。舉例而言,低頻帶解碼器208可解碼低頻帶資料268以產生合成低頻帶信號222,如參看圖2所描述。
方法500可進一步包括選擇複數個非線性處理函數中之一非線性處理函數(在506處)。舉例而言,函數選擇器180可選擇複數個可用非線性處理函數118中之一特定非線性處理函數,如參看圖2所描述。
方法500亦可包括基於合成低頻帶音訊信號及非線性處理函數產生合成高頻帶音訊信號(在508處)。舉例而言,高頻帶信號產生器216可基於合成低頻帶信號222及選定非線性處理函數產生合成高頻帶信號224,如參看圖2所描述。
方法500可使用基於指示在編碼器處接收之輸入信號的低頻帶部分之特性的低頻帶參數選擇之非線性處理函數實現在解碼器處產生合成高頻帶信號。使用選定非線性處理函數產生合成高頻帶信號可改良在有聲狀況及無聲狀況兩者下合成高頻帶信號與輸入信號之高頻帶部分之間的相關性。
在一特定實施例中,圖5之方法500可經由處理單元(諸如,中央處理單元(CPU)、數位信號處理器(DSP)或控制器)之硬體(例如,場可程式化閘陣列(FPGA)器件、特殊應用積體電路(ASIC)等)或經由韌體器件或其任何組合實施。作為一實例,可由執行指令之處理器(如關 於圖6所描述)執行圖5之方法500。
參考圖6,描繪無線通信器件之特定說明性實施例之方塊圖,且將該器件大體上標示為600。器件600包括耦接至記憶體632之處理器610(例如,中央處理單元(CPU)、數位信號處理器(DSP)等)。記憶體632可包括由處理器610執行之指令660。處理器610亦可包括寫碼器/解碼器(CODEC)634,如所展示。CODEC 634可執行本文中所揭示之方法及程序,諸如圖4之方法400、圖5之方法500或兩者,及/或指令660可由處理器610執行以執行本文中所揭示之方法及程序,諸如圖4之方法400、圖5之方法500或兩者。
CODEC 634可包括編碼器690及解碼器692。編碼器690可包括分析濾波器組110、諧波性估計器106、低頻帶編碼器108、混頻器116、信號產生器112、濾波器114及參數估計器190中之一或多者,如所展示。解碼器692可包括合成濾波器組210、諧波性解碼器206、低頻帶解碼器208、高頻帶信號產生器216、混頻器116及濾波器114中之一或多者,如所展示。在替代實施例中,編碼器690及解碼器692可駐留在多個處理器內或其部分內。舉例而言,器件600可包括多個處理器(諸如,DSP及應用程式處理器),且編碼器690及解碼器692或其組件可包括在多個處理器中之一些或全部中。
可經由專用硬體(例如,電路)、藉由執行指令以執行一或多個任務之處理器或其組合實施分析濾波器組110、諧波性估計器106、低頻帶編碼器108、混頻器116、信號產生器112、濾波器114、參數估計器190、合成濾波器組210、諧波性解碼器206、低頻帶解碼器208、高頻帶信號產生器216或其組合。作為一實例,此等指令可儲存在記憶體器件中,諸如隨機存取記憶體(RAM)、磁阻式隨機存取記憶體(MRAM)、自旋力矩轉移MRAM(STT-MRAM)、快閃記憶體、唯讀記憶體(ROM)、可程式化唯讀記憶體(PROM)、固態記憶體、可抹除可 程式化唯讀記憶體(EPROM)、電可抹除可程式化唯讀記憶體(EEPROM)、暫存器、硬碟、抽取式磁碟或緊密光碟唯讀記憶體(CD-ROM)。
圖6亦展示耦接至處理器610且耦接至顯示器628之顯示控制器626。揚聲器636及麥克風638可耦接至器件600。舉例而言,麥克風638可產生圖1之輸入音訊信號102,且器件600可基於輸入音訊信號102產生用於傳輸至接收器之輸出位元串流,如參看圖1所描述。舉例而言,輸出位元串流可由傳輸器經由處理器610、無線控制器640及天線642傳輸。作為另一實例,揚聲器636可用於輸出由器件600根據由接收器接收(例如,經由無線控制器640及天線642)之輸入位元串流重建構之信號,如參看圖2所描述。
在一特定實施例中,處理器610、顯示控制器626、記憶體632及無線控制器640包括在系統級封裝或系統單晶片器件(例如,行動台數據機(MSM))622中。在一特定實施例中,輸入器件630(諸如,觸控式螢幕及/或小鍵盤)及電源供應器644耦接至系統單晶片器件622。此外,在一特定實施例中,如圖6所說明,顯示器628、輸入器件630、揚聲器636、麥克風638、天線642及電源供應器644在系統單晶片器件622之外部。顯示器628、輸入器件630、揚聲器636、麥克風638、天線642及電源供應器644中之每一者可耦接至系統單晶片器件622之組件,諸如介面或控制器。
結合所描述之實施例,第一裝置可包括用於將輸入音訊信號分成至少一低頻帶信號及一高頻帶信號之構件,諸如分析濾波器組110、經組態以分離音訊信號之一或多個其他器件或電路,或其任何組合。低頻帶信號可對應於低頻帶頻率範圍且高頻帶信號可對應於高頻帶頻率範圍。該裝置亦可包括用於選擇複數個非線性處理函數中之一非線性處理函數之構件,諸如函數選擇器180、經組態以自複數個 非線性處理函數選擇一非線性處理函數之一或多個其他器件或電路,或其任何組合。該裝置可進一步包括用於基於低頻帶信號及非線性處理函數產生第一延展信號之第一構件,諸如混頻器116、經組態以基於低頻帶信號及非線性處理函數產生信號之一或多個其他器件或電路,或其任何組合。該裝置亦可包括用於基於第一延展信號、高頻帶信號或兩者產生至少一個調整參數之第二構件,諸如參數估計器190、經組態以基於延展信號及/或高頻帶信號產生至少一個調整參數之一或多個其他器件或電路,或其任何組合。
結合所描述之實施例,第二裝置可包括用於接收對應於輸入音訊信號之至少一低頻帶信號之低頻帶資料的構件,諸如解碼器系統200之組件或耦接至解碼器系統200之組件(例如,接收器)、經組態以接收對應於輸入音訊信號之低頻帶信號之低頻帶資料的一或多個其他器件或電路,或其任何組合。該裝置亦可包括用於解碼低頻帶資料以產生合成低頻帶音訊信號之構件,諸如低頻帶解碼器208、經組態以解碼低頻帶資料以產生合成低頻帶音訊信號之一或多個其他器件或電路,或其任何組合。該裝置可進一步包括用於選擇複數個非線性處理函數中之一非線性處理函數之構件,諸如函數選擇器180、經組態以選擇複數個非線性處理函數中之一非線性處理函數之一或多個其他器件或電路,或其任何組合。該裝置亦可包括用於基於合成低頻帶音訊信號及非線性處理函數產生合成高頻帶音訊信號之構件,諸如高頻帶信號產生器216、經組態以基於合成低頻帶音訊信號及非線性處理函數產生合成高頻帶音訊信號之一或多個其他器件或電路,或其任何組合。
熟悉此項技術者將進一步瞭解,結合本文中所揭示之實施例所描述之各種說明性邏輯區塊、組態、模組、電路及演算法步驟可實施為電子硬體、由諸如硬體處理器之處理器件執行之電腦軟體,或兩者之組合。上文大體在功能性方面描述各種說明性組件、區塊、組態、 模組、電路及步驟。此功能性經實施為硬體抑或可執行軟體取決於特定應用及強加於整個系統上之設計約束。對於每一特定應用而言,熟習此項技術者可以變化之方式實施所描述之功能性,但不應將此等實施決策解釋為導致脫離本發明之範疇。
結合本文中所揭示之實施例而描述之方法或演算法的步驟可直接體現於硬體中、由處理器執行之軟體模組中,或兩者之組合中。軟體模組可駐留於記憶體器件中,諸如隨機存取記憶體(RAM)、磁阻式隨機存取記憶體(MRAM)、自旋力矩轉移MRAM(STT-MRAM)、快閃記憶體、唯讀記憶體(ROM)、可程式化唯讀記憶體(PROM)、可抹除可程式化唯讀記憶體(EPROM)、電可抹除可程式化唯讀記憶體(EEPROM)、暫存器、硬碟、抽取式磁碟或緊密光碟唯讀記憶體(CD-ROM)。例示性記憶體器件耦接至處理器,以使得處理器可自記憶體器件讀取資訊及將資訊寫入至記憶體器件。在替代方案中,記憶體器件可與處理器成一體式。處理器及儲存媒體可駐留於特殊應用積體電路(ASIC)中。ASIC可駐留於計算器件或使用者終端機中。在替代方案中,處理器及儲存媒體可作為離散組件駐留於計算器件或使用者終端機中。
提供所揭示之實施例的前述描述以使熟習此項技術者能夠製作或使用所揭示之實施例。對於熟習此項技術者而言,此等實施例之各種修改將易於顯而易見,且本文中所定義之原理可在不脫離本發明之範疇的情況下應用於其他實施例。因此,本發明並不意欲限於本文中所展示之實施例,而應符合可能與如以下申請專利範圍所定義之原理及新穎特徵相一致的最廣泛範疇。
100‧‧‧編碼器系統
102‧‧‧輸入音訊信號
106‧‧‧諧波性估計器
108‧‧‧低頻帶編碼器
110‧‧‧分析濾波器組
112‧‧‧信號產生器
114‧‧‧濾波器
116‧‧‧混頻器
118‧‧‧非線性處理函數
122‧‧‧低頻帶信號
124‧‧‧高頻帶信號
168‧‧‧低頻帶參數
170‧‧‧諧波性因子
172‧‧‧第二延展信號
174‧‧‧第三延展信號
176‧‧‧雜訊信號
178‧‧‧調整參數
180‧‧‧函數選擇器
182‧‧‧第一延展信號
190‧‧‧參數估計器

Claims (59)

  1. 一種方法,其包含:在一器件處,將一輸入音訊信號分為至少一低頻帶信號及一高頻帶信號,該低頻帶信號對應於一低頻帶頻率範圍且該高頻帶信號對應於一高頻帶頻率範圍;選擇複數個非線性處理函數中之一非線性處理函數;基於該低頻帶信號及該非線性處理函數產生一第一延展信號;及基於該第一延展信號、該高頻帶信號或兩者產生至少一個調整參數。
  2. 如請求項1之方法,其中該第一延展信號係藉由混合一雜訊信號及一第二延展信號來產生,且其中該至少一個調整參數係基於該第一延展信號及該高頻帶信號判定。
  3. 如請求項2之方法,其中一第一比例之該雜訊信號及一第二比例之該第二延展信號經混合,且其中該第一比例及該第二比例係基於該低頻帶信號、該高頻帶信號或該輸入音訊信號中之至少一者之一諧波性判定。
  4. 如請求項3之方法,其進一步包含基於一音訊訊框中該輸入音訊信號之週期性之一估計判定該諧波性。
  5. 如請求項2之方法,其進一步包含藉由對一第三延展信號進行濾波來產生該第二延展信號,其中該第二延展信號之一頻寬對應於該高頻帶頻率範圍。
  6. 如請求項5之方法,其進一步包含藉由將該非線性處理函數應用於該低頻帶信號來產生該第三延展信號。
  7. 如請求項2之方法,其中該第二延展信號係藉由將一線性變換應 用於一第三延展信號及選擇對應於該高頻帶頻率範圍之變換係數來產生。
  8. 如請求項7之方法,其中該線性變換對應於一離散餘弦變換。
  9. 如請求項1之方法,其中該輸入音訊信號係使用分析濾波器組分成至少該低頻帶信號及該高頻帶信號。
  10. 如請求項1之方法,其進一步包含判定與該輸入音訊信號之一訊框相關聯之一參數,其中基於該參數選擇該非線性處理函數,其中回應於判定該參數滿足一第一條件而選擇該複數個非線性處理函數中之一第一非線性處理函數,且其中回應於判定該參數滿足一第二條件而選擇該複數個非線性處理函數中之一第二非線性處理函數。
  11. 如請求項10之方法,其中該第一非線性處理函數對應於一低階冪函數,且其中該第二非線性處理函數對應於一高階冪函數。
  12. 如請求項10之方法,其中與該訊框相關聯之該參數為經選擇以編碼該低頻帶信號之一寫碼模式、該訊框之一週期性、該訊框中非週期性雜訊之一量及對應於該訊框之一頻譜傾斜中之一者。
  13. 如請求項1之方法,其中該至少一個調整參數對應於與該高頻帶信號相關聯之至少一個增益調整參數。
  14. 一種方法,其包括:在一器件處,接收對應於一輸入音訊信號之至少一低頻帶信號之低頻帶資料;解碼該低頻帶資料以產生一合成低頻帶音訊信號;選擇複數個非線性處理函數中之一非線性處理函數;及基於該合成低頻帶音訊信號及該非線性處理函數產生一合成高頻帶音訊信號。
  15. 如請求項14之方法,其進一步包含藉由組合該合成低頻帶音訊信號及該合成高頻帶音訊信號來產生一輸出音訊信號,其中該輸出音訊信號之一第一頻寬大於該合成低頻帶音訊信號之一第二頻寬。
  16. 如請求項14之方法,其進一步包含藉由混合一雜訊信號及一第二延展信號來產生一第一延展信號,其中基於該第一延展信號及至少一個調整參數產生該合成高頻帶音訊信號。
  17. 如請求項16之方法,其中一第一比例之該第二延展信號及一第二比例之該雜訊信號經混合,且其中該第一比例及該第二比例係基於一所接收之諧波性參數或該低頻帶資料中之至少一者判定。
  18. 如請求項16之方法,其中該合成高頻帶音訊信號係藉由按與該至少一個調整參數相關聯之一因子來調節該第一延展信號來產生。
  19. 如請求項16之方法,其進一步包含藉由對一第三延展信號進行濾波來產生該第二延展信號,其中該第二延展信號對應於一高頻帶頻率範圍。
  20. 如請求項16之方法,其中該第二延展信號係藉由將一線性變換應用於一第三延展信號及選擇對應於一高頻帶頻率範圍之變換係數來產生。
  21. 如請求項20之方法,其中該線性變換對應於一離散餘弦變換。
  22. 如請求項20之方法,其進一步包含基於該合成低頻帶音訊信號及該非線性處理函數產生該第三延展信號。
  23. 如請求項14之方法,其進一步包含基於一所接收之參數或該低頻帶資料選擇該非線性處理函數。
  24. 一種裝置,其包含: 一記憶體;及一處理器,其經組態以進行以下操作:將一輸入音訊信號分成至少一低頻帶信號及一高頻帶信號,該低頻帶信號對應於一低頻帶頻率範圍且該高頻帶信號對應於一高頻帶頻率範圍;選擇複數個非線性處理函數中之一非線性處理函數;基於該低頻帶信號及該非線性處理函數產生一第一延展信號;及基於該第一延展信號、該高頻帶信號或兩者產生至少一個調整參數。
  25. 如請求項24之裝置,其中該第一延展信號係藉由混合一雜訊信號及一第二延展信號來產生,且其中該至少一個調整參數係基於該第一延展信號及該高頻帶信號判定。
  26. 如請求項25之裝置,其中一第一比例之該雜訊信號及一第二比例之該第二延展信號經混合,且其中該第一比例及該第二比例係基於該低頻帶信號、該高頻帶信號或該輸入音訊信號中之至少一者之一諧波性判定。
  27. 如請求項26之裝置,其中該處理器經進一步組態以基於一音訊訊框中該輸入音訊信號之週期性之一估計判定該諧波性。
  28. 如請求項25之裝置,其中該處理器經進一步組態以藉由對一第三延展信號進行濾波來產生該第二延展信號,其中該第二延展信號之一頻寬對應於該高頻帶頻率範圍。
  29. 如請求項28之裝置,其中該處理器經進一步組態以藉由將該非線性處理函數應用於該低頻帶信號來產生該第三延展信號。
  30. 如請求項25之裝置,其中該第二延展信號係藉由將一線性變換應用於一第三延展信號及選擇對應於該高頻帶頻率範圍之變換 係數來產生。
  31. 如請求項30之裝置,其中該線性變換對應於一離散餘弦變換。
  32. 如請求項24之裝置,其中該輸入音訊信號係使用分析濾波器組分成至少該低頻帶信號及該高頻帶信號。
  33. 如請求項24之裝置,其中該處理器經進一步組態以判定與該輸入音訊信號之一訊框相關聯之一參數,其中基於該參數選擇該非線性處理函數,其中回應於判定該參數滿足一第一條件而選擇該複數個非線性處理函數中之一第一非線性處理函數,且其中回應於判定該參數滿足一第二條件而選擇該複數個非線性處理函數中之一第二非線性處理函數。
  34. 如請求項33之裝置,其中與該訊框相關聯之該參數為經選擇以編碼該低頻帶信號之一寫碼模式、該訊框之一週期性、該訊框中非週期性雜訊之一量及對應於該訊框之一頻譜傾斜中之一者。
  35. 如請求項24之裝置,其中該複數個非線性處理函數包括一低階冪函數及一高階冪函數。
  36. 如請求項24之裝置,其中該至少一個調整參數對應於與該高頻帶信號相關聯之至少一個增益調整參數。
  37. 如請求項24之裝置,其中該處理器係整合至一編碼器系統中。
  38. 一種裝置,其包含:一記憶體;及一處理器,其經組態以進行以下操作:接收對應於一輸入音訊信號之至少一低頻帶信號之低頻帶資料;解碼該低頻帶資料以產生一合成低頻帶音訊信號;選擇複數個非線性處理函數中之一非線性處理函數;及 基於該合成低頻帶音訊信號及該非線性處理函數產生一合成高頻帶音訊信號。
  39. 如請求項38之裝置,其中該處理器經進一步組態以藉由組合該合成低頻帶音訊信號及該合成高頻帶音訊信號來產生一輸出音訊信號,其中該輸出音訊信號之一第一頻寬大於該合成低頻帶音訊信號之一第二頻寬。
  40. 如請求項38之裝置,其中該處理器經進一步組態以藉由混合一雜訊信號及一第二延展信號來產生一第一延展信號,其中基於該第一延展信號及至少一個調整參數產生該合成高頻帶音訊信號。
  41. 如請求項40之裝置,其中一第一比例之該第二延展信號及一第二比例之該雜訊信號經混合,且其中該第一比例及該第二比例係基於一所接收之諧波性參數或該低頻帶資料中之至少一者判定。
  42. 如請求項40之裝置,其中該合成高頻帶音訊信號係藉由按與該至少一個調整參數相關聯之一因子來調節該第一延展信號來產生。
  43. 如請求項40之裝置,其中該處理器經進一步組態以藉由對一第三延展信號進行濾波來產生該第二延展信號,其中該第二延展信號對應於一高頻帶頻率範圍。
  44. 如請求項40之裝置,其中該第二延展信號係藉由將一線性變換應用於一第三延展信號及選擇對應於一高頻帶頻率範圍之變換係數來產生。
  45. 如請求項44之裝置,其中該線性變換對應於一離散餘弦變換。
  46. 如請求項44之裝置,其中該處理器經進一步組態以基於該合成低頻帶音訊信號及該非線性處理函數產生該第三延展信號。
  47. 如請求項38之裝置,其中該處理器經進一步組態以基於一所接收之參數或該低頻帶資料選擇該非線性處理函數。
  48. 如請求項38之裝置,其中該處理器係整合至一解碼器系統中。
  49. 一種裝置,其包含:用於將一輸入音訊信號分成至少一低頻帶信號及一高頻帶信號之構件,該低頻帶信號對應於一低頻帶頻率範圍且該高頻帶信號對應於一高頻帶頻率範圍;用於選擇複數個非線性處理函數中之一非線性處理函數之構件;用於基於該低頻帶信號及該非線性處理函數產生一第一延展信號之第一構件;及用於基於該第一延展信號、該高頻帶信號或兩者產生至少一個調整參數之第二構件。
  50. 如請求項49之裝置,其中該第一延展信號係藉由混合一雜訊信號及一第二延展信號來產生,且其中該至少一個調整參數係基於該第一延展信號及該高頻帶信號判定。
  51. 如請求項50之裝置,其中一第一比例之該雜訊信號及一第二比例之該第二延展信號經混合,且其中該第一比例及該第二比例係基於該低頻帶信號、該高頻帶信號或該輸入音訊信號中之至少一者之一諧波性判定。
  52. 一種裝置,其包含:用於接收對應於一輸入音訊信號之至少一低頻帶信號之低頻帶資料的構件;用於解碼該低頻帶資料以產生一合成低頻帶音訊信號之構件;用於選擇複數個非線性處理函數中之一非線性處理函數之構 件;及用於基於該合成低頻帶音訊信號及該非線性處理函數產生一合成高頻帶音訊信號之構件。
  53. 如請求項52之裝置,其中該低頻帶資料指示該低頻帶信號之特性。
  54. 如請求項52之裝置,其中該合成高頻帶音訊信號係藉由按與該至少一個調整參數相關聯之一因子來調節一第一延展信號來產生。
  55. 一種電腦可讀儲存器件,其儲存當由一處理器執行時引起該處理器執行包含以下各者之操作的指令:將一輸入音訊信號分成至少一低頻帶信號及一高頻帶信號,該低頻帶信號對應於一低頻帶頻率範圍且該高頻帶信號對應於一高頻帶頻率範圍;選擇複數個非線性處理函數中之一非線性處理函數;基於該低頻帶信號及該非線性處理函數產生一第一延展信號;及基於該第一延展信號、該高頻帶信號或兩者產生至少一個調整參數。
  56. 如請求項55之電腦可讀儲存器件,其中該第一延展信號係藉由混合一雜訊信號及一第二延展信號來產生,且其中該至少一個調整參數係基於該第一延展信號及該高頻帶信號判定。
  57. 如請求項56之電腦可讀儲存器件,其中該等操作進一步包含:藉由對一第三延展信號進行濾波來產生該第二延展信號,其中該第二延展信號之一頻寬對應於該高頻帶頻率範圍;及藉由將該非線性處理函數應用於該低頻帶信號來產生該第三延展信號。
  58. 一種電腦可讀儲存器件,其儲存當由一處理器執行時引起該處理器執行包含以下各者之操作的指令:接收對應於一輸入音訊信號之至少一低頻帶信號之低頻帶資料;解碼該低頻帶資料以產生一合成低頻帶音訊信號;選擇複數個非線性處理函數中之一非線性處理函數;及基於該合成低頻帶音訊信號及該非線性處理函數產生一合成高頻帶音訊信號。
  59. 如請求項58之電腦可讀儲存器件,其中該等操作進一步包含判定與該輸入音訊信號之一訊框相關聯之一參數,其中基於該參數選擇該非線性處理函數。
TW104104441A 2014-02-13 2015-02-10 用於音訊信號之諧波頻寬延展之方法、裝置及電腦可讀儲存器件 TWI559298B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201461939585P 2014-02-13 2014-02-13
US14/617,524 US9564141B2 (en) 2014-02-13 2015-02-09 Harmonic bandwidth extension of audio signals

Publications (2)

Publication Number Publication Date
TW201535356A true TW201535356A (zh) 2015-09-16
TWI559298B TWI559298B (zh) 2016-11-21

Family

ID=53775460

Family Applications (1)

Application Number Title Priority Date Filing Date
TW104104441A TWI559298B (zh) 2014-02-13 2015-02-10 用於音訊信號之諧波頻寬延展之方法、裝置及電腦可讀儲存器件

Country Status (25)

Country Link
US (1) US9564141B2 (zh)
EP (1) EP3105757B1 (zh)
JP (1) JP6290434B2 (zh)
KR (1) KR101827665B1 (zh)
CN (1) CN105981102B (zh)
AU (1) AU2015217340B2 (zh)
BR (1) BR112016018575B1 (zh)
CA (1) CA2936987C (zh)
CL (1) CL2016002009A1 (zh)
DK (1) DK3105757T3 (zh)
ES (1) ES2777282T3 (zh)
HU (1) HUE046891T2 (zh)
IL (1) IL246787B (zh)
MX (1) MX349848B (zh)
MY (1) MY180821A (zh)
NZ (1) NZ721890A (zh)
PH (1) PH12016501396A1 (zh)
PL (1) PL3105757T3 (zh)
PT (1) PT3105757T (zh)
RU (1) RU2651218C2 (zh)
SA (1) SA516371666B1 (zh)
SG (1) SG11201605412VA (zh)
SI (1) SI3105757T1 (zh)
TW (1) TWI559298B (zh)
WO (1) WO2015123210A1 (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103516440B (zh) 2012-06-29 2015-07-08 华为技术有限公司 语音频信号处理方法和编码装置
TWI557726B (zh) * 2013-08-29 2016-11-11 杜比國際公司 用於決定音頻信號的高頻帶信號的主比例因子頻帶表之系統和方法
US9858941B2 (en) * 2013-11-22 2018-01-02 Qualcomm Incorporated Selective phase compensation in high band coding of an audio signal
FR3020732A1 (fr) * 2014-04-30 2015-11-06 Orange Correction de perte de trame perfectionnee avec information de voisement
US20160180860A1 (en) * 2014-12-23 2016-06-23 Qualcomm Incorporated High order B-spline sampling rate conversion (SRC)
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
US9837089B2 (en) 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation
RU2714365C1 (ru) * 2016-03-07 2020-02-14 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Способ гибридного маскирования: комбинированное маскирование потери пакетов в частотной и временной области в аудиокодеках
CN109791773B (zh) * 2016-11-04 2020-03-24 惠普发展公司,有限责任合伙企业 音频输出产生系统、音频通道输出方法和计算机可读介质
EP3382703A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and methods for processing an audio signal
US10825467B2 (en) * 2017-04-21 2020-11-03 Qualcomm Incorporated Non-harmonic speech detection and bandwidth extension in a multi-source environment
CN110322882A (zh) * 2019-05-13 2019-10-11 厦门亿联网络技术股份有限公司 一种生成混合语音数据的方法及系统
CN113963703A (zh) * 2020-07-03 2022-01-21 华为技术有限公司 一种音频编码的方法和编解码设备

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2376657C2 (ru) 2005-04-01 2009-12-20 Квэлкомм Инкорпорейтед Системы, способы и устройства для высокополосного предыскажения шкалы времени
TWI317933B (en) * 2005-04-22 2009-12-01 Qualcomm Inc Methods, data storage medium,apparatus of signal processing,and cellular telephone including the same
US8311840B2 (en) 2005-06-28 2012-11-13 Qnx Software Systems Limited Frequency extension of harmonic signals
EP1772855B1 (en) * 2005-10-07 2013-09-18 Nuance Communications, Inc. Method for extending the spectral bandwidth of a speech signal
US9454974B2 (en) 2006-07-31 2016-09-27 Qualcomm Incorporated Systems, methods, and apparatus for gain factor limiting
EP1947644B1 (en) 2007-01-18 2019-06-19 Nuance Communications, Inc. Method and apparatus for providing an acoustic signal with extended band-width
CA2729474C (en) * 2008-07-11 2015-09-01 Frederik Nagel Apparatus and method for generating a bandwidth extended signal
JP2010079275A (ja) * 2008-08-29 2010-04-08 Sony Corp 周波数帯域拡大装置及び方法、符号化装置及び方法、復号化装置及び方法、並びにプログラム
PL3246919T3 (pl) * 2009-01-28 2021-03-08 Dolby International Ab Ulepszona transpozycja harmonicznych
JP4892021B2 (ja) * 2009-02-26 2012-03-07 株式会社東芝 信号帯域拡張装置
TWI591625B (zh) * 2009-05-27 2017-07-11 杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
US8447617B2 (en) * 2009-12-21 2013-05-21 Mindspeed Technologies, Inc. Method and system for speech bandwidth extension
JP5854520B2 (ja) * 2010-03-09 2016-02-09 フラウンホーファーゲゼルシャフトツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. オーディオ信号用の位相ボコーダに基づく帯域幅拡張方法における改善された振幅応答及び時間的整列のための装置及び方法
US8600737B2 (en) * 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
JP5777041B2 (ja) * 2010-07-23 2015-09-09 沖電気工業株式会社 帯域拡張装置及びプログラム、並びに、音声通信装置

Also Published As

Publication number Publication date
MY180821A (en) 2020-12-09
PH12016501396B1 (en) 2016-08-22
JP2017510836A (ja) 2017-04-13
JP6290434B2 (ja) 2018-03-07
PL3105757T3 (pl) 2020-05-18
AU2015217340B2 (en) 2018-05-31
KR101827665B1 (ko) 2018-02-08
BR112016018575A2 (zh) 2017-08-08
PH12016501396A1 (en) 2016-08-22
MX349848B (es) 2017-08-15
EP3105757A1 (en) 2016-12-21
HUE046891T2 (hu) 2020-03-30
SA516371666B1 (ar) 2019-04-28
MX2016010358A (es) 2016-11-30
DK3105757T3 (da) 2020-02-10
BR112016018575B1 (pt) 2022-08-23
SG11201605412VA (en) 2016-08-30
PT3105757T (pt) 2020-03-23
RU2016133008A3 (zh) 2018-03-16
CN105981102B (zh) 2019-11-12
NZ721890A (en) 2018-02-23
KR20160121548A (ko) 2016-10-19
WO2015123210A1 (en) 2015-08-20
RU2016133008A (ru) 2018-03-16
SI3105757T1 (sl) 2020-03-31
CA2936987A1 (en) 2015-08-20
ES2777282T3 (es) 2020-08-04
US9564141B2 (en) 2017-02-07
TWI559298B (zh) 2016-11-21
US20150228288A1 (en) 2015-08-13
RU2651218C2 (ru) 2018-04-18
AU2015217340A1 (en) 2016-07-28
CA2936987C (en) 2019-05-21
CL2016002009A1 (es) 2017-01-27
IL246787B (en) 2018-01-31
CN105981102A (zh) 2016-09-28
EP3105757B1 (en) 2019-12-11

Similar Documents

Publication Publication Date Title
TWI559298B (zh) 用於音訊信號之諧波頻寬延展之方法、裝置及電腦可讀儲存器件
US10163447B2 (en) High-band signal modeling
US10410652B2 (en) Estimation of mixing factors to generate high-band excitation signal
US9899032B2 (en) Systems and methods of performing gain adjustment
CA2925572C (en) Gain shape estimation for improved tracking of high-band temporal characteristics
ES2807258T3 (es) Escalado para circuitería de forma de ganancia
AU2014331903A1 (en) Gain shape estimation for improved tracking of high-band temporal characteristics
US20150149157A1 (en) Frequency domain gain shape estimation
BR112016007914B1 (pt) Estimativa de formato de ganho para rastreamento aperfeiçoado de características temporais de banda alta