TW201435859A - 用於量化及解量化相位資訊之系統及方法 - Google Patents

用於量化及解量化相位資訊之系統及方法 Download PDF

Info

Publication number
TW201435859A
TW201435859A TW103101042A TW103101042A TW201435859A TW 201435859 A TW201435859 A TW 201435859A TW 103101042 A TW103101042 A TW 103101042A TW 103101042 A TW103101042 A TW 103101042A TW 201435859 A TW201435859 A TW 201435859A
Authority
TW
Taiwan
Prior art keywords
frequency domain
signal
frequency
domain signal
sub
Prior art date
Application number
TW103101042A
Other languages
English (en)
Inventor
Subasingha Shaminda Subasingha
Venkatesh Krishnan
Vivek Rajendran
Stephane Pierre Villette
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of TW201435859A publication Critical patent/TW201435859A/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/097Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using prototype waveform decomposition or prototype waveform interpolative [PWI] coders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本發明描述一種用於量化一電子器件上之相位資訊之方法。該方法包括獲得一語音信號。該方法亦包括基於該語音信號判定一原型音調週期信號及將該原型音調週期信號變換成一第一頻域信號。該方法額外包括將該第一頻域信號映射至複數個子頻帶中。該方法亦包括基於該第一頻域信號判定一全域對準及利用純量量化來量化該全域對準以獲得一經量化全域對準。該方法額外包括判定對應於該複數個子頻帶之複數個頻帶對準。該方法亦包括利用向量量化來量化該複數個頻帶對準以獲得複數個經量化頻帶對準。該方法進一步包括傳輸該經量化全域對準及該複數個經量化頻帶對準。

Description

用於量化及解量化相位資訊之系統及方法 相關申請案
本申請案與2013年2月21日申請之美國臨時專利申請案第61/767,455號「SYSTEMS AND METHODS FOR PERFORMING A BAND ALIGNMENT SEARCH」有關且主張其優先權。
本發明大體上係關於電子器件。更特定言之,本發明係關於用於量化相位資訊之系統及方法。
最近幾十年中,電子器件之使用已變得普遍。詳言之,電子技術之進展已降低了愈加複雜且有用的電子器件之成本。成本降低及消費者需求已使電子器件之使用劇增,使得其在現代社會中幾乎隨處可見。由於電子器件之使用已推廣開來,因此具有對電子器件之新的且改良之特徵的需求。更特定言之,人們常常尋求執行新功能及/或更快、更有效且以更高品質執行功能之電子器件。
一些電子器件(例如,行動電話、智慧型手機、音訊記錄器、攝錄影機、電腦,等)利用音訊信號。此等電子器件可編碼、儲存及/或傳輸音訊信號。舉例而言,一智慧型手機可獲得、編碼及傳輸用於電話呼叫之語音信號,同時另一智慧型手機可接收該語音信號並對其進行解碼。
然而,在音訊信號之編碼、傳輸及解碼中存在特定挑戰。舉例而言,音訊信號可經編碼以便減小傳輸該音訊信號所需之頻寬量。低效編碼可利用比準確地表示音訊信號所需要的頻寬更多的頻寬。自此論述可瞭解,改良編碼及解碼之系統及方法可為有益的。
描述一種用於量化一電子器件上之相位資訊之方法。該方法包括獲得一語音信號。該方法亦包括基於該語音信號判定一原型音調週期信號。該方法進一步包括將該原型音調週期信號變換成一第一頻域信號。該方法額外包括將該第一頻域信號映射至複數個子頻帶中。該方法亦包括基於該第一頻域信號判定一全域對準。該方法進一步包括利用純量量化來量化該全域對準以獲得一經量化全域對準。該方法額外包括判定對應於該複數個子頻帶之複數個頻帶對準。該方法亦包括利用向量量化來量化該複數個頻帶對準以獲得複數個經量化頻帶對準。該方法進一步包括傳輸該經量化全域對準及該複數個經量化頻帶對準。變換該原型音調週期信號可包括判定該原型音調週期信號之一離散時間傅立葉(Fourier)級數或對該原型音調週期信號執行一離散傅立葉變換。映射該第一頻域信號可係基於該第一頻域信號之一長度。
該方法可包括判定該複數個子頻帶中的每一者之一振幅。該方法亦可包括基於一振幅經量化之原型音調週期信號判定一第二頻域信號。該第二頻域信號之一長度可等於該第一頻域信號之一長度。判定該全域對準可係基於該第一頻域信號與該第二頻域信號之間的一相關性。
判定該複數個子頻帶中的每一者之該振幅可包括判定在該複數個子頻帶中之至少一者內的該第一頻域信號之至少一個頻率索引的一平均振幅。具有兩個或兩個以上頻率索引之一子頻帶的平均振幅可為 該子頻帶中的第一頻率索引與最後頻率索引之一平均振幅。
判定對應於該複數個子頻帶之該複數個頻帶對準可包括基於該第一頻域信號之一部分與一全域移位頻域信號之一部分之間的一相關性判定一頻帶對準。
判定該複數個頻帶對準可包括依序移位該第一頻域信號之該部分及該全域移位頻域信號之該部分中之至少一者。可在圍繞一單位圓之單一旋轉內執行該依序移位。一移位解析度對於一較高子頻帶可較高。該複數個子頻帶可包括具有不均勻頻寬之一或多個子頻帶。
亦描述一種用於量化相位資訊之電子器件。該電子器件包括原型音調週期抽取電路,該原型音調週期抽取電路基於一語音信號判定一原型音調週期信號。該電子器件亦包括耦接至該原型音調週期抽取電路之頻域變換電路。該頻域變換電路將該原型音調週期信號變換成一第一頻域信號。該電子器件進一步包括耦接至該頻域變換電路之振幅變換電路。該振幅變換電路將該第一頻域信號映射至複數個子頻帶中。該電子器件額外包括耦接至該頻域變換電路之全域對準搜尋電路。該全域對準搜尋電路基於該第一頻域信號判定一全域對準。該電子器件亦包括耦接至該全域對準搜尋電路之頻帶對準搜尋電路。該頻帶對準搜尋電路判定對應於該複數個子頻帶之複數個頻帶對準。該電子器件進一步包括耦接至該全域對準搜尋電路之全域對準量化器電路。該全域對準量化器電路利用純量量化來量化該全域對準以獲得一經量化全域對準。該電子器件額外包括耦接至該頻帶對準搜尋電路之頻帶對準量化器電路。該頻帶對準量化器電路利用向量量化來量化該複數個頻帶對準以獲得複數個經量化頻帶對準。該電子器件亦包括傳輸器電路,該傳輸器電路傳輸該經量化全域對準及該複數個經量化頻帶對準。
亦描述一種用於量化相位資訊之電腦程式產品。該電腦程式產 品包括具有指令之一非暫時性有形電腦可讀媒體。該等指令包括用於使得一電子器件獲得一語音信號之程式碼。該等指令亦包括用於使得該電子器件基於該語音信號判定一原型音調週期信號之程式碼。該等指令進一步包括用於使得該電子器件將該原型音調週期信號變換成一第一頻域信號之程式碼。該等指令額外包括用於使得該電子器件將該第一頻域信號映射至複數個子頻帶中之程式碼。該等指令亦包括用於使得該電子器件基於該第一頻域信號判定一全域對準之程式碼。該等指令進一步包括用於使得該電子器件利用純量量化來量化該全域對準以獲得一經量化全域對準之程式碼。該等指令額外包括用於使得該電子器件判定對應於該複數個子頻帶之複數個頻帶對準之程式碼。該等指令亦包括用於使得該電子器件利用向量量化來量化該複數個頻帶對準以獲得複數個經量化頻帶對準之程式碼。該等指令進一步包括用於使得該電子器件傳輸該經量化全域對準及該複數個經量化頻帶對準之程式碼。
亦描述一種用於量化相位資訊之裝置。該裝置包括用於獲得一語音信號之構件。該裝置亦包括用於基於該語音信號判定一原型音調週期信號之構件。該裝置進一步包括用於將該原型音調週期信號變換成一第一頻域信號之構件。該裝置額外包括用於將該第一頻域信號映射至複數個子頻帶中之構件。該裝置亦包括用於基於該第一頻域信號判定一全域對準之構件。該裝置進一步包括用於利用純量量化來量化該全域對準以獲得一經量化全域對準之構件。該裝置額外包括用於判定對應於該複數個子頻帶之複數個頻帶對準之構件。該裝置亦包括用於利用向量量化來量化該複數個頻帶對準以獲得複數個經量化頻帶對準之構件。該裝置進一步包括用於傳輸該經量化全域對準及該複數個經量化頻帶對準之構件。
102‧‧‧語音信號
104‧‧‧編碼器
106‧‧‧經編碼語音信號
108‧‧‧解碼器
110‧‧‧經解碼語音信號
202‧‧‧語音信號
204‧‧‧編碼器
208‧‧‧解碼器
210‧‧‧經解碼語音信號
212‧‧‧分析模組
214‧‧‧係數變換
216‧‧‧量化器A
218‧‧‧反量化器A
220‧‧‧反係數變換A
222‧‧‧分析濾波器
224‧‧‧量化器B
226‧‧‧經編碼激發信號
228‧‧‧濾波器參數
230‧‧‧反量化器B
232‧‧‧激發信號
234‧‧‧合成濾波器
236‧‧‧反量化器C
238‧‧‧反係數變換B
302‧‧‧語音信號
304‧‧‧編碼器
340‧‧‧音調估計器
342‧‧‧音調滯後
344‧‧‧PPP信號
346‧‧‧頻域變換模組
348‧‧‧全域對準
350‧‧‧全域對準量化器
352‧‧‧頻帶對準
354‧‧‧頻帶對準量化器
356‧‧‧振幅
358‧‧‧振幅量化器
360‧‧‧經量化全域對準
362‧‧‧經量化頻帶對準
364‧‧‧經量化振幅
366‧‧‧振幅變換模組
368‧‧‧頻帶對準搜尋模組
370‧‧‧全域對準搜尋模組
372‧‧‧成框及預處理模組
374‧‧‧經預處理之語音信號
376‧‧‧分析模組
378‧‧‧係數變換
380‧‧‧量化器
382‧‧‧經量化LSF向量
384‧‧‧合成濾波器
386‧‧‧全域移位頻域信號
388‧‧‧頻域信號
390‧‧‧殘餘信號
392‧‧‧PPP抽取模組
394‧‧‧振幅經量化之PPP信號
396‧‧‧電子器件
400‧‧‧用於量化相位資訊之方法
501‧‧‧電子器件
503‧‧‧解碼器
505‧‧‧LSF向量解量化器
507‧‧‧LSF向量
509‧‧‧反係數變換
511‧‧‧係數
513‧‧‧合成濾波器
515‧‧‧經解碼語音信號
517‧‧‧振幅解量化器
519‧‧‧頻帶對準解量化器
521‧‧‧全域對準解量化器
523‧‧‧經解量化之振幅
525‧‧‧經解量化之頻帶對準
527‧‧‧經解量化之全域對準
529‧‧‧PPP信號重建構及激發信號產生模組
531‧‧‧激發信號
542‧‧‧音調滯後
560‧‧‧經量化全域對準
562‧‧‧經量化頻帶對準
564‧‧‧經量化振幅
582‧‧‧經量化LSF向量
600‧‧‧用於解量化相位資訊之方法
733‧‧‧DTFS變換
735‧‧‧第一頻域信號
737‧‧‧子頻帶映射模組
739‧‧‧子頻帶
741‧‧‧振幅判定模組
743‧‧‧振幅經量化之PPP信號
744‧‧‧PPP信號
745‧‧‧DTFS產生模組
747‧‧‧第二頻域信號
748‧‧‧全域對準
749‧‧‧全域對準判定模組
750‧‧‧全域對準量化器
751‧‧‧全域移位頻域信號
752‧‧‧頻帶對準
753‧‧‧頻帶對準判定模組
754‧‧‧頻帶對準量化器
755‧‧‧碼簿
756‧‧‧振幅
758‧‧‧振幅量化器
760‧‧‧經量化全域對準
762‧‧‧經量化頻帶對準
764‧‧‧經量化振幅
800‧‧‧用於量化相位資訊之方法
957‧‧‧先前訊框PPP信號
959‧‧‧當前訊框PPP信號
961‧‧‧語音或殘餘信號
963‧‧‧先前訊框
965‧‧‧當前訊框
1067a‧‧‧子頻帶A
1067j‧‧‧子頻帶J
1067n‧‧‧子頻帶N
1069‧‧‧頻率
1171‧‧‧第一頻域信號之時域版本
1173‧‧‧第二頻域信號之時域版本
1175‧‧‧全域移位頻域信號之時域版本
1177‧‧‧時間
1179‧‧‧全域對準
1181‧‧‧相移
1267‧‧‧子頻帶
1269‧‧‧頻率
1283a‧‧‧索引A
1283b‧‧‧索引B
1283c‧‧‧索引C
1283d‧‧‧索引D
1389‧‧‧多次旋轉頻帶對準
1389a‧‧‧EVRC頻帶對準
1391‧‧‧單次旋轉頻帶對準
1393‧‧‧頻帶對準索引/角
1393a‧‧‧頻帶對準索引/角
1489‧‧‧多次旋轉頻帶對準
1493‧‧‧頻帶對準索引/角
1495‧‧‧具有較高相關性之頻帶對準索引
1497‧‧‧出現次數(概率)
1499‧‧‧頻帶對準索引
1591‧‧‧單次旋轉頻帶對準
1593‧‧‧頻帶對準索引/角
1595‧‧‧具有較高相關性之頻帶對準索引
1597‧‧‧出現次數(概率)
1599‧‧‧頻帶對準索引
1602‧‧‧揚聲器
1604‧‧‧聽筒
1606‧‧‧輸出插口
1608‧‧‧麥克風
1610‧‧‧音訊編解碼器
1612‧‧‧應用處理器
1614‧‧‧基頻處理器
1616‧‧‧射頻收發器
1618‧‧‧功率放大器
1620‧‧‧天線
1622‧‧‧電力管理電路
1624‧‧‧電池組
1626‧‧‧輸入器件
1628‧‧‧輸出器件
1630‧‧‧應用記憶體
1632‧‧‧顯示控制器
1634‧‧‧顯示器
1638‧‧‧基頻記憶體
1640‧‧‧無線通信器件
1654‧‧‧頻帶對準量化器
1668‧‧‧頻帶對準搜尋模組
1756‧‧‧電子器件
1758‧‧‧記憶體
1760a‧‧‧指令
1760b‧‧‧指令
1762a‧‧‧資料
1762b‧‧‧資料
1764‧‧‧處理器
1766‧‧‧匯流排系統
1768‧‧‧通信介面
1770‧‧‧輸入器件
1772‧‧‧麥克風
1774‧‧‧輸出器件
1776‧‧‧揚聲器
1778‧‧‧顯示器
1780‧‧‧顯示控制器
圖1為說明編碼器及解碼器之通用實例之方塊圖;圖2為說明編碼器及解碼器之一基本實施之一實例的方塊圖;圖3為說明一電子器件之一個組態的方塊圖,在該電子器件中可實施用於量化相位資訊之系統及方法;圖4為說明用於量化相位資訊之方法之一個組態的流程圖;圖5為說明經組態以用於解量化相位資訊之電子器件之一個組態的方塊圖;圖6為說明用於解量化相位資訊之方法之一個組態的流程圖;圖7為說明可用於振幅映射及相位對準搜尋之若干模組之一個組態的方塊圖;圖8為說明用於量化相位資訊之方法之一更特定組態的流程圖;圖9為說明語音或殘餘信號之一個實例的曲線圖;圖10為說明將一第一頻域信號映射至不均勻子頻帶的實例之圖;圖11為說明全域對準之一個實例的圖;圖12為說明用於子頻帶之頻帶對準之一個實例的圖;圖13為說明根據本文中所揭示之系統及方法的多次旋轉頻帶對準之一個實例及單次旋轉頻帶對準之一個實例的圖;圖13A為說明增強型可變速率編解碼器(EVRC)頻帶對準之一個實例的圖;圖14為說明多次旋轉頻帶對準之一更特定實例的圖;圖15為說明單次旋轉頻帶對準之一更特定實例的圖;圖16為說明一無線通信器件之一個組態的方塊圖,在該無線通信器件中可實施用於量化及解量化相位資訊之系統及方法;及圖17說明可用於電子器件中之各種組件。
現參考諸圖描述各種組態,在諸圖中,相似參考數字可指示功能上類似之元件。可以多種不同組態來配置及設計如諸圖中所大體描述及說明之系統及方法。因此,對如諸圖中所表示之若干組態的以下更詳細描述並不意欲限制如所主張之範疇,而僅表示系統及方法。
圖1為說明編碼器104及解碼器108之通用實例之方塊圖。編碼器104接收語音信號102。語音信號102可為在任何頻率範圍中的語音信號。舉例而言,語音信號102可為具有0千赫茲(kHz)至24kHz之大致頻率範圍的全頻帶信號、具有0千赫茲(kHz)至16kHz之大致頻率範圍的超寬頻信號、具有0kHz至8kHz之大致頻率範圍的寬頻信號、具有0kHz至4kHz之大致頻率範圍的窄頻信號、具有50赫茲(Hz)至300Hz之大致頻率範圍的低頻信號或具有4kHz至8kHz之大致頻率範圍之高頻信號。語音信號102之其他可能頻率範圍包括300Hz至3400Hz(例如,公眾交換電話網路(PSTN)之頻率範圍)、14kHz至20kHz、16kHz至20kHz及16kHz至32kHz。在一些組態中,語音信號102可以16kHz進行取樣,且可具有0kHz至8kHz之大致頻率範圍。
編碼器104對語音信號102進行編碼以產生經編碼語音信號106。大體而言,經編碼語音信號106包括表示語音信號102之一或多個參數。該等參數中之一或多者可經量化。該一或多個參數之實例包括濾波參數(例如,加權因數、線譜頻率(LSF)、線譜對(LSP)、導抗譜頻率(ISF)、導抗譜對(ISP)、部分相關性(PARCOR)係數、反射係數及/或對數面積比率值(log-area-ratio value),等),及包括於經編碼激發信號中的參數(例如,經量化振幅、經量化全域對準、經量化頻帶對準、音調,等)。該等參數可對應於一或多個頻帶。解碼器108對經編碼語音信號106進行解碼以產生經解碼語音信號110。舉例而言,解碼器108基於包括於經編碼語音信號106中的一或多個參數而建構經解碼語音信號110。經解碼語音信號110可為原始語音信號102之大致重 現。
編碼器104可以硬體(例如,電路)、軟體或兩者的組合加以實施。舉例而言,編碼器104可實施為特殊應用積體電路(ASIC)或具有指令之處理器。類似地,解碼器108可以硬體(例如,電路)、軟體或兩者的組合加以實施。舉例而言,解碼器108可實施為特殊應用積體電路(ASIC)或具有指令之處理器。編碼器104與解碼器108可實施於單獨電子器件上或相同電子器件上。
在一些組態中,編碼器104及/或解碼器108可包括於語音寫碼系統中,在該語音寫碼系統處,藉由使激發信號傳遞經過合成濾波器以產生經合成語音輸出(例如,經解碼語音信號110)而進行語音合成。在此類系統中,編碼器104接收語音信號102,接著將語音信號102開窗成訊框(例如,20毫秒(ms)訊框),並產生合成濾波參數及產生對應激發信號所需之參數。此等參數可作為經編碼語音信號106而傳輸至解碼器。解碼器108可使用此等參數來產生合成濾波器(例如,1/A(z))及對應激發信號,且可將該激發信號傳遞經過合成濾波器以產生經解碼語音信號110。圖1可為此類語音編碼器/解碼器系統之簡化方塊圖。
圖2為說明編碼器204及解碼器208之一基本實施之一實例的方塊圖。編碼器204可為結合圖1描述之編碼器104之一個實例。編碼器204可包括分析模組212、係數變換214、量化器A 216、反量化器A 218、反係數變換A 220、分析濾波器222及量化器B 224。編碼器204及/或解碼器208之組件中之一或多者可以硬體(例如,電路)、軟體或兩者的組合加以實施。
編碼器204接收語音信號202。應注意,語音信號202可包括如上文結合圖1所述之任何頻率範圍(例如,語音頻率之整個頻帶或語音頻率之子頻帶)。
在此實例中,分析模組212將語音信號202之頻譜包封編碼為一組線性預測(LP)係數(例如,分析濾波器係數A(z)、其可應用於產生全極濾波器1/A(z),其中z為複數(complex number))。分析模組212通常將輸入信號處理為語音信號202之一系列非重疊訊框,其中針對每一訊框或子訊框計算一組新係數。在一些組態中,訊框週期可為可預期語音信號202在其內在本端靜止之週期。訊框週期之一個常見實例為20ms(例如,在8kHz之取樣率下等效於160個樣本)。在一個實例中,分析模組212經組態以計算一組十個線性預測係數來表徵每一20ms訊框之共振峰結構。亦有可能實施分析模組212以將語音信號202處理為一系列重疊訊框。
分析模組212可經組態以直接分析每一訊框之樣本,或可首先根據開窗函數(例如,漢明窗(Hamming window))來對樣本進行加權。亦可在大於訊框之窗(諸如30ms窗)內執行分析。此窗可為對稱的(例如,5-20-5,使得其緊接20ms訊框之前及之後包括5毫秒)或不對稱的(例如,10-20,使得其包括前一訊框之後10ms)。分析模組212通常經組態以使用列文遜-杜賓(Levinson-Durbin)遞迴或勒魯-蓋恩(Leroux-Gueguen)演算法來計算線性預測係數。在另一實施中,分析模組可經組態以針對每一訊框計算一組倒頻譜係數而非一組線性預測係數。
藉由量化該等係數,編碼器204之輸出速率可顯著減小,而對重現品質具有相對較小的影響。線性預測係數難以有效地量化,且通常映射至諸如LSF之另一表示以用於量化及/或熵編碼。在圖2之實例中,係數變換214將係數之組變換成對應LSF向量(例如,一組LSF)。係數之其他一對一表示包括LSP、PARCOR係數、反射係數、對數面積比率值、ISP及ISF。舉例而言,ISF可用於GSM(全球行動通信系統)、AMR-WB(自適應性多速率寬頻)編解碼器中。為方便起見,術語「線譜頻率」、「LSF」、「LSF向量」及相關術語可用以指LSF、 LSP、ISF、ISP、PARCOR係數、反射係數及對數面積比率值中之一或多者。通常,一組係數與對應LSF向量之間的變換係可逆的,但一些組態可包括其中變換不可逆而無錯誤之編碼器204實施。
量化器A 216經組態以量化LSF向量(或其他係數表示)。編碼器204可輸出此量化之結果作為濾波參數228。量化器A 216通常包括向量量化器,該向量量化器將輸入向量(例如,LSF向量)編碼為對表或碼簿中的對應向量條目之索引。
如圖2中所見,編碼器204亦藉由使語音信號202傳遞經過根據係數之集合加以組態之分析濾波器222(亦稱為白化或預測錯誤濾波器)而產生殘餘信號。分析濾波器222可實施為有限脈衝回應(FIR)濾波器或無限脈衝回應(IIR)濾波器。此殘餘信號將通常含有未表示於濾波參數228中的語音訊框之對感知重要的資訊,諸如與音調相關之長期結構。量化器B 224經組態以計算此殘餘信號之經量化表示用於作為經編碼激發信號226而輸出。在一些組態中,量化器B 224包括向量量化器,該向量量化器將輸入向量編碼為表或碼簿中的對應向量條目之索引。另外或替代地,量化器B 224可經組態以發送一或多個參數,向量可在解碼器處自該一或多個參數動態地加以產生,而非如在稀疏碼簿方法中自儲存器擷取。此類方法用於諸如代數CELP(碼激發線性預測)之寫碼方案及諸如3GPP2(第三代合作夥伴2)EVRC(增強型可變速率編解碼器)之編解碼器中。在一些組態中,經編碼激發信號226及濾波參數228可包括於經編碼語音信號106中。
編碼器204根據對應解碼器208將可獲得的相同濾波器參數值來產生經編碼激發信號226可為有益的。以此方式,所得經編碼激發信號226可在一定程度上解決彼等參數值中的非理想性,諸如量化錯誤。因此,使用將在解碼器208處可用的相同係數值來組態分析濾波器222可為有益的。在如圖2中所說明的編碼器204之基本實例中,反 量化器A 218對濾波參數228進行解量化。反係數變換A 220將所得值映射回至一組對應係數。此組係數用以組態分析濾波器222以產生藉由量化器B 224量化之殘餘信號。
編碼器204之一些實施經組態以藉由在最佳地匹配殘餘信號之一組碼簿向量當中識別一個碼簿向量來計算經編碼激發信號226。然而,應注意,編碼器204亦可經實施以計算殘餘信號之經量化表示而不實際上產生該殘餘信號。舉例而言,編碼器204可經組態以使用數個碼簿向量產生對應合成信號(例如,根據一組當前濾波參數)且選擇與最佳地匹配感知加權域中的原始語音信號202之所產生信號相關聯的碼簿向量。
解碼器208可包括反量化器B 230、反量化器C 236、反係數變換B 238及合成濾波器234。反量化器C 236對濾波參數228(例如,LSF向量)進行解量化,且反係數變換B 238將LSF向量變換成一組係數(例如,如上文參考編碼器204之反量化器A 218及反係數變換A 220所描述)。反量化器B 230對經編碼激發信號226進行解量化以產生激發信號232。基於該等係數及激發信號232,合成濾波器234合成經解碼語音信號210。換言之,合成濾波器234經組態以根據經解量化之係數在光譜上對激發信號232進行塑形以產生經解碼語音信號210。在一些組態中,解碼器208亦可將激發信號232提供至另一解碼器,該另一解碼器可使用激發信號232來導出另一頻帶(例如,高頻帶)之激發信號。在一些實施中,解碼器208可經組態以將關於激發信號232之額外資訊(諸如頻譜傾斜、音調增益及滯後以及語音模式)提供至另一解碼器。
具有編碼器204及解碼器208之系統為合成式分析語音編解碼器之基本實例。碼簿激發線性預測寫碼為合成式分析寫碼之一個風行家庭。此類寫碼器之實施可執行殘餘之波形編碼,包括諸如自固定及自適應性碼簿選擇輸入項、錯誤最小化操作及/或感知加權操作之操 作。合成式分析寫碼之其他實施包括混合激發線性預測(MELP)、代數CELP(ACELP)、鬆弛CELP(RCELP)、規則脈衝激發(RPE)、多脈衝激發(MPE)、多脈衝CELP(MP-CELP),及向量總和激發線性預測(VSELP)寫碼。相關寫碼方法包括多頻帶激發(MBE)及原型波形內插(PWI)寫碼。標準化合成式分析語音編解碼器之實例包括ETSI(歐洲電信標準協會)-GSM全速率編解碼器(GSM 06.10)(其使用殘餘激發線性預測(RELP))、GSM增強型全速率編解碼器(ETSI-GSM 06.60)、ITU(國際電信聯盟)標準11.8kbps G.729 Annex E譯碼器、用於IS-136(分時多重存取方案)之IS(臨時標準)-641編解碼器、GSM自適應性多速率(GSM-AMR)編解碼器及4GVTM(第四代VocoderTM)編解碼器(QUALCOMM公司,加利福尼亞州聖地牙哥)。可根據此等技術中之任一者或將語音信號表示為(A)描述濾波器之一組參數及(B)用以驅動所述濾波器以重現該語音信號之激發信號的任何其他語音寫碼技術(不管已知或是待開發)來實施編碼器204及對應解碼器208。
即使在分析濾波器222已自語音信號202移除粗糙的頻譜包封之後,大量精細諧波結構亦可保留,對於有聲語音尤其如此。週期性結構與音調有關,且由相同說話者說出之不同有聲聲音可具有不同共振峰結構但具有類似的音調結構。
可藉由使用一或多個參數值對音調結構之特性進行編碼來提高寫碼效率及/或語音品質。音調結構之一個重要特性為第一諧波之頻率(亦稱為基本頻率),其通常在60赫茲(Hz)至400Hz之範圍內。此特性通常編碼為基本頻率之倒數,亦稱為音調滯後。音調滯後指示一個音調週期中的樣本之數目,且可編碼為一或多個碼簿索引。來自男性說話者之語音信號傾向於比來自女性說話者之語音信號具有更大音調滯後。
編碼器204可包括經組態以對語音信號202之長期諧波結構進行 編碼之一或多個模組。在一些方法中,編碼器204包括開環LPC分析模組,其對短期特性或粗糙的頻譜包絡進行編碼。短期特性被編碼為係數(例如,濾波器參數)。其他特性可被編碼為參數(諸如音調滯後、振幅及相位(例如,全域對準及頻帶對準))之值。舉例而言,編碼器204可經組態而以包括一或多個碼簿索引之形式輸出經編碼激發信號226。殘餘信號之此經量化表示之計算(例如,藉由量化器B 224)可包括選擇此等索引及計算此等值。音調結構之編碼可包括音調原型波形之內插,其操作可包括計算連續音調脈衝之間的差。對於對應於無聲語音之訊框(其通常為雜訊樣且非結構化的)可停用長期結構之模型化。
解碼器208之一些實施可經組態以在已恢復長期結構(音調或諧波結構)之後將激發信號232輸出至另一解碼器(例如,高頻帶解碼器)。舉例而言,此類解碼器可經組態以輸出激發信號232作為經編碼激發信號226之經解量化之版本。當然,亦有可能實施解碼器208使得另一解碼器執行經編碼激發信號226之反量化以獲得激發信號232。
在一些組態中,編碼器204可利用原型音調週期編碼技術。原型音調週期編碼技術利用以下事實:有聲語音通常本質上為週期性的。詳言之,有聲語音傾向於包括在時間上(例如,在一訊框內)並不快速改變的重複循環。此等重複循環稱為「音調循環」,此係因為其以有聲語音之基本頻率或音調而重複。原型音調週期編碼技術抽取且編碼每一訊框之代表性音調循環。代表性音調循環稱為原型音調週期(PPP)信號。經編碼PPP信號可傳輸至解碼器208(例如,作為經編碼激發信號226之部分),其可藉由在PPP信號之間內插音調循環而重建構或合成語音。
本文中所揭示之系統及方法之一些組態基於新頻帶對準搜尋策略而提供PPP信號編碼之位元速率減小。在一些基於PPP之語音寫碼 系統中,諸如在EVRC規範中,每一語音訊框之僅最後PPP信號經量化且傳輸至解碼器。解碼器可利用波形內插技術來基於當前訊框PPP信號(例如,當前訊框之最後PPP信號)及先前訊框PPP信號(例如,先前訊框之最後PPP信號)產生一經解碼訊框。此可減小寫碼系統之平均位元速率。在EVRC全速率PPP信號量化中,PPP信號經量化,且振幅及相位資訊兩者皆傳輸至解碼器。在EVRC中,振幅資訊經向量量化,但相位資訊係使用純量量化而加以量化。與向量量化相比,純量量化可能需要較高數目個位元用於相位量化。
圖3為說明電子器件396之一個組態的方塊圖,在電子器件396中可實施用於量化相位資訊之系統及方法。電子器件396之實例包括智慧型手機、行動電話、固定電話、耳機、桌上型電腦、膝上型電腦、電視、遊戲系統、音訊記錄器、攝錄影機、靜態相機、汽車控制台,等。可根據結合圖3描述之編碼器304實施上文所述之編碼器中之一或多者。如本文所使用,術語「相位資訊」可為指示對應於PPP信號之時序或相位(例如,頻帶對準)的資訊。
圖3中所說明之編碼器304利用根據本文中所揭示之系統及方法的PPP信號編碼技術。在此實例中,編碼器304包括成框及預處理模組372、分析模組376、係數變換378、量化器380、分析濾波器384、音調估計器340、PPP抽取模組392、頻域變換模組346、振幅變換模組366、全域對準搜尋模組370、頻帶對準搜尋模組368、全域對準量化器350、頻帶對準量化器354及/或振幅量化器358。應注意,編碼器304及編碼器304之組件中之一或多者可以硬體(例如,電路)、軟體或兩者的組合加以實施。舉例而言,頻帶對準搜尋模組368及/或頻帶對準量化器354可以硬體(例如,電路)、軟體或兩者的組合加以實施。應注意,本文中的方塊圖中之線或箭頭可指代組件或元件之間的耦接。舉例而言,頻帶對準搜尋模組368可耦接至頻帶對準量化器354。
語音信號302(例如,輸入語音 s )可為含有語音資訊之電子信號。舉例而言,可藉由麥克風捕獲聲波語音信號且對其進行取樣以產生語音信號302。在一些組態中,語音信號302可以16kbps進行取樣。或者,電子器件396可自另一器件(例如,藍芽耳機)接收語音信號302。語音信號302可包含如上文結合圖1所描述之頻率範圍。
語音信號302可提供至成框及預處理模組372。成框及預處理模組372可將語音信號302劃分成一系列訊框。每一訊框可為一特定時段。舉例而言,每一訊框可對應於語音信號302之20ms。成框及預處理模組372可對語音信號執行其他操作,諸如濾波(例如,低通、高通及帶通濾波中之一或多者)。因此,成框及預處理模組372可基於語音信號302產生經預處理之語音信號374(例如,S(p),其中p為樣本編號)。
分析模組376可判定一組係數(例如,線性預測分析濾波器A(z))。舉例而言,分析模組376可將經預處理之語音信號374之頻譜包絡編碼為如結合圖2所描述之一組係數。
該等係數可提供至係數變換378。係數變換378將該組係數變換成如上文結合圖2所描述之對應LSF向量(例如,LSF、LSP、ISF、ISP,等)。
LSF向量提供至量化器380。量化器380將LSF向量量化成經量化LSF向量382。舉例而言,量化器可對LSF向量執行向量量化以產生經量化LSF向量382。在一些組態中,可在子訊框基礎上產生及/或量化LSF向量。在此等組態中,僅對應於某些子訊框(例如,每一訊框之最後或末端子訊框)之經量化LSF向量可發送至解碼器。經量化LSF向量382可為上文結合圖2所述之濾波器參數228之一個實例。
經量化LSF向量382用以界定分析濾波器384。分析濾波器384產生殘餘信號390。舉例而言,分析濾波器384基於經量化LSF向量 382(例如,A(z))對經預處理之語音信號374進行濾波。
在一些組態中,可以開環方式實現PPP量化。舉例而言,可能不像在ACELP激發搜尋中那般存在錯誤最小化。分析模組376可計算LSF向量。經量化LSF向量382可用以產生分析濾波器384。將經預處理之語音信號374傳遞經過分析濾波器可產生殘餘信號390。殘餘信號390可用以抽取原型音調週期激發信號。
殘餘信號390提供至音調估計器340及PPP抽取模組392。音調估計器340基於該殘餘信號390判定音調滯後342。舉例而言,音調估計器340可估計殘餘信號390中的一對音調峰值之間的距離(例如,以樣本數計),其近似於音調滯後342。在一些組態中,音調估計器340可替代地基於語音信號302或經預處理之語音信號374判定音調滯後342。音調滯後342可提供至PPP抽取模組392。
PPP抽取模組392基於語音信號302判定PPP信號344。舉例而言,PPP抽取模組392基於音調滯後342及殘餘信號390判定PPP信號344。大體而言,PPP信號為信號之一個音調循環。舉例而言,PPP信號344可為殘餘信號390之訊框中的最後音調循環。在一些組態中,PPP抽取模組392可替代地判定語音信號302或經預處理之語音信號374之PPP信號344。PPP信號344可提供至頻域變換模組346。
頻域變換模組346可將PPP信號344變換成第一頻域信號388(例如,目標PPP信號)。變換PPP信號344可包括判定PPP信號344之離散時間傅立葉級數(DTFS或DFS)或對PPP信號344執行離散傅立葉變換(DFT)。舉例而言,頻域變換模組346可根據方程式(1)而操作。
在方程式(1)中,x(m)為具有長度L之PPP信號344,m為PPP信號344之樣本索引,i為頻率索引(其中0 i<L),j為虛數單位,且X T (i)為 第一頻域信號388(例如,x(m)之DTFS)。應注意,X T 為複合向量,且可表示為實向量X T .a與虛向量X T .b之總和,使得X T =X T .a+jX T .b。第一頻域信號388(例如,X T )可稱為「目標PPP信號」。頻率索引i處的每一DTFS分量X T (i)具有一振幅及相位。在DTFS中,每一分量對應於單一頻率或頻率索引。應注意,第一頻域信號之頻率索引之數目與PPP信號344之持續時間或長度(例如,L)(其為訊框之音調滯後342)相同。注意,歸因於實信號之傅立葉級數或傅立葉變換之對稱性,X T (i)之約一半分量足以重建構其餘一半係數。亦應注意,DFT類似於離散時間傅立葉變換(DTFT),惟假定用於DFT之原始信號(例如,x(m))為週期性的,而用於DTFT之原始信號可為非週期性的除外。
第一頻域信號388可提供至振幅變換模組366及全域對準搜尋模組370。振幅變換模組366可將第一頻域信號388(例如,X T )映射至複數個子頻帶中。舉例而言,振幅變換模組366可將第一頻域信號之頻率索引(i)分群成多個子頻帶(例如,頻率區間)。「頻率區間」可為頻率範圍或頻帶(例如,子頻帶)。在一些組態中,複數個子頻帶可包括具有不均勻頻寬(例如,根據感知尺度)之一或多個子頻帶。舉例而言,較高子頻帶可相對於較低子頻帶具有較寬頻寬。舉例而言,較高子頻帶可比較低子頻帶包括X T 之更多頻率索引。映射第一頻域信號388可係基於第一頻域信號之長度(例如,L)(例如,映射可基於L而不同)。
振幅變換模組366可基於包括於每一子頻帶(例如,頻率區間)中的頻率索引而判定每一子頻帶之振幅。舉例而言,每一子頻帶之振幅可為對應於包括於每一子頻帶中的頻率索引之平均振幅。舉例而言,具有兩個或兩個以上頻率索引之子頻帶的振幅可為第一頻率索引與最後頻率索引之平均振幅。具有僅一個頻率索引之每一子頻帶的振幅可為該頻率索引i之振幅。或者,每一子頻帶(例如,頻率區間)之振幅可 為對應於該區間之中間頻率的內插振幅。可基於圍繞子頻帶中點之DTFS分量的兩個振幅來完成內插。可捨棄每一子頻帶之相位。舉例而言,將每一子頻帶之相位設定為0。
如上文所描述,振幅變換模組366可判定振幅356。振幅變換模組366可將振幅356(例如,振幅向量)提供至振幅量化器358。舉例而言,振幅變換模組366可提供第一頻域信號388(例如,X T )、全域移位頻域信號(例如,X GS )或頻帶經移位頻域信號(例如,X BS )之振幅356(例如,頻域中的振幅頻譜)。舉例而言,振幅變換模組366可如上文所描述判定對應於子頻帶中的每一者的平均振幅,且將振幅356提供至振幅量化器358。
振幅量化器358可利用向量量化來量化振幅356以獲得經量化振幅364。舉例而言,振幅量化器358可判定對應於碼簿或查找表中的最佳地匹配振幅356之向量的索引。經量化振幅364可為至碼簿或查找表之索引。經量化振幅364可發送至解碼器。舉例而言,編碼器304可將經量化振幅364作為位元串流之部分提供至傳輸器,該傳輸器可將該位元串流傳輸至包括解碼器之電子器件。
振幅量化器358亦可產生振幅經量化之PPP信號394。舉例而言,振幅量化器358可基於對應於第一頻域信號388之振幅356而產生振幅經量化之PPP信號394。振幅經量化之PPP信號394可為具有經量化振幅之頻域信號。振幅經量化之PPP信號394可提供至全域對準搜尋模組370。
全域對準搜尋模組370可判定兩個頻域PPP信號之間的全域對準348。詳言之,全域對準搜尋模組370可藉由頻域移位而對準時域中的兩個PPP信號。或者,全域對準搜尋模組370可藉由採用時域相關性而對準時域中的兩個PPP信號。可在兩個步驟中執行相位對準。可首先如下判定全域對準348。
全域對準搜尋模組370可基於振幅經量化之PPP信號394而產生第二頻域信號(例如,另一DTFS X C )該第二頻域信號之頻率索引的數目可與第一頻域信號之頻率索引的數目(例如,L)相同。第二頻域信號之所有頻率索引之相位可為0。第二頻域信號之相同子頻帶中的頻率索引中的每一者之振幅可我相同的,且可為上文所述之每一子頻帶之振幅(例如,平均振幅)。在一些實施中,振幅量化之子頻帶結構可不同於頻帶對準搜尋之子頻帶結構。舉例而言,X C 之時域版本可大致類似於X T 之時域版本之經移位版本(但不完全類似,例如,此係因為存在一些基於頻帶之移位,在該等移位處,第二信號不完全等於第一信號之經移位版本)。此係因為已捨棄X C 中的相位資訊且子頻帶中的每一者之振幅為來自X T 之平均振幅。第二頻域信號(例如,X C )可稱為「當前PPP信號」。
全域對準搜尋模組370可基於第一頻域信號388(例如,X T )判定全域對準348(例如,S G )。舉例而言,全域對準搜尋模組370可判定對應於第一頻域信號388(例如,X T )與第二頻域信號(例如,X C )之最大相關性的移位。此移位為全域對準348。全域對準348可提供至全域對準量化器350。應注意,在頻域中計算相關性可減小計算複雜度(與時域相比),儘管此類似於計算兩個時域波形之相關。此外,可在頻域中計算相關性,此係因為缺少每一子頻帶之相對相位差。
全域對準量化器350可量化全域對準348以產生經量化全域對準360(例如,S GQ 樣本)。舉例而言,全域對準量化器350可利用純量量化來量化該全域對準348以獲得經量化全域對準360。舉例而言,全域量化器350可利用均勻或不均勻純量量化選擇一最佳經量化值(例如,最接近的經量化值或最小化錯誤量度之經量化值)以獲得經量化全域對準360。經量化全域對準360可提供(圖3中未展示)至全域對準搜尋模組370。經量化全域對準360可發送至解碼器。舉例而言,編碼器 304可將經量化全域對準360作為位元串流之部分提供至傳輸器,該傳輸器可將該位元串流傳輸至包括解碼器之電子器件。
全域對準搜尋模組370可判定全域移位頻域信號386(例如,X GS )。全域移位頻域信號386可係基於第二頻域信號。舉例而言,全域對準搜尋模組370可根據方程式(2)用一因數乘以第二頻域信號。
在方程式(2)中,X GS 為全域移位頻域信號386,X C 為第二頻域信號,S GQ 為經量化全域對準360,且0 i<L。全域移位頻域信號386可提供至頻帶對準搜尋模組368。應注意,在頻域中乘以線性相位等效於時域中的循環移位。根據經量化全域對準360移位第二頻域信號可能不準確地得出第一頻域信號之所有諧波的相位的近似值。因此,頻帶對準搜尋模組368可如下判定頻帶對準352。
頻帶對準搜尋模組368可判定對應於該複數個子頻帶之複數個頻帶對準352。每一頻帶對準352可為全域移位頻域信號386(例如,X GS )之每一子頻帶中的第一頻率索引之相移。舉例而言,針對藉由感知尺度界定之頻率子頻帶執行頻帶對準索引之搜尋。一已知方法(例如,EVRC規範)在搜尋頻帶對準時允許圍繞單位圓之多次旋轉。在一些情況下,此藉由圍繞單位圓之多次旋轉而導致較低解析度搜尋。相比之下,本文中所揭示之系統及方法在搜尋頻帶對準時僅允許圍繞單位圓之單次旋轉。在一些情況下,此藉由圍繞單位圓之僅單次旋轉而導致較高解析度搜尋。
為了清楚起見,下文給出用於根據EVRC規範之頻帶對準搜尋的已知方法之一個實例。在EVRC中,使用以下方程式(3)進行頻帶對準搜尋。
在方程式(3)中,band_alignment(j)為第j個子頻帶之頻帶對準。在此實例中,採用17個子頻帶,其中0 j<17。然而,子頻帶之數目 可取決於實施而不同。在方程式(3)中,。此外,n為 頻帶對準索引,其中,其中n以步階1增加。對於所有 執行方程式(3)中的求和,使得,其中k 為諧波編號,Fs為取樣頻率(例如,8000個樣本/秒),L為音調滯後,lband(j)為第j個子頻帶之下部頻率界限,且hbsnd(j)為待搜尋以用於頻帶對準之第j個子頻帶之上部頻率界限。在一個實例中,lband(j)=F_BAND[j]且hband(j)=F_BAND[j+1]。舉例而言,F_BAND[18]={0,200,300,400,500,600,850,1000,1200,1400,1600,1850,2100,2375,2650,2950,3250,4000}。若對於給定lband、hbandL,不存在 使得k,則band_alignment(j)=INVALID_ID
X GS .a(k)及X GS .b(k)為全域移位頻域信號386(例如,X GS )之DTFS係數。舉例而言,X GS .a(k)為實DTFS係數,且X GS .b(k)為X GS 之虛係數(例如,X GS =X GS .a(k)+jX GS .b(k))。X T .a(k)及X T .b(k)為第一頻域信號(例如,X T 或目標PPP信號)之DTFS係數。舉例而言,X T .a(k)為實DTFS係數,且X T .b(k)為X T 之虛係數(例如,X T =X T .a(k)+jX T .b(k))。在方程式(3)中, Θ為頻帶對準角,其中及Θ=2π對應於全周式旋轉。
在此實例中,針對每一子頻帶判定頻帶對準,且可藉由頻帶對準角Θ或藉由頻帶對準索引n表示頻帶對準。在EVRC中,頻帶對準索 引n與頻帶對準角Θ藉由而相聯繫。方程式(3)根據每一頻帶 對準索引n移位全域移位頻域信號(例如,X GS )之每一子頻帶j。藉由 選擇頻帶對準角而進行移位。方程式(3)判定導致X GS 之頻 帶經移位版本與每一子頻帶jX T 之間的最大相關性的頻帶對準索引n
Θ可改寫為,其中l {-16,-15,...,0,...,14,15}(對於j<3)且 l {-16.0,-15.5,-15.0,...,0,...,14.0,14.5,15.0,15.5}(對於j 3)。因此,l為步階為 1.0或0.5之自-16至16之搜尋範圍。可觀測到,在此實例中,項繞 回[0,2π]。特定言之,頻帶對準角Θ多次自角0增加,且圍繞原點經過角2π
舉例而言,考慮其中L=40、k=10、Fs=8000且j=11的情況。在此 情況下,。此使得Θ僅採用之倍數,其導致Θ繞回單 位圓且對於j=11僅以角進行搜尋。可對於所 有j 3搜尋類似角。結果,搜尋角在[0,2π]中不單調增加。對於一些音調滯後,此導致以相同頻帶對準角搜尋多次(對於多個頻帶對準索引值),其導致減小之搜尋解析度。
與已知方法相比,本文中所揭示之系統及方法之一些組態在搜尋頻帶對準時僅允許圍繞單位圓之單次旋轉。下文描述藉由本文中之系統及方法揭示之方法。
頻帶對準搜尋模組368可判定對應於該複數個子頻帶之複數個頻帶對準352。舉例而言,判定對應於複數個子頻帶之複數個頻帶對準352可包括對於該複數個子頻帶中之至少一者基於第一頻域信號388(例如,X T )之一部分與全域移位頻域信號386(例如,X GS )之一部分之間的相關性(例如,最大相關性)判定頻帶對準352。應注意,存在以下情況:DTFS無頻率索引落入給定子頻帶(例如,頻率區間)內。 舉例而言,可不針對無k之子頻帶(例如,頻率區間)判定頻帶對準。第一頻域信號之該部分可為頻率區間及/或子頻帶。此外,全域移位頻域信號386之該部分可為對應頻率區間及/或對應子頻帶。
判定該複數個頻帶對準352可包括依序移位該第一頻域信號之該部分及該全域移位頻域信號之該部分中之至少一者。舉例而言,依序移位可包括以頻帶對準索引(例如,n)或頻帶對準角(例如,)之順序移位全域移位頻域信號386之該部分(或第一頻域信號之該部分)。頻帶對準搜尋模組368可在圍繞單位圓之單次旋轉內執行依序移位。該依序移位可單調地增加。在一些組態中,移位解析度可基於子頻帶而變化。舉例而言,與較低子頻帶之移位解析度相比,移位解析度對於較高子頻帶可較高。舉例而言,頻帶對準索引(例如,n)或頻帶對準角(例如,)之順序可更緊密地間隔及/或可對於較高子頻帶包括更多頻帶對準索引或頻帶對準角。
單次旋轉可在範圍[0,2π]、[-π,π]或僅包括圍繞單位圓之單次旋轉的任何其他範圍內。應注意,範圍端點中之一或多者可或可不包括於該單次旋轉中。舉例而言,單次旋轉可在範圍[0,2π)或[-π,π)內。
在一些組態中,頻帶對準搜尋模組368可根據方程式(4)判定該複數個頻帶對準352。
方程式(4)中的項可類似於如上文所界定之方程式(3)中給出的對應項。然而,在方程式(4)中,頻帶對準角係如由方程式(5)所提供而界定。
在方程式(5)中,n為如上文所描述之頻帶對準索引,k為如上文所描述之諧波編號,N為頻帶對準索引之總數(例如,n [0,N-1]),且k ib 為每一子頻帶中的最小諧波編號。詳言之,k ib 為使得第k個DTFS分量對應於每一子頻帶內的頻率(在頻率lband(j)與hband(j)之間)的k之 最小值(例如,索引)。舉例而言,,其 中L為PPP信號中的樣本之數目(例如,音調滯後),且k為DTFS中的頻率索引。頻帶對準352可表示為頻帶對準角或頻帶對準索引n,頻帶對準角與頻帶對準索引n如由方程式(5)所說明而相聯繫。應注意,方程式(4)及方程式(5)可適用於任何取樣頻率Fs。在一些組態中,取樣頻率Fs對於窄頻語音(例如,根據原始EVRC規範)可設定為8000個樣本/秒。在其他組態中,取樣頻率Fs對於寬頻語音可為16000個樣本/秒(例如,但可利用不同慣例)。
頻帶對準搜尋模組368可根據方程式(4)搜尋複數個頻帶對準352。舉例而言,可如上文結合方程式(3)所描述而實現此搜尋,惟頻 帶對準角係根據方程式(5)而給出除外。一旦對於子頻帶判定出最大化全域移位頻域信號386(例如,X GS )與第一頻域信號388(例如,X T ) 之間的相關性之頻帶對準索引n,則按比例調整因數確保頻帶對 準角對於包括於給定子頻帶中的其餘頻率索引(例如,DTFS分量)線性地改變。因此,根據本文中所揭示之系統及方法的頻帶對準搜尋可確保線性地增加一或多個子頻帶中的相位。在一些組態中,頻帶對準搜尋模組368可基於頻帶對準352移位全域移位頻域信號386(例如,X GS )之每一頻帶以獲得頻帶經移位頻域信號(例如,X BS )。
應注意,根據頻帶對準搜尋(且例如根據方程式(5))判定頻帶對準352可為應用於PPP信號344之一個種類之量化。另外或替代地,判定全域對準348亦可認為係PPP信號344之量化。
本文中所揭示之頻帶搜尋方法消除了可反覆地繞回2π的已知頻帶對準搜尋方法的問題。此亦產出高斯式頻帶對準索引分佈,其致能對複數個頻帶對準352之向量量化。舉例而言,每一所得頻帶對準(例如,頻帶對準索引n或頻帶對準角)具有一概率分佈,使得其致能有效的向量量化。向量量化之實例包括任何類型之向量量化,諸如多階段向量量化、分裂向量量化、多階段向量量化與分裂向量量化兩者的組合或任何其他類型之向量量化。向量量化減小表示PPP信號之相位資訊所需的位元數目。此與使用純量量化之已知EVRC方法形成對比。對於純量量化,需要對於所有頻帶對準發送單獨索引。然而,向量量化利用索引間相關性,因此可減小量化對準索引所需要之有效位元數目。舉例而言,與EVRC方法相比,本文中所揭示之方法將用以傳輸頻帶對準之位元數目減少約40%。舉例而言,EVRC利用99個位元用於窄頻語音中的頻帶對準,而本文中所揭示之方法可僅利用61個位元對於寬頻語音而不使語音品質降級。因此,本文中所揭示之系統及方法可用以使用較少位元(與已知相位量化技術相比)量化PPP信號,且可因此減小PPP寫碼系統之位元速率。
頻帶對準352(例如,頻帶對準向量)可提供至頻帶對準量化器354。頻帶對準量化器354可利用向量量化來量化複數個頻帶對準352以獲得複數個經量化頻帶對準362。頻帶對準量化器354之實例包括任何類型之向量量化器(例如,多階段向量量化器、分裂量化器、組合多階段及分裂向量量化器或任何其他類型之向量量化器)。頻帶對準量化器354可判定對應於碼簿或查找表中的最佳地匹配頻帶對準352之向量的索引。經量化頻帶對準362可為至碼簿或查找表之索引。經量化頻帶對準362可發送至解碼器。舉例而言,編碼器304可將經量化頻帶對準362作為位元串流之部分提供至傳輸器,該傳輸器可將該位元串流傳輸至包括解碼器之電子器件。
應注意,經量化振幅364、經量化頻帶對準362、經量化全域對準360及音調滯後342可為包括於經編碼激發信號中的參數之實例,其可傳輸至包括解碼器之另一電子器件。舉例而言,經量化振幅364、經量化頻帶對準362、經量化全域對準360及音調滯後342可為包括於結合圖2描述之經編碼激發信號226中的參數之實例。另外或替代地,經量化LSF向量382、經量化振幅364、經量化頻帶對準362、經量化全域對準360及音調滯後342可包括於上文結合圖1所述之經編碼語音信號106中。舉例而言,電子器件396可傳輸及/或儲存經量化LSF向量382、經量化振幅364、經量化頻帶對準362、經量化全域對準360及音調滯後342中之一或多者。在一些組態中,可經由無線及/或有線網路(例如,蜂巢式網路、區域網路、網際網路,等)發送傳輸。舉例而言,電子器件396可包括傳輸經量化LSF向量382、經量化振幅364、經量化頻帶對準362、經量化全域對準360及音調滯後342中之一或多者的傳輸器(例如,傳輸器電路)。
圖4為說明用於量化相位資訊之方法400之一個組態的流程圖。可藉由電子器件396執行方法400。電子器件396可獲得語音信號(402)。舉例而言,電子器件396可捕獲聲波語音信號且對其進行取樣以產生如結合圖3所描述之語音信號302。
電子器件396可基於語音信號302判定PPP信號344(404)。舉例而言,電子器件396可判定當前訊框之最後PPP信號,如結合圖3所描述。
電子器件396可將PPP信號344變換成第一頻域信號388(例如,X T )(406)。舉例而言,電子器件396可如結合圖3所描述而判定PPP信號344之DTFS(及例如根據方程式(1))。
電子器件396可將第一頻域信號(例如,X T )映射至複數個子頻帶中(408)。舉例而言,電子器件396可將第一頻域信號之頻率索引分配 至多個子頻帶中,如結合圖3所描述。
電子器件396可基於第一頻域信號388(例如,X T )判定全域對準348(例如,S G )(410)。電子器件396亦可如上文所描述而基於振幅經量化之PPP信號394而產生第二頻域信號(例如,X C )。電子器件396可接著判定對應於第一頻域信號388(例如,X T )與第二頻域信號(例如,X C )之最大相關性的全域對準348(例如,S G )(410)。可如上文結合圖3所描述而實現此判定。
電子器件396可利用純量量化來量化全域對準348以獲得經量化全域對準360(412)。舉例而言,電子器件396可如上文結合圖3所描述而利用均勻或不均勻純量量化來量化全域對準(412)。
電子器件396可判定對應於該複數個子頻帶之複數個頻帶對準352(414)。舉例而言,電子器件396可如上文所描述而判定全域移位頻域信號(例如,X GS )。電子器件396可接著對於複數個子頻帶中之至少一者在圍繞單位圓之單次旋轉內藉由判定對應於第一頻域信號388(例如,X T )之一部分與全域移位頻域信號386(例如,X GS )之一部分之間的相關性判定頻帶對準352而判定複數個頻帶對準352(414)。可如結合圖3(及例如根據方程式(4)及方程式(5))所描述而實現此判定。
電子器件396可利用向量量化來量化複數個頻帶對準352以獲得複數個經量化頻帶對準362(416)。舉例而言,電子器件396可如結合圖3所描述而判定對應於碼簿或查找表中的最佳地匹配頻帶對準352之向量的索引。
電子器件396可傳輸經量化全域對準360及該複數個經量化頻帶對準362(418)。舉例而言,電子器件396可將經量化全域對準360及該複數個經量化頻帶對準362插入至位元串流中。電子器件396可接著使用傳輸器(例如,射頻(RF)傳輸器)傳輸該位元串流(418)。
本文中所揭示之系統及方法在大多數情況下與已知EVRC方法相 比導致較佳搜尋解析度。在極少情況下,藉由本文中的系統及方法提供的搜尋解析度可等於EVRC之搜尋解析度,但不會比EVRC之搜尋解析度差。較佳搜尋解析度可導致提高之語音品質。與已知方法相比,本文中所描述之系統及方法提供新穎頻帶對準搜尋準則。此外,本文中所揭示之系統及方法通常致能提高之頻帶對準搜尋解析度,其中頻帶對準較佳地適合於向量量化。增加之解析度導致改良之語音品質,且使用向量量化導致量化需要較少位元。
圖5為說明經組態以用於解量化相位資訊之電子器件501之一個組態的方塊圖。電子器件501之實例包括智慧型手機、行動電話、固定電話、耳機、桌上型電腦、膝上型電腦、電視、遊戲系統、音訊記錄器、攝錄影機、靜態相機、汽車控制台,等。電子器件501包括解碼器503。可根據結合圖5描述之解碼器503而實施上文所述之解碼器中之一或多者。
應注意,包括於電子器件501及/或解碼器503中的組件中之一或多者可以硬體(例如,電路)、軟體或兩者的組合加以實施。舉例而言,頻帶對準解量化器519可以硬體(例如,電路)、軟體或兩者的組合加以實施。亦應注意,圖5或本文中的其他方塊圖中的區塊內之箭頭可指示組件之間的直接或間接耦接。
解碼器503基於所接收的參數產生經解碼語音信號515(例如,合成語音信號)。所接收參數之實例包括經量化LSF向量582、經量化振幅564、經量化頻帶對準562、經量化全域對準560及音調滯後542。經量化振幅564、經量化頻帶對準562、經量化全域對準560及音調滯後542可為包括於經編碼激發信號中的參數之實例,其可自另一電子器件接收。解碼器503包括LSF向量解量化器505、反係數變換509、合成濾波器513、振幅解量化器517、頻帶對準解量化器519、全域對準解量化器521及PPP信號重建構及激發信號產生模組529中之一或多 者。
解碼器503接收經量化LSF向量582(例如,經量化LSF、LSP、ISF、ISP、PARCOR係數、反射係數或對數面積比率值)。在一些組態中,經量化LSF向量582可為對應於查找表或碼簿之索引。
LSF向量解量化器505解量化所接收的經量化LSF向量582以產生LSF向量507。舉例而言,LSF向量解量化器505可基於對應於查找表或碼簿之索引(例如,經量化LSF向量582)而查找LSF向量507。
LSF向量507可提供至反係數變換509。反係數變換509將LSF向量507變換成係數511(例如,用於合成濾波器之濾波器係數1/A(z))。係數511提供至合成濾波器513。
振幅解量化器517可解量化經量化振幅564以獲得經解量化之振幅523。舉例而言,振幅反量化器517可在碼簿或查找表中查找對應於經量化振幅564(例如,索引)之經解量化之振幅523。
頻帶對準解量化器519可解量化經量化頻帶對準562以獲得經解量化之頻帶對準525。舉例而言,頻帶對準反量化器519可在碼簿或查找表中查找對應於經量化頻帶對準562(例如,索引)之經解量化之頻帶對準525。經量化頻帶對準562可為經向量量化頻帶對準562。因此,頻帶對準解量化器519可應用向量解量化以獲得經解量化之頻帶對準525。
全域對準解量化器521可解量化經量化全域對準560。舉例而言,全域對準解量化器521可將經量化全域對準560轉換為經解量化之全域對準527。經解量化之振幅523、經解量化之頻帶對準525及/或經解量化之全域對準527可提供至PPP信號重建構及激發信號產生模組529。
PPP信號重建構及激發信號產生模組529可基於經解量化之振幅523、經解量化之頻帶對準525、經解量化之全域對準527及/或音調滯 後542而產生激發信號531。舉例而言,PPP信號重建構及激發信號產生模組529可重建構由經解量化之振幅523、經解量化之頻帶對準525及經解量化之全域對準527指定之當前PPP信號。PPP信號重建構及激發信號產生模組529可接著在先前訊框PPP信號與當前訊框PPP信號之間內插PPP信號以產生當前訊框之激發信號531。
激發信號531可提供至合成濾波器513。合成濾波器513根據係數511對激發信號531進行濾波以產生經解碼語音信號515。舉例而言,合成濾波器513之極點可根據係數511加以組態。激發信號531接著傳遞經過合成濾波器513以產生經解碼語音信號515(例如,合成語音信號)。
圖6為說明用於解量化相位資訊之方法600之一個組態的流程圖。電子器件501可獲得經向量量化之複數個經量化頻帶對準562(602)。舉例而言,電子器件501可包括自另一電子器件接收位元串流之接收器。該位元串流可包括複數個頻帶對準562。
電子器件501可解量化該複數個經量化頻帶對準562以獲得複數個經解量化之頻帶對準525(604)。舉例而言,電子器件501可如上文結合圖5所描述而在碼簿或查找表中查找對應於經量化頻帶對準562(例如,索引)之經解量化之頻帶對準525。經量化頻帶對準562可為經向量量化之頻帶對準562。因此,電子器件501可應用向量解量化以獲得經解量化之頻帶對準525。
電子器件501可基於複數個經解量化之頻帶對準525而產生激發信號531(606)。舉例而言,PPP信號重建構及激發信號產生模組529可重建構由經解量化之頻帶對準525指定之當前PPP信號,且在先前訊框PPP信號與當前訊框PPP信號之間內插PPP信號以產生當前訊框之激發信號531,如上文結合圖5所描述。
電子器件501可基於激發信號531合成語音信號(例如,經解碼語 音信號515)(608)。舉例而言,激發信號531可傳遞經過合成濾波器513以產生合成語音信號,如上文結合圖5所描述。
圖7為說明可用於振幅映射及相位對準搜尋之若干模組之一個組態的方塊圖。詳言之,圖7說明可用以執行結合圖3及/或圖4描述之功能的模組之更特定實例。圖7說明DTFS變換733、子頻帶映射模組737、振幅判定模組741、DTFS產生模組745、全域對準判定模組749、頻帶對準判定模組753、振幅量化器758、全域對準量化器750及/或頻帶對準量化器754。圖7中所說明之模組中之一或多者可以硬體、軟體或兩者的組合加以實施。圖7中所說明之模組中之一或多者可實施於電子器件中。在一些組態中,結合圖7描述之模組中之一或多者可包括於與結合圖3所描述者執行類似功能之模組或組件中之一或多者內及/或對應於與結合圖3所描述者執行類似功能之模組或組件中之一或多者。
DTFS變換733可將PPP信號744變換成第一頻域信號735(例如,X T )。舉例而言,DTFS變換733可如上文方程式(1)中所說明而判定PPP信號744之DTFS。第一頻域信號735可提供至子頻帶映射模組737。
子頻帶映射模組737可將第一頻域信號735(例如,X T )映射至複數個子頻帶739中。可如結合圖3所描述而實現此映射。該複數個子頻帶739可提供至振幅判定模組741。
振幅判定模組741可判定複數個子頻帶739中的每一者之振幅756。舉例而言,振幅判定模組741可平均化每一子頻帶739(例如,具有兩個或兩個以上頻率索引)之第一頻率索引振幅與最後頻率索引振幅以產生每一子頻帶739之振幅756。或者,振幅判定模組741可鄰近於一或多個子頻帶之子頻帶中點而內插振幅以判定振幅756。應注意,可捨棄每一子頻帶739之相位。舉例而言,每一子頻帶之相位可 設定為0。振幅756可提供至振幅量化器758。
振幅量化器758可利用向量量化來量化振幅756獲得經量化振幅764及振幅經量化之PPP信號743。可如上文結合圖3所描述而實現此量化。振幅經量化之PPP信號743可提供至DTFS產生模組745。
DTFS產生模組745可基於振幅經量化之PPP信號743而判定第二頻域信號747(例如,X C )。舉例而言,DTFS產生模組745可產生第二頻域信號747(例如,X C )作為與第一頻域信號735具有相同數目個頻率索引之DTFS,其中每一頻率索引具有相位0。此外,每一子頻帶中的所有頻率索引之振幅可設定為每一子頻帶之(平均)振幅756。第二頻域信號747可提供至全域對準判定模組749。
全域對準判定模組749可基於第一頻域信號735(例如,X T )及第二頻域信號747(例如,X C )判定全域對準748(例如,S G )。舉例而言,全域對準判定模組749可將全域對準748判定為對應於第一頻域信號735(例如,X T )與第二頻域信號747(例如,X C )之最大相關性的移位。全域對準748可提供至全域對準量化器750。
全域對準判定模組749亦可判定全域移位頻域信號751(例如,X GS )。舉例而言,全域對準判定模組749可根據如上文所描述之方程式(2)而用一因數(基於全域對準748(例如,S G ))乘以第二頻域信號747。全域移位頻域信號751可提供至頻帶對準判定模組753。
頻帶對準判定模組753可判定對應於複數個子頻帶739之複數個頻帶對準752。舉例而言,頻帶對準判定模組753可對於複數個子頻帶739中之至少一者在圍繞單位圓之單次旋轉內判定全域移位頻域信號751(例如,X GS )與第一頻域信號735(例如,X T )之間的一組相關性。頻帶對準判定模組753亦可判定對應於每一組相關性之最大相關性的頻帶對準以判定複數個頻帶對準752。舉例而言,可如上文結合圖3所描述、如藉由方程式(4)及方程式(5)所說明而實現此等操作。複數個 頻帶對準752可提供至頻帶對準量化器754。
頻帶對準量化器754可利用向量量化來量化該複數個頻帶對準752以獲得複數個經量化頻帶對準762。舉例而言,頻帶對準量化器754可判定對應於碼簿755中的最佳地匹配頻帶對準752之索引。經量化頻帶對準762可為至碼簿755之索引。
全域對準量化器750可量化全域對準748以產生經量化全域對準760。舉例而言,全域對準量化器750可利用純量量化來量化全域對準748以獲得經量化全域對準760,如上文結合圖3所描述。
圖8為說明用於量化相位資訊之方法800之一更特定組態的流程圖。電子器件可執行方法800。舉例而言,包括結合圖7描述之模組中之一或多者的電子器件可執行方法800。
該電子器件可將PPP信號744變換成第一頻域信號735(例如,X T )(802)。舉例而言,DTFS變換733可如上文方程式(1)中所說明而判定PPP信號744之DTFS。該電子器件可將第一頻域信號735(例如,X T )映射至複數個子頻帶739中(804)。可如結合圖3及/或圖7所描述而實現此映射。
該電子器件可判定複數個子頻帶739中的每一者之振幅756(806)。舉例而言,判定複數個子頻帶739中的每一者之振幅(806)可包括判定複數個子頻帶中之至少一者內的第一頻域信號之至少一個頻率索引的平均振幅。可如上文結合圖3及/或圖7所描述而實現此判定。
電子器件可對於複數個子頻帶中的每一者基於振幅經量化之PPP信號743判定第二頻域信號747(例如,X C )(808),其中第二頻域信號747之長度等於第一頻域信號735之長度。可如上文結合圖3及/或圖7所描述而實現此判定。
電子器件可基於第一頻域信號735(例如,X T )及第二頻域信號747(例如,X C )判定全域對準748(例如,S G )(810)。舉例而言,判定 全域對準748(810)可係基於第一頻域信號735與第二頻域信號747之間的相關性。可如上文結合圖3及/或圖7所描述而實現此判定。電子器件可判定全域移位頻域信號751(例如,X GS )(812)。可如上文結合圖3及/或圖7所描述而實現此判定。
該電子器件可對於複數個子頻帶739中之至少一者在圍繞單位圓之單次旋轉內判定全域移位頻域信號751(例如,X GS )與第一頻域信號735(例如,X T )之間的一組相關性(814)。可如上文結合圖3及/或圖7所描述而實現此判定。該電子器件可判定對應於每一組相關性之最大相關性的頻帶對準以判定複數個頻帶對準752(816)。可如上文結合圖3及/或圖7所描述而實現此判定。
該電子器件可利用向量量化來量化該複數個頻帶對準752以獲得複數個經量化頻帶對準762(818)。可如上文結合圖3及/或圖7所描述而實現此量化。
為易於理解,下文給出實例以說明判定全域對準之操作。詳言之,圖9至圖11說明對於判定全域對準之操作的實例。
圖9為說明語音或殘餘信號961之一個實例的曲線圖。詳言之,圖9說明語音或殘餘信號961之先前訊框963及當前訊框965。語音或殘餘信號961為有聲信號,且因此展現週期性音調循環。編碼器304可自語音或殘餘信號961判定(例如,提取)PPP信號。舉例而言,編碼器304可判定音調滯後(例如,L)及音調循環界限。編碼器304可接著將每一訊框之最後音調循環指定為PPP信號(例如,x(m))。舉例而言,編碼器304可獲得先前訊框PPP信號957(例如,先前訊框963之最後PPP信號)及當前訊框PPP信號959(例如,當前訊框之最後PPP信號)。
一旦當前訊框PPP信號959(例如,x(m))得以判定,編碼器304即可判定當前訊框PPP信號959之DTFS以判定第一頻域信號(例如,X T )。可如上文所描述根據方程式(1)實現此判定。第一頻域信號(例如, X T (i))可與當前訊框PPP信號959具有相同長度(例如,L),其為當前訊框之音調滯後且可稱為「目標PPP信號」。出於此實例之目的,可假定L=44。每一頻率索引(例如,X T 之頻率索引)具有一振幅及相位。應注意,EVRC規範亦使用DTFS。
圖10為說明將一第一頻域信號(例如,X T )映射至不均勻子頻帶1067a至1067n的實例之圖。舉例而言,編碼器304可將第一頻域信號自DTFS域映射至子頻帶域中。在此實例中,子頻帶1067之數目為24。如圖10中所說明,與較低子頻帶(例如,子頻帶A 1067a及子頻帶J 1067j)相比,較高子頻帶(例如,子頻帶N 1067n)在頻率1069中具有較寬頻寬,且包括第一頻域信號之更多頻率索引。可基於第一頻域信號之長度(例如,L)而預先判定所利用之映射。
如上文所描述,編碼器304可基於包括於第一頻域信號之每一子頻帶1067中的一或多個頻率索引而判定每一子頻帶1067之振幅。舉例而言,具有兩個或兩個以上頻率索引之子頻帶1067之振幅可為子頻帶1067中的第一頻率索引與最後頻率索引之平均振幅。可捨棄(例如,設定為0)每一子頻帶1067之相位。可在子頻帶域中執行此等操作。
圖11為說明全域對準1179之一個實例的圖。詳言之,圖11說明隨時間1177推移之第一頻域信號(例如,X T )之時域版本1171之一個實例。如上文所描述,編碼器304可基於每一子頻帶1067(在子頻帶域中)之振幅在DTFS域中產生第二頻域信號(例如,X C (i),其中0 i<L)。在此實例中,第二頻域信號之所有44個頻率索引之相位為0。第二頻域信號之相同子頻帶1067中的頻率索引中的每一者之振幅相同。圖11說明第二頻域信號1173之時域版本之一個實例。舉例而言,X C 1173之時域版本可類似於X T 之時域版本1171之經移位版本。此係因為在X C 中已捨棄相位資訊。除相位差以外,兩波形1171、1173看起來亦不相同,此係因為子頻帶中的每一者之振幅為來 自X T 之平均振幅。
如上文所描述,編碼器304可判定全域對準1179(例如,S G )。舉例而言,編碼器304可藉由計算產生第一頻域信號(例如,X T )與第二頻域信號(例如,X C )之間的最大相關性的索引而判定全域對準1179。應注意,預期之增強型話音服務(EVS)規範可利用頻域相關性來減小計算複雜度,儘管此類似於計算兩個時域波形之相關性。此外,可在頻域中計算相關性,此係因為缺少每一子頻帶之相對相位差。圖11說明全域移位頻域信號之時域版本1175之一個實例,其說明為第二頻域信號1173之時域版本之經相移版本。給出第一頻域信號之時域版本1171與第二頻域信號之時域版本1173之經移位版本之間的最大相關性之相移1181為全域對準1179。全域對準1179可經量化且在位元串流中儲存(例如,發送)。
如上文所描述,電子器件396可藉由根據方程式(2)用一因數乘以第二頻域信號而判定全域移位頻域信號(例如,X GS (i),其中0 i<L)。全域移位頻域信號為依據經量化全域對準(例如,S GQ )而移位之第二頻域信號。如圖11中所說明,在頻域中乘以線性相位等效於時域中之循環移位。一旦電子器件396已判定且應用全域對準,則電子器件可判定頻帶對準352(例如,每一子頻帶之band_alignment(j)以致能多頻帶相位對準)。
圖12為說明用於子頻帶1267之頻帶對準之一個實例的圖。詳言之,圖12說明包括四個頻率索引1283a至1283d之頻率1269上的子頻帶1267。電子器件396可判定對應於該複數個子頻帶之複數個頻帶對準352。每一頻帶對準352可為全域移位頻域信號(例如,X GS )之每一子頻帶中的第一頻率索引之相移。舉例而言,可判定子頻帶1267中的第一索引(例如,索引A 1283a)之頻帶對準(1285)。一已知方法(例如,EVRC規範)在搜尋頻帶對準時允許圍繞單位圓之多次旋轉。在一些情 況下,此藉由圍繞單位圓之多次旋轉而導致較低解析度搜尋。相比之下,本文中所揭示之系統及方法在搜尋頻帶對準時僅允許圍繞單位圓之單次旋轉。在一些情況下,此藉由圍繞單位圓之僅單次旋轉而導致較高解析度搜尋。
一旦對於子頻帶1267判定出最大化全域移位頻域信號(例如,X GS )與第一頻域信號(例如,X T )之間的相關性之頻帶對準索引n,則 按比例調整因數確保頻帶對準角對於包括於給定子頻帶1267中 的其餘頻率索引(例如,DTFS分量)線性地改變。舉例而言,假定子頻帶1267為子頻帶10(例如,j=10)且具有四個頻率索引(例如,索引20至23處之索引A至D 1283a至1283d)。亦假定總共存在32個不同的可能頻帶對準索引(例如,具有5位元索引)。一旦判定出索引A 1283a之頻帶對準,則其餘頻率索引(例如,索引B至D 1283b至1283d)將根據按比例調整因數線性地變化(1287)。
圖13為說明根據本文中所揭示之系統及方法的多次旋轉頻帶對準1389之一個實例及單次旋轉頻帶對準1391之一個實例的圖。詳言之,說明對應於多次旋轉頻帶對準1389及單次旋轉頻帶對準1391之若干頻帶對準索引或角1393。
一些頻帶對準搜尋方案可包括搜尋單位圓歷經多次旋轉。此可產生具有多個峰值之索引直方圖。舉例而言,多次旋轉頻帶對準1389包括圍繞單位圓旋轉多次(如由單位圓上之數字序列所指示)之頻帶對準索引/角1393。
根據本文中所揭示之系統及方法的頻帶對準搜尋方案(其可併入預期EVS規範中)提供在單次旋轉中搜尋單位圓。此可產生分佈類似於高斯分佈之索引直方圖。舉例而言,單次旋轉頻帶對準1391包括圍繞單位圓旋轉僅一次(如由單位圓上之數字序列所指示)之頻帶對準索 引/角1393。此允許向量量化,其將所需位元之數目減少至約64個位元(例如,較之於EVRC規範減少約40%)。
圖13A為說明EVRC頻帶對準1389a之一個實例的圖。詳言之,說明對應於EVRC頻帶對準1389a之若干頻帶對準索引或角1393a。
根據EVRC規範之頻帶對準搜尋方案可包括在較低解析度下搜尋單位圓歷經多次旋轉。此可產生具有多個峰值之索引直方圖。舉例而言,EVRC頻帶對準1389a包括圍繞單位圓旋轉多次(如由單位圓上之數字序列所指示)之頻帶對準索引/角1393a。如圖13A中所說明,根據EVRC規範之頻帶對準搜尋在圍繞單位圓旋轉多次時可能反覆地覆蓋相同角。在此實例中,頻帶對準搜尋反覆地覆蓋如上文所描述之角 。EVRC規範利用純量量化用於頻帶對準,其 需要約100個位元(例如,每20個子頻帶5個位元)。此對於每一子頻帶提供32個可能的頻帶對準。相比而言,根據本文中所揭示之系統及方法的頻帶對準搜尋方案提供在單次旋轉中搜尋單位圓,通常具有較高解析度。
圖14為說明多次旋轉頻帶對準1489之一更特定實例的圖。在此實例中,頻帶對準索引/角1493圍繞單位圓旋轉多次,如由單位圓上之數字序列所指示。在此實例中,假定具有較高相關性(例如,在第一頻域信號與第二頻域信號之間)之頻帶對準索引1495出現於圍繞單位圓之0(弧度)指示之區域中。如圖14中所說明,多個峰值在頻帶對準索引1499上出現於出現次數(概率)1497中。詳言之,圖14展示對於特定諧波編號之實例頻帶對準索引分佈。此為頻帶對準圍繞0定中心之典型情況之一個實例。頻帶對準索引分佈(例如,對準之直方圖)包括圍繞頻帶索引1、9、17及24之四個峰值。此使得量化低效,且在此情況下無法完全利用向量量化技術之優勢。
圖15為說明單次旋轉頻帶對準1591之一更特定實例的圖。在此實例中,頻帶對準索引/角1593圍繞單位圓旋轉僅一次,如由單位圓上之數字序列所指示。在此實例中,假定具有較高相關性(例如,在第一頻域信號與第二頻域信號之間)之頻帶對準索引1595出現於0周圍。如圖15中所說明,單一峰值在頻帶對準索引1599上出現於出現次數(概率)1597中(一旦索引如圖15中所示而排序)。詳言之,圖15展示對於特定諧波編號之實例頻帶對準索引分佈。在此實例中,量化索引經配置而使得索引分佈將看起來類似於高斯分佈。或者,方程式(5) 之n的範圍可界定為,使得該分佈之峰值出現在0 周圍。此替代搜尋在重新配置搜尋索引n的情況下亦導致相同搜尋角。
已知頻帶對準方案之對準索引的分佈可類似於圖14所提供的直方圖。在已知方法中,量化碼簿必須將更多碼點配置至每一峰值而非將更多點分配至單一峰值(其為根據本文中所揭示之系統及方法所提供的方法之情況(例如,如在圖15中的直方圖中所說明))。因此,本文中所揭示之系統及方法可在具有較少失真的情況下產生更有效的量化。
圖16為說明一無線通信器件1640之一個組態的方塊圖,在該無線通信器件1640中可實施用於量化及解量化相位資訊之系統及方法。圖16中所說明之無線通信器件1640可為本文中所描述之電子器件中之至少一者的實例。無線通信器件1640可包括應用處理器1612。應用處理器1612通常處理指令(例如,執行程式)以執行無線通信器件1640上之功能。應用處理器1612可耦接至音訊寫碼器/解碼器(編解碼器)1610。
音訊編解碼器1610可用於對音訊信號進行寫碼及/或解碼。音訊 編解碼器1610可耦接至至少一個揚聲器1602、聽筒1604、輸出插口1606及/或至少一個麥克風1608。揚聲器1602可包括將電或電子信號轉換成聲波信號之一或多個電聲轉換器。舉例而言,揚聲器1602可用以播放音樂或輸出揚聲器電話交談,等。聽筒1604可為可用以將聲波信號(例如,語音信號)輸出至使用者之另一揚聲器或電聲轉換器。舉例而言,可使用聽筒1604而使得僅一使用者可可靠地聽到聲學信號。輸出插口1606可用於將諸如頭戴式耳機之其他器件耦接至無線通信器件1640以用於輸出音訊。揚聲器1602、聽筒1604及/或輸出插口1606可通常用於自音訊編解碼器1610輸出音訊信號。至少一個麥克風1608可為將聲學信號(諸如使用者之話音)轉換成提供至音訊編解碼器1610之電或電子信號的聲電轉換器。
音訊編解碼器1610(例如,解碼器)可包括頻帶對準搜尋模組1668及/或頻帶對準量化器1654。頻帶對準搜尋模組1668可如上文所描述而判定頻帶對準。頻帶對準量化器1654可如上文所描述而量化頻帶對準。
應用處理器1612亦可耦接至電力管理電路1622。電力管理電路1622之一個實例為電力管理積體電路(PMIC),其可用以管理無線通信器件1640之電力消耗。電力管理電路1622可耦接至電池組1624。電池組1624可通常將電力提供至無線通信器件1640。舉例而言,電池組1624及/或電力管理電路1622可耦接至包括於無線通信器件1640中的元件中之至少一者。
應用處理器1612可耦接至用於接收輸入之至少一個輸入器件1626。輸入器件1626之實例包括紅外線感測器、影像感測器、加速度計、觸摸感測器、小鍵盤,等。輸入器件1626可允許使用者與無線通信器件1640互動。應用處理器1612亦可耦接至一或多個輸出器件1628。輸出器件1628之實例包括印表機、投影儀、螢幕、觸覺器件, 等。輸出器件1628可允許無線通信器件1640產生可由使用者體驗之輸出。
應用處理器1612可耦接至應用記憶體1630。應用記憶體1630可為能夠儲存電子資訊之任何電子器件。應用記憶體1630之實例包括雙資料速率同步動態隨機存取記憶體(DDRAM)、同步動態隨機存取記憶體(SDRAM)、快閃記憶體,等。應用記憶體1630可為應用處理器1612提供儲存。舉例而言,應用記憶體1630可儲存用於使在應用處理器1612上執行之程式行使功能的資料及/或指令。
應用處理器1612可耦接至顯示控制器1632,顯示控制器1632又可耦接至顯示器1634。顯示控制器1632可為用以在顯示器1634上產生影像之硬體區塊。舉例而言,顯示控制器1632可將來自應用處理器1612之指令及/或資料轉譯成可呈現在顯示器1634上之影像。顯示器1634之實例包括液晶顯示器(LCD)面板、發光二極體(LED)面板、陰極射線管(CRT)顯示器、電漿顯示器,等。
應用處理器1612可耦接至基頻處理器1614。基頻處理器1614通常處理通信信號。舉例而言,基頻處理器1614可對所接收的信號進行解調變及/或解碼。另外或替代地,基頻處理器1614可對信號進行編碼及/或調變以準備傳輸。
基頻處理器1614可耦接至基頻記憶體1638。基頻記憶體1638可為能夠儲存電子資訊之任何電子器件,諸如SDRAM、DDRAM、快閃記憶體,等。基頻處理器1614可自基頻記憶體1638讀取資訊(例如,指令及/或資料)及/或將資訊寫入至基頻記憶體1638。另外或替代地,基頻處理器1614可使用儲存於基頻記憶體1638中的指令及/或資料來執行通信操作。
基頻處理器1614可耦接至射頻(RF)收發器1616。RF收發器1616可耦接至功率放大器1618及一或多個天線1620。RF收發器1616可傳 輸及/或接收射頻信號。舉例而言,RF收發器1616可使用功率放大器1618及至少一個天線1620傳輸RF信號。RF收發器1616亦可使用一或多個天線1620接收RF信號。
圖17說明可用於電子器件1756中之各種組件。所說明組件可位於同一實體結構內或位於單獨外殼或結構中。可根據本文中所描述之器件中之一或多者實施結合圖17描述之電子器件1756。電子器件1756包括處理器1764。處理器1764可為通用單晶片或多晶片微處理器(例如,ARM)、特殊用途微處理器(例如,數位信號處理器(DSP))、微控制器、可程式化閘陣列,等。處理器1764可稱為中央處理單元(CPU)。儘管圖17之電子器件1756中僅展示單一處理器1764,但在替代組態中,可使用處理器之組合(例如,ARM及DSP)。
電子器件1756亦包括與處理器1764電子通信之記憶體1758。亦即,處理器1764可自記憶體1758讀取資訊及/或將資訊寫入至記憶體1758。記憶體1758可為能夠儲存電子資訊之任何電子組件。記憶體1758可為隨機存取記憶體(RAM)、唯讀記憶體(ROM)、磁碟儲存媒體、光學儲存媒體、RAM中的快閃記憶體器件、與處理器包括在一起之機載記憶體、可程式化唯讀記憶體(PROM)、可抹除可程式化唯讀記憶體(EPROM)、電可抹除PROM(EEPROM)、暫存器等,包括其組合。
資料1762a及指令1760a可儲存在記憶體1758中。該等指令1760a可包括一或多個程式、常式、子常式、函式、程序,等。該等指令1760a可包括單一電腦可讀陳述式或許多電腦可讀陳述式。該等指令1760a可由處理器1764執行以實施上文所述之方法、功能及程序中之一或多者。執行該等指令1760a可涉及使用儲存在記憶體1758中的資料1762a。圖17展示載入於處理器1764中之一些指令1760b及資料1762b(其可來自指令1760a及資料1762a)。
電子器件1756亦可包括用於與其他電子器件通信之一或多個通信介面1768。通信介面1768可係基於有線通信技術、無線通信技術,或兩者。不同類型之通信介面1768之實例包括串列埠、平行埠、通用串列匯流排(USB)、乙太網路配接器、IEEE 1394匯流排介面、小電腦系統介面(SCSI)匯流排介面、紅外線(IR)通信埠、藍芽無線通信配接器,等。
電子器件1756亦可包括一或多個輸入器件1770及一或多個輸出器件1774。不同種類之輸入器件1770之實例包括鍵盤、滑鼠、麥克風、遙控器件、按鈕、操縱桿、軌跡球、觸控板、光筆,等。舉例而言,電子器件1756可包括用於捕獲聲波信號之一或多個麥克風1772。在一個組態中,麥克風1772可為將聲波信號(例如,話音、語音)轉換成電或電子信號之轉換器。不同種類之輸出器件1774之實例包括揚聲器、印表機,等。舉例而言,電子器件1756可包括一或多個揚聲器1776。在一個組態中,揚聲器1776可為將電或電子信號轉換成聲波信號之轉換器。可通常包括於電子器件1756中的一個特定類型之輸出器件為顯示器件1778。配合本文中所揭示之組態使用之顯示器件1778可利用任何適當的影像投影技術,諸如陰極射線管(CRT)、液晶顯示器(LCD)、發光二極體(LED)、氣體電漿、電致發光,或其類似者。顯示控制器1780亦可經提供而用於將儲存於記憶體1758中的資料轉換成在顯示器件1778上展示之文字、圖形及/或移動影像(在適當的情況下)。
電子器件1756之各種組件可藉由一或多個匯流排耦接在一起,其可包括功率匯流排、控制信號匯流排、狀態信號匯流排、資料匯流排,等。為簡單起見,各種匯流排在圖17中說明為匯流排系統1766。應注意,圖17僅說明電子器件1756之一個可能組態。可利用各種其他架構及組件。
在以上描述中,參考數字有時與各種術語結合使用。在術語與一參考數字結合使用的情況下,此可意欲指代展示於諸圖中之一或多者中的特定元件。在無參考數字而使用一術語的情況下,此可意欲泛指該術語而不限於任何特定圖。
術語「判定」涵蓋多種動作,且因此「判定」可包含計算(calculating、computing)、處理、推導、研究、查找(例如,在表、資料庫或另一資料結構中查找)、確定及其類似者。又,「判定」可包括接收(例如,接收資訊)、存取(例如,存取記憶體中的資料)及其類似者。又,「判定」可包括解析、選擇、挑選、建立及其類似者。
片語「基於」並不意謂「僅基於」,除非另有明確指定。換言之,片語「基於」描述「僅基於」及「至少基於」兩者。
應注意,在相容的情況下,結合本文中所描述之組態中的任一者描述之特徵、功能、程序、組件、元件、結構等中之一或多者可與結合本文中所描述之其他組態中之任一者描述之功能、程序、組件、元件、結構等中之一或多者加以組合。換言之,可根據本文中所揭示之系統及方法實施本文中所描述之功能、程序、組件、元件等之任何相容組合。
可將本文中所描述之功能作為一或多個指令儲存於處理器可讀或電腦可讀媒體上。術語「電腦可讀媒體」係指可由電腦或處理器存取之任何可用媒體。作為實例而非限制,此類媒體可包含RAM、ROM、EEPROM、快閃記憶體、CD-ROM或其他光碟儲存器、磁碟儲存器或其他磁性儲存器件或可用以儲存呈指令或資料結構之形式的所要程式碼且可由電腦存取之任何其他媒體。如本文所使用,磁碟及光盤包括緊密光碟(CD)、雷射光碟、光學光碟、數位多功能光碟(DVD)、軟碟及Blu-ray®光碟,其中磁碟通常以磁性方式重現資料,而光碟藉由雷射以光學方式重現資料。應注意,電腦可讀媒體可為有 形的及非暫時性的。術語「電腦程式產品」係指計算器件或處理器,其與可由該計算器件或處理器執行、處理或計算之程式碼或指令(例如,「程式」)相組合。如本文所使用,術語「程式碼」可指可由計算器件或處理器執行之軟體、指令、程式碼或資料。
軟體或指令亦可經由傳輸媒體加以傳輸。舉例而言,若使用同軸電纜、光纜、雙絞線、數位用戶線(DSL)或諸如紅外線、無線電及微波之無線技術自網站、伺服器或其他遠端源傳輸軟體,則同軸電纜、光纜、雙絞線、DSL或諸如紅外線、無線電及微波之無線技術包括於傳輸媒體之定義中。
本文中所揭示之方法包含用於達成所描述方法之一或多個步驟或動作。該等方法步驟及/或動作可彼此互換而不脫離申請專利範圍之範疇。換言之,除非對於所描述方法之恰當操作需要步驟或動作之特定次序,否則可修改特定步驟及/或動作之次序及/或使用而不脫離申請專利範圍之範疇。
應理解,申請專利範圍不限於上文所說明之精確組態及組件。可在本文中所描述之系統、方法及裝置之配置、操作及細節中進行各種修改、改變及變化而不脫離申請專利範圍之範疇。
400‧‧‧用於量化相位資訊之方法

Claims (44)

  1. 一種用於在一電子器件上量化相位資訊之方法,其包含:獲得一語音信號;基於該語音信號判定一原型音調週期信號;將該原型音調週期信號變換成一第一頻域信號;將該第一頻域信號映射至複數個子頻帶中;基於該第一頻域信號判定一全域對準;利用純量量化來量化該全域對準以獲得一經量化全域對準;判定對應於該複數個子頻帶之複數個頻帶對準;利用向量量化來量化該複數個頻帶對準以獲得複數個經量化頻帶對準;及傳輸該經量化全域對準及該複數個經量化頻帶對準。
  2. 如請求項1之方法,其進一步包含:判定該複數個子頻帶中的每一者之一振幅;及基於一振幅經量化之原型音調週期信號判定一第二頻域信號,其中該第二頻域信號之一長度等於該第一頻域信號之一長度,且其中判定該全域對準係基於該第一頻域信號與該第二頻域信號之間的一相關性。
  3. 如請求項2之方法,其中判定該複數個子頻帶中的每一者之該振幅包含判定在該複數個子頻帶中之至少一者內的該第一頻域信號之至少一個頻率索引的一平均振幅。
  4. 如請求項3之方法,其中具有兩個或兩個以上頻率索引之一子頻帶的該平均振幅為該子頻帶中的第一頻率索引與最後頻率索引之一平均振幅。
  5. 如請求項2之方法,其中判定對應於該複數個子頻帶之該複數個 頻帶對準包含基於該第一頻域信號之一部分與一全域移位頻域信號之一部分之間的一相關性判定一頻帶對準。
  6. 如請求項5之方法,其中判定該複數個頻帶對準包含依序移位該第一頻域信號之該部分及該全域移位頻域信號之該部分中之至少一者。
  7. 如請求項6之方法,其中在圍繞一單位圓之一單次旋轉內執行該依序移位。
  8. 如請求項6之方法,其中一移位解析度對於一較高子頻帶較高。
  9. 如請求項1之方法,其中該複數個子頻帶包括具有不均勻頻寬之一或多個子頻帶。
  10. 如請求項1之方法,其中變換該原型音調週期信號包含判定該原型音調週期信號之一離散時間傅立葉級數或對該原型音調週期信號執行一離散傅立葉變換。
  11. 如請求項10之方法,其中映射該第一頻域信號係基於該第一頻域信號之一長度。
  12. 一種用於量化相位資訊之電子器件,其包含:原型音調週期提取電路,其基於一語音信號判定一原型音調週期信號;耦接至該原型音調週期提取電路之頻域變換電路,其中該頻域變換電路將該原型音調週期信號變換成一第一頻域信號;耦接至該頻域變換電路之振幅變換電路,其中該振幅變換電路將該第一頻域信號映射至複數個子頻帶中;耦接至該頻域變換電路之全域對準搜尋電路,其中該全域對準搜尋電路基於該第一頻域信號判定一全域對準;耦接至該全域對準搜尋電路之頻帶對準搜尋電路,其中該頻帶對準搜尋電路判定對應於該複數個子頻帶之複數個頻帶對 準;耦接至該全域對準搜尋電路之全域對準量化器電路,其中該全域對準量化器電路利用純量量化來量化該全域對準以獲得一經量化全域對準;耦接至該頻帶對準搜尋電路之頻帶對準量化器電路,其中該頻帶對準量化器電路利用向量量化來量化該複數個頻帶對準以獲得複數個經量化頻帶對準;及傳輸器電路,其傳輸該經量化全域對準及該複數個經量化頻帶對準。
  13. 如請求項12之電子器件,其中該振幅變換電路進一步判定該複數個子頻帶中的每一者之一振幅,且其中該全域對準搜尋電路基於一振幅經量化之原型音調週期信號判定一第二頻域信號,其中該第二頻域信號之一長度等於該第一頻域信號之一長度,且其中判定該全域對準係基於該第一頻域信號與該第二頻域信號之間的一相關性。
  14. 如請求項13之電子器件,其中判定該複數個子頻帶中的每一者之該振幅包含判定在該複數個子頻帶中之至少一者內的該第一頻域信號之至少一個頻率索引的一平均振幅。
  15. 如請求項14之電子器件,其中具有兩個或兩個以上頻率索引之一子頻帶的該平均振幅為該子頻帶中的第一頻率索引與最後頻率索引之一平均振幅。
  16. 如請求項13之電子器件,其中判定對應於該複數個子頻帶之該複數個頻帶對準包含基於該第一頻域信號之一部分與一全域移位頻域信號之一部分之間的一相關性判定一頻帶對準。
  17. 如請求項16之電子器件,其中判定該複數個頻帶對準包含依序移位該第一頻域信號之該部分及該全域移位頻域信號之該部分 中之至少一者。
  18. 如請求項17之電子器件,其中在圍繞一單位圓之一單次旋轉內執行該依序移位。
  19. 如請求項17之電子器件,其中一移位解析度對於一較高子頻帶較高。
  20. 如請求項12之電子器件,其中該複數個子頻帶包括具有不均勻頻寬之一或多個子頻帶。
  21. 如請求項12之電子器件,其中變換該原型音調週期信號包含判定該原型音調週期信號之一離散時間傅立葉級數或對該原型音調週期信號執行一離散傅立葉變換。
  22. 如請求項21之電子器件,其中映射該第一頻域信號係基於該第一頻域信號之一長度。
  23. 一種用於量化相位資訊之電腦程式產品,其包含上面具有指令之一非暫時性有形電腦可讀媒體,該等指令包含:用於使得一電子器件獲得一語音信號之程式碼;用於使得該電子器件基於該語音信號判定一原型音調週期信號之程式碼;用於使得該電子器件將該該原型音調週期信號變換成一第一頻域信號之程式碼;用於使得該電子器件將該第一頻域信號映射至複數個子頻帶中之程式碼;用於使得該電子器件基於該第一頻域信號判定一全域對準之程式碼;用於使得該電子器件利用純量量化來量化該全域對準以獲得一經量化全域對準之程式碼;用於使得該電子器件判定對應於該複數個子頻帶之複數個頻 帶對準之程式碼;用於使得該電子器件利用向量量化來量化該複數個頻帶對準以獲得複數個經量化頻帶對準之程式碼;及用於使得該電子器件傳輸該經量化全域對準及該複數個經量化頻帶對準之程式碼。
  24. 如請求項23之電腦程式產品,其進一步包含:用於使得該電子器件判定該複數個子頻帶中的每一者之一振幅之程式碼;及用於使得該電子器件基於一振幅經量化之原型音調週期信號判定一第二頻域信號之程式碼,其中該第二頻域信號之一長度等於該第一頻域信號之一長度,且其中判定該全域對準係基於該第一頻域信號與該第二頻域信號之間的一相關性。
  25. 如請求項24之電腦程式產品,其中判定該複數個子頻帶中的每一者之該振幅包含判定在該複數個子頻帶中之至少一者內的該第一頻域信號之至少一個頻率索引的一平均振幅。
  26. 如請求項25之電腦程式產品,其中具有兩個或兩個以上頻率索引之一子頻帶的該平均振幅為該子頻帶中的第一頻率索引與最後頻率索引之一平均振幅。
  27. 如請求項24之電腦程式產品,其中判定對應於該複數個子頻帶之該複數個頻帶對準包含基於該第一頻域信號之一部分與一全域移位頻域信號之一部分之間的一相關性判定一頻帶對準。
  28. 如請求項27之電腦程式產品,其中判定該複數個頻帶對準包含依序移位該第一頻域信號之該部分及該全域移位頻域信號之該部分中之至少一者。
  29. 如請求項28之電腦程式產品,其中在圍繞一單位圓之一單次旋轉內執行該依序移位。
  30. 如請求項28之電腦程式產品,其中一移位解析度對於一較高子頻帶較高。
  31. 如請求項23之電腦程式產品,其中該複數個子頻帶包括具有不均勻頻寬之一或多個子頻帶。
  32. 如請求項23之電腦程式產品,其中變換該原型音調週期信號包含判定該原型音調週期信號之一離散時間傅立葉級數或對該原型音調週期信號執行一離散傅立葉變換。
  33. 如請求項32之電腦程式產品,其中映射該第一頻域信號係基於該第一頻域信號之一長度。
  34. 一種用於量化相位資訊之裝置,其包含:用於獲得一語音信號之構件;用於基於該語音信號判定一原型音調週期信號之構件;用於將該原型音調週期信號變換成一第一頻域信號之構件;用於將該第一頻域信號映射至複數個子頻帶中之構件;用於基於該第一頻域信號判定一全域對準之構件;用於利用純量量化來量化該全域對準以獲得一經量化全域對準之構件;用於判定對應於該複數個子頻帶之複數個頻帶對準之構件;用於利用向量量化來量化該複數個頻帶對準以獲得複數個經量化頻帶對準之構件;及用於傳輸該經量化全域對準及該複數個經量化頻帶對準之構件。
  35. 如請求項34之裝置,其進一步包含用於判定該複數個子頻帶中的每一者之一振幅之構件;及用於基於一振幅經量化之原型音調週期信號判定一第二頻域信號之構件,其中該第二頻域信號之一長度等於該第一頻域信 號之一長度,且其中判定該全域對準係基於該第一頻域信號與該第二頻域信號之間的一相關性。
  36. 如請求項35之裝置,其中判定該複數個子頻帶中的每一者之該振幅包含判定在該複數個子頻帶中之至少一者內的該第一頻域信號之至少一個頻率索引的一平均振幅。
  37. 如請求項36之裝置,其中具有兩個或兩個以上頻率索引之一子頻帶的該平均振幅為該子頻帶中的第一頻率索引與最後頻率索引之一平均振幅。
  38. 如請求項35之裝置,其中判定對應於該複數個子頻帶之該複數個頻帶對準包含基於該第一頻域信號之一部分與一全域移位頻域信號之一部分之間的一相關性判定一頻帶對準。
  39. 如請求項38之裝置,其中判定該複數個頻帶對準包含依序移位該第一頻域信號之該部分及該全域移位頻域信號之該部分中之至少一者。
  40. 如請求項39之裝置,其中在圍繞一單位圓之一單次旋轉內執行該依序移位。
  41. 如請求項39之裝置,其中一移位解析度對於一較高子頻帶較高。
  42. 如請求項34之裝置,其中該複數個子頻帶包括具有不均勻頻寬之一或多個子頻帶。
  43. 如請求項34之裝置,其中變換該原型音調週期信號包含判定該原型音調週期信號之一離散時間傅立葉級數或對該原型音調週期信號執行一離散傅立葉變換。
  44. 如請求項43之裝置,其中映射該第一頻域信號係基於該第一頻域信號之一長度。
TW103101042A 2013-02-21 2014-01-10 用於量化及解量化相位資訊之系統及方法 TW201435859A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201361767455P 2013-02-21 2013-02-21
US14/015,991 US9236058B2 (en) 2013-02-21 2013-08-30 Systems and methods for quantizing and dequantizing phase information

Publications (1)

Publication Number Publication Date
TW201435859A true TW201435859A (zh) 2014-09-16

Family

ID=51351893

Family Applications (1)

Application Number Title Priority Date Filing Date
TW103101042A TW201435859A (zh) 2013-02-21 2014-01-10 用於量化及解量化相位資訊之系統及方法

Country Status (3)

Country Link
US (1) US9236058B2 (zh)
TW (1) TW201435859A (zh)
WO (1) WO2014130086A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106970771B (zh) * 2016-01-14 2020-01-14 腾讯科技(深圳)有限公司 音频数据处理方法和装置
US11361772B2 (en) 2019-05-14 2022-06-14 Microsoft Technology Licensing, Llc Adaptive and fixed mapping for compression and decompression of audio data

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3683767D1 (de) * 1986-04-30 1992-03-12 Ibm Sprachkodierungsverfahren und einrichtung zur ausfuehrung dieses verfahrens.
US5765127A (en) * 1992-03-18 1998-06-09 Sony Corp High efficiency encoding method
US5884253A (en) 1992-04-09 1999-03-16 Lucent Technologies, Inc. Prototype waveform speech coding with interpolation of pitch, pitch-period waveforms, and synthesis filter
US6219635B1 (en) 1997-11-25 2001-04-17 Douglas L. Coulter Instantaneous detection of human speech pitch pulses
US6272460B1 (en) 1998-09-10 2001-08-07 Sony Corporation Method for implementing a speech verification system for use in a noisy environment
US7272556B1 (en) * 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
US7924752B2 (en) * 1999-09-20 2011-04-12 Broadcom Corporation Voice and data exchange over a packet based network with AGC
US7222070B1 (en) * 1999-09-22 2007-05-22 Texas Instruments Incorporated Hybrid speech coding and system
US7039581B1 (en) * 1999-09-22 2006-05-02 Texas Instruments Incorporated Hybrid speed coding and system
US7139700B1 (en) * 1999-09-22 2006-11-21 Texas Instruments Incorporated Hybrid speech coding and system
US6377916B1 (en) * 1999-11-29 2002-04-23 Digital Voice Systems, Inc. Multiband harmonic transform coder
US20040002856A1 (en) 2002-03-08 2004-01-01 Udaya Bhaskar Multi-rate frequency domain interpolative speech CODEC system
US20060020469A1 (en) 2004-07-08 2006-01-26 Rast Rodger H Apparatus and methods for static and semi-static displays
US8135047B2 (en) * 2006-07-31 2012-03-13 Qualcomm Incorporated Systems and methods for including an identifier with a packet associated with a speech signal
JP2009109805A (ja) 2007-10-31 2009-05-21 Toshiba Corp 音声処理装置及びその方法
PL2346030T3 (pl) 2008-07-11 2015-03-31 Fraunhofer Ges Forschung Koder audio, sposób kodowania sygnału audio oraz program komputerowy
WO2012088336A2 (en) 2010-12-22 2012-06-28 Genaudio, Inc. Audio spatialization and environment simulation

Also Published As

Publication number Publication date
WO2014130086A1 (en) 2014-08-28
US9236058B2 (en) 2016-01-12
US20140236584A1 (en) 2014-08-21

Similar Documents

Publication Publication Date Title
RU2667382C2 (ru) Улучшение классификации между кодированием во временной области и кодированием в частотной области
KR101871644B1 (ko) 적응적 대역폭 확장 및 그것을 위한 장치
US9842598B2 (en) Systems and methods for mitigating potential frame instability
JP6526096B2 (ja) 平均符号化レートを制御するためのシステムおよび方法
US9208775B2 (en) Systems and methods for determining pitch pulse period signal boundaries
TWI518677B (zh) 用於判定內插因數組之系統及方法
US9236058B2 (en) Systems and methods for quantizing and dequantizing phase information