TWI698859B - 編碼及解碼音訊信號之技術 - Google Patents

編碼及解碼音訊信號之技術 Download PDF

Info

Publication number
TWI698859B
TWI698859B TW107139530A TW107139530A TWI698859B TW I698859 B TWI698859 B TW I698859B TW 107139530 A TW107139530 A TW 107139530A TW 107139530 A TW107139530 A TW 107139530A TW I698859 B TWI698859 B TW I698859B
Authority
TW
Taiwan
Prior art keywords
frame
information
audio signal
value
ltpf
Prior art date
Application number
TW107139530A
Other languages
English (en)
Other versions
TW201923746A (zh
Inventor
艾曼紐 拉斐里
愛德瑞恩 托馬斯克
曼法德 路茲奇
康瑞德 班恩朵夫
Original Assignee
弗勞恩霍夫爾協會
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 弗勞恩霍夫爾協會 filed Critical 弗勞恩霍夫爾協會
Publication of TW201923746A publication Critical patent/TW201923746A/zh
Application granted granted Critical
Publication of TWI698859B publication Critical patent/TWI698859B/zh

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

提供一種用以編碼/解碼音訊信號資訊之方法及裝置及非暫時性記憶體單元。該編碼器端可判定一信號訊框是否對長期後濾波(LTPF)及/或封包丟失消隱(PLC)有用並可依據該判定之結果來編碼資訊。該解碼器端可依據自該編碼器獲得的該資訊應用該LTPF及/或PLC。

Description

編碼及解碼音訊信號之技術
1. 技術領域
本發明之示例有關於一種用以編碼/解碼音訊信號資訊的方法及裝置。
2. 先前技術 先前技術包含以下段落:
[1] 3GPP TS 26.445; 用於增前語音服務(EVS)的編解碼器;詳盡的演算法描述。
[2] ISO/IEC 23008-3:2015; 資訊科技 – 異質環境中之高效編碼與媒體傳遞—第3部: 3D 音訊。
[3] Ravelli等"使用諧波後濾波器處理音訊信號的裝置與方法"美國專利申請號2017/0140769 A1. 2017年5月18日。
[4] Markovic等"諧波濾波器工具之諧度相依控制"美國專利申請號2017/0133029 A1. 2017年5月11日。
[5] ITU-T G.718: 8-32 kbit/s的語音及音訊之訊框錯誤穩健窄頻及寬頻嵌入式可變位元率編碼。
[6] ITU-T G.711 附錄I: 針對以G.711進行封包丟失消隱之高品質低複雜度演算法。
[7] 3GPP TS 26.447;用於增前語音服務(EVS)的編解碼器;丟失封包之錯誤消隱。
以轉換為基礎之音訊編解碼器通常在處理諧波音訊信號時引入諧波間雜訊,特別是在低延遲及低位元率時。此諧波間雜訊通常被認為是很惱人的假影,當主觀評估高聲調音訊素材時顯著降低以轉換為基礎之音訊編解碼器的效能。
長期後濾波(LTPF)是一種用於以轉換為基礎之音訊編碼器的工具,其幫助降低此諧波間雜訊。LTPF仰賴在轉換解碼之後應用於時域信號的一後濾波器。此後濾波器本質上為具有由諸如音調資訊(例如音調延遲)之參數控制的梳狀頻率響應的無限脈衝響應(IIR)濾波器。
為了較佳的穩健性,該後濾波器參數(一音調延遲及,在一些示例中,每訊框之增益),例如當在增益為非零時,在編碼器端估測並編碼於位元串流中。在示例中,增益為零的情況係以一位元發訊並對應至一非現用中後濾波器,其在信號不包含諧波部分時被使用。
LTPF最初係在3GPP EVS標準中介紹[1]並在之後整合至MPEG-H 3D音訊標準[2]中。相對應之專利為[3]及[4]。
在先前技術中,其他於解碼器處的功能可利用音調資訊。一例子是封包丟失消隱(PLC)或錯誤消隱。PLC係用於音訊編解碼器以在從編碼器到解碼器的傳輸期間消隱丟失或損壞的封包。在先前技術中,PLC可在解碼器端執行並在轉換域中或在時域中外插解碼信號。理想上,消隱的信號應不帶假影並應具有與失去信號相同的頻譜特性。此目標在要消隱的信號含有諧波結構時特別難以達成。
在此情況下,以音調為基礎的PLC技術可產生可接受的結果。這些方法假設信號係局部穩態並藉由使用一外插音調週期合成一週期信號來恢復該丟失信號。這些技術可用於以CELP為基礎的語音編碼中(參見,例如ITU-T G.718[5])。這些技術亦可用於PCM編碼(ITU-T G.711[6])。而最近,他們被應用於以MDCT為基礎的音訊編碼,最好的例子為3GPP EVS標準中的TCX時域消隱(TCX TD-PLC)。
該音調資訊(其可為音調延遲)係使用於以因調為基礎之PLC的主要參數。此參數可在編碼器端估測並編碼進位元串流中。在此情況下,使用最後良好訊框的音調延遲以消隱當前丟失訊框(像是在如[5]與[7]中)。若在位元串流中沒有音調延遲,則可藉由對解碼信號(像是在如[6]中)運行一音調偵測演算法來於解碼器端估測出。
在3GPP EVS標準中(見[1]及[7]),LTPF與以音調為基礎的PLC皆用於相同的MDCT為基礎的TCX音訊編解碼器。兩個工具皆共享相同的音調延遲參數。LTPF編碼器估測並編碼音調延遲參數。此音調延遲係在增益為非零時出現於位元串流中。在解碼器端,解碼器使用此資訊來濾波該解碼信號。在封包丟失的情況中,在最後良好訊框的LTPF增益高於某一臨界值且滿足其他條件時(詳見[7])使用以音調為基礎的PLC。在此情況中,音調延遲係出現於位元串流中且其可直接由PLC模組使用。
先前技術的位元串流語法係以下給出:
Figure 107139530-A0304-0001
然而,可能引發一些問題。
音調延遲參數並非針對每個訊框被編碼於位元串流中。當一訊框中的增益為零時(LTPF非現用),該位元串流中不存在音調延遲資訊。此會在信號的諧波內容不佔主導及/或足夠穩定時發生。
因此,藉由基於該增益而區辨該音調延遲的編碼,可透過其他功能獲得無音調延遲(例如PLC)。
舉例而言,具有訊框其中信號為微略諧波,對LTPF為不足,但對使用音調為基礎的PLC卻是足夠的。在該情形中,即便音調延遲參數不存在於該位元串流中,還是在解碼端處需要該音調延遲參數。
一種解決方案是在解碼器端增加一第二音調偵測器,但此將對複雜度增加一顯著的量,這對目標為低功率設備的音訊編解碼器來說是一個問題。
3. 本發明
根據本發明的示例,提供一種用以解碼與劃分成一序列訊框的一音訊信號相關聯之音訊信號資訊的裝置,包含: 一位元串流讀取器,其組配來讀取具有下列各項的編碼音訊信號資訊: 針對一第一訊框及一第二訊框之該音訊信號的一編碼表示形式; 針對該第一訊框之一第一音調資訊以及具有一第一數值的一第一控制資料項目;以及 針對該第二訊框之一第二音調資訊以及具有與該第一數值不同的一第二數值之一第二控制資料項目;以及 一控制器,其組配來控制一長期後濾波器(LTPF),以: 在該第二控制資料項目具有該第二數值時使用該第二音調資訊濾波該第二訊框中的該音訊信號之一解碼表示形式;以及 在該第一控制資料項目具有該第一數值時針對該第一訊框停用該LTPF。
因此,該裝置能夠區辨適合於LTPF的訊框與不適合LTPF的訊框,同時即使LTPF並不合適,使用訊框進行錯誤消隱。舉例來說,在較高諧度的情況下,該裝置可利用該音調資訊(例如音調延遲)於LTPF。在較低諧度的情況下,該裝置可避免使用該音調資訊於LTPF,但可利用該音調資訊於其他功能(例如消隱)。
根據示例,該位元串流讀取器係組配來讀取一第三訊框,該第三訊框具有指示該第一音調資訊及/或該第二音調資訊存在或不存在的一控制資料項目。
根據示例,該第三訊框具有缺少該第一音調資訊、該第一控制資料項目、該第二音調資訊、以及該第二控制資料項目的一格式。
根據示例,該第三控制資料項目係以具有區別該第三訊框與該第一及第二訊框之一數值的一單一位元編碼。
根據示例,在該編碼音訊信號資訊中,針對該第一訊框,為該第一控制資料項目保留一單一位元並為該第一音調資訊保留一固定資料欄位。
根據示例,在該編碼音訊信號資訊中,針對該第二訊框,為該第二控制資料項目保留一單一位元並為該第二音調資訊保留一固定資料欄位。
根據示例,該第一控制資料項目及該第二控制資料項目係編碼於該編碼音訊信號資訊中的相同部分或資料欄位中。
根據示例,該編碼音訊信號資訊包含編碼該第三控制資料項目的一第一傳訊位元;以及在指示該第一音調資訊(16b)及/或該第二音調資訊(17b)存在的該第三控制資料項目(18e)之一數值的情形下,編碼該第一控制資料項目(16c)及該第二控制資料項目(17c)的一第二傳訊位元。
根據示例,該裝置可進一步包含組配來使用該第一及/或第二音調資訊以消隱一後續不正確解碼的音訊訊框的一消隱單元。
根據示例,該消隱單元可組配來,在決定一無效訊框之解碼的情況下,檢查是否有儲存關於一先前正確解碼的訊框的音調資訊,以便以使用該儲存的音調資訊獲得的一訊框來消隱一無效解碼訊框。
因此,能夠在每次該音訊信號適用消隱、且並不只在該音訊信號適用LTPF時獲得良好的消隱。當獲得該音訊資訊時,沒有必要估測該音調延遲,因此降低了複雜度。
根據示例,提供用以編碼音訊信號的裝置,包含: 一音調估測器,組配來獲取與一音訊信號之一音調相關聯的音調資訊; 一信號分析器,組配來獲取與該音訊信號之諧度相關聯的諧度資訊;以及 一位元串流形成器,組配來準備編碼訊框之編碼音訊信號資訊,以便將下列項目包括於該位元串流之中: 針對一第一訊框、一第二訊框、以及一第三訊框之該音訊信號的一編碼表示形式; 針對該第一訊框之一第一音調資訊以及具有一第一數值的一第一控制資料項目; 針對該第二訊框之一第二音調資訊以及具有與該第一數值不同的一第二數值之一第二控制資料項目;以及 針對該第一、第二、以及第三訊框之一第三控制資料項目; 其中該第一數值及該第二數值取決於與該諧度資訊相關聯的一第二準則,以及 該第一數值指示針對該第一訊框中之該音訊信號之該諧度的該第二準則未滿足,以及 該第二數值指示針對該第二訊框中之該音訊信號之該諧度的該第二準則滿足, 其中該第二準則包含當至少一第二諧度測量大於至少一第二臨界值時滿足的至少一條件, 該第三控制資料項目係以具有一數值的一單一位元編碼,該數值區別該第三訊框與該第一及第二訊框,該第三訊框在第一準則未滿足的情況下會被編碼以及該第一及第二訊框在該第一準則滿足的情況下會被編碼,其中該第一準則包含當至少一第一諧度測量大於至少一第一臨界值時滿足的至少一條件, 其中在該位元串流中,針對該第一訊框,為該第一控制資料項目保留一單一位元並為該第一音調資訊保留一固定資料欄位, 其中在該位元串流中,針對該第二訊框,為該第二控制資料項目保留一單一位元並為該第二音調資訊保留一固定資料欄位, 其中在該位元串流中,針對該第三訊框,不為該固定資料欄位及/或該第一與第二控制項目保留位元。
因此,該解碼器能夠區辨有用於LTFP的訊框、僅有用於PLC的訊框,以及皆無用於LTFP及PLC的訊框。
根據示例,該第二準則包含當先前訊框之至少一第一諧度測量大於該至少一第二臨界值時滿足的一額外條件。
根據示例,該信號分析器係組配來判定該信號在兩個連續訊框間是否為穩定作為該第二準則的一條件。
因此,該解碼器能夠區辨,例如,一穩定信號與一非穩定信號。在非穩定信號的情況中,該解碼器可避免使用該音調資訊於LTPF,但可使用該音調資訊於其他功能(例如消隱)。
根據示例,該第一與第二諧度測量係在不同取樣率下取得。
根據示例,該音調資訊包含一音調延遲資訊或其一經處理版本。
根據示例,該諧度資訊包含一自相關值及/或一標準化自相關值及/或其一經處理版本之至少一者。
根據示例,提供一種用以解碼與劃分成一序列訊框的一音訊信號相關聯之音訊信號資訊的方法,包含: 讀取一編碼音訊信號資訊,其包含: 針對一第一訊框與一第二訊框之該音訊信號的一編碼表示形式; 針對該第一訊框之一第一音調資訊以及具有一第一數值的一第一控制資料項目(16c); 針對該第二訊框之一第二音調資訊以及具有與該第一數值不同的一第二數值之一第二控制資料項目(17c), 在判定該第一控制資料項目具有該第一數值時,使用該第一音調資訊於一長期後濾波器(LTPF),以及 在判定該第二控制資料項目之該第二數值時,停用該LTPF。
根據示例,該方法進一步包含,在判定該第一或第二控制資料項目具有該第一或第二數值時,使用該第一或第二音調資訊於一錯誤消隱功能。
根據示例,提供一種用以編碼與劃分成訊框之一信號相關聯的音訊信號資訊,包含: 自該音訊信號獲取測量; 驗證一第二準則的滿足,該第二準則係基於該等測量並包含當至少一第二諧度測量大於一第二臨界值時滿足的至少一條件; 形成包括下列項目之帶有訊框的一編碼音訊信號資訊: 針對一第一訊框與一第二訊框與一第三訊框之該音訊信號的一編碼表示形式; 針對該第一訊框之一第一音調資訊與具有一第一數值的一第一控制資料項目及一第三控制資料項目; 針對該第二訊框之一第二音調資訊與具有與該第一數值不同的一第二數值之一第二控制資料項目及一第三控制資料項目, 其中該第一數值與該第二數值取決於該第二準則,且該第一數值指示基於該第一訊框中之該音訊信號的一諧度之該第二準則的未滿足,以及該第二數值指示基於該第二訊框中之該音訊信號的一諧度之該第二準則的滿足, 該第三控制資料項目為具有一數值的一單一位元,該數值區別該第三訊框與跟該第一準則之滿足相關聯的該第一及第二訊框,以便在該第三控制資料項目指示基於在至少一第一諧度測量高於至少一第一臨界值時滿足的至少一條件之該第一準則的未滿足時識別該第三訊框, 其中形成該編碼音訊信號資訊,使得針對該第一訊框,保留一單一位元用於該第一控制資料項目以及一固定資料欄位用於該第一音調資訊, 其中形成該編碼音訊信號資訊,使得針對該第二訊框,保留一單一位元用於該第二控制資料項目以及一固定資料欄位用於該第二音調資訊, 其中形成該編碼音訊信號資訊,使得針對該第三訊框,不為該固定資料欄位保留位元以及不為該第一控制資料項目與該第二控制資料項目保留位元。
根據示例,提供一種方法,包含: 編碼一音訊信號: 將編碼音訊信號資訊傳送至一解碼器或儲存該編碼音訊信號資訊; 解碼該音訊信號資訊。
根據示例,提供一種用以編碼/解碼音訊信號之方法,包含: 在編碼器處,編碼一音訊信號並推導出諧度資訊及/或音調資訊; 在編碼器處,判定該諧度資訊及/或音調資訊是否適合於至少一LTPF及/或錯誤消隱功能; 將一位元串流自解碼器傳送至一編碼器及/或將其儲存於一記憶體中,該位元串流包括該音訊信號之一數位表示形式以及與諧度相關聯之資訊並傳訊該音調資訊是否適於LTPF及/或錯誤消隱; 在解碼器處,根據來自該編碼器之該傳訊解碼該音訊信號之該數位表示形式並使用該音調資訊於LTPF及/或錯誤消隱。
根據示例,該編碼器係根據上述或下述的任何示例,及/或該解碼器係根據上述或下述的任何示例,及/或根據上述或下述的任何示例來編碼及/或根據上述或下述的任何示例來解碼。
根據示例,提供一種儲存指令之非暫時性記憶體單元,當該等指令由一處理器執行時,執行上述或下述之方法。
因此,該編碼器可判定一信號訊框是否對長期後濾波(LTPF)及/或封包丟失消隱(PLC)有用並可依據該判定結果編碼資訊。該解碼器可依據自該編碼器獲取的該資訊應用該LTPF及/或PLC。
5. 編碼器端
圖1顯示一裝置10。該裝置10可用於編碼信號(編碼器)。例如,該裝置10可編碼音訊信號11以產生編碼音訊信號資訊(例如資訊12、12’、12”,使用下述使用之技術)。
裝置10可包括一組件(未顯示)以獲取(例如藉由取樣原始音訊信號)該音訊信號之數位表示形式,以便以數位形式處理。該音訊信號可被劃分成訊框(例如對應於一序列時間間隔)或子訊框(其可為訊框的細分)。舉例來說,每個間隔可為20ms長(一個細分可為10ms長)。每個訊框在時域(TD)中可包含一有限數量個樣本(例如針對一20ms訊框1024或2048個樣本)。在示例中,一訊框或一複製或其一經處理版本可被(部分地或完全地)轉換成一頻域(FD)表示形式。
該編碼音訊信號資訊可為,舉例來說,代碼激發線性預測(CELP)、或代數CELP(ACELP)類型、及/或TCX類型。在示例中,裝置10可包括一降取樣器(未顯示)以降低每個訊框的樣本數量。在示例中,裝置10可包括一再取樣器(其可為升取樣器、低通濾波器、及升取樣器類型)。
在示例中,裝置10可將該編碼音訊信號資訊提供至一通訊單元。該通訊單元可包含硬體(例如具有至少一天線)以與其他設備通訊(例如將該編碼音訊信號資訊傳送到其他設備)。該通訊單元可執行根據一特定協定的通訊。該通訊可為無線的。可執行在藍牙標準之下的傳輸。在示例中,裝置10可包含一儲存設備(或儲存該編碼音訊信號資訊於其上)。
裝置10可包含一音調估測器13,其可在一訊框中(例如在一時間間隔內)針對音訊信號11估測並提供輸出音調資訊13a。音調資訊13a可包含一音調延遲或其經處理版本。音調資訊13a可,例如,透過運算音訊信號11之自相關獲得。音調資訊13a可表示於一二元資料欄位中(此處以「ltpf_pitch_lag」表示),該二元資料欄位可,例如,以介於7到11之間的位元個數(例如9位元)表示。
裝置10可包含一信號分析器14,其可針對一訊框(例如在一時間間隔內)而分析音訊信號11。信號分析器14可,例如,獲取與音訊信號11相關聯的諧度資訊14a。諧度資訊可包含或基於,例如,下列之至少一者或其組合:相關資訊(例如自相關資訊)、增益資訊(例如後濾波器增益資訊)、週期性資訊、可預測性資訊等。這些數值中至少一者可例如被標準化或處理。
在示例中,諧度資訊14a可包含可用一位元(此處以「ltpf_active」表示)編碼的資訊。諧度資訊14a可攜載信號之諧度的資訊。諧度資訊14a可基於由信號滿足的準則(「第二準則」)。諧度資訊14a可區別,例如,第二準則的滿足(其可與較高週期性及/或較高可預測性及/或信號的穩定性相關聯)與第二準則的未滿足(其可與較低諧度及/或較低可預測性及/或信號不穩定性相關聯)。較低諧度通常與雜訊相關聯。諧度資訊14a中的資料之至少一者可基於該第二準則的驗證及/或由該第二準則建立之條件中至少一者的驗證。舉例來說,該第二準則可包含至少一諧度相關測量(例如自相關、諧度、增益、可預測性、週期性等之一者或組合,其亦可被標準化及/或處理)、或其一經處理版本與至少一臨界值的比較。舉例來說,一臨界值可為一「第二臨界值」(可能多於一臨界值)。在一些示例中,該第二準則包含對先前訊框(例如緊接在當前訊框前的訊框)之條件的驗證。在一些示例中,諧度資訊14a可用一位元編碼。在一些其他示例中,用一序列位元(例如一位元用於「ltpf_active」及一些其他位元,例如,用於增益資訊或其他諧度資訊)。
如選擇器26所指示,輸出諧度資訊21a可控制音調資訊13a的實際編碼。舉例來說,在極低諧度的情況中,可防止音調資訊13a被編碼於一位元串流中。
如選擇器25所指示,輸出諧度資訊21a的數值(「ltpf_pitch_lag_present」)可控制諧度資訊14a的實際編碼。因此,在偵測極低諧度(例如基於與該第二準則不同的準則)的情況中,可防止諧度資訊14a被編碼於一位元串流中。
裝置10可包含一位元串流形成器15。位元串流形成器15可提供音訊信號11(例如在一時間間隔中)的編碼音訊信號資訊(以12、12’、或12”指示)。特別是,位元串流形成器15可形成含有至少音訊信號11之數位版本、音調資訊13a(例如「ltpf_pitch_lag」)、以及諧度資訊14a(例如「ltpf_active」)的一位元串流。該編碼音訊信號資訊可提供至一解碼器。該編碼音訊信號資訊可為一位元串流,其可被,例如,儲存及/或傳送到一接收器(其可反過來解碼由裝置10編碼的音訊資訊)。
該編碼音訊信號資訊中的音調資訊13a可在解碼器端被使用於一長期後濾波器(LTPF)。該LTPF可於TD中操作。例如,當諧度資訊14a指示一較高諧度,該LTPF將會在解碼器端啟用(例如使用音調資訊13a)。當諧度資訊14a指示一較低(中間)諧度(或無論如何不適用於LTPF的諧度),該LTPF將會在解碼器端停用或減用(例如不使用音調資訊13a,即使音調資訊依然編碼於該位元串流中)。當諧度資訊14a包含「ltpf_active」欄位(其可用一位元編碼),ltpf_active=0可意謂「在解碼器不使用該LTPF」,而ltpf_active=1可意謂「在解碼器使用該LTPF」。舉例來說,ltpf_active=0可與一諧度相關聯,該諧度係低於與ltpf_active=1相關聯的諧度,例如在將一諧度測量與該第二臨界值比較完之後。雖然根據此文件中的慣例ltpf_active=0是指比與ltpf_active=1相關聯的諧度還低的一諧度,可提供一不同的慣例(例如,基於二元數值的不同意義)。可使用額外或替代的準則及/或條件以供判定ltpf_active的數值。例如,為了陳述ltpf_active=1,亦可檢查該信號是否穩定(例如,藉由亦檢查與一先前訊框相關聯的諧度測量)。
除了該LTPF功能,音調資訊13a可被用來,例如,在該解碼器執行一封包丟失消隱(PLC)操作。在示例中,不論諧度資訊14a為何(例如,即使ltpf_active=0),都將執行該PLC。因此,在示例中,雖然音調資訊13a將總是被該解碼器的LTPF功能使用,但相同的音調資訊13a將只在由諧度資訊14a設定的條件下僅由解碼器處的一LPTF功能使用。
亦可能驗證一「第一準則」(其可與該第二準則不同)的滿足或未滿足,例如,用於判定是否諧度資訊13a的傳輸將對解碼器而言為一貴重資訊。
在示例中,當信號分析器14偵測到諧度(例如一特定諧度測量)未滿足第一準則(該第一準則被滿足,例如,在諧度的條件下,並特別是諧度測量,係高於一特定「第一臨界值」),則裝置10可選擇編碼無音調資訊13a。在該情形下,舉例來說,該解碼器將使用該編碼訊框中的資料,既不用於LPTF功能亦不用於PLC功能(至少,在一些示例中,該解碼器將使用非基於音調資訊的消隱策略,而是使用不同消隱技術,像是以解碼器為基礎的估測、FD消隱技術、或其他技術)。
在一些示例中,可選擇上述的該第一與第二臨界值,使得: - 該第一臨界值及/或第一準則區辨適用於PLC的音訊信號與不適用於PLC的音訊信號;以及 - 該第二臨界值及/或第二準則區辨適用於LTPF的音訊信號與不適用於LTPF的音訊信號。
在示例中,可選擇該第一與第二臨界值使得,假使與該第一與第二臨界值比較的該等諧度測量具有介於0與1之間的一數值(其中0意謂:非諧波信號;以及1意謂:完美諧波信號),則該第一臨界值之數值係低於該第二臨界值之數值(例如,與該第一臨界值相關聯的諧度係低於與該第二臨界值相關聯的諧度)。
在為該第二準則設置的條件當中,亦能夠檢查是否音訊信號11的時間演進使得能夠使用該信號於LTPF。舉例來說,亦可能檢查,針對先前訊框,是否已達到近似(或相同)的臨界值。在示例中,諧度測量(或其經處理版本)的組合(或加權組合)可與一或多個臨界值做比較。可使用不同的諧度測量(例如在不同取樣率下獲取的)。
圖5顯示可由裝置10準備的該編碼音訊信號資訊的訊框12”(或訊框的部分)之示例。可在第一訊框16”、第二訊框17”、以及第三訊框18”當中區別出訊框12”。在音訊信號11的時間演進中,該等第一訊框16”可被該等第二訊框17”及/或該等第三訊框取代,且反之亦然,例如,根據在特定時間間隔(例如,在該信號滿足或不滿足該第一及/或第二準則及/或該諧度大於或小於該第一臨界值及/或第二臨界值的基礎上)中之該音訊信號的特徵(例如諧度)。
第一訊框16”可為與適用於PLC但不一定適用於LTPF(滿足第一準則、不滿足第二準則)之諧度相關聯的訊框。舉例來說,一諧度測量可低於該第二臨界值或不滿足其他條件(例如,信號在先前訊框與當前訊框之間一直是不穩定的)。第一訊框16”可包含音訊信號11的一編碼表示形式16a。第一訊框16”可包含第一音調資訊16b(例如「ltpf_pitch_lag」)。第一音調資訊16b可編碼或基於,例如,由音調估測器13獲得的音調資訊13a。第一訊框16”可包含一第一控制資料項目16c(例如「ltpf_active」,根據當前慣例具有數值「0」),其可包含或基於,例如由信號分析器14獲得的諧度資訊14a。此第一訊框16”可含有(於欄位16a中)足夠的資訊以供,在該解碼器端,解碼音訊信號,並且使用音調資訊13a(編碼於16b中)於PLC,如果有需要的話。在示例中,由於諧度不滿足該第二準則(例如該信號之低諧度測量及/或在兩個連續訊框之間不穩定的信號),該解碼器將不會使用音調資訊13a於LTPF。
第二訊框17”可為與保有足夠用於LTPF之一諧度(例如,其滿足該第二準則,例如根據一測量,該諧度高於該第二臨界值及/或該先前訊框亦大於至少一特定臨界值)相關聯的訊框。第二訊框17”可包含音訊信號11之一編碼表示形式17a。第二訊框17”可包含第二音調資訊17b(例如「ltpf_pitch_lag」)。第二音調資訊17b可編碼或基於,例如由音調估測器13獲得的音調資訊13a。第二訊框17”可包含一第二控制資料項目17c(例如「ltpf_active」,根據當前慣例具有數值「1」),其可包含或基於,例如由信號分析器14獲得的諧度資訊14a。此第二訊框17”可含有足夠的資訊使得,在該解碼器端,解碼音訊信號11,並且可使用音調資訊17b(來自音調估測器之輸出13a)於PLC,如果有需要的話。進一步地,由於滿足該第二準則,特別是基於該信號的高諧度(如根據當前慣例,由ltpf_active=1表示),該解碼器將會使用音調資訊17b(13a)於LTPF。
在示例中,第一訊框16”與第二訊框17”係由控制資料項目16c與17c的數值(例如由「ltpf_active」的二元數值)識別。
在示例中,當被編碼於該位元串流中時,該等第一與該等第二訊框,針對該第一與第二音訊資訊(16b、17b)以及針對該第一與第二控制資料項目(16c、17c)呈現一格式,使得: - 保留一單一位元以供編碼該第一與第二控制資料項目16c與17c;以及 - 為該第一與第二音調資訊16b與17b之各者保留一固定資料欄位。
因此,可由在訊框中一特定(例如固定的)部分中一位元的數值從一單一第二資料項目17c中區別一單一第一資料項目16c。亦可對該第一與第二音調資訊在一保留位置(例如固定位置)中插入的一固定位元數目。
在示例(例如顯示於圖4及/或圖5中)中,諧度資訊14a不單只區辨該第二準則的滿足與不滿足,例如,不單只區辨較高諧度與較低諧度。在一些情況中,諧度資訊可包含諸如增益資訊(例如,後濾波器增益)、及/或相關資訊(自相關,標準化相關)、及/或其經處理版本的額外諧度資訊。在一些情況中,此處所引用的增益或其他諧度資訊可用1至4位元(例如,2位元)編碼並可指由信號分析器14獲得的後濾波器增益。
在編碼該額外諧度資訊的示例中,該解碼器藉由辨認ltpf_active=1(例如,第二訊框17’或17”),可知道第二訊框17’或17”之一後續欄位編碼該額外諧度資訊17d。相對地,藉由確認ltpf_active=0(例如,第一訊框16’或16”),該解碼器可知道沒有額外諧度資訊欄位17d被編碼於訊框17’或17”中。
在示例(例如圖5)中,第三訊框18”可被編碼於位元串流中。可定義第三訊框18”以致有一缺少兂調資訊及諧度資訊的格式。其資料結構不提供用以編碼資料16b、16c、17b、17c的位元。然而,第三訊框18”依然可包含音訊信號之一編碼表示形式18a及/或其他有用於該編碼器的控制資料。
在示例中,第三訊框18”係由第三控制資料項目18e(「ltpf_pitch_lag_present」)從該等第一與第二訊框區別出,第三控制資料項目18e可在該第三訊框中具有一數值,該數值與第一與第二訊框16”與17”中的數值不同。舉例來說,第三控制資料項目18e可為「0」以識別第三訊框18”且為「1」以識別第一與第二訊框16”與17”。
在示例中,當資訊信號對LTPF及對PLC不為有用時(例如,由於非常低的諧度,舉例來說,例如,當雜訊盛行時)可編碼第三訊框18”。因此,控制資料項目18e(「ltpf_pitch_lag_present」)可為「0」以向解碼器發訊通知在音訊延遲中沒有貴重資訊,並因而通知對其編碼是沒有意義的。此可為基於該第一準則之驗證程序的結果。
根據當前慣例,當第三控制資料項目18e為「0」時,諧度測量可低於與一低諧度相關聯的一第一臨界值(此可為用以驗證該第一準則之滿足的一項技術)。
圖3及圖4顯示第一訊框16、16’以及第二訊框17、17’的示例,其中不提供第三控制資料項目18e(第二訊框17’編碼額外諧度資訊,其在一些示例中為可選的)。在一些示例中,不使用這些訊框。然而,要注意的是在一些示例中,除了缺少第三控制項目18e外,訊框16、16’、17、17’與圖5之訊框16”與17”具有相同欄位。
圖2顯示裝置10’之一示例,該裝置可為裝置10之一特定實施態樣。因而於此不再重複裝置10的屬性(信號的特徵、代碼、傳輸/儲存特徵、藍牙實作等)。裝置10’可準備音訊信號11的一編碼音訊信號資訊(例如訊框12、12’、12”)。裝置10’可包含一音調估測器13、一信號分析器14、以及一位元串流形成器15,其可為如(或非常相似於)裝置10的那些。裝置10’亦可包含如裝置10之用以取樣、再取樣、以及濾波的組件。
音調估測器13可輸出音調資訊13a(例如音調延遲,像是「ltpf_pitch_lag」)。
信號分析器14可輸出諧度資訊24c(14a),其在一些示例中可由多個數值形成(例如,多重數值組成的一向量)。信號分析器14可包含可輸出諧度測量24a的諧度測量器24。諧度測量24a可包含標準化或非標準化的相關/自相關資訊、增益(例如後濾波器增益)資訊、週期性資訊、可預測性資訊、與信號之穩定性及/或演進相關的資訊,其經處理版本等。參考符號24a可指多個數值,然而,其至少一些(或全部),可為相同或可為不同,及/或相同數值經處理的版本,及/或以不同取樣率取得。
在示例中,諧度測量24a可包含一第一諧度測量24a’(其可以一第一取樣率,例如6.4 kHz量測)與一第二諧度測量24a”(其可以一第二取樣率,例如12.8 kHz量測)。在其他示例中,可使用相同測量。
在區塊21處驗證諧度測量24a(例如第一諧度測量24a’)是否滿足該第一準則,例如它們超過一第一臨界值,其可儲存於記憶體元件23中。
舉例來說,可將至少一諧度測量24a(例如第一諧度測量24a’)與該第一臨界值做比較。該第一臨界值,例如,可被儲存於記憶體元件23中(例如一非暫時性記憶體元件)。區塊21(其可被視為第一諧度測量24a’與該第一臨界值的比較器)可輸出指示音訊信號11的諧度是否超過該第一臨界值(及特別是,第一諧度測量24a’是否超過該第一臨界值)的諧度資訊21a。
在示例中,舉例來說,ltpf_pitch_present可為,
Figure 02_image001
其中
Figure 02_image003
係取樣率為6.4 kHz的音訊信號,
Figure 02_image005
係當前訊框的長度,且
Figure 02_image007
係針對當前訊框由音調估測器取得的音調延遲,以及
Figure 02_image009
係在延遲T 處長度L 的信號x 的標準化相關,
Figure 02_image011
在一些示例中,可使用其他取樣率或其他相關。在示例中,該第一臨界值可為0.6。事實上,已有注意到對於超過0.6的諧度測量,可以可靠地執行PLC。然而,即使數值略超過0.6,並不總是保證能夠可靠地執行LTPF。
來自區塊21的輸出21a因此可為二元值(例如「ltpf_pitch_lag_present」),若該諧度超過該第一臨界值(例如若諧度測量24a’超過該第一臨界值),其可為「1」,以及若該諧度低於該第一臨界值,則可為「0」。諧度資訊21a(例如「ltpf_pitch_lag_present」)可控制實際輸出13a的編碼:若(例如以如上所顯示的第一測量24a’)該諧度低於該第一臨界值(ltpf_pitch_lag_present=0)或不滿足該第一準則,不會編碼音調資訊13a;若該諧度超過該第一臨界值(ltpf_pitch_lag_present=1)或滿足該第一準則,實際上會編碼音調資訊。輸出21a(「ltpf_pitch_lag_present」)可編碼。因此,輸出21a可編碼為第三控制項目18e(例如當輸出21a為「0」時用以編碼第三訊框18”,以及當輸出21a為「1」時用以編碼第二或第三訊框)。
諧度測量器24可選擇地輸出例如可為一增益資訊(例如「ltpf_gain」)的諧度測量24b,該增益資訊可由位元串流形成器15編碼於編碼音訊信號資訊12、12’、12”中。可提供其他參數。在一些示例中,可在解碼器端針對LTPF使用其他諧度資訊24b。
如區塊22所示,該第二準則之滿足的驗證可以至少一諧度測量24a(例如第二諧度測量24a”)的基礎執行。
該第二準則所基於的一條件可為至少一諧度測量24a(例如第二諧度測量24a”)與一第二臨界值的比較。該第二臨界值可儲存,例如,於記憶體元件23中(在不同於儲存該第一臨界值的一記憶體位置中)。
該第二準則亦可基於其他條件(例如基於同時滿足兩個不同條件)。一額外的條件可,例如,基於先前訊框。舉例來說,能夠將至少一諧度測量24a(例如第二諧度測量24a”)與一臨界值做比較。
因此,區塊22可輸出諧度資訊22a,其係可基於至少一條件或多個條件(例如一條件於當訊框及一條件於先前訊框)。
區塊22可輸出(例如做為該第二準則的驗證程序結果)諧度資訊22a,其指示音訊信號11之諧度(針對當前訊框及/或針對先前訊框)是否超過一第二臨界值(以及,例如,第二諧度測量24a”是否超過一第二臨界值)。
諧度資訊22a可為二元值(例如「ltpf_active」),其在該諧度超過該第二臨界值時(例如該第二諧度測量24a”超過該第二臨界值)可為「1」,並在(當前訊框及/或先前訊框的)該諧度低於該第二臨界值時(例如第二諧度測量24a”低於該第二臨界值)可為「0」。
諧度資訊22a(例如「ltpf_active」)可控制(其提供)數值24b的實際編碼(在實際上提供數值24b的示例中):若該諧度(例如第二諧度測量24a”)未滿足該第二準則(例如若該諧度低於該第二臨界值且ltpf_active=0),沒有進一步諧度資訊24b(例如沒有額外諧度資訊)被編碼;若該諧度(例如第二諧度測量24a”)滿足該第二準則(例如其超過該第二臨界值且ltpf_active=1),則實際上編碼額外諧度資訊24b。
值得注意地,該第二準則可基於不同及/或額外地條件。舉例來說,能夠驗證信號是否在時間上為穩定(例如標準化相關是否在兩個連續訊框中具有相似特性)。
可定義該第二臨界值以使其與一諧波內容相關聯,該諧波內容超過與該第一臨界值相關聯的諧波內容。在示例中,可選擇該第一與第二臨界值,使得假設跟該第一與第二臨界值做比較的該等諧度測量具有介於0與1之間的一數值(其中0表示:非諧波信號;且1表示:完美諧波信號),則該第一臨界值的數值低於該第二臨界值的數值(例如,與該第一臨界值相關聯的諧度低於與該第二臨界值相關聯的諧度)。
數值22a(例如「ltpf_active」)可被編碼,例如,成該第一或第二控制資料項目16c或17c(圖4)。數值22a實際的編碼可由數值21a(例如,使用選擇器25)控制:例如,若ltpf_pitch_lag_present=1,可僅編碼「ltpf_active」,而當ltpf_pitch_lag_present=0時,不提供「ltpf_active」至位元串流形成器15(以編碼第三訊框18”)。在該情形中,沒有必要提供音調資訊給解碼器:諧度可能太低,使解碼器將既不為PLC亦不為LTPF使用該音調資訊。諸如「ltpf_active」的諧度資訊亦在此情形中為無用的:因為沒有音調資訊提供至解碼器,該解碼器將不可能嘗試執行LTPF。
此處提供用以獲取ltpf_active數值(16c、17c、22a)的示例。可執行其他替代策略。
首先一標準化相關可計算如下:
Figure 02_image013
其中pitch_int為音調延遲的整數部分,pitch_fr為音調延遲的分數部分,以及
Figure 02_image015
其中
Figure 02_image017
為12.8kHz(舉例)的再取樣輸入信號以及hi 為由下給出的一FIR低通濾波器的脈衝響應
Figure 02_image019
其中
Figure 02_image021
從,例如,下列數值中選出: double tab_ltpf_interp_x12k8[15] = { +6.698858366939680e-03, +3.967114782344967e-02, +1.069991860896389e-01 +2.098804630681809e-01, +3.356906254147840e-01, +4.592209296082350e-01 +5.500750019177116e-01, +5.835275754221211e-01, +5.500750019177116e-01 +4.592209296082350e-01, +3.356906254147840e-01, +2.098804630681809e-01 +1.069991860896389e-01, +3.967114782344967e-02, +6.698858366939680e-03};
LTPF啟用位元(「ltpf_active」)隨後可根據下列程序取得: if ( (mem_ltpf_active==0 && mem_nc>0.94 && nc>0.94) || (mem_ltpf_active==1 && nc>0.9) || (mem_ltpf_active==1 && abs(pit-mem_pit)<2 && (nc-mem_nc)>-0.1 && nc>0.84) ) { ltpf_active = 1; } else { ltpf_active = 0; } 其中mem_ltpf_active為先前訊框中ltpf_active的值(若在先前訊框中ltpf_pitch_present=0,其為0),mem_nc為先前訊框中nc的值(若在先前訊框中ltpf_pitch_present=0,其為0),pit=pitch_int+pitch_fr/4以及mem_pit為先前訊框中pit的值(若在先前訊框中ltpf_pitch_present=0,其為0)。此程序顯示,例如,於圖6b中(另見下文)。
重要的是要注意圖2之圖式化純粹為指示性的。替代於區塊21、22與該等選擇器,可使用不同的硬體及/或軟體單元。在示例中,至少兩個諸如區塊21與22、音調估測器、信號分析器及/或諧度測量器及/或位元串流形成器的組件可實作一單一元件。
以執行的測量為基礎下,能夠區分下列狀態: - 一第三狀態,其中: o 未滿足該第一準則; o 區塊21與區塊22的輸出21a與22a都為「0」; o 輸出13a(例如,「ltpf_pitch_lag」)、24b(例如,額外諧度資訊,可選的)、以及22a(例如,「ltpf_active」)未經編碼; o 只有輸出21a的數值「0」(例如,「ltpf_pitch_lag_present」)經編碼; o 第三訊框18”係編碼有第三控制項目「0」(例如來自「ltpf_pitch_lag_present」)及該音訊信號的信號表示形式,但不含任何編碼音調資訊及/或第一與第二控制項目的位元; o 因此,解碼器將了解沒有音調資訊及諧度資訊可以用於LTPF與PLC(例如,由於極低諧度); - 一第一狀態,其中: o 滿足該第一準則且未滿足該第二準則; o 區塊21的輸出21a為「1」(例如,由於該第一準則的滿足,例如,由於第一測量24a’大於該第一臨界值),而區塊22的輸出22a為「0」(例如,由於該第二準則的未滿足,例如,由於第二測量24a”,針對當前或先前訊框,低於該第二臨界值); o 輸出21a(例如「ltpf_pitch_lag_present」)的數值「1」被編碼於18e中; o 輸出13a(例如「ltpf_pitch_lag」)被編碼於16b中; o 輸出22a(例如「ltpf_active」)的數值「0」被編碼於16c中; o 選擇性輸出24b(例如額外諧度資訊)未被編碼; o 第一訊框16”係編碼有等於「1」的第三控制資料項目(例如,來自「ltpf_pitch_lag_present」18e)、編碼等於「0」的第一控制資料項目(例如,來自「ltpf_active」16c)之一單一位元、以及用來編碼第一音調資訊16b(例如,取自「ltpf_pitch_lag」)的一固定數量位元(例如,在一固定位置中); o 因此,解碼器將了解將使用音調資訊13a(例如編碼於16b中的音調延遲)僅於PLC,而沒有音調資訊或諧度資訊將用於LTPF; - 一第二狀態,其中: o 滿足該第一與第二準則; o 區塊21與區塊22的輸出21a與22a都為「1」(例如,由於該第一準則的滿足,例如,由於第一測量24a’大於該第二臨界值且第二測量24a”滿足該第二準則,例如,第二測量24a”,在當前訊框中或在先前訊框中,大於第二臨界值); o 輸出21a(例如「ltpf_pitch_lag_present」)的數值「1」經編碼; o 輸出13a(例如「ltpf_pitch_lag」)經編碼; o 輸出22a(例如「ltpf_active」)的數值「1」經編碼; o 第二訊框17”係編碼有等於1的第三控制資料項目(例如,來自「ltpf_pitch_lag_present」18e)、編碼等於「1」的第二控制資料項目(例如,來自「ltpf_active」17c)之一單一位元、用來編碼17c中之第二音調資訊(例如,取自「ltpf_pitch_lag」)的一固定數量位元(例如,在一固定位置中),以及可選地,17d中之額外資訊(諸如額外諧度資訊); o 因此,解碼器將使用音調資訊13a(例如音調延遲)於PLC,且亦將使用音調資訊及(如果)額外諧度資訊於LTPF(例如,假設該諧度足以用於LTPF與PLC兩者)。
因此,參照圖5,顯示可由位元串流形成器15提供訊框12”,例如,於裝置10’中。特別是,可如以下編碼: - 在第三狀態的情形下,第三訊框18”具下列欄位: o 具數值「0」的第三控制資料項目18e(例如,從21a取得的「ltpf_pitch_lag_present」);以及 o 音訊信號11之編碼表示形式18a; - 在第一狀態的情形下,第一訊框16”具下列欄位: o 具數值「1」的第三控制資料項目18e(例如,從21a取得的「ltpf_pitch_lag_present」); o 音訊信號11之編碼表示形式16a; o 第一訊框16”之固定資料欄位中的第一音調資訊16b(例如,從13a取得的「ltpf_pitch_lag」);以及 o 具數值「0」的第一控制資料項目16c(例如,從22a取得的「ltpf_active」);以及 - 在第二狀態的情形下,第二訊框17”具下列欄位: o 具數值「1」的第三控制資料項目18e(例如,從21a取得的「ltpf_pitch_lag_present」); o 音訊信號11之編碼表示形式17a; o 第二訊框17”中的第二音調資訊17b(例如,從13a取得的「ltpf_pitch_lag」); o 具數值「1」的第二控制資料項目17c(例如,從22a取得的「ltpf_active」);以及 o 其中提供一可選的諧度資訊17d(例如,從24b取得)。
在示例中,第三訊框18”不呈現用於第一或第二音調資訊的固定資料欄位以及不呈現任何編碼第一控制資料項目與第二控制資料項目的位元。
從第三控制資料項目18e及第一與第二控制資料項目16c與17c,解碼器將了解是否: - 在第三狀態的情形下,解碼器將不會以音調資訊及諧度資訊實作LTPF與PLC, - 在第一狀態的情形下,解碼器將不會實作LTPF但將會僅以音調資訊實作PLC,以及 - 在第二狀態的情形下,解碼器將會使用音調資訊執行LTPF以及使用音調資訊執行PLC兩者。
從圖5可看出,在一些示例中: - 第三訊框18可具有缺少第一音調資訊16b、第一控制資料項目16c、第二音調資訊17b、以及第二控制資料項目17c的格式; - 第三控制資料項目18e可以具有區別第三訊框18”與第一跟第二訊框16”、17”的一數值之一單一位元編碼;及/或 - 在編碼音訊信號資訊中,針對第一訊框16”,可為第一控制資料項目16c保留一單一位元且可為第一音調資訊保留固定資料欄位16b;及/或 - 在編碼音訊信號資訊中,針對第二訊框17”,可為第二控制資料項目17c保留一單一位元且可為第二音調資訊保留固定資料欄位17b;及/或 - 可編碼第一控制資料項目16c及第二控制資料項目17c於編碼音訊信號資訊中之相同部分或資料欄位中;及/或 - 該編碼音訊信號資訊可包含編碼第三控制資料項目18e的一第一傳訊位元;及/或在指示第一音調資訊及/或第二音調資訊存在的第三控制資料項目之一數值的情形下,編碼第一控制資料項目與第二控制資料項目的一第二傳訊位元。
圖6a顯示根據示例的方法60。該方法可,例如,使用裝置10或10’來操作。例如,該方法可如上所述編碼訊框16”、17”、18”。
方法60可包含例如,使用信號分析器14以及,特別是諧度測量器24從音訊信號11獲取(在一特定時間間隔)諧度測量(例如,24a)的步驟S60。諧度測量(諧度資訊)可包含或基於,舉例來說,應用至音訊信號11(例如,針對一時間間隔)的相關資訊(例如,自相關資訊)、增益資訊(例如,後濾波器增益資訊)、週期性資訊、可預測性資訊的至少一者或一組合。在示例中,可獲取第一諧度測量24a’(例如,以6.4 kHz)以及可獲取第二諧度測量24a”(例如,以12.8 kHz)。在不同示例中,可使用相同的諧度測量。
該方法可包含驗證該第一準則的滿足,例如,使用區塊21。舉例來說,可執行該等諧度測量與一第一臨界值的比較。若在S61該第一準則未滿足(例如該諧度低於該第一臨界值,例如,當第一測量24a’低於該第一臨界值),在S62可編碼第三訊框18”,第三訊框18”指示在第三控制資料項目18e中的一「0」值(例如「ltpf_pitch_lag_present」),例如,不保留任何用以編碼諸如音調資訊及額外諧度資訊之數值的位元。因此,解碼器將不會基於由編碼器提供的音調資訊及諧度資訊來執行LTPF也不會執行PLC。
若在S61判定滿足該第一準則(例如,諧度大於該第一臨界值並因此不在一較低的諧度等級),在步驟S63及S65會檢查是否滿足該第二準則。該第二準則可包含,例如,當前訊框的諧度測量與至少一臨界值的比較。
舉例來說,在步驟S63處將該諧度(例如,一第二諧度測量24a”)與一第二臨界值(在一些示例中,設定該第二臨界值使得其與大於與該第一臨界值相關聯的諧波內容之一諧波內容相關聯,例如,在該諧度測量於跟一完全非諧波信號相關聯的一0值與跟一完美諧波信號相關聯的一1值之間的假設下)做比較。
若在S63處判定該諧度不大於一第二臨界值(例如其在一些情況下可與一中間諧度等級相關聯),在S64處編碼一第一訊框16、16’、16”。可編碼該第一訊框(指示一中間諧度)以包含可為「1」的第三控制資料項目18e(例如,「ltpf_pitch_lag_present」)、可為「0」的第一控制資料項目16b(例如,「ltpf_active」)、以及諸如音調延遲(「ltpf_pitch_lag」)的第一音調資訊16b的數值。因此,在接收第一訊框16、16’、16”時,解碼器將使用該第一音調資訊16b於PLC,但將不使用該第一音調資訊16b於LTPF。
值得注意地,在S61及S62執行的比較可基於不同的諧度測量,其可例如以不同取樣率取得。
若在S63處判定諧度大於該第二臨界值(例如該第二諧度測量超過該第二臨界值),在步驟S65處可檢查音訊信號是否為一暫態信號,例如,音訊信號11的時間結構是否有變化(或先前訊框上的另一條件是否被滿足)。舉例來說,能夠檢查先前訊框是否亦滿足超過一第二臨界值的一條件。若先前訊框上的該條件亦成立(非暫態),則視該信號係穩定且能夠觸發步驟S66。否則,該方法繼續於S64以編碼一第一訊框16、16’、16”(見上文)。
在步驟S66處可編碼第二訊框17、17’、17”。第二訊框17”可包含具數值「1」的第三控制資料項目18e(例如「ltpf_pitch_lag_present」)、可為「1」的第二控制資料項目17c(例如,「ltpf_active」)。因此,可編碼音調資訊17b(諸如「pitch_lag」以及,可選地,額外諧度資訊17d)。解碼器將了解可使用具音調資訊的PLC以及具音調資訊(以及,可選地,諧度資訊)的LTPF。
在S67處,可傳送經編碼訊框至一解碼器(例如,經由一藍牙連結)、儲存於一記憶體上、或以另一方式使用。
在步驟S63及S64處,標準化相關測量nc(第二測量24a”)可為以12.8 kHz獲取的標準化相關測量nc(亦見上文及下文)。在步驟S61處,標準化相關(第一測量24a’)可為6.4 kHz的標準化相關測量(亦見上文及下文)。
圖6b顯示亦可使用的方法60b。圖6b明確地顯示可用以判定ltpf_active之數值的第二準則600的示例。
可以看出,步驟S60、S61及S62係如方法60中相同並因此不重述。
在步驟S610處,可檢查是否: - 針對先前訊框,已獲得ltpf_active=0 (由mem_ltpf_active=0表示);以及 - 針對先前訊框,標準化相關測量nc (24a”)大於一第三臨界值(例如,介於0.92與0.96之間之一數值,例如0.94);以及 - 針對當前訊框,標準化相關測量nc (24a”)大於該第三臨界值(例如,介於0.92與0.96之間之一數值,例如0.94)。
若該結果為肯定的,則在S614設定ltpf_active為1並觸發步驟S66(編碼第二訊框17、17’、17”)以及S67(傳送或儲存該編碼訊框)。
若在步驟S610設定的條件未被驗證,可在步驟S611檢查: - 針對先前訊框,已獲得ltpf_active=1 (由mem_ltpf_active=1表示); - 針對當前訊框,標準化相關測量nc (24a”)大於一第四臨界值(例如,介於0.85與0.95之間之一數值,例如0.9)。
若該結果為肯定的,則在S614設定ltpf_active為1並觸發步驟S66(編碼第二訊框17、17’、17”)以及S67(傳送或儲存該編碼訊框)。
若在步驟S611設定的條件未被驗證,可在步驟S612檢查是否: - 針對先前訊框,已獲得ltpf_active=0 (由mem_ltpf_active=0表示); - 針對當前訊框,當前音調與先前音調之間的距離小於一第五臨界值(例如,介於1.8與2.2之間之一數值,例如2);以及 - 當前訊框之標準化相關測量nc (24a”)與先前訊框之標準化相關測量mem_nc之間的差異大於一第六臨界值(例如,介於-0.15與-0.05之間之一數值,例如-0.1);以及 - 針對當前訊框,標準化相關測量nc (24a”)大於一第七臨界值(例如,介於0.82與0.86之間之一數值,例如0.84)。 (在步驟S610~S612的一些示例中,可避免上列條件中一些,而保持一些條件。)
若在步驟S612的檢查結果為肯定的,則在S614設定ltpf_active為1並觸發步驟S66(編碼第二訊框17、17’、17”)以及S67(傳送或儲存該編碼訊框)。
否則,若在S610~S612的檢查沒有被驗證,則在S613,針對當前訊框設定ltpf_active為0並觸發步驟S64,以便編碼第一訊框16、16’、16”。
在步驟S610~S612中,標準化相關測量nc (第二測量24a”)可為以12.8 kHz獲取的標準化相關測量(見上文)。在步驟S61中,標準化相關(第一測量24a’)可為以6.4 kHz獲取的標準化相關(見上文)。
可以看出,可將相關於當前訊框及/或先前訊框的數個度量考慮在內。因此可藉由檢查數個測量(例如,與當前及/或先前訊框相關聯的)是否個別地超過或低於數個臨界值(例如,步驟S610~S612中該第三至第七臨界值中至少一些)而驗證該第二準則的滿足。
此處提供關於如何在編碼器端獲取用於LTPF之參數的一些示例。
在此討論再取樣技術的一示例(可使用其他技術)。
取樣率為
Figure 02_image023
的輸入信號係再取樣至12.8 kHz的一固定取樣率。該再取樣係使用一升取樣+低通濾波+降取樣方式執行,該方式可公式化如下:
Figure 02_image025
Figure 02_image027
其中
Figure 02_image029
為該輸入信號,
Figure 02_image031
為12.8 kHz的再取樣信號,
Figure 02_image033
為升取樣因子且
Figure 02_image035
為下式給定的一FIR低通濾波器的脈衝響應
Figure 02_image037
此處提供
Figure 02_image039
的一示例: double tab_resamp_filter[239] = { -2.043055832879108e-05, -4.463458936757081e-05, -7.163663994481459e-05, -1.001011132655914e-04, -1.283728480660395e-04, -1.545438297704662e-04, -1.765445671257668e-04, -1.922569599584802e-04, -1.996438192500382e-04, -1.968886856400547e-04, -1.825383318834690e-04, -1.556394266046803e-04, -1.158603651792638e-04, -6.358930335348977e-05, +2.810064795067786e-19, +7.292180213001337e-05, +1.523970757644272e-04, +2.349207769898906e-04, +3.163786496265269e-04, +3.922117380894736e-04, +4.576238491064392e-04, +5.078242936704864e-04, +5.382955231045915e-04, +5.450729176175875e-04, +5.250221548270982e-04, +4.760984242947349e-04, +3.975713799264791e-04, +2.902002172907180e-04, +1.563446669975615e-04, -5.818801416923580e-19, -1.732527127898052e-04, -3.563859653300760e-04, -5.411552308801147e-04, -7.184140229675020e-04, -8.785052315963854e-04, -1.011714513697282e-03, -1.108767055632304e-03, -1.161345220483996e-03, -1.162601694464620e-03, -1.107640974148221e-03, -9.939415631563015e-04, -8.216921898513225e-04, -5.940177657925908e-04, -3.170746535382728e-04, +9.746950818779534e-19, +3.452937604228947e-04, +7.044808705458705e-04, +1.061334465662964e-03, +1.398374734488549e-03, +1.697630799350524e-03, +1.941486748731660e-03, +2.113575906669355e-03, +2.199682452179964e-03, +2.188606246517629e-03, +2.072945458973295e-03, +1.849752491313908e-03, +1.521021876908738e-03, +1.093974255016849e-03, +5.811080624426164e-04, -1.422482656398999e-18, -6.271537303228204e-04, -1.274251404913447e-03, -1.912238389850182e-03, -2.510269249380764e-03, -3.037038298629825e-03, -3.462226871101535e-03, -3.758006719596473e-03, -3.900532466948409e-03, -3.871352309895838e-03, -3.658665583679722e-03, -3.258358512646846e-03, -2.674755551508349e-03, -1.921033054368456e-03, -1.019254326838640e-03, +1.869623690895593e-18, +1.098415446732263e-03, +2.231131973532823e-03, +3.348309272768835e-03, +4.397022774386510e-03, +5.323426722644900e-03, +6.075105310368700e-03, +6.603520247552113e-03, +6.866453987193027e-03, +6.830342695906946e-03, +6.472392343549424e-03, +5.782375213956374e-03, +4.764012726389739e-03, +3.435863514113467e-03, +1.831652835406657e-03, -2.251898372838663e-18, -1.996476188279370e-03, -4.082668858919100e-03, -6.173080374929424e-03, -8.174448945974208e-03, -9.988823864332691e-03, -1.151698705819990e-02, -1.266210056063963e-02, -1.333344579518481e-02, -1.345011199343934e-02, -1.294448809639154e-02, -1.176541543002924e-02, -9.880867320401294e-03, -7.280036402392082e-03, -3.974730209151807e-03, +2.509617777250391e-18, +4.586044219717467e-03, +9.703248998383679e-03, +1.525124770818010e-02, +2.111205854013017e-02, +2.715337236094137e-02, +3.323242450843114e-02, +3.920032029020130e-02, +4.490666443426786e-02, +5.020433088017846e-02, +5.495420172681558e-02, +5.902970324375908e-02, +6.232097270672976e-02, +6.473850225260731e-02, +6.621612450840858e-02, +6.671322871619612e-02, +6.621612450840858e-02, +6.473850225260731e-02, +6.232097270672976e-02, +5.902970324375908e-02, +5.495420172681558e-02, +5.020433088017846e-02, +4.490666443426786e-02, +3.920032029020130e-02, +3.323242450843114e-02, +2.715337236094137e-02, +2.111205854013017e-02, +1.525124770818010e-02, +9.703248998383679e-03, +4.586044219717467e-03, +2.509617777250391e-18, -3.974730209151807e-03, -7.280036402392082e-03, -9.880867320401294e-03, -1.176541543002924e-02, -1.294448809639154e-02, -1.345011199343934e-02, -1.333344579518481e-02, -1.266210056063963e-02, -1.151698705819990e-02, -9.988823864332691e-03, -8.174448945974208e-03, -6.173080374929424e-03, -4.082668858919100e-03, -1.996476188279370e-03, -2.251898372838663e-18, +1.831652835406657e-03, +3.435863514113467e-03, +4.764012726389739e-03, +5.782375213956374e-03, +6.472392343549424e-03, +6.830342695906946e-03, +6.866453987193027e-03, +6.603520247552113e-03, +6.075105310368700e-03, +5.323426722644900e-03, +4.397022774386510e-03, +3.348309272768835e-03, +2.231131973532823e-03, +1.098415446732263e-03, +1.869623690895593e-18, -1.019254326838640e-03, -1.921033054368456e-03, -2.674755551508349e-03, -3.258358512646846e-03, -3.658665583679722e-03, -3.871352309895838e-03, -3.900532466948409e-03, -3.758006719596473e-03, -3.462226871101535e-03, -3.037038298629825e-03, -2.510269249380764e-03, -1.912238389850182e-03, -1.274251404913447e-03, -6.271537303228204e-04, -1.422482656398999e-18, +5.811080624426164e-04, +1.093974255016849e-03, +1.521021876908738e-03, +1.849752491313908e-03, +2.072945458973295e-03, +2.188606246517629e-03, +2.199682452179964e-03, +2.113575906669355e-03, +1.941486748731660e-03, +1.697630799350524e-03, +1.398374734488549e-03, +1.061334465662964e-03, +7.044808705458705e-04, +3.452937604228947e-04, +9.746950818779534e-19, -3.170746535382728e-04, -5.940177657925908e-04, -8.216921898513225e-04, -9.939415631563015e-04, -1.107640974148221e-03, -1.162601694464620e-03, -1.161345220483996e-03, -1.108767055632304e-03, -1.011714513697282e-03, -8.785052315963854e-04, -7.184140229675020e-04, -5.411552308801147e-04, -3.563859653300760e-04, -1.732527127898052e-04, -5.818801416923580e-19, +1.563446669975615e-04, +2.902002172907180e-04, +3.975713799264791e-04, +4.760984242947349e-04, +5.250221548270982e-04, +5.450729176175875e-04, +5.382955231045915e-04, +5.078242936704864e-04, +4.576238491064392e-04, +3.922117380894736e-04, +3.163786496265269e-04, +2.349207769898906e-04, +1.523970757644272e-04, +7.292180213001337e-05, +2.810064795067786e-19, -6.358930335348977e-05, -1.158603651792638e-04, -1.556394266046803e-04, -1.825383318834690e-04, -1.968886856400547e-04, -1.996438192500382e-04, -1.922569599584802e-04, -1.765445671257668e-04, -1.545438297704662e-04, -1.283728480660395e-04, -1.001011132655914e-04, -7.163663994481459e-05, -4.463458936757081e-05, -2.043055832879108e-05};
在此討論高通濾波器技術的一示例(可使用其他技術)。
再取樣信號可使用一2階IIR濾波器進行高通濾波,該2階IIR濾波器之轉換函數可如下給出
Figure 02_image041
此處討論音調偵測測技術之一示例(可使用其他技術)。
信號
Figure 02_image031
可使用下式藉由因子2降取樣
Figure 02_image043
其中h2 = {0.1236796411180537, 0.2353512128364889, 0.2819382920909148, 0.2353512128364889, 0.1236796411180537}。
Figure 02_image045
的自相關可由下式運算
Figure 02_image047
其中
Figure 02_image049
Figure 02_image051
為最小與最大延遲。
一自相關可使用下式做加權
Figure 02_image053
其中
Figure 02_image055
定義如下
Figure 02_image057
音調延遲的一第一估測
Figure 02_image059
可為最大化該加權自相關的延遲
Figure 02_image061
音調延遲的一第二估測
Figure 02_image063
可為最大化在先前訊框中估測之該音調延遲附近的非加權自相關的延遲
Figure 02_image065
其中
Figure 02_image067
Figure 02_image069
以及
Figure 02_image071
為在先前訊框中估測之最後音調延遲。
在當前訊框中該音調延遲的最後估測然後可由下式給出
Figure 02_image073
其中
Figure 02_image075
為在延遲T處長度L之信號x的標準化相關
Figure 02_image077
該標準化相關可為由信號分析器14及/或諧度測量器24取得的該等諧度測量之至少一者。此為可使用來,舉例來說,與該第一臨界值比較的該等諧度測量之一者。
此處討論用以取得一LTPF位元串流技術之一示例(可使用其他技術)。
LTPF位元串流的第一個位元傳訊在該位元串流中存在音調延遲參數。其係藉由下式取得
Figure 02_image079
Figure 02_image081
為0,不再編碼更多位元,導致一LTPF位元串流中僅有一位元(見第三訊框18”)。
Figure 02_image081
為1,編碼另外兩個參數,一個音調延遲參數(例如,編碼9個位元),以及一個位元用來傳訊LTPF的啟用(見訊框16”與17”)。在該情況中,該LTPF位元串流(訊框)可由11個位元組成。
Figure 02_image083
如以下章節說明般取得該音調延遲參數以及該啟用位元。
根據上述方式此等資料可編碼於訊框12、12’、12”中。
此處討論用以取得一LTPF音調延遲參數的一示例(可使用其他技術)。
該LTPF音調延遲參數的整數部分可由下式給出
Figure 02_image085
其中
Figure 02_image087
以及
Figure 02_image089
Figure 02_image091
該LTPF音調延遲的小數部分則可由下式給出
Figure 02_image093
其中
Figure 02_image095
以及h4 為由下式給出之一FIR低通濾波器的脈衝響應
Figure 02_image097
Figure 02_image099
的數值可為,例如: double tab_ltpf_interp_R[31] = { -2.874561161519444e-03, -3.001251025861499e-03, +2.745471654059321e-03 +1.535727698935322e-02, +2.868234046665657e-02, +2.950385026557377e-02 +4.598334491135473e-03, -4.729632459043440e-02, -1.058359163062837e-01 -1.303050213607112e-01, -7.544046357555201e-02, +8.357885725250529e-02 +3.301825710764459e-01, +6.032970076366158e-01, +8.174886856243178e-01 +8.986382851273982e-01, +8.174886856243178e-01, +6.032970076366158e-01 +3.301825710764459e-01, +8.357885725250529e-02, -7.544046357555201e-02 -1.303050213607112e-01, -1.058359163062837e-01, -4.729632459043440e-02 +4.598334491135473e-03, +2.950385026557377e-02, +2.868234046665657e-02 +1.535727698935322e-02, +2.745471654059321e-03, -3.001251025861499e-03 -2.874561161519444e-03};
Figure 02_image101
則根據下式修改
Figure 02_image103
Figure 02_image105
兩者
Figure 02_image107
最後,音調延遲參數索引可由下式給出
Figure 02_image109
一標準化相關可首先如以下運算出
Figure 02_image013
其中
Figure 02_image015
以及hi 為由下式給出之一FIR低通濾波器的脈衝響應
Figure 02_image111
其中
Figure 02_image021
從,例如,下列數值中選出: double tab_ltpf_interp_x12k8[15] = { +6.698858366939680e-03, +3.967114782344967e-02, +1.069991860896389e-01 +2.098804630681809e-01, +3.356906254147840e-01, +4.592209296082350e-01 +5.500750019177116e-01, +5.835275754221211e-01, +5.500750019177116e-01 +4.592209296082350e-01, +3.356906254147840e-01, +2.098804630681809e-01 +1.069991860896389e-01, +3.967114782344967e-02, +6.698858366939680e-03};
該LTPF啟用位元(「ltpf_active」)則可根據以下設定 if ( (mem_ltpf_active==0 && mem_nc>0.94 && nc>0.94) || (mem_ltpf_active==1 && nc>0.9) || (mem_ltpf_active==1 && abs(pit-mem_pit)<2 && (nc-mem_nc)>-0.1 && nc>0.84) ) { ltpf_active = 1; } else { ltpf_active = 0; } 其中mem_ltpf_active為先前訊框中ltpf_active的值(若在先前訊框中pitch_present=0,其為0),mem_nc為先前訊框中nc的值(若在先前訊框中pitch_present=0,其為0),pit=pitch_int+pitch_fr/4以及mem_pit為先前訊框中pit的值(若在先前訊框中pitch_present=0,其為0)。 6. 解碼器端
圖7顯示裝置70。裝置70可為一解碼器。裝置70可獲取諸如編碼音訊信號資訊12、12’、12”的資料。裝置70可執行上文及/或下文所述之操作。編碼音訊信號資訊12、12’、12”可能已,例如,由諸如裝置10或10’的一編碼器或藉由實作方法60產生。在示例中,編碼音訊信號資訊12、12’、12”可能已,例如,由不同於裝置10或10’或不實作方法60的一編碼器產生。裝置70可產生濾波解碼音訊信號資訊76。
裝置70可包含一通訊單元(或從其接收資料)(例如,使用一天線)以獲取編碼音訊信號資訊。可實行一藍牙通訊。裝置70可包含一儲存單元(或從其接收資料)(例如,使用一記憶體)以獲取編碼音訊信號資訊。裝置70可包含於TD及/或FD中操作的設備。
裝置70可包含可解碼該編碼音訊信號資訊12、12’、12”的位元串流讀取器71(或「位元串流分析器」、或「位元串流去格式化器」、或「位元串流解析器」)。位元串流讀取器71可包含,例如,用來解譯以位元串流型式獲得之資料的一狀態機器。位元串流讀取器71可輸出該音訊信號11的解碼表示形式71a。
解碼表示形式71a可能歷經在該位元串流讀取器下游的一或多個處理技術(此處為了簡潔而未顯示)。
裝置70可包含LTPF 73,其可進而提供濾波解碼音訊信號資訊73’。
裝置70可包含濾波器控制器72,其可控制LTPF 73。
特別地,LTPF 73可由額外諧度資訊(例如,增益資訊)控制,當由位元串流讀取器71提供時(特別是當出現於訊框17’或17”中的欄位17d,「ltpf_gain」中時)。
除此之外或替代地,LTPF 73可由音調資訊(例如,音調延遲)控制。該音調資訊可出現於訊框16、16’、16”、17、17’、17”的欄位16b或17b中。然而,如由選擇器78所示,該音調資訊並非總是使用於控制該LTPF:當控制資料項目16c(「ltpf_active」)為「0」,則不使用該音調資訊於該LTPF(由於對於該LTPF諧度太低)。
裝置70可包含用以執行一PLC功能以提供音訊資訊76的消隱單元75。當出現於該解碼訊框中時,可使用該音調資訊於PLC。
在以下段落中討論在裝置70處之LTPF的一示例。
圖8a與8b顯示可能使用的針對訊框之語法。亦指出不同的欄位。
如圖8a中所示,位元串流讀取器71可於正被編碼的該訊框之一特定位置(欄位)中搜尋一第一數值(在該訊框為圖5的訊框16”、17”以及18”之一者的假設之下)。該特定位置可被解讀,例如,為與訊框18”中之第三控制項目18e相關聯的位置(例如,「ltpf_pitch_lag_present」)。
若「ltpf_pitch_lag_present」18e的數值為「0」,則位元串流讀取器71知道沒有針對LTPF與PLC的其他資訊(例如,沒有「ltpf_active」、「ltpf_pitch_lag」、「ltpf_gain」)。
若「ltpf_pitch_lag_present」18e的數值為「1」,則位元串流讀取器71可搜尋含有指示諧度資訊(例如,14a、22a)之控制資料16c或17c(例如,「ltpf_active」)的一欄位(例如,一1位元欄位)。舉例來說,若「ltpf_active」為「0」,則知道該訊框為第一訊框16”,指示對LTPF不貴重但可能用於PLC的諧度。若「ltpf_active」為「1」,則知道該訊框為第二訊框17”,其可攜載對LTPF與PLC都貴重的資訊。
讀取器71亦搜尋含有音調資訊16b或17b(例如,「ltpf_pitch_lag」)的一欄位(例如,一9位元欄位)。此音調資訊可被提供予消隱單元75(用於PLC)。此音調資訊可被提供予濾波器控制器72/LTPF 73,但只在「ltpf_active」為「1」時(例如,較高諧度),如圖7中選擇器78所示。
在圖8b之示例中實行一相似的操作,其中,額外地,可選擇地編碼增益17d。 7. 在解碼器端之LTPF的一示例
在MDCT(改進離散餘弦轉換)合成、MDST(改進離散正弦轉換)合成、或基於另一轉換的合成之後的解碼信號可使用一IIR濾波器在時域中進行後濾波,該IIR濾波器的參數可取決於LTPF位元串流資料「pitch_index」及「ltpf_active」。為了避免當該等參數從一訊框改變至下一訊框時的不連續,可對當前訊框之第一個四分之一處應用一轉移機制。
在示例中,可使用下式實施一LTPF IIR濾波器
Figure 02_image113
其中
Figure 02_image115
為濾波器輸入信號(亦即,在MDCT合成之後的解碼信號)且
Figure 02_image117
為濾波器輸出信號。
該LTPF音調延遲之整數部分
Figure 02_image119
及小數部分
Figure 02_image121
可如下運算。首先在12.8 kHz的該音調延遲係使用下式恢復
Figure 02_image123
Figure 02_image125
Figure 02_image127
該音調延遲隨後可使用下式縮放至輸出取樣率fs 並轉換為整數與小數部分
Figure 02_image129
Figure 02_image131
Figure 02_image133
Figure 02_image135
其中fs 為該取樣率。
濾波器係數
Figure 02_image137
Figure 02_image139
可如下運算
Figure 02_image141
Figure 02_image143
Figure 02_image145
Figure 02_image147
其中
Figure 02_image149
Figure 02_image151
以及
Figure 02_image153
Figure 02_image155
可根據下列獲得 fs_idx = min(4,(
Figure 02_image157
/8000-1)); if (nbits < 320 + fs_idx*80) { gain_ltpf = 0.4; gain_ind = 0; } else if (nbits < 400 + fs_idx*80) { gain_ltpf = 0.35; gain_ind = 1; } else if (nbits < 480 + fs_idx*80) { gain_ltpf = 0.3; gain_ind = 2; } else if (nbits < 560 + fs_idx*80) { gain_ltpf = 0.25; gain_ind = 3; } else { gain_ltpf = 0; } 以及表格
Figure 02_image159
Figure 02_image161
為預先決定的。
此處提供
Figure 02_image159
的示例(代替「fs 」,取樣率係經表示): double tab_ltpf_num_8000[4][3] = { {6.023618207009578e-01,4.197609261363617e-01,-1.883424527883687e-02}, {5.994768582584314e-01,4.197609261363620e-01,-1.594928283631041e-02}, {5.967764663733787e-01,4.197609261363617e-01,-1.324889095125780e-02}, {5.942410120098895e-01,4.197609261363618e-01,-1.071343658776831e-02}}; double tab_ltpf_num_16000[4][3] = { {6.023618207009578e-01,4.197609261363617e-01,-1.883424527883687e-02}, {5.994768582584314e-01,4.197609261363620e-01,-1.594928283631041e-02}, {5.967764663733787e-01,4.197609261363617e-01,-1.324889095125780e-02}, {5.942410120098895e-01,4.197609261363618e-01,-1.071343658776831e-02}}; double tab_ltpf_num_24000[4][5] = { {3.989695588963494e-01,5.142508607708275e-01,1.004382966157454e-01,-1.278893956818042e-02,-1.572280075461383e-03}, {3.948634911286333e-01,5.123819208048688e-01,1.043194926386267e-01,-1.091999960222166e-02,-1.347408330627317e-03}, {3.909844475885914e-01,5.106053522688359e-01,1.079832524685944e-01,-9.143431066188848e-03,-1.132124620551895e-03}, {3.873093888199928e-01,5.089122083363975e-01,1.114517380217371e-01,-7.450287133750717e-03,-9.255514050963111e-04}}; double_tab_ltpf_num_32000[4][7] = { {2.982379446702096e-01,4.652809203721290e-01,2.105997428614279e-01,3.766780380806063e-02,-1.015696155796564e-02,-2.535880996101096e-03,-3.182946168719958e-04}, {2.943834154510240e-01,4.619294002718798e-01,2.129465770091844e-01,4.066175002688857e-02,-8.693272297010050e-03,-2.178307114679820e-03,-2.742888063983188e-04}, {2.907439213122688e-01,4.587461910960279e-01,2.151456974108970e-01,4.350104772529774e-02,-7.295495347716925e-03,-1.834395637237086e-03,-2.316920186482416e-04}, {2.872975852589158e-01,4.557148886861379e-01,2.172126950911401e-01,4.620088878229615e-02,-5.957463802125952e-03,-1.502934284345198e-03,-1.903851911308866e-04}}; double tab_ltpf_num_48000[4][11] = { {1.981363739883217e-01,3.524494903964904e-01,2.513695269649414e-01,1.424146237314458e-01,5.704731023952599e-02,9.293366241586384e-03,-7.226025368953745e-03,-3.172679890356356e-03,-1.121835963567014e-03,-2.902957238400140e-04,-4.270815593769240e-05}, {1.950709426598375e-01,3.484660408341632e-01,2.509988459466574e-01,1.441167412482088e-01,5.928947317677285e-02,1.108923827452231e-02,-6.192908108653504e-03,-2.726705509251737e-03,-9.667125826217151e-04,-2.508100923165204e-04,-3.699938766131869e-05}, {1.921810055196015e-01,3.446945561091513e-01,2.506220094626024e-01,1.457102447664837e-01,6.141132133664525e-02,1.279941396562798e-02,-5.203721087886321e-03,-2.297324511109085e-03,-8.165608133217555e-04,-2.123855748277408e-04,-3.141271330981649e-05}, {1.894485314175868e-01,3.411139251108252e-01,2.502406876894361e-01,1.472065631098081e-01,6.342477229539051e-02,1.443203434150312e-02,-4.254449144657098e-03,-1.883081472613493e-03,-6.709619060722140e-04,-1.749363341966872e-04,-2.593864735284285e-05}};
此處提供
Figure 02_image163
的示例(代替「fs 」,取樣率係經表示): double_tab_ltpf_den_8000[4][5] = { {0.000000000000000e+00, 2.098804630681809e-01, 5.835275754221211e-01, 2.098804630681809e-01, 0.000000000000000e+00}, {0.000000000000000e+00, 1.069991860896389e-01, 5.500750019177116e-01, 3.356906254147840e-01, 6.698858366939680e-03}, {0.000000000000000e+00, 3.967114782344967e-02, 4.592209296082350e-01, 4.592209296082350e-01, 3.967114782344967e-02}, {0.000000000000000e+00, 6.698858366939680e-03, 3.356906254147840e-01, 5.500750019177116e-01, 1.069991860896389e-01}}; double_tab_ltpf_den_16000[4][5] = { {0.000000000000000e+00, 2.098804630681809e-01, 5.835275754221211e-01, 2.098804630681809e-01, 0.000000000000000e+00}, {0.000000000000000e+00, 1.069991860896389e-01, 5.500750019177116e-01, 3.356906254147840e-01, 6.698858366939680e-03}, {0.000000000000000e+00, 3.967114782344967e-02, 4.592209296082350e-01, 4.592209296082350e-01, 3.967114782344967e-02}, {0.000000000000000e+00, 6.698858366939680e-03, 3.356906254147840e-01, 5.500750019177116e-01, 1.069991860896389e-01}}; double_tab_ltpf_den_24000[4][7] = { {0.000000000000000e+00, 6.322231627323796e-02, 2.507309606013235e-01, 3.713909428901578e-01, 2.507309606013235e-01, 6.322231627323796e-02, 0.000000000000000e+00}, {0.000000000000000e+00, 3.459272174099855e-02, 1.986515602645028e-01, 3.626411726581452e-01, 2.986750548992179e-01, 1.013092873505928e-01, 4.263543712369752e-03}, {0.000000000000000e+00, 1.535746784963907e-02, 1.474344878058222e-01, 3.374259553990717e-01, 3.374259553990717e-01, 1.474344878058222e-01, 1.535746784963907e-02}, {0.000000000000000e+00, 4.263543712369752e-03, 1.013092873505928e-01, 2.986750548992179e-01, 3.626411726581452e-01, 1.986515602645028e-01, 3.459272174099855e-02}}; double_tab_ltpf_den_32000[4][9] = { {0.000000000000000e+00, 2.900401878228730e-02, 1.129857420560927e-01, 2.212024028097570e-01, 2.723909472446145e-01, 2.212024028097570e-01, 1.129857420560927e-01, 2.900401878228730e-02, 0.000000000000000e+00}, {0.000000000000000e+00, 1.703153418385261e-02, 8.722503785537784e-02, 1.961407762232199e-01, 2.689237982237257e-01, 2.424999102756389e-01, 1.405773364650031e-01, 4.474877169485788e-02, 3.127030243100724e-03}, {0.000000000000000e+00, 8.563673748488349e-03, 6.426222944493845e-02, 1.687676705918012e-01, 2.587445937795505e-01, 2.587445937795505e-01, 1.687676705918012e-01, 6.426222944493845e-02, 8.563673748488349e-03}, {0.000000000000000e+00, 3.127030243100724e-03, 4.474877169485788e-02, 1.405773364650031e-01, 2.424999102756389e-01, 2.689237982237257e-01, 1.961407762232199e-01, 8.722503785537784e-02, 1.703153418385261e-02}}; double_tab_ltpf_den_48000[4][13] = { {0.000000000000000e+00, 1.082359386659387e-02, 3.608969221303979e-02, 7.676401468099964e-02, 1.241530577501703e-01, 1.627596438300696e-01, 1.776771417779109e-01, 1.627596438300696e-01, 1.241530577501703e-01, 7.676401468099964e-02, 3.608969221303979e-02, 1.082359386659387e-02, 0.000000000000000e+00}, {0.000000000000000e+00, 7.041404930459358e-03, 2.819702319820420e-02, 6.547044935127551e-02, 1.124647986743299e-01, 1.548418956489015e-01, 1.767122381341857e-01, 1.691507213057663e-01, 1.352901577989766e-01, 8.851425011427483e-02, 4.499353848562444e-02, 1.557613714732002e-02, 2.039721956502016e-03}, {0.000000000000000e+00, 4.146998467444788e-03, 2.135757310741917e-02, 5.482735584552816e-02, 1.004971444643720e-01, 1.456060342830002e-01, 1.738439838565869e-01, 1.738439838565869e-01, 1.456060342830002e-01, 1.004971444643720e-01, 5.482735584552816e-02, 2.135757310741917e-02, 4.146998467444788e-03}, {0.000000000000000e+00, 2.039721956502016e-03, 1.557613714732002e-02, 4.499353848562444e-02, 8.851425011427483e-02, 1.352901577989766e-01, 1.691507213057663e-01, 1.767122381341857e-01, 1.548418956489015e-01, 1.124647986743299e-01, 6.547044935127551e-02, 2.819702319820420e-02, 7.041404930459358e-03}}
參考轉移處理,考慮五個不同情形。
第一個情形:ltpf_active = 0且mem_ltpf_active = 0
Figure 02_image165
第二個情形:ltpf_active = 1且mem_ltpf_active = 0
Figure 02_image167
Figure 02_image169
第三個情形:ltpf_active = 0且mem_ltpf_active = 1
Figure 02_image171
Figure 02_image169
其中
Figure 02_image173
Figure 02_image175
Figure 02_image177
以及
Figure 02_image179
為先前訊框中運算的濾波器參數。
第四個情形:ltpf_active = 1且mem_ltpf_active = 1以及
Figure 02_image181
Figure 02_image183
Figure 02_image113
Figure 02_image169
第五個情形:ltpf_active = 1且mem_ltpf_active = 1以及(
Figure 02_image185
Figure 02_image187
)
Figure 02_image189
Figure 02_image169
Figure 02_image191
Figure 02_image169
8. 封包丟失消隱
此處提供封包丟失消隱(PLC)或錯誤消隱的示例。 8.1 一般資訊
損壞訊框無法提供正確的聲響輸出並應被丟棄。
針對每個解碼訊框,可驗證其有效性。舉例來說,每個訊框可具有攜載藉執行由一預定演算法提供之預定操作而驗證的一循環冗餘碼(CRC)的一欄位。讀取器71(或另一邏輯組件,像是消隱單元75)可重複該演算法並驗證計算結果是否對應CRC欄位上的數值。若一訊框未被正確解碼,則假設係受一些錯誤影響。因此,若驗證提供不正確解碼的結果,則該訊框被認為是非正確解碼(無效、已損壞)。
當一訊框被判定為非正確解碼,可使用一消隱策略提供一聲響輸出:否則,可聽見某些類似惱人的聲響孔。因此,必須找到某些形式的訊框,其將該非正確解碼之訊框開啟的「間隙填補」。訊框丟失消隱程序之目的在於消隱針對解碼之任何不可用或損壞之訊框的影響。
一訊框丟失消隱程序可包含針對各種信號類型的消隱方法。具訊框丟失之容易出錯的狀況中的最佳可能編解碼效能可透過選擇最合適的方法獲得。其中一種封包丟失消隱方法可為,例如,TCX時域消隱。 8.2 TCX時域消隱
TCX時域消隱方法係操作於時域中的一音調為基礎之PLC技術。其最適合於具有一主導諧度結構的信號。該程序之一示例如下:如章節8.2.1中所述,以LP濾波器逆濾波最後解碼訊框之合成信號以獲得如章節8.2.2中所述之週期信號。隨機信號由章節8.2.3中具有大致均勻分佈之一隨機產生器產生。加總二個激發信號以形成章節8.2.4中所述之全激發信號,其以章節8.2.6中所述之衰減因子適應性淡出並最終以該LP濾波器濾波以獲得合成消隱時間信號。若LTPF在最後良好訊框中為現用,則該LTPF亦如章節8.3中所述應用於該合成消隱時間信號上。為了在一丟失訊框之後得到與第一個良好訊框的正確重疊,時域混疊消隱信號係於章節8.2.5中產生。 8.2.1 LPC參數計算
該TCX時域消隱方法係在激發域中操作。可在80等距頻域帶上計算一自相關函數。能量係以固定預加重因子
Figure 02_image193
來預加重。
Figure 107139530-A0304-0002
在使用一逆均勻堆疊的DFT將該自相關函數轉換至時域之前,使用下列窗格對該自相關函數進行延遲窗格化
Figure 02_image195
最後,可使用一列文森杜賓(Levinson Durbin)操作以針對該消隱訊框獲得LP濾波器,
Figure 02_image197
。以下提供一示例:
Figure 02_image199
Figure 02_image201
Figure 02_image203
Figure 02_image205
Figure 02_image207
Figure 02_image209
Figure 02_image211
Figure 02_image213
Figure 02_image215
該LP濾波器僅在一良好訊框之後的該第一個丟失訊框中計算並在後續丟失訊框中保持不變。 8.2.2 激發之週期部分的建構
最後
Figure 02_image217
個解碼時間樣本首先係使用下列濾波器以從章節8.2.1之預加重因子進行預加重
Figure 02_image219
以獲得信號
Figure 02_image221
,其中若pitch_fr > 0則Tc 為音調延遲數值pitch_int或pitch_int+1。該數值pitch_int及pitch_fr係在該位元串流中發送的該等音調延遲數值。
預加重信號,
Figure 02_image221
係進一步以計算之逆LP濾波器濾波以獲得先前激發信號
Figure 02_image223
。為了建構針對當前丟失訊框的激發信號,
Figure 02_image225
,重複地以Tc 複製
Figure 02_image223
如下
Figure 02_image227
其中E對應
Figure 02_image223
中的最後樣本。若穩定因子
Figure 02_image229
低於1,則首先會以如下表所述的一11-點線性相位FIR濾波器對
Figure 02_image223
的第一個音調循環進行低通濾波
Figure 107139530-A0304-0003
音調增益,
Figure 02_image231
,係如下計算
Figure 02_image233
若pitch_fr = 0則
Figure 02_image235
。否則,第二音調增益,
Figure 02_image237
,係如下計算
Figure 02_image239
以及
Figure 02_image241
。若
Figure 02_image243
則Tc 減少一以供進一步處理。
最後,限界
Figure 02_image245
Figure 02_image247
形成之週期激發,
Figure 02_image249
,以一開始並以衰減因子
Figure 02_image251
結束在整個訊框中逐個樣本地衰減以獲得
Figure 02_image253
。音調的增益僅在一良好訊框之後的第一個丟失訊框中計算並對於進一步的連續訊框丟失將其設定為
Figure 02_image251
。 8.2.3 激發之隨機部分的建構
激發之隨機部分可用具有大致均勻分佈之一隨機產生器產生如下
Figure 02_image255
Figure 02_image257
其中針對以此方法進行消隱的該第一個訊框,以24607初始化
Figure 02_image259
,以及
Figure 02_image261
提取該數值之16個LSB。針對進一步訊框,儲存
Figure 02_image263
並使用作下一個
Figure 02_image259
為了將雜訊偏移至更高頻率,該激發信號係以如下表所述之一11-點線性相位FIR濾波器進行高通濾波以得到
Figure 02_image265
Figure 107139530-A0304-0004
為確保雜訊能以相依於衰減因子
Figure 02_image251
的漸衰速率漸衰到全頻帶雜訊,該激發之隨機部分,
Figure 02_image267
,係透過全頻帶,
Figure 02_image269
,與高通濾波版本,
Figure 02_image265
,之間的一線性內插組成,如下
Figure 02_image271
Figure 02_image257
其中對在一良好訊框之後的第一個丟失訊框而言
Figure 02_image273
,以及
Figure 02_image275
針對第二個以及進一步的連續訊框丟失,其中
Figure 02_image277
先前消隱訊框的
Figure 02_image279
為了調整雜訊程度,雜訊增益,
Figure 02_image281
,係計算如下
Figure 02_image283
若在章節8.2.2之後
Figure 02_image285
,則
Figure 02_image287
。否則,第二雜訊增益,
Figure 02_image289
,係如上方程式計算,但以
Figure 02_image291
Figure 02_image103
。接著,
Figure 02_image293
為了進一步處理,首先標準化
Figure 02_image295
然後乘以
Figure 02_image297
以得到
Figure 02_image299
形成之隨機激發,
Figure 02_image301
,從第一個樣本到樣本五係以
Figure 02_image299
均勻衰減,以及接下來以
Figure 02_image299
開始並以
Figure 02_image303
結束在整個訊框中逐個樣本地衰減以獲得
Figure 02_image305
。雜訊增益,
Figure 02_image295
,僅在一良好訊框之後的第一個丟失訊框計算並對於進一步的連續訊框丟失將其設定為
Figure 02_image307
。 8.2.4 全激勵、合成及後處理的建構
隨機激發,
Figure 02_image305
,係加至週期激發,
Figure 02_image253
,以形成全激發信號
Figure 02_image309
。針對該消隱訊框的最後合成信號係藉由以來自章節8.2.1之該LP濾波器對該全激發進行濾波獲得並以去加重濾波器做後處理。 8.2.5 時域混疊消隱
為了在下一訊框為良好訊框的情形中得到一正確的疊加,可產生時域混疊消隱部分,
Figure 02_image311
。為此,如同上述建立
Figure 02_image313
個額外樣本以獲得
Figure 02_image315
的信號
Figure 02_image317
。關於此,時域混疊消隱部分係藉由下列步驟建立:
以零填補合成時域緩衝
Figure 02_image317
Figure 02_image319
以MDCT窗格
Figure 02_image321
Figure 02_image323
窗格化
Figure 02_image325
從2N重塑至N
Figure 02_image327
從N重塑至2N
Figure 02_image329
以翻轉之MDCT窗格
Figure 02_image321
Figure 02_image331
窗格化
Figure 02_image333
8.2.6. 多重訊框丟失的處理
所建構之信號淡出至零。淡出速率係由一衰減因子,
Figure 02_image251
,所控制,其取決於先前的衰減因子,
Figure 02_image335
、最後正確接收之訊框上計算的音調增益,
Figure 02_image245
、連續抹除訊框的數目,
Figure 02_image337
、以及穩定度,
Figure 02_image229
。可使用以下程序以運算衰減因子
Figure 02_image251
if (
Figure 02_image339
== 1)
Figure 02_image341
=
Figure 02_image343
if (
Figure 02_image341
> 0.98)
Figure 02_image341
= 0.98 else if (
Figure 02_image341
< 0.925)
Figure 02_image341
= 0.925 else if (
Figure 02_image339
== 2)
Figure 02_image341
= (0.63 + 0.35
Figure 02_image345
)
Figure 02_image347
if
Figure 02_image341
< 0.919
Figure 02_image341
= 0.919; else if (
Figure 02_image339
== 3)
Figure 02_image341
= (0.652 + 0.328
Figure 02_image345
)
Figure 02_image349
else if (
Figure 02_image339
== 4)
Figure 02_image341
= (0.674 + 0.3
Figure 02_image345
)
Figure 02_image349
else if (
Figure 02_image339
== 5) {
Figure 02_image341
= (0.696 + 0.266
Figure 02_image345
)
Figure 02_image349
else
Figure 02_image341
= (0.725 + 0.225
Figure 02_image345
)
Figure 02_image349
Figure 02_image351
=
Figure 02_image341
可獲得因子
Figure 02_image229
(最後兩個相鄰縮放因子向量
Figure 02_image353
Figure 02_image355
的穩定度),舉例來說,如:
Figure 02_image357
其中
Figure 02_image359
Figure 02_image361
為最後兩個相鄰訊框的縮放因子向量。因子
Figure 02_image229
係限界於
Figure 02_image363
,具較大數值的
Figure 02_image229
對應更穩定的信號。這限制了能量及頻譜包絡的波動。若沒有兩個相鄰縮放因子向量存在,則將因子
Figure 02_image229
設定為0.8。
為防止快速的高能量增加,係以
Figure 02_image365
以及
Figure 02_image367
來對該頻譜進行低通濾波。 8.3 與LTPF相關的消隱操作
若在消隱訊框中mem_ltpf_active=1,則在該消隱方法為具符號擾碼之MDCT訊框重複或TCX時域消隱時設定ltpf_active為1。因此,如章節5中所述應用長期後濾波於該合成時域信號,但是以
Figure 02_image369
其中
Figure 02_image371
為先前訊框的LTPF增益且
Figure 02_image251
為衰減因子。使用於LTPF的音調值
Figure 02_image103
Figure 02_image105
係從最後訊框重新使用。 9. 圖9之解碼器
根據一示例(其可,例如,為裝置70的實施例),圖9顯示音訊解碼器300的一區塊示意圖。
音訊解碼器300可組配以接收編碼音訊信號資訊310(其可,例如,為編碼音訊信號資訊12、12’、12”)並在其基礎上提供解碼音訊資訊312。
音訊解碼器300可包含一位元串流分析器320(其亦可被指定為一「位元串流去格式化器」或「位元串流解析器」),其對應於位元串流讀取器71。位元串流分析器320可接收編碼音訊信號資訊310並在其基礎上提供一頻域表示形式322與控制資訊324。
控制資訊324可包含音調資訊16b、17b(例如,「ltpf_pitch_lag」),及額外諧度資訊,像是額外諧度資訊或增益資訊(例如,「ltpf_gain」),以及諸如16c、17c、18c的控制資料項目,其與解碼器端之音訊信號11的諧度相關聯。
控制資訊324亦可包含資料控制項目(例如,16c、17c)。選擇器325(例如,對應於圖7之選擇器78)顯示音調資訊係在控制項目(其反過來由在編碼器端獲得的該諧度資訊控制)的控制之下提供至LTPF組件376:若編碼音訊信號資訊310的諧度太低(例如,低於上述之該第二臨界值),則LTPF組件376不會接收該音調資訊。
頻域表示形式322可,例如,包含編碼頻譜值326、編碼縮放因子328、以及可選地,額外旁側資訊330,其可,例如,控制特定處理步驟,像是例如雜訊填充、一中間處理或一後處理。音訊解碼器300亦可包含頻譜值解碼組件340,其可組配來接收編碼頻譜值326,並且在其基礎上提供一組解碼頻譜值342。音訊解碼器300亦可包含縮放因子解碼組件350,其可組配來接收編碼縮放因子328並在其基礎上提供一組解碼縮放因子352。
替代於該縮放因子解碼,例如,在該編碼音訊資訊包含編碼LPC資訊而非一縮放因子資訊的情形下,可使用LPC至縮放因子轉換組件354。然而,在一些編碼模式下(例如,在USAC音訊解碼器或在EVS音訊解碼器中的TCX解碼模式下),可使用一組LPC係數以在音訊解碼器端推導出一組縮放因子。此功能可由LPC至縮放因子轉換組件354達到。
音訊解碼器300亦可包含用以執行可選信號處理(像是,舉例來說,雜訊填充;及/或時間雜訊整形;TNS,等等)的一可選處理區塊366,其可應用於解碼頻譜值342。解碼頻譜值342的一經處理版本366’可由處理區塊366輸出。
音訊解碼器300亦可包含一縮放器360,其可組配以將該組縮放因子352應用至該組頻譜值342(或其經處理版本366’),因而獲得一組縮放值362。舉例來說,包含多重解碼頻譜值342(或其經處理版本366’)的一第一頻帶可使用一第一縮放因子進行縮放,以及包含多重解碼頻譜值342的一第二頻帶可使用一第二縮放因子進行縮放。因此,得到一組縮放值362。
音訊解碼器300亦可包含一頻域至時域轉換370,其可組配以接收縮放值362,並提供與一組縮放值362相關聯的一時域表示形式372。舉例來說,頻域至時域轉換370可提供一時域表示形式372,其與該音訊內容的一訊框或子訊框相關聯。舉例來說,該頻域至時域轉換可接收一組MDCT(或MDST)係數(其可被認為是縮放解碼頻譜值)並在其基礎上提供可形成時域表示形式372的一時域樣本區塊。
音訊解碼器300亦包含一LTPF組件376,其可對應於濾波器控制器72及LTPF 73。LTPF組件376可接收時域表示形式372並某程度上修改時域表示形式372,藉此獲得時域表示形式372之一經後處理版本378。
音訊解碼器300亦可包含可例如對應於消隱單元75(以執行一PLC功能)的一錯誤消隱組件380。錯誤消隱組件380可,例如,從頻域至時域轉換370接收時域表示形式372,且該錯誤消隱組件380可,例如,針對一或多個丟失音訊訊框提供一錯誤消隱音訊資訊382。換句話說,若丟失一音訊訊框,使得舉例來說,針對該音訊訊框(或音訊子訊框)沒有可用之編碼頻譜值326,則錯誤消隱組件380可在與在該丟失音訊訊框之前的一或多個音訊訊框相關聯的時域表示形式372的基礎上提供該錯誤消隱音訊資訊。該錯誤消隱音訊資訊典型上可為一音訊內容的一時域表示形式。
關於該錯誤消隱,應該注意的是該錯誤消隱不會在該訊框解碼的同時發生。舉例來說若一訊框n為良好則進行一正常的解碼,並最後保存在必須消隱下個訊框之時將有幫助的一些變數,則若n+1丟失了,呼叫該消隱功能給定該變數來自前一良好訊框。一些變數亦將更新以有助於下一訊框丟失或恢復至下一良好訊框。
因此,錯誤消隱組件380可連接至一儲存組件327,數值16b、17b、17d係及時儲存於其上以供將來使用。該等數值將僅在後續訊框被辨認為不純地解碼時使用。否則,儲存於儲存組件327上地數值將會以新數值16b、17b、17d被及時更新。
在示例中,錯誤消隱組件380可執行具信號擾碼之MDCT(或MDST)訊框解析度重複,及/或TCX時域消隱,及/或相位ECU。在示例中,能夠在運行中主動地辨認較佳的技術並使用它。
音訊解碼器300亦可包含一信號組合組件390,其可組配以接收經濾波(後處理)之時域表示形式378。信號組合390可接收錯誤消隱音訊資訊382,其亦可為針對一丟失音訊訊框提供之一錯誤消隱音訊信號的一時域表示形式。信號組合390可,例如,組合與後續音訊訊框相關聯的時域表示形式。在有後續正確解碼音訊訊框的情形中,信號組合390可組合(例如,疊加)與那些後續正確解碼音訊訊框相關聯的時域表示形式。然而,若有一音訊訊框丟失,則信號組合390可組合(例如,疊加)與在該丟失音訊訊框之前的正確解碼音訊訊框相關聯的時域表示形式以及與該丟失音訊訊框相關聯的錯誤消隱音訊資訊,從而在正確接收音訊訊框與丟失音訊訊框之間具有一平滑轉換。相似地,信號組合390可組配以組合(例如,疊加)與丟失音訊訊框相關聯的錯誤消隱音訊資訊以及與在該丟失音訊訊框之後的另一正確解碼音訊訊框相關聯的時域表示形式(或在多重連續音訊訊框丟失情況下與另一丟失音訊訊框相關聯的另一錯誤消隱音訊資訊)。
因此,信號組合390可提供一解碼音訊資訊312,使得時域表示形式372、或其一經後處理版本378係針對正確解碼音訊訊框而提供,並且使得錯誤消隱音訊資訊382係針對丟失音訊訊框而提供,其中可在後續音訊訊框的音訊資訊(無論其是否由頻域至時域轉換370或由錯誤消隱組件380提供)之間執行一疊加操作。由於某些編解碼器在重疊與增加部分上具需要消去的一些混疊,可選地可在已建立之半訊框上建立某些人造混疊以執行該疊加。
值得注意地,消隱組件380可接收,於輸入中,音調資訊及/或增益資訊(16b、17b、17d),即使後者不提供至該LTPF組件:此係因為消隱組件380可以低於LTPF組件370應運作之諧度的諧度之下運作。如上所述,其中該諧度係超過該第一臨界值但低於該第二臨界值,即使是該LTPF功能為停用或減用,一消隱功能可為現用的。
值得注意地,可選擇其他的實施態樣。特別是,可使用與組件340、350、354、360、及370不同的組件。
值得注意地,在提供有可使用第三訊框18”的示例中(例如,沒有欄位16b、17b、16c、17c),當獲得該第三訊框18”時,沒有來自該第三訊框18”的資訊被使用於LTPF組件376與於錯誤消隱組件380。 10. 圖10之方法
圖10中顯示方法100。在步驟S101處,可由一讀取器(71、320)解碼一訊框(12、12’、12”)。在示例中,可從一儲存單元接收(例如,經由一藍牙連接)及/或獲得該訊框。
在步驟S102處,檢查該訊框的有效性(例如以CRC、同位等等)。若確認了該訊框的無效性,執行消隱(見下文)。
否則,若該訊框保持為有效,則在步驟S103處檢查音調資訊是否被編碼於該訊框中。舉例來說,檢查訊框12”中欄位18e的數值(「ltpf_pitch_lag_present」)。在示例中,僅在諧度已被確認為超過該第一臨界值時(例如,藉區塊21及/或在步驟S61處)編碼該音調資訊。然而,該解碼器不執行比較。
若在S103處確認事實上編碼該音調資訊(例如,以目前慣例ltpf_pitch_lag_present=1),則解碼該音調資訊(例如,從編碼該音調資訊16b或17b、「ltpf_pitch_lag」的該欄位)並在步驟S104處儲存。否則,結束循環並可在S101處解碼一新的訊框。
隨後,在步驟S105處,檢查是否啟用LTPF,亦即,是否能夠使用該音調資訊於LTPF。可藉檢查各自的控制項目(例如,16c、17c、「ltpf_active」)而執行此驗證。此可意謂著該諧度係超過該第二臨界值(例如,如由區塊22及/或在步驟S63處辨認)及/或該時間演進並非極度複雜(該信號在時間間隔中係足夠平坦)。然而,比較不是由解碼器所執行。
若驗證LTPF為現用,則在步驟S106執行LTPF。否則,跳過該LTPF。該循環結束。可在S101解碼一新的訊框。
參照該消隱,後者可細分成數個步驟。在步驟S107處,驗證先前訊框的該音調資訊(或先前訊框之一者的一音調資訊)是否被儲存在記憶體中(例如,其可供處置)。
若驗證儲存了搜尋之音調資訊,則可在步驟S108處執行錯誤消隱(例如,由組件75或380)。可執行具信號擾碼之MDCT(或MDST)訊框解析度重複,及/或TCX時域消隱,及/或相位ECU。
否則,若在S107處驗證沒有儲存新的音調資訊(作為先前訊框與極低的諧度或極高變化的信號相關聯的結果),一不同的消隱技術,本身已知且不暗示使用由編碼器提供的一音調資訊,可在步驟S109處使用。這些技術中的一些可基於在解碼器估測音調資訊及/或其他諧度資訊。在一些示例中,在此情況中可不執行消隱技術。
在執行過消隱之後,該循環結束並可在S101處解碼一新的訊框。 11. 解決方案之討論
提出之解決方案可被視為僅在編碼器端保留一音調偵測器並在每當LTPF或PLC需要此資訊時發送音調延遲參數。使用一位元來傳訊位元串流中存在音調資訊與否。使用一額外位元來傳訊LTPF是否為現用中。
藉由使用兩個傳訊位元而非一個,該提出之解決方案能夠將該音調延遲資訊直接地提供給兩模組而不具任何額外複雜度,即使在以音調為基礎的PLC為現用中而非LTPF的情況下亦是如此。
因此,可得到一個LTPF與以音調為基礎之PLC的低複雜度組合。 11.1 編碼器
a. 使用一音調偵測演算法估測每訊框一音調延遲。此能以三個步驟完成以降低複雜度並增進準確性。以一降低的取樣率使用一「開迴路音調分析」粗略估測一第一音調延遲(見例如,[1]或[5]為例)。該音調延遲的整數部分隨後藉由以一較高取樣率最大化一相關函數進行細化。第三個步驟係藉由例如最大化一內插相關函數來估測該音調延遲的小數部分。
b. 做出是否編碼該位元串流中之該音調延遲的決定。可以使用諸如像是標準化相關之信號諧度的測量。若該信號諧度高於一臨界值則隨後設定該位元ltpf_pitch_lag_present 為1否則設定為0。若ltpf_pitch_lag_present 為1則將該音調延遲ltpf_pitch_lag 編碼於該位元串流中。
c. 在ltpf_pitch_lag_present 為1的情況中,做出是否在當前訊框中啟用該LTPF工具的一第二決定。此決定亦可基於諸如該標準化相關之該信號諧度,但具有一較高臨界值以及額外地一滯後機制以為了提供一穩定的決定。此決定設定位元ltpf_active
d. (可選的)在ltpf _active 為1的情況中,一LTPF增益係經估測並編碼於該位元串流中。可使用一以相關為基礎的函數估測該LTPF增益並使用均勻量化來進行量化。 11.2 位元串流
根據示例,該位元串流語法係顯示於圖8a與8b。 11.3 解碼器
若解碼器正確地接收一非損壞訊框: a. 自該位元串流解碼該LTPF資料 b. 若ltpf_pitch_lag_present 為0或ltpf_active 為0,則以一為0的LTPF增益呼叫該LTPF解碼器(在該情況中沒有音調延遲)。 c. 若ltpf_pitch_lag_present 為1且ltpf_active 為1,則以該解碼音調延遲與該解碼增益呼叫該LTPF解碼器。 若該解碼器接收一損壞訊框或若該訊框丟失:
a. 做出是否使用以該音調為基礎之PLC於消隱該丟失/損壞訊框的決定。此決定係基於最後良好訊框的該LTPF資料加上可能地其他資訊。
b. 若該最後良好訊框的ltpf_pitch_lag_present 為0,則不使用音調為基礎的PLC。在該情況中使用另一PLC方法,像是如具符號擾碼之訊框重複(見[7])。
c. 若該最後良好訊框的ltpf_pitch_lag_present 為1,則可能地滿足其他條件,然後使用該音調為基礎的PLC消隱該丟失/損壞訊框。該PLC模組使用從該最後良好訊框之該位元串流解碼的音調延遲ltpf_pitch_lag 。 12. 進一步示例
圖11顯示可實行編碼裝置10或10’及/或執行方法60的系統110。系統110可包含一處理器111及儲存指令之一非暫時性記憶體單元112,該等指令當由該處理器111執行時,可致使該處理器111執行一音調估測113(例如,實行該音調估測器13)、一信號分析114(例如實行該信號分析器14及/或該諧度測量器24)、以及一位元串流形成115(例如,實行該位元串流形成器15及/或步驟S62、S64、及/或S66)。系統110可包含一輸入單元116,其可獲得一音訊信號(例如,音訊信號11)。該處理器111可因此執行程序以獲得該音訊信號的一編碼表示形式(例如,以訊框12、12’、12”的格式)。可使用一輸出單元117將該編碼表示形式提供至外部單元。該輸出單元117可包含,例如,用以對外部設備通訊的一通訊單元(例如,使用諸如藍牙的無線通訊)及/或外部儲存空間。該處理器111可將該音訊信號之該編碼表示形式儲存於一本地儲存空間118中。
圖12顯示可實行解碼裝置70或300及/或執行方法100的系統120。該系統120可包含一處理器121及儲存指令的一非暫時性記憶體單元122,該等指令當由該處理器121執行時,可致使該處理器121執行一位元串流讀取123(例如,實行音調讀取器71及/或320及/或步驟S101單元75或380及/或步驟S107~S109)、一濾波器控制124(例如,實行LTPF 73或376及/或步驟S106)、以及一消隱125(例如,實行)。系統120可包含一輸入單元126,其可獲得一音訊信號之一解碼表示形式(例如,以訊框12、12’、12”的形式)。處理器121可因此執行程序以獲得該音訊信號之一解碼表示形式。可使用一輸出單元127將此解碼表示形式提供至外部單元。該輸出單元127可包含,例如,用以對外部設備通訊的一通訊單元(例如,使用諸如藍牙的無線通訊)及/或外部儲存空間。該處理器121可將該音訊信號之該解碼表示形式儲存於一本地儲存空間128中。
在示例中,系統110及120可為相同的設備。
圖13顯示根據一示例的一方法1300。在步驟S130處該方法可提供編碼音訊信號(例如,根據上述任何方法或使用上述至少一些設備)並導出諧度資訊及/或音調資訊。
在一編碼器端,在步驟S131處該方法可提供決定(例如,在諸如諧度測量之諧度資訊的基礎上)該音調資訊是否適合於在解碼器端操作的至少一LTPF及/或錯誤消隱功能。
在一編碼器端,在步驟S132處該方法可提供自一編碼器發送(例如,無線地,例如,使用藍牙)及/或在一記憶體中儲存包括該音訊信號之一數位表示形式及與諧度相關聯之資訊的一位元串流。該步驟亦可提供對該解碼器傳訊該音調資訊是否可適於LTPF及/或錯誤消隱。舉例來說,該第三控制項目18e (「ltpf_pitch_lag_present」)可根據編碼於該第三控制項目18e中的數值傳訊音調資訊(編碼於該位元串流中的)係適於或不適於至少錯誤消隱。舉例來說,該第一控制項目16a (ltpf_active=0)可傳訊音調資訊(編碼於該位元串流中為「ltpf_pitch_lag」)係適於錯誤消隱但不適於LTPF(例如,由於其中間諧度)。舉例來說,該第二控制項目17a (ltpf_active=1)可傳訊音調資訊(編碼於該位元串流中為「ltpf_pitch_lag」)係適於錯誤消隱與LTPF兩者(例如,由於其較高諧度)。
在一解碼器端,該方法可提供,在步驟S134處,根據來自該編碼器之該傳訊解碼該音訊信號之該數位表示形式並使用該音調資訊於LTPF及/或錯誤消隱。
取決於某些實行條件,可以硬體實行示例。可使用一數位儲存媒介,例如一軟碟、一數位多功能碟(DVD)、一藍光碟、一光碟(CD)、一唯讀記憶體(ROM)、一可規劃唯讀記憶體(PROM)、一可抹除及可規劃唯讀記憶體(EPROM)、一電性可抹除可規劃唯讀記憶體(EEPROM)或一快閃記憶體,執行該實行,該數位儲存媒介具有與一可規劃電腦系統協作(或能夠協作)的電子可讀控制信號儲存於其上,使得各自方法可被執行。因此,該數位儲存媒介可為電腦可讀取的。
一般上,可實行示例為具有程式指令之一電腦程式產品,當該電腦程式產品運行於一電腦上時可操作該等程式指令以執行該等方法之一者。該等程式指令可例如儲存於一機器可讀媒介上。
其他示例包含儲存在一機器可讀載體上之用以執行本文所述該等方法中之一者的電腦程式。換句話說,方法之一示例因此為具有程式指令之一電腦程式,當該電腦程式運行於一電腦上時該等程式指令用以執行本文所述該等方法中之一者。
該等方法之一進一步示例,因此,為一資料載體媒介(或一數位儲存媒介、或一電腦可讀媒介),其包含用以執行本文所述該等方法中之一者的電腦程式儲存於其上。該資料載體媒介、該數位儲存媒介或該紀錄媒介係有形及/或非暫時性的,而不是無形且暫時性的信號。
一進一步的示例包含一處理單元,例如執行本文所述該等方法中之一者的一電腦、或一可規劃邏輯設備。
一進一步的示例包含一電腦,具有用以執行本文所述該等方法中之一者的電腦程式安裝於其上。
一進一步的示例包含一裝置或一系統,其發送(例如,電子地或光學地)用以執行本文所述該等方法中之一者的一電腦程式至一接收器。該接收器可,例如,為一電腦、一行動設備、一記憶體設備或類似者。該裝置或系統可,例如,包含用以將該電腦程式發送至該接收器的一檔案伺服器。
在一些示例中,可使用一可規劃邏輯設備(例如,一場域可規劃閘陣列)以執行本文所述該等方法之一些或全部功能。在一些示例中,為了執行本文所述該等方法之一者,一場域可規劃閘陣列可與一微處理器協作。一般上,該等方法可由任何適當的硬體裝置執行。
上述示例係針對以上所論之原則的說明。可以知道對本文所述之配置及細節的修改及變化將會是顯而易見的。其意圖因此為受到即將界定之專利請求項的範圍所限制,而非受到通過本文示例之描述與說明介紹的特定細節所限制。
10、10’、70‧‧‧裝置 11‧‧‧音訊信號 12、12’、12”‧‧‧資訊、訊框 13‧‧‧音調估測器 13a、16b、17b‧‧‧音調資訊 14‧‧‧信號分析器 14a、21a、22a、24c‧‧‧諧度資訊 15‧‧‧位元串流形成器 16、16’、16”‧‧‧第一訊框 17、17’、17”‧‧‧第二訊框 18”‧‧‧第三訊框 16a、17a、18a‧‧‧編碼表示形式 16c、17c、18e‧‧‧控制資料項目 17d‧‧‧額外諧度資訊 21、22‧‧‧區塊 23‧‧‧記憶體元件 24‧‧‧諧度測量器 24a、24a’、24a”、24b‧‧‧諧度測量 25、26、78、325‧‧‧選擇器 60、60b、100、1300‧‧‧方法 S60、S61、S62、S63、S64、S65、S66、S67、S101、S102、S103、S104、S105、S106、S107、S108、S109、S131、S132、S133、S134、S610、S611、S612、S613、S614‧‧‧步驟 600‧‧‧第二準則 71‧‧‧位元串流讀取器 71a‧‧‧解碼表示形式 72‧‧‧濾波器控制器 73‧‧‧LTPF 75‧‧‧消隱單元 76‧‧‧濾波解碼音訊信號資訊、音訊資訊 110、120‧‧‧系統 111、121‧‧‧處理器 112、122‧‧‧非暫時性記憶體單元 113‧‧‧音調估測 114‧‧‧信號分析 115‧‧‧位元串流形成 116、126‧‧‧輸入單元 117、127‧‧‧輸出單元 118、128‧‧‧本地儲存空間 123‧‧‧位元串流讀取 124‧‧‧濾波器控制 125‧‧‧消隱 300‧‧‧音訊解碼器 310‧‧‧編碼音訊信號資訊 312‧‧‧解碼音訊資訊 320‧‧‧位元串流分析器 322‧‧‧頻域表示形式 324‧‧‧控制資訊 326‧‧‧編碼頻譜值 327‧‧‧儲存組件 328‧‧‧編碼縮放因子 330‧‧‧額外旁側資訊 340‧‧‧頻譜值解碼組件 342‧‧‧解碼頻譜值 350‧‧‧縮放因子解碼組件 352‧‧‧解碼縮放因子 354‧‧‧LPC至縮放因子轉換組件 360‧‧‧縮放器 362‧‧‧縮放值 366‧‧‧可選處理區塊 366’‧‧‧經處理版本 370‧‧‧頻域至時域轉換 372‧‧‧時域表示形式 376‧‧‧LTPF組件 378‧‧‧經後處理版本 380‧‧‧錯誤消隱組件 382‧‧‧錯誤消隱音訊資訊 390‧‧‧信號組合組件
4. 圖示說明
圖1及圖2顯示用以編碼音訊信號資訊的裝置。
圖3~圖5顯示可由圖1及圖2之裝置編碼的編碼信號資訊的格式。
圖6a及圖6b顯示用以編碼音訊信號資訊的方法。
圖7顯示用以解碼音訊信號資訊的裝置。
圖8a及圖8b顯示編碼音訊信號資訊的格式。
圖9顯示用以解碼音訊信號資訊的裝置。
圖10顯示用以解碼音訊信號資訊的方法。
圖11及圖12顯示用以編碼/解碼音訊信號資訊的系統。
圖13顯示編碼/解碼的方法。
S130、S131、S132、S133、S134‧‧‧步驟

Claims (14)

  1. 一種用以解碼音訊信號資訊之裝置,該音訊信號資訊與劃分成一序列訊框之一音訊信號相關聯,該裝置包含:一位元串流讀取器,其組配來讀取具有下列之編碼音訊信號資訊:針對一第一訊框與一第二訊框之該音訊信號的一編碼表示形式,其中該編碼表示形式包括一第二傳訊位元;針對該第一訊框之一第一音調資訊,該第一訊框係由在該第二傳訊位元中具有一第一數值的一第一控制資料項目所識別;以及針對該第二訊框之一第二音調資訊,該第二訊框係由在該第二傳訊位元中具有與該第一數值不同之一第二數值的一第二控制資料項目所識別;以及一控制器,其組配來控制一長期後濾波器LTPF,以:當該第二控制資料項目具有該第二數值時,使用該第二音調資訊對該第二訊框中的該音訊信號之一解碼表示形式進行濾波;以及當該第一控制資料項目具有該第一數值時,停用針對該第一訊框之該LTPF;以及其中該裝置組配來檢查該等訊框的有效性,以便在正確解碼訊框與非正確解碼訊框之間進行區別,該裝置進一步包含一消隱單元,該消隱單元組配來使 用該第一及/或第二音調資訊以消隱一隨後非正確解碼音訊訊框。
  2. 如請求項1之裝置,其中:該位元串流讀取器係組配來讀取一第三訊框,該第三訊框具有指示該第一音調資訊及/或該第二音調資訊存在或不存在的一第三控制資料項目。
  3. 如請求項2之裝置,其中:該第三訊框具有缺少該第一音調資訊、該第一控制資料項目、該第二音調資訊、以及該第二控制資料項目的一格式。
  4. 如請求項2之裝置,其中:該第三控制資料項目係以一單一位元編碼,該單一位元具有區別該第三訊框與該第一訊框及該第二訊框的一數值。
  5. 如請求項2之裝置,其中:該編碼音訊信號資訊包含:一第一傳訊位元,該第一傳訊位元編碼該第三控制資料項目,該第三控制資料項目在下列項目之間進行區別:該第三訊框,其缺少該第一音調資訊、該第一控制資料項目、該第二音調資訊、及該第二控制資料項目;及該第一訊框及該第二訊框,其包括編碼該第一控制資料項目及該第二控制資料項目的該第 二傳訊位元。
  6. 如請求項1之裝置,該消隱單元係組配以:在決定解碼一無效訊框的情形下,檢查是否有儲存與一先前正確解碼訊框有關的音調資訊,以便於以使用該儲存之音調資訊獲得的一訊框來消隱一無效解碼訊框。
  7. 一種用以編碼劃分成一序列訊框的音訊信號之裝置,該裝置包含:一音調估測器,其組配來獲得與一音訊信號之一音調延遲或其一經處理版本相關聯的音調資訊;一信號分析器,其組配來獲得與該音訊信號之諧度相關聯的諧度資訊;以及一位元串流形成器,其組配來預備編碼訊框之編碼音訊信號資訊以便將下列項目包括於該位元串流中:針對一第一訊框、一第二訊框、及一第三訊框的該音訊信號之一編碼表示形式,在該第一訊框及該第二訊框的情況下,該編碼表示形式包括一第二傳訊位元;針對該第一訊框之一第一音調資訊,其中該第一訊框係由在該第二傳訊位元中具有一第一數值之一第一控制資料項目所識別;針對該第二訊框之一第二音調資訊,其中該第二訊框係由在該第二傳訊位元中具有與該第一數值不同之一第二數值的一第二控制資料項目所識別;以及 針對該第一、第二、及第三訊框之一第三控制資料項目,其中該第一數值與該第二數值取決於與該諧度資訊相關聯的一第二準則,以及該第一數值指示針對該第一訊框中之該音訊信號之該諧度的該第二準則未滿足,以及該第二數值指示針對該第二訊框中之該音訊信號之該諧度的該第二準則滿足,其中該第二準則包含當至少一第二諧度測量大於至少一第二臨界值時滿足的至少一條件,該第三控制資料項目係以具有一數值的一單一位元編碼,該數值區別該第三訊框與該第一及第二訊框,該第三訊框在一第一準則未滿足的情況下會被編碼以及該第一及第二訊框在該第一準則滿足的情況下會被編碼,其中該第一準則包含當至少一第一諧度測量大於至少一第一臨界值時滿足的至少一條件,其中在該位元串流中,針對該第一訊框及該第二訊框,為該第一控制資料項目及該第二控制資料項目保留該第二傳訊位元,以在該第一訊框與該第二訊框之間進行區別,其中針對該第一音調資訊及該第二音調資訊保留一固定資料欄位,其中在該位元串流中,針對該第三訊框,不為該固定資料欄位及/或該第一與第二控制項目保留位元。
  8. 如請求項7之裝置,其中該第二準則包含 當先前訊框之至少一諧度測量大於至少一額外臨界值時滿足的至少一額外條件。
  9. 如請求項7之裝置,其中該第一與第二諧度測量係在不同取樣率下獲得。
  10. 如請求項7之裝置,其中:該諧度資訊包含一自相關值及/或一標準化自相關值及/或其一經處理版本中之至少一者。
  11. 一種用以解碼音訊信號資訊之方法,該音訊信號資訊與劃分成一序列訊框之一音訊信號相關聯,該方法包含:讀取一編碼音訊信號資訊,該編碼音訊信號資訊包含:針對一第一訊框與一第二訊框之該音訊信號的一編碼表示形式,其中該編碼表示形式包括一第二傳訊位元;針對該第一訊框之一第一音調資訊,該第一音調資訊係由在該第二傳訊位元中具有一第一數值的一第一控制資料項目所識別;針對該第二訊框之一第二音調資訊,該第二音調資訊係由在該第二傳訊位元中具有與該第一數值不同之一第二數值的一第二控制資料項目所識別,在判定該第一控制資料項目具有該第一數值時,使用該第一音調資訊於一長期後濾波器LTPF,以及在判定該第二控制資料項目之該第二數值時,停用該 LTPF,及在判定該第一或第二控制資料項目具有該第一或第二數值時,使用該第一或第二音調資訊於一錯誤消隱功能。
  12. 一種用以編碼音訊信號資訊之方法,該音訊信號資訊與劃分成訊框之一信號相關聯,該包含:自該音訊信號獲得測量;驗證一第二準則的滿足,該第二準則係基於該等測量並包含當至少一第二諧度測量大於一第二臨界值時滿足的至少一條件;形成包括下列項目之帶有訊框的一編碼音訊信號資訊:針對一第一訊框與一第二訊框與一第三訊框之該音訊信號的一編碼表示形式,其中該編碼表示形式包括一第二傳訊位元;針對該第一訊框與一音調延遲或其一經處理版本相關聯之一第一音調資訊,該第一訊框係由在該第二傳訊位元中具有一第一數值的一第一控制資料項目及一第三控制資料項目所識別;針對該第二訊框與一音調延遲或其一經處理版本相關聯之一第二音調資訊,該第二訊框係由在該第二傳訊位元中具有與該第一數值不同的一第二數值之一第二控制資料項目及一第三控制資料項目所識別,其中該第一數值與該第二數值取決於該第二準則,且 該第一數值指示在該第一訊框中之該音訊信號之一諧度的基礎上該第二準則的未滿足,以及該第二數值指示在該第二訊框中之該音訊信號之一諧度的基礎上該第二準則的滿足,該第三控制資料項目為具有一數值的一單一位元,該數值區別該第三訊框與跟該第一準則之滿足相關聯的該第一及第二訊框,以便在當至少一第一諧度測量高於至少一第一臨界值時滿足的至少一條件的基礎上,在該第三控制資料項目指示該第一準則的未滿足時識別該第三訊框,其中形成該編碼音訊信號資訊,以至於針對該第一訊框,為該第一及第二控制資料項目保留該第二傳訊位元,以在該第一訊框與該第二訊框之間進行區別,其中針對該第一或第二音調資訊保留一固定資料欄位,以及其中形成該編碼音訊信號資訊,以至於針對該第三訊框,不為該固定資料欄位保留位元以及不為該第一控制資料項目與該第二控制資料項目保留位元。
  13. 一種用以編碼及解碼音訊信號之方法,該方法包含:編碼根據請求項11的一音訊信號;發送該編碼音訊信號資訊至一解碼器或儲存該編碼音訊信號資訊;解碼根據請求項12的該音訊信號資訊。
  14. 一種儲存有指令的非暫時性記憶體單元, 當該等指令由一處理器執行時,實施根據請求項11、或請求項12、或請求項13之方法。
TW107139530A 2017-11-10 2018-11-07 編碼及解碼音訊信號之技術 TWI698859B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
EP17201099.3 2017-11-10
EP17201099.3A EP3483883A1 (en) 2017-11-10 2017-11-10 Audio coding and decoding with selective postfiltering
WOPCT/EP2018/080350 2018-11-06
PCT/EP2018/080350 WO2019091980A1 (en) 2017-11-10 2018-11-06 Encoding and decoding audio signals

Publications (2)

Publication Number Publication Date
TW201923746A TW201923746A (zh) 2019-06-16
TWI698859B true TWI698859B (zh) 2020-07-11

Family

ID=60301910

Family Applications (1)

Application Number Title Priority Date Filing Date
TW107139530A TWI698859B (zh) 2017-11-10 2018-11-07 編碼及解碼音訊信號之技術

Country Status (17)

Country Link
US (1) US11217261B2 (zh)
EP (2) EP3483883A1 (zh)
JP (1) JP7004474B2 (zh)
KR (1) KR102460233B1 (zh)
CN (1) CN111566731B (zh)
AR (1) AR113481A1 (zh)
AU (1) AU2018363701B2 (zh)
BR (1) BR112020009184A2 (zh)
CA (1) CA3082274C (zh)
ES (1) ES2968821T3 (zh)
MX (1) MX2020004776A (zh)
PL (1) PL3707714T3 (zh)
RU (1) RU2741518C1 (zh)
SG (1) SG11202004228VA (zh)
TW (1) TWI698859B (zh)
WO (1) WO2019091980A1 (zh)
ZA (1) ZA202002524B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5981408B2 (ja) * 2013-10-29 2016-08-31 株式会社Nttドコモ 音声信号処理装置、音声信号処理方法、及び音声信号処理プログラム
EP2980798A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Harmonicity-dependent controlling of a harmonic filter tool
CN113302684B (zh) 2019-01-13 2024-05-17 华为技术有限公司 高分辨率音频编解码
CN112289328B (zh) * 2020-10-28 2024-06-21 北京百瑞互联技术股份有限公司 一种确定音频编码码率的方法及系统
CN113096685B (zh) * 2021-04-02 2024-05-07 北京猿力未来科技有限公司 音频处理方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012126893A1 (en) * 2011-03-18 2012-09-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Frame element length transmission in audio coding
WO2014165668A1 (en) * 2013-04-03 2014-10-09 Dolby Laboratories Licensing Corporation Methods and systems for generating and interactively rendering object based audio

Family Cites Families (156)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3639753A1 (de) 1986-11-21 1988-06-01 Inst Rundfunktechnik Gmbh Verfahren zum uebertragen digitalisierter tonsignale
US5012517A (en) 1989-04-18 1991-04-30 Pacific Communication Science, Inc. Adaptive transform coder having long term predictor
US5233660A (en) 1991-09-10 1993-08-03 At&T Bell Laboratories Method and apparatus for low-delay celp speech coding and decoding
JPH05281996A (ja) 1992-03-31 1993-10-29 Sony Corp ピッチ抽出装置
IT1270438B (it) 1993-06-10 1997-05-05 Sip Procedimento e dispositivo per la determinazione del periodo del tono fondamentale e la classificazione del segnale vocale in codificatori numerici della voce
US5581653A (en) 1993-08-31 1996-12-03 Dolby Laboratories Licensing Corporation Low bit-rate high-resolution spectral envelope coding for audio encoder and decoder
JP3402748B2 (ja) 1994-05-23 2003-05-06 三洋電機株式会社 音声信号のピッチ周期抽出装置
JPH0811644A (ja) 1994-06-27 1996-01-16 Nissan Motor Co Ltd ルーフモール取付構造
US6167093A (en) 1994-08-16 2000-12-26 Sony Corporation Method and apparatus for encoding the information, method and apparatus for decoding the information and method for information transmission
DE69619284T3 (de) 1995-03-13 2006-04-27 Matsushita Electric Industrial Co., Ltd., Kadoma Vorrichtung zur Erweiterung der Sprachbandbreite
US5781888A (en) 1996-01-16 1998-07-14 Lucent Technologies Inc. Perceptual noise shaping in the time domain via LPC prediction in the frequency domain
WO1997027578A1 (en) 1996-01-26 1997-07-31 Motorola Inc. Very low bit rate time domain speech analyzer for voice messaging
US5812971A (en) 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
JPH1091194A (ja) 1996-09-18 1998-04-10 Sony Corp 音声復号化方法及び装置
US6570991B1 (en) 1996-12-18 2003-05-27 Interval Research Corporation Multi-feature speech/music discrimination system
KR100261253B1 (ko) 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치
GB2326572A (en) 1997-06-19 1998-12-23 Softsound Limited Low bit rate audio coder and decoder
US6507814B1 (en) 1998-08-24 2003-01-14 Conexant Systems, Inc. Pitch determination using speech classification and prior pitch estimation
US7272556B1 (en) 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
US7099830B1 (en) 2000-03-29 2006-08-29 At&T Corp. Effective deployment of temporal noise shaping (TNS) filters
US6735561B1 (en) 2000-03-29 2004-05-11 At&T Corp. Effective deployment of temporal noise shaping (TNS) filters
US6665638B1 (en) 2000-04-17 2003-12-16 At&T Corp. Adaptive short-term post-filters for speech coders
US7395209B1 (en) 2000-05-12 2008-07-01 Cirrus Logic, Inc. Fixed point audio decoding system and method
US7353168B2 (en) 2001-10-03 2008-04-01 Broadcom Corporation Method and apparatus to eliminate discontinuities in adaptively filtered signals
US6785645B2 (en) 2001-11-29 2004-08-31 Microsoft Corporation Real-time speech and music classifier
US20030187663A1 (en) 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
US7447631B2 (en) 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
US7433824B2 (en) 2002-09-04 2008-10-07 Microsoft Corporation Entropy coding by adapting coding between level and run-length/level modes
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
JP4287637B2 (ja) 2002-10-17 2009-07-01 パナソニック株式会社 音声符号化装置、音声符号化方法及びプログラム
KR101049751B1 (ko) 2003-02-11 2011-07-19 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩
KR20030031936A (ko) 2003-02-13 2003-04-23 배명진 피치변경법을 이용한 단일 음성 다중 목소리 합성기
ATE503246T1 (de) 2003-06-17 2011-04-15 Panasonic Corp Empfangsvorrichtung, sendevorrichtung und übertragungssystem
WO2005027096A1 (en) 2003-09-15 2005-03-24 Zakrytoe Aktsionernoe Obschestvo Intel Method and apparatus for encoding audio
US7009533B1 (en) 2004-02-13 2006-03-07 Samplify Systems Llc Adaptive compression and decompression of bandlimited signals
DE102004009954B4 (de) 2004-03-01 2005-12-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines Multikanalsignals
WO2005086139A1 (en) 2004-03-01 2005-09-15 Dolby Laboratories Licensing Corporation Multichannel audio coding
DE102004009949B4 (de) 2004-03-01 2006-03-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Ermitteln eines Schätzwertes
JP4744438B2 (ja) 2004-03-05 2011-08-10 パナソニック株式会社 エラー隠蔽装置およびエラー隠蔽方法
KR100956877B1 (ko) 2005-04-01 2010-05-11 콸콤 인코포레이티드 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 방법 및장치
US7546240B2 (en) * 2005-07-15 2009-06-09 Microsoft Corporation Coding with improved time resolution for selected segments via adaptive block transformation of a group of samples from a subband decomposition
US7539612B2 (en) 2005-07-15 2009-05-26 Microsoft Corporation Coding and decoding scale factor information
KR100888474B1 (ko) 2005-11-21 2009-03-12 삼성전자주식회사 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법
US7805297B2 (en) 2005-11-23 2010-09-28 Broadcom Corporation Classification-based frame loss concealment for audio signals
US9123350B2 (en) 2005-12-14 2015-09-01 Panasonic Intellectual Property Management Co., Ltd. Method and system for extracting audio features from an encoded bitstream for audio classification
US8255207B2 (en) 2005-12-28 2012-08-28 Voiceage Corporation Method and device for efficient frame erasure concealment in speech codecs
CN101395661B (zh) 2006-03-07 2013-02-06 艾利森电话股份有限公司 音频编码和解码的方法和设备
US8150065B2 (en) 2006-05-25 2012-04-03 Audience, Inc. System and method for processing an audio signal
ATE447227T1 (de) 2006-05-30 2009-11-15 Koninkl Philips Electronics Nv Linear-prädiktive codierung eines audiosignals
CN1983909B (zh) 2006-06-08 2010-07-28 华为技术有限公司 一种丢帧隐藏装置和方法
US8015000B2 (en) 2006-08-03 2011-09-06 Broadcom Corporation Classification-based frame loss concealment for audio signals
EP2054882B1 (en) 2006-08-15 2011-01-19 Dolby Laboratories Licensing Corporation Arbitrary shaping of temporal noise envelope without side-information
FR2905510B1 (fr) 2006-09-01 2009-04-10 Voxler Soc Par Actions Simplif Procede d'analyse en temps reel de la voix pour le controle en temps reel d'un organe numerique et dispositif associe
CN101140759B (zh) 2006-09-08 2010-05-12 华为技术有限公司 语音或音频信号的带宽扩展方法及系统
DE102006049154B4 (de) 2006-10-18 2009-07-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kodierung eines Informationssignals
KR101292771B1 (ko) 2006-11-24 2013-08-16 삼성전자주식회사 오디오 신호의 오류은폐방법 및 장치
JPWO2008072701A1 (ja) 2006-12-13 2010-04-02 パナソニック株式会社 ポストフィルタおよびフィルタリング方法
FR2912249A1 (fr) 2007-02-02 2008-08-08 France Telecom Codage/decodage perfectionnes de signaux audionumeriques.
JP4871894B2 (ja) 2007-03-02 2012-02-08 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
EP2015293A1 (en) * 2007-06-14 2009-01-14 Deutsche Thomson OHG Method and apparatus for encoding and decoding an audio signal using adaptively switched temporal resolution in the spectral domain
JP5618826B2 (ja) 2007-06-14 2014-11-05 ヴォイスエイジ・コーポレーション Itu.t勧告g.711と相互運用可能なpcmコーデックにおいてフレーム消失を補償する装置および方法
CN101325537B (zh) * 2007-06-15 2012-04-04 华为技术有限公司 一种丢帧隐藏的方法和设备
JP4928366B2 (ja) 2007-06-25 2012-05-09 日本電信電話株式会社 ピッチ探索装置、パケット消失補償装置、それらの方法、プログラム及びその記録媒体
JP4572218B2 (ja) 2007-06-27 2010-11-04 日本電信電話株式会社 音楽区間検出方法、音楽区間検出装置、音楽区間検出プログラム及び記録媒体
US20110116542A1 (en) 2007-08-24 2011-05-19 France Telecom Symbol plane encoding/decoding with dynamic calculation of probability tables
CN101790757B (zh) 2007-08-27 2012-05-30 爱立信电话股份有限公司 语音与音频信号的改进的变换编码
CN100524462C (zh) 2007-09-15 2009-08-05 华为技术有限公司 对高带信号进行帧错误隐藏的方法及装置
JP5547081B2 (ja) 2007-11-02 2014-07-09 華為技術有限公司 音声復号化方法及び装置
WO2009066869A1 (en) 2007-11-21 2009-05-28 Electronics And Telecommunications Research Institute Frequency band determining method for quantization noise shaping and transient noise shaping method using the same
KR101162275B1 (ko) 2007-12-31 2012-07-04 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
CN102057424B (zh) 2008-06-13 2015-06-17 诺基亚公司 用于经编码的音频数据的错误隐藏的方法和装置
EP2144231A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme with common preprocessing
EP2144230A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
MX2011000369A (es) 2008-07-11 2011-07-29 Ten Forschung Ev Fraunhofer Codificador y decodificador de audio para codificar marcos de señales de audio muestreadas.
PL2346030T3 (pl) 2008-07-11 2015-03-31 Fraunhofer Ges Forschung Koder audio, sposób kodowania sygnału audio oraz program komputerowy
US8577673B2 (en) 2008-09-15 2013-11-05 Huawei Technologies Co., Ltd. CELP post-processing for music signals
TWI419148B (zh) 2008-10-08 2013-12-11 Fraunhofer Ges Forschung 多解析度切換音訊編碼/解碼方案
GB2466673B (en) 2009-01-06 2012-11-07 Skype Quantization
CA2750795C (en) 2009-01-28 2015-05-26 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, encoded audio information, methods for encoding and decoding an audio signal and computer program
JP4945586B2 (ja) 2009-02-02 2012-06-06 株式会社東芝 信号帯域拡張装置
JP4932917B2 (ja) 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
FR2944664A1 (fr) 2009-04-21 2010-10-22 Thomson Licensing Dispositif et procede de traitement d'images
US8352252B2 (en) 2009-06-04 2013-01-08 Qualcomm Incorporated Systems and methods for preventing the loss of information within a speech frame
US8428938B2 (en) 2009-06-04 2013-04-23 Qualcomm Incorporated Systems and methods for reconstructing an erased speech frame
KR20100136890A (ko) 2009-06-19 2010-12-29 삼성전자주식회사 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법
CN101958119B (zh) 2009-07-16 2012-02-29 中兴通讯股份有限公司 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法
WO2011044700A1 (en) 2009-10-15 2011-04-21 Voiceage Corporation Simultaneous time-domain and frequency-domain noise shaping for tdac transforms
PT2491553T (pt) 2009-10-20 2017-01-20 Fraunhofer Ges Forschung Codificador de áudio, descodificador de áudio, método para codificar uma informação de áudio, método para descodificar uma informação de áudio e programa de computador que utiliza uma redução iterativa de tamanho de intervalo
WO2011048118A1 (en) 2009-10-20 2011-04-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Audio signal encoder, audio signal decoder, method for providing an encoded representation of an audio content, method for providing a decoded representation of an audio content and computer program for use in low delay applications
US8207875B2 (en) 2009-10-28 2012-06-26 Motorola Mobility, Inc. Encoder that optimizes bit allocation for information sub-parts
US7978101B2 (en) 2009-10-28 2011-07-12 Motorola Mobility, Inc. Encoder and decoder using arithmetic stage to compress code space that is not fully utilized
KR101761629B1 (ko) 2009-11-24 2017-07-26 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
MX2012008075A (es) 2010-01-12 2013-12-16 Fraunhofer Ges Forschung Codificador de audio, decodificador de audio, metodo para codificar e informacion de audio, metodo para decodificar una informacion de audio y programa de computacion utilizando una modificacion de una representacion de un numero de un valor de contexto numerico previo.
US20110196673A1 (en) 2010-02-11 2011-08-11 Qualcomm Incorporated Concealing lost packets in a sub-band coding decoder
EP2375409A1 (en) 2010-04-09 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction
FR2961980A1 (fr) 2010-06-24 2011-12-30 France Telecom Controle d'une boucle de retroaction de mise en forme de bruit dans un codeur de signal audionumerique
EP3422346B1 (en) * 2010-07-02 2020-04-22 Dolby International AB Audio encoding with decision about the application of postfiltering when decoding
ES2937066T3 (es) 2010-07-20 2023-03-23 Fraunhofer Ges Forschung Decodificador de audio, procedimiento y programa informático para decodificación de audio
US9082416B2 (en) 2010-09-16 2015-07-14 Qualcomm Incorporated Estimating a pitch lag
US8738385B2 (en) 2010-10-20 2014-05-27 Broadcom Corporation Pitch-based pre-filtering and post-filtering for compression of audio signals
AR085794A1 (es) 2011-02-14 2013-10-30 Fraunhofer Ges Forschung Prediccion lineal basada en esquema de codificacion utilizando conformacion de ruido de dominio espectral
US9270807B2 (en) 2011-02-23 2016-02-23 Digimarc Corporation Audio localization using audio signal encoding and recognition
MX2013012301A (es) 2011-04-21 2013-12-06 Samsung Electronics Co Ltd Aparato para cuantificar coeficientes de codificacion predictiva lineal, aparato de codificacion de sonido, aparato para decuantificar coeficientes de codificacion predictiva lineal, aparato de decodificacion de sonido y dispositivo electronico para los mismos.
EP2707873B1 (en) 2011-05-09 2015-04-08 Dolby International AB Method and encoder for processing a digital stereo audio signal
FR2977439A1 (fr) 2011-06-28 2013-01-04 France Telecom Fenetres de ponderation en codage/decodage par transformee avec recouvrement, optimisees en retard.
FR2977969A1 (fr) 2011-07-12 2013-01-18 France Telecom Adaptation de fenetres de ponderation d'analyse ou de synthese pour un codage ou decodage par transformee
CN103493130B (zh) 2012-01-20 2016-05-18 弗劳恩霍夫应用研究促进协会 用以利用正弦代换进行音频编码及译码的装置和方法
WO2013149672A1 (en) 2012-04-05 2013-10-10 Huawei Technologies Co., Ltd. Method for determining an encoding parameter for a multi-channel audio signal and multi-channel audio encoder
US20130282373A1 (en) 2012-04-23 2013-10-24 Qualcomm Incorporated Systems and methods for audio signal processing
US9026451B1 (en) 2012-05-09 2015-05-05 Google Inc. Pitch post-filter
WO2013183977A1 (ko) 2012-06-08 2013-12-12 삼성전자 주식회사 프레임 에러 은닉방법 및 장치와 오디오 복호화방법 및 장치
GB201210373D0 (en) 2012-06-12 2012-07-25 Meridian Audio Ltd Doubly compatible lossless audio sandwidth extension
FR2992766A1 (fr) 2012-06-29 2014-01-03 France Telecom Attenuation efficace de pre-echos dans un signal audionumerique
CN102779526B (zh) 2012-08-07 2014-04-16 无锡成电科大科技发展有限公司 语音信号中基音提取及修正方法
US9406307B2 (en) 2012-08-19 2016-08-02 The Regents Of The University Of California Method and apparatus for polyphonic audio signal prediction in coding and networking systems
US9293146B2 (en) 2012-09-04 2016-03-22 Apple Inc. Intensity stereo coding in advanced audio coding
US9280975B2 (en) 2012-09-24 2016-03-08 Samsung Electronics Co., Ltd. Frame error concealment method and apparatus, and audio decoding method and apparatus
US9401153B2 (en) 2012-10-15 2016-07-26 Digimarc Corporation Multi-mode audio recognition and auxiliary data encoding and decoding
CN103886863A (zh) * 2012-12-20 2014-06-25 杜比实验室特许公司 音频处理设备及音频处理方法
FR3001593A1 (fr) 2013-01-31 2014-08-01 France Telecom Correction perfectionnee de perte de trame au decodage d'un signal.
RU2628144C2 (ru) 2013-02-05 2017-08-15 Телефонактиеболагет Л М Эрикссон (Пабл) Способ и устройство для управления маскировкой потери аудиокадров
AU2014283389B2 (en) 2013-06-21 2017-10-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for improved concealment of the adaptive codebook in ACELP-like concealment employing improved pulse resynchronization
EP2830055A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Context-based entropy coding of sample values of a spectral envelope
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
KR101831289B1 (ko) 2013-10-18 2018-02-22 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. 오디오 신호의 스펙트럼의 스펙트럼 계수들의 코딩
US9906858B2 (en) 2013-10-22 2018-02-27 Bongiovi Acoustics Llc System and method for digital signal processing
ES2805744T3 (es) * 2013-10-31 2021-02-15 Fraunhofer Ges Forschung Decodificador de audio y método para proporcionar una información de audio decodificada usando un ocultamiento de errores en base a una señal de excitación de dominio de tiempo
EP3063761B1 (en) 2013-10-31 2017-11-22 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung E.V. Audio bandwidth extension by insertion of temporal pre-shaped noise in frequency domain
KR101940740B1 (ko) 2013-10-31 2019-01-22 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 시간 도메인 여기 신호를 변형하는 오류 은닉을 사용하여 디코딩된 오디오 정보를 제공하기 위한 오디오 디코더 및 방법
BR112016010197B1 (pt) 2013-11-13 2021-12-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificador para codificar um sinal áudio, sistema de transmissão de áudio e método para determinar os valores de correção
GB2524333A (en) 2014-03-21 2015-09-23 Nokia Technologies Oy Audio signal payload
US9396733B2 (en) 2014-05-06 2016-07-19 University Of Macau Reversible audio data hiding
NO2780522T3 (zh) 2014-05-15 2018-06-09
EP2963649A1 (en) 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio processor and method for processing an audio signal using horizontal phase correction
US9685166B2 (en) 2014-07-26 2017-06-20 Huawei Technologies Co., Ltd. Classification between time-domain coding and frequency domain coding
EP2980796A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for processing an audio signal, audio decoder, and audio encoder
WO2016016724A2 (ko) 2014-07-28 2016-02-04 삼성전자 주식회사 패킷 손실 은닉방법 및 장치와 이를 적용한 복호화방법 및 장치
EP2980799A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an audio signal using a harmonic post-filter
PT3000110T (pt) 2014-07-28 2017-02-15 Fraunhofer Ges Forschung Seleção de um de entre um primeiro algoritmo de codificação e um segundo algoritmo de codificação com o uso de redução de harmônicos.
EP2980798A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Harmonicity-dependent controlling of a harmonic filter tool
EP2988300A1 (en) 2014-08-18 2016-02-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Switching of sampling rates at audio processing devices
WO2016142002A1 (en) 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
EP3067886A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
US10049684B2 (en) 2015-04-05 2018-08-14 Qualcomm Incorporated Audio bandwidth selection
US9886963B2 (en) 2015-04-05 2018-02-06 Qualcomm Incorporated Encoder selection
JP6422813B2 (ja) 2015-04-13 2018-11-14 日本電信電話株式会社 符号化装置、復号装置、これらの方法及びプログラム
US9978400B2 (en) 2015-06-11 2018-05-22 Zte Corporation Method and apparatus for frame loss concealment in transform domain
US9837089B2 (en) 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
KR20170000933A (ko) 2015-06-25 2017-01-04 한국전기연구원 시간 지연 추정을 이용한 풍력 터빈의 피치 제어 시스템
US9830921B2 (en) 2015-08-17 2017-11-28 Qualcomm Incorporated High-band target signal control
WO2017039422A2 (ko) 2015-09-04 2017-03-09 삼성전자 주식회사 음질 향상을 위한 신호 처리방법 및 장치
US9978381B2 (en) 2016-02-12 2018-05-22 Qualcomm Incorporated Encoding of multiple audio signals
US10219147B2 (en) 2016-04-07 2019-02-26 Mediatek Inc. Enhanced codec control
US10283143B2 (en) 2016-04-08 2019-05-07 Friday Harbor Llc Estimating pitch of harmonic signals
CN107103908B (zh) 2017-05-02 2019-12-24 大连民族大学 复调音乐多音高估计方法及伪双谱在多音高估计中的应用

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012126893A1 (en) * 2011-03-18 2012-09-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Frame element length transmission in audio coding
WO2014165668A1 (en) * 2013-04-03 2014-10-09 Dolby Laboratories Licensing Corporation Methods and systems for generating and interactively rendering object based audio

Also Published As

Publication number Publication date
KR20200081467A (ko) 2020-07-07
CN111566731B (zh) 2023-04-04
AU2018363701B2 (en) 2021-05-13
MX2020004776A (es) 2020-08-13
ZA202002524B (en) 2021-08-25
ES2968821T3 (es) 2024-05-14
AR113481A1 (es) 2020-05-06
KR102460233B1 (ko) 2022-10-28
US11217261B2 (en) 2022-01-04
CN111566731A (zh) 2020-08-21
AU2018363701A1 (en) 2020-05-21
US20200265855A1 (en) 2020-08-20
JP7004474B2 (ja) 2022-01-21
RU2741518C1 (ru) 2021-01-26
EP3483883A1 (en) 2019-05-15
CA3082274C (en) 2023-03-07
JP2021502605A (ja) 2021-01-28
EP3707714C0 (en) 2023-11-29
PL3707714T3 (pl) 2024-05-20
TW201923746A (zh) 2019-06-16
EP3707714B1 (en) 2023-11-29
CA3082274A1 (en) 2019-05-16
EP3707714A1 (en) 2020-09-16
WO2019091980A1 (en) 2019-05-16
SG11202004228VA (en) 2020-06-29
BR112020009184A2 (pt) 2020-11-03

Similar Documents

Publication Publication Date Title
TWI698859B (zh) 編碼及解碼音訊信號之技術
AU2021215252B2 (en) Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
EP3175455B1 (en) Harmonicity-dependent controlling of a harmonic filter tool
KR20130133846A (ko) 정렬된 예견 부를 사용하여 오디오 신호를 인코딩하고 디코딩하기 위한 장치 및 방법
US11380341B2 (en) Selecting pitch lag