TWI576830B - Sound decoding apparatus and method - Google Patents

Sound decoding apparatus and method Download PDF

Info

Publication number
TWI576830B
TWI576830B TW105135127A TW105135127A TWI576830B TW I576830 B TWI576830 B TW I576830B TW 105135127 A TW105135127 A TW 105135127A TW 105135127 A TW105135127 A TW 105135127A TW I576830 B TWI576830 B TW I576830B
Authority
TW
Taiwan
Prior art keywords
frequency band
time envelope
low
envelope
signal
Prior art date
Application number
TW105135127A
Other languages
English (en)
Other versions
TW201706983A (zh
Inventor
Kei Kikuiri
Atsushi Yamaguchi
Original Assignee
Ntt Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ntt Docomo Inc filed Critical Ntt Docomo Inc
Publication of TW201706983A publication Critical patent/TW201706983A/zh
Application granted granted Critical
Publication of TWI576830B publication Critical patent/TWI576830B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Analogue/Digital Conversion (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Electrophonic Musical Instruments (AREA)

Description

聲音解碼裝置及方法
本發明係有關於聲音解碼裝置、聲音編碼裝置、聲音解碼方法、聲音編碼方法、聲音解碼程式、及聲音編碼程式。
利用聽覺心理而摘除人類知覺上所不必要之資訊以將訊號之資料量壓縮成數十分之一的聲音音響編碼技術,是在訊號的傳輸及積存上極為重要的技術。作為被廣泛利用的知覺性音訊編碼技術的例子,可舉例如已被ISO/IEC MPEG(Moving Picture Experts Group)所標準化的MPEG4 AAC(Advanced Audio Coding)等。
又,作為更加提升聲音編碼之性能、以低位元速率獲得高聲音品質的方法,使用聲音的低頻成分來生成高頻成分的頻帶擴充技術,近年來是被廣泛利用。該頻帶擴充技術的代表性例子係為MPEG4 AAC中所利用的SBR(Spectral Band Replication)技術。在此種SBR中,對於藉由QMF(Quadrature Mirror Filter)濾波器組而被轉換成頻率領域的訊號,藉由進行從低頻頻帶往高頻頻帶的 頻譜係數之複寫,以生成高頻成分之後,藉由調整已被複寫之係數的頻譜包絡和調性(tonality),以進行高頻成分的調整。以下,將頻譜包絡與調性的調整,稱作「頻率包絡之調整」。此種利用頻帶擴充技術的聲音編碼方式,係僅使用少量的輔助資訊就能再生出訊號的高頻成分,因此對於聲音編碼的低位元速率化,是有效的。
此處,在以SBR為代表的頻率領域上的頻帶擴充技術中,藉由對於頻率領域中所展現的頻譜係數,進行頻率包絡之調整,將演說訊號或拍手音、響板音這類時間包絡變化較大的聲音訊號進行編碼之際,則在解碼訊號中,有時候會有稱作前回聲或後回聲的殘響狀之雜音被感覺出來。此問題係起因於,在調整處理的過程中,高頻成分的時間包絡會變形,許多情況下會變成比調整前還平坦的形狀所造成。因調整處理而變得平坦的高頻成分的時間包絡,係與編碼前的原訊號中的高頻成分之時間包絡不一致,而成為前回聲‧後回聲之原因。
作為對該問題的解決法,係有如下的方法為人所知(參照下記專利文獻1)。亦即,取得頻率領域訊號的每一時槽的低頻成分之功率,從已取得之功率,抽出時間包絡資訊,將所抽出的時間包絡資訊,以輔助資訊進行調整後,重疊至實施過頻率包絡之調整處理的高頻成分的方法。以下,將上記方法稱作「時間包絡變形手法」。藉此,將解碼訊號的時間包絡調整成失真較少的形狀,確認可以獲得改善了前回聲、後回聲的再生訊號。
〔先前技術文獻〕 〔專利文獻〕
〔專利文獻1〕國際公開2010/114123號公報
此處,上記專利文獻1中所記載之時間包絡變形手法中,是在以已被輸入之多工化位元串流為基礎而獲得之僅含低頻成分的解碼訊號被獲得後,從該解碼訊號獲得QMF領域之訊號。然後,從QMF領域之訊號取得時間包絡資訊,使用參數而將該時間包絡資訊再予調整後,使用調整後的時間包絡資訊,以高頻成分的QMF領域之訊號為對象而實施時間包絡變形處理。
然而,在上記的時間包絡變形手法中,由於是使用從低頻成分的QMF領域之訊號所獲得之時間的函數亦即單一之時間包絡資訊來進行時間包絡變形的處理,因此該當低頻成分的時間包絡與高頻成分的時間包絡的相關性不夠時,時間包絡的波形調整會有困難。其結果為,會有解碼訊號中的前回聲及後回聲未被充分改善之傾向。
於是,本發明係有鑑於所述課題而研發,其目的在提供一種聲音解碼裝置、聲音編碼裝置、聲音解碼方法、聲音編碼方法、聲音解碼程式、及聲音編碼程式,藉由將解碼訊號中的時間包絡調整成失真較少的形狀,而可獲得前回聲及後回聲有被充分改善的再生訊號。
為了解決上記課題,本發明之一側面所述之解碼裝置,係屬於將聲音訊號所編碼而成之編碼序列予以解碼的聲音解碼裝置,具備:解多工化手段,係將編碼序列,解多工化成為低頻頻帶編碼序列與高頻頻帶編碼序列;和低頻頻帶解碼手段,係將已被解多工化手段進行解多工化的低頻頻帶編碼序列加以解碼,以獲得低頻頻帶訊號;和頻率轉換手段,係將已被低頻頻帶解碼手段所得到之低頻頻帶訊號,轉換成頻率領域;和高頻頻帶編碼序列解析手段,係將已被解多工化手段進行解多工化的高頻頻帶編碼序列加以解析,取得已被編碼之高頻頻帶生成用輔助資訊及時間包絡資訊;和編碼序列解碼逆量化手段,係將已被高頻頻帶編碼序列解析手段所取得到的高頻頻帶生成用輔助資訊及時間包絡資訊,進行解碼及逆量化;和高頻頻帶生成手段,係根據已被頻率轉換手段轉換成頻率領域的低頻頻帶訊號,使用已被編碼序列解碼逆量化手段所解碼之高頻頻帶生成用輔助資訊,生成聲音訊號的頻率領域之高頻頻帶成分;和第1~第N(N係2以上之整數)低頻頻帶時間包絡算出手段,係將已被頻率轉換手段轉換成頻率領域的低頻頻帶訊號進行分析,取得複數低頻頻帶之時間包絡;和時間包絡算出手段,係使用已被編碼序列解碼逆量化手段所取得到的時間包絡資訊、及已被低頻頻帶時間包絡算出手段所取得到的複數之低頻頻帶之時間包絡,而 算出高頻頻帶之時間包絡;和時間包絡調整手段,係使用已被時間包絡算出手段所取得之時間包絡,來調整已被高頻頻帶生成手段所生成之高頻頻帶成分的時間包絡;和逆頻率轉換手段,係將已被時間頻率包絡調整手段所調整之高頻頻帶成分,和已被低頻頻帶解碼手段所解碼之低頻頻帶訊號,進行加算,輸出含有全頻帶成分的時間領域訊號。
或者,另一側面所述之解碼裝置,係屬於將聲音訊號所編碼而成之編碼序列予以解碼的聲音解碼裝置,具備:解多工化手段,係將編碼序列,解多工化成為低頻頻帶編碼序列與高頻頻帶編碼序列;和低頻頻帶解碼手段,係將已被解多工化手段進行解多工化的低頻頻帶編碼序列加以解碼,以獲得低頻頻帶訊號;和頻率轉換手段,係將已被低頻頻帶解碼手段所得到之低頻頻帶訊號,轉換成頻率領域;和高頻頻帶編碼序列解析手段,係將已被解多工化手段進行解多工化的高頻頻帶編碼序列加以解析,取得已被編碼之高頻頻帶生成用輔助資訊、頻率包絡資訊、及時間包絡資訊;和編碼序列解碼逆量化手段,係將已被高頻頻帶編碼序列解析手段所取得到的高頻頻帶生成用輔助資訊、頻率包絡資訊、及時間包絡資訊,進行解碼及逆量化;和高頻頻帶生成手段,係根據已被頻率轉換手段轉換成頻率領域的低頻頻帶訊號,使用已被編碼序列解碼逆量化手段所解碼之高頻頻帶生成用輔助資訊,生成聲音訊號的頻率領域之高頻頻帶成分;和第1~第N(N係2以上 之整數)低頻頻帶時間包絡算出手段,係將已被頻率轉換手段轉換成頻率領域的低頻頻帶訊號進行分析,取得複數低頻頻帶之時間包絡;和時間包絡算出手段,係使用已被編碼序列解碼逆量化手段所取得到的時間包絡資訊、及已被低頻頻帶時間包絡算出手段所取得到的複數之低頻頻帶之時間包絡,而算出高頻頻帶之時間包絡;和頻率包絡重疊手段,係將已被編碼序列解碼逆量化手段所取得到的頻率包絡資訊,重疊至高頻頻帶之時間包絡以取得時間頻率包絡;和時間頻率包絡調整手段,係使用已被時間包絡算出手段所取得之時間包絡、及已被頻率包絡重疊手段所取得之時間頻率包絡,來調整已被高頻頻帶生成手段所生成之高頻頻帶成分的時間包絡與頻率包絡;和逆頻率轉換手段,係將已被時間頻率包絡調整手段所調整之高頻頻帶成分,和已被低頻頻帶解碼手段所解碼之低頻頻帶訊號,進行加算,輸出含有全頻帶成分的時間領域訊號。
或者,另一側面所述之解碼裝置,係屬於將聲音訊號所編碼而成之編碼序列予以解碼的聲音解碼裝置,具備:解多工化手段,係將編碼序列,解多工化成為低頻頻帶編碼序列與高頻頻帶編碼序列;和低頻頻帶解碼手段,係將已被解多工化手段進行解多工化的低頻頻帶編碼序列加以解碼,以獲得低頻頻帶訊號;和頻率轉換手段,係將已被低頻頻帶解碼手段所得到之低頻頻帶訊號,轉換成頻率領域;和高頻頻帶編碼序列解析手段,係將已被解多工化手段進行解多工化的高頻頻帶編碼序列加以解析,取得已被 編碼之高頻頻帶生成用輔助資訊、頻率包絡資訊、及時間包絡資訊;和編碼序列解碼逆量化手段,係將已被高頻頻帶編碼序列解析手段所取得到的高頻頻帶生成用輔助資訊、頻率包絡資訊、及時間包絡資訊,進行解碼及逆量化;和高頻頻帶生成手段,係根據已被頻率轉換手段轉換成頻率領域的低頻頻帶訊號,使用已被編碼序列解碼逆量化手段所解碼之高頻頻帶生成用輔助資訊,生成聲音訊號的頻率領域之高頻頻帶成分;和第1~第N(N係2以上之整數)低頻頻帶時間包絡算出手段,係將已被頻率轉換手段轉換成頻率領域的低頻頻帶訊號進行分析,取得複數低頻頻帶之時間包絡;和時間包絡算出手段,係使用已被編碼序列解碼逆量化手段所取得到的時間包絡資訊、及已被低頻頻帶時間包絡算出手段所取得到的複數之低頻頻帶之時間包絡,而算出高頻頻帶之時間包絡;和頻率包絡算出手段,係使用已被編碼序列解碼逆量化手段所取得到的頻率包絡資訊,來算出頻率包絡;和時間頻率包絡調整手段,係使用已被時間包絡算出手段所取得之時間包絡、及已被頻率包絡算出手段所取得之頻率包絡,來調整已被高頻頻帶生成手段所生成之高頻頻帶成分的時間包絡與頻率包絡;和逆頻率轉換手段,係將已被時間頻率包絡調整手段所調整之高頻頻帶成分,和已被低頻頻帶解碼手段所解碼之低頻頻帶訊號,進行加算,輸出含有全頻帶成分的時間領域訊號。
本發明之一側面所述之解碼方法,係屬於將聲音訊號 所編碼而成之編碼序列予以解碼的聲音解碼方法,具備:解多工化步驟,係由解多工化手段,將編碼序列,解多工化成為低頻頻帶編碼序列與高頻頻帶編碼序列;和低頻頻帶解碼步驟,係由低頻頻帶解碼手段,將已被解多工化手段進行解多工化的低頻頻帶編碼序列加以解碼,以獲得低頻頻帶訊號;和頻率轉換步驟,係由頻率轉換手段,將已被低頻頻帶解碼手段所得到之低頻頻帶訊號,轉換成頻率領域;和高頻頻帶編碼序列解析步驟,係由高頻頻帶編碼序列解析手段,將已被解多工化手段進行解多工化的高頻頻帶編碼序列加以解析,取得已被編碼之高頻頻帶生成用輔助資訊及時間包絡資訊;和編碼序列解碼逆量化步驟,係由編碼序列解碼逆量化手段,將已被高頻頻帶編碼序列解析手段所取得到的高頻頻帶生成用輔助資訊及時間包絡資訊,進行解碼及逆量化;和高頻頻帶生成步驟,係由高頻頻帶生成手段,根據已被頻率轉換手段轉換成頻率領域的低頻頻帶訊號,使用已被編碼序列解碼逆量化手段所解碼之高頻頻帶生成用輔助資訊,生成聲音訊號的頻率領域之高頻頻帶成分;和第1~第N低頻頻帶時間包絡算出步驟,係由第1~第N(N係2以上之整數)低頻頻帶時間包絡算出手段,將已被頻率轉換手段轉換成頻率領域的低頻頻帶訊號進行分析,取得複數低頻頻帶之時間包絡;和時間包絡算出步驟,係由時間包絡算出手段,使用已被編碼序列解碼逆量化手段所取得到的時間包絡資訊、及已被低頻頻帶時間包絡算出手段所取得到的複數之低頻頻帶之 時間包絡,而算出高頻頻帶之時間包絡;和時間包絡調整步驟,係由時間包絡調整手段,使用已被時間包絡算出手段所取得之時間包絡,來調整已被高頻頻帶生成手段所生成之高頻頻帶成分的時間包絡;和逆頻率轉換步驟,係由逆頻率轉換手段,將已被時間包絡調整手段所調整之高頻頻帶成分,和已被低頻頻帶解碼手段所解碼之低頻頻帶訊號,進行加算,輸出含有全頻帶成分的時間領域訊號。
或者,本發明之另一側面所述之解碼方法,係屬於將聲音訊號所編碼而成之編碼序列予以解碼的聲音解碼方法,具備:解多工化步驟,係由解多工化手段,將編碼序列,解多工化成為低頻頻帶編碼序列與高頻頻帶編碼序列;和低頻頻帶解碼步驟,係由低頻頻帶解碼手段,將已被解多工化手段進行解多工化的低頻頻帶編碼序列加以解碼,以獲得低頻頻帶訊號;和頻率轉換步驟,係由頻率轉換手段,將已被低頻頻帶解碼手段所得到之低頻頻帶訊號,轉換成頻率領域;和高頻頻帶編碼序列解析步驟,係由高頻頻帶編碼序列解析手段,將已被解多工化手段進行解多工化的高頻頻帶編碼序列加以解析,取得已被編碼之高頻頻帶生成用輔助資訊、頻率包絡資訊、及時間包絡資訊;和編碼序列解碼逆量化步驟,係由編碼序列解碼逆量化手段,將已被高頻頻帶編碼序列解析手段所取得到的高頻頻帶生成用輔助資訊、頻率包絡資訊、及時間包絡資訊,進行解碼及逆量化;和高頻頻帶生成步驟,係由高頻頻帶生成手段,根據已被頻率轉換手段轉換成頻率領域的 低頻頻帶訊號,使用已被編碼序列解碼逆量化手段所解碼之高頻頻帶生成用輔助資訊,生成聲音訊號的頻率領域之高頻頻帶成分;和第1~第N低頻頻帶時間包絡算出步驟,係由第1~第N(N係2以上之整數)低頻頻帶時間包絡算出手段,將已被頻率轉換手段轉換成頻率領域的低頻頻帶訊號進行分析,取得複數低頻頻帶之時間包絡;和時間包絡算出步驟,係由時間包絡算出手段,使用已被編碼序列解碼逆量化手段所取得到的時間包絡資訊、及已被低頻頻帶時間包絡算出手段所取得到的複數之低頻頻帶之時間包絡,而算出高頻頻帶之時間包絡;和頻率包絡重疊步驟,係由頻率包絡重疊手段,將已被編碼序列解碼逆量化手段所取得到的頻率包絡資訊,重疊至高頻頻帶之時間包絡以取得時間頻率包絡;和時間頻率包絡調整步驟,係由時間頻率包絡調整手段,使用已被時間包絡算出手段所取得之時間包絡、及已被頻率包絡重疊手段所取得之時間頻率包絡,來調整已被高頻頻帶生成手段所生成之高頻頻帶成分的時間包絡與頻率包絡;和逆頻率轉換步驟,係由逆頻率轉換手段,將已被時間頻率包絡調整手段所調整之高頻頻帶成分,和已被低頻頻帶解碼手段所解碼之低頻頻帶訊號,進行加算,輸出含有全頻帶成分的時間領域訊號。
或者,本發明之另一側面所述之解碼方法,係屬於將聲音訊號所編碼而成之編碼序列予以解碼的聲音解碼方法,具備:解多工化步驟,係由解多工化手段,將編碼序 列,解多工化成為低頻頻帶編碼序列與高頻頻帶編碼序列;和低頻頻帶解碼步驟,係由低頻頻帶解碼手段,將已被解多工化手段進行解多工化的低頻頻帶編碼序列加以解碼,以獲得低頻頻帶訊號;和頻率轉換步驟,係由頻率轉換手段,將已被低頻頻帶解碼手段所得到之低頻頻帶訊號,轉換成頻率領域;和高頻頻帶編碼序列解析步驟,係由高頻頻帶編碼序列解析手段,將已被解多工化手段進行解多工化的高頻頻帶編碼序列加以解析,取得已被編碼之高頻頻帶生成用輔助資訊、頻率包絡資訊、及時間包絡資訊;和編碼序列解碼逆量化步驟,係由編碼序列解碼逆量化手段,將已被高頻頻帶編碼序列解析手段所取得到的高頻頻帶生成用輔助資訊、頻率包絡資訊、及時間包絡資訊,進行解碼及逆量化;和高頻頻帶生成步驟,係由高頻頻帶生成手段,根據已被頻率轉換手段轉換成頻率領域的低頻頻帶訊號,使用已被編碼序列解碼逆量化手段所解碼之高頻頻帶生成用輔助資訊,生成聲音訊號的頻率領域之高頻頻帶成分;和第1~第N(N係2以上之整數)低頻頻帶時間包絡算出步驟,係由低頻頻帶時間包絡算出手段,將已被頻率轉換手段轉換成頻率領域的低頻頻帶訊號進行分析,取得複數低頻頻帶之時間包絡;和時間包絡算出步驟,係由時間包絡算出手段,使用已被編碼序列解碼逆量化手段所取得到的時間包絡資訊、及已被低頻頻帶時間包絡算出手段所取得到的複數之低頻頻帶之時間包絡,而算出高頻頻帶之時間包絡;和頻率包絡算出步驟,係由 頻率包絡算出手段,使用已被編碼序列解碼逆量化手段所取得到的頻率包絡資訊,來算出頻率包絡;和時間頻率包絡調整步驟,係由時間頻率包絡調整手段,使用已被時間包絡算出手段所取得之時間包絡、及已被頻率包絡算出手段所取得之頻率包絡,來調整已被高頻頻帶生成手段所生成之高頻頻帶成分的時間包絡與頻率包絡;和逆頻率轉換步驟,係由逆頻率轉換手段,將已被時間頻率包絡調整手段所調整之高頻頻帶成分,和已被低頻頻帶解碼手段所解碼之低頻頻帶訊號,進行加算,輸出含有全頻帶成分的時間領域訊號。
本發明之一側面所述之解碼程式,係屬於將聲音訊號所編碼而成之編碼序列予以解碼的聲音解碼程式,使電腦發揮功能成為:解多工化手段,係將編碼序列,解多工化成為低頻頻帶編碼序列與高頻頻帶編碼序列;低頻頻帶解碼手段,係將已被解多工化手段進行解多工化的低頻頻帶編碼序列加以解碼,以獲得低頻頻帶訊號;頻率轉換手段,係將已被低頻頻帶解碼手段所得到之低頻頻帶訊號,轉換成頻率領域;高頻頻帶編碼序列解析手段,係將已被解多工化手段進行解多工化的高頻頻帶編碼序列加以解析,取得已被編碼之高頻頻帶生成用輔助資訊及時間包絡資訊;編碼序列解碼逆量化手段,係將已被高頻頻帶編碼序列解析手段所取得到的高頻頻帶生成用輔助資訊及時間包絡資訊,進行解碼及逆量化;高頻頻帶生成手段,係根據已被頻率轉換手段轉換成頻率領域的低頻頻帶訊號,使 用已被編碼序列解碼逆量化手段所解碼之高頻頻帶生成用輔助資訊,生成聲音訊號的頻率領域之高頻頻帶成分;第1~第N(N係2以上之整數)低頻頻帶時間包絡算出手段,係將已被頻率轉換手段轉換成頻率領域的低頻頻帶訊號進行分析,取得複數低頻頻帶之時間包絡;時間包絡算出手段,係使用已被編碼序列解碼逆量化手段所取得到的時間包絡資訊、及已被低頻頻帶時間包絡算出手段所取得到的複數之低頻頻帶之時間包絡,而算出高頻頻帶之時間包絡;時間包絡調整手段,係使用已被時間包絡算出手段所取得之時間包絡,來調整已被高頻頻帶生成手段所生成之高頻頻帶成分的時間包絡;及逆頻率轉換手段,係將已被時間頻率包絡調整手段所調整之高頻頻帶成分,和已被低頻頻帶解碼手段所解碼之低頻頻帶訊號,進行加算,輸出含有全頻帶成分的時間領域訊號。
或者,本發明之另一側面所述之解碼程式,係屬於將聲音訊號所編碼而成之編碼序列予以解碼的聲音解碼程式,使電腦發揮功能成為:解多工化手段,係將編碼序列,解多工化成為低頻頻帶編碼序列與高頻頻帶編碼序列;低頻頻帶解碼手段,係將已被解多工化手段進行解多工化的低頻頻帶編碼序列加以解碼,以獲得低頻頻帶訊號;頻率轉換手段,係將已被低頻頻帶解碼手段所得到之低頻頻帶訊號,轉換成頻率領域;高頻頻帶編碼序列解析手段,係將已被解多工化手段進行解多工化的高頻頻帶編碼序列加以解析,取得已被編碼之高頻頻帶生成用輔助資 訊、頻率包絡資訊、及時間包絡資訊;編碼序列解碼逆量化手段,係將已被高頻頻帶編碼序列解析手段所取得到的高頻頻帶生成用輔助資訊、頻率包絡資訊、及時間包絡資訊,進行解碼及逆量化;高頻頻帶生成手段,係根據已被頻率轉換手段轉換成頻率領域的低頻頻帶訊號,使用已被編碼序列解碼逆量化手段所解碼之高頻頻帶生成用輔助資訊,生成聲音訊號的頻率領域之高頻頻帶成分;第1~第N(N係2以上之整數)低頻頻帶時間包絡算出手段,係將已被頻率轉換手段轉換成頻率領域的低頻頻帶訊號進行分析,取得複數低頻頻帶之時間包絡;時間包絡算出手段,係使用已被編碼序列解碼逆量化手段所取得到的時間包絡資訊、及已被低頻頻帶時間包絡算出手段所取得到的複數之低頻頻帶之時間包絡,而算出高頻頻帶之時間包絡;頻率包絡重疊手段,係將已被編碼序列解碼逆量化手段所取得到的頻率包絡資訊,重疊至高頻頻帶之時間包絡以取得時間頻率包絡;時間頻率包絡調整手段,係使用已被時間包絡算出手段所取得之時間包絡、及已被頻率包絡重疊手段所取得之時間頻率包絡,來調整已被高頻頻帶生成手段所生成之高頻頻帶成分的時間包絡與頻率包絡;及逆頻率轉換手段,係將已被時間頻率包絡調整手段所調整之高頻頻帶成分,和已被低頻頻帶解碼手段所解碼之低頻頻帶訊號,進行加算,輸出含有全頻帶成分的時間領域訊號。
或者,本發明之另一側面所述之解碼程式,係屬於將 聲音訊號所編碼而成之編碼序列予以解碼的聲音解碼程式,使電腦發揮功能成為:解多工化手段,係將編碼序列,解多工化成為低頻頻帶編碼序列與高頻頻帶編碼序列;低頻頻帶解碼手段,係將已被解多工化手段進行解多工化的低頻頻帶編碼序列加以解碼,以獲得低頻頻帶訊號;頻率轉換手段,係將已被低頻頻帶解碼手段所得到之低頻頻帶訊號,轉換成頻率領域;高頻頻帶編碼序列解析手段,係將已被解多工化手段進行解多工化的高頻頻帶編碼序列加以解析,取得已被編碼之高頻頻帶生成用輔助資訊、頻率包絡資訊、及時間包絡資訊;編碼序列解碼逆量化手段,係將已被高頻頻帶編碼序列解析手段所取得到的高頻頻帶生成用輔助資訊、頻率包絡資訊、及時間包絡資訊,進行解碼及逆量化;高頻頻帶生成手段,係根據已被頻率轉換手段轉換成頻率領域的低頻頻帶訊號,使用已被編碼序列解碼逆量化手段所解碼之高頻頻帶生成用輔助資訊,生成聲音訊號的頻率領域之高頻頻帶成分;第1~第N(N係2以上之整數)低頻頻帶時間包絡算出手段,係將已被頻率轉換手段轉換成頻率領域的低頻頻帶訊號進行分析,取得複數低頻頻帶之時間包絡;時間包絡算出手段,係使用已被編碼序列解碼逆量化手段所取得到的時間包絡資訊、及已被低頻頻帶時間包絡算出手段所取得到的複數之低頻頻帶之時間包絡,而算出高頻頻帶之時間包絡;頻率包絡算出手段,係使用已被編碼序列解碼逆量化手段所取得到的頻率包絡資訊,來算出頻率包絡;時間頻 率包絡調整手段,係使用已被時間包絡算出手段所取得之時間包絡、及已被頻率包絡算出手段所取得之頻率包絡,來調整已被高頻頻帶生成手段所生成之高頻頻帶成分的時間包絡與頻率包絡;及逆頻率轉換手段,係將已被時間頻率包絡調整手段所調整之高頻頻帶成分,和已被低頻頻帶解碼手段所解碼之低頻頻帶訊號,進行加算,輸出含有全頻帶成分的時間領域訊號。
若依據此種解碼裝置、解碼方法、或解碼程式,則可從編碼序列進行解多工化及解碼而獲得低頻頻帶訊號,可從編碼序列進行解多工化、解碼、及逆量化而獲得高頻頻帶生成用輔助資訊及時間包絡資訊。然後,從使用高頻頻帶生成用輔助資訊而已被轉換成頻率領域之低頻頻帶訊號,生成出頻率領域的高頻頻帶成分,另一方面,分析頻率領域之低頻頻帶訊號而取得了複數低頻頻帶之時間包絡後,使用該複數低頻頻帶之時間包絡、和時間包絡資訊,來算出高頻頻帶之時間包絡。然後,藉由已被算出之高頻頻帶之時間包絡來調整高頻頻帶成分的時間包絡,將已被調整之高頻頻帶成分與低頻頻帶訊號進行加算而輸出時間領域訊號。如此,高頻頻帶成分的時間包絡的調整時會使用複數低頻頻帶之時間包絡,因此可利用低頻頻帶成分的時間包絡與高頻頻帶成分的時間包絡的相關而高精度地調整高頻頻帶成分的時間包絡的波形。其結果為,解碼訊號中的時間包絡是被調整成失真較少的形狀,可獲得充分改善前回聲及後回聲的再生訊號。
此處,還具備:時間包絡算出控制手段,係使用已被頻率轉換手段轉換成頻率領域的低頻頻帶訊號,來控制第1~第N低頻頻帶時間包絡算出手段中的低頻頻帶之時間包絡之算出、及時間包絡算出手段中的高頻頻帶之時間包絡之算出的其中至少1者,較為理想。若具備所述之時間包絡算出控制手段,則可隨著低頻頻帶訊號的功率等性質而省略低頻頻帶之時間包絡的算出、或高頻頻帶之時間包絡的算出之處理,可削減演算量。
又,還具備:時間包絡算出控制手段,係使用已被編碼序列解碼逆量化手段所取得的時間包絡資訊,來控制第1~第N低頻頻帶時間包絡算出手段中的低頻頻帶之時間包絡之算出、及時間包絡算出手段中的高頻頻帶之時間包絡之算出的其中至少1者,也很理想。若具備所述之時間包絡算出控制手段,則可隨著從編碼序列所得到之時間包絡資訊而省略低頻頻帶之時間包絡的算出、或高頻頻帶之時間包絡的算出之處理,可削減演算量。
甚至,高頻頻帶編碼序列解析手段,係更進一步取得時間包絡算出控制資訊;還具備:時間包絡算出控制手段,係使用已被高頻頻帶編碼序列解析手段所取得的時間包絡算出控制資訊,來控制第1~第N低頻頻帶時間包絡算出手段中的低頻頻帶之時間包絡之算出、及時間包絡算出手段中的高頻頻帶之時間包絡之算出的其中至少1者,也很理想。若採用所述構成,則可隨著從編碼序列所得到之時間包絡算出控制資訊而省略低頻頻帶之時間包絡的算 出、或高頻頻帶之時間包絡的算出之處理,可削減演算量。
又甚至,高頻頻帶編碼序列解析手段,係更進一步取得時間包絡算出控制資訊;編碼序列解碼/逆量化手段,係更進一步取得第2頻率包絡資訊;還具備:時間包絡算出控制手段,係根據時間包絡算出控制資訊,判斷是否將高頻頻帶成分的頻率包絡基於第2頻率包絡資訊來進行調整,若判斷為要調整該當頻率包絡時,則控制成不進行第1~第N低頻頻帶時間包絡算出手段中的低頻頻帶之時間包絡之算出、及時間包絡算出手段中的高頻頻帶之時間包絡之算出,也很理想。此時也是,可隨著從編碼序列所得到之時間包絡算出控制資訊而省略低頻頻帶之時間包絡的算出、或高頻頻帶之時間包絡的算出之處理,可削減演算量。
又甚至,時間頻率包絡調整手段,係將已被高頻頻帶生成手段所生成的聲音訊號之高頻頻帶成分,基於所定的函數而加以處理,也很理想。又,低頻頻帶時間包絡算出手段,係將已取得之複數低頻頻帶的時間包絡,基於所定的函數而加以處理,也很理想。
又,本發明之一側面所述之編碼裝置,係屬於將聲音訊號予以編碼的聲音編碼裝置,具備:頻率轉換手段,係將聲音訊號,轉換成頻率領域;和降頻取樣手段,係將聲音訊號予以降頻取樣以取得低頻頻帶訊號;和低頻頻帶編碼手段,係將降頻取樣手段所取得的低頻頻帶訊號予以編 碼;和第1~第N(N係2以上之整數)低頻頻帶時間包絡算出手段,係將已被頻率轉換手段轉換成頻率領域的聲音訊號的低頻頻帶成分的時間包絡予以複數算出;和時間包絡資訊算出手段,係使用已被第1~第N低頻頻帶時間包絡算出手段所算出的低頻頻帶成分的時間包絡,而算出為了取得已被頻率轉換手段所轉換之聲音訊號高頻頻帶成分的時間包絡所必須的時間包絡資訊;和輔助資訊算出手段,係分析聲音訊號而算出為了從低頻頻帶訊號生成高頻頻帶成分時所使用的高頻頻帶生成用輔助資訊;和量化編碼手段,係將已被輔助資訊算出手段所生成的高頻頻帶生成用輔助資訊、及已被時間包絡資訊算出手段所算出的時間包絡資訊,進行量化及編碼;和編碼序列構成手段,係將已被量化編碼手段所量化及編碼過的高頻頻帶生成用輔助資訊及時間包絡資訊,構成為高頻頻帶編碼序列;和多工化手段,係生成由已被低頻頻帶編碼手段所取得之低頻頻帶編碼序列、和已被編碼序列構成手段所構成之高頻頻帶編碼序列所多工化而成的編碼序列。
本發明之一側面所述之編碼方法,係屬於將聲音訊號予以編碼的聲音編碼方法,具備:頻率轉換步驟,係由頻率轉換手段,將聲音訊號,轉換成頻率領域;和降頻取樣步驟,係由降頻取樣手段,將聲音訊號予以降頻取樣以取得低頻頻帶訊號;和低頻頻帶編碼步驟,係由低頻頻帶編碼手段,將降頻取樣手段所取得的低頻頻帶訊號予以編碼;和第1~第N低頻頻帶時間包絡算出步驟,係由第1 ~第N(N係2以上之整數)低頻頻帶時間包絡算出手段,將已被頻率轉換手段轉換成頻率領域的聲音訊號的低頻頻帶成分的時間包絡,予以複數算出;和時間包絡資訊算出步驟,係由時間包絡資訊算出手段,使用已被第1~第N低頻頻帶時間包絡算出手段所算出的低頻頻帶成分的時間包絡,而算出為了取得已被頻率轉換手段所轉換之聲音訊號高頻頻帶成分的時間包絡所必須的時間包絡資訊;和輔助資訊算出步驟,係由輔助資訊算出手段,分析聲音訊號而算出為了從低頻頻帶訊號生成高頻頻帶成分時所使用的高頻頻帶生成用輔助資訊;和量化編碼步驟,係由量化編碼手段,將已被輔助資訊算出手段所生成的高頻頻帶生成用輔助資訊、及已被時間包絡資訊算出手段所算出的時間包絡資訊,進行量化及編碼;和編碼序列構成步驟,係由編碼序列構成手段,將已被量化編碼手段所量化及編碼過的高頻頻帶生成用輔助資訊及時間包絡資訊,構成為高頻頻帶編碼序列;和多工化步驟,係由多工化手段,生成由已被低頻頻帶編碼手段所取得之低頻頻帶編碼序列、和已被編碼序列構成手段所構成之高頻頻帶編碼序列所多工化而成的編碼序列。
本發明之一側面所述之編碼程式,係屬於將聲音訊號予以編碼的聲音編碼程式,使電腦發揮功能成為:頻率轉換手段,係將聲音訊號,轉換成頻率領域;降頻取樣手段,係將聲音訊號予以降頻取樣以取得低頻頻帶訊號;低頻頻帶編碼手段,係將降頻取樣手段所取得的低頻頻帶訊 號予以編碼;第1~第N(N係2以上之整數)低頻頻帶時間包絡算出手段,係將已被頻率轉換手段轉換成頻率領域的聲音訊號的低頻頻帶成分的時間包絡予以複數算出;時間包絡資訊算出手段,係使用已被第1~第N低頻頻帶時間包絡算出手段所算出的低頻頻帶成分的時間包絡,而算出為了取得已被頻率轉換手段所轉換之聲音訊號高頻頻帶成分的時間包絡所必須的時間包絡資訊;輔助資訊算出手段,係分析聲音訊號而算出為了從低頻頻帶訊號生成高頻頻帶成分時所使用的高頻頻帶生成用輔助資訊;量化編碼手段,係將已被輔助資訊算出手段所生成的高頻頻帶生成用輔助資訊、及已被時間包絡資訊算出手段所算出的時間包絡資訊,進行量化及編碼;編碼序列構成手段,係將已被量化編碼手段所量化及編碼過的高頻頻帶生成用輔助資訊及時間包絡資訊,構成為高頻頻帶編碼序列;及多工化手段,係生成由已被低頻頻帶編碼手段所取得之低頻頻帶編碼序列、和已被編碼序列構成手段所構成之高頻頻帶編碼序列所多工化而成的編碼序列。
若依據此種編碼裝置、編碼方法、或編碼程式,則聲音訊號會被降頻取樣而獲得低頻頻帶訊號,該低頻頻帶訊號係被編碼,而另一方面,根據頻率領域之聲音訊號而複數算出低頻頻帶成分的時間包絡,使用該複數低頻頻帶成分的時間包絡來算出用來取得高頻頻帶成分的時間包絡所需的時間包絡資訊。然後,算出用來從低頻頻帶訊號生成高頻頻帶成分所需的高頻頻帶生成用輔助資訊,將高頻頻 帶生成用輔助資訊與時間包絡資訊進行量化及編碼後,構成含有高頻頻帶生成用輔助資訊與時間包絡資訊的高頻頻帶編碼序列。然後,生成由低頻頻帶編碼序列及高頻頻帶編碼序列所多工化而成的編碼序列。藉此,在編碼序列被輸入至解碼裝置之際,在解碼裝置側上,高頻頻帶成分的時間包絡的調整時可以使用複數低頻頻帶之時間包絡,在解碼裝置側上可利用低頻頻帶成分的時間包絡與高頻頻帶成分的時間包絡的相關而高精度地調整高頻頻帶成分的時間包絡的波形。其結果為,解碼訊號中的時間包絡是被調整成失真較少的形狀,在解碼裝置側上可獲得充分改善前回聲及後回聲的再生訊號。
此處,還具備:頻率包絡算出手段,係算出已被頻率轉換手段轉換成頻率領域的聲音訊號的高頻頻帶成分的頻率包絡資訊;量化編碼手段,係更進一步將頻率包絡資訊予以量化及編碼;編碼序列構成手段,係再加上已被量化編碼手段所量化及編碼過的頻率包絡資訊而構成高頻頻帶編碼序列,較為理想。若採用所述構成,則在解碼裝置側上,高頻頻帶成分的頻率包絡之調整亦成為可能,因此在解碼裝置側上可獲得改善了頻率特性的再生訊號。
又,還具備:控制資訊生成手段,係使用已被頻率轉換手段轉換成頻率領域的聲音訊號、和已被時間包絡資訊算出手段所算出的時間包絡資訊的其中至少1者,來生成用來控制聲音解碼裝置中的時間包絡算出所需的時間包絡算出控制資訊;編碼序列構成手段,係再加上已被控制資 訊生成手段所生成的時間包絡算出控制資訊,而構成高頻頻帶編碼序列,也很理想。此情況下,可參照聲音訊號之功率等性質或時間包絡資訊,使解碼裝置側上的時間包絡之算出處理更有效率,可削減演算量。
又甚至,時間包絡資訊算出手段,係算出已被頻率轉換手段轉換成頻率領域的聲音訊號的高頻頻帶成分的時間包絡,基於從第1~第N低頻頻帶成分的時間包絡所算出的時間包絡、與上記頻帶成分的時間包絡的相關,而算出時間包絡資訊,也很理想。
若依據本發明,則藉由將解碼訊號中的時間包絡調整成失真較少的形狀,可獲得充分改善前回聲及後回聲的再生訊號。
1f1~1fn‧‧‧低頻頻帶時間包絡算出部
2e1~2en‧‧‧低頻頻帶時間包絡算出部
1、102、201、301‧‧‧聲音解碼裝置
1a‧‧‧解多工化部
1b‧‧‧低頻頻帶解碼部
1c‧‧‧頻帶分割濾波器組部
1d‧‧‧編碼序列解析部
1e‧‧‧逆量化部
1g‧‧‧時間包絡算出部
1h‧‧‧高頻頻帶生成部
1i‧‧‧時間包絡調整部
1j‧‧‧頻帶合成濾波器組部
1k、1m、1n、1o‧‧‧時間包絡算出控制部
1p、1v‧‧‧時間/頻率包絡調整部
1q‧‧‧頻率包絡重疊部
1r‧‧‧編碼序列解碼/逆量化部
1s‧‧‧時間包絡算出控制部
1t‧‧‧包絡調整部
1u‧‧‧頻率包絡重疊部
1w‧‧‧頻率包絡算出部
2、102、202、302‧‧‧聲音編碼裝置
2a‧‧‧降頻取樣部
2b‧‧‧低頻頻帶編碼部
2c‧‧‧頻帶分割濾波器組部
2d‧‧‧高頻頻帶生成用輔助資訊算出部
2e1~2ek‧‧‧低頻頻帶時間包絡算出部
2f‧‧‧時間包絡資訊算出部
2g‧‧‧量化/編碼部
2h‧‧‧高頻頻帶編碼序列構成部
2i‧‧‧多工化部
2j‧‧‧時間包絡算出控制資訊生成部
2k‧‧‧低頻頻帶解碼部
2m‧‧‧頻帶合成濾波器組部
2n、2o、2p‧‧‧頻率包絡資訊算出部
〔圖1〕本發明之第1實施形態所述之聲音解碼裝置1的概略構成圖。
〔圖2〕藉由圖1的聲音解碼裝置1而被實現的聲音解碼方法之程序的流程圖。
〔圖3〕本發明之第1實施形態所述之聲音編碼裝置2的概略構成圖。
〔圖4〕藉由圖3的聲音編碼裝置2而被實現的聲音編碼方法之程序的流程圖。
〔圖5〕第1實施形態所述之聲音解碼裝置1的第1變形例中的關於包絡算出之重點構成的圖示。
〔圖6〕圖5的聲音解碼裝置1所進行的包絡算出之程序的流程圖。
〔圖7〕第1實施形態所述之聲音解碼裝置1的第2變形例中的關於包絡算出之重點構成的圖示。
〔圖8〕圖7的聲音解碼裝置1所進行的包絡算出之程序的流程圖。
〔圖9〕第1實施形態所述之聲音解碼裝置1的第3變形例中的關於包絡算出之重點構成的圖示。
〔圖10〕圖9的聲音解碼裝置1所進行的包絡算出之程序的流程圖。
〔圖11〕第1實施形態所述之聲音解碼裝置1的第4變形例所進行的包絡算出之程序的流程圖。
〔圖12〕第1實施形態所述之聲音解碼裝置1的第5變形例所進行的包絡算出之程序的流程圖。
〔圖13〕第1實施形態所述之聲音解碼裝置1的第6變形例中的關於包絡算出之重點構成的圖示。
〔圖14〕第1實施形態所述之聲音解碼裝置1的第7變形例中的時間包絡算出部1g的時間包絡算出之程序的流程圖。
〔圖15〕第1實施形態所述之聲音解碼裝置1的第2變形例中,將第1實施形態所述之聲音解碼裝置1的第7變形例予以適用之際,時間包絡算出控制部1m之處理之 一部分的流程圖。
〔圖16〕第1實施形態所述之聲音解碼裝置1的第4變形例中,將第1實施形態所述之聲音解碼裝置1的第7變形例予以適用之際,時間包絡算出控制部1n之處理之一部分的流程圖。
〔圖17〕第1實施形態所述之聲音編碼裝置2的第1變形例之構成的圖示。
〔圖18〕圖17的聲音編碼裝置2所進行之聲音編碼之程序的流程圖。
〔圖19〕第1實施形態所述之聲音編碼裝置2的第2變形例之構成的圖示。
〔圖20〕圖19的聲音編碼裝置2所進行之聲音編碼之程序的流程圖。
〔圖21〕第1實施形態所述之聲音編碼裝置2的第3變形例之構成的圖示。
〔圖22〕圖21的聲音編碼裝置2所進行之聲音編碼之程序的流程圖。
〔圖23〕第2實施形態所述之聲音解碼裝置101之構成的圖示。
〔圖24〕圖23的聲音解碼裝置101所進行之聲音解碼之程序的流程圖。
〔圖25〕第2實施形態所述之聲音編碼裝置102之構成的圖示。
〔圖26〕圖25的聲音編碼裝置102所進行之聲音編 碼之程序的流程圖。
〔圖27〕將本發明的第1實施形態所述之聲音編碼裝置2的第1變形例,適用於本發明的第2實施形態所述之聲音編碼裝置102之際的構成的圖示。
〔圖28〕圖27的聲音編碼裝置102所進行之聲音編碼之程序的流程圖。
〔圖29〕將本發明的第1實施形態所述之聲音編碼裝置2的第2變形例,適用於本發明的第2實施形態所述之聲音編碼裝置102之際的構成的圖示。
〔圖30〕圖29的聲音編碼裝置102所進行之聲音編碼之程序的流程圖。
〔圖31〕第3實施形態所述之聲音解碼裝置201之構成的圖示。
〔圖32〕圖31的聲音解碼裝置201所進行之聲音解碼之程序的流程圖。
〔圖33〕第4實施形態所述之聲音解碼裝置301之構成的圖示。
〔圖34〕圖33的聲音解碼裝置301所進行之聲音解碼之程序的流程圖。
〔圖35〕第3實施形態所述之聲音編碼裝置202之構成的圖示。
〔圖36〕圖35的聲音編碼裝置202所進行之聲音編碼之程序的流程圖。
〔圖37〕第4實施形態所述之聲音編碼裝置302之 構成的圖示。
〔圖38〕圖37的聲音編碼裝置302所進行之聲音編碼之程序的流程圖。
〔圖39〕第2實施形態所述之聲音解碼裝置101的第3變化例之構成的圖示。
〔圖40〕圖39的聲音解碼裝置101所進行之聲音解碼之程序的流程圖。
以下,根據圖面來詳細說明本發明所述之聲音解碼裝置、聲音編碼裝置、聲音解碼方法、聲音編碼方法、聲音解碼程式、及聲音編碼程式的理想實施形態。此外,於圖面的說明中,對同一要素係標示同一符號,並省略重複說明。
〔第1實施形態〕
圖1係本發明的第1實施形態所述之聲音解碼裝置1之構成的圖示,圖2係藉由聲音解碼裝置1而被實現的聲音解碼方法之程序的流程圖。聲音解碼裝置1,係實體上具備未圖示的CPU、ROM、RAM及通訊裝置等,該CPU,係將ROM等之聲音解碼裝置1的內藏記憶體中所儲存的所定之電腦程式(例如圖2的流程圖所示之處理執行所需的電腦程式)載入至RAM中並執行,藉此以統籌控制聲音解碼裝置1。聲音解碼裝置1的通訊裝置,係將 從後述的聲音編碼裝置2所輸出之已被多工化的編碼序列,加以接收,然後將已解碼之聲音訊號,輸出至外部。
聲音解碼裝置1,係如圖1所示,在功能上是具備:解多工化部(解多工化手段)1a、低頻頻帶解碼部(低頻頻帶解碼手段)1b、頻帶分割濾波器組部(頻率轉換手段)1c、編碼序列解析部(高頻頻帶編碼序列解析手段)1d、編碼序列解碼/逆量化部(編碼序列解碼逆量化手段)1e、第1~第n(n係2以上之整數)低頻頻帶時間包絡算出部(低頻頻帶時間包絡算出手段)1f1~1fn、時間包絡算出部(時間包絡算出手段)1g、高頻頻帶生成部(高頻頻帶生成手段)1h、時間包絡調整部(時間包絡調整手段)1i、及頻帶合成濾波器組部(逆頻率轉換手段)1j(1c~1e、及1h~1i係亦稱作頻帶擴充部(頻帶擴充手段))。圖1所示的聲音解碼裝置1之各機能部,係藉由聲音解碼裝置1的CPU去執行聲音解碼裝置1的內藏記憶體中所儲存的電腦程式,所實現的功能。聲音解碼裝置1的CPU,係藉由執行該電腦程式(使用圖1的各機能部),而依序執行圖2的流程圖中所示的處理(步驟S01~步驟S10之處理)。該電腦程式之執行上所被須的各種資料、及該電腦程式之執行所產生的各種資料,係全部都被保存在聲音解碼裝置1的ROM或RAM等之內藏記憶體中。
以下詳細說明聲音解碼裝置1的各機能部之機能。
解多工化部1a係將透過聲音解碼裝置1之通訊裝置 而被輸入的已被多工化之編碼序列,解多工化成為低頻頻帶編碼序列與高頻頻帶編碼序列而予以分離。
低頻頻帶解碼部1b,係將從解多工化部1a所給予之低頻頻帶編碼序列予以解碼,獲得只含低頻頻帶成分的解碼訊號。此時,解碼的方式係可為基於以CELP(Code-Excited Linear Prediction)方式為代表的聲音編碼方式,或亦可為基於以AAC(Advanced Audio Coding)或TCX(Transform Coded Excitation)方式等之音響編碼。又,亦可基於PCM(Pulse Code Modulation)編碼方式。又,亦可基於切換這些編碼方式而進行編碼的方式來為之。於本實施形態,編碼方式係沒有限定。
頻帶分割濾波器組部1c,係將從低頻頻帶解碼部1b所給予的只含低頻頻帶成分的解碼訊號加以分析,將該解碼訊號轉換成頻率領域之訊號。以後,將由上記頻帶分割濾波器組部1c所取得之低頻頻帶所對應之頻率領域之訊號,表示成Xdec(j,i){0≦j<kx、t(s)≦i<t(s+1)、0≦s<sE}。此處,j係為頻率方向的索引,i係為時間方向的索引,kx係為非負整數。又,t係被定義成,使得針對上記訊號Xdec(j,i)的索引i的範圍t(s)≦i<t(s+1),會對應於第s(0≦s<sE)個訊框。又,sE係為所有訊框之數目。上記訊框係對應於,例如,依照低頻頻帶解碼部1b之解碼方式的編碼方式所規定的訊框。又,上記訊框係亦可對應於“ISO/IEC 14496-3”中所規定之“MPEG4 AAC”裡所被利用的SBR中的所謂SBR訊框 (SBR frame)、或是SBR包絡時間區段(SBR envelope time segment)。此外,本實施形態中,上記訊框所規定的時間間隔,係不限定於上記的例子。上記索引i係亦可對應於“ISO/IEC 14496-3”中所規定之“MPEG4 AAC”裡所被利用的SBR中的所謂QMF子頻帶次樣本(QMF subband subsample)、或將其整合之時槽(time slot)。
編碼序列解析部1d,係將從解多工化部1a所給予之高頻頻帶編碼序列加以解析,取得已被編碼之高頻頻帶生成用輔助資訊、和已被編碼之時間/頻率包絡資訊。
編碼序列解碼/逆量化部1e,係將從編碼序列解析部1d所給予之已被編碼的高頻頻帶生成用輔助資訊加以解碼、逆量化,獲得高頻頻帶生成用輔助資訊,並且將從編碼序列解析部1d所給予之已被編碼的時間包絡資訊加以解碼、逆量化,取得時間包絡資訊。
第1~第n低頻頻帶時間包絡算出部1f1~1fn,係分別算出不同的時間包絡。亦即,第k低頻頻帶時間包絡算出部1fk(1≦k≦n),係從頻帶分割濾波器組部1c,收取低頻頻帶之訊號X(j,i){0≦j<kx、t(s)≦i<t(s+1)、0≦s<sE},算出低頻頻帶的第k個時間包絡Ldec(k,i)。(步驟Sb6之處理)。具體而言,第k低頻頻帶時間包絡算出部1fk,係將時間包絡Ldec(k,i)算出如下。
首先,低頻頻帶內的不同副頻帶,可用滿足下記條件的二個整數k1、kh來指定。
滿足上記條件的可能之整數組(k1、kh),全部係有nmax=kx(kx+1)/2個。若選擇這些整數組之內的任意一者,則可指定上記副頻帶。
接著,從上記nmax個整數組中,選擇n個,藉此而指定n個副頻帶。以下,為了表示這些n個頻帶,將這二個大小n的陣列B1與Bh,定義成使得訊號Xdec(j,i){B1(k)≦j≦Bh(k)、t(s)≦i<t(s+1)、0≦s<sE},對應於第k(1≦k≦n)個副頻帶成分。
然後,將上記n個副頻帶成分之功率的時間包絡,以下式取得之。
然後,以上記EL(k,i)為對象,計算下式。
接著,對該量L0(k,i)實施所定的處理以取得時間包絡L(k,i)。例如,亦可使用下式,將該量L0(k,i)在時間方向上進行平滑化,以取得時間包絡L(k,i)。
在上記式中,sc(j)、0≦j≦d係為平滑化係數,d係為平滑化的次數。sc(j)係藉由例如下式:
而被設定,但本實施形態中sc(j)之值係不限定於上式。
又,上記L0(k,i)係亦可例如藉由下式來計算。
甚至,上記L0(k.i)係亦可例如藉由下式來計算。
其中,ε係為用來避免除數為零用的緩和係數。又甚至,上記L0(k.i)係亦可例如藉由下式來計算。
然後,第k低頻頻帶時間包絡算出部1fk所算出的時 間包絡Ldec(k,i),係可使用例如下式:
或下式:
其中,上記Ldec(k,i)係只要是表示第k個上記副頻帶之訊號的訊號功率或訊號振幅之時間變動的參數即可,並不限定於上記的L0(k,i)及L1(k,i)之形態。
又,上記Ldec(k,i)係亦可如下述般地使用主成分分析的方法來算出。
首先,上述的Ldec(k,i){1≦k≦n、t(s)≦i≦t(s+1)、0≦s<sE}的算出過程中,藉由把上記n置換成別的整數m=n-1,以將上記Ldec(k,i)所對應的量,針對索引k決定m種類,改變這些量,而可表示成L2(k,i){1≦k≦m(=n-1)、t(s)≦i<t(s+1)、0≦s<sE}。然後,將第s(0≦s<sE)個訊框所對應之上記L2 (l,i){1≦l≦m、t(s)≦i<t(s+1)},視為次方D=t(s+1)-t(s)之向量的m個所集合而成的樣本,則這些樣本的平均是可藉由下式:
而求出。使用上記平均,將位移向量以下式定義之。
根據這些位移向量,將尺寸D×D的變異數共變異數矩陣Cov,以下式加以算出。
接著,算出滿足下式:
的彼此正交之;矩陣Cov的固有向量V(k)。此處,上記V(k) i係為固有向量V(k)的成分,λ(k)係為V(k)所對應之矩陣Cov的固有值。此處,上記向量V(k)之各者,係亦可被正規化。只不過,正規化的方法在本發明中係沒有限定。以下,為了簡化論述,令λ(1)≧λ(2)≧...≧λ(D)
使用以上取得的固有向量,低頻頻帶時間包絡算出部1fk(其中,1≦k≦n)係將時間包絡Ldec(k,i)算出如下。亦即,若D≧m(=n-1),則從上記固有向量之中,按照對應之固有值的大小順序而選擇出n-1個,以下式加以算出。
反之,若D<m(=n-1),則使用上記固有向量,以下式加以算出。
此處,α係為定數,例如亦可設α=0。又,同樣是D<m(=n-1)的情況下,亦可用下式來算出。
又,上記Ldec(k,i)係亦可用如下的方法來算出。首先,於上記L2(l,i)的算出過程中,令m=n,算出L2(l,i)、1≦l≦m、t(s)≦i<t(s+1)、0≦s<sE。這些係可視為,維度D=t(s+1)-t(s)之向量的n個所 集結成之集合。使用上記n個向量,以格拉姆-施密特的正交化方法等方法,算出n個正交向量,令它們為Ldec(k,i)、1≦l≦n、t(s)≦i<t(s+1)、0≦s<sE。只不過,正交化的方法係不限定於上記例子。又亦可為,正交向量係不一定要被正規化。
時間包絡算出部1g,係使用從第1~第n低頻頻帶時間包絡算出部1f1~1fn所給予的n個低頻頻帶之時間包絡、與從編碼序列解碼/逆量化部1e所給予的時間包絡資訊,來算出高頻頻帶之時間包絡。詳言之,時間包絡算出部1g所進行之時間包絡之算出,係進行如下。
首先,將高頻頻帶分割成nH(nH≧1個副頻帶,將這些副頻帶表示成B(T) 1(1=1,2,3,...,nH)。接著,使用上記時間包絡Ldec(k,i),算出高頻頻帶的副頻帶B(T) 1的時間包絡gdec(l,i)。i係時間方向的索引。
例如,上記gdec(l,i)係由下式給定。
此處,上記式中所示的值: ,係從編碼序列解碼/逆量化部1e所給予的時間包絡資訊。
又,從編碼序列解碼/逆量化部1e所給予的時間包絡資訊,係亦可為含有使得係數Al,k(s)變成
之係數,此時,上記gdec(l,i)係亦可藉由下式:
來給定。
然後,從編碼序列解碼/逆量化部1e所給予的時間包絡資訊,係除了上記係數Al,k(s){1≦l≦nH、1≦k≦n、0≦s<sE}、或上記係數Al,k(s){1≦l≦nH、0≦k≦n、0≦s<sE}以外,還可含有下式:
所給予之係數,此時,上記gdec(l,i)係亦可藉由下式:
或下式:
來給定。此處,U(k,i){1≦k≦g、t(s)≦i<t(s+1)、0≦s<sE}係為所定之係數、或所定之函數。例如,上記U(k,i)係亦可為由下式給定的函數。
此處,Ω係為所定之係數。
此處,上記gdec(1、i)係只要能以Ldec(k,i)來表現則亦可容許其他的形態,時間包絡資訊的形態也不限定於係數Al,k(s)的形態。
最後,時間包絡算出部1g係使用上記gdec(l,i),藉由下式:
或下式:
而算出時間包絡。
高頻頻帶生成部1h,係將頻帶分割濾波器組部1c所給予的低頻頻帶之訊號Xdec(j,i){0≦j<kx、t(s)≦i<t(s+1)、0≦s<sE},使用從編碼序列解碼/逆量化部1e所給予的高頻頻帶生成用輔助資訊而對高頻頻帶進行複寫,以生成高頻頻帶之訊號Xdec(j,i){kx≦j≦kmax、t(s)≦i<t(s+1)、0≦s<sE}。上記高頻頻帶之生成,係依照“ISO/IEC 14496-3”中所規定的 “MPEG4 AAC”的SBR中的HF世代(HF generation)之方法來進行(“ISO/IEC 14496-3 subpart 4 General Audio Coding”)。
時間包絡調整部1i,係將從高頻頻帶生成部1h所給予的高頻頻帶訊號XH(j,i){kx≦j≦kmax、t(s)≦i<t(s+1)、0≦s<sE}的時間包絡,使用從時間包絡算出部1g所給予的時間包絡ET(l,i){1≦l≦nH、t(s)≦i<t(s+1)、0≦s<sE}來加以調整。
亦即上記時間包絡之調節,係如下記般地,藉由與“MPEG4 AAC”的SBR中的HF調整(HF adjustment)類似的手段來進行。但是,為了簡便起見,在下記中係展示僅考慮HF調整中的雜訊添加(Noise addition)的方法,其他的增益限制器(Gain limiter)、增益平滑器(Gain smother)、正弦波添加(Sinusoid addition)等之對應處理係省略。但是,包含上述省略之處理而使處理一般化,是較為容易。此外,假設進行雜訊添加對應處理所必須的雜訊基準比例因子、或上記省略之處理進行之際所必須之參數,係已經藉由編碼序列解碼/逆量化部1e而被給定。
首先,為了簡化以下的論述,將表示副頻帶B(T) 1(1≦l≦nH)之交界的以nH+1個之索引為要素的陣列FH,定義成使得訊號XH(j,i){FH(1)≦j<FH(1+1)、t(s)≦i<t(s+1)、0≦s<sE}會對應於副頻帶B(T) 1之成分。其中,FH(1)=kx、FH(nH+1)=kmax+1。
根據上記定義,時間包絡係可藉由下式進行轉換。
其後,將已被編碼序列解碼/逆量化部1e所給定的雜訊基準比例因子Q(m,i),以下式進行轉換。
其中,M=F(nH+1)-F(1)。又,以下式算出增益。
此處,定義由下式所表示的量。
最後,時間包絡調整部1i係藉由下式,獲得已經做了時間包絡調節的訊號。
此處,V0、V1係用來規定雜訊成分的陣列,f係用來將索引i投影至上述陣列上之索引所用的函數(具體例子請參照“ISO/IEC 14496-3 4.B.18”。)。
頻帶合成濾波器組部1j,係將從時間包絡調整部1i所給予的高頻帶訊號Y(i,j){kx≦j≦kmax、t(s)≦i<t(s+1)、0≦s<sE}、和從頻帶分割濾波器組部1c所給予的低頻帶訊號X(j,i){0≦j<kx、t(s)≦i<t(s+ 1)、0≦s<sE}進行加算後,進行頻帶合成,藉此而取得含有全頻帶成分的時間領域之解碼聲音訊號,將已取得之聲音訊號透過內建的通訊裝置而輸出至外部。
以下,參照圖2,說明聲音解碼裝置1之動作,同時詳述聲音解碼裝置1中的聲音解碼方法。
首先,藉由解多工化部1a,從所被輸入的編碼序列中,分離出低頻頻帶編碼序列與高頻頻帶編碼序列(步驟S01)。接著,藉由低頻頻帶解碼部1b,低頻頻帶編碼序列係被解碼,獲得僅含低頻頻帶成分的解碼訊號(步驟S02)。其後,藉由頻帶分割濾波器組部1c,僅含低頻頻帶成分的解碼訊號會被分析,並被轉換成頻率領域之訊號(步驟S03)。
然後,藉由編碼序列解析部1d,高頻頻帶編碼序列會被解析,取得已被編碼之高頻頻帶生成用輔助資訊、和已被量化之時間包絡資訊(步驟S04)。然後,藉由編碼序列解碼/逆量化部1e,高頻頻帶生成用輔助資訊會被解碼,並且時間包絡資訊會被逆量化(步驟S05)。其後,藉由高頻頻帶生成部1h,將低頻頻帶之訊號Xdec(j,i),使用高頻頻帶生成用輔助資訊而對高頻頻帶進行複寫,以生成高頻頻帶之訊號Xdec(j,i)(步驟S06)。接著,藉由第1~第n低頻頻帶時間包絡算出部1f1~1fn,以低頻頻帶之訊號X(j,i)為基礎,算出複數低頻頻帶之時間包絡Ldec(k,i)(步驟S07)。
然後,藉由時間包絡算出部1g,使用複數低頻頻帶 內之時間包絡Ldec(k,i)與時間包絡資訊,來算出高頻頻帶之時間包絡ET(l,i)(步驟S08)。然後,藉由時間包絡調整部1i,高頻頻帶訊號XH(j,i)的時間包絡會被使用時間包絡ET(l,i)而被調整(步驟S09)。最後,藉由頻帶合成濾波器組部1j,高頻帶訊號Y(i,j)與低頻帶訊號X(j,i)被加算後,藉由頻帶合成,而取得時間領域之解碼聲音訊號,將該解碼聲音訊號予以輸出(步驟S10)。
圖3係本發明的第1實施形態所述之聲音編碼裝置2之構成的圖示,圖4係藉由聲音編碼裝置2而被實現的聲音編碼方法之程序的流程圖。聲音編碼裝置2,係實體上具備未圖示的CPU、ROM、RAM及通訊裝置等,該CPU,係將ROM等之聲音編碼裝置2的內藏記憶體中所儲存的所定之電腦程式(例如圖4的流程圖所示之處理執行所需的電腦程式)載入至RAM中並執行,藉此以統籌控制聲音編碼裝置2。聲音編碼裝置2的通訊裝置,係將作為編碼對象的聲音訊號,從外部予以接收,還有,將已被編碼之多工化位元串流,輸出至外部。
如圖3所示,聲音編碼裝置2,係在機能上是具備有:降頻取樣部(降頻取樣手段)2a、低頻頻帶編碼部(低頻頻帶編碼手段)2b、頻帶分割濾波器組部(頻率轉換手段)2c、高頻頻帶生成用輔助資訊算出部(輔助資訊算出手段)2d、第1~第n(n係2以上之整數)低頻頻帶時間包絡算出部(低頻頻帶時間包絡算出手段)2e1~ 2en、時間包絡資訊算出部(時間包絡資訊算出手段)2f、量化/編碼部(量化編碼手段)2g、高頻頻帶編碼序列構成部(編碼序列構成手段)2h、及多工化部(多工化手段)2i。圖3所示的聲音編碼裝置2之各機能部,係藉由聲音編碼裝置2的CPU去執行聲音編碼裝置2的內藏記憶體中所儲存的電腦程式,所實現的功能。聲音編碼裝置2的CPU,係藉由執行該電腦程式(使用圖3的各機能部),而依序執行圖4的流程圖中所示的處理(步驟S11~步驟S20之處理)。該電腦程式之執行上所被須的各種資料、及該電腦程式之執行所產生的各種資料,係全部都被保存在聲音編碼裝置2的ROM或RAM等之內藏記憶體中。
降頻取樣部2a,係將透過聲音編碼裝置2的通訊裝置而從外部所接收到的輸入訊號,加以處理,獲得已被縮減取樣的低頻頻帶之時間領域訊號。低頻頻帶編碼部2b,係將已被縮減取樣的時間領域訊號進行編碼,獲得低頻頻帶編碼序列。低頻頻帶編碼部2b中的編碼係亦可基於以CELP方式為代表的聲音編碼方式,或是基於以AAC為代表的轉換編碼或是TCX方式等之音響編碼。又,亦可基於PCM編碼方式。又,亦可基於切換這些編碼方式而進行編碼的方式來為之。於本實施形態,編碼方式係沒有限定。
頻帶分割濾波器組部2c,係將透過聲音編碼裝置2之通訊裝置而被接收的來自外部之輸入訊號,加以分析, 轉換成頻率領域之全頻帶的訊號X(j,i)。其中,j係為頻率方向的索引,i係為時間方向的索引。
高頻頻帶生成用輔助資訊算出部2d,係從頻帶分割濾波器組部2c收取頻率領域之訊號X(j,i),基於高頻頻帶之功率、訊號變化、或調性等之分析,算出在從低頻頻帶之訊號成分生成高頻頻帶之訊號成分時所使用的高頻頻帶生成用輔助資訊。
第1~第n低頻頻帶時間包絡算出部2e1~2en,係分別算出複數個不同的低頻頻帶成分之時間包絡。具體而言,第k低頻頻帶時間包絡算出部2ek(1≦k≦n),係從頻帶分割濾波器組部2c,收取低頻頻帶之訊號X(j,i){0≦j<kx、t(s)≦i<t(s+1)、0≦s<sE},依照上述聲音解碼裝置1的第k低頻頻帶時間包絡算出部1fk(其中,1≦k≦n)的時間包絡Ldec(k,i)之算出方法,算出低頻頻帶之第k個時間包絡L(k、i){t(s)≦i<t(s+1)、0≦s<sE}。
時間包絡資訊算出部2f,係從頻帶分割濾波器組部2c,收取高頻頻帶之訊號X(j,i){kx≦j<N、t(s)≦i<t(s+1)、0≦s<sE},又,從第k低頻頻帶時間包絡算出部2ek(1≦k≦n),係收取時間包絡L(k、i){t(s)≦i<t(s+1)、0≦s<sE},算出訊號X(j,i)的高頻頻帶成分的時間包絡取得時所必須的時間包絡資訊。上記時間包絡資訊係為,在上述的聲音解碼裝置1側,上記時間包絡Ldec(k,i)已被給定之際,可將高頻頻帶之 參照時間包絡之近似加以復原的資訊。
具體而言,上記時間包絡資訊的算出,是被進行如下。首先,功率的時間包絡係藉由下式而被算出。
接著,上記高頻頻帶之第1(1≦l≦nH)個頻率領域之參照時間包絡,若表示成H(l、i){t(s)≦i<t(s+1)},則參照時間包絡H(l、i)係藉由下式:
或下式:
而被算出。
此外,亦可和上述的低頻頻帶之時間包絡同樣地,對H(l,i)實施所定之處理(例如平滑化),來作為高頻頻帶之參照時間包絡。又,高頻頻帶的參照時間包絡,係只要是表示高頻頻帶之訊號的訊號功率或訊號振幅之時間變化的參數即可,不限定於上記的算出方法。上記參照時間包絡H(l,i)的以上記時間包絡L(k,i)所取之近似若表示成g(l,i),則上記g(l,i)之型態,係依照聲音解碼裝置1中的gdec(l,i)之型態。此處,使上記時間包絡L(k,i),對應至聲音解碼裝置1側的時間包絡Ldec(k,i)。
例如,時間包絡資訊係為,定義相對於上記參照時間包絡H(l,i)的上記g(l,i)之誤差,藉由求出使該誤差呈最小的g(l,i),就可算出。亦即,將誤差視為時間包絡資訊的函數,只要將能給予該誤差最小值的時間包絡資訊加以探索而算出即可。該當時間包絡資訊之算出,亦可以數值性的方式來進行。又,亦可使用數式來計算。
更詳言之,相對於參照時間包絡H(l,i)的上記g(l,i)之誤差,係可藉由下式:
而被計算。又,該誤差係亦可利用下式而被當成加權誤差來計算。
甚至,誤差係亦可藉由下式來計算。
此處,權重w(l,i)係可定義成隨時間索引i而變化 的權重,或可定義成隨頻率索引l而變化的權重皆可,甚至亦可定義成隨時間索引i及頻率索引l而變化的權重。此外,本實施形態中,對於上記誤差的形態,及上記例子的權重形態,並沒有限定。
量化/編碼部2g,係從時間包絡資訊算出部2f收取時間包絡資訊,進行時間包絡資訊的量化、編碼,從高頻頻帶生成用輔助資訊算出部2d收取高頻頻帶生成用輔助資訊而將高頻頻帶生成用輔助資訊予以編碼。
作為此種時間包絡資訊的量化、編碼方法係亦可為,例如,若該當資訊是係數Al,k(s)之形態,則將上記Al,k(s)進行純量量化後,進行熵編碼。甚至亦可將Al,k(s)使用所定之碼簿而進行向量量化,將該索引予以編碼。此外,本實施形態中,時間包絡資訊的量化、編碼方法係不限定於上記。
高頻頻帶編碼序列構成部2h,係從量化/編碼部2g收取已被編碼之高頻頻帶生成用輔助資訊和已被量化之時間包絡資訊,構成含有它們之高頻頻帶編碼序列。
多工化部2i係從低頻頻帶編碼部2b收取低頻頻帶編碼序列,從高頻頻帶編碼序列構成部2h收取高頻頻帶編碼序列,藉由將2個編碼序列進行多工化而生成編碼序列,將所生成之編碼序列予以輸出。
以下,參照圖4,說明聲音編碼裝置2之動作,同時詳述聲音編碼裝置2中的聲音編碼方法。
首先,已被輸入之聲音訊號係藉由頻帶分割濾波器組 部2c而被分析,藉此,頻率領域之全頻帶的訊號X(j,i)會被取得(步驟S11)。接著,藉由降頻取樣部2a,來自外部的輸入聲音訊號會被處理,取得已被縮減取樣的時間領域訊號(步驟S12)。其後,藉由低頻頻帶編碼部2b,已被縮減取樣的時間領域訊號會被編碼,獲得低頻頻帶編碼序列(步驟S13)。
然後,藉由高頻頻帶生成用輔助資訊算出部2d,從頻帶分割濾波器組部2c所取得之頻率領域之訊號X(j,i)會被分析,算出在高頻頻帶之訊號成分生成之際所使用的高頻頻帶生成用輔助資訊(步驟S14)。然後,藉由第1~第n低頻頻帶時間包絡算出部2e1~2en,以低頻頻帶之訊號X(j,i)為基礎,算出低頻頻帶之複數時間包絡L(k、i)(步驟S15)。其後,藉由時間包絡資訊算出部2f,以高頻頻帶之訊號X(j,i)及低頻頻帶之複數時間包絡L(k、i)為基礎,算出訊號X(j,i)的高頻頻帶成分的時間包絡取得時所必須的時間包絡資訊(步驟S16)。接著,藉由量化/編碼部2g,時間包絡資訊會被量化、編碼,並且高頻頻帶生成用輔助資訊會被編碼(步驟S17)。
然後,藉由高頻頻帶編碼序列構成部2h,含有已被編碼之高頻頻帶生成用輔助資訊和已被量化之時間包絡資訊的高頻頻帶編碼序列,會被構成(步驟S18)。然後,藉由多工化部2i,將低頻頻帶編碼序列與高頻頻帶編碼序列進行多工化而生成編碼序列,所生成之編碼序列會被輸 出(步驟S19)。
若依據以上說明的聲音解碼裝置1、解碼方法、或解碼程式,則可從編碼序列進行解多工化及解碼而獲得低頻頻帶訊號,可從編碼序列進行解多工化、解碼、及逆量化而獲得高頻頻帶生成用輔助資訊及時間包絡資訊。然後,從使用高頻頻帶生成用輔助資訊而已被轉換成頻率領域之低頻頻帶訊號Xdec(j,i),生成出頻率領域的高頻頻帶成分Xdec(j,i),另一方面,分析頻率領域之低頻頻帶訊號Xdec(j,i)而取得了複數低頻頻帶之時間包絡Ldec(k,i)後,使用該複數低頻頻帶之時間包絡Ldec(k,i)、和時間包絡資訊,來算出高頻頻帶之時間包絡ET(l,i)。然後,藉由已被算出之高頻頻帶之時間包絡ET(l,i)來調整高頻頻帶成分XH(j,i)的時間包絡,將已被調整之高頻頻帶成分與低頻頻帶訊號進行加算而輸出時間領域訊號。如此,高頻頻帶成分XH(j,i)的時間包絡的調整時會使用複數低頻頻帶之時間包絡Ldec(k,i),因此可利用低頻頻帶成分的時間包絡與高頻頻帶成分的時間包絡的相關而高精度地調整高頻頻帶成分的時間包絡的波形。其結果為,解碼訊號中的時間包絡是被調整成失真較少的形狀,可獲得充分改善前回聲及後回聲的再生訊號。
又,若依據上述的聲音編碼裝置2、編碼方法、或編碼程式,則聲音訊號會被降頻取樣而獲得低頻頻帶訊號,該低頻頻帶訊號係被編碼,而另一方面,根據頻率領域之 聲音訊號X(j,i)而複數算出低頻頻帶成分的時間包絡L(k,i),使用該複數低頻頻帶成分的時間包絡L(k,i)來算出用來取得高頻頻帶成分的時間包絡所需的時間包絡資訊。然後,算出用來從低頻頻帶訊號生成高頻頻帶成分所需的高頻頻帶生成用輔助資訊,將高頻頻帶生成用輔助資訊與時間包絡資訊進行量化及編碼後,構成含有高頻頻帶生成用輔助資訊與時間包絡資訊的高頻頻帶編碼序列。然後,生成由低頻頻帶編碼序列及高頻頻帶編碼序列所多工化而成的編碼序列。藉此,在編碼序列被輸入至聲音解碼裝置1,在聲音解碼裝置1側上,高頻頻帶成分的時間包絡的調整時可以使用複數低頻頻帶之時間包絡,在聲音解碼裝置1側上可利用低頻頻帶成分的時間包絡與高頻頻帶成分的時間包絡的相關而高精度地調整高頻頻帶成分的時間包絡的波形。其結果為,解碼訊號中的時間包絡是被調整成失真較少的形狀,在解碼裝置側上可獲得充分改善前回聲及後回聲的再生訊號。
〔第1實施形態的聲音解碼裝置的第1變形例〕
圖5係第1實施形態所述之聲音解碼裝置1的第1變形例中的關於包絡算出之重點構成的圖示,圖6係圖5的聲音解碼裝置1所進行的包絡算出之程序的流程圖。
圖5所示的聲音解碼裝置1,係除了具備低頻頻帶時間包絡算出部1f1~1fn及時間包絡算出部1g,還具備時間包絡算出控制部(時間包絡算出控制手段)1k。該時間包 絡算出控制部1k,係從頻帶分割濾波器組部1c收取低頻頻帶訊號,算出該當訊框中的低頻頻帶訊號之功率(步驟S31),將所算出之低頻頻帶訊號之功率,與所定閾值進行比較(步驟S32)。然後,時間包絡算出控制部1k,係當低頻頻帶訊號之功率沒有大於所定閾值時(步驟S32:NO),則對低頻頻帶時間包絡算出部1f1~1fn係輸出低頻頻帶時間包絡算出控制訊號,對時間包絡算出部1g係輸出時間包絡算出控制訊號,控制成在低頻頻帶時間包絡算出部1f1~1fn及時間包絡算出部1g中不進行時間包絡之算出處理。此時,高頻頻帶訊號的時間包絡係並未基於上記時間包絡而做調整(例如,上記數式29中,令E(m,i)為Ecurr(m,i),取代上記數式30而改成下式:
來為之)(步驟S36),就被送往頻帶合成濾波器組部1j。另一方面,時間包絡算出控制部1k,係當低頻頻帶訊號之功率大於所定閾值時,則對低頻頻帶時間包絡算出部1f1~1fn係輸出低頻頻帶時間包絡算出控制訊號,對時間包絡算出部1g係輸出時間包絡算出控制訊號,控制成低頻頻帶時間包絡算出部1f1~1fn及時間包絡算出部1g會實施時間包絡之算出處理。此時,在時間包絡調整部1i 中基於上記時間包絡而調整過時間包絡的高頻頻帶訊號,係會被送往頻帶合成濾波器組部1j。
參照圖6,在聲音解碼裝置1的第1變形例中,步驟S31~S36所示的包絡算出處理,是被置換成圖2所示的第1實施形態所述之聲音解碼裝置1的步驟S07~S09之處理而被執行。
藉由此種聲音解碼裝置1的第1變形例,例如當低頻頻帶訊號之功率較小、無法被使用於高頻頻帶訊號的時間包絡算出時,藉由省略步驟S07~S08之處理,就可削減演算量。
此外,時間包絡算出控制部1k,係亦可將第1~第n低頻頻帶時間包絡算出部1f1~1fn中所被算出之第1~第n低頻頻帶時間包絡所相當之部分的功率予以算出,也可基於將已被算出之第1~第n低頻頻帶時間包絡所相當之功率與所定閾值之比較結果而輸出低頻頻帶時間包絡算出控制訊號,以控制是否省略上記第1~第n低頻頻帶時間包絡算出部1f1~1fn之處理。
此情況下,若時間包絡算出控制部1k係控制成省略所有第1~第n低頻頻帶時間包絡算出部1f1~1fn之處理,則向時間包絡算出部1g輸出時間包絡算出控制訊號以控制成省略時間包絡算出處理。又,若時間包絡算出控制部1k係控制成,要由第1~第n低頻頻帶時間包絡算出部1f1~1fn當中至少1者以上來實施低頻頻帶時間包絡之算出處理的情況下,則向時間包絡算出部1g輸出時間 包絡算出控制訊號以控制成實施時間包絡算出處理。
〔第1實施形態的聲音解碼裝置的第2變形例〕
圖7係第1實施形態所述之聲音解碼裝置1的第2變形例中的關於包絡算出之重點構成的圖示,圖8係圖7的聲音解碼裝置1所進行的包絡算出之程序的流程圖。
圖7所示的聲音解碼裝置1,係除了具備低頻頻帶時間包絡算出部1f1~1fn及時間包絡算出部1g,還具備時間包絡算出控制部(時間包絡算出控制手段)1m。該時間包絡算出控制部1m,係基於從編碼序列解碼/逆量化部1e所收取到的時間包絡資訊,而向第1~第n低頻頻帶時間包絡算出部1f1~1fn輸出低頻頻帶時間包絡算出控制訊號,藉此而控制第1~第n低頻頻帶時間包絡算出部1f1~1fn中的低頻頻帶時間包絡算出處理之實施。
詳言之,聲音解碼裝置1的第2變形例中,圖8所示的步驟S41~S48的包絡算出處理,是被置換成圖2所示的第1實施形態所述之聲音解碼裝置1的步驟S07~S09之處理而被執行。
首先,藉由時間包絡算出控制部1m,計數值count係被設定成0(步驟S41)。接著,藉由時間包絡算出控制部1m,判定從編碼序列解碼/逆量化部1e所收取到的時間包絡資訊中所含有之係數A1,count+1(s)是否為0(步驟S42)。
判定的結果若係數A1,count+1(s)為0(步驟S42: NO),則藉由時間包絡算出控制部1m,向第count個低頻頻帶時間包絡算出部1fcount輸出低頻頻帶時間包絡算出控制訊號,控制成不會實施低頻頻帶時間包絡算出部1fcount中的低頻頻帶時間包絡算出處理,前進至步驟S44之處理。另一方面,若係數A1,count+1(s)被判定為非0時(步驟S42:YES),則向第count個低頻頻帶時間包絡算出部1fcount輸出低頻頻帶時間包絡算出控制訊號,控制成會實施低頻頻帶時間包絡算出部1fcount中的低頻頻帶時間包絡算出處理。藉此,藉由低頻頻帶時間包絡算出部1fcount,低頻頻帶時間包絡就被算出(步驟S43)。
然後,藉由時間包絡算出控制部1m,將計數值count增加1(步驟S44)之後,計數值count與低頻頻帶時間包絡算出部1f1~1fn的個數n會被進行比較(步驟S45)。比較之結果,若計數值count小於個數n(步驟S45:YES),則返回步驟S42之處理,重複時間包絡資訊中所含之下個係數A1,count(s)之判定。另一方面,若計數值count為個數n以上時(步驟S45:NO),則進入步驟S46之處理。然後,藉由時間包絡算出控制部1m,判定是否在1個以上的低頻頻帶時間包絡算出部1f1~1fn中實施低頻頻帶時間包絡的算出處理(步驟S46)。判定之結果,若所有的低頻頻帶時間包絡算出部1f1~1fn中都不實施低頻頻帶時間包絡的算出處理(步驟S46:NO),則向時間包絡算出部1g輸出時間包絡算出控制訊號以控制成省略時間包絡算出處理。此時,取代步驟S47~S48 之處理改為實施步驟S49,前進至步驟S10之處理(圖2)。相對於此,若在1個以上的低頻頻帶時間包絡算出部1f1~1fn中要實施低頻頻帶時間包絡的算出處理(步驟S46:YES),則在時間包絡算出部1g中實施時間包絡之算出處理(步驟S47)。接著,藉由時間包絡調整部1i,高頻頻帶訊號的時間包絡調整處理會被實施(步驟S48)。其後,藉由頻帶合成濾波器組部1j,實施輸出訊號的合成處理。
藉由此種聲音解碼裝置1的第2變形例,若根據從編碼序列所得到之時間包絡資訊而有部分處理是不需要時,則藉由省略步驟S07~S08之任一處理,就可削減演算量。
〔第1實施形態的聲音解碼裝置的第3變形例〕
圖9係第1實施形態所述之聲音解碼裝置1的第3變形例中的關於包絡算出之重點構成的圖示,圖10係圖9的聲音解碼裝置1所進行的包絡算出之程序的流程圖。
圖9所示的聲音解碼裝置1,係除了具備低頻頻帶時間包絡算出部1f1~1fn及時間包絡算出部1g,還具備時間包絡算出控制部(時間包絡算出控制手段)1n。該時間包絡算出控制部1n,係從編碼序列解析部1d收取時間包絡算出控制資訊。於本變形例中,時間包絡算出控制資訊裡係會描述,是否於該當訊框中實施時間包絡算出處理。在讀取時間包絡算出控制資訊的描述內容之際,若解碼/逆 量化處理是必要時,則藉由編碼序列解碼/逆量化部1e而實施解碼逆量化處理。又,時間包絡算出控制部1n係藉由參照時間包絡算出控制資訊,以決定是否要在該當訊框中實施時間包絡算出處理。然後,時間包絡算出控制部1n,係在已決定不實施時間包絡算出處理的情況下,對低頻頻帶時間包絡算出部1f1~1fn係輸出低頻頻帶時間包絡算出控制訊號,對時間包絡算出部1g係輸出時間包絡算出控制訊號,控制成在低頻頻帶時間包絡算出部1f1~1fn及時間包絡算出部1g中不進行時間包絡之算出處理。此時,高頻頻帶訊號,係不將時間包絡基於上記時間包絡進行調整,就送往頻帶合成濾波器組部1j。反之,時間包絡算出控制部1n,係在已決定要實施時間包絡算出處理的情況下,對低頻頻帶時間包絡算出部1f1~1fn係輸出低頻頻帶時間包絡算出控制訊號,對時間包絡算出部1g係輸出時間包絡算出控制訊號,控制成在低頻頻帶時間包絡算出部1f1~1fn及時間包絡算出部1g中會進行時間包絡之算出處理。此時,被時間包絡調整部1i調整過時間包絡的高頻頻帶訊號,會被送往頻帶合成濾波器組部1j。
參照圖10,在聲音解碼裝置1的第3變形例中,步驟S51~S54所示的包絡算出處理,是被置換成圖2所示的第1實施形態所述之聲音解碼裝置1的步驟S07~S09之處理而被執行。
藉由此種聲音解碼裝置1的第3變形例也是,基於來自編碼裝置側的控制資訊而省略步驟S07~S08之處理, 就可削減演算量。
〔第1實施形態的聲音解碼裝置的第4變形例〕
圖11係第1實施形態所述之聲音解碼裝置1的第4變形例所進行的包絡算出之程序的流程圖。此外,該聲音解碼裝置1的第4變形例之構成,係和圖9所示構成相同。
在該第4變形例中,圖11所示的步驟S61~S64所示的包絡算出處理,係被置換成圖2所示的第1實施形態所述之聲音解碼裝置1的步驟S07~S09之處理而被執行。
亦即,在時間包絡算出控制資訊中係描述了,於該當訊框中,第1~n低頻頻帶時間包絡當中要被使用於時間包絡算出處理的低頻頻帶時間包絡。此處,在讀取時間包絡算出控制資訊的描述內容之際,若解碼/逆量化處理是必要時,則藉由編碼序列解碼/逆量化部1e而實施解碼逆量化處理。然後,藉由時間包絡算出控制部1n,基於時間包絡算出控制資訊,於該當訊框中被用於時間包絡算出處理的低頻頻帶時間包絡會被選擇(步驟S61)。
接著,藉由時間包絡算出控制部1n,對第1~n低頻頻帶時間包絡算出部1f1~1fn輸出低頻頻帶時間包絡算出控制訊號。藉此,會被控制成,藉由已被上記選擇處理所選擇之低頻頻帶時間包絡所相當之低頻頻帶時間包絡算出部1f1~1fn來算出低頻頻帶時間包絡,且被控制成,不會藉由未被上記選擇處理所選擇之低頻頻帶時間包絡所相當 之低頻頻帶時間包絡算出部1f1~1fn來算出低頻頻帶時間包絡(步驟S62)。
其後,藉由時間包絡算出控制部1n,對時間包絡算出部1g輸出時間包絡算出控制訊號,控制成僅使用已被選擇之低頻頻帶時間包絡,來算出時間包絡(步驟S63)。然後,藉由時間包絡調整部1i,使用已被算出的時間包絡,調整已被高頻頻帶生成部1h所生成之高頻頻帶訊號的時間包絡(步驟S64)。
又,亦可為,於上記選擇處理中,若任一低頻頻帶時間包絡均未被選擇時,則略過上記步驟S62~S63,高頻頻帶訊號係不基於上記時間包絡來調整時間包絡(圖6的步驟S36),就被送往頻帶合成濾波器組部1j。
藉由此種聲音解碼裝置1的第4變形例也是,基於來自編碼裝置側的控制資訊而省略步驟S07~S08之處理,就可削減演算量。
〔第1實施形態的聲音解碼裝置的第5變形例〕
圖12係第1實施形態所述之聲音解碼裝置1的第5變形例所進行的包絡算出之程序的流程圖。此外,該聲音解碼裝置1的第5變形例之構成,係和圖9所示構成相同。
在該第5變形例中,圖12所示的步驟S71~S75所示的包絡算出處理,係被置換成圖2所示的第1實施形態所述之聲音解碼裝置1的步驟S07~S09之處理而被執行。
亦即,在時間包絡算出控制資訊中係描述了,於該當訊框中,第1~n低頻頻帶時間包絡之算出方法。在讀取時間包絡算出控制資訊的描述內容之際,若解碼/逆量化處理是必要時,則藉由編碼序列解碼/逆量化部1e而實施解碼逆量化處理。時間包絡算出控制資訊中所描述的第1~n低頻頻帶時間包絡之算出方法,係亦可為例如表示副頻帶之陣列B1與Bh之設定的相關內容,可根據此種時間包絡算出控制資訊來控制副頻帶的頻率領域。陣列B1與Bh之設定的相關內容,係亦可由設定陣列B1與Bh的整數組(k1、kh)來描述,也可描述為關於要從所定之複數陣列B1與Bh的設定內容中選擇出何者。於本變形例中,陣列B1與Bh之設定的相關內容的描述方法係沒有限定。又,時間包絡算出控制資訊中所描述的第1~n低頻頻帶時間包絡之算出方法,係只要是關於上記所定處理之設定的內容(例如關於上記平滑化係數sc(j)之設定的內容)即可,藉此就可根據時間包絡算出控制資訊來控制上記所定之處理(例如上記平滑化處理)。平滑化係數sc(j)之設定的相關內容,係可為將平滑化係數sc(j)之值予以量化、編碼而成者,也可為有關於從所定複數平滑化係數sc(j)中選擇何者之內容。或者,亦可含有描述了是否進行平滑化處理的內容。於本變形例中,上記所定之處理的設定(例如上記平滑化係數sc(j)之設定)的相關內容的描述方法係沒有限定。甚至,時間包絡算出控制資訊中所描述的第1~n低頻頻帶時間包絡之算出方 法,係只要含有上述算出方法當中的至少1者以上即可。此外,於本變形例中,時間包絡算出控制資訊中所描述的第1~n低頻頻帶時間包絡之算出方法,係只要有描述低頻頻帶時間包絡之算出方法的相關內容即可,不限定於上記的內容。
在步驟S71中,藉由時間包絡算出控制部1n,基於時間包絡算出控制資訊,決定是否於該當訊框中變更低頻頻帶時間包絡之算出方法。接著,若不變更低頻頻帶時間包絡之算出方法(步驟S71:NO),則不變更低頻頻帶時間包絡之算出方法,在低頻頻帶時間包絡算出部1f1~1fn中算出第1~n低頻頻帶時間包絡(步驟S73)。另一方面,若要變更低頻頻帶時間包絡之算出方法(步驟S71:YES),則藉由時間包絡算出控制部1n,對低頻頻帶時間包絡算出部1f1~1fn輸出低頻頻帶時間包絡算出控制訊號以指示低頻頻帶時間包絡之算出方法,低頻頻帶時間包絡之算出方法就會被變更(步驟S72)。其後,在低頻頻帶時間包絡算出部1f1~1fn中,藉由已被變更之低頻頻帶時間包絡算出方法,算出第1~n低頻頻帶時間包絡(步驟S73)。然後,藉由時間包絡算出部1g,使用已被低頻頻帶時間包絡算出部1f1~1fn所算出的第1~n低頻頻帶時間包絡,來算出時間包絡(步驟S74)。然後,藉由時間包絡調整部1i,使用已被時間包絡算出部1g所算出的時間包絡,調整已被高頻頻帶生成部1h所生成之高頻頻帶訊號的時間包絡(步驟S75)。
藉由此種聲音解碼裝置1的第5變形例也是,基於來自編碼裝置側的控制資訊而精密地控制步驟S07~S08之處理,就可更高精度地削減時間包絡之調整。
〔第1實施形態的聲音解碼裝置的第6變形例〕
圖13,係第1實施形態所述之聲音解碼裝置1的第6變形例中的關於包絡算出之重點構成的圖示。圖13所示的聲音解碼裝置1,係除了具備低頻頻帶時間包絡算出部1f1~1fn及時間包絡算出部1g,還具備時間包絡算出控制部(時間包絡算出控制手段)1o。該時間包絡算出控制部1o係被構成為,會執行聲音解碼裝置1的第1~第5變形例中的包絡算出處理當中的任1者以上。
〔第1實施形態的聲音解碼裝置的第7變形例〕
圖14係第1實施形態所述之聲音解碼裝置1的第7變形例所進行的包絡算出之程序的流程圖。此外,該聲音解碼裝置1的第7變形例之構成,係和第1實施形態所述之聲音解碼裝置1相同。圖14的步驟S261~S262,係將上記第1實施形態所述之聲音解碼裝置1之處理加以表示的流程圖圖2中的步驟S08予以置換而成者。
於本變形例中,係時間包絡算出部1g,係使用從低頻頻帶時間包絡算出部1f1~1fn所給予的低頻頻帶內的時間包絡Ldec(k,i){1≦k≦n、t(s)≦i<t(s+1)、0≦s<sE},和從編碼序列解碼/逆量化部1e所給予的時 間包絡資訊,來進行所定處理(步驟S261之處理)後,算出時間包絡(步驟S262之處理)。此處,作為所定之處理、及其所涉及之時間包絡之算出,係有以下所示的例子。
在第1例中,是將數式18、數式21、數式23、或數式24中的係數Al,k(s),使用從編碼序列解碼/逆量化部1e以別的型態所給予的時間包絡資訊而加以算出。例如,上記係數係藉由下式而算出。
0≦s<sE
此處,αk(s)、k=1,2,...,Num、0≦s<sE係為從編碼序列解碼/逆量化部1e所給予的時間包絡資訊,Flk(x1,x2,...,xNum)、1≦l≦nH、1≦k≦n係以Num個之變數為引數的所定函數。其後,使用已被上記方法所取得的係數Al,k(s),來藉由數式18、數式21、數式23、或數式24,算出時間包絡。
在第2例中,首先,算出下式所給定的量。
此處,下式:
係為所定之係數。
又,上記g(0)(l,i)係可為所定之係數,或亦可為針對索引l,i的所定之函數。例如,上記g(0)(l,i)係亦可為由下式給定之函數。
此處,λ、ω係為所定之係數。
接下來,算出數式18、數式21、數式23、或數式24左邊所對應的量,將它們改為表示成g(1)(l,i){1≦l≦nH、t(s)≦i<t(s+1)、0≦s<sE}。然後,時間包絡係例如藉由下式而算出。
又,時間包絡係亦可藉由下式而算出。
甚至,亦可藉由下式:
而算出時間包絡。
又,若從編碼序列解碼/逆量化部1e沒有給予時間包絡資訊時,則亦可藉由下式:
而算出時間包絡。
於本變形例中,上記gdec(l,i)的形態,係不限定於上記例子。
此外,於本發明中,所定處理、及其所涉及之時間包絡之算出的內容,係不限定於上記的例子。
本變形例係亦可對第1實施形態所述之聲音解碼裝置1的第1~第6變形例,適用如下之方法。
對第1實施形態所述之聲音解碼裝置1的第1變形例做適用時,例如,係將圖6的步驟S34,置換成圖14的步驟S261~S262。此處,亦可預先複數準備上記所定之處理,依照低頻訊號之功率大小來切換之。甚至,亦可隨著低頻訊號之功率大小,來選擇:a)僅實施上記所定之處理以算出時間包絡;b)實施上記所定之處理,然後再使用時間包絡資訊來算出時間包絡;c)不實施上記所定之處理,使用時間包絡資訊來算出時間包絡;當中之任一者。
圖15係對第1實施形態所述之聲音解碼裝置1的第2變形例做適用時,第1實施形態所述之聲音解碼裝置1的第7變形例中的時間包絡算出控制部1m之處理之一部分的流程圖。
對第1實施形態所述之聲音解碼裝置1的第2變形例做適用時,例如,係將圖8的步驟S42置換成圖15的步驟S271,將圖8的步驟S47置換成圖14的步驟S261~ S262。又,亦可預先複數準備所定之處理,基於時間包絡資訊來切換之。甚至,亦可隨著時間包絡資訊,來選擇:a)僅實施上記所定之處理以算出時間包絡;b)實施上記所定之處理,然後再使用時間包絡資訊來算出時間包絡;c)不實施上記所定之處理,使用時間包絡資訊來算出時間包絡;當中之任一者。
又,對第1實施形態所述之聲音解碼裝置1的第3變形例做適用時,係將圖10的步驟S53,置換成圖14的步驟S261~S262。又,亦可預先複數準備所定之處理,基於時間包絡算出控制資訊來切換之。甚至,亦可隨著時間包絡算出控制資訊,來選擇:a)僅實施上記所定之處理以算出時間包絡;b)實施上記所定之處理,然後再使用時間包絡資訊來算出時間包絡;c)不實施上記所定之處理,使用時間包絡資訊來算出時間包絡;當中之任一者。
圖16係對第1實施形態所述之聲音解碼裝置1的第4變形例做適用時,第1實施形態所述之聲音解碼裝置1的第7變形例中的時間包絡算出控制部1n之處理之一部分的流程圖。
對第1實施形態所述之聲音解碼裝置1的第4變形例做適用時,係將圖11的步驟S61置換成圖16的步驟S281,將圖11的步驟S63置換成圖14的步驟S261~S262。於圖16的步驟S281中,作為從第1~n低頻帶成分的時間包絡選擇所算出之低頻帶成分之時間包絡的方法,係例如,調查上記所定之處理之一例中的A(0) l,k是否 為零,若A(0) l,k非零,且時間包絡算出控制資訊是指示了藉由低頻訊號時間包絡算出部1fk來算出Ldec(k,i)的情況下,低頻訊號時間包絡算出部1fk係亦可算出Ldec(k,i)。
對第1實施形態所述之聲音解碼裝置1的第5變形例做適用時,係將圖12的步驟S74,置換成圖14的步驟S261~S262。此處,低頻帶成分之時間包絡算出方法若有變更時,則亦可配合其來變更所定之處理方法。
又,對第1實施形態所述之聲音解碼裝置1的第6變形例之適用,係按照對上記第1~第5變形例的適用方法。
此外,在圖14中,雖然圖示了在所定處理之後算出時間包絡的流程,但亦可在時間包絡算出後,進行所定之處理。例如,亦可對已算出之時間包絡,實施平滑化等之所定處理。甚至,亦可在所定處理之後,算出時間包絡,然後再對該時間包絡實施別的所定處理。
〔第1實施形態的聲音編碼裝置的第1變形例〕
圖17係第1實施形態所述之聲音編碼裝置2的第1變形例之構成的圖示,圖18係圖17的聲音編碼裝置2所進行之聲音編碼之程序的流程圖。
圖17所示的聲音編碼裝置2,係對第1實施形態所述之聲音編碼裝置2,還追加了時間包絡算出控制資訊生成部(控制資訊生成手段)2j。
該時間包絡算出控制資訊生成部2j,係使用從頻帶分割濾波器組部2c所收取的頻率領域之訊號X(j,i)、及從時間包絡資訊算出部2f所收取的時間包絡資訊當中之至少1者以上,來生成時間包絡算出控制資訊。所生成之時間包絡算出控制資訊,係只要是第1實施形態所述之聲音解碼裝置1的第3~第7變形例中的時間包絡算出控制資訊當中之任一者即可。
此處,時間包絡算出控制資訊生成部2j係亦可例如,將從頻帶分割濾波器組部2c所收取的頻率領域之訊號X(j,i)當中相當於低頻頻帶訊號的頻率領域之訊號功率予以算出,隨應於所算出之訊號功率而生成是否在聲音解碼裝置1中實施時間包絡算出處理的時間包絡算出控制資訊。
又,時間包絡算出控制資訊生成部2j係亦可算出頻率領域之訊號X(j,i)之中相當於高頻頻帶訊號的頻率領域之訊號功率,隨應於所算出之訊號功率而生成是否在聲音解碼裝置1中實施時間包絡算出處理的時間包絡算出控制資訊。
甚至,時間包絡算出控制資訊生成部2j係亦可算出頻率領域之訊號X(j,i)之中相當於全頻帶訊號的頻率領域(亦即相當於低頻頻帶訊號之頻帶與相當於高頻頻帶之頻帶)之訊號功率,隨應於所算出之訊號功率而生成是否在解碼裝置中實施時間包絡算出處理的時間包絡算出控制資訊。
甚至,時間包絡算出控制資訊生成部2j係亦可將第1~第n低頻頻帶時間包絡算出部2e1~2en中所被算出之第1~第n低頻頻帶時間包絡所相當之部分的功率予以算出,而隨應於所算出的訊號功率而生成在聲音解碼裝置1中用於時間包絡算出處理的低頻頻帶時間包絡之選擇所相關的時間包絡算出控制資訊。
又,時間包絡算出控制資訊生成部2j係亦可算出頻率領域之訊號X(j,i)之中相當於低頻頻帶訊號的頻率領域之訊號功率,隨應於所算出之訊號功率而生成關於聲音解碼裝置1中的低頻頻帶時間包絡算出方法的時間包絡算出控制資訊。
於本變形例中,所算出的訊號功率的頻帶係沒有限定,隨應於所算出之訊號功率而被生成的時間包絡算出控制資訊,係只要是上記第1實施形態所述之聲音解碼裝置1的第3~第7變形例中的時間包絡算出控制資訊當中之任1者以上即可。
甚至,時間包絡算出控制資訊生成部2j係亦可偵測/測定頻率領域之訊號X(j,i)的訊號特性,隨應於訊號特性,而生成是否在聲音解碼裝置1中實施時間包絡算出處理的時間包絡算出控制資訊。
又,時間包絡算出控制資訊生成部2j,係亦可隨應於頻率領域之訊號X(j,i)的訊號特性,而生成在聲音解碼裝置1中用於時間包絡算出處理的低頻頻帶時間包絡之選擇所相關的時間包絡算出控制資訊。
甚至,時間包絡算出控制資訊生成部2j,係亦可隨應於頻率領域之訊號X(j,i)的訊號特性,而生成關於聲音解碼裝置1中的低頻頻帶時間包絡算出方法的時間包絡算出控制資訊。
此外,被時間包絡算出控制資訊生成部2j所偵測/測定的訊號特性,係亦可為有關於訊號上揚/下挫之劇烈度的特性。甚至,亦可為關於訊號之定常性的特性。甚至,亦可為關於訊號之音調性之強度的特性。甚至,亦可為上記特性當中之至少1者以上。
於本變形例中,所被偵測/測定的訊號特性係沒有限定,隨著已被偵測/測定出來的訊號特性而被生成的時間包絡算出控制資訊,係只要是第1實施形態所述之聲音解碼裝置1的第3~第6變形例中的時間包絡算出控制資訊當中之任1者以上即可。
又,時間包絡算出控制資訊生成部2j,係亦可例如隨著從時間包絡資訊算出部2f所收取的上記時間包絡資訊Al,k(s)(1≦l≦nH,1≦k≦n,0≦s<sE)的值,來生成在聲音解碼裝置1中是否實施時間包絡算出處理的時間包絡算出控制資訊。甚至,時間包絡算出控制資訊生成部2j,係亦可生成在聲音解碼裝置1中用於時間包絡算出處理的低頻頻帶時間包絡之選擇所相關的時間包絡算出控制資訊。甚至,亦可生成關於聲音解碼裝置1中的低頻頻帶時間包絡算出方法的時間包絡算出控制資訊。
於本變形例中,隨應於時間包絡資訊而被生成的時間 包絡算出控制資訊,係只要是第1實施形態所述之聲音解碼裝置1的第3~第6變形例中的時間包絡算出控制資訊當中之任1者以上即可。
又,時間包絡算出控制資訊生成部2j係亦可使用,例如從頻帶分割濾波器組部2c所收取的頻率領域之訊號X(j,i)、及從量化/編碼部2g所收取的高頻頻帶生成用輔助資訊的編碼序列,來生成在聲音解碼裝置1中是否實施時間包絡算出處理的時間包絡算出控制資訊。甚至,時間包絡算出控制資訊生成部2j,係亦可生成在聲音解碼裝置1中用於時間包絡算出處理的低頻頻帶時間包絡之選擇所相關的時間包絡算出控制資訊。甚至,時間包絡算出控制資訊生成部2j係亦可生成,關於聲音解碼裝置1中的低頻頻帶時間包絡算出方法的時間包絡算出控制資訊。
更具體而言,時間包絡算出控制資訊生成部2j,係例如,將從量化/編碼部2g所收取的高頻頻帶生成用輔助資訊的編碼序列予以解碼/逆量化而取得局部解碼高頻頻帶生成用輔助資訊之後,使用該當局部解碼高頻頻帶生成用輔助資訊、及頻率領域之訊號X(j,i),來生成擬似局部解碼高頻頻帶訊號。擬似局部解碼高頻頻帶訊號,係可藉由實施和第1實施形態所述之聲音解碼裝置1的高頻頻帶生成部1h相同的處理,就可生成。將所被生成之擬似局部解碼高頻頻帶訊號、與頻率領域之訊號X(j,i)的相當於高頻頻帶訊號的頻帶進行比較,基於比較結果而生成時間包絡算出控制資訊。
此處,擬似局部解碼高頻頻帶訊號與頻率領域之訊號X(j,i)的相當於高頻頻帶訊號的頻帶之比較,係亦可算出該當兩訊號的差分訊號,基於該當差分訊號的功率大小而為之。甚至,亦可將擬似局部解碼高頻頻帶訊號與頻率領域之訊號X(j,i)的相當於高頻頻帶訊號之頻帶的時間包絡予以算出,基於該當時間包絡的差分、或差分之大小的至少1者而為之。
又,時間包絡算出控制資訊生成部2j,係亦可使用例如從頻帶分割濾波器組部2c所收取的頻率領域之訊號X(j,i)、從時間包絡資訊算出部2f所收取的時間包絡資訊、及從量化/編碼部2g所收取的高頻頻帶生成用輔助資訊的編碼序列,來生成在聲音解碼裝置1中是否實施時間包絡算出處理的時間包絡算出控制資訊。甚至,時間包絡算出控制資訊生成部2j,係亦可生成在聲音解碼裝置1中用於時間包絡算出處理的低頻頻帶時間包絡之選擇所相關的時間包絡算出控制資訊。甚至,時間包絡算出控制資訊生成部2j係亦可生成,關於聲音解碼裝置1中的低頻頻帶時間包絡算出方法的時間包絡算出控制資訊。
更具體而言,時間包絡算出控制資訊生成部2j,係在生成了擬似局部解碼高頻頻帶訊號後,使用從時間包絡資訊算出部2f所收取的時間包絡資訊來調整該當擬似局部解碼高頻頻帶訊號的時間包絡,將該當調整過時間包絡之擬似局部解碼高頻頻帶訊號與頻率領域之訊號X(j,i)的相當於高頻頻帶訊號之頻帶進行比較,基於比較結果而生 成時間包絡算出控制資訊。
又,調整過時間包絡之擬似局部解碼高頻頻帶訊號與頻率領域之訊號X(j,i)的相當於高頻頻帶訊號之頻帶的比較,係可和擬似局部解碼高頻頻帶訊號與頻率領域之訊號X(j,i)的相當於高頻頻帶訊號之頻帶的比較,同樣地實施。
又,於第1實施形態所述之聲音編碼裝置2的時間包絡資訊算出部2f中,亦可使用擬似局部解碼高頻頻帶訊號來算出時間包絡資訊。更具體而言,對時間包絡資訊算出部2f係還會輸入著從量化/編碼部2g所收取的高頻頻帶生成用輔助資訊的編碼序列,將該當高頻頻帶生成用輔助資訊的編碼序列予以解碼/逆量化而取得了局部解碼高頻頻帶生成用輔助資訊後,使用該當局部解碼高頻頻帶生成用輔助資訊、及頻率領域之訊號X(j,i),來生成擬似局部解碼高頻頻帶訊號。
例如,時間包絡資訊算出部2f,係亦可使用由時間包絡資訊所算出之時間包絡來調整擬似局部解碼高頻頻帶訊號之時間包絡之際,將能夠最接近於頻率領域之訊號X(j,i)之相當於高頻頻帶訊號之頻帶的時間包絡資訊,當作所被算出之時間包絡資訊而加以輸出。此處,是否接近於頻率領域之訊號X(j,i)之相當於高頻頻帶訊號之頻帶的判斷,係可基於調整過時間包絡之擬似局部解碼高頻頻帶訊號與頻率領域之訊號X(j,i)的相當於高頻頻帶訊號之頻帶的差分訊號來為之,甚至也可算出該當兩訊號的 時間包絡,基於該時間包絡之誤差來為之。
又,時間包絡算出控制資訊生成部2j係亦可例如,隨應於從量化/編碼部2g所收取的時間包絡資訊的編碼所需之資訊量(更具體而言是位元數),來生成在聲音解碼裝置1中是否實施時間包絡算出處理的時間包絡算出控制資訊。甚至,時間包絡算出控制資訊生成部2j,係亦可生成在聲音解碼裝置1中用於時間包絡算出處理的低頻頻帶時間包絡之選擇所相關的時間包絡算出控制資訊。甚至,時間包絡算出控制資訊生成部2j係亦可生成,關於聲音解碼裝置1中的低頻頻帶時間包絡算出方法的時間包絡算出控制資訊。
更具體而言,時間包絡算出控制資訊生成部2j,係例如,當從量化/編碼部2g所收取的時間包絡資訊的編碼所需之資訊量(更具體而言是位元數)是等於所定閾值、或小於閾值時,則生成用來指示在聲音解碼裝置1中實施時間包絡算出處理的時間包絡算出控制資訊。另一方面,時間包絡算出控制資訊生成部2j,係當時間包絡資訊之編碼所需的資訊量是大於閾值時,則生成用來指示在聲音解碼裝置1中不實施時間包絡算出處理的時間包絡算出控制資訊。
甚至,亦可生成在聲音解碼裝置1中用於時間包絡算出處理的低頻頻帶時間包絡之選擇所相關的時間包絡算出控制資訊,以使得時間包絡資訊之編碼所需的資訊量會等於所定閾值、或小於閾值。此時,亦可將時間包絡資訊之 編碼所需的資訊量與閾值之比較結果,通知給時間包絡資訊算出部2f,時間包絡資訊算出部2f係隨著所被通知的比較結果,來重新算出時間包絡資訊。此外,當重新算出時間包絡資訊時,量化/編碼部2g係將已被重新算出之時間包絡資訊,進行編碼/量化。此處,時間包絡資訊的重新算出次數係沒有被限定。
於本變形例中,只要基於時間包絡資訊之編碼所需的資訊量來算出時間包絡算出控制資訊即可,所生成之時間包絡算出控制資訊係只要是第1實施形態所述之聲音解碼裝置1的第3~第6變形例中的時間包絡算出控制資訊當中之任意1者以上即可。
如上述而被時間包絡算出控制資訊生成部2j所生成的時間包絡算出控制資訊,係藉由高頻頻帶編碼序列構成部2h而被再加上高頻頻帶編碼序列而構成了高頻頻帶編碼序列。
〔第1實施形態的聲音編碼裝置的第2變形例〕
圖19係第1實施形態所述之聲音編碼裝置2的第2變形例之構成的圖示,圖20係圖19的聲音編碼裝置2所進行之聲音編碼之程序的流程圖。
圖19所示的聲音編碼裝置2,係對第1實施形態所述之聲音編碼裝置2,還追加了低頻頻帶解碼部2k。
該低頻頻帶解碼部2k,係從低頻頻帶編碼部2b收取低頻頻帶編碼序列,將低頻頻帶編碼序列予以解碼逆量化 而取得局部解碼低頻訊號。此外,在可以從低頻頻帶編碼部2b取得已量化之低頻頻帶訊號的情況下,低頻頻帶解碼部2k係亦可將已量化之低頻頻帶訊號加以逆量化而取得局部解碼低頻訊號。相對於此,藉由低頻頻帶時間包絡算出部2e1~2en,使用低頻頻帶解碼部2k中所取得的局部解碼低頻訊號,而算出第1~第n低頻頻帶時間包絡。
此外,該當第1實施形態所述之聲音編碼裝置2的第2變形例,係亦可適用於第1實施形態所述之聲音編碼裝置2的第1變形例。
〔第1實施形態的聲音編碼裝置的第3變形例〕
圖21係第1實施形態所述之聲音編碼裝置2的第3變形例之構成的圖示,圖22係圖21的聲音編碼裝置2所進行之聲音編碼之程序的流程圖。
圖21所示的聲音編碼裝置2,係對第1實施形態所述之聲音編碼裝置2,取代掉降頻取樣部2a而具備頻帶合成濾波器組部2m這點有所不同。
該頻帶合成濾波器組部2m,係從頻帶分割濾波器組部2c收取頻率領域之訊號X(j,i),針對相當於低頻頻帶訊號之頻帶進行頻帶合成以取得縮減取樣訊號。頻帶合成所述之縮減取樣訊號之取得,係可依照例如,“ISO/IEC 14496-3”中所規定之“MPEG4 AAC”的SBR中的縮減取樣合成濾波器組(Downsampledsynthesis filterbank)之方法而進行(“ISO/IEC 14496-3 subpart 4 General Audio Coding”)。
此外,該當第1實施形態所述之聲音編碼裝置2的第3變形例,係亦可適用於第1實施形態所述之聲音編碼裝置2的第1~第2變形例。
第1實施形態所述之聲音編碼裝置2的第4變形例,係在前記第1實施形態所述之聲音編碼裝置2的時間包絡資訊算出部2f中算出g(l,i)之際,實施對應於上記第1實施形態所述之聲音解碼裝置1之第7變形例的所定處理。此外,和第1實施形態所述之聲音解碼裝置1的第7變形例同樣地,可在實施所定處理後使用低頻頻帶之時間包絡來算出g(l,i),也可使用低頻頻帶之時間包絡而算出g(l,i)後,實施所定處理以算出g(l,i)。
此外,該當第1實施形態所述之聲音編碼裝置2的第4變形例,係亦可適用於第1實施形態所述之聲音編碼裝置2的第1~第3變形例。
將該當第1實施形態所述之聲音編碼裝置2的第4變形例,適用於第1實施形態所述之聲音編碼裝置2的第1變形例之際,係基於對上記H(l,i)的g(l,i)之誤差,在上記時間包絡資訊算出控制資訊中,含有上記第1實施形態所述的聲音解碼裝置1中是否實施上記所定處理的資訊。
〔第2實施形態〕
接著,說明本發明的第2實施形態。
圖23係第2實施形態所述之聲音解碼裝置101之構成的圖示,圖24係圖23的聲音解碼裝置101所進行之聲音解碼之程序的流程圖。與圖23所示的聲音解碼裝置101的第1實施形態所述之聲音解碼裝置1的相異點係為,還有追加了頻率包絡重疊部(頻率包絡重疊手段)1q這點,和取代時間包絡調整部1i改為具備時間/頻率包絡調整部(時間頻率包絡調整手段)1p這點(1c~1e、1h、1j、及1p有時也會稱作頻帶擴充部(頻帶擴充手段)。)。
編碼序列解析部1d,係將從解多工化部1a所給予之高頻頻帶編碼序列加以解析,取得已被編碼之高頻頻帶生成用輔助資訊、和已被量化之時間/頻率包絡資訊。
編碼序列解碼/逆量化部1e,係將從編碼序列解析部1d所給予之已被編碼的高頻頻帶生成用輔助資訊加以解碼,獲得高頻頻帶生成用輔助資訊,並且將從編碼序列解析部1d所給予之已被量化的時間/頻率包絡資訊加以逆量化,取得時間/頻率包絡資訊。
頻率包絡重疊部1q,係從時間包絡算出部1g收取時間包絡ET(l,i),從編碼序列解碼/逆量化部1e收取頻率包絡資訊。然後,頻率包絡重疊部1q,係從頻率包絡資訊算出頻率包絡,將頻率包絡重疊至時間包絡。詳言之,頻率包絡重疊部1q係用以下的程序來進行處理。
首先,頻率包絡重疊部1q係將時間包絡以下式進行轉換。
接著,頻率包絡重疊部1q係將高頻頻帶分割成mH(mH≧1)個副頻帶。此處,將這些副頻帶表示成B(F) k(k=1,2,3,...,mH)。又,以下為了簡化論述,將表示副頻帶B(F) k(1≦k≦mH)之交界的以mH+1個之索引為要素的陣列GH,定義成使得訊號XH(j,i)、GH(k)≦j<GH(k+1)、t(s)≦i<t(s+1)、0≦s<sE會對應於副頻帶B(F) k之成分。其中,GH(1)=kx、GH(mH+1)=kmax+1。
接著,頻率包絡重疊部1q,係將頻率包絡以下面的數式來算出。
此處,上記sfdec(k,s)(其中1≦k≦mH、0≦s< sE),係對應於副頻帶B(F) k的尺度因子。
此外,上記頻率包絡,係亦可藉由以下數式而算出。
於本實施形態中,上記EF,dec(k,s)的形態,係不限定於上記例子。
此處,頻率包絡重疊部1q,係上記sfdec(k,s)以如下的方法加以算出。首先,上記sfdec(k,s)之內,對應於數個副頻帶者,係如下式表示,是設成不隨時間改變的常數(以下,將這些副頻帶所對應的索引k的集合,標示為NC)。
此處,雖然亦可C=0,但於本實施形態中,C的值係沒有規定。然後,頻率包絡重疊部1q係若整數1未被包含在集合Nc中,則從頻率包絡資訊,取得尺度因子sfdec(1、s)、0≦s<s。
其後,頻率包絡重疊部1q,係將下記的(步驟k)的處理重複k=2至k=mH,算出上記尺度因子。
(步驟k)
若整數k未被包含在集合Nc,則從頻率包絡資訊,取得尺度因子的差分dsfdec(k、s)、0≦s<s,以下式:
算出尺度因子,對整數k加算1而進入以下(步驟k)之處理。另一方面,若整數k有被包含在集合Nc中,則對整數k加算1而進入以下(步驟k)之處理。
又,從頻率包絡資訊,收取尺度因子之差分分sfdec(1、s)、0≦s<sE時,係將sfdec(0、s)、0≦s<sE,使用從頻帶分割濾波器組部1c所收取到的頻率領域訊號之低頻頻帶成分而加以算出,實施上記步驟k之處理。例如,於後述之數式63、64、及65中,將X(j,i)置換成Xdec(j,i),將使用在k=0時滿足0≦k1≦kh<kx之所定的k1、及kh所算出的sf(0、s),當作sfdec(0、s)。
此處,與上記例子不同,頻率包絡資訊,係亦可對應於尺度因子sfdec(k,s)本身。又,頻率包絡資訊係為,將第s(s≧1)個畫格中的尺度因子sfdec(k、s)、1≦k≦mH,使用第s-1個畫格中的尺度因子sfdec(k、s-1),以下式來算出之際,亦可為時間方向之差分dtsf (s、k)、1≦s<sE、1≦k≦mH
其中,此時,對應於初期值的sfdec(k、0)、1≦k≦mH,係用上記方法等別的手段來取得。
甚至,亦可從低頻頻帶成分之尺度因子、及高頻頻帶之副頻帶的尺度因子當中的至少1者以上,將前記副頻帶的尺度因子,使用內插.外插來求出。此時,頻率包絡資訊,係為上記內插.外插時所使用的副頻帶之比例因子、及高頻頻帶內的內插.外插參數。此外,上記低頻頻帶成分之比例因子的算出時,係使用從頻帶分割濾波器組部1c所收取到的頻率領域訊號之低頻頻帶成分。
又,內插.外插參數係亦可為所定之參數。甚至,亦可從前記所定之內插.外插參數、及頻率包絡資訊中所含之內插.外插參數,算出實際用於內插.外插的參數,進行前記比例因子的內插.外插。甚至,在為收取到頻率包絡資訊的情況下,及頻率包絡資訊不含內插.外插參數時的至少任1者以上的情況下,係亦可僅使用所定之內插.外插參數,進行前記比例因子的內插.外插。此外,本實施形態中,上記的內插.外插方法係沒有限定。
此外,上記頻率包絡資訊之形態係為一例,只要是表 示高頻頻帶之每一副頻帶之訊號功率或訊號振幅之頻率方向之變動的參數極熱。於本實施形態中,頻率包絡資訊的形態係沒有限定。
接著,頻率包絡重疊部1q係將上記EF(k,s)使用下面的數式來進行轉換。
接著,頻率包絡重疊部1q係使用如上記而被轉換的時間包絡E0(m,i)、及頻率包絡E1(m,i),藉由下式而算出量E2(m,i)。
又,上記E2(m,i),係亦可為由下式給定的狀態。
甚至,亦可為由下式給定的狀態。
此處,Q(m)、0≦m<kmax-kx係為滿足下式之條件的整數。
又,亦可為如下式的形態。
但是,於本發明中,上記E2(m,i)的形態,係不限定於上記例子。
接著,頻率包絡重疊部1q係使用上記E2(m,i)而將量E(m,i)以下式算出。
此處,係數C(s)係亦可由下式給定。
又亦可為下式:
也無妨。
時間/頻率包絡調整部1p,係將從高頻頻帶生成部1h所給予的高頻頻帶訊號XH(j,i)、kx≦j<kmax的時間/頻率包絡,使用從頻率包絡重疊部1q所給予的時間/頻率包絡E1(m,i)來調整。
此外,本發明的第1實施形態所述之聲音解碼裝置1 的第1~第6變形例,係亦可適用於該當本發明的第2實施形態所述之聲音解碼裝置101。
圖25係第2實施形態所述之聲音編碼裝置102之構成的圖示,圖26係圖25的聲音編碼裝置102所進行之聲音編碼之程序的流程圖。與圖25所示的聲音編碼裝置102,的第1實施形態所述之聲音編碼裝置2的不同點,係還追加了頻率包絡資訊算出部2n這點。
亦即,頻率包絡資訊算出部2n,係從頻帶分割濾波器組部2c,給予高頻頻帶之訊號X(j,i){0≦j<N、0≦i<t(sE)},算出頻率包絡資訊。詳言之,頻率包絡資訊的算出係可進行如下。
首先,頻率包絡資訊算出部2n,係將副頻帶B(F) k(其中,k=1,2,3,...,mH)上的功率之頻率包絡,以下式算出。
接著,頻率包絡資訊算出部2n係算出副頻帶B(F) k的比例因子sf(k、s)、1≦k≦mH。上記sf(k、s)係例如藉由下式而算出。
又,頻率包絡資訊算出部2n,係亦可將上記sf(k、s)依照“ISO/IEC 14496-3 4.B.18”所記載之方法,以下式算出。
又,亦可對應於聲音解碼裝置101側,以下式來設定:
然後,頻率包絡資訊算出部2n係亦可將頻率包絡資訊,當作上記尺度因子sf(k、s)(1≦k≦mH)。又,頻率包絡資訊係亦可為如下式的形態。亦即,亦可將上記尺度因子sf(k,s)之差分,以下式:
加以定義,將上記dsf(k、s)與sf(1、s)(0≦s<sE),當作頻率包絡資訊。
又,亦可和第2實施形態所述之聲音解碼裝置101的頻率包絡重疊部1q同樣地,使用低頻頻帶的頻率領域之訊號X(j,i)(0≦j<kx)而算出上記尺度因子sf(0,s),將藉由該當比例因子sf(0,s)所算出的dsf(1、s),含在頻率包絡資訊中。
又,頻率包絡資訊係亦可為,將高頻頻帶之上記尺度因子,從低頻頻帶成分之尺度因子進行外插而取近似之際,來自低頻頻帶的外插之參數。又,頻率包絡資訊係為,來自高頻頻帶當中之數個副頻帶的比例因子,將這些副頻帶以外的部分,使用內插.外插而求出之際,副頻帶之比例因子、及高頻頻帶內之內插.外插參數。亦可將前者與後者的形態合起來當作頻率包絡資訊。
此外,在本發明中,上記頻率包絡資訊,係不限定於上記例子。
作為頻率包絡資訊的量化.編碼方法,係亦可例如將頻率包絡資訊進行純量量化後,進行以霍夫曼編碼或算術編碼為代表的熵編碼。甚至亦可將頻率包絡資訊,以所定 的碼簿進行向量量化,將該索引予以編碼。
具體而言,例如,將上記尺度因子sf(k、s)進行純量量化後,進行以霍夫曼編碼或算術編碼為代表的熵編碼。甚至,亦可將上記dsf(k,s)進行純量量化後,進行熵編碼。甚至亦可將上記尺度因子sf(k,s),以所定的碼簿進行向量量化,將該索引予以編碼。甚至亦可將上記dsf(k,s),以所定的碼簿進行向量量化,將該索引予以編碼。然後,亦可將已純量量化之尺度因子sf(k,s)的差分,進行熵編碼。
例如,亦可依照“ISO/IEC 14496-3 4.B.18”所記載之方法,使用上式的sf(k、s),藉由下式:
而算出EDelta(k,s),將EDelta(k,s)進行霍夫曼編碼。
此處,某整數1是被含在集合Nc中時,亦可省略sf(1、s)(0≦s<sE)或dsf(1、s)(0≦s<sE)的上記量化、編碼。
此外,本發明中,上記頻率包絡資訊的量化、編碼, 係不限定於上記例子。
此外,本發明的第1實施形態所述之聲音編碼裝置2的第1~第4變形例,係亦可適用於該當本發明的第2實施形態所述之聲音編碼裝置102。例如,圖27係將本發明的第1實施形態所述之聲音編碼裝置2的第1變形例,適用於本發明的第2實施形態所述之聲音編碼裝置102之際的構成的圖示,圖28係圖27的聲音編碼裝置102所進行之聲音編碼之程序的流程圖。又,圖29係將本發明的第1實施形態所述之聲音編碼裝置2的第2變形例,適用於本發明的第2實施形態所述之聲音編碼裝置102之際的構成的圖示,圖30係圖29的聲音編碼裝置102所進行之聲音編碼之程序的流程圖。
〔第3實施形態〕
接著,說明本發明的第3實施形態。
圖31係第3實施形態所述之聲音解碼裝置201之構成的圖示,圖32係圖31的聲音解碼裝置201所進行之聲音解碼之程序的流程圖。與圖31所示的聲音解碼裝置201的第1實施形態所述之聲音解碼裝置1的相異點係為,還追加了時間包絡算出控制部1s這點,和取代了編碼序列解碼/逆量化部1e及時間包絡調整部1i改為具備編碼序列解碼/逆量化部1r及包絡調整部1t這點(1c~1d、1h、1j、及1r~1t有時也會稱作頻帶擴充部(頻帶擴充手段)。)。
編碼序列解析部1d,係將從解多工化部1a所給予之高頻頻帶編碼序列予以解析,獲得已被編碼之高頻頻帶生成用輔助資訊、及時間包絡算出控制資訊,還獲得已被編碼之時間包絡資訊、或已被編碼之第2頻率包絡資訊。
編碼序列解碼/逆量化部1r,係將從編碼序列解析部1d所給予之已被編碼的高頻頻帶生成用輔助資訊加以解碼,獲得高頻頻帶生成用輔助資訊。
高頻頻帶生成部1h,係將頻帶分割濾波器組部1c所給予的低頻頻帶之訊號Xdec(j,i)、0≦j<kx,使用從編碼序列解碼/逆量化部1r所給予的高頻頻帶生成用輔助資訊而對高頻頻帶進行複寫,以生成高頻頻帶之訊號Xdec(j,i),kx≦j≦kmax
時間包絡算出控制部1s,係基於從編碼序列解析部1d所給予的時間包絡算出控制資訊,調查包絡調整部1t是否將高頻頻帶之訊號的包絡以第2頻率包絡資訊進行調整。若包絡調整部1t不將高頻頻帶之訊號的包絡以第2頻率包絡資訊進行調整,則編碼序列解碼/逆量化部1r,係將從編碼序列解析部1d所給予之已被編碼的時間包絡資訊進行解碼/逆量化,獲得時間包絡資訊。另一方面,若包絡調整部1t將高頻頻帶之訊號的包絡以第2頻率包絡資訊進行調整,則時間包絡算出控制部1s係對低頻頻帶時間包絡算出部1f1~1fn輸出低頻頻帶時間包絡算出控制訊號,對時間包絡算出部1g係輸出時間包絡算出控制訊號,指示在低頻頻帶時間包絡算出部1f1~1fn及時間包 絡算出部1g中不進行包絡算出之處理。
又,編碼序列解碼/逆量化部1r係將從編碼序列解析部1d所給予之已被編碼的第2頻率包絡資訊,進行解碼/逆量化,而獲得第2頻率包絡資訊。然後,此情況下,包絡調整部1t係將從高頻頻帶生成部1h所給予的高頻頻帶訊號XH(j,i)(kx≦j<kmax)的頻率包絡,使用從編碼序列解碼/逆量化部1r所給予的第2頻率包絡資訊來進行調整。
具體而言,使用已被解碼/逆量化的上記第2頻率包絡資訊,依照聲音解碼裝置101的頻率包絡重疊部1q中的EF,dec(k,s)之算出方法,算出上記EF,dec(k,s)所對應之量E3(k,s)、1≦k≦mH、0≦s<sE,然後將上記E3(k,s)以下式進行轉換。
其後的處理,係依照聲音解碼裝置101的時間/頻率包絡調整部1p中的處理程序,取得已被調整包絡的高頻 帶訊號Y(i,j){kx≦j≦kmax、t(s)≦i<t(s+1)、0≦s<sE}。
此外,本發明第1實施形態所述之聲音解碼裝置1的第1~第7變形例,係亦可適用於該當本發明第3實施形態所述之聲音解碼裝置201。
圖35係第3實施形態所述之聲音編碼裝置202之構成的圖示,圖36係圖35的聲音編碼裝置202所進行之聲音編碼之程序的流程圖。與圖35所示的聲音編碼裝置202,的第1實施形態所述之聲音編碼裝置2的不同點,係還被追加了時間包絡算出控制資訊生成部2j及第2頻率包絡資訊算出部2o這點。
第2頻率包絡資訊算出部2o,係從頻帶分割濾波器組部2c,給予高頻頻帶之訊號X(j,i){kx≦j<N、t(s)≦i<t(s+1)、0≦s<sE},算出第2頻率包絡資訊(步驟S207之處理)。
該第2頻率包絡資訊係亦可用和前記第2實施形態所述之聲音編碼裝置102中的頻率包絡資訊之算出方法同樣的方法來求出。但是,於本實施形態中,第2頻率包絡資訊的算出方法係沒有限定。
量化/編碼部2g,係將時間包絡資訊、及第2頻率包絡資訊,進行量化、編碼。時間包絡資訊,係可和第1及第2實施形態之聲音編碼裝置的量化/編碼部2g中的量化、編碼相同。第2頻率包絡資訊,係可和第2實施形態的聲音編碼裝置的量化/編碼部2g中的頻率包絡資訊之量 化、編碼相同。但是,於本實施形態中,時間包絡資訊、及第2頻率包絡資訊的量化.編碼方法,係沒有限定。
時間包絡算出控制資訊生成部2j,係使用從頻帶分割濾波器組部2c所收取的頻率領域之訊號X(j,i)、從時間包絡資訊算出部2f所收取的時間包絡資訊、及從第2頻率包絡資訊算出部2o所收取的第2頻率包絡資訊當中之至少1者以上,來生成時間包絡算出控制資訊(步驟S209之處理)。所生成之時間包絡算出控制資訊,係只要是上記第3實施形態所述之聲音解碼裝置201中的時間包絡算出控制資訊即可。
時間包絡算出控制資訊生成部2j,係亦可和例如第1實施形態例的聲音編碼裝置2的第1變形例相同。
時間包絡算出控制資訊生成部2j,係例如和第1實施形態的聲音編碼裝置2的第1變形例同樣地,使用時間包絡資訊與第2頻率包絡資訊而分別生成擬似局部解碼高頻頻帶訊號,與原訊號做比較。若使用第2頻率包絡資訊所生成之擬似局部解碼高頻頻帶訊號是較接近原訊號,則作為時間包絡算出控制資訊,係生成用來指示在解碼裝置中以第2頻率包絡資訊來調整高頻頻帶訊號的資訊。上記各擬似局部解碼高頻頻帶訊號與原訊號之比較,係例如亦可算出差分訊號,判定差分訊號是否較小。甚至,亦可先算出上記各擬似局部解碼高頻頻帶訊號、及原訊號的時間包絡,然後算出上記各擬似局部解碼高頻頻帶訊號與原訊號的時間包絡之差分,判斷前記差分是否較小而為之。甚 至,亦可藉由判斷與上記原訊號之差分訊號、或/及包絡的差分的最大值是否較小來為之。於本實施形態中,比較方法係不限定於上記方法。
時間包絡算出控制資訊生成部2j,係亦可在生成上記時間包絡算出控制資訊之際,還會使用已被量化之時間包絡資訊、及已被量化之第2頻率包絡資訊當中之至少一者。
編碼構成部2h,係將從編碼/逆量化部2g所收取的已被編碼之高頻頻帶生成用輔助資訊,和若時間包絡算出控制資訊是指示在解碼裝置中以第2頻率包絡資訊來調整高頻頻帶訊號的資訊時,則與已被編碼之第2頻率包絡資訊、若不該當於上記情況時則與已被編碼之時間包絡資訊,構成高頻頻帶編碼序列(步驟S211之處理)。
此外,本發明的第1實施形態所述之聲音編碼裝置2的第1~第4變形例,係亦可適用於該當本發明第3實施形態所述之聲音編碼裝置202。
〔第4實施形態〕
接著,說明本發明的第4實施形態。
圖33係第4實施形態所述之聲音解碼裝置301之構成的圖示,圖34係圖33的聲音解碼裝置301所進行之聲音解碼之程序的流程圖。與圖33所示的聲音解碼裝置201的第1實施形態所述之聲音解碼裝置1的相異點係為,還追加了時間包絡算出控制部1s及頻率包絡重疊部 1u這點,和取代了編碼序列解碼/逆量化部1e及時間包絡調整部1i改為具備編碼序列解碼/逆量化部1r及時間/頻率包絡調整部1v這點(1c~1d、1h、1j、1r~1s及1u~1v有時也會稱作頻帶擴充部(頻帶擴充手段)。)。
編碼序列解析部1d,係將從解多工化部1a所給予之高頻頻帶編碼序列予以解析,獲得已被編碼之高頻頻帶生成用輔助資訊、及時間包絡算出控制資訊,還獲得已被編碼之時間包絡資訊、及已被編碼之頻率包絡資訊、或已被編碼之第2頻率包絡資訊。
時間包絡算出控制部1s,係基於從編碼序列解析部1d所給予的時間包絡算出控制資訊,調查包絡調整部1v是否將高頻頻帶之訊號的包絡以第2頻率包絡資訊進行調整,若時間/頻率包絡調整部1v未將高頻頻帶之訊號的包絡以第2頻率包絡資訊進行調整,則編碼序列解碼/逆量化部1r係將從編碼序列解析部1d所給予之已被編碼的時間包絡資訊進行解碼/逆量化,獲得時間包絡資訊。
另一方面,若時間/頻率包絡調整部1v有將高頻頻帶之訊號的包絡以第2頻率包絡資訊進行調整,則和第3實施形態的步驟S190之處理同樣地處理。又,時間/頻率包絡調整部1v之處理也和第3實施形態的步驟S191之處理相同。
此外,本發明第1實施形態所述之聲音解碼裝置1的第1~第7變形例,係亦可適用於該當本發明第4實施形態所述之聲音解碼裝置301。
圖37係第4實施形態所述之聲音編碼裝置302之構成的圖示,圖38係圖37的聲音編碼裝置302所進行之聲音編碼之程序的流程圖。與圖37所示的聲音編碼裝置302,的第1實施形態所述之聲音編碼裝置2的不同點,係還被追加了時間包絡算出控制資訊生成部2j、頻率包絡資訊算出部2p、及第2頻率包絡資訊算出部2o這點。
量化/編碼部2g,係將時間包絡資訊、頻率包絡資訊、及第2頻率包絡資訊,進行量化、編碼。該時間包絡資訊,係可和第1及第2實施形態之編碼裝置的量化/編碼部2g中的量化、編碼相同。頻率包絡資訊、第2頻率包絡資訊,係和第2實施形態的編碼裝置的量化/編碼部2g中的頻率包絡資訊之量化、編碼相同。但是,於本發明中,時間包絡資訊、及第2頻率包絡資訊的量化.編碼方法,係沒有限定。
時間包絡算出控制資訊生成部2j,係使用從頻帶分割濾波器組部2c所收取的頻率領域之訊號X(j,i)、從時間包絡資訊算出部2f所收取的時間包絡資訊、從頻率包絡資訊算出部2p所收取的頻率包絡資訊、及從第2頻率包絡資訊算出部2o所收取的第2頻率包絡資訊當中之至少1者以上,來生成時間包絡算出控制資訊(步驟S250之處理)。所生成之時間包絡算出控制資訊,係只要是上記第4實施形態所述之聲音解碼裝置301中的時間包絡算出控制資訊即可。
時間包絡算出控制資訊生成部2j,係亦可和例如第1 實施形態的編碼裝置2的第1變形例相同。甚至,時間包絡算出控制資訊生成部2j,係亦可和例如第3實施形態所述之聲音編碼裝置202相同。
時間包絡算出控制資訊生成部2j,係例如和第1實施形態的編碼裝置2的第1變形例同樣地,使用時間包絡資訊與頻率包絡資訊、及第2頻率包絡資訊,而分別生成擬似局部解碼高頻頻帶訊號,與原訊號做比較。若使用第2頻率包絡資訊所生成之擬似局部解碼高頻頻帶訊號是較接近原訊號,則作為時間包絡算出控制資訊,係生成用來指示在解碼裝置中以第2頻率包絡資訊來調整高頻頻帶訊號的資訊。
上記各擬似局部解碼高頻頻帶訊號與原訊號之比較,係亦可和第3實施形態所述之聲音編碼裝置202的時間包絡算出控制資訊生成部2j相同,於本實施形態中,比較方法係沒有限定。
時間包絡算出控制資訊生成部2j,係亦可在生成上記時間包絡算出控制資訊之際,還會使用已被量化之時間包絡資訊、已被量化之頻率包絡資訊、及已被量化之第2頻率包絡資訊當中之至少一者。
編碼構成部2h,係將從編碼/逆量化部1g所收取的已被編碼之高頻頻帶生成用輔助資訊,和若時間包絡算出控制資訊是指示在解碼裝置中以第2頻率包絡資訊來調整高頻頻帶訊號的資訊時,則與已被編碼之第2頻率包絡資訊、若不該當於上記情況時則與已被編碼之時間包絡資 訊、及已被編碼之頻率包絡資訊,來構成高頻頻帶編碼序列(步驟S252之處理)。
此外,本發明的第1實施形態所述之聲音編碼裝置2的第1~第4變形例,係亦可適用於該當本發明的第4實施形態所述之聲音編碼裝置302。
〔第1實施形態的聲音解碼裝置的第8變形例〕
在本變形例中,第1實施形態所述之聲音解碼裝置1的時間包絡算出部1g中,會對已算出之時間包絡,基於所定函數實施處理。例如,時間包絡算出部1g,係將時間包絡進行時間上的正規化處理,以下式算出時間包絡ET’(l,i)。
在本變形例中,在算出時間包絡ET’(l,i)後,在其以後之處理中,就可將量ET(l,i)置換成量ET’(l,i)而進行處理。
若依據如此變形例,則可不改變高頻頻帶生成部1h中所生成之高頻頻帶訊號XH(j,i)的訊框s中的頻帶FH(1)≦j<FH(l+1)的能量總量,可以僅調整訊框s的 頻帶FH(1)≦j<FH(l+1)內的高頻頻帶訊號XH(j,i)(FH(1)≦j<FH(l+1))的時間性形狀。
此外,上記第1實施形態所述之聲音解碼裝置1的第8變形例,係亦可適用於第1實施形態所述之聲音解碼裝置1的第1~第7變形例、及第2~第4實施形態所述之各聲音解碼裝置,此時只要將ET(l,i)置換成ET’(l,i)即可。
〔第1實施形態的聲音解碼裝置的第9變形例〕
在本變形例中,於第1實施形態所述之聲音解碼裝置1的第1~第n低頻頻帶時間包絡算出部1f1~1fn中,將量L0(k,i)在時間方向上進行平滑化以取得時間包絡L1(k,i)之際,從訊框s-1前進至訊框s之際,會將L0(k,i)(t(s)-d≦i<t(s))加以保持。若依據本變形例,則靠近於與訊框s-1之交界的訊框s的量L0(k,i)(更具體而言係為L0(k,i)(t(s)≦i<t(s)+d))也能進行平滑化。
此外,上記第1實施形態所述之聲音解碼裝置1的第9變形例係亦可適用於第1實施形態所述之聲音解碼裝置1的第1~第8變形例、及第2~第4實施形態所述之各聲音解碼裝置。
〔第1實施形態的聲音編碼裝置的第5變形例〕
在本變形例中,第1實施形態的聲音編碼裝置2所述 之時間包絡資訊算出部2f中的時間包絡資訊之算出,係基於參照時間包絡H(l,i)與上記g(l,i)之相關而實施。例如,時間包絡資訊算出部2f係如以下所述般地算出時間包絡資訊。
亦即,藉由下式,算出H(l,i)與g(l,i)的相關係數corr(l)。
將上記相關係數corr(l)與所定閾值進行比較,基於該比較結果而算出時間包絡資訊。甚至,亦可求出相當於corr2(l)的值而和所定閾值進行比較,基於該比較結果而算出時間包絡資訊,也可實現之。
例如,如下述般地算出時間包絡資訊。令上述與相關係數進行比較之所定閾值為corrth(l),令gdec(l,i)是以數式21來給定,藉由下式而算出時間包絡資訊。
在上記的例子中所算出的時間包絡資訊,被輸入至第1實施形態的解碼裝置1的第2變形例之際,係於副頻帶B(T) 1中,若Al,k(s)=0,Al,0(s)=const(0)的情況下(亦即,在編碼裝置中相關係數小於所定閾值的情況下),則藉由時間包絡算出控制部1m,向第k個(k>0)低頻頻帶時間包絡算出部1fk輸出低頻頻帶時間包絡算出控制訊號,控制成不會實施低頻頻帶時間包絡算出部1fk中的低頻頻帶時間包絡算出處理。另一方面,若Al,k(s)=const(k),Al,0(s)=0的情況下(亦即,在編碼裝置中相關係數大於所定閾值的情況下),則藉由時間包絡算出控制部1m,向第k個(k>0)低頻頻帶時間包絡算出部1fk輸出低頻頻帶時間包絡算出控制訊號,控制成會實施低頻頻帶時間包絡算出部1fk中的低頻頻帶時間包絡算出處理。
此外,於本變形例中,只要基於參照時間包絡H(l,i)與上記g(l,i)之相關而算出時間包絡資訊即可,不限定於上記的方法。
若是基於上記第1實施形態所述之聲音編碼裝置2中所記載之參照時間包絡H(l,i)與g(l,i)的誤差(或加權誤差)來算出時間包絡資訊的情況下,則基於參照時間包絡H(l,i)與g(l,i)是一致到何種程度,來算出時間包絡資訊。另一方面,本變形例中,係基於參照時間包絡H(l,i)與g(l,i)之形狀是相似到何種程度,來算出時 間包絡資訊。
此外,上記第1實施形態所述之聲音編碼裝置2的第5變形例,係亦可適用於第1實施形態的聲音編碼裝置2的第1~第5變形例、及第2~第4實施形態所述之聲音編碼裝置。
〔第2實施形態的聲音解碼裝置的第1變形例〕
在本變形例中,係在第2實施形態的聲音解碼裝置101所述之頻率包絡重疊部1q中,對頻率包絡EF,dec(k,s)基於所定的函數而實施處理。例如,頻率包絡重疊部1q係基於,下式所給予的將頻率包絡EF,dec(k,s)進行平滑化之函數,來實施處理。
其中,
sch(j)、dh係分別為所定之平滑化係數、平滑化次數。此時,在以後處理中,只要將EF,dec,Filt(k,i)置換成EF,dec(k,s)而進行處理即可。
甚至,在上記數式73中可含有,基於該當頻率包絡EF,dec(k,s)所對應之訊框的訊號特性,而決定是否將頻率包絡EF,dec(k,s)進行平滑化的函數。甚至,表示是否平滑化之資訊是被包含在編碼序列中,而可含有基於該資訊來決定是否將頻率包絡EF,dec(k,s)進行平滑化的函數。
此外,上記第2實施形態的聲音解碼裝置101的第1變形例,係亦可適用於第4實施形態所述之聲音解碼裝置。
〔第2實施形態的聲音解碼裝置的第2變形例〕
在第2實施形態的聲音解碼裝置101所述之頻率包絡重疊部1q中,量E(m,i)係為,藉由C(s)而將E2(m,i)補正後的值(數式60)。又,若根據數式61,則訊框s的頻帶kx≦m≦kmax中的時間/頻率包絡調整後之高頻頻帶訊號的能量,會被補正成訊框s的頻帶kx≦m≦kmax中的時間包絡E0(m,i)之總和。另一方面,若根據數式62,則訊框s的頻帶kx≦m≦kmax中的時間/頻率包絡調整後之高頻頻帶訊號的能量,會被補正成訊框s的頻帶kx≦m≦kmax中的頻率包絡E1(m,i)之總和。在本變形例中,為了使C(s)在訊框s的頻帶kx≦m≦kmax中的時間/頻率包絡調整後之高頻頻帶訊號的能量被進行時間/頻率包絡調整後仍會被保持,而藉由下式來給定。
甚至,為了使訊框s的頻帶kx≦m≦kmax中的時間/頻率包絡調整後之高頻頻帶訊號的能量,會被補正成訊框s的頻帶kx≦m≦kmax中的時間包絡E2(m,i)之總和,而可藉由下式來給定C(s)。
[數76]C(s)=1
此外,上記第2實施形態的聲音解碼裝置101的第2變形例,係亦可適用於第2實施形態的聲音解碼裝置101的第1變形例、及第4實施形態所述之聲音解碼裝置。
〔第2實施形態所述之聲音解碼裝置的第3變形例〕
圖39係本發明的第2實施形態所述之聲音解碼裝置101的第3變形例之構成的圖示,圖40係圖39的聲音解碼裝置101所進行之聲音解碼之程序的流程圖。本變形例與第2實施形態之聲音解碼裝置101的相異點為,取代了頻率包絡重疊部1q改為具備頻率包絡算出部1w這點。
本變形例的頻率包絡算出部1w,係和第2實施形態 的頻率包絡重疊部1q同樣地,算出頻率包絡E1(m,s)(步驟S119a)。
然後,時間/頻率包絡調整部1p,係使用時間包絡ET(l,i)、及頻率包絡E1(m,s),將時間/頻率包絡之調整,例如進行如下(步驟S120)。
亦即,時間/頻率包絡調整部1p,係和頻率包絡重疊部1q同樣地,將時間包絡ET(l,i)轉換成E0(m,i)。
又,和“MPEG4 AAC”的SBR中的HF調整(HF adjustment)同樣地,被編碼序列解碼/逆量化部1e所給予的訊框s中的雜訊基準比例因子Q(m,s),係用下式進行轉換。
又,使用藉由決定是否將被編碼序列解碼/逆量化部1e所給予之正弦波進行附加的參數所求出的量S(m,s),訊框s中的正弦波之位準係由下式所給定。
又,增益係使用頻率包絡E1(m,s)、由編碼序列解碼/逆量化部1e所給予的訊框s中的雜訊基準比例因子Q(m,s)、由編碼序列解碼/逆量化部1e所給予的訊框s之參數所依存的函數δ(s),而由下式所給定。
此處,量Ecurr(m,s)係被下式所定義。
又,亦可被下式所定義。
又,S’(m,s)係為用來表示,在訊框s中,含有索引m所代表之頻率的副頻帶B(F) k(GH(k)≦m<GH(k+1))內所被附加的正弦波是否存在的函數,若有被附加之正弦波存在時係為“1”,其他情形則為“0”。
然後,使用上記Ecurr(m,s),可算出下記量X’H(m+kx,i)。
或者,上記量X’H(m+kx,i)係亦可從以下的式子來算出。
或者,上記量X’H(m+kx,i)係亦可從以下的式子來算出。
若如此處理,則可將高頻頻帶訊號XH(m+kx,i),於頻率索引m、或副頻帶B(F) k中,在時間方向上進行平坦化。因此,藉由實施之後的處理,就不會依循高頻頻帶訊號XH(m+kx,i)的時間包絡,可基於時間包絡算出部1g中所算出的時間包絡,輸出高頻頻帶之訊號。
此處,對於增益、雜訊基準比例因子、正弦波位準, 實施基於所定函數之處理,而可算出增益G2(m,s)、雜訊基準比例因子Q3(m,s)、正弦波位準S3(m,s)。例如,和“MPEG4 AAC”的SBR中的HF調整(HF adjustment)同樣地,對上記增益、雜訊基準比例因子、正弦波位準,基於用來避免多餘雜訊之附加的增益限制(增益限制器、Gain limiter)、增益限制所致之能量損失之補償(增益加強器、Gain booster)之函數,來實施處理,算出增益G2(m,s)、雜訊基準比例因子Q3(m,s)、正弦波位準S3(m,s)(具體例請參照ISO/IEC 1449-3 4.6.18.7.5)。在實施了上記所定之處理的情況下,在以後的處理中,是取代了G(m,s),Q2(m,s),S2(m,s),改用G2(m,s),Q3(m,s),S3(m,s)。
使用上記所得到的增益G(m,s)、雜訊基準比例因子Q2(m,s)、及時間包絡E0(m,i),而算出由下式所給定的量G3(m,i)、Q4(m,i)。在下式中,將增益、及雜訊基準比例因子基於時間包絡而予以算出,經過之後的處理,最終會由時間/頻率包絡調整部1p,輸出時間/頻率包絡經過調整的訊號。
此外,在上式中,雖然是將增益、及雜訊基準比例因子基於時間包絡而予以算出,但和增益、及雜訊基準比例因子同樣地,正弦波位準亦可基於時間包絡而算出。
甚至,亦可對上記G3(m,i)、Q4(m,i)實施基於所定函數之處理。例如,可基於平滑化函數而進行處理。算出由下式所給定的GFilt(m,i)、QFilt(m,i)。
其中,sch(j)、dh係分別為所定之平滑化係數、平滑化次數。又,GTemp(m,i)、QTemp(m,i)係由下式所給定。
甚至,即使藉由基於下式函數之處理,也可同樣地獲得平滑化之效果。
其中,wold(m,i)、wcurr(m,i)係分別為所定之加權係數。又,GTemp(m,i)、QTemp(m,i)係由下式所給定。
又,Gold(m)係前1個訊框(具體而言係為訊框s-1)中的與訊框s之交界的時間索引(具體而言係為t(s)-1)之增益,是由下式之任一者所給定。
在實施了基於上記所定函數之處理的情況下,在以後的處理中,是取代了G3(m,s),Q4(m,s),改用GFilt(m,s),QFilt(m,s)。
又,上記進行平滑化之函數,係可含有,基於由編碼序列解碼/逆量化部1e所給予的訊框s之參數而決定是否進行上記平滑化的函數。甚至,表示是否平滑化之資訊是被包含在編碼序列中,而亦可含有基於該資訊來決定是否進行上記平滑化的函數。甚至可含有,基於上記當中之任一方來決定是否進行上記平滑化的函數。
最後,時間/頻率包絡調整部1p係可藉由下式,獲得時間/頻率包絡經過調整的訊號。
[數97]W 1(m,i)=G 3(m,i).X H (m+k x ,i) Re{W 2(m,i)}=Re{W 1(m,i)}+Q 4(m,i).V 0(f(i)) Im{W 2(m,i)}=Im{W 1(m,i)}+Q 4(m,i).V 1(f(i))
此處,V0、V1係為用來規定雜訊成分的陣列,f係用來將索引i投影成上記陣列上之索引的函數,φRe,sin、φIm,sin係用來規定正弦波成分之相位的陣列,fsin係用來將索引i投影成上記陣列上之索引的函數(具體例請參照“ISO/IEC 14496-3 4.6.18”)。
或者,於上記數式97中,係亦可取代XH(m+kx,i)改用X’H(m+kx,i)。
此外,若將上述的“MPEG4 AAC”的SBR中的HF調整的增益加強器,對本發明之第2實施形態的聲音解碼裝置101所述之頻率包絡重疊部1q做適用,則會對每一副頻帶B(F) k(GH(k)≦j<GH(k+1)),以訊框s單位,補償增益限制所致之能量損失。另一方面,若依據下式, 則會對每一副頻帶B(F) k(GH(k)≦j<GH(k+1)),針對高頻頻帶訊號XH(j,i)係以時間索引i單位,補償增益限制所致之能量損失。
上式中,對增益G(m,s)、雜訊比例因子Q2(m,s),可適用上述的“MPEG4 AAC”的SBR中的HF調整的增益限制器。
使用上記增益G2(m,i)、及雜訊比例因子Q3(m,i),取代數式89、90,改用下式來給定GTemp(m,i)、QTemp(m,i)。
然後,若將數式99置換成下式,則會對每一副頻帶B(T) k(FH(k)≦j<FH(k+1)),針對高頻頻帶訊號XH(j,i)係以時間索引i單位,補償增益限制所致之能量損失。
然後,若將數式99置換成下式,則會對每一頻率索引m,針對高頻頻帶訊號XH(j,i)係以時間索引i單位,補償增益限制所致之能量損失。
或者,在算出上記的量GBoostTemp(m.i)之際,可取代XH(m+kx,i)而改用X’H(m+kx,i)。
在第2實施形態的聲音解碼裝置101所述之時間/頻率包絡調整部1p中,時間/頻率包絡之調整,係和第1實施形態的聲音解碼裝置1所述之時間包絡調整部1i同樣地,使用從頻率包絡重疊部1q所收取的量E(m,i),藉由和“MPEG4 AAC”的SBR中的HF調整(HF Adjustment)類似的手段來進行。因此,和“MPEG4 AAC”的SBR中的HF調整(HF adjustment)同樣地,對增益、雜訊基準比例因子、正弦波位準,基於用來避免多餘雜訊之附加的增益限制(增益限制器、Gain limiter)、增益限制所致之能量損失之補償(增益加強器、Gain booster)之函數,來實施處理時,將該當處理對時間索引i(t(s)≦i<t(s+1))來實施。另一方面,若依據本變形例,則對增益、雜訊基準比例因子、正弦波位準,基於用來避免多餘雜訊之附加的增益限制(增益限制器、Gain limiter)、增益限制所致之能量損失之補償(增益加強器、Gain booster)之函數,來實施處理時,只要將該當 處理當中至少1者處理,對訊框s實施即可。因此,在本變形例中,相較於第2實施形態的聲音解碼裝置101,可削減上記處理的演算量。
此外,上記第2實施形態的聲音解碼裝置101的第3變形例,係亦可適用於第2實施形態的聲音解碼裝置101的第1~第2變形例、及第4實施形態所述之聲音解碼裝置。
〔第2實施形態的聲音解碼裝置101的第3變形例的其他形態〕
在上記變形例中,第1實施形態的聲音解碼裝置1的第1、第2、第3變形例、及執行該當變形例之處理之至少一者以上的第1實施形態的聲音解碼裝置1的第5變形例做適用時,會發生時間包絡算出部1g不算出時間包絡ET(l,i)的情形。此種情況下,在E0(m,i)為必要的演算處理中,將E0(m,i)置換成1來執行。藉由此方法,E0(m,i)、E0(m,i)的乘冪、乘以E0(m,i)之平方根的處理係可省略,可削減演算量。此外,在使用上記方法的處理中,時間/頻率包絡調整部1p係不需要算出E0(m,i)。
〔第1實施形態所述之聲音編碼裝置2的第6變形例〕
時間包絡資訊算出部2f,係基於:從頻帶分割濾波器組部2c所得之頻率領域之訊號X(j,i)、透過聲音編碼 裝置2之通訊裝置而被接收的來自外部之輸入訊號、及來自降頻取樣部2a之輸出而被獲得之已被縮減取樣的低頻頻帶之時間領域訊號當中之至少1者以上的訊號的特性,而算出時間包絡資訊。作為上記訊號之特性,係為例如訊號的過渡性、調性、雜音性等等,但在本變形例中,訊號特性係不限定於這些具體例。
此外,本變形例係亦可適用於第1實施形態的聲音編碼裝置2的第1~第5變形例、及第2~第4實施形態所述之聲音編碼裝置。
〔第1實施形態所述之聲音編碼裝置2的第7變形例〕
時間包絡算出控制資訊生成部2j,係基於:從頻帶分割濾波器組部2c所得之頻率領域之訊號X(j,i)、透過聲音編碼裝置2之通訊裝置而被接收的來自外部之輸入訊號、及來自降頻取樣部2a之輸出而被獲得之已被縮減取樣的低頻頻帶之時間領域訊號當中之至少1者以上之訊號的訊號特性,而生成關於聲音解碼裝置1中之低頻頻帶時間包絡算出方法的時間包絡算出控制資訊。作為上記訊號之特性,係為例如訊號的過渡性、調性、雜音性等等,但在本變形例中,訊號特性係不限定於這些具體例。
此外,本變形例係亦可適用於第1實施形態的聲音編碼裝置2的第1~第6變形例、及第2~第4實施形態所述之聲音編碼裝置。
〔第1~第4實施形態的聲音編碼裝置的量化/編碼部〕
關於第1~第4實施形態的聲音編碼裝置的量化/編碼部2g,係當然亦可將用來決定是否附加雜訊基準比例因子、或正弦波的參數,也進行量化、編碼。
〔產業上利用之可能性〕
本發明係將聲音解碼裝置、聲音編碼裝置、聲音解碼方法、聲音編碼方法、聲音解碼程式、及聲音編碼程式作為使用用途,藉由將解碼訊號中的時間包絡調整成失真較少的形狀,可獲得充分改善前回聲及後回聲的再生訊號。
1‧‧‧聲音解碼裝置
1a‧‧‧解多工化部
1b‧‧‧低頻頻帶解碼部
1c‧‧‧頻帶分割濾波器組部
1d‧‧‧編碼序列解析部
1e‧‧‧逆量化部
1f1‧‧‧第1低頻頻帶時間包絡算出部
1fn‧‧‧第n低頻頻帶時間包絡算出部
1g‧‧‧時間包絡算出部
1h‧‧‧高頻頻帶生成部
1i‧‧‧時間包絡調整部
1j‧‧‧頻帶合成濾波器組部

Claims (4)

  1. 一種聲音解碼裝置,係屬於將聲音訊號所編碼而成之編碼序列予以解碼的聲音解碼裝置,其係具備:解多工化手段,係將前記編碼序列,解多工化成為低頻頻帶編碼序列與高頻頻帶編碼序列;和低頻頻帶解碼手段,係將已被前記解多工化手段進行解多工化的前記低頻頻帶編碼序列加以解碼,以獲得低頻頻帶訊號;和頻率轉換手段,係將已被前記低頻頻帶解碼手段所得到之前記低頻頻帶訊號,轉換成頻率領域;和高頻頻帶編碼序列解析手段,係將已被前記解多工化手段進行解多工化的前記高頻頻帶編碼序列加以解析,取得已被編碼之高頻頻帶生成用輔助資訊及時間包絡資訊;和編碼序列解碼逆量化手段,係將已被前記高頻頻帶編碼序列解析手段所取得到的前記高頻頻帶生成用輔助資訊及時間包絡資訊,進行解碼及逆量化;和高頻頻帶生成手段,係根據前記低頻頻帶解碼手段所得到的前記低頻頻帶訊號,使用已被前記編碼序列解碼逆量化手段所解碼之前記高頻頻帶生成用輔助資訊,生成前記聲音訊號的高頻頻帶成分;和第1~第N(N係2以上之整數)低頻頻帶時間包絡算出手段,係將已被前記頻率轉換手段轉換成頻率領域的前 記低頻頻帶訊號進行分析,取得複數低頻頻帶之時間包絡;和時間包絡算出手段,係使用已被前記編碼序列解碼逆量化手段所取得到的前記時間包絡資訊、及已被前記低頻頻帶時間包絡算出手段所取得到的前記複數之低頻頻帶之時間包絡,而算出高頻頻帶之時間包絡;和時間包絡調整手段,係使用已被前記時間包絡算出手段所取得之前記時間包絡,來調整已被前記高頻頻帶生成手段所生成之高頻頻帶成分的時間包絡;和訊號輸出手段,係將已被前記時間包絡調整手段所調整之前記高頻頻帶成分,和已被前記低頻頻帶解碼手段所解碼之前記低頻頻帶訊號,進行加算,並輸出含有全頻帶成分的時間領域訊號;前記時間包絡算出手段所做的前記高頻頻帶之時間包絡的算出係含有,在時間方向上進行平滑化之處理。
  2. 如請求項1所記載之聲音解碼裝置,其中,前記時間包絡算出手段,係藉由將使用了預先被複數準備的前記複數之低頻頻帶之時間包絡的所定處理,基於前記時間包絡資訊來做切換實施,以算出前記高頻頻帶之時間包絡;前記所定處理中係包含有:使用了在時間方向上進行平滑化之處理的前記高頻頻帶之時間包絡的算出所需之處理。
  3. 一種聲音解碼方法,係屬於將聲音訊號所編碼而成 之編碼序列予以解碼的聲音解碼方法,其係具備:解多工化步驟,係由解多工化手段,將前記編碼序列,解多工化成為低頻頻帶編碼序列與高頻頻帶編碼序列;和低頻頻帶解碼步驟,係由低頻頻帶解碼手段,將已被前記解多工化手段進行解多工化的前記低頻頻帶編碼序列加以解碼,以獲得低頻頻帶訊號;和頻率轉換步驟,係由頻率轉換手段,將已被前記低頻頻帶解碼手段所得到之前記低頻頻帶訊號,轉換成頻率領域;和高頻頻帶編碼序列解析步驟,係由高頻頻帶編碼序列解析手段,將已被前記解多工化手段進行解多工化的前記高頻頻帶編碼序列加以解析,取得已被編碼之高頻頻帶生成用輔助資訊及時間包絡資訊;和編碼序列解碼逆量化步驟,係由編碼序列解碼逆量化手段,將已被前記高頻頻帶編碼序列解析手段所取得到的前記高頻頻帶生成用輔助資訊及時間包絡資訊,進行解碼及逆量化;和高頻頻帶生成步驟,係由高頻頻帶生成手段,根據前記低頻頻帶解碼手段所得到的前記低頻頻帶訊號,使用已被前記編碼序列解碼逆量化手段所解碼之前記高頻頻帶生成用輔助資訊,生成前記聲音訊號的高頻頻帶成分;和第1~第N低頻頻帶時間包絡算出步驟,係由第1~ 第N(N係2以上之整數)低頻頻帶時間包絡算出手段,將已被前記頻率轉換手段轉換成頻率領域的前記低頻頻帶訊號進行分析,取得複數低頻頻帶之時間包絡;和時間包絡算出步驟,係由時間包絡算出手段,使用已被前記編碼序列解碼逆量化手段所取得到的前記時間包絡資訊、及已被前記低頻頻帶時間包絡算出手段所取得到的前記複數之低頻頻帶之時間包絡,而算出高頻頻帶之時間包絡;和時間包絡調整步驟,係由時間包絡調整手段,使用已被前記時間包絡算出手段所取得之前記時間包絡,來調整已被前記高頻頻帶生成手段所生成之高頻頻帶成分的時間包絡;和訊號輸出步驟,係由訊號輸出手段,將已被前記時間包絡調整手段所調整之前記高頻頻帶成分,和已被前記低頻頻帶解碼手段所解碼之前記低頻頻帶訊號,進行加算,並輸出含有全頻帶成分的時間領域訊號;前記時間包絡算出步驟中的前記高頻頻帶之時間包絡的算出係含有,在時間方向上進行平滑化之處理。
  4. 如請求項3所記載之聲音解碼方法,其中,在前記時間包絡算出步驟中,係藉由將使用了預先被複數準備的前記複數之低頻頻帶之時間包絡的所定處理,基於前記時間包絡資訊來做切換實施,以算出前記高頻頻帶之時間包絡;前記所定處理中係包含有:使用了在時間方向上進行 平滑化之處理的前記高頻頻帶之時間包絡的算出所需之處理。
TW105135127A 2011-02-18 2012-02-17 Sound decoding apparatus and method TWI576830B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2011033917 2011-02-18
JP2011215591 2011-09-29

Publications (2)

Publication Number Publication Date
TW201706983A TW201706983A (zh) 2017-02-16
TWI576830B true TWI576830B (zh) 2017-04-01

Family

ID=46672679

Family Applications (3)

Application Number Title Priority Date Filing Date
TW101105268A TWI547941B (zh) 2011-02-18 2012-02-17 A sound decoding apparatus, a speech coding apparatus, a voice decoding method, a speech coding method, a speech decoding program, and a speech coding program
TW105135127A TWI576830B (zh) 2011-02-18 2012-02-17 Sound decoding apparatus and method
TW105117200A TW201637001A (zh) 2011-02-18 2012-02-17 聲音解碼裝置及方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
TW101105268A TWI547941B (zh) 2011-02-18 2012-02-17 A sound decoding apparatus, a speech coding apparatus, a voice decoding method, a speech coding method, a speech decoding program, and a speech coding program

Family Applications After (1)

Application Number Title Priority Date Filing Date
TW105117200A TW201637001A (zh) 2011-02-18 2012-02-17 聲音解碼裝置及方法

Country Status (19)

Country Link
US (1) US8756068B2 (zh)
EP (5) EP4020466B1 (zh)
JP (7) JP5977176B2 (zh)
KR (7) KR102208914B1 (zh)
CN (2) CN104916290B (zh)
AU (1) AU2012218409B2 (zh)
BR (2) BR112013020987B1 (zh)
CA (5) CA3239539A1 (zh)
DK (5) DK3998607T3 (zh)
ES (4) ES2949240T3 (zh)
FI (2) FI3998607T3 (zh)
HU (3) HUE058847T2 (zh)
MX (2) MX339764B (zh)
PL (5) PL3407352T3 (zh)
PT (5) PT3567589T (zh)
RU (8) RU2599966C2 (zh)
SG (1) SG192796A1 (zh)
TW (3) TWI547941B (zh)
WO (1) WO2012111767A1 (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PL3407352T3 (pl) * 2011-02-18 2022-08-08 Ntt Docomo, Inc. Dekoder mowy, koder mowy, sposób dekodowania mowy, sposób kodowania mowy, program do dekodowania mowy i program do kodowania mowy
JP5997592B2 (ja) 2012-04-27 2016-09-28 株式会社Nttドコモ 音声復号装置
US11037923B2 (en) 2012-06-29 2021-06-15 Intel Corporation Through gate fin isolation
TWI477789B (zh) * 2013-04-03 2015-03-21 Tatung Co 資訊擷取裝置及其發送頻率調整方法
BR112015029574B1 (pt) 2013-06-11 2021-12-21 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Aparelho e método de decodificação de sinal de áudio.
EP4325488A3 (en) 2014-02-28 2024-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoding device, encoding device, decoding method, encoding method, terminal device, and base station device
JP2016038435A (ja) * 2014-08-06 2016-03-22 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
AU2017219696B2 (en) 2016-02-17 2018-11-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Post-processor, pre-processor, audio encoder, audio decoder and related methods for enhancing transient processing
TWI602173B (zh) * 2016-10-21 2017-10-11 盛微先進科技股份有限公司 音訊處理方法與非暫時性電腦可讀媒體
EP3396670B1 (en) * 2017-04-28 2020-11-25 Nxp B.V. Speech signal processing
US10650834B2 (en) 2018-01-10 2020-05-12 Savitech Corp. Audio processing method and non-transitory computer readable medium
JP7139628B2 (ja) * 2018-03-09 2022-09-21 ヤマハ株式会社 音処理方法および音処理装置
EP3576088A1 (en) * 2018-05-30 2019-12-04 Fraunhofer Gesellschaft zur Förderung der Angewand Audio similarity evaluator, audio encoder, methods and computer program

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW554334B (en) * 2001-02-27 2003-09-21 Mitsubishi Electric Corp Speech coding method and speech coding apparatus
US20060239473A1 (en) * 2005-04-15 2006-10-26 Coding Technologies Ab Envelope shaping of decorrelated signals
TW200931397A (en) * 2007-11-06 2009-07-16 Nokia Corp An encoder
TW201009814A (en) * 2008-07-17 2010-03-01 Fraunhofer Ges Forschung Audio encoding/decoding scheme having a switchable bypass
US20100063812A1 (en) * 2008-09-06 2010-03-11 Yang Gao Efficient Temporal Envelope Coding Approach by Prediction Between Low Band Signal and High Band Signal
TW201044378A (en) * 2009-04-09 2010-12-16 Fraunhofer Ges Forschung Apparatus and method for generating a synthesis audio signal and for encoding an audio signal

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3982070A (en) * 1974-06-05 1976-09-21 Bell Telephone Laboratories, Incorporated Phase vocoder speech synthesis system
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
JP2000122698A (ja) * 1998-10-19 2000-04-28 Mitsubishi Electric Corp 音声符号化装置
US7260523B2 (en) * 1999-12-21 2007-08-21 Texas Instruments Incorporated Sub-band speech coding system
JP2001318698A (ja) * 2000-05-10 2001-11-16 Nec Corp 音声符号化装置及び音声復号化装置
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
US7987095B2 (en) * 2002-09-27 2011-07-26 Broadcom Corporation Method and system for dual mode subband acoustic echo canceller with integrated noise suppression
KR100587953B1 (ko) * 2003-12-26 2006-06-08 한국전자통신연구원 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템
KR100657916B1 (ko) * 2004-12-01 2006-12-14 삼성전자주식회사 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법
KR100721537B1 (ko) * 2004-12-08 2007-05-23 한국전자통신연구원 광대역 음성 부호화기의 고대역 음성 부호화 장치 및 그방법
KR100708121B1 (ko) * 2005-01-22 2007-04-16 삼성전자주식회사 음성 신호의 대역 확장 방법 및 장치
JP4448464B2 (ja) * 2005-03-07 2010-04-07 日本電信電話株式会社 雑音低減方法、装置、プログラム及び記録媒体
EP1864281A1 (en) * 2005-04-01 2007-12-12 QUALCOMM Incorporated Systems, methods, and apparatus for highband burst suppression
UA92742C2 (ru) * 2005-04-01 2010-12-10 Квелкомм Инкорпорейтед Способ и устройство для кодирования речевых сигналов с расщеплением полосы
US7953605B2 (en) * 2005-10-07 2011-05-31 Deepen Sinha Method and apparatus for audio encoding and decoding using wideband psychoacoustic modeling and bandwidth extension
CN101483495B (zh) * 2008-03-20 2012-02-15 华为技术有限公司 一种背景噪声生成方法以及噪声处理装置
JP5203077B2 (ja) * 2008-07-14 2013-06-05 株式会社エヌ・ティ・ティ・ドコモ 音声符号化装置及び方法、音声復号化装置及び方法、並びに、音声帯域拡張装置及び方法
BR122019023704B1 (pt) * 2009-01-16 2020-05-05 Dolby Int Ab sistema para gerar um componente de frequência alta de um sinal de áudio e método para realizar reconstrução de frequência alta de um componente de frequência alta
JP4932917B2 (ja) 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
PL3407352T3 (pl) * 2011-02-18 2022-08-08 Ntt Docomo, Inc. Dekoder mowy, koder mowy, sposób dekodowania mowy, sposób kodowania mowy, program do dekodowania mowy i program do kodowania mowy

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW554334B (en) * 2001-02-27 2003-09-21 Mitsubishi Electric Corp Speech coding method and speech coding apparatus
US20060239473A1 (en) * 2005-04-15 2006-10-26 Coding Technologies Ab Envelope shaping of decorrelated signals
TW200931397A (en) * 2007-11-06 2009-07-16 Nokia Corp An encoder
TW201009814A (en) * 2008-07-17 2010-03-01 Fraunhofer Ges Forschung Audio encoding/decoding scheme having a switchable bypass
US20100063812A1 (en) * 2008-09-06 2010-03-11 Yang Gao Efficient Temporal Envelope Coding Approach by Prediction Between Low Band Signal and High Band Signal
TW201044378A (en) * 2009-04-09 2010-12-16 Fraunhofer Ges Forschung Apparatus and method for generating a synthesis audio signal and for encoding an audio signal

Also Published As

Publication number Publication date
TWI547941B (zh) 2016-09-01
JP6664526B2 (ja) 2020-03-13
JP6510593B2 (ja) 2019-05-08
PT3567589T (pt) 2022-05-19
US20130339010A1 (en) 2013-12-19
CA3239539A1 (en) 2012-08-23
FI3998607T3 (fi) 2024-04-22
PL3998607T3 (pl) 2024-06-24
JP2021043471A (ja) 2021-03-18
EP3998607A1 (en) 2022-05-18
CA3147525A1 (en) 2012-08-23
EP4020466A1 (en) 2022-06-29
MX2013009464A (es) 2013-12-06
KR20220035287A (ko) 2022-03-21
KR102424902B1 (ko) 2022-07-22
EP3567589A1 (en) 2019-11-13
AU2012218409B2 (en) 2016-09-15
CA3055514A1 (en) 2012-08-23
TW201301263A (zh) 2013-01-01
AU2012218409A1 (en) 2013-09-12
DK4020466T3 (da) 2023-06-26
PL2677519T3 (pl) 2019-12-31
RU2707931C1 (ru) 2019-12-02
JP7252381B2 (ja) 2023-04-04
TW201706983A (zh) 2017-02-16
JP2017194716A (ja) 2017-10-26
WO2012111767A1 (ja) 2012-08-23
KR102068112B1 (ko) 2020-01-20
BR112013020987B1 (pt) 2021-01-19
HUE058847T2 (hu) 2022-09-28
CA2827482A1 (en) 2012-08-23
BR122019027753B1 (pt) 2021-04-20
RU2651193C1 (ru) 2018-04-18
KR102375912B1 (ko) 2022-03-16
EP3998607B1 (en) 2024-03-27
JP7009602B2 (ja) 2022-01-25
EP2677519B1 (en) 2019-08-14
KR20140005256A (ko) 2014-01-14
RU2599966C2 (ru) 2016-10-20
PT3998607T (pt) 2024-04-30
RU2013142349A (ru) 2015-03-27
KR20200003943A (ko) 2020-01-10
BR112013020987A2 (pt) 2016-10-11
CA2827482C (en) 2018-01-02
CA2984936A1 (en) 2012-08-23
JP2022043334A (ja) 2022-03-15
HUE058682T2 (hu) 2022-09-28
CN103370742A (zh) 2013-10-23
PL3567589T3 (pl) 2022-06-06
JP2019091074A (ja) 2019-06-13
KR20220106233A (ko) 2022-07-28
ES2913760T3 (es) 2022-06-06
JP6810292B2 (ja) 2021-01-06
EP3407352B9 (en) 2022-08-10
PT4020466T (pt) 2023-06-27
JP2016218464A (ja) 2016-12-22
EP4020466B1 (en) 2023-05-10
PL4020466T3 (pl) 2023-09-25
RU2630379C1 (ru) 2017-09-07
TWI563499B (zh) 2016-12-21
KR102208914B1 (ko) 2021-01-27
EP3407352B1 (en) 2022-05-11
EP2677519A1 (en) 2013-12-25
RU2679973C1 (ru) 2019-02-14
DK2677519T3 (da) 2019-09-23
EP3407352A1 (en) 2018-11-28
DK3567589T3 (da) 2022-05-09
RU2718425C1 (ru) 2020-04-02
DK3998607T3 (da) 2024-04-15
HUE062540T2 (hu) 2023-11-28
KR20200142110A (ko) 2020-12-21
CN104916290B (zh) 2018-11-06
KR20170070286A (ko) 2017-06-21
CN104916290A (zh) 2015-09-16
PL3407352T3 (pl) 2022-08-08
SG192796A1 (en) 2013-09-30
CA3055514C (en) 2022-05-17
RU2742199C1 (ru) 2021-02-03
CA2984936C (en) 2019-10-29
DK3407352T3 (da) 2022-06-07
TW201637001A (zh) 2016-10-16
JP2020077012A (ja) 2020-05-21
JP6189498B2 (ja) 2017-08-30
ES2745141T3 (es) 2020-02-27
JP5977176B2 (ja) 2016-08-24
FI4020466T3 (fi) 2023-06-14
PT3407352T (pt) 2022-06-07
EP2677519A4 (en) 2016-10-19
EP3567589B1 (en) 2022-04-06
ES2916257T3 (es) 2022-06-29
PT2677519T (pt) 2019-09-30
MX339764B (es) 2016-06-08
KR102565287B1 (ko) 2023-08-08
CN103370742B (zh) 2015-06-03
KR20180089567A (ko) 2018-08-08
RU2674922C1 (ru) 2018-12-13
US8756068B2 (en) 2014-06-17
JPWO2012111767A1 (ja) 2014-07-07
ES2949240T3 (es) 2023-09-26

Similar Documents

Publication Publication Date Title
JP7252381B2 (ja) 音声復号装置