TW201126515A - Speech encoding device, speech decoding device, speech encoding method, speech decoding method, speech encoding program, and speech decoding program - Google Patents

Speech encoding device, speech decoding device, speech encoding method, speech decoding method, speech encoding program, and speech decoding program Download PDF

Info

Publication number
TW201126515A
TW201126515A TW099110498A TW99110498A TW201126515A TW 201126515 A TW201126515 A TW 201126515A TW 099110498 A TW099110498 A TW 099110498A TW 99110498 A TW99110498 A TW 99110498A TW 201126515 A TW201126515 A TW 201126515A
Authority
TW
Taiwan
Prior art keywords
frequency
recorded
time envelope
linear prediction
low
Prior art date
Application number
TW099110498A
Other languages
English (en)
Other versions
TWI379288B (zh
Inventor
Kosuke Tsujino
Kei Kikuiri
Nobuhiko Naka
Original Assignee
Ntt Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ntt Docomo Inc filed Critical Ntt Docomo Inc
Publication of TW201126515A publication Critical patent/TW201126515A/zh
Application granted granted Critical
Publication of TWI379288B publication Critical patent/TWI379288B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/03Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)

Description

201126515 明說 明發 域 領 術 技 之 屬 所 明 、 發 六 ί 本發明係有關於聲音編碼裝置、聲音解碼裝置、聲音 編碼方法、聲音解碼方法、聲音編碼程式及聲音解碼程式 1 術 技 前 先 [ 利用聽覺心理而摘除人類知覺上所不必要之資訊以將 訊號之資料量壓縮成數十分之一的聲音音響編碼技術,是 在訊號的傳輸、積存上極爲重要的技術。作爲被廣泛利用 的知覺性音訊編碼技術的例子,可舉例如已被“ IS 0/IEC MPEG”所標準化的“ MPEG4 AAC”等。 作爲更加提升聲音編碼之性能、以低位元速率獲得高 聲音品質的方法,使用聲音的低頻成分來生成高頻成分的 頻帶擴充技術,近年來是被廣泛利用。頻帶擴充技術的代 表性例子係爲“MPEG4 AAC”中所利用的SBR( Spectral Band Replication )技術。在 SBR 中,對於藉由 QMF ( Quadrature Mirror Filter)濾波器組而被轉換成頻率領域 的訊號,藉由進行從低頻頻帶往高頻頻帶的頻譜係數之複 寫,以生成高頻成分之後,藉由調整已被複寫之係數的頻 譜包絡和調性(tonality),以進行尚頻成分的調整。利 用頻帶擴充技術的聲音編碼方式’係僅使用少量的輔助資 訊就能再生出訊號的高頻成分’因此對於聲音編碼的低位 元速率化,是有效的* -5- 201126515 以S B R爲代表的頻率領域上的頻帶擴充技術,係藉由 對頻譜係數的增益調整、時間方向的線性預測逆濾波器處 理、雜訊的重疊,而對頻率領域中所表現的頻譜係數,進 行頻譜包絡和調性之調整。藉由該調整處理,將演說訊號 或拍手、響板這類時間包絡變化較大的訊號進行編碼之際 ,則在解碼訊號中,有時候會有稱作前回聲或後回聲的殘 響狀之雜音被感覺出來。此問題係起因於,在調整處理的 過程中,高頻成分的時間包絡會變形,許多情況下會變成 比調整前還平坦的形狀所造成。因調整處理而變得平坦的 高頻成分的時間包絡,係與編碼前的原訊號中的高頻成分 之時間包絡不一致,而成爲前回聲•後回聲之原因。 同樣的前回聲•後回聲之問題,在“ MPEG Surround ”及參量(parametric)音響爲代表的,使用參量處理的 多聲道音響編碼中,也會發生。多聲道音響編碼時的解碼 器,雖然含有對解碼訊號實施殘響濾波器所致之無相關化 處理的手段,但在無相關化處理的過程中,訊號的時間包 絡會變形,而產生和前回聲·後回聲同樣的再生訊號之劣 化。作爲針對此課題的解決法,係存在有TES ( Temporal Envelope Shaping)技術(專利文獻1 )。在TES技術中, 係對於在QMF領域中所表現之無相關化處理前之訊號,在 頻率方向上進行線性預測分析,得到線性預測係數後,使 用所得到之線性預測係數來對無相關化處理後之訊號,在 頻率方向上進行線性預測合成濾波器處理。藉由該處理, TES技術係將無相關化處理前之訊號所帶有的時間包絡予 201126515 以抽出,配合於其來調整無相關化處理後之訊號的時間包 絡。由於無相關化處理前之訊號係帶有失真較少的時間包 絡,因此藉由以上之處理,可將無相關化處理後之訊號的 時間包絡調整成失真較少的形狀,可獲得改善了前回聲· 後回聲的再生訊號。 [先前技術文獻] [專利文獻] [專利文獻1]美國專利申請公開第2006/023 9473號說明 書 【發明內容】 [發明所欲解決之課題] 以上所示的TES技術,係利用了無相關化處理前之訊 號是帶有失真較少之時間包絡的性質。可是,在SBR解碼 器中,由於是將訊號的高頻成分藉由來自低頻成分的訊號 複寫而加以複製,因此無法獲得關於高頻成分之失真較少 的時間包絡。作爲針對該問題的解決法之一,係考慮在 SB R編碼器中將輸入訊號的高頻成分加以分析,將分析結 果所得到的線性預測係數予以量化,多工化至位元串流中 而加以傳輸的方法。藉此,在SBR解碼器中就可獲得,含 有關於高頻成分之時間包絡之失真較少之資訊的線性預測 係數。可是,此情況下,已被量化之線性預測係數的傳輸 上需要較多的資訊量,因此會辦隨著編碼位元串流全體的 201126515 位元速率顯著增大之問題。於是,本發明的目的在於, SB R爲代表的頻率領域上的頻帶擴充技術中,不使位元 率顯著增大,就減輕前回聲•後回聲的發生並提升解碼 號的主觀品質。 [用以解決課題之手段] 本發明的聲音編碼裝置,係屬於將聲音訊號予以編 的聲音編碼裝置,其特徵爲,具備:核心編碼手段,係 前記聲音訊號的低頻成分,予以編碼:和時間包絡輔助 訊算出手段,係使用前記聲音訊號之低頻成分之時間包 ,來算出用來獲得前記聲音訊號之高頻成分之時間包絡 近似所需的時間包絡輔助資訊;和位元串流多工化手段 係生成至少由已被前記核心編碼手段所編碼過之前記低 成分、和已被前記時間包絡輔助資訊算出手段所算出的 記時間包絡輔助資訊所多工化而成的位元串流。 在本發明的聲音編碼裝置中,前記時間包絡輔助資 ,係表示一參數,其係用以表示在所定之解析區間內, 記聲音訊號的高頻成分中的時間包絡之變化的急峻度, 爲理想。 在本發明的聲音編碼裝置中,係更具備:頻率轉換 段,係將前記聲音訊號,轉換成頻率領域;前記時間包 輔助資訊算出手段,係基於對已被前記頻率轉換手段轉 成頻率領域之前記聲音訊號的高頻側係數在頻率方向上 行線性預測分析所取得的高頻線性預測係數,而算出前 以 速 訊 碼 將 資 絡 之 y jtB 頻 刖 訊 * 刖 較 手 絡 換 進 記 -8 - 201126515 時間包絡輔助資訊,較爲理想。 在本發明的聲音編碼裝置中,前記時間包絡輔助資訊 算出手段,係對已被前記頻率轉換手段轉換成頻率領域之 前記聲音訊號的低頻側係數,在頻率方向上進行線性預測 分析而取得低頻線性預測係數,基於該低頻線性預測係數 和前記高頻線性預測係數,而算出前記時間包絡輔助資訊 ,較爲理想。 在本發明的聲音編碼裝置中,前記時間包絡輔助資訊 算出手段,係從前記低頻線性預測係數及前記高頻線性預 測係數,分別取得預測增益,基於該當二個預測增益之大 小,而算出前記時間包絡輔助資訊,較爲理想。 在本發明的聲音編碼裝置中,前記時間包絡輔助資訊 算出手段,係從前記聲音訊號中分離出高頻成分,從該當 高頻成分中取得被表現在時間領域中的時間包絡資訊,基 於該當時間包絡資訊的時間性變化之大小,而算出前記時 間包絡輔助資訊,較爲理想。 在本發明的聲音編碼裝置中,前記時間包絡輔助資訊 ,係含有差分資訊,其係爲了使用對前記聲音訊號之低頻 成分進行往頻率方向之線性預測分析所獲得之低頻線性預 測係數而取得高頻線性預測係數所需,較爲理想。 在本發明的聲音編碼裝置中,係更具備:頻率轉換手 段,係將前記聲音訊號,轉換成頻率領域:前記時間包絡 輔助資訊算出手段,係對已被前記頻率轉換手段轉換成頻 率領域之前記聲音訊號的低頻成分及高頻側係數,分別在 -9 - 201126515 頻率方向上進行線性預測分析而取得低頻線性預測係數與 高頻線性預測係數,並取得該當低頻線性預測係數及高頻 線性預測係數的差分,以取得前記差分資訊,較爲理想》 在本發明的聲音編碼裝置中,前記差分資訊係表示 LSP ( Linear Spectrum Pair) 、ISP ( Immittance Spectrum Pair ) 、 LSF ( Linear Spectrum Frequency ) 、 ISF (
Immittance Spectrum Frequency) 、PARCOR係數之任一領 域中的線性預測係數之差分,較爲理想。 本發明的聲音編碼裝置,係屬於將聲音訊號予以編碼 的聲音編碼裝置,其特徵爲,具備:核心編碼手段,係將 前記聲音訊號的低頻成分,予以編碼;和頻率轉換手段, 係將前記聲音訊號,轉換成頻率領域:和線性預測分析手 段,係對已被前記頻率轉換手段轉換成頻率領域之前記聲 音訊號的高頻側係數,在頻率方向上進行線性預測分析而 取得高頻線性預測係數;和預測係數抽略手段,係將已被 前記線性預測分析手段所取得之前記高頻線性預測係數, 在時間方向上作抽略;和預測係數量化手段,係將已被前 記預測係數抽略手段作抽略後的前記高頻線性預測係數, 予以量化;和位元串流多工化手段,係生成至少由前記核 心編碼手段所編碼後的前記低頻成分和前記預測係數量化 手段所量化後的前記高頻線性預測係數’所多工化而成的 位元串流。 本發明的聲音解碼裝置,係屬於將已被編碼之聲音訊 號予以解碼的聲音解碼裝置,其特徵爲’具備:位元串流 -10- 201126515 分離手段,係將含有前記已被編碼之聲音訊號的來自外部 的位元串流,分離成編碼位元串流與時間包絡輔助資訊; 和核心解碼手段,係將已被前記位元串流分離手段所分離 的前記編碼位元串流予以解碼而獲得低頻成分;和頻率轉 換手段,係將前記核心解碼手段所得到之前記低頻成分, 轉換成頻率領域;和高頻生成手段,係將已被前記頻率轉 換手段轉換成頻率領域的前記低頻成分,從低頻頻帶往高 頻頻帶進行複寫,以生成高頻成分;和低頻時間包絡分析 手段,係將已被前記頻率轉換手段轉換成頻率領域的前記 低頻成分加以分析,而取得時間包絡資訊;和時間包絡調 整手段,係將已被前記低頻時間包絡分析手段所取得的前 記時間包絡資訊,使用前記時間包絡輔助資訊來進行調整 ;和時間包絡變形手段,係使用前記時間包絡調整手段所 調整後的前記時間包絡資訊,而將已被前記高頻生成手段 所生成之前記高頻成分的時間包絡,加以變形。 在本發明的聲音解碼裝置中,係更具備:高頻調整手 段’係用以調整前記局頻成分;前記頻率轉換手段,係爲 具有實數或複數(complex number)之係數的64分割QMF 濾波器組;前記頻率轉換手段、前記高頻生成手段、前記 高頻調整手段,係以“ISO/IEC 1 4496-3 ”中所規定之" MPEG4 AAC” 中的 SBR 解碼器(SBR : Spectral Band Replication)爲依據而作動,較爲理想。 在本發明的聲音解碼裝置中,前記低頻時間包絡分析 手段’係對已被前記頻率轉換手段轉換成頻率領域的前記 -11 - 201126515 低頻成分,進行頻率方向的線性預測分析,而取得 性預測係數;前記時間包絡調整手段,係使用前記 絡輔助資訊來調整前記低頻線性預測係數:前記時 變形手段,係對於已被前記高頻生成手段所生成之 域的前記高頻成分,使用已被前記時間包絡調整手 整過的線性預測係數來進行頻率方向的線性預測濾 理,以將聲音訊號的時間包絡予以變形,較爲理想 在本發明的聲音解碼裝置中,前記低頻時間包 手段,係將已被前記頻率轉換手段轉換成頻率領域 低頻成分的每一時槽的功率加以取得,以取得聲音 時間包絡資訊:前記時間包絡調整手段,係使用前 包絡輔助資訊來調整前記時間包絡資訊;前記時間 形手段,係對已被前記高頻生成手段所生成之頻率 高頻成分,重疊上前記調整後的時間包絡資訊,以 成分的時間包絡予以變形,較爲理想。 在本發明的聲音解碼裝置中,前記低頻時間包 手段,係將已被前記頻率轉換手段轉換成頻率領域 低頻成分的每一QMF子頻帶樣本的功率加以取得, 聲音訊號的時間包絡資訊;前記時間包絡調整手段 用前記時間包絡輔助資訊來調整前記時間包絡資訊 時間包絡變形手段,係對已被前記高頻生成乎段所 頻率領域的高頻成分,乘算上前記調整後的時間包 ,以將高頻成分的時間包絡予以變形,較爲理想。 在本發明的聲音解碼裝置中,前記時間包絡輔 低頻線 時間包 間包絡 頻率領 段所調 波器處 〇 絡分析 的前記 訊號的 記時間 包絡變 領域的 將高頻 絡分析 的前記 以取得 ,係使 :前記 生成之 絡資訊 助資訊 -12- 201126515 ,係表示線性預測係數之強度之調整時所要使用的濾波器 強度參數,較爲理想。 在本發明的聲音解碼裝置中,前記時間包絡輔助資訊 ,係表示前記時間包絡資訊之時間變化之大小的參數,較 爲理想。 在本發明的聲音解碼裝置中,前記時間包絡輔助資訊 ,係含有對於前記低頻線性預測係數的線性預測係數之差 分資訊,較爲理想。 在本發明的聲音解碼裝置中,前記差分資訊係表示 LSP ( Linear Spectrum Pair) 、 ISP ( Immittance Spectrum Pair ) 、 LSF ( Linear Spectrum Frequency ) 、 ISF (
Immittance Spectrum Frequency) 、PARCOR係數之任一領 域中的線性預測係數之差分,較爲理想。 在本發明的聲音解碼裝置中,前記低頻時間包絡分析 手段,係對已被前記頻率轉換手段轉換成頻率領域之前記 低頻成分進行頻率方向的線性預測分析以取得前記低頻線 性預測係數,並且藉由取得該當頻率領域之前記低頻成分 的每一時槽的功率以取得聲音訊號的時間包絡資訊;前記 時間包絡調整手段,係使用前記時間包絡輔助資訊來調整 前記低頻線性預測係數,並且使用前記時間包絡輔助資訊 來調整前記時間包絡資訊;前記時間包絡變形手段,係對 於已被前記高頻生成手段所生成之頻率領域的高頻成分, 使用已被前記時間包絡調整手段所調整過的線性預測係數 來進行頻率方向的線性預測濾波器處理,以將聲音訊號的 -13- 201126515 時間包絡予以變形,並且對該當頻率領域之前記高頻成分 ,重疊上以前記時間包絡調整手段做過調整後的前記時間 包絡資訊,以將前記高頻成分的時間包絡予以變形,較爲 理想。 在本發明的聲音解碼裝置中,前記低頻時間包絡分析 手段,係對已被前記頻率轉換手段轉換成頻率領域之前記 低頻成分進行頻率方向的線性預測分析以取得前記低頻線 性預測係數,並且藉由取得該當頻率領域之前記低頻成分 的每一 QMF子頻帶樣本的功率以取得聲音訊號的時間包絡 資訊;前記時間包絡調整手段,係使用前記時間包絡輔助 資訊來調整前記低頻線性預測係數,並且使用前記時間包 絡輔助資訊來調整前記時間包絡資訊;前記時間包絡變形 手段,係對於已被前記高頻生成手段所生成之頻率領域的 高頻成分’使用以前記時間包絡調整手段做過調整後的線 性預測係數來進行頻率方向的線性預測濾波器處理,以將 聲音訊號的時間包絡予以變形,並且對該當頻率領域之前 記高頻成分,乘算上以前記時間包絡調整手段做過調整後 的前記時間包絡資訊,以將前記高頻成分的時間包絡予以 變形,較爲理想。 在本發明的聲音解碼裝置中,前記時間包絡輔助資訊 ,係表示線性預測係數的濾波器強度、和前記時間包絡資 訊之時間變化之大小之雙方的參數,較爲理想。 本發明的聲音解碼裝置,係屬於將已被編碼之聲音訊 號予以解碼的聲音解碼裝置,其特徵爲,具備:位元串流 -14- 201126515 分離手段’係將含有前記已被編碼之聲音訊號的來自外部 的位元串流,分離成編碼位元串流與線性預測係數;和線 性預測係數內插•外插手段,係將前記線性預測係數,在 時間方向上進行內插或外插;和時間包絡變形手段,係使 用已被前記線性預測係數內插•外插手段做過內插或外插 之線性預測係數,而對頻率領域中所表現之高頻成分,進 行頻率方向的線性預測濾波器處理,以將聲音訊號的時間 包絡予以變形。 本發明的聲音編碼方法,係屬於使用將聲音訊號予以 編碼的聲音編碼裝置的聲音編碼方法,其特徵爲,具備: 核心編碼步驟,係由前記聲音編碼裝置,將前記聲音訊號 的低頻成分,予以編碼;和時間包絡輔助資訊算出步驟, 係由前記聲音編碼裝置,使用前記聲音訊號之低頻成分之 時間包絡,來算出用來獲得前記聲音訊號之高頻成分之時 間包絡之近似所需的時間包絡輔助資訊;和位元串流多工 化步驟,係由前記聲音編碼裝置,生成至少由在前記核心 編碼步驟中所編碼過之前記低頻成分、和在前記時間包絡 輔助資訊算出步驟中所算出的前記時間包絡輔助資訊,所 多工化而成的位元串流。 本發明的聲音編碼方法,係屬於使用將聲音訊號予以 編碼的聲音編碼裝置的聲音編碼方法,其特徵爲,具備: 核心編碼步驟,係由前記聲音編碼裝置,將前記聲音訊號 的低頻成分,予以編碼;和頻率轉換步驟,係由前記聲音 編碼裝置,將前記聲音訊號,轉換成頻率領域;和線性預 -15- 201126515 測分析步驟,係由前記聲音編碼裝置,對已在前 換步驟中轉換成頻率領域之前記聲音訊號的高頻 在頻率方向上進行線性預測分析而取得高頻線性 ;和預測係數抽略步驟,係由前記聲音編碼裝置 記線性預測分析手段步驟中所取得之前記高頻線 數’在時間方向上作抽略;和預測係數量化步驟 記聲音編碼裝置,將前記預測係數抽略手段步驟 後的前記高頻線性預測係數,予以量化;和位元 化步驟,係由前記聲音編碼裝置,生成至少由前 碼步驟中的編碼後的前記低頻成分和前記預測係 驟中的量化後的前記高頻線性預測係數,所多工 位元串流。 本發明的聲音解碼方法,係屬於使用將已被 音訊號予以解碼的聲音解碼裝置的聲音解碼方法 爲’具備:位元串流分離步驟,係由前記聲音解 將含有前記已被編碼之聲音訊號的來自外部的位 分離成編碼位元串流與時間包絡輔助資訊;和核 驟,係由前記聲音解碼裝置,將已在前記位元串 驟中作分離的前記編碼位元串流予以解碼而獲得 :和頻率轉換步驟,係由前記聲音解碼裝置,將 解碼步驟中所得到之前記低頻成分,轉換成頻率 高頻生成步驟,係由前記聲音解碼裝置,將已在 轉換步驟中轉換成頻率領域的前記低頻成分,從 往高頻頻帶進行複寫,以生成高頻成分:和低頻 記頻率轉 側係數, 預測係數 ,將在前 性預測係 ,係由前 中的抽略 串流多工 記核心編 數量化步 化而成的 編碼之聲 ,其特徵 碼裝置, 元串流, 心解碼步 流分離步 低頻成分 前記核心 領域;和 前記頻率 低頻頻帶 時間包絡 -16- 201126515 分析步驟,係由前記聲音解碼裝置,將已在前記頻率轉換 步驟中轉換成頻率領域的前記低頻成分加以分析,而取得 時間包絡資訊;和時間包絡調整步驟,係由前記聲音解碼 裝置’將已在前記低頻時間包絡分析步驟中所取得的前記 時間包絡資訊,使用前記時間包絡輔助資訊來進行調整; 和時間包絡變形步驟,係由前記聲音解碼裝置,使用前記 時間包絡調整步驟中的調整後的前記時間包絡資訊,而將 已在前記高頻生成步驟中所生成之前記高頻成分的時間包 絡,加以變形。 本發明的聲音解碼方法,係屬於使用將已被編碼之聲 音訊號予以解碼的聲音解碼裝置的聲音解碼方法,其特徵 爲’具備:位元串流分離步驟,係由前記聲音解碼裝置, 將含有前記已被編碼之聲音訊號的來自外部的位元串流, 分離成編碼位元串流與線性預測係數·,和線性預測係數內 插•外插步驟,係由前記聲音解碼裝置,將前記線性預測 係數,在時間方向上進行內插或外插;和時間包絡變形步 驟’係由前記聲音解碼裝置,使用已在前記線性預測係數 內插•外插步驟中做過內插或外插之前記線性預測係數, 而對頻率領域中所表現之高頻成分,進行頻率方向的線性 預測濾波器處理’以將聲音訊號的時間包絡予以變形。 本發明的聲音編碼程式,其特徵爲,爲了將聲音訊號 予以編碼’而使電腦裝置發揮機能成爲:核心編碼手段, 係將前記聲音訊號的低頻成分,予以編碼;時間包絡輔助 資訊算出手段’係使用前記聲音訊號之低頻成分之時間包 -17- 201126515 絡,來算出用來獲得前記聲音訊號之高頻成分之時間包絡 之近似所需的時間包絡輔助資訊;及位元串流多工化手段 ,係生成至少由已被前記核心編碼手段所編碼過之前記低 頻成分、和已被前記時間包絡輔助資訊算出手段所算出的 前記時間包絡輔助資訊所多工化而成的位元串流。 本發明的聲音編碼程式,其特徵爲,爲了將聲音訊號 予以編碼,而使電腦裝置發揮機能成爲:核心編碼手段, 係將前記聲音訊號的低頻成分,予以編碼;頻率轉換手段 ,係將前記聲音訊號,轉換成頻率領域;線性預測分析手 段,係對已被前記頻率轉換手段轉換成頻率領域之前記聲 音訊號的高頻側係數,在頻率方向上進行線性預測分析而 取得高頻線性預測係數;預測係數抽略手段,係將已被前 記線性預測分析手段所取得之前記高頻線性預測係數,在 時間方向上作抽略;預測係數量化手段,係將已被前記預 測係數抽略手段作抽略後的前記高頻線性預測係數,予以 量化;及位元串流多工化手段,係生成至少由前記核心編 碼手段所編碼後的前記低頻成分和前記預測係數量化手段 所量化後的前記高頻線性預測係數,所多工化而成的位元 串流。 本發明的聲音解碼程式,其特徵爲,爲了將已被編碼 之聲音訊號予以解碼,而使電腦裝置發揮機能成爲:位元 串流分離手段,係將含有前記已被編碼之聲音訊號的來自 外部的位元串流,分離成編碼位元串流與時間包絡輔助資 訊;核心解碼手段,係將已被前記位元串流分離手段所分 -18 - 201126515 離的前記編碼位元串流予以 換手段,係將前記核心解碼 轉換成頻率領域;高頻生成 手段轉換成頻率領域的前記 頻帶進行複寫,以生成高頻 ,係將已被前記頻率轉換手 成分加以分析,而取得時間 ,係將已被前記低頻時間包 包絡資訊,使用前記時間包 間包絡變形手段,係使用前 的前記時間包絡資訊,而將 之前記高頻成分的時間包絡 本發明的聲音解碼程式 之聲音訊號予以解碼,而使 串流分離手段,係將含有前 外部的位元串流,分離成編 線性預測係數內插·外插手 在時間方向上進行內插或外 使用已被前記線性預測係數 插之線性預測係數,而對頻 進行頻率方向的線性預測濾 間包絡予以變形。 在本發明的聲音解碼裝 ,係對已被前記高頻生成手 解碼而獲得低頻成分;頻率轉 手段所得到之前記低頻成分, 手段’係將已被前記頻率轉換 低頻成分,從低頻頻帶往高頻 成分;低頻時間包絡分析手段 段轉換成頻率領域的前記低頻 包絡資訊;時間包絡調整手段 絡分析手段所取得的前記時間 絡輔助資訊來進行調整;及時 記時間包絡調整手段所調整後 已被前記高頻生成手段所生成 ,加以變形。 ,其特徵爲,爲了將已被編碼 電腦裝置發揮機能成爲:位元 記已被編碼之聲音訊號的來自 碼位元串流與線性預測係數; 段,係將前記線性預測係數, 插;及時間包絡變形手段,係 內插•外插手段做過內插或外 率領域中所表現之高頻成分, 波器處理,以將聲音訊號的時 置中,前記時間包絡變形手段 段所生成之頻率領域的前記高 • 19 - 201126515 頻成分進行了頻率方向的線性預測濾波器處理後,將前記 線性預測濾波器處理之結果所得到的高頻成分之功率,調 整成相等於前記線性預測濾波器處理前之値,較爲理想。 在本發明的聲音解碼裝置中,前記時間包絡變形手段 ,係對已被前記高頻生成手段所生成之頻率領域的前記高 頻成分進行了頻率方向的線性預測濾波器處理後,將前記 線性預測濾波器處理之結果所得到的高頻成分之任意頻率 範圍內的功率,調整成相等於前記線性預測濾波器處理前 之値,較爲理想。 在本發明的聲音解碼裝置中,前記時間包絡輔助資訊 ,係前記調整後之前記時間包絡資訊中的最小値與平均値 之比率,較爲理想。 在本發明的聲音解碼裝置中,前記時間包絡變形手段 ,係控制前記調整後的時間包絡之增益,使得前記頻率領 域的高頻成分的s B R包絡時間區段內的功率是在時間包絡 之變形前後呈相等之後,藉由對前記頻率領域的高頻成分 ,乘算上前記已被增益控制之時間包絡,以將高頻成分的 時間包絡予以變形,較爲理想。 在本發明的聲音解碼裝置中,前記低頻時間包絡分析 手段,係將已被前記頻率轉換手段轉換成頻率領域之前記 低頻成分的每一 QMF子頻帶樣本之功率,加以取得,然後 使用SBR包絡時間區段內的平均功率而將每一前記QMF子 頻帶樣本的功率進行正規化,藉此以取得表現成爲應被乘 算至各QMF子頻帶樣本之增益係數的時間包絡資訊,較爲 -20- 201126515 理想。 本發明的聲音解碼裝置,係屬於將已被編碼之聲音訊 號予以解碼的聲音解碼裝置,其特徵爲,具備:核心解碼 手段’係將含有前記已被編碼之聲音訊號之來自外部的位 元串流予以解碼而獲得低頻成分;和頻率轉換手段,係將 前記核心解碼手段所得到之前記低頻成分,轉換成頻率領 域;和高頻生成手段,係將已被前記頻率轉換手段轉換成 頻率領域的前記低頻成分,從低頻頻帶往高頻頻帶進行複 寫,以生成高頻成分;和低頻時間包絡分析手段,係將已 被前記頻率轉換手段轉換成頻率領域的前記低頻成分加以 分析,而取得時間包絡資訊;和時間包絡輔助資訊生成部 ,係將前記位元串流加以分析而生成時間包絡輔助資訊: 和時間包絡調整手段,係將已被前記低頻時間包絡分析手 段所取得的前記時間包絡資訊,使用前記時間包絡輔助資 訊來進行調整;和時間包絡變形手段,係使用前記時間包 絡調整手段所調整後的前記時間包絡資訊,而將已被前記 高頻生成手段所生成之前記高頻成分的時間包絡,加以變 形。 在本發明的聲音解碼裝置中,具備相當於前記高頻調 整手段的一次高頻調整手段、和二次高頻調整手段;前記 一次高頻調整手段’係執行包含相當於前記高頻調整手段 之處理之一部分的處理;前記時間包絡變形手段,對前記 一次高頻調整手段的輸出訊號,進行時間包絡的變形;前 記二次高頻調整手段’係對前記時間包絡變形手段的輸出 -21 - 201126515 訊號’執行相當於前記高頻調整手段之處理當中未被前記 一次高頻調整手段所執行之處理,較爲理想;前記二次高 頻調整手段,係SBR之解碼過程中的正弦波之附加處理’ 較爲理想。 [發明效果] 若依據本發明,則在以S B R爲代表的頻率領域上的頻 帶擴充技術中,可不使位元速率顯著增大,就能減輕前回 聲•後回聲的發生並提升解碼訊號的主觀品質。 【實施方式】 以下,參照圖面,詳細說明本發明所述之理想實施形 態。此外’於圖面的說明中,在可能的情況下,對同一要 素係標示同一符號,並省略重複說明。 (第1實施形態) 圖1係第1實施形態所述之聲音編碼裝置11之構成的圖 示。聲音編碼裝置11,係實體上具備未圖示的CPU、ROM 、RAM及通訊裝置等,該CPU,係將ROM等之聲音編碼裝 置1 1的內藏記億體中所儲存的所定之電腦程式(例如圖2 的流程圖所示之處理執行所需的電腦程式)載入至RAM中 並執行,藉此以統篛控制聲音編碼裝置1 1。聲音編碼裝置 1 1的通訊裝置,係將作爲編碼對象的聲音訊號,從外部予 以接收,還有,將已被編碼之多工化位元串流,輸出至外 -22- 201126515 部。 聲音編碼裝置11,係在功能上是具備:頻率轉換部la (頻率轉換手段)、頻率逆轉換部lb、核心編解碼器編碼 部1 C (核心編碼手段)、SBR編碼部id、線性預測分析部 le(時間包絡輔助資訊算出手段)、濾波器強度參數算出 部1 f (時間包絡輔助資訊算出手段)及位元串流多工化部 1 g (位元串流多工化手段)。圖1所示的聲音編碼裝置1 1 的頻率轉換部1 a〜位元串流多工化部丨g,係聲音編碼裝置 1 1的CPU去執行聲音編碼裝置丨丨的內藏記憶體中所儲存的 電腦程式’所實現的功能。聲音編碼裝置1 1的C P U,係藉 由執行該電腦程式(使用圖1所示的頻率轉換部la〜位元 串流多工化部1 g )’而依序執行圖2的流程圖中所示的處 理(步驟S a 1〜步驟S a7之處理)。該電腦程式之執行上所 被須的各種資料、及該電腦程式之執行所產生的各種資料 ’係全部都被保存在聲音編碼裝置11的ROM或RAM等之內 藏記憶體中。 頻率轉換部la,係將透過聲音編碼裝置11的通訊裝置 所接收到的來自外部的輸入訊號,以多分割QMF濾波器組 進行分析’獲得QMF領域之訊號q(k,r)(步驟Sal之處理) 。其中,k(〇gkg63)係頻率方向的指數,r係表示時槽 的指數。頻率逆轉換部1 b,係在從頻率轉換部! a所得到的 QMF領域之訊號當中’將低頻側的半數之係數,以爐 波器組加以合成,獲得只含有輸入訊號之低頻成分的已被 縮減取樣的時間領域訊號(步驟S a2之處理)。核心編解 -23- 201126515 碼器編碼部1 c,係將已被縮減取樣的時間領域訊號,予以 編碼,獲得編碼位元串流(步驟S a 3之處理)。核心編解 碼器編碼部lc中的編碼係亦可基於以CELP方式爲代表的聲 音編碼方式,或是基於以AAC爲代表的轉換編碼或是TCX (Transform Coded Excitation)方式等之音響編碼。 SBR編碼部Id,係從頻率轉換部ia收取QMF領域之訊 號,基於高頻成分的功率·訊號變化•調性等之分析而進 行SBR編碼,獲得SBR輔助資訊(步驟Sa4之處理)。頻率 轉換部la中的QMF分析之方法及SBR編碼部Id中的SBR編 碼之方法,係在例如文獻“ 3GPP TS 26.404; Enhanced aacPlus encoder SBR part” 中有詳述。 線性預測分析部1 e,係從頻率轉換部1 a收取QMF領域 之訊號,對該訊號之高頻成分,在頻率方向上進行線性預 測分析而取得高頻線性預測係數aH(n,r) ( 1 $ n S N )(步 驟Sa5之處理)。其中,Ν係爲線性預測係數。又,指數r ,係爲關於QMF領域之訊號的子樣本的時間方向之指數。 在訊號線性預測分析時,係可使用共分散法或自我相關法 。aH(n,r)取得之際的線性預測分析,係可對q(k,r)當中滿 足kx< 63的高頻成分來進行。其中kx係爲被核心編解碼 器編碼部1 c所編碼的頻率頻帶之上限頻率所對應的頻率指 數。又,線性預測分析部le,係亦可對有別於aH(n,r)取得 之際所分析的另一低頻成分,進行線性預測分析,取得有 別於aH(n,r)的低頻線性預測係數aL(n,r)(此種低頻成分所 涉及之線性預測係數,係對應於時間包絡資訊,以下在第 -24- 201126515 1實施形態中係同樣如此)。aL(n,r)取得之際的線性預測 分析,係對滿足〇 S k < kx的低頻成分而進行。又,該線性 預測分析係亦可針對〇 S k < kx之區間中所含之一部分的頻 率頻帶而進行。 濾波器強度參數算出部1 f,係例如,使用已被線性預 測分析部1 e所取得之線性預測係數,來算出濾波器強度參 數(濾波器強度參數係對應於時間包絡輔助資訊,以下在 第1實施形態中係同樣如此)(步驟S a6之處理)。首先, 從aH(n,r)算出預測增益GH(r)。預測增益的算出方法,係例 如在“聲音編碼,守谷健弘著、電子情報通信學會編”中 有詳述。然後,當aL(n,r)被算出時,同樣地會算出預測增 益GL(r)。濾波器強度參數K(r),係爲GH(r)越大則越大的 參數,例如可依照以下的數式(1 )而取得。其中, max(a,b)係表示a與b的最大値,min(a,b)係表示a與b的最小 値。 [數1] K(r)=max(0, min(1,GH(r)-1)) 又,當GL(r)被算出時,K(r)係爲GH(r)越大則越大、 GL(r)越大則越小的參數而可被取得》此時的K係可例如依 照以下的數式(2 )而加以取得。 [數2] K(r)=max(0, min(1, GH(r)/GL(r)-1)) K(r)係表示,在SBR解碼時將高頻成分之時間包絡加 以調整用之強度的參數。對於頻率方向之線性預測係數的 -25- 201126515 預測增益,係分析區間的訊號的時間包絡越是急峻變化, 則爲越大的値。K(r)係爲,其値越大,則向解碼器指示要 把SBR所生成之高頻成分的時間包絡的變化變得急峻之處 理更爲加強所用的參數。此外,K(r)係亦可爲,其値越小 ,則向解碼器(例如聲音解碼裝置2 1等)指示要把SBR所 生成之高頻成分的時間包絡的變化變得急峻之處理更爲減 弱所用的參數,亦可包含有表示不要執行使時間包絡變得 急峻之處理的値。又,亦可不傳輸各時槽的K(r),而是對 於複數時槽,傳輸一代表的K(r)。爲了決定共有同一K(r) 値的時槽的區間,使用SBR輔助資訊中所含之SBR包絡的 時間交界(SBR envelope time border)資訊,較爲理想。 K(r)係被量化後,被發送至位元串流多工化部1§。在 量化之前,針對複數時槽r而例如求取K (r)的平均,以對於 複數時槽,計算出代表的K(r),較爲理想。又,當將代表 複數時槽之K(r)予以傳輸時,亦可並非將K(r)的算出如數 式(2)般地從分析每個時槽之結果而獨立進行,而是由 複數時槽所成之區間全體的分析結果,來取得代表它們的 K(〇。此時的IC(r)之算出,係可依照例如以下的數式(3 ) 而進行。其中’ mean( ·)係表示被K(r)所代表的時槽的區 間內的平均値。 [數3] K{r) = maxCO^ini^meaniG^CrVmeaniG^ (r))-l))) 此外,在K(r)傳輸之際,亦可與“ ISO/IEC 1 4496-3 subpart 4 General Audio Coding” 中所記載之 SBR輔助資 -26- 201126515 訊中所含的逆濾波器模式資訊,作排他性的傳輸。亦即, 亦可爲,對於SB R輔助資訊的逆濾波器模式資訊的傳輸時 槽係不傳輸K(r),對於K(r)的傳輸時槽則不傳輸SBR輔助 資訊的逆濾波器模式資訊(“ISO/IEC 1 4496-3 subpart 4 General Audio Coding” 中的 bs#invf#mode)。此夕f > 亦可 附加用來表示要傳輸K(r)或SBR輔助資訊中所含之逆濾波 器模式資訊之中的哪一者用的資訊。又,亦可將K(r)和 SB R輔助資訊中所含之逆濾波器模式資訊組合成一個向量 資訊來操作,將該向量進行熵編碼。此時,亦可將Κ(〇、 和SBR輔助資訊中所含之逆濾波器模式資訊的値的組合, 加以限制。 位元串流多工化部1 g,係將已被核心編解碼器編碼部 lc所算出之編碼位元串流、已被SBR編碼部Id所算出之 SBR輔助資訊、已被濾波器強度參數算出部If所算出之 K(r)予以多工化,將多工化位元串流(已被編碼之多工化 位元串流),透過聲音編碼裝置11的通訊裝置而加以輸出 (步驟Sa7之處理)。 圖3係第1實施形態所述之聲音解碼裝置21之構成的圖 示。聲音解碼裝置21,係實體上具備未圖示的CPU、ROM 、RAM及通訊裝置等,該CPU,係將ROM等之聲音解碼裝 置2 1的內藏記憶體中所儲存的所定之電腦程式(例如圖4 的流程圖所示之處理執行所需的電腦程式)載入至RAM中 並執行,藉此以統籌控制聲音解碼裝置2 1。聲音解碼裝置 2 1的通訊裝置,係將從聲音編碼裝置1 1、後述之變形例1 -27- 201126515 的聲音編碼裝置lla、或後述之變形例2的聲音編碼裝置所 輸出的已被編碼之多工化位元串流,予以接收,然後還會 將已解碼的聲音訊號,輸出至外部。聲音解碼裝置21,係 如圖3所示,在功能上是具備:位元串流分離部2 a (位元 串流分離手段)、核心編解碼器解碼部2b (核心解碼手段 )、頻率轉換部2c (頻率轉換手段)、低頻線性預測分析 部2d (低頻時間包絡分析手段)、訊號變化偵測部2e、濾 波器強度調整部2f (時間包絡調整手段)、高頻生成部2g (高頻生成手段)、高頻線性預測分析部2h、線性預測逆 濾波器部2i、高頻調整部2j (高頻調整手段)、線性預測 濾波器部2k (時間包絡變形手段)、係數加算部2m及頻率 逆轉換部2n。圖3所示的聲音解碼裝置21的位元串流分離 部2 a〜包絡形狀參數算出部丨n,係藉由聲音解碼裝置2 1的 CPU去執行聲音解碼裝置2 1的內藏記憶體中所儲存的電腦 程式’所實現的功能。聲音解碼裝置2 1的CPU,係藉由執 行該電腦程式(使用圖3所示的位元串流分離部2 a〜包絡 形狀參數算出部1 η ),而依序執行圖4的流程圖中所示的 處理(步驟Sb 1〜步驟Sb 1 1之處理)。該電腦程式之執行 上所被須的各種資料、及該電腦程式之執行所產生的各種 資料’係全部都被保存在聲音解碼裝置21的R〇M或RAM等 之內藏記憶體中。 位元串流分離部2a,係將透過聲音解碼裝置21的通訊 裝置所輸入的多工化位元串流,分離成濾波器強度參數、 SBR輔助資訊、編碼位元串流。核心編解碼器解碼部2b, • 28 · 201126515 係將從位元串流分離部2a所給予之編碼位元串流進行解碼 ,獲得僅含有低頻成分的解碼訊號(步驟Sbl之處理)。 此時,解碼的方式係可爲基於以CELP方式爲代表的聲音 編碼方式,或亦可爲基於以AAC爲代表的轉換編碼或是 TCX ( Transform Coded Excitation)方式等之音響編碼。 頻率轉換部2c,係將從核心編解碼器解碼部2b所給予 之解碼訊號,以多分割QMF濾波器組進行分析,獲得QMF 領域之訊號qdee(k,r)(步驟Sb2之處理)。其中,k(0Sk $ 63 )係頻率方向的指數,r係表示QMF領域之訊號的關 於子樣本的時間方向之指數的指數。 低頻線性預測分析部2d,係將從頻率轉換部2c所得到 之qdee(k,r),關於每一時槽!*而在頻率方向上進行線性預測 分析,取得低頻線性預測係數ade(:(n,r)(步驟Sb3之處理) 。線性預測分析,係對從核心編解碼器解碼部2b所得到的 解碼訊號之訊號頻帶所對應之〇Sk<kx的範圍而進行之。 又,該線性預測分析係亦可針對〇 $ k < kx之區間中所含之 一部分的頻率頻帶而進行。 訊號變化偵測部2e,係偵測出從頻率轉換部2c所得到 之QMF領域之訊號的時間變化,成爲偵測結果T(r)而輸出 。訊號變化的偵測,係可藉由例如以下所示方法而進行。 1.時槽r中的訊號的短時間功率p(r)可藉由以下的數式 (4 )而取得。 -29- 201126515 [數4] 63 户 〇) = £1“(灸,)12 k=0 2. 將p(r)平滑化後的包絡penv(r)可藉由以下的數式(f )而取得。其中α係爲滿足0< α <1之定數。 [數5]
Penv{r) = a · PenXr ~ 1) + (1 ~ ' p(f) 3. 使用p(r)和Penv(r)而將T(r)藉由以下的數式(6)而 取得。其中,0係爲定數。 [數6] T (r) = max(l, p(r)/(β · penv (r))) 以上所示的方法係基於功率的變化而偵測訊號變化的 單純例,亦可藉由其他更洗鍊的方法來進行訊號變化偵測 。又,亦可省略訊號變化偵測部2e。 濾波器強度調整部2f,係對於從低頻線性預測分析部 2d所得到之adee(n,r),進行濾波器強度之調整,取得已被 調整過的線性預測係數aadj(n,r)(步驟Sb4之處理)。濾波 器強度的調整,係可使用透過位元串流分離部2a所接收Slj 的濾波器強度參數K,依照例如以下的數式(7 )而進行。 [數7] aadjM = ^eMr)-K(r)n (l^n^N) 甚至,當訊號變化偵測部2e的輸出T(r)被獲得時,^ 度的調整係亦可依照以下的數式(8 )而進行 -30- 201126515 [數8] aadj r) = Cl dec r) · (K(r) · T(r))n (1SCN) 高頻生成部2g,係將從頻率轉換部2c所獲得之QMF領 域之訊號,從低頻頻帶往高頻頻帶做複寫,生成高頻成分 的QMF領域之訊號,qexp(k,r)(步驟Sb5之處理)。高頻的 生成,係可依照“MPEG4 AAC”的SBR中的HF generation 之方法而進行(“ISO/IEC 14496-3 subpart 4 General Audio Coding")。 高頻線性預測分析部2h,係將已被高頻生成部2g所生 成之qexp(k,〇,關於每一時槽r而在頻率方向上進行線性預 測分析,取得高頻線性預測係數aexp(n,r)(步驟Sb6之處理 )。線性預測分析,係對已被高頻生成部2g所生成之高頻 成分所對應之kx$k$63的範圍而進行之。 線性預測逆濾波器部2i,係將已被高頻生成部2g所生 成之高頻頻帶的QMF領域之訊號視爲對象,在頻率方向上 以aexp(n,r)爲係數而進行線性預測逆濾波器處理(步驟Sb7 之處理)。線性預測逆濾波器的傳達函數,係如以下的數 式(9 )所示。 [數9] /⑻= l + ^Xp(«,r),w n—\ 該線性預測逆濾波器處理,係可從低頻側的係數往高 頻側的係數進行,亦可反之。線性預測逆濾波器處理,係 於後段中在進行時間包絡變形之前,先一度將高頻成分的 -31 - 201126515 時間包絡予以平坦化所需之處理’線性預測逆濾波器部2 i 係亦可省略。又,亦可對於來自高頻生成部2 g的輸出不進 行往高頻成分的線性預測分析與逆濾波器處理,而是改成 對於後述來自高頻調整部2 j的輸出,進行高頻線性預測分 析部2h所致之線性預測分析和線性預測逆濾波器部2i所致 之逆濾波器處理。甚至,線性預測逆濾波器處理中所使用 的線性預測係數,係亦可不是aexp(n,r)而是adee(n,r)或 aadj(n,r)。又,線性預測逆濾波器處理中所被使用的線性 預測係數,係亦可爲對aexp(n,r)進行濾波器強度調整而取 得的線性預測係數aexp, adj(n,r)。強度調整,係和取得 aadj(n,r)之際相同,例如,依照以下的數式(10 )而進行 〇 [數 10] ^txpyadj (n,r) = a^(n,r)^K(r)n (ι^χ^ν) 高頻調整部2j,係對於來自線性預測逆濾波器部2i的 輸出,進行高頻成分的頻率特性及調性之調整(步驟Sb8 之處理)。該調整係依照從位元串流分離部2 a所給予之 SBR輔助資訊而進行。高頻調整部2j所致之處理,係依照 “MPEG4 AAC” 的 S B R 中的"H F a d j u s t m e n t ” 步驟而進行 的處理’是對於高頻頻帶的QMF領域之訊號,進行時間方 向的線性預測逆濾波器處理、增益之調整及雜訊之重疊所 作的調整。關於以上步驟的處理之細節,係在“ ISO/IEC 14496-3 subpart 4 General Audio Coding” 中有詳述。此 外’如上記,頻率轉換部2c、高頻生成部2g及高頻調整部 -32- 201126515 2j,係全部都是以“ ISO/1 EC 1 4496-3 ”中所規定之“ MPEG4 AAC”中的S B R解碼器爲依據而作動。 線性預測濾波器部2k,係對於從高頻調整部2j所輸出 的QMF領域之訊號的高頻成分qadj(n,r),使用從濾波器強 度調整部2f所得到之aadj(n,r)而在頻率方向上進行線性預 測合成濾波器處理(步驟Sb9之處理)。線性預測合成濾 波器處理中的傳達函數,係如以下的數式(1 1 )所示。 [數 11] g(z) =-ί- 1也辦 72=1 藉由該線性預測合成濾波器處理,線性預測濾波器部 2 k係將基於S B R所生成之高頻成分的時間包絡,予以變形 〇 係數加算部2m,係將從頻率轉換部2c所輸出之含有低 頻成分的QMF領域之訊號,和從線性預測濾波器部2k所輸 出之含有高頻成分的QMF領域之訊號,進行加算,輸出含 有低頻成分和高頻成分雙方的QMF領域之訊號(步驟Sb 10 之處理)。
頻率逆轉換部2n,係將從係數加算部2m所得到之QMF 領域之訊號,藉由QMF合成濾波器組而加以處理。藉此, 含有藉由核心編解碼器之解碼所獲得之低頻成分、和已被 SBR所生成之時間包絡是被線性預測濾波器所變形過的高 頻成分之雙方的時間領域的解碼後之聲音訊號,會被取得 ,該取得之聲音訊號,係透過內藏的通訊裝置而輸出至外 -33- 201126515 部(步驟Sbll之處理)。此外,頻率逆轉換部2n’係亦可 當 K(r)與 “ ISO/IEC 1 4496-3 subpart 4 General Audio Coding”中所記載之SBR輔助資訊之逆濾波器模式資訊是 作排他性傳輸時,對於K(r)被傳輸而SBR輔助資訊之逆濾 波器模式資訊不會傳輸的時槽,係使用該當時槽之前後的 時槽當中的對於至少一個時槽的SBR輔助資訊之逆濾波器 模式資訊,來生成該當時槽的SBR輔助資訊之逆濾波器模 式資訊,也可將該當時槽的SB R輔助資訊之逆濾波器模式 資訊,設定成預先決定之所定模式。另一方面,頻率逆轉 換部2η,係亦可對於SBR輔助資訊之逆濾波器資料被傳輸 而K(r)不被傳輸的時槽,係使用該當時槽之前後的時槽當 中的對於至少一個時槽的K(r),來生成該當時槽的K(r), 也可將該當時槽的K(r),設定成預先決定之所定値。此外 ,頻率逆轉換部2η,係亦可基於表示K(r)或SBR輔助資訊 之逆濾波器模式資訊之哪一者已被傳輸之資訊,來判斷所 被傳輸之資訊是K(r)還是SBR輔助資訊之逆濾波器模式資 訊。 (第1實施形態的變形例1 ) 圖5係第1實施形態所述之聲音編碼裝置的變形例(聲 音編碼裝置11a)之構成的圖示。聲音編碼裝置lla,係實 體上具備未圖示的CPU、ROM、RAM及通訊裝置等,該 CPU ’係將ROM等之聲音編碼裝置na的內藏記憶體中所 儲存的所定之電腦程式載入至RAM中並執行,藉此以統籌 -34 - 201126515 控制聲音編碼裝置lla。聲音編碼裝置lla的通訊裝置,係 將作爲編碼對象的聲音訊號’從外部予以接收,還有,將 已被編碼之多工化位元串流,輸出至外部。 聲音編碼裝置lla,係如圖5所示,在功能上係取代了 聲音編碼裝置1 1的線性預測分析部1 e、濾波器強度參數算 出部If及位元串流多工化部lg,改爲具備:高頻頻率逆轉 換部1 h、短時間功率算出部1 i (時間包絡輔助資訊算出手 段)、濾波器強度參數算出部1 fl (時間包絡輔助資訊算 出手段)及位元串流多工化部1 g 1 (位元串流多工化手段 )。位兀串流多工化部1 g 1係具有與1 G相同的功能。圖5所 示的聲音編碼裝置lla的頻率轉換部la〜SBR編碼部Id、高 頻頻率逆轉換部1 h、短時間功率算出部1 i、濾波器強度參 數算出部1Π及位元串流多工化部lgl,係藉由聲音編碼裝 置1 la的CPU去執行聲音編碼裝置i la的內藏記憶體中所儲 存的電腦程式,所實現的功能。該電腦程式之執行上所被 須的各種資料、及該電腦程式之執行所產生的各種資料, 係全部都被保存在聲音編碼裝置lla的ROM或RAM等之內 藏記憶體中。 高頻頻率逆轉換部lh,係從頻率轉換部ia所得到的 QMF領域之訊號之中,將被核心編解碼器編碼部1 c所編碼 之低頻成分所對應的係數置換成“ 0 ”後使用Q M F合成濾 波器組進行處理,獲得僅含高頻成分的時間領域訊號。短 時間功率算出部li,係將從高頻頻率逆轉換部“所得到之 時間領域的高頻成分,切割成短區間,然後算出其功率’ -35- 201126515 並算出p(r)。此外,作爲替代性的方法,亦可使用qmF領 域之訊號而依照以下的數式(12)來算出短時間功率。 [數 12] 63 户(,)=ΣΙ#,)Ι2 k=0 濾波器強度參數算出部lfl,係偵測出p(r)的變化部分 ,將K(r)的値決定成,變化越大則K(r)越大。K(r)的値係 亦可例如和聲音解碼裝置2 1之訊號變化偵測部2 e中的T⑴ 之算出爲相同的方法而進行。又,亦可藉由其他更洗鍊的 方法來進行訊號變化偵測。又,濾波器強度參數算出部 1 Π ’係亦可在針對低頻成分和高頻成分之各者而取得了 短時間功率後’以和聲音解碼裝置2 1之訊號變化偵測部2 e 中的T(r)之算出相同的方法來取得低頻成分及高頻成分之 各自的訊號變化Tr(r)、Th(〇,使用它們來決定K(r)的値》 此時,K(r)係可例如依照以下的數式(1 3 )而加以取得。 其中,ε係爲例如3.0等之定數。 [數 13] K(r)=max(0,e •(Th(r)-Tr(r))) (第1實施形態的變形例2 ) 第1實施形態的變形例2的聲音編碼裝置(未圖示), 係實體上具備未圖示的CPU、ROM、RAM及通訊裝置等, 該CPU,係將ROM等變形例2之聲音編碼裝置的內藏記億 體中所儲存的所定之電腦程式載入至RAM中並執行,藉此 -36- 201126515 以統籌控制變形例2的聲音編碼裝置。變形例2的聲音編碼 裝置的通訊裝置,係將作爲編碼對象的聲音訊號,從外部 予以接收,還有’將已被編碼之多工化位元串流,輸出至 外部》 變形例2的聲音編碼裝置,係在功能上是取代了聲音 編碼裝置1 1的濾波器強度參數算出部1 f及位元串流多工化 部1 g,改爲具備未圖示的線性預測係數差分編碼部(時間 包絡輔助資訊算出手段)、接收來自該線性預測係數差分 編碼部之輸出的位元串流多工化部(位元串流多工化手段 )。變形例2的聲音編碼裝置的頻率轉換部1 a〜線性預測 分析部1 e、線性預測係數差分編碼部、及位元串流多工化 部,係藉由變形例2的聲音編碼裝置之CPU去執行變形例2 之聲音編碼裝置的內藏記憶體中所儲存的電腦程式,所實 現的功能。該電腦程式之執行上所被須的各種資料、及該 電腦程式之執行所產生的各種資料,係全部都被保存在變 形例2的聲音編碼裝置的ROM或RAM等之內藏記憶體中。 線性預測係數差分編碼部,係使用輸入訊號的aH(n,r) 和輸入訊號的aL(n,r),依照以下的數式(1 4 )而算出線性 預測係數的差分値aD(n,r)。 [數 14] aD(n,r)=aH(n,r)-aL(n,r) (1 ^n^N) 線性預測係數差分編碼部,係還將a d (η,r)予以量化, 發送至位元串流多工化部(對應於位元串流多工化部1 g之 構成)。該位元串流多工化部’係取代K(r)改成將aD(n,r) -37- 201126515 多工化至位元串流,將該多工化位元串流,透過內藏的通 訊裝置而輸出至外部。 第1實施形態的變形例2的聲音解碼裝置(未圖示), 係實體上具備未圖示的CPU、ROM、RAM及通訊裝置等, 該CPU,係將ROM等變形例2之聲音解碼裝置的內藏記憶 體中所儲存的所定之電腦程式載入至RAM中並執行,藉此 以統籌控制變形例2的聲音解碼裝置。變形例2的聲音解碼 裝置的通訊裝置,係將從聲音編碼裝置11、變形例1所述 之聲音編碼裝置11a、或變形例2所述之聲音編碼裝置所輸 出的已被編碼之多工化位元串流,加以接收,然後將已解 碼之聲音訊號,輸出至外部。 變形例2的聲音解碼裝置,係在功能上是取代了聲音 解碼裝置2 1的濾波器強度調整部2f,改爲具備未圖示的線 性預測係數差分解碼部。變形例2的聲音解碼裝置的位元 串流分離部2a〜訊號變化偵測部2e、線性預測係數差分解 碼部、及高頻生成部2g〜頻率逆轉換部2η,係藉由變形例 2的聲音解碼裝置之CPU去執行變形例2之聲音解碼裝置的 內藏記億體中所儲存的電腦程式’所實現的功能。該電腦 程式之執行上所被須的各種資料、及該電腦程式之執行所 產生的各種資料,係全部都被保存在變形例2的聲音解碼 裝置的ROM或RAM等之內藏記億體中。 線性預測係數差分解碼部’係利用從低頻線性預測分 析部2d所得到之aL(n,r)和從位元串流分離部2a所給予之 aD(n,r),依照以下的數式(15 )而獲得已被差分解碼的 -38- 201126515 aatjj(n,r)。 [數 15]
3adj(n,r)~•3dec(n,r)"^3D(n,r), 1 = Π = N 線性預測係數差分解碼部’係將如此已被差分解碼之 aadj(n,r),發送至線性預測濾波器部2k ° aD(n,r) ’係可爲 如數式(1 4 )所示是預測係數之領域中的差分値’但亦可 是將預測係數,轉換成 LSP ( Linear Spectrum Pair) 、ISP (Immittance Spectrum Pair) 、LSF ( Linear Spectrum Frequency ) 、ISF ( Immittance Spectrum Frequency ) 、 PARCOR係數等之其他表現形式後,求取差分而得的値。 此時,差分解碼也是和該表現形式相同。 (第2實施形態) 圖6係第2實施形態所述之聲音編碼裝置12之構成的圖 示。聲音編碼裝置12,係實體上具備未圖示的CPU、ROM 、RAM及通訊裝置等,該CPU,係將ROM等之聲音編碼裝 置1 2的內藏記憶體中所儲存的所定之電腦程式(例如圖7 的流程圖所示之處理執行所需的電腦程式)載入至RAM中 並執行’藉此以統籌控制聲音編碼裝置;[2。聲音編碼裝置 1 2的通訊裝置,係將作爲編碼對象的聲音訊號,從外部予 以接收’還有,將已被編碼之多工化位元串流,輸出至外 部。 聲音編碼裝置〗2 ’係在功能上是取代了聲音編碼裝置 1 1的濾波器強度參數算出部1 f及位元串流多工化部1 g,改 -39- 201126515 爲具備:線性預測係數抽略部lj (預測係數抽略手段)、 線性預測係數量化部1 k (預測係數量化手段)及位元串流 多工化部1 g2 (位元串流多工化手段)。圖6所示的聲音編 碼裝置1 2的頻率轉換部1 a〜線性預測分析部1 e (線性預測 分析手段)、線性預測係數抽略部1 j、線性預測係數量化
部1 k及位元串流多工化部1 g2,係聲音編碼裝置1 2的CPU 去執行聲音編碼裝置12的內藏記憶體中所儲存的電腦程式 ,所實現的功能。聲音編碼裝置12的CPU,係藉由執行該 電腦程式(使用圖6所示的聲音編碼裝置12的頻率轉換部 1 a〜線性預測分析部1 e、線性預測係數抽略部lj、線性預 測係數量化部1 k及位元串流多工化部1 g2 ),依序執行圖7 的流程圖中所示的處理(步驟Sal〜步驟Sa5、及步驟Scl 〜步驟Sc3之處理)。該電腦程式之執行上所被須的各種 資料、及該電腦程式之執行所產生的各種資料,係全部都 被保存在聲音編碼裝置12的ROM或RAM等之內藏記憶體中 〇 線性預測係數抽略部lj,係將從線性預測分析部丨6所 獲得之aH(n,r) ’在時間方向上作抽略,將對於aH(n,r)當中 之一部分時槽η的値’和對應的ri之値,發送至線性預測 係數量化部Ik (步驟Scl之處理)。其中,〇si<Nts,Nts 係在框架中aH(n,r)之傳輸所被進行的時槽的數目。線性預 測係數的抽略’係可每一定時間間隔而爲之,或亦可基於 aH(n,r)之性質而爲不等時間間隔的抽略。例如,亦可考慮 ’在帶有某長度之框架之中比較aH(n,r)的GH(r),當GH(r) -40- 201126515 超過一定値時則將aH(n,r)視爲量化的對象等方法。當線,丨生 預測係數的抽略間隔是不依循aH(n,r)之性質而設爲―定間 隔時,則對於非傳輸對象之時槽,就沒有必要算出aH(n,〇 〇 線性預測係數量化部1 k,係將從線性預測係數抽略部 1J所給予之抽略後的高頻線性預測係數aH(n,ri),和對應之 時槽的指數η,予以量化,發送至位元串流多工化部丨g2 ( 步驟S c 2之處理)。此外,作爲替代性構成,亦可取代 a η (η,r j)的量化,改成和第1實施形態的變形例2所述之聲音 編碼裝置同樣地,將線性預測係數的差分値aD(n,ri)視爲量 化的對象。 位元串流多工化部1 g2,係將已被核心編解碼器編碼 部lc所算出之編碼位元串流、已被SBR編碼部Id所算出之 SBR輔助資訊、從線性預測係數量化部1 k所給予之量化後 的aH(n,ri)所對應之時槽的指數{ η },多工化至位元串流 中,將該多工化位元串流,透過聲音編碼裝置〗2的通訊裝 置而加以輸出(步驟Sc3之處理)。 圖8係第2實施形態所述之聲音解碼裝置22之構成的圖 示。聲音解碼裝置22,係實體上具備未圖示的CPU、ROM 、RAM及通訊裝置等,該CPU,係將ROM等之聲音解碼裝 置22的內藏記憶體中所儲存的所定之電腦程式(例如圖9 的流程圖所示之處理執行所需的電腦程式)載入至RAM中 並執行,藉此以統籌控制聲音解碼裝置22。聲音解碼裝置 22的通訊裝置,係將從聲音編碼裝置12所輸出的已被編碼 -41 - 201126515 之多工化位元串流’加以接收,然後將已解碼之聲音訊號 ,輸出至外部。 聲音解碼裝置22 ’係在功能上是取代了聲音解碼裝置 2 1的位元串流分離部2a、低頻線性預測分析部2d、訊號變 化偵測部2e、濾波器強度調整部η及線性預測濾波器部2k ’改爲具備:位元串流分離部2 a 1 (位元串流分離手段) '線性預測係數內插•外插部2p (線性預測係數內插.外 插手段)及線性預測濾波器部2k 1 (時間包絡變形手段) 。圖8所示之聲音解碼裝置22的位元串流分離部2al、核心 編解碼器解碼部2b、頻率轉換部2c、高頻生成部2g〜高頻 調整部2j、線性預測濾波器部2k 1、係數加算部2m、頻率 逆轉換部2η、及線性預測係數內插·外插部2p,係藉由聲 音編碼裝置12的CPU去執行聲音編碼裝置12的內藏記憶體 中所儲存的電腦程式,所實現的功能。聲音解碼裝置22的 CPU ’係藉由執行該電腦程式(使用圖8所示之位元串流 分離部2al、核心編解碼器解碼部2b、頻率轉換部2c、高 頻生成部2g〜高頻調整部2j、線性預測濾波器部2kl、係 數加算部2m、頻率逆轉換部2n、及線性預測係數內插•外 插部2P ) ’而依序執行圖9的流程圖所示之處理(步驟Sbl 〜步驟Sb2、步驟Sdl、步驟Sb5〜步驟Sb8、步驟Sd2、及 步驟SblO〜步驟Sbll之處理)。該電腦程式之執行上所被 須的各種資料、及該電腦程式之執行所產生的各種資料, 係全部都被保存在聲音解碼裝置22的ROM或RAM等之內藏 記憶體中。 -42- 201126515 聲音解碼裝置22,係取代了聲音解碼裝置22的位元串 流分離部2a、低頻線性預測分析部2d、訊號變化偵測部2e 、濾波器強度調整部2f及線性預測濾波器部2k,改爲具備 :位元串流分離部2al、線性預測係數內插·外插部2p及 線性預測濾波器部2k 1。 位元串流分離部2al,係將已透過聲音解碼裝置22的 通訊裝置而輸入的多工化位元串流,分離成已被量化的 aH(n,ri)所對應之時槽的指數ri、SBR輔助資訊、編碼位元 串流。 線性預測係數內插·外插部2p,係將已被量化的 aH(n,ri)所對應之時槽的指數ri,從位元串流分離部2al加 以收取,將線性預測係數未被傳輸之時槽所對應的aH(n,r) ,藉由內插或外插而加以取得(步驟Sdl之處理)。線性 預測係數內插•外插部2p,係可將線性預測係數的外插, 例如依照例以下的數式(1 6 )而進行。 [數 16] aH(n^r) = slr~ri〇laH(n,ri0) (1<η^Ν) 其中,no係線性預測係數所被傳輸之時槽{ η }當中最靠 近Γ的値。又,(5係爲滿足0<5<1之定數。 又,線性預測係數內插•外插部2ρ,係可將線性預測 係數的內插,例如依照例以下的數式(1 7 )而進行。其中 ,滿足 ri〇<r<ri〇 + 1。 -43- 201126515 [數 17] γ 一 γ γ — γ% aH(n,r) — (^5^i)"* ' (^5^0+1) Cl^n^N) ri〇+i~n ri〇+i~ri〇 此外,線性預測係數內插•外插部2 p,係亦可將線性 預測係數,轉換成 LSP ( Linear Spectrum Pair) 、ISP ( Immittance Spectrum Pair ) 、 LSF ( Linear Spectrum
Frequency ) 、ISF ( Immittance Spectrum Frequency )、 PARCOR係數等之其他表現形式後,進行內插•外插,將 所得到的値,轉換成線性預測係數而使用之。內插或外插 後的aH(n,r)係被發送至線性預測濾波器部2kl,作爲線性 預測合成濾波器處理時的線性預測係數而被利用,但亦可 當成線性預測逆濾波器部2i中的線性預測係數而被使用。 當位兀串流中不是aH(n,r)而是被多工化了 aD(n,ri)時,線性 預測係數內插•外插部2p,係早於上記內插或外插處理, 進行和第1實施形態的變形例2所述之聲音解碼裝置同樣的 差分解碼處理。 線性預測濾波器部2k 1 ’係對於從高頻調整部2j所輸 出的qadj(n,r),使用從線性預測係數內插·外插部2p所得 到之已被內插或外插的aH(n,r),而在頻率方向上進行線性 預測合成濾波器處理(步驟S d2之處理)。線性預測濾波 器部2k 1的傳達函數係如以下的數式(1 8 )所示。線性預 測濾波器部2k 1,係和聲音解碼裝置2 1的線性預測濾波器 部2 k同樣地’進行線性預測合成濾波器處理,藉此而將 SBR所生成的高頻成分之時間包絡,予以變形。 -44- 201126515 mm g⑺=—- (第3實施形態) 圖1 〇係第3實施形態所述之聲音編碼裝置1 3之構成的 圖示。聲音編碼裝置13,係實體上具備未圖示的CPU、 ROM、RAM及通訊裝置等,該CPU,係將ROM等之聲音編 碼裝置1 3的內藏記憶體中所儲存的所定之電腦程式(例如 圖1 1的流程圖所示之處理執行所需的電腦程式)載入至 RAM中並執行,藉此以統籌控制聲音編碼裝置丨3。聲音編 碼裝置13的通訊裝置,係將作爲編碼對象的聲音訊號,從 外部予以接收,還有,將已被編碼之多工化位元串流,輸 出至外部。 聲音編碼裝置13’係在功能上是取代了聲音編碼裝置 1 1的線性預測分析部1 e、濾波器強度參數算出部丨f及位元 串流多工化部1 g ’改爲具備:時間包絡算出部1 m (時間包 絡輔助資訊算出手段)、包絡形狀參數算出部1 n (時間包 絡輔助資訊算出手段)及位元串流多工化部丨g3 (位元串 流多工化手段)。圖10所示的聲音編碼裝置13的頻率轉換 部la〜SBR編碼部id、時間包絡算出部1〇1、包絡形狀參數 算出部In、及位元串流多工化部lg3 ’係藉由聲音編碼裝 置12的CPU去執行聲音編碼裝置κ的內藏記憶體中所儲存 的電腦&式,所貫現的功能。聲音編碼裝置i 3的C p u ,係 -45- 201126515 藉由執行該電腦程式(使用圖10所示的聲音編碼裝置13的 頻率轉換部la〜SBR編碼部ld、時間包絡算出部lm、包絡 形狀參數算出部1 η、及位元串流多工化部1 g3 ),來依序 執行圖1 1的流程圖所示之處理(步驟S a 1〜步驟S a4、及步 驟Sel〜步驟Se3之處理)。該電腦程式之執行上所被須的 各種資料、及該電腦程式之執行所產生的各種資料,係全 部都被保存在聲音編碼裝置13的ROM或RAM等之內藏記憶 體中。 時間包絡算出部1 m ’係收取q(k,r),例如,藉由取得 q(k,r)的每一時槽之功率,以取得訊號之高頻成分的時間 包絡資訊e(r)(步驟Sel之處理)。此時,e(r)係可依照以 下的數式(19)而被取得。 擻19]
包絡形狀參數算出部1 η,係從時間包絡算出部丨m收取 e(0,然後從SBR編碼部1 d收取SBR包絡的時間交界{ bi } 。其中’ OSiSNe’ Ne係爲編碼框架內的SBR包絡之數目 。包絡形狀參數算出部In,係針對編碼框架內的SBR包絡 之各者,例如依照以下的數式(20 )而取得包絡形狀參數 s(i) ( 0 ^ i < Ne )(步驟Se2之處理)。此外,包絡形狀參 數s(i)係對應於時間包絡輔助資訊,這在第3實施形態中也 同樣如此。 -46- 201126515 [數 20] ⑹=-—^7—rZkO"^))2 bi+「Hbi 其中, [數 21] *Μ-ι _ Ze(r) r~bi
上記數式中的S(i)係表示滿足biSrCbi+l的第i個SBR 包絡內的e(〇之變化大小的參數,時間包絡的變化越大則 e(r)會取越大的値。上記數式(20)及(21 ),係爲s(i)的 算出方法之一例,亦可使用例如e(r)的SMF ( Spectral Flatness Measure)、或最大値與最小値的比値等,來取 得s(i)。其後,s(i)係被量化,被傳輸至位元串流多工化部 lg3 〇 位元串流多工化部1 g3,係將已被核心編解碼器編碼 部lc所算出之編碼位元串流、已被SBR編碼部Id所算出之 SBR輔助資訊、s(i),多工化至位元串流,將該已多工化 之位元串流,透過聲音編碼裝置13的通訊裝置而加以輸出 (步驟Se3之處理)。 圖12係第3實施形態所述之聲音解碼裝置23之構成的 圖示。聲音解碼裝置23,係實體上具備未圖示的CPU、 ROM、RAM及通訊裝置等,該CPU,係將ROM等之聲音解 碼裝置23的內藏記憶體中所儲存的所定之電腦程式(例如 -47- 201126515 圖1 3的流程圖所示之處理執行所需的電腦程式)載 RAM中並執行,藉此以統籌控制聲音解碼裝置2 3。聲 碼裝置2 3的通訊裝置,係將從聲音編碼裝置丨3所輸出 被編碼之多工化位元串流,加以接收,然後將已解碼 音訊號,輸出至外部。 聲音解碼裝置23,係在功能上是取代了聲音解碼 2 1的位元串流分離部2a、低頻線性預測分析部2d、訊 化偵測部2 e、濾波器強度調整部2 f、高頻線性預測分 2h、線性預測逆濾波器部2i及線性預測濾波器部2k, 具備:位元串流分離部2a2(位元串流分離手段)、 時間包絡算出部2r (低頻時間包絡分析手段)、包絡 調整部2s (時間包絡調整手段)、高頻時間包絡算出 、時間包絡平坦化部2 u及時間包絡變形部2 v (時間包 形手段)。圖1 2所示之聲音解碼裝置2 3的位元串流分 2 a2、核心編解碼器解碼部2b〜頻率轉換部2c、高頻 部2g、高頻調整部2j、係數加算部2m、頻率逆轉換部 及低頻時間包絡算出部2r〜時間包絡變形部2 v,係藉 音編碼裝置12的CPU去執行聲音編碼裝置12的內藏記 中所儲存的電腦程式’所實現的功能。聲音解碼裝置 C P U ’係藉由執行該電腦程式(使用圖丨2所示之聲音 裝置23的位元串流分離部2a2、核心編解碼器解碼部 頻率轉換部2c、高頻生成部2g、高頻調整部2j、係數 部2m、頻率逆轉換部2n、及低頻時間包絡算出部2r〜 包絡變形部2 v )’來依序執行圖1 3的流程圖所示之處 入至 音解 的已 之聲 裝置 號變 析部 改爲 低頻 形狀 部2t 絡變 離部 生成 2n、 由聲 憶體 23的 解碼 2b〜 加算 時間 理( -48- 201126515 步驟Sbl〜步驟Sb2、步驟Sfl〜步驟Sf2、步驟Sb5、步驟 Sf3〜步驟Sf4、步驟Sb8、步驟Sf5、及步驟SblO〜步驟 Sb 1 1之處理)。該電腦程式之執行上所被須的各種資料、 及該電腦程式之執行所產生的各種資料,係全部都被保存 在聲音解碼裝置23的ROM或RAM等之內藏記憶體中。 位元串流分離部2a2,係將透過聲音解碼裝置23的通 訊裝置所輸入的多工化位元串流,分離成s(i)、SBR輔助 資訊、編碼位元串流。低頻時間包絡算出部2r,係從頻率 轉換部2c收取含低頻成分的qdee(k,〇,將e(r)依照以下的數 式(22 )而加以取得(步驟Sfl之處理)。 [數 22]
包絡形狀調整部2s,係使用s(i)來調整e(r),並取得調 整後的時間包絡資訊eadj(r)(步驟Sf2之處理)。對該e(r) 的調整,係可依照例如以下的數式(23 )〜(25 )而進行 [數 23] eadj(r) = e(J) + Φ(0~ν(ΐ) -(e(r)-e(z)) (s(i)>v(0) eadjir)=e(r) 其中, 49- 201126515 [數 24] Φ)=
H
[數 25] bi+l_
v(z)= 上記的數式(23 )〜(25 )係爲調整方法之一例’亦 可使用eadj(r)的形狀是接近於s(i)所示之形狀之類的其他調 整方法。 高頻時間包絡算出部2t,係使用從高頻生成部2g所得 到的qexp(k,r)而將時間包絡eexp(r)依照以下的數式(26 ) 而予以算出(步驟Sf3之處理)。 [數 26]
時間包絡平坦化部2u,係將從高頻生成部2g所得到的 qexp(k,r)的時間包絡,依照以下的數式(27 )而予以平坦 化,將所得到的QMF領域之訊號qflat(k,r),發送至高頻調 整部2j (步驟Sf4之處理)。 [數 27]
(kx^k^63) 時間包絡平坦化部2 u中的時間包絡之平坦化係亦可省 -50- 201126515 略。又,亦可不對於來自高頻生成部2g的輸出,進行高頻 成分的時間包絡算出與時間包絡的平坦化處理,而是改成 對於來自高頻調整部2 j的輸出,進行高頻成分的時間包絡 算出與時間包絡的平坦化處理。甚至,在時間包絡平坦化 部2u中所使用的時間包絡,係亦可並非從高頻時間包絡算 出部2t所得到的eexp(r),而是從包絡形狀調整部2s所得到 的 eadj(r)。 時間包絡變形部2v,係將從高頻調整部2j所獲得之 qadj(k,r),使用從時間包絡變形部2v所獲得之eadj(r)而予以 變形,取得時間包絡是已被變形過的QMF領域之訊號 qenvadj(k,r)(步驟Sf5之處理)。該變形,係依照以下的數 式(28 )而被進行。£16„^£1』(1〇係被當成對應於高頻成分 的QMF領域之訊號,而被發送至係數加算部2m。 [數 28] qenvadj (K r) = qadj (k, r) · eadj (r) (第4實施形態) 圖14係第4實施形態所述之聲音解碼裝置24之構成的 圖示。聲音解碼裝置24,係實體上具備未圖示的CPU、 ROM、RAM及通訊裝置等’該CPU ’係將ROM等之聲音解 碼裝置24的內藏記億體中所儲存的所定之電腦程式載入至 RAM中並執行,藉此以統籌控制聲音解碼裝置24。聲音解 碼裝置24的通訊裝置,係將從聲音編碼裝置11或聲音編碼 裝置1 3所輸出的已被編碼之多工化位元串流,加以接收, -51 - 201126515 然後將已解碼之聲音訊號,輸出至外部》 聲音解碼裝置23,係在功能上是具備:聲音解碼裝置 2 1的構成(核心編解碼器解碼部2b、頻率轉換部2 c、低頻 線性預測分析部2d、訊號變化偵測部2e、濾波器強度調整 部2f、高頻生成部2g、高頻線性預測分析部2h、線性預測 逆濾波器部2i、高頻調整部2j、線性預測濾波器部2k、係 數加算部2m及頻率逆轉換部2η),和聲音解碼裝置24的構 成(低頻時間包絡算出部2r、包絡形狀調整部2s及時間包 絡變形部2v )。甚至,聲音解碼裝置24,係還具備:位元 串流分離部2a3 (位元串流分離手段)及輔助資訊轉換部 2w。線性預測濾波器部2k和時間包絡變形部2v的順序係亦 可和圖14所示呈相反。此外,聲音解碼裝置24,係將已被 聲音編碼裝置11或聲音編碼裝置13所編碼的位元串流,當 作輸入,較爲理想。圖1 4所示的聲音解碼裝置2 4之構成, 係藉由聲音解碼裝置24的CPU去執行聲音解碼裝置24的內 藏記憶體中所儲存的電腦程式,所實現的功能。該電腦程 式之執行上所被須的各種資料、及該電腦程式之執行所產 生的各種資料,係全部都被保存在聲音解碼裝置24的ROM 或RAM等之內藏記憶體中。 位元串流分離部2a3,係將透過聲音解碼裝置24的通 訊裝置所輸入的多工化位元串流,分離成時間包絡輔助資 訊、SBR輔助資訊、編碼位元串流。時間包絡輔助資訊, 係亦可爲第1實施形態中所說明過的K(r),或是可爲第3實 施形態中所說明過的s(i)。又,亦可爲不是K(r)、s(i)之任 -52- 201126515 —者的其他參數X(r)。 輔助資訊轉換部2w,係將所被輸入的時間包絡輔助資 訊予以轉換,獲得K(〇和s(i)。當時間包絡輔助資訊是K(r) 時,輔助資訊轉換部2w係將K(r)轉換成s(i)。輔助資訊轉 換部2w,係亦可將該轉換,例如將bi S r < bi+ !之區間內的 K(〇之平均値 [數 29] m 加此取得後,使用所定的轉換表,將該數式(2 9 )所 示的平均値,轉換成s(i),藉此而進行之。又,當時間包 絡輔助資訊爲s(i)時,輔助資訊轉換部2w,係將s(i)轉換成 K(r)。輔助資訊轉換部2w,係亦可將該轉換,藉由例如使 用所定的轉換表來將s(i)轉換成K(r),而加以執行。其中 ,1和r必須以滿足biS r< bi+1之關係而建立關連對應。 當時間包絡輔助資訊是既非s(i)也非K(r)的參數X(r)時 ,輔助資訊轉換部2w係將X(r),轉換成K(r)與s(i)。輔助 資訊轉換部2w,係將該轉換,藉由例如使用所定的轉換表 來將X(r)轉換成K(r)及s(i)而加以進行,較爲理想。又,輔 助資訊轉換部2w,係將X(r),就每一 SBR包絡,傳輸1個代 表値,較爲理想。將X(r)轉換成K(r)及s(i)的對應表亦可彼 此互異。 (第1實施形態的變形例3 ) 第1實施形態的聲音解碼裝置2 1中,聲音解碼裝置2 1 -53- 201126515 的線性預測濾波器部2k,係可含有自動增益控制處理。該 自動增益控制處理,係用來使線性預測濾波器部2k所輸出 之QMF領域之訊號的功率,契合於所被輸入之QMF領域之 訊號功率的處理。增益控制後的QMF領域訊號qsyn,pt5w(n,r) ,一般而言,係由下式而實現。 [數 30]
此處,P〇(r)、Pi(r)係分別可由以下的數式(31 )及數 式(32 )來表示。 [數 31] 63 2 p〇(r)=£hw(w,r) [數 32] 63 *1 —Z*·*. 藉由該自動增益控制處理,線性預測濾波器部2k的輸 出訊號的高頻成分之功率,係被調整成相等於線性預測濾 波器處理前的値。其結果爲,基於SBR所生成之高頻成分 的時間包絡加以變形後的線性預測濾波器部2k之輸出訊號 中,在高頻調整部2j中所被進行之高頻訊號的功率調整之 效果,係被保持。此外,該自動增益控制處理,係亦可對 QMF領域之訊號的任意頻率範圍,個別進行。對各個頻率 範圍之處理,係分別將數式(30)、數式(31)、數式( 201126515 3 2 )的η ’限定在某個頻率範圍內,就可實現。例如第^個 頻率範圍係可表示作FiSn<Fi + 1 (此時的i係爲表示qmf領 域之訊號的任意頻率範圍之號碼的指數)。Fi係表示頻率 軸圍之父界’係爲 MPEG4 AAC’的SBR中所規定之包絡 比例因子的頻率交界表,較爲理想。頻率交界表係依照“ MPEG4 AAC”的S B R之規定,於高頻生成部2 g中被決定。 藉由該自動增益控制處理,線性預測濾波器部2]^的輸出訊 號的高頻成分的任意頻率範圍內之功率,係被調整成相等 於線性預測瀘波器處理前的値。其結果爲,基於SBr所生 成之高頻成分的時間包絡加以變形後的線性預測濾波器部 2k之輸出訊號中,在高頻調整部2j中所被進行之高頻訊號 的功率調整之效果’係以頻率範圍之單位而被保持。又, 與第1實施形態的本變形例3相同之變更,係亦可施加於第 4實施形態中的線性預測濾波器部2k上。 (第3實施形態的變形例1 ) 第3實施形態的聲音編碼裝置13中的包絡形狀參數算 出部In,係亦可藉由如以下之處理而實現。包絡形狀參數 算出部In’係針對編碼框架內的SBR包絡之各者,例如依 照以下的數式(33 )而取得包絡形狀參數s(i) ( i < Ne )° [數 33] s(i) -1- min(-^^-) <0 -55- 201126515 其中, [數 34] Φ) 係爲e(r)的在SBR包絡內的平均値,其算出方法係依照數 式(21 ) »其中,所謂SBR包絡,係表示滿足bi S r < bi + 1 的時間範圍。又,{bi} ’係在SBR輔助資訊中被當作資 訊而含有的SBR包絡之時間交界,是把表示任意時間範圍 、任意頻率範圍的平均訊號能量的S B R包絡比例因子當作 對象的時間範圍之交界。又,min( ·)係表示bi S r < bi+1之 範圍中的最小値。因此,在此情況下,包絡形狀參數s (i) 係爲用來指示調整後的時間包絡資訊的SBR包絡內的最小 値與平均値之比率的參數。又,第3實施形態的聲音解碼 裝置23中的包絡形狀調整部2s,係亦可藉由如以下之處理 而實現。包絡形狀調整部2s,係使用s(i)來調整e(r),並取 得調整後的時間包絡資訊eadj(〇。調整的方法係依照以下 的數式(35)或數式(36)。 [數 35]
eadj(r) = Φ) [數 36]
eadj(r) = Φ) 201126515 數式3 5 ’係用來調整包絡形狀,以使得調整後之時間 包絡資訊eadj (r)的S B R包絡內之最小値與平均値之比率, 是等於包絡形狀參數s (i)之値。又,與上記之第3實施形態 的本變形例1相同之變更’係亦可施加於第4實施形態。 (第3實施形態的變形例2 ) 時間包絡變形部2 v ’係亦可取代數式(2 8 ),改成利 用以下的數式。如數式(37 )所示,eadj,sealed(r)係用來控 制調整後的時間包絡資訊eadj(r)的增益,使得qadj(k,r)與 qenvadj(k,r)的SBR包絡內的功率是呈相等。又,如數式( 38 )所示,第3實施形態的本變形例2中,並非將eadj(r), 而是將eadj,seaied(r),乘算至QMF領域之訊號qadj(k,r),以 獲得qenvadj(k,r)。因此,時間包絡變形部2v係可進行QMF 領域之訊號qadj(k,r)的時間包絡之變形,以使得SBR包絡內 的訊號功率,在時間包絡的變形前後是呈相等。其中,所 謂SBR包絡,係表示滿足bi S r < bi+1的時間範圍。又,{ bi },係在SBR輔助資訊中被當作資訊而含有的SBR包絡 之時間交界,是把表示任意時間範圍、任意頻率範圍的平 均訊號能量的SBR包絡比例因子當作對象的時間範圍之交 界。又,本發明之實施例中的用語“ SBR包絡”,係相當 於 “ISO/IEC 1 4496-3 ” 中所規定之 “MPEG4 AAC” 中的 用語“ SBR包絡時間區段”,在放眼所有實施例中’“ S B R包絡”都意味著與‘‘ s B R包絡時間區段”相同之內容 -57- 201126515 擻37] eadj,scaied(r) = eadjir)' k=kx 63 ^,+1-1 1 ZZlMD.^(r)l I k=kx r=bi {kx < Ar<63,^· <r<bi+x) [數 38] ^envadj ^*) ~ 9.adj ^adj,scaled (^) (kx <A:<63,^,. <r<^>/+1) 又,與上記之第3實施形態的本變形例2相同之變S 係亦可施加於第4實施形態。 (第3實施形態的變形例3 ) 數式(1 9 )係亦可爲下記的數式(3 9 ) ° [數 39] 63 (^/+1 - \q{k ,r)\ (Ο k = 0 63 Σ Σ k(^»r>i2 bi k = ο 數式(22)係亦可爲下記的數式(4〇) -58- 201126515 [數 40] 63 ¢,+ 1 - \q dec (k ,r)\2
數式(26)係亦可爲下記的數式(q)。 [數 41]
63
Hi - )Σ k exp (^ »^ )| •__k = k x_ */+i - 1 63
Σ Σ k exp ( ^ ^ ) I r = b t k = kx 若依照數式(39)及數式(40),則時間包絡資訊 e(r),係將每一 QMF子頻帶樣本的功率,以SBR包絡內的 平均功率而進行正規化,然後求取平方根。其中,QMF子 頻帶樣本,係於QMF領域訊號中,是對應於同一時間指數 “ r”的訊號向量,係意味著QMF領域中的一個子樣本。 又,於本發明之實施形態全體中,用語“時槽”係意味著 與“ QMF子頻帶樣本”同一之內容。此時,時間包絡資訊 e(r),意味著應對各QMF子頻帶樣本作乘算的增益係數, 這在調整後的時間包絡資訊eadj(r)也是同樣如此。 (第4實施形態的變形例1 ) 第4實施形態的變形例1的聲音解碼裝置24a (未圖示 ),係實體上具備未圖示的CPU、ROM、RAM及通訊裝置 等,該CPU,係將ROM等之聲音解碼裝置24a的內藏記憶 -59- 201126515 體中所儲存的所定之電腦程式載入至RAM中並執行,藉此 以統_控制聲音解碼裝置24a。聲音解碼裝置24a的通訊裝 置,係將從聲音編碼裝置11或聲音編碼裝置13所輸出的已 被編碼之多工化位元串流,加以接收,然後將已解碼之聲 音訊號,輸出至外部。聲音解碼裝置24a,係在功能上是 取代了聲音解碼裝置24的位元串流分離部2a3,改爲具備 位元串流分離部2a4 (未圖示),然後還取代了輔助資訊 轉換部2 w,改爲具備時間包絡輔助資訊生成部2 y (未圖示 )。位元串流分離部2a4,係將多工化位元串流,分離成 SB R輔助資訊、編碼位元串流。時間包絡輔助資訊生成部 2y,係基於編碼位元串流及SBR輔助資訊中所含之資訊, 而生成時間包絡輔助資訊。 某個SBR包絡中的時間包絡輔助資訊之生成時,係可 使用例如該當SBR包絡之時間寬度(bi+l-bi )、框架級別 (frame class )、逆據波器之強度參數、雜訊水平(noise floor )、高頻功率之大小、高頻功率與低頻功率之比率、 將在QMF領域中所被表現之低頻訊號在頻率方向上進行線 性預測分析之結果的自我相關係數或預測增益等。基於這 些參數之一、或複數的値來決定K(r)或s(i),就可生成時 間包絡輔助資訊。例如SBR包絡之時間寬度(bi + 1-bi )越 寬則K(r)或s(i)就越小,或者SBR包絡之時間寬度(bi + l-bi )越寬則K(r)或s(i)就越大,如此基於(bi+l-bi )來決定 K(r)或s(i),就可生成時間包絡輔助資訊。又,同樣之變 更亦可施加於第1實施形態及第3實施形態。 -60- 201126515 (第4實施形態的變形例2 ) 第4實施形態的變形例2的聲音解碼裝置24b (參照圖 15),係實體上具備未圖示的CPU、ROM、RAM及通訊裝 置等,該CPU,係將ROM等之聲音解碼裝置24b的內藏記 憶體中所儲存的所定之電腦程式載入至RAM中並執行,藉 此以統籌控制聲音解碼裝置24b。聲音解碼裝置24b的通訊 裝置,係將從聲音編碼裝置11或聲音編碼裝置13所輸出的 已被編碼之多工化位元串流,加以接收,然後將已解碼之 聲音訊號,輸出至外部。聲音解碼裝置24b,係如圖1 5所 示,除了高頻調整部2j以外,還具備有一次高頻調整部2jl 和二次高頻調整部2j2。 此處,一次高頻調整部2j 1,係依照“ MPEG4 AAC” 的SBR中的“HF adjustment”步驟中的,對於高頻頻帶的 QMF領域之訊號,進行時間方向的線性預測逆濾波器處理 、增益之調整及雜訊之重疊處理,而進行調整。此時,一 次高頻調整部2jl的輸出訊號,係相當於“ISO/IEC 1 4496-3:2005 ” 的 “SBR tool” 內,4.6.18.7.6 節 “Assembling HF signals”之記載內的訊號W2。線性預測濾波器部2k ( 或線性預測濾波器部2k 1 )及時間包絡變形部2v,係以一 次高頻調整部的輸出訊號爲對象,而進行時間包絡之變形 。二次高頻調整部2 j 2,係對從時間包絡變形部2 v所輸出 的QMF領域之訊號,進行“MPEG4 AAC”之SBR中的“HF adjustment”步驟中的正弦波之附加處理。二次高頻調整 -61 - 201126515 部之處理係相當於,“ ISO/IEC 1 4496-3:2 005 ”的“ SBR tool” 內,4.6.18.7.6 節 “Assembling HF signals” 之記載 內’,從訊號W2而生成出訊號γ的處理中,將訊號w2置換成 時間包絡變形部2v之輸出訊號而成的處理。 此外,在上記說明中,雖然只有將正弦波附加處理設 計成二次高頻調整部2j2的處理,但亦可將“ HF adjustment”步驟中存在的任一處理,設計成二次高頻調 整部2 j 2的處理。又,同樣之變形,係亦可施加於第1實施 形態、第2實施形態、第3實施形態。此時,由於第1實施 形態及第2實施形態係具備線性預測濾波器部(線性預測 濾波器部2k,2kl ),不具備時間包絡變形部,因此對於一 次高頻調整部2j 1之輸出訊號進行了線性預測濾波器部中 的處理後,以線性預測濾波器部之輸出訊號爲對象,進行 二次高頻調整部2j 2中的處理。 又,由於第3實施形態係具備時間包絡變形部2 v,不 具備線性預測濾波器部,因此對於一次高頻調整部2j 1之 輸出訊號進行了時間包絡變形部2v中的處理後,以時間包 絡變形部2v之輸出訊號爲對象,進行二次高頻調整部中的 處理。 又,第4實施形態的聲音解碼裝置(聲音解碼裝置24, 24a,24b )中,線性預測濾波器部2k和時間包絡變形部2v 的處理順序亦可顛倒。亦即,對於高頻調整部2 j或是一次 高頻調整部2j 1的輸出訊號,亦可先進行時間包絡變形部 2v的處理,然後才對時間包絡變形部2v的輸出訊號進行線 -62- 201126515 性預測濾波器部2k的處理。 又,亦可爲,時間包絡輔助資訊係含有用來指示是否 進行線性預測濾波器部2k或時間包絡變形部2v之處理的2 値之控制資訊,只有當該控制資訊指示要進行線性預測濾 波器部2k或時間包絡變形部2v之處理時,才更將濾波器強 度參數K(r)、包絡形狀參數s(i)、或決定K(r)與s(i)之雙方 的參數X(〇之任意一者以上,以資訊的方式加以含有的形 式。 (第4實施形態的變形例3 ) 第4實施形態的變形例3的聲音編解裝置24c (參照圖 16 ),係實體上具備未圖示的CPU、ROM、RAM及通訊裝 置等’該CPU,係將ROM等之聲音解碼裝置24c的內藏記 憶體中所儲存的所定之電腦程式(例如用來進行圖1 7的流 程圖所述之處理所需的電腦程式)載入至RAM中並執行, 藉此以統籌控制聲音解碼裝置24c。聲音解碼裝置24c的通 訊裝置,係將已被編碼之多工化位元串流,加以接收,然 後將已解碼之聲音訊號,輸出至外部。聲音解碼裝置24c ’係如圖16所示,取代了高頻調整部2j,改爲具備一次高 頻調整部2j3和二次高頻調整部2j4,然後還取代了線性預 測濾波器部2k和時間包絡變形部2v改爲具備個別訊號成分 調整部2zl,2z2,2z3 (個別訊號成分調整部,係相當於時 間包絡變形手段)。 一次高頻調整部2j 3,係將高頻頻帶的QMF領域之訊 -63- 201126515 號,輸出成爲複寫訊號成分。一次高頻調整部2j3,係亦 可將對於高頻頻帶的QMF領域之訊號,利用從位元串流分 離部2a3所給予之SBR輔助資訊而進行過時間方向之線性預 測逆濾波器處理及增益調整(頻率特性調整)之至少一方 的訊號,輸出成爲複寫訊號成分。甚至,一次高頻調整部 2j3,係利用從位元串流分離部2a3所給予之SBR輔助資訊 而生成雜訊訊號成分及正弦波訊號成分,將複寫訊號成分 、雜訊訊號成分及正弦波訊號成分以分離之形態而分別輸 出(步驟Sgl之處理)。雜訊訊號成分及正弦波訊號成分 ,係亦可依存於SBR輔助資訊的內容,而不被生成》 個別訊號成分調整部2zl, 2z2,2z3,係對前記一次高 頻調整手段的輸出中所含有之複數訊號成分之每一者,進 行處理(步驟Sg2之處理)。個別訊號成分調整部2zl, 2z2,2z3中的處理,係亦可和線性預測濾波器部2k相同, 使用從濾波器強度調整部2f所得到之線性預測係數,進行 頻率方向的線性預測合成濾波器處理(處理1 )。又,個 別訊號成分調整部2zl,2z2,2z3中的處理,係亦可和時間 包絡變形部2v相同,使用從包絡形狀調整部2s所得到之時 間包絡來對各QMF子頻帶樣本乘算增益係數之處理(處理 2 )。又,個別訊號成分調整部2 z 1,2 z 2,2 z 3中的處理,係 亦可對於輸入訊號進行和線性預測濾波器部2k相同的,使 用從濾波器強度調整部2f所得到之線性預測係數,進行頻 率方向的線性預測合成濾波器處理之後,再對其輸出訊號 進行和時間包絡變形部2v相同的,使用從包絡形狀調整部 -64- 201126515 2 s所得到之時間包絡來對各QMF子頻帶樣本乘算增益係數 之處理(處理3)。又’個別訊號成分調整部2zl, 2z2,2z3 中的處理,係亦可對於輸入訊號,進行和時間包絡變形部 2 v相同的,使用從包絡形狀調整部2 s所得到之時間包絡來 對各QMF子頻帶樣本乘算增益係數之處理後,再對其輸出 訊號,進行和線性預測濾波器部2k相同的,使用從濾波器 強度調整部2 f所得到之線性預測係數,進行頻率方向的線 性預測合成濾波器處理(處理4 )。又,個別訊號成分調 整部2zl,2z2,2z3係亦可不對輸入訊號進行時間包絡變形 處理,而是將輸入訊號直接輸出(處理5),又,個別訊 號成分調整部2zl,2z2,2z3中的處理,係亦可以處理1〜5 以外的方法,來實施將輸入訊號的時間包絡予以變形所需 之任何處理(處理6 )。又,個別訊號成分調整部2 z 1, 2z2,2z3中的處理,係亦可是將處理1〜6當中的複數處理 以任意順序加以組合而成的處理(處理7 ) ^ 個別訊號成分調整部2zl,2z2,2z3中的處理係可彼此 相同,但個別訊號成分調整部2 z 1,2 z 2,2 z 3,係亦可對於 —次高頻調整手段之輸出中所含之複數訊號成分之每一者 ,以彼此互異之方法來進行時間包絡之變形。例如,個別 訊號成分調整部2zl係對所輸入的複寫訊號進行處理2,個 別訊號成分調整部2z2係對所輸入的雜訊訊號成分進行處 理3,個別訊號成分調整部2z3係對所輸入的正弦波訊號進 行處理5的方式,對複寫訊號、雜訊訊號、正弦波訊號之 各者進行彼此互異之處理。又,此時,濾波器強度調整部 65- 201126515 2f和包絡形狀調整部2s,係可對個別訊號成分調整部2z 1, 2z2,2z3之各者發送彼此相同的線性預測係數或時間包絡 ,或可發送彼此互異之線性預測係數或時間包絡,又或可 對於個別訊號成分調整部2zl,2z2, 2z3之任意2者以上發送 同一線性預測係數或時間包絡。個別訊號成分調整部2z 1, 2z2, 2z3之1者以上,係可不進行時間包絡變形處理,將輸 入訊號直接輸出(處理5),因此個別訊號成分調整部 2zl,2z2,2z3係整體來說,對於從一次高頻調整部2j3所輸 出之訊號成分之至少一個會進行時間包絡處理(因爲當個 別訊號成分調整部2zl,2z2, 2z3全部都是處理5時,則對任 一訊號成分都沒有進行時間包絡變形處理,因此不具本發 明之效果)。 個別訊號成分調整部2zl, 2z2,2z3之各自的處理,係 可以固定成處理1至處理7之某種處理,但亦可基於從外部 所給予的控制資訊,而動態地決定要進行處理1至處理7之 何者。此時,上記控制資訊係被包含在多工化位元串流中 ,較爲理想。又,上記控制資訊,係可用來指示要在特定 之SBR包絡時間區段、編碼框架、或其他時間範圍中進行 處理1至處理7之何者,或者亦可不特定所控制之時間範圍 ,指示要進行處理1至處理7之何者。 二次高頻調整部2j4,係將從個別訊號成分調整部2zl, 2z2,2z3所輸出之處理後的訊號成分予以相加,輸出至係 數加算部(步驟Sg3之處理)。又,二次高頻調整部2j4, 係亦可對複寫訊號成分,利用從位元串流分離部2a3所給 -66 - 201126515 予之SBR輔助資訊,而進行時間方向之線性預測逆濾波器 處理及增益調整(頻率特性調整)之至少一方。 個別訊號成分調整部亦可爲,2zl,2z2,2z3係彼此協 調動作,將進行過處理1〜7之任一處理後的2個以上之訊 號成分彼此相加,對相加後之訊號再施加處理1〜7之任一 處理然後生成中途階段之輸出訊號。此時,二次高頻調整 部2〗4係將前記途中階段之輸出訊號、和尙未對前記途中 階段之輸出訊號相加的訊號成分,進行相加,輸出至係數 加算部。具體而言,對複寫訊號成分進行處理5,對雜音 成分施加處理1後,將這2個訊號成分彼此相加,對相加後 的訊號再施以處理2以生成中途階段之輸出訊號,較爲理 想。此時,二次高頻調整部2j4係對前記途中階段之輸出 訊號,加上正弦波訊號成分,輸出至係數加算部。 一次高頻調整部2j3,係不限於複寫訊號成分、雜訊 訊號成分、正弦波訊號成分這3種訊號成分,亦可將任意 之複數訊號成分以彼此分離的形式而予以輸出。此時的訊 號成分,係亦可將複寫訊號成分、雜訊訊號成分、正弦波 訊號成分當中的2個以上進行相加後的成分。又,亦可是 將複寫訊號成分' 雜訊訊號成分、正弦波訊號成分之任一 者作頻帶分割而成的訊號。訊號成分的數目可爲3以外, 此時,個別訊號成分調整部的數可爲3以外。 SBR所生成的高頻訊號,係油將低頻頻帶複寫至高頻 頻帶而得到之複寫訊號成分、雜訊訊號、正弦波訊號之3 個要素所構成。複寫訊號、雜訊訊號、正弦波訊號之每一 -67- 201126515 者,係由於帶有彼此互異的時間包絡,因此如本變形例的 個別訊號成分調整部所進行,對各個訊號成分以彼此互異 之方法進行時間包絡之變形,因此相較於本發明的其他實 施例,可更加提升解碼訊號的主觀品質。尤其是,雜訊訊 號一般而言係帶有平坦的時間包絡,複寫訊號係帶有接近 於低頻頻帶之訊號的時間包絡,因此藉由將它們予以分離 ,施加彼此互異之處理,就可獨立地控制複寫訊號和雜訊 的訊號的時間包絡,這對解碼訊號的主觀品質提升是有效 的。具體而言,對雜訊訊號係進行使時間包絡變形之處理 (處理3或處理4),對複寫訊號係進行異於對雜訊訊號之 處理(處理1或處理2 ),然後,對正弦波訊號係進行處理 5 (亦即不進行時間包絡變形處理),較爲理想。或是, 對雜訊訊號係進行時間包絡變形處理(處理3或處理4 ), 對複寫訊號和正弦波訊號係進行處理5 (亦即不進行時間 包絡變形處理),較爲理想。 (第1實施形態的變形例4 ) 第1實施形態的變形例4的聲音編碼裝置lib (圖44) ’係實體上具備未圖示的CPU、ROM、RAM及通訊裝置等 ,該CPU,係將ROM等之聲音編碼裝置lib的內藏記憶體 中所儲存的所定之電腦程式載入至RAM中並執行,藉此以 統簿控制聲音編碼裝置lib。聲音編碼裝置lib的通訊裝置 ,係將作爲編碼對象的聲音訊號,從外部予以接收,還有 ,將已被編碼之多工化位元串流,輸出至外部。聲音編碼 -68- 201126515 裝置1 1 b ’係取代了聲音編碼裝置〗丨的線性預測分析部i e 而改爲具備線性預測分析部i e 1 ,還具備有時槽選擇部1 p 〇 時槽選擇部lp,係從頻率轉換部la收取QMF領域之訊 號’選擇要在線性預測分析部1 e i中實施線性預測分析處 理的時槽。線性預測分析部丨e 1,係基於由時槽選擇部i p 所通知的選擇結果,將已被選擇之時槽的QMF領域訊號, 和線性預測分析部1 e同樣地進行線性預測分析,取得高頻 線性預測係數、低頻線性預測係數當中的至少一者。濾波 器強度參數算出部1 f,係使用線性預測分析部1 e 1中所得 到的、已被時槽選擇部1 p所選擇的時槽的線性預測分析, 來算出濾波器強度參數。在時槽選擇部lp中的時槽之選擇 ’係亦可使用例如與後面記載之本變形例的解碼裝置2 1 a 中的時槽選擇部3a相同,使用高頻成分之QMF領域訊號的 訊號功率來選擇之方法當中的至少一種方法。此時,時槽 選擇部lp中的高頻成分之QMF領域訊號,係從頻率轉換部 la所收取之QMF領域之訊號當中,會在SBR編碼部Id上被 編碼的頻率成分,較爲理想。時槽的選擇方法,係可使用 前記方法之至少一種,甚至也可使用異於前記方法之至少 一種,甚至還可將它們組合使用。 第1實施形態的變形例4的聲音編解裝置2 1 a (參照圖 1 8 ),係實體上具備未圖示的CPU、ROM、RAM及通訊裝 置等,該CPU,係將ROM等之聲音解碼裝置21a的內藏記 憶體中所儲存的所定之電腦程式(例如用來進行圖1 9的流 -69- 201126515 程圖所述之處理所需的電腦程式)載入至RAM中並執行, 藉此以統篛控制聲音解碼裝置2 1 a。聲音解碼裝置2 1 a的通 訊裝置,係將已被編碼之多工化位元串流,加以接收,然 後將已解碼之聲音訊號,輸出至外部。聲音解碼裝置21a ,係如圖1 8所示,取代了聲音解碼裝置2 1的低頻線性預測 分析部2d、訊號變化偵測部2e、高頻線性預測分析部2h、 及線性預測逆濾波器部2i、及線性預測濾波器部2k,改爲 具備:低頻線性預測分析部2d 1、訊號變化偵測部2e 1、高 頻線性預測分析部2h 1、線性預測逆濾波器部2i 1、及線性 預測濾波器部2k3,還具備有時槽選擇部3a。 時槽選擇部3a,係對於高頻生成部2g所生成之時槽r 的高頻成分之QMF領域之訊號qexp(k,r),判斷是否要在線 性預測濾波器部2k中施加線性預測合成濾波器處理,選擇 要施加線性預測合成濾波器處理的時槽(步驟Sh 1之處理 )。時槽選擇部3 a,係將時槽的選擇結果,通知給低頻線 性預測分析部2dl、訊號變化偵測部2el、高頻線性預測分 析部2h 1、線性預測逆濾波器部2U、線性預測濾波器部 2k3。在低頻線性預測分析部2d 1中,係基於由時槽選擇部 3 a所通知的選擇結果,將已被選擇之時槽rl的QMF領域訊 號,進行和低頻線性預測分析部2d同樣的線性預測分析, 取得低頻線性預測係數(步驟Sh2之處理)。在訊號變化 偵測部2el中,係基於由時槽選擇部3a所通知的選擇結果 ,將已被選擇之時槽的QMF領域訊號的時間變化,和訊號 變化偵測部2e同樣地予以測出,將偵測結果T(rl )予以輸出 -70- 201126515 在濾波器強度調整部2 f中,係對低頻線性預測分析部 2d 1中所得到的已被時槽選擇部3 a所選擇之時槽的低頻線 性預測係數,進行濾波器強度調整,獲得已被調整之線性 預測係數ade<:(n,rl)。在高頻線性預測分析部2hl中,係將 已被高頻生成部2g所生成之高頻成分的QMF領域訊號,基 於由時槽選擇部3 a所通知的選擇結果,關於已被選擇之時 槽r 1,和高頻線性預測分析部2k同樣地,在頻率方向上進 行線性預測分析,取得高頻線性預測係數aexp(n,rl)(步驟 Sh3之處理)。在線性預測逆濾波器部2i 1中,係基於由時 槽選擇部3a所通知的選擇結果,將已被選擇之時槽rl的高 頻成分之QMF領域之訊號qexp(k,r),和線性預測逆濾波器 部2i同樣地在頻率方向上以aexp(n,rl)爲係數進行線性預測 逆濾波器處理(步驟Sh4之處理)。 在線性預測濾波器部2 k 3中,係基於由時槽選擇部3 a 所通知的選擇結果,對於從已被選擇之時槽rl的高頻調整 部2j所輸出之高頻成分的QMF領域之訊號qadj(k,rl),和線 性預測濾波器部2k同樣地,使用從濾波器強度調整部2 f所 得到之aadj(n,rl) ’而在頻率方向上進行線性預測合成濾波 器處理(步驟Sh5之處理)。又,變形例3中所記載之對線 性預測濾波器部2k的變更,亦可對線性預測濾波器部2k3 施加。在時槽選擇部3 a中的施加線性預測合成濾波器處理 之時槽的選擇時,係亦可例如將高頻成分的QMF領域訊號 qexp(k,r)之訊號功率是大於所定値pexpTh的時槽r,選擇一 -71 - 201126515 個以上。qexp(k,r)的訊號功率係用以下的數式來求出,較 爲理想。 [數 42] 4⑺=Σ kM2 其中’ Μ係表示比被高頻生成部2g所生成之高頻成分之下 限頻率kx還高之頻率範圍的値,然後亦可將高頻生成部2g 所生成之高頻成分的頻率範圍表示成kx<=k<kx + M。又, 所定値Pexp,Th係亦可爲包含時槽r之所定時間寬度的Pexp(r) 的平均値。甚至,所定時間寬度係亦可爲SB R包絡。 又,亦可選擇成其中含有高頻成分之QMF領域訊號之 訊號功率是呈峰値的時槽。訊號功率的峰値,係亦可例如 對於訊號功率的移動平均値 [數 43]
PexpMA^) 將 [數 44]
exp,MA 從正値變成負値的時槽r的高頻成分的QMF領域之訊號功 率,視爲峰値。訊號功率的移動平均値 [數 45] 0) εχρ,ΜΑ 係可用以下式子求出。 -72- 201126515 [數 46] r+--l 〜,施〇〇=去Σρ» c〆="-三 2 其中,C係用來決定求出平均値之範圍的所定値。又,訊 號功率之峰値’係可以前記的方法來求出,也可藉由不同 的方法來求出。 甚至’亦可使從高頻成分之QMF領域訊號之訊號功率 的變動小的定常狀態起,變成變動大的過渡狀態爲止的時 間寬度t是小於所定之値tth,而將該當時間寬度中所包含 的時槽,選擇出至少一個。甚至,亦可使從高頻成分之 QMF領域訊號之訊號功率的變動大的過渡狀態起,變成變 動小的定常狀態爲止的時間寬度t是小於所定之値tlh,而 將該當時間寬度中所包含的時槽,選擇出至少一個。可以 令丨Pexp(r+1 )-Pexp(r) |是小於所定値(或者小於或等於所 定値)的時槽r爲前記定常狀態,令| p e x p (r + 1) - P e x p (r) | 是大於或等於所定値(或者大於所定値)的時槽r爲前記 過渡狀態;也可令I Pexp>MA(r+l)-Pexp,MA(r) |是小於所定 値(或者小於或等於所定値)的時槽r爲前記定常狀態, 令丨PexP,MA(r+l)-Pexp,MA(r)丨是大於或等於所定値(或者 大於所定値)的時槽r爲前記過渡狀態。又,過渡狀態、 定常狀態係可用前記的方法來定義,也可用不同的方法來 定義。時槽的選擇方法,係可使用前記方法之至少一種, 甚至也可使用異於前記方法之至少一種,甚至還可將它們 組合。 -73- 201126515 (第1實施形態的變形例5 ) 第1實施形態的變形例5的聲音編碼裝置11c (圖45) ,係實體上具備未圖示的CPU、ROM、RAM及通訊裝置等 ,該CPU,係將ROM等之聲音編碼裝置1 lc的內藏記憶體 中所儲存的所定之電腦程式載入至RAM中並執行,藉此以 統箨控制聲音編碼裝置11c。聲音編碼裝置11c的通訊裝置 ,係將作爲編碼對象的聲音訊號,從外部予以接收,還有 ,將已被編碼之多工化位元串流,輸出至外部。聲音編碼 裝置11c,係取代了變形例4的聲音編碼裝置11b的時槽選 擇部lp、及位元串流多工化部lg,改爲具備:時槽選擇部 1 P 1、及位元串流多工化部1 g4。 時槽選擇部1 p 1,係和第1實施形態的變形例4中所記 載之時槽選擇部lp同樣地選擇出時槽,將時槽選擇資訊送 往位元串流多工化部1 g4。位元串流多工化部1 g4,係將已 被核心編解碼器編碼部lc所算出之編碼位元串流、已被 SBR編碼部Id所算出之SBR輔助資訊、已被濾波器強度參 數算出部1 f所算出之濾波器強度參數,和位元串流多工化 部1 g同樣地進行多工化’然後將從時槽選擇部丨p丨所收取 到的時槽選擇資訊進行多工化,將多工化位元串流,透過 聲音編碼裝置11c的通訊裝置而加以輸出。前記時槽選擇 資訊’係後面記載的聲音解碼裝置21b中的時槽選擇部3al 所會收取的時槽選擇資訊,例如亦可含有所選擇的時槽的 指數r 1。甚至亦可爲例如時槽選擇部3 a丨的時槽選擇方法 -74 - 201126515 中所利用的參數。第1實施形態的變形例5的聲音編解裝置 21b (參照圖20),係實體上具備未圖示的CPU、ROM、 RAM及通訊裝置等,該CPu,係將ROM等之聲音解碼裝置 2 1 b的內藏記憶體中所儲存的所定之電腦程式(例如用來 進行圖2 1的流程圖所述之處理所需的電腦程式)載入至 RAM中並執行,藉此以統籌控制聲音解碼裝置2 1 b。聲音 解碼裝置21b的通訊裝置,係將已被編碼之多工化位元串 流’加以接收,然後將已解碼之聲音訊號,輸出至外部。 聲音解碼裝置2lb,係如圖2〇所示,取代了變形例4的 聲音解碼裝置2 1 a的位元串流分離部2 a、及時槽選擇部3 a ,改爲具備:位元串流分離部2a5、及時槽選擇部3 a 1,對 時槽選擇部3al係輸入著時槽選擇資訊。在位元串流分離 部2a5中’係將多工化位元串流,和位元串流分離部2a同 樣地’分離成濾波器強度參數、SBR輔助資訊、編碼位元 串流’然後還分離出時槽選擇資訊。在時槽選擇部3al中 ,係基於從位元串流分離部2a5所送來的時槽選擇資訊, 來選擇時槽(步驟Sil之處理)。時槽選擇資訊,係時槽 之選擇時所用的資訊,例如亦可含有所選擇的時槽的指數 rl。甚至亦可爲例如變形例4中所記載之時槽選擇方法中 所利用的參數。此時,對時槽選擇部3 a 1,除了輸入時槽 選擇資訊,還生成未圖示的高頻訊號生成部2g所生成的高 頻成分之QMF領域訊號。前記參數,係亦可爲,例如前記 時槽之選擇時所需使用的所定値(例如Pexp,Th、tTh等)。 -75- 201126515 (第1實施形態的變形例6 ) 第1實施形態的變形例6的聲音編碼裝置1 id (未圖示 ),係實體上具備未圖示的CPU、ROM、RAM及通訊裝置 等’該CPU ’係將ROM等之聲音編碼裝置1 id的內藏記憶 體中所儲存的所定之電腦程式載入至RAM中並執行,藉此 以統籌控制聲音編碼裝置lid。聲音編碼裝置lid的通訊裝 置,係將作爲編碼對象的聲音訊號,從外部予以接收,還 有’將已被編碼之多工化位元串流,輸出至外部。聲音編 碼裝置1 1 d,係取代了變形例1的聲音編碼裝置1 1 a的短時 間功率算出部1 i,改爲具備未圖示的短時間功率算出部1 i 1 ,還具備有時槽選擇部1ρ2。 時槽選擇部1ρ2,係從頻率轉換部ia收取QMF領域之 訊號,將在短時間功率算出部1 i中實施短時間功率算出處 理的時間區間所對應之時槽,加以選擇。短時間功率算出 部1Π,係基於由時槽選擇部1P2所通知的選擇結果,將已 被選擇之時槽所對應之時間區間的短時間功率,和變形例 1的聲音編碼裝置1 1 a的短時間功率算出部1 i同樣地予以算 出。 (第1實施形態的變形例7 ) 第1實施形態的變形例7的聲音編碼裝置1 1 e (未圖示 ),係實體上具備未圖示的CPU、ROM、RAM及通訊裝置 等,該CPU,係將ROM等之聲音編碼裝置lie的內藏記憶 體中所儲存的所定之電腦程式載入至RAM中並執行,藉此 -76- 201126515 以統籌控制聲音編碼裝置lie。聲音編碼裝置ue的通訊裝 置’係將作爲編碼對象的聲音訊號,從外部予以接收,還 有,將已被編碼之多工化位元串流,輸出至外部。聲音編 碼裝置1 1 e,係取代了變形例6的聲音編碼裝置1 1 d的時槽 選擇部1ρ2,改爲具備未圖示的時槽選擇部1P3。甚至還取 代了位元串流多工化部lgl,改爲還具備用來接受來自時 槽選擇部1ρ3之輸出的位元串流多工化部。時槽選擇部1P3 ,係和第1實施形態的變形例6中所記載之時槽選擇部1 P2 同樣地選擇出時槽,將時槽選擇資訊送往位元串流多工化 部。 (第1實施形態的變形例8 ) 第1實施形態的變形例8的聲音編碼裝置(未圖示), 係實體上具備未圖示的CPU、ROM、RAM及通訊裝置等, 該CPU,係將ROM等變形例8之聲音編碼裝置的內藏記億 體中所儲存的所定之電腦程式載入至RAM中並執行,藉此 以統籌控制變形例8的聲音編碼裝置。變形例8的聲音編碼 裝置的通訊裝置,係將作爲編碼對象的聲音訊號,從外部 予以接收,還有’將已被編碼之多工化位兀串流,輸出至 外部。變形例8的聲音編碼裝置’係在變形例2所記載的聲 音編碼裝置中,還更具備有時槽選擇部1P。 第1實施形態的變形例8的聲音解碼裝置(未圖示)’ 係實體上具備未圖示的CPU、ROM、RAM及通訊裝置等’ 該CPU,係將ROM等變形例8之聲音解碼裝置的內藏記憶 -77- 201126515 體中所儲存的所定之電腦程式載入至RAM中並執行,藉此 以統籌控制變形例8的聲音解碼裝置。變形例8的聲音解碼 裝置的通訊裝置,係將已被編碼之多工化位元串流,加以 接收,然後將已解碼之聲音訊號,輸出至外部。變形例8 的聲音解碼裝置,係取代了變形例2中所記載之聲音解碼 裝置的低頻線性預測分析部2d、訊號變化偵測部2e、高頻 線性預測分析部2h、及線性預測逆濾波器部2i、及線性預 測濾波器部2k,改爲具備:低頻線性預測分析部2d 1、訊 號變化偵測部2el、高頻線性預測分析部2hl、線性預測逆 濾波器部2Π、及線性預測濾波器部2k3,還具備有時槽選 擇部3a。 (第1實施形態的變形例9 ) 第1實施形態的變形例9的聲音編碼裝置(未圖示), 係實體上具備未圖示的CPU、ROM、RAM及通訊裝置等, 該CPU ’係將ROM等變形例9之聲音編碼裝置的內藏記憶 體中所儲存的所定之電腦程式載入至RAM中並執行,藉此 以統籌控制變形例9的聲音編碼裝置。變形例9的聲音編碼 裝置的通訊裝置,係將作爲編碼對象的聲音訊號,從外部 予以接收,還有,將已被編碼之多工化位元串流,輸出至 外部。變形例9的聲音編碼裝置,係取代了變形例8所記載 的聲音編碼裝置的時槽選擇部邙,改爲具備有時槽選擇部 1 P1。甚至,取代了變形例8中所記載之位元串流多工化部 ,改爲具備除了往變形例8所記載之位元串流多I化部的 -78- 201126515 輸入還接受來自時槽選擇部ip〗之輸出用的位元串流多工 化部。 第1實施形態的變形例9的聲音解碼裝置(未圖示)’ 係實體上具備未圖示的CPU、ROM、RAM及通訊裝置等, 該CPU,係將ROM等變形例9之聲音解碼裝置的內藏記憶 體中所儲存的所定之電腦程式載入至RAM中並執行,藉此 以統籌控制變形例9的聲音解碼裝置。變形例9的聲音解碼 裝置的通訊裝置,係將已被編碼之多工化位元串流,加以 接收,然後將已解碼之聲音訊號,輸出至外部。變形例9 的聲音解碼裝置,係取代了變形例8所記載之聲音解碼裝 置的時槽選擇部3a,改爲具備時槽選擇部3al。然後,取 代了位元串流分離部2 a,改爲具備除了將位元串流分離部 2a5之濾波器強度參數還將前記變形例2所記載之aD(n,r)予 以分離的位元串流分離部。 (第2實施形態的變形例1 ) 第2實施形態的變形例1的聲音編碼裝置1 2a (圖46 ) ’係實體上具備未圖不的CPU、ROM、RAM及通訊裝置等 ’該CPU,係將ROM等之聲音編碼裝置12a的內藏記億體 中所儲存的所定之電腦程式載入至RAM中並執行,藉此以 統籌控制聲音編碼裝置12a。聲音編碼裝置12a的通訊裝置 ’係將作爲編碼對象的聲音訊號,從外部予以接收,還有 ,將已被編碼之多工化位元串流,輸出至外部。聲音編碼 裝置1 2 a,係取代了聲音編碼裝置1 2的線性預測分析部1 e -79- 201126515 ,改爲具備線性預測分析部1 e 1,還具備有時槽選擇部! p ο 第2實施形態的變形例1的聲音編解裝置22a (參照圖 22),係實體上具備未圖示的CPU、ROM、RAM及通訊裝 置等’該CPU’係將ROM等之聲音解碼裝置22a的內藏記 憶體中所儲存的所定之電腦程式(例如用來進行圖23的流 程圖所述之處理所需的電腦程式)載入至RAM中並執行, 藉此以統籙控制聲音解碼裝置22a。聲音解碼裝置22 a的通 訊裝置,係將已被編碼之多工化位元串流,加以接收,然 後將已解碼之聲音訊號,輸出至外部。聲音解碼裝置2 2 a ,係如圖2 2所示,取代了第2實施形態的聲音解碼裝置2 2 的高頻線性預測分析部2h、線性預測逆濾波器部2i、線性 預測濾波器部2kl、及線性預測內插·外插部2p,改爲具 備有:低頻線性預測分析部2 d 1、訊號變化偵測部2 e 1、高 頻線性預測分析部2 h 1、線性預測逆濾波器部2 i 1、線性預 測濾波器部2k2、及線性預測內插·外插部2p 1,還具備有 時槽選擇部3a。 時槽選擇部3 a,係將時槽的選擇結果,通知給高頻線 性預測分析部2h 1、線性預測逆濾波器部2i 1、線性預測濾 波器部2k2、線性預測係數內插·外插部2p 1 »在線性預測 係數內插·外插部2pl中,係基於由時槽選擇部3a所通知 的選擇結果,將已被選擇之時槽且是線性預測係數未被傳 輸的時槽rl所對應的aH(n,r),和線性預測係數內插•外插 部2p同樣地,藉由內插或外插而加以取得(步驟Sj 1之處 -80- 201126515 理)。在線性預測濾波器部2k2中,係基於由時槽選擇部 3a所通知的選擇結果,關於已被選擇之時槽1"1’對於從高 頻調整部2j所輸出的qadj(n,rl),使用從線性預測係數內插 •外插部2p 1所得到之已被內插或外插過的aH(n,r 1) ’和線 性預測濾波器部2 k 1同樣地’在頻率方向上進行線性預測 合成濾波器處理(步驟Sj 2之處理).。又’第1實施形態的 變形例3中所記載之對線性預測濾波器部2k的變更’亦可 對線性預測濾波器部2k2施加。 (第2實施形態的變形例2) 第2實施形態的變形例2的聲音編碼裝置12b (圖47 ) ,係實體上具備未圖示的CPU、ROM、RAM及通訊裝置等 ,該CPU,係將ROM等之聲音編碼裝置12b的內藏記憶體 中所儲存的所定之電腦程式載入至RAM中並執行,藉此以 統籌控制聲音編碼裝置lib。聲音編碼裝置12b的通訊裝置 ,係將作爲編碼對象的聲音訊號,從外部予以接收,還有 ,將已被編碼之多工化位元串流,輸出至外部。聲音編碼 裝置12b ’係取代了變形例1的聲音編碼裝置i2a的時槽選 擇部lp、及位元串流多工化部lg2,改爲具備:時槽選擇 部1 P 1、及位元串流多工化部1 g 5。位元串流多工化部i g 5 ’係和位元串流多工化部1 g2同樣地,將已被核心編解碼 器編碼部1C所算出之編碼位元串流、已被SBR編碼部1(1所 算出之SBR輔助資訊、從線性預測係數量化部1]{所給予之 量化後的線性預測係數所對應之時槽的指數予以多工化, -81 - 201126515 然後還將從時槽選擇部Ιρί所收取的時槽選擇資訊,多工 化至位元串流中,將多工化位元串流’透過聲音編碼裝置 12b的通訊裝置而加以輸出。 第2實施形態的變形例2的聲音編解裝置22b (參照圖 24),係實體上具備未圖示的CPU、ROM、RAM及通訊裝 置等,該CPU,係將ROM等之聲音解碼裝置22b的內藏記 憶體中所儲存的所定之電腦程式(例如用來進行圖2 5的流 程圖所述之處理所需的電腦程式)載入至RAM中並執行, 藉此以統籌控制聲音解碼裝置22b。聲音解碼裝置22b的通 訊裝置,係將已被編碼之多工化位元串流,加以接收,然 後將已解碼之聲音訊號,輸出至外部。聲音解碼裝置22b ’係如圖24所示’取代了變形例1所記載之聲音解碼裝置 22a的位元串流分離部2al、及時槽選擇部3a,改爲具備: 位元串流分離部2a6、及時槽選擇部3al,對時槽選擇部 3al係輸入著時槽選擇資訊。在位元串流分離部2a6中,係 和位元串流分離部2 a 1同樣地,將多工化位元串流,分離 成已被量化的aH(n,ri)、和其所對應之時槽的指數ri、SBR 輔助資訊、編碼位元串流,然後還分離出時槽選擇資訊。 (第3實施形態的變形例4 ) 第3實施形態的變形例1所記載之 [數 47] e(0 係可爲e(r)的在SBR包絡內的平均値,也可爲另外訂定的 値。 -82 - 201126515 (第3實施形態的變形例5 ) 包絡形狀調整部2 s ’係如前記第3實施形態的變形例3 所記載,調整後的時間包絡eadj(r)是例如數式(28 )、數 式(37)及(38)所示’是要被乘算至qMf子頻帶樣本的 增益係數’有鑑於此’將eadj(r)以所定之値eadj Th⑴而作 如下限制,較爲理想。 [數 48] eadj(r)>eadjJh (第4實施形態) 第4實施形態的聲音編碼裝置14 (圖48 ),係實體上 具備未圖示的CPU、ROM、RAM及通訊裝置等,該CPU, 係將ROM等之聲音編碼裝置14的內藏記憶體中所儲存的所 定之電腦程式載入至R A Μ中並執行,藉此以統震控制聲音 編碼裝置14。聲音編碼裝置14的通訊裝置,係將作爲編碼 對象的聲音訊號,從外部予以接收,還有,將已被編碼之 多工化位元串流’輸出至外部》聲音編碼裝置14,係取代 了第1實施形態的變形例4的聲音編碼裝置1 1 b的位元串流 多工化部1 g,改爲具備位元串流多工化部丨g7,還具備有 :聲音編碼裝置13的時間包絡算出部lm、及包絡參數算出 部1 η。 位元串流多工化部1 g7,係和位元串流多工化部1 g同 樣地’將已被核心編解碼器編碼部1 c所算出之編碼位元串 -83- 201126515 流、和已被SBR編碼部Id所算出之SBR輔助資訊予以多工 化’然後還將已被濾波器強度參數算出部所算出之濾波器 強度參數、和已被包絡形狀參數算出部1 η所算出之包絡形 狀參數,轉換成時間包絡輔助資訊而予以多工化,將多工 化位元串流(已被編碼之多工化位元串流),透過聲音編 碼裝置14的通訊裝置而加以輸出。 (第4實施形態的變形例4) 第4實施形態的變形例4的聲音編碼裝置14a (圖49 ) ’係實體上具備未圖示的CPU、ROM、RAM及通訊裝置等 ’該CPU,係將ROM等之聲音編碼裝置14a的內藏記憶體 中所儲存的所定之電腦程式載入至RAM中並執行,藉此以 統篛控制聲音編碼裝置14a。聲音編碼裝置14a的通訊裝置 ,係將作爲編碼對象的聲音訊號,從外部予以接收,還有 ,將已被編碼之多工化位元串流,輸出至外部。聲音編碼 裝置l4a,係取代了第4實施形態的聲音編碼裝置14的線性 預測分析部1 e,改爲具備線性預測分析部1 e 1,還具備有 時槽選擇部1 P。 第4實施形態的變形例4的聲音編解裝置24d (參照圖 26),係實體上具備未圖示的CPU、ROM、RAM及通訊裝 置等,該CPU,係將ROM等之聲音解碼裝置24d的內藏記 憶體中所儲存的所定之電腦程式(例如用來進行圖2 7的流 程圖所述之處理所需的電腦程式)載入至RAM中並執行, 藉此以統鏵控制聲音解碼裝置24d。聲音解碼裝置24d的通 -84- 201126515 訊裝置,係將已被編碼之多工化位元串流,加以接收,然 後將已解碼之聲音訊號,輸出至外部。聲音解碼裝置24d ,係如圖26所示,取代了聲音解碼裝置24的低頻線性預測 分析部2d、訊號變.化偵測部2e、高頻線性預測分析部2h、 及線性預測逆濾波器部2i、及線性預測濾波器部2k,改爲 具備:低頻線性預測分析部2d 1、訊號變化偵測部2el、高 頻線性預測分析部2hl、線性預測逆濾波器部2il、及線性 預測濾波器部2k3,還具備有時槽選擇部3 a。時間包絡變 形部2v,係將從線性預測濾波器部2k3所得到之QMF領域 之訊號,使用從包絡形狀調整部2 s所得到之時間包絡資訊 ,而和第3實施形態、第4實施形態、及這些之變形例的時 間包絡變形部2v同樣地加以變形(步驟Ski之處理)。 (第4實施形態的變形例5 ) 第4實施形態的變形例5的聲音編解裝置24e (參照圖 28 ),係實體上具備未圖示的CPU、ROM、RAM及通訊裝 置等,該CPU,係將ROM等之聲音解碼裝置24e的內藏記 憶體中所儲存的所定之電腦程式(例如用來進行圖2 9的流 程圖所述之處理所需的電腦程式)載入至RAM中並執行, 藉此以統籌控制聲音解碼裝置24e。聲音解碼裝置24e的通 訊裝置,係將已被編碼之多工化位元串流,加以接收,然 後將已解碼之聲音訊號,輸出至外部。聲音解碼裝置24e ,係如圖2 8所示,在變形例5中,係和第1實施形態同樣地 ,一直到第4實施形態全體都可省略的變形例4所記載之聲 -85- 201126515 音解碼裝置24d的高頻線性預測分析部2h 1、線性預測逆濾 波器部2il係被省略,並取代了聲音解碼裝置24d的時槽選 擇部3a、及時間包絡變形部2v,改爲具備:時槽選擇部 3a2、及時間包絡變形部2vl。然後,將一直到第4實施形 態全體都可對調處理順序的線性預測濾波器部2k3之線性 預測合成濾波器處理和時間包絡變形部2 v 1的時間包絡之 變形處理的順序,予以對調。 時間包絡變形部2 v 1,係和時間包絡變形部2 v同樣地 ,將從高頻調整部2j所獲得之qadj(k,r),使用從包絡形狀 調整部2s所獲得之eadj(r)而予以變形,取得時間包絡是已 被變形過的QMF領域之訊號qenvadj(k,r)。然後,將時間包 絡變形處理時所得到之參數、或至少使用時間包絡變形處 理時所得到之參數所算出之參數,當作時槽選擇資訊,通 知給時槽選擇部3 a2。作爲'時槽選擇資訊,係可爲數式( 22)、數式(40)的e(r)或其算出過程中不做平方根演算 的丨e(r) | 2 ’甚至可爲某複數時槽區間(例如SBR包絡) [數49] t^r<bi+1 中的這些値的平均値,亦即數式(24 )的 [數50] 冲),网 也能一起來當作時槽選擇資訊。其中, -86- 201126515 [數 51] 网2 = Σ丨吩)|2 r,bt ^.+1 甚至’作爲時槽選擇資訊,係可爲數式(26 )、數式(41 )的eexp(r)或其算出過程中不做平方根演算的丨eexp(r)丨2 ’甚至可爲某複數時槽區間(例如SBr包絡) [數 52] bi^r< Kl 中的這些値的平均値 [數 53] y),Μ)|2 也能一起來當作時槽選擇資訊。其中, [數 54] [數 55]
bi+i 一 Ν
甚至’作爲時槽選擇資訊,係可爲數式(23)、數式(35 )、數式(36 )的eadj(r)或其算出過程中不做平方根演算 的I eadj(r) | 2,甚至可爲某複數時槽區間(例如SBR包絡 -87- 201126515 [數 56] b; <r < b; i+l 中的這些値的平均値 [數 57] W), Μ·)| 也能一起來當作時槽選擇資訊。其中 [數 58] Α.+1-1Z〜(r) eadj(i) = ^
yM b: [數 59]
"I Σ eadjd) K\ ~bi 甚至,作爲時槽選擇資訊,係可 eadj,st:aled(r)或其算出過程中不做2 eatU,st:aud(r) | 2,甚至可爲某複數時槽H ) 爲數式(37 )的 P方根演算的丨 ί間(例如S B R包絡 [數 60] b; <r <b i+l 中的這些値的平均値 -88- 201126515 擻61] adj,scaled (i): e adj,scaled (0 也能一起來當作時槽選擇資訊。其中 擻62] ^•+1 / j ^adj,scaled V / ^adj^scaled (0 r-b: bM ~hi [數 63] e. adj,scaled (Of 〉:^adj,scaled (^*)| r=bl bi+l ~bi
甚至,作爲時槽選擇資訊,係時間包絡是被變死 成分所對應之QMF領域訊號的時槽r的訊號功率F 其做過平方根演算後的訊號振幅値 [數 64]
envadj (r) 也甚至可以是某複數時槽區間(例如SBR包絡) [數 65] z+1 過的局頻 envadj(r)或 b, <r < b: 中的這些値的平均値 [數 66] envadj
Ml
envadj (0 -89 - 201126515 也能一起來當作時槽選擇資訊。其中 [數 67] nvadj(r)-~ |^βηναφ (^5 Γ)| k=kx kx+M-l [數 68] _ Σρ—7(r) o _ _^ί_ envadj\l) 一 l "Ί Κι 其中’ Μ係表示比被高頻生成部2 g所生成之高頻成分之下 限頻率kx還高之頻率範園的値,然後亦可將高頻生成部2g 所生成之高頻成分的頻率範圍表示成1^$1£< kx + M。 時槽選擇部3 a2,係基於從時間包絡變形部2 v 1所通知 之時槽選擇資訊,而對於已經在時間包絡變形部2 v 1中將 時間包絡予以變形過的時槽r的高頻成分的QMF領域之訊 號qenvadjdr),判斷是否要在線性預測濾波器部2k中施加 線性預測合成濾波器處理,選擇要施加線性預測合成濾波 器處理的時槽(步驟Spl之處理)。 本變形例中的時槽選擇部3 a2中的施加線性預測合成 濾波器處理之時槽的選擇時,係可將從時間包絡變形部 2vl所通知的時槽選擇資訊中所含之參數u(r)是大於所定値 uTh的時槽r予以選擇一個以上,也可將u(r)是大於或等於 所定値uTh的時槽r予以選擇一個以上。u(r)係亦可包含上 記 e(r) 、 | e(r)丨 2 、 eexp(r) 、 | eexp(r) | 2 、 eadj(r)、 I ® a d j (Γ) I 6adj,scaled(r) 丨 ea(jj,scaled(r)丨 Penvadj(f) 90 - 201126515 、以及 [數 69] 當中的至少一者,UTh係亦可包含上記 _] <〇,网2,〜(’), |e«cp 〇')| , eadj (〇, (〇| ea0),scaled (0 > \eadj,scaled (l)| >
Pemadj(}\-^Knyadj ⑺, 當中的至少一者。又,UTh係亦可爲包含時槽r的所定之時 間寬度(例如SBR包絡)的u(r)之平均値。甚至’亦可選 擇包含u(r)是峰値的時槽。u(r)的峰値’係可和前記第1實 施形態的變形例4中的高頻成分的QMF領域訊號之訊號功 率之峰値的算出方法同樣地算出。甚至,亦可將前記第1 實施形態的變形例4中的定常狀態和過渡狀態,使用u(r)而 和前記第1實施形態的變形例4同樣地進行判斷,基於其而 選擇時槽。時槽的選擇方法,係可使用前記方法之至少一 種,甚至也可使用異於前記方法之至少一種,甚至還可將 它們組合。 (第4實施形態的變形例6 ) 第4實施形態的變形例6的聲音編解裝置24f (參照圖 3〇),係實體上具備未圖示的CPU、ROM、RAM及通訊裝 置等’該CPU’係將R〇M等之聲音解碼裝置24e的內藏記 -91 - 201126515 憶體中所儲存的所定之電腦程式(例如用來進行圖29的流 程圖所述之處理所需的電腦程式)載入至RAM中並執行, 藉此以統篛控制聲音解碼裝置24f。聲音解碼裝置24f的通 訊裝置,係將已被編碼之多工化位元串流,加以接收,然 後將已解碼之聲音訊號,輸出至外部。聲音解碼裝置24f ’係如圖3 0所示,在變形例6中,係和第1實施形態同樣地 ,一直到第4實施形態全體都可省略的變形例4所記載之聲 音解碼裝置24d的訊號變化偵測部2el、高頻線性預測分析 部2 h 1、線性預測逆濾波器部2 Π係被省略,並取代了聲音 解碼裝置24d的時槽選擇部3a、及時間包絡變形部2v,改 爲具備:時槽選擇部3a2、及時間包絡變形部2v 1。然後, 將一直到第4實施形態全體都可對調處理順序的線性預測 濾波器部2k3之線性預測合成濾波器處理和時間包絡變形 部2 v 1的時間包絡之變形處理的順序,予以對調。 時槽選擇部3 a2,係基於從時間包絡變形部2 v 1所通知 之時槽選擇資訊,而對於已經在時間包絡變形部2vl中將 時間包絡予以變形過的時槽r的高頻成分的QMF領域之訊 號qenvadj(k,r),判斷是否要在線性預測濾波器部2k3中施加 線性預測合成濾波器處理,選擇要施行線性預測合成濾波 器處理的時槽,將已選擇的時槽,通知給低頻線性預測分 析部2d 1和線性預測濾波器部2k3。 (第4實施形態的變形例7 ) 第4實施形態的變形例7的聲音編碼裝置14b (圖50 ) -92- 201126515 ’係實體上具備未圖示的CPU、ROM、RAM及通訊裝置等 ’該CPU ’係將ROM等之聲音編碼裝置14b的內藏記憶體 中所儲存的所定之電腦程式載入至RAM中並執行,藉此以 統籌控制聲音編碼裝置14b。聲音編碼裝置14b的通訊裝置 ’係將作爲編碼對象的聲音訊號,從外部予以接收,還有 ’將已被編碼之多工化位元串流,輸出至外部。聲音編碼 裝置14b,係取代了變形例4的聲音編碼裝置14a的位元串 流多工化部lg7、及時槽選擇部1P,改爲具備:位元串流 多工化部1 g6、及時槽選擇部1 p 1 ^ 位元串流多工化部1 g6,係和位元串流多工化部1 g7同 樣地,將已被核心編解碼器編碼部1 c所算出之編碼位元串 流、已被SBR編碼部Id所算出之SBR輔助資訊、將已被濾 波器強度參數算出部所算出之濾波器強度參數和已被包絡 形狀參數算出部In所算出之包絡形狀參數予以轉換成的時 間包絡輔助資訊,予以多工化,然後還將從時槽選擇部 1 P 1所收取到的時槽選擇資訊予以多工化,將多工化位元 串流(已被編碼之多工化位元串流),透過聲音編碼裝置 14b的通訊裝置而加以輸出。 第4實施形態的變形例7的聲音編解裝置24g (參照圖 31),係實體上具備未圖示的CPU' ROM、RAM及通訊裝 置等,該CPU,係將ROM等之聲音解碼裝置24g的內藏記 憶體中所儲存的所定之電腦程式(例如用來進行圖3 2的流 程圖所述之處理所需的電腦程式)載入至RAM中並執行, 藉此以統籌控制聲音解碼裝置24g。聲音解碼裝置24g的通 -93- 201126515 訊裝置,係將已被編碼之多工化位元串流,加以接收,然 後將已解碼之聲音訊號’輸出至外部。聲音解碼裝置24g ,係如圖3 1所示,取代了變形例4所記載之聲音解碼裝置 2d的位元串流分離部2a3、及時槽選擇部3a,改爲具備: 位元串流分離部2a7、及時槽選擇部3al。 位元串流分離部2a7’係將已透過聲音解碼裝置248的 通訊裝置而輸入的多工化位元串流,和位元串流分離部 2a3同樣地,分離成時間包絡輔助資訊、SBR輔助資訊、編 碼位元串流,然後還分離出時槽選擇資訊。 (第4實施形態的變形例8 ) 第4實施形態的變形例8的聲音編解裝置24h (參照圖 33),係實體上具備未圖示的CPU、ROM、RAM及通訊裝 置等,該CPU,係將ROM等之聲音解碼裝置24h的內藏記 憶體中所儲存的所定之電腦程式(例如用來進行圖3 4的流 程圖所述之處理所需的電腦程式)載入至RAM中並執行, 藉此以統篛控制聲音解碼裝置24h。聲音解碼裝置24h的通 訊裝置,係將已被編碼之多工化位元串流,加以接收,然 後將已解碼之聲音訊號,輸出至外部。聲音解碼裝置24h ,係如圖33所示,取代了變形例2的聲音解碼裝置24b的低 頻線性預測分析部2d '訊號變化偵測部2e、高頻線性預測 分析部2h、線性預測逆濾波器部2i、及線性預測濾波器部 2k,改爲具備:低頻線性預測分析部2d 1、訊號變化偵測 部2el、高頻線性預測分析部2hl、線性預測逆濾波器部 •94- 201126515 2i 1、及線性預測濾波器部2k3,還具備有時槽選擇部3 a。 一次高頻調整部2 j 1,係和第4實施形態的變形例2中的一 次高頻調整部2jl同樣地,進行前記“ MPEG-4 AAC”之 SBR中之” HF Adjustment “步驟中所具有之一個以上的處 理(步驟Sml之處理)。二次高頻調整部2j2,係和第4實 施形態的變形例2中的二次高頻調整部2 j 2同樣地,進行前 記 “MPEG-4 AAC” 之 SBR中之” HF Adjustment “ 步驟中 所具有之一個以上的處理(步驟Sm2之處理)。二次高頻 調整部2j2中所進行的處理,係爲前記“ MPEG-4 AAC”之 SBR中之” HF Adjustment “步驟中所具有之處理當中,未 被一次高頻調整部2j 1所進行之處理,較爲理想。 形 變 置 裝 解 編 音 聲 的 9 Nly 例 9 咳 變 的 的 態 態形 形施 施實 4*^ 第 圖 照 參 35),係實體上具備未圖示的CPU、ROM、RAM及通訊裝 置等,該CPU,係將ROM等之聲音解碼裝置24i的內藏記憶 體中所儲存的所定之電腦程式(例如用來進行圖3 6的流程 圖所述之處理所需的電腦程式)載入至RAM中並執行,藉 此以統籌控制聲音解碼裝置24i。聲音解碼裝置24i的通訊 裝置,係將已被編碼之多工化位元串流,加以接收,然後 將已解碼之聲音訊號,輸出至外部。聲音解碼裝置24i, 係如圖3 5所示,和第1實施形態同樣地,一直到第4實施形 態全體都可省略的變形例8的聲音解碼裝置24h的高頻線性 預測分析部2h 1、及線性預測逆濾波器部2i 1係被省略,並 -95- 201126515 取代了變形例8的聲音解碼裝置24h的時間包絡變形部2v、 及時槽選擇部3a,改爲具備:時間包絡變形部2vl、及時 槽選擇部3a2。然後,將一直到第4實施形態全體都可對調 處理順序的線性預測濾波器部2k3之線性預測合成濾波器 處理和時間包絡變形部2 v 1的時間包絡之變形處理的順序 ,予以對調。 (第4實施形態的變形例10) 第4實施形態的變形例1 0的聲音編解裝置24j (參照圖 37),係實體上具備未圖示的CPU、ROM、RAM及通訊裝 置等,該CPU,係將ROM等之聲音解碼裝置24j的內藏記憶 體中所儲存的所定之電腦程式(例如用來進行圖36的流程 圖所述之處理所需的電腦程式)載入至RAM中並執行,藉 此以統篛控制聲音解碼裝置24j。聲音解碼裝置24j的通訊 裝置,係將已被編碼之多工化位元串流,加以接收,然後 將已解碼之聲音訊號,輸出至外部。聲音解碼裝置24j, 係如圖37所示,和第1實施形態同樣地,一直到第4實施形 態全體都可省略的變形例8的聲音解碼裝置24h的訊號變化 偵測部2e 1、高頻線性預測分析部2h 1、及線性預測逆濾波 器部2i 1係被省略,並取代了變形例8的聲音解碼裝置24h 的時間包絡變形部2v、及時槽選擇部3a ’改爲具備:時間 包絡變形部2 v 1、及時槽選擇部3 a2。然後,將一直到第4 實施形態全體都可對調處理順序的線性預測濾波器部2k3 之線性預測合成濾波器處理和時間包絡變形部2v 1的時間 96 201126515 包絡之變形處理的順序,予以對調。 (第4實施形態的變形例1 1 ) 第4實施形態的變形例1 1的聲音編解裝置24k (參照圖 38),係實體上具備未圖示的CPU、ROM、RAM及通訊裝 置等,該CPU,係將ROM等之聲音解碼裝置24k的內藏記 憶體中所儲存的所定之電腦程式(例如用來進行圖39的流 程圖所述之處理所需的電腦程式)載入至RAM中並執行, 藉此以統籌控制聲音解碼裝置24k。聲音解碼裝置24k的通 訊裝置,係將已被編碼之多工化位元串流,加以接收,然 後將已解碼之聲音訊號,輸出至外部。聲音解碼裝置24k ,係如圖38所示,取代了變形例8的聲音解碼裝置24h的位 元串流分離部2a3、及時槽選擇部3 a,改爲具備:位元串 流分離部2a7、及時槽選擇部3al。 (第4實施形態的變形例I2 ) 第4實施形態的變形例1 2的聲音編解裝置24q (參照圖 40),係實體上具備未圖示的CPU、ROM、RAM及通訊裝 置等,該CPU,係將ROM等之聲音解碼裝置24q的內藏記 憶體中所儲存的所定之電腦程式(例如用來進行圖4 1的流 程圖所述之處理所需的電腦程式)載入至RAM中並執行, 藉此以統籌控制聲音解碼裝置24q。聲音解碼裝置24q的通 訊裝置,係將已被編碼之多工化位元串流,加以接收,然 後將已解碼之聲音訊號,輸出至外部。聲音解碼裝置24q -97- 201126515 ,係如圖40所示,取代了變形例3的聲音解碼裝置24c的低 頻線性預測分析部2d、訊號變化偵測部2e、高頻線性預測 分析部2h、線性預測逆濾波器部2i、及個別訊號成分調整 部2zl, 2z2, 2z3,改爲具備:低頻線性預測分析部2dl、訊 號變化偵測部2el、高頻線性預測分析部2hl、線性預測逆 濾波器部2il、及個別訊號成分調整部2z4,2z5,2z6 (個別 訊號成分調整部係相當於時間包絡變形手段),還具備有 時槽選擇部3a » 個別訊號成分調整部2z4,2z5,2z6當中的至少一者, 係關於前記一次高頻調整手段之輸出中所含之訊號成分, 基於由時槽選擇部3 a所通知的選擇結果,對於已被選擇之 時槽的QMF領域訊號,和個別訊號成分調整部2zl,2z2, 2z3同樣地,進行處理(步驟Snl之處理)。使用時槽選擇 資訊所進行之處理,係含有前記第4實施形態的變形例3中 所記載之個別訊號成分調整部2zl,2z2,2z3的處理當中的 包含有頻率方向之線性預測合成濾波器處理的處理當中的 至少一者,較爲理想。 個別訊號成分調整部2z4,2z5,2z6中的處理,係前記 第4實施形態的變形例3中所記載之個別訊號成分調整部 2zl,2z2,2z3的處理同樣地,可以彼此相同,但個別訊號 成分調整部2z4,2z5,2z6,係亦可對於一次高頻調整手段 之輸出中所含之複數訊號成分之每一者,以彼此互異之方 法來進行時間包絡之變形。(當個別訊號成分調整部2z4, 2z5,2z6全部都不基於時槽選擇部3a所通知之選擇結果來 -98- 201126515 進行處理時,則等同於本發明的第4實施形態的變形例3) 〇 從時槽選擇部3 a通知給每一個別訊號成分調整部2Z 4, 2z5,2z6的時槽之選擇結果’係並無必要全部相同’可以 全部或部分相異。 甚至,在圖40中雖然是構成爲,通知一個從時槽選擇 部3a通知給每一個別訊號成分調整部2z4,2z5,2z6的時槽 之選擇結果,但亦可具有複數個時槽選擇部’而對個別訊 號成分調整部2z4,2z5,2z6之每一者、或是一部分,通知 不同的時槽之選擇結果。又,此時,亦可爲,在個別訊號 成分調整部2z4,2z5,2z6當中’對於進行第4實施形態之變 形例3所記載之處理4 (對於輸入訊號,進行和時間包絡變 形部2v相同的,使用從包絡形狀調整部2s所得到之時間包 絡來對各QMF子頻帶樣本乘算增益係數之處理後,再對其 輸出訊號,進行和線性預測濾波器部2k相同的,使用從濾 波器強度調整部2f所得到之線性預測係數,進行頻率方向 的線性預測合成濾波器處理)的個別訊號成分調整部的時 槽選擇部,係被從時間包絡變形部輸入著時槽選擇資訊而 進行時槽的選擇處理。 (第4實施形態的變形例13 ) 第4實施形態的變形例1 3的聲音編解裝置24m (參照圖 42 ),係實體上具備未圖示的CPU、ROM、RAM及通訊裝 置等,該CPU,係將ROM等之聲音解碼裝置2 4m的內藏記 -99- 201126515 憶體中所儲存的所定之電腦程式(例如用來進行圖43的流 程圖所述之處理所需的電腦程式)載入至rAM中並執行, 藉此以統籌控制聲音解碼裝置24m。聲音解碼裝置24m的 通訊裝置’係將已被編碼之多工化位元串流,加以接收, 然後將已解碼之聲音訊號,輸出至外部。聲音解碼裝置 24m’係如圖42所示,取代了變形例12的聲音解碼裝置24q 的位元串流分離部2a3、及時槽選擇部3a,改爲具備:位 元串流分離部2a7、及時槽選擇部3al。 (第4實施形態的變形例1 4 ) 第4實施形態的變形例μ的聲音解碼裝置24η (未圖示 ),係實體上具備未圖示的CPU、ROM、RAM及通訊裝置 等’該CPU ’係將ROM等之聲音解碼裝置24η的內藏記憶 體中所儲存的所定之電腦程式載入至RAM中並執行,藉此 以統籌控制聲音解碼裝置24η。聲音解碼裝置24η的通訊裝 置’係將已被編碼之多工化位元串流,加以接收,然後將 已解碼之聲音訊號,輸出至外部。聲音解碼裝置24η,係 在功能上’取代了變形例1的聲音解碼裝置24a的低頻線性 預測分析部2d、訊號變化偵測部2e、高頻線性預測分析部 2h、線性預測逆濾波器部2i、及線性預測濾波器部2k,改 爲具備:低頻線性預測分析部2 d 1、訊號變化偵測部2 e 1、 高頻線性預測分析部2hl、線性預測逆濾波器部2i 1、及線 性預測濾波器部2k3,還具備有時槽選擇部3a。 -100- 201126515 (第4實施形態的變形例1 5 ) 第4實施形態的變形例15的聲音解碼裝置24p (未圖示 ),係實體上具備未圖示的CPU、ROM、RAM及通訊裝置 等,該CPU,係將ROM等之聲音解碼裝置24p的內藏記憶 體中所儲存的所定之電腦程式載入至R A Μ中並執行,藉此 以統籌控制聲音解碼裝置24Ρ。聲音解碼裝置24ρ的通訊裝 置,係將已被編碼之多工化位元串流,加以接收,然後將 已解碼之聲音訊號,輸出至外部。聲音解碼裝置2 4ρ,係 在功能上是取代了變形例14的聲音解碼裝置24η的時槽選 擇部3a,改爲具備時槽選擇部3al。然後還取代了位元串 流分離部2a4,改爲具備位元串流分離部2a8 (未圖示)。 位元串流分離部2 a8,係和位元串流分離部2 a4同樣地 ,將多工化位元串流,分離成SBR輔助資訊 '編碼位元串 流,然後還分離出時槽選擇資訊。 [產業上利用之可能性] 可利用於,在以SBR爲代表的頻率領域上的頻帶擴充 技術中所適用的技術,且是不使位元速率顯著增大,就能 減輕前回聲•後回聲的發生並提升解碼訊號的主觀品質所 需之技術。 【圖式簡單說明】 [圖1]第1實施形態所述之聲音編碼裝置之構成的圖示 -101 - 201126515 [圖2]用來說明第1實施形態所述之聲音編碼裝置之動 作的流程圖。 [圖3]第1實施形態所述之聲音解碼裝置之構成的圖示 〇 [圖4]用來說明第1實施形態所述之聲音解碼裝置之動 作的流程圖。 [圖5]第1實施形態的變形例1所述之聲音編碼裝置之構 成的圖示》 [圖6]第2實施形態所述之聲音編碼裝置之構成的圖示 〇 [圖7]用來說明第2實施形態所述之聲音編碼裝置之動 作的流程圖。 [圖8]第2實施形態所述之聲音解碼裝置之構成的圖示 〇 [圖9]用來說明第2實施形態所述之聲音解碼裝置之動 作的流程圖。 [圖10]第3實施形態所述之聲音編碼裝置之構成的圖示 〇 [圖1 1 ]用來說明第3實施形態所述之聲音編碼裝置之動 作的流程圖》 [圖12]第3實施形態所述之聲音解碼裝置之構成的圖示 〇 [圖1 3 ]用來說明第3實施形態所述之聲音解碼裝置之動 作的流程圖。 -102- 201126515 [圖14]第4實施形態所述之聲音解碼裝置之構成的圖示 〇 [圖1 5]第4實施形態的變形例所述之聲音解碼裝置之構 成的圖示。 [圖1 6 ]第4實施形態的其他變形例所述之聲音解碼裝置 之構成的圖示。 [圖I7]第4實施形態的其他變形例所述之聲音解碼裝置 之動作的說明用之流程圖。 [圖1 8 ]第1實施形態的其他變形例所述之聲音解碼裝置 之構成的圖示。 [圖1 9]第1實施形態的其他變形例所述之聲音解碼裝置 之動作的說明用之流程圖。 [圖20]第1實施形態的其他變形例所述之聲音解碼裝置 之構成的圖示。 [圖2 1 ]第1實施形態的其他變形例所述之聲音解碼裝置 之動作的說明用之流程圖。 [圖22]第2實施形態的變形例所述之聲音解碼裝置之構 成的圖示》 [圖23]用來說明第2實施形態的變形例所述之聲音解碼 裝置之動作的流程圖。 [圖24]第2實施形態的其他變形例所述之聲音解碼裝置 之構成的圖示。 [圖25]第2實施形態的其他變形例所述之聲音解碼裝置 之動作的說明用之流程圖。 -103- 201126515 [圖26]第4實施形態的其他變形例所述之聲音解碼裝置 之構成的圖示。 [圖27]第4實施形態的其他變形例所述之聲音解碼裝置 之動作的說明用之流程圖。 [圖28]第4實施形態的其他變形例所述之聲音解碼裝置 之構成的圖示。 [圖29]第4實施形態的其他變形例所述之聲音解碼裝置 之動作的說明用之流程圖。 [圖30]第4實施形態的其他變形例所述之聲音解碼裝置 之構成的圖示。 [圖3 1 ]第4實施形態的其他變形例所述之聲音解碼裝置 之構成的圖示。 [圖32]第4實施形態的其他變形例所述之聲音解碼裝置 之動作的說明用之流程圖。 [圖33]第4實施形態的其他變形例所述之聲音解碼裝置 之構成的圖示。 [圖3 4 ]第4實施形態的其他變形例所述之聲音解碼裝置 之動作的說明用之流程圖。 [圖3 5 ]第4實施形態的其他變形例所述之聲音解碼裝置 之構成的圖示。 [圖36]第4實施形態的其他變形例所述之聲音解碼裝置 之動作的說明用之流程圖。 [圖37]第4實施形態的其他變形例所述之聲音解碼裝置 之構成的圖示。 -104- 201126515 [圖3 8]第4實施形態的其他變形例所述之聲音解碼裝置 之構成的圖示。 [圖3 9]第4實施形態的其他變形例所述之聲音解碼裝置 之動作的說明用之流程圖。 [圖40]第4實施形態的其他變形例所述之聲音解碼裝置 之構成的圖示。 [圖4 1]第4實施形態的其他變形例所述之聲音解碼裝置 之動作的說明用之流程圖。 [圖42]第4實施形態的其他變形例所述之聲音解碼裝置 之構成的圖示。 [圖43]第4實施形態的其他變形例所述之聲音解碼裝置 之動作的說明用之流程圖。 [圖44]第1實施形態的其他變形例所述之聲音編碼裝置 之構成的圖示。 [圖45]第1實施形態的其他變形例所述之聲音編碼裝置 之構成的圖示。 [圖46]第2實施形態的變形例所述之聲音編碼裝置之構 成的圖示。 [圖47]第2實施形態的其他變形例所述之聲音編碼裝置 之構成的圖示。 [圖48]第4實施形態所述之聲音編碼裝置之構成的圖示 〇 [圖49]第4實施形態的其他變形例所述之聲音編碼裝置 之構成的圖示。 -105- 201126515 [圖50]第4實施形態的其他變形例所述之聲音編碼裝置 之構成的圖示。 【主要元件符號說明】 11,1 la, 1 lb, 11c,12, 12a, 12b, 13,14,14a, 14b :聲 音編碼裝置、la:頻率轉換部、lb:頻率逆轉換部、lc: 核心編解碼器編碼部、Id : SBR編碼部、le, :lel :線性預 測分析部、1 f :濾波器強度參數算出部、1 Π :濾波器強度 參數算出部、lg,lgl,lg2,lg3,lg4,lg5,lg6,lg7:位元 串流多工化部、1 h :高頻頻率逆轉換部、1 i :短時間功率 算出部、Ij :線性預測係數抽略部、1 k :線性預測係數量 化部、1 m :時間包絡算出部、1 n :包絡形狀參數算出部、 lp,Ipl :時槽選擇部、21,22,23,24,24b,24c:聲音解 碼裝置、2a,2al,2a2,2a3,2a5,2a6,2a7:位元串流分離 部、2b :核心編解碼器解碼部、2c :頻率轉換部、2d,2d 1 :低頻線性預測分析部、2e, 2el :訊號變化偵測部、2f : 濾波器強度調整部、2g :高頻生成部、2h,2hl :高頻線性 預測分析部、2i,2il :線性預測逆濾波器部、2j,2jl,2j2, 2j3, 2j4 :高頻調整部、2k,2kl,2k2, 2k3 :線性預測濾波 器部、2m :係數加算部、2η :頻率逆轉換部、2p,2pl : 線性預測係數內插•外插部、2r :低頻時間包絡計算部、 2s :包絡形狀調整部、2t :高頻時間包絡算出部、2u :時 間包絡平坦化部、2v,2vl :時間包絡變形部、2w :輔助 資訊轉換部、2zl,2z2, 2z3,2z4,2z5, 2z6:個別訊號成分 調整部、3a, 3al,3a2:時槽選擇部 -106-

Claims (1)

  1. 201126515 七、申請專利範圍: 1. 一種聲音編碼裝置,係屬於將聲音訊號予以編碼的 聲音編碼裝置,其特徵爲,具備: 核心編碼手段,係將前記聲音訊號的低頻成分,予以 編碼;和 時間包絡輔助資訊算出手段,係使用前記聲音訊號之 低頻成分之時間包絡,來算出用來獲得前記聲音訊號之高 頻成分之時間包絡之近似所需的時間包絡輔助資訊;和 位元串流多工化手段,係生成至少由已被前記核心編 碼手段所編碼過之前記低頻成分、和已被前記時間包絡輔 助資訊算出手段所算出的前記時間包絡輔助資訊所多工化 而成的位元串流。 2 .如申請專利範圍第1項所記載之聲音編碼裝置,其 中, 前記時間包絡輔助資訊,係表示一參數,其係用以表 示在所定之解析區間內,前記聲音訊號的高頻成分中的時 間包絡之變化的急峻度。 3 .如申請專利範圍第2項所記載之聲音編碼裝置,其 中, 更具備:頻率轉換手段,係將前記聲音訊號,轉換成 頻率領域; 前記時間包絡輔助資訊算出手段,係基於對已被前記 頻率轉換手段轉換成頻率領域之前記聲音訊號的高頻側係 數在頻率方向上進行線性預測分析所取得的高頻線性預測 -107- 201126515 係數,而算出前記時間包絡輔助資訊。 4.如申請專利範圍第3項所記載之聲音編碼裝置,其 中,前記時間包絡輔助資訊算出手段,係對已被前記頻率 轉換手段轉換成頻率領域之前記聲音訊號的低頻側係數, 在頻率方向上進行線性預測分析而取得低頻線性預測係數 ,基於該低頻線性預測係數和前記高頻線性預測係數,而 算出前記時間包絡輔助資訊。 5 .如申請專利範圍第4項所記載之聲音編碼裝置,其 中,前記時間包絡輔助資訊算出手段,係從前記低頻線性 預測係數及前記高頻線性預測係數,分別取得預測增益, 基於該當二個預測增益之大小,而算出前記時間包絡輔助 資訊。 6 .如申請專利範圍第2項所記載之聲音編碼裝置,其 中,前記時間包絡輔助資訊算出手段,係從前記聲音訊號 中分離出高頻成分,從該當高頻成分中取得被表現在時間 領域中的時間包絡資訊,基於該當時間包絡資訊的時間性 變化之大小,而算出前記時間包絡輔助資訊。 7 ·如申請專利範圍第1項所記載之聲音編碼裝置,其 中,前記時間包絡輔助資訊,係含有差分資訊,其係爲了 使用對前記聲音訊號之低頻成分進行往頻率方向之線性預 測分析所獲得之低頻線性預測係數而取得高頻線性預測係 數所需。 8 ·如申請專利範圍第7項所記載之聲音編碼裝置,其 中, -108- 201126515 更具備:頻率轉換手段,係將前記聲音訊號,轉換成 頻率領域; 前記時間包絡輔助資訊算出手段,係對已被前記頻率 轉換手段轉換成頻率領域之前記聲音訊號的低頻成分及高 頻側係數,分別在頻率方向上進行線性預測分析而取得低 頻線性預測係數與高頻線性預測係數,並取得該當低頻線 性預測係數及高頻線性預測係數的差分,以取得前記差分 資訊。 9 .如申請專利範圍第8項所記載之聲音編碼裝置,其 中,前記差分資訊係表示LSP ( Linear Spectrum Pair)、 ISP ( Immittance Spectrum Pair) 、LSF ( Linear Spectrum Frequency) 、ISF ( Immittance Spectrum Frequency ) 、 PARCOR係數之任一領域中的線性預測係數之差分。 1 〇. —種聲音編碼裝置,係屬於將聲音訊號予以編碼 的聲音編碼裝置,其特徵爲,具備: 核心編碼手段,係將前記聲音訊號的低頻成分,予以 編碼;和 頻率轉換手段,係將前記聲音訊號,轉換成頻率領域 :和 線性預測分析手段,係對已被前記頻率轉換手段轉換 成頻率領域之前記聲音訊號的高頻側係數,在頻率方向上 進行線性預測分析而取得高頻線性預測係數;和 預測係數抽略手段,係將已被前記線性預測分析手段 所取得之前記高頻線性預測係數,在時間方向上作抽略; -109- 201126515 和 預測係數量化手段’係將已被前記預測係數抽略手段 作抽略後的前記高頻線性預測係數,予以量化;和 位元串流多工化手段’係生成至少由前記核心編碼手 段所編碼後的前記低頻成分和前記預測係數量化手段所量 化後的前記高頻線性預測係數,所多工化而成的位元串流 0 π.—種聲音解碼裝置,係屬於將已被編碼之聲音訊 號予以解碼的聲音解碼裝置,其特徵爲,具備: 位元串流分離手段,係將含有前記已被編碼之聲音訊 號的來自外部的位元串流,分離成編碼位元串流與時間包 絡輔助資訊;和 核心解碼手段,係將已被前記位元串流分離手段所分 離的前記編碼位元串流予以解碼而獲得低頻成分;和 頻率轉換手段,係將前記核心解碼手段所得到之前記 低頻成分,轉換成頻率領域;和 高頻生成手段,係將已被前記頻率轉換手段轉換成頻 率領域的前記低頻成分,從低頻頻帶往高頻頻帶進行複寫 ,以生成高頻成分;和 低頻時間包絡分析手段,係將已被前記頻率轉換手段 轉換成頻率領域的前記低頻成分加以分析,而取得時間包 絡資訊;和 時間包絡調整手段,係將已被前記低頻時間包絡分析 手段所取得的前記時間包絡資訊,使用前記時間包絡輔助 -110- 201126515 資訊來進行調整;和 時間包絡變形手段,係使用前記時間包絡 調整後的前記時間包絡資訊,而將已被前記高 所生成之前記高頻成分的時間包絡,加以變形 1 2 .如申請專利範圍第1 1項所記載之聲音 其中, 更具備:高頻調整手段,係用以調整前記丨 前記頻率轉換手段,係爲具有實數或複I number)之係數的64分割QMF濾波器組; 前記頻率轉換手段、前記高頻生成手段、 整手段,係以“ISO/IEC 1 4496-3 ”中所規定 AAC” 中的 SBR解碼器(SBR : Spectral Band )爲依據而作動。 1 3 .如申請專利範圍第1 1項或第1 2項所記 碼裝置,其中, 前記低頻時間包絡分析手段,係對已被前 手段轉換成頻率領域的前記低頻成分,進行頻 性預測分析,而取得低頻線性預測係數; 前記時間包絡調整手段,係使用前記時間 訊來調整前記低頻線性預測係數; 前記時間包絡變形手段,係對於已被前記 段所生成之頻率領域的前記高頻成分,使用以 絡調整手段做過調整後的線性預測係數來進行 線性預測濾波器處理,以將聲音訊號的時間包 調整手段所 頻生成手段 〇 解碼裝置, 寄頻成分; t ( complex 前記高頻調 之 “ MPEG4 Replication 載之聲音解 記頻率轉換 率方向的線 包絡輔助資 高頻生成手 前記時間包 頻率方向的 絡予以變形 -111 - 201126515 1 4 ·如申請專利範圍第1 1項或第1 2項所記載之聲音解 碼裝置,其中, 前記低頻時間包絡分析手段,係將已被前記頻率轉換 手段轉換成頻率領域的前記低頻成分的每一時槽的功率加 以取得,以取得聲音訊號的時間包絡資訊; 前記時間包絡調整手段,係使用前記時間包絡輔助資 訊來調整前記時間包絡資訊; 前記時間包絡變形手段,係對已被前記高頻生成手段 所生成之頻率領域的高頻成分,重疊上前記調整後的時間 包絡資訊,以將高頻成分的時間包絡予以變形。 1 5 .如申請專利範圍第1 1項或第1 2項所記載之聲音解 碼裝置,其中, 前記低頻時間包絡分析手段,係將已被前記頻率轉換 手段轉換成頻率領域的前記低頻成分的每一 Q M F子頻帶樣 本的功率加以取得,以取得聲音訊號的時間包絡資訊; 前記時間包絡調整手段,係使用前記時間包絡輔助資 訊來調整前記時間包絡資訊; 前記時間包絡變形手段,係對已被前記高頻生成手段 所生成之頻率領域的高頻成分,乘算上前記調整後的時間 包絡資訊,以將高頻成分的時間包絡予以變形。 1 6.如申請專利範圍第1 3項所記載之聲音解碼裝置, 其中,前記時間包絡輔助資訊,係表示線性預測係數之強 度之調整時所要使用的濾波器強度參數。 -112- 201126515 1 7 ·如申請專利範圍第1 4項或第1 5項所記載之聲音解 碼裝置’其中’前記時間包絡輔助資訊,係代表著表示前 記時間包絡資訊之時間變化之大小的參數。 1 8 ·如申請專利範圍第1 3項所記載之聲音解碼裝置, 其中’前記時間包絡輔助資訊,係含有對於前記低頻線性 預測係數的線性預測係數之差分資訊。 1 9 ·如申請專利範圍第1 8項所記載之聲音解碼裝置, 其中,前記差分資訊係表示LSP( Linear Spectrum Pair) 、ISP ( Immittance Spectrum Pair ) 、 LSF ( Linear Spectrum Frequency ) ' ISF ( Immittance Spectrum Frequency) 、PARCOR係數之任一領域中的線性預測係數 之差分。 2 0.如申請專利範圍第1 1項或第12項所記載之聲音解 碼裝置,其中, 前記低頻時間包絡分析手段,係對已被前記頻率轉換 手段轉換成頻率領域之前記低頻成分進行頻率方向的線性 預測分析以取得前記低頻線性預測係數,並且藉由取得該 當頻率領域之前記低頻成分的每一時槽的功率以取得聲音 訊號的時間包絡資訊; 前記時間包絡調整手段,係使用前記時間包絡輔助資 訊來調整前記低頻線性預測係數,並且使用前記時間包絡 輔助資訊來調整前記時間包絡資訊: 前記時間包絡變形手段,係對於已被前記高頻生成手 段所生成之頻率領域的高頻成分,使用以前記時間包絡調 -113- 201126515 整手段做過調整後的線性預測係數來進行頻率方向的線性 預測濾波器處理,以將聲音訊號的時間包絡予以變形’並 且對該當頻率領域之前記高頻成分,重疊上以前記時間包 絡調整手段做過調整後的前記時間包絡資訊,以將前記高 頻成分的時間包絡予以變形。 2 1 .如申請專利範圍第1 1項或第1 2項所記載之聲音解 碼裝置,其中, 前記低頻時間包絡分析手段,係對已被前記頻率轉換 手段轉換成頻率領域之前記低頻成分進行頻率方向的線性 預測分析以取得前記低頻線性預測係數,並且藉由取得該 當頻率領域之前記低頻成分的每一 QMF子頻帶樣本的功率 以取得聲音訊號的時間包絡資訊; 前記時間包絡調整手段,係使用前記時間包絡輔助資 訊來調整前記低頻線性預測係數,並且使用前記時間包絡 輔助資訊來調整前記時間包絡資訊; 前記時間包絡變形手段,係對於已被前記髙頻生成手 段所生成之頻率領域的高頻成分,使用以前記時間包絡調 整手段做過調整後的線性預測係數來進行頻率方向的線性 預測濾波器處理,以將聲音訊號的時間包絡予以變形,並 且對該當頻率領域之則記闻頻成分,乘算上以前記時間包 絡調整手段做過調整後的前記時間包絡資訊,以將前記高 頻成分的時間包絡予以變形。 2 2 .如申請專利範圍第2 0項或第2 1項所記載之聲音解 碼裝置,其中,前記時間包絡輔助資訊,係代表著表示線 -114- 201126515 性預測係數的濾波器強度、和前記時間包絡資訊之時間變 化之大小之雙方的參數。 23.—種聲音解碼裝置,係屬於將已被編碼之聲音訊 號予以解碼的聲音解碼裝置,其特徵爲,具備: 位元串流分離手段,係將含有前記已被編碼之聲音訊 號的來自外部的位元串流,分離成編碼位元串流與線性預 測係數;和 線性預測係數內插•外插手段,係將前記線性預測係 數,在時間方向上進行內插或外插;和 時間包絡變形手段,係使用已被前記線性預測係數內 插·外插手段做過內插或外插之線性預測係數,而對頻率 領域中所表現之高頻成分,進行頻率方向的線性預測濾波 器處理,以將聲音訊號的時間包絡予以變形。 24·—種聲音編碼方法,係屬於使用將聲音訊號予以 編碼的聲音編碼裝置的聲音編碼方法,其特徵爲,具備: 核心編碼步驟,係由前記聲音編碼裝置,將前記聲音 訊號的低頻成分,予以編碼;和 時間包絡輔助資訊算出步驟,係由前記聲音編碼裝置 ,使用前記聲音訊號之低頻成分之時間包絡,來算出用來 獲得前記聲音訊號之高頻成分之時間包絡之近似所需的時 間包絡輔助資訊;和 位元串流多工化步驟,係由前記聲音編碼裝置,生成 至少由在前記核心編碼步驟中所編碼過之前記低頻成分、 和在前記時間包絡輔助資訊算出步驟中所算出的前記時間 -115- 201126515 包絡輔助資訊,所多工化而成的位元串流。 2 5 . —種聲音編碼方法,係屬於使用將聲音訊號予以 編碼的聲音編碼裝置的聲音編碼方法,其特徵爲,具備: 核心編碼步驟,係由前記聲音編碼裝置,將前記聲音 訊號的低頻成分,予以編碼;和 頻率轉換步驟,係由前記聲音編碼裝置,將前記聲音 訊號,轉換成頻率領域;和 線性預測分析步驟,係由前記聲音編碼裝置,對已在 前記頻率轉換步驟中轉換成頻率領域之前記聲音訊號的高 頻側係數,在頻率方向上進行線性預測分析而取得高頻線 性預測係數;和 預測係數抽略步驟,係由前記聲音編碼裝置,將在前 記線性預測分析手段步驟中所取得之前記高頻線性預測係 數,在時間方向上作抽略;和 預測係數量化步驟,係由前記聲音編碼裝置,將前記 預測係數抽略手段步驟中的抽略後的前記高頻線性預測係 數,予以量化;和 位元串流多工化步驟,係由前記聲音編碼裝置,生成 至少由前記核心編碼步驟中的編碼後的前記低頻成分和前 記預測係數量化步驟中的量化後的前記高頻線性預測係數 ,所多工化而成的位元串流。 2 6.—種聲音解碼方法,係屬於使用將已被編碼之聲 音訊號予以解碼的聲音解碼裝置的聲音解碼方法,其特徵 爲,具備: -116- 201126515 位兀串流分離步驟,係由前記聲音解碼裝置,將含有 前記已被編碼之聲音訊號的來自外部的位元串流,分離成 編碼位元串流與時間包絡輔助資訊;和 核心解碼步驟,係由前記聲音解碼裝置,將已在前記 位元串流分離步驟中作分離的前記編碼位元串流予以解碼 而獲得低頻成分;和 頻率轉換步驟,係由前記聲音解碼裝置,將前記核心 解碼步驟中所得到之前記低頻成分,轉換成頻率領域:和 高頻生成步驟,係由前記聲音解碼裝置,將已在前記 頻率轉換步驟中轉換成頻率領域的前記低頻成分,從低頻 頻帶往高頻頻帶進行複寫,以生成高頻成分;和 低頻時間包絡分析步驟,係由前記聲音解碼裝置,將 已在前記頻率轉換步驟中轉換成頻率領域的前記低頻成分 加以分析,而取得時間包絡資訊;和 時間包絡調整步驟,係由前記聲音解碼裝置,將已在 前記低頻時間包絡分析步驟中所取得的前記時間包絡資訊 ,使用前記時間包絡輔助資訊來進行調整;和 時間包絡變形步驟,係由前記聲音解碼裝置,使用前 記時間包絡調整步驟中的調整後的前記時間包絡資訊,而 將已在前記高頻生成步驟中所生成之前記高頻成分的時間 包絡,加以變形。 2 7·—種聲音解碼方法,係屬於使用將已被編碼之聲 音訊號予以解碼的聲音解碼裝置的聲音解碼方法,其特徵 爲"具備· -117- 201126515 位元串流分離步驟,係由前記聲音解碼裝置,將含有 前記已被編碼之聲音訊號的來自外部的位元串流,分離成 編碼位元串流與線性預測係數;和 線性預測係數內插•外插步驟,係由前記聲音解碼裝 置,將前記線性預測係數,在時間方向上進行內插或外插 :和 時間包絡變形步驟,係由前記聲音解碼裝置,使用已 在前記線性預測係數內插•外插步驟中做過內插或外插之 前記線性預測係數,而對頻率領域中所表現之高頻成分, 進行頻率方向的線性預測濾波器處理,以將聲音訊號的時 間包絡予以變形。 28.—種聲音編碼程式,其特徵爲,爲了將聲音訊號 予以編碼,而使電腦裝置發揮機能成爲: 核心編碼手段,係將前記聲音訊號的低頻成分,予以 編碼; 時間包絡輔助資訊算出手段,係使用前記聲音訊號之 低頻成分之時間包絡,來算出用來獲得前記聲音訊號之高 頻成分之時間包絡之近似所需的時間包絡輔助資訊;及 位元串流多工化手段,係生成至少由已被前記核心編 碼手段所編碼過之前記低頻成分、和已被前記時間包絡輔 助資訊算出手段所算出的前記時間包絡輔助資訊所多工化 而成的位元串流。 2 9.—種聲音編碼程式,其特徵爲,爲了將聲音訊號 予以編碼,而使電腦裝置發揮機能成爲: -118- 201126515 核心編碼手段,係將前記聲音訊號的低頻成分,予以 編碼; 頻率轉換手段,係將前記聲音訊號,轉換成頻率領域 線性預測分析手段,係對已被前記頻率轉換手段轉換 成頻率領域之前記聲音訊號的高頻側係數,在頻率方向上 進行線性預測分析而取得高頻線性預測係數; 預測係數抽略手段,係將已被前記線性預測分析手段 所取得之前記高頻線性預測係數,在時間方向上作抽略; 預測係數量化手段,係將已被前記預測係數抽略手段 作抽略後的前記高頻線性預測係數,予以量化;及 位元串流多工化手段,係生成至少由前記核心編碼手 段所編碼後的前記低頻成分和前記預測係數量化手段所量 化後的前記高頻線性預測係數,所多工化而成的位元串流 0 30.—種聲音解碼程式,其特徵爲,爲了將已被編碼 之聲音訊號予以解碼,而使電腦裝置發揮機能成爲: 位元串流分離手段,係將含有前記已被編碼之聲音訊 號的來自外部的位元串流,分離成編碼位元串流與時間包 絡輔助資訊; 核心解碼手段,係將已被前記位元串流分離手段所分 離的前記編碼位元串流予以解碼而獲得低頻成分; 頻率轉換手段,係將前記核心解碼手段所得到之前記 低頻成分,轉換成頻率領域; -119- 201126515 高頻生成手段’係將已被前記頻率轉換手段轉換成頻 率領域的前記低頻成分’從低頻頻帶往高頻頻帶進行複寫 ,以生成高頻成分; 低頻時間包絡分析手段,係將已被前記頻率轉換手段 轉換成頻率領域的前記低頻成分加以分析,而取得時間包 絡資訊; 時間包絡調整手段’係將已被前記低頻時間包絡分析 手段所取得的前記時間包絡資訊,使用前記時間包絡輔助 資訊來進行調整;及 時間包絡變形手段,係使用前記時間包絡調整手段所 調整後的前記時間包絡資訊,而將已被前記高頻生成手段 所生成之前記高頻成分的時間包絡,加以變形。 31.—種聲音解碼程式,其特徵爲,爲了將已被編碼 之聲音訊號予以解碼,而使電腦裝置發揮機能成爲: 位元串流分離手段,係將含有前記已被編碼之聲音訊 號的來自外部的位元串流,分離成編碼位元串流與線性預 測係數; 線性預測係數內插•外插手段,係將前記線性預測係 數,在時間方向上進行內插或外插;及 時間包絡變形手段,係使用已被前記線性預測係數內 插·外插手段做過內插或外插之線性預測係數,而對頻率 領域中所表現之高頻成分,進行頻率方向的線性預測濾波 器處理,以將聲音訊號的時間包絡予以變形。 3 2.如申請專利範圍第13、20、21項之任一項所記載 -120- 201126515 之聲音解碼裝置,其中,前記時間包絡變形手段,係對 被前記高頻生成手段所生成之頻率領域的前記高頻成分 行了頻率方向的線性預測濾波器處理後,將前記線性預 濾波器處理之結果所得到的高頻成分之功率,調整成相 於前記線性預測濾波器處理前之値。 3 3 .如申請專利範圍第1 3、2 0、2 1項之任一項所記 之聲音解碼裝置,其中,前記時間包絡變形手段,係對 被前記高頻生成手段所生成之頻率領域的前記高頻成分 行了頻率方向的線性預測濾波器處理後,將前記線性預 濾波器處理之結果所得到的高頻成分之任意頻率範圍內 功率,調整成相等於前記線性預測濾波器處理前之値。 34.如申請專利範圍第14、15、20、21、32、33項 任一項所記載之聲音解碼裝置,其中,前記時間包絡輔 資訊,係前記調整後之前記時間包絡資訊中的最小値與 均値之比率。 3 5 .如申請專利範圍第1 4、1 5、2 0 ' 2 1、3 2〜3 4項 任一項所記載之聲音解碼裝置,其中,前記時間包絡變 手段,係控制前記調整後的時間包絡之增益,使得前記 率領域的高頻成分的SB R包絡時間區段內的功率是在時 包絡之變形前後呈相等之後,藉由對前記頻率領域的高 成分,乘算上前記已被增益控制之時間包絡,以將高頻 分的時間包絡予以變形。 3 6 ·如申請專利範圍第1 2、1 4、1 5、1 7、2 0、2 1、 〜3 5項之任一項所記載之聲音解碼裝置,其中,前記低 已 進 測 等 載 已 進 測 之 之 助 平 之 形 頻 間 頻 成 3 2 頻 -121 - 201126515 時間包絡分析手段,係將已被前記頻率轉換手段轉換成頻 率領域之前記低頻成分的每一 QMF子頻帶樣本之功率’加 以取得,然後使用SBR包絡時間區段內的平均功率而將每 一前記QMF子頻帶樣本的功率進行正規化,藉此以取得表 現成爲應被乘算至各QMF子頻帶樣本之增益係數的時間包 絡資訊。 37.—種聲音解碼裝置,係屬於將已被編碼之聲音訊 號予以解碼的聲音解碼裝置,其特徵爲,具備: 核心解碼手段,係將含有前記已被編碼之聲音訊號之 來自外部的位元串流予以解碼而獲得低頻成分;和 頻率轉換手段,係將前記核心解碼手段所得到之前記 低頻成分,轉換成頻率領域;和 高頻生成手段,係將已被前記頻率轉換手段轉換成頻 率領域的前記低頻成分,從低頻頻帶往高頻頻帶進行複寫 ,以生成高頻成分;和 低頻時間包絡分析手段,係將已被前記頻率轉換手段 轉換成頻率領域的前記低頻成分加以分析,而取得時間包 絡資訊;和 時間包絡輔助資訊生成部,係將前記位元串流加以分 析而生成時間包絡輔助資訊;和 時間包絡調整手段’係將已被前記低頻時間包絡分析 手段所取得的前記時間包絡資訊,使用前記時間包絡輔助 資訊來進行調整;和 時間包絡變形手段,係使用前記時間包絡調整手段所 -122- 201126515 調整後的前記時間包絡資訊,而將已被前記高頻生成手段 所生成之前記高頻成分的時間包絡,加以變形。 3 8 .如申請專利範圍第丨丨〜2 2、3 2〜3 7項之任一項所 記載之聲音解碼裝置,其中, 具備相當於前記高頻調整手段的一次高頻調整手段、 和二次高頻調整手段; 則記一次高頻調整手段,係執行包含相當於前記高頻 調整手段之處理之一部分的處理; 前記時間包絡變形手段,對前記一次高頻調整手段的 輸出訊號,進行時間包絡的變形; 前記二次高頻調整手段,係對前記時間包絡變形手段 的輸出訊號,執行相當於前記高頻調整手段之處理當中未 被前記一次高頻調整手段所執行之處理。 3 9 .如申請專利範圍第3 8項所記載之聲音解碼裝置, 其中,前記二次高頻調整手段,係SBR之解碼過程中的正 弦波之附加處理。 -123-
TW099110498A 2009-04-03 2010-04-02 Speech encoding device, speech decoding device, speech encoding method, speech decoding method, speech encoding program, and speech decoding program TW201126515A (en)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2009091396 2009-04-03
JP2009146831 2009-06-19
JP2009162238 2009-07-08
JP2010004419A JP4932917B2 (ja) 2009-04-03 2010-01-12 音声復号装置、音声復号方法、及び音声復号プログラム

Publications (2)

Publication Number Publication Date
TW201126515A true TW201126515A (en) 2011-08-01
TWI379288B TWI379288B (zh) 2012-12-11

Family

ID=42828407

Family Applications (6)

Application Number Title Priority Date Filing Date
TW099110498A TW201126515A (en) 2009-04-03 2010-04-02 Speech encoding device, speech decoding device, speech encoding method, speech decoding method, speech encoding program, and speech decoding program
TW101124694A TWI384461B (zh) 2009-04-03 2010-04-02 A sound decoding apparatus, a sound decoding method, and a recording medium on which a voice decoding program is recorded
TW101124697A TWI476763B (zh) 2009-04-03 2010-04-02 A sound decoding apparatus, a sound decoding method, and a recording medium on which a voice decoding program is recorded
TW101124696A TWI479479B (zh) 2009-04-03 2010-04-02 A sound decoding apparatus, a sound decoding method, and a recording medium on which a voice decoding program is recorded
TW101124698A TWI479480B (zh) 2009-04-03 2010-04-02 A sound coding apparatus, a voice decoding apparatus, a speech coding method, a speech decoding method, a recording medium recording a sound coding program and a voice decoding program
TW101124695A TWI478150B (zh) 2009-04-03 2010-04-02 A sound decoding apparatus, a sound decoding method, and a recording medium on which a voice decoding program is recorded

Family Applications After (5)

Application Number Title Priority Date Filing Date
TW101124694A TWI384461B (zh) 2009-04-03 2010-04-02 A sound decoding apparatus, a sound decoding method, and a recording medium on which a voice decoding program is recorded
TW101124697A TWI476763B (zh) 2009-04-03 2010-04-02 A sound decoding apparatus, a sound decoding method, and a recording medium on which a voice decoding program is recorded
TW101124696A TWI479479B (zh) 2009-04-03 2010-04-02 A sound decoding apparatus, a sound decoding method, and a recording medium on which a voice decoding program is recorded
TW101124698A TWI479480B (zh) 2009-04-03 2010-04-02 A sound coding apparatus, a voice decoding apparatus, a speech coding method, a speech decoding method, a recording medium recording a sound coding program and a voice decoding program
TW101124695A TWI478150B (zh) 2009-04-03 2010-04-02 A sound decoding apparatus, a sound decoding method, and a recording medium on which a voice decoding program is recorded

Country Status (21)

Country Link
US (5) US8655649B2 (zh)
EP (5) EP2509072B1 (zh)
JP (1) JP4932917B2 (zh)
KR (7) KR101172326B1 (zh)
CN (6) CN102737640B (zh)
AU (1) AU2010232219B8 (zh)
BR (1) BRPI1015049B1 (zh)
CA (4) CA2757440C (zh)
CY (1) CY1114412T1 (zh)
DK (2) DK2503548T3 (zh)
ES (5) ES2587853T3 (zh)
HR (1) HRP20130841T1 (zh)
MX (1) MX2011010349A (zh)
PH (4) PH12012501116A1 (zh)
PL (2) PL2503548T3 (zh)
PT (3) PT2503548E (zh)
RU (6) RU2498422C1 (zh)
SG (2) SG174975A1 (zh)
SI (1) SI2503548T1 (zh)
TW (6) TW201126515A (zh)
WO (1) WO2010114123A1 (zh)

Families Citing this family (62)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4932917B2 (ja) 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
WO2011048798A1 (ja) * 2009-10-20 2011-04-28 パナソニック株式会社 符号化装置、復号化装置およびこれらの方法
PL3779979T3 (pl) * 2010-04-13 2024-01-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Sposób dekodowania audio do przetwarzania sygnałów audio stereo z wykorzystaniem zmiennego kierunku predykcji
ES2564504T3 (es) 2010-12-29 2016-03-23 Samsung Electronics Co., Ltd Aparato de codificación y aparato de descodificación con una ampliación de ancho de banda
CA2827482C (en) * 2011-02-18 2018-01-02 Ntt Docomo, Inc. Speech decoder, speech encoder, speech decoding method, speech encoding method, speech decoding program, and speech encoding program
CN103918029B (zh) 2011-11-11 2016-01-20 杜比国际公司 使用过采样谱带复制的上采样
JP5997592B2 (ja) * 2012-04-27 2016-09-28 株式会社Nttドコモ 音声復号装置
JP6200034B2 (ja) * 2012-04-27 2017-09-20 株式会社Nttドコモ 音声復号装置
CN102737647A (zh) * 2012-07-23 2012-10-17 武汉大学 双声道音频音质增强编解码方法及装置
EP2704142B1 (en) * 2012-08-27 2015-09-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for reproducing an audio signal, apparatus and method for generating a coded audio signal, computer program and coded audio signal
CN103730125B (zh) * 2012-10-12 2016-12-21 华为技术有限公司 一种回声抵消方法和设备
CN105551497B (zh) 2013-01-15 2019-03-19 华为技术有限公司 编码方法、解码方法、编码装置和解码装置
AU2014211539B2 (en) 2013-01-29 2017-04-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Low-complexity tonality-adaptive audio signal quantization
BR112015017632B1 (pt) * 2013-01-29 2022-06-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. Aparelho e método para gerar um sinal melhorado da frequência utilizando nivelamento temporal de sub-bandas
US9711156B2 (en) * 2013-02-08 2017-07-18 Qualcomm Incorporated Systems and methods of performing filtering for gain determination
KR102148407B1 (ko) * 2013-02-27 2020-08-27 한국전자통신연구원 소스 필터를 이용한 주파수 스펙트럼 처리 장치 및 방법
TWI477789B (zh) * 2013-04-03 2015-03-21 Tatung Co 資訊擷取裝置及其發送頻率調整方法
CN108806704B (zh) 2013-04-19 2023-06-06 韩国电子通信研究院 多信道音频信号处理装置及方法
JP6305694B2 (ja) * 2013-05-31 2018-04-04 クラリオン株式会社 信号処理装置及び信号処理方法
FR3008533A1 (fr) 2013-07-12 2015-01-16 Orange Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences
KR101883789B1 (ko) * 2013-07-18 2018-07-31 니폰 덴신 덴와 가부시끼가이샤 선형 예측 분석 장치, 방법, 프로그램 및 기록 매체
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
US9319819B2 (en) * 2013-07-25 2016-04-19 Etri Binaural rendering method and apparatus for decoding multi channel audio
JP6242489B2 (ja) * 2013-07-29 2017-12-06 ドルビー ラボラトリーズ ライセンシング コーポレイション 脱相関器における過渡信号についての時間的アーチファクトを軽減するシステムおよび方法
CN104517610B (zh) 2013-09-26 2018-03-06 华为技术有限公司 频带扩展的方法及装置
CN104517611B (zh) * 2013-09-26 2016-05-25 华为技术有限公司 一种高频激励信号预测方法及装置
AU2014336357B2 (en) 2013-10-18 2017-04-13 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Concept for encoding an audio signal and decoding an audio signal using deterministic and noise like information
KR101849613B1 (ko) * 2013-10-18 2018-04-18 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 스피치 관련 스펙트럼 정형 정보를 사용하는 오디오 신호의 인코딩 및 오디오 신호의 디코딩을 위한 개념
EP3063761B1 (en) * 2013-10-31 2017-11-22 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung E.V. Audio bandwidth extension by insertion of temporal pre-shaped noise in frequency domain
KR20160087827A (ko) * 2013-11-22 2016-07-22 퀄컴 인코포레이티드 고대역 코딩에서의 선택적 위상 보상
EP3040987B1 (en) 2013-12-02 2019-05-29 Huawei Technologies Co., Ltd. Encoding method and apparatus
US10163447B2 (en) * 2013-12-16 2018-12-25 Qualcomm Incorporated High-band signal modeling
MX361028B (es) * 2014-02-28 2018-11-26 Fraunhofer Ges Forschung Dispositivo de decodificación, dispositivo de codificación, método de decodificación, método de codificación, dispositivo de terminal y dispositivo de estación de base.
JP6035270B2 (ja) 2014-03-24 2016-11-30 株式会社Nttドコモ 音声復号装置、音声符号化装置、音声復号方法、音声符号化方法、音声復号プログラム、および音声符号化プログラム
BR112016024372B1 (pt) 2014-04-25 2020-11-03 Ntt Docomo, Inc. dispositivo de conversão de coeficiente de predição linear e método de conversão de coeficiente de predição linear
EP3696816B1 (en) * 2014-05-01 2021-05-12 Nippon Telegraph and Telephone Corporation Periodic-combined-envelope-sequence generation device, periodic-combined-envelope-sequence generation method, periodic-combined-envelope-sequence generation program and recording medium
WO2016024853A1 (ko) * 2014-08-15 2016-02-18 삼성전자 주식회사 음질 향상 방법 및 장치, 음성 복호화방법 및 장치와 이를 채용한 멀티미디어 기기
US9659564B2 (en) * 2014-10-24 2017-05-23 Sestek Ses Ve Iletisim Bilgisayar Teknolojileri Sanayi Ticaret Anonim Sirketi Speaker verification based on acoustic behavioral characteristics of the speaker
US9455732B2 (en) * 2014-12-19 2016-09-27 Stmicroelectronics S.R.L. Method and device for analog-to-digital conversion of signals, corresponding apparatus
WO2016142002A1 (en) 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
MX2017012957A (es) * 2015-04-10 2018-02-01 Thomson Licensing Metodo y dispositivo para codificar multiples señales de audio, y metodo y dispositivo para decodificar una mezcla de multiples señales de audio con separacion mejorada.
EP4134953A1 (en) * 2016-04-12 2023-02-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder for encoding an audio signal, method for encoding an audio signal and computer program under consideration of a detected peak spectral region in an upper frequency band
US11817115B2 (en) * 2016-05-11 2023-11-14 Cerence Operating Company Enhanced de-esser for in-car communication systems
DE102017204181A1 (de) 2017-03-14 2018-09-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Sender zum Emittieren von Signalen und Empfänger zum Empfangen von Signalen
EP3382701A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for post-processing an audio signal using prediction based shaping
EP3382700A1 (en) 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for post-processing an audio signal using a transient location detection
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
WO2019091573A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
CN111868682B (zh) * 2018-02-27 2024-05-28 泽腾系统有限公司 用于异构数据的可扩展变换处理单元
US10810455B2 (en) 2018-03-05 2020-10-20 Nvidia Corp. Spatio-temporal image metric for rendered animations
CN109243485B (zh) * 2018-09-13 2021-08-13 广州酷狗计算机科技有限公司 恢复高频信号的方法和装置
KR102603621B1 (ko) * 2019-01-08 2023-11-16 엘지전자 주식회사 신호 처리 장치 및 이를 구비하는 영상표시장치
CN113192523A (zh) * 2020-01-13 2021-07-30 华为技术有限公司 一种音频编解码方法和音频编解码设备
JP6872056B2 (ja) * 2020-04-09 2021-05-19 株式会社Nttドコモ 音声復号装置および音声復号方法
CN113190508B (zh) * 2021-04-26 2023-05-05 重庆市规划和自然资源信息中心 一种面向管理的自然语言识别方法

Family Cites Families (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2256293C2 (ru) * 1997-06-10 2005-07-10 Коудинг Технолоджиз Аб Усовершенствование исходного кодирования с использованием дублирования спектральной полосы
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
DE19747132C2 (de) 1997-10-24 2002-11-28 Fraunhofer Ges Forschung Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
SE0004187D0 (sv) * 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
US8782254B2 (en) * 2001-06-28 2014-07-15 Oracle America, Inc. Differentiated quality of service context assignment and propagation
CN100395817C (zh) * 2001-11-14 2008-06-18 松下电器产业株式会社 编码设备、解码设备和解码方法
WO2003046891A1 (en) * 2001-11-29 2003-06-05 Coding Technologies Ab Methods for improving high frequency reconstruction
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
US7555434B2 (en) * 2002-07-19 2009-06-30 Nec Corporation Audio decoding device, decoding method, and program
BRPI0306434B1 (pt) * 2002-09-19 2018-06-12 Nec Corporation Aparelho e método de decodificação de áudio
KR101106026B1 (ko) * 2003-10-30 2012-01-17 돌비 인터네셔널 에이비 오디오 신호 인코딩 또는 디코딩
US7668711B2 (en) * 2004-04-23 2010-02-23 Panasonic Corporation Coding equipment
TWI498882B (zh) * 2004-08-25 2015-09-01 Dolby Lab Licensing Corp 音訊解碼器
US7720230B2 (en) 2004-10-20 2010-05-18 Agere Systems, Inc. Individual channel shaping for BCC schemes and the like
US7045799B1 (en) 2004-11-19 2006-05-16 Varian Semiconductor Equipment Associates, Inc. Weakening focusing effect of acceleration-deceleration column of ion implanter
KR100956877B1 (ko) * 2005-04-01 2010-05-11 콸콤 인코포레이티드 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 방법 및장치
WO2006108543A1 (en) 2005-04-15 2006-10-19 Coding Technologies Ab Temporal envelope shaping of decorrelated signal
PT1875463T (pt) * 2005-04-22 2019-01-24 Qualcomm Inc Sistemas, métodos e aparelho para nivelamento de fator de ganho
JP4339820B2 (ja) * 2005-05-30 2009-10-07 太陽誘電株式会社 光情報記録装置および方法および信号処理回路
US20070006716A1 (en) * 2005-07-07 2007-01-11 Ryan Salmond On-board electric guitar tuner
DE102005032724B4 (de) * 2005-07-13 2009-10-08 Siemens Ag Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen
US8284961B2 (en) 2005-07-15 2012-10-09 Panasonic Corporation Signal processing device
US7953605B2 (en) * 2005-10-07 2011-05-31 Deepen Sinha Method and apparatus for audio encoding and decoding using wideband psychoacoustic modeling and bandwidth extension
JP5457171B2 (ja) * 2006-03-20 2014-04-02 オランジュ オーディオデコーダ内で信号を後処理する方法
KR100791846B1 (ko) * 2006-06-21 2008-01-07 주식회사 대우일렉트로닉스 오디오 복호기
US9454974B2 (en) * 2006-07-31 2016-09-27 Qualcomm Incorporated Systems, methods, and apparatus for gain factor limiting
CN101140759B (zh) * 2006-09-08 2010-05-12 华为技术有限公司 语音或音频信号的带宽扩展方法及系统
DE102006049154B4 (de) * 2006-10-18 2009-07-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kodierung eines Informationssignals
JP4918841B2 (ja) * 2006-10-23 2012-04-18 富士通株式会社 符号化システム
ES2403410T3 (es) * 2007-08-27 2013-05-17 Telefonaktiebolaget L M Ericsson (Publ) Frecuencia de transición adaptativa entre el rellenado con ruido y la extensión del ancho de banda
WO2009059632A1 (en) * 2007-11-06 2009-05-14 Nokia Corporation An encoder
KR101413967B1 (ko) 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치
KR101413968B1 (ko) 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
US20090201983A1 (en) * 2008-02-07 2009-08-13 Motorola, Inc. Method and apparatus for estimating high-band energy in a bandwidth extension system
KR101475724B1 (ko) * 2008-06-09 2014-12-30 삼성전자주식회사 오디오 신호 품질 향상 장치 및 방법
KR20100007018A (ko) * 2008-07-11 2010-01-22 에스앤티대우(주) 피스톤밸브 어셈블리 및 이를 포함하는 연속 감쇠력 가변형댐퍼
US8532998B2 (en) * 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Selective bandwidth extension for encoding/decoding audio/speech signal
US8352279B2 (en) * 2008-09-06 2013-01-08 Huawei Technologies Co., Ltd. Efficient temporal envelope coding approach by prediction between low band signal and high band signal
US8463599B2 (en) * 2009-02-04 2013-06-11 Motorola Mobility Llc Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder
JP4932917B2 (ja) 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
US9047875B2 (en) * 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension

Also Published As

Publication number Publication date
TW201243831A (en) 2012-11-01
CN102779522B (zh) 2015-06-03
TWI379288B (zh) 2012-12-11
RU2012130461A (ru) 2014-02-10
KR101702415B1 (ko) 2017-02-03
KR20120082475A (ko) 2012-07-23
CN102379004B (zh) 2012-12-12
WO2010114123A1 (ja) 2010-10-07
KR20120079182A (ko) 2012-07-11
ES2587853T3 (es) 2016-10-27
CA2757440A1 (en) 2010-10-07
PH12012501119A1 (en) 2015-05-18
MX2011010349A (es) 2011-11-29
ES2428316T3 (es) 2013-11-07
PT2509072T (pt) 2016-12-13
PH12012501117A1 (en) 2015-05-11
PH12012501116B1 (en) 2015-08-03
TW201243833A (en) 2012-11-01
HRP20130841T1 (hr) 2013-10-25
ES2453165T9 (es) 2014-05-06
CA2844635C (en) 2016-03-29
CN102737640B (zh) 2014-08-27
JP2011034046A (ja) 2011-02-17
US20140163972A1 (en) 2014-06-12
PT2503548E (pt) 2013-09-20
CA2844441C (en) 2016-03-15
PH12012501117B1 (en) 2015-05-11
EP2416316A1 (en) 2012-02-08
CN102779521A (zh) 2012-11-14
TWI384461B (zh) 2013-02-01
CA2757440C (en) 2016-07-05
TW201243830A (en) 2012-11-01
CA2844635A1 (en) 2010-10-07
EP2503547A1 (en) 2012-09-26
CN102379004A (zh) 2012-03-14
RU2498420C1 (ru) 2013-11-10
EP2503547B1 (en) 2016-05-11
AU2010232219B8 (en) 2012-12-06
AU2010232219A1 (en) 2011-11-03
PH12012501118B1 (en) 2015-05-11
PH12012501119B1 (en) 2015-05-18
US9779744B2 (en) 2017-10-03
ES2610363T3 (es) 2017-04-27
SI2503548T1 (sl) 2013-10-30
AU2010232219B2 (en) 2012-11-22
TWI478150B (zh) 2015-03-21
CN102779520B (zh) 2015-01-28
KR101702412B1 (ko) 2017-02-03
US20130138432A1 (en) 2013-05-30
US9460734B2 (en) 2016-10-04
CA2844438A1 (en) 2010-10-07
CA2844438C (en) 2016-03-15
CN102779520A (zh) 2012-11-14
KR20120082476A (ko) 2012-07-23
EP2509072A1 (en) 2012-10-10
TW201246194A (en) 2012-11-16
US20120010879A1 (en) 2012-01-12
EP2416316B1 (en) 2014-01-08
US20160358615A1 (en) 2016-12-08
RU2012130466A (ru) 2014-01-27
EP2503546A1 (en) 2012-09-26
PL2503546T3 (pl) 2016-11-30
CN102779523B (zh) 2015-04-01
EP2503546B1 (en) 2016-05-11
EP2416316A4 (en) 2012-09-12
CY1114412T1 (el) 2016-08-31
PL2503546T4 (pl) 2017-01-31
RU2011144573A (ru) 2013-05-10
KR101172325B1 (ko) 2012-08-14
JP4932917B2 (ja) 2012-05-16
KR20160137668A (ko) 2016-11-30
TWI479479B (zh) 2015-04-01
KR101172326B1 (ko) 2012-08-14
TWI476763B (zh) 2015-03-11
RU2498421C2 (ru) 2013-11-10
SG10201401582VA (en) 2014-08-28
SG174975A1 (en) 2011-11-28
RU2012130472A (ru) 2013-09-10
RU2012130470A (ru) 2014-01-27
KR101530295B1 (ko) 2015-06-19
US8655649B2 (en) 2014-02-18
DK2503548T3 (da) 2013-09-30
KR20120080257A (ko) 2012-07-16
PT2416316E (pt) 2014-02-24
DK2509072T3 (en) 2016-12-12
RU2498422C1 (ru) 2013-11-10
CN102779523A (zh) 2012-11-14
CN102737640A (zh) 2012-10-17
EP2509072B1 (en) 2016-10-19
RU2595914C2 (ru) 2016-08-27
BRPI1015049B1 (pt) 2020-12-08
PL2503548T3 (pl) 2013-11-29
RU2595915C2 (ru) 2016-08-27
CN102779521B (zh) 2015-01-28
KR20120080258A (ko) 2012-07-16
KR101530296B1 (ko) 2015-06-19
CA2844441A1 (en) 2010-10-07
KR101530294B1 (ko) 2015-06-19
ES2453165T3 (es) 2014-04-04
KR20110134442A (ko) 2011-12-14
EP2503548A1 (en) 2012-09-26
TWI479480B (zh) 2015-04-01
ES2586766T3 (es) 2016-10-18
RU2595951C2 (ru) 2016-08-27
RU2012130462A (ru) 2013-09-10
EP2503548B1 (en) 2013-06-19
TW201243832A (en) 2012-11-01
US20160365098A1 (en) 2016-12-15
PH12012501116A1 (en) 2015-08-03
PH12012501118A1 (en) 2015-05-11
US10366696B2 (en) 2019-07-30
US9064500B2 (en) 2015-06-23
CN102779522A (zh) 2012-11-14

Similar Documents

Publication Publication Date Title
TW201126515A (en) Speech encoding device, speech decoding device, speech encoding method, speech decoding method, speech encoding program, and speech decoding program
JP5588547B2 (ja) 音声復号装置、音声復号方法、及び音声復号プログラム
AU2012204068B2 (en) Speech encoding device, speech decoding device, speech encoding method, speech decoding method, speech encoding program, and speech decoding program
BR122012021668A2 (pt) Dispositivo de codificação de voz, dispositivo de decodificação de voz, método de codificação de voz, método de decodificação de voz, programa de codificação de voz e programa de decodificação de voz