JP2016532138A - 高帯域励起信号を予測するための方法および装置 - Google Patents

高帯域励起信号を予測するための方法および装置 Download PDF

Info

Publication number
JP2016532138A
JP2016532138A JP2016517389A JP2016517389A JP2016532138A JP 2016532138 A JP2016532138 A JP 2016532138A JP 2016517389 A JP2016517389 A JP 2016517389A JP 2016517389 A JP2016517389 A JP 2016517389A JP 2016532138 A JP2016532138 A JP 2016532138A
Authority
JP
Japan
Prior art keywords
frequency
signal
low
band
spectral
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016517389A
Other languages
English (en)
Other versions
JP6420324B2 (ja
Inventor
▲澤▼新 ▲劉▼
▲澤▼新 ▲劉▼
磊 苗
磊 苗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of JP2016532138A publication Critical patent/JP2016532138A/ja
Application granted granted Critical
Publication of JP6420324B2 publication Critical patent/JP6420324B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0016Codebook for LPC parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Digital Transmission Methods That Use Modulated Carrier Waves (AREA)
  • Measuring Frequencies, Analyzing Spectra (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Position Fixing By Use Of Radio Waves (AREA)

Abstract

高周波励起信号を予測するための方法および装置が開示される。方法は、受信された低周波ビットストリームに基づいて、周波数の順に配列されたスペクトル周波数パラメータのセットを取得するステップであって、スペクトル周波数パラメータは、低周波LSFパラメータまたは低周波ISFパラメータを含む、ステップと、スペクトル周波数パラメータのセットに対して、スペクトル周波数パラメータの一部またはすべてにおいて同一位置間隔を有するすべての2つのスペクトル周波数パラメータ間のスペクトル周波数パラメータ差(102)を計算するステップと、計算されたスペクトル周波数パラメータ差から最小スペクトル周波数パラメータ差(103)を取得するステップと、最小スペクトル周波数パラメータ差に対応する周波数ビンに基づいて、低周波から高周波励起信号を予測するための開始周波数ビン(104)を決定するステップと、開始周波数ビンに基づいて、低周波から高周波励起信号(105)を予測するステップとを含む。この実施形態を実施することによって、高周波励起信号はより確実に予測されることができ、それによって、高周波励起信号の性能を改善する。

Description

本発明は、2013年9月26日に中国特許庁に出願した、発明の名称を「METHOD AND APPARATUS FOR PREDICTING HIGH-FREQUENCY EXCITATION SIGNAL」とする中国特許出願第201310444734.4号の優先権を主張するものであり、その全体が参照により本明細書に組み込まれる。
本発明は、通信技術の分野に関し、かつ特に、高周波励起信号を予測するための方法および装置に関する。
音声サービスの品質上の要求は、現代の通信においてますます高くなり、第3世代パートナーシッププロジェクト(The 3rd Generation Partnership Project, 3GPP)は、適応マルチレート広帯域(Adaptive Multi-Rate Wideband, AMR-WB)音声コーデックを提案している。AMR-WB音声コーデックは、例えば高い音声再構成品質、低平均符号化レート、および良好な自己適応のような利点を有しており、かつ通信史において同時に無線および有線サービスで使用できるはじめての音声符号化システムである。実際の適用においては、AMR-WB音声コーデックのデコーダ側で、エンコーダによって送信された低周波ビットストリームを受信した後に、デコーダは低周波線形予測(Linear Predictive Coding, LPC)係数を得るために低周波ビットストリームを復号化し、かつ低周波LPC係数を使用することによって高周波または広帯域LPC係数を予測してもよい。さらに、デコーダは、高周波励起信号としてランダムノイズを使用し、かつ高周波または広帯域LPC係数および高周波励起信号を使用することによって高周波信号を合成してもよい。
しかしながら、実際では、高周波信号は、高周波励起信号として使用されるランダムノイズと、高周波または広帯域LPC係数とを使用することによって合成されてもよいが、ランダムノイズは元の高周波励起信号とはしばしば大きく異なることから、高周波励起信号の性能は比較的不十分であり、最終的には合成される高周波信号の性能に影響を与えることが発見されている。
本発明の実施形態は、高周波励起信号をより確実に予測することができる高周波励起信号を予測するための方法および装置を開示し、それによって高周波励起信号の性能を改善する。
本発明の実施形態の第1態様は、高周波励起信号を予測するための方法を開示しており、
受信された低周波ビットストリームに基づいて、周波数の順に配列されたスペクトル周波数パラメータのセットを取得するステップであって、スペクトル周波数パラメータは、低周波線スペクトル周波数(Line Spectrum Frequency, LSF)パラメータまたは低周波イミタンススペクトル周波数(Immittance Spectral Frequencies, ISF)パラメータを含む、ステップと、
スペクトル周波数パラメータのセットに対して、スペクトル周波数パラメータの一部またはすべてにおいて同一位置間隔を有するすべての2つのスペクトル周波数パラメータ間のスペクトル周波数パラメータ差を計算するステップと、
計算されたスペクトル周波数パラメータ差から、最小スペクトル周波数パラメータ差を取得するステップと、
最小スペクトル周波数パラメータ差に対応する周波数ビンに基づいて、低周波から高周波励起信号を予測するための開始周波数ビンを決定するステップと、
開始周波数ビンに基づいて、低周波から高周波励起信号を予測するステップと
含む。
本発明の実施形態の第1態様の第1の可能な実施方式において、受信された低周波ビットストリームに基づいて、周波数の順に配列されたスペクトル周波数パラメータのセットを取得するステップは、
周波数の順に配列されたスペクトル周波数パラメータのセットを得るために、受信された低周波ビットストリームに基づいて復号化を実行するステップ、または
低周波信号を得るために、受信された低周波ビットストリームに基づいて復号化を実行するステップ、および、低周波信号に基づいて、周波数の順に配列されたスペクトル周波数パラメータのセットを計算するステップ
を含む。
本発明の実施形態の第1態様の第1の可能な実施方式を参照して、本発明の実施形態の第1態様の第2の可能な実施方式において、もし周波数の順に配列されたスペクトル周波数パラメータのセットが、受信された低周波ビットストリームに基づく復号化によって得られる場合、方法は、
低周波励起信号を得るために、受信された低周波ビットストリームに基づいて復号化を実行するステップをさらに含み、かつ
開始周波数ビンに基づいて、低周波から高周波励起信号を予測するステップは、
低周波励起信号から、開始周波数ビンに基づいて高周波励起信号として予め設定された帯域幅を有する周波数帯域を選択するステップを含む。
本発明の実施形態の第1態様の第2の可能な実施方式を参照して、本発明の実施形態の第1態様の第3の可能な実施方式において、方法は、
復号化によって得られたスペクトル周波数パラメータを、低周波LPC係数に変換するステップと、
低周波LPC係数および低周波励起信号を使用して低周波信号を合成するステップと、
低周波LPC係数に基づいて、高周波または広帯域LPC係数を予測するステップと、
高周波励起信号および高周波または広帯域LPC係数を使用して高周波信号を合成するステップと、
広帯域信号を得るために、低周波信号を高周波信号と結合するステップと
をさらに含む。
本発明の実施形態の第1態様の第2の可能な実施方式を参照して、本発明の実施形態の第1態様の第4の可能な実施方式において、方法は、
復号化によって得られたスペクトル周波数パラメータを、低周波LPC係数に変換するステップと、
低周波LPC係数および低周波励起信号を使用して低周波信号を合成するステップと、
低周波信号に基づいて、高周波エンベロープを予測するステップと、
高周波励起信号および高周波エンベロープを使用して高周波信号を合成するステップと、
広帯域信号を得るために、低周波信号を高周波信号と結合するステップと
をさらに含む。
本発明の実施形態の第1態様の第1の可能な実施方式を参照して、本発明の実施形態の第1態様の第5の可能な実施方式において、もし低周波信号が、受信された低周波ビットストリームに基づく復号化によって得られ、かつ周波数の順に配列されたスペクトル周波数パラメータのセットが低周波信号に基づいて計算される場合、開始周波数ビンに基づいて、低周波から高周波励起信号を予測するステップは、
低周波励起信号を得るために、LPC分析フィルタを使用して低周波信号を処理するステップと、
低周波励起信号から、開始周波数ビンに基づいて高周波励起信号として予め設定された帯域幅を有する周波数帯域を選択するステップと
を含む。
本発明の実施形態の第1態様の第5の可能な実施方式を参照して、本発明の実施形態の第1態様の第6の可能な実施方式において、方法は、
計算されたスペクトル周波数パラメータを、低周波LPC係数に変換するステップと、
低周波LPC係数に基づいて、高周波または広帯域LPC係数を予測するステップと、
高周波励起信号および高周波または広帯域LPC係数を使用して高周波信号を合成するステップと、
広帯域信号を得るために、低周波信号を高周波信号と結合するステップと
をさらに含む。
本発明の実施形態の第1態様の第5の可能な実施方式を参照して、本発明の実施形態の第1態様の第7の可能な実施方式において、方法は、
低周波信号に基づいて、高周波エンベロープを予測するステップと、
高周波励起信号および高周波エンベロープを使用して高周波信号を合成するステップと、
広帯域信号を得るために、低周波信号を高周波信号と結合するステップと
をさらに含む。
本発明の実施形態の第1態様または本発明の実施形態の第1態様の第1から第7の可能な実施方式のいずれ1つを参照して、本発明の実施形態の第1態様の第8の可能な実施方式において、同一位置間隔を有するすべての2つのスペクトル周波数パラメータは、すべての2つの隣接スペクトル周波数パラメータ、または、スペクトル周波数パラメータの同一数量により離間されたすべての2つのスペクトル周波数パラメータを含む。
本発明の実施形態の第2態様は、高周波励起信号を予測するための装置を開示しており、装置は、
受信された低周波ビットストリームに基づいて、周波数の順に配列されたスペクトル周波数パラメータのセットを取得するように構成された第1取得ユニットであって、スペクトル周波数パラメータは、低周波線スペクトル周波数LSFパラメータまたは低周波イミタンススペクトル周波数ISFパラメータを含む、第1取得ユニットと、
第1取得ユニットによって取得されたスペクトル周波数パラメータのセットに対して、スペクトル周波数パラメータの一部またはすべてにおいて同一位置間隔を有するすべての2つのスペクトル周波数パラメータ間のスペクトル周波数パラメータ差を計算するように構成された計算ユニットと、
計算ユニットによって計算されたスペクトル周波数パラメータ差から、最小スペクトル周波数パラメータ差を取得するように構成された第2取得ユニットと、
第2取得ユニットによって取得された最小スペクトル周波数パラメータ差に対応する周波数ビンに基づいて、低周波から高周波励起信号を予測するための開始周波数ビンを決定するように構成された開始周波数ビン決定ユニットと、
開始周波数ビン決定ユニットによって決定された開始周波数ビンに基づいて、低周波から高周波励起信号を予測するように構成された高周波励起予測ユニットと
を備える。
本発明の実施形態の第2態様の第1の可能な実施方式において、第1取得ユニットは、周波数の順に配列されたスペクトル周波数パラメータのセットを得るために、受信された低周波ビットストリームに基づいて復号化を実行するように特に構成され、または、低周波信号を得るために、受信された低周波ビットストリームに基づいて復号化を実行し、かつ低周波信号に基づいて周波数の順に配列されたスペクトル周波数パラメータのセットを計算するように特に構成される。
本発明の実施形態の第2態様の第1の可能な実施方式を参照して、本発明の実施形態の第2態様の第2の可能な実施方式において、もし第1取得ユニットが、周波数の順に配列されたスペクトル周波数パラメータのセットを得るために、受信された低周波ビットストリームに基づいて復号化を実行するように特に構成される場合、装置は、
低周波励起信号を得るために、受信された低周波ビットストリームに基づいて復号化を実行するように構成される復号化ユニットをさらに備え、かつ
高周波励起予測ユニットは、復号化ユニットによる復号化によって得られた低周波励起信号から、開始周波数ビン決定ユニットによって決定された開始周波数ビンに基づいて高周波励起信号として予め設定された帯域幅を有する周波数帯域を選択するように特に構成される。
本発明の実施形態の第2態様の第2の可能な実施方式を参照して、本発明の実施形態の第2態様の第3の可能な実施方式において、装置は、
第1取得ユニットによる復号化によって得られたスペクトル周波数パラメータを、低周波線形予測LPC係数に変換するように構成された第1変換ユニットと、
第1変換ユニットによる変換によって得られた低周波LPC係数と、復号化ユニットによる復号化によって得られた低周波励起信号とを低周波信号に合成するように構成された第1低周波信号合成ユニットと、
第1変換ユニットによる変換によって得られた低周波LPC係数に基づいて、高周波または広帯域LPC係数を予測するように構成された第1LPC係数予測ユニットと、
高周波励起予測ユニットにより選択された高周波励起信号と、第1LPC係数予測ユニットにより予測された高周波または広帯域LPC係数とを使用して、高周波信号を合成するように構成された第1高周波信号合成ユニットと、
広帯域信号を得るために、第1低周波信号合成ユニットにより合成された低周波信号を、第1高周波信号合成ユニットにより合成された高周波信号と結合するように構成された第1広帯域信号合成ユニット
をさらに備える。
本発明の実施形態の第2態様の第2の可能な実施方式を参照して、本発明の実施形態の第2態様の第4の可能な実施方式において、装置は、
第1取得ユニットによる復号化によって得られたスペクトル周波数パラメータを、低周波線形予測LPC係数に変換するように構成された第2変換ユニットと、
第2変換ユニットによる変換によって得られた低周波LPC係数と、復号化ユニットによる復号化によって得られた低周波励起信号とを、低周波信号に合成するように構成された第2低周波信号合成ユニットと、
第2低周波信号合成ユニットにより合成された低周波信号に基づいて、高周波エンベロープを予測するように構成された第1高周波エンベロープ予測ユニットと、
高周波励起予測ユニットにより選択された高周波励起信号と、第1高周波エンベロープ予測ユニットにより予測された高周波エンベロープとを使用して、高周波信号を合成するように構成された第2高周波信号合成ユニットと、
広帯域信号を得るために、第2低周波信号合成ユニットにより合成された低周波信号を、第2高周波信号合成ユニットにより合成された高周波信号と結合するように構成された第2広帯域信号合成ユニットと
をさらに備える。
本発明の実施形態の第2態様の第1の可能な実施方式を参照して、本発明の実施形態の第2態様の第5の可能な実施方式において、もし第1取得ユニットが、低周波信号を得るために、受信された低周波ビットストリームに基づいて復号化を実行し、かつ、低周波信号に基づいて、周波数の順に配列されたスペクトル周波数パラメータのセットを計算するように特に構成される場合、高周波励起予測ユニットは、低周波励起信号を得るために、LPC分析フィルタを使用して低周波信号を処理し、かつ低周波励起信号から、開始周波数ビン決定ユニットによって決定された開始周波数ビンに基づいて高周波励起信号として予め設定された帯域幅を有する周波数帯域を選択するように特に構成される。
本発明の実施形態の第2態様の第5の可能な実施方式を参照して、本発明の実施形態の第2態様の第6の可能な実施方式において、装置は、
第1取得ユニットにより得られた計算されたスペクトル周波数パラメータを、低周波線形予測LPC係数に変換するように構成された第3変換ユニットと、
第3変換ユニットによる変換によって得られた低周波LPC係数に基づいて、高周波または広帯域LPC係数を予測するように構成された第2LPC係数予測ユニットと、
高周波励起予測ユニットにより選択された高周波励起信号と、第2LPC係数予測ユニットにより予測された高周波または広帯域LPC係数とを使用して、高周波信号を合成するように構成された第3高周波信号合成ユニットと、
広帯域信号を得るために、第1取得ユニットによる復号化によって得られた低周波信号を、第3高周波信号合成ユニットにより合成された高周波信号と結合するように構成された第3広帯域信号合成ユニットと
をさらに備える。
本発明の実施形態の第2態様の第5の可能な実施方式を参照して、本発明の実施形態の第2態様の第7の可能な実施方式において、装置は、
第1取得ユニットによる復号化によって得られた低周波信号に基づいて、高周波エンベロープを予測するように構成された第3高周波エンベロープ予測ユニットと、
高周波励起予測ユニットにより選択された高周波励起信号と、第3高周波エンベロープ予測ユニットにより予測された高周波エンベロープとを使用して、高周波信号を合成するように構成された第4高周波信号合成ユニットと、
広帯域信号を得るために、第1取得ユニットによる復号化によって得られた低周波信号を、第4高周波信号合成ユニットにより合成された高周波信号と結合するように構成された第4広帯域信号合成ユニットと
をさらに備える。
本発明の実施形態の第2態様または本発明の実施形態の第2態様の第1から第7の可能な実施方式のいずれか1つを参照して、本発明の実施形態の第2態様の第8の可能な実施方式において、同一位置間隔を有するすべての2つのスペクトル周波数パラメータは、すべての2つの隣接スペクトル周波数パラメータ、または、スペクトル周波数パラメータの同一数量により離間されたすべての2つのスペクトル周波数パラメータを含む。
本発明の実施形態において、周波数の順に配列されたスペクトル周波数パラメータのセットが、受信された低周波ビットストリームに基づいて取得された後、スペクトル周波数パラメータのこのセットにおいて同一位置間隔を有する任意の2つのスペクトル周波数パラメータ間のスペクトル周波数パラメータ差が計算されてもよく、かつさらに、最小スペクトル周波数パラメータ差が、計算されたスペクトル周波数パラメータ差から取得され、スペクトル周波数パラメータは、低周波線スペクトル周波数LSFパラメータまたは低周波イミタンススペクトル周波数ISFパラメータを含み、かつ従って、最小スペクトル周波数パラメータ差は、最小LSFパラメータ差または最小ISFパラメータ差である。信号エネルギーと、LSFパラメータ差またはISFパラメータ差に対応する周波数ビンとの間のマッピング関係に基づいて、より小さいLSFパラメータ差またはISFパラメータ差がより大きい信号エネルギーを示すことが学習されてもよく、かつ従って、低周波から高周波励起信号を予測するための開始周波数ビンは、最小スペクトル周波数パラメータ差に対応する周波数ビン(すなわち、最小LSFパラメータ差または最小ISFパラメータ差)に基づいて決定され、かつ高周波励起信号は、開始周波数ビンに基づいて低周波から予測され、それは比較的良好な符号化品質を有する高周波励起信号の予測を実施することができ、その結果、高周波励起信号はより確実に予測されることができ、それによって、高周波励起信号の性能を効果的に改善する。
本発明の実施形態における技術的解決策をより明確に説明するために、以下に、実施形態を説明するために必要な添付図面を簡潔に紹介する。当然ながら、以下の説明における添付図面は、本発明の実施形態の単なる一部を示しているに過ぎず、かつ当業者は、創造的努力なしに、これらの添付図面から他の図面をさらに導き出すことができる。
本発明の実施形態によって開示される高周波励起信号を予測するための方法の概略的なフローチャートである。 本発明の実施形態によって開示される高周波励起信号を予測するプロセスの概略図である。 本発明の実施形態によって開示される高周波励起信号を予測する別のプロセスの概略図である。 本発明の実施形態によって開示される高周波励起信号を予測する別のプロセスの概略図である。 本発明の実施形態によって開示される高周波励起信号を予測する別のプロセスの概略図である。 本発明の実施形態によって開示される高周波励起信号を予測するための装置の概略構造図である。 本発明の実施形態によって開示される高周波励起信号を予測するための別の装置の概略構造図である。 本発明の実施形態によって開示される高周波励起信号を予測するための別の装置の概略構造図である。 本発明の実施形態によって開示される高周波励起信号を予測するための別の装置の概略構造図である。 本発明の実施形態によって開示される高周波励起信号を予測するための別の装置の概略構造図である。 本発明の実施形態によって開示されるデコーダの概略構造図である。
本発明の実施形態の添付図面を参照して、本発明の実施形態における技術的解決策を以下に明確かつ十分に説明する。当然ながら、説明される実施形態は、本発明の実施形態のすべてではなく単なる一部に過ぎない。創造的努力なしに本発明の実施形態に基づいて当業者によって得られる他のすべての実施形態は、本発明の保護範囲内であるものとする。
本発明の実施形態は、高周波励起信号をより確実に予測することができる高周波励起信号を予測するための方法および装置を開示しており、それによって、高周波励起信号の性能を改善する。詳細な説明は別途以下になされる。
図1を参照すると、図1は、本発明の実施形態によって開示される高周波励起信号を予測するための方法の概略的なフローチャートである。図1に示されるように、高周波励起信号を予測するための方法は、以下のステップを含んでもよい。
101:受信された低周波ビットストリームに基づいて、周波数の順に配列されたスペクトル周波数パラメータのセットを取得し、スペクトル周波数パラメータは、低周波LSFパラメータまたは低周波ISFパラメータを含む。
本発明のこの実施形態において、スペクトル周波数パラメータは、低周波LSFパラメータまたは低周波ISFパラメータを含み、低周波LSFパラメータまたは低周波ISFパラメータのそれぞれは周波数にさらに対応し、かつ低周波ビットストリームでは、低周波LSFパラメータまたは低周波ISFパラメータに対応する周波数は、通常昇順に配列されるので、周波数の順に配列されたスペクトル周波数パラメータのセットは、スペクトル周波数パラメータに対応する周波数の順に配列されたスペクトル周波数パラメータのセットである。
本発明のこの実施形態において、周波数の順に配列されたスペクトル周波数パラメータのセットは、受信された低周波ビットストリームに基づいてデコーダによって取得されてもよい。デコーダは、AMR-WB音声コーデックにおけるデコーダであってもよく、または音声デコーダ、低周波ビットストリームデコーダ、若しくは別のタイプのそのようなものであってもよく、本発明のこの実施形態においては限定されない。本発明のこの実施形態におけるデコーダは、少なくとも1つのプロセッサを備えてもよく、かつデコーダは、少なくとも1つのプロセッサの制御の下で動いてもよい。
実施形態において、デコーダがエンコーダによって送信された低周波ビットストリームを受信した後、デコーダははじめに、線スペクトル対(Linear Spectral Pairs, LSP)パラメータを得るために、エンコーダによって送信された低周波ビットストリームを直接復号化し、かつ次いで、LSPパラメータを低周波LSFパラメータに変換してもよく、または、デコーダははじめに、イミタンススペクトル対(Immittance Spectral Pairs, ISP)パラメータを得るために、エンコーダによって送信された低周波ビットストリームを直接復号化し、かつ次いで、ISPパラメータを、低周波ISFパラメータに変換してもよい。
デコーダがLSPパラメータを低周波LSFパラメータに変換し、かつデコーダがISPパラメータを低周波ISFパラメータに変換する具体的な変換プロセスは、当業者にとって周知であり、かつ本発明のこの実施形態において、ここで詳細には説明されない。
本発明のこの実施形態において、スペクトル周波数パラメータはまた、例えばLSPパラメータまたはLSFパラメータのようなLPC係数の任意の周波数領域表示パラメータであってもよく、本発明のこの実施形態においては限定されない。
別の実施形態において、エンコーダによって送信された低周波ビットストリームを受信した後、デコーダは、低周波信号を得るために、受信された低周波ビットストリームに基づいて復号化を実行し、かつ低周波信号に基づいて周波数の順に配列されたスペクトル周波数パラメータのセットを計算してもよい。
具体的には、デコーダは、低周波信号に基づいて、LPC係数を計算し、かつ次いで、LPC係数をLSFパラメータまたはISFパラメータに変換してもよく、LPC係数がLSFパラメータまたはISFパラメータに変換される具体的な計算プロセスは、当業者にとって周知でもあり、かつ本発明のこの実施形態において、ここで詳細には説明されもしない。
102:取得されたスペクトル周波数パラメータのセットに対して、スペクトル周波数パラメータの一部またはすべてにおいて同一位置間隔を有するすべての2つのスペクトル周波数パラメータ間のスペクトル周波数パラメータ差を計算する。
本発明のこの実施形態において、デコーダは、取得されたスペクトル周波数パラメータのセットから、一部のスペクトル周波数パラメータを選択し、かつ選択されたスペクトル周波数パラメータにおいて同一位置間隔を有するすべての2つのスペクトル周波数パラメータ間のスペクトル周波数パラメータ差を計算してもよい。当然ながら、本発明のこの実施形態において、デコーダは、取得されたスペクトル周波数パラメータのセットからすべてのスペクトル周波数パラメータを選択し、かつすべての選択されたスペクトル周波数パラメータにおいて同一位置間隔を有するすべての2つのスペクトル周波数パラメータ間のスペクトル周波数パラメータ差を計算してもよい。すなわち、スペクトル周波数パラメータの一部またはすべてのいずれも、取得されたスペクトル周波数パラメータのセットにおけるスペクトル周波数パラメータである。
本発明のこの実施形態において、デコーダが周波数の順に配列されたスペクトル周波数パラメータのセット(すなわち、低周波LSFパラメータまたは低周波ISFパラメータ)を取得した後、デコーダは、この取得されたスペクトル周波数パラメータのセットに対して、周波数パラメータのこのセット(の一部またはすべて)において、同一位置間隔を有するすべての2つのスペクトル周波数パラメータ間のスペクトル周波数パラメータ差を計算してもよい。
実施形態において、同一位置間隔を有するすべての2つのスペクトル周波数パラメータは、その位置が隣接するすべての2つのスペクトル周波数パラメータを含み、例えば、周波数の昇順に配列された低周波LSFパラメータのセットにおいて位置が隣接する(すなわち、位置間隔が0のLSFパラメータ)すべての2つの低周波LSFパラメータであってもよく、または、周波数の昇順に配列された低周波ISFパラメータのセットにおいて位置が隣接する(すなわち、位置間隔が0のISFパラメータ)すべての2つの低周波ISFパラメータであってもよい。
別の実施形態において、同一位置間隔を有するすべての2つのスペクトル周波数パラメータは、位置がスペクトル周波数パラメータの同一数量(例えば1つまたは2つのような)により離間されたすべての2つのスペクトル周波数パラメータを含み、例えば、周波数の昇順に配列された低周波LSFパラメータのセットにおけるLSF[1]およびLSF[3]、LSF[2]およびLSF[4]、またはLSF[3]およびLSF[5]等であってもよく、LSF[1]およびLSF[3]、LSF[2]およびLSF[4]、並びにLSF[3]およびLSF[5]の位置間隔は、すべて1つのLSFパラメータ、すなわち、LSF[2]、LSF[3]、およびLSF[4]である。
103:計算されたスペクトル周波数パラメータ差から、最小スペクトル周波数パラメータ差を取得する。
本発明のこの実施形態において、スペクトル周波数パラメータ差を計算した後、デコーダは、計算されたスペクトル周波数パラメータ差から、最小スペクトル周波数パラメータ差を取得してもよい。
104:最小スペクトル周波数パラメータ差に対応する周波数ビンに基づいて、低周波から高周波励起信号を予測するための開始周波数ビンを決定する。
本発明のこの実施形態において、最小スペクトル周波数パラメータ差は2つの周波数ビンに対応するので、デコーダは、2つの周波数ビンに基づいて低周波から高周波励起信号を予測するための開始周波数ビンを決定してもよい。例えば、デコーダは、低周波から高周波励起信号を予測するための開始周波数ビンとして、2つの周波数ビンの中で小さい方の周波数ビンを使用してもよく、または、デコーダは、低周波から高周波励起信号を予測するための開始周波数ビンとして、2つの周波数ビンの中で大きい方の周波数ビンを使用してもよく、または、デコーダは、低周波から高周波励起信号を予測するための開始周波数ビンとして、2つの周波数ビン間に位置する周波数ビンを使用してもよく、すなわち、選択された開始周波数ビンは、2つの周波数ビンの中で小さい方の周波数ビンよりも大きくまたはこれに等しく、かつ、2つの周波数ビンの中で大きい方の周波数ビンよりも小さくまたはこれに等しく、かつ開始周波数ビンの具体的な選択は、本発明のこの実施形態においては限定されない。
例えば、もしLSF[2]およびLSF[4]間の差が最小LSF差である場合、デコーダは、低周波から高周波励起信号を予測するための開始周波数ビンとして、LSF[2]に対応する最小周波数ビンを使用してもよく、または、デコーダは、低周波から高周波励起信号を予測するための開始周波数ビンとして、LSF[4]に対応する最大周波数ビンを使用してもよく、または、デコーダは、低周波から高周波励起信号を予測するための開始周波数ビンとして、LSF[2]に対応する最小周波数ビンと、LSF[4]に対応する最大周波数ビンとの間の周波数ビン範囲内の周波数ビンを使用してもよく、本発明のこの実施形態においては限定されない。
105:開始周波数ビンに基づいて、低周波から高周波励起信号を予測する。
本発明のこの実施形態において、低周波から高周波励起信号を予測するための開始周波数ビンを決定した後、デコーダは、低周波から高周波励起信号を予測してもよい。例えば、デコーダは、低周波ビットストリームに対応する低周波励起信号から、開始周波数ビンに基づいて高周波励起信号として予め設定された帯域幅を有する周波数帯域を選択する。
図1に説明される方法においては、受信された低周波ビットストリームに基づいて、周波数の順に配列されたスペクトル周波数パラメータのセットを取得した後、デコーダは、スペクトル周波数パラメータのこのセットにおいて、同一位置間隔を有するすべての2つのスペクトル周波数パラメータ間のスペクトル周波数パラメータ差を計算してもよく、かつ計算されたスペクトル周波数パラメータ差から最小スペクトル周波数パラメータ差をさらに取得し、スペクトル周波数パラメータは、低周波線スペクトル周波数LSFパラメータまたは低周波イミタンススペクトル周波数ISFパラメータを含み、かつ従って、最小スペクトル周波数パラメータ差は、最小LSFパラメータ差または最小ISFパラメータ差である。信号エネルギーと、LSFパラメータ差またはISFパラメータ差に対応する周波数ビンとの間のマッピング関係に基づいて、より小さいLSFパラメータ差またはISFパラメータ差がより大きい信号エネルギーを示すことが学習されてもよく、かつ従って、デコーダは、最小スペクトル周波数パラメータ差(すなわち、最小LSFパラメータ差または最小ISFパラメータ差)に対応する周波数ビンに基づいて、低周波から高周波励起信号を予測するための開始周波数ビンを決定し、かつ高周波励起信号の開始周波数ビンに基づいて低周波から高周波励起信号を予測し、それは良好な符号化品質を有する高周波励起信号の予測を実施することができ、その結果、高周波励起信号がより確実に予測されることができ、それによって、高周波励起信号の性能を効果的に改善する。
図2を参照すると、図2は、本発明の実施形態によって開示される高周波励起信号を予測するプロセスの概略図である。図2に示されるように、高周波励起信号を予測するプロセスは、以下である。
1.デコーダは、周波数の順に配列された低周波LSFパラメータのセットを得るために、受信された低周波ビットストリームに基づいて復号化を実行する。
2.デコーダは、取得された低周波LSFパラメータのセットに対して、低周波LSFパラメータのこのセット(の一部またはすべて)において、隣接する位置を有するすべての2つの低周波LSFパラメータ間の差LSF_DIFFを計算し、かつ、LSF_DIFF[i]=LSF[i+1]-LSF[i]であるものとし、ここでi≦Mであり、iはi番目のLSFを示し、かつMは低周波LSFパラメータの数量を示す。
3.デコーダは、計算された差LSF_DIFFから最小MIN_LSF_DIFFを取得する。
任意選択の実施方式として、デコーダは、低周波ビットストリームのレートに基づいて最小MIN_LSF_DIFFを検索する範囲、すなわちLSF_DIFFに対応する最も高い周波数の位置を決定してもよく、ここでより高いレートはより広い検索範囲を示し、かつより低いレートはより狭い検索範囲を示す。例えば、AMR-WBにおいて、レートが8.85kbpsよりも小さいまたはこれに等しいとき、iの最大値はM-8であり、または、レートが12.65kbpsよりも小さいまたはこれに等しいとき、iの最大値はM-6であり、または、レートが15.85kbpsよりも小さいまたはこれに等しいとき、iの最大値はM-4である。
任意選択の実施方式として、最小MIN_LSF_DIFFが検索されるとき、補正係数αはまず、LSF_DIFFを補正するために使用されてもよく、αは周波数の増加に伴って減少し、すなわち、
α*LSF_DIFF[i]≦MIN_LSF_DIFFであり、ここでi≦M、かつ0<α<1である。
4.デコーダは、最小MIN_LSF_DIFFに対応する周波数ビンに基づいて、低周波から高周波励起信号を予測するための開始周波数ビンを決定する。
5.デコーダは、低周波励起信号を得るために、受信された低周波ビットストリームに基づいて復号化を実行する。
6.デコーダは、低周波励起信号から、開始周波数ビンに基づいて高周波励起信号として予め設定された帯域幅を有する周波数帯域を選択する。
またさらに、図2に示された高周波励起信号を予測するプロセスは、さらに以下を含んでもよい。
7.デコーダは、復号化によって得られた低周波LSFパラメータを、低周波LPC係数に変換する。
8.デコーダは、低周波LPC係数および低周波励起信号を使用して、低周波信号を合成する。
9.デコーダは、低周波LPC係数に基づいて、高周波または広帯域LPC係数を予測する。
10.デコーダは、高周波励起信号および高周波または広帯域LPC係数を使用して高周波信号を合成する。
11.デコーダは、広帯域信号を得るために、低周波信号を高周波信号と結合する。
任意選択の実施方式として、低周波ビットストリームレートのレートが所定の閾値よりも大きいとき、復号化によって得られた低周波励起信号の中で、周波数帯域が高周波信号のものに隣接する信号が高周波励起信号として固定的に選択されてもよく、例えば、AMR-WBにおいて、レートが23.05kbpsよりも大きいまたはこれに等しいとき、4から6kHzの周波数帯域の信号が6から8kHzの高周波励起信号として固定的に選択されてもよい。
任意選択の実施方式として、図2に説明される方法において、LSFパラメータはまた、ISFパラメータによって置き換えられてもよく、本発明の実施形態に影響を与えない。
図2に説明されるプロセスにおいて、デコーダは、高周波励起信号の開始周波数ビンに基づいて低周波励起信号から高周波励起信号を予測し、それは良好な符号化品質を有する高周波励起信号の予測を実施することができ、その結果、高周波励起信号はより確実に予測されることができ、それによって、高周波励起信号の性能を効果的に改善する。さらに、デコーダが低周波信号を高周波信号と結合した後、広帯域信号の性能は、さらに改善されることができる。
図3を参照すると、図3は、本発明の実施形態によって開示される高周波励起信号を予測する別のプロセスの概略図である。図3に示されるように、高周波励起信号を予測するプロセスは以下である。
1.デコーダは、周波数の順に配列された低周波LSFパラメータのセットを得るために、受信された低周波ビットストリームに基づいて復号化を実行する。
2.デコーダは、取得された低周波LSFパラメータのセットに対して、低周波LSFパラメータのこのセット(の一部またはすべて)において、2つの低周波LSFパラメータの位置間隔を有するすべての2つの低周波LSFパラメータ間の差LSF_DIFFを計算し、かつ、LSF_DIFF[i]=LSF[i+2]-LSF[i]であるものとし、ここでi≦Mであり、iはi番目のLSFを示し、かつMは低周波LSFパラメータの数量を示す。
3.デコーダは、計算された差LSF_DIFFから最小MIN_LSF_DIFFを取得する。
任意選択の実施方式として、デコーダは、低周波ビットストリームのレートに基づいて最小MIN_LSF_DIFFを検索する範囲、すなわちLSF_DIFFに対応する最も高い周波数の位置を決定してもよく、ここでより高いレートはより広い検索範囲を示し、かつより低いレートはより狭い検索範囲を示す。例えば、AMR-WBにおいて、レートが8.85kbpsよりも小さいまたはこれに等しいとき、iの最大値はM-8であり、または、レートが12.65kbpsよりも小さいまたはこれに等しいとき、iの最大値はM-6であり、または、レートが15.85kbpsよりも小さいまたはこれに等しいとき、iの最大値はM-4である。
任意選択の実施方式として、最小MIN_LSF_DIFFが検索されるとき、補正係数αはMIN_LSF_DIFFを補正ために使用されてもよく、αは周波数の増加に伴って減少し、すなわち、
LSF_DIFF[i]≦α*MIN_LSF_DIFFであり、ここでi≦M、かつα>1である。
4.デコーダは、最小MIN_LSF_DIFFに対応する周波数ビンに基づいて、低周波から高周波励起信号を予測するための開始周波数ビンを決定する。
5.デコーダは、低周波励起信号を得るために、受信された低周波ビットストリームに基づいて復号化を実行する。
6.デコーダは、低周波励起信号から、開始周波数ビンに基づいて高周波励起信号として予め設定された帯域幅を有する周波数帯域を選択する。
またさらに、図3に示される高周波励起信号を予測するプロセスは、さらに以下を含んでもよい。
7.デコーダは、復号化によって得られた低周波LSFパラメータを、低周波LPC係数に変換する。
8.デコーダは、低周波LPC係数および低周波励起信号を使用して、低周波信号を合成する。
9.デコーダは、合成された低周波信号に基づいて、高周波エンベロープを予測する。
10.デコーダは、高周波励起信号および高周波エンベロープを使用して高周波信号を合成する。
11.デコーダは、広帯域信号を得るために、低周波信号を高周波信号と結合する。
任意選択の実施方式として、低周波ビットストリームレートのレートが所定の閾値よりも大きいとき、復号化によって得られた低周波励起信号の中で、周波数帯域が高周波信号のものに隣接する信号が高周波励起信号として固定的に選択されてもよく、例えば、AMR-WBにおいて、レートが23.05kbpsよりも大きいまたはこれに等しいとき、4から6kHzの周波数帯域の信号が6から8kHzの高周波励起信号として固定的に選択されてもよい。
任意選択の実施方式として、図3に説明される方法において、LSFパラメータはまた、ISFパラメータによって置き換えられてもよく、本発明の実施形態に影響を与えない。
図3に説明されるプロセスにおいて、デコーダは、高周波励起信号の開始周波数ビンに基づいて低周波励起信号から高周波励起信号を予測し、それは良好な符号化品質を有する高周波励起信号の予測を実施することができ、その結果、高周波励起信号はより確実に予測されることができ、それによって、高周波励起信号の性能を効果的に改善する。さらに、デコーダが低周波信号を高周波信号と結合した後、広帯域信号の性能はさらに改善されることができる。
図4を参照すると、図4は、本発明の実施形態によって開示される高周波励起信号を予測する別のプロセスの概略図である。図4に示されるように、高周波励起信号を予測するプロセスは以下である。
1.デコーダは、低周波信号を得るために、受信された低周波ビットストリームに基づいて復号化を実行する。
2.デコーダは、低周波信号に基づいて、周波数の順に配列された低周波LSFパラメータのセットを計算する。
3.デコーダは、計算された低周波LSFパラメータ計算のセットに対して、低周波LSFパラメータのこのセット(の一部またはすべて)において、隣接する位置を有するすべての2つの低周波LSFパラメータ間の差LSF_DIFFを計算し、かつ、LSF_DIFF[i]=LSF[i+1]-LSF[i]であるものとし、ここでi≦Mであり、iはi番目のLSFを示し、かつMは低周波LSFパラメータの数量を示す。
4.デコーダは、計算された差LSF_DIFFから最小MIN_LSF_DIFFを取得する。
任意選択の実施方式として、デコーダは、低周波ビットストリームのレートに基づいて最小MIN_LSF_DIFFを検索する範囲、すなわちLSF_DIFFに対応する最も高い周波数の位置を決定してもよく、ここでより高いレートはより広い検索範囲を示し、かつより低いレートはより狭い検索範囲を示す。例えば、AMR-WBにおいて、レートが8.85kbpsよりも小さいまたはこれに等しいとき、iの最大値はM-8であり、または、レートが12.65kbpsよりも小さいまたはこれに等しいとき、iの最大値はM-6であり、または、レートが15.85kbpsよりも小さいまたはこれに等しいとき、iの最大値はM-4である。
任意選択の実施方式として、最小MIN_LSF_DIFFが検索されるとき、補正係数αはLSF_DIFFを補正するために使用されてもよく、αは周波数の増加に伴って減少し、すなわち、
α*LSF_DIFF[i]≦MIN_LSF_DIFFであり、ここでi≦M、かつ0<α<1である。
5.デコーダは、最小MIN_LSF_DIFFに対応する周波数ビンに基づいて、低周波から高周波励起信号を予測するための開始周波数ビンを決定する。
6.デコーダは、低周波励起信号を得るために、LPC分析フィルタを使用して低周波信号を処理する。
7.デコーダは、低周波励起信号から、開始周波数ビンに基づいて高周波励起信号として予め設定された帯域幅を有する周波数帯域を選択する。
またさらに、図4に示される高周波励起信号を予測するプロセスは、以下をさらに含んでもよい。
8.デコーダは、計算された低周波LSFパラメータを、低周波LPC係数に変換する。
9.デコーダは、低周波LPC係数に基づいて、高周波または広帯域LPC係数を予測する。
10.デコーダは、高周波励起信号および高周波または広帯域LPC係数を使用して高周波信号を合成する。
11.デコーダは、広帯域信号を得るために、低周波信号を高周波信号と結合する。
任意選択の実施方式として、低周波ビットストリームレートのレートが所定の閾値よりも大きいとき、復号化によって得られた低周波信号の中で、周波数帯域が高周波信号のものに隣接する信号が高周波励起信号として固定的に選択されてもよく、例えば、AMR-WBにおいて、レートが23.05kbpsよりも大きいまたはこれに等しいとき、4から6kHzの周波数帯域の信号が6から8kHzの高周波励起信号として固定的に選択されてもよい。
任意選択の実施方式として、図4に説明される方法において、LSFパラメータはさらにISFパラメータによって置き換えられてもよく、本発明の実施形態に影響しない。
図4に説明されるプロセスにおいて、デコーダは、高周波励起信号の開始周波数ビンに基づいて低周波信号から高周波励起信号を予測し、それは良好な符号化品質を有する高周波励起信号の予測を実施することができ、その結果、高周波励起信号はより確実に予測されることができ、それによって、高周波励起信号の性能を効果的に改善する。さらに、デコーダが低周波信号を高周波信号と結合した後、広帯域信号の性能はさらに改善されることができる。
図5を参照すると、図5は、本発明の実施形態によって開示される高周波励起信号を予測する別のプロセスの概略図である。図5に示されるように、高周波励起信号を予測するプロセスは以下を含む。
1.デコーダは、低周波信号を得るために、受信された低周波ビットストリームに基づいて復号化を実行する。
2.デコーダは、低周波信号に基づいて、周波数の順に配列された低周波LSFパラメータのセットを計算する。
3.デコーダは、計算された低周波LSFパラメータのセットに対して、低周波LSFパラメータのこのセット(の一部またはすべて)において、2つの低周波LSFパラメータの位置間隔を有するすべての2つの低周波LSFパラメータ間の差LSF_DIFFを計算し、かつ、LSF_DIFF[i]=LSF[i+2]-LSF[i]であるものとし、ここでi≦Mであり、iはi番目の差を示し、かつMは低周波LSFパラメータの数量を示す。
4.デコーダは、計算された差LSF_DIFFから最小MIN_LSF_DIFFを取得する。
任意選択の実施方式として、デコーダは、低周波ビットストリームのレートに基づいて最小MIN_LSF_DIFFを検索する範囲、すなわちLSF_DIFFに対応する最も高い周波数の位置を決定してもよく、ここでより高いレートはより広い検索範囲を示し、かつより低いレートはより狭い検索範囲を示す。例えば、AMR-WBにおいて、レートが8.85kbpsよりも小さいまたはこれに等しいとき、iの最大値はM-8であり、または、レートが12.65kbpsよりも小さいまたはこれに等しいとき、iの最大値はM-6であり、または、レートが15.85kbpsよりも小さいまたはこれに等しいとき、iの最大値はM-4である。
任意選択の実施方式として、最小MIN_LSF_DIFFが検索されるとき、補正係数αはMIN_LSF_DIFFを補正するために使用されてもよく、αは周波数の増加に伴って減少し、すなわち、
LSF_DIFF[i]≦α*MIN_LSF_DIFFであり、ここでi≦M、かつα>1である。
5:デコーダは、最小MIN_LSF_DIFFに対応する周波数ビンに基づいて、低周波から高周波励起信号を予測するための開始周波数ビンを決定する。
6.デコーダは、低周波励起信号を得るために、LPC分析フィルタを使用して低周波信号を処理する。
7.デコーダは、低周波励起信号から、開始周波数ビンに基づいて高周波励起信号として予め設定された帯域幅を有する周波数帯域を選択する。
またさらに、図5に示される高周波励起信号を予測するプロセスは以下を含んでもよい。
8.デコーダは、低周波信号に基づいて、高周波エンベロープを予測する。
実施形態において、デコーダは、低周波LPC係数および低周波励起信号に基づいて、高周波エンベロープを予測してもよい。
9.デコーダは、高周波励起信号および高周波エンベロープを使用して高周波信号を合成する。
10.デコーダは、広帯域信号を得るために、低周波信号を高周波信号と結合する。
任意選択の実施方式として、低周波ビットストリームレートのレートが所定の閾値よりも大きいとき、復号化によって得られた低周波信号の中で、周波数帯域が高周波信号のものに隣接する信号が高周波励起信号として固定的に選択されてもよく、例えば、AMR-WBにおいて、レートが23.05kbpsよりも大きいまたはこれに等しいとき、4から6kHzの周波数帯域の信号が6から8kHzの高周波励起信号として固定的に選択されてもよい。
任意選択の実施方式として、図5に説明される方法において、LSFパラメータはさらにISFパラメータによって置き換えられてもよく、本発明の実施形態に影響を与えない。
図5に説明されるプロセスにおいて、デコーダは、高周波励起信号の開始周波数ビンに基づいて低周波信号から高周波励起信号を予測し、それは良好な符号化品質を有する高周波励起信号の予測を実施することができ、その結果、高周波励起信号はより確実に予測されることができ、それによって、高周波励起信号の性能を効果的に改善する。さらに、デコーダが低周波信号を高周波信号と結合した後、広帯域信号の性能はさらに改善されることができる。
図6を参照すると、図7は、本発明の実施形態によって開示される高周波励起信号を予測するための装置の概略構造図である。図6に示される高周波励起信号を予測するための装置は、物理的に独立したデバイスとして実施されてもよく、またはデコーダの新たに追加される部分として使用されてもよく、本発明のこの実施形態においては限定されない。図6に示されるように、高周波励起信号を予測するための装置は、
受信された低周波ビットストリームに基づいて、周波数の順に配列されたスペクトル周波数パラメータのセットを取得するように構成された第1取得ユニット601であって、スペクトル周波数パラメータは、低周波LSFパラメータまたは低周波ISFパラメータを含む、第1取得ユニット601と、
第1取得ユニット601によって取得されたスペクトル周波数パラメータのセットに対して、スペクトル周波数パラメータの一部またはすべてにおいて同一位置間隔を有するすべての2つのスペクトル周波数パラメータ間のスペクトル周波数パラメータ差を計算するように構成された計算ユニット602と、
計算ユニット602によって計算されたスペクトル周波数パラメータ差から最小スペクトル周波数パラメータ差を取得するように構成された第2取得ユニット603と、
第2取得ユニット603によって取得された最小スペクトル周波数パラメータ差に対応する周波数ビンに基づいて、低周波から高周波励起信号を予測するための開始周波数ビンを決定するように構成された開始周波数ビン決定ユニット604と、
開始周波数ビン決定ユニット604によって決定された開始周波数ビンに基づいて、低周波から高周波励起信号を予測するように構成された高周波励起予測ユニット605と
を備えてもよい。
任意選択の実施方式として、第1取得ユニット601は、周波数の順に配列されたスペクトル周波数パラメータのセットを得るために、受信された低周波ビットストリームに基づいて復号化を実行するように特に構成されてもよく、または、低周波信号を得るために、受信された低周波ビットストリームに基づいて復号化を実行し、かつ低周波信号に基づいて周波数の順に配列されたスペクトル周波数パラメータのセットを計算するように特に構成される。
実施形態において、同一位置間隔を有するすべての2つのスペクトル周波数パラメータは、すべての2つの隣接スペクトル周波数パラメータ、または、スペクトル周波数パラメータの同一数量により離間されたすべての2つのスペクトル周波数パラメータを含む。
図6に説明される高周波励起信号を予測するための装置は、高周波励起信号の開始周波数ビンに基づいて低周波励起信号から高周波励起信号を予測してもよく、それは良好な符号化品質を有する高周波励起信号の予測を実施することができ、その結果、高周波励起信号はより確実に予測されることができ、それによって高周波励起信号の性能を効果的に改善する。
さらに、図7を参照すると、図7は、本発明の実施形態によって開示される高周波励起信号を予測するための別の装置の概略構造図である。図7に示された高周波励起信号を予測するための装置は、図6に示される高周波励起信号を予測するための装置を最適化することによって得られる。図7に示された高周波励起信号を予測するための装置において、もし第1取得ユニット601が、周波数の順に配列されたスペクトル周波数パラメータのセットを得るために、受信された低周波ビットストリームに基づいて復号化を実行するように特に構成される場合、図6に示される高周波励起信号を予測するための装置のすべてのユニットに加えて、図7に示された高周波励起信号を予測するための装置は、
低周波励起信号を得るために、受信された低周波ビットストリームを復号化するように構成された復号化ユニット606をさらに備えてもよく、かつ
それに対応して、高周波励起予測ユニット605は、復号化ユニット606による復号化によって得られた低周波励起信号から、開始周波数ビン決定ユニット604によって決定された開始周波数ビンに基づいて高周波励起信号として予め設定された帯域幅を有する周波数帯域を選択するように特に構成される。
任意選択の実施方式として、図7に示された高周波励起信号を予測するための装置は、
第1取得ユニット601による復号化によって得られたスペクトル周波数パラメータを、低周波LPC係数に変換するように構成された第1変換ユニット607と、
第1変換ユニット607による変換によって得られた低周波LPC係数と、復号化ユニット606による復号化によって得られた低周波励起信号とを使用して、低周波信号を合成するように構成された第1低周波信号合成ユニット608と、
第1変換ユニット607による変換によって得られた低周波LPC係数に基づいて、高周波または広帯域LPC係数を予測するように構成された第1LPC係数予測ユニット609と、
高周波励起予測ユニット605により選択された高周波励起信号と、第1LPC係数予測ユニット608により予測された高周波または広帯域LPC係数とを使用して、高周波信号を合成するように構成された第1高周波信号合成ユニット610と、
広帯域信号を得るために、第1低周波信号合成ユニット607により合成された低周波信号を、第1高周波信号合成ユニット609により合成された高周波信号と結合するように構成された第1広帯域信号合成ユニット611と
をさらに備えてもよい。
さらに図8を参照すると、図8は、本発明の実施形態によって開示される高周波励起信号を予測するための別の装置の概略構造図である。図8に示される高周波励起信号を予測するための装置は、図6に示される高周波励起信号を予測するための装置を最適化することによって得られる。図8に示される高周波励起信号を予測するための装置において、もし第1取得ユニット601が、周波数の順に配列されたスペクトル周波数パラメータのセットを得るために、受信された低周波ビットストリームに基づいて復号化を実行するように特に構成される場合、図6に示される高周波励起信号を予測するための装置のすべてのユニットに加えて、図8に示される高周波励起信号を予測するための装置はまた、低周波励起信号を得るために、受信された低周波ビットストリームを復号化するように構成された復号化ユニット606をさらに備え、かつそれに対応して、高周波励起予測ユニット605は、復号化ユニット606による復号化によって得られた低周波励起信号から、開始周波数ビン決定ユニット604によって決定された開始周波数ビンに基づいて高周波励起信号として予め設定された帯域幅を有する周波数帯域を選択するようにさらに構成される。
任意選択の実施方式として、図8に示される高周波励起信号を予測するための装置は、
第1取得ユニット601による復号化によって得られたスペクトル周波数パラメータを、低周波LPC係数に変換するように構成された第2変換ユニット612と、
第2変換ユニット612による変換によって得られた低周波LPC係数と、復号化ユニット606による復号化によって得られた低周波励起信号とを低周波信号に合成するように構成された第2低周波信号合成ユニット613と、
第2低周波信号合成ユニット612により合成された低周波信号に基づいて、高周波エンベロープを予測するように構成された第1高周波エンベロープ予測ユニット614と、
高周波励起予測ユニット605により選択された高周波励起信号と、第1高周波エンベロープ予測ユニット614により予測された高周波エンベロープとを使用して、高周波信号を合成するように構成された第2高周波信号合成ユニット615と、
広帯域信号を得るために、第2低周波信号合成ユニット612により合成された低周波信号を、第2高周波信号合成ユニット614により合成された高周波信号と結合するように構成された第2広帯域信号合成ユニット616と
をさらに備えてもよい。
図9を参照すると、図9は、本発明の実施形態によって開示される高周波励起信号を予測するための別の装置の概略構造図である。図9に示される高周波励起信号を予測するための装置は、図6に示される高周波励起信号を予測するための装置を最適化することによって得られる。図9に示される高周波励起信号を予測するための装置において、もし第1取得ユニット601が、低周波信号を得るために、受信された低周波ビットストリームに基づいて復号化を実行し、かつ、低周波信号に基づいて、周波数の順に配列されたスペクトル周波数パラメータのセットを計算するように特に構成される場合、高周波励起予測ユニット605は、低周波励起信号を得るために、LPC分析フィルタ(高周波励起予測ユニット605に含まれてもよい)を使用して低周波信号を処理し、かつ、低周波励起信号から、開始周波数ビン決定ユニット604によって決定された開始周波数ビンに基づいて高周波励起信号として予め設定された帯域幅を有する周波数帯域を選択するように特に構成される。
任意選択の実施方式として、図9に示される高周波励起信号を予測するための装置は、
第1取得ユニット601により得られた計算されたスペクトル周波数パラメータを、低周波LPC係数に変換するように構成された第3変換ユニット617と、
第3変換ユニット617による変換によって得られた低周波LPC係数に基づいて、高周波または広帯域LPC係数を予測するように構成された第2LPC係数予測ユニット618と、
高周波励起予測ユニット605により選択された高周波励起信号と、第2LPC係数予測ユニット618により予測された高周波または広帯域LPC係数とを使用して、高周波信号を合成するように構成された第3高周波信号合成ユニット619と、
広帯域信号を得るために、第1取得ユニット601による復号化によって得られた低周波信号を、第3高周波信号合成ユニット619により合成された高周波信号と結合するように構成された第3広帯域信号合成ユニット620と
をさらに備えてもよい。
さらに図10を参照すると、図10は、本発明の実施形態によって開示される高周波励起信号を予測するための別の装置の概略構造図である。図10に示される高周波励起信号を予測するための装置は、図6に示される高周波励起信号を予測するための装置を最適化することによって得られる。図10に示される高周波励起信号を予測するための装置において、第1取得ユニット601は、低周波信号を得るために、受信された低周波ビットストリームに基づいて復号化を実行し、かつ、低周波信号に基づいて、周波数の順に配列されたスペクトル周波数パラメータのセットを計算するようにさらに構成され、かつ、高周波励起予測ユニット605は、低周波励起信号を得るために、LPC分析フィルタ(高周波励起予測ユニット605に含まれてもよい)を使用して低周波信号を処理し、かつ低周波励起信号から、開始周波数ビン決定ユニット604によって決定された開始周波数ビンに基づいて高周波励起信号として予め設定された帯域幅を有する周波数帯域を選択するようにさらに構成されてもよい。
任意選択の実施方式として、図10に示される高周波励起信号を予測するための装置は、
第1取得ユニット601による復号化によって得られた低周波信号に基づいて、高周波エンベロープを予測するように構成された第3高周波エンベロープ予測ユニット621と、
高周波励起予測ユニット605により選択された高周波励起信号と、第3高周波エンベロープ予測ユニット621により予測された高周波エンベロープとを使用して、高周波信号を合成するように構成された第4高周波信号合成ユニット622と、
広帯域信号を得るために、第1取得ユニット601による復号化によって得られた低周波信号を、第4高周波信号合成ユニット621により合成された高周波信号と結合するように構成された第4広帯域信号合成ユニット623と
をさらに備えてもよい。
図7から図10に説明される高周波励起信号を予測するための装置は、高周波励起信号の開始周波数ビンに基づいて低周波励起信号または低周波信号から高周波励起信号を予測してもよく、それは良好な符号化品質を有する高周波励起信号の予測を実施することができ、その結果、高周波励起信号はより確実に予測されることができ、それによって、高周波励起信号の性能を効果的に改善する。さらに、図7〜図10に説明される高周波励起信号を予測するための装置が低周波信号を高周波信号と結合した後、広帯域信号の性能はさらに改善されることができる。
図11を参照すると、図11は、本発明の実施形態によって開示されるデコーダの概略構造図であり、本発明の実施形態によって開示される高周波励起信号を予測するための方法を実行するように構成される。図10に示されるように、デコーダ1100は、例えばCPUのような少なくとも1つのプロセッサ1101と、少なくとも1つのネットワークインタフェース1104と、ユーザインタフェース1103と、メモリ1105と、少なくとも1つの通信バス1102とを備える。通信バス1102は、これらのコンポーネント間の接続および通信を実施するように構成される。任意選択で、ユーザインタフェース1103は、USBインタフェース、または別の標準インタフェース若しくは有線インタフェースを備えてもよい。任意選択で、ネットワークインタフェース1104は、Wi-Fiインタフェース、または別の無線インタフェースを備えてもよい。メモリ1105は、高速RAMメモリを備えてもよく、または例えば少なくとも1つの磁気ディスク記憶装置のような不揮発性メモリ(non-volatile memory)をさらに備えてもよい。任意選択で、メモリ1105は、前述のプロセッサ1101から遠く離れたところに位置する少なくとも1つの記憶装置を備えてもよい。
図11に示されたデコーダにおいて、ネットワークインタフェース1104は、エンコーダによって送信された低周波ビットストリームを受信してもよく、ユーザインタフェース1103は、周辺デバイスに接続され、かつ信号を出力するように構成されてもよく、メモリ1105は、プログラムを記憶するように構成されてもよく、かつプロセッサ1101は、メモリ1105内に記憶されたプログラムを呼び出し、かつ以下の動作、すなわち、
ネットワークインタフェース1104によって受信された低周波ビットストリームに基づいて、周波数の順に配列された、低周波LSFパラメータまたは低周波ISFパラメータを含むスペクトル周波数パラメータのセットを取得し、
取得されたスペクトル周波数パラメータのセットに対して、スペクトル周波数パラメータの一部またはすべてにおいて同一位置間隔を有するすべての2つのスペクトル周波数パラメータ間のスペクトル周波数パラメータ差を計算し、
計算されたスペクトル周波数パラメータ差から、最小スペクトル周波数パラメータ差を取得し、
最小スペクトル周波数パラメータ差に対応する周波数ビンに基づいて、低周波から高周波励起信号を予測するための開始周波数ビンを決定し、かつ
開始周波数ビンに基づいて、低周波から高周波励起信号を予測する
動作を実行するように構成されてもよい。
任意選択の実施方式として、受信された低周波ビットストリームに基づいてプロセッサ1101によって、周波数の順に配列されたスペクトル周波数パラメータのセットを取得することは、
周波数の順に配列されたスペクトル周波数パラメータのセットを得るために、受信された低周波ビットストリームに基づいて復号化を実行すること、または
低周波信号を得るために、受信された低周波ビットストリームに基づいて復号化を実行すること、および、低周波信号に基づいて、周波数の順に配列されたスペクトル周波数パラメータのセットを計算すること
を含んでもよい。
任意選択の実施方式として、もしプロセッサ1101が、周波数の順に配列されたスペクトル周波数パラメータのセットを得るために、受信された低周波ビットストリームに基づいて復号化を実行する場合、プロセッサ11101は、以下の動作、すなわち、
低周波励起信号を得るために、受信された低周波ビットストリームに基づいて復号化を実行する動作をさらに実行してもよい。
それに対応して、プロセッサ1101によって、開始周波数ビンに基づいて、低周波から高周波励起信号を予測することは、
低周波励起信号から、開始周波数ビンに基づいて高周波励起信号として予め設定された帯域幅を有する周波数帯域を選択すること
を含んでもよい。
任意選択の実施方式として、プロセッサ1101は、以下の動作、すなわち、
復号化によって得られたスペクトル周波数パラメータを、低周波LPC係数に変換し、
低周波LPC係数および低周波励起信号を使用して低周波信号を合成し、
低周波LPC係数に基づいて、高周波または広帯域LPC係数を予測し、
高周波励起信号および高周波または広帯域LPC係数を使用して高周波信号を合成し、かつ
広帯域信号を得るために、低周波信号を、高周波信号と結合する
動作をさらに実行してもよい。
別の任意選択の実施方式として、プロセッサ1101は、以下の動作、すなわち、
復号化によって得られたスペクトル周波数パラメータを、低周波LPC係数に変換し、
低周波LPC係数および低周波励起信号を使用して低周波信号を合成し、
低周波信号に基づいて、高周波エンベロープを予測し、
高周波励起信号および高周波エンベロープを使用して高周波信号を合成し、かつ
広帯域信号を得るために、低周波信号を高周波信号と結合する
動作をさらに実行してもよい。
任意選択の実施方式として、もしプロセッサ11101が、低周波信号を得るために、受信された低周波ビットストリームに基づいて復号化を実行し、かつ低周波信号に基づいて周波数の順に配列されたスペクトル周波数パラメータのセットを計算する場合、プロセッサ1101によって、開始周波数ビンに基づいて、低周波から高周波励起信号を予測することは、
低周波励起信号を得るために、LPC分析フィルタを使用して低周波信号を処理し、かつ
低周波励起信号から、開始周波数ビンに基づいて高周波励起信号として予め設定された帯域幅を有する周波数帯域を選択すること
を含む。
任意選択の実施方式として、プロセッサ1101は、以下の動作、すなわち、
計算されたスペクトル周波数パラメータを、低周波LPC係数に変換し、
低周波LPC係数に基づいて、高周波または広帯域LPC係数を予測し、
高周波励起信号および高周波または広帯域LPC係数を使用して高周波信号を合成し、
広帯域信号を得るために、低周波信号を高周波信号と結合する
動作をさらに実行してもよい。
別の任意選択の実施方式として、プロセッサ1101は、以下の動作、すなわち、
低周波信号に基づいて、高周波エンベロープを予測し、
高周波励起信号および高周波エンベロープを使用して高周波信号を合成し、
広帯域信号を得るために、低周波信号を高周波信号と結合する
動作をさらに実行してもよい。
図11に説明されるデコーダは、高周波励起信号の開始周波数ビンに基づいて低周波励起信号または低周波信号から高周波励起信号を予測してもよく、それは良好な符号化品質を有する高周波励起信号の予測を実施することができ、その結果、高周波励起信号はより確実に予測されることができ、それによって、高周波励起信号の性能を効果的に改善する。さらに、図11に説明されるデコーダが低周波信号を高周波信号と結合した後、広帯域信号の性能はさらに改善されることができる。
当業者は、実施形態における方法のステップのすべてまたは一部が、関連ハードウェアに命令するプログラムによって実施されてもよいということを理解できる。プログラムは、コンピュータ可読記憶媒体に記憶されてもよい。記憶媒体は、フラッシュメモリ、読み出し専用メモリ(Read-Only Memory, ROM)、ランダムアクセスメモリ(Random Access Memory, RAM)、磁気ディスク、および光ディスクを含んでもよい。
本発明の実施形態によって開示される高周波励起信号を予測するための方法および装置は、詳細に上記に説明されている。本明細書では、具体的な実施例が、本発明の原理および実施方式を詳述するために適用され、かつ前述の実施形態の説明は、本発明の方法および核となる考え方を理解することを助けるために使用されるのみである。さらに、当業者は、本発明の考え方に基づいて、具体的な実施方式および適用範囲に関して修正をすることができる。要するに、本明細書の内容は、本発明を限定するものとして解釈されるべきではない。
601 第1取得ユニット
602 計算ユニット
603 第2取得ユニット
604 開始周波数ビン決定ユニット
605 高周波励起予測ユニット
606 復号化ユニット
607 第1変換ユニット
608 第1低周波信号合成ユニット
609 第1LPC係数予測ユニット
610 第1高周波信号合成ユニット
611 第1広帯域信号合成ユニット
612 第2変換ユニット
613 第2低周波信号合成ユニット
614 第1高周波エンベロープ予測ユニット
615 第2高周波信号合成ユニット
616 第2広帯域信号合成ユニット
617 第3変換ユニット
618 第2LPC係数予測ユニット
619 第3高周波信号合成ユニット
620 第3広帯域信号合成ユニット
621 第3高周波エンベロープ予測ユニット
622 第4高周波信号合成ユニット
623 第4広帯域信号合成ユニット
1100 デコーダ
1101 プロセッサ
1102 通信バス
1103 ユーザインタフェース
1104 ネットワークインタフェース
1105 メモリ
本発明は、2013年9月26日に中国特許庁に出願した、発明の名称を「METHOD AND APPARATUS FOR PREDICTING HIGH-FREQUENCY EXCITATION SIGNAL」とする中国特許出願第201310444734.4号の優先権を主張するものであり、その全体が参照により本明細書に組み込まれる。
本発明は、通信技術の分野に関し、かつ特に、高帯域励起信号を予測するための方法および装置に関する。
音声サービスの品質上の要求は、現代の通信においてますます高くなり、第3世代パートナーシッププロジェクト(The 3rd Generation Partnership Project, 3GPP)は、適応マルチレート広帯域(Adaptive Multi-Rate Wideband, AMR-WB)音声コーデックを提案している。AMR-WB音声コーデックは、例えば高い音声再構成品質、低平均符号化レート、および良好な自己適応のような利点を有しており、かつ通信史において同時に無線および有線サービスで使用できるはじめての音声符号化システムである。実際の適用においては、AMR-WB音声コーデックのデコーダ側で、エンコーダによって送信された低帯域ビットストリームを受信した後に、デコーダは低帯域線形予測係数(linear prediction coefficient, LPC)を得るために低帯域ビットストリームを復号化し、かつ低帯域LPC係数を使用することによって高周波または広帯域LPC係数を予測してもよい。さらに、デコーダは、高帯域励起信号としてランダムノイズを使用し、かつ高帯域または広帯域LPC係数および高帯域励起信号を使用することによって高帯域信号を合成してもよい。
しかしながら、実際では、高帯域信号は、高帯域励起信号として使用されるランダムノイズと、高帯域または広帯域LPC係数とを使用することによって合成されてもよいが、ランダムノイズは元の高帯域励起信号とはしばしば大きく異なることから、高帯域励起信号の性能は比較的不十分であり、最終的には合成される高帯域信号の性能に影響を与えることが発見されている。
本発明の実施形態は、高帯域励起信号をより確実に予測することができる高帯域励起信号を予測するための方法および装置を開示し、それによって高帯域励起信号の性能を改善する。
本発明の実施形態の第1態様は、高帯域励起信号を予測するための方法を開示しており、
受信された低帯域ビットストリームに基づいて、周波数の順に配列されたスペクトル周波数パラメータのセットを取得するステップであって、スペクトル周波数パラメータは、低帯域線スペクトル周波数(Line Spectral Frequency, LSF)パラメータまたは低帯域イミタンススペクトル周波数(Immittance Spectral Frequencies, ISF)パラメータを含む、ステップと、
スペクトル周波数パラメータのセットに対して、スペクトル周波数パラメータの一部またはすべてにおいて同一位置間隔を有するすべての2つのスペクトル周波数パラメータ間のスペクトル周波数パラメータ差を計算するステップと、
計算されたスペクトル周波数パラメータ差から、最小スペクトル周波数パラメータ差を取得するステップと、
最小スペクトル周波数パラメータ差に対応する周波数ビンに基づいて、低帯域から高帯域励起信号を予測するための開始周波数ビンを決定するステップと、
開始周波数ビンに基づいて、低帯域から高帯域励起信号を予測するステップと
含む。
本発明の実施形態の第1態様の第1の可能な実施方式において、受信された低帯域ビットストリームに基づいて、周波数の順に配列されたスペクトル周波数パラメータのセットを取得するステップは、
周波数の順に配列されたスペクトル周波数パラメータのセットを得るために、受信された低帯域ビットストリーム復号化するステップ、または
低帯域信号を得るために、受信された低帯域ビットストリーム復号化するステップ、および、低帯域信号に基づいて、周波数の順に配列されたスペクトル周波数パラメータのセットを計算するステップ
を含む。
本発明の実施形態の第1態様の第1の可能な実施方式を参照して、本発明の実施形態の第1態様の第2の可能な実施方式において、もし周波数の順に配列されたスペクトル周波数パラメータのセットが、受信された低帯域ビットストリーム復号化することによって得られる場合、方法は、
低帯域励起信号を得るために、受信された低帯域ビットストリーム復号化するステップをさらに含み、かつ
開始周波数ビンに基づいて、低帯域から高帯域励起信号を予測するステップは、
低帯域励起信号から、開始周波数ビンに基づいて高帯域励起信号として予め設定された帯域幅を有する周波数帯域を選択するステップを含む。
本発明の実施形態の第1態様の第2の可能な実施方式を参照して、本発明の実施形態の第1態様の第3の可能な実施方式において、方法は、
復号化によって得られたスペクトル周波数パラメータを、低帯域LPC係数に変換するステップと、
低帯域LPC係数および低帯域励起信号を使用して低帯域信号を合成するステップと、
低帯域LPC係数に基づいて、高帯域または広帯域LPC係数を予測するステップと、
高帯域励起信号および高帯域または広帯域LPC係数を使用して高帯域信号を合成するステップと、
広帯域信号を得るために、低帯域信号を高帯域信号と結合するステップと
をさらに含む。
本発明の実施形態の第1態様の第2の可能な実施方式を参照して、本発明の実施形態の第1態様の第4の可能な実施方式において、方法は、
復号化によって得られたスペクトル周波数パラメータを、低帯域LPC係数に変換するステップと、
低帯域LPC係数および低帯域励起信号を使用して低帯域信号を合成するステップと、
低帯域信号に基づいて、高帯域エンベロープを予測するステップと、
高帯域励起信号および高帯域エンベロープを使用して高帯域信号を合成するステップと、
広帯域信号を得るために、低帯域信号を高帯域信号と結合するステップと
をさらに含む。
本発明の実施形態の第1態様の第1の可能な実施方式を参照して、本発明の実施形態の第1態様の第5の可能な実施方式において、もし低帯域信号が、受信された低帯域ビットストリーム復号化することによって得られ、かつ周波数の順に配列されたスペクトル周波数パラメータのセットが低帯域信号に基づいて計算される場合、開始周波数ビンに基づいて、低帯域から高帯域励起信号を予測するステップは、
低帯域励起信号を得るために、LPC分析フィルタを使用して低周波信号を処理するステップと、
低帯域励起信号から、開始周波数ビンに基づいて高帯域励起信号として予め設定された帯域幅を有する周波数帯域を選択するステップと
を含む。
本発明の実施形態の第1態様の第5の可能な実施方式を参照して、本発明の実施形態の第1態様の第6の可能な実施方式において、方法は、
計算されたスペクトル周波数パラメータを、低帯域LPC係数に変換するステップと、
低帯域LPC係数に基づいて、高帯域または広帯域LPC係数を予測するステップと、
高帯域励起信号および高帯域または広帯域LPC係数を使用して高帯域信号を合成するステップと、
広帯域信号を得るために、低帯域信号を高帯域信号と結合するステップと
をさらに含む。
本発明の実施形態の第1態様の第5の可能な実施方式を参照して、本発明の実施形態の第1態様の第7の可能な実施方式において、方法は、
低帯域信号に基づいて、高帯域エンベロープを予測するステップと、
高帯域励起信号および高帯域エンベロープを使用して高帯域信号を合成するステップと、
広帯域信号を得るために、低帯域信号を高帯域信号と結合するステップと
をさらに含む。
本発明の実施形態の第1態様または本発明の実施形態の第1態様の第1から第7の可能な実施方式のいずれ1つを参照して、本発明の実施形態の第1態様の第8の可能な実施方式において、同一位置間隔を有するすべての2つのスペクトル周波数パラメータは、すべての2つの隣接スペクトル周波数パラメータ、または、スペクトル周波数パラメータの同一数量により離間されたすべての2つのスペクトル周波数パラメータを含む。
本発明の実施形態の第2態様は、高帯域励起信号を予測するための装置を開示しており、装置は、
受信された低帯域ビットストリームに基づいて、周波数の順に配列されたスペクトル周波数パラメータのセットを取得するように構成された第1取得ユニットであって、スペクトル周波数パラメータは、低帯域線スペクトル周波数(LSF)パラメータまたは低帯域イミタンススペクトル周波数ISFパラメータを含む、第1取得ユニットと、
第1取得ユニットによって取得されたスペクトル周波数パラメータのセットに対して、スペクトル周波数パラメータの一部またはすべてにおいて同一位置間隔を有するすべての2つのスペクトル周波数パラメータ間のスペクトル周波数パラメータ差を計算するように構成された計算ユニットと、
計算ユニットによって計算されたスペクトル周波数パラメータ差から、最小スペクトル周波数パラメータ差を取得するように構成された第2取得ユニットと、
第2取得ユニットによって取得された最小スペクトル周波数パラメータ差に対応する周波数ビンに基づいて、低帯域から高帯域励起信号を予測するための開始周波数ビンを決定するように構成された開始周波数ビン決定ユニットと、
開始周波数ビン決定ユニットによって決定された開始周波数ビンに基づいて、低帯域から高帯域励起信号を予測するように構成された高帯域励起予測ユニットと
を備える。
本発明の実施形態の第2態様の第1の可能な実施方式において、第1取得ユニットは、周波数の順に配列されたスペクトル周波数パラメータのセットを得るために、受信された低帯域ビットストリーム復号化するように特に構成され、または、低帯域信号を得るために、受信された低帯域ビットストリーム復号化し、かつ低帯域信号に基づいて周波数の順に配列されたスペクトル周波数パラメータのセットを計算するように特に構成される。
本発明の実施形態の第2態様の第1の可能な実施方式を参照して、本発明の実施形態の第2態様の第2の可能な実施方式において、もし第1取得ユニットが、周波数の順に配列されたスペクトル周波数パラメータのセットを得るために、受信された低帯域ビットストリーム復号化するように特に構成される場合、装置は、
低帯域励起信号を得るために、受信された低帯域ビットストリーム復号化するように構成される復号化ユニットをさらに備え、かつ
高帯域励起予測ユニットは、復号化ユニットによって得られた低帯域励起信号から、開始周波数ビン決定ユニットによって決定された開始周波数ビンに基づいて高帯域励起信号として予め設定された帯域幅を有する周波数帯域を選択するように特に構成される。
本発明の実施形態の第2態様の第2の可能な実施方式を参照して、本発明の実施形態の第2態様の第3の可能な実施方式において、装置は、
第1取得ユニットによって得られたスペクトル周波数パラメータを、低帯域線形予測係数(LPC)係数に変換するように構成された第1変換ユニットと、
第1変換ユニットによる変換によって得られた低帯域LPC係数と、復号化ユニットによって得られた低帯域励起信号とを低帯域信号に合成するように構成された第1低帯域信号合成ユニットと、
第1変換ユニットによる変換によって得られた低帯域LPC係数に基づいて、高帯域または広帯域LPC係数を予測するように構成された第1LPC係数予測ユニットと、
高帯域励起予測ユニットにより選択された高帯域励起信号と、第1LPC係数予測ユニットにより予測された高帯域または広帯域LPC係数とを使用して、高帯域信号を合成するように構成された第1高帯域信号合成ユニットと、
広帯域信号を得るために、第1低帯域信号合成ユニットにより合成された低帯域信号を、第1高帯域信号合成ユニットにより合成された高帯域信号と結合するように構成された第1広帯域信号合成ユニット
をさらに備える。
本発明の実施形態の第2態様の第2の可能な実施方式を参照して、本発明の実施形態の第2態様の第4の可能な実施方式において、装置は、
第1取得ユニットによって得られたスペクトル周波数パラメータを、低帯域線形予測係数(LPC)係数に変換するように構成された第2変換ユニットと、
第2変換ユニットによる変換によって得られた低帯域LPC係数と、復号化ユニットによって得られた低帯域励起信号とを、低帯域信号に合成するように構成された第2低帯域信号合成ユニットと、
第2低帯域信号合成ユニットにより合成された低帯域信号に基づいて、高帯域エンベロープを予測するように構成された第1高帯域エンベロープ予測ユニットと、
高帯域励起予測ユニットにより選択された高帯域励起信号と、第1高帯域エンベロープ予測ユニットにより予測された高帯域エンベロープとを使用して、高帯域信号を合成するように構成された第2高帯域信号合成ユニットと、
広帯域信号を得るために、第2低帯域信号合成ユニットにより合成された低帯域信号を、第2高帯域信号合成ユニットにより合成された高帯域信号と結合するように構成された第2広帯域信号合成ユニットと
をさらに備える。
本発明の実施形態の第2態様の第1の可能な実施方式を参照して、本発明の実施形態の第2態様の第5の可能な実施方式において、もし第1取得ユニットが、低帯域信号を得るために、受信された低帯域ビットストリーム復号化し、かつ、低帯域信号に基づいて、周波数の順に配列されたスペクトル周波数パラメータのセットを計算するように特に構成される場合、高帯域励起予測ユニットは、低帯域励起信号を得るために、LPC分析フィルタを使用して低周波信号を処理し、かつ低帯域励起信号から、開始周波数ビン決定ユニットによって決定された開始周波数ビンに基づいて高帯域励起信号として予め設定された帯域幅を有する周波数帯域を選択するように特に構成される。
本発明の実施形態の第2態様の第5の可能な実施方式を参照して、本発明の実施形態の第2態様の第6の可能な実施方式において、装置は、
第1取得ユニットにより得られた計算されたスペクトル周波数パラメータを、低帯域線形予測係数(LPC)係数に変換するように構成された第3変換ユニットと、
第3変換ユニットによる変換によって得られた低帯域LPC係数に基づいて、高帯域または広帯域LPC係数を予測するように構成された第2LPC係数予測ユニットと、
高帯域励起予測ユニットにより選択された高帯域励起信号と、第2LPC係数予測ユニットにより予測された高帯域または広帯域LPC係数とを使用して、高帯域信号を合成するように構成された第3高帯域信号合成ユニットと、
広帯域信号を得るために、第1取得ユニットによって得られた低帯域信号を、第3高帯域信号合成ユニットにより合成された高帯域信号と結合するように構成された第3広帯域信号合成ユニットと
をさらに備える。
本発明の実施形態の第2態様の第5の可能な実施方式を参照して、本発明の実施形態の第2態様の第7の可能な実施方式において、装置は、
第1取得ユニットによって得られた低帯域信号に基づいて、高帯域エンベロープを予測するように構成された第3高帯域エンベロープ予測ユニットと、
高帯域励起予測ユニットにより選択された高帯域励起信号と、第3高帯域エンベロープ予測ユニットにより予測された高帯域エンベロープとを使用して、高帯域信号を合成するように構成された第4高帯域信号合成ユニットと、
広帯域信号を得るために、第1取得ユニットによって得られた低帯域信号を、第4高帯域信号合成ユニットにより合成された高帯域信号と結合するように構成された第4広帯域信号合成ユニットと
をさらに備える。
本発明の実施形態の第2態様または本発明の実施形態の第2態様の第1から第7の可能な実施方式のいずれか1つを参照して、本発明の実施形態の第2態様の第8の可能な実施方式において、同一位置間隔を有するすべての2つのスペクトル周波数パラメータは、すべての2つの隣接スペクトル周波数パラメータ、または、スペクトル周波数パラメータの同一数量により離間されたすべての2つのスペクトル周波数パラメータを含む。
本発明の実施形態において、周波数の順に配列されたスペクトル周波数パラメータのセットが、受信された低帯域ビットストリームに基づいて取得された後、スペクトル周波数パラメータのこのセットにおいて同一位置間隔を有する任意の2つのスペクトル周波数パラメータ間のスペクトル周波数パラメータ差が計算されてもよく、かつさらに、最小スペクトル周波数パラメータ差が、計算されたスペクトル周波数パラメータ差から取得され、スペクトル周波数パラメータは、低帯域線スペクトル周波数LSFパラメータまたは低帯域イミタンススペクトル周波数ISFパラメータを含み、かつ従って、最小スペクトル周波数パラメータ差は、最小LSFパラメータ差または最小ISFパラメータ差である。信号エネルギーと、LSFパラメータ差またはISFパラメータ差に対応する周波数ビンとの間のマッピング関係に基づいて、より小さいLSFパラメータ差またはISFパラメータ差がより大きい信号エネルギーを示すことが学習されてもよく、かつ従って、低帯域から高帯域励起信号を予測するための開始周波数ビンは、最小スペクトル周波数パラメータ差に対応する周波数ビン(すなわち、最小LSFパラメータ差または最小ISFパラメータ差)に基づいて決定され、かつ高帯域励起信号は、開始周波数ビンに基づいて低帯域から予測され、比較的良好な符号化品質を有する高帯域励起信号の予測を実施することができ、その結果、高帯域励起信号はより確実に予測されることができ、それによって、高帯域励起信号の性能を効果的に改善する。
本発明の実施形態における技術的解決策をより明確に説明するために、以下に、実施形態を説明するために必要な添付図面を簡潔に紹介する。当然ながら、以下の説明における添付図面は、本発明の実施形態の単なる一部を示しているに過ぎず、かつ当業者は、創造的努力なしに、これらの添付図面から他の図面をさらに導き出すことができる。
本発明の実施形態によって開示される高帯域励起信号を予測するための方法の概略的なフローチャートである。 本発明の実施形態によって開示される高帯域励起信号を予測するプロセスの概略図である。 本発明の実施形態によって開示される高帯域励起信号を予測する別のプロセスの概略図である。 本発明の実施形態によって開示される高帯域励起信号を予測する別のプロセスの概略図である。 本発明の実施形態によって開示される高帯域励起信号を予測する別のプロセスの概略図である。 本発明の実施形態によって開示される高帯域励起信号を予測するための装置の概略構造図である。 本発明の実施形態によって開示される高帯域励起信号を予測するための別の装置の概略構造図である。 本発明の実施形態によって開示される高帯域励起信号を予測するための別の装置の概略構造図である。 本発明の実施形態によって開示される高帯域励起信号を予測するための別の装置の概略構造図である。 本発明の実施形態によって開示される高帯域励起信号を予測するための別の装置の概略構造図である。 本発明の実施形態によって開示されるデコーダの概略構造図である。
本発明の実施形態の添付図面を参照して、本発明の実施形態における技術的解決策を以下に明確に説明する。当然ながら、説明される実施形態は、本発明の実施形態のすべてではなく単なる一部に過ぎない。創造的努力なしに本発明の実施形態に基づいて当業者によって得られる他のすべての実施形態は、本発明の保護範囲内であるものとする。
本発明の実施形態は、高帯域励起信号をより確実に予測することができる高帯域励起信号を予測するための方法および装置を開示しており、それによって、高帯域励起信号の性能を改善する。詳細な説明は別途以下になされる。
図1を参照すると、図1は、本発明の実施形態によって開示される高帯域励起信号を予測するための方法の概略的なフローチャートである。図1に示されるように、高帯域励起信号を予測するための方法は、以下のステップを含んでもよい。
101:受信された低帯域ビットストリームに基づいて、周波数の順に配列されたスペクトル周波数パラメータのセットを取得し、スペクトル周波数パラメータは、低帯域LSFパラメータまたは低帯域ISFパラメータを含む。
本発明のこの実施形態において、スペクトル周波数パラメータは、低帯域LSFパラメータまたは低帯域ISFパラメータを含み、低帯域LSFパラメータまたは低帯域ISFパラメータのそれぞれは周波数にさらに対応し、かつ低帯域ビットストリームでは、低帯域LSFパラメータまたは低帯域ISFパラメータに対応する周波数は、通常昇順に配列されるので、周波数の順に配列されたスペクトル周波数パラメータのセットは、スペクトル周波数パラメータに対応する周波数の順に配列されたスペクトル周波数パラメータのセットである。
本発明のこの実施形態において、周波数の順に配列されたスペクトル周波数パラメータのセットは、受信された低帯域ビットストリームに基づいてデコーダによって取得されてもよい。デコーダは、AMR-WB音声コーデックにおけるデコーダであってもよく、または音声デコーダ、低帯域ビットストリームデコーダ、若しくは別のタイプのそのようなものであってもよく、本発明のこの実施形態においては限定されない。本発明のこの実施形態におけるデコーダは、少なくとも1つのプロセッサを備えてもよく、かつデコーダは、少なくとも1つのプロセッサの制御の下で動いてもよい。
実施形態において、デコーダがエンコーダによって送信された低帯域ビットストリームを受信した後、デコーダははじめに、線スペクトル対(Linear Spectral Pairs, LSP)パラメータを得るために、エンコーダによって送信された低帯域ビットストリームを直接復号化し、かつ次いで、LSPパラメータを低帯域LSFパラメータに変換してもよく、または、デコーダははじめに、イミタンススペクトル対(Immittance Spectral Pairs, ISP)パラメータを得るために、エンコーダによって送信された低帯域ビットストリームを直接復号化し、かつ次いで、ISPパラメータを、低帯域ISFパラメータに変換してもよい。
デコーダがLSPパラメータを低帯域LSFパラメータに変換し、かつデコーダがISPパラメータを低帯域ISFパラメータに変換する具体的な変換プロセスは、当業者にとって周知であり、かつ本発明のこの実施形態において、ここで詳細には説明されない。
本発明のこの実施形態において、スペクトル周波数パラメータはまた、例えばLSPパラメータまたはLSFパラメータのようなLPC係数の任意の周波数領域表示パラメータであってもよく、本発明のこの実施形態においては限定されない。
別の実施形態において、エンコーダによって送信された低帯域ビットストリームを受信した後、デコーダは、低帯域信号を得るために、受信された低帯域ビットストリーム復号化し、かつ低帯域信号に基づいて周波数の順に配列されたスペクトル周波数パラメータのセットを計算してもよい。
具体的には、デコーダは、低帯域信号に基づいて、LPC係数を計算し、かつ次いで、LPC係数をLSFパラメータまたはISFパラメータに変換してもよく、LPC係数がLSFパラメータまたはISFパラメータに変換される具体的な計算プロセスは、当業者にとって周知でもあり、かつ本発明のこの実施形態において、ここで詳細には説明されもしない。
102:取得されたスペクトル周波数パラメータのセットに対して、スペクトル周波数パラメータの一部またはすべてにおいて同一位置間隔を有するすべての2つのスペクトル周波数パラメータ間のスペクトル周波数パラメータ差を計算する。
本発明のこの実施形態において、デコーダは、取得されたスペクトル周波数パラメータのセットから、一部のスペクトル周波数パラメータを選択し、かつ選択されたスペクトル周波数パラメータにおいて同一位置間隔を有するすべての2つのスペクトル周波数パラメータ間のスペクトル周波数パラメータ差を計算してもよい。当然ながら、本発明のこの実施形態において、デコーダは、取得されたスペクトル周波数パラメータのセットからすべてのスペクトル周波数パラメータを選択し、かつすべての選択されたスペクトル周波数パラメータにおいて同一位置間隔を有するすべての2つのスペクトル周波数パラメータ間のスペクトル周波数パラメータ差を計算してもよい。すなわち、スペクトル周波数パラメータの一部またはすべてのいずれも、取得されたスペクトル周波数パラメータのセットにおけるスペクトル周波数パラメータである。
本発明のこの実施形態において、デコーダが周波数の順に配列されたスペクトル周波数パラメータのセット(すなわち、低帯域LSFパラメータまたは低帯域ISFパラメータ)を取得した後、デコーダは、この取得されたスペクトル周波数パラメータのセットに対して、周波数パラメータのこのセット(の一部またはすべて)において、同一位置間隔を有するすべての2つのスペクトル周波数パラメータ間のスペクトル周波数パラメータ差を計算してもよい。
実施形態において、同一位置間隔を有するすべての2つのスペクトル周波数パラメータは、その位置が隣接するすべての2つのスペクトル周波数パラメータを含み、例えば、周波数の昇順に配列された低帯域LSFパラメータのセットにおいて位置が隣接する(すなわち、位置間隔が0のLSFパラメータ)すべての2つの低帯域LSFパラメータであってもよく、または、周波数の昇順に配列された低帯域ISFパラメータのセットにおいて位置が隣接する(すなわち、位置間隔が0のISFパラメータ)すべての2つの低帯域ISFパラメータであってもよい。
別の実施形態において、同一位置間隔を有するすべての2つのスペクトル周波数パラメータは、位置がスペクトル周波数パラメータの同一数量(例えば1つまたは2つのような)により離間されたすべての2つのスペクトル周波数パラメータを含み、例えば、周波数の昇順に配列された低帯域LSFパラメータのセットにおけるLSF[1]およびLSF[3]、LSF[2]およびLSF[4]、またはLSF[3]およびLSF[5]等であってもよく、LSF[1]およびLSF[3]、LSF[2]およびLSF[4]、並びにLSF[3]およびLSF[5]の位置間隔は、すべて1つのLSFパラメータ、すなわち、LSF[2]、LSF[3]、およびLSF[4]である。
103:計算されたスペクトル周波数パラメータ差から、最小スペクトル周波数パラメータ差を取得する。
本発明のこの実施形態において、スペクトル周波数パラメータ差を計算した後、デコーダは、計算されたスペクトル周波数パラメータ差から、最小スペクトル周波数パラメータ差を取得してもよい。
104:最小スペクトル周波数パラメータ差に対応する周波数ビンに基づいて、低帯域から高帯域励起信号を予測するための開始周波数ビンを決定する。
本発明のこの実施形態において、最小スペクトル周波数パラメータ差は2つの周波数ビンに対応するので、デコーダは、2つの周波数ビンに基づいて低帯域から高帯域励起信号を予測するための開始周波数ビンを決定してもよい。例えば、デコーダは、低帯域から高帯域励起信号を予測するための開始周波数ビンとして、2つの周波数ビンの中で小さい方の周波数ビンを使用してもよく、または、デコーダは、低帯域から高帯域励起信号を予測するための開始周波数ビンとして、2つの周波数ビンの中で大きい方の周波数ビンを使用してもよく、または、デコーダは、低帯域から高帯域励起信号を予測するための開始周波数ビンとして、2つの周波数ビン間に位置する周波数ビンを使用してもよく、すなわち、選択された開始周波数ビンは、2つの周波数ビンの中で小さい方の周波数ビンよりも大きくまたはこれに等しく、かつ、2つの周波数ビンの中で大きい方の周波数ビンよりも小さくまたはこれに等しく、かつ開始周波数ビンの具体的な選択は、本発明のこの実施形態においては限定されない。
例えば、もしLSF[2]およびLSF[4]間の差が最小LSF差である場合、デコーダは、低帯域から高帯域励起信号を予測するための開始周波数ビンとして、LSF[2]に対応する最小周波数ビンを使用してもよく、または、デコーダは、低帯域から高帯域励起信号を予測するための開始周波数ビンとして、LSF[4]に対応する最大周波数ビンを使用してもよく、または、デコーダは、低帯域から高帯域励起信号を予測するための開始周波数ビンとして、LSF[2]に対応する最小周波数ビンと、LSF[4]に対応する最大周波数ビンとの間の周波数ビン範囲内の周波数ビンを使用してもよく、本発明のこの実施形態においては限定されない。
105:開始周波数ビンに基づいて、低帯域から高帯域励起信号を予測する。
本発明のこの実施形態において、低帯域から高帯域励起信号を予測するための開始周波数ビンを決定した後、デコーダは、低帯域から高帯域励起信号を予測してもよい。例えば、デコーダは、低帯域ビットストリームに対応する低帯域励起信号から、開始周波数ビンに基づいて高帯域励起信号として予め設定された帯域幅を有する周波数帯域を選択する。
図1に説明される方法においては、受信された低帯域ビットストリームに基づいて、周波数の順に配列されたスペクトル周波数パラメータのセットを取得した後、デコーダは、スペクトル周波数パラメータのこのセットにおいて、同一位置間隔を有するすべての2つのスペクトル周波数パラメータ間のスペクトル周波数パラメータ差を計算してもよく、かつ計算されたスペクトル周波数パラメータ差から最小スペクトル周波数パラメータ差をさらに取得し、スペクトル周波数パラメータは、低帯域線スペクトル周波数(LSF)パラメータまたは低帯域イミタンススペクトル周波数ISFパラメータを含み、かつ従って、最小スペクトル周波数パラメータ差は、最小LSFパラメータ差または最小ISFパラメータ差である。信号エネルギーと、LSFパラメータ差またはISFパラメータ差に対応する周波数ビンとの間のマッピング関係に基づいて、より小さいLSFパラメータ差またはISFパラメータ差がより大きい信号エネルギーを示すことが学習されてもよく、かつ従って、デコーダは、最小スペクトル周波数パラメータ差(すなわち、最小LSFパラメータ差または最小ISFパラメータ差)に対応する周波数ビンに基づいて、低帯域から高帯域励起信号を予測するための開始周波数ビンを決定し、かつ高帯域励起信号の開始周波数ビンに基づいて低帯域から高帯域励起信号を予測し、それは良好な符号化品質を有する高帯域励起信号の予測を実施することができ、その結果、高帯域励起信号がより確実に予測されることができ、それによって、高帯域励起信号の性能を効果的に改善する。
図2を参照すると、図2は、本発明の実施形態によって開示される高帯域励起信号を予測するプロセスの概略図である。図2に示されるように、高帯域励起信号を予測するプロセスは、以下である。
1.デコーダは、周波数の順に配列された低帯域LSFパラメータのセットを得るために、受信された低帯域ビットストリーム復号化する。
2.デコーダは、取得された低帯域LSFパラメータのセットに対して、低帯域LSFパラメータのこのセット(の一部またはすべて)において、隣接する位置を有するすべての2つの低帯域LSFパラメータ間の差LSF_DIFFを計算し、かつ、LSF_DIFF[i]=LSF[i+1]-LSF[i]であるものとし、ここでi≦Mであり、iはi番目のLSFを示し、かつMは低帯域LSFパラメータの数量を示す。
3.デコーダは、計算された差LSF_DIFFから最小の差MIN_LSF_DIFFを取得する。
任意選択の実施方式として、デコーダは、低帯域ビットストリームのレートに基づいて最小MIN_LSF_DIFFを検索する範囲、すなわちLSF_DIFFに対応する最も高い周波数の位置を決定してもよく、ここでより高いレートはより広い検索範囲を示し、かつより低いレートはより狭い検索範囲を示す。例えば、AMR-WBにおいて、レートが8.85kbpsよりも小さいまたはこれに等しいとき、iの最大値はM-8であり、または、レートが12.65kbpsよりも小さいまたはこれに等しいとき、iの最大値はM-6であり、または、レートが15.85kbpsよりも小さいまたはこれに等しいとき、iの最大値はM-4である。
任意選択の実施方式として、最小MIN_LSF_DIFFが検索されるとき、補正係数αはまず、LSF_DIFFを補正するために使用されてもよく、αは周波数の増加に伴って減少し、すなわち、
α*LSF_DIFF[i]≦MIN_LSF_DIFFであり、ここでi≦M、かつ0<α<1である。
4.デコーダは、最小MIN_LSF_DIFFに対応する周波数ビンに基づいて、低帯域から高帯域励起信号を予測するための開始周波数ビンを決定する。
5.デコーダは、低帯域励起信号を得るために、受信された低帯域ビットストリーム復号化する。
6.デコーダは、低帯域励起信号から、開始周波数ビンに基づいて高帯域励起信号として予め設定された帯域幅を有する周波数帯域を選択する。
またさらに、図2に示された高帯域励起信号を予測するプロセスは、さらに以下を含んでもよい。
7.デコーダは、復号化によって得られた低帯域LSFパラメータを、低帯域LPC係数に変換する。
8.デコーダは、低帯域LPC係数および低帯域励起信号を使用して、低帯域信号を合成する。
9.デコーダは、低帯域LPC係数に基づいて、高帯域または広帯域LPC係数を予測する。
10.デコーダは、高帯域励起信号および高帯域または広帯域LPC係数を使用して高帯域信号を合成する。
11.デコーダは、広帯域信号を得るために、低帯域信号を高帯域信号と結合する。
任意選択の実施方式として、低帯域ビットストリームレートのレートが所定の閾値よりも大きいとき、復号化によって得られた低帯域励起信号の中で、周波数帯域が高帯域信号のものに隣接する信号が高帯域励起信号として固定的に選択されてもよく、例えば、AMR-WBにおいて、レートが23.05kbpsよりも大きいまたはこれに等しいとき、4から6kHzの周波数帯域の信号が6から8kHzの周波数帯域の高帯域励起信号として固定的に選択されてもよい。
任意選択の実施方式として、図2に説明される方法において、LSFパラメータはまた、ISFパラメータによって置き換えられてもよく、本発明の実施形態に影響を与えない。
図2に説明されるプロセスにおいて、デコーダは、高帯域励起信号の開始周波数ビンに基づいて低帯域励起信号から高帯域励起信号を予測し、それは良好な符号化品質を有する高帯域励起信号の予測を実施することができ、その結果、高帯域励起信号はより確実に予測されることができ、それによって、高帯域励起信号の性能を効果的に改善する。さらに、デコーダが低帯域信号を高帯域信号と結合した後、広帯域信号の性能は、さらに改善されることができる。
図3を参照すると、図3は、本発明の実施形態によって開示される高帯域励起信号を予測する別のプロセスの概略図である。図3に示されるように、高帯域励起信号を予測するプロセスは以下である。
1.デコーダは、周波数の順に配列された低帯域LSFパラメータのセットを得るために、受信された低帯域ビットストリーム復号化する。
2.デコーダは、取得された低帯域LSFパラメータのセットに対して、低帯域LSFパラメータのこのセット(の一部またはすべて)において、2つの低帯域LSFパラメータの位置間隔を有するすべての2つの低帯域LSFパラメータ間の差LSF_DIFFを計算し、かつ、LSF_DIFF[i]=LSF[i+2]-LSF[i]であるものとし、ここでi≦Mであり、iはi番目のLSFを示し、かつMは低帯域LSFパラメータの数量を示す。
3.デコーダは、計算された差LSF_DIFFから最小MIN_LSF_DIFFを取得する。
任意選択の実施方式として、デコーダは、低帯域ビットストリームのレートに基づいて最小MIN_LSF_DIFFを検索する範囲、すなわちLSF_DIFFに対応する最も高い周波数の位置を決定してもよく、ここでより高いレートはより広い検索範囲を示し、かつより低いレートはより狭い検索範囲を示す。例えば、AMR-WBにおいて、レートが8.85kbpsよりも小さいまたはこれに等しいとき、iの最大値はM-8であり、または、レートが12.65kbpsよりも小さいまたはこれに等しいとき、iの最大値はM-6であり、または、レートが15.85kbpsよりも小さいまたはこれに等しいとき、iの最大値はM-4である。
任意選択の実施方式として、最小MIN_LSF_DIFFが検索されるとき、補正係数αはMIN_LSF_DIFFを補正ために使用されてもよく、αは周波数の増加に伴って減少し、すなわち、
LSF_DIFF[i]≦α*MIN_LSF_DIFFであり、ここでi≦M、かつα>1である。
4.デコーダは、最小MIN_LSF_DIFFに対応する周波数ビンに基づいて、低帯域から高帯域励起信号を予測するための開始周波数ビンを決定する。
5.デコーダは、低帯域励起信号を得るために、受信された低帯域ビットストリーム復号化する。
6.デコーダは、低帯域励起信号から、開始周波数ビンに基づいて高帯域励起信号として予め設定された帯域幅を有する周波数帯域を選択する。
またさらに、図3に示される高帯域励起信号を予測するプロセスは、さらに以下を含んでもよい。
7.デコーダは、復号化によって得られた低帯域LSFパラメータを、低帯域LPC係数に変換する。
8.デコーダは、低帯域LPC係数および低帯域励起信号を使用して、低帯域信号を合成する。
9.デコーダは、合成された低帯域信号に基づいて、高帯域エンベロープを予測する。
10.デコーダは、高帯域励起信号および高帯域エンベロープを使用して高帯域信号を合成する。
11.デコーダは、広帯域信号を得るために、低帯域信号を高帯域信号と結合する。
任意選択の実施方式として、低帯域ビットストリームレートのレートが所定の閾値よりも大きいとき、復号化によって得られた低帯域励起信号の中で、周波数帯域が高帯域信号のものに隣接する信号が高帯域励起信号として固定的に選択されてもよく、例えば、AMR-WBにおいて、レートが23.05kbpsよりも大きいまたはこれに等しいとき、4から6kHzの周波数帯域の信号が6から8kHzの高帯域励起信号として固定的に選択されてもよい。
任意選択の実施方式として、図3に説明される方法において、LSFパラメータはまた、ISFパラメータによって置き換えられてもよく、本発明の実施形態に影響を与えない。
図3に説明されるプロセスにおいて、デコーダは、高帯域励起信号の開始周波数ビンに基づいて低帯域励起信号から高帯域励起信号を予測し、それは良好な符号化品質を有する高帯域励起信号の予測を実施することができ、その結果、高帯域励起信号はより確実に予測されることができ、それによって、高帯域励起信号の性能を効果的に改善する。さらに、デコーダが低帯域信号を高帯域信号と結合した後、広帯域信号の性能はさらに改善されることができる。
図4を参照すると、図4は、本発明の実施形態によって開示される高帯域励起信号を予測する別のプロセスの概略図である。図4に示されるように、高帯域励起信号を予測するプロセスは以下である。
1.デコーダは、低帯域信号を得るために、受信された低帯域ビットストリーム復号化する。
2.デコーダは、低帯域信号に基づいて、周波数の順に配列された低帯域LSFパラメータのセットを計算する。
3.デコーダは、計算された低帯域LSFパラメータ計算のセットに対して、低帯域LSFパラメータのこのセット(の一部またはすべて)において、隣接する位置を有するすべての2つの低帯域LSFパラメータ間の差LSF_DIFFを計算し、かつ、LSF_DIFF[i]=LSF[i+1]-LSF[i]であるものとし、ここでi≦Mであり、iはi番目のLSFを示し、かつMは低帯域LSFパラメータの数量を示す。
4.デコーダは、計算された差LSF_DIFFから最小MIN_LSF_DIFFを取得する。
任意選択の実施方式として、デコーダは、低帯域ビットストリームのレートに基づいて最小MIN_LSF_DIFFを検索する範囲、すなわちLSF_DIFFに対応する最も高い周波数の位置を決定してもよく、ここでより高いレートはより広い検索範囲を示し、かつより低いレートはより狭い検索範囲を示す。例えば、AMR-WBにおいて、レートが8.85kbpsよりも小さいまたはこれに等しいとき、iの最大値はM-8であり、または、レートが12.65kbpsよりも小さいまたはこれに等しいとき、iの最大値はM-6であり、または、レートが15.85kbpsよりも小さいまたはこれに等しいとき、iの最大値はM-4である。
任意選択の実施方式として、最小MIN_LSF_DIFFが検索されるとき、補正係数αはLSF_DIFFを補正するために使用されてもよく、αは周波数の増加に伴って減少し、すなわち、
α*LSF_DIFF[i]≦MIN_LSF_DIFFであり、ここでi≦M、かつ0<α<1である。
5.デコーダは、最小MIN_LSF_DIFFに対応する周波数ビンに基づいて、低帯域から高帯域励起信号を予測するための開始周波数ビンを決定する。
6.デコーダは、低帯域励起信号を得るために、LPC分析フィルタを使用して低周波信号を処理する。
7.デコーダは、低帯域励起信号から、開始周波数ビンに基づいて高帯域励起信号として予め設定された帯域幅を有する周波数帯域を選択する。
またさらに、図4に示される高帯域励起信号を予測するプロセスは、以下をさらに含んでもよい。
8.デコーダは、計算された低帯域LSFパラメータを、低帯域LPC係数に変換する。
9.デコーダは、低帯域LPC係数に基づいて、高帯域または広帯域LPC係数を予測する。
10.デコーダは、高帯域励起信号および高帯域または広帯域LPC係数を使用して高帯域信号を合成する。
11.デコーダは、広帯域信号を得るために、低帯域信号を高帯域信号と結合する。
任意選択の実施方式として、低帯域ビットストリームレートのレートが所定の閾値よりも大きいとき、復号化によって得られた低帯域信号の中で、周波数帯域が高帯域信号のものに隣接する信号が高帯域励起信号として固定的に選択されてもよく、例えば、AMR-WBにおいて、レートが23.05kbpsよりも大きいまたはこれに等しいとき、4から6kHzの周波数帯域の信号が6から8kHzの高帯域励起信号として固定的に選択されてもよい。
任意選択の実施方式として、図4に説明される方法において、LSFパラメータはさらにISFパラメータによって置き換えられてもよく、本発明の実施形態に影響しない。
図4に説明されるプロセスにおいて、デコーダは、高帯域励起信号の開始周波数ビンに基づいて低帯域信号から高帯域励起信号を予測し、それは良好な符号化品質を有する高帯域励起信号の予測を実施することができ、その結果、高帯域励起信号はより確実に予測されることができ、それによって、高帯域励起信号の性能を効果的に改善する。さらに、デコーダが低帯域信号を高帯域信号と結合した後、広帯域信号の性能はさらに改善されることができる。
図5を参照すると、図5は、本発明の実施形態によって開示される高帯域励起信号を予測する別のプロセスの概略図である。図5に示されるように、高帯域励起信号を予測するプロセスは以下を含む。
1.デコーダは、低帯域信号を得るために、受信された低帯域ビットストリーム復号化する。
2.デコーダは、低帯域信号に基づいて、周波数の順に配列された低帯域LSFパラメータのセットを計算する。
3.デコーダは、計算された低帯域LSFパラメータのセットに対して、低帯域LSFパラメータのこのセット(の一部またはすべて)において、2つの低帯域LSFパラメータの位置間隔を有するすべての2つの低帯域LSFパラメータ間の差LSF_DIFFを計算し、かつ、LSF_DIFF[i]=LSF[i+2]-LSF[i]であるものとし、ここでi≦Mであり、iはi番目の差を示し、かつMは低帯域LSFパラメータの数量を示す。
4.デコーダは、計算された差LSF_DIFFから最小MIN_LSF_DIFFを取得する。
任意選択の実施方式として、デコーダは、低帯域ビットストリームのレートに基づいて最小MIN_LSF_DIFFを検索する範囲、すなわちLSF_DIFFに対応する最も高い周波数の位置を決定してもよく、ここでより高いレートはより広い検索範囲を示し、かつより低いレートはより狭い検索範囲を示す。例えば、AMR-WBにおいて、レートが8.85kbpsよりも小さいまたはこれに等しいとき、iの最大値はM-8であり、または、レートが12.65kbpsよりも小さいまたはこれに等しいとき、iの最大値はM-6であり、または、レートが15.85kbpsよりも小さいまたはこれに等しいとき、iの最大値はM-4である。
任意選択の実施方式として、最小MIN_LSF_DIFFが検索されるとき、補正係数αはMIN_LSF_DIFFを補正するために使用されてもよく、αは周波数の増加に伴って減少し、すなわち、
LSF_DIFF[i]≦α*MIN_LSF_DIFFであり、ここでi≦M、かつα>1である。
5:デコーダは、最小MIN_LSF_DIFFに対応する周波数ビンに基づいて、低帯域から高帯域励起信号を予測するための開始周波数ビンを決定する。
6.デコーダは、低帯域励起信号を得るために、LPC分析フィルタを使用して低周波信号を処理する。
7.デコーダは、低帯域励起信号から、開始周波数ビンに基づいて高帯域励起信号として予め設定された帯域幅を有する周波数帯域を選択する。
またさらに、図5に示される高帯域励起信号を予測するプロセスは以下を含んでもよい。
8.デコーダは、低帯域信号に基づいて、高帯域エンベロープを予測する。
実施形態において、デコーダは、低帯域LPC係数および低帯域励起信号に基づいて、高帯域エンベロープを予測してもよい。
9.デコーダは、高帯域励起信号および高帯域エンベロープを使用して高帯域信号を合成する。
10.デコーダは、広帯域信号を得るために、低帯域信号を高帯域信号と結合する。
任意選択の実施方式として、低帯域ビットストリームレートのレートが所定の閾値よりも大きいとき、復号化によって得られた低帯域信号の中で、周波数帯域が高帯域信号のものに隣接する信号が高帯域励起信号として固定的に選択されてもよく、例えば、AMR-WBにおいて、レートが23.05kbpsよりも大きいまたはこれに等しいとき、4から6kHzの周波数帯域の信号が6から8kHzの高帯域励起信号として固定的に選択されてもよい。
任意選択の実施方式として、図5に説明される方法において、LSFパラメータはさらにISFパラメータによって置き換えられてもよく、本発明の実施形態に影響を与えない。
図5に説明されるプロセスにおいて、デコーダは、高帯域励起信号の開始周波数ビンに基づいて低帯域信号から高帯域励起信号を予測し、それは良好な符号化品質を有する高帯域励起信号の予測を実施することができ、その結果、高帯域励起信号はより確実に予測されることができ、それによって、高帯域励起信号の性能を効果的に改善する。さらに、デコーダが低帯域信号を高帯域信号と結合した後、広帯域信号の性能はさらに改善されることができる。
図6を参照すると、図6は、本発明の実施形態によって開示される高帯域励起信号を予測するための装置の概略構造図である。図6に示される高帯域励起信号を予測するための装置は、物理的に独立したデバイスとして実施されてもよく、またはデコーダの新たに追加される部分として使用されてもよく、本発明のこの実施形態においては限定されない。図6に示されるように、高帯域励起信号を予測するための装置は、
受信された低帯域ビットストリームに基づいて、周波数の順に配列されたスペクトル周波数パラメータのセットを取得するように構成された第1取得ユニット601であって、スペクトル周波数パラメータは、低帯域LSFパラメータまたは低帯域ISFパラメータを含む、第1取得ユニット601と、
第1取得ユニット601によって取得されたスペクトル周波数パラメータのセットに対して、スペクトル周波数パラメータの一部またはすべてにおいて同一位置間隔を有するすべての2つのスペクトル周波数パラメータ間のスペクトル周波数パラメータ差を計算するように構成された計算ユニット602と、
計算ユニット602によって計算されたスペクトル周波数パラメータ差から最小スペクトル周波数パラメータ差を取得するように構成された第2取得ユニット603と、
第2取得ユニット603によって取得された最小スペクトル周波数パラメータ差に対応する周波数ビンに基づいて、低帯域から高帯域励起信号を予測するための開始周波数ビンを決定するように構成された開始周波数ビン決定ユニット604と、
開始周波数ビン決定ユニット604によって決定された開始周波数ビンに基づいて、低帯域から高帯域励起信号を予測するように構成された高帯域励起予測ユニット605と
を備えてもよい。
任意選択の実施方式として、第1取得ユニット601は、周波数の順に配列されたスペクトル周波数パラメータのセットを得るために、受信された低帯域ビットストリーム復号化するように特に構成されてもよく、または、低帯域信号を得るために、受信された低帯域ビットストリーム復号化し、かつ低帯域信号に基づいて周波数の順に配列されたスペクトル周波数パラメータのセットを計算するように特に構成される。
実施形態において、同一位置間隔を有するすべての2つのスペクトル周波数パラメータは、すべての2つの隣接スペクトル周波数パラメータ、または、スペクトル周波数パラメータの同一数量により離間されたすべての2つのスペクトル周波数パラメータを含む。
図6に説明される高帯域励起信号を予測するための装置は、高帯域励起信号の開始周波数ビンに基づいて低帯域励起信号から高帯域励起信号を予測してもよく、それは良好な符号化品質を有する高帯域励起信号の予測を実施することができ、その結果、高帯域励起信号はより確実に予測されることができ、それによって高帯域励起信号の性能を効果的に改善する。
さらに、図7を参照すると、図7は、本発明の実施形態によって開示される高帯域励起信号を予測するための別の装置の概略構造図である。図7に示された高帯域励起信号を予測するための装置は、図6に示される高帯域励起信号を予測するための装置を最適化することによって得られる。図7に示された高帯域励起信号を予測するための装置において、もし第1取得ユニット601が、周波数の順に配列されたスペクトル周波数パラメータのセットを得るために、受信された低帯域ビットストリーム復号化するように特に構成される場合、図6に示される高帯域励起信号を予測するための装置のすべてのユニットに加えて、図7に示された高帯域励起信号を予測するための装置は、
低帯域励起信号を得るために、受信された低帯域ビットストリームを復号化するように構成された復号化ユニット606をさらに備えてもよく、かつ
それに対応して、高帯域励起予測ユニット605は、復号化ユニット606によって得られた低帯域励起信号から、開始周波数ビン決定ユニット604によって決定された開始周波数ビンに基づいて高帯域励起信号として予め設定された帯域幅を有する周波数帯域を選択するように特に構成される。
任意選択の実施方式として、図7に示された高帯域励起信号を予測するための装置は、
第1取得ユニット601によって得られたスペクトル周波数パラメータを、低帯域LPC係数に変換するように構成された第1変換ユニット607と、
第1変換ユニット607による変換によって得られた低帯域LPC係数と、復号化ユニット606によって得られた低帯域励起信号とを使用して、低帯域信号を合成するように構成された第1低帯域信号合成ユニット608と、
第1変換ユニット607による変換によって得られた低帯域LPC係数に基づいて、高帯域または広帯域LPC係数を予測するように構成された第1LPC係数予測ユニット609と、
高帯域励起予測ユニット605により選択された高帯域励起信号と、第1LPC係数予測ユニット609により予測された高帯域または広帯域LPC係数とを使用して、高帯域信号を合成するように構成された第1高帯域信号合成ユニット610と、
広帯域信号を得るために、第1低帯域信号合成ユニット608により合成された低帯域信号を、第1高帯域信号合成ユニット610により合成された高帯域信号と結合するように構成された第1広帯域信号合成ユニット611と
をさらに備えてもよい。
さらに図8を参照すると、図8は、本発明の実施形態によって開示される高帯域励起信号を予測するための別の装置の概略構造図である。図8に示される高帯域励起信号を予測するための装置は、図6に示される高帯域励起信号を予測するための装置を最適化することによって得られる。図8に示される高帯域励起信号を予測するための装置において、もし第1取得ユニット601が、周波数の順に配列されたスペクトル周波数パラメータのセットを得るために、受信された低帯域ビットストリーム復号化するように特に構成される場合、図6に示される高帯域励起信号を予測するための装置のすべてのユニットに加えて、図8に示される高帯域励起信号を予測するための装置はまた、低帯域励起信号を得るために、受信された低帯域ビットストリームを復号化するように構成された復号化ユニット606をさらに備え、かつそれに対応して、高帯域励起予測ユニット605は、復号化ユニット606によって得られた低帯域励起信号から、開始周波数ビン決定ユニット604によって決定された開始周波数ビンに基づいて高帯域励起信号として予め設定された帯域幅を有する周波数帯域を選択するようにさらに構成される。
任意選択の実施方式として、図8に示される高帯域励起信号を予測するための装置は、
第1取得ユニット601によって得られたスペクトル周波数パラメータを、低帯域LPC係数に変換するように構成された第2変換ユニット612と、
第2変換ユニット612による変換によって得られた低帯域LPC係数と、復号化ユニット606によって得られた低帯域励起信号とを低帯域信号に合成するように構成された第2低帯域信号合成ユニット613と、
第2低帯域信号合成ユニット613により合成された低帯域信号に基づいて、高帯域エンベロープを予測するように構成された第1高帯域エンベロープ予測ユニット614と、
高帯域励起予測ユニット605により選択された高帯域励起信号と、第1高帯域エンベロープ予測ユニット614により予測された高帯域エンベロープとを使用して、高帯域信号を合成するように構成された第2高帯域信号合成ユニット615と、
広帯域信号を得るために、第2低帯域信号合成ユニット613により合成された低帯域信号を、第2高帯域信号合成ユニット615により合成された高帯域信号と結合するように構成された第2広帯域信号合成ユニット616と
をさらに備えてもよい。
図9を参照すると、図9は、本発明の実施形態によって開示される高帯域励起信号を予測するための別の装置の概略構造図である。図9に示される高帯域励起信号を予測するための装置は、図6に示される高帯域励起信号を予測するための装置を最適化することによって得られる。図9に示される高帯域励起信号を予測するための装置において、もし第1取得ユニット601が、低帯域信号を得るために、受信された低帯域ビットストリーム復号化し、かつ、低帯域信号に基づいて、周波数の順に配列されたスペクトル周波数パラメータのセットを計算するように特に構成される場合、高帯域励起予測ユニット605は、低帯域励起信号を得るために、LPC分析フィルタ(高帯域励起予測ユニット605に含まれてもよい)を使用して低周波信号を処理し、かつ、低帯域励起信号から、開始周波数ビン決定ユニット604によって決定された開始周波数ビンに基づいて高帯域励起信号として予め設定された帯域幅を有する周波数帯域を選択するように特に構成される。
任意選択の実施方式として、図9に示される高帯域励起信号を予測するための装置は、
第1取得ユニット601により得られた計算されたスペクトル周波数パラメータを、低帯域LPC係数に変換するように構成された第3変換ユニット617と、
第3変換ユニット617による変換によって得られた低帯域LPC係数に基づいて、高帯域または広帯域LPC係数を予測するように構成された第2LPC係数予測ユニット618と、
高帯域励起予測ユニット605により選択された高帯域励起信号と、第2LPC係数予測ユニット618により予測された高帯域または広帯域LPC係数とを使用して、高帯域信号を合成するように構成された第3高帯域信号合成ユニット619と、
広帯域信号を得るために、第1取得ユニット601によって得られた低帯域信号を、第3高帯域信号合成ユニット619により合成された高帯域信号と結合するように構成された第3広帯域信号合成ユニット620と
をさらに備えてもよい。
さらに図10を参照すると、図10は、本発明の実施形態によって開示される高帯域励起信号を予測するための別の装置の概略構造図である。図10に示される高帯域励起信号を予測するための装置は、図6に示される高帯域励起信号を予測するための装置を最適化することによって得られる。図10に示される高帯域励起信号を予測するための装置において、第1取得ユニット601は、低帯域信号を得るために、受信された低帯域ビットストリーム復号化し、かつ、低帯域信号に基づいて、周波数の順に配列されたスペクトル周波数パラメータのセットを計算するようにさらに構成され、かつ、高帯域励起予測ユニット605は、低帯域励起信号を得るために、LPC分析フィルタ(高帯域励起予測ユニット605に含まれてもよい)を使用して低周波信号を処理し、かつ低帯域励起信号から、開始周波数ビン決定ユニット604によって決定された開始周波数ビンに基づいて高帯域励起信号として予め設定された帯域幅を有する周波数帯域を選択するようにさらに構成されてもよい。
任意選択の実施方式として、図10に示される高帯域励起信号を予測するための装置は、
第1取得ユニット601によって得られた低帯域信号に基づいて、高帯域エンベロープを予測するように構成された第3高帯域エンベロープ予測ユニット621と、
高帯域励起予測ユニット605により選択された高帯域励起信号と、第3高帯域エンベロープ予測ユニット621により予測された高帯域エンベロープとを使用して、高帯域信号を合成するように構成された第4高帯域信号合成ユニット622と、
広帯域信号を得るために、第1取得ユニット601によって得られた低帯域信号を、第4高帯域信号合成ユニット622により合成された高帯域信号と結合するように構成された第4広帯域信号合成ユニット623と
をさらに備えてもよい。
図7から図10に説明される高帯域励起信号を予測するための装置は、高帯域励起信号の開始周波数ビンに基づいて低帯域励起信号または低帯域信号から高帯域励起信号を予測してもよく、それは良好な符号化品質を有する高帯域励起信号の予測を実施することができ、その結果、高帯域励起信号はより確実に予測されることができ、それによって、高帯域励起信号の性能を効果的に改善する。さらに、図7〜図10に説明される高帯域励起信号を予測するための装置が低帯域信号を高帯域信号と結合した後、広帯域信号の性能はさらに改善されることができる。
図11を参照すると、図11は、本発明の実施形態によって開示されるデコーダの概略構造図であり、本発明の実施形態によって開示される高帯域励起信号を予測するための方法を実行するように構成される。図11に示されるように、デコーダ1100は、例えばCPUのような少なくとも1つのプロセッサ1101と、少なくとも1つのネットワークインタフェース1104と、ユーザインタフェース1103と、メモリ1105と、少なくとも1つの通信バス1102とを備える。通信バス1102は、これらのコンポーネント間の接続および通信を実施するように構成される。任意選択で、ユーザインタフェース1103は、USBインタフェース、または別の標準インタフェース若しくは有線インタフェースを備えてもよい。任意選択で、ネットワークインタフェース1104は、Wi-Fiインタフェース、または別の無線インタフェースを備えてもよい。メモリ1105は、高速RAMメモリを備えてもよく、または例えば少なくとも1つの磁気ディスク記憶装置のような不揮発性メモリをさらに備えてもよい。任意選択で、メモリ1105は、前述のプロセッサ1101から遠く離れたところに位置する少なくとも1つの記憶装置を備えてもよい。
図11に示されたデコーダにおいて、ネットワークインタフェース1104は、エンコーダによって送信された低帯域ビットストリームを受信してもよく、ユーザインタフェース1103は、周辺デバイスに接続され、かつ信号を出力するように構成されてもよく、メモリ1105は、プログラムを記憶するように構成されてもよく、かつプロセッサ1101は、メモリ1105内に記憶されたプログラムを呼び出し、かつ以下の動作、すなわち、
ネットワークインタフェース1104によって受信された低帯域ビットストリームに基づいて、周波数の順に配列された、低帯域LSFパラメータまたは低帯域ISFパラメータを含むスペクトル周波数パラメータのセットを取得し、
取得されたスペクトル周波数パラメータのセットに対して、スペクトル周波数パラメータの一部またはすべてにおいて同一位置間隔を有するすべての2つのスペクトル周波数パラメータ間のスペクトル周波数パラメータ差を計算し、
計算されたスペクトル周波数パラメータ差から、最小スペクトル周波数パラメータ差を取得し、
最小スペクトル周波数パラメータ差に対応する周波数ビンに基づいて、低帯域から高帯域励起信号を予測するための開始周波数ビンを決定し、かつ
開始周波数ビンに基づいて、低帯域から高帯域励起信号を予測する
動作を実行するように構成されてもよい。
任意選択の実施方式として、受信された低帯域ビットストリームに基づいてプロセッサ1101によって、周波数の順に配列されたスペクトル周波数パラメータのセットを取得することは、
周波数の順に配列されたスペクトル周波数パラメータのセットを得るために、受信された低帯域ビットストリーム復号化すること、または
低帯域信号を得るために、受信された低帯域ビットストリーム復号化すること、および、低帯域信号に基づいて、周波数の順に配列されたスペクトル周波数パラメータのセットを計算すること
を含んでもよい。
任意選択の実施方式として、もしプロセッサ1101が、周波数の順に配列されたスペクトル周波数パラメータのセットを得るために、受信された低周波ビットストリーム復号化する場合、プロセッサ11101は、以下の動作、すなわち、
低帯域励起信号を得るために、受信された低帯域ビットストリーム復号化する動作をさらに実行してもよい。
それに対応して、プロセッサ1101によって、開始周波数ビンに基づいて、低帯域から高帯域励起信号を予測することは、
低帯域励起信号から、開始周波数ビンに基づいて高帯域励起信号として予め設定された帯域幅を有する周波数帯域を選択すること
を含んでもよい。
任意選択の実施方式として、プロセッサ1101は、以下の動作、すなわち、
復号化によって得られたスペクトル周波数パラメータを、低帯域LPC係数に変換し、
低帯域LPC係数および低帯域励起信号を使用して低帯域信号を合成し、
低帯域LPC係数に基づいて、高帯域または広帯域LPC係数を予測し、
高帯域励起信号および高帯域または広帯域LPC係数を使用して高帯域信号を合成し、かつ
広帯域信号を得るために、低帯域信号を、高帯域信号と結合する
動作をさらに実行してもよい。
別の任意選択の実施方式として、プロセッサ1101は、以下の動作、すなわち、
復号化によって得られたスペクトル周波数パラメータを、低帯域LPC係数に変換し、
低帯域LPC係数および低帯域励起信号を使用して低帯域信号を合成し、
低帯域信号に基づいて、高帯域エンベロープを予測し、
高帯域励起信号および高帯域エンベロープを使用して高帯域信号を合成し、かつ
広帯域信号を得るために、低帯域信号を高帯域信号と結合する
動作をさらに実行してもよい。
任意選択の実施方式として、もしプロセッサ11101が、低帯域信号を得るために、受信された低帯域ビットストリーム復号化し、かつ低帯域信号に基づいて周波数の順に配列されたスペクトル周波数パラメータのセットを計算する場合、プロセッサ1101によって、開始周波数ビンに基づいて、低帯域から高帯域励起信号を予測することは、
低帯域励起信号を得るために、LPC分析フィルタを使用して低周波信号を処理し、かつ
低帯域励起信号から、開始周波数ビンに基づいて高帯域励起信号として予め設定された帯域幅を有する周波数帯域を選択すること
を含む。
任意選択の実施方式として、プロセッサ1101は、以下の動作、すなわち、
計算されたスペクトル周波数パラメータを、低帯域LPC係数に変換し、
低帯域LPC係数に基づいて、高帯域または広帯域LPC係数を予測し、
高帯域励起信号および高帯域または広帯域LPC係数を使用して高帯域信号を合成し、
広帯域信号を得るために、低帯域信号を高帯域信号と結合する
動作をさらに実行してもよい。
別の任意選択の実施方式として、プロセッサ1101は、以下の動作、すなわち、
低帯域信号に基づいて、高帯域エンベロープを予測し、
高帯域励起信号および高帯域エンベロープを使用して高帯域信号を合成し、
広帯域信号を得るために、低帯域信号を高帯域信号と結合する
動作をさらに実行してもよい。
図11に説明されるデコーダは、高帯域励起信号の開始周波数ビンに基づいて低帯域励起信号または低帯域信号から高帯域励起信号を予測してもよく、それは良好な符号化品質を有する高帯域励起信号の予測を実施することができ、その結果、高帯域励起信号はより確実に予測されることができ、それによって、高帯域励起信号の性能を効果的に改善する。さらに、図11に説明されるデコーダが低帯域信号を高帯域信号と結合した後、広帯域信号の性能はさらに改善されることができる。
当業者は、実施形態における方法のステップのすべてまたは一部が、関連ハードウェアに命令するプログラムによって実施されてもよいということを理解できる。プログラムは、コンピュータ可読記憶媒体に記憶されてもよい。記憶媒体は、フラッシュメモリ、読み出し専用メモリ(Read-Only Memory, ROM)、ランダムアクセスメモリ(Random Access Memory, RAM)、磁気ディスク、および光ディスクを含んでもよい。
本発明の実施形態によって開示される高帯域励起信号を予測するための方法および装置は、詳細に上記に説明されている。本明細書では、具体的な実施例が、本発明の原理および実施方式を詳述するために適用され、かつ前述の実施形態の説明は、本発明の方法および核となる考え方を理解することを助けるために使用されるのみである。さらに、当業者は、本発明の考え方に基づいて、具体的な実施方式および適用範囲に関して修正をすることができる。要するに、本明細書の内容は、本発明を限定するものとして解釈されるべきではない。
601 第1取得ユニット
602 計算ユニット
603 第2取得ユニット
604 開始周波数ビン決定ユニット
605 高帯域励起予測ユニット
606 復号化ユニット
607 第1変換ユニット
608 第1低帯域信号合成ユニット
609 第1LPC係数予測ユニット
610 第1高帯域信号合成ユニット
611 第1広帯域信号合成ユニット
612 第2変換ユニット
613 第2低帯域信号合成ユニット
614 第1高帯域エンベロープ予測ユニット
615 第2高帯域信号合成ユニット
616 第2広帯域信号合成ユニット
617 第3変換ユニット
618 第2LPC係数予測ユニット
619 第3高帯域信号合成ユニット
620 第3広帯域信号合成ユニット
621 第3高帯域エンベロープ予測ユニット
622 第4高帯域信号合成ユニット
623 第4広帯域信号合成ユニット
1100 デコーダ
1101 プロセッサ
1102 通信バス
1103 ユーザインタフェース
1104 ネットワークインタフェース
1105 メモリ

Claims (18)

  1. 高周波励起信号を予測するための方法であって、
    受信された低周波ビットストリームに基づいて、周波数の順に配列されたスペクトル周波数パラメータのセットを取得するステップであって、前記スペクトル周波数パラメータは、低周波線スペクトル周波数LSFパラメータまたは低周波イミタンススペクトル周波数ISFパラメータを含む、ステップと、
    スペクトル周波数パラメータの前記セットに対して、前記スペクトル周波数パラメータの一部またはすべてにおいて同一位置間隔を有するすべての2つのスペクトル周波数パラメータ間のスペクトル周波数パラメータ差を計算するステップと、
    前記計算されたスペクトル周波数パラメータ差から最小スペクトル周波数パラメータ差を取得するステップと、
    前記最小スペクトル周波数パラメータ差に対応する周波数ビンに基づいて、低周波から高周波励起信号を予測するための開始周波数ビンを決定するステップと、
    前記開始周波数ビンに基づいて、前記低周波から前記高周波励起信号を予測するステップと
    を含む、方法。
  2. 受信された低周波ビットストリームに基づいて、周波数の順に配列されたスペクトル周波数パラメータのセットを取得する前記ステップは、
    周波数の順に配列されたスペクトル周波数パラメータの前記セットを得るために、前記受信された低周波ビットストリームに基づいて復号化を実行するステップ、または
    低周波信号を得るために、前記受信された低周波ビットストリームに基づいて復号化を実行するステップ、および、前記低周波信号に基づいて、周波数の順に配列されたスペクトル周波数パラメータの前記セットを計算するステップ
    を含む、請求項1に記載の方法。
  3. もし周波数の順に配列されたスペクトル周波数パラメータの前記セットが、前記受信された低周波ビットストリームを復号化することによって得られる場合、前記方法は、
    低周波励起信号を得るために、前記受信された低周波ビットストリームに基づいて復号化を実行するステップをさらに含み、かつ
    前記開始周波数ビンに基づいて、前記低周波から前記高周波励起信号を予測する前記ステップは、
    前記低周波励起信号から、前記開始周波数ビンに基づいて前記高周波励起信号として予め設定された帯域幅を有する周波数帯域を選択するステップを含む、請求項2に記載の方法。
  4. 前記方法は、
    復号化によって得られた前記スペクトル周波数パラメータを低周波線形予測LPC係数に変換するステップと、
    前記低周波LPC係数および前記低周波励起信号を使用して低周波信号を合成するステップと、
    前記低周波LPC係数に基づいて、高周波または広帯域LPC係数を予測するステップと、
    前記高周波励起信号および前記高周波または広帯域LPC係数を使用して高周波信号を合成するステップと、
    広帯域信号を得るために、前記低周波信号を前記高周波信号と結合するステップと
    をさらに含む、請求項3に記載の方法。
  5. 前記方法は、
    復号化によって得られた前記スペクトル周波数パラメータを低周波線形予測LPC係数に変換するステップと、
    前記低周波LPC係数および前記低周波励起信号を使用して低周波信号を合成するステップと、
    前記低周波信号に基づいて、高周波エンベロープを予測するステップと、
    前記高周波励起信号および前記高周波エンベロープを使用して高周波信号を合成するステップと、
    広帯域信号を得るために、前記低周波信号を前記高周波信号と結合するステップと
    をさらに含む、請求項3に記載の方法。
  6. もし前記低周波信号が、前記受信された低周波ビットストリームに基づく復号化によって得られ、かつ周波数の順に配列されたスペクトル周波数パラメータの前記セットが前記低周波信号に基づいて計算される場合、前記開始周波数ビンに基づいて、前記低周波から前記高周波励起信号を予測する前記ステップは、
    低周波励起信号を得るために、LPC分析フィルタを使用して前記低周波信号を処理するステップと、
    前記低周波励起信号から、前記開始周波数ビンに基づいて前記高周波励起信号として予め設定された帯域幅を有する周波数帯域を選択するステップと
    を含む、請求項2に記載の方法。
  7. 前記方法は、
    得られた前記計算されたスペクトル周波数パラメータを、低周波線形予測LPC係数に変換するステップと、
    前記低周波LPC係数に基づいて、高周波または広帯域LPC係数を予測するステップと、
    前記高周波励起信号および前記高周波または広帯域LPC係数を使用して高周波信号を合成するステップと、
    広帯域信号を得るために、前記低周波信号を前記高周波信号と結合するステップと
    をさらに含む、請求項6に記載の方法。
  8. 前記方法は、
    前記低周波信号に基づいて、高周波エンベロープを予測するステップと、
    前記高周波励起信号および前記高周波エンベロープを使用して高周波信号を合成するステップと、
    広帯域信号を得るために、前記低周波信号を前記高周波信号と結合するステップと
    をさらに含む、請求項6に記載の方法。
  9. 同一位置間隔を有する前記すべての2つのスペクトル周波数パラメータは、すべての2つの隣接スペクトル周波数パラメータ、または、スペクトル周波数パラメータの同一数量により離間されたすべての2つのスペクトル周波数パラメータを含む、請求項1〜8のいずれか一項に記載の方法。
  10. 高周波励起信号を予測するための装置であって、受信された低周波ビットストリームに基づいて、周波数の順に配列されたスペクトル周波数パラメータのセットを取得するように構成された第1取得ユニットであって、前記スペクトル周波数パラメータは、低周波線スペクトル周波数LSFパラメータまたは低周波イミタンススペクトル周波数ISFパラメータを含む、第1取得ユニットと、
    前記第1取得ユニットによって取得されたスペクトル周波数パラメータの前記セットに対して、前記スペクトル周波数パラメータの一部またはすべてにおいて同一位置間隔を有するすべての2つのスペクトル周波数パラメータ間のスペクトル周波数パラメータ差を計算するように構成された計算ユニットと、
    前記計算ユニットによって計算された前記スペクトル周波数パラメータ差から最小スペクトル周波数パラメータ差を取得するように構成された第2取得ユニットと、
    前記第2取得ユニットによって取得された前記最小スペクトル周波数パラメータ差に対応する周波数ビンに基づいて、低周波から高周波励起信号を予測するための開始周波数ビンを決定するように構成された開始周波数ビン決定ユニットと、
    前記開始周波数ビン決定ユニットによって決定された前記開始周波数ビンに基づいて、前記低周波から前記高周波励起信号を予測するように構成された高周波励起予測ユニットと
    を備える装置。
  11. 前記第1取得ユニットは、周波数の順に配列されたスペクトル周波数パラメータの前記セットを得るために、前記受信された低周波ビットストリームに基づいて復号化を実行するように特に構成され、または、低周波信号を得るために、前記受信された低周波ビットストリームに基づいて復号化を実行し、かつ前記低周波信号に基づいて、周波数の順に配列されたスペクトル周波数パラメータの前記セットを計算するように特に構成される、請求項10に記載の装置。
  12. もし前記第1取得ユニットが、周波数の順に配列されたスペクトル周波数パラメータの前記セットを得るために、前記受信された低周波ビットストリームに基づいて復号化を実行するように特に構成される場合、前記装置は、
    低周波励起信号を得るために、前記受信された低周波ビットストリームに基づいて復号化を実行するように構成された復号化ユニットをさらに備え、かつ
    前記高周波励起予測ユニットは、前記復号化ユニットによる復号化によって得られた前記低周波励起信号から、前記開始周波数ビン決定ユニットにより決定された前記開始周波数ビンに基づいて前記高周波励起信号として予め設定された帯域幅を有する周波数帯域を選択するように特に構成される、請求項11に記載の装置。
  13. 前記装置は、
    前記第1取得ユニットによる復号化によって得られた前記スペクトル周波数パラメータを、低周波線形予測LPC係数に変換するように構成された第1変換ユニットと、
    前記第1変換ユニットによる変換によって得られた低周波LPC係数と、前記復号化ユニットによる復号化によって得られた前記低周波励起信号とを前記低周波信号に合成するように構成された第1低周波信号合成ユニットと、
    前記第1変換ユニットによる変換によって得られた前記低周波LPC係数に基づいて、高周波または広帯域LPC係数を予測するように構成された第1LPC係数予測ユニットと、
    前記高周波励起予測ユニットにより選択された前記高周波励起信号と、前記第1LPC係数予測ユニットにより予測された前記高周波または広帯域LPC係数とを使用して、高周波信号を合成するように構成された第1高周波信号合成ユニットと、
    広帯域信号を得るために、前記第1低周波信号合成ユニットにより合成された前記低周波信号を、前記第1高周波信号合成ユニットにより合成された前記高周波信号と結合するように構成された第1広帯域信号合成ユニットと
    をさらに備える、請求項12に記載の装置。
  14. 前記装置は、
    前記第1取得ユニットによる復号化によって得られた前記スペクトル周波数パラメータを、低周波線形予測LPC係数に変換するように構成された第2変換ユニットと、
    前記第2変換ユニットによる変換によって得られた低周波LPC係数と、前記復号化ユニットによる復号化によって得られた前記低周波励起信号とを前記低周波信号に合成するように構成された第2低周波信号合成ユニットと、
    前記第2低周波信号合成ユニットにより合成された前記低周波信号に基づいて、高周波エンベロープを予測するように構成された第1高周波エンベロープ予測ユニットと、
    前記高周波励起予測ユニットにより選択された前記高周波励起信号と、前記第1高周波エンベロープ予測ユニットにより予測された前記高周波エンベロープとを使用して、高周波信号を合成するように構成された第2高周波信号合成ユニットと、
    広帯域信号を得るために、前記第2低周波信号合成ユニットにより合成された前記低周波信号を、前記第2高周波信号合成ユニットにより合成された前記高周波信号と結合するように構成された第2広帯域信号合成ユニットと
    をさらに備える、請求項12に記載の装置。
  15. もし前記第1取得ユニットが、前記低周波信号を得るために、前記受信された低周波ビットストリームに基づいて復号化を実行し、かつ前記低周波信号に基づいて、周波数の順に配列されたスペクトル周波数パラメータの前記セットを計算するように特に構成される場合、前記高周波励起予測ユニットは、低周波励起信号を得るために、LPC分析フィルタを使用して前記低周波信号を処理し、かつ前記低周波励起信号から、前記開始周波数ビンに基づいて前記高周波励起信号として予め設定された帯域幅を有する周波数帯域を選択するように特に構成される、請求項11に記載の装置。
  16. 前記装置は、
    前記第1取得ユニットにより得られた前記計算されたスペクトル周波数パラメータを、低周波線形予測LPC係数に変換するように構成された第3変換ユニットと、
    前記第3変換ユニットによる変換によって得られた前記低周波LPC係数に基づいて、高周波または広帯域LPC係数を予測するように構成された第2LPC係数予測ユニットと、
    前記高周波励起予測ユニットにより選択された前記高周波励起信号と、前記第2LPC係数予測ユニットにより予測された前記高周波または広帯域LPC係数とを使用して、高周波信号を合成するように構成された第3高周波信号合成ユニットと、
    広帯域信号を得るために、前記第1取得ユニットによる復号化によって得られた前記低周波信号を、前記第3高周波信号合成ユニットにより合成された前記高周波信号と結合するように構成された第3広帯域信号合成ユニットと
    をさらに備える、請求項15に記載の装置。
  17. 前記装置は、
    前記第1取得ユニットによる復号化によって得られた前記低周波信号に基づいて、高周波エンベロープを予測するように構成された第3高周波エンベロープ予測ユニットと、
    前記高周波励起予測ユニットにより選択された前記高周波励起信号と、前記第3高周波エンベロープ予測ユニットにより予測された前記高周波エンベロープとを使用して、高周波信号を合成するように構成された第4高周波信号合成ユニットと、
    広帯域信号を得るために、前記第1取得ユニットによる復号化によって得られた前記低周波信号を、前記第4高周波信号合成ユニットにより合成された前記高周波信号と結合するように構成された第4広帯域信号合成ユニットと
    をさらに備える、請求項15に記載の装置。
  18. 同一位置間隔を有する前記すべての2つのスペクトル周波数パラメータは、すべての2つの隣接スペクトル周波数パラメータ、または、スペクトル周波数パラメータの同一数量により離間されたすべての2つのスペクトル周波数パラメータを含む、請求項11〜17のいずれか一項に記載の装置。
JP2016517389A 2013-09-26 2014-04-03 高帯域励起信号を予測するための方法および装置 Active JP6420324B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201310444734.4A CN104517611B (zh) 2013-09-26 2013-09-26 一种高频激励信号预测方法及装置
CN201310444734.4 2013-09-26
PCT/CN2014/074711 WO2015043151A1 (zh) 2013-09-26 2014-04-03 一种高频激励信号预测方法及装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2018192580A Division JP6720266B2 (ja) 2013-09-26 2018-10-11 高帯域励起信号を予測するための方法および装置

Publications (2)

Publication Number Publication Date
JP2016532138A true JP2016532138A (ja) 2016-10-13
JP6420324B2 JP6420324B2 (ja) 2018-11-07

Family

ID=52741932

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2016517389A Active JP6420324B2 (ja) 2013-09-26 2014-04-03 高帯域励起信号を予測するための方法および装置
JP2018192580A Active JP6720266B2 (ja) 2013-09-26 2018-10-11 高帯域励起信号を予測するための方法および装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2018192580A Active JP6720266B2 (ja) 2013-09-26 2018-10-11 高帯域励起信号を予測するための方法および装置

Country Status (16)

Country Link
US (3) US9685165B2 (ja)
EP (3) EP4339946A3 (ja)
JP (2) JP6420324B2 (ja)
KR (2) KR101805794B1 (ja)
CN (2) CN104517611B (ja)
AU (1) AU2014328353B2 (ja)
BR (1) BR112016006583B1 (ja)
CA (1) CA2924952C (ja)
ES (1) ES2716152T3 (ja)
HK (1) HK1206139A1 (ja)
MX (1) MX353022B (ja)
MY (1) MY166226A (ja)
RU (1) RU2637885C2 (ja)
SG (1) SG11201602225WA (ja)
WO (1) WO2015043151A1 (ja)
ZA (2) ZA201601991B (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104217727B (zh) * 2013-05-31 2017-07-21 华为技术有限公司 信号解码方法及设备
FR3008533A1 (fr) 2013-07-12 2015-01-16 Orange Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences
CN104517610B (zh) 2013-09-26 2018-03-06 华为技术有限公司 频带扩展的方法及装置
CN104517611B (zh) 2013-09-26 2016-05-25 华为技术有限公司 一种高频激励信号预测方法及装置
CA2928882C (en) * 2013-11-13 2018-08-14 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Encoder for encoding an audio signal, audio transmission system and method for determining correction values
TWI752166B (zh) * 2017-03-23 2022-01-11 瑞典商都比國際公司 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合
CN107818797B (zh) * 2017-12-07 2021-07-06 苏州科达科技股份有限公司 语音质量评价方法、装置及其系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008139844A (ja) * 2006-11-09 2008-06-19 Sony Corp 周波数帯域拡大装置及び周波数帯域拡大方法、再生装置及び再生方法、並びに、プログラム及び記録媒体
JP2013508783A (ja) * 2009-10-23 2013-03-07 クゥアルコム・インコーポレイテッド 狭帯域信号から「より上の帯域」の信号を決定すること

Family Cites Families (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5455888A (en) * 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
JPH0955778A (ja) * 1995-08-15 1997-02-25 Fujitsu Ltd 音声信号の広帯域化装置
US7072832B1 (en) * 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
US7389227B2 (en) * 2000-01-14 2008-06-17 C & S Technology Co., Ltd. High-speed search method for LSP quantizer using split VQ and fixed codebook of G.729 speech encoder
WO2003038812A1 (en) * 2001-11-02 2003-05-08 Matsushita Electric Industrial Co., Ltd. Audio encoding and decoding device
WO2003046891A1 (en) * 2001-11-29 2003-06-05 Coding Technologies Ab Methods for improving high frequency reconstruction
US7363218B2 (en) * 2002-10-25 2008-04-22 Dilithium Networks Pty. Ltd. Method and apparatus for fast CELP parameter mapping
KR100499047B1 (ko) * 2002-11-25 2005-07-04 한국전자통신연구원 서로 다른 대역폭을 갖는 켈프 방식 코덱들 간의 상호부호화 장치 및 그 방법
RU2248619C2 (ru) * 2003-02-12 2005-03-20 Рыболовлев Александр Аркадьевич Способ и устройство преобразования речевого сигнала методом линейного предсказания с адаптивным распределением информационных ресурсов
EP2264700A1 (en) * 2003-09-16 2010-12-22 Panasonic Corporation Coding apparatus and decoding apparatus
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
KR100647290B1 (ko) * 2004-09-22 2006-11-23 삼성전자주식회사 합성된 음성의 특성을 이용하여 양자화/역양자화를선택하는 음성 부호화/복호화 장치 및 그 방법
AU2006232364B2 (en) * 2005-04-01 2010-11-25 Qualcomm Incorporated Systems, methods, and apparatus for wideband speech coding
TWI317933B (en) 2005-04-22 2009-12-01 Qualcomm Inc Methods, data storage medium,apparatus of signal processing,and cellular telephone including the same
JP5100380B2 (ja) * 2005-06-29 2012-12-19 パナソニック株式会社 スケーラブル復号装置および消失データ補間方法
JP2007310296A (ja) * 2006-05-22 2007-11-29 Oki Electric Ind Co Ltd 帯域拡張装置及び方法
KR20070115637A (ko) 2006-06-03 2007-12-06 삼성전자주식회사 대역폭 확장 부호화 및 복호화 방법 및 장치
CN101089951B (zh) * 2006-06-16 2011-08-31 北京天籁传音数字技术有限公司 频带扩展编码方法及装置和解码方法及装置
US8532984B2 (en) * 2006-07-31 2013-09-10 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of active frames
US8295507B2 (en) * 2006-11-09 2012-10-23 Sony Corporation Frequency band extending apparatus, frequency band extending method, player apparatus, playing method, program and recording medium
KR101565919B1 (ko) * 2006-11-17 2015-11-05 삼성전자주식회사 고주파수 신호 부호화 및 복호화 방법 및 장치
US8639500B2 (en) 2006-11-17 2014-01-28 Samsung Electronics Co., Ltd. Method, medium, and apparatus with bandwidth extension encoding and/or decoding
KR101375582B1 (ko) * 2006-11-17 2014-03-20 삼성전자주식회사 대역폭 확장 부호화 및 복호화 방법 및 장치
ES2548010T3 (es) 2007-03-05 2015-10-13 Telefonaktiebolaget Lm Ericsson (Publ) Procedimiento y dispositivo para suavizar ruido de fondo estacionario
US8392198B1 (en) * 2007-04-03 2013-03-05 Arizona Board Of Regents For And On Behalf Of Arizona State University Split-band speech compression based on loudness estimation
KR100921867B1 (ko) * 2007-10-17 2009-10-13 광주과학기술원 광대역 오디오 신호 부호화 복호화 장치 및 그 방법
CN101458930B (zh) * 2007-12-12 2011-09-14 华为技术有限公司 带宽扩展中激励信号的生成及信号重建方法和装置
JP4818335B2 (ja) * 2008-08-29 2011-11-16 株式会社東芝 信号帯域拡張装置
JP4945586B2 (ja) * 2009-02-02 2012-06-06 株式会社東芝 信号帯域拡張装置
US8463599B2 (en) 2009-02-04 2013-06-11 Motorola Mobility Llc Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder
JP4932917B2 (ja) * 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
CN101521014B (zh) * 2009-04-08 2011-09-14 武汉大学 音频带宽扩展编解码装置
JP5754899B2 (ja) * 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
JP2011209548A (ja) * 2010-03-30 2011-10-20 Nippon Logics Kk 帯域拡張装置
CN102870156B (zh) * 2010-04-12 2015-07-22 飞思卡尔半导体公司 音频通信设备、输出音频信号的方法和通信系统
US9294060B2 (en) 2010-05-25 2016-03-22 Nokia Technologies Oy Bandwidth extender
CN103035248B (zh) * 2011-10-08 2015-01-21 华为技术有限公司 音频信号编码方法和装置
EP3279895B1 (en) * 2011-11-02 2019-07-10 Telefonaktiebolaget LM Ericsson (publ) Audio encoding based on an efficient representation of auto-regressive coefficients
EP3089164A1 (en) * 2011-11-02 2016-11-02 Telefonaktiebolaget LM Ericsson (publ) Generation of a high band extension of a bandwidth extended audio signal
EP2774148B1 (en) * 2011-11-03 2014-12-24 Telefonaktiebolaget LM Ericsson (PUBL) Bandwidth extension of audio signals
FR2984580A1 (fr) * 2011-12-20 2013-06-21 France Telecom Procede de detection d'une bande de frequence predeterminee dans un signal de donnees audio, dispositif de detection et programme d'ordinateur correspondant
US9711156B2 (en) * 2013-02-08 2017-07-18 Qualcomm Incorporated Systems and methods of performing filtering for gain determination
MY172616A (en) * 2013-03-13 2019-12-06 Telekom Malaysia Berhad A system for analysing network traffic and a method thereof
CN103165134B (zh) * 2013-04-02 2015-01-14 武汉大学 音频信号高频参数编解码装置
US9666202B2 (en) * 2013-09-10 2017-05-30 Huawei Technologies Co., Ltd. Adaptive bandwidth extension and apparatus for the same
CN104517611B (zh) 2013-09-26 2016-05-25 华为技术有限公司 一种高频激励信号预测方法及装置
CN104517610B (zh) * 2013-09-26 2018-03-06 华为技术有限公司 频带扩展的方法及装置
US10163447B2 (en) * 2013-12-16 2018-12-25 Qualcomm Incorporated High-band signal modeling

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008139844A (ja) * 2006-11-09 2008-06-19 Sony Corp 周波数帯域拡大装置及び周波数帯域拡大方法、再生装置及び再生方法、並びに、プログラム及び記録媒体
JP2013508783A (ja) * 2009-10-23 2013-03-07 クゥアルコム・インコーポレイテッド 狭帯域信号から「より上の帯域」の信号を決定すること

Also Published As

Publication number Publication date
CN105761723B (zh) 2019-01-15
EP3051534A1 (en) 2016-08-03
JP2019023749A (ja) 2019-02-14
MY166226A (en) 2018-06-22
KR101805794B1 (ko) 2017-12-07
US9685165B2 (en) 2017-06-20
EP3573057B1 (en) 2024-06-05
CA2924952C (en) 2018-06-19
AU2014328353A1 (en) 2016-04-14
KR101894927B1 (ko) 2018-09-04
CN104517611B (zh) 2016-05-25
RU2016116016A (ru) 2017-11-01
US20170249948A1 (en) 2017-08-31
AU2014328353B2 (en) 2017-04-20
RU2637885C2 (ru) 2017-12-07
EP3051534B1 (en) 2019-01-02
EP4339946A3 (en) 2024-04-24
ES2716152T3 (es) 2019-06-10
EP3051534A4 (en) 2017-05-03
ZA201707083B (en) 2018-11-28
US20160210979A1 (en) 2016-07-21
US20190272838A1 (en) 2019-09-05
EP3573057A1 (en) 2019-11-27
CN105761723A (zh) 2016-07-13
JP6420324B2 (ja) 2018-11-07
KR20160055268A (ko) 2016-05-17
MX2016003882A (es) 2016-06-17
EP4339946A2 (en) 2024-03-20
JP6720266B2 (ja) 2020-07-08
BR112016006583A2 (pt) 2017-09-12
WO2015043151A1 (zh) 2015-04-02
ZA201601991B (en) 2019-04-24
US10339944B2 (en) 2019-07-02
BR112016006583B1 (pt) 2019-11-26
CA2924952A1 (en) 2015-04-02
CN104517611A (zh) 2015-04-15
US10607620B2 (en) 2020-03-31
MX353022B (es) 2017-12-18
HK1206139A1 (zh) 2015-12-31
KR20170137944A (ko) 2017-12-13
SG11201602225WA (en) 2016-05-30

Similar Documents

Publication Publication Date Title
JP6720266B2 (ja) 高帯域励起信号を予測するための方法および装置
KR102248252B1 (ko) 대역폭 확장을 위한 고주파수 부호화/복호화 방법 및 장치
US10453466B2 (en) Apparatus and method for encoding/decoding for high frequency bandwidth extension
US10152983B2 (en) Apparatus and method for encoding/decoding for high frequency bandwidth extension
US10490199B2 (en) Bandwidth extension audio decoding method and device for predicting spectral envelope
WO2015043161A1 (zh) 频带扩展的方法及装置
RU2725416C1 (ru) Расширение полосы частот гармонического аудиосигнала
KR20190060887A (ko) 노이즈 신호 처리 방법, 노이즈 신호 생성 방법, 인코더, 디코더, 및 인코딩/디코딩 시스템
JP6584431B2 (ja) 音声情報を用いる改善されたフレーム消失補正
US20130346073A1 (en) Audio encoder/decoder apparatus
AU2016222488A1 (en) Apparatus and method for encoding/decoding for high-frequency bandwidth extension

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160525

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160525

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170621

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170627

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170927

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180306

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180523

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180911

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181011

R150 Certificate of patent or registration of utility model

Ref document number: 6420324

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250