JP6423420B2 - 帯域幅拡張方法および装置 - Google Patents

帯域幅拡張方法および装置 Download PDF

Info

Publication number
JP6423420B2
JP6423420B2 JP2016517362A JP2016517362A JP6423420B2 JP 6423420 B2 JP6423420 B2 JP 6423420B2 JP 2016517362 A JP2016517362 A JP 2016517362A JP 2016517362 A JP2016517362 A JP 2016517362A JP 6423420 B2 JP6423420 B2 JP 6423420B2
Authority
JP
Japan
Prior art keywords
signal
frequency
excitation signal
parameter
bandwidth extension
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016517362A
Other languages
English (en)
Other versions
JP2016537662A (ja
Inventor
▲澤▼新 ▲劉▼
▲澤▼新 ▲劉▼
磊 苗
磊 苗
▲賓▼ 王
▲賓▼ 王
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of JP2016537662A publication Critical patent/JP2016537662A/ja
Application granted granted Critical
Publication of JP6423420B2 publication Critical patent/JP6423420B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/087Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using mixed excitation models, e.g. MELP, MBE, split band LPC or HVXC
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0002Codebook adaptations
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • G10L2025/906Pitch tracking

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Vehicle Body Suspensions (AREA)
  • External Artificial Organs (AREA)

Description

本願は、発明の名称を「帯域幅拡張方法および装置」とした、2013年9月26日に中国特許庁に出願された中国特許出願第201310444398.3号に対する優先権を主張し、その全体を引用により本明細書に組み込む。
本発明は音声符号化および復号化の分野に関し、特に、中速および低速の広帯域の代数符号励振線形予測(ACELP、Algebraic Code Excited Linear Prediction)における帯域幅拡張方法および装置に関する。
ブラインド帯域幅拡張技術は復号器での技術で、復号器は、低周波復号信号に従って、および、対応する予測方法を用いることによってブラインド帯域幅拡張を実施する。
中速および低速の広帯域のACELP符号化および復号化の最中は、既存のアルゴリズムは全て、まず、16kHzで標本化された広帯域信号を12.8kHzに下方標本化し、次いで、符号化を実施する。このように、符号化および復号化の後の信号出力の帯域幅は6.4kHzのみである。元のアルゴリズムが変更されない場合は、6.4乃至8kHzまたは6.4乃至7kHzの帯域幅を有する部分における情報をブラインド帯域幅拡張の方式で復元する必要がある。即ち、対応する復元は復号器でのみ実施される。
しかし、既存のブラインド帯域幅拡張技術によって復元された高周波信号は元の高周波信号から大幅に変動し、復元された高周波信号が満足できないものとなる原因となる。
本発明では帯域幅拡張方法および装置を提供し、既存のブラインド帯域幅拡張技術を用いて復元された高周波帯域信号が元の高周波帯域信号から大幅に変動するという問題を解決することを目的とする。
第1の態様によれば、帯域幅拡張パラメータを取得するステップであって、当該帯域幅拡張パラメータは、以下のパラメータ、即ち、線形予測係数LPC、線スペクトル周波数LSFパラメータ、ピッチ期間、復号化率、適応コードブック寄与、および代数コードブック寄与のうち1つまたは複数を含むステップと、当該帯域幅拡張パラメータに従って、帯域幅拡張を復号された低周波信号に対して実施して、高周波帯域信号を取得するステップとを含む帯域幅拡張方法が提供される。
第1の態様を参照して、第1の態様の第1の実装方式では、当該帯域幅拡張パラメータに従って、帯域幅拡張を復号された低周波信号に対して実施して、高周波帯域信号を取得するステップは、当該帯域幅拡張パラメータに従って高周波エネルギおよび高帯域励起信号を予測するステップと、当該高周波エネルギおよび当該高帯域励起信号に従って当該高周波帯域信号を取得するステップとを含む。
第1の態様の第1の実装方式を参照して、第1の態様の第2の実装方式では、高周波エネルギは高周波利得を含み、帯域幅拡張パラメータに従って高周波エネルギおよび高帯域励起信号を予測するステップは、LPCに従って高周波利得を予測するステップと、LSFパラメータ、適応コードブック寄与、および代数コードブック寄与に従って適合的に高帯域励起信号を予測するステップとを含む。
第1の態様の第2の実装方式を参照して、第1の態様の第3の実装方式では、LSFパラメータ、適応コードブック寄与、および代数コードブック寄与に従って適合的に高帯域励起信号を予測するステップは、復号化率、LSFパラメータ、適応コードブック寄与、および代数コードブック寄与に従って、適合的に高帯域励起信号を予測するステップを含む。
第1の態様の第1の実装方式を参照して、第1の態様の第4の実装方式では、高周波エネルギは高周波利得を含み、帯域幅拡張パラメータに従って高周波エネルギおよび高帯域励起信号を予測するステップは、LPCに従って高周波利得を予測するステップと、適応コードブック寄与および代数コードブック寄与に従って高帯域励起信号を適合的に予測するステップとを含む。
第1の態様の第4の実装方式を参照して、第1の態様の第5の実装方式では、適応コードブック寄与および代数コードブック寄与に従って高帯域励起信号を適合的に予測するステップは、復号化率、適応コードブック寄与、および代数コードブック寄与に従って適合的に高帯域励起信号を予測するステップを含む。
第1の態様の第1の実装方式を参照して、第1の態様の第6の実装方式では、高周波エネルギは高周波エンベロープを含み、帯域幅拡張パラメータに従って高周波エネルギおよび高帯域励起信号を予測するステップは、復号された低周波信号または低周波励起信号に従って高周波エンベロープを予測するステップであって、当該低周波励起信号は適応コードブック寄与および代数コードブック寄与の和であるステップと、当該復号された低周波信号または当該低周波励起信号に従って当該高帯域励起信号を予測するステップとを含む。
第1の態様の第6の実装方式を参照して、第1の態様の第7の実装方式では、復号された低周波信号または低周波励起信号に従って高帯域励起信号を予測するステップは、復号化率および復号された低周波信号に従って高帯域励起信号を予測するステップを含む。
第1の態様の第6の実装方式を参照して、第1の態様の第8の実装方式では、復号された低周波信号または低周波励起信号に従って高帯域励起信号を予測するステップは、復号化率および低周波励起信号に従って高帯域励起信号を予測するステップを含む。
第1の態様の第1乃至第8の実装方式を参照して、第1の態様の第9の実装方式では、帯域幅拡張パラメータに従って高周波エネルギおよび高帯域励起信号を予測した後に、当該方法はさらに、帯域幅拡張パラメータおよび復号された低周波信号のうち少なくとも1つに従って第1の補正因子を決定するステップであって、第1の補正因子は、以下のパラメータ、即ち、音声因子、ノイズ・ゲート因子、およびスペクトル傾斜因子のうち1つまたは複数を含むステップと、第1の補正因子に従って高周波エネルギを補正するステップとを含む。
第1の態様の第9の実装方式を参照して、第1の態様の第10の実装方式では、帯域幅拡張パラメータおよび復号された低周波信号のうち少なくとも1つに従って第1の補正因子を決定するステップは、ピッチ期間、適応コードブック寄与、代数コードブック寄与、および復号された低周波信号に従って第1の補正因子を決定するステップを含む。
第1の態様の第9の実装方式を参照して、第1の態様の第11の実装方式では、帯域幅拡張パラメータおよび復号された低周波信号のうち少なくとも1つに従って第1の補正因子を決定するステップは、当該復号された低周波信号に従って第1の補正因子を決定するステップを含む。
第1の態様の第9の実装方式を参照して、第1の態様の第12の実装方式では、帯域幅拡張パラメータおよび復号された低周波信号のうち少なくとも1つに従って第1の補正因子を決定するステップは、ピッチ期間、適応コードブック寄与、代数コードブック寄与、および復号された低周波信号に従って第1の補正因子を決定するステップを含む。
第1の態様の第9乃至第12の実装方式を参照して、第1の態様の第13の実装方式では、当該方法はさらに、ピッチ期間に従って高周波エネルギを補正するステップを含む。
第1の態様の第9乃至第13の実装方式を参照して、第1の態様の第14の実装方式では、当該方法はさらに、帯域幅拡張パラメータおよび復号された低周波信号のうち少なくとも1つに従って第2の補正因子を決定するステップであって、第2の補正因子は分類パラメータおよび信号タイプのうち少なくとも1つを含むステップと、第2の補正因子に従って高周波エネルギおよび高帯域励起信号を補正するステップとを含む。
第1の態様の第14の実装方式を参照して、第1の態様の第15の実装方式では、帯域幅拡張パラメータおよび復号された低周波信号のうち少なくとも1つに従って第2の補正因子を決定するステップは、当該帯域幅拡張パラメータに従って第2の補正因子を決定するステップを含む。
第1の態様の第14の実装方式を参照して、第1の態様の第16の実装方式では、帯域幅拡張パラメータおよび復号された低周波信号のうち少なくとも1つに従って第2の補正因子を決定するステップは、当該復号された低周波信号に従って第2の補正因子を決定するステップを含む。
第1の態様の第14の実装方式を参照して、第1の態様の第17の実装方式では、帯域幅拡張パラメータおよび復号された低周波信号のうち少なくとも1つに従って第2の補正因子を決定するステップは、当該帯域幅拡張パラメータおよび当該復号された低周波信号に従って第2の補正因子を決定するステップを含む。
第1の態様の第9乃至第17の実装方式を参照して、第1の態様の第18の実装方式では、当該方法はさらに、予測された高帯域励起信号およびランダム雑音信号に重み付けして、最終的な高帯域励起信号を取得するステップであって、当該重み付けの重みは、分類パラメータの値および/または復号された低周波信号の音声因子に従って決定されるステップを含む。
第1の態様の第1乃至第18の実装方式を参照して、第1の態様の第19の実装方式では、高周波エネルギおよび高帯域励起信号に従って高周波帯域信号を取得するステップは、高周波エネルギおよび高帯域励起信号を合成して高周波帯域信号を取得するステップ、または、高周波エネルギ、高帯域励起信号、および予測されたLPCを合成して高周波帯域信号を取得するステップであって、当該予測されたLPCは予測された高周波数帯域LPCまたは予測された広帯域LPCを含み、当該予測されたLPCはLPCに基づいて取得されるステップを含む。
第2の態様によれば、帯域幅拡張パラメータを取得するように構成された取得ユニットであって、当該帯域幅拡張パラメータは、以下のパラメータ、即ち、線形予測係数LPC、線スペクトル周波数LSFパラメータ、ピッチ期間、復号化率、適応コードブック寄与、および代数コードブック寄与のうち1つまたは複数を含む、取得ユニットと、取得ユニットにより取得された帯域幅拡張パラメータに従って、帯域幅拡張を復号された低周波信号に対して実施して高周波帯域信号を取得するように構成された帯域幅拡張ユニットとを備えた帯域幅拡張装置が提供される。
第2の態様を参照して、第2の態様の第1の実装方式では、帯域幅拡張ユニットは、帯域幅拡張パラメータに従って高周波エネルギおよび高帯域励起信号を予測するように構成された予測サブユニットと、当該高周波エネルギおよび当該高帯域励起信号に従って高周波帯域信号を取得するように構成された合成サブユニットとを備える。
第2の態様の第1の実装方式を参照して、第2の態様の第2の実装方式では、高周波エネルギは高周波利得を含み、予測サブユニットは特に、LPCに従って当該高周波利得を予測し、LSFパラメータ、適応コードブック寄与、および代数コードブック寄与に従って、高帯域励起信号を適合的に予測するように構成される。
第2の態様の第1の実装方式を参照して、第2の態様の第3の実装方式では、高周波エネルギは高周波利得を含み、予測サブユニットは特に、LPCに従って当該高周波利得を予測し、復号化率、LSFパラメータ、適応コードブック寄与、および代数コードブック寄与に従って高帯域励起信号を適合的に予測するように構成される。
第2の態様の第1の実装方式を参照して、第2の態様の第4の実装方式では、高周波エネルギは高周波利得を含み、予測サブユニットは特に、LPCに従って当該高周波利得を予測し、適応コードブック寄与および代数コードブック寄与に従って高帯域励起信号を適合的に予測するように構成される。
第2の態様の第1の実装方式を参照して、第2の態様の第5の実装方式では、高周波エネルギは高周波利得を含み、予測サブユニットは特に、LPCに従って当該高周波利得を予測し、復号化率、適応コードブック寄与、および代数コードブック寄与に従って高帯域励起信号を適合的に予測するように構成される。
第2の態様の第1の実装方式を参照して、第2の態様の第6の実装方式では、高周波エネルギは高周波エンベロープを含み、予測サブユニットは特に、復号された低周波信号に従って当該高周波エンベロープを予測し、当該復号された低周波信号または低周波励起信号に従って高帯域励起信号を予測するように構成される。当該低周波励起信号は適応コードブック寄与および代数コードブック寄与の和である。
第2の態様の第6の実装方式を参照して、第2の態様の第7の実装方式では、予測サブユニットは特に、復号された低周波信号に従って高周波エンベロープを予測し、復号化率および低周波励起信号に従って高帯域励起信号を予測するように構成される。
第2の態様の第6の実装方式を参照して、第2の態様の第8の実装方式では、予測サブユニットは特に、復号された低周波信号に従って高周波エンベロープを予測し、復号化率および当該復号された低周波信号に従って高帯域励起信号を予測するように構成される。
第2の態様の第1乃至第8の実装方式を参照して、第2の態様の第9の実装方式では、帯域幅拡張ユニットはさらに、高周波エネルギおよび高帯域励起信号が帯域幅拡張パラメータに従って予測された後、当該帯域幅拡張パラメータおよび復号された低周波信号のうち少なくとも1つに従って第1の補正因子を決定し、第1の補正因子に従って高周波エネルギを補正するように構成された第1の補正サブユニットであって、第1の補正因子は、以下のパラメータ、即ち、音声因子、ノイズ・ゲート因子、およびスペクトル傾斜因子のうち1つまたは複数を含む、第1の補正サブユニットを備える。
第2の態様の第9の実装方式を参照して、第2の態様の第10の実装方式では、第1の補正サブユニットは特に、ピッチ期間、適応コードブック寄与、および代数コードブック寄与に従って第1の補正因子を決定し、第1の補正因子に従って高周波エネルギを補正するように構成される。
第2の態様の第9の実装方式を参照して、第2の態様の第11の実装方式では、第1の補正サブユニットは特に、復号された低周波信号に従って第1の補正因子を決定し、第1の補正因子に従って高周波エネルギを補正するように構成される。
第2の態様の第9の実装方式を参照して、第2の態様の第12の実装方式では、第1の補正サブユニットは特に、ピッチ期間、適応コードブック寄与、代数コードブック寄与、および復号された低周波信号に従って第1の補正因子を決定し、第1の補正因子に従って高周波エネルギを補正するように構成される。
第2の態様の第9乃至第12の実装方式を参照して、第2の態様の第13の実装方式では、帯域幅拡張ユニットはさらに、ピッチ期間に従って高周波エネルギを補正するように構成された第2の補正サブユニットを備える。
第2の態様の第9乃至第13の実装方式を参照して、第2の態様の第14の実装方式では、帯域幅拡張ユニットはさらに、帯域幅拡張パラメータおよび復号された低周波信号のうち少なくとも1つに従って第2の補正因子を決定し、第2の補正因子に従って高周波エネルギおよび高帯域励起信号を補正するように構成された第3の補正サブユニットであって、第2の補正因子は分類パラメータおよび信号タイプのうち少なくとも1つを含む、第3の補正サブユニットを備える。
第2の態様の第14の実装方式を参照して、第2の態様の第15の実装方式では、第3の補正サブユニットは特に、帯域幅拡張パラメータに従って第2の補正因子を決定し、第2の補正因子に従って高周波エネルギおよび高帯域励起信号を補正するように構成される。
第2の態様の第14の実装方式を参照して、第2の態様の第16の実装方式では、第3の補正サブユニットは特に、復号された低周波信号に従って第2の補正因子を決定し、第2の補正因子に従って高周波エネルギおよび高帯域励起信号を補正するように構成される。
第2の態様の第14の実装方式を参照して、第2の態様の第17の実装方式では、第3の補正サブユニットは特に、帯域幅拡張パラメータおよび復号された低周波信号に従って第2の補正因子を決定し、第2の補正因子に従って高周波エネルギおよび高帯域励起信号を補正するように構成される。
第2の態様の第9乃至第17の実装方式を参照して、第2の態様の第18の実装方式では、帯域幅拡張ユニットはさらに、予測された高帯域励起信号およびランダム雑音信号を重み付けして最終的な高帯域励起信号を取得するように構成された重み付けサブユニットであって、当該重み付けの重みは、分類パラメータの値および/または復号された低周波信号の音声因子に従って決定される、重み付けサブユニットを備える。
第2の態様の第1乃至第18の実装方式を参照して、第2の態様の第19の実装方式では、合成サブユニットは特に、高周波エネルギおよび高帯域励起信号を合成して高周波帯域信号を取得するか、または、高周波エネルギ、高帯域励起信号、および予測されたLPCを合成して高周波帯域信号を取得するように構成される。当該予測されたLPCは予測された高周波数帯域LPCまたは予測された広帯域LPCを含み、当該予測されたLPCはLPCに基づいて取得される。
本発明の諸実施形態では、帯域幅拡張パラメータを用い、当該帯域幅拡張パラメータを用いることによって、帯域幅拡張を復号された低周波信号に実施し、それにより高周波帯域信号が復元される。本発明の諸実施形態における帯域幅拡張方法および装置を用いて復元された高周波帯域信号は元の高周波帯域信号に近く、その品質は満足できるものである。
本発明の諸実施形態における技術的解決策をより明確に説明するために、以下では本発明の諸実施形態を説明するのに必要な添付図面を簡単に説明する。明らかに、以下の説明における添付図面は本発明の幾つかの実施形態を示すにすぎず、当業者は創作的な努力なしにこれらの添付図面から依然として他の図面を導出することができる。
本発明の1実施形態に従う帯域幅拡張方法の流れ図である。 本発明の1実施形態に従う帯域幅拡張方法の1実装のブロック図である。 本発明の1実施形態に従う時間領域および周波数領域における帯域幅拡張方法の1実装のブロック図である。 本発明の1実施形態に従う周波数領域における帯域幅拡張方法の1実装のブロック図である。 本発明の1実施形態に従う時間領域における帯域幅拡張方法の1実装のブロック図である。 本発明の1実施形態に従う帯域幅拡張装置の略構造図である。 本発明の1実施形態に従う帯域幅拡張装置内の帯域幅拡張ユニットの略構造図である。 本発明の別の実施形態に従う帯域幅拡張装置内の帯域幅拡張ユニットの略構造図である。 本発明の別の実施形態に従う帯域幅拡張装置内の帯域幅拡張ユニットの略構造図である。 本発明の別の実施形態に従う帯域幅拡張装置内の帯域幅拡張ユニットの略構造図である。 本発明の別の実施形態に従う帯域幅拡張装置内の帯域幅拡張ユニットの略構造図である。 本発明の1実施形態に従う復号器の略構造図である。
以下では、本発明の諸実施形態における添付図面を参照して、本発明の諸実施形態における技術的解決策を明確説明する。明らかに、説明する実施形態は本発明の諸実施形態の全部ではなく一部である。当業者が創作的な努力なしに本発明の諸実施形態に基づいて得る他の全ての実施形態は本発明の保護範囲に入るものとする。
本発明の諸実施形態では、復号化率、符号ストリームを直接復号化することにより得られたLPC係数(LSFパラメータ)およびピッチ期間、中間復号化により得られた適応コードブック寄与および代数コードブック寄与、ならびに最終的な復号化により得られた低周波信号のうち任意の1つまたはこれらの一部の組合せに従って帯域幅拡張を低周波信号に実施し、それにより高周波帯域信号が復元される。
以下で、図1を参照して、本発明の1実施形態に従う帯域幅拡張方法を詳細に説明する。当該方法が以下のステップを含んでもよい。
S11:復号器が帯域幅拡張パラメータを取得する。当該帯域幅拡張パラメータは、以下のパラメータ、即ち、線形予測係数(LPC、Linear Predictive Coefficient)、線スペクトル周波数(LSF、Lin Spectral Frequency)パラメータ、ピッチ期間、適応コードブック寄与、および代数コードブック寄与のうち1つまたは複数を含む。
当該復号器を、復号化動作をそこで実施する必要がある携帯電話、タブレット、コンピュータ、テレビ・セット、セットトップ・ボックス、またはゲーム・コンソールのようなハードウェア装置内に配置してもよく、これらのハードウェア装置内のプロセッサの制御下で動作してもよい。当該復号器が独立なハードウェア装置であってもよい。当該ハードウェア装置はプロセッサを備え、当該ハードウェア装置は当該プロセッサの制御下で動作する。
特に、LPCは線形予測フィルタの係数であり、当該線形予測フィルタはサウンド・チャネル・モデルの基本的性質を記述でき、LPCは周波数領域における信号のエネルギ変化傾向も反映する。LSFパラメータはLPCの周波数領域の表示方式である。
さらに、人が有声音を出すとき、気流は声門を通り、声帯に緩和励起振動を生成させ、それにより準周期的なパルス気流が生成される。この気流はサウンド・チャネルを励起し、次いで有声音が生成される。有声音は有音音声とも呼ばれる。有音音声は会話において最も多くのエネルギを伝達する。声帯が振動するそのような周波数は基本周波数と呼ばれ、対応する期間はピッチ期間と呼ばれる。
復号化率とは、会話符号化アルゴリズムにおいては、符号化と復号化が両方とも、前もって設定された速度(bit rate)に従って処理されることを指し、異なる復号化率に対して、パラメータまたは処理方式が異なってもよい。
適応コードブック寄与は、LPCを用いることにより会話信号を分析した後の残差信号内の準周期的な部分である。代数コードブック寄与は、LPCを用いることにより会話信号を分析した後の残差信号内の疑似雑音部分を指す。
ここで、LPCおよびLSFパラメータを、符号ストリームを直接復号化することによって取得してもよく、適応コードブック寄与および代数コードブック寄与を結合して低周波励起信号を取得してもよい。
適応コードブック寄与は、信号の準周期的な成分を反映し、代数コードブック寄与は信号の疑似雑音成分を反映する。
S12:復号器が、帯域幅拡張パラメータに従って、帯域幅拡張を復号された低周波信号に実施して、高周波帯域信号を取得する。
例えば、先ず、高周波エネルギおよび高帯域励起信号が帯域幅拡張パラメータに従って予測され、次いで高周波帯域信号が当該高周波エネルギおよび当該高帯域励起信号に従って取得される。当該高周波エネルギが高周波エンベロープまたは高周波利得を含んでもよい。
さらに、時間領域および周波数領域の差異に関して、高周波エネルギまたは高帯域励起信号の予測に必要な帯域幅拡張パラメータが異なってもよい。
帯域幅拡張が時間領域および周波数領域で実施される場合、帯域幅拡張パラメータに従って高周波エネルギおよび高帯域励起信号を予測するステップが、LPCに従って高周波利得を予測するステップと、LSFパラメータ、適応コードブック寄与、および代数コードブック寄与に従って適合的に高帯域励起信号を予測するステップを含んでもよい。さらに、高帯域励起信号をさらに、復号化率、LSFパラメータ、適応コードブック寄与、および代数コードブック寄与に従って適合的に予測してもよい。
場合によっては、帯域幅拡張が時間領域で実施される場合、帯域幅拡張パラメータに従って高周波エネルギおよび高帯域励起信号を予測するステップが、LPCに従って高周波利得を予測するステップと、適応コードブック寄与および代数コードブック寄与に従って高帯域励起信号を適合的に予測するステップを含んでもよい。さらに、高帯域励起信号をさらに、復号化率、適応コードブック寄与、および代数コードブック寄与に従って適合的に予測してもよい。
場合によっては、帯域幅拡張が周波数領域で実施される場合、帯域幅拡張パラメータに従って高周波エネルギおよび高帯域励起信号を予測するステップが、復号された低周波信号に従って高周波エンベロープを予測するステップと、当該復号された低周波信号または低周波励起信号に従って当該高帯域励起信号を予測するステップとを含んでもよい。ここで、当該低周波励起信号は適応コードブック寄与および代数コードブック寄与の和である。さらに、高帯域励起信号を復号化率および復号された低周波信号に従って予測してもよく、または、高帯域励起信号を復号化率および低周波励起信号に従って予測してもよい。
さらに、帯域幅拡張パラメータに従って高周波エネルギおよび高帯域励起信号を予測した後に、本発明の当該実施形態における帯域幅拡張方法がさらに、当該帯域幅拡張パラメータおよび復号された低周波信号のうち少なくとも1つに従って第1の補正因子を決定するステップであって、第1の補正因子は、以下のパラメータ、即ち、音声因子、ノイズ・ゲート因子、およびスペクトル傾斜因子のうち1つまたは複数を含むステップと、第1の補正因子に従って当該高周波エネルギを補正するステップとを含んでもよい。例えば、当該音声因子または当該ノイズ・ゲート因子を当該帯域幅拡張パラメータに従って決定してもよく、当該スペクトル傾斜因子を復号された低周波信号に従って決定してもよい。
帯域幅拡張パラメータおよび復号された低周波信号に従って第1の補正因子を決定するステップが、当該復号された低周波信号に従って第1の補正因子を決定するステップ、または、ピッチ期間、適応コードブック寄与、および代数コードブック寄与に従って第1の補正因子を決定するステップ、または、ピッチ期間、適応コードブック寄与、代数コードブック寄与、および復号された低周波信号に従って第1の補正因子を決定するステップを含んでもよい。
さらに、本発明の当該実施形態における帯域幅拡張方法がさらに、ピッチ期間に従って高周波エネルギを補正するステップを含んでもよい。
さらに、本発明の当該実施形態における帯域幅拡張方法がさらに、帯域幅拡張パラメータおよび復号された低周波信号のうち少なくとも1つに従って第2の補正因子を決定するステップであって、第2の補正因子は分類パラメータおよび信号タイプのうち少なくとも1つを含むステップと、第2の補正因子に従って高周波エネルギおよび高帯域励起信号を補正するステップとを含んでもよい。
特に、帯域幅拡張パラメータおよび復号された低周波信号のうち少なくとも1つに従って第2の補正因子を決定するステップが、当該帯域幅拡張パラメータに従って第2の補正因子を決定するステップ、または、復号された低周波信号に従って第2の補正因子を決定するステップ、または、当該帯域幅拡張パラメータおよび当該復号された低周波信号に従って第2の補正因子を決定するステップを含んでもよい。
さらに、本発明の当該実施形態における帯域幅拡張方法がさらに、ランダム雑音信号および復号化率に従って高帯域励起信号を補正するステップを含んでもよい。
さらに、高周波エネルギおよび高帯域励起信号に従って高周波帯域信号を取得するステップが、当該高周波エネルギおよび当該高帯域励起信号を合成して高周波帯域信号を取得するステップ、または、当該高周波エネルギ、当該高帯域励起信号、および予測されたLPCを合成して高周波帯域信号を取得するステップを含んでもよい。当該予測されたLPCは予測された高周波数帯域LPCまたは予測された広帯域LPCを含み、当該予測されたLPCはLPCに基づいて取得される。本明細書における広帯域LPCの「広帯域」は低周波数帯域および高周波数帯域を含む。
以上から、本発明の当該実施形態では、帯域幅拡張パラメータを用いて、帯域幅拡張が復号された低周波信号に対して実施され、それにより高周波帯域信号が復元されることが分かる。本発明の当該実施形態における帯域幅拡張方法を用いて復元された高周波帯域信号は元の高周波帯域信号に近く、その品質は満足できるものである。
即ち、本発明の当該実施形態における帯域幅拡張方法では高周波エネルギが、符号ストリームを直接復号化することにより得られた低周波数パラメータ、中間復号化パラメータ、または最終的な復号化により得られた低周波信号を十分に使用することによって予測され、高帯域励起信号が低周波励起信号に従って適合的に予測され、その結果、最後に出力された高周波帯域信号は元の高周波帯域信号により近く、それにより出力信号の品質が向上する。
以下で、添付図面を参照して本発明の具体的な諸実施形態を詳細に説明する。
先ず、図2は本発明の具体的な実施形態に従う帯域幅拡張方法の略流れ図を示す。
図2に示すように、先ず、音声因子、ノイズ・ゲート因子、スペクトル傾斜因子、および分類パラメータの値のうち任意の1つまたはこれらの一部の組合せを、復号化率、符号ストリームを直接復号化することにより得られたLPC(またはLSFパラメータ)およびピッチ期間、中間復号化により得られた適応コードブック寄与および代数コードブック寄与のようなパラメータ、および最終的な復号化により得られた低周波信号のうち任意の1つまたはこれらの一部の組合せに従って計算する。音声因子は、適応コードブック寄与の代数コードブック寄与に対する割合であり、ノイズ・ゲート因子は信号背景雑音の大きさを表すために使用されるパラメータであり、スペクトル傾斜因子は、信号スペクトル傾斜の程度または異なる周波数帯の間の信号のエネルギ変化傾向を表すために使用される。分類パラメータは信号タイプを区別するために使用されるパラメータである。次に、高周波数帯域LPCまたは広帯域LPC、高周波エネルギ(例えば、高周波利得、または高周波エンベロープ)、および高帯域励起信号が予測される。最後に、高周波帯域信号が、予測された高周波エネルギおよび高帯域励起信号を用いることによって、または予測された高周波エネルギおよび高帯域励起信号、および予測されたLPCを用いることによって、合成される。
特に、高周波数帯域LPCまたは広帯域LPCを復号化により得られたLPCに従って予測してもよい。高周波エンベロープまたは高周波利得を以下のように予測してもよい。
例えば、高周波利得または高周波エンベロープは、予測されたLPCおよび復号化によって得られたLPC、または、復号された低周波信号の高周波数および低周波数の間の関係を用いることによって予測される。
あるいは、例えば、様々な信号タイプに対して、様々な補正因子を計算して、予測された高周波利得または高周波エンベロープを補正する。例えば、当該予測された高周波エンベロープまたは高周波利得を、復号された低周波信号の分類パラメータ、スペクトル傾斜因子、音声因子、およびノイズ・ゲート因子のうち任意の1つの重み付けされた値またはそれらの幾つかの重み付けされた値を用いて、補正してもよい。あるいは、ピッチ期間が安定な信号に対して、予測された高周波エンベロープをさらに、ピッチ期間を用いて補正してもよい。
高帯域励起信号を以下のように予測してもよい。
例えば、異なる復号化率または異なる種類の信号に対して、高帯域励起信号が、異なる周波数帯を有する低周波信号を適合的に選択することによって予測され、復号化により、または、異なる予測アルゴリズムを用いることにより得られる。
さらに、予測された高帯域励起信号およびランダム雑音信号を重み付けして、最終的な高帯域励起信号を取得する。重みは、分類パラメータの値および/または復号された低周波信号の音声因子に従って決定される。
最後に、高周波帯域信号が、予測された高周波エネルギおよび高帯域励起信号を用いることによって、または、予測された高周波エネルギおよび高帯域励起信号、および予測されたLPCを用いることによって、合成される。
以上から、本発明の当該実施形態における帯域幅拡張方法では、高周波エネルギが、符号ストリームを直接復号化することにより得られた低周波数パラメータ、中間復号化パラメータ、または最終的な復号化により得られた低周波信号を十分に使用することによって予測され、高帯域励起信号が低周波励起信号に従って適合的に予測され、その結果、最後に出力される高周波帯域信号は元の高周波帯域信号により近く、それにより出力信号の品質が向上することが分かる。
時間領域および周波数領域の差異に関して、本発明の当該実施形態における帯域幅拡張方法の具体的な実装プロセスが異なってもよい。以下では、図3乃至図5を参照して、時間領域および周波数領域に対する具体的な実施形態、周波数領域に対する具体的な実施形態、および時間領域に対する具体的な実施形態を別々に説明する。
図3に示すように、時間領域および周波数領域で帯域幅拡張を実施する具体的な実装プロセスにおいて、先ず、広帯域LPCが復号化によって得られたLPCに従って予測される。
次に、高周波利得が、予測された広帯域LPCおよび復号化によって得られたLPCの間の関係を用いることによって予測される。さらに、様々な信号タイプに対して、予測された高周波利得を補正するために様々な補正因子が計算される。例えば、当該予測された高周波利得は復号された低周波信号の分類パラメータ、スペクトル傾斜因子、音声因子、およびノイズ・ゲート因子を用いることによって補正される。補正された高周波利得は、最小ノイズ・ゲート因子ng_minに比例し、分類パラメータの値fmeritに比例し、スペクトル傾斜因子tiltの逆数に比例し、音声因子voice_facに反比例する。この場合、より大きな高周波利得はより小さなスペクトル傾斜因子を示し、より大きな背景雑音はより大きなノイズ・ゲート因子を示し、より強い会話特性はより大きい分類パラメータの値を示す。例えば、補正された高周波利得 = gain * (1-tilt) * fmerit * (30+ng_min) * (1.6-voice_fac)である。ここで、各フレームで評価されるノイズ・ゲート因子を所与の閾値と比較する必要がある。したがって、各フレームで評価されたノイズ・ゲート因子が所与の閾値より小さいとき、最小ノイズ・ゲート因子は、各フレームで評価されたノイズ・ゲート因子と等しく、そうでない場合は、最小ノイズ・ゲート因子は当該所与の閾値に等しい。
さらに、異なる復号化率または異なる種類の信号に対して、高帯域励起信号が、異なる周波数帯を有する低周波信号を適合的に選択することによって予測され、復号化により、または、異なる予測アルゴリズムを用いることにより得られる。例えば、復号化率が所与の値より大きいとき、高周波帯域信号に隣接する周波数帯を有する低周波励起信号(適応コードブック寄与および代数コードブック寄与の和)が当該高帯域励起信号として使用され、そうでない場合は、符号化品質が良好である(即ち、LSFパラメータの間の差分値が小さい)周波数帯を有する信号がLSFパラメータの間の差分値を用いることによって当該高帯域励起信号として低周波励起信号から適合的に選択される。異なる復号器が異なる所与の値を選択してもよいことは理解される。例えば、適応マルチレート広帯域(AMR−WB、Adaptive Multi−Rate Wideband)コーデックは12.65kbps、15.85kbps、18.25kbps、19.85kbps、23.05kbps、および23.85kbpsのような復号化率をサポートし、次いでAMR−WBコーデックは19.85kbpsを所与の値として選択してもよい。
ISFパラメータ(ISFパラメータは1群の数値であり、LPC係数のオーダと同じである)はLPC係数の周波数領域の表現方式であり、当該周波数領域における会話/オーディオ信号のエネルギ変化を反映する。ISFの値は大まかに、会話/オーディオ信号の低周波数から高周波数までの周波数帯全体に対応し、ISFパラメータの各値は1つの対応する周波数値に対応する。
本発明の1実施形態では、符号化品質が良好である(即ち、LSFパラメータの間の差分値がより小さい)周波数帯を有する信号がLSFパラメータの間の差分値を用いることによって高帯域励起信号として低周波励起信号から適合的に選択されることが、各2つのLSFパラメータの間の差分値を計算して、LSFパラメータの1群の差分値を取得すること、最小差分値を検索し、LSFパラメータに対応する周波数ビンを当該最小差分値に従って決定すること、および、周波数帯を有する周波数領域励起信号を、当該周波数ビンに従う周波数領域励起信号から選択し、高周波数帯域を有する励起信号として使用することを含んでもよい。複数の選択方式がある。当該周波数ビンがF1である場合は、必要とされる長さの周波数帯を有する信号を周波数ピンF1−Fから選択してもよく、高帯域励起信号として使用される。F>=0であり、特に選択された長さは、復元する必要がある高周波帯域信号の帯域幅と信号特徴に従って決定される。
さらに、符号化品質が良好である周波数帯を低周波励起信号から適合的に選択するとき、音楽信号または会話信号に対して、異なる最小開始選択周波数ビンを選択する。例えば、会話信号に対して、当該選択を2乃至6kHzの範囲から適合的に実施してもよく、音楽信号に対しては、当該選択を1乃至6kHzの範囲から適合的に実施してもよい。予測された高帯域励起信号およびランダム雑音信号をさらに重み付けして、最終的な高帯域励起信号を取得してもよい。当該重み付けの重みは、分類パラメータの値および/または低周波信号の音声因子に従って決定される。
Figure 0006423420
ここで、exc[n]は予測された高帯域励起信号であり、random[n]はランダム雑音信号であり、αは予測された高帯域励起信号の重みであり、βはランダム雑音信号の重みであり、γは予測された高帯域励起信号の重みがαに計算されたときに事前設定される値であり、fmeritは分類パラメータの値であり、voice_facは音声因子である。
信号分類方法は様々であり、したがって高帯域励起信号は、様々な周波数帯を有する低周波信号を適合的に選択することにより予測され、復号化により、または、様々な予測アルゴリズムを用いることにより得られることは容易に理解される。例えば、信号を会話信号および音楽信号に分類してもよい。会話信号をさらに無声音、有声音、および遷移音に分類してもよい。あるいは、当該信号をさらに過渡信号および非過渡信号等に分類してもよい。
最後に、高周波帯域信号が、予測された高周波利得および高帯域励起信号、および予測されたLPCを用いることによって合成される。当該高帯域励起信号は予測された高周波利得を用いることによって補正され、次いで、補正された高帯域励起信号がLPC合成フィルタを通過して、最後に出力される高周波帯域信号を取得するか、または、当該高帯域励起信号がLPC合成フィルタを通過して、高周波帯域信号を取得し、次いで、当該高周波帯域信号が当該高周波利得を用いることによって補正され、最後に出力される高周波帯域信号を取得する。LPC合成フィルタは線形フィルタであり、したがって合成前の補正は合成後の補正と同じである。即ち、高周波利得を用いた合成前の高帯域励起信号の補正結果は、高周波利得を用いた合成後の高帯域励起信号の補正結果と同じであり、したがって、補正に関する順序はない。
ここで、合成プロセスでは、周波数領域の取得された高帯域励起信号を時間領域の高帯域励起信号に変換し、時間領域の高帯域励起信号および時間領域の高周波利得を合成フィルタの入力として使用し、予測されたLPC係数を合成フィルタの係数として使用し、それにより合成された高周波帯域信号を取得する。
以上から、本発明の当該実施形態における帯域幅拡張方法では、高周波エネルギは、符号ストリームを直接復号化することにより得られた低周波数パラメータ、中間復号化パラメータ、または最終的な復号化により得られた低周波信号を十分に使用することによって予測され、高帯域励起信号は低周波励起信号に従って適合的に予測され、その結果、最後に出力される高周波帯域信号は元の高周波帯域信号により近く、それにより出力信号の品質が向上することが分かる。
図4に示すように、周波数領域で帯域幅拡張を実施する具体的な実装プロセスにおいて、先ず、高周波数帯域LPCが復号化によって得られたLPCに従って予測される。
次に、拡張する必要がある高周波帯域信号をM個のサブバンドに分割し、当該M個のサブバンドの高周波エンベロープを予測する。例えば、当該高周波帯域信号に隣接するN個の周波数帯が復号された低周波信号から選択され、当該N個の周波数帯のエネルギまたは振幅が計算され、当該M個のサブバンドの高周波エンベロープが当該N個の周波数帯のエネルギまたは振幅の間のサイズ関係に従って予測される。ここで、MとNは両方とも予め設定された値である。例えば、高周波帯域信号はM=2個のサブバンドに分割され、当該高周波帯域信号に隣接するN=2または4個のサブバンドが選択される。
さらに、予測された高周波エンベロープを、復号された低周波信号の分類パラメータ、ピッチ期間、当該低周波信号の高周波数および低周波数の間のエネルギまたは振幅比率、音声因子、およびノイズ・ゲート因子を用いて補正する。ここで、高周波数および低周波数が、異なる低周波信号に対して異なって分割されてもよい。例えば、低周波信号の帯域幅が6kHzである場合には、0乃至3kHzおよび3乃至6kHzをそれぞれ当該低周波信号の低周波数および高周波数として使用してもよく、または、0乃至4kHzおよび4乃至6kHzをそれぞれ当該低周波信号の低周波数および高周波数として使用してもよい。
補正された高周波エンベロープは、最小ノイズ・ゲート因子ng_minに比例し、分類パラメータの値fmeritに比例し、スペクトル傾斜因子tiltの逆数に比例し、音声因子voice_facに反比例する。さらに、ピッチ期間pitchが安定な信号に対して、補正された高周波エンベロープは当該ピッチ期間に比例する。この場合、より大きな高周波エネルギはより小さなスペクトル傾斜因子を示し、より大きな背景雑音はより大きなノイズ・ゲート因子を示し、より強い会話特性はより大きい分類パラメータの値を示す。例えば、補正された高周波エンベロープは、
gain*=(1-tilt)*fmerit*(30+ng_min)*(1.6-voice_fac)*(pitch/100)
である。
次に、復号化率が所与の閾値以上であるとき、高周波帯域信号に隣接する低周波信号の周波数帯を選択して高帯域励起信号を予測するか、または、復号化率が所与の閾値未満であるとき、符号化品質が良好であるサブバンドを適合的に選択して高帯域励起信号を予測する。ここで、当該所与の閾値が経験値であってもよい。
さらに、予測された高帯域励起信号がランダム雑音信号を用いて重み付けされ、重み付けされた値が低周波信号の分類パラメータにより決定される。当該ランダム雑音信号の重みは、当該低周波信号の分類パラメータのサイズに比例する。即ち、
Figure 0006423420
である。
ここで、exc[n]は予測された高帯域励起信号であり、random[n]はランダム雑音信号であり、αは予測された高帯域励起信号の重みであり、βはランダム雑音信号の重みであり、γは予測された高帯域励起信号の重みがαに計算されたときに事前設定される値であり、fmeritは分類パラメータの値である。
最後に、高周波帯域信号が、予測された高周波エンベロープおよび高帯域励起信号を用いることによって合成される。
ここで、合成プロセスが、周波数領域の高帯域励起信号に当該周波数領域の高周波エンベロープを直接乗じて、合成された高周波帯域信号を取得するものであってもよい。
以上から、本発明の当該実施形態における帯域幅拡張方法では、高周波エネルギは、符号ストリームを直接復号化することにより得られた低周波数パラメータ、中間復号化パラメータ、または最終的な復号化により得られた低周波信号を十分に使用することによって予測され、高帯域励起信号は低周波励起信号に従って適合的に予測され、その結果、最後に出力される高周波帯域信号は元の高周波帯域信号により近く、それにより出力信号の品質が向上することが分かる。
図5に示すように、時間領域で帯域幅拡張を実施する具体的な実装プロセスにおいて、先ず、広帯域LPCが復号化によって得られたLPCに従って予測される。
次に、拡張する必要がある高周波帯域信号をM個のサブフレームに分割し、当該M個のサブフレームの高周波利得を、予測された広帯域LPCおよび復号化によって得られたLPCの間の関係を用いて予測する。
次に、現在のサブフレームの高周波利得が、現在のサブフレームまたは現在のフレームの低周波信号または低周波励起信号を用いることによって予測される。
さらに、予測された高周波利得が、復号された低周波信号の分類パラメータ、ピッチ期間、当該低周波信号の高周波数および低周波数の間のエネルギまたは振幅比率、音声因子、およびノイズ・ゲート因子を用いることによって補正される。補正された高周波利得は、最小ノイズ・ゲート因子ng_minに比例し、分類パラメータの値fmeritに比例し、スペクトル傾斜因子tiltの逆数に比例し、音声因子voice_facに反比例する。さらに、ピッチ期間pitchが安定な信号に対しては、補正された高周波利得は当該ピッチ期間に比例する。この場合、より大きな高周波エネルギはより小さなスペクトル傾斜因子を示し、より大きな背景雑音はより大きなノイズ・ゲート因子を示し、より強い会話特性はより大きい分類パラメータの値を示す。例えば、補正された高周波利得は、
gain*=(1-tilt)*fmerit*(30+ng_min)*(1.6-voice_fac)*(pitch/100)
である。ここで、tiltはスペクトル傾斜因子であり、fmeritは分類パラメータの値であり、ng_minは最小ノイズ・ゲート因子であり、voice_facは音声因子であり、pitchはピッチ期間である。
次に、復号化率が所与の閾値以上であるとき、高周波帯域信号に隣接する復号された低周波信号の周波数帯を選択して高帯域励起信号を予測するか、または、復号化率が所与の閾値未満であるとき、符号化品質が良好である周波数帯を適合的に選択して高帯域励起信号を予測する。即ち、高周波帯域信号に隣接する周波数帯を有する低周波励起信号(適応コードブック寄与および代数コードブック寄与)を当該高帯域励起信号として使用してもよい。
さらに、予測された高帯域励起信号がランダム雑音信号を用いて重み付けされ、重み付けされた値が、低周波信号の分類パラメータおよび音声因子の重み付けされた値により決定される。
最後に、高周波帯域信号が、予測された高周波利得および高帯域励起信号、および予測されたLPCを用いることによって合成される。
ここで、合成プロセスが、時間領域の高帯域励起信号および時間領域の高周波利得を合成フィルタの入力として使用し、予測されたLPC係数を合成フィルタの係数として使用し、それにより合成された高周波帯域信号を取得するというものであってもよい。
以上から、本発明の当該実施形態における帯域幅拡張方法では、高周波エネルギは、符号ストリームを直接復号化することにより得られた低周波数パラメータ、中間復号化パラメータ、または最終的な復号化により得られた低周波信号を十分に使用することによって予測され、高帯域励起信号は低周波励起信号に従って適合的に予測され、その結果、最後に出力される高周波帯域信号は元の高周波帯域信号により近く、それにより出力信号の品質が向上することが分かる。
図6乃至図11は本発明の1実施形態に従う帯域幅拡張装置の構造図を示す。図6に示すように、帯域幅拡張装置60は、取得ユニット61と帯域幅拡張ユニット62を備える。取得ユニット61は、帯域幅拡張パラメータを取得するするように構成される。当該帯域幅拡張パラメータは、以下のパラメータ、即ち、線形予測係数LPC、線スペクトル周波数LSFパラメータ、ピッチ期間、復号化率、適応コードブック寄与、および代数コードブック寄与のうち1つまたは複数を含む。帯域幅拡張ユニット62は、取得ユニット61により取得された帯域幅拡張パラメータに従って、帯域幅拡張を復号された低周波信号に実施して、高周波帯域信号を取得するように構成される。
さらに、図7に示すように、帯域幅拡張ユニット62は、予測サブユニット621と合成サブユニット622を備える。予測サブユニット621は、帯域幅拡張パラメータに従って高周波エネルギおよび高帯域励起信号を予測するように構成される。合成サブユニット622は、当該高周波エネルギおよび当該高帯域励起信号に従って高周波帯域信号を取得するように構成される。特に、合成サブユニット622は、高周波エネルギおよび高帯域励起信号を合成して高周波帯域信号を取得するか、または、高周波エネルギ、高帯域励起信号、および予測されたLPCを合成して高周波帯域信号を取得するように構成される。当該予測されたLPCは予測された高周波数帯域LPCまたは予測された広帯域LPCを含み、当該予測されたLPCはLPCに基づいて取得される。
特に、高周波エネルギは高周波利得を含み、予測サブユニット621は、LPCに従って高周波利得を予測し、LSFパラメータ、適応コードブック寄与、および代数コードブック寄与に従って、高帯域励起信号を適合的に予測するように構成される。
あるいは、高周波エネルギは高周波利得を含み、予測サブユニット621は、LPCに従って高周波利得を予測し、復号化率、LSFパラメータ、適応コードブック寄与、および代数コードブック寄与に従って高帯域励起信号を適合的に予測するように構成される。
あるいは、高周波エネルギは高周波利得を含み、予測サブユニット621は、LPCに従って高周波利得を予測し、適応コードブック寄与および代数コードブック寄与に従って高帯域励起信号を適合的に予測するように構成される。
あるいは、高周波エネルギは高周波利得を含み、予測サブユニット621は、LPCに従って高周波利得を予測し、復号化率、適応コードブック寄与、および代数コードブック寄与に従って高帯域励起信号を適合的に予測するように構成される。
あるいは、高周波エネルギは高周波エンベロープを含み、予測サブユニット621は、復号された低周波信号に従って当該高周波エンベロープを予測し、当該復号された低周波信号または低周波励起信号に従って高帯域励起信号を予測するように構成される。当該低周波励起信号は適応コードブック寄与および代数コードブック寄与の和である。
あるいは、高周波エネルギは高周波エンベロープを含み、予測サブユニット621は、復号された低周波信号に従って当該高周波エンベロープを予測し、復号化率および当該復号された低周波信号に従って高帯域励起信号を予測するように構成される。
あるいは、高周波エネルギは高周波エンベロープを含み、予測サブユニット621は、復号された低周波信号に従って当該高周波エンベロープを予測し、復号化率および当該低周波励起信号に従って高帯域励起信号を予測するように構成される。
さらに、帯域幅拡張ユニット62はさらに、図8に示すように、第1の補正サブユニット623を備える。第1の補正サブユニット623は、高周波エネルギおよび高帯域励起信号が帯域幅拡張パラメータに従って予測された後、当該帯域幅拡張パラメータおよび復号された低周波信号のうち少なくとも1つに従って第1の補正因子を決定し、第1の補正因子に従って当該高周波エネルギを補正するように構成される。第1の補正因子は、以下のパラメータ、即ち、音声因子、ノイズ・ゲート因子、およびスペクトル傾斜因子のうち1つまたは複数を含む。
特に、第1の補正サブユニット623は、ピッチ期間、適応コードブック寄与、および代数コードブック寄与に従って第1の補正因子を決定し、第1の補正因子に従って高周波エネルギを補正するように構成される。あるいは、第1の補正サブユニットは特に、復号された低周波信号に従って第1の補正因子を決定し、第1の補正因子に従って高周波エネルギを補正するように構成される。あるいは、第1の補正サブユニットは特に、ピッチ期間、適応コードブック寄与、代数コードブック寄与、および復号された低周波信号に従って第1の補正因子を決定し、第1の補正因子に従って当該高周波エネルギを補正するように構成される。
さらに、帯域幅拡張ユニット62はさらに、図9に示すように、ピッチ期間に従って高周波エネルギを補正するように構成された第2の補正サブユニット624を備える。
さらに、帯域幅拡張ユニット62はさらに、図10に示すように、帯域幅拡張パラメータおよび復号された低周波信号のうち少なくとも1つに従って第2の補正因子を決定し、第2の補正因子に従って高周波エネルギおよび高帯域励起信号を補正するように構成された第3の補正サブユニット625を備える。第2の補正因子は分類パラメータおよび信号タイプのうち少なくとも1つを含む。
特に、第3の補正サブユニット625は、帯域幅拡張パラメータに従って第2の補正因子を決定し、第2の補正因子に従って高周波エネルギおよび高帯域励起信号を補正するように構成される。あるいは、第3の補正サブユニット625は、復号された低周波信号に従って第2の補正因子を決定し、第2の補正因子に従って高周波エネルギおよび高帯域励起信号を補正するように構成される。第3の補正サブユニット625は、帯域幅拡張パラメータおよび復号された低周波信号に従って第2の補正因子を決定し、第2の補正因子に従って高周波エネルギおよび高帯域励起信号を補正するように構成される。
さらに、帯域幅拡張ユニット62はさらに、図11に示すように、予測された高帯域励起信号およびランダム雑音信号を重み付けして最終的な高帯域励起信号を取得するように構成された重み付けサブユニット626を備える。当該重み付けの重みは、分類パラメータの値および/または復号された低周波信号の音声因子に従って決定される。
本発明の1実施形態では、帯域幅拡張装置60がさらにプロセッサを備えてもよい。当該プロセッサは、当該帯域幅拡張装置に含まれたユニットを制御するように構成される。
以上から、本発明の当該実施形態における帯域幅拡張装置は、符号ストリームを直接復号化することにより得られた低周波数パラメータ、中間復号化パラメータ、または最終的な復号化により得られた低周波信号を十分に使用することによって高周波エネルギを予測し、低周波励起信号に従って高帯域励起信号を適合的に予測し、その結果、最後に出力される高周波帯域信号は元の高周波帯域信号により近く、それにより出力信号の品質が向上することが分かる。
図12は本発明の1実施形態に従う復号器120の略構造図を示す。復号器120はプロセッサ121とメモリ122を備える。
プロセッサ121は本発明の1実施形態における帯域幅拡張方法を実装する。即ち、プロセッサ121は、帯域幅拡張パラメータを取得し、当該帯域幅拡張パラメータに従って、帯域幅拡張を復号された低周波信号に実施して、高周波帯域信号を取得するように構成される。当該帯域幅拡張パラメータは、以下のパラメータ、即ち、線形予測係数LPC、線スペクトル周波数LSFパラメータ、ピッチ期間、復号化率、適応コードブック寄与、および代数コードブック寄与のうち1つまたは複数を含む。メモリ122は、プロセッサ121により実行される命令を格納するように構成される。
本発明の各請求項で説明する解決策はまた、1実施形態として考えるべきであり、当該請求項における特徴であり、組み合わせてもよいことは理解されるべきである。例えば、本発明における決定ステップの後に実施される別の分岐ステップを別の実施形態において使用してもよい。
本明細書で開示した実施形態で説明した例と組み合わせて、ユニットおよびアルゴリズムのステップを電子ハードウェアまたはコンピュータ・ソフトウェアおよび電子ハードウェアの組合せで実装してもよいことは当業者には認識される。当該機能をハードウェアで実施するかまたはソフトウェアで実施するかは、技術的解決策の特定の適用および設計制約条件に依存する。当業者は異なる方法を使用して、説明した機能を特定の適用ごとに実装してもよいが、当該実装が本発明の範囲を超えるとは考えるべきではない。
説明の便宜および簡単さの目的のため、以上のシステム、装置、およびユニットの詳細な動作プロセスについては、上述の方法の実施形態における対応するプロセスを参照でき、詳細についてはここで再度説明しないことは当業者により明らかに理解される。
本願で提供した幾つかの実施形態では、開示したシステム、装置、および方法を他の方式で実装してもよいことは理解されるべきである。例えば、説明した装置の実施形態は例示的なものにすぎない。例えば、ユニット分割は論理的な機能分割にすぎず、実際の実装では他の分割であってもよい。例えば、複数のユニットまたはコンポーネントを組み合わせるかまたは別のシステムに統合してもよく、または、幾つかの特徴を無視するかまたは実施しなくてもよい。さらに、表示または議論した相互結合または直接結合または通信接続を、幾つかのインタフェースを用いて実装してもよい。当該装置またはユニットの間の間接結合または通信接続を電子、機械、または他の形態で実装してもよい。
別々の部分として説明したユニットが物理的に別々であってもなくてもよく、ユニットとして表示した部分が物理ユニットであってもなくてもよく、1つの位置に配置してもよく、または、複数のネットワーク単位に分散させてもよい。当該ユニットの一部または全部を、実際のニーズに従って選択して諸実施形態の解決策の目的を達成してもよい。
さらに、本発明の諸実施形態の機能ユニットを1つの処理ユニットに統合してもよく、または、当該ユニットの各々が物理的に単体で存在してもよく、または、2つ以上のユニットが1つのユニットに統合される。
当該機能をソフトウェア機能ユニットの形で実装し独立な製品として販売または利用するとき、当該機能をコンピュータ可読記憶媒体に格納してもよい。かかる理解に基づいて、本発明の技術的解決策を本質的に、または先行技術に貢献する部分、または技術的解決策の一部を、ソフトウェア製品の形で実装してもよい。当該コンピュータ・ソフトウェア製品は記憶媒体に格納され、本発明の諸実施形態で説明した方法のステップの全部または一部を実施するようにコンピュータ装置(パーソナル・コンピュータ、サーバ、またはネットワーク装置であってもよい)に指示するための幾つかの命令を含む。以上の記憶媒体は、USBフラッシュ・ドライブ、取外し可能ハード・ディスク、読取り専用メモリ(ROM、Read−Only Memory)、ランダム・アクセス・メモリ(RAM、Random Access Memory)、磁気ディスク、または光ディスクのような、プログラムコードを格納できる任意の媒体を含む。
以上の説明は本発明の特定の実装方式にすぎず、本発明の保護範囲の限定を意図するものではない。本発明で開示した技術的範囲内で当業者により容易に想到される任意の変形または置換えは本発明の保護範囲内に入るものとする。したがって、本発明の保護範囲は特許請求の範囲の保護範囲の対象となる。
61 取得ユニット
62 帯域幅拡張ユニット
621 予測サブユニット
622 合成サブユニット
623 第1の補正サブユニット
624 第2の補正サブユニット
625 第3の補正サブユニット
626 重み付けサブユニット
121 プロセッサ
122 メモリ

Claims (13)

  1. 帯域幅拡張パラメータを取得するステップであって、前記帯域幅拡張パラメータは、以下のパラメータ、即ち、線形予測係数(LPC)、線スペクトル周波数(LSF)パラメータ、ピッチ期間、復号化率、適応コードブック寄与、および代数コードブック寄与のうち1つまたは複数を含む、ステップと、
    前記帯域幅拡張パラメータに従って高周波利得および高帯域励起信号を予測するステップと、
    前記高周波利得および前記高帯域励起信号に従って高周波帯域信号を取得するステップと、
    を含み
    前記帯域幅拡張パラメータに従って高周波利得および高帯域励起信号を予測するステップは、
    前記LPCに従って前記高周波利得を予測するステップと、
    前記復号化率が所与の値より小さい場合、前記LSFパラメータの2つのLSFパラメータごとの差分値を計算することと、より小さい差分値を有する2つのLSFパラメータに対応する低周波帯域励起信号の周波数範囲から、周波数帯域を選択することで前記高帯域励起信号を予測するステップであって、前記低周波帯域励起信号は前記適応コードブック寄与と前記代数コードブック寄与の合計として表される、ステップと、
    を含む、帯域幅拡張方法。
  2. 前記高帯域励起信号を予測するステップは、
    2つのLSFパラメータごとの差分値を計算して、1群のLSFパラメータ差分値を取得するステップと、
    前記1群のLSFパラメータ差分値から最小差分値を検索するステップと、
    前記最小差分値を有する前記LSFパラメータに対応する周波数ビンを決定するステップと、
    前記周波数ビンに従って周波数領域内の低周波帯域励起信号から周波数帯域を有する周波数領域励起信号を選択するステップであって、前記周波数ビンは、前記選択された周波数領域励起信号の開始点であり、前記選択された周波数領域励起信号は前記高帯域励起信号として使用される、ステップと、
    含む、請求項1に記載の方法。
  3. 前記帯域幅拡張パラメータに従って高周波利得および高帯域励起信号を予測した後に、前記方法はさらに、
    第1の補正因子に従って前記高周波利得を補正するステップであって、前記第1の補正因子は以下のパラメータ、即ち、復号化された低周波信号の音声因子、ノイズ・ゲート因子、およびスペクトル傾斜因子のうち1つまたは複数を含み、前記ノイズ・ゲート因子は、前記復号化された低周波信号の背景の雑音の大きさを表すために使用されるパラメータである、ステップと、
    を含む、請求項1または2に記載の方法。
  4. 前記高周波利得および前記高帯域励起信号を第2の補正因子に従って補正するステップであって、前記第2の補正因子は前記復号化された低周波信号の分類パラメータおよび信号タイプのうち少なくとも1つを含み、前記分類パラメータは、信号タイプを区別するために使用されるパラメータである、ステップと、
    をさらに含む、請求項3に記載の方法。
  5. 前記予測された高帯域励起信号およびランダム雑音信号に重み付けして、最終的な高帯域励起信号を取得するステップであって、前記重み付けの重みは、分類パラメータの値および/または前記復号化された低周波信号の音声因子に従って決定されるステップをさらに含む、請求項3または4に記載の方法。
  6. 記高周波利得および前記高帯域励起信号に従って高周波帯域信号を取得するステップは、
    前記予測された高周波利得を用いて前記高帯域励起信号を補正して、補正された高帯域励起信号を取得するステップと、
    LPC合成フィルタを用いて前記補正された高帯域励起信号をフィルタして、前記高周波帯域信号を取得するステップと、
    を含む、請求項1乃至5の何れか1項に記載の方法。
  7. 帯域幅拡張パラメータを取得するように構成された取得ユニットであって、前記帯域幅拡張パラメータは、以下のパラメータ、即ち、線形予測係数(LPC)、線スペクトル周波数(LSF)パラメータ、ピッチ期間、復号化率、適応コードブック寄与、および代数コードブック寄与のうち1つまたは複数を含む、取得ユニットと、
    前記取得ユニットにより取得された前記帯域幅拡張パラメータに従って、帯域幅拡張を復号された低周波信号に実施して、高周波帯域信号を取得するように構成された帯域幅拡張ユニットと、
    を備え、
    前記帯域幅拡張ユニットは、
    前記帯域幅拡張パラメータに従って高周波利得および高帯域励起信号を予測するように構成された予測サブユニットと、
    前記高周波利得および前記高帯域励起信号に従って高周波帯域信号を取得するように構成された合成サブユニットと、
    を備え
    前記予測サブユニットは、
    前記LPCに従って前記高周波利得を予測し、
    前記復号化率が所与の値より小さい場合、前記LSFパラメータの2つのLSFパラメータごとの差分値を計算することと、低周波帯域励起信号の周波数範囲から、周波数帯域を選択することで前記高帯域励起信号を予測する
    ように構成され、
    前記選択された周波数は、より小さい差分値を有する2つのLSFパラメータに対応し、前記低周波帯域励起信号は前記適応コードブック寄与と前記代数コードブック寄与の合計として表される、
    帯域幅拡張装置。
  8. 前記予測サブユニットは、
    2つのLSFパラメータごとの差分値を計算して、1群のLSFパラメータ差分値を取得し、
    前記1群のLSFパラメータ差分値から最小差分値を検索し、
    前記最小差分値を有する前記LSFパラメータに対応する周波数ビンを決定し
    前記周波数ビンに従って周波数領域内の低周波帯域励起信号から周波数帯域を有する周波数領域励起信号を選択する
    ように構成され、
    前記周波数ビンは、前記選択された周波数領域励起信号の開始点であり、前記選択された周波数領域励起信号は前記高帯域励起信号として使用される、
    請求項7に記載の装置。
  9. 前記帯域幅拡張ユニットはさらに、第1の補正因子に従って前記高周波利得を補正するように構成された第1の補正サブユニットを備え、前記第1の補正因子は以下のパラメータ、即ち、復号化された低周波信号の音声因子、ノイズ・ゲート因子、およびスペクトル傾斜因子のうち1つまたは複数を含み、前記ノイズ・ゲート因子は、前記復号化された低周波信号の背景の雑音の大きさを表すために使用されるパラメータである、請求項7または8に記載の装置。
  10. 前記帯域幅拡張ユニットはさらに、前記高周波利得および前記高帯域励起信号を第2の補正因子に従って補正し、前記第2の補正因子は前記復号化された低周波信号の分類パラメータおよび信号タイプのうち少なくとも1つを含み、前記分類パラメータは、信号タイプを区別するために使用されるパラメータである、請求項9に記載の装置。
  11. 前記帯域幅拡張ユニットはさらに、前記予測された高帯域励起信号およびランダム雑音信号を重み付けして最終的な高帯域励起信号を取得するように構成された重み付けサブユニットを備え、前記重み付けの重みは、分類パラメータの値および/または前記復号された低周波信号の音声因子に従って決定される、請求項9または10に記載の装置。
  12. 前記合成サブユニットは、
    前記予測された高周波利得を用いて前記高帯域励起信号を補正して、補正された高帯域励起信号を取得し、
    LPC合成フィルタを用いて前記補正された高帯域励起信号をフィルタして、前記高周波帯域信号を取得する
    ように構成される、請求項7乃至11の何れか1項に記載の装置。
  13. 請求項1乃至6の何れか1項に記載の方法をコンピュータに実行させる、プログラム。
JP2016517362A 2013-09-26 2014-04-15 帯域幅拡張方法および装置 Active JP6423420B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201310444398.3 2013-09-26
CN201310444398.3A CN104517610B (zh) 2013-09-26 2013-09-26 频带扩展的方法及装置
PCT/CN2014/075420 WO2015043161A1 (zh) 2013-09-26 2014-04-15 频带扩展的方法及装置

Publications (2)

Publication Number Publication Date
JP2016537662A JP2016537662A (ja) 2016-12-01
JP6423420B2 true JP6423420B2 (ja) 2018-11-14

Family

ID=52741937

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016517362A Active JP6423420B2 (ja) 2013-09-26 2014-04-15 帯域幅拡張方法および装置

Country Status (11)

Country Link
US (2) US9666201B2 (ja)
EP (2) EP3611729B1 (ja)
JP (1) JP6423420B2 (ja)
KR (2) KR101787711B1 (ja)
CN (2) CN104517610B (ja)
BR (1) BR112016005850B1 (ja)
ES (2) ES2745289T3 (ja)
HK (1) HK1206140A1 (ja)
PL (1) PL3611729T3 (ja)
SG (1) SG11201601691RA (ja)
WO (1) WO2015043161A1 (ja)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103426441B (zh) 2012-05-18 2016-03-02 华为技术有限公司 检测基音周期的正确性的方法和装置
CN103928029B (zh) 2013-01-11 2017-02-08 华为技术有限公司 音频信号编码和解码方法、音频信号编码和解码装置
CN104217727B (zh) 2013-05-31 2017-07-21 华为技术有限公司 信号解码方法及设备
FR3008533A1 (fr) 2013-07-12 2015-01-16 Orange Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences
CN105761723B (zh) * 2013-09-26 2019-01-15 华为技术有限公司 一种高频激励信号预测方法及装置
CN104517610B (zh) * 2013-09-26 2018-03-06 华为技术有限公司 频带扩展的方法及装置
EP2980794A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
US9837089B2 (en) * 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation
BR112017024480A2 (pt) * 2016-02-17 2018-07-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. pós-processador, pré-processador, codificador de áudio, decodificador de áudio e métodos relacionados para aprimoramento do processamento transiente
CN105869653B (zh) * 2016-05-31 2019-07-12 华为技术有限公司 话音信号处理方法和相关装置和系统
CN105959974B (zh) * 2016-06-14 2019-11-29 深圳市海思半导体有限公司 一种预测空口带宽的方法和装置
US10475457B2 (en) * 2017-07-03 2019-11-12 Qualcomm Incorporated Time-domain inter-channel prediction
CN108630212B (zh) * 2018-04-03 2021-05-07 湖南商学院 非盲带宽扩展中高频激励信号的感知重建方法与装置
WO2019213965A1 (zh) * 2018-05-11 2019-11-14 华为技术有限公司 语音信号的处理方法和移动设备
CN110660402B (zh) * 2018-06-29 2022-03-29 华为技术有限公司 立体声信号编码过程中确定加权系数的方法和装置
CN109150399B (zh) * 2018-08-14 2021-04-13 Oppo广东移动通信有限公司 数据传输方法、装置、电子设备及计算机可读介质
CN115512709A (zh) * 2021-06-07 2022-12-23 炬芯科技股份有限公司 一种音频数据的处理方法、对应装置、设备和存储介质
CN113421584B (zh) * 2021-07-05 2023-06-23 平安科技(深圳)有限公司 音频降噪方法、装置、计算机设备及存储介质

Family Cites Families (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5455888A (en) * 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
EP0878790A1 (en) * 1997-05-15 1998-11-18 Hewlett-Packard Company Voice coding system and method
US6199040B1 (en) * 1998-07-27 2001-03-06 Motorola, Inc. System and method for communicating a perceptually encoded speech spectrum signal
US6704711B2 (en) * 2000-01-28 2004-03-09 Telefonaktiebolaget Lm Ericsson (Publ) System and method for modifying speech signals
US7003454B2 (en) * 2001-05-16 2006-02-21 Nokia Corporation Method and system for line spectral frequency vector quantization in speech codec
US6895375B2 (en) * 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
EP1423847B1 (en) * 2001-11-29 2005-02-02 Coding Technologies AB Reconstruction of high frequency components
ES2259158T3 (es) * 2002-09-19 2006-09-16 Matsushita Electric Industrial Co., Ltd. Metodo y aparato decodificador audio.
US20050004793A1 (en) * 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
EP1723639B1 (en) * 2004-03-12 2007-11-14 Nokia Corporation Synthesizing a mono audio signal based on an encoded multichannel audio signal
CN101006495A (zh) * 2004-08-31 2007-07-25 松下电器产业株式会社 语音编码装置、语音解码装置、通信装置以及语音编码方法
KR100707174B1 (ko) * 2004-12-31 2007-04-13 삼성전자주식회사 광대역 음성 부호화 및 복호화 시스템에서 고대역 음성부호화 및 복호화 장치와 그 방법
BRPI0607646B1 (pt) * 2005-04-01 2021-05-25 Qualcomm Incorporated Método e equipamento para encodificação por divisão de banda de sinais de fala
PL1875463T3 (pl) 2005-04-22 2019-03-29 Qualcomm Incorporated Układy, sposoby i urządzenie do wygładzania współczynnika wzmocnienia
US7734462B2 (en) * 2005-09-02 2010-06-08 Nortel Networks Limited Method and apparatus for extending the bandwidth of a speech signal
US20080300866A1 (en) * 2006-05-31 2008-12-04 Motorola, Inc. Method and system for creation and use of a wideband vocoder database for bandwidth extension of voice
KR101565919B1 (ko) * 2006-11-17 2015-11-05 삼성전자주식회사 고주파수 신호 부호화 및 복호화 방법 및 장치
CN101304261B (zh) * 2007-05-12 2011-11-09 华为技术有限公司 一种频带扩展的方法及装置
KR101413967B1 (ko) * 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치
KR101413968B1 (ko) * 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
CN101620854B (zh) * 2008-06-30 2012-04-04 华为技术有限公司 频带扩展的方法、系统和设备
BRPI0910511B1 (pt) * 2008-07-11 2021-06-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Aparelho e método para decodificar e codificar um sinal de áudio
EP2176862B1 (en) * 2008-07-11 2011-08-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for calculating bandwidth extension data using a spectral tilt controlling framing
JP4932917B2 (ja) * 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
US8484020B2 (en) * 2009-10-23 2013-07-09 Qualcomm Incorporated Determining an upperband signal from a narrowband signal
CN102044250B (zh) 2009-10-23 2012-06-27 华为技术有限公司 频带扩展方法及装置
EP2502231B1 (en) * 2009-11-19 2014-06-04 Telefonaktiebolaget L M Ericsson (PUBL) Bandwidth extension of a low band audio signal
CN102714041B (zh) * 2009-11-19 2014-04-16 瑞典爱立信有限公司 改进的激励信号带宽扩展
JP5651980B2 (ja) * 2010-03-31 2015-01-14 ソニー株式会社 復号装置、復号方法、およびプログラム
US8600737B2 (en) 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
BR112012032746A2 (pt) * 2010-06-21 2016-11-08 Panasonic Corp dispositivo de descodificação, dispositivo de codificação, e métodos para os mesmos.
CN102339607A (zh) * 2010-07-16 2012-02-01 华为技术有限公司 一种频带扩展的方法和装置
KR101826331B1 (ko) * 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
US8924200B2 (en) 2010-10-15 2014-12-30 Motorola Mobility Llc Audio signal bandwidth extension in CELP-based speech coder
JP5743137B2 (ja) * 2011-01-14 2015-07-01 ソニー株式会社 信号処理装置および方法、並びにプログラム
CN103460286B (zh) * 2011-02-08 2015-07-15 Lg电子株式会社 带宽扩展的方法和设备
CN102800317B (zh) * 2011-05-25 2014-09-17 华为技术有限公司 信号分类方法及设备、编解码方法及设备
ES2582475T3 (es) * 2011-11-02 2016-09-13 Telefonaktiebolaget Lm Ericsson (Publ) Generación de una extensión de banda ancha de una señal de audio de ancho de banda extendido
PL3040988T3 (pl) * 2011-11-02 2018-03-30 Telefonaktiebolaget Lm Ericsson (Publ) Dekodowanie audio w oparciu o wydajną reprezentację współczynników autoregresji
US9589576B2 (en) * 2011-11-03 2017-03-07 Telefonaktiebolaget Lm Ericsson (Publ) Bandwidth extension of audio signals
US8666753B2 (en) * 2011-12-12 2014-03-04 Motorola Mobility Llc Apparatus and method for audio encoding
CN103295578B (zh) * 2012-03-01 2016-05-18 华为技术有限公司 一种语音频信号处理方法和装置
CN103928031B (zh) * 2013-01-15 2016-03-30 华为技术有限公司 编码方法、解码方法、编码装置和解码装置
US9601125B2 (en) * 2013-02-08 2017-03-21 Qualcomm Incorporated Systems and methods of performing noise modulation and gain adjustment
US9319510B2 (en) * 2013-02-15 2016-04-19 Qualcomm Incorporated Personalized bandwidth extension
US9666202B2 (en) * 2013-09-10 2017-05-30 Huawei Technologies Co., Ltd. Adaptive bandwidth extension and apparatus for the same
CN105761723B (zh) * 2013-09-26 2019-01-15 华为技术有限公司 一种高频激励信号预测方法及装置
CN104517610B (zh) * 2013-09-26 2018-03-06 华为技术有限公司 频带扩展的方法及装置
US9595269B2 (en) * 2015-01-19 2017-03-14 Qualcomm Incorporated Scaling for gain shape circuitry

Also Published As

Publication number Publication date
EP3611729A1 (en) 2020-02-19
WO2015043161A1 (zh) 2015-04-02
BR112016005850B1 (pt) 2020-12-08
EP3038105A4 (en) 2016-08-31
CN108172239A (zh) 2018-06-15
CN104517610B (zh) 2018-03-06
EP3038105A1 (en) 2016-06-29
CN108172239B (zh) 2021-01-12
US10186272B2 (en) 2019-01-22
CN104517610A (zh) 2015-04-15
PL3611729T3 (pl) 2022-09-12
EP3611729B1 (en) 2022-06-08
KR20170117621A (ko) 2017-10-23
SG11201601691RA (en) 2016-04-28
US20170213564A1 (en) 2017-07-27
US20160196829A1 (en) 2016-07-07
ES2924905T3 (es) 2022-10-11
US9666201B2 (en) 2017-05-30
KR20160044025A (ko) 2016-04-22
ES2745289T3 (es) 2020-02-28
KR101787711B1 (ko) 2017-11-15
HK1206140A1 (en) 2015-12-31
KR101893454B1 (ko) 2018-08-30
EP3038105B1 (en) 2019-06-26
JP2016537662A (ja) 2016-12-01

Similar Documents

Publication Publication Date Title
JP6423420B2 (ja) 帯域幅拡張方法および装置
RU2641224C2 (ru) Адаптивное расширение полосы пропускания и устройство для этого
TWI585748B (zh) 訊框錯誤隱藏方法以及音訊解碼方法
JP6470857B2 (ja) 音声処理のための無声/有声判定
KR101960198B1 (ko) 시간 도메인 코딩과 주파수 도메인 코딩 간의 분류 향상
TWI553628B (zh) 訊框錯誤隱藏方法
RU2627102C2 (ru) Декодер для формирования аудиосигнала с улучшенной частотной характеристикой, способ декодирования, кодер для формирования кодированного сигнала и способ кодирования с использованием компактной дополнительной информации для выбора
AU2013378793B2 (en) Systems and methods for mitigating potential frame instability
KR102105044B1 (ko) 낮은 레이트의 씨이엘피 디코더의 비 음성 콘텐츠의 개선
KR20130023289A (ko) 광대역 스피치 코딩을 위한 시스템들, 방법들, 장치, 및 컴퓨터 프로그램 제품들
US20180166085A1 (en) Bandwidth Extension Audio Decoding Method and Device for Predicting Spectral Envelope
EP2593937B1 (en) Audio encoder and decoder and methods for encoding and decoding an audio signal
CN104584120A (zh) 生成舒适噪声
BR112015020250B1 (pt) Método, memória legível por computador e aparelho para controle de uma taxa de codificação média.
TW201434033A (zh) 用於判定音調脈衝週期信號界限之系統及方法
KR20220045260A (ko) 음성 정보를 갖는 개선된 프레임 손실 보정
KR20220084294A (ko) 생성 모델을 사용한 오디오 신호의 파형 코딩 방법 및 시스템

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170613

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20170913

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171113

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180424

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20180724

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180830

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180918

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181018

R150 Certificate of patent or registration of utility model

Ref document number: 6423420

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250