JP2018041091A - 信号処理方法及び装置 - Google Patents

信号処理方法及び装置 Download PDF

Info

Publication number
JP2018041091A
JP2018041091A JP2017202843A JP2017202843A JP2018041091A JP 2018041091 A JP2018041091 A JP 2018041091A JP 2017202843 A JP2017202843 A JP 2017202843A JP 2017202843 A JP2017202843 A JP 2017202843A JP 2018041091 A JP2018041091 A JP 2018041091A
Authority
JP
Japan
Prior art keywords
subbands
energy
subband
energy envelope
quantized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017202843A
Other languages
English (en)
Other versions
JP6517300B2 (ja
Inventor
▲賓▼ 王
Bin Wang
▲賓▼ 王
磊 苗
Miao Lei
磊 苗
▲澤▼新 ▲劉▼
▲澤▼新 ▲劉▼
Zexin Liu
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of JP2018041091A publication Critical patent/JP2018041091A/ja
Application granted granted Critical
Publication of JP6517300B2 publication Critical patent/JP6517300B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

【課題】信号処理方法及び装置においてビット割当てに各サブバンドのビット要求をより良好に充足させ、信号符号化及び復号化性能を向上させる。【解決手段】M個のサブバンドを除くN個のサブバンドにおけるK個のサブバンドの周波数帯より低いN個のサブバンドからM個のサブバンドを選択するステップと、M個のサブバンドの性能情報に従って、M個のサブバンドの元のエンベロープ値に対して修正処理を実行することを決定するステップと、M個のサブバンドの修正されたエンベロープ値を取得するため、M個のサブバンドの元のエンベロープ値に対して個別に修正を実行するステップと、M個のサブバンドの修正されたエンベロープ値及びK個のサブバンドの元のエンベロープ値に従って、N個のサブバンドに対して第1のビット割当てを実行するステップとを有する。【選択図】図1

Description

本出願は、参照することによりその全体がここに援用される、“信号処理方法及び装置”という名称であって、2014年4月29日に中国専利局に出願された中国特許出願第201410177234.3号に対する優先権を主張する。
[技術分野]
本発明は、信号処理分野に関し、具体的には、信号処理方法及び装置に関する。
現在の通信伝送では、音声信号又はオーディオ信号の品質に対する増大する注目が払われ、従って、信号符号化及び復号化に対する要求がますます高くなっている。既存の周波数領域符号化アルゴリズムでは、通常、ビット割当ては周波数エンベロープのサイズに従って信号の各サブバンドに対して直接実行され、それから、各サブバンドが割り当てられるビット数を利用することによって符号化される。しかしながら、実践は、これら既存の符号化アルゴリズムにおいて、低周波数帯のサブバンドは信号符号化品質に対して比較的大きな影響を有し、従って、通常、低周波数帯のサブバンドは信号符号化性能のボトルネックになることを示す。さらに、上記のビット割当て方式は、各サブバンドのビット要求、特に低周波数帯のサブバンドのものに良好に適応化できず、比較的不良な信号符号化性能を導く。対応して、信号復号化性能もまた比較的不良である。
本発明の実施例は、信号符号化及び復号化性能を向上可能な信号処理方法及び装置を提供する。
第1の態様によると、信号処理方法が提供され、N個のサブバンドからM個のサブバンドを選択するステップであって、前記N個のサブバンドは信号の現在フレームのスペクトル係数を分割することによって取得され、前記M個のサブバンドの周波数帯は前記M個のサブバンドを除く前記N個のサブバンドにおけるK個のサブバンドの周波数帯より低く、Nは1より大きな正の整数であり、M及びKは共に正の整数であり、MとKとの和はNである、選択するステップと、前記M個のサブバンドの性能情報に従って、前記M個のサブバンドの元のエンベロープ値に対して修正処理を実行することを決定するステップであって、前記性能情報は前記M個のサブバンドのものであるエネルギー特性及びスペクトル特性を示すのに利用される、決定するステップと、前記M個のサブバンドの修正されたエンベロープ値を取得するため、前記M個のサブバンドの元のエンベロープ値に対して個別に修正を実行するステップと、前記M個のサブバンドの修正されたエンベロープ値及び前記K個のサブバンドの元のエンベロープ値に従って、前記N個のサブバンドに対して第1のビット割当てを実行するステップとを有する。
第1の態様を参照して、第1の可能な実現方式では、前記M個のサブバンドの性能情報に従って、前記M個のサブバンドの元のエンベロープ値に対して修正処理を実行することを決定するステップは、
前記N個のサブバンドの元のエンベロープ値に従って第1のパラメータを決定するステップであって、前記第1のパラメータは前記信号のスペクトルエネルギーのものであって、前記M個のサブバンドに対する集中度を示す、決定するステップと、
前記M個のサブバンドの元のエンベロープ値に従って第2のパラメータを決定するステップであって、前記第2のパラメータは前記M個のサブバンドのスペクトル変動度を示す、決定するステップと、
前記第1のパラメータが第1の範囲内に属し、前記第2のパラメータが第2の範囲内に属する場合、前記M個のサブバンドの元のエンベロープ値に対して前記修正処理を実行することを決定するステップと、
を有する。
第1の態様の第1の可能な実現方式を参照して、第2の可能な実現方式では、前記N個のサブバンドの元のエンベロープ値に従って第1のパラメータを決定するステップは、前記M個のサブバンドの元のエンベロープ値に従って前記M個のサブバンドの合計エネルギーを決定するステップと、前記K個のサブバンドの元のエンベロープ値に従って前記K個のサブバンドの合計エネルギーを決定するステップと、前記K個のサブバンドの合計エネルギーに対する前記M個のサブバンドの合計エネルギーの比を前記第1のパラメータとして決定するステップとを有する。
第1の態様の第1の可能な実現方式又は第2の可能な実現方式を参照して、第3の可能な実現方式では、前記M個のサブバンドの元のエンベロープ値に従って第2のパラメータを決定するステップは、前記M個のサブバンドの元のエンベロープ値に従って前記M個のサブバンドの合計エネルギーと第1のサブバンドのエネルギーとを決定するステップであって、前記第1のサブバンドのエネルギーは前記M個のサブバンドのもののうち最大である、決定するステップと、前記M個のサブバンドの合計エネルギーに対する前記第1のサブバンドのエネルギーの比を前記第2のパラメータとして決定するステップとを有する。
第1の態様又は上記の実現方式の何れか1つを参照して、第4の可能な実現方式では、前記M個のサブバンドの修正されたエンベロープ値を取得するため、前記M個のサブバンドの元のエンベロープ値に対して個別に修正を実行するステップは、前記M個のサブバンドの元のエンベロープ値に従って前記M個のサブバンドの合計エネルギーと前記第1のサブバンドのエネルギーとを決定するステップであって、前記第1のサブバンドのエネルギーは前記M個のサブバンドのもののうち最大である、決定するステップと、前記M個のサブバンドの合計エネルギーと前記第1のサブバンドのエネルギーとに従って修正ファクタを決定するステップと、前記M個のサブバンドの修正されたエンベロープ値を取得するため、前記修正ファクタを利用することによって前記M個のサブバンドの元のエンベロープ値に対して個別に修正を実行するステップとを有する。
第1の態様又は上記実現方式の何れか1つを参照して、第5の可能な実現方式では、前記M個のサブバンドにおける各サブバンドの修正されたエンベロープ値は、同一のサブバンドの元のエンベロープ値より大きい。
第1の態様又は上記の実現方式の何れか1つを参照して、第6の可能な実現方式では、当該方法は更に、前記第1のビット割当ての間に前記N個のサブバンドにそれぞれ割り当てられたビット数に従って、前記N個のサブバンドにおける各サブバンドの冗長ビット数を決定するステップであって、前記N個のサブバンドにおける各サブバンドの冗長ビット数は、同一のサブバンドにおける単一の情報単位を符号化するのに必要とされるビット数未満である、決定するステップと、前記N個のサブバンドにおける各サブバンドの冗長ビット数に従って冗長ビット合計数を決定するステップと、前記M個のサブバンドの修正されたエンベロープ値、前記K個のサブバンドの元のエンベロープ値及び前記冗長ビット合計数に従って、前記N個のサブバンドに対して第2のビット割当てを実行するステップとを有する。
第2の態様によると、信号処理装置が提供され、N個のサブバンドからM個のサブバンドを選択するよう構成される選択ユニットであって、前記N個のサブバンドは信号の現在フレームのスペクトル係数を分割することによって取得され、前記M個のサブバンドの周波数帯は前記M個のサブバンドを除く前記N個のサブバンドにおけるK個のサブバンドの周波数帯より低く、Nは1より大きな正の整数であり、M及びKは共に正の整数であり、MとKとの和はNである、選択ユニットと、前記M個のサブバンドの性能情報に従って、前記M個のサブバンドの元のエンベロープ値に対して修正処理を実行することを決定するよう構成される決定ユニットであって、前記性能情報は前記M個のサブバンドのものであるエネルギー特性及びスペクトル特性を示すのに利用される、決定ユニットと、前記M個のサブバンドの修正されたエンベロープ値を取得するため、前記M個のサブバンドの元のエンベロープ値に対して個別に修正を実行するよう構成される修正ユニットと、前記M個のサブバンドの修正されたエンベロープ値及び前記K個のサブバンドの元のエンベロープ値に従って、前記N個のサブバンドに対して第1のビット割当てを実行するよう構成される割当てユニットとを有する。
第2の態様を参照して、第1の可能な実現方式では、前記決定ユニットは、具体的には、前記N個のサブバンドの元のエンベロープ値に従って第1のパラメータを決定し、前記第1のパラメータは前記信号のスペクトルエネルギーのものであって、前記M個のサブバンドに対する集中度を示し、前記M個のサブバンドの元のエンベロープ値に従って第2のパラメータを決定し、前記第2のパラメータは前記M個のサブバンドのスペクトル変動度を示し、前記第1のパラメータが第1の範囲内に属し、前記第2のパラメータが第2の範囲内に属する場合、前記M個のサブバンドの元のエンベロープ値に対して前記修正処理を実行することを決定するよう構成される。
第2の態様の第1の可能な実現方式を参照して、第2の可能な実現方式では、前記決定ユニットは、具体的には、前記M個のサブバンドの元のエンベロープ値に従って前記M個のサブバンドの合計エネルギーを決定し、前記K個のサブバンドの元のエンベロープ値に従って前記K個のサブバンドの合計エネルギーを決定し、前記K個のサブバンドの合計エネルギーに対する前記M個のサブバンドの合計エネルギーの比を前記第1のパラメータとして決定するよう構成される。
第2の態様の第1の可能な実現方式又は第2の可能な実現方式を参照して、第3の可能な実現方式では、前記決定ユニットは、具体的には、前記M個のサブバンドの元のエンベロープ値に従って前記M個のサブバンドの合計エネルギーと第1のサブバンドのエネルギーとを決定し、前記第1のサブバンドのエネルギーは前記M個のサブバンドのもののうち最大であり、前記M個のサブバンドの合計エネルギーに対する前記第1のサブバンドのエネルギーの比を前記第2のパラメータとして決定するよう構成される。
第2の態様又は上記の実現方式の何れか1つを参照して、第4の可能な実現方式では、前記修正ユニットは、具体的には、前記M個のサブバンドの元のエンベロープ値に従って前記M個のサブバンドの合計エネルギーと前記第1のサブバンドのエネルギーとを決定し、前記第1のサブバンドのエネルギーは前記M個のサブバンドのもののうち最大であり、前記M個のサブバンドの合計エネルギーと前記第1のサブバンドのエネルギーとに従って修正ファクタを決定し、前記M個のサブバンドの修正されたエンベロープ値を取得するため、前記修正ファクタを利用することによって前記M個のサブバンドの元のエンベロープ値に対して個別に修正を実行するよう構成される。
第2の態様又は上記の実現方式の何れか1つを参照して、第5の可能な実現方式では、前記M個のサブバンドにおける各サブバンドの修正されたエンベロープ値は、同一のサブバンドの元のエンベロープ値より大きい。
第2の態様又は上記の実現方式の何れか1つを参照して、第6の可能な実現方式では、前記決定ユニットは更に、前記第1のビット割当ての間に前記N個のサブバンドにそれぞれ割り当てられたビット数に従って、前記N個のサブバンドにおける各サブバンドの冗長ビット数を決定するよう構成され、前記N個のサブバンドにおける各サブバンドの冗長ビット数は、同一のサブバンドにおける単一の情報単位を符号化するのに必要とされるビット数未満であり、前記決定ユニットは更に、前記N個のサブバンドにおける各サブバンドの冗長ビット数に従って冗長ビット合計数を決定するよう構成され、前記割当てユニットは更に、前記M個のサブバンドの修正されたエンベロープ値、前記K個のサブバンドの元のエンベロープ値及び前記冗長ビット合計数に従って、前記N個のサブバンドに対して第2のビット割当てを実行するよう構成される。
本発明の実施例では、ビット割当てはN個のサブバンドの元のエンベロープ値に従って直接的には実行されず、代わりに、低周波数帯のM個のサブバンドがN個のサブバンドから選択され、M個のサブバンドのものであるエネルギー特性及びスペクトル特性に従って、M個のサブバンドの元のエンベロープ値に対して修正処理を実行することが決定され、M個のサブバンドの元のエンベロープ値に従ってM個のサブバンドの元のエンベロープ値に対して個別に修正が実行され、第1のビット割当ては、M個のサブバンドの修正されたエンベロープ値及びK個のサブバンドの元のエンベロープ値に従ってN個のサブバンドに対して実行され、これにより、ビット割当ては各サブバンドのビット要求をより良好に充足し、従って、信号符号化及び復号化性能を向上させることができる。
本発明の実施例における技術的解決策をより明確に説明するため、以下は、本発明の実施例を説明するのに必要な添付図面を簡単に説明する。明らかに、以下の説明における添付図面は本発明の単なるいくつかの実施例を示し、当業者は、創作的な努力なく、これらの添付図面から他の図面を依然として導出してもよい。
図1は、本発明の実施例による信号処理方法の概略的なフローチャートである。 図2は、本発明の実施例による信号処理方法の処理の概略的なフローチャートである。 図3は、本発明の実施例による信号処理装置の概略的なブロック図である。 図4は、本発明の他の実施例による信号処理装置の概略的なブロック図である。
以下は、本発明の実施例における添付図面を参照して、本発明の実施例における技術的解決策を明確に説明する。明らかに、説明される実施例は、本発明の実施例の全てでなく一部である。創作的な努力なく本発明の実施例に基づき当業者により取得される他の全ての実施例は、本発明の保護範囲内に属する。
信号符号化技術及び信号復号化技術は、携帯電話、無線装置、パーソナル・データ・アシスタント(Personal Data Assistant,PDA)、携帯又はポータブルコンピュータ、グローバル・ポジショニング・システム(Global Positioning System,GPS)受信機/ナビゲーションアシスタント、カメラ、オーディオ/ビデオプレーヤ、ビデオカメラ、ビデオレコーダ及びモニタリング装置などの各種電子装置に広く適用される。通常、このような電子装置は、音声エンコーダ又はオーディオエンコーダを有し、更に音声デコーダ又はオーディオデコーダを有してもよい。音声エンコーダ又はオーディオエンコーダ及び音声デコーダ又はオーディオデコーダは、デジタル信号プロセッサ(Digital Signal Processor,DSP)チップなどのデジタル回路又はチップによって直接実現されてもよいし、又はソフトウェアコードにおける手順を実行することによってソフトウェアコードにより駆動されるプロセッサによって実現されてもよい。
図1は、本発明の実施例による信号処理方法の概略的なフローチャートである。図1における方法は、上記の音声エンコーダ又は上記のオーディオエンコーダなどのエンコーダサイドによって実行される。図1における方法はまた、上記の音声デコーダ又は上記のオーディオデコーダなどのデコーダサイドによって実行されてもよい。
符号化処理において、エンコーダサイドはまず、時間領域信号を周波数領域信号に変換してもよい。例えば、時間周波数変換は、高速フーリエ変換(Fast Fourier Transform,FFT)又は修正離散コサイン変換(Modified Discrete Cosine Transform,MDCT)などのアルゴリズムを用いることによって実行されてもよい。それから、グローバルゲインが周波数領域信号のスペクトル係数に対して正規化を実行するため利用されてもよく、複数のサブバンドを取得するため、正規化されたスペクトル係数に対して分割が実行される。
復号化処理では、デコーダサイドは、正規化されたスペクトル係数を取得するため、エンコーダサイドから受信したビットストリームを復号化してもよく、複数のサブバンドを取得するため、正規化されたスペクトル係数に対して分割が実行される。
110.N個のサブバンドからM個のサブバンドを選択し、ここで、N個のサブバンドは信号の現在フレームのスペクトル係数を分割することによって取得され、M個のサブバンドの周波数帯はM個のサブバンドを除くN個のサブバンドにおけるK個のサブバンドの周波数帯より低く、Nは1より大きな正の整数であり、M及びKは共に正の整数であり、MとKとの和はNである。
本発明の本実施例では、信号は音声信号であってもよいし、又はオーディオ信号であってもよい。上記のK個のサブバンドは、M個のサブバンドを除くN個のサブバンドにおける全てのサブバンドである。
120.M個のサブバンドの性能情報に従って、M個のサブバンドの元のエンベロープ値に対して修正処理を実行することを決定し、ここで、性能情報はM個のサブバンドのものであるエネルギー特性及びスペクトル特性を示すのに利用される。
130.M個のサブバンドの修正されたエンベロープ値を取得するため、M個のサブバンドの元のエンベロープ値に対して個別に修正を実行する。
140.M個のサブバンドの修正されたエンベロープ値及びK個のサブバンドの元のエンベロープ値に従って、N個のサブバンドに対して第1のビット割当てを実行する。
本発明の本実施例では、ビット割当てはN個のサブバンドの元のエンベロープ値に従って直接的には実行されず、代わりに、低周波数帯のM個のサブバンドがN個のサブバンドから選択され、M個のサブバンドのものであるエネルギー特性及びスペクトル特性に従って、M個のサブバンドの元のエンベロープ値に対して修正処理を実行することが決定され、M個のサブバンドの元のエンベロープ値に従ってM個のサブバンドの元のエンベロープ値に対して個別に修正が実行され、第1のビット割当ては、M個のサブバンドの修正されたエンベロープ値及びK個のサブバンドの元のエンベロープ値に従ってN個のサブバンドに対して実行され、これにより、ビット割当ては各サブバンドのビット要求をより良好に充足し、従って、信号符号化及び復号化性能を向上させることができる。
具体的には、既存の周波数領域符号化アルゴリズムでは、ビット割当ては、周波数エンベロープのサイズに従って直接的に信号の各サブバンドに対して実行される。この結果、割り当てられるビット数は低周波数帯のいくつかのサブバンドのビット要求を良好には充足できない。しかしながら、本発明の本実施例では、低周波数帯のM個のサブバンドがまずN個のサブバンドから選択され、M個のサブバンドのものであるエネルギー特性及びスペクトル特性に従って、M個のサブバンドの元のエンベロープ値に対して修正処理を実行することが決定され、M個のサブバンドの元のエンベロープ値に従ってM個のサブバンドの元のエンベロープ値に対して修正が実行され、それから、第1のビット割当てが、M個のサブバンドの修正されたエンベロープ値及びK個のサブバンドの元のエンベロープ値に従ってN個のサブバンドに対して実行される。本発明の本実施例では、ビット割当ては、N個のサブバンドの元のエンベロープ値に従ってN個のサブバンドに対して直接的には実行されないことがわかりうる。代わりに、M個のサブバンドのものであるエネルギー特性及びスペクトル特性が、M個のサブバンドの修正された各エンベロープ値を取得するため、修正がM個のサブバンドに対して実行される必要があることを決定するための考慮点として利用され、ビット割当てが、低周波数帯のサブバンドの修正されたエンベロープ値及び他のサブバンドの元のエンベロープ値に従って実行され、これにより、各サブバンドに対して実行され、特に低周波数帯のM個のサブバンドに対して実行されるビット割当てがより適切なものとなり、従って、信号符号化及び復号化性能を向上させることができる。
スペクトル係数がN個のサブバンドを取得するため分割された後、各サブバンドのエンベロープが計算及び量子化されてもよい。従って、各サブバンドは量子化されたエンベロープ値を有する。元のエンベロープ値は修正されたエンベロープ値に関連し、元のエンベロープ値はサブバンドの初期的なエンベロープ値、すなわち、サブバンド分割後の計算により取得された量子化されたエンベロープ値を表すものであってもよいことが理解されるべきである。サブバンドの初期的なエンベロープ値が修正された後に取得されたエンベロープ値は、修正されたエンベロープ値として参照される。従って、本発明の本実施例では、言及された元のエンベロープ値及び修正されたエンベロープ値は共に、量子化されたエンベロープ値を表す。
任意的には、実施例として、ステップ110において、M個のサブバンドが、サブバンドのハーモニック特性及びサブバンドのエネルギーに従ってN個のサブバンドから選択されてもよい。例えば、M個のサブバンドについて、各サブバンドのハーモニック強度は所定の強度閾値より大きくてもよく、N個のサブバンドの合計エネルギーに対するサブバンドのエネルギーの比は、所定のエネルギー閾値より大きい。上述されるように、低周波数帯のサブバンドは、通常は信号符号化性能のボトルネックである。これらのサブバンドでは、比較的強いハーモニック特性を有し、そのエネルギーが全てのサブバンドの合計エネルギーの特定の割合を説明するサブバンドが、特に符号化性能のボトルネックである。従って、M個のサブバンドがサブバンドのハーモニック特性及びサブバンドのエネルギーに従ってN個のサブバンドから選択され、M個のサブバンドの元のエンベロープ値が修正された後、M個のサブバンドに対して実行されるビット割当てはより適切なものとなり、従って、信号符号化及び復号化性能を効率的に向上させることができる。
任意的には、他の実施例として、N個のサブバンドが周波数帯の昇順に配置されてもよい。このようにして、ステップ110において、最初のM個のサブバンドがN個のサブバンドから選択されてもよい。本実施例では、M個のサブバンドは周波数帯の昇順に選択され、これは処理を簡単化し、信号処理効率を向上させることができる。
任意的には、他の実施例として、ステップ120において、第1のパラメータは、N個のサブバンドの元のエンベロープ値に従って決定されてもよく、ここで、第1のパラメータは信号のスペクトルエネルギーのものであって、M個のサブバンドに対する集中度を示すものであってもよい。第2のパラメータは、M個のサブバンドの元のエンベロープ値に従って決定されてもよく、ここで、第2のパラメータは、M個のサブバンドのスペクトル変動度を示す。第1のパラメータが第1の範囲内に属し、第2のパラメータが第2の範囲内に属する場合、M個のサブバンドの元のエンベロープ値に対して修正処理を実行することが決定されてもよい。
具体的には、M個のサブバンドのエネルギー特性は、信号のスペクトルエネルギーのものであって、M個のサブバンドに対する集中度であってもよく、M個のサブバンドのスペクトル特性は、M個のサブバンドのスペクトル変動度であってもよい。
第1の範囲は、サブバンドのエネルギーに関連し、予め設定されてもよい。信号のスペクトルエネルギーのものであって、M個のサブバンドに対する集中度が比較的低いとき、それは、N個のサブバンドに対するM個のサブバンドの比が小さいことを示し、符号化性能が大きく影響されないことを示すものであってもよい。従って、M個のサブバンドの元のエンベロープ値を修正する必要はない。信号のスペクトルエネルギーのものであって、M個のサブバンドに対する集中度が比較的高いとき、それは、M個のサブバンドの元のエンベロープ値がまた比較的大きいことを示す。従って、M個のサブバンドに割り当てられるビット数は符号化のために十分であり、M個のサブバンドの元のエンベロープ値を修正する必要もない。第1の範囲は、実験的なシミュレーションによって予め決定されてもよい。例えば、第1の範囲は[1/6,2/3]に予め設定されてもよい。
第2の範囲は、サブバンドのスペクトル変動度に関連し、予め設定されてもよい。M個のサブバンドのスペクトル変動度が低い場合、M個のサブバンドに割り当てられるビット数が小さくても、符号化性能は大きく影響されない。このようにして、M個のサブバンドの元のエンベロープ値を修正する必要はない。従って、第2の範囲は、サブバンドのスペクトル変動度が比較的高いことを示す。第2の範囲は、実験的なシミュレーションにより予め決定されてもよい。例えば、第2の範囲は、
Figure 2018041091
又は
Figure 2018041091
に予め設定されてもよい。通常、信号において符号化のために利用可能な帯域幅が0〜4KHzである場合、第2の範囲は、
Figure 2018041091
に予め設定されてもよく、信号において符号化のために利用可能な帯域幅が0〜8KHzである場合、第2の範囲は、
Figure 2018041091
に予め設定されてもよい。
第1のパラメータが第1の範囲内に属し、第2のパラメータが第2の範囲内に属するとき、それは、信号のスペクトルエネルギーのものであって、M個のサブバンドに対する集中度が極端に高くなったり、極端に低くなったりせず、M個のサブバンドのスペクトル変動度が比較的高いことを意味し、M個のサブバンドの元のエンベロープ値に対して修正が実行されてもよく、これにより、M個のサブバンドの第1のビット割当ての間にM個のサブバンドに割り当てられるビットは、M個のサブバンドのビット要求をより良好に充足する。例えば、M個のサブバンドにおける各サブバンドについて、修正されたエンベロープ値は元のエンベロープ値より大きい。このとき、M個のサブバンドの元のエンベロープ値に従って第1のビット割当てを実行することと比較して、M個のサブバンドの修正されたエンベロープ値に従って第1のビット割当てを実行することは、M個のサブバンドに割り当てられるビット数をより大きくし、従って、M個のサブバンドの符号化性能を向上させることができる。
本実施例では、N個のサブバンドの元のエンベロープ値に従って決定される第1のパラメータ及び第2のパラメータは、各周波数帯の特性を反映しうることがわかりうる。従って、第1のパラメータが第1の範囲内に属し、第2のパラメータが第2の範囲内に属する場合、M個のサブバンドの元のエンベロープ値に対して修正処理を実行することが決定され、これにより、ビット割当てがM個のサブバンドの修正されたエンベロープ値に従って以降に実行されるとき、M個のサブバンドに割り当てられるビット数はM個のサブバンドのビット要求をより良好に充足し、従って、信号符号化及び復号化性能を向上させることができる。
任意的には、他の実施例として、ステップ120において、M個のサブバンドの合計エネルギーはM個のサブバンドの元のエンベロープ値に従って決定されてもよい。K個のサブバンドの合計エネルギーは、K個のサブバンドの元のエンベロープ値に従って決定されてもよい。K個のサブバンドの合計エネルギーに対するM個のサブバンドの合計エネルギーの比が、第1のパラメータとして決定されてもよい。
具体的には、K個のサブバンドの合計エネルギーに対するM個のサブバンドの合計エネルギーの比が、第1のパラメータとして決定されてもよい。
例えば、第1のパラメータは、以下の式に従って計算により取得されてもよく、ここで、第1のパラメータはαにより表されてもよい。
Figure 2018041091
ただし、EPMはM個のサブバンドの合計エネルギーを表すものであってもよく、EPKはK個のサブバンドの合計エネルギーを表すものであってもよく、band_widthはi番目のサブバンドの帯域幅を表すものであってもよく、band_energyはi番目のサブバンドのエネルギーを表すものであってもよい。band_energyはi番目のサブバンドの元のエンベロープ値を表すものであってもよい。例えば、i番目のサブバンドの元のエンベロープ値band_energyは、i番目のサブバンドのスペクトル係数に従って取得されてもよい。例えば、band_energyは、以下の式に従って取得されてもよい。
Figure 2018041091
当業者は第1のパラメータを取得するため、上記の式に従って様々な等価な修正又は変更を明らかに行うことができ、このような修正又は変更はまた本発明の本実施例の範囲内に属することが理解されるべきである。
任意的には、他の実施例として、ステップ120において、M個のサブバンドの元のエンベロープ値に従って、M個のサブバンドの合計エネルギーが決定されてもよく、第1のサブバンドのエネルギーが決定されてもよく、ここで、第1のサブバンドのエネルギーはM個のサブバンドのもののうち最大である。M個のサブバンドの合計エネルギーに対する第1のサブバンドのエネルギーの比が、第2のパラメータとして決定されてもよい。
具体的には、M個のサブバンドのスペクトル変動度が、M個のサブバンドの元のエンベロープ値の変動度を利用することによって示されてもよい。例えば、第2のパラメータは、以下の式に従って計算により取得されてもよく、ここで、第2のパラメータはβによって表されてもよく、
Figure 2018041091
ただし、Ep_tmpi及びEpMの計算方式について、上記の式が参照されてもよい。
当業者は、第2のパラメータを取得するため上記の式に従って様々な等価な修正又は変更を明らかに行うことができ、このような修正又は変更もまた本発明の本実施例の範囲内に属することが理解されるべきである。
任意的には、他の実施例として、ステップ130において、M個のサブバンドの合計エネルギー及び第1のサブバンドのエネルギーが、M個のサブバンドの元のエンベロープ値に従って決定されてもよく、ここで、第1のサブバンドのエネルギーはM個のサブバンドのもののうち最大である。修正ファクタは、M個のサブバンドの合計エネルギー及び第1のサブバンドのエネルギーに従って決定されてもよい。このとき、M個のサブバンドの修正されたエンベロープ値を取得するため、修正ファクタを利用することによって、M個のサブバンドの元のエンベロープ値に対して個別に修正が実行されてもよい。
例えば、修正ファクタは以下の式に従って決定されてもよく、ここで、修正ファクタはγによって表されてもよく、
Figure 2018041091
ただし、Ep_tmpi及びEpMの計算方式について、上記の式が参照されてもよい。
修正ファクタγに従ってM個のサブバンドにおける各サブバンドの元のエンベロープ値に対して修正が実行されてもよい。例えば、各サブバンドの元のエンベロープ値は、サブバンドの修正されたエンベロープ値を取得するため、修正ファクタと乗算されてもよい。
当業者は、修正ファクタを取得するため上記の式に従って様々な等価な修正又は変更を明らかに行うことができ、このような修正又は変更もまた本発明の本実施例の範囲内に属することが理解されるべきである。
任意的には、他の実施例として、ステップ130において、M個のサブバンドにおける各サブバンドの修正されたエンベロープ値は、サブバンドの元のエンベロープ値より大きくてもよい。
具体的には、M個のサブバンドにおける各サブバンドの修正されたエンベロープ値は、M個のサブバンドにおける各サブバンドの元のエンベロープ値に対して修正を実行することによって取得される。各サブバンドの修正されたエンベロープ値は、サブバンドの元のエンベロープ値より大きくてもよい。M個のサブバンドにおける各サブバンドの修正されたエンベロープ値がサブバンドの元のエンベロープ値より大きい場合、ステップ140において、M個のサブバンドの修正されたエンベロープ値に従ってビット割当てが実行される。このようにして、M個のサブバンドにおける各サブバンドに割り当てられるビット数が増加し、これにより、ビット割当ては各サブバンドのビット要求をより良好に充足し、従って、信号符号化及び復号化性能を向上させることができる。
任意的には、他の実施例として、ステップ130において、M個のサブバンドにおける各サブバンドの修正されたエンベロープ値は、サブバンドの元のエンベロープ値未満であってもよい。
具体的には、M個のサブバンドにおける各サブバンドの修正されたエンベロープ値がサブバンドの元のエンベロープ値未満である場合、ステップ140において、M個のサブバンドの修正されたエンベロープ値及びK個のサブバンドの元のエンベロープ値に従って、ビット割当てが実行される。このようにして、M個のサブバンドにおける各サブバンドに割り当てられるビット数は比較的小さく、従って、K個のサブバンドにそれぞれ割り当てられるビット数は増加し、これにより、ビット割当ては各サブバンドのビット要求をより良好に充足し、従って、信号符号化及び復号化性能を向上させることができる。
任意的には、他の実施例として、ステップ130において、第1のビット割当ては、エンベロープ値の降順にN個のサブバンドに対して実行されてもよい。
任意的には、他の実施例として、ステップ130において、修正ファクタは第2のパラメータに従って決定されてもよい。それから、M個のサブバンドの修正されたエンベロープ値を取得するため、修正ファクタを利用することによって、M個のサブバンドの元のエンベロープ値に対して個別に修正が実行されてもよい。
具体的には、修正ファクタは第2のパラメータに従って決定されてもよい。修正ファクタに従ってM個のサブバンドにおける各サブバンドの元のエンベロープ値に対して修正が実行されてもよい。例えば、各サブバンドの元のエンベロープ値は、サブバンドの修正されたエンベロープ値を取得するため、修正ファクタと乗算されてもよく、これにより、M個のサブバンドに割り当てられるビット数はM個のサブバンドのビット要求をより良好に充足し、従って、信号符号化及び復号化性能を向上させることができる。
第1のビット割当てが実行された後、通常は各サブバンドに割り当てられるビットに冗長ビットがある。各サブバンドの冗長ビットは、サブバンドの1つの情報単位を符号化するのに十分でない。従って、全てのサブバンドの冗長ビット数が、冗長ビット合計数を取得するため計数されてもよく、それから、第2のビット割当てが実行される。
任意的には、他の実施例として、ステップ140の後、N個のサブバンドにおける各サブバンドの冗長ビット数が、第1のビット割当ての間にN個のサブバンドにそれぞれ割り当てられるビット数に従って決定されてもよく、ここで、N個のサブバンドにおける各サブバンドの冗長ビット数は、同じサブバンドにおける符号化のため必要とされるビット数未満である。冗長ビット合計数は、N個のサブバンドにおける各サブバンドの冗長ビット数に従って決定されてもよい。それから、第2のビット割当てが、冗長ビット合計数に従ってN個のサブバンドに対して実行されてもよい。
具体的には、合計の冗長ビットはN個のサブバンドに等しく割り当てられてもよい。このようにして、ビットの無駄を回避し、信号符号化及び復号化性能を更に向上させるため、冗長ビットが再利用されてもよい。
上記は、第1のビット割当て及び第2のビット割当ての処理を説明している。図1における上記の方法がエンコーダサイドによって実行される場合、第2のビット割当て後、エンコーダサイドは、2回のビット割当ての処理において各サブバンドに割り当てられるビット数を利用することによって、各サブバンドのスペクトル係数を量子化し、量子化されたスペクトル係数のインデックス及び各サブバンドの元のエンベロープ値のインデックスをビットストリームに書き込み、それからビットストリームをデコーダサイドに送信してもよい。
図1における上記の方法がデコーダサイドによって実行される場合、第2のビット割当て後、デコーダサイドは、復元された信号を取得するため、2回のビット割当ての処理において各サブバンドに割り当てられるビット数を利用することによって、量子化されたスペクトル係数を復号化してもよい。
以下は、特定の具体例を参照して本発明の実施例を詳細に説明する。これらの具体例は当業者が本発明の実施例をより良好に理解するのを助けることを単に意図するものであり、本発明の実施例の範囲を限定することを意図するものでないことが理解されるべきである。
以下の具体例において、エンコーダサイドが説明のため具体例として利用される。
図2は、本発明の実施例による信号処理方法の処理の概略的なフローチャートである。
201.エンコーダサイドは、時間領域信号に対して時間周波数変換を実行する。
202.エンコーダサイドは、周波数領域信号のスペクトル係数をN個のサブバンドに分割し、ここで、Nは1より大きい正の整数である。
具体的には、エンコーダサイドはグローバルゲインを計算してもよく、グローバルゲインは元のスペクトル係数に対して正規化を実行するのに利用され、それから、全てのサブバンドを取得するため、正規化されたスペクトル係数に対して分割が実行される。
203.エンコーダサイドは、計算処理及び量子化処理によって各サブバンドの元のエンベロープ値を取得する。
204.エンコーダサイドは、N個のサブバンドからM個のサブバンドを選択し、ここで、Mは正の整数である。
M個のサブバンドの周波数帯は、M個のサブバンドを除くN個のサブバンドにおけるK個のサブバンドの周波数帯より低く、ここで、Kは正の整数であり、KとMとの和はNである。
205.エンコーダサイドは、M個のサブバンドの元のエンベロープ値及びK個のサブバンドの元のエンベロープ値に従って第1のパラメータを決定する。
第1のパラメータは、信号のスペクトルエネルギーのものであって、M個のサブバンドに対する集中度を示すものであってもよい。例えば、K個のサブバンドの合計エネルギーに対するM個のサブバンドの合計エネルギーの比が、第1のパラメータを示すのに利用されてもよい。第1のパラメータの計算方式について、図1の実施例における第1のパラメータの計算方式が参照されてもよく、詳細は再説明されない。
206.エンコーダサイドは、M個のサブバンドの元のエンベロープ値に従って第2のパラメータを決定する。
第2のパラメータは、M個のサブバンドのスペクトル変動度を示すものであってもよい。例えば、M個のサブバンドの合計エネルギーに対する第1のサブバンドのエネルギーの比が、第2のパラメータを示すのに利用されてもよく、ここで、第1のサブバンドのエネルギーはM個のサブバンドのもののうち最大である。第2のパラメータの計算方式について、図1の実施例における第2のパラメータの計算方式が参照されてもよく、詳細は再説明されない。
207.エンコーダサイドは、第1のパラメータが第1の範囲内に属し、第2のパラメータが第2の範囲内に属するか決定する。
第1の範囲及び第2の範囲は予め設定されてもよい。例えば、第1の範囲は[1/6,2/3]に予め設定されてもよい。第2の範囲は、
Figure 2018041091
又は
Figure 2018041091
に予め設定されてもよい。
208.エンコーダサイドが、ステップ207において第1のパラメータが第1の範囲内に属し、第2のパラメータが第2の範囲内に属すると決定した場合、M個のサブバンドの修正されたエンベロープ値を取得するため、M個のサブバンドの元のエンベロープ値に従ってM個のサブバンドの元のエンベロープ値を修正する。
具体的には、エンコーダサイドは、M個のサブバンドの元のエンベロープ値に従って修正ファクタを決定してもよい。修正ファクタの計算方式について、図1の実施例における処理が参照されてもよく、詳細は再説明されない。エンコーダサイドは、M個のサブバンドの修正されたエンベロープ値を取得するため、修正ファクタを利用することによって、M個のサブバンドにおける各サブバンドの元のエンベロープ値に対して修正を実行してもよい。例えば、各サブバンドの修正されたエンベロープ値は、サブバンドの元のエンベロープ値より大きくてもよい。
209.エンコーダサイドは、M個のサブバンドの修正されたエンベロープ値及びK個のサブバンドの元のエンベロープ値に従って、N個のサブバンドに対して第1のビット割当てを実行する。
例えば、エンコーダサイドは、エンベロープ値の降順でN個のサブバンドに対して第1のビット割当てを実行してもよい。M個のサブバンドについて、各サブバンドの修正されたエンベロープ値はサブバンドの元のエンベロープ値より大きいため、修正前の割り当てられたビット数と比較して、M個のサブバンドにおける各サブバンドに割り当てられるビット数は増加し、これにより、ビット割当ては各サブバンドのビット要求をより良好に充足し、これにより、信号符号化及び復号化性能を向上させる。
210.エンコーダサイドは、N個のサブバンドに対して第2のビット割当てを実行する。
具体的には、エンコーダサイドは、N個のサブバンドの冗長ビット合計数を決定するため、各サブバンドの帯域幅と第1のビット割当て後のN個のサブバンドにおける各サブバンドに割り当てられるビット数とに従って、各サブバンドの冗長ビット数を決定してもよい。それから、合計の冗長ビットは、冗長ビット合計数に従ってN個のサブバンドに等しく割り当てられる。
211.エンコーダサイドは、N個のサブバンドにおける各サブバンドに割り当てられるビット数に従って各サブバンドのスペクトル係数を量子化する。
212.エンコーダサイドは、ステップ211において取得された量子化されたスペクトル係数及び各サブバンドの元のエンベロープ値に従ってビットストリームを書き込む。
具体的には、エンコーダサイドは、量子化されたスペクトル係数のインデックス、各サブバンドの元のエンベロープ値などをビットストリームに書き込んでもよい。特定の処理について、従来技術が参照されてもよく、ここでは詳細は再説明されない。
213.エンコーダサイドが、ステップ207において第1のパラメータが第1の範囲外に属するか、又は第2のパラメータが第2の範囲外に属すると決定した場合、エンコーダサイドは、N個のサブバンドの元のエンベロープ値に従ってN個のサブバンドに対して第1のビット割当てを実行する。
例えば、エンコーダサイドは、エンベロープ値の降順でN個のサブバンドに対して第1のビット割当てを実行してもよい。
214.エンコーダサイドは、N個のサブバンドに対して第2のビット割当てを実行する。
具体的には、エンコーダサイドは、N個のサブバンドの冗長ビット合計数を決定するため、各サブバンドの帯域幅と第1のビット割当て後のN個のサブバンドにおける各サブバンドに割り当てられたビット数とに従って、各サブバンドの冗長ビット数を決定してもよい。それから、合計の冗長ビットは、冗長ビット合計数に従ってN個のサブバンドに等しく割り当てられる。
215.エンコーダサイドは、N個のサブバンドにおける各サブバンドに割り当てられたビット数に従って、各サブバンドのスペクトル係数を量子化する。
216.エンコーダサイドは、ステップ215において取得された量子化されたスペクトル係数及び各サブバンドの元のエンベロープ値に従ってビットストリームを書き込む。
具体的には、エンコーダサイドは、量子化されたスペクトル係数のインデックス、各サブバンドの元のエンベロープ値などをビットストリームに書き込んでもよい。特定の処理について、従来技術が参照されてもよく、詳細はここでは再説明されない。
本発明の本実施例では、第1のパラメータが第1の範囲内に属し、第2のパラメータが第2の範囲内に属する場合、M個のサブバンドの元のエンベロープ値に従って、低周波数帯のM個のサブバンドの元のエンベロープ値に対して修正が実行され、M個のサブバンドの修正されたエンベロープ値及びK個のサブバンドの元のエンベロープ値に従って、N個のサブバンドに対して第1のビット割当てが実行され、これにより、ビット割当ては各サブバンドのビット要求をより良好に充足し、従って、信号符号化及び復号化性能を向上させることができる。
図3は、本発明の実施例による信号処理装置の概略的なブロック図である。図3における装置300は、エンコーダサイドの装置又はデコーダサイドの装置であってもよい。図3における装置300は、選択ユニット310、決定ユニット320、修正ユニット330及び割当てユニット340を有する。
選択ユニット310は、N個のサブバンドからM個のサブバンドを選択し、ここで、N個のサブバンドは信号の現在フレームのスペクトル係数を分割することによって取得され、M個のサブバンドの周波数帯はM個のサブバンドを除くN個のサブバンドにおけるK個のサブバンドの周波数帯より低く、Nは1より大きな正の整数であり、M及びKは共に正の整数であり、MとKとの和はNである。決定ユニット320は、M個のサブバンドの性能情報に従って、M個のサブバンドの元のエンベロープ値に対して修正処理を実行することを決定し、ここで、性能情報はM個のサブバンドのものであるエネルギー特性及びスペクトル特性を示すのに利用される。修正ユニット330は、M個のサブバンドの修正されたエンベロープ値を取得するため、M個のサブバンドの元のエンベロープ値に対して個別に修正を実行する。割当てユニット340は、M個のサブバンドの修正されたエンベロープ値及びK個のサブバンドの元のエンベロープ値に従って、N個のサブバンドに対して第1のビット割当てを実行する。
本発明の本実施例では、ビット割当てはN個のサブバンドの元のエンベロープ値に従って直接的には実行されず、代わりに、低周波数帯のM個のサブバンドがN個のサブバンドから選択され、M個のサブバンドのものであるエネルギー特性及びスペクトル特性に従って、M個のサブバンドの元のエンベロープ値に対して修正処理を実行することが決定され、M個のサブバンドの元のエンベロープ値に従ってM個のサブバンドの元のエンベロープ値に対して個別に修正が実行され、第1のビット割当ては、M個のサブバンドの修正されたエンベロープ値及びK個のサブバンドの元のエンベロープ値に従ってN個のサブバンドに対して実行され、これにより、ビット割当ては各サブバンドのビット要求をより良好に充足し、従って、信号符号化及び復号化性能を向上させることができる。
任意的には、実施例として、決定ユニット320は、N個のサブバンドの元のエンベロープ値に従って第1のパラメータを決定してもよく、ここで、第1のパラメータは信号のスペクトルエネルギーのものであって、M個のサブバンドに対する集中度を示す。決定ユニット320は、M個のサブバンドの元のエンベロープ値に従って第2のパラメータを決定してもよく、ここで、第2のパラメータはM個のサブバンドのスペクトル変動度を示す。決定ユニット320は、第1のパラメータが第1の範囲内に属し、第2のパラメータが第2の範囲内に属する場合、M個のサブバンドの元のエンベロープ値に対して修正処理を実行することを決定してもよい。
任意的には、他の実施例として、決定ユニット320は、M個のサブバンドの元のエンベロープ値に従ってM個のサブバンドの合計エネルギーを決定し、K個のサブバンドの元のエンベロープ値に従ってK個のサブバンドの合計エネルギーを決定し、K個のサブバンドの合計エネルギーに対するM個のサブバンドの合計エネルギーの比を第1のパラメータとして決定してもよい。
任意的には、他の実施例として、決定ユニット320は、M個のサブバンドの元のエンベロープ値に従ってM個のサブバンドの合計エネルギーと第1のサブバンドのエネルギーとを決定してもよく、ここで、第1のサブバンドのエネルギーはM個のサブバンドのもののうち最大である。決定ユニット320は、M個のサブバンドの合計エネルギーに対する第1のサブバンドのエネルギーの比を第2のパラメータとして決定してもよい。
任意的には、他の実施例として、修正ユニット330は、M個のサブバンドの元のエンベロープ値に従ってM個のサブバンドの合計エネルギーと第1のサブバンドのエネルギーとを決定してもよく、ここで、第1のサブバンドのエネルギーはM個のサブバンドのもののうち最大である。修正ユニット330は、M個のサブバンドの合計エネルギーと第1のサブバンドのエネルギーとに従って修正ファクタを決定し、M個のサブバンドの修正されたエンベロープ値を取得するため、修正ファクタを利用することによってM個のサブバンドの元のエンベロープ値に対して個別に修正を実行してもよい。
任意的には、他の実施例として、M個のサブバンドにおける各サブバンドの修正されたエンベロープ値は、同一のサブバンドの元のエンベロープ値より大きくてもよい。
任意的には、他の実施例として、決定ユニット320は更に、第1のビット割当ての間にN個のサブバンドにそれぞれ割り当てられたビット数に従って、N個のサブバンドにおける各サブバンドの冗長ビット数を決定してもよく、ここで、N個のサブバンドにおける各サブバンドの冗長ビット数は、同一のサブバンドにおける単一の情報単位を符号化するのに必要とされるビット数未満である。決定ユニット320は更に、N個のサブバンドにおける各サブバンドの冗長ビット数に従って冗長ビット合計数を決定してもよい。割当てユニット340は更に、M個のサブバンドの修正されたエンベロープ値、K個のサブバンドの元のエンベロープ値及び冗長ビット合計数に従って、N個のサブバンドに対して第2のビット割当てを実行してもよい。
装置300の他の機能及び処理について、図1及び図2における方法の実施例の処理が参照されてもよい。繰り返しを回避するため、詳細はここでは再説明されない。
図4は、本発明の他の実施例による信号処理装置の概略的なブロック図である。図4における装置400は、エンコーダサイドの装置又はデコーダサイドの装置であってもよい。図4における装置400は、メモリ410及びプロセッサ420を有する。
メモリ410は、ランダムアクセスメモリ、フラッシュメモリ、読み出し専用メモリ、プログラマブル読み出し専用メモリ、不揮発性メモリ、レジスタなどを含むものであってもよい。プロセッサ420は、中央処理ユニット(Central Processing Unit,CPU)であってもよい。
メモリ410は、実行可能な命令を記憶するよう構成される。プロセッサ420は、メモリ410に記憶される実行可能な命令を実行し、N個のサブバンドからM個のサブバンドを選択し、ここで、N個のサブバンドは信号の現在フレームのスペクトル係数を分割することによって取得され、M個のサブバンドの周波数帯はM個のサブバンドを除くN個のサブバンドにおけるK個のサブバンドの周波数帯より低く、Nは1より大きな正の整数であり、M及びKは共に正の整数であり、MとKとの和はNであり、M個のサブバンドの性能情報に従って、M個のサブバンドの元のエンベロープ値に対して修正処理を実行することを決定し、ここで、性能情報はM個のサブバンドのものであるエネルギー特性及びスペクトル特性を示すのに利用され、M個のサブバンドの修正されたエンベロープ値を取得するため、M個のサブバンドの元のエンベロープ値に対して個別に修正を実行し、M個のサブバンドの修正されたエンベロープ値及びK個のサブバンドの元のエンベロープ値に従って、N個のサブバンドに対して第1のビット割当てを実行してもよい。
本発明の本実施例では、ビット割当てはN個のサブバンドの元のエンベロープ値に従って直接的には実行されず、代わりに、低周波数帯のM個のサブバンドがN個のサブバンドから選択され、M個のサブバンドのものであるエネルギー特性及びスペクトル特性に従って、M個のサブバンドの元のエンベロープ値に対して修正処理を実行することが決定され、M個のサブバンドの元のエンベロープ値に従ってM個のサブバンドの元のエンベロープ値に対して個別に修正が実行され、第1のビット割当ては、M個のサブバンドの修正されたエンベロープ値及びK個のサブバンドの元のエンベロープ値に従ってN個のサブバンドに対して実行され、これにより、ビット割当ては各サブバンドのビット要求をより良好に充足し、従って、信号符号化及び復号化性能を向上させることができる。
任意的には、実施例として、プロセッサ420は、N個のサブバンドの元のエンベロープ値に従って第1のパラメータを決定してもよく、ここで、第1のパラメータは信号のスペクトルエネルギーのものであって、M個のサブバンドに対する集中度を示す。プロセッサ420は、M個のサブバンドの元のエンベロープ値に従って第2のパラメータを決定してもよく、ここで、第2のパラメータはM個のサブバンドのスペクトル変動度を示す。プロセッサ420は、第1のパラメータが第1の範囲内に属し、第2のパラメータが第2の範囲内に属する場合、M個のサブバンドの元のエンベロープ値に対して修正処理を実行することを決定してもよい。
任意的には、他の実施例として、プロセッサ420は、M個のサブバンドの元のエンベロープ値に従ってM個のサブバンドの合計エネルギーを決定し、K個のサブバンドの元のエンベロープ値に従ってK個のサブバンドの合計エネルギーを決定し、K個のサブバンドの合計エネルギーに対するM個のサブバンドの合計エネルギーの比を第1のパラメータとして決定してもよい。
任意的には、他の実施例として、プロセッサ420は、M個のサブバンドの元のエンベロープ値に従ってM個のサブバンドの合計エネルギーと第1のサブバンドのエネルギーとを決定してもよく、ここで、第1のサブバンドのエネルギーはM個のサブバンドのもののうち最大である。プロセッサ420は、M個のサブバンドの合計エネルギーに対する第1のサブバンドのエネルギーの比を第2のパラメータとして決定してもよい。
任意的には、他の実施例として、プロセッサ420は、M個のサブバンドの元のエンベロープ値に従ってM個のサブバンドの合計エネルギーと第1のサブバンドのエネルギーとを決定してもよく、ここで、第1のサブバンドのエネルギーはM個のサブバンドのもののうち最大である。プロセッサ420は、M個のサブバンドの合計エネルギーと第1のサブバンドのエネルギーとに従って修正ファクタを決定し、M個のサブバンドの修正されたエンベロープ値を取得するため、修正ファクタを利用することによってM個のサブバンドの元のエンベロープ値に対して個別に修正を実行してもよい。
任意的には、他の実施例として、M個のサブバンドにおける各サブバンドの修正されたエンベロープ値は、同一のサブバンドの元のエンベロープ値より大きくてもよい。
任意的には、他の実施例として、プロセッサ420は更に、第1のビット割当ての間にN個のサブバンドにそれぞれ割り当てられたビット数に従って、N個のサブバンドにおける各サブバンドの冗長ビット数を決定してもよく、ここで、N個のサブバンドにおける各サブバンドの冗長ビット数は、同一のサブバンドにおける単一の情報単位を符号化するのに必要とされるビット数未満である。プロセッサ420は更に、N個のサブバンドにおける各サブバンドの冗長ビット数に従って冗長ビット合計数を決定してもよい。プロセッサ420は更に、M個のサブバンドの修正されたエンベロープ値、K個のサブバンドの元のエンベロープ値及び冗長ビット合計数に従って、N個のサブバンドに対して第2のビット割当てを実行してもよい。
装置400の他の機能及び処理について、図1及び図2における方法の実施例の処理が参照されてもよい。繰り返しを回避するため、詳細はここでは再説明されない。
当業者は、本明細書に開示された実施例において説明される具体例に関して、ユニット及びアルゴリズムステップが電子ハードウェア又はコンピュータソフトウェアと電子ハードウェアとの組み合わせによって実現されてもよいことを認識しうる。機能がハードウェア又はソフトウェアによって実行されるか否かは、技術的解決策の特定の適用及び設計制約条件に依存する。当業者は、異なる方法を利用して特定の各適用について説明された機能を実現してもよいが、実現形態は本発明の範囲を超えているとみなされるべきでない。
便利で簡潔な説明の目的のため、上記のシステム、装置及びユニットの詳細な動作処理について、上記の方法の実施例における対応する処理が参照されてもよく、詳細はここでは再説明されないことが、当業者により明確に理解されうる。
本出願において提供される複数の実施例において、開示されるシステム、装置及び方法は他の方式で実現されてもよいことが理解されるべきである。例えば、説明される装置の実施例は単なる例示的なものである。例えば、ユニットの分割は、単なる論理的機能の分割であり、実際の実現形態では他の分割であってもよい。例えば、複数のユニット又はコンポーネントが他のシステムに組み合わせ又は統合されてもよいし、又はいくつかの特徴は無視されるか、又は実行されなくてもよい。さらに、表示又は説明される相互結合若しくは直接的な結合又は通信接続は、いくつかのインタフェースを用いることによって実現されてもよい。装置又はユニットの間の間接的な結合又は通信接続は、電子、機械又は他の形式により実現されてもよい。
別々のパーツとして説明されるユニットは物理的に別々であってもよいし、又はそうでなくてもよく、ユニットとして表示されるパーツは物理的ユニットであってもよいし、又はそうでなくてもよく、1つの位置に配置されてもよいし、又は複数のネットワークユニット上に分散されてもよい。ユニットの一部又は全ては、実施例の解決策の課題を実現するため実際の要求に従って選択されてもよい。
さらに、本発明の実施例における機能ユニットは1つの処理ユニットに統合されてもよいし、又はユニットのそれぞれは物理的に単独で存在してもよいし、又は2つ以上のユニットが1つのユニットに統合される。
当該機能はソフトウェア機能ユニットの形態で実現され、独立した製品として販売又は使用されるとき、当該機能はコンピュータ可読記憶媒体に記憶されてもよい。このような理解に基づき、従来技術に実質的又は部分的に貢献する本発明の技術的解決策又は技術的解決策の一部は、ソフトウェア製品の形態で実現されてもよい。コンピュータソフトウェア製品は記憶媒体に記憶され、本発明の実施例において説明される方法のステップの全て又は一部を実行するようコンピュータ装置(パーソナルコンピュータ、サーバ、ネットワーク装置などであってもよい)に指示するための複数の命令を有する。上記の記憶媒体は、USB、フラッシュドライブ、着脱可能なハードディスク、読み出し専用メモリ(ROM,Read−Only Memory)、ランダムアクセスメモリ(RAM,Random Access Memory)、磁気ディスク又は光ディスクなど、プログラムエンコードを記憶可能な何れかの媒体を含む。
上記説明は、本発明の単なる特定の実現方式であり、本発明の保護範囲を限定することを意図するものでない。本発明において開示される技術的範囲内で当業者により容易に想到される何れの変形又は置換も本発明の保護範囲内に属する。従って、本発明の保護範囲は請求項の保護範囲に従属する。

Claims (26)

  1. オーディオ信号処理方法であって、
    オーディオ信号のN個のサブバンドのM個のサブバンドのエネルギー特性及びスペクトル特性に従って、前記M個のサブバンドの量子化されたエネルギーエンベロープを修正するか判定するステップであって、前記N個のサブバンドは更にK個のサブバンドを含み、前記M個のサブバンド及び前記K個のサブバンドは周波数において重複を有さず、前記M個のサブバンドの最大周波数は前記K個のサブバンドの最小周波数未満であり、M及びKの双方は正の整数であり、N=M+Kである、判定するステップと、
    前記M個のサブバンドの量子化されたエネルギーエンベロープが修正される必要があるという判定に基づき、前記M個のサブバンドの修正されたエネルギーエンベロープを取得するため、前記M個のサブバンドの量子化されたエネルギーエンベロープを個別に修正するステップと、
    前記M個のサブバンドの修正されたエネルギーエンベロープ及び前記K個のサブバンドのエネルギーエンベロープ情報に従って前記N個のサブバンドに対してビット割当てを実行するステップであって、前記N個のサブバンドのそれぞれは割り当てられた符号化ビットを有するか、あるいは、割り当てられた符号化ビットを有さない、実行するステップと、
    を有する方法。
  2. 前記M個のサブバンドのエネルギー属性値は、前記N個のサブバンドの量子化されたエネルギーエンベロープに従って決定される、請求項1記載の方法。
  3. 前記M個のサブバンドのエネルギー属性値は、
    前記M個のサブバンドの量子化されたエネルギーエンベロープの合計を取得し、
    前記K個のサブバンドの量子化されたエネルギーエンベロープの合計を取得し、
    前記K個のサブバンドの量子化されたエネルギーエンベロープの合計に対する前記M個のサブバンドの量子化されたエネルギーエンベロープの合計の比を計算することによって決定され、前記比は前記M個のサブバンドのエネルギー属性値を表す、請求項2記載の方法。
  4. 前記M個のサブバンドのスペクトル属性値は、前記M個のサブバンドの量子化されたエネルギーエンベロープに従って決定される、請求項1乃至3何れか一項記載の方法。
  5. 前記M個のサブバンドのスペクトル属性値は、
    前記M個のサブバンドの量子化されたエネルギーエンベロープの合計を取得し、
    前記M個のサブバンドの量子化されたエネルギーエンベロープの合計に対する前記M個のサブバンド内の第1のサブバンドの量子化されたエネルギーエンベロープの比を計算することによって決定され、前記比は前記M個のサブバンドのスペクトル属性値を表し、前記第1のサブバンドの量子化されたエネルギーエンベロープは前記M個のサブバンドのうち最大である、請求項4記載の方法。
  6. 前記M個のサブバンドのエネルギー属性値が第1の範囲内に属し、前記M個のサブバンドのスペクトル属性値が第2の範囲内に属するとき、前記M個のサブバンドの量子化されたエネルギーエンベロープを調整することを決定するステップを有する、請求項1乃至5何れか一項記載の方法。
  7. 前記第1の範囲は、[1/6,2/3]である、請求項6記載の方法。
  8. 前記オーディオ信号の符号化された帯域幅が0〜4KHzであるとき、前記第2の範囲は、[1/0.575*M,∞)である、請求項6又は7記載の方法。
  9. 前記オーディオ信号の符号化された帯域幅が0〜8KHzであるとき、前記第2の範囲は、[1/0.5*M,∞)である、請求項6又は7記載の方法。
  10. 前記M個のサブバンドの修正されたエネルギーエンベロープを取得するため、前記M個のサブバンドの量子化されたエネルギーエンベロープを個別に修正するステップは、
    前記M個のサブバンドの量子化されたエネルギーエンベロープ及び前記M個のサブバンド内の第1のサブバンドの量子化されたエネルギーエンベロープの合計に従って、前記M個のサブバンドのそれぞれの修正ファクタを決定するステップであって、前記第1のサブバンドの量子化されたエネルギーエンベロープは前記M個のサブバンドのうち最大である、決定するステップと、
    前記M個のサブバンドの修正されたエネルギーエンベロープを取得するため、調整ファクタを用いて前記M個のサブバンドの量子化されたエネルギーエンベロープを個別に修正するステップと、
    を含む、請求項1乃至9何れか一項記載の方法。
  11. 前記M個のサブバンドの各サブバンドの修正されたエネルギーエンベロープは、同一のサブバンドの量子化されたエネルギーエンベロープより大きい、請求項1乃至10何れか一項記載の方法。
  12. 前記K個のサブバンドのエネルギーエンベロープ情報は、前記K個のサブバンドのエネルギーエンベロープを含み、前記K個のサブバンドのサブバンドのエネルギーエンベロープは、量子化されたエネルギーエンベロープ又は前記量子化されたエネルギーエンベロープを修正することによって取得されるエネルギーエンベロープである、請求項1乃至11何れか一項記載の方法。
  13. オーディオ信号処理装置であって、
    オーディオ信号のN個のサブバンドのM個のサブバンドのエネルギー特性及びスペクトル特性に従って、前記M個のサブバンドの量子化されたエネルギーエンベロープを修正するか判定するよう構成される判定ユニットであって、前記N個のサブバンドは更にK個のサブバンドを含み、前記M個のサブバンド及び前記K個のサブバンドは周波数において重複を有さず、前記M個のサブバンドの最大周波数は前記K個のサブバンドの最小周波数未満であり、M及びKの双方は正の整数であり、N=M+Kである、判定ユニットと、
    前記M個のサブバンドの量子化されたエネルギーエンベロープが修正される必要があるという判定に基づき、前記M個のサブバンドの修正されたエネルギーエンベロープを取得するため、前記M個のサブバンドの量子化されたエネルギーエンベロープを個別に修正するよう構成される修正ユニットと、
    前記M個のサブバンドの修正されたエネルギーエンベロープ及び前記K個のサブバンドのエネルギーエンベロープ情報に従って前記N個のサブバンドに対してビット割当てを実行するよう構成される割当てユニットであって、前記N個のサブバンドのそれぞれは割り当てられた符号化ビットを有するか、あるいは、割り当てられた符号化ビットを有さない、割当てユニットと、
    を有する装置。
  14. 前記M個のサブバンドのエネルギー属性値は、前記N個のサブバンドの量子化されたエネルギーエンベロープに従って決定される、請求項13記載の装置。
  15. 前記M個のサブバンドのエネルギー属性値を決定する際、前記判定ユニットは、
    前記M個のサブバンドの量子化されたエネルギーエンベロープの合計を取得し、
    前記K個のサブバンドの量子化されたエネルギーエンベロープの合計を取得し、
    前記K個のサブバンドの量子化されたエネルギーエンベロープの合計に対する前記M個のサブバンドの量子化されたエネルギーエンベロープの合計の比を計算するよう構成され、前記比は前記M個のサブバンドのエネルギー属性値を表す、請求項14記載の装置。
  16. 前記M個のサブバンドのスペクトル属性値は、前記M個のサブバンドの量子化されたエネルギーエンベロープに従って決定される、請求項13乃至15何れか一項記載の装置。
  17. 前記M個のサブバンドのスペクトル属性値を決定する際、前記判定ユニットは、
    前記M個のサブバンドの量子化されたエネルギーエンベロープの合計を取得し、
    前記M個のサブバンドの量子化されたエネルギーエンベロープの合計に対する前記M個のサブバンド内の第1のサブバンドの量子化されたエネルギーエンベロープの比を計算するよう構成され、前記比は前記M個のサブバンドのスペクトル属性値を表し、前記第1のサブバンドの量子化されたエネルギーエンベロープは前記M個のサブバンドのうち最大である、請求項16記載の装置。
  18. 前記M個のサブバンドのエネルギー属性値が第1の範囲内に属し、前記M個のサブバンドのスペクトル属性値が第2の範囲内に属するとき、前記判定ユニットは、前記M個のサブバンドの量子化されたエネルギーエンベロープを調整することを決定するよう構成される、請求項13乃至17何れか一項記載の装置。
  19. 前記第1の範囲は、[1/6,2/3]である、請求項18記載の装置。
  20. 前記オーディオ信号の符号化された帯域幅が0〜4KHzであるとき、前記第2の範囲は、[1/0.575*M,∞)である、請求項18又は19記載の装置。
  21. 前記オーディオ信号の符号化された帯域幅が0〜8KHzであるとき、前記第2の範囲は、[1/0.5*M,∞)である、請求項18又は19記載の装置。
  22. 前記修正ユニットは、
    前記M個のサブバンドの量子化されたエネルギーエンベロープ及び前記M個のサブバンド内の第1のサブバンドの量子化されたエネルギーエンベロープの合計に従って、前記M個のサブバンドのそれぞれの修正ファクタを決定し、前記第1のサブバンドの量子化されたエネルギーエンベロープは前記M個のサブバンドのうち最大であり、
    前記M個のサブバンドの修正されたエネルギーエンベロープを取得するため、調整ファクタを用いて前記M個のサブバンドの量子化されたエネルギーエンベロープを個別に修正するよう構成される、請求項13乃至21何れか一項記載の装置。
  23. 前記M個のサブバンドの各サブバンドの修正されたエネルギーエンベロープは、同一のサブバンドの量子化されたエネルギーエンベロープより大きい、請求項13乃至22何れか一項記載の装置。
  24. 前記K個のサブバンドのエネルギーエンベロープ情報は、前記K個のサブバンドのエネルギーエンベロープを含み、前記K個のサブバンドのサブバンドのエネルギーエンベロープは、量子化されたエネルギーエンベロープ又は前記量子化されたエネルギーエンベロープを修正することによって取得されるエネルギーエンベロープである、請求項13乃至23何れか一項記載の装置。
  25. プログラムが記録されたコンピュータ可読記憶媒体であって、前記プログラムは請求項1乃至12何れか一項記載の方法をコンピュータに実行させる記憶媒体。
  26. 請求項1乃至12何れか一項記載の方法をコンピュータに実行させるよう構成されるコンピュータプログラム。
JP2017202843A 2014-04-29 2017-10-19 信号処理方法及び装置 Active JP6517300B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201410177234.3A CN105096957B (zh) 2014-04-29 2014-04-29 处理信号的方法及设备
CN201410177234.3 2014-04-29

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2016556272A Division JP6231699B2 (ja) 2014-04-29 2014-12-01 信号処理方法及び装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2019078807A Division JP6790166B2 (ja) 2014-04-29 2019-04-17 信号処理方法及び装置

Publications (2)

Publication Number Publication Date
JP2018041091A true JP2018041091A (ja) 2018-03-15
JP6517300B2 JP6517300B2 (ja) 2019-05-22

Family

ID=54358124

Family Applications (4)

Application Number Title Priority Date Filing Date
JP2016556272A Active JP6231699B2 (ja) 2014-04-29 2014-12-01 信号処理方法及び装置
JP2017202843A Active JP6517300B2 (ja) 2014-04-29 2017-10-19 信号処理方法及び装置
JP2019078807A Active JP6790166B2 (ja) 2014-04-29 2019-04-17 信号処理方法及び装置
JP2020184397A Active JP7144499B2 (ja) 2014-04-29 2020-11-04 信号処理方法及び装置

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2016556272A Active JP6231699B2 (ja) 2014-04-29 2014-12-01 信号処理方法及び装置

Family Applications After (2)

Application Number Title Priority Date Filing Date
JP2019078807A Active JP6790166B2 (ja) 2014-04-29 2019-04-17 信号処理方法及び装置
JP2020184397A Active JP7144499B2 (ja) 2014-04-29 2020-11-04 信号処理方法及び装置

Country Status (20)

Country Link
US (7) US9837088B2 (ja)
EP (3) EP3637417B1 (ja)
JP (4) JP6231699B2 (ja)
KR (4) KR101890346B1 (ja)
CN (2) CN105096957B (ja)
AU (2) AU2014392351B2 (ja)
BR (1) BR112016015855B1 (ja)
CA (1) CA2935084C (ja)
CL (1) CL2016002106A1 (ja)
ES (1) ES2755152T3 (ja)
HK (1) HK1212501A1 (ja)
IL (2) IL246427B (ja)
MX (2) MX2018009564A (ja)
NZ (1) NZ721875A (ja)
PT (1) PT3079150T (ja)
RU (3) RU2688259C2 (ja)
SG (2) SG11201605353YA (ja)
UA (1) UA117395C2 (ja)
WO (1) WO2015165264A1 (ja)
ZA (1) ZA201604465B (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105096957B (zh) * 2014-04-29 2016-09-14 华为技术有限公司 处理信号的方法及设备
CN107452391B (zh) 2014-04-29 2020-08-25 华为技术有限公司 音频编码方法及相关装置
RU2763480C1 (ru) * 2021-06-16 2021-12-29 Федеральное государственное казенное военное образовательное учреждение высшего образования "Военный учебно-научный центр Военно-Морского Флота "Военно-морская академия имени Адмирала флота Советского Союза Н.Г. Кузнецова" Устройство для восстановления речевого сигнала
CN117476013A (zh) * 2022-07-27 2024-01-30 华为技术有限公司 音频信号的处理方法、装置、存储介质及计算机程序产品

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005258478A (ja) * 2005-06-06 2005-09-22 Matsushita Electric Ind Co Ltd 符号化装置
JP2013511054A (ja) * 2009-11-27 2013-03-28 ゼットティーイー コーポレーション 階層的オーディオ符号化、復号化方法及びシステム
JP2017507366A (ja) * 2014-04-29 2017-03-16 華為技術有限公司Huawei Technologies Co.,Ltd. 信号処理方法及び装置

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100188912B1 (ko) * 1992-09-21 1999-06-01 윤종용 서브밴드코딩의 비트재할당 방법
JP3283413B2 (ja) * 1995-11-30 2002-05-20 株式会社日立製作所 符号化復号方法、符号化装置および復号装置
JP2003280698A (ja) * 2002-03-22 2003-10-02 Sanyo Electric Co Ltd 音声圧縮方法および音声圧縮装置
DE10345995B4 (de) 2003-10-02 2005-07-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines Signals mit einer Sequenz von diskreten Werten
DE102004007200B3 (de) 2004-02-13 2005-08-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiocodierung
WO2007041789A1 (en) * 2005-10-11 2007-04-19 National Ict Australia Limited Front-end processing of speech signals
US7590523B2 (en) 2006-03-20 2009-09-15 Mindspeed Technologies, Inc. Speech post-processing using MDCT coefficients
US8392198B1 (en) * 2007-04-03 2013-03-05 Arizona Board Of Regents For And On Behalf Of Arizona State University Split-band speech compression based on loudness estimation
JP2008309955A (ja) * 2007-06-13 2008-12-25 Toshiba Corp ノイズサプレス装置
US7885819B2 (en) * 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
KR20090110244A (ko) 2008-04-17 2009-10-21 삼성전자주식회사 오디오 시맨틱 정보를 이용한 오디오 신호의 부호화/복호화 방법 및 그 장치
JP2009288560A (ja) * 2008-05-29 2009-12-10 Sanyo Electric Co Ltd 音声符号化装置、音声復号装置、及びプログラム
US8352279B2 (en) * 2008-09-06 2013-01-08 Huawei Technologies Co., Ltd. Efficient temporal envelope coding approach by prediction between low band signal and high band signal
CN101727906B (zh) * 2008-10-29 2012-02-01 华为技术有限公司 高频带信号的编解码方法及装置
CN101770776B (zh) 2008-12-29 2011-06-08 华为技术有限公司 瞬态信号的编码方法和装置、解码方法和装置及处理系统
CN101770775B (zh) * 2008-12-31 2011-06-22 华为技术有限公司 信号处理方法及装置
JP5520967B2 (ja) 2009-02-16 2014-06-11 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュート 適応的正弦波コーディングを用いるオーディオ信号の符号化及び復号化方法及び装置
ES2374486T3 (es) * 2009-03-26 2012-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dispositivo y método para manipular una señal de audio.
CN101853663B (zh) * 2009-03-30 2012-05-23 华为技术有限公司 比特分配方法、编码装置及解码装置
US8498874B2 (en) 2009-09-11 2013-07-30 Sling Media Pvt Ltd Audio signal encoding employing interchannel and temporal redundancy reduction
CN102081926B (zh) * 2009-11-27 2013-06-05 中兴通讯股份有限公司 格型矢量量化音频编解码方法和系统
US8560330B2 (en) * 2010-07-19 2013-10-15 Futurewei Technologies, Inc. Energy envelope perceptual correction for high band coding
SG10201505469SA (en) 2010-07-19 2015-08-28 Dolby Int Ab Processing of audio signals during high frequency reconstruction
US9047875B2 (en) * 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
KR101826331B1 (ko) * 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
CN102436820B (zh) 2010-09-29 2013-08-28 华为技术有限公司 高频带信号编码方法及装置、高频带信号解码方法及装置
WO2012065081A1 (en) * 2010-11-12 2012-05-18 Polycom, Inc. Scalable audio in a multi-point environment
RU2505921C2 (ru) * 2012-02-02 2014-01-27 Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." Способ и устройство кодирования и декодирования аудиосигналов (варианты)
CN103366750B (zh) * 2012-03-28 2015-10-21 北京天籁传音数字技术有限公司 一种声音编解码装置及其方法
CN103544957B (zh) 2012-07-13 2017-04-12 华为技术有限公司 音频信号的比特分配的方法和装置
EP2717262A1 (en) * 2012-10-05 2014-04-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and methods for signal-dependent zoom-transform in spatial audio object coding
CN108198564B (zh) * 2013-07-01 2021-02-26 华为技术有限公司 信号编码和解码方法以及设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005258478A (ja) * 2005-06-06 2005-09-22 Matsushita Electric Ind Co Ltd 符号化装置
JP2013511054A (ja) * 2009-11-27 2013-03-28 ゼットティーイー コーポレーション 階層的オーディオ符号化、復号化方法及びシステム
JP2017507366A (ja) * 2014-04-29 2017-03-16 華為技術有限公司Huawei Technologies Co.,Ltd. 信号処理方法及び装置

Also Published As

Publication number Publication date
MX358255B (es) 2018-08-09
RU2656812C2 (ru) 2018-06-06
JP2019152871A (ja) 2019-09-12
US20230238010A1 (en) 2023-07-27
RU2702265C1 (ru) 2019-10-07
US20190267015A1 (en) 2019-08-29
CA2935084C (en) 2019-03-12
RU2016134014A (ru) 2018-02-22
RU2688259C2 (ru) 2019-05-21
CN106409303B (zh) 2019-09-20
US11881226B2 (en) 2024-01-23
US9837088B2 (en) 2017-12-05
CN105096957B (zh) 2016-09-14
EP3079150B1 (en) 2019-09-11
NZ721875A (en) 2018-03-23
CL2016002106A1 (es) 2016-12-16
AU2014392351B2 (en) 2017-09-14
JP6231699B2 (ja) 2017-11-15
US10347264B2 (en) 2019-07-09
EP3637417A1 (en) 2020-04-15
MX2018009564A (es) 2022-01-14
EP3079150A1 (en) 2016-10-12
JP7144499B2 (ja) 2022-09-29
HK1212501A1 (en) 2016-06-10
US20170047074A1 (en) 2017-02-16
ES2755152T3 (es) 2020-04-21
CN105096957A (zh) 2015-11-25
RU2018118576A (ru) 2018-10-31
UA117395C2 (uk) 2018-07-25
JP2017507366A (ja) 2017-03-16
AU2014392351A1 (en) 2016-07-21
SG11201605353YA (en) 2016-08-30
IL248575B (en) 2022-02-01
JP6790166B2 (ja) 2020-11-25
KR102052487B1 (ko) 2019-12-05
US20190108848A1 (en) 2019-04-11
PT3079150T (pt) 2019-10-29
KR20180095120A (ko) 2018-08-24
KR101890346B1 (ko) 2018-08-21
EP4372738A2 (en) 2024-05-22
KR20160099714A (ko) 2016-08-22
ZA201604465B (en) 2017-09-27
US20210343298A1 (en) 2021-11-04
EP3079150A4 (en) 2016-12-07
US20200135218A1 (en) 2020-04-30
US11081121B2 (en) 2021-08-03
IL246427B (en) 2019-03-31
CA2935084A1 (en) 2015-11-05
JP6517300B2 (ja) 2019-05-22
KR20180019761A (ko) 2018-02-26
US10546591B2 (en) 2020-01-28
EP3637417B1 (en) 2024-02-07
AU2017272204A1 (en) 2018-01-04
US11580996B2 (en) 2023-02-14
RU2018118576A3 (ja) 2019-03-05
KR101830855B1 (ko) 2018-02-21
BR112016015855B1 (pt) 2019-09-10
MX2016010690A (es) 2016-11-23
KR20190049954A (ko) 2019-05-09
SG10201801095QA (en) 2018-03-28
JP2021043453A (ja) 2021-03-18
US20170352358A1 (en) 2017-12-07
CN106409303A (zh) 2017-02-15
AU2017272204B2 (en) 2019-09-12
IL248575A0 (en) 2016-12-29
US10186271B2 (en) 2019-01-22
KR101977383B1 (ko) 2019-05-10
WO2015165264A1 (zh) 2015-11-05

Similar Documents

Publication Publication Date Title
JP6790166B2 (ja) 信号処理方法及び装置
JP6574820B2 (ja) 高周波帯域信号を予測するための方法、符号化デバイス、および復号デバイス
JP2017138616A (ja) オーディオ信号符号化及び復号化方法並びにオーディオ信号符号化及び復号化装置
JP2017151466A (ja) 符号化方法、復号化方法、符号化装置及び復号化装置
US20240185867A1 (en) Signal Processing Method and Device

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180904

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181204

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190319

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190417

R150 Certificate of patent or registration of utility model

Ref document number: 6517300

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250