JP6608993B2 - 符号化方法、装置、プログラム及び記録媒体 - Google Patents

符号化方法、装置、プログラム及び記録媒体 Download PDF

Info

Publication number
JP6608993B2
JP6608993B2 JP2018083901A JP2018083901A JP6608993B2 JP 6608993 B2 JP6608993 B2 JP 6608993B2 JP 2018083901 A JP2018083901 A JP 2018083901A JP 2018083901 A JP2018083901 A JP 2018083901A JP 6608993 B2 JP6608993 B2 JP 6608993B2
Authority
JP
Japan
Prior art keywords
encoding
unit
encoding process
current frame
frequency domain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018083901A
Other languages
English (en)
Other versions
JP2018139004A (ja
Inventor
健弘 守谷
優 鎌本
登 原田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Publication of JP2018139004A publication Critical patent/JP2018139004A/ja
Application granted granted Critical
Publication of JP6608993B2 publication Critical patent/JP6608993B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0016Codebook for LPC parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Spectroscopy & Molecular Physics (AREA)

Description

本発明は、音響信号の符号化技術に関する。特に、音響信号を周波数領域に変換して符号化する符号化技術に関する。
音声や音楽などの音響信号の符号化には、入力音響信号を周波数領域で符号化する手法が広く用いられている。音響信号の周波数領域での符号化方法としては、例えば非特許文献1や非特許文献2の方法がある。
非特許文献1に記載された符号化方法は、線形予測係数に変換可能な係数に基づくスペクトル包絡を用いた符号化処理を行うものである。具体的には、非特許文献1に記載された符号化方法は、入力音響信号から得られる線形予測係数に変換可能な係数を符号化して線形予測係数符号を得て、線形予測係数符号に対応する量子化済みの線形予測係数に変換可能な係数に対応するスペクトル包絡係数列で入力音響信号に対応する周波数領域係数列を正規化して得られる正規化係数列を符号化して正規化係数符号を得るものである。線形予測係数に変換可能な係数とは、線形予測係数そのもの、PARCOR係数(偏自己相関係数)またはLSPパラメータなどである。
非特許文献2に記載された符号化方法は、区分した周波数領域ごとの係数の平均エネルギーの対数値を隣接する周波数領域の平均エネルギーの対数値との差分をとり、差分値可変長符号化を伴う符号化処理を行うものである。具体的には、非特許文献2に記載された符号化方法は、入力音響信号に対応する周波数領域係数列を低域ほどサンプル数が少なく高域ほどサンプル数が多い周波数領域に区分し、区分した周波数領域ごとの平均エネルギーを得て、その平均エネルギーを対数軸で量子化する。量子化した値を隣接する周波数領域の平均エネルギーを同様に対数軸で量子化した値との差分を可変長符号化する。区分した周波数領域ごとの対数軸で量子化された平均エネルギーを使って、各周波数領域係数の量子化ビット数や各周波数領域係数の量子化ステップ幅を適応的に決定し、それに従って各周波数領域係数を量子化し、さらにそれを可変長符号化するものである。
Anthony Vetro, "MPEG Unified Speech and Audio Coding", Industry and Standards, IEEE MultiMedia, April-June, 2013. M. Bosi and R.E. Goldberg, "Introduction to Digital Audio Coding and Standards", Kluwer Academic Publishers, 2003.
非特許文献2の符号化方法によれば、入力音響信号のスペクトル包絡の起伏が大きくない場合やスペクトルの集中度が高くない場合には、平均エネルギーの差分を可変長符号化することにより平均エネルギー符号の符号量を少なくすることができるため、入力音響信号を効率良く符号化することができる。しかし、入力音響信号のスペクトル包絡の起伏が大きい場合やスペクトルの集中度が高い場合には、平均エネルギーの差分を可変長符号化して得られる平均エネルギー符号の符号量が多くなる。
これに対し、非特許文献1の符号化方法によれば、線形予測係数に変換可能な係数によりスペクトル包絡を効率良く符号化できるため、入力音響信号のスペクトル包絡の起伏が大きい場合やスペクトルの集中度が高い場合には、非特許文献2の符号化方法よりも入力音響信号を効率良く符号化することができる。しかし、入力音響信号のスペクトル包絡の起伏が大きくない場合やスペクトルの集中度が高くない場合には、非特許文献2の符号化方法ほどは効率良く符号化することはできない。
このように、従来の符号化方法には、入力音響信号の特性によっては効率良く符号化できない場合がある。
本発明は、入力音響信号の特性によらず効率の良く符号化し、かつ、受聴者が不自然に感じることの少ない復号音響信号を得られるような符号化方法、装置、プログラム及び記録媒体を提供することを目的とする。
本発明の一態様の符号化方法は、入力音響信号を、所定時間区間のフレームごとに、周波数領域での複数の符号化処理のうちの決定された符号化処理で符号化する符号化方法であって、前フレームの入力音響信号の高域成分のエネルギーの大きさと現フレームの入力音響信号の高域成分のエネルギーの大きさとの少なくとも何れかが所定の閾値以下の場合に、前フレームと異なる符号化処理を現フレームの符号化処理として決定することを可能とする決定ステップ、を含み、入力音響信号に対応する線形予測係数に変換可能な係数に基づくスペクトル包絡を用いて、入力音響信号に対応する周波数領域の係数列を符号化する第一符号化ステップと、入力音響信号に対応する周波数領域の係数列について、区分した周波数領域ごとの係数の平均エネルギーの対数値を隣接する周波数領域の平均エネルギーの対数値との差分の可変長符号化を伴って符号化する第二符号化ステップと、を更に含み、決定ステップは、更に、前フレームと異なる符号化処理を現フレームの符号化処理とすることを可能とされた場合のうち、前フレームの入力音響信号を第一符号化ステップで符号化し、かつ、現フレームの入力音響信号のスペクトルの起伏が大きいまたは集中度が高いことを示す指標が所定の閾値より小さい場合には、現フレームを第二符号化ステップで符号化することを決定する。
本発明の一態様の符号化方法は、入力音響信号を、所定時間区間のフレームごとに、周波数領域での複数の符号化処理のうちの決定された符号化処理で符号化する符号化方法であって、前フレームの入力音響信号の高域成分のエネルギーの大きさと現フレームの入力音響信号の高域成分のエネルギーの大きさとの少なくとも何れかが所定の閾値以下の場合には、前フレームと異なる符号化処理を現フレームの符号化処理として決定することを可能とし、そうでない場合には、入力音響信号の高域成分が疎である状態に従って、前フレームと異なる符号化処理を現フレームの符号化処理として決定することを可能とするか、前フレームと同じ符号化処理を現フレームの符号化処理として決定するか、を決定する決定ステップ、を含み、入力音響信号に対応する線形予測係数に変換可能な係数に基づくスペクトル包絡を用いて、入力音響信号に対応する周波数領域の係数列を符号化する第一符号化ステップと、入力音響信号に対応する周波数領域の係数列について、区分した周波数領域ごとの係数の平均エネルギーの対数値を隣接する周波数領域の平均エネルギーの対数値との差分の可変長符号化を伴って符号化する第二符号化ステップと、を更に含み、決定ステップは、更に、前フレームと異なる符号化処理を現フレームの符号化処理とすることを可能とされた場合のうち、前フレームの入力音響信号を第一符号化ステップで符号化し、かつ、現フレームの入力音響信号のスペクトルの起伏が大きいまたは集中度が高いことを示す指標が所定の閾値より小さい場合には、現フレームを第二符号化ステップで符号化することを決定する。
フレームごとに周波数領域で符号化を行う複数の符号化処理の何れかを選択可能な構成により、受聴者が不自然に感じることの少ない復号音響信号を得ることが可能となる。
符号化装置の構成を例示したブロック図。 復号装置の構成を例示したブロック図。 符号化方法の処理の流れの例を示す図。 決定部380の処理の流れの例を示す図。 適合符号化処理判定部382の処理の流れの例を示す図。 第二実施形態の切替決定部383の処理の流れの例を示す図。 第三実施形態の適合符号化処理判定部382の処理の流れの例を示す図。 第一符号化処理及び第二符号化処理の概念図。
[第一実施形態]
以下、本発明の第一実施形態について説明する。第一実施形態は、周波数領域での符号化処理を行う複数の異なる符号化処理の何れかでフレーム毎の入力音響信号に対応する周波数領域の係数列を符号化する構成において、入力音響信号または/および入力音響信号に対応する周波数領域の係数列の高域成分のエネルギーが小さい場合にのみ、符号化処理の切り替えを行う構成である。入力音響信号の高域成分のエネルギーとは、入力音響信号の高域成分のエネルギーの大きさそのものや、入力音響信号に占める高域成分のエネルギーの大きさなどである。
<符号化装置300>
符号化装置300の構成を図1に示す。符号化装置300は、周波数領域変換部110、決定部380、第一符号化部101、第二符号化部201を備えている。第一符号化部101は、例えば、線形予測分析符号化部120、スペクトル包絡係数列生成部130、包絡正規化部140、正規化係数符号化部150を備えている。第二符号化部201は、例えば、領域分割部220、平均対数エネルギー差分可変長符号化部240、係数符号化部250を備えている。符号化装置300には、所定の時間区間であるフレーム単位で、時間領域の音声音響ディジタル信号(以下、入力音響信号とする。)が入力され、フレームごとに以下の処理が行われる。以下では、現在の入力音響信号がf番目のフレームであるとして、各部の具体処理を説明する。f番目のフレームの入力音響信号をxf(n) (n=1, ..., Nt)とする。ここでNtはフレームあたりのサンプル数である。
以下、符号化装置300の動作について説明する。符号化装置300により、図3に例示する符号化方法の各ステップの処理が実行される。
<周波数領域変換部110>
周波数領域変換部110は、入力音響信号xf(n) (n=1, ..., Nt)を周波数領域の係数列、例えば、N点のMDCT係数列Xf(n) (n=1, ..., N)に変換して出力する(ステップS110)。ただし、Nは、周波数領域でのサンプル数であり、正の整数である。周波数領域への変換は、MDCTではない公知の変換方法により行ってもよい。
また、第一符号化部101、第二符号化部201、決定部380で複数の精度や方法により得られた周波数領域の係数列が必要である場合には、周波数領域変換部110で、複数の精度や方法により周波数領域の係数列を得ればよい。例えば、第一符号化部101と第二符号化部201がMDCT係数列を周波数領域の係数列として用い、決定部380がパワースペクトル系列を周波数領域の係数列として用いる場合には、周波数領域変換部110が、入力音響信号からMDCT係数列とパワースペクトル系列を求めればよい。また、例えば、第一符号化部101と第二符号化部201がMDCT係数列を周波数領域の係数列として用い、決定部380が周波数帯域ごとのエネルギーの系列を周波数領域の係数列として用いる場合には、周波数領域変換部110が、入力音響信号からMDCT係数列と周波数帯域ごとのエネルギーの系列を求めればよい。また、例えば、第一符号化部101と第二符号化部201がMDCT係数列を周波数領域の係数列として用い、決定部380の切替可否判定部381が周波数帯域ごとのエネルギーの系列を周波数領域の係数列として用い、決定部380の適合符号化処理判定部382がパワースペクトル系列を周波数領域の係数列として用いる場合には、周波数領域変換部110が、入力音響信号からMDCT係数列と周波数帯域ごとのエネルギーの系列とパワースペクトル系列を求めればよい。
<決定部380>
決定部380は、前フレームの入力音響信号の高域成分のエネルギーの大きさと、現フレームの入力音響信号の高域成分のエネルギーの大きさとの少なくとも何れかが所定の閾値より小さい場合に、前フレームと異なる符号化処理を現フレームの符号化処理として決定することを可能とする(ステップS380)。
言い代えれば、決定部380は、少なくとも、入力音響信号の高域成分のエネルギーが小さい場合には、前フレームの周波数領域の係数列を符号化した符号化処理と異なる符号化処理で現フレームの周波数領域の係数列を符号化することを許し、そうでない場合には前フレームの周波数領域の係数列を符号化した符号化処理と異なる符号化処理で現フレームの周波数領域の係数列を符号化することを許さない判定を行い、その判定結果に従って現フレームの周波数領域の係数列を符号化するように切替制御する。
決定部380は、例えば、切替可否判定部381、適合符号化処理判定部382、切替決定部383、切替部384を備えている。以下、決定部380の一例について説明する。決定部380は、図4に例示する各ステップの処理を行う。
<切替可否判定部381>
切替可否判定部381は、前フレームの入力音響信号の高域成分のエネルギーの大きさと、現フレームの入力音響信号の高域成分のエネルギーの大きさとの少なくとも何れかが所定の閾値より小さい場合には、切り替え可、すなわち、前フレームの周波数領域の係数列を符号化した符号化処理と異なる符号化処理で現フレームの周波数領域の係数列を符号化することを可能とする、と判定し、そうでない場合には切り替え不可、すなわち、前フレームの周波数領域の係数列を符号化した符号化処理と異なる符号化処理で現フレームの周波数領域の係数列を符号化することを許さない、と判定し、判定結果を出力する(ステップS381)。
以下、切替可否判定部381の動作の例を説明する。まず、入力音響信号の高域成分のエネルギーの大きさとして、MDCT係数列の高域のエネルギーを用いる例を説明する。
切替可否判定部381は、まず、前フレームのMDCT係数列Xf-1(n) (n=1, ..., N)の高域のエネルギーEhf-1を下記の式(1)により、現フレームのMDCT係数列Xf(n) (n=1, ..., N)の高域のエネルギーEhfを下記の式(2)により、それぞれ求める(ステップS3811)。式(1)と式(2)において、MはNより小さい予め定めた正の整数である。
切替可否判定部381は、次に、前フレームの高域のエネルギーEhf-1と現フレームの高域のエネルギーEhfの少なくとも何れかが予め定めた閾値TH1より小さい場合、すなわち、Ehf-1<TH1および/またはEhf<TH1である場合、には切り替え可と判定し、そうでない場合には切り替え不可と判定し、切り替え可否の情報を出力する(ステップS3812)。
なお、現フレームのステップS3811で求まる前フレームの高域のエネルギーEhf-1は、前フレームのステップS3811で求めた現フレームの高域のエネルギーEhfと同じである。このため、計算した高域のエネルギーEhfを少なくとも直後のフレームまで切替可否判定部381内に記憶しておけば、前フレームの高域のエネルギーEhf-1を計算する必要は無い。
次に、入力音響信号の高域成分のエネルギーの大きさとして、MDCT係数列の全エネルギーに対する高域のエネルギーの割合を用いる例を説明する。
切替可否判定部381は、まず、前フレームのMDCT係数列Xf-1(n) (n=1, ..., N)の全エネルギーに対する高域のエネルギーの割合Ehf-1を下記の式(1A)により、現フレームのMDCT係数列Xf(n) (n=1, ..., N)の全エネルギーに対する高域のエネルギーの割合Ehfを下記の式(2A)により、それぞれ求める(ステップS3811)。式(1A)と式(2A)において、Mは予め定めた正の整数である。
切替可否判定部381は、次に、前フレームの全エネルギーに対する高域のエネルギーの割合Ehf-1と現フレームの全エネルギーに対する高域のエネルギーの割合Ehfの少なくとも何れかが予め定めた閾値TH1より小さい場合、すなわち、Ehf-1<TH1および/またはEhf<TH1である場合、には切り替え可と判定し、そうでない場合には切り替え不可と判定し、切り替え可否の情報を出力する(ステップS3812)。
なお、現フレームのステップS3811で求まる前フレームの全エネルギーに対する高域のエネルギーの割合Ehf-1は、前フレームのステップS3811で求めた現フレームの全エネルギーに対する高域のエネルギーの割合Ehfと同じである。このため、計算した全エネルギーに対する高域のエネルギーの割合Ehfを少なくとも直後のフレームまで切替可否判定部381内に記憶しておけば、前フレームの全エネルギーに対する高域のエネルギーの割合Ehf-1を計算する必要は無い。
なお、上述の二つの例では、Ehf-1<TH1および/またはEhf<TH1である場合には切り替え可と判定し、そうでない場合には切り替え不可と判定しているが、Ehf-1<TH1かつEhf<TH1である場合には切り替え可と判定し、そうでない場合には切り替え不可と判定してもよい。すなわち、前フレームの入力音響信号の高域成分のエネルギーの大きさと現フレームの入力音響信号の高域成分のエネルギーの大きさとの双方が所定の閾値より小さい場合には、切り替え可、すなわち、前フレームの周波数領域の係数列を符号化した符号化処理と異なる符号化処理で現フレームの周波数領域の係数列を符号化することを可能とする、と判定し、そうでない場合には切り替え不可、すなわち、前フレームの周波数領域の係数列を符号化した符号化処理と異なる符号化処理で現フレームの周波数領域の係数列を符号化することを許さない、と判定してもよい。
また、上述の例では、MDCT係数列を用いて高域のエネルギーや全エネルギーに対する高域のエネルギーの割合を求めているが、パワースペクトル系列や周波数帯域ごとのエネルギーの系列を用いて高域のエネルギーや全エネルギーに対する高域のエネルギーの割合を求めてもよい。
<適合符号化処理判定部382>
適合符号化処理判定部382は、現フレームの入力音響信号に対応する周波数領域の係数列が、第一符号化部101の符号化処理と第二符号化部201の符号化処理の何れに適しているかを判定し、判定結果を出力する(ステップS382)。
以下、適合符号化処理判定部382の動作の一例を説明する。適合符号化処理判定部382は、図5に例示する各ステップの処理を行う。以下の例では、第一符号化部101の符号化処理が非特許文献1に例示される線形予測係数に変換可能な係数に基づくスペクトル包絡を用いた符号化処理であり、第二符号化部201の符号化処理が非特許文献2に例示される区分した周波数領域ごとの係数の平均エネルギーの対数値を隣接する周波数領域の平均エネルギーの対数値との差分の可変長符号化を伴う符号化処理である。
この例では、入力音響信号のスペクトル包絡の起伏が大きいまたは/および集中度が高い場合には、現フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部101の符号化処理に適していると判定し、入力音響信号のスペクトル包絡の起伏が小さいまたは/および集中度が低い場合には、現フレームの入力音響信号に対応する周波数領域の係数列が第二符号化部201の符号化処理に適していると判定し、判定結果を出力する。
スペクトルの起伏や集中度を推定する方法としては、何れの方法を採用してもよいが、以下の例では、スペクトルまたはその包絡の谷の深さを推定する構成について説明する。この構成では、スペクトルまたはその包絡の谷が浅いときにはスペクトルの起伏が小さく集中度が低いと判定され、スペクトルまたはその包絡の谷が深いときにはスペクトルの起伏が大きく集中度が高いと判定される。スペクトルまたはその包絡の谷が浅いということは、ノイズフロアが高いともいえる。また、スペクトルまたはその包絡の谷が深いということは、ノイズフロアが低いともいえる。
適合符号化処理判定部382は、まず、現フレームのMDCT係数列Xf(n) (n=1, ..., N)をPサンプルごとのQ個の部分係数列XSf(1)(n) (n=1, ..., P), XS f(2)(n) (n=1, ..., P), ..., XSf(Q)(n) (n=1, ..., P)に分ける(ステップS3821)。PおよびQは、P×Q=Nの関係を満たす正の整数である。P=1でもよい。また、ここでは第一符号化部101または第二符号化部201で符号化処理の対象となる周波数領域の係数列であるMDCT係数列Xf(n) (n=1, ..., N)を適合符号化処理判定部382でも用いる構成としているが、MDCT係数列Xf(n) (n=1, ..., N)とは別の精度や方法で周波数領域に変換して得られた周波数領域の係数列、例えば、パワースペクトル系列を適合符号化処理判定部382による処理の対象としてもよい。
適合符号化処理判定部382は、次に、部分係数列XS f(1)(n) (n=1, ..., P), XS f(2)(n) (n=1, ..., P), ..., XS f(Q)(n) (n=1, ..., P)ごとのパワーの平均値またはその対数値による系列AVEXS(q) (q=1, …, Q)を求める(ステップS3822)。パワーの平均値は式(3)により求まるAVEXS(q)である。また、パワーの平均値の対数値は式(3A)により求まるAVEXS(q)である。
適合符号化処理判定部382は、次に、パワーの平均値またはパワーの平均値の対数値による系列AVEXS(1), AVEXS(2) , ..., AVEXS(Q)の各要素について、隣接する2つの要素のうちのいずれよりも小さいかどうかを判定し、判定された要素数を求める(ステップS3823)。すなわち、式(4)を満たすqの個数Vallyを求める。
適合符号化処理判定部382は、次に、式(4)を満たすqに対応するVally個のAVEXS(q)の平均値EV、すなわち、谷の部分領域の平均値EVを求める(ステップS3824)。AVEXS(q)がパワーの平均値である場合には、ステップS3824で求まるEVは谷の部分における部分領域のパワーの平均値である。AVEXS(q)がパワーの平均値の対数値である場合には、ステップS3824で求まるEVは部分領域のパワーの平均値の対数値の谷の部分における平均値である。適合符号化処理判定部382は、また、すべての部分領域のパワーの平均値またはパワーの平均値の対数値を求める(ステップS3825)。すべての部分領域のパワーの平均値は、MDCT係数列Xf(n) (n=1, ..., N)のパワーの平均値であり、式(11)により求まるEである。すべての部分領域のパワーの平均値の対数値は、MDCT係数列Xf(n) (n=1, ..., N)のパワーの平均値の対数値であり、式(11A)により求まるEである。
適合符号化処理判定部382は、次に、すべての部分領域のAVEXS(q)の平均値Eと谷の部分領域のAVEXS(q)の平均値EVの差が所定の閾値TH2以下である場合には、スペクトルの谷が浅く、スペクトル包絡の起伏の少ないか集中度が低いスペクトルであると推定されることから、現フレームの入力音響信号に対応する周波数領域の係数列が第二符号化部201の符号化処理に適合すると判定する。逆にすべての部分領域のAVEXS(q)の平均値Eと谷の部分領域のAVEXS(q)の平均値EVの差が閾値TH2より大きい場合には、スペクトルの谷が深く、スペクトル包絡の起伏が大きいか集中度が高いスペクトルであると推定されることから、現フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部101の符号化処理が適合すると判定する。適合符号化処理判定部382は、何れの符号化処理が適合するかの情報を出力する(ステップS3826)。適合する符号化処理の情報は、適合情報ともよぶ。
また、ステップS3821では、部分係数列ごとに異なるサンプル数としてもよい。例えば、現フレームのMDCT係数列Xf(n) (n=1, ..., N)をQ個の部分係数列XS f(1)(n) (n=1, ..., P1), XS f(2)(n) (n=1, ..., P2), ..., XS f(Q)(n) (n=1, ..., PQ)に分けてもよい。P1, P2, ..., PQは、P1+P2+...+PQ=Nを満たす正の整数である。また、P1, P2, ..., PQは、P1≦P2≦...≦PQを満たすことが好ましい。また、Qは正の整数である。
<切替決定部383>
切替決定部383は、切替可否判定部381が得た切り替え可否の情報と、適合符号化処理判定部382が得た何れの符号化処理が適合するかの情報と、から、現フレームの周波数領域の係数列を第一符号化部101で符号化するか第二符号化部201で符号化するかを決定し、決定した符号化処理を特定可能な符号である切替符号を出力する(ステップS383)。出力した切替符号は復号装置400に入力される。ここで、切替決定部383は、切り替え不可である場合には、現フレームが適合する符号化処理が何れの符号化処理であったとしても、前フレームと同じ符号化処理で現フレームの周波数領域の係数列を符号化することを決定する。また、切り替え可である場合には、前フレームの符号化処理が何れの符号化処理であったとしても、現フレームが適合する符号化処理で現フレームの周波数領域の係数列を符号化することを決定する。ただし、切り替え可である場合であっても、現フレームが適合する符号化処理ではなく前フレームと同じ符号化処理で現フレームの周波数領域の係数列を符号化すると決定する場合が含まれていてもよい。
以下、切替決定部383の動作の一例を説明する。以下の例では、第一符号化部101の符号化処理が非特許文献1に例示される線形予測係数に変換可能な係数に基づくスペクトル包絡を用いた符号化処理であり、第二符号化部201の符号化処理が非特許文献2に例示される区分した周波数領域ごとの係数の平均エネルギーの対数値の隣接する周波数領域の平均エネルギーの対数値との差分の可変長符号化を伴う符号化処理である。
切替決定部383は、切替可否判定部381が得た切り替え可否の情報が切り替え不可を表す場合、および/または、適合符号化処理判定部382が得た何れの符号化処理が適合するかの情報が前フレームのMDCT係数列Xf-1(n) (n=1, ..., N)の符号化処理と同じ符号化処理を表す場合、には、前フレームのMDCT係数列Xf-1(n) (n=1, ..., N)の符号化処理と同じ符号化処理を現フレームのMDCT係数列Xf(n) (n=1, ..., N)の符号化処理として決定する。
すなわち、前フレームのMDCT係数列Xf-1(n) (n=1, ..., N)が第一符号化部101で符号化された場合であって、切替可否判定部381が得た切り替え可否の情報が切り替え不可を表す場合、には、現フレームのMDCT係数列Xf(n) (n=1, ..., N)も第一符号化部101で符号化すると決定する。また、前フレームのMDCT係数列Xf-1(n) (n=1, ..., N)が第一符号化部101で符号化された場合であって、適合符号化処理判定部382が得た何れの符号化処理が適合するかの情報が第一符号化部101の符号化処理を表す場合、にも、現フレームのMDCT係数列Xf(n) (n=1, ..., N)も第一符号化部101で符号化すると決定する。
また、前フレームのMDCT係数列Xf-1(n) (n=1, ..., N)が第二符号化部201で符号化された場合であって、切替可否判定部381が得た切り替え可否の情報が切り替え不可を表す場合、には、現フレームのMDCT係数列Xf(n) (n=1, ..., N)も第二符号化部201で符号化すると決定する。また、前フレームのMDCT係数列Xf-1(n) (n=1, ..., N)が第二符号化部201で符号化された場合であって、適合符号化処理判定部382が得た何れの符号化処理が適合するかの情報が第二符号化部201の符号化処理を表す場合、にも、現フレームのMDCT係数列Xf(n) (n=1, ..., N)も第二符号化部201で符号化すると決定する。
切替可否判定部381が得た切り替え可否の情報が切り替え可を表す場合、かつ、適合符号化処理判定部382が得た何れの符号化処理が適合するかの情報が前フレームのMDCT係数列Xf-1(n) (n=1, ..., N)の符号化処理と異なる符号化処理を表す場合、には、前フレームのMDCT係数列Xf-1(n) (n=1, ..., N)の符号化処理と異なる符号化処理を現フレームのMDCT係数列Xf(n) (n=1, ..., N)の符号化処理として決定する。すなわち、前フレームのMDCT係数列Xf-1(n) (n=1, ..., N)が第一符号化部101で符号化された場合であって、切替可否判定部381が得た切り替え可否の情報が切り替え可を表し、適合符号化処理判定部382が得た何れの符号化処理が適合するかの情報が第二符号化部201の符号化処理を表す場合には、現フレームのMDCT係数列Xf(n) (n=1, ..., N)は第二符号化部201で符号化すると決定する。また、前フレームのMDCT係数列Xf-1(n) (n=1, ..., N)が第二符号化部201で符号化された場合であって、切替可否判定部381が得た切り替え可否の情報が切り替え可を表し、適合符号化処理判定部382が得た何れの符号化処理が適合するかの情報が第一符号化部101の符号化処理を表す場合には、現フレームのMDCT係数列Xf(n) (n=1, ..., N)は第一符号化部101で符号化すると決定する。
<切替部384>
切替部384は、切替決定部383で決定した符号化処理で現フレームのMDCT係数列Xf(n) (n=1, ..., N)が符号化されるように、周波数領域変換部110が出力したMDCT係数列Xf(n) (n=1, ..., N)を第一符号化部101または第二符号化部201に入力するように制御を行う(ステップS384)。また、現フレームのMDCT係数列Xf(n) (n=1, ..., N)の符号化のために、現フレームの入力音響信号xf(n) (n=1, ..., Nt)も必要である場合には、現フレームの入力音響信号xf(n) (n=1, ..., Nt)も第一符号化部101または/および第二符号化部201に入力する。
例えば、第一符号化部101の符号化処理が非特許文献1に例示される線形予測係数に変換可能な係数に基づくスペクトル包絡を用いた符号化処理であり、第二符号化部201の符号化処理が非特許文献2に例示される区分した周波数領域ごとの係数の平均エネルギーを隣接する周波数領域の平均エネルギーとの差分の可変長符号化を伴う符号化処理である場合には、第一符号化部101のみで現フレームの入力音響信号xf (n) (n=1, ..., Nt)が必要となるため、MDCT係数列Xf(n) (n=1, ..., N)を第一符号化部101に入力する場合には現フレームの入力音響信号xf(n) (n=1, ..., Nt)も第一符号化部101に入力する。
<第一符号化部101、第二符号化部201>
第一符号化部101と第二符号化部201は、共に周波数領域の係数列を符号化する符号化処理を行うものであるが、行う符号化処理は互いに異なる。すなわち、第一符号化部101は、第二符号化部201とは異なる符号化処理により現フレームの周波数領域の係数列を符号化し、得られた符号である第一符号を出力する(ステップS101)。また、第二符号化部201は、第一符号化部101とは異なる符号化処理により現フレームの周波数領域の係数列を符号化し、得られた符号である第二符号を出力する(ステップS201)。例えば、第一符号化部101は線形予測係数に変換可能な係数に基づくスペクトル包絡を用いた符号化処理を行い、第二符号化部201は区分した周波数領域ごとの係数の平均エネルギーを用いた符号化処理を行う。
以下、第一符号化部101と第二符号化部201の動作の一例を説明する。以下の例では、第一符号化部101の符号化処理が非特許文献1に例示される線形予測係数に変換可能な係数に基づくスペクトル包絡を用いた符号化処理であり、第二符号化部201の符号化処理が非特許文献2に例示される区分した周波数領域ごとの係数の平均エネルギーを隣接する周波数領域の平均エネルギーとの差分の可変長符号化を伴う符号化処理である。
この例では、第一符号化部101による第一符号化処理は、図8の左に例示するように線形予測係数に変換可能な係数で周波数領域のスペクトル包絡形状を表現するものである。一方、第二符号化部201による第二符号化処理は、図8の右に例示するようにスケール・ファクタ・バンド(周波数領域係数列の複数の領域への区分)で包絡形状を表現するものである。第二符号化処理によれば、各領域の平均の高さの差分値の可変長符号化を使うため、平均値が滑らかに変化する場合に、非常に効率がよいと言える。
決定部380の決定又は選択の結果に基づいて、周波数領域での複数の符号化処理である第一符号化部101の処理及び第二符号化部201の処理のうちの一方が行われる。
<第一符号化部101>
第一符号化部101は、線形予測分析符号化部120、スペクトル包絡係数列生成部130、包絡正規化部140、正規化係数符号化部150を備えている。第一符号化部101には、現フレームのMDCT係数列Xf(n) (n=1, ..., N)と入力音響信号x f(n) (n=1, ..., Nt)が入力され、線形予測係数符号CLfと正規化係数符号CNfを含む第一符号が出力される。出力された第一符号は復号装置400に入力される。なお、第一符号化部101は、非特許文献1に記載された符号化処理から入力音響信号を周波数領域の係数列に変換する部分を除いたものである。すなわち、周波数領域変換部110と第一符号化部101とで行われる符号化処理は、非特許文献1に記載された符号化処理と同様である。
<線形予測分析符号化部120>
線形予測分析符号化部120は、入力音響信号xf(n) (n=1, ..., Nt)を線形予測分析して線形予測係数に変換可能な係数を求め、線形予測係数に変換可能な係数を符号化して、線形予測係数符号CLfと、線形予測係数符号CLfに対応する量子化された線形予測係数に変換可能な係数と、を得て出力する(ステップS120)。線形予測係数に変換可能な係数とは、線形予測係数そのもの、PARCOR係数(偏自己相関係数)またはLSPパラメータなどである。
<スペクトル包絡係数列生成部130>
スペクトル包絡係数列生成部130は、線形予測分析符号化部120が得た量子化された線形予測係数に変換可能な係数に対応するパワースペクトル包絡係数列Wf(n) (n=1, ..., N)を得て出力する(ステップS130)。
<包絡正規化部140>
包絡正規化部140は、スペクトル包絡係数列生成部130が得たパワースペクトル包絡係数列Wf(n) (n=1, ..., N)を用いて、周波数領域変換部110が得たMDCT係数列の各係数Xf(n) (n=1, ..., N)を正規化し、正規化MDCT係数列XNf(n) (n=1, ..., N)を出力する(ステップS140)。すなわち、MDCT係数列Xf(n) (n=1, ..., N)の各係数をパワースペクトル包絡係数列Wf(n) (n=1, ..., N)に含まれる対応する係数で除した値による系列を正規化MDCT係数列XNf(n) (n=1, ..., N)として求める。
<正規化係数符号化部150>
正規化係数符号化部150は、包絡正規化部140が得た正規化MDCT係数列XNf(n) (n=1, ..., N)を符号化して正規化係数符号CNfを得る(ステップS150)。
<第二符号化部201>
また、第二符号化部201は、領域分割部220、平均対数エネルギー差分可変長符号化部240、係数符号化部250を備えている。第二符号化部201には、現フレームのMDCT係数列Xf(n) (n=1, ..., N)が入力され、平均エネルギー符号CAと係数符号CDfを含む第二符号が出力される。出力された第二符号は復号装置400に入力される。なお、第二符号化部201は、非特許文献2に記載された符号化処理から入力音響信号を周波数領域の係数列に変換する部分を除いたものである。すなわち、周波数領域変換部110と第二符号化部201とで行われる符号化処理は、非特許文献2に記載された符号化処理と同様である。
<領域分割部220>
領域分割部220は、周波数領域変換部110が得たMDCT係数列Xf(n) (n=1, ..., N)を低域の部分領域ほどサンプル数が少なく高域の部分領域ほどサンプル数が多い複数の部分領域に分ける(ステップS220)。部分領域の個数をRとし、各部分領域に含まれるサンプル数をS1, ..., SRとすると、MDCT係数列の各係数Xf(n) (n=1, ..., N)は、最低域のサンプルから順に各部分領域に、XBf(1)(n) (n=1, ..., S1), XBf(2)(n) (n=1, ..., S2), ..., XBf(R)(n) (n=1, ..., SR)と分けられることになる。RおよびS1, ..., SRは正の整数である。S1, ..., SRは、S1≦S2≦... ≦SRの関係を満たすとする。XBf(1)(n) (n=1, ..., S1), XBf(2)(n) (n=1, ..., S2), ..., XBf(R)(n) (n=1, ..., SR)を部分領域係数列と呼ぶ。
<平均対数エネルギー差分可変長符号化部240>
平均対数エネルギー差分可変長符号化部240は、領域分割部220が得た各部分領域について、部分領域に含まれる係数の平均エネルギーを求め、部分領域の平均エネルギーそれぞれについて対数軸で量子化し、隣接する部分領域の平均エネルギーの対数軸での量子化値との差を可変長符号化し、平均エネルギー符号CAfを得る(ステップS240)。
平均対数エネルギー差分可変長符号化部240は、まず、各部分領域r (r=1, ..., R)の平均エネルギーEXB(r) (r=1, ..., R)を式(5)により求める(ステップS2401)。
平均対数エネルギー差分可変長符号化部240は、次に、各部分領域について、平均エネルギーEXB (r) (r=1, ..., R)の対数領域でのスカラ量子化を行い平均エネルギーの対数領域での量子化値Q(log(EXB (r))) (r=1, ..., R)を得る(ステップS2402)。平均対数エネルギー差分可変長符号化部240は、次に、各部分領域について、平均エネルギーの対数領域での量子化値Q(log(EXB (r)))と隣接する部分領域に含まれる係数の平均エネルギーの対数領域での量子化値Q(log(EXB (r-1)))との差DiffEXB(r)を求める(ステップS2403)。ただし、r=1の場合は、平均エネルギーEXB (1)の対数値のスカラ量子化値Q(log(EXB (r)))そのものをDiffEXB(1)とする。DiffEXB(r) (r=1, ..., R)を平均対数エネルギー差分と呼ぶ。すなわち、DiffEXB(r) (r=1, ..., R)は式(6)により求まる。ただし、Q()を、スカラ量子化関数とし、入力を予め定めた値で正規化(除算)して得られた値の小数部分を四捨五入して得られる整数値を出力する関数とする。
平均対数エネルギー差分可変長符号化部240は、次に、平均対数エネルギー差分DiffEXB(r) (r=1, ..., R)を可変長符号化して平均エネルギー符号CAfを得る(ステップS2404)。なお、平均対数エネルギー差分DiffEXB(r)の絶対値が小さい場合のほうが統計的な出現頻度が高いので、可変長符号は、絶対値が大きい場合よりも符号量が少なくなるように、予め決定されている。すなわち、平均対数エネルギーの領域ごとの変動が小さい場合、すなわちスペクトル包絡の起伏が小さい場合、スペクトル包絡の集中度が低い場合には、平均エネルギー符号CAfの符号の長さを短くできる傾向がある。
<係数符号化部250>
係数符号化部250は、領域分割部220が得た部分領域係数列XBf(1)(n) (n=1, ..., S1), XBf(2)(n) (n=1, ..., S2), ..., XBf(R)(n) (n=1, ..., SR)の各係数を、平均対数エネルギー差分可変長符号化部240が得た平均エネルギーの対数領域での量子化値Q(log(EXB (r)) (r=1, ..., R)を用いて、例えばスカラ量子化して、係数符号CDfを得る(ステップS250)。このスカラ量子化に用いる量子化ステップ幅や量子化ビット数は、領域分割部220が得た部分領域係数列XBf(1)(n) (n=1, ..., S1), XBf(2)(n) (n=1, ..., S2), ..., XBf(R)(n) (n=1, ..., SR)ごとに平均エネルギーの量子化値Q(EXB(r)) (r=1, ..., R)から決定する。なお、平均エネルギーの量子化値Q(EXB(r)) (r=1, ..., R)は、平均エネルギーの対数領域での量子化値Q(log(EXB (r)) (r=1, ..., R)を式(7)により線形領域の値とすることにより求まる。
係数符号化部250は、まず、各領域に対応する平均エネルギーの対数領域での量子化値Q(log(EXB(r)) (r=1, ..., R)とその値と周波数で推定される聴覚上識別できないスペクトルレベルのエネルギーの対数値の差の値を考慮し、係数符号CDfの符号量として与えられたビット数を各部分領域係数列の各係数に配分する(ステップS2501)。
係数符号化部250は、次に、各部分領域の平均エネルギーの量子化値Q(EXB(r)) (r=1, ..., R)と配分されたビット数から、各部分領域係数列の各係数のスカラ量子化のステップ幅を求める(ステップS2502)。
係数符号化部250は、次に、各部分領域係数列の各係数を、決められたステップ幅とビット数で量子化し、さらに量子化された各係数の整数値を可変長符号化して、係数符号CDfを得る(ステップS2503)。
<復号装置400>
復号装置400の構成を図2に示す。復号装置400は、切替部480、第一復号部401及び第二復号部501を備えている。第一復号部401は、例えば、線形予測復号部420、スペクトル包絡係数列生成部430、正規化係数復号部450および包絡逆正規化部440を備えている。第二復号部501は、例えば、平均対数エネルギー差分可変長復号部540及び係数復号部550を備えている。復号装置400には、所定の時間区間であるフレーム単位で、切替符号と入力符号を含む符号が入力される。第一符号化部101で符号化されたフレームの場合には入力符号は線形予測係数符号CLfと正規化係数符号CNfを含み、第二符号化部201で符号化されたフレームの場合には入力符号は平均エネルギー符号CAfと係数符号CDfを含む。以下では、現在処理の対象となっているフレームがf番目のフレームであるとして、各部の具体処理を説明する。
以下、復号装置400の動作について説明する。
<切替部480>
切替部480は、入力された切替符号から、現フレームの入力符号を第一復号部401で復号するか第二復号部501で復号するかを決定し、決定した復号処理を行えるよう、入力符号を第一復号部401または第二復号部501に入力するよう制御を行う(ステップS480)。
具体的には、切替部480は、入力された切替符号が、第一符号化部101の符号化処理を特定する符号、すなわち、線形予測係数に変換可能な係数に基づくスペクトル包絡を用いた符号化処理を特定する符号である場合には、第一符号化部101の符号化処理に対応する復号処理を行う第一復号部401に入力符号を入力するよう制御する。また、入力された切替符号が、第二符号化部201の符号化処理を特定する符号、すなわち、区分した周波数領域ごとの係数の平均エネルギーを隣接する周波数領域の平均エネルギーとの差分の可変長符号化を伴う符号化処理を特定する符号である場合には、第二符号化部201の符号化処理に対応する復号処理を行う第二復号部501に入力符号を入力するよう制御する。
<第一復号部401>
第一復号部401は、線形予測復号部420、スペクトル包絡係数列生成部430、正規化係数復号部450、包絡逆正規化部440を備えている。第一復号部401には、現フレームの線形予測係数符号CLfと正規化係数符号CNfが入力され、周波数領域の係数列Xf(n) (n=1, ..., N)が出力される。
<線形予測復号部420>
線形予測復号部420は、入力符号に含まれる線形予測係数符号CLfを復号して復号された線形予測係数に変換可能な係数を得る。復号された線形予測係数に変換可能な係数は、符号化装置300の線形予測分析符号化部120が得た量子化された線形予測係数に変換可能な係数と同じものである。また、線形予測復号部420が行う復号処理は、符号化装置300の線形予測分析符号化部120は行う符号化処理と対応するものである。なお、線形予測係数に変換可能な係数とは、線形予測係数そのもの、PARCOR係数(偏自己相関係数)またはLSPパラメータなどである。
<スペクトル包絡係数列生成部430>
スペクトル包絡係数列生成部430は、線形予測復号部420が得た復号された線形予測係数に変換可能な係数に対応するパワースペクトル包絡係数列Wf(n) (n=1, ..., N)を得て出力する。ただし、Nは、周波数領域でのサンプル数であり、正の整数である。
<正規化係数復号部450>
正規化係数復号部450は、入力された正規化係数符号CNfを復号して復号正規化MDCT係数列^XNf(n) (n=1, ..., N)を得る(ステップS450)。ここで、正規化係数復号部450が行う復号処理は、符号化装置300の正規化係数符号化部150が行う符号化処理と対応するものである。すなわち、符号化装置300でMDCTではない周波数領域への変換処理が行われた場合には、^XNf(n) (n=1, ..., N)は、符号化装置300の周波数領域への変換処理に対応するMDCTではない領域の周波数領域の係数列である。なお、復号正規化MDCT係数列^XNf(n) (n=1, ..., N)は、符号化装置300の正規化係数符号化部150に入力された正規化MDCT係数列XNf(n) (n=1, ..., N)に対応するものであるが、それぞれの係数には量子化誤差が含まれるため、XNf(n) に"^"を付した^XNf(n)としてある。
<包絡逆正規化部440>
包絡逆正規化部440は、スペクトル包絡係数列生成部430が得たパワースペクトル包絡係数列Wf(n) (n=1, ..., N)を用いて、正規化係数復号部450が得た復号正規化MDCT係数列の各係数^XNf(n) (n=1, ..., N)を逆正規化し、復号MDCT係数列^XNf(n) (n=1, ..., N)を出力する(ステップS440)。すなわち、復号正規化MDCT係数列XNf(n) (n=1, ..., N)の各係数とパワースペクトル包絡係数列Wf(n) (n=1, ..., N) の各係数とを対応する係数同士を乗算して得られる値による系列を復号MDCT係数列^Xf(n) (n=1, ..., N)として求める。
<第二復号部501>
第二復号部501は、平均対数エネルギー差分可変長復号部540、係数復号部550を備えている。第二復号部501には、現フレームの平均エネルギー符号CAfと係数符号CDfが入力され、周波数領域の係数列Xf(n) (n=1, ..., N) が出力される。
<平均対数エネルギー差分可変長復号部540>
平均対数エネルギー差分可変長復号部540は、入力された平均エネルギー符号CAfを復号して部分領域の復号平均エネルギーQ(EXB(r)) (r=1, ..., R)を得る(ステップS540)。なお、復号平均エネルギーは、符号化装置300の係数符号化部250で得られる平均エネルギーの量子化値と同じものであるので、同じ記号Q(EXB(r))を用いている。
平均対数エネルギー差分可変長復号部540は、まず、平均エネルギー符号CAfを復号して各部分領域の対数領域でのエネルギーの差DiffEXB(r) (r=1, ..., R)を得る(ステップS5401)。ここで、平均対数エネルギー差分可変長復号部540が行う復号処理は、符号化装置300の平均対数エネルギー差分可変長符号化部240は行う符号化処理と対応するものである。なお、各部分領域の対数領域でのエネルギーの差は、符号化装置300の平均対数エネルギー差分可変長符号化部240で得られる各部分領域の対数領域でのエネルギーの差と同じものであるので、同じ記号DiffEXB(r)を用いている。
平均対数エネルギー差分可変長復号部540は、次に、部分領域ごとに、対数領域でのエネルギーの差DiffEXB(r) (r=1, ..., R)を隣接する部分領域の平均エネルギーの対数領域での復号値Q(log(EXB (r-1)))に加算して平均エネルギーの対数領域での復号値Q(log(EXB (r))を得る(ステップS5402)。なお、平均エネルギーの対数領域での復号値は、符号化装置300の平均対数エネルギー差分可変長符号化部240で得られる平均エネルギーの対数領域での量子化値と同じものであるので、同じ記号Q(log(EXB (r))を用いている。
平均対数エネルギー差分可変長復号部540は、次に、平均エネルギーの対数領域での復号値Q(log(EXB(r-1))) (r=1, ..., R)を線形領域の値としたものを復号平均エネルギーQ(EXB(r)) (r=1, ..., R)として得る(ステップS5403)。
<係数復号部550>
係数復号部550は、平均対数エネルギー差分可変長復号部540で得られた復号平均エネルギーQ(EXB(r)) (r=1, ..., R)を用いて、係数符号CDfを復号して復号係数列^Xf (n) (n=1, ..., N)を得る(ステップS550)。ここで、係数復号部550が行う復号処理は、符号化装置300の係数符号化部250が行う符号化処理と対応するものである。入力された係数符号CDfは、符号化装置300の係数符号化部250で各部分領域係数列の各係数を可変長符号化して得られたものであるので、係数符号CDfのうちの各係数に対応する符号部分の符号長は自動的に復元できる。また、平均対数エネルギー差分可変長復号部540で得られた復号平均エネルギーQ(EXB(r))から各領域の量子化ステップ幅が求まる。これらにより、係数符号CDfから周波数領域の復号MDCT係数列^Xf(n) (n=1, ..., N)を得ることができる。
<時間領域変換部410>
時間領域変換部410は、N点の復号MDCT係数列^Xf(n) (n=1, ..., N)を時間領域に変換して復号音響信号^xf(n) (n=1, ..., Nt)を得て出力する(ステップS410)。ただし、Ntは、時間領域でのサンプル数であり、正の整数である。符号化装置300の周波数領域変換部110でMDCTではない周波数領域への変換が行われた場合には、その変換処理に対応する時間領域への変換処理を行えばよい。
第一実施形態によれば、入力音響信号の高域のエネルギーが小さい場合にのみ符号化処理及び復号処理の切り替えを行うことができるため、高域成分の量子化特性が異なる複数の符号化処理及び復号処理が実装されている場合であっても、受聴者が不自然に感じることの少ない復号音響信号を得ることが可能となる。
第一実施形態によれば、また、線形予測係数に変換可能な係数に基づくスペクトル包絡を用いた符号化処理と区分した周波数領域ごとの係数の平均エネルギーを用いた符号化処理とのうち入力音響信号に適した符号化処理とを、実際に符号化してみることなく選択することができるため、少ない演算処理量で入力音響信号に適した符号化処理を行うことが可能となる。
第一実施形態によれば、さらに、線形予測係数に変換可能な係数に基づくスペクトル包絡を用いた符号化処理と区分した周波数領域ごとの係数の平均エネルギーを用いた符号化処理とのうちから符号化処理とを選択して符号化できるため、入力音響信号のスペクトルの起伏が大きい場合や集中度が高い場合であってもそうでない場合であっても、入力音響信号の特性によらずに効率の良い符号化処理を行うことが可能となる。
[第二実施形態]
第一実施形態では、入力音響信号の高域成分のエネルギーの大きさが大きい場合には必ず前フレームの符号化処理と同じ符号化処理で現フレームの周波数領域の係数列を符号化していたが、第二実施形態は、入力音響信号の高域成分のエネルギーの大きさが大きい場合であっても、入力音響信号の高域成分が疎である状態次第では、前フレームの符号化処理と異なる符号化処理で現フレームの周波数領域の係数列を符号化することを許すものである。
第二実施形態の符号化装置は、入力音響信号の高域成分のエネルギーが小さい場合には、前フレームと異なる符号化処理を現フレームの符号化処理として決定することを可能とし、そうでない場合には、入力音響信号の高域成分が疎である状態に従って、前フレームと異なる符号化処理を現フレームの符号化処理として決定することを可能とするか、前フレームと同じ符号化処理を現フレームの符号化処理として決定するか、を決定するものである。
第二実施形態の符号化装置の構成は、第一実施形態と同じ図1である。第二実施形態の符号化装置300は、決定部380内の切替可否判定部381と切替決定部383の処理が異なる部分以外は、第一実施形態の符号化装置300と同じである。第二実施形態の復号装置の構成は、第一実施形態と同じ図2であり、各部の処理も第一実施形態の復号装置と同じである。以下では、第一実施形態の符号化装置300と異なる処理を行う決定部380内の切替可否判定部381と切替決定部383について説明する。
<切替可否判定部381>
切替可否判定部381は、前フレームの入力音響信号の高域成分のエネルギーの大きさと、現フレームの入力音響信号の高域成分のエネルギーの大きさとの少なくとも何れかが所定の閾値より小さい場合には、切り替え可、すなわち、前フレームの周波数領域の係数列を符号化した符号化処理と異なる符号化処理で現フレームの周波数領域の係数列を符号化することを可能とする、と判定し、判定結果を出力する(ステップS381)。上記以外の場合には、切り替え可であるとも切り替え不可とも判定せず、何れとも判定しなかったことを表す情報を判定結果として出力するか、判定結果を出力しない。入力音響信号の高域成分のエネルギーの大きさとしては、高域のエネルギーを用いてもよいし、全エネルギーに対する高域のエネルギーの割合を用いてもよいのは第一実施形態と同様である。
<切替決定部383>
切替決定部383は、切替可否判定部381が得た切り替え可否の情報と、適合符号化処理判定部382が得た何れの符号化処理が適合するかの情報と、入力音響信号から求まる入力音響信号の高域成分が疎であるか否かの状態とから、現フレームの周波数領域の係数列を第一符号化部101で符号化するか第二符号化部201で符号化するかを決定し、決定した符号化処理を特定可能な符号である切替符号を出力する(ステップS383B)。出力した切替符号は復号装置400に入力される。
切替可否判定部381が得た切り替え可否の情報が切り替え可である場合には、すなわち、入力音響信号の高域成分のエネルギーが小さい場合には、切替決定部383は第一実施形態の切替決定部383と同じ処理を行う。切替可否判定部381が得た切り替え可否の情報が何れとも判定しなかったことを表す場合、または、切替可否判定部381に判定結果が入力されなかった場合、すなわち、入力音響信号の高域成分のエネルギーが大きい場合には、入力音響信号から求まる入力音響信号の高域成分が疎であるか否かの状態に基づいて、前フレームの符号化処理と異なる符号化処理で現フレームの周波数領域の係数列を符号化することを許すか否かを決定する。
以下、切替決定部383の動作のうち第一実施形態の切替決定部383と異なる部分、すなわち、入力音響信号の高域成分のエネルギーが大きい場合の切替決定部383の動作の一例を説明する。以下の例では、第一実施形態と同様に、第一符号化部101の符号化処理が非特許文献1に例示される線形予測係数に変換可能な係数に基づくスペクトル包絡を用いた符号化処理であり、第二符号化部201の符号化処理が非特許文献2に例示される区分した周波数領域ごとの係数の平均エネルギーの対数値の隣接する周波数領域の平均エネルギーの対数値との差分の可変長符号化を伴う符号化処理である。切替決定部383は、例えば図6のステップS3831BからS3836Bの処理を行う。
切替決定部383は、まず、現フレームのMDCT係数列Xf(n) (n=1, ..., N)をPサンプルごとのQ個の部分係数列XSf(1)(n) (n=1, ..., P), XSf(2)(n) (n=1, ..., P), ..., XSf(Q)(n) (n=1, ..., P)に分ける(ステップS3831B)。PおよびQは、P×Q=Nの関係を満たす正の整数である。P=1でもよい。また、ここでは第一符号化部101または第二符号化部201で符号化処理の対象となる周波数領域の係数列であるMDCT係数列Xf(n) (n=1, ..., N)を切替決定部383でも用いる構成としているが、MDCT係数列Xf(n) (n=1, ..., N)とは別の精度や方法で周波数領域に変換して得られた周波数領域の係数列、例えば、パワースペクトル系列を切替決定部383による処理の対象としてもよい。
切替決定部383は、次に、部分係数列XS f(1)(n) (n=1, ..., P), XSf(2)(n) (n=1, ..., P), ..., XSf(Q)(n) (n=1, ..., P)ごとのパワーの平均値の対数値による系列AVEXS(q) (q=1, …, Q)を求める(ステップS3832B)。部分係数列ごとのパワーの平均値の対数値は式(3A)により求まるAVEXS(q)である。
切替決定部383は、また、MDCT係数列Xf(n) (n=1, ..., N)のパワーの平均値の対数値を求める(ステップS3833B)。MDCT係数列のパワーの平均値の対数値は式(9)により求まるAVETotalである。
切替決定部383は、次に、qがあらかじめ設定したQLow(ただし、1<QLow)からQHigh(ただし、QLow≦QHigh≦Q)の範囲内、すなわち、予め定めた高域側にある1つまたは複数の部分領域の範囲内、で式(10)を満たすAVEXS(q)の個数、すなわちピークの領域の個数を求める(ステップS3834B)。μおよびλは正の定数である。
切替決定部383は、次に、ピークの領域の個数が閾値TH3以下である場合には、現フレームの入力音響信号の高域成分が疎であると判定し、ピークの領域の個数が閾値TH3を超える場合には、現フレームの入力音響信号の高域成分が疎でないと判定する(ステップS3835B)。ここで、閾値TH3は、現フレームに近い過去のフレームの入力音響信号の高域成分が疎である場合には現フレームに近い過去のフレームの入力音響信号の高域成分が疎でない場合よりも大きな値となるように予め定められた規則により決定される値である。例えば、現フレームに近い過去のフレームの入力音響信号の高域成分が疎である場合には予め定めたTH3_1を閾値TH3とし、現フレームに近い過去のフレームの入力音響信号の高域成分が疎でない場合はTH3_1より小さい値である予め定めたTH3_2を閾値TH3とする。ここで、現フレームに近い過去のフレームとは、例えば前フレームや2つ前のフレームなどである。現フレームの入力音響信号の高域成分が疎であるか否かの判定結果は少なくとも2フレーム後まで切替決定部383内に記憶される。
切替決定部383は、次に、前フレームの符号化処理と、現フレーム及び現フレームに近い過去のフレームについての入力音響信号の高域成分が疎であるか否かの判定結果と、に基づいて、現フレームの周波数領域の係数列を第一符号化部101と第二符号化部201の何れで符号化するかを決定する(ステップS3836B)。すなわち、前フレームの符号化処理と異なる符号化処理で現フレームの周波数領域の係数列を符号化することを許すか否かを決定する。
例えば、切替決定部383は、前のフレームのMDCT係数列Xf-1(n) (n=1, ..., N)が第一符号化部101で符号化された場合については、現フレームの高域成分が疎でなく、かつ、前フレームと2つ前のフレームの少なくとも何れかで高域成分が疎である場合には、現フレームのMDCT係数列Xf(n) (n=1, ..., N)を第二符号化部201で符号化することを決定可能とし、それ以外の場合には、現フレームのMDCT係数列Xf(n) (n=1, ..., N)を第一符号化部101で符号化することを決定する。すなわち、切替決定部383は、前のフレームのMDCT係数列Xf-1(n) (n=1, ..., N)が第一符号化部101で符号化された場合については、現フレームの高域成分が疎でなく、かつ、前フレームと2つ前のフレームの少なくとも何れかで高域成分が疎である場合には、前フレームの符号化処理と異なる符号化処理で現フレームの周波数領域の係数列を符号化することを許し、それ以外の場合には前フレームの符号化処理と異なる符号化処理で現フレームの周波数領域の係数列を符号化することを許さない。
また、切替決定部383は、前のフレームのMDCT係数列Xf-1(n) (n=1, ..., N)が第二符号化部201で符号化された場合については、(1)現フレームの高域成分が疎でありかつ前フレームの高域成分が疎でない場合、または、(2)現フレームの高域成分が疎でありかつ前フレームの高域成分が疎でありかつ2つ前のフレームの高域成分が疎でない場合、には、現フレームのMDCT係数列Xf(n) (n=1, ..., N)を第一符号化部101で符号化することを決定可能とし、それ以外の場合には、現フレームのMDCT係数列Xf(n) (n=1, ..., N)を第二符号化部201で符号化することを決定する。すなわち、切替決定部383は、前のフレームのMDCT係数列Xf-1(n) (n=1, ..., N)が第二符号化部201で符号化された場合については、(1)現フレームの高域成分が疎でありかつ前フレームの高域成分が疎でない場合、または、(2)現フレームの高域成分が疎でありかつ前フレームの高域成分が疎でありかつ2つ前のフレームの高域成分が疎でない場合、には、前フレームの符号化処理と異なる符号化処理で現フレームの周波数領域の係数列を符号化することを許し、それ以外の場合には前フレームの符号化処理と異なる符号化処理で現フレームの周波数領域の係数列を符号化することを許さない。
なお、切替決定部383は、前フレームの符号化処理と異なる符号化処理で現フレームの周波数領域の係数列を符号化することを許した場合には、適合符号化処理判定部382が得た何れの符号化処理が適合するかの情報に基づいて現フレームの周波数領域の係数列の符号化処理を決定する。例えば、切替決定部383は、前フレームの符号化処理と異なる符号化処理で現フレームの周波数領域の係数列を符号化することを許した場合には、前フレームのMDCT係数列Xf-1(n) (n=1, ..., N)が第二符号化部201で符号化された場合であっても、適合符号化処理判定部382が得た何れの符号化処理が適合するかの情報が第一符号化部101の符号化処理を表す場合には、現フレームのMDCT係数列Xf(n) (n=1, ..., N)は第一符号化部101で符号化すると決定する。また、切替決定部383は、前フレームの符号化処理と異なる符号化処理で現フレームの周波数領域の係数列を符号化することを許した場合には、前フレームのMDCT係数列Xf-1(n) (n=1, ..., N)が第一符号化部101で符号化された場合であっても、適合符号化処理判定部382が得た何れの符号化処理が適合するかの情報が第二符号化部201の符号化処理を表す場合には、現フレームのMDCT係数列Xf(n) (n=1, ..., N)は第二符号化部201で符号化すると決定する。
なお、切替決定部383は、前フレームの符号化処理と異なる符号化処理で現フレームの周波数領域の係数列を符号化することを許した場合であっても、符号化装置300に図示しない手段が得た他の情報によって前フレームの符号化処理と同じ符号化処理で現フレームの周波数領域の係数列を符号化すべきと判定された場合には、現フレームの入力音響信号に対応する周波数領域の係数列を前フレームの符号化処理と同じ符号化処理で符号化してもよい。
また、ステップS3831Bでは、部分係数列ごとに異なるサンプル数としてもよい。例えば、現フレームのMDCT係数列Xf(n) (n=1, ..., N)をQ個の部分係数列XSf(1)(n) (n=1, ..., P1), XSf(2)(n) (n=1, ..., P2), ..., XSf(Q)(n) (n=1, ..., PQ)に分けてもよい。P1, P2, ..., PQは、P1+P2+...+PQ=Nを満たす正の整数である。また、P1, P2, ..., PQは、P1≦P2≦...≦PQを満たすことが好ましい。また、Qは正の整数である。
また、ステップS3831BやステップS3832BやステップS3833Bの処理と同じ処理を適合符号化処理判定部382が行った場合には、切替決定部383は、ステップS3831BやステップS3832BやステップS3833Bは行わずに、適合符号化処理判定部382が行った処理結果を用いてもよい。
[第三実施形態]
第一実施形態及び第二実施形態では1つの閾値を用いて現フレームが適している符号化処理を判定していたが、第三実施形態は2つの閾値を用いた判定を行うものである。
第三実施形態の符号化装置の構成は、第一実施形態と同じ図1である。第三実施形態の符号化装置300は、決定部380内の適合符号化処理判定部382と切替決定部383の処理が異なる部分以外は、第一実施形態または第二実施形態の符号化装置300と同じである。第三実施形態の復号装置の構成は、第一実施形態と同じ図2であり、各部の処理も第一実施形態の復号装置と同じである。以下では、第一実施形態の符号化装置300と異なる処理を行う決定部380内の適合符号化処理判定部382と切替決定部383について説明する。
<適合符号化処理判定部382>
適合符号化処理判定部382は、図7に例示する各ステップの処理を行う。適合符号化処理判定部382は、現フレームの入力音響信号に対応する周波数領域の係数列が、第一符号化部101の符号化処理と第二符号化部201の符号化処理の何れに適しているか、言い換えれば、何れの符号化処理を行ってもよいものであるか、を判定し、判定結果を出力する(ステップS382A)。
以下、適合符号化処理判定部382の動作の一例を説明する。適合符号化処理判定部382は、図7に例示する各ステップの処理を行う。以下の例では、第一符号化部101の符号化処理が非特許文献1に例示される線形予測係数に変換可能な係数に基づくスペクトル包絡を用いた符号化処理であり、第二符号化部201の符号化処理が非特許文献2に例示される区分した周波数領域ごとの係数の平均エネルギーの対数値を隣接する周波数領域の平均エネルギーの対数値との差分の可変長符号化を伴う符号化処理である。
この例では、適合符号化処理判定部382は、入力音響信号のスペクトル包絡の起伏が大きいまたは/および集中度が高い場合には、現フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部101の符号化処理に適していると判定し、入力音響信号のスペクトル包絡の起伏が小さいまたは/および集中度が低い場合には、現フレームの入力音響信号に対応する周波数領域の係数列が第二符号化部201の符号化処理に適していると判定し、入力音響信号のスペクトル包絡の起伏が中程度または/および集中度が中程度である場合には、現フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部101の符号化処理と第二符号化部201の符号化処理の何れの符号化処理を行ってもよいものである、すなわち、第一符号化部101の符号化処理と第二符号化部201の符号化処理の何れの符号化処理にも適合する、と判定し、判定結果を出力する。
入力音響信号のスペクトル包絡の起伏が中程度または/および集中度が中程度である場合には、後述するように、切替決定部383で前フレームと同じ符号化処理で現フレームの周波数領域の係数列を符号化することを決定する。すなわち、切替決定部383では、前フレームと現フレームとの間で符号化処理が切り替わることにより受聴者が不自然に感じることの少ないように現フレームの符号化処理が決定される。したがって、現フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部101の符号化処理と第二符号化部201の符号化処理の何れの符号化処理を行ってもよいものである場合や、第一符号化部101の符号化処理と第二符号化部201の符号化処理の何れの符号化処理にも適合する場合に限らず、現フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部101の符号化処理と第二符号化部201の符号化処理の何れの符号化処理が適しているともいい難い場合や、現フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部101の符号化処理と第二符号化部201の符号化処理の何れの符号化処理も適していない可能性がある場合が、入力音響信号のスペクトル包絡の起伏が中程度または/および集中度が中程度である場合に含まれていてもよい。すなわち、上述した「第一符号化部101の符号化処理と第二符号化部201の符号化処理の何れの符号化処理にも適合する」との判定を、「第一符号化部101の符号化処理と第二符号化部201の符号化処理の何れの符号化処理への適性も判別できない」との判定と読み替えてもよい。
スペクトルの起伏や集中度を推定する方法としては、何れの方法を採用してもよいが、スペクトル包絡の谷の深さを推定する構成について説明する。この構成では、スペクトル包絡の谷が浅いときにはスペクトルの起伏が小さく集中度が低いと判定され、スペクトル包絡の谷が深いときにはスペクトルの起伏が大きく集中度が高いと判定され、スペクトル包絡の谷の深さが中程度のときにはスペクトルの起伏が中程度であり集中度が中程度であると判定される。
適合符号化処理判定部382は、第一実施形態の適合符号化処理判定部382と同じステップS3821からS3825、と、第一実施形態の適合符号化処理判定部382とは異なるステップS3826Aを行う。以下では、第一実施形態の適合符号化処理判定部382と異なる部分について説明する。
適合符号化処理判定部382は、ステップS3825の次に、閾値TH2_1,TH2_2を用いた以下の判定処理及び後述する適合情報の出力を行う(ステップS3826A)。
適合符号化処理判定部382は、すべての部分領域のAVEXS(q)の平均値Eと谷の部分領域のAVEXS(q)の平均値EVの差が所定の閾値TH2_1より小さい場合には、スペクトルの谷が浅く、スペクトル包絡の起伏の少ないか集中度が低いスペクトルであると推定されることから、現フレームの入力音響信号に対応する周波数領域の係数列が第二符号化部201の符号化処理に適合すると判定する。
また、適合符号化処理判定部382は、すべての部分領域のAVEXS(q)の平均値Eと谷の部分領域のAVEXS(q)の平均値EVの差が、閾値TH2_1より大きな値である所定の閾値TH2_2より大きい場合には、スペクトルの谷が深く、スペクトル包絡の起伏が大きいか集中度が高いスペクトルであると推定されることから、現フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部101の符号化処理が適合すると判定する。
また、適合符号化処理判定部382は、すべての部分領域のAVEXS(q)の平均値Eと谷の部分領域のAVEXS(q)の平均値EVの差が閾値TH2_1以上閾値TH2_2以下である場合には、スペクトルの谷の深さが中程度であり、スペクトル包絡の起伏が中程度か集中度が中程度のスペクトルであると推定されることから、現フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部101の符号化処理と第二符号化部201の符号化処理の何れの符号化処理を行ってもよいものである。すなわち、第一符号化部101の符号化処理と第二符号化部201の符号化処理の何れの符号化処理にも適合する、と判定する。
その後、適合符号化処理判定部382は、適合する符号化処理の情報である適合情報を出力する。適合情報とは、適合符号化処理判定部382の判定結果のことであり、何れのまたは双方の符号化処理が適合するかの情報とも言える。
なお、適合符号化処理判定部382は、現フレームの入力音響信号に対応する周波数領域の係数列が、第一符号化部101の符号化処理と第二符号化部201の符号化処理の何れかに適していると判定された場合にのみ第一符号化部101の符号化処理に適していることを表す情報または第二符号化部201の符号化処理に適していることを表す情報を出力し、現フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部101の符号化処理と第二符号化部201の符号化処理の何れの符号化処理を行ってもよいものである、すなわち、第一符号化部101の符号化処理と第二符号化部201の符号化処理の何れの符号化処理にも適合する、と判定された場合には、判定結果を出力しない構成としてもよい。
<切替決定部383>
切替決定部383は、切替可否判定部381が得た切り替え可否の情報と、適合符号化処理判定部382が得た何れのまたは双方の符号化処理が適合するかの情報すなわち適合する符号化処理の情報(適合情報)と、から、現フレームの周波数領域の係数列を第一符号化部101で符号化するか第二符号化部201で符号化するかを決定し、決定した符号化処理を特定可能な符号である切替符号を出力する(ステップS383A)。出力した切替符号は復号装置400に入力される。ここで、切替決定部383は、切り替え不可である場合には、現フレームが適合する符号化処理が何れの符号化処理であったとしても、前フレームと同じ符号化処理で現フレームの周波数領域の係数列を符号化することを決定する。また、切替決定部383は、切り替え可であり、かつ、現フレームが第一符号化部101の符号化処理と第二符号化部201の符号化処理の何れの符号化処理も適合する場合には、前フレームと同じ符号化処理で現フレームの周波数領域の係数列を符号化することを決定する。また、切替決定部383は、切り替え可であり、かつ、現フレームが第一符号化部101の符号化処理と第二符号化部201の符号化処理の何れか一方に適合する場合には、前フレームの符号化処理が何れの符号化処理であったとしても、現フレームが適合する符号化処理で現フレームの周波数領域の係数列を符号化することを決定する。
以下、切替決定部383の動作の一例を説明する。以下の例では、第一符号化部101の符号化処理が非特許文献1に例示される線形予測係数に変換可能な係数に基づくスペクトル包絡を用いた符号化処理であり、第二符号化部201の符号化処理が非特許文献2に例示される区分した周波数領域ごとの係数の平均エネルギーの対数値の隣接する周波数領域の平均エネルギーの対数値との差分の可変長符号化を伴う符号化処理である。
切替決定部383は、切替可否判定部381が得た切り替え可否の情報が切り替え不可を表す場合、および/または、適合符号化処理判定部382が得た何れの符号化処理が適合するかの情報(適合情報)が前フレームのMDCT係数列Xf-1(n) (n=1, ..., N)の符号化処理と同じ符号化処理を表す場合または第一符号化部101の符号化処理と第二符号化部201の符号化処理の何れの符号化処理も適合することを表す場合、には、前フレームのMDCT係数列Xf-1(n) (n=1, ..., N)の符号化処理と同じ符号化処理を現フレームのMDCT係数列Xf(n) (n=1, ..., N)の符号化処理として決定する。
すなわち、切替決定部383は、前フレームのMDCT係数列Xf-1(n) (n=1, ..., N)が第一符号化部101で符号化された場合であって、切替可否判定部381が得た切り替え可否の情報が切り替え不可を表す場合、には、現フレームのMDCT係数列Xf(n) (n=1, ..., N)も第一符号化部101で符号化すると決定する。また、切替決定部383は、前フレームのMDCT係数列Xf-1(n) (n=1, ..., N)が第一符号化部101で符号化された場合であって、適合符号化処理判定部382が得た何れの符号化処理が適合するかの情報(適合情報)が第一符号化部101の符号化処理を表す場合、には、現フレームのMDCT係数列Xf(n) (n=1, ..., N)も第一符号化部101で符号化すると決定する。また、切替決定部383は、前フレームのMDCT係数列Xf-1(n) (n=1, ..., N)が第一符号化部101で符号化された場合であって、適合符号化処理判定部382が得た何れの符号化処理が適合するかの情報(適合情報)が第一符号化部101の符号化処理と第二符号化部201の符号化処理の何れの符号化処理も適合することを表す場合、には、現フレームのMDCT係数列Xf(n) (n=1, ..., N)も第一符号化部101で符号化すると決定する。
また、切替決定部383は、前フレームのMDCT係数列Xf-1(n) (n=1, ..., N)が第二符号化部201で符号化された場合であって、切替可否判定部381が得た切り替え可否の情報が切り替え不可を表す場合、には、現フレームのMDCT係数列Xf(n) (n=1, ..., N)も第二符号化部201で符号化すると決定する。また、切替決定部383は、前フレームのMDCT係数列Xf-1(n) (n=1, ..., N)が第二符号化部201で符号化された場合であって、適合符号化処理判定部382が得た何れの符号化処理が適合するかの情報(適合情報)が第二符号化部201の符号化処理を表す場合、には、現フレームのMDCT係数列Xf(n) (n=1, ..., N)も第二符号化部201で符号化すると決定する。また、切替決定部383は、前フレームのMDCT係数列Xf-1(n) (n=1, ..., N)が第二符号化部201で符号化された場合であって、適合符号化処理判定部382が得た何れの符号化処理が適合するかの情報(適合情報)が第一符号化部101の符号化処理と第二符号化部201の符号化処理の何れの符号化処理も適合することを表す場合、には、現フレームのMDCT係数列Xf(n) (n=1, ..., N)も第二符号化部201で符号化すると決定する。
切替決定部383は、切替可否判定部381が得た切り替え可否の情報が切り替え可を表す場合、かつ、適合符号化処理判定部382が得た何れの符号化処理が適合するかの情報(適合情報)が前フレームのMDCT係数列Xf-1(n) (n=1, ..., N)の符号化処理と異なる符号化処理を表す場合、には、前フレームのMDCT係数列Xf-1(n) (n=1, ..., N)の符号化処理と異なる符号化処理を現フレームのMDCT係数列Xf(n) (n=1, ..., N)の符号化処理として決定する。すなわち、切替決定部383は、前フレームのMDCT係数列Xf-1(n) (n=1, ..., N)が第一符号化部101で符号化された場合であって、切替可否判定部381が得た切り替え可否の情報が切り替え可を表し、適合符号化処理判定部382が得た何れの符号化処理が適合するかの情報(適合情報)が第二符号化部201の符号化処理を表す場合には、現フレームのMDCT係数列Xf(n) (n=1, ..., N)は第二符号化部201で符号化すると決定する。また、切替決定部383は、前フレームのMDCT係数列Xf-1(n) (n=1, ..., N)が第二符号化部201で符号化された場合であって、切替可否判定部381が得た切り替え可否の情報が切り替え可を表し、適合符号化処理判定部382が得た何れの符号化処理が適合するかの情報(適合情報)が第一符号化部101の符号化処理を表す場合には、現フレームのMDCT係数列Xf(n) (n=1, ..., N)は第一符号化部101で符号化すると決定する。
なお、適合符号化処理判定部382を、現フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部101の符号化処理と第二符号化部201の符号化処理の何れの符号化処理にも適合すると判定された場合に判定結果を出力しない構成とした場合には、切替決定部383は、適合する符号化処理の情報が入力されなかった場合に、上述した何れの符号化処理が適合するかの情報(適合情報)が第一符号化部101の符号化処理と第二符号化部201の符号化処理の何れの符号化処理も適合することを表す場合の処理を行えばよい。
[第一変形例]
現フレームの入力音響信号が、非特許文献1に例示される線形予測係数に変換可能な係数に基づくスペクトル包絡を用いた符号化処理と、非特許文献2に例示される区分した周波数領域ごとの係数の平均エネルギーの対数値の隣接する周波数領域の平均エネルギーの対数値との差分の可変長符号化を伴う符号化処理と、の何れの符号化処理が適合するかの判定には、入力音響信号のスペクトル包絡の起伏の大きさや集中度だけではなく、その他の情報を含めた判定を行ってもよい。
例えば、前フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部101により符号化され、切替可否判定部381が切り替え可と判定し、適合符号化処理判定部382が現フレームの入力音響信号に対応する周波数領域の係数列が第二符号化部201の符号化処理に適合すると判定した場合であっても、符号化装置300に図示しない手段が得た他の情報によって現フレームの入力音響信号に対応する周波数領域の係数列を第一符号化部101の符号化処理で符号化すべきと判定された場合には、現フレームの入力音響信号に対応する周波数領域の係数列を第一符号化部101により符号化してもよい。すなわち、符号化装置300は、前フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部101により符号化され、切替可否判定部381が切り替え可と判定し、適合符号化処理判定部382が現フレームの入力音響信号に対応する周波数領域の係数列が第二符号化部201の符号化処理に適合すると判定した場合に、現フレームの入力音響信号に対応する周波数領域の係数列を第二符号化部201により符号化することを決定可能とする構成であればよい。
また、逆に、前フレームの入力音響信号に対応する周波数領域の係数列が第二符号化部201により符号化され、切替可否判定部381が切り替え可と判定し、適合符号化処理判定部382が現フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部101の符号化処理に適合すると判定した場合であっても、符号化装置300に図示しない手段が得た他の情報によって現フレームの入力音響信号に対応する周波数領域の係数列を第二符号化部201の符号化処理で符号化すべきと判定された場合には、現フレームの入力音響信号に対応する周波数領域の係数列を第二符号化部201により符号化してもよい。すなわち、符号化装置300は、前フレームの入力音響信号に対応する周波数領域の係数列が第二符号化部201により符号化され、切替可否判定部381が切り替え可と判定し、適合符号化処理判定部382が現フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部101の符号化処理に適合すると判定した場合に、現フレームの入力音響信号に対応する周波数領域の係数列を第一符号化部101により符号化することを決定可能とする構成であればよい。
また、例えば、第三実施形態の符号化装置300では、前フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部101により符号化され、適合符号化処理判定部382が現フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部101の符号化処理と第二符号化部201の符号化処理の何れの符号化処理も適合すると判定した場合であっても、切替可否判定部381が切り替え可と判定し、符号化装置300に図示しない手段が得た他の情報によって現フレームの入力音響信号に対応する周波数領域の係数列を第二符号化部201の符号化処理で符号化すべきと判定された場合には、現フレームの入力音響信号に対応する周波数領域の係数列を第二符号化部201により符号化してもよい。
また、逆に、前フレームの入力音響信号に対応する周波数領域の係数列が第二符号化部201により符号化され、適合符号化処理判定部382が現フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部101の符号化処理と第二符号化部201の符号化処理の何れの符号化処理も適合すると判定した場合であっても、切替可否判定部381が切り替え可と判定し、符号化装置300に図示しない手段が得た他の情報によって現フレームの入力音響信号に対応する周波数領域の係数列を第一符号化部101の符号化処理で符号化すべきと判定された場合には、現フレームの入力音響信号に対応する周波数領域の係数列を第一符号化部101により符号化してもよい。
すなわち、第三実施形態の符号化装置300は、切替可否判定部381が切り替え可と判定し、適合符号化処理判定部382が現フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部101の符号化処理と第二符号化部201の符号化処理の何れの符号化処理も適合すると判定した場合に、現フレームの入力音響信号に対応する周波数領域の係数列を前フレームと同じ符号化処理で符号化することを決定可能とする構成であればよい。
[第二変形例]
現フレームの周波数領域の係数列を第一符号化部101で符号化するか第二符号化部201で符号化するかの決定には、切替可否判定部381が得た切り替え可否の情報を用いないでもよい。この場合は、決定部380内に切替可否判定部381を備えなくてもよい。
この場合は、切替決定部383は、切替可否判定部381が得た切り替え可否の情報を用いずに、適合符号化処理判定部382が得た適合情報から、現フレームの周波数領域の係数列を第一符号化部101で符号化するか第二符号化部201で符号化するかを決定し、決定した符号化処理を特定可能な符号である切替符号を出力する。
例えば、適合符号化処理判定部382が現フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部101の符号化処理に適合すると判定した場合には、現フレームの入力音響信号に対応する周波数領域の係数列を第一符号化部101により符号化し、適合符号化処理判定部382が現フレームの入力音響信号に対応する周波数領域の係数列が第二符号化部201の符号化処理に適合すると判定した場合には、現フレームの入力音響信号に対応する周波数領域の係数列を第二符号化部201により符号化すればよい。
この場合も、第一変形例と同様に、その他の情報を含めた判定を行ってもよい。
例えば、適合符号化処理判定部382が現フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部101の符号化処理に適合すると判定した場合であっても、符号化装置300に図示しない手段が得た他の情報によって現フレームの入力音響信号に対応する周波数領域の係数列を第二符号化部201の符号化処理で符号化すべきと判定された場合には、現フレームの入力音響信号に対応する周波数領域の係数列を第二符号化部201により符号化してもよい。
逆に、適合符号化処理判定部382が現フレームの入力音響信号に対応する周波数領域の係数列が第二符号化部201の符号化処理に適合すると判定した場合であっても、符号化装置300に図示しない手段が得た他の情報によって現フレームの入力音響信号に対応する周波数領域の係数列を第一符号化部101の符号化処理で符号化すべきと判定された場合には、現フレームの入力音響信号に対応する周波数領域の係数列を第一符号化部101により符号化してもよい。
すなわち、適合符号化処理判定部382が現フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部101の符号化処理に適合すると判定した場合に、現フレームの入力音響信号に対応する周波数領域の係数列を第一符号化部101の符号化処理で符号化することを決定可能とする構成であればよい。また、適合符号化処理判定部382が現フレームの入力音響信号に対応する周波数領域の係数列が第二符号化部201の符号化処理に適合すると判定した場合に、現フレームの入力音響信号に対応する周波数領域の係数列を第二符号化部201の符号化処理で符号化することを決定可能とする構成であればよい。
また、例えば、第三実施形態の符号化装置300では、適合符号化処理判定部382が現フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部101の符号化処理と第二符号化部201の符号化処理の何れの符号化処理も適合すると判定した場合のうち、符号化装置300に図示しない手段が得た他の情報によって現フレームの入力音響信号に対応する周波数領域の係数列を第一符号化部101の符号化処理で符号化すべきと判定された場合には、現フレームの入力音響信号に対応する周波数領域の係数列を第一符号化部101により符号化してもよい。
また、適合符号化処理判定部382が現フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部101の符号化処理と第二符号化部201の符号化処理の何れの符号化処理も適合すると判定した場合のうち、符号化装置300に図示しない手段が得た他の情報によって現フレームの入力音響信号に対応する周波数領域の係数列を第二符号化部201の符号化処理で符号化すべきと判定された場合には、現フレームの入力音響信号に対応する周波数領域の係数列を第二符号化部201により符号化してもよい。
すなわち、第三実施形態の符号化装置300は、適合符号化処理判定部382が現フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部101の符号化処理と第二符号化部201の符号化処理の何れの符号化処理も適合すると判定した場合に、現フレームの入力音響信号に対応する周波数領域の係数列を前フレームと同じ符号化処理で符号化することを決定可能とする構成であればよい。
なお、上記の各実施形態における、算出した値と閾値との比較においては、算出した値と閾値と同じ値である場合には、閾値を境として隣接する二つの場合の何れか一方に場合分けされるように設定すればよい。すなわち、ある閾値以上の場合としているところを当該閾値より大きい場合とするとともに、当該閾値より小さい場合としているところを当該閾値以下の場合としてもよい。また、ある閾値より大きい場合としているところを当該閾値以上の場合とするとともに、当該閾値以下の場合としているところを当該閾値より小さい場合としてもよい。
例えば、第一実施形態において、決定部380は、前フレームの入力音響信号の高域成分のエネルギーの大きさと、現フレームの入力音響信号の高域成分のエネルギーの大きさとの少なくとも何れかが所定の閾値以下の場合に、前フレームと異なる符号化処理を現フレームの符号化処理として決定することを可能としてもよい(ステップS380)。
また、第二実施形態において、切替可否判定部381は、前フレームの入力音響信号の高域成分のエネルギーの大きさと、現フレームの入力音響信号の高域成分のエネルギーの大きさとの少なくとも何れかが所定の閾値以下の場合には、切り替え可、すなわち、前フレームの周波数領域の係数列を符号化した符号化処理と異なる符号化処理で現フレームの周波数領域の係数列を符号化することを可能とする、と判定し、判定結果を出力してもよい。
また、第一実施形態において、適合符号化処理判定部382は、すべての部分領域のAVEXS(q)の平均値Eと谷の部分領域のAVEXS(q)の平均値EVの差が所定の閾値TH2より小さい場合には、スペクトルの谷が浅く、スペクトル包絡の起伏の少ないか集中度が低いスペクトルであると推定されることから、現フレームの入力音響信号に対応する周波数領域の係数列が第二符号化部201の符号化処理に適合すると判定してもよい。逆にすべての部分領域のAVEXS(q)の平均値Eと谷の部分領域のAVEXS(q)の平均値EVの差が閾値TH2以上である場合には、スペクトルの谷が深く、スペクトル包絡の起伏が大きいか集中度が高いスペクトルであると推定されることから、現フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部101の符号化処理が適合すると判定してもよい。
また、第三実施形態において、適合符号化処理判定部382は、すべての部分領域のAVEXS(q)の平均値Eと谷の部分領域のAVEXS(q)の平均値EVの差が、閾値TH2_1より大きな値である所定の閾値TH2_2以上である場合には、スペクトルの谷が深く、スペクトル包絡の起伏が大きいか集中度が高いスペクトルであると推定されることから、現フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部101の符号化処理が適合すると判定してもよい。この場合、適合符号化処理判定部382は、すべての部分領域のAVEXS(q)の平均値Eと谷の部分領域のAVEXS(q)の平均値EVの差が閾値TH2_1以上であり閾値TH2_2より小さい場合には、スペクトルの谷の深さが中程度であり、スペクトル包絡の起伏が中程度か集中度が中程度のスペクトルであると推定されることから、現フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部101の符号化処理と第二符号化部201の符号化処理の何れの符号化処理を行ってもよいとする。
符号化装置及び符号化方法において説明した処理は、記載の順にしたがって時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。
また、符号化方法における各ステップをコンピュータによって実現する場合、符号化方法が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、その各ステップがコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。
また、各処理手段は、コンピュータ上で所定のプログラムを実行させることにより構成することにしてもよいし、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
その他、この発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。

Claims (6)

  1. 入力音響信号を、所定時間区間のフレームごとに、周波数領域での複数の符号化処理のうちの決定された符号化処理で符号化する符号化方法であって、
    前フレームの入力音響信号の高域成分のエネルギーの大きさと現フレームの入力音響信号の高域成分のエネルギーの大きさとの少なくとも何れかが所定の閾値以下の場合に、前フレームと異なる符号化処理を現フレームの符号化処理として決定することを可能とする決定ステップ、
    を含み、
    前記入力音響信号に対応する線形予測係数に変換可能な係数に基づくスペクトル包絡を用いて、前記入力音響信号に対応する周波数領域の係数列を符号化する第一符号化ステップと、
    前記入力音響信号に対応する周波数領域の係数列について、区分した周波数領域ごとの係数の平均エネルギーの対数値を隣接する周波数領域の平均エネルギーの対数値との差分の可変長符号化を伴って符号化する第二符号化ステップと、
    を更に含み、
    前記決定ステップは、更に、前フレームと異なる符号化処理を現フレームの符号化処理とすることを可能とされた場合のうち、前フレームの前記入力音響信号を第一符号化ステップで符号化し、かつ、現フレームの前記入力音響信号のスペクトルの起伏が大きいまたは集中度が高いことを示す指標が所定の閾値より小さい場合には、現フレームを第二符号化ステップで符号化することを決定する、
    ことを特徴とする符号化方法。
  2. 入力音響信号を、所定時間区間のフレームごとに、周波数領域での複数の符号化処理のうちの決定された符号化処理で符号化する符号化方法であって、
    前フレームの入力音響信号の高域成分のエネルギーの大きさと現フレームの入力音響信号の高域成分のエネルギーの大きさとの少なくとも何れかが所定の閾値以下の場合には、前フレームと異なる符号化処理を現フレームの符号化処理として決定することを可能とし、そうでない場合には、前記入力音響信号の高域成分が疎である状態に従って、前フレームと異なる符号化処理を現フレームの符号化処理として決定することを可能とするか、前フレームと同じ符号化処理を現フレームの符号化処理として決定するか、を決定する決定ステップ、
    を含み、
    前記入力音響信号に対応する線形予測係数に変換可能な係数に基づくスペクトル包絡を
    用いて、前記入力音響信号に対応する周波数領域の係数列を符号化する第一符号化ステップと、
    前記入力音響信号に対応する周波数領域の係数列について、区分した周波数領域ごとの係数の平均エネルギーの対数値を隣接する周波数領域の平均エネルギーの対数値との差分の可変長符号化を伴って符号化する第二符号化ステップと、
    を更に含み、
    前記決定ステップは、更に、前フレームと異なる符号化処理を現フレームの符号化処理とすることを可能とされた場合のうち、前フレームの前記入力音響信号を第一符号化ステップで符号化し、かつ、現フレームの前記入力音響信号のスペクトルの起伏が大きいまたは集中度が高いことを示す指標が所定の閾値より小さい場合には、現フレームを第二符号化ステップで符号化することを決定する、
    ことを特徴とする符号化方法。
  3. 入力音響信号を、所定時間区間のフレームごとに、周波数領域での複数の符号化処理のうちの決定された符号化処理で符号化する符号化装置であって、
    前フレームの入力音響信号の高域成分のエネルギーの大きさと現フレームの入力音響信号の高域成分のエネルギーの大きさとの少なくとも何れかが所定の閾値以下の場合に、前フレームと異なる符号化処理を現フレームの符号化処理として決定することを可能とする決定部、
    を含み、
    前記入力音響信号に対応する線形予測係数に変換可能な係数に基づくスペクトル包絡を用いて、前記入力音響信号に対応する周波数領域の係数列を符号化する第一符号化部と、
    前記入力音響信号に対応する周波数領域の係数列について、区分した周波数領域ごとの係数の平均エネルギーの対数値を隣接する周波数領域の平均エネルギーの対数値との差分の可変長符号化を伴って符号化する第二符号化部と、
    を更に含み、
    前記決定部は、更に、前フレームと異なる符号化処理を現フレームの符号化処理とすることを可能とされた場合のうち、前フレームの前記入力音響信号を第一符号化部で符号化し、かつ、現フレームの前記入力音響信号のスペクトルの起伏が大きいまたは集中度が高いことを示す指標が所定の閾値より小さい場合には、現フレームを第二符号化部で符号化することを決定する、
    ことを特徴とする符号化装置。
  4. 入力音響信号を、所定時間区間のフレームごとに、周波数領域での複数の符号化処理の
    うちの決定された符号化処理で符号化する符号化装置であって、
    前フレームの入力音響信号の高域成分のエネルギーの大きさと現フレームの入力音響信号の高域成分のエネルギーの大きさとの少なくとも何れかが所定の閾値以下の場合には、前フレームと異なる符号化処理を現フレームの符号化処理として決定することを可能とし、そうでない場合には、前記入力音響信号の高域成分が疎である状態に従って、前フレームと異なる符号化処理を現フレームの符号化処理として決定することを可能とするか、前フレームと同じ符号化処理を現フレームの符号化処理として決定するか、を決定する決定部、
    を含み、
    前記入力音響信号に対応する線形予測係数に変換可能な係数に基づくスペクトル包絡を用いて、前記入力音響信号に対応する周波数領域の係数列を符号化する第一符号化部と、
    前記入力音響信号に対応する周波数領域の係数列について、区分した周波数領域ごとの係数の平均エネルギーの対数値を隣接する周波数領域の平均エネルギーの対数値との差分の可変長符号化を伴って符号化する第二符号化部と、
    を更に含み、
    前記決定部は、更に、前フレームと異なる符号化処理を現フレームの符号化処理とすることを可能とされた場合のうち、前フレームの前記入力音響信号を第一符号化部で符号化し、かつ、現フレームの前記入力音響信号のスペクトルの起伏が大きいまたは集中度が高いことを示す指標が所定の閾値より小さい場合には、現フレームを第二符号化部で符号化することを決定する、
    ことを特徴とする符号化装置。
  5. 請求項1又は2の符号化方法の各ステップをコンピュータに実行させるためのプログラム。
  6. 請求項1又は2の符号化方法の各ステップをコンピュータに実行させるためのプログラムが記録されたコンピュータ読み取り可能な記録媒体。
JP2018083901A 2014-07-28 2018-04-25 符号化方法、装置、プログラム及び記録媒体 Active JP6608993B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2014152958 2014-07-28
JP2014152958 2014-07-28

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2016538178A Division JP6411509B2 (ja) 2014-07-28 2015-05-15 符号化方法、装置、プログラム及び記録媒体

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2019140886A Division JP6739604B2 (ja) 2014-07-28 2019-07-31 符号化方法、装置、プログラム及び記録媒体

Publications (2)

Publication Number Publication Date
JP2018139004A JP2018139004A (ja) 2018-09-06
JP6608993B2 true JP6608993B2 (ja) 2019-11-20

Family

ID=55217142

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2016538178A Active JP6411509B2 (ja) 2014-07-28 2015-05-15 符号化方法、装置、プログラム及び記録媒体
JP2018083901A Active JP6608993B2 (ja) 2014-07-28 2018-04-25 符号化方法、装置、プログラム及び記録媒体
JP2019140886A Active JP6739604B2 (ja) 2014-07-28 2019-07-31 符号化方法、装置、プログラム及び記録媒体

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2016538178A Active JP6411509B2 (ja) 2014-07-28 2015-05-15 符号化方法、装置、プログラム及び記録媒体

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2019140886A Active JP6739604B2 (ja) 2014-07-28 2019-07-31 符号化方法、装置、プログラム及び記録媒体

Country Status (8)

Country Link
US (4) US10304472B2 (ja)
EP (3) EP3614382B1 (ja)
JP (3) JP6411509B2 (ja)
KR (3) KR102061316B1 (ja)
CN (4) CN112992163B (ja)
ES (3) ES2838006T3 (ja)
PL (2) PL3163571T3 (ja)
WO (1) WO2016017238A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112992163B (zh) * 2014-07-28 2024-09-13 日本电信电话株式会社 编码方法、装置以及记录介质
CN114898761A (zh) 2017-08-10 2022-08-12 华为技术有限公司 立体声信号编解码方法及装置
CN110868220B (zh) * 2018-08-28 2021-09-07 株洲中车时代电气股份有限公司 车辆设备的身份标识的配置及异常检测方法
CN113948085B (zh) * 2021-12-22 2022-03-25 中国科学院自动化研究所 语音识别方法、系统、电子设备和存储介质

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PL183307B1 (pl) * 1994-03-31 2002-06-28 Arbitron Co System kodowania sygnału dźwiękowego
US5450490A (en) * 1994-03-31 1995-09-12 The Arbitron Company Apparatus and methods for including codes in audio signals and decoding
US5742734A (en) * 1994-08-10 1998-04-21 Qualcomm Incorporated Encoding rate selection in a variable rate vocoder
US5774846A (en) * 1994-12-19 1998-06-30 Matsushita Electric Industrial Co., Ltd. Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus
JP3317470B2 (ja) * 1995-03-28 2002-08-26 日本電信電話株式会社 音響信号符号化方法、音響信号復号化方法
US7058572B1 (en) * 2000-01-28 2006-06-06 Nortel Networks Limited Reducing acoustic noise in wireless and landline based telephony
JP3612260B2 (ja) * 2000-02-29 2005-01-19 株式会社東芝 音声符号化方法及び装置並びに及び音声復号方法及び装置
JP3453116B2 (ja) * 2000-09-26 2003-10-06 パナソニック モバイルコミュニケーションズ株式会社 音声符号化方法及び装置
JP3426207B2 (ja) * 2000-10-26 2003-07-14 三菱電機株式会社 音声符号化方法および装置
US7200561B2 (en) * 2001-08-23 2007-04-03 Nippon Telegraph And Telephone Corporation Digital signal coding and decoding methods and apparatuses and programs therefor
CN1639984B (zh) * 2002-03-08 2011-05-11 日本电信电话株式会社 数字信号编码方法、解码方法、编码设备、解码设备
JP3960932B2 (ja) * 2002-03-08 2007-08-15 日本電信電話株式会社 ディジタル信号符号化方法、復号化方法、符号化装置、復号化装置及びディジタル信号符号化プログラム、復号化プログラム
CA2388439A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
US7379864B2 (en) * 2003-05-06 2008-05-27 Lucent Technologies Inc. Method and apparatus for the detection of previous packet loss in non-packetized speech
EP1742202B1 (en) * 2004-05-19 2008-05-07 Matsushita Electric Industrial Co., Ltd. Encoding device, decoding device, and method thereof
US7752039B2 (en) * 2004-11-03 2010-07-06 Nokia Corporation Method and device for low bit rate speech coding
US20060224381A1 (en) * 2005-04-04 2006-10-05 Nokia Corporation Detecting speech frames belonging to a low energy sequence
CN101496097A (zh) * 2006-07-31 2009-07-29 高通股份有限公司 用于在与语音信号相关联的包中包含识别符的系统及方法
US8260609B2 (en) * 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
CN101140759B (zh) * 2006-09-08 2010-05-12 华为技术有限公司 语音或音频信号的带宽扩展方法及系统
US9653088B2 (en) * 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
EP2077550B8 (en) * 2008-01-04 2012-03-14 Dolby International AB Audio encoder and decoder
US8483854B2 (en) * 2008-01-28 2013-07-09 Qualcomm Incorporated Systems, methods, and apparatus for context processing using multiple microphones
CN101727906B (zh) * 2008-10-29 2012-02-01 华为技术有限公司 高频带信号的编解码方法及装置
CN101763856B (zh) * 2008-12-23 2011-11-02 华为技术有限公司 信号分类处理方法、分类处理装置及编码系统
CN101615395B (zh) * 2008-12-31 2011-01-12 华为技术有限公司 信号编码、解码方法及装置、系统
CN101770775B (zh) * 2008-12-31 2011-06-22 华为技术有限公司 信号处理方法及装置
CN101552006B (zh) * 2009-05-12 2011-12-28 武汉大学 加窗信号mdct域的能量及相位调整方法及其装置
KR20100136890A (ko) * 2009-06-19 2010-12-29 삼성전자주식회사 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법
WO2011161886A1 (ja) * 2010-06-21 2011-12-29 パナソニック株式会社 復号装置、符号化装置およびこれらの方法
CN102446508B (zh) * 2010-10-11 2013-09-11 华为技术有限公司 语音音频统一编码窗型选择方法及装置
JP5694751B2 (ja) * 2010-12-13 2015-04-01 日本電信電話株式会社 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体
WO2012102149A1 (ja) * 2011-01-25 2012-08-02 日本電信電話株式会社 符号化方法、符号化装置、周期性特徴量決定方法、周期性特徴量決定装置、プログラム、記録媒体
CN102800317B (zh) * 2011-05-25 2014-09-17 华为技术有限公司 信号分类方法及设备、编解码方法及设备
KR102070429B1 (ko) * 2011-10-21 2020-01-28 삼성전자주식회사 에너지 무손실 부호화방법 및 장치, 오디오 부호화방법 및 장치, 에너지 무손실 복호화방법 및 장치, 및 오디오 복호화방법 및 장치
CN103366750B (zh) * 2012-03-28 2015-10-21 北京天籁传音数字技术有限公司 一种声音编解码装置及其方法
CN104217727B (zh) * 2013-05-31 2017-07-21 华为技术有限公司 信号解码方法及设备
FR3013496A1 (fr) * 2013-11-15 2015-05-22 Orange Transition d'un codage/decodage par transformee vers un codage/decodage predictif
WO2015104447A1 (en) * 2014-01-13 2015-07-16 Nokia Technologies Oy Multi-channel audio signal classifier
MX356883B (es) * 2014-05-08 2018-06-19 Ericsson Telefon Ab L M Codificador y discriminador de señal de audio.
CN111192595B (zh) * 2014-05-15 2023-09-22 瑞典爱立信有限公司 音频信号分类和编码
GB2526128A (en) * 2014-05-15 2015-11-18 Nokia Technologies Oy Audio codec mode selector
CN112992163B (zh) * 2014-07-28 2024-09-13 日本电信电话株式会社 编码方法、装置以及记录介质
TWI602172B (zh) * 2014-08-27 2017-10-11 弗勞恩霍夫爾協會 使用參數以加強隱蔽之用於編碼及解碼音訊內容的編碼器、解碼器及方法
US10049684B2 (en) * 2015-04-05 2018-08-14 Qualcomm Incorporated Audio bandwidth selection

Also Published As

Publication number Publication date
EP3796314B1 (en) 2021-12-22
US10629217B2 (en) 2020-04-21
KR20170024030A (ko) 2017-03-06
US11043227B2 (en) 2021-06-22
EP3796314A1 (en) 2021-03-24
ES2838006T3 (es) 2021-07-01
CN112992164A (zh) 2021-06-18
JP6739604B2 (ja) 2020-08-12
KR20190042773A (ko) 2019-04-24
US20200176006A1 (en) 2020-06-04
PL3796314T3 (pl) 2022-03-28
JP2018139004A (ja) 2018-09-06
KR20190077115A (ko) 2019-07-02
EP3163571A4 (en) 2017-11-29
ES2908564T3 (es) 2022-05-03
JPWO2016017238A1 (ja) 2017-06-01
CN112992165A (zh) 2021-06-18
CN106796801A (zh) 2017-05-31
CN112992163B (zh) 2024-09-13
KR101993828B1 (ko) 2019-06-27
US20170178659A1 (en) 2017-06-22
PL3163571T3 (pl) 2020-05-18
EP3163571B1 (en) 2019-11-20
CN112992163A (zh) 2021-06-18
CN106796801B (zh) 2021-02-26
ES2770704T3 (es) 2020-07-02
US20200176007A1 (en) 2020-06-04
KR102049294B1 (ko) 2019-11-27
US10304472B2 (en) 2019-05-28
WO2016017238A1 (ja) 2016-02-04
JP2019215558A (ja) 2019-12-19
US11037579B2 (en) 2021-06-15
EP3614382B1 (en) 2020-10-07
KR102061316B1 (ko) 2019-12-31
EP3163571A1 (en) 2017-05-03
EP3614382A1 (en) 2020-02-26
JP6411509B2 (ja) 2018-10-24
US20190206414A1 (en) 2019-07-04

Similar Documents

Publication Publication Date Title
JP6739604B2 (ja) 符号化方法、装置、プログラム及び記録媒体
US10734009B2 (en) Periodic-combined-envelope-sequence generation device, periodic-combined-envelope-sequence generation method, periodic-combined-envelope-sequence generation program and recording medium
JP6744471B2 (ja) 符号化装置、復号装置、符号化方法、復号方法、符号化プログラム、復号プログラム、記録媒体
JP6509973B2 (ja) 符号化方法、符号化装置、プログラム、および記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180425

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190618

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190731

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191008

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191024

R150 Certificate of patent or registration of utility model

Ref document number: 6608993

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150