JP5419876B2 - スペクトル平滑化装置、符号化装置、復号装置、通信端末装置、基地局装置及びスペクトル平滑化方法 - Google Patents

スペクトル平滑化装置、符号化装置、復号装置、通信端末装置、基地局装置及びスペクトル平滑化方法 Download PDF

Info

Publication number
JP5419876B2
JP5419876B2 JP2010523772A JP2010523772A JP5419876B2 JP 5419876 B2 JP5419876 B2 JP 5419876B2 JP 2010523772 A JP2010523772 A JP 2010523772A JP 2010523772 A JP2010523772 A JP 2010523772A JP 5419876 B2 JP5419876 B2 JP 5419876B2
Authority
JP
Japan
Prior art keywords
subband
spectrum
representative value
smoothing
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010523772A
Other languages
English (en)
Other versions
JPWO2010016271A1 (ja
Inventor
智史 山梨
正浩 押切
利幸 森井
宏幸 江原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2010523772A priority Critical patent/JP5419876B2/ja
Publication of JPWO2010016271A1 publication Critical patent/JPWO2010016271A1/ja
Application granted granted Critical
Publication of JP5419876B2 publication Critical patent/JP5419876B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、音声信号のスペクトルを平滑化するスペクトル平滑化装置、符号化装置、復号装置、通信端末装置、基地局装置及びスペクトル平滑化方法に関する。
インターネット通信に代表されるパケット通信システムや、移動通信システムなどで音声・楽音信号を伝送する場合、音声・楽音信号の伝送効率を高めるため、圧縮・符号化技術がよく使われる。また、近年では、単に低ビットレートで音声・楽音信号を符号化するという一方で、より高品質の音声・楽音信号を符号化する技術に対するニーズが高まっている。
このようなニーズに対して、音声信号を直交変換(時間−周波数変換)し、音声信号の周波数成分(スペクトル)を算出し、算出したスペクトルに対して、線形変換及び非線形変換等の処理を行い復号信号の品質を高めるための様々な技術が開発されてきている(例えば、特許文献1参照)。特許文献1に開示される方法では、まず一定時間長の音声信号から当該音声信号に含まれる周波数スペクトルを分析し、分析したスペクトルに対し、スペクトル強度の値が大きいほど、より強調する非線形変換処理を行う。次に、非線形変換処理されたスペクトルに対し、周波数領域で線形の平滑化処理を行う。その後、非線形変換特性を打ち消すための逆非線形変換処理を行い、さらに平滑化特性を打ち消すための逆平滑化処理を行うことによって、音声信号に含まれる全帯域の雑音成分を抑制する。このように、特許文献1に開示される方法では、音声信号から得られるスペクトルの全サンプルに対し非線形変換処理を行った後、スペクトルの平滑化を行うことにより、良好な品質の音声信号を得る。なお、特許文献1には、非線形処理の例として、べき乗、対数変換等の変換方法が挙げられている。
特開2002−244695号公報 国際公開第2007/037361号パンフレット
Yuichiro TAKAMIZAWA, Toshiyuki NOMURA and Masao IKEKAWA, "High-Quality and Processor-Efficient Implementation of and MPEG-2 AAC Encoder", IEICE TRANS. INF. &SYST., VOL.E86-D, No.3 MARCH 2003
しかしながら、特許文献1に開示される方法では、音声信号から得られるスペクトルの全サンプルに対し非線形変換処理を行うため、処理演算量が膨大となるという問題点が存在する。また、処理演算量を削減するために、単純に、スペクトルのサンプルから一部のサンプルを抽出し、抽出したサンプルに対し非線形変換処理を行うだけでは、非線形変換後にスペクトルの平滑化を行っても、十分に高い音声品質を得ることができるとは限らない。
本発明の目的は、音声信号から算出されるスペクトルに対して、非線形変換した後に、平滑化を行う構成において、良好な音声品質を維持しつつ、処理演算量を大幅に削減させ
ることができるスペクトル平滑化装置、符号化装置、復号装置、通信端末装置、基地局装置及びスペクトル平滑化方法を提供することである。
本発明のスペクトル平滑化装置は、入力される信号を時間−周波数変換して周波数成分を生成する時間−周波数変換手段と、前記周波数成分を複数のサブバンドに分割するサブバンド分割手段と、前記分割された各サブバンドに対して、算術平均の計算及びその計算結果を用いた乗算演算を用いてサブバンドの代表値を算出する代表値算出手段と、前記サブバンド毎の代表値に対して非線形変換を行う非線形変換手段と、前記非線形変換された代表値を周波数領域で平滑化する平滑化手段と、を具備する構成を採る。
本発明のスペクトル平滑化方法は、入力される信号を時間−周波数変換して周波数成分を生成する時間−周波数変換ステップと、前記周波数成分を複数のサブバンドに分割するサブバンド分割ステップと、前記分割された各サブバンドに対して、算術平均の計算及びその計算結果を用いた乗算演算を用いてサブバンドの代表値を算出する代表値算出ステップと、前記サブバンド毎の代表値に対して非線形変換を行う非線形変換ステップと、前記非線形変換された代表値を周波数領域で平滑化する平滑化ステップと、を有するようにした。
本発明によれば、良好な音声品質を維持しつつ、処理演算量を大幅に削減させることが可能となる。
本発明の実施の形態1に係る処理の概要を示すスペクトル概略図 実施の形態1に係るスペクトル平滑化装置の要部構成を示すブロック図 実施の形態1に係る代表値算出部の要部構成を示すブロック図 実施の形態1における入力信号のサブバンド及びサブグループの構成を示す概略図 本発明の実施の形態2に係る符号化装置および復号装置を有する通信システムの構成を示すブロック図 実施の形態2に係る図5に示した符号化装置の内部の主要な構成を示すブロック図 実施の形態2に係る図6に示した第2レイヤ符号化部の内部の主要な構成を示すブロック図 実施の形態2に係る図7に示したスペクトル平滑部の主要な構成を示すブロック図 実施の形態2に係る図7に示したフィルタリング部におけるフィルタリング処理の詳細について説明するための図 実施の形態2に係る図7に示した探索部においてサブバンドSBに対して最適ピッチ係数T’を探索する処理の手順を示すフロー図 実施の形態2に係る図5に示した復号装置の内部の主要な構成を示すブロック図 実施の形態2に係る図11に示した第2レイヤ復号部の内部の主要な構成を示すブロック図
以下、本発明の実施の形態について、図面を参照して詳細に説明する。
(実施の形態1)
先ず、本発明の実施の形態に係るスペクトル平滑化方法の概要について、図1を用いて説明する。図1は、本実施の形態に係るスペクトル平滑化方法の概要を説明するためのスペクトル図である。
図1Aに、入力信号のスペクトルを示す。本実施の形態では、まず、入力信号のスペクトルを複数のサブバンドに分割する。図1Bに、複数のサブバンドに分割された入力信号のスペクトルの様子を示す。なお、図1のスペクトル図は、本発明の概要を説明するためのものであり、例えば、本発明は、図中のサブバンド数に制限されるものではない。
次に、各サブバンド毎に代表値を算出する。具体的には、サブバンド内のサンプルを更に複数のサブグループに分割する。そして、サブグループ毎にスペクトルの絶対値の算術平均(相加平均)を算出する。
次に、各サブグループの算術平均値の幾何平均(相乗平均)をサブバンド毎に算出する。なお、上記の幾何平均値は、この時点ではまだ正確な幾何平均値ではなく、各サブグループの算術平均値を単純に掛け合わせた値を算出し、正確な幾何平均値は、後述する非線形変換の後に求めることとする。上記の処理は更なる演算量削減のためであり、もちろんこの時点で正確な幾何平均値を求めても構わない。
上記の幾何平均値を各サブバンドの代表値とする。図1Cに、点線で示す入力信号のスペクトルに重ねて、各サブバンドの代表値を示す。なお、説明をわかりやすくするため、図1Cには、各サブグループの算術平均値を単純に掛け合わせた値に代えて、正確な幾何平均値を代表値として示す。
次に、各サブバンドの代表値に対して、入力信号のスペクトルに対しスペクトル強度の値が大きいほど、より強調する非線形変換(例えば、対数変換)を行った後、周波数領域で平滑化処理を行う。その後、逆非線形変換(例えば、対数逆変換)を行い、各サブバンド毎に平滑化スペクトルを算出する。図1Dに、点線で示す入力信号のスペクトルに重ねて、各サブバンド毎の平滑化スペクトルを示す。
このような処理により、対数領域におけるスペクトルの平滑化を、音声品質の劣化を抑えつつ、かつ、処理演算量を大幅に削減することができる。以下、当該効果を得る本発明の実施の形態に係るスペクトル平滑化装置の構成について説明する。
本実施の形態に係るスペクトル平滑化装置は、入力スペクトルを平滑化し、平滑化後のスペクトル(以下「平滑化スペクトル」という)を出力信号として出力する。より具体的には、スペクトル平滑化装置は、入力信号をNサンプルずつに区切り(Nは自然数)、Nサンプルを1フレームとしてフレーム毎に平滑化処理を行う。ここで、平滑化処理の対象となる入力信号をx(n=0、…、N−1)と表す。xは、Nサンプルずつ区切られた入力信号のうち、n+1番目のサンプルを示す。
図2に、本実施の形態に係るスペクトル平滑化装置100の要部構成を示す。
図2に示すスペクトル平滑化装置100は、時間−周波数変換処理部101、サブバンド分割部102、代表値算出部103、非線形変換部104、平滑化部105、及び逆非線形変換部106から主に構成される。
時間−周波数変換処理部101は、入力信号xに対して高速フーリエ変換(FFT:Fast Fourier Transform)を行い、周波数成分のスペクトルS1(k)(以下、入力スペクトル)を算出する。
そして、時間−周波数変換処理部101は、入力スペクトルS1(k)をサブバンド分割部102に出力する。
サブバンド分割部102は、時間−周波数変換処理部101から入力される入力スペクトルS1(k)をP個(Pは2以上の整数)のサブバンドに分割する。以下では、サブバンド分割部102が、各サブバンドのサンプル数が等しくなるように、入力スペクトルS1(k)を分割する場合を例に説明する。なお、各サブバンドのサンプル数は、サブバンド毎に異なっていてもよい。サブバンド分割部102は、サブバンドに分割されたスペクトル(以下「サブバンドスペクトル」ともいう)を代表値算出部103に出力する。
代表値算出部103は、サブバンド分割部102から入力される、サブバンドに分割された入力スペクトルの各サブバンドに対して代表値を算出し、算出したサブバンド毎の代表値を非線形変換部104へ出力する。代表値算出部103の詳しい処理については後述する。
図3に、代表値算出部103の内部構成を示す。図3に示す代表値算出部103は、相加平均算出部201、及び相乗平均算出部202を備える。
まず、サブバンド分割部102からサブバンドスペクトルが相加平均算出部201に入力される。
相加平均算出部201は、入力されたサブバンドスペクトルの各サブバンドを、さらにQ個(Qは2以上の整数)のサブグループ(第0サブグループ〜第Q−1サブグループ)に分割する。なお、以下では、Q個の各サブグループが、それぞれR個(Rは2以上の整数)のサンプルから構成される場合を例に説明する。なお、ここではQ個の各サブグループが全てR個のサンプルから構成される場合について説明するが、各サブグループ内のサンプルはもちろん異なる数であっても構わない。
図4に、サブバンド及びサブグループの構成例を示す。図4は、一例として、1サブバンドを構成するサンプル数が8であり、サブバンドを構成するサブグループ数Qが2であり、サブグループ内のサンプル数Rが4である場合を示す。
次に、相加平均算出部201は、Q個のサブグループそれぞれに対して、式(1)を用いて、各サブグループに含まれるスペクトル(FFT係数)の絶対値の算術平均(相加平均)を算出する。
Figure 0005419876
なお、式(1)において、AVE1は、第qサブグループに含まれるスペクトル(FFT係数)の絶対値の算術平均(相加平均)であり、BSは、第qサブグループの先頭サンプルのインデックスを示す。
次に、相加平均算出部201は、算出したサブバンド毎の算術平均(相加平均)値スペクトルAVE1(q=0〜Q−1)(サブバンド算術平均値スペクトル)を相乗平均算出部202に出力する。
相乗平均算出部202は、相加平均算出部201から入力されるサブバンド毎の算術平均値(相加平均)スペクトルAVE1(q=0〜Q−1)を、式(2)に示すように全
て掛け合わせ、サブバンド毎に代表値スペクトル(サブバンド代表値スペクトル)AVE2(p=0〜P−1)を算出する。
Figure 0005419876
式(2)において、Pは、サブバンド数である。
次に、相乗平均算出部202は、算出したサブバンド代表値スペクトルAVE2(p=0〜P−1)を非線形変換部104に出力する。
非線形変換部104は、相乗平均算出部202から入力されるサブバンド代表値スペクトルAVE2(p=0〜P−1)に対して、式(3)を用いて、各代表値に対して値が大きいほどより強調する特性の非線形変換を行い、第1サブバンド対数代表値スペクトルAVE3(p=0〜P−1)を算出する。ここでは、非線形変換処理として対数変換を行う場合について説明する。
Figure 0005419876
次に、非線形変換部104は、式(4)を用いて、算出した第1サブバンド対数代表値スペクトルAVE3(p=0〜P−1)に対して、サブグループ数Qの逆数を乗じることにより第2サブバンド対数代表値スペクトルAVE4(p=0〜P−1)を算出する。
Figure 0005419876
相乗平均算出部202における式(2)の処理では、単純に各サブバンドのサブバンド算術平均値スペクトルAVE1が掛け合わせられただけであったが、非線形変換部104における式(4)の処理により幾何平均(相乗平均)が算出されることになる。このように、本実施の形態では、式(3)を用いて対数領域に変換した後に、式(4)を用いてサブグループ数Qの逆数を乗じる。これにより、演算量が大きい累乗根の計算を、単純な除算に置き換えることができる。さらに、サブグループ数Qが定数である場合には、Qの逆数を予め算出しておくことにより、累乗根の計算を単純な乗算に置き換えることができるので、演算量をより削減することが可能となる。
次に、非線形変換部104は、式(4)を用いて算出した第2サブバンド対数代表値スペクトルAVE4(p=0〜P−1)を平滑化部105に出力する。
再度、図2に戻り、平滑化部105は、非線形変換部104から入力される第2サブバンド対数代表値スペクトルAVE4(p=0〜P−1)に対して、式(5)を用いて、周波数領域で平滑化し、対数平滑化スペクトルAVE5(p=0〜P−1)を算出する。
Figure 0005419876
なお、式(5)は、平滑化フィルタリング処理を示し、式(5)において、MA_LENは平滑化フィルタリングの次数を示し、Wは平滑化フィルタの重みを示す。
また、式(5)は、サブバンドインデックスpが、p≧(MA_LEN−1)/2であり、かつ、p≦P−1−(MA_LEN−1)/2の場合の対数平滑化スペクトルの算出方法である。サブバンドインデックスpが先頭、あるいは、最後尾付近の場合には、境界条件を考慮し、式(6)、及び式(7)を用いてそれぞれスペクトルを平滑化する。
Figure 0005419876
Figure 0005419876
なお、平滑化部105は、上述したように平滑化フィルタリング処理による平滑化処理として、単純な移動平均による平滑化を行っても良い(Wが全てのiに対して1の時には、移動平均による平滑化になる)。また、窓関数(重み)は、ハニング窓やその他の窓関数を利用してもよい。
次に、平滑化部105は算出した対数平滑化スペクトルAVE5(p=0〜P−1)を逆非線形変換部106に出力する。
逆非線形変換部106は、平滑化部105から入力される対数平滑化スペクトルAVE5(p=0〜P−1)に対して逆非線形変換として、対数逆変換を行い、対数平滑化スペクトルを対数領域の値から線形領域の値に変換する。逆非線形変換部106は、式(8)を用いて、対数平滑化スペクトルAVE5(p=0〜P−1)に対して対数逆変換を行い、平滑化スペクトルAVE6(p=0〜P−1)を算出する。
Figure 0005419876
さらに、逆非線形変換部106は、各サブバンド内のサンプルの値を、算出した線形領域の平滑化スペクトルAVE6(p=0〜P−1)の値として、全サンプルの平滑化スペクトルを算出する。
逆非線形変換部106は、全サンプルの平滑化スペクトル値をスペクトル平滑化装置100の処理結果として出力する。
以上、本発明に係るスペクトル平滑化装置及びスペクトル平滑化方法について説明した。
以上のように、本実施の形態では、サブバンド分割部102は、入力スペクトルを複数のサブバンドに分割し、代表値算出部103は、サブバンド毎に、算術平均、及び、乗算演算あるいは幾何平均を用いて代表値を算出し、非線形変換部104は、各代表値に対し
て値が大きいほどより強調する特性の非線形変換を行い、平滑化部105は、当該サブバンド毎の非線形変換された代表値を周波数領域で平滑化する。
このように、スペクトルの全サンプルを複数のサブバンドに分割し、各サブバンドに対して、算術平均(相加平均)と、乗算演算あるいは幾何平均(相乗平均)とを組み合せて代表値を得、当該代表値を非線形変換した後に平滑化することにより、良好な音声品質を維持しつつ、かつ、処理演算量を大幅に減らすことができるようになる。
上述したように、本発明においてサブバンド内のサンプルの算術平均と、乗算演算あるいは幾何平均とを組み合せてサブバンドの代表値を算出する構成を採ることにより、サブバンド内のサンプル値の算術平均値(相加平均値)、すなわち、線形領域での平均値を、単純に各サブバンドの代表値とする場合において、サブバンド内のサンプル値の大きさのばらつきによって発生し得る音声品質の劣化を回避することができる。
なお、本実施の形態では、時間−周波数変換処理として高速フーリエ変換(FFT)を例に挙げて説明したが、本発明はこれに限定されず、高速フーリエ変換(FFT)以外の時間−周波数変換方法を利用する場合にも同様に適用される。例えば、非特許文献1では、聴覚マスキング値の算出(図2参照)に際し、高速フーリエ変換(FFT)ではなく、修正離散コサイン変換(MDCT:Modified Discrete Cosine Transform)を用いて周波数成分(スペクトル)を算出している。このように時間−周波数変換処理部において、修正離散コサイン変換(MDCT)やその他の時間−周波数変換方法を用いる構成に対しても、同様に本発明は適用される。
なお、上述した構成では、相乗平均算出部202は、算術平均(相加平均)値スペクトルAVE1(q=0〜Q−1)を掛け合わせただけであり、累乗根の計算を行っていない。そのため、相乗平均算出部202は、正確には、相乗平均値を算出しているわけではない。これは、上述したように、非線形変換部104において、非線形変換処理として式(3)を用いて対数領域に変換した後に、式(4)を用いてサブグループ数Qの逆数を乗じることにより、累乗根の計算を単純な除算(乗算)に置き換えることができるため、演算量をより削減することができるからである。
したがって、本発明は、必ずしも上述の構成に限定されるものではない。例えば、相乗平均算出部202において、算術平均(相加平均)値スペクトルAVE1(q=0〜Q−1)に対して、サブバンド毎に全サブグループの算術平均値スペクトルの値を掛け合わせた後に、サブグループ数の累乗根を算出し、算出した累乗根をサブバンド代表値スペクトルAVE2(p=0〜P−1)として非線形変換部104に出力する構成においても同様に本発明を適用することができる。すなわち、いずれの場合も、平滑化部105は、非線形変換されたサブバンド毎の代表値を得ることができる。なお、この場合には、非線形変換部104において、式(4)の演算を省略すればよい。
なお、本実施の形態では、サブバンド毎の代表値を、まずサブグループの算術平均値を求め、次にサブバンド内の全サブグループの算術平均値の幾何平均値とする場合について説明した。しかし、本発明はこれに限定されず、サブグループを構成するサンプル数が1である場合、つまり各サブグループの算術平均値を算出せず、サブバンド内の全サンプルの幾何平均値をサブバンドの代表値とする場合にも同様に適用できる。なお、この構成においても、上述したように、正確に幾何平均値を算出せず、非線形変換を行った後にサブグループ数の逆数を乗じることによって対数領域で幾何平均値を算出してもよい。
なお、以上の説明では、逆非線形変換部106において、同一サブバンド内のサンプルのスペクトル値を全て同じ値とした。しかし、本発明はこれに限定されず、逆非線形変換
部106の後段に、逆平滑化処理部を設け、逆平滑化処理部が、各サブバンド内でサンプル毎に重みをつけて逆平滑化処理を行ってもよい。また、この逆平滑化処理は、平滑化部105と全く逆の変換でなくてもよい。
また、以上の説明では、非線形変換部104が、非線形変換処理として対数変換を行い、逆非線形変換部106が、逆非線形変換処理として対数逆変換を行う場合を例に説明したが、非線形変換処理は、これに限られず、べき乗等を用いてもよく、逆非線形変換処理に、当該非線形変換処理の逆処理を行うようにすればよい。ただし、式(4)を用いてサブグループ数Qの逆数を乗じることにより、累乗根の計算を単純な除算(乗算)に置き換えることができるため、演算量をより削減することができるのは、非線形変換部104が、非線形変換として対数変換を行うことによる。したがって、非線形変換処理として、対数変換以外の処理を行う場合には、サブグループ毎の算術平均値に対し幾何平均値を算出することにより、サブバンド毎の代表値を算出し、当該代表値に対し非線形処理を施せばよい。
また、サブバンド数、サブグループ数としては、例えば、入力信号のサンプリング周波数が32kHzであり、1フレーム長が20msecの場合、つまり、入力信号が640サンプルある場合、サブバンド数を80に設定し、サブグループ数を2に設定し、各サブグループのサンプル数を4に設定し、平滑化フィルタリングの次数を7に設定するという場合が一例として挙げられる。但し、本発明は、当該設定に限定されるものではなく、これらが他の数値に設定される場合にも同様に適用することができる。
また、本発明に係るスペクトル平滑化装置及びスペクトル平滑化方法は、音声符号化装置及び音声符号化方法、音声復号装置及び音声復号方法、音声認識装置及び音声認識方法など、スペクトル領域において平滑化を行うスペクトル平滑化部分の全てに適用可することができる。例えば、特許文献2に公開されている帯域拡張技術では、高域スペクトルを生成するパラメータを算出するために行う低域スペクトルに対する前処理として、LPC(Linear Predictive Coefficient)からスペクトル包絡を算出し、算出したスペクトル包絡を用いて低域スペクトルからスペクトル包絡を除去する処理を行っているが、特許文献2のスペクトル包絡除去処理に利用するスペクトル包絡に代えて、本発明に係るスペクトル平滑化方法を低域スペクトルに適用して算出した平滑化スペクトルを用いることも可能である。
また、本実施の形態では、入力される入力スペクトルS1(k)を各サブバンドのサンプル数が等しいP個(Pは2以上の整数)のサブバンドに分割する構成について説明したが、本発明はこれに限らず、各サブバンドのサンプル数が異なる構成についても同様に適用できる。例えば、低域側のサブバンドほどサンプル数が少なく、高域側のサブバンドほどサンプル数が多くなるようにサブバンドを分割する構成が例として挙げられる。一般的に、人間の聴感は、高域側ほど周波数分解能が低いということが言えるため、上記のような構成にすることによって、より効率的にスペクトルを平滑化することができる。また、各サブバンドを構成するサブグループについても同様である。つまり、本実施の形態では、Q個の各サブグループが全てR個のサンプルから構成される場合について説明したが、本発明はこれに限らず、低域側のサブグループほどサンプル数が少なく、高域側のサブグループほどサンプル数が多くなるようにサブグループを分割するような構成に対しても同様に適用することができる。
また、本実施の形態では、平滑化処理として重み付け移動平均を例として説明したが、本発明はこれに限らず、種々の平滑化処理に対しても同様に適用することができる。例えば、上述したように、各サブバンドのサンプル数が異なる(高域ほどサンプル数が多くなる)構成において、移動平均のフィルタのタップ数が左右対称ではなく、高域ほど小さい
タップ数にしてもかまわない。高域のサブバンドほどサンプル数が多い場合には、高域側のタップ数が小さい移動平均フィルタを用いることで、聴感的により適した平滑化処理が可能となる。もちろん、本発明は、高域ほど大きいタップ数である、左右非対称の移動平均フィルタを利用する場合にも同様に適用することができる。
(実施の形態2)
本実施の形態では、実施の形態1で説明したスペクトル平滑化処理を、特許文献2などに公開されている帯域拡張符号化時の前処理に利用する場合の構成を説明する。
図5は、本発明の実施の形態2に係る符号化装置および復号装置を有する通信システムの構成を示すブロック図である。図5において、通信システムは、符号化装置と復号装置とを備え、それぞれ伝送路を介して通信可能な状態となっている。なお、符号化装置および復号装置はいずれも、通常、基地局装置あるいは通信端末装置等に搭載されて用いられる。
符号化装置301は、入力信号をNサンプルずつ区切り(Nは自然数)、Nサンプルを1フレームとしてフレーム毎に符号化を行う。ここで、符号化の対象となる入力信号をx(n=0、…、N−1)と表すこととする。nは、Nサンプルずつ区切られた入力信号のうち、n+1番目の信号要素を示す。符号化された入力情報(符号化情報)は、伝送路302を介して復号装置303に送信される。
復号装置303は、伝送路302を介して、符号化装置301から送信された符号化情報を受信し、これを復号し出力信号を得る。
図6は、図5に示した符号化装置301の内部の主要な構成を示すブロック図である。入力信号のサンプリング周波数をSRinputとすると、ダウンサンプリング処理部311は、入力信号のサンプリング周波数をSRinputからSRbaseまでダウンサンプリングし(SRbase<SRinput)、ダウンサンプリングした入力信号をダウンサンプリング後入力信号として、第1レイヤ符号化部312に出力する。
第1レイヤ符号化部312は、ダウンサンプリング処理部311から入力されるダウンサンプリング後入力信号に対して、例えばCELP(Code Excited Linear Prediction)方式の音声符号化方法を用いて符号化を行って第1レイヤ符号化情報を生成し、生成した第1レイヤ符号化情報を第1レイヤ復号部313および符号化情報統合部317に出力する。
第1レイヤ復号部313は、第1レイヤ符号化部312から入力される第1レイヤ符号化情報に対して、例えばCELP方式の音声復号方法を用いて復号を行って第1レイヤ復号信号を生成し、生成した第1レイヤ復号信号をアップサンプリング処理部314に出力する。
アップサンプリング処理部314は、第1レイヤ復号部313から入力される第1レイヤ復号信号のサンプリング周波数をSRbaseからSRinputまでアップサンプリングし、アップサンプリングした第1レイヤ復号信号をアップサンプリング後第1レイヤ復号信号として、時間−周波数変換処理部315に出力する。
遅延部318は、入力信号に所定の長さの遅延を与える。この遅延は、ダウンサンプリング処理部311、第1レイヤ符号化部312、第1レイヤ復号部313、およびアップサンプリング処理部314で生じる時間遅れを補正するためのものである。
時間−周波数変換処理部315は、バッファbuf1およびbuf2(n=0、…、N−1)を内部に有し、入力信号xおよびアップサンプリング処理部314から入力されるアップサンプリング後第1レイヤ復号信号yを修正離散コサイン変換(MDCT:Modified Discrete Cosine Transform)する。
次に、時間−周波数変換処理部315における直交変換処理について、その計算手順と内部バッファへのデータ出力に関して説明する。
まず、時間−周波数変換処理部315は、下記の式(9)および式(10)によりバッファbuf1およびbuf2それぞれを、「0」を初期値として初期化する。
Figure 0005419876
Figure 0005419876
次いで、時間−周波数変換処理部315は、入力信号x、アップサンプリング後第1レイヤ復号信号yに対し下記の式(11)および式(12)に従ってMDCTし、入力信号のMDCT係数(以下、入力スペクトルと呼ぶ)S2(k)およびアップサンプリング後第1レイヤ復号信号ynのMDCT係数(以下、第1レイヤ復号スペクトルと呼ぶ)S1(k)を求める。
Figure 0005419876
Figure 0005419876
ここで、kは1フレームにおける各サンプルのインデックスを示す。時間−周波数変換処理部315は、入力信号xとバッファbuf1とを結合させたベクトルであるx’を下記の式(13)により求める。また、時間−周波数変換処理部315は、アップサンプリング後第1レイヤ復号信号yとバッファbuf2とを結合させたベクトルであるy’を下記の式(14)により求める。
Figure 0005419876
Figure 0005419876
次に、時間−周波数変換処理部315は、式(15)および式(16)によりバッファbuf1およびbuf2を更新する。
Figure 0005419876
Figure 0005419876
そして、時間−周波数変換処理部315は、入力スペクトルS2(k)および第1レイヤ復号スペクトルS1(k)を第2レイヤ符号化部316に出力する。
第2レイヤ符号化部316は、時間−周波数変換処理部315から入力される入力スペクトルS2(k)および第1レイヤ復号スペクトルS1(k)を用いて第2レイヤ符号化情報を生成し、生成した第2レイヤ符号化情報を符号化情報統合部317に出力する。なお、第2レイヤ符号化部316の詳細については後述する。
符号化情報統合部317は、第1レイヤ符号化部312から入力される第1レイヤ符号化情報と、第2レイヤ符号化部316から入力される第2レイヤ符号化情報とを統合し、統合された情報源符号に対し、必要であれば伝送誤り符号などを付加した上でこれを符号化情報として伝送路302に出力する。
次に、図6に示した第2レイヤ符号化部316の内部の主要な構成について図7を用いて説明する。
第2レイヤ符号化部316は、帯域分割部360、スペクトル平滑化部361、フィルタ状態設定部362、フィルタリング部363、探索部364、ピッチ係数設定部365、ゲイン符号化部366および多重化部367を備え、各部は以下の動作を行う。
帯域分割部360は、時間−周波数変換処理部315から入力される入力スペクトルS2(k)の高域部(FL≦k<FH)をP個のサブバンドSB(p=0,1,…,P−1)に分割する。そして、帯域分割部360は、分割した各サブバンドのバンド幅BW(p=0,1,…,P−1)および先頭インデックスBS(p=0,1,…,P−1)(FL≦BS<FH)を帯域分割情報としてフィルタリング部363、探索部364および多重化部367に出力する。以下、入力スペクトルS2(k)のうち、サブバンドSBに対応する部分をサブバンドスペクトルS2(k)(BS≦k<BS+BW)と記す。
スペクトル平滑化部361は、時間−周波数変換処理部315から入力される第1レイヤ復号スペクトルS1(k)(0≦k<FL)に対して平滑化処理を施し、平滑化処理後の平滑化第1レイヤ復号スペクトルS1’(k)(0≦k<FL)をフィルタ状態設定部362に出力する。
図8にスペクトル平滑化部361の内部構成を示す。スペクトル平滑化部361は、サブバンド分割部102、代表値算出部103、非線形変換部104、平滑化部105、逆非線形変換部106とから主に構成される。ここで、各処理部は、実施の形態1で説明した処理部と同一であるため、同一の符号を付して説明を省略する。
フィルタ状態設定部362は、スペクトル平滑化部361から入力される平滑化第1レイヤ復号スペクトルS1’(k)(0≦k<FL)を、後段のフィルタリング部363で用いるフィルタの内部状態として設定する。フィルタリング部363における全周波数帯域のスペクトルS(k)の0≦k<FLの帯域に、平滑化第1レイヤ復号スペクトルS1’(k)がフィルタの内部状態(フィルタ状態)として格納される。
フィルタリング部363は、マルチタップのピッチフィルタを備え、フィルタ状態設定
部362により設定されたフィルタ状態と、ピッチ係数設定部365から入力されるピッチ係数と、帯域分割部360から入力される帯域分割情報とに基づいて、第1レイヤ復号スペクトルをフィルタリングし、各サブバンドSB(p=0,1,…,P−1)の推定値スペクトルS2’(k)(BS≦k<BS+BW)(p=0,1,…,P−1)(以下、「サブバンドSBの推定スペクトル」と称す)を算出する。フィルタリング部363は、サブバンドSBの推定スペクトルS2’(k)を探索部364に出力する。なお、フィルタリング部363におけるフィルタリング処理の詳細については後述する。なお、マルチタップのタップ数は1以上の任意の値(整数)をとることができるものとする。
探索部364は、帯域分割部360から入力される帯域分割情報に基づき、フィルタリング部363から入力されるサブバンドSBの推定スペクトルS2’(k)と、時間−周波数変換処理部315から入力される入力スペクトルS2(k)の高域部(FL≦k<FH)における各サブバンドスペクトルS2(k)との類似度を算出する。この類似度の算出は、例えば相関演算等により行われる。また、フィルタリング部363、探索部364およびピッチ係数設定部365の処理は、サブバンド毎に閉ループの探索処理を構成し、各閉ループにおいて、探索部364は、ピッチ係数設定部365からフィルタリング部363に入力されるピッチ係数Tを種々に変化させることにより、各ピッチ係数に対応する類似度を算出する。探索部364は、サブバンド毎の閉ループにおいて、例えば、サブバンドSBに対応する閉ループにおいて類似度が最大となる最適ピッチ係数T’(ただしTmin〜Tmaxの範囲)を求め、P個の最適ピッチ係数を多重化部367に出力する。探索部364は、各最適ピッチ係数T’を用いて、各サブバンドSBに類似する、第1レイヤ復号スペクトルの一部帯域を算出する。また、探索部364は、各最適ピッチ係数T’(p=0,1,…,P−1)に対応する推定スペクトルS2’(k)をゲイン符号化部366に出力する。なお、探索部364における最適ピッチ係数T’(p=0,1,…,P−1)の探索処理の詳細については後述する。
ピッチ係数設定部365は、探索部364の制御の下、フィルタリング部363および探索部364とともに、第1サブバンドSBに対応する閉ループの探索処理を行う場合には、ピッチ係数Tを、予め定められた探索範囲Tmin〜Tmaxの中で少しずつ変化させながら、フィルタリング部363に順次出力する。
ゲイン符号化部366は、時間−周波数変換処理部315から入力される入力スペクトルS2(k)の高域部(FL≦k<FH)についてのゲイン情報を算出する。具体的には、ゲイン符号化部366は、周波数帯域FL≦k<FHをJ個のサブバンドに分割し、入力スペクトルS2(k)のサブバンド毎のスペクトルパワを求める。この場合、第j+1サブバンドのスペクトルパワBは下記の式(17)で表される。
Figure 0005419876
式(17)において、BLは第j+1サブバンドの最小周波数、BHは第j+1サブバンドの最大周波数を表す。また、ゲイン符号化部366は、探索部364から入力される各サブバンドの推定スペクトルS2’(k)(p=0,1,…,P−1)を周波数領域で連続させて入力スペクトルの高域部の推定スペクトルS2’(k)を構成する。そして、ゲイン符号化部366は、入力スペクトルS2(k)に対してスペクトルパワを算出した場合と同様に、推定スペクトルS2’(k)のサブバンド毎のスペクトルパワB’を下記の式(18)に従い算出する。次いで、ゲイン符号化部366は、入力スペクトルS2(k)に対する推定スペクトルのS2’(k)のサブバンド毎のスペクトルパワの変動量V
を式(19)に従い算出する。
Figure 0005419876
Figure 0005419876
そして、ゲイン符号化部366は、変動量Vを符号化し、符号化後の変動量VQに対応するインデックスを多重化部367に出力する。
多重化部367は、帯域分割部360から入力される帯域分割情報と、探索部364から入力される各サブバンドSB(p=0,1,…,P−1)に対する最適ピッチ係数T’と、ゲイン符号化部366から入力される変動量VQのインデックスと、を第2レイヤ符号化情報として多重化し、符号化情報統合部317に出力する。なお、T’と、VQのインデックスとを直接、符号化情報統合部317に入力して、符号化情報統合部317にて第1レイヤ符号化情報と多重化しても良い。
次いで、図7に示したフィルタリング部363におけるフィルタリング処理の詳細について、図9を用いて説明する。
フィルタリング部363は、フィルタ状態設定部362から入力されるフィルタ状態と、ピッチ係数設定部365から入力されるピッチ係数Tと、帯域分割部360から入力される帯域分割情報とを用いて、サブバンドSB(p=0,1,…,P−1)に対して、帯域BS≦k<BS+BW(p=0,1,…,P−1)における推定スペクトルを生成する。フィルタリング部363において用いるフィルタの伝達関数F(z)は下記の式(20)で表される。
以下、サブバンドSBを例にとり、サブバンドスペクトルS2(k)の推定スペクトルS2’(k)を生成する処理を説明する。
Figure 0005419876
式(20)において、Tはピッチ係数設定部365から与えられるピッチ係数、βは予め内部に記憶されているフィルタ係数を表している。例えば、タップ数が3の場合、フィルタ係数の候補は(β−1、β、β)=(0.1、0.8、0.1)が例として挙げられる。この他に(β−1、β、β)=(0.2、0.6、0.2)、(0.3、0.4、0.3)などの値も適当である。また、(β−1、β、β)=(0.0、1.0、0.0)の値でも良く、この場合には帯域0≦k<FLの第1レイヤ復号スペクトルの一部帯域をその形状を変化させずにそのままBS≦k<BS+BWの帯域にコピーすることを意味する。また、式(20)においてM=1とする。Mはタップ数に関する指標である。
フィルタリング部363における全周波数帯域のスペクトルS(k)の0≦k<FLの帯域には、平滑化第1レイヤ復号スペクトルS1’(k)がフィルタの内部状態(フィルタ状
態)として格納される。
S(k)のBS≦k<BS+BWの帯域には、以下の手順のフィルタリング処理によりサブバンドSBの推定スペクトルS2’(k)が格納される。すなわち、S2’(k)には、基本的に、このkよりTだけ低い周波数のスペクトルS(k−T)が代入される。ただし、スペクトルの円滑性を増すために、実際には、スペクトルS(k−T)からiだけ離れた近傍のスペクトルS(k−T+i)に所定のフィルタ係数βを乗じたスペクトルβ・S(k−T+i)を、全てのiについて加算したスペクトルをS2’(k)に代入する。この処理は下記の式(21)で表される。
Figure 0005419876
上記演算を、周波数の低いk=BSから順に、kをBS≦k<BS+BWの範囲で変化させて行うことにより、BS≦k<BS+BWにおける推定スペクトルS2’(k)を算出する。
以上のフィルタリング処理は、ピッチ係数設定部365からピッチ係数Tが与えられる度に、BS≦k<BS+BWの範囲において、その都度S(k)をゼロクリアして行われる。すなわち、ピッチ係数Tが変化するたびにS(k)は算出され、探索部364に出力される。
図10は、図7に示した探索部364においてサブバンドSBに対して最適ピッチ係数T’を探索する処理の手順を示すフロー図である。なお、探索部364は、図10に示した手順を繰り返すことにより、各サブバンドSB(p=0,1,…,P−1)に対応する最適ピッチ係数T’(p=0,1,…,P−1)を探索する。
まず、探索部364は、類似度の最小値を保存するための変数である最小類似度Dminを「+∞」に初期化する(ST110)。次いで、探索部364は、下記の式(22)に従い、あるピッチ係数における入力スペクトルS2(k)の高域部(FL≦k<FH)と、推定スペクトルS2’(k)との類似度Dを算出する(ST120)。
Figure 0005419876
式(22)において、M’は、類似度Dを算出する際のサンプル数を示し、各サブバンドのバンド幅以下の任意の値で良い。なお、式(22)中にはS2’(k)が存在しないが、これはBSとS2’(k)を用いてS2’(k)を表しているためである。
次いで、探索部364は算出した類似度Dが最小類似度Dminより小さいか否かを判定する(ST130)。ST120において算出された類似度Dが最小類似度Dminより小さい場合(ST130:「YES」)には、探索部364は、類似度Dを最小類似度Dminに代入する(ST140)。一方、ST120において算出された類似度Dが最小類似度Dmin以上である場合(ST130:「NO」)には、探索部364は、探索範囲にわたる処理が終了した否かを判定する。すなわち、探索部364は、探索範囲内の
すべてのピッチ係数それぞれに対し、ST120において上記の式(22)に従って類似度を算出したか否かを判定する(ST150)。探索範囲にわたって処理が終了していなかった場合(ST150:「NO」)には、探索部364は処理を再びST120に戻す。そして、探索部364は、前回のST120の手順において式(22)に従って類似度を算出した場合とは異なるピッチ係数に対して、式(22)に従い類似度を算出する。一方、探索範囲にわたる処理が終了した場合(ST150:「YES」)には、探索部364には、最小類似度Dminに対応するピッチ係数Tを最適ピッチ係数T’として多重化部367に出力する(ST160)。
次いで、図5に示した復号装置303について説明する。
図11は、復号装置303の内部の主要な構成を示すブロック図である。
図11において、符号化情報分離部331は、入力された符号化情報の中から第1レイヤ符号化情報と第2レイヤ符号化情報とを分離し、第1レイヤ符号化情報を第1レイヤ復号部332に出力し、第2レイヤ符号化情報を第2レイヤ復号部335に出力する。
第1レイヤ復号部332は、符号化情報分離部331から入力される第1レイヤ符号化情報に対して復号を行い、生成された第1レイヤ復号信号をアップサンプリング処理部333に出力する。ここで、第1レイヤ復号部332の動作は、図6に示した第1レイヤ復号部313と同様であるため、詳細な説明は省略する。
アップサンプリング処理部333は、第1レイヤ復号部332から入力される第1レイヤ復号信号に対してサンプリング周波数をSRbaseからSRinputまでアップサンプリングする処理を行い、得られるアップサンプリング後第1レイヤ復号信号を時間−周波数変換処理部334に出力する。
時間−周波数変換処理部334は、アップサンプリング処理部333から入力されるアップサンプリング後第1レイヤ復号信号に対して直交変換処理(MDCT)を施し、得られるアップサンプリング後第1レイヤ復号信号のMDCT係数(以下、第1レイヤ復号スペクトルと呼ぶ)S1(k)を第2レイヤ復号部335に出力する。ここで、時間−周波数変換処理部334の動作は、図6に示した時間−周波数変換処理部315のアップサンプリング後第1レイヤ復号信号に対する処理と同様であるため、詳細な説明は省略する。
第2レイヤ復号部335は、時間−周波数変換処理部334から入力される第1レイヤ復号スペクトルS1(k)、符号化情報分離部331から入力される第2レイヤ符号化情報を用いて、高域成分を含む第2レイヤ復号信号を生成し出力信号として出力する。
図12は、図11に示した第2レイヤ復号部335の内部の主要な構成を示すブロック図である。
分離部351は、符号化情報分離部331から入力される第2レイヤ符号化情報を、各サブバンドのバンド幅BW(p=0,1,…,P−1)、先頭インデックスBS(p=0,1,…,P−1)(FL≦BS<FH)を含む帯域分割情報と、フィルタリングに関する情報である最適ピッチ係数T’(p=0,1,…,P−1)と、ゲインに関する情報である符号化後変動量VQ(j=0,1,…,J−1)のインデックスと、に分離する。また、分離部351は、帯域分割情報および最適ピッチ係数T’(p=0,1,…,P−1)をフィルタリング部354に出力し、符号化後変動量VQ(j=0,1,…,J−1)のインデックスをゲイン復号部355に出力する。なお、符号化情報分離部331において、帯域分割情報と、T’(p=0,1,…,P−1)と、VQ(j
=0,1,…,J−1)のインデックスとを分離済みの場合は、分離部351を配置しなくても良い。
スペクトル平滑化部352は、時間−周波数変換処理部334から入力される第1レイヤ復号スペクトルS1(k)(0≦k<FL)に対して平滑化処理を施し、平滑化後の平滑化第1レイヤ復号スペクトルS1’(k)(0≦k<FL)をフィルタ状態設定部353に出力する。スペクトル平滑化部352の処理は、第2レイヤ符号化部316内のスペクトル平滑化部361と同様であるため、ここでは説明を省略する。
フィルタ状態設定部353は、スペクトル平滑化部352から入力される平滑化第1レイヤ復号スペクトルS1’(k)(0≦k<FL)を、フィルタリング部354で用いるフィルタ状態として設定する。ここで、フィルタリング部354における全周波数帯域0≦k<FHのスペクトルを便宜的にS(k)と呼ぶ場合、S(k)の0≦k<FLの帯域に、平滑化第1レイヤ復号スペクトルS1’(k)がフィルタの内部状態(フィルタ状態)として格納される。ここで、フィルタ状態設定部353の構成および動作は、図7に示したフィルタ状態設定部362と同様であるため、詳細な説明は省略する。
フィルタリング部354は、マルチタップ(タップ数が1より多い)のピッチフィルタを備える。フィルタリング部354は、分離部351から入力される帯域分割情報と、フィルタ状態設定部353により設定されたフィルタ状態と、分離部351から入力されるピッチ係数T’(p=0,1,…,P−1)と、予め内部に格納しているフィルタ係数とに基づき、平滑化第1レイヤ復号スペクトルS1’(k)をフィルタリングし、上記の式(21)に示す、各サブバンドSB(p=0,1,…,P−1)の推定値スペクトルS2’(k)(BS≦k<BS+BW)(p=0,1,…,P−1)を算出する。フィルタリング部354でも、上記の式(20)に示したフィルタ関数が用いられる。ただし、この場合のフィルタリング処理およびフィルタ関数は、式(20)、式(21)におけるTをT’に置き換えたものとする。
ゲイン復号部355は、分離部351から入力される、符号化後変動量VQのインデックスを復号し、変動量Vの量子化値である変動量VQを求める。
スペクトル調整部356は、フィルタリング部354から入力される各サブバンドSB(p=0,1,…,P−1)の推定値スペクトルS2’(k)(BS≦k<BS+BW)(p=0,1,…,P−1)を周波数領域で連続させて入力スペクトルの推定スペクトルS2’(k)を求める。また、スペクトル調整部356は、下記の式(23)に従い、推定スペクトルS2’(k)にゲイン復号部355から入力されるサブバンド毎の変動量VQを乗じる。これにより、スペクトル調整部356は、推定スペクトルS2’(k)の周波数帯域FL≦k<FHにおけるスペクトル形状を調整し、復号スペクトルS3(k)を生成して時間−周波数変換処理部357に出力する。
Figure 0005419876
次に、スペクトル調整部356は、式(24)のようにして、時間−周波数変換処理部334から入力される第1レイヤ復号スペクトルS1(k)(0≦k<FL)を復号スペクトルS3(k)の低域部(0≦k<FL)に代入する。ここで、復号スペクトルS3(k)の低域部(0≦k<FL)は、第1レイヤ復号スペクトルS1(k)からなり、復号スペクトルS3(k)の高域部(FL≦k<FH)は、スペクトル形状調整後の推定スペクトルS2’(k)からなる。
Figure 0005419876
時間−周波数変換処理部357は、スペクトル調整部356から入力される復号スペクトルS3(k)を時間領域の信号に直交変換し、得られる第2レイヤ復号信号を出力信号として出力する。ここでは、必要に応じて適切な窓掛けおよび重ね合わせ加算等の処理を行い、フレーム間に生じる不連続を回避する。
以下、時間−周波数変換処理部357における具体的な処理について説明する。
時間−周波数変換処理部357は、バッファbuf’(k)を内部に有しており、下記の式(25)に示すようにバッファbuf’(k)を初期化する。
Figure 0005419876
また、時間−周波数変換処理部357は、スペクトル調整部356から入力される第2レイヤ復号スペクトルS3(k)を用いて下記の式(26)に従い、第2レイヤ復号信号y”を求めて出力する。
Figure 0005419876
式(26)において、Z4(k)は、下記の式(27)に示すように、復号スペクトルS3(k)とバッファbuf’(k)とを結合させたベクトルである。
Figure 0005419876
次に、時間−周波数変換処理部357は、下記の式(28)に従いバッファbuf’(k)を更新する。
Figure 0005419876
次に、時間−周波数変換処理部357は、復号信号y”を出力信号として出力する。
このように、本実施の形態によれば、低域部のスペクトルを用いて帯域拡張を行い高域部のスペクトルを推定する符号化/復号において、前処理として低域部のスペクトルに対して相加平均と相乗平均を組み合わせた平滑化処理を施す。これにより、帯域拡張符号化方式に対しても、復号信号に大きな品質劣化を発生させることなく、処理演算量を大幅に削減することができる。
また、本実施の形態では、帯域拡張符号化時に、復号して得られる低域復号スペクトルに対して平滑化処理を行い、平滑化された低域復号スペクトルを用いて高域スペクトルを推定し、符号化する構成について説明したが、本発明はこれに限らず、入力信号の低域スペクトルに対して平滑化処理を行い、平滑化された入力スペクトルから高域スペクトルを
推定し、符号化する構成についても同様に適用できる。
また、本発明に係るスペクトル平滑化装置およびスペクトル平滑化方法は、上記実施の形態に限定されず、種々変更して実施することができる。例えば、各実施の形態は、適宜組み合わせて実施することが可能である。
また、信号処理プログラムを、メモリ、ディスク、テープ、CD、DVD等の機械読み取り可能な記録媒体に記録、書き込みをし、動作を行う場合についても、本発明は適用することができ、本実施の形態と同様の作用および効果を得ることができる。
また、上記実施の形態では、本発明をハードウェアで構成する場合を例にとって説明したが、本発明はソフトウェアで実現することも可能である。
また、上記実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されてもよいし、一部または全てを含むように1チップ化されてもよい。ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル/プロセッサを利用してもよい。
さらには、半導体技術の進歩または派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適用等が可能性としてありえる。
2008年8月8日出願の特願2008−205645及び2009年4月10日出願の特願2009−096222に含まれる明細書、図面及び要約書の開示内容は、すべて本願に援用される。
本発明にかかるスペクトル平滑化装置、符号化装置、復号装置、通信端末装置、基地局装置及びスペクトル平滑化方法は、スペクトル領域での平滑化を少ない演算量で実現することができ、例えば、パケット通信システム、移動通信システムなどに適用できる。
100 スペクトル平滑化装置
101,315,334,357 時間−周波数変換処理部
102 サブバンド分割部
103 代表値算出部
104 非線形変換部
105 平滑化部
106 逆非線形変換部
201 相加平均算出部
202 相乗平均算出部
301 符号化装置
302 伝送路
303 復号装置
311 ダウンサンプリング処理部
312 第1レイヤ符号化部
313,332 第1レイヤ復号部
314,333 アップサンプリング処理部
316 第2レイヤ符号化部
317 符号化情報統合部
318 遅延部
331 符号化情報分離部
335 第2レイヤ復号部
351 分離部
352,361 スペクトル平滑化部
353,362 フィルタ状態設定部
354,363 フィルタリング部
355 ゲイン復号部
356 スペクトル調整部
360 帯域分割部
364 探索部
365 ピッチ係数設定部
366 ゲイン符号化部
367 多重化部

Claims (12)

  1. 入力される信号を時間−周波数変換して周波数成分を生成する時間−周波数変換手段と、
    前記周波数成分を複数のサブバンドに分割するサブバンド分割手段と、
    前記分割された各サブバンドに対して、算術平均の計算及びその計算結果を用いた乗算演算を用いてサブバンドの代表値を算出する代表値算出手段と、
    前記サブバンド毎の代表値に対して非線形変換を行う非線形変換手段と、
    前記非線形変換された代表値を周波数領域で平滑化する平滑化手段と、
    を具備し、
    前記代表値算出手段は、各サブバンドをさらに複数のサブグループに分割し、前記サブグループ毎に算術平均値を算出し、前記サブグループ毎の算術平均値を用いた前記乗算演算を行った結果を用いて幾何平均値を算出することにより、前記サブバンド毎の代表値を算出する、
    スペクトル平滑化装置。
  2. 入力される信号を時間−周波数変換して周波数成分を生成する時間−周波数変換手段と、
    前記周波数成分を複数のサブバンドに分割するサブバンド分割手段と、
    前記分割された各サブバンドに対して、算術平均の計算及びその計算結果を用いた乗算演算を用いてサブバンドの代表値を算出する代表値算出手段と、
    前記サブバンド毎の代表値に対して非線形変換を行う非線形変換手段と、
    前記非線形変換された代表値を周波数領域で平滑化する平滑化手段と、
    を具備し、
    前記代表値算出手段は、
    各サブバンドをさらに複数のサブグループに分割し、前記サブグループ毎に算術平均値を算出し、前記サブグループ毎の算術平均値を掛け合わせた値を、前記サブバンド毎の代表値として算出し、
    前記非線形変換手段は、
    前記サブバンド毎の代表値に対して前記非線形変換を行うことによりサブバンド毎の中間値を算出し、前記サブバンド毎の中間値に対して、各サブバンド内のサブグループ数の逆数を乗じて得られる値を、前記非線形変換された代表値として算出する、
    スペクトル平滑化装置。
  3. 平滑化された代表値に対して、前記非線形変換と逆特性の逆非線形変換を行う逆非線形変換手段と、を更に具備する、
    請求項1又は2記載のスペクトル平滑化装置。
  4. 前記非線形変換手段は、
    前記各代表値に対して、値が大きいほど、より強調する特性の非線形変換を行う、
    請求項1又は2記載のスペクトル平滑化装置。
  5. 前記非線形変換手段は、
    前記非線形変換として対数変換を行う、
    請求項1又は2記載のスペクトル平滑化装置。
  6. 前記代表値算出手段は、
    前記乗算演算の結果を用いて幾何平均の計算を行うことにより、前記サブバンドの代表値を算出する、
    請求項1又は2記載のスペクトル平滑化装置。
  7. 入力信号の所定周波数以下の低域部分を符号化して第1符号化情報を生成する第1符号化手段と、
    前記第1符号化情報を復号して復号信号を生成する復号手段と、
    前記入力信号の前記所定周波数より高い高域部分を複数のサブバンドに分割し、前記入力信号または前記復号信号から前記複数のサブバンドをそれぞれ推定することにより第2符号化情報を生成する第2符号化手段と、を具備する帯域拡張符号化を行う符号化装置であって、
    前記第2符号化手段は、
    前記復号信号を入力して平滑化する請求項1から請求項のいずれかに記載のスペクトル平滑化装置を具備し、
    前記入力信号または平滑化後の前記復号信号から前記複数のサブバンドをそれぞれ推定する、
    符号化装置。
  8. 符号化装置において生成された、符号化側入力信号の所定周波数以下の低域部分を符号化して得られる第1符号化情報と、前記符号化側入力信号の前記所定周波数より高い高域部分を複数のサブバンドに分割し、前記符号化側入力信号または前記第1符号化情報を復号して得られる第1復号信号から、前記複数のサブバンドをそれぞれ推定することにより生成された第2符号化情報と、を受信する受信手段と、
    前記第1符号化情報を復号して第2復号信号を生成する第1復号手段と、
    前記第2符号化情報を用いて、前記第2復号信号から前記符号化側入力信号の高域部分を推定することにより第3復号信号を生成する第2復号手段と、を具備する帯域拡張復号を行う復号装置であって、
    前記第2復号手段は、
    前記第2復号信号を入力して平滑化する請求項1から請求項のいずれかに記載のスペクトル平滑化装置を具備し、
    平滑化後の前記第2復号信号から前記符号化側入力信号の高域部分を推定する、
    復号装置。
  9. 請求項1から請求項のいずれかに記載のスペクトル平滑化装置を具備する通信端末装置。
  10. 請求項1から請求項のいずれかに記載のスペクトル平滑化装置を具備する基地局装置。
  11. 入力される信号を時間−周波数変換して周波数成分を生成する時間−周波数変換ステップと、
    前記周波数成分を複数のサブバンドに分割するサブバンド分割ステップと、
    前記分割された各サブバンドに対して、算術平均の計算及びその計算結果を用いた乗算演算を用いてサブバンドの代表値を算出する代表値算出ステップと、
    前記サブバンド毎の代表値に対して非線形変換を行う非線形変換ステップと、
    前記非線形変換された代表値を周波数領域で平滑化する平滑化ステップと、
    を有し、
    前記代表値算出ステップは、各サブバンドをさらに複数のサブグループに分割し、前記サブグループ毎に算術平均値を算出し、前記サブグループ毎の算術平均値を用いた前記乗算演算を行った結果を用いて幾何平均値を算出することにより、前記サブバンド毎の代表値を算出する、
    スペクトル平滑化方法。
  12. 入力される信号を時間−周波数変換して周波数成分を生成する時間−周波数変換ステップと、
    前記周波数成分を複数のサブバンドに分割するサブバンド分割ステップと、
    前記分割された各サブバンドに対して、算術平均の計算及びその計算結果を用いた乗算演算を用いてサブバンドの代表値を算出する代表値算出ステップと、
    前記サブバンド毎の代表値に対して非線形変換を行う非線形変換ステップと、
    前記非線形変換された代表値を周波数領域で平滑化する平滑化ステップと、
    を有し、
    前記代表値算出ステップは、
    各サブバンドをさらに複数のサブグループに分割し、前記サブグループ毎に算術平均値を算出し、前記サブグループ毎の算術平均値を掛け合わせた値を、前記サブバンド毎の代表値として算出し、
    前記非線形変換ステップは、
    前記サブバンド毎の代表値に対して前記非線形変換を行うことによりサブバンド毎の中間値を算出し、前記サブバンド毎の中間値に対して、各サブバンド内のサブグループ数の逆数を乗じて得られる値を、前記非線形変換された代表値として算出する、
    スペクトル平滑化方法。
JP2010523772A 2008-08-08 2009-08-07 スペクトル平滑化装置、符号化装置、復号装置、通信端末装置、基地局装置及びスペクトル平滑化方法 Active JP5419876B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010523772A JP5419876B2 (ja) 2008-08-08 2009-08-07 スペクトル平滑化装置、符号化装置、復号装置、通信端末装置、基地局装置及びスペクトル平滑化方法

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
JP2008205645 2008-08-08
JP2008205645 2008-08-08
JP2009096222 2009-04-10
JP2009096222 2009-04-10
JP2010523772A JP5419876B2 (ja) 2008-08-08 2009-08-07 スペクトル平滑化装置、符号化装置、復号装置、通信端末装置、基地局装置及びスペクトル平滑化方法
PCT/JP2009/003799 WO2010016271A1 (ja) 2008-08-08 2009-08-07 スペクトル平滑化装置、符号化装置、復号装置、通信端末装置、基地局装置及びスペクトル平滑化方法

Publications (2)

Publication Number Publication Date
JPWO2010016271A1 JPWO2010016271A1 (ja) 2012-01-19
JP5419876B2 true JP5419876B2 (ja) 2014-02-19

Family

ID=41663498

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010523772A Active JP5419876B2 (ja) 2008-08-08 2009-08-07 スペクトル平滑化装置、符号化装置、復号装置、通信端末装置、基地局装置及びスペクトル平滑化方法

Country Status (11)

Country Link
US (1) US8731909B2 (ja)
EP (1) EP2320416B1 (ja)
JP (1) JP5419876B2 (ja)
KR (1) KR101576318B1 (ja)
CN (1) CN102099855B (ja)
BR (1) BRPI0917953B1 (ja)
DK (1) DK2320416T3 (ja)
ES (1) ES2452300T3 (ja)
MX (1) MX2011001253A (ja)
RU (1) RU2510536C9 (ja)
WO (1) WO2010016271A1 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
US12002476B2 (en) 2010-07-19 2024-06-04 Dolby International Ab Processing of audio signals during high frequency reconstruction
PL3288032T3 (pl) 2010-07-19 2019-08-30 Dolby International Ab Przetwarzanie sygnałów audio podczas rekonstrukcji wysokiej częstotliwości
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
EP2720222A1 (en) * 2012-10-10 2014-04-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for efficient synthesis of sinusoids and sweeps by employing spectral patterns
US9319790B2 (en) * 2012-12-26 2016-04-19 Dts Llc Systems and methods of frequency response correction for consumer electronic devices
JP6531649B2 (ja) 2013-09-19 2019-06-19 ソニー株式会社 符号化装置および方法、復号化装置および方法、並びにプログラム
CN105849801B (zh) 2013-12-27 2020-02-14 索尼公司 解码设备和方法以及程序
US20160379661A1 (en) * 2015-06-26 2016-12-29 Intel IP Corporation Noise reduction for electronic devices
US10043527B1 (en) * 2015-07-17 2018-08-07 Digimarc Corporation Human auditory system modeling with masking energy adaptation
CN110709927B (zh) * 2017-06-07 2022-11-01 日本电信电话株式会社 编码装置、解码装置、平滑化装置、逆平滑化装置、其方法及记录介质
JP6439843B2 (ja) * 2017-09-14 2018-12-19 ソニー株式会社 信号処理装置および方法、並びにプログラム

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0522151A (ja) * 1991-07-09 1993-01-29 Toshiba Corp 帯域分割形符号化方式
JPH0844399A (ja) * 1994-03-17 1996-02-16 Nippon Telegr & Teleph Corp <Ntt> 音響信号変換符号化方法および復号化方法
JP2000259190A (ja) * 1999-03-09 2000-09-22 Matsushita Electric Ind Co Ltd オーディオ信号圧縮方法及びオーディオ信号復号方法とオーディオ信号圧縮装置
JP2002244695A (ja) * 2001-02-22 2002-08-30 Nippon Telegr & Teleph Corp <Ntt> 音声スペクトル改善方法、音声スペクトル改善装置、音声スペクトル改善プログラム、プログラムを記憶した記憶媒体
JP2003108172A (ja) * 2001-09-27 2003-04-11 Kenwood Corp 音声信号加工装置、音声信号加工方法及びプログラム
JP2003216190A (ja) * 2001-11-14 2003-07-30 Matsushita Electric Ind Co Ltd 符号化装置および復号化装置
WO2005111568A1 (ja) * 2004-05-14 2005-11-24 Matsushita Electric Industrial Co., Ltd. 符号化装置、復号化装置、およびこれらの方法
JP2006011456A (ja) * 2004-06-25 2006-01-12 Samsung Electronics Co Ltd 低ビット率符号化/復号化方法及び装置並びにコンピュータ可読媒体

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH046450A (ja) * 1990-04-24 1992-01-10 Sumitomo Light Metal Ind Ltd Al合金材上の溶着金属定量方法
DE4212339A1 (de) * 1991-08-12 1993-02-18 Standard Elektrik Lorenz Ag Codierverfahren fuer audiosignale mit 32 kbit/s
US5495552A (en) * 1992-04-20 1996-02-27 Mitsubishi Denki Kabushiki Kaisha Methods of efficiently recording an audio signal in semiconductor memory
EP1199812A1 (en) * 2000-10-20 2002-04-24 Telefonaktiebolaget Lm Ericsson Perceptually improved encoding of acoustic signals
DE10105339B4 (de) * 2001-02-05 2004-05-13 november Aktiengesellschaft Gesellschaft für Molekulare Medizin Verfahren zur fälschungssicheren Markierung, fälschungssichere Markierung und Kit
US7590250B2 (en) * 2002-03-22 2009-09-15 Georgia Tech Research Corporation Analog audio signal enhancement system using a noise suppression algorithm
US7447631B2 (en) * 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
JP3881932B2 (ja) * 2002-06-07 2007-02-14 株式会社ケンウッド 音声信号補間装置、音声信号補間方法及びプログラム
JP4161628B2 (ja) * 2002-07-19 2008-10-08 日本電気株式会社 エコー抑圧方法及び装置
US7277550B1 (en) * 2003-06-24 2007-10-02 Creative Technology Ltd. Enhancing audio signals by nonlinear spectral operations
CN1322488C (zh) * 2004-04-14 2007-06-20 华为技术有限公司 一种语音增强的方法
EP1926083A4 (en) 2005-09-30 2011-01-26 Panasonic Corp AUDIOCODING DEVICE AND AUDIOCODING METHOD
US8126706B2 (en) * 2005-12-09 2012-02-28 Acoustic Technologies, Inc. Music detector for echo cancellation and noise reduction
EP1928115A1 (en) * 2006-11-30 2008-06-04 Nokia Siemens Networks Gmbh & Co. Kg Adaptive modulation and coding in a SC-FDMA system
JP2008205645A (ja) 2007-02-16 2008-09-04 Mitsubishi Electric Corp アンテナ装置
JP2009096222A (ja) 2007-10-12 2009-05-07 Komatsu Ltd 建設機械

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0522151A (ja) * 1991-07-09 1993-01-29 Toshiba Corp 帯域分割形符号化方式
JPH0844399A (ja) * 1994-03-17 1996-02-16 Nippon Telegr & Teleph Corp <Ntt> 音響信号変換符号化方法および復号化方法
JP2000259190A (ja) * 1999-03-09 2000-09-22 Matsushita Electric Ind Co Ltd オーディオ信号圧縮方法及びオーディオ信号復号方法とオーディオ信号圧縮装置
JP2002244695A (ja) * 2001-02-22 2002-08-30 Nippon Telegr & Teleph Corp <Ntt> 音声スペクトル改善方法、音声スペクトル改善装置、音声スペクトル改善プログラム、プログラムを記憶した記憶媒体
JP2003108172A (ja) * 2001-09-27 2003-04-11 Kenwood Corp 音声信号加工装置、音声信号加工方法及びプログラム
JP2003216190A (ja) * 2001-11-14 2003-07-30 Matsushita Electric Ind Co Ltd 符号化装置および復号化装置
WO2005111568A1 (ja) * 2004-05-14 2005-11-24 Matsushita Electric Industrial Co., Ltd. 符号化装置、復号化装置、およびこれらの方法
JP2006011456A (ja) * 2004-06-25 2006-01-12 Samsung Electronics Co Ltd 低ビット率符号化/復号化方法及び装置並びにコンピュータ可読媒体

Also Published As

Publication number Publication date
RU2510536C2 (ru) 2014-03-27
EP2320416B1 (en) 2014-03-05
US20110137643A1 (en) 2011-06-09
ES2452300T3 (es) 2014-03-31
EP2320416A1 (en) 2011-05-11
KR101576318B1 (ko) 2015-12-09
MX2011001253A (es) 2011-03-21
BRPI0917953B1 (pt) 2020-03-24
WO2010016271A1 (ja) 2010-02-11
CN102099855A (zh) 2011-06-15
RU2510536C9 (ru) 2015-09-10
CN102099855B (zh) 2012-09-26
BRPI0917953A2 (pt) 2015-11-10
JPWO2010016271A1 (ja) 2012-01-19
US8731909B2 (en) 2014-05-20
DK2320416T3 (da) 2014-05-26
KR20110049789A (ko) 2011-05-12
EP2320416A4 (en) 2012-08-22
RU2011104350A (ru) 2012-09-20

Similar Documents

Publication Publication Date Title
JP5419876B2 (ja) スペクトル平滑化装置、符号化装置、復号装置、通信端末装置、基地局装置及びスペクトル平滑化方法
JP5404418B2 (ja) 符号化装置、復号装置および符号化方法
JP5449133B2 (ja) 符号化装置、復号装置およびこれらの方法
JP5448850B2 (ja) 符号化装置、復号装置およびこれらの方法
JP5511785B2 (ja) 符号化装置、復号装置およびこれらの方法
JP5339919B2 (ja) 符号化装置、復号装置およびこれらの方法
WO2009084221A1 (ja) 符号化装置、復号装置およびこれらの方法
JP5730303B2 (ja) 復号装置、符号化装置およびこれらの方法
JP5190359B2 (ja) 符号化装置及び符号化方法
JP5565914B2 (ja) 符号化装置、復号装置およびこれらの方法
WO2013057895A1 (ja) 符号化装置及び符号化方法
JP5774490B2 (ja) 符号化装置、復号装置およびこれらの方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120709

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130903

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131004

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131029

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131119

R150 Certificate of patent or registration of utility model

Ref document number: 5419876

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250