JPWO2018225412A1 - 符号化装置、復号装置、平滑化装置、逆平滑化装置、それらの方法、およびプログラム - Google Patents

符号化装置、復号装置、平滑化装置、逆平滑化装置、それらの方法、およびプログラム Download PDF

Info

Publication number
JPWO2018225412A1
JPWO2018225412A1 JP2019523392A JP2019523392A JPWO2018225412A1 JP WO2018225412 A1 JPWO2018225412 A1 JP WO2018225412A1 JP 2019523392 A JP2019523392 A JP 2019523392A JP 2019523392 A JP2019523392 A JP 2019523392A JP WO2018225412 A1 JPWO2018225412 A1 JP WO2018225412A1
Authority
JP
Japan
Prior art keywords
sequence
spectrum
value
envelope
logarithmic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019523392A
Other languages
English (en)
Other versions
JP6780108B2 (ja
Inventor
亮介 杉浦
亮介 杉浦
優 鎌本
優 鎌本
守谷 健弘
健弘 守谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Publication of JPWO2018225412A1 publication Critical patent/JPWO2018225412A1/ja
Application granted granted Critical
Publication of JP6780108B2 publication Critical patent/JP6780108B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

スペクトル包絡系列の各サンプル値の2底対数に対応する整数値列であり、かつ、総和が0となる整数値列である、対数スペクトル包絡系列L0,L1,…,LN-1とその包絡符号とを得る。量子化スペクトル系列^X0,^X1,…,^XN-1について、Lkが正値である^Xkの最下位桁からLk桁だけ数値を取り除いたものを平滑化スペクトル値~Xkとし、予め定めた規則に従って、Lkが負値である^Xkの最下位桁に-Lk桁だけ数値を追加したものを~Xkとし、Lkが0である場合には、^Xkを~Xkとすることにより、平滑化スペクトル系列~X0,~X1,…,~XN-1を得て、この各サンプルを固定長で符号化して信号符号を得る。

Description

この発明は、音信号などの時系列信号の符号化技術などの信号処理技術に関し、特に、音信号などの時系列信号の周波数スペクトルに由来するサンプル列を、そのスペクトル包絡値に基づいて平滑化、あるいは逆平滑化する技術に関する。
一般的に、時系列信号などのサンプル列を圧縮符号化する場合には、そのサンプル列に対して線形予測分析を行い、それによって得られる線形予測係数に基づいて符号長を適切に割り当てる。これにより、少ない符号量で復号信号の歪みが小さくなるような効率のよい圧縮符号化を行う。音声音響信号のサンプル列を圧縮符号化する従来技術として非特許文献1の技術がある。
図9Aは、非特許文献1の符号化装置1011の機能構成図である。非特許文献1の符号化装置1011は、入力された音声音響信号のサンプル系列を周波数スペクトル系列X0,X1,…,XN-1(ただし、Nは正の整数)に変換する周波数領域変換部1111と、周波数スペクトル系列X0,X1,…,XN-1から線形予測係数α12,…,αp(ただし、pは線形予測の次数であり、2以上の整数)と当該線形予測係数α12,…,αpに対応する所定ビット数の線形予測係数符号Cαを得る線形予測分析部112と、線形予測係数α12,…,αpに対応するスペクトル包絡系列H0,H1,…,HN-1を得るスペクトル包絡生成部1113と、周波数スペクトル系列X0,X1,…,XN-1に基づく系列の各サンプルを量子化幅で除算した結果の整数部分の系列である量子化スペクトル系列を得て、量子化スペクトル系列の各サンプルに当該サンプルに対応するスペクトル包絡の値に応じて符号長を割り当てて符号化して信号符号CXを得るとともに量子化幅に対応する符号である所定ビット数の量子化幅符号CQを得る量子化部1115と、線形予測係数符号Cαと信号符号CXと量子化幅符号CQとを多重化し、符号化装置1011の出力符号を得る多重化部1117とを含む。
図9Bは非特許文献1の復号装置1012の機能構成図である。非特許文献1の復号装置1012は、符号化装置1011が出力した出力符号を入力符号として得て、入力符号に含まれる量子化幅符号CQを逆量子化部1125に、入力符号に含まれる線形予測係数符号Cαをスペクトル包絡生成部1123に、入力符号に含まれる信号符号CXを逆量子化部1125に、それぞれ出力する多重分離部1127と、線形予測係数符号Cα(スペクトル包絡を表す符号)に対応するスペクトル包絡系列H0,H1,…,HN-1を得るスペクトル包絡生成部1123と、スペクトル包絡系列H0,H1,…,HN-1中の各サンプルの値に応じた符号長の信号符号CXを復号して量子化スペクトル系列の各サンプルの値を得て、量子化幅符号CQを復号して量子化幅を得て、量子化スペクトル系列の各サンプルの値に量子化幅を乗算して得られる系列から周波数スペクトル系列X0,X1,…,XN-1を得る逆量子化部1125と、周波数スペクトル系列X0,X1,…,XN-1を時間領域のサンプル列である出力信号に変換する時間領域変換部1121を含む。
T. Backstrom and C.R. Helmrich, "Arithmetic coding of speech and audio spectra using tcx based on linear predictive spectral envelopes," in Proc. ICASSP 2015, Apr. 2015, pp. 5127-5131.
非特許文献1の技術のように、各サンプルに割り当てられる符号長がスペクトル包絡に依存しているような符号化方式は、符号化装置が出力した出力符号が全く誤りなく入力符号として復号装置に入力されるような条件では有用である。しかし、非特許文献1の技術には、符号化装置が出力した出力符号に含まれる線形予測係数符号Cα(スペクトル包絡を表す符号)が復号装置に入力されるまでの間でひとたび誤りが生じてしまうと、信号符号に含まれる各サンプルに対応する符号の符号長に誤りが生じてしまい、復号により得られるサンプル数が変わってしまうことにより、復号処理自体が破綻してしまうという課題、或いは、復号により得られるサンプル数はたまたま正しくなるものの、入力信号とは全く異なる出力信号を出力してしまうという課題がある。このような課題は、「スペクトル包絡を表す符号」として線形予測係数符号Cαが用いられる場合のみならず、より一般的にスペクトル包絡に対応する情報を符号化した符号を「スペクトル包絡を表す符号」とし、符号化装置が出力した出力符号が復号装置に入力されるまでの間に、出力符号に含まれる「スペクトル包絡を表す符号」に誤りが生じた場合にも共通する。
本発明は、符号化装置が出力した符号が復号装置に入力されるまでの間にスペクトル包絡を表す符号に誤りが生じる可能性があるという条件下でも、スペクトル包絡の情報を活かして効率よく信号を圧縮すること、すなわち、少ない符号量で復号信号の歪みが小さくなるようにすることと、復号装置に入力される符号中のスペクトル包絡を表す符号に誤りが含まれていても復号により得られるサンプル数が符号化装置に入力されたサンプル数と同じになることを保証して誤りの影響を小さくとどめることと、を両立した符号化および復号を可能とすることを目的とする。
本発明では、まず、所定時間区間の時系列信号に対応するスペクトル包絡系列の各サンプル値の2底対数に対応する整数値列であり、かつ、総和が0となる整数値列である、対数スペクトル包絡系列L0,L1,…,LN-1と、当該対数スペクトル包絡系列を特定可能な符号である包絡符号とを得る。次に、時系列信号の周波数領域スペクトル系列の各サンプル値を量子化して得た量子化スペクトル系列^X0,^X1,…,^XN-1について、^Xk(kはサンプル番号でありk∈{0,…,N-1})に対応するLkが正値である^Xkについて、^Xkの二進数表記における最下位桁からLk桁だけ数値を取り除いたものを平滑化スペクトル値~Xkとし、^Xkに対応するLkが負値である^Xkについて、予め定めた規則に従って、^Xkの二進数表記における最下位桁に-Lk桁だけ数値を追加したものを平滑化スペクトル値~Xkとし、^Xkに対応するLkが0である場合には、^Xkを平滑化スペクトル値~Xkとすることにより、平滑化スペクトル系列~X0,~X1,…,~XN-1を得て、得た平滑化スペクトル系列~X0,~X1,…,~XN-1の各サンプルを固定長で符号化して信号符号を得る。ただし、予め定めた規則は、取り除いた数値が過不足なく追加する数値となるように、サンプル番号順と桁番号順とに基づいて、定めた規則である。
これにより、符号化装置が出力した符号が復号装置に入力されるまでの間にスペクトル包絡を表す符号に誤りが生じる可能性があるという条件下でも、スペクトル包絡の情報を活かして効率よく信号を圧縮できる。
図1は第一実施形態の符号化装置の機能構成図であり、図1Bは信号平滑化部の機能構成図の例示である。 図2は第一実施形態の復号装置の機能構成図であり、図2Bは信号逆平滑化部の機能構成図の例示である。 図3Aから図3Cは第一実施形態の平滑化部の処理を例示するための概念図である。 図4Aから図4Cは第一実施形態の逆平滑化部の処理を例示するための概念図である。 図5Aから図5Cは第一実施形態で得られた出力符号に符号誤りが発生した場合の影響を例示するための概念図である。 図6Aは第二実施形態の符号化装置の機能構成図であり、図6Bは第二実施形態の復号装置の機能構成図である。 図7Aは第三実施形態の符号化装置の機能構成図であり、図7Bは第三実施形態の復号装置の機能構成図である。 図8Aは第四実施形態の平滑化装置の機能構成図であり、図8Bは第四実施形態の逆平滑化装置の機能構成図である。 図9Aは非特許文献1の符号化装置の機能構成図であり、図9Bは非特許文献1の復号装置の機能構成図である。
以下、本発明の実施形態を説明する。
[原理]
各サンプルに対して予め決めた符号長を割り当てると、符号化装置が出力した符号が復号装置に入力されるまでの間に線形予測係数符号に誤りが生じる可能性があるという条件下でも、復号により得られるサンプルのサンプル数が符号化装置で符号化されたサンプルのサンプル数と同じになることが保証される。特に、符号化装置に入力された時系列信号の周波数スペクトル系列の各周波数スペクトル値を当該時系列信号のスペクトル包絡系列の各スペクトル包絡値で除算すること(すなわち平滑化すること)で得られた平滑化スペクトル系列は、系列に含まれる平滑化スペクトルの振幅値がおおよそ一定範囲内に収まっていることが多い。そのため、平滑化スペクトル系列の各サンプルには、短い符号長の固定長の符号を割り当てることができる。この場合、復号装置では符号を復号して得た平滑化スペクトル系列の各平滑化スペクトル値にスペクトル包絡系列の各スペクトル包絡値を乗算する処理(すなわち逆平滑化)を行う必要がある。
公知技術ではないが、周波数スペクトルを平滑化した後に量子化し、量子化後のサンプルに符号を割り当てることは可能である。この場合は、この符号化装置において、周波数スペクトル系列の各周波数スペクトル値を時系列信号のスペクトル包絡系列の各スペクトル包絡値で除算することにより得た平滑化スペクトル系列の各平滑化スペクトル値を量子化して得られるサンプル系列の各サンプルに符号を割り当てる構成となる。この構成とすると、復号装置において、量子化誤差がスペクトル包絡を乗算することにより拡大されてしまい、時系列信号を復元する精度の低下に繋がってしまう。
一方で、公知技術ではないが、周波数スペクトルを量子化した後に平滑化し、平滑化後のサンプルに符号を割り当てることも可能である。この場合は、周波数スペクトル系列の各周波数スペクトル値を量子化して量子化後の値による系列である量子化周波数スペクトル系列を得て、量子化周波数スペクトル系列の各量子化周波数スペクトル値をスペクトル包絡系列の各スペクトル包絡値で除算して平滑化量子化周波数スペクトル系列を得、平滑化量子化周波数スペクトル系列の各サンプルに符号を割り当てる構成となる。しかし、除算の結果である平滑化量子化周波数スペクトル系列の各サンプルは一般的には有限精度の値にならないため、平滑化量子化周波数スペクトル系列の各サンプルに短い符号長の固定長の符号を割り当ててしまうと量子化誤差が大きくなってしまう。
そこで本発明の各実施形態では、スペクトル包絡系列に含まれる各スペクトル包絡値の対数値の和が近似的に0になることを利用し、周波数スペクトル系列の各周波数スペクトル値を量子化することにより整数値になった量子化スペクトル系列に対するスペクトル包絡系列の整数領域での除算および乗算と、可逆性と、両立できる平滑化と逆平滑化を実現する。さらに、この除算によって量子化スペクトル系列を平滑化して得た平滑化スペクトル系列の各サンプルに固定長の符号を割り当てた符号化と復号をすることで、復号により得られるサンプル数が符号化装置に入力されたサンプル数と同じになることを保証したまま、信号の圧縮と復元を実現する。
以下に各実施形態で実現するスペクトル包絡に基づく可逆な除算および乗算の原理を述べる。周波数スペクトル系列X0,X1,…,XN-1の各周波数スペクトル値をスカラー量子化して得たN点の整数値の量子化スペクトル系列^X0,^X1,…,^XN-1について、そのスペクトル包絡の形状を表すスペクトル包絡系列の各スペクトル包絡値H0,H1,…,HN-1は、周波数スペクトル系列X0,X1,…,XN-1から得られた線形予測係数α12,…,αpを用いて以下のように表せる。
Figure 2018225412

ただし、Nは正の整数であり、pは2以上の整数である。・を実数としてexp(・)はネイピア数を底とする指数関数、jは虚数単位である。このスペクトル包絡値H0,H1,…,HN-1の対数値の合計は近似的に0となることが知られており、スペクトル包絡値Hkの2を底とする対数値Lk(=log2(Hk), k=0,…,N-1)の合計もほぼ0となる。また、スペクトル包絡値の対数値Lkが整数値である場合、量子化スペクトル系列の各量子化スペクトル値に対するスペクトル包絡値での除算^Xk/Hkは、量子化スペクトル値^Xkの2進数表記において桁を増やす、或いは減らす操作に相当する。上記2つの性質を用いて、符号化装置の信号平滑化部における情報の欠落の無い除算と、この除算と可逆な、復号装置の信号逆平滑化部における情報の欠落が無い乗算と、を実現する。
<第一実施形態>
この発明の第一実施形態のシステムは、符号化装置および復号装置を含む。符号化装置は、フレーム単位で入力された時間領域の時系列信号、例えば、音声や音楽などの音信号(音響信号)を符号化して符号を得て、出力する。符号化装置が出力する符号は復号装置へ入力される。復号装置は入力された符号を復号してフレーム単位の時間領域の時系列信号、例えば、音信号を出力する。以下、時系列信号が音信号である場合の符号化装置と復号装置について説明する。なお、符号化装置に入力される音信号は、例えば、音声や音楽などの音をマイクロホンで収音し、AD変換して得られた時系列信号である。また、復号装置が出力した音信号は、例えば、DA変換され、スピーカで再生されることで、受聴可能とされる。
≪符号化装置11≫
図1Aおよび図1Bを参照して、第一実施形態の符号化装置11の機能構成、および符号化装置11が実行する符号化方法の処理手続きを説明する。
図1Aに例示するように、符号化装置11は、周波数領域変換部111、線形予測分析部112(包絡符号化部)、スペクトル包絡生成部113、対数包絡生成部114、量子化部115、信号平滑化部116、および多重化部117を含む。なお、線形予測分析部112、スペクトル包絡生成部113、および対数包絡生成部114は「対数スペクトル包絡生成部」に含まれる。
符号化装置11には、時間領域の音信号(時系列信号である入力信号)が入力される。音信号は、例えば音声信号または音響信号である。符号化装置に入力された時間領域の音信号は周波数変換部へ入力される。
[周波数領域変換部111]
周波数領域変換部111には、符号化装置11に入力された時間領域の音信号が入力される。周波数領域変換部111は、所定の時間長のフレーム(所定時間区間)単位で、入力された時間領域の音信号を、例えば修正離散コサイン変換(MDCT)などで、周波数領域のN点のサンプルの系列である周波数スペクトル系列X0,X1,…,XN-1に変換して出力する。Nは正の整数であり、例えばN=1024などである。周波数領域への変換方法として、MDCTではない様々な公知の変換方法等(例えば、離散フーリエ変換、短時間フーリエ変換等)を用いてもよい。MDCTを用いた場合には、周波数スペクトル系列はMDCT係数列である。周波数領域変換部111は、変換により得た周波数スペクトル系列X0,X1,…,XN-1を、線形予測分析部112および量子化部115に出力する。なお、周波数領域変換部111は、変換により得た周波数スペクトル系列に対して聴覚的な重み付けのためのフィルタ処理や圧伸処理を施し、フィルタ処理後や圧伸処理後の系列を周波数スペクトル系列X0,X1,…,XN-1として出力してもよい。
[線形予測分析部112]
線形予測分析部112には、周波数領域変換部111が出力した周波数スペクトル系列X0,X1,…,XN-1が入力される。線形予測分析部112は、入力された周波数スペクトル系列X0,X1,…,XN-1に対応する線形予測係数α12,…,αpと、当該線形予測係数α12,…,αpに対応する線形予測係数符号Cα(包絡符号CL)と、を得て出力する。線形予測係数符号Cαの例は線形予測係数α12,…,αpに対応するLSP(Line Spectrum Pairs)パラメータ列に対応する符号であるLSP符号である。pは、線形予測の次数であり、2以上の整数である。線形予測分析部112は、線形予測係数α12,…,αpをスペクトル包絡生成部113に、線形予測係数符号Cαを多重化部117に、それぞれ出力する。
線形予測分析部112は、例えば、入力された周波数スペクトル系列X0,X1,…,XN-1の各値の自乗の系列を逆フーリエ変換したものに対してLevinson-Durbinアルゴリズムを行うことにより線形予測係数を得て、得られた線形予測係数を符号化して線形予測係数符号Cαを得て出力するとともに、得られた線形予測係数符号Cαに対応する線形予測係数の量子化値を線形予測係数α12,…,αpとして得て出力する。
線形予測分析部112による線形予測係数符号Cαの生成は、例えば従来的な符号化技術によって行われる。従来的な符号化技術とは、例えば、線形予測係数そのものに対応する符号を線形予測係数符号Cαとする符号化技術、線形予測係数をLSPパラメータに変換してLSPパラメータに対応する符号を線形予測係数符号Cαとする符号化技術、線形予測係数をPARCOR係数に変換してPARCOR係数に対応する符号を線形予測係数符号Cαとする符号化技術などである。
なお、線形予測分析部112は、周波数領域変換部111が出力した周波数スペクトル系列X0,X1,…,XN-1ではなく、符号化装置11に入力された時間領域の音信号から線形予測係数α12,…,αpと当該線形予測係数α12,…,αpに対応する線形予測係数符号Cαとを得て出力してもよい。
[スペクトル包絡生成部113]
スペクトル包絡生成部113には、線形予測分析部112が出力した線形予測係数α12,…,αpが入力される。スペクトル包絡生成部113は、入力された線形予測係数α12,…,αpを用いて、以下の式(1)により求まるスペクトル包絡値H0,H1,…,HN-1によるスペクトル包絡系列である(所定時間区間の時系列信号のスペクトル包絡系列)を得て対数包絡生成部114に出力する。
Figure 2018225412

ただし、k=0,...,N-1であり、・を実数としてexp(・)はネイピア数を底とする指数関数、jは虚数単位である。
なお、スペクトル包絡生成部113は、周波数領域変換部111が出力した周波数スペクトル系列X0,X1,…,XN-1や符号化装置11に入力された時間領域の音信号からスペクトル包絡系列H0,H1,…,HN-1を得てもよい。この場合は、線形予測分析部112を備えずに、スペクトル包絡生成部113がスペクトル包絡系列H0,H1,…,HN-1に対応する符号を包絡符号CLとして得て出力すればよい。なお、スペクトル包絡生成部113の動作から分かる通り、線形予測分析部112が得た線形予測係数α12,…,αpに対応する線形予測係数符号Cαは、スペクトル包絡系列H0,H1,…,HN-1に対応する符号である包絡符号CLと等価なものであり、スペクトル包絡に対応する符号である。
[対数包絡生成部114]
対数包絡生成部114には、スペクトル包絡生成部113が出力したスペクトル包絡系列H0,H1,…,HN-1が入力される。対数包絡生成部114は、スペクトル包絡系列H0,H1,…,HN-1から対数スペクトル包絡系列L0,L1,…,LN-1を得て出力する。ただし、対数スペクトル包絡系列L0,L1,…,LN-1は、スペクトル包絡系列H0,H1,…,HN-1の各サンプル値であるスペクトル包絡値Hk(ただし、k=0,1,...,N-1)の2底対数に対応する整数値列であり、かつ、総和が0となる整数値列である。例えば対数包絡生成部114は、以下のstep I〜IVの各処理を行って対数スペクトル包絡系列L0,L1,…,LN-1を得て出力する。
Step I:対数包絡生成部114は、入力されたスペクトル包絡系列H0,H1,…,HN-1の各スペクトル包絡値H0,H1,…,HN-1の2を底とする対数値log2Hk(ただし、k=0,1,...,N-1)を求める。
Step II:対数包絡生成部114は、Step Iで求めた各対数値log2Hkを整数値に丸め、丸め後の各整数値による系列を対数スペクトル包絡系列L0,L1,…,LN-1として得る。各対数値log2Hkを整数値に丸める処理は、例えば各対数値log2Hkの小数点第一位を四捨五入することにより整数値を得る処理である。すなわち、ここで得た対数スペクトル包絡系列は、スペクトル包絡系列の各サンプル値の2底対数に対応する整数値列である。
Step III:対数包絡生成部114は、Step IIで得た対数スペクトル包絡系列の各サンプル値である対数スペクトル包絡値L0,L1,…,LN-1の総和を求める。すなわち、スペクトル包絡系列の各サンプル値の2底対数に対応する整数値列に含まれる値の総和を求める。
Step IV:対数包絡生成部114は、Step IIIで求めた総和が0であれば(すなわち、スペクトル包絡系列の各サンプル値の2底対数に対応する整数値列に含まれる値の総和が0である場合には)Step IIで得た対数スペクトル包絡系列L0,L1,…,LN-1を信号平滑化部116に出力する。一方、Step IIIで求めた総和が0でなければ(すなわち、スペクトル包絡系列の各サンプル値の2底対数に対応する整数値列に含まれる値の総和が0でない場合には)、対数包絡生成部114は、予め定めた規則により、総和が0となるように調整したもの、例えば、以下の(a),(b)のように調整したもの、を対数スペクトル包絡系列L0,L1,…,LN-1として得て、信号平滑化部116に出力する。
(a) Step IIIで求めた総和が0よりも大きければ、対数スペクトル包絡系列L0,L1,…,LN-1の中で最も大きい値から順に、対数スペクトル包絡系列L0,L1,…,LN-1に含まれる対数スペクトル包絡値の総和が0になるように、1ずつ値を引いたものを対数スペクトル包絡系列L0,L1,…,LN-1とする。すなわち、Step IIIで求めた整数値列に含まれる値の総和が0よりも大きければ、整数値列の中で最も大きい値から順に、整数値列に含まれる値の総和が0になるように、1ずつ値を引いたものを対数スペクトル包絡系列L0,L1,…,LN-1とする。例えば、Step IIで得た対数スペクトル包絡系列L0,L1,…,LN-1が含む対数スペクトル包絡値Lk(ただし、k=0,1,...,N-1)の値の順序(大きいほうからの順序)を表す指標をφ(Lk)=0,…,N-1とする。ただし、大きな値のLkほどφ(Lk)の値が小さい。対数包絡生成部114は、iをi=0に初期化し(Step a-1)、φ(Lk(i))=iとなる調整対象のLk(i)(ただし、k(i)=0,…,N-1)から1を引いた値Lk(i)-1を新たなLk(i)とし(Step a-2)、L0,L1,…,LN-1の総和が0になるかを判定し(Step a-3)、L0,L1,…,LN-1の総和が0でなければi+1を新たなiとしてStep a-2に戻り(Step a-4)、L0,L1,…,LN-1の総和が0であれば当該L0,L1,…,LN-1による系列を対数スペクトル包絡系列として信号平滑化部116に出力する(Step a-5)。なお、Step a-4においてi+1がN-1を超えてしまった場合にはStep a-1に戻ってもよい。
(b) Step IIIで求めた総和が0よりも小さければ、対数スペクトル包絡系列L0,L1,…,LN-1の中で最も小さい値から順に、対数スペクトル包絡系列L0,L1,…,LN-1に含まれる対数スペクトル包絡値の総和が0になるように1ずつ値を足したものを対数スペクトル包絡系列L0,L1,…,LN-1とする。すなわち、Step IIIで求めた整数値列に含まれる値の総和が0よりも小さければ、整数値列の中で最も小さい値から順に、整数値列に含まれる値の総和が0になるように、1ずつ値を足したものを対数スペクトル包絡系列L0,L1,…,LN-1とする。例えば、Step IIで得た対数スペクトル包絡系列L0,L1,…,LN-1が含む対数スペクトル包絡値Lk(ただし、k=0,1,...,N-1)の値の順序(小さいほうからの順序)を表す指標をμ(Lk)=0,…,N-1とする。ただし、小さな値のLkほど(絶対値|Lk|が大きいほど)μ(Lk)の値が小さい。対数包絡生成部114は、iをi=0に初期化し(Step b-1)、μ(Lk(i))=iとなる調整対象のLk(i)(ただし、k(i)=0,…,N-1)に1を加えた値Lk(i)+1を新たなLk(i)とし(Step b-2)、L0,L1,…,LN-1の総和が0になるかを判定し(Step b-3)、L0,L1,…,LN-1の総和が0でなければi+1を新たなiとしてStep b-2に戻り(Step b-4)、L0,L1,…,LN-1の総和が0であれば当該L0,L1,…,LN-1を対数スペクトル包絡系列として信号平滑化部116に出力する(Step b-5)。なお、Step b-4においてi+1がN-1を超えてしまった場合にはStep b-1に戻ってもよい。
上述の(a),(b)によれば乗除の可逆性を担保できる。すなわち、上述の(a),(b)により、後述する平滑化部116aの処理において、各量子化スペクトル値からの桁の削除(除算)と各量子化スペクトル値への桁の追加(乗算)とで数値の過不足がなくなるようにできる。しかし、上述の(a),(b)は一例であって、本発明を限定するものではない。Step IIIで求めた総和が0でない場合に、その他の基準(例えば、調整前後の対数スペクトル包絡系列の距離を最小化する基準)によって対数スペクトル包絡系列L0,L1,…,LN-1の総和が0になるように調整され、総和が0になる対数スペクトル包絡系列L0,L1,…,LN-1が信号平滑化部116に出力されてもよい。Step IIIで求めた対数スペクトル包絡系列L0,L1,…,LN-1の総和が0でない場合に、総和が0となるようにどのような順序で対数スペクトル包絡の値を調整するかは任意であるし、調整対象の対数スペクトル包絡値からどのような値を引いたり足したりするのかも任意である。すなわち、対数包絡生成部114は、Step IIで得た対数スペクトル包絡系列L0,L1,…,LN-1の総和が0になるようにL0,L1,…,LN-1の少なくとも一部の値を調整し、それによって得られたL0,L1,…,LN-1を信号平滑化部116に出力すればよい。言い換えるとStep IIで得た対数スペクトル包絡系列L0,L1,…,LN-1(整数値列)に含まれる値の総和が0である場合には、対数包絡生成部114は、Step IIで得た対数スペクトル包絡系列L0,L1,…,LN-1を対数スペクトル包絡系列L0,L1,…,LN-1として信号平滑化部116に出力する。一方、Step IIで得た対数スペクトル包絡系列L0,L1,…,LN-1(整数値列)に含まれる値の総和が0でない場合には、予め定めた規則により、調整後の整数値列に含まれる値の総和が0となるように、当該整数値列に含まれる少なくとも一部の整数値を調整し、調整後の整数値列を対数スペクトル包絡系列L0,L1,…,LN-1として信号平滑化部116に出力する。
なお、対数スペクトル包絡系列L0,L1,…,LN-1に含まれる対数スペクトル包絡値L0,L1,…,LN-1をなるべく変えないように総和が0となるような最小限の調整を行うのが望ましく、対数スペクトル包絡系列L0,L1,…,LN-1に含まれる対数スペクトル包絡値L0,L1,…,LN-1を大きく変えるような調整を行うのは好ましくない。また、すべてのL0,L1,…,LN-1を0にするような調整を行ってはならず、対数スペクトル包絡系列L0,L1,…,LN-1のうち、負値であった対数スペクトル包絡値が負値のうちの少なくとも何れかの対数スペクトル包絡値が負値であり、かつ、正値であった対数スペクトル包絡値のうちの少なくとも対数スペクトル包絡値が正値であるように、対数スペクトル包絡系列L0,L1,…,LN-1の少なくとも一部の値を調整する必要がある。
[量子化部115]
量子化部115には、周波数領域変換部111が出力した周波数スペクトル系列X0,X1,…,XN-1が入力される。量子化部115は、入力された周波数スペクトル系列X0,X1,…,XN-1の各周波数スペクトル値を量子化幅で割り算した結果の整数部分の値による系列である量子化スペクトル系列^X0,^X1,…,^XN-1を得て信号平滑化部116へ出力する。この量子化幅は従来的な方法で決めればよく、例えば、量子化部115が入力された周波数スペクトル系列X0,X1,…,XN-1のエネルギーや振幅の最大値に比例するような値を量子化幅として決定すればよい。
量子化部115は、決定した量子化幅の値に対応する符号を得て、得た符号を量子化幅符号CQとして多重化部117に出力する。なお、量子化部115は、信号平滑化部116において量子化スペクトル系列^X0,^X1,…,^XN-1を予め定めたビット数で表現できる量子化幅の中で最小の値を二分探索的に求め、量子化幅の値を決定してもよい。この場合には、量子化部115が量子化スペクトル系列^X0,^X1,…,^XN-1と量子化幅を得る処理と後述する信号平滑化部116の処理とを複数回行い、量子化部115は最終的に決定した量子化幅に対応する量子化幅符号CQを多重化部117に出力し、信号平滑化部116は最終的に決定した量子化スペクトル系列^X0,^X1,…,^XN-1が入力された際の平滑化スペクトル系列に対応する信号符号CXを多重化部117に出力する。
[信号平滑化部116]
図1Bに例示するように、信号平滑化部116は、例えば、平滑化部116aと平滑化系列符号化部116bとを備える。信号平滑化部116には、量子化部115が出力した量子化スペクトル系列^X0,^X1,…,^XN-1、および対数包絡生成部114が出力した対数スペクトル包絡系列L0,L1,…,LN-1が入力される。まず、信号平滑化部116の平滑化部116aが、入力された量子化スペクトル系列^X0,^X1,…,^XN-1を入力された対数スペクトル包絡系列L0,L1,…,LN-1に基づいて平滑化して平滑化スペクトル系列~X0,~X1,…,~XN-1を得て出力する。次に、信号平滑化部116の平滑化系列符号化部116bが、信号平滑化部116の平滑化部116aによる平滑化により得た平滑化スペクトル系列~X0,~X1,…,~XN-1を、例えばサンプル毎に4ビットずつなどのように、予め定められたビット数の固定長符号で表現した信号符号CXを得て多重化部117に出力する。
信号平滑化部116の平滑化部116aが行う平滑化は、量子化スペクトル系列^X0,^X1,…,^XN-1の各量子化スペクトル値の二進数表記における下位桁を、対数スペクトル包絡系列L0,L1,…,LN-1のうちの対応する対数スペクトル包絡値に少なくとも基づいて操作することにより行う。
信号平滑化部116の平滑化部116aが行う平滑化処理の具体例を説明する。平滑化部116aは、各サンプル番号k(ただし、k=0,…,N-1)に対して、量子化スペクトル値^Xkに対応する対数スペクトル包絡値Lkが正値である場合には、量子化スペクトル値^Xkの二進数表記における最下位桁からLk桁(すなわち、対数スペクトル包絡値Lkと同じ桁数)だけ数値を取り除いたものを平滑化スペクトル値~Xkとし、対数スペクトル包絡値Lkが負値である場合には、量子化スペクトル値^Xkの二進数表記における最下位桁から-Lk桁(すなわち、対数スペクトル包絡値Lkの絶対値と同じ桁数)だけ数値を追加したものを平滑化スペクトル値~Xkとし、対数スペクトル包絡値Lkが0である場合には、量子化スペクトル値^Xkをそのまま平滑化スペクトル値~Xkとし、その際、予め定めた規則Rsにより、取り除いた数値を過不足なく追加する数値とすることにより、平滑化スペクトル系列~X0,~X1,…,~XN-1を得る。すなわち、平滑化部116aは、^Xk(kはサンプル番号でありk∈{0,…,N-1})に対応するLkが正値である^Xkについて、^Xkの二進数表記における最下位桁からLk桁だけ数値を取り除いたものを平滑化スペクトル値~Xkとし、^Xkに対応するLkが負値である^Xkについて、予め定めた規則Rsに従って、^Xkの二進数表記における最下位桁に-Lk桁だけ数値を追加したものを平滑化スペクトル値~Xkとし、^Xkに対応するLkが0である場合には、^Xkを平滑化スペクトル値~Xkとすることにより、平滑化スペクトル系列~X0,~X1,…,~XN-1を得る。この予め定めた規則Rsは、取り除いた数値が過不足なく追加する数値となるように、サンプル番号順と桁番号順とに基づいて、定めた規則である。ここで「取り除いた数値」とは、^Xkに対応するLkが正値である^Xkから取り除いた数値であり、「追加する数値」とは、^Xkに対応するLkが負値である^Xkに追加する数値である。予め定めた規則Rsは、予め定めた手順に従って、正値である対数スペクトル包絡値Lk’に対応する^Xk’の二進数表記における最下位桁から取り除かれたLk’桁の数値の何れかを、負値である何れかの対数スペクトル包絡値Lk”に対応する^Xkの二進数表記における最下位桁から-Lk桁に追加する何れかの桁の数値とするものである。ただし、k”,k’∈{0,…,N-1}であり、かつ、k”≠k’である。正値である対数スペクトル包絡値Lk’に対応する^Xk’から取り除かれる二進数表記における桁の数値の個数は、負値である対数スペクトル包絡値Lk”に対応する^Xk”に追加する二進数表記における桁の数値の個数と同一である。取り除かれた数値と追加する数値とは一対一で対応する。すなわち、正値である対数スペクトル包絡値Lk’に対応する^Xk’から取り除かれたすべての数値が、負値である何れかの対数スペクトル包絡値Lkに対応する^Xkに追加される何れかの桁の数値とされる。
図3Aから図3Cを用いて予め定めた規則Rsの一例を説明する。図3Aから図3Cに例示する予め定めた規則Rsは、量子化スペクトル系列において、正値である対数スペクトル包絡値(図3Aの例ではL0,L1,L2)それぞれに対応する量子化スペクトル値(図3Aの例では^X0,^X1,^X2)から取り除かれた桁の数値を、当該量子化スペクトル系列において大きい桁から順、同じ桁についてはサンプル番号k(ただし、k=0,…,4)が小さい順のものを、負値である対数スペクトル包絡値(図3Aの例ではL3,L4)に対応する桁シフト前の平滑化スペクトル値(図3Bでは~X3’,~X4’)において小さい桁から順、同じ桁についてはサンプル番号kが小さい順、となるように、負値である対数スペクトル包絡値に対応する量子化スペクトル値(図3Aでは^X3,^X4)に追加する規則である。なお、図3Aから図3Cを用いて説明する予め定めた規則Rsは一例であって本発明を限定するものではない。すなわち、この例は本発明にとって任意的(オプショナル)なものである。
図3Aから図3Cの例を詳しく説明する。この例ではN=5であり、量子化スペクトル系列の各量子化スペクトル値は^X0=13, ^X1=52, ^X2=21, ^X3=2, ^X4=1であり、対数スペクトル包絡系列の各対数スペクトル包絡値はL0=1, L1=3, L2=1, L3=-2 L4=-3である。量子化スペクトル値^X0=13については、対応する対数スペクトル包絡値L0=1であるため、量子化スペクトル値^X0の二進数表記0,0,1,1,0,1の最下位の桁の数値1を取り除く。量子化スペクトル値^X1=52については、対応する対数スペクトル包絡値L0=3であるため、量子化スペクトル値^X1の二進数表記1,1,0,1,0,0の最下位から3桁の数値1, 0, 0を取り除く。量子化スペクトル値^X2=21については、対応する対数スペクトル包絡値L2=1であるため、量子化スペクトル値^X2の二進数表記0,1,0,1,0,1の最下位の桁の数値1を取り除く。量子化スペクトル値^X3=2については、対応する対数スペクトル包絡値L3=-2であるため、量子化スペクトル値^X3の二進数表記0,0,0,0,1,0の最下位桁より下位に2桁の数値を追加する。量子化スペクトル値^X4=1については、対応する対数スペクトル包絡値L4=-2であるため、量子化スペクトル値^X4の二進数表記0,0,0,0,0,1の最下位桁より下位に3桁の数値を追加する。
この際、上記の予め定めた規則Rsでは、取り除かれた数値の順位は、量子化スペクトル値^X1=52の二進数表記1,1,0,1,0,0の最下位から3桁目の数値1が1番目の順(1)、量子化スペクトル値^X1=52の二進数表記1,1,0,1,0,0の最下位から2桁目の数値0が2番目の順(2)、量子化スペクトル値^X0=13の二進数表記0,0,1,1,0,1の最下位桁の数値1が3番目の順(3)、量子化スペクトル値^X1=52の二進数表記1,1,0,1,0,0の最下位桁の数値0が4番目の順(4)、量子化スペクトル値^X4=1の二進数表記0,0,0,0,0,1の最下位桁の数値1が5番目の順(5)である(図3A)。追加される側では、桁シフト前の平滑化スペクトル値~X4’の二進数表記における最下位の桁の順位が1番目(1)であるので、量子化スペクトル値^X1=52の二進数表記1,1,0,1,0,0における最下位から3桁目の数値1をこの桁に追加する(図3Aおよび図3B)。また、桁シフト前の平滑化スペクトル値~X3’の二進数表記における最下位の桁の順位が2番目(2)であるので、量子化スペクトル値^X1=52の二進数表記1,1,0,1,0,0における最下位から2桁目の数値0をこの桁に追加する。また、桁シフト前の平滑化スペクトル値~X4’の二進数表記における最下位から2桁目の順位が3番目(3)であるので、量子化スペクトル値^X0=13の二進数表記0,0,1,1,0,1における最下位桁の数値1をこの桁に追加する。また、桁シフト前の平滑化スペクトル値~X3’の二進数表記における最下位から2桁目の順位が4番目(4)であるので、量子化スペクトル値^X1=52の二進数表記1,1,0,1,0,0における最下位桁の数値0をこの桁に追加する。また、桁シフト前の平滑化スペクトル値~X4’の二進数表記における最下位から3桁目の順位が5番目(5)であるので、量子化スペクトル値^X2=21の二進数表記0,1,0,1,0,1における最下位桁の数値1をこの桁に追加する。その後、このように得られた桁シフト前の平滑化スペクトル値による系列~X0’,…,~X4’(図3B)の二進数表記における最下位桁を揃えたものを、平滑化スペクトル系列~X0,…,~X4(図3C)として得る。
信号平滑化部116の平滑化部116aが行う平滑化処理は、量子化スペクトル系列^X0,^X1,…,^XN-1の各量子化スペクトル値^Xkを対応する対数スペクトル包絡値Lkで除算する処理と、量子化スペクトル系列^X0,^X1,…,^XN-1に含まれる情報が全て平滑化スペクトル系列~X0,~X1,…,~XN-1に含まれるようにする処理と、を両立させる処理である。
上記の図3Aから図3Cの例であれば、元の量子化スペクトル系列^X0,…,^X4が6ビット精度の値域であるのに対して、平滑化スペクトル系列~X0,…,~X4は実質的には4ビットの値域で表現される。これにより、信号平滑化部116の平滑化系列符号化部116bは、平滑化により得た平滑化スペクトル系列~X0,…,~X4の各平滑化スペクトル値~Xkを4ビットの固定長で符号化して信号符号CXを得ることができる。
なお、信号平滑化部116の平滑化系列符号化部116bは、平滑化スペクトル系列~X0,~X1,…,~XN-1の全ての平滑化スペクトル値~Xkを同じビット数で符号化して信号符号CXを得る構成ではなく、平滑化スペクトル系列~X0,~X1,…,~XN-1の各平滑化スペクトル値~Xkを、サンプル位置毎(すなわち、サンプル番号k毎)に予め定められたビット数で符号化して信号符号CXを得る構成であってもよい。また、平滑化スペクトル系列~X0,~X1,…,~XN-1の各平滑化スペクトル値を、サンプル位置の範囲毎(すなわち、サンプル番号kの範囲毎)に予め定められたビット数で符号化して信号符号CXを得る構成にしてもよい。
[多重化部117]
多重化部117は、線形予測分析部112またはスペクトル包絡生成部113が出力したスペクトル包絡を表す符号である線形予測係数符号Cαまたは包絡符号CL(対数スペクトル包絡系列L0,L1,…,LN-1を特定可能な符号である包絡符号CL)と、量子化部115が出力した量子化幅符号CQと、信号平滑化部116が出力した信号符号CXと、を受け取り、これらの符号全てを含む出力符号(例えば全ての符号を繋ぎ合わせて得た出力符号)を、出力する。
≪復号装置12≫
図2Aおよび図2Bを参照して、第一実施形態の復号装置12の機能構成、およびが実行する復号方法の処理手続きを説明する。
図2Aに例示するように、復号装置12は、時間領域変換部121、スペクトル包絡生成部123、対数包絡生成部124、逆量子化部125、信号逆平滑化部126、および多重分離部127を含む。スペクトル包絡生成部123および対数包絡生成部124は、「対数スペクトル包絡復号部」に含まれる。
復号装置12には、符号化装置11が出力した出力符号が入力符号として入力される。復号装置12に入力された入力符号は多重分離部127へ入力される。
[多重分離部127]
多重分離部127には、復号装置12に入力された入力符号が入力される。多重分離部127は、入力符号をフレーム毎に受け取り、入力符号を分離して、入力符号に含まれるスペクトル包絡を表す符号である線形予測係数符号Cαまたは包絡符号CLをスペクトル包絡生成部123へ、入力符号に含まれる量子化幅符号CQを逆量子化部125へ、入力符号に含まれる信号符号CXを信号逆平滑化部126へ、それぞれ出力する。
[スペクトル包絡生成部123]
スペクトル包絡生成部123には、多重分離部127が出力した線形予測係数符号Cα(包絡符号CL)が入力される。スペクトル包絡生成部123は、符号化装置11の線形予測分析部112が行った符号化方法に対応する例えば従来的な復号技術によって、線形予測係数符号Cαを復号して線形予測係数α12,…,αpを得る。さらに、スペクトル包絡生成部123は、得た線形予測係数α12,…,αpを用いて符号化装置11のスペクトル包絡生成部113と同一の手順によりスペクトル包絡系列H0,H1,…,HN-1を生成し(すなわち、包絡符号を復号してスペクトル包絡系列を得)、対数包絡生成部124に出力する。ここで、従来的な復号技術とは、例えば、線形予測係数符号Cαが量子化された線形予測係数に対応する符号である場合に線形予測係数符号Cαを復号して量子化された線形予測係数と同じ線形予測係数を得る技術、線形予測係数符号Cαが量子化されたLSPパラメータに対応する符号である場合に線形予測係数符号Cαを復号して量子化されたLSPパラメータと同じLSPパラメータを得る技術などである。また、線形予測係数とLSPパラメータは互いに変換可能なものであり、入力された線形予測係数符号Cαと後段での処理において必要な情報に応じて、線形予測係数とLSPパラメータの間での変換処理を行なえばよいのは周知である。以上から、上記の線形予測係数符号Cαの復号処理と必要に応じて行なう上記の変換処理とを包含したものが「従来的な復号技術による復号」ということになる。なお、符号化装置11のスペクトル包絡生成部113が周波数スペクトル系列X0,X1,…,XN-1や時間領域の音信号からスペクトル包絡系列H0,H1,…,HN-1と当該スペクトル包絡系列に対応する符号を包絡符号CLとして得た場合には、符号化装置11のスペクトル包絡生成部113が包絡符号CLを得た方法に対応する復号方法で包絡符号CLを復号してスペクトル包絡系列H0,H1,…,HN-1を得る。
なお、符号化装置11のスペクトル包絡生成部113の説明箇所において上述したように、線形予測係数符号Cαは包絡符号CLと等価なものであり、包絡符号CLはスペクトル包絡に対応する符号であるので、上述した2つの処理、すなわち、線形予測係数符号Cαを復号して線形予測係数を得て、得た線形予測係数からスペクトル包絡系列H0,H1,…,HN-1を得る処理も、包絡符号CLを復号してスペクトル包絡系列H0,H1,…,HN-1を得る処理も、要するに、スペクトル包絡に対応する符号である包絡符号CLからスペクトル包絡系列H0,H1,…,HN-1を得る処理である。したがって、スペクトル包絡生成部123は、スペクトル包絡に対応する符号である包絡符号CLからスペクトル包絡系列H0,H1,…,HN-1を得るものである。
[対数包絡生成部124]
対数包絡生成部124には、スペクトル包絡生成部123が出力したスペクトル包絡系列H0,H1,…,HN-1が入力される。対数包絡生成部124は、入力されたスペクトル包絡系列H0,H1,…,HN-1を用いて、符号化装置11の対数包絡生成部114と同一の手順により、対数スペクトル包絡系列L0,L1,…,LN-1を得、信号逆平滑化部126に出力する。すなわち、対数包絡生成部124は、スペクトル包絡系列H0,H1,…,HN-1の各サンプル値であるスペクトル包絡値Hk(ただし、k=0,1,...,N-1)の2底対数に対応する整数値列を得、当該整数値列に含まれる値の総和が0である場合には、当該整数値列を対数スペクトル包絡系列L0,L1,…,LN-1とし、当該整数値列に含まれる値の総和が0でない場合には、予め定めた規則により、調整後の整数値列に含まれる値の総和が0となるように、スペクトル包絡系列H0,H1,…,HN-1の各サンプル値の2底対数に対応する整数値列に含まれる少なくとも一部の整数値を調整し、調整後の整数値列を対数スペクトル包絡系列L0,L1,…,LN-1として得る。前述のように、対数スペクトル包絡系列L0,L1,…,LN-1は、スペクトル包絡系列H0,H1,…,HN-1の各サンプル値であるスペクトル包絡値Hk(ただし、k=0,1,...,N-1)の2底対数に対応する整数値列であり、かつ、総和が0となる整数値列である。
[信号逆平滑化部126]
図2Bに例示するように、信号逆平滑化部126は、例えば、平滑化系列復号部126bと逆平滑化部126aとを備える。信号逆平滑化部126には、多重分離部127が出力した信号符号CXと、対数包絡生成部124が出力した対数スペクトル包絡系列L0,L1,…,LN-1と、が入力される。まず、信号逆平滑化部126の平滑化系列復号部126bが、入力された信号符号CXを復号して平滑化スペクトル系列~X0,~X1,…,~XN-1を得て出力する。ここで、信号符号CXは、符号化装置11の信号平滑化部116が出力した信号符号CXと同じ構成、すなわち、平滑化スペクトル系列~X0,~X1,…,~XN-1の各サンプル~Xkに対応する予め定められたビット数の固定長符号で表現されたものである。そのため、平滑化系列復号部126bは、信号符号CXに対して固定長の復号を行うことで、平滑化スペクトル系列~X0,~X1,…,~XN-1の各サンプル値である平滑化スペクトル値~Xkを得ることができる。
次に、信号逆平滑化部126の逆平滑化部126aが、信号逆平滑化部126の平滑化系列復号部126bによる復号により得た平滑化スペクトル系列~X0,~X1,…,~XN-1と入力された対数スペクトル包絡系列L0,L1,…,LN-1に基づき、以下のように逆平滑化を行い量子化スペクトル系列^X0,^X1,…,^XN-1を得て逆量子化部125へ出力する。
信号逆平滑化部126の逆平滑化部126aが行う逆平滑化は、平滑化スペクトル系列~X0,~X1,…,~XN-1の各平滑化スペクトル値の二進数表記における下位桁を、対数スペクトル包絡系列L0,L1,…,LN-1のうちの対応する対数スペクトル包絡値に少なくとも基づいて操作することにより行う。
信号逆平滑化部126の逆平滑化部126aが行う逆平滑化処理の具体例を説明する。逆平滑化部126aは、各サンプル番号k(k=0,…,N-1)に対して、平滑化スペクトル値~Xkに対応する対数スペクトル包絡値Lkが負値である場合には、平滑化スペクトル値~Xkの二進数表記における最下位桁から-Lk桁(すなわち、対数スペクトル包絡値Lkの絶対値と同じ桁数)だけ数値を取いたものを量子化スペクトル値^Xkとし、対数スペクトル包絡値Lkが正値である場合には、平滑化スペクトル値~Xkの二進数表記における最下位桁からLk桁(すなわち、対数スペクトル包絡値Lkと同じ桁数)だけ数値を追加したものを量子化スペクトル値^Xkとし、対数スペクトル包絡値Lkが0である場合には、平滑化スペクトル値~Xkをそのまま量子化スペクトル値^Xkとし、その際、符号化装置11の信号平滑化部116の平滑化部116aの平滑化処理と対応するように予め定めた規則Rrより、取り除いた数値をを過不足なく追加する数値とすることにより、量子化スペクトル系列^X0,^X1,…,^XN-1を得る。すなわち、逆平滑化部126aは、~Xkに対応するLkが負値である^Xkについて、~Xkの二進数表記における最下位桁から-Lk桁だけ数値を取り除いたものを量子化スペクトル値^Xkとし、~Xkに対応するLkが正値である^Xkについて、平滑化部116aの平滑化処理と対応するように予め定めた規則Rrに従って、~Xkの二進数表記における最下位桁にLk桁だけ数値を追加したものを量子化スペクトル値^Xkとし、~Xkに対応するLkが0である場合には、~Xkを量子化スペクトル値^Xkとすることにより、量子化スペクトル系列^X0,^X1,…,^XN-1を得る。予め定めた規則Rrは、取り除いた数値が過不足なく追加する数値となるように、サンプル番号順と桁番号順とに基づいて、定めた規則である。ここで「取り除いた数値」とは、^Xkに対応するLkが負値である^Xkから取り除いた数値であり、「追加する数値」とは、^Xkに対応するLkが正値である^Xkに追加する数値である。予め定めた規則Rrは、予め定めた手順に従って、負値である対数スペクトル包絡値Lk’に対応する~Xk’の二進数表記における最下位桁から取り除かれた-Lk’桁の数値の何れかを、正値である何れかの対数スペクトル包絡値Lk”に対応する~Xk”の二進数表記における最下位桁からLk”桁に追加する何れかの桁の数値とするものである。ただし、k”,k’∈{0,…,N-1}であり、かつ、k”≠k’である。予め定めた規則Rrは前述の予め定めた規則Rsに対応するものでなければならない。言い換えると、信号逆平滑化部126の逆平滑化部126aが予め定めた規則Rrに従って行う逆平滑化が、前述の信号平滑化部116の平滑化部116aが予め定めた規則Rsに従って行う平滑化の逆処理でなければならない。負値である対数スペクトル包絡値Lk’に対応する~Xk’から取り除かれる二進数表記における桁の数値の個数は、正値である対数スペクトル包絡値Lk”に対応する~Xk”に追加する二進数表記における桁の数値の個数と同一である。取り除かれた数値と追加する数値とは一対一で対応する。すなわち、負値である対数スペクトル包絡値Lk’に対応する~Xk’から取り除かれたすべての数値が、正値である何れかの対数スペクトル包絡値Lk”に対応する~Xkに追加される何れかの桁の数値とされる。
図4Aから図4Cを用いて予め定めた規則Rrの一例を説明する。図4Aから図4Cに例示する予め定めた規則Rrは、図3Aから図3Cで例示した符号化装置11の信号平滑化部116の平滑化部116aの平滑化処理と対応するように予め定めた規則である。予め定めた規則Rrは、平滑化スペクトル系列において、負値である対数スペクトル包絡値(図4Aの例ではL3,L4)それぞれに対応する平滑化スペクトル値(図4Aの例では~X3,~X4)から取り除かれた桁の数値を、当該平滑化スペクトル系列において小さい桁から順、同じ桁についてはサンプル番号kが大きい順のものを、桁シフト前の量子化スペクトル値(図4Bでは^X0’,^X1’,^X2’)において大きい桁から順、同じ桁についてはサンプル番号kが小さい順、となるように、正値である対数スペクトル包絡値に対応する平滑化スペクトル値(図4Aの例では~X0,~X1,~X2)に追加する規則である。なお、図4Aから図4Cを用いて説明する予め定めた規則Rrは一例であって本発明を限定するものではない。すなわち、この例は本発明にとって任意的なものである。
図4Aから図4Cの例を詳しく説明する。この例ではN=5であり、平滑化スペクトル系列の各平滑化スペクトル値は~X0=6, ~X1=6, ~X2=10, ~X3=8, ~X4=15であり、対数スペクトル包絡系列の各対数スペクトル包絡値はL0=1, L1=3, L2=1, L3=-2 L4=-3である。平滑化スペクトル値~X0=6については、対応する対数スペクトル包絡値L0=1であるため、平滑化スペクトル値~X0の二進数表記0,0,0,1,1,0の最下位より下位に1桁の数値を追加する。平滑化スペクトル値~X1=6については、対応する対数スペクトル包絡値L1=3であるため、平滑化スペクトル値~X1の二進数表記0,0,0,1,1,0の最下位より下位に3桁の数値を追加する。平滑化スペクトル値~X2=10については、対応する対数スペクトル包絡値L2=1であるため、平滑化スペクトル値~X2の二進数表記0,0,1,0,1,0の最下位より下位に1桁の数値を追加する。平滑化スペクトル値~X3=8については、対応する対数スペクトル包絡値L3=-2であるため、平滑化スペクトル値~X3の二進数表記0,0,1,0,0,0の最下位から2桁の数値0, 0を取り除く。平滑化スペクトル値~X4=15については、対応する対数スペクトル包絡値L4=-3であるため、平滑化スペクトル値~X4の二進数表記0,0,1,1,1,1の最下位から3桁の数値1, 1, 1を取り除く。
この際、上記の予め定めた規則Rrでは、取り除かれた数値の順位は、平滑化スペクトル値~X4の二進数表記0,0,1,1,1,1の最下位桁の数値1が1番目の順(1)、平滑化スペクトル値~X3の二進数表記0,0,1,0,0,0の最下位桁の数値0が2番目の順(2)、平滑化スペクトル値~X4の二進数表記0,0,1,1,1,1の最下位から2桁目の数値1が3番目の順(3)、平滑化スペクトル値~X3の二進数表記0,0,1,0,0,0の最下位から2桁目の数値0が4番目の順(4)、平滑化スペクトル値~X4の二進数表記0,0,1,1,1,1の最下位から3桁目の数値1が5番目の順(5)である。追加する側では、量子化スペクトル値^X1の二進数表記における最下位から3桁目の順位が1番目(1)であるので、平滑化スペクトル値~X4の二進数表記0,0,1,1,1,1における最下位桁の数値1をこの桁に追加する。また、量子化スペクトル値^X1の二進数表記における最下位から2桁目の順位が2番目(2)であるので、平滑化スペクトル値~X3の二進数表記0,0,1,0,0,0における最下位桁の数値0をこの桁に追加する。また、量子化スペクトル値^X0の二進数表記における最下位桁の順位が3番目(3)であるので、平滑化スペクトル値~X4の二進数表記0,0,1,1,1,1における最下位から2桁目の数値1をこの桁に追加する。また、量子化スペクトル値^X1の二進数表記における最下位桁の順位が4番目(4)であるので、平滑化スペクトル値~X3の二進数表記0,0,1,0,0,0における最下位から2桁目の数値0をこの桁に追加する。また、量子化スペクトル値^X2の二進数表記における最下位桁の順位が5番目(5)であるので、平滑化スペクトル値~X4の二進数表記0,0,1,1,1,1における最下位から3桁目の数値1をこの桁に追加する。
信号逆平滑化部126の逆平滑化部126aが行う逆平滑化処理は、平滑化スペクトル系列~X0,~X1,…,~XN-1の各平滑化スペクトル値~Xkに対応する対数スペクトル包絡値Lkを乗算する処理と、平滑化スペクトル系列~X0,~X1,…,~XN-1に含まれる情報が全て量子化スペクトル系列^X0,^X1,…,^XN-1に含まれるようにする処理と、を両立させる処理であり、符号化装置11の信号平滑化部116の平滑化部116aが行う平滑化処理に対応する処理である。
なお、信号逆平滑化部126の平滑化系列復号部126bは、符号化装置11の信号平滑化部116の平滑化系列符号化部116bに対応する復号処理を行えばよい。すなわち、信号逆平滑化部126の平滑化系列復号部126bは、全てのサンプルを同じビット数で信号符号CXを復号して平滑化スペクトル系列~X0,~X1,…,~XN-1の各平滑化スペクトル値~Xkを得る構成であっても、サンプル位置毎に予め定められたビット数で信号符号CXを復号して平滑化スペクトル系列~X0,~X1,…,~XN-1の各平滑化スペクトル値~Xkを得る構成であっても、サンプル位置の範囲毎に予め定められたビット数で信号符号CXを復号して平滑化スペクトル系列~X0,~X1,…,~XN-1の各平滑化スペクトル値~Xkを得る構成であってもよい。
[逆量子化部125]
逆量子化部125には、多重分離部127の出力した量子化幅符号CQと、信号逆平滑化部126が出力した量子化スペクトル系列^X0,^X1,…,^XN-1と、が入力される。逆量子化部125は、入力された量子化幅符号CQを復号して量子化幅を得る。また、逆量子化部125は、入力された量子化スペクトル系列^X0,^X1,…,^XN-1の各量子化スペクトル値と、復号により得た量子化幅とを掛け合わせたサンプルの系列である復号スペクトル系列X0,X1,…,XN-1を得て時間領域変換部121に出力する。すなわち、逆量子化部125は、量子化スペクトル系列^X0,^X1,…,^XN-1を逆量子化して復号スペクトル系列X0,X1,…,XN-1(周波数領域スペクトル系列)を得て時間領域変換部121に出力する。つまり、逆量子化部125は、量子化スペクトル系列^X0,^X1,…,^XN-1を逆量子化して所定時間区間の復号された周波数領域スペクトルの系列である復号スペクトル系列X0,X1,…,XN-1(周波数領域スペクトル系列)を得て時間領域変換部121に出力する。
[時間領域変換部121]
時間領域変換部121には、逆量子化部125が出力した復号スペクトル系列X0,X1,…,XN-1が入力される。時間領域変換部121は、フレーム毎に、周波数領域のN点のサンプルの系列である復号スペクトル系列X0,X1,…,XN-1を、符号化装置11の周波数領域変換部111に対応する逆変換である(例えば逆MDCT)を用いて、時間領域の信号に変換してフレーム単位の音信号(復号音信号)を得、出力信号として出力する。なお、符号化装置11における周波数領域変換部111において、変換により得た周波数スペクトル系列に対して聴覚的な重み付けのためのフィルタ処理や圧伸処理が施されている場合には、時間領域変換部121は、まず、符号化装置11が行ったフィルタ処理や圧伸処理に対応する逆変換を復号スペクトル系列X0,X1,…,XN-1に行い、逆変換後の系列を時間領域の信号に変換して出力する。すなわち、時間領域変換部121は、周波数領域スペクトル系列を時間領域に変換して所定時間区間の復号された時系列信号を得る。
≪誤りが生じた場合≫
第一実施形態の符号化装置11が出力した出力符号が復号装置12に入力されるまでの間で誤りが生じた場合の例を、図5Aから図5Cを用いて説明する。この例では、入力符号に含まれる信号符号CXに誤りが含まれずに、信号符号CXの復号により正しい平滑化スペクトル系列~X0=6, ~X1=6, ~X2=10, ~X3=8, ~X4=15が得られたものの、入力符号に含まれる線形予測係数符号Cα(スペクトル包絡を表す符号)に誤りが含まれ、正しくは対数スペクトル包絡系列L0=1, L1=3, L2=1, L3=-2, L4=-3であるところが、線形予測係数符号Cαを復号して得た対数スペクトル包絡系列がL0=2, L1=2, L2=0, L3=-2, L4=-2であったとする。この場合、平滑化スペクトル値~X0=6については、対応する対数スペクトル包絡値L0=2であるため、2桁の数値を追加することになる。平滑化スペクトル値~X1=6については、対応する対数スペクトル包絡値L1=2であるため、2桁の数値を追加することになる。平滑化スペクトル値~X2=10については、対応する対数スペクトル包絡値L2=0であるため、桁の追加や削除は行わないことになる。平滑化スペクトル値~X3=8については、対応する対数スペクトル包絡値L3=-2であるため、最下位から2桁の数値0, 0を取り除くことになる。平滑化スペクトル値~X4=15については、対応する対数スペクトル包絡値L4=-2であるため、最下位から2桁の数値1, 1を取り除くことになる(図5A)。取り除かれた4つの数値は、上記の予め定めた規則Rrに従って、平滑化スペクトル値~X0および平滑化スペクトル値~X1に追加され(図5B)、量子化スペクトル値^Xo=24, ^X1=27, ^X2=10, ^X3=2, ^X4=3が得られる(図5C)。得られた量子化スペクトル値は正しくないものの、量子化スペクトル値には対数スペクトル包絡値の誤りと同程度の誤りが生じるだけである。例えば、対数スペクトル包絡の値が誤りにより1増えてしまった場合には、それに対応するスペクトル包絡値は2倍されたことに相当する。この誤った包絡で逆平滑化した場合、復号により得られる量子化スペクトル値は本来の値の2倍程度の誤りで収まることになる。また例えば、対数スペクトル包絡の値が誤りにより1減ってしまった場合には、それに対応するスペクトル包絡値は1/2倍されたことに相当する。この誤った包絡で逆平滑化した場合、復号により得られる量子化スペクトル値は本来の値の1/2倍程度の誤りで収まることになる。また、線形予測係数符号Cαにいくら誤りが生じても、量子化スペクトル系列のサンプル数には誤りは絶対に生じない。
例示はしないが、入力符号に含まれる信号符号CXに誤りが含まれた場合には、信号符号CXの復号により得られる平滑化スペクトル系列のうち、符号に誤りが生じた平滑化スペクトルの値には誤りが生じるが、符号に誤りが生じていない平滑化スペクトルの値には誤りは生じない。すなわち、信号符号CXの誤りは、信号符号CX中の誤りが生じたビットが対応する平滑化スペクトルの値のみにしか影響しない。また、信号符号CXにいくら誤りが生じても、量子化スペクトル系列のサンプル数には誤りは絶対に生じない。
<第二実施形態>
フレームが十分短い場合、つまり上記Nが小さい場合(例えば、N=32の場合)においては、周波数スペクトル系列から線形予測係数を求めて、求めた線形予測係数に対応する対数スペクトル包絡系列を求めるよりも、周波数スペクトル系列から対数スペクトル包絡系列を直接求めるほうが、少ない演算量で実装できることがある。第二実施形態では、周波数スペクトル系列から対数スペクトル包絡系列を直接求める方法として対数スペクトル包絡系列をベクトル量子化により得る符号化装置、およびこの符号化装置に対応する復号装置について説明する。
≪符号化装置21≫
図6Aを参照して、第二実施形態の符号化装置21が実行する符号化方法の処理手続きを説明する。第二実施形態の符号化装置21は、第一実施形態の符号化装置21における線形予測分析部112、スペクトル包絡生成部113、および対数包絡生成部114に代えて、対数包絡符号化部214を備える以外は、第一実施形態の符号化装置11と同一の構成である。以下、第一実施形態の符号化装置11と異なる点について説明する。以降、第一実施形態と共通する部分については、第一実施形態と同じ参照番号を用いて説明を簡略化する。
[対数包絡符号化部214]
対数包絡符号化部214には、周波数領域変換部111が出力した周波数スペクトル系列X0,X1,…,XN-1が入力される。対数包絡符号化部214は、入力された周波数スペクトル系列X0,X1,…,XN-1に含まれる周波数スペクトル値に基づいて対数スペクトル包絡系列L0,L1,…,LN-1を求め、対数スペクトル包絡系列L0,L1,…,LN-1を信号平滑化部116へ、対数スペクトル包絡系列に対応する符号である包絡符号CLを多重化部117へ出力する。
対数包絡符号化部214が対数スペクトル包絡系列L0,L1,…,LN-1を得る方法として、ベクトル量子化を行う方法を例示する。対数包絡符号化部214内の図示しない記憶部に、予め、総和が0となるようなN個の整数で構成される対数スペクトル包絡系列L0,L1,…,LN-1の複数個の候補について、各候補の対数スペクトル包絡系列L0,L1,…,LN-1と、各候補の対数スペクトル包絡系列L0,L1,…,LN-1の各対数スペクトル包絡値を指数とした2のべき乗の系列であるスペクトル包絡系列H0,H1,…,HN-1と、各候補の対数スペクトル包絡系列L0,L1,…,LN-1に対応する符号と、による組を記憶しておく。すなわち、対数包絡符号化部214内の図示しない記憶部には、対数スペクトル包絡系列L0,L1,…,LN-1の候補と、当該対数スペクトル包絡系列L0,L1,…,LN-1の候補に対応するスペクトル包絡系列H0,H1,…,HN-1の候補と、当該対数スペクトル包絡系列L0,L1,…,LN-1の候補を特定可能な符号と、による組が複数組予め記憶されている。対数包絡符号化部214は、当該記憶部に予め記憶された複数個の組のうち、スペクトル包絡系列H0,H1,…,HN-1の候補が入力された周波数スペクトル系列X0,X1,…,XN-1(所定時間区間の時系列信号)に対応するスペクトル包絡系列H0,H1,…,HN-1に対応する組を選択して、当該選択した組の対数スペクトル包絡系列L0,L1,…,LN-1の候補を対数スペクトル包絡系列L0,L1,…,LN-1として得、当該選択した組の符号を包絡符号CL(スペクトル包絡を表す符号)として得て出力する。例えば、対数包絡符号化部214は、当該記憶部内に記憶されたスペクトル包絡系列H0,H1,…,HN-1のそれぞれについて、入力された周波数スペクトル系列X0,X1,…,XN-1中の各周波数スペクトル値Xkとスペクトル包絡系列H0,H1,…,HN-1中の対応するスペクトル包絡値Hkとの比の系列のエネルギーを求め、エネルギーが最小となるスペクトル包絡系列H0,H1,…,HN-1に対応する対数スペクトル包絡系列L0,L1,…,LN-1と包絡符号CLとを出力する。
[多重化部117]
多重化部117は、スペクトル包絡を表す符号として、第一実施形態の線形予測分析部112またはスペクトル包絡生成部113が出力した線形予測係数符号Cαまたは包絡符号CLに代えて、対数包絡符号化部214が出力した包絡符号CLを用いる以外は、第一実施形態の多重化部117と同じ動作をする。
≪復号装置22≫
図6Bを参照して、第二実施形態の復号装置22の機能構成、および復号装置22が実行する復号方法の処理手続きを説明する。第二実施形態の復号装置22は、第一実施形態の復号装置12におけるスペクトル包絡生成部123、および対数包絡生成部114に代えて、対数包絡復号部224を備える以外は、第一実施形態の復号装置12と同様の構成である。以下、第一実施形態の復号装置12と異なる点について説明する。
[多重分離部127]
多重分離部127には、復号装置12に入力された入力符号が入力される。多重分離部127は、入力符号をフレーム毎に受け取り、入力符号を分離して、入力符号に含まれるスペクトル包絡を表す符号である包絡符号CLを対数包絡復号部224へ、入力符号に含まれる量子化幅符号CQを逆量子化部125へ、入力符号に含まれる信号符号CXを信号逆平滑化部126へ、それぞれ出力する。
[対数包絡復号部224]
対数包絡復号部224内の図示しない記憶部には、予め、対応する符号化装置21の対数包絡符号化部214の図示しない記憶部に記憶されているのと同じ、総和が0となるようなN個の整数で構成される対数スペクトル包絡系列L0,L1,…,LN-1の複数個の候補について、各候補の対数スペクトル包絡系列L0,L1,…,LN-1と、各系列に対応する符号と、による組を記憶しておく。すなわち、対数包絡復号部224内の図示しない記憶部には、対数スペクトル包絡系列L0,L1,…,LN-1の候補と、当該対数スペクトル包絡系列L0,L1,…,LN-1の候補を特定可能な符号と、による組が複数組予め記憶されている。対数包絡復号部224には、多重分離部127が出力した包絡符号CLが入力される。対数包絡復号部224は、入力された包絡符号CLに対応する対数スペクトル包絡系列L0,L1,…,LN-1を記憶部から得て信号逆平滑化部126に出力する。すなわち、対数包絡復号部224は、当該記憶部に予め記憶された複数個の組のうち、符号が包絡符号CLに対応する組を選択し、当該選択した組の対数スペクトル包絡系列の候補を対数スペクトル包絡系列L0,L1,…,LN-1として得て信号逆平滑化部126に出力する。
<第三実施形態>
以上説明したように、第一実施形態の符号化装置11も第二実施形態の符号化装置21も要するに図7Aに示す符号化装置31に相当する。符号化装置31は、周波数領域変換部111、対数スペクトル包絡生成部314、量子化部115、信号平滑化部116、および多重化部117を含む。対数スペクトル包絡生成部314は、所定時間区間の時系列信号に対応するスペクトル包絡系列の各サンプル値の2底対数に対応する整数値列であり、かつ、総和が0となる整数値列である、対数スペクトル包絡系列L0,L1,…,LN-1と、当該対数スペクトル包絡系列を特定可能な符号である包絡符号CLと、を得て出力する。第一実施形態の符号化装置11では、線形予測分析部112(包絡符号化部)、スペクトル包絡生成部113、および対数包絡生成部114を含む機能構成が対数スペクトル包絡生成部314に相当する。第二実施形態の符号化装置21では、対数包絡符号化部214を含む機能構成が対数スペクトル包絡生成部314に相当する。また、信号平滑化部116は、時系列信号の周波数領域スペクトル系列の各サンプル値を量子化して得た量子化スペクトル系列^X0,^X1,…,^XN-1について、^Xk(kはサンプル番号でありk∈{0,…,N-1})に対応するLkが正値である^Xkについて、^Xkの二進数表記における最下位桁からLk桁だけ数値を取り除いたものを平滑化スペクトル値~Xkとし、^Xkに対応するLkが負値である^Xkについて、予め定めた規則に従って、^Xkの二進数表記における最下位桁に-Lk桁だけ数値を追加したものを平滑化スペクトル値~Xkとし、^Xkに対応するLkが0である場合には、^Xkを平滑化スペクトル値~Xkとすることにより、平滑化スペクトル系列~X0,~X1,…,~XN-1を得て、得た平滑化スペクトル系列~X0,~X1,…,~XN-1の各サンプルを固定長で符号化して信号符号を得るものである。この予め定めた規則は、取り除いた数値が過不足なく追加する数値となるように、サンプル番号順と桁番号順とに基づいて、定めた規則である。
同様に、第一実施形態の復号装置12も第二実施形態の復号装置22も図7Bに示す復号装置32に相当する。復号装置32は、時間領域変換部121、対数スペクトル包絡復号部324、逆量子化部125、信号逆平滑化部126、および多重分離部127を含む。対数スペクトル包絡復号部324は、入力された包絡符号CLを復号し、スペクトル包絡系列の各サンプル値の2底対数に対応する整数値列であり、かつ、総和が0となる整数値列である対数スペクトル包絡系列L0,L1,…,LN-1を得る。第一実施形態の復号装置12では、スペクトル包絡生成部123および対数包絡生成部124を含む機能構成が対数スペクトル包絡復号部324に相当する。第二実施形態の復号装置22では、対数包絡復号部224を含む機能構成が対数スペクトル包絡復号部324に相当する。信号逆平滑化部126は、固定長の符号である信号符号を復号して所定時間区間の平滑化スペクトル系列~X0,~X1,…,~XN-1を得、平滑化スペクトル系列~X0,~X1,…,~XN-1について、~Xk(kはサンプル番号でありk∈{0,…,N-1})に対応するLkが負値である~Xkについて、~Xkの二進数表記における最下位桁から-Lk桁だけ数値を取り除いたものを量子化スペクトル値^Xkとし、~Xkに対応するLkが正値である~Xkについて、予め定めた規則に従って、~Xkの二進数表記における最下位桁にLk桁だけ数値を追加したものを量子化スペクトル値^Xkとし、~Xkに対応するLkが0である場合には、~Xkを量子化スペクトル値^Xkとすることにより、所定時間区間の量子化されたスペクトルの系列である量子化スペクトル系列^X0,^X1,…,^XN-1を得る。予め定めた規則は、取り除いた数値が過不足なく追加する数値となるように、サンプル番号順と桁番号順とに基づいて、定めた規則である。逆量子化部125は、量子化スペクトル系列^X0,^X1,…,^XN-1を逆量子化して周波数領域スペクトル系列X0,X1,…,XN-1を得て出力する。すなわち、逆量子化部125は、量子化スペクトル系列^X0,^X1,…,^XN-1を逆量子化して所定時間区間の復号された周波数領域スペクトルの系列である周波数領域スペクトル系列X0,X1,…,XN-1を得る。時間領域変換部121は、周波数領域スペクトル系列X0,X1,…,XN-1を時間領域に変換して所定時間区間の復号された時系列信号である出力信号を得て出力する。
<第四実施形態>
図8Aに例示するように、音信号などの時系列信号である入力信号を入力とし、第一実施形態の符号化装置11、第二実施形態の符号化装置21、または第三実施形態の符号化装置31の信号平滑化部116の平滑化部116aで得られる平滑化スペクトル系列~X0,~X1,…,~XN-1を出力する平滑化装置41が構成されてもよい。平滑化装置41は、周波数領域変換部111、対数スペクトル包絡生成部414、量子化部115、平滑化部116a、および多重化部117を含む。対数スペクトル包絡生成部414は、所定時間区間の時系列信号に対応するスペクトル包絡系列の各サンプル値の2底対数に対応する整数値列であり、かつ、総和が0となる整数値列である、対数スペクトル包絡系列L0,L1,…,LN-1を得て出力する。対数スペクトル包絡生成部414は、第三実施形態の対数スペクトル包絡生成部413と同一構成であってもよいし、対数スペクトル包絡生成部413の機能構成から包絡符号CLを得て出力する機能構成を除外したものであってもよい。平滑化部116aは、時系列信号の周波数領域スペクトル系列の各サンプル値を量子化して得た量子化スペクトル系列^X0,^X1,…,^XN-1について、^Xk(kはサンプル番号でありk∈{0,…,N-1})に対応するLkが正値である^Xkについて、^Xkの二進数表記における最下位桁からLk桁だけ数値を取り除いたものを平滑化スペクトル値~Xkとし、^Xkに対応するLkが負値である^Xkについて、予め定めた規則に従って、^Xkの二進数表記における最下位桁に-Lk桁だけ数値を追加したものを平滑化スペクトル値~Xkとし、^Xkに対応するLkが0である場合には、^Xkを平滑化スペクトル値~Xkとすることにより、平滑化スペクトル系列~X0,~X1,…,~XN-1を得て出力する。予め定めた規則は、取り除いた数値が過不足なく追加する数値となるように、サンプル番号順と桁番号順とに基づいて、定めた規則である。対数スペクトル包絡生成部414が包絡符号CLを出力するのであれば、平滑化装置41が包絡符号CLを出力してもよい。
図8Bに例示するように、平滑化装置41から出力された平滑化スペクトル系列~X0,~X1,…,~XN-1を入力とし、平滑化スペクトル系列~X0,~X1,…,~XN-1の逆平滑化を行う逆平滑化装置42が構成されてもよい。逆平滑化装置42は、逆平滑化部126a、逆量子化部125、および時間領域変換部121を含む。平滑化装置41から出力された包絡符号CLが入力される逆平滑化装置42は、さらに前述の対数スペクトル包絡復号部324を含む。逆平滑化装置42が対数スペクトル包絡系列L0,L1,…,LN-1を取得可能であり、平滑化装置41から平滑化スペクトル系列~X0,~X1,…,~XN-1が出力される場合、その平滑化スペクトル系列~X0,~X1,…,~XN-1が逆平滑化部126aに入力される。平滑化装置41から平滑化スペクトル系列~X0,~X1,…,~XN-1および包絡符号CLが出力される場合、平滑化スペクトル系列~X0,~X1,…,~XN-1は逆平滑化部126aに入力され、包絡符号CLは対数スペクトル包絡復号部324に入力される。包絡符号CLが入力された対数スペクトル包絡復号部324は、前述のように包絡符号CLを復号することで対数スペクトル包絡系列L0,L1,…,LN-1を得、当該対数スペクトル包絡系列L0,L1,…,LN-1を逆平滑化部126aに入力する。逆平滑化部126aは、平滑化スペクトル系列~X0,~X1,…,~XN-1および対数スペクトル包絡系列L0,L1,…,LN-1を入力とし、前述のように対数スペクトル包絡系列L0,L1,…,LN-1を用いて平滑化スペクトル系列~X0,~X1,…,~XN-1の逆平滑化を行って、量子化スペクトル系列^X0,^X1,…,^XN-1を得て出力する。すなわち、逆平滑化部126aは、所定時間区間のスペクトル包絡系列の各サンプル値の2底対数に対応する整数値列であり、かつ、総和が0となる整数値列である対数スペクトル包絡系列L0,L1,…,LN-1と、所定時間区間の平滑化スペクトル系列~X0,~X1,…,~XN-1と、を入力とし、平滑化スペクトル系列~X0,~X1,…,~XN-1について、~Xk(kはサンプル番号でありk∈{0,…,N-1})に対応するLkが負値である~Xkについて、~Xkの二進数表記における最下位桁から-Lk桁だけ数値を取り除いたものを量子化スペクトル値^Xkとし、~Xkに対応するLkが正値である~Xkについて、予め定めた規則に従って、~Xkの二進数表記における最下位桁にLk桁だけ数値を追加したものを量子化スペクトル値^Xkとし、~Xkに対応するLkが0である場合には、~Xkを量子化スペクトル値^Xkとすることにより、所定時間区間の量子化されたスペクトルの系列である量子化スペクトル系列^X0,^X1,…,^XN-1を得て出力する。予め定めた規則は、取り除いた数値が過不足なく追加する数値となるように、サンプル番号順と桁番号順とに基づいて、定めた規則である。逆量子化部125は、量子化スペクトル系列^X0,^X1,…,^XN-1を逆量子化して周波数領域スペクトル系列X0,X1,…,XN-1を得て出力する。すなわち、逆量子化部125は、量子化スペクトル系列^X0,^X1,…,^XN-1を逆量子化して所定時間区間の復号された周波数領域スペクトルの系列である周波数領域スペクトル系列X0,X1,…,XN-1を得る。時間領域変換部121は、周波数領域スペクトル系列X0,X1,…,XN-1を時間領域に変換して所定時間区間の復号された時系列信号である出力信号を得て出力する。
<変形例等>
なお、本発明は上述の実施形態に限定されるものではない。例えば、上記の各実施形態の符号化装置11,21,31の信号平滑化部116の平滑化系列符号化部116bでは、平滑化により得た平滑化スペクトル系列の各サンプルを固定長で符号化して信号符号CXを得ているが、可変長符号化して信号符号CXを得る構成としてもよい。その際には、復号装置12,22,32の信号逆平滑化部126の平滑化系列復号部126bでは、信号符号CXを可変長復号して平滑化スペクトル系列を得ればよい。この変形例では、復号装置の入力符号に含まれる信号符号CXに誤りが含まれた場合には信号符号CX中の誤りが生じたビットが対応する平滑化スペクトルの値以外にも誤りの影響が生じることはあるが、復号装置12,22の入力符号に含まれる線形予測係数符号Cαにいくら誤りが生じても量子化スペクトル系列のサンプル数には誤りが生じないのは上記の各実施形態と同様である。
また、上記の実施形態では、符号化装置11,21,31、および平滑化装置41に入力される音信号(時系列信号)として、音声や音楽などの音をマイクロホンで収音し、それによって得られる音を表すアナログ信号をAD変換したデジタル信号を例示した。しかし、これは単なる例示であり、本発明を限定するものではない。例えば、その他の手段によって得られた音を表すアナログ信号をデジタル信号にAD変換して得られた音信号が符号化装置11,21,31、または平滑化装置41に入力されてもよい。音を表すアナログ信号に対応するデジタル信号である音信号が符号化装置11,21,31、または平滑化装置41に入力されてもよい。音を表すデジタル信号である音信号が符号化装置11,21,31、または平滑化装置41に入力されてもよい。すなわち、音信号を得る方法は任意的である。音を表すアナログ信号が符号化装置11,21,31、または平滑化装置41に入力されてもよい。この場合には、符号化装置11,21,31、または平滑化装置41でこのアナログ信号をAD変換して得られるデジタル信号を音信号として用いてもよい。すなわち、符号化装置11,21,31、または平滑化装置41にデジタル信号が入力されることも任意的である。
上記の実施形態では、符号化装置11,21,31、または平滑化装置41に時間領域の音信号が入力され、この時間領域の音信号が周波数スペクトル系列X0,X1,…,XN-1に変換された。しかし、これは単なる例示であり、本発明を限定するものではない。例えば、周波数スペクトル系列X0,X1,…,XN-1が符号化装置11,21,31、または平滑化装置41に入力されてもよい。この場合には符号化装置11,21,31、または平滑化装置41が周波数領域変換部111を備えなくてもよい。すなわち、周波数領域変換部111は符号化装置11,21,31、または平滑化装置41にとって任意的な要素である。
上記の実施形態では、復号装置12,22,32、または逆平滑化装置42が復号スペクトル系列X0,X1,…,XN-1を時間領域の信号に変換してフレーム単位の音信号を得、それを出力信号として出力した。しかし、これは単なる例示であり、本発明を限定するものではない。例えば、復号装置12,22,32、または逆平滑化装置42が復号スペクトル系列X0,X1,…,XN-1を出力信号として出力してもよい。この場合には復号装置12,22,32、または逆平滑化装置42が時間領域変換部121を備えなくてもよい。すなわち、時間領域変換部121は復号装置12,22,32、または逆平滑化装置42にとって任意的な要素である。復号装置12,22,32、または逆平滑化装置42が復号スペクトル系列X0,X1,…,XN-1の関数値を出力信号として出力してもよい。復号装置12,22,32、または逆平滑化装置42から出力される出力信号がスピーカから再生されることなく、他の処理の入力信号とされてもよい。すなわち、復号装置12,22,32、または逆平滑化装置42から出力される出力信号がスピーカから再生されることも任意的である。
なお、信号平滑化部116の平滑化部116aまたは平滑化装置41の平滑化部116aは、^Xkに対応するLkが正値であるすべての^Xkについて、^Xkの二進数表記における最下位桁からLk桁だけ数値を取り除いたものを平滑化スペクトル値~Xkとし、^Xkに対応するLkが負値であるすべての^Xkについて、予め定めた規則に従って、^Xkの二進数表記における最下位桁に-Lk桁だけ数値を追加したものを平滑化スペクトル値~Xkとするのが望ましい。ただし、信号平滑化部116の平滑化部116aまたは平滑化装置41の平滑化部116aは、^Xkに対応するLkが正値である一部の^Xkについて、^Xkの二進数表記における最下位桁からLk桁だけ数値を取り除かずにそのまま平滑化スペクトル値~Xkとし、^Xkに対応するLkが負値である一部の^Xkについて、予め定めた規則に従って、^Xkの二進数表記における最下位桁に-Lk桁だけ数値を追加せずにそのまま平滑化スペクトル値~Xkとしてもよい。同様に、信号逆平滑化部126の逆平滑化部126aまたは逆平滑化装置42の逆平滑化部126aは、~Xkに対応するLkが負値であるすべての~Xkについて、~Xkの二進数表記における最下位桁から-Lk桁だけ数値を取り除いたものを量子化スペクトル値^Xkとし、~Xkに対応するLkが正値であるすべての~Xkについて、予め定めた規則に従って、~Xkの二進数表記における最下位桁にLk桁だけ数値を追加したものを量子化スペクトル値^Xkとするのが望ましい。ただし、信号逆平滑化部126の逆平滑化部126aまたは逆平滑化装置42の逆平滑化部126aは、~Xkに対応するLkが負値である一部の~Xkについて、~Xkの二進数表記における最下位桁から-Lk桁だけ数値を取り除かずにそのまま量子化スペクトル値^Xkとし、~Xkに対応するLkが正値である一部の~Xkについて、予め定めた規則に従って、~Xkの二進数表記における最下位桁にLk桁だけ数値を追加せずにそのまま量子化スペクトル値^Xkとしてもよい。
時系列信号が音信号以外の時系列信号(例えば、動画信号、地震波信号、生体信号など)であってもよい。すなわち、時系列信号が音信号であることも任意的である。
上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
上記の各装置は、例えば、CPU(central processing unit)等のプロセッサ(ハードウェア・プロセッサ)およびRAM(random-access memory)・ROM(read-only memory)等のメモリ等を備える汎用または専用のコンピュータが所定のプログラムを実行することで構成される。このコンピュータは1個のプロセッサやメモリを備えていてもよいし、複数個のプロセッサやメモリを備えていてもよい。このプログラムはコンピュータにインストールされてもよいし、予めROM等に記録されていてもよい。また、CPUのようにプログラムが読み込まれることで機能構成を実現する電子回路(circuitry)ではなく、プログラムを用いることなく処理機能を実現する電子回路を用いて一部またはすべての処理部が構成されてもよい。1個の装置を構成する電子回路が複数のCPUを含んでいてもよい。
上述の構成をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。このプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体の例は、非一時的な(non-transitory)記録媒体である。このような記録媒体の例は、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等である。
このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。処理の実行時、このコンピュータは、自己の記憶装置に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。
コンピュータ上で所定のプログラムを実行させて本装置の処理機能が実現されるのではなく、これらの処理機能の少なくとも一部がハードウェアで実現されてもよい。
11,21,31,1011 符号化装置
12,22,32,1012 復号装置
41 平滑化装置
42 逆平滑化装置

Claims (20)

  1. 所定時間区間の時系列信号に対応するスペクトル包絡系列の各サンプル値の2底対数に対応する整数値列であり、かつ、総和が0となる整数値列である、対数スペクトル包絡系列L0,L1,…,LN-1と、
    当該対数スペクトル包絡系列を特定可能な符号である包絡符号と、
    を得る対数スペクトル包絡生成部と、
    前記時系列信号の周波数領域スペクトル系列の各サンプル値を量子化して得た量子化スペクトル系列^X0,^X1,…,^XN-1について、
    ^Xk(kはサンプル番号でありk∈{0,…,N-1})に対応するLkが正値である^Xkについて、^Xkの二進数表記における最下位桁からLk桁だけ数値を取り除いたものを平滑化スペクトル値~Xkとし、
    ^Xkに対応するLkが負値である^Xkについて、予め定めた規則に従って、^Xkの二進数表記における最下位桁に-Lk桁だけ数値を追加したものを平滑化スペクトル値~Xkとし、
    ^Xkに対応するLkが0である場合には、^Xkを平滑化スペクトル値~Xkとする
    ことにより、平滑化スペクトル系列~X0,~X1,…,~XN-1を得て、
    前記得た平滑化スペクトル系列~X0,~X1,…,~XN-1の各サンプルを固定長で符号化して信号符号を得るものであり、
    前記予め定めた規則は、取り除いた数値が過不足なく追加する数値となるように、サンプル番号順と桁番号順とに基づいて、定めた規則である
    信号平滑化部と、
    を含む符号化装置。
  2. 請求項1の符号化装置であって、
    前記対数スペクトル包絡生成部は、
    前記対数スペクトル包絡系列の候補と、当該対数スペクトル包絡系列の候補に対応するスペクトル包絡系列の候補と、当該対数スペクトル包絡系列の候補を特定可能な符号と、による組が複数組予め記憶されており、
    前記予め記憶された複数個の組のうち、スペクトル包絡系列の候補が前記所定時間区間の時系列信号に対応するスペクトル包絡系列に対応する組を選択して、当該選択した組の対数スペクトル包絡系列の候補を前記対数スペクトル包絡系列として得、当該選択した組の符号を包絡符号として得る対数包絡符号化部
    を含む符号化装置。
  3. 請求項1の符号化装置であって、
    前記対数スペクトル包絡生成部は、
    前記時系列信号に対応するスペクトル包絡系列と、当該スペクトル包絡系列に対応する包絡符号と、を得、
    前記スペクトル包絡系列の各サンプル値の2底対数に対応する整数値列を得、
    前記整数値列に含まれる値の総和が0である場合には、前記整数値列を前記対数スペクトル包絡系列とし、
    前記整数値列に含まれる値の総和が0でない場合には、予め定めた規則により、調整後の整数値列に含まれる値の総和が0となるように、前記整数値列に含まれる少なくとも一部の整数値を調整し、調整後の整数値列を前記対数スペクトル包絡系列として得る
    ものである
    符号化装置。
  4. 入力された包絡符号を復号し、所定時間区間のスペクトル包絡系列の各サンプル値の2底対数に対応する整数値列であり、かつ、総和が0となる整数値列である対数スペクトル包絡系列L0,L1,…,LN-1を得る対数スペクトル包絡復号部と、
    固定長の符号である信号符号を復号して前記所定時間区間の平滑化スペクトル系列~X0,~X1,…,~XN-1を得、
    前記平滑化スペクトル系列~X0,~X1,…,~XN-1について、
    ~Xk(kはサンプル番号でありk∈{0,…,N-1})に対応するLkが負値である~Xkについて、~Xkの二進数表記における最下位桁から-Lk桁だけ数値を取り除いたものを量子化スペクトル値^Xkとし、
    ~Xkに対応するLkが正値である~Xkについて、予め定めた規則に従って、~Xkの二進数表記における最下位桁にLk桁だけ数値を追加したものを量子化スペクトル値^Xkとし、
    ~Xkに対応するLkが0である場合には、~Xkを量子化スペクトル値^Xkとする
    ことにより、前記所定時間区間の量子化されたスペクトルの系列である量子化スペクトル系列^X0,^X1,…,^XN-1を得るものであり、
    前記予め定めた規則は、取り除いた数値が過不足なく追加する数値となるように、サンプル番号順と桁番号順とに基づいて、定めた規則である
    信号逆平滑化部と、
    を含む復号装置。
  5. 請求項4の復号装置であって、
    前記対数スペクトル包絡復号部は、
    前記対数スペクトル包絡系列の候補と、当該対数スペクトル包絡系列の候補を特定可能な符号と、による組が複数組予め記憶されており、
    前記予め記憶された複数個の組のうち、符号が前記包絡符号に対応する組を選択し、当該選択した組の対数スペクトル包絡系列の候補を前記対数スペクトル包絡系列L0,L1,…,LN-1として得る対数包絡復号部を含む、復号装置。
  6. 請求項4の復号装置であって、
    前記対数スペクトル包絡復号部は、
    前記包絡符号を復号して前記スペクトル包絡系列を得るスペクトル包絡生成部と、
    前記スペクトル包絡系列の各サンプル値の2底対数に対応する整数値列を得、
    前記整数値列に含まれる値の総和が0である場合には、前記整数値列を前記対数スペクトル包絡系列とし、
    前記整数値列に含まれる値の総和が0でない場合には、予め定めた規則により、調整後の整数値列に含まれる値の総和が0となるように、前記整数値列に含まれる少なくとも一部の整数値を調整し、調整後の整数値列を前記対数スペクトル包絡系列として得る対数包絡生成部と、
    を含む復号装置。
  7. 所定時間区間の時系列信号に対応するスペクトル包絡系列の各サンプル値の2底対数に対応する整数値列であり、かつ、総和が0となる整数値列である、対数スペクトル包絡系列L0,L1,…,LN-1を得る対数スペクトル包絡生成部と、
    前記時系列信号の周波数領域スペクトル系列の各サンプル値を量子化して得た量子化スペクトル系列^X0,^X1,…,^XN-1について、
    ^Xk(kはサンプル番号でありk∈{0,…,N-1})に対応するLkが正値である^Xkについて、^Xkの二進数表記における最下位桁からLk桁だけ数値を取り除いたものを平滑化スペクトル値~Xkとし、
    ^Xkに対応するLkが負値である^Xkについて、予め定めた規則に従って、^Xkの二進数表記における最下位桁に-Lk桁だけ数値を追加したものを平滑化スペクトル値~Xkとし、
    ^Xkに対応するLkが0である場合には、^Xkを平滑化スペクトル値~Xkとする
    ことにより、平滑化スペクトル系列~X0,~X1,…,~XN-1を得るものであり、
    前記予め定めた規則は、取り除いた数値が過不足なく追加する数値となるように、サンプル番号順と桁番号順とに基づいて、定めた規則である
    平滑化部と、
    を含む平滑化装置。
  8. 所定時間区間のスペクトル包絡系列の各サンプル値の2底対数に対応する整数値列であり、かつ、総和が0となる整数値列である対数スペクトル包絡系列L0,L1,…,LN-1と、前記所定時間区間の平滑化スペクトル系列~X0,~X1,…,~XN-1と、を入力とし、
    前記平滑化スペクトル系列~X0,~X1,…,~XN-1について、
    ~Xk(kはサンプル番号でありk∈{0,…,N-1})に対応するLkが負値である~Xkについて、~Xkの二進数表記における最下位桁から-Lk桁だけ数値を取り除いたものを量子化スペクトル値^Xkとし、
    ~Xkに対応するLkが正値である~Xkについて、予め定めた規則に従って、~Xkの二進数表記における最下位桁にLk桁だけ数値を追加したものを量子化スペクトル値^Xkとし、
    ~Xkに対応するLkが0である場合には、~Xkを量子化スペクトル値^Xkとする
    ことにより、前記所定時間区間の量子化されたスペクトルの系列である量子化スペクトル系列^X0,^X1,…,^XN-1を得るものであり、
    前記予め定めた規則は、取り除いた数値が過不足なく追加する数値となるように、サンプル番号順と桁番号順とに基づいて、定めた規則である
    逆平滑化部
    を含む逆平滑化装置。
  9. 所定時間区間の時系列信号に対応するスペクトル包絡系列の各サンプル値の2底対数に対応する整数値列であり、かつ、総和が0となる整数値列である、対数スペクトル包絡系列L0,L1,…,LN-1と、
    当該対数スペクトル包絡系列を特定可能な符号である包絡符号と、
    を得る対数スペクトル包絡生成ステップと、
    前記時系列信号の周波数領域スペクトル系列の各サンプル値を量子化して得た量子化スペクトル系列^X0,^X1,…,^XN-1について、
    ^Xk(kはサンプル番号でありk∈{0,…,N-1})に対応するLkが正値である^Xkについて、^Xkの二進数表記における最下位桁からLk桁だけ数値を取り除いたものを平滑化スペクトル値~Xkとし、
    ^Xkに対応するLkが負値である^Xkについて、予め定めた規則に従って、^Xkの二進数表記における最下位桁に-Lk桁だけ数値を追加したものを平滑化スペクトル値~Xkとし、
    ^Xkに対応するLkが0である場合には、^Xkを平滑化スペクトル値~Xkとする
    ことにより、平滑化スペクトル系列~X0,~X1,…,~XN-1を得て、
    前記得た平滑化スペクトル系列~X0,~X1,…,~XN-1の各サンプルを固定長で符号化して信号符号を得るステップであり、
    前記予め定めた規則は、取り除いた数値が過不足なく追加する数値となるように、サンプル番号順と桁番号順とに基づいて、定めた規則である
    信号平滑化ステップと、
    を含む符号化方法。
  10. 入力された包絡符号を復号し、所定時間区間のスペクトル包絡系列の各サンプル値の2底対数に対応する整数値列であり、かつ、総和が0となる整数値列である対数スペクトル包絡系列L0,L1,…,LN-1を得る対数スペクトル包絡復号ステップと、
    固定長の符号である信号符号を復号して前記所定時間区間の平滑化スペクトル系列~X0,~X1,…,~XN-1を得、
    前記平滑化スペクトル系列~X0,~X1,…,~XN-1について、
    ~Xk(kはサンプル番号でありk∈{0,…,N-1})に対応するLkが負値である~Xkについて、~Xkの二進数表記における最下位桁から-Lk桁だけ数値を取り除いたものを量子化スペクトル値^Xkとし、
    ~Xkに対応するLkが正値である~Xkについて、予め定めた規則に従って、~Xkの二進数表記における最下位桁にLk桁だけ数値を追加したものを量子化スペクトル値^Xkとし、
    ~Xkに対応するLkが0である場合には、~Xkを量子化スペクトル値^Xkとする
    ことにより、前記所定時間区間の量子化されたスペクトルの系列である量子化スペクトル系列^X0,^X1,…,^XN-1を得るステップであり、
    前記予め定めた規則は、取り除いた数値が過不足なく追加する数値となるように、サンプル番号順と桁番号順とに基づいて、定めた規則である
    信号逆平滑化ステップと、
    を含む復号方法。
  11. 所定時間区間の時系列信号に対応するスペクトル包絡系列の各サンプル値の2底対数に対応する整数値列であり、かつ、総和が0となる整数値列である、対数スペクトル包絡系列L0,L1,…,LN-1を得る対数スペクトル包絡生成ステップと、
    前記時系列信号の周波数領域スペクトル系列の各サンプル値を量子化して得た量子化スペクトル系列^X0,^X1,…,^XN-1について、
    ^Xk(kはサンプル番号でありk∈{0,…,N-1})に対応するLkが正値である^Xkについて、^Xkの二進数表記における最下位桁からLk桁だけ数値を取り除いたものを平滑化スペクトル値~Xkとし、
    ^Xkに対応するLkが負値である^Xkについて、予め定めた規則に従って、^Xkの二進数表記における最下位桁に-Lk桁だけ数値を追加したものを平滑化スペクトル値~Xkとし、
    ^Xkに対応するLkが0である場合には、^Xkを平滑化スペクトル値~Xkとする
    ことにより、平滑化スペクトル系列~X0,~X1,…,~XN-1を得るステップであり、
    前記予め定めた規則は、取り除いた数値が過不足なく追加する数値となるように、サンプル番号順と桁番号順とに基づいて、定めた規則である
    平滑化ステップと、
    を含む平滑化方法。
  12. 所定時間区間のスペクトル包絡系列の各サンプル値の2底対数に対応する整数値列であり、かつ、総和が0となる整数値列である対数スペクトル包絡系列L0,L1,…,LN-1と、前記所定時間区間の平滑化スペクトル系列~X0,~X1,…,~XN-1と、を入力とし、
    前記平滑化スペクトル系列~X0,~X1,…,~XN-1について、
    ~Xk(kはサンプル番号でありk∈{0,…,N-1})に対応するLkが負値である~Xkについて、~Xkの二進数表記における最下位桁から-Lk桁だけ数値を取り除いたものを量子化スペクトル値^Xkとし、
    ~Xkに対応するLkが正値である~Xkについて、予め定めた規則に従って、~Xkの二進数表記における最下位桁にLk桁だけ数値を追加したものを量子化スペクトル値^Xkとし、
    ~Xkに対応するLkが0である場合には、~Xkを量子化スペクトル値^Xkとする
    ことにより、前記所定時間区間の量子化されたスペクトルの系列である量子化スペクトル系列^X0,^X1,…,^XN-1を得るものであり、
    前記予め定めた規則は、取り除いた数値が過不足なく追加する数値となるように、サンプル番号順と桁番号順とに基づいて、定めた規則である
    逆平滑化ステップ
    を含む逆平滑化方法。
  13. 請求項1から3の何れかの符号化装置としてコンピュータを機能させるためのプログラム。
  14. 請求項4から6の何れかの復号装置としてコンピュータを機能させるためのプログラム。
  15. 請求項7の平滑化装置としてコンピュータを機能させるためのプログラム。
  16. 請求項8の逆平滑化装置としてコンピュータを機能させるためのプログラム。
  17. 請求項1から3の何れかの符号化装置としてコンピュータを機能させるためのプログラムを格納したコンピュータ読み取り可能な記録媒体。
  18. 請求項4から6の何れかの復号装置としてコンピュータを機能させるためのプログラムを格納したコンピュータ読み取り可能な記録媒体。
  19. 請求項7の平滑化装置としてコンピュータを機能させるためのプログラムを格納したコンピュータ読み取り可能な記録媒体。
  20. 請求項8の逆平滑化装置としてコンピュータを機能させるためのプログラムを格納したコンピュータ読み取り可能な記録媒体。
JP2019523392A 2017-06-07 2018-04-24 符号化装置、復号装置、平滑化装置、逆平滑化装置、それらの方法、およびプログラム Active JP6780108B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2017112242 2017-06-07
JP2017112242 2017-06-07
PCT/JP2018/016564 WO2018225412A1 (ja) 2017-06-07 2018-04-24 符号化装置、復号装置、平滑化装置、逆平滑化装置、それらの方法、およびプログラム

Publications (2)

Publication Number Publication Date
JPWO2018225412A1 true JPWO2018225412A1 (ja) 2020-03-19
JP6780108B2 JP6780108B2 (ja) 2020-11-04

Family

ID=64567301

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019523392A Active JP6780108B2 (ja) 2017-06-07 2018-04-24 符号化装置、復号装置、平滑化装置、逆平滑化装置、それらの方法、およびプログラム

Country Status (5)

Country Link
US (1) US11087774B2 (ja)
EP (1) EP3637418B1 (ja)
JP (1) JP6780108B2 (ja)
CN (1) CN110709927B (ja)
WO (1) WO2018225412A1 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016200750A (ja) * 2015-04-13 2016-12-01 日本電信電話株式会社 符号化装置、復号装置、これらの方法及びプログラム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE602004004376T2 (de) * 2004-05-28 2007-05-24 Alcatel Anpassungsverfahren für ein Mehrraten-Sprach-Codec
EP1989707A2 (fr) * 2006-02-24 2008-11-12 France Telecom Procede de codage binaire d'indices de quantification d'une enveloppe d'un signal, procede de decodage d'une enveloppe d'un signal et modules de codage et decodage correspondants
EP2320416B1 (en) * 2008-08-08 2014-03-05 Panasonic Corporation Spectral smoothing device, encoding device, decoding device, communication terminal device, base station device, and spectral smoothing method
US8463603B2 (en) * 2008-09-06 2013-06-11 Huawei Technologies Co., Ltd. Spectral envelope coding of energy attack signal
CN101751926B (zh) * 2008-12-10 2012-07-04 华为技术有限公司 信号编码、解码方法及装置、编解码系统
US9031834B2 (en) * 2009-09-04 2015-05-12 Nuance Communications, Inc. Speech enhancement techniques on the power spectrum
RU2571561C2 (ru) * 2011-04-05 2015-12-20 Ниппон Телеграф Энд Телефон Корпорейшн Способ кодирования, способ декодирования, кодер, декодер, программа и носитель записи
US9552821B2 (en) * 2012-05-30 2017-01-24 Nippon Telegraph And Telephone Corporation Encoding method, encoder, program and recording medium

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016200750A (ja) * 2015-04-13 2016-12-01 日本電信電話株式会社 符号化装置、復号装置、これらの方法及びプログラム

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
BACKSTROM, TOM, ET AL.: "Arithmetic Coding of Speech and Audio Spectra using TCX based on Linear Predictive Spectral Envelope", PROC. ICASSP 2015, JPN6018025661, 19 April 2015 (2015-04-19), AU, pages 5127 - 5131, XP033187738, ISSN: 0004364695, DOI: 10.1109/ICASSP.2015.7178948 *
FERREIRA, ANIBAL J. S.: "Combined Spectral Envelope Normalization and Subtraction of Sinusoidal Components in the ODFT and MD", PROC. 2001 IEEE WORKSHOP ON THE APPLICATIONS OF SIGNAL PROCESSING TO AUDIO AND ACOUSTICS, JPN6018025659, 24 October 2001 (2001-10-24), US, pages 51 - 54, XP010566872, ISSN: 0004364694 *
MORIYA, TAKEHIRO, ET AL.: "Progress in LPC-Based Frequency-Domain Audio Coding", APSIPA TRANSACTIONS ON SIGNAL AND INFORMATION PROCESSING, vol. 5, JPN7018002295, 31 May 2016 (2016-05-31), pages 1 - 10, XP055336101, ISSN: 0004364693, DOI: 10.1017/ATSIP.2016.11 *

Also Published As

Publication number Publication date
WO2018225412A1 (ja) 2018-12-13
EP3637418A1 (en) 2020-04-15
CN110709927B (zh) 2022-11-01
CN110709927A (zh) 2020-01-17
US20200194018A1 (en) 2020-06-18
EP3637418A4 (en) 2021-02-24
US11087774B2 (en) 2021-08-10
EP3637418B1 (en) 2022-03-16
JP6780108B2 (ja) 2020-11-04

Similar Documents

Publication Publication Date Title
US11024319B2 (en) Encoding method, decoding method, encoder, decoder, program, and recording medium
JP6490846B2 (ja) 復号装置、及びその方法、プログラム、記録媒体
JPWO2015146224A1 (ja) 符号化方法、符号化装置、プログラム、および記録媒体
JP4359949B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JP6962268B2 (ja) ピッチ強調装置、その方法、およびプログラム
JP5361565B2 (ja) 符号化方法、復号方法、符号化器、復号器およびプログラム
JP5336942B2 (ja) 符号化方法、復号方法、符号化器、復号器、プログラム
JP5336943B2 (ja) 符号化方法、復号方法、符号化器、復号器、プログラム
JP6780108B2 (ja) 符号化装置、復号装置、平滑化装置、逆平滑化装置、それらの方法、およびプログラム
JP6668532B2 (ja) 復号装置、及びその方法、プログラム、記録媒体
JP6962445B2 (ja) 符号化装置、符号化方法、プログラム、および記録媒体
JP5579932B2 (ja) 符号化方法、装置、プログラム及び記録媒体
JP5786044B2 (ja) 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体
JP5800920B2 (ja) 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体
JP5635213B2 (ja) 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体
WO2013129528A1 (ja) 符号化装置、この方法、プログラムおよび記録媒体

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191118

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191118

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201013

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201014

R150 Certificate of patent or registration of utility model

Ref document number: 6780108

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150