JP4682752B2 - 音声符号化復号装置及び方法、並びに音声復号装置及び方法 - Google Patents

音声符号化復号装置及び方法、並びに音声復号装置及び方法 Download PDF

Info

Publication number
JP4682752B2
JP4682752B2 JP2005240313A JP2005240313A JP4682752B2 JP 4682752 B2 JP4682752 B2 JP 4682752B2 JP 2005240313 A JP2005240313 A JP 2005240313A JP 2005240313 A JP2005240313 A JP 2005240313A JP 4682752 B2 JP4682752 B2 JP 4682752B2
Authority
JP
Japan
Prior art keywords
signal
frequency
decoding
time
conversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005240313A
Other languages
English (en)
Other versions
JP2007057613A (ja
Inventor
志朗 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2005240313A priority Critical patent/JP4682752B2/ja
Publication of JP2007057613A publication Critical patent/JP2007057613A/ja
Application granted granted Critical
Publication of JP4682752B2 publication Critical patent/JP4682752B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、入力された音声信号をいわゆる変換符号化によって符号化して符号列を生成すると共に、その符号列を復号して元の音声信号を復元する音声符号化復号装置及びその方法、並びに音声復号装置及びその方法に関する。
従来より、音声信号の符号化手法は種々知られているが、その1つとして、例えば時間領域の音声信号を周波数領域のスペクトル信号に変換(時間−周波数変換)する、いわゆる変換符号化手法を挙げることができる。
この時間−周波数変換としては、例えば入力された音声信号を所定単位時間(フレーム)毎にブロック化し、当該ブロック毎にDFT(Discrete Fourier Transformation)、DCT(Discrete Cosine Transformation)、或いはMDCT(Modified DCT)などを行うことで時間領域の音声信号を周波数領域のスペクトル信号に変換するものがある。
また、この時間−周波数変換によって生成されたスペクトル信号を符号化する際には、スペクトル信号をある一定幅の周波数帯域に分割し、周波数帯域毎に正規化した後に量子化して符号化する方法がある。周波数帯域分割を行う際の各周波数帯域の幅は、人間の聴覚特性を考慮して決定されることがある。具体的には、スペクトル信号を臨界帯域(クリティカルバンド)と呼ばれる高域ほど広くなるような帯域分割幅で複数(例えば24や32)の周波数帯域に分割することがある。また、各周波数帯域毎に適応的なビット割り当て(ビットアロケーション)を行って符号化することもある。ビット割り当て手法としては、例えば下記非特許文献1に記載されている手法が挙げられる。
この非特許文献1では、周波数帯域毎の各周波数成分の大きさを元にビット割り当てを行っている。この手法では、量子化雑音スペクトルが平坦になり、雑音エネルギが最小になるが、聴覚心理モデルが考慮されていないため、実際の雑音感は最小ではない。
近年では、マスキング効果や等感度曲線といった聴覚心理モデルを利用したビット割り当て手法の採用や符号化効率の向上によって聴覚上の音質が目覚ましく向上しており、その結果、音声信号の圧縮技術が一般化し、通信・メディアにおいて広く用いられるようになっている。
ここで、従来の変換符号化手法は、入力信号がPCM(Pulse Code Modulation)信号であるという前提の下で成り立っている。
PCM信号に対する従来の音声符号化装置、音声復号装置の概略構成を図12、図13に示す。なお、ここでは時間−周波数変換方式としてMDCTを用い、フレーム毎にNサンプルの入力信号に対してN個の周波数成分を得るものとする。
図12に示す音声符号化装置100において、時間−周波数変換部101は、入力した1フレーム当たりNサンプルのPCM信号TをMDCTにより時間−周波数変換し、N個の周波数成分からなるスペクトル信号Sを生成する。量子化・符号化部102は、このスペクトル信号Sの周波数成分を任意の数、任意の精度で量子化・符号化し、符号Cを生成する。マルチプレクサ103は、この符号Cを多重化してビットストリームBを生成し、出力する。
一方、図13に示す音声復号装置110において、デマルチプレクサ111は、ビットストリームBの多重化を解いて符号Cを復元し、復号・逆量子化部112は、この符号Cを復号・逆量子化してスペクトル信号S’を生成する。周波数−時間変換部113は、このスペクトル信号S’をIMDCT(Inverse MDCT)により周波数−時間変換してPCM信号T’を復元し、出力する。
この図12、図13に示す音声符号化装置100、音声復号装置110では、入力されたPCM信号Tを完全に復元することはできない。すなわち、図14(A)、(B)に示すように、入力されたPCM信号Tと復元されたPCM信号T’、或いは時間−周波数変換後のスペクトル信号Sと復号・逆量子化後のスペクトル信号S’との間には誤差が生じている。
そこで、図14(A)に示す誤差信号E(=T−T’)をビットストリームBに含めることにより、入力されたPCM信号Tを完全に復元する方法も知られている。この場合における音声符号化装置、音声復号装置の概略構成を図15、図16に示す。
図15に示す音声符号化装置120において、時間−周波数変換部121は、入力したPCM信号TをMDCTにより時間−周波数変換してスペクトル信号Sを生成し、第1の量子化・符号化部122は、スペクトル信号Sを量子化・符号化して符号C0を生成する。復号・逆量子化部123は、この符号C0を復号・逆量子化してスペクトル信号S’を生成し、周波数−時間変換部124は、このスペクトル信号S’をIMDCTにより周波数−時間変換してPCM信号T’を復元する。減算器125では、入力されたPCM信号Tから復元されたPCM信号T’を減算して誤差信号Eを生成し、第2の量子化・符号化部126は、この誤差信号Eを量子化・符号化して符号C1を生成する。そして、マルチプレクサ127は、符号C0と符号C1とを多重化してビットストリームBを生成し、出力する。
一方、図16に示す音声復号装置130において、デマルチプレクサ131は、ビットストリームBの多重化を解いて符号C0及び符号C1を復元する。第1の復号・逆量子化部132は、符号C0を復号・逆量子化してスペクトル信号S’を生成し、周波数−時間変換部133は、このスペクトル信号S’をIMDCTにより周波数−時間変換してPCM信号T’を復元する。また、第2の復号・逆量子化部134は、符号C1を復号・逆量子化して誤差信号Eを生成する。そして、加算器135は、PCM信号T’と誤差信号Eとを加算して入力信号と等しいPCM信号Tを復元し、出力する。
IEEE Transactions of Acoustics, Speech, and Signal Processing, Vol.ASSP-25, No.4, August 1977
ところで、近年、音声信号の記録方式としてPCM方式以外にもΔΣ変調方式が例えばSACD(Super Audio Compact Disc)において採用されるようになっている。しかしながら、ΔΣ変調方式は、従来のPCM方式と直接的な互換性がないため、お互いの再生装置にて再生する場合には、記録方式の変換作業が発生してしまう。
従来必要とされていたΔΣ変調方式とPCM方式との相互変換作業の一例を図17(A)、(B)に示す。図17(A)は、ΔΣ変調信号及びPCM信号をそれぞれSACD及びCDに記録する際の作業を示したものであり、図17(B)はSACD及びCDにそれぞれ記録されたΔΣ変調信号及びPCM信号を再生する際の作業を示したものである。
図17(A)に示すように、アナログ入力信号は、ΔΣ変調器141において2.8MHz/1ビットのΔΣ変調信号に変換され、SACD142に記録される。また、ΔΣ変調器141において変換され、又はSACD142から読み出された2.8MHz/1ビットのΔΣ変調信号は、デシメーションフィルタ143でダウンサンプリングされることにより44kHz/16ビットのPCM信号に変換され、CD144に記録される。
また、図17(B)に示すように、SACD142から読み出された2.8MHz/1ビットのΔΣ変調信号は、アナログローパスフィルタ145を介してアナログ出力信号として出力される。また、CD144から読み出された44kHz/16ビットのPCM信号は、インターポレーションフィルタ146でオーバーサンプリングされることにより176kHz/24ビットに変換され、ΔΣ変調器147において2.8MHz/1ビットのΔΣ変調信号に変換された後、SACD142に記録されるか、又はアナログローパスフィルタ145を介してアナログ出力信号として出力される。
このように、従来、ΔΣ変調方式とPCM方式との相互変換を行う場合には、デシメーションフィルタやインターポレーションフィルタが必要であり、さらにこれらのフィルタには非常に高い精度が要求され、高い次数のフィルタ係数が必要であるため、作業が複雑化し、コスト高の要因となっていた。
本発明は、このような従来の実情に鑑みて提案されたものであり、相互変換を行うことなく、ΔΣ変調信号及びPCM信号の何れをも再生可能とする音声符号化復号装置及びその方法、並びに音声復号装置及びその方法を提供することを目的とする。
上述した目的を達成するために、本発明に係る音声符号化復号装置は、入力されたΔΣ変調信号に対して時間−周波数変換を施してスペクトル信号を生成する時間−周波数変換手段と、上記時間−周波数変換手段によって生成されたスペクトル信号を量子化及び符号化してビットストリームを生成するスペクトル信号符号化手段と、上記スペクトル信号符号化手段によって生成されたビットストリームを復号及び逆量子化してスペクトル信号を生成するビットストリーム復号手段と、上記ビットストリーム復号手段によって生成されたスペクトル信号に対して周波数−時間変換を施してΔΣ変調信号を生成する周波数−時間変換手段と、上記ビットストリーム復号手段によって生成されたスペクトル信号の低域側の所定の周波数成分に対して周波数−時間変換を施してPCM信号を生成する部分的周波数−時間変換手段とを備えることを特徴とする。
また、本発明に係る音声符号化復号方法は、入力されたΔΣ変調信号に対して時間−周波数変換を施してスペクトル信号を生成する時間−周波数変換工程と、上記時間−周波数変換工程にて生成されたスペクトル信号を量子化及び符号化してビットストリームを生成するスペクトル信号符号化工程と、上記スペクトル信号符号化工程にて生成されたビットストリームを復号及び逆量子化してスペクトル信号を生成するビットストリーム復号工程と、上記ビットストリーム復号工程にて生成されたスペクトル信号に対して周波数−時間変換を施してΔΣ変調信号を生成し、又は上記ビットストリーム復号工程にて生成されたスペクトル信号の低域側の所定の周波数成分に対して周波数−時間変換を施してPCM信号を生成する周波数−時間変換工程とを有することを特徴とする。
また、上述した目的を達成するために、本発明に係る音声復号装置は、入力されたΔΣ変調信号に対して時間−周波数変換を施してスペクトル信号を生成し、該スペクトル信号を量子化及び符号化して生成されたビットストリームを入力し、該ビットストリームを復号及び逆量子化してスペクトル信号を生成するビットストリーム復号手段と、上記ビットストリーム復号手段によって生成されたスペクトル信号に対して周波数−時間変換を施してΔΣ変調信号を生成する周波数−時間変換手段と、上記ビットストリーム復号手段によって生成されたスペクトル信号の低域側の所定の周波数成分に対して周波数−時間変換を施してPCM信号を生成する部分的周波数−時間変換手段とを備えることを特徴とする。
また、本発明に係る音声復号方法は、入力されたΔΣ変調信号に対して時間−周波数変換を施してスペクトル信号を生成し、該スペクトル信号を量子化及び符号化して生成されたビットストリームを入力し、該ビットストリームを復号及び逆量子化してスペクトル信号を生成するビットストリーム復号工程と、上記ビットストリーム復号工程にて生成されたスペクトル信号に対して周波数−時間変換を施してΔΣ変調信号を生成し、又は上記ビットストリーム復号工程にて生成されたスペクトル信号の低域側の所定の周波数成分に対して周波数−時間変換を施してPCM信号を生成する周波数−時間変換工程とを有することを特徴とする。
本発明に係る音声符号化復号装置及びその方法、並びに音声復号装置及びその方法によれば、相互変換を行うことなく、ΔΣ変調信号を符号化したビットストリームからΔΣ変調信号及びPCM信号の何れをも再生することができる。
以下、本発明を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。この実施の形態は、本発明を、時間領域のΔΣ変調信号を周波数領域のスペクトル信号に変換してビットストリームを生成する音声符号化装置、及び、そのビットストリームを復号してΔΣ変調信号を復元すると共に、同じビットストリームからPCM信号を生成する音声復号装置に適用したものである。
先ず、本実施の形態における音声符号化装置、音声復号装置について説明するのに先立って、ΔΣ変調信号を符号化したビットストリームからPCM信号を生成する原理について説明する。
現在、音声信号の記録方式として採用されているΔΣ変調方式は、例えばSACDのように「非常に優れた音質」を訴求する方式として利用されている。この「非常に優れた音質」の本質は、ΔΣ変調方式がもたらす再現周波数の広帯域化ではなく、ノイズシェーピング技術によってノイズを超高域に追いやることで得られる可聴帯域内(約20kHz程度まで)の信号の精度の高さによって得られるものである。以下、この点について説明する。
PCM信号とそのスペクトル分布の一例を図1(A)、(B)に示す。また、ΔΣ変調信号とそのスペクトル分布の一例を図2(A)、(B)に示す。PCM信号のSNR(Signal to Noise Ratio)は全周波数成分に亘って平坦であり(図1(B))、24ビットのPCM信号の場合に約144dB、16ビットのPCM信号の場合に約96dBとなる。一方、ΔΣ変調信号では、ノイズシェーピング技術によってノイズを超高域に追いやる結果、低域の周波数成分のSNRが高域の周波数成分のSNRよりも大きくなっている(図2(B))。
88kHz/24ビットのPCM信号と、2.8MHz/1ビットのΔΣ変調信号とを、SNR及び周波数応答について比較した図を図3に示す。ここで、ビット長を単純に振幅に置き換えてしまうと、ΔΣ変調信号は振幅を1ビット、PCM信号は振幅を24ビットで表現しているため利得が一致せず、図3のような比較はできない。そこで図3では、それぞれの方式の利得を0dBに合わせて、SNR及び周波数応答を比較している。
図3から分かるように、ΔΣ変調信号は1ビット信号であるにも拘わらず、ノイズシェーピング技術によって24ビットのPCM信号をも上回る最大SNRを実現することが可能となっている。つまり、図3における低域の周波数成分が「非常に優れた音質」の本質である。
ここで、図4に示すように、ΔΣ変調信号に対して時間−周波数変換を施したスペクトル信号Sの全周波数成分を、全周波数成分の1/Mに相当する低域の周波数成分Sとそれ以外の周波数成分Sとに便宜的に分けることにする。音声符号化装置において、図5(A)に示すようなΔΣ変調信号を時間−周波数変換したスペクトル信号Sを量子化・符号化してビットストリームBを生成している場合、復元したスペクトル信号S’の低域の周波数成分S'に対して1/Mのサイズの部分的な周波数−時間変換を施した後、振幅を定率のA倍すると、図5(B)に示すようなPCM信号が得られる。元のスペクトル信号Sと低域の周波数成分S'との誤差を図5(C)に示す。このPCM信号を32ビット、或いは64ビットといった非常に高い精度で復元・再生すれば、例えば24ビットのPCM信号よりも高音質を実現することができる。
以上がΔΣ変調信号を符号化したビットストリームからPCM信号を生成する原理である。
次に、本実施の形態における音声符号化装置、音声復号装置について説明する。本実施の形態における音声符号化装置、音声復号装置の概略構成を図6、7に示す。なお、ここでは時間−周波数変換方式としてMDCTを用い、フレーム毎にNサンプルの入力信号に対してN個の周波数成分を得るものとする。
図6に示す音声符号化装置10において、時間−周波数変換部11は、入力した1フレーム当たりNサンプルのΔΣ変調信号TΔΣに対してMDCTにより時間−周波数変換を施し、N個の周波数成分からなるスペクトル信号Sを生成する。量子化・符号化部12は、このスペクトル信号Sの周波数成分を任意の数、任意の精度で量子化・符号化し、符号Cを生成する。マルチプレクサ13は、この符号Cを多重化してビットストリームBを生成し、出力する。
一方、図7に示す音声復号装置20において、デマルチプレクサ21は、ビットストリームBの多重化を解いて符号Cを復元し、復号・逆量子化部22は、この符号Cを復号・逆量子化してスペクトル信号S’を生成する。周波数−時間変換部23は、このスペクトル信号S’に対してIMDCTにより周波数−時間変換を施して1フレーム当たりNサンプルのΔΣ変調信号T'ΔΣを復元し、出力する。また、周波数選択部24は、スペクトル信号S’の1/Mに相当する低域の周波数成分S'を選択し、部分的周波数−時間変換部25は、この低域の周波数成分S'に対して1/Mのサイズの部分的周波数−時間変換を施し、乗算器26は、信号の振幅をA倍して1フレーム当たりN/MサンプルのPCM信号T'PCMを生成し、出力する。
このように、音声復号装置20では、ΔΣ変調信号TΔΣを符号化したビットストリームBを復号してΔΣ変調信号T'ΔΣを復元すると共に、同じビットストリームBからPCM信号T'PCMを生成することができる。
ΔΣ変調信号を符号化したビットストリームを記録媒体に記録すると共に、記録媒体に記録されたビットストリームからΔΣ変調信号及びPCM信号を再生する様子を図8(A)、(B)に示す。なお、この図8においてM=64とする。
図8(A)に示すように、ΔΣ変調器31は、アナログ入力信号を2.8MHz/1ビットのΔΣ変調信号に変換し、音声符号化装置10は、このΔΣ変調信号を符号化してビットストリームを生成し、記録媒体32に記録する。
また、図8(B)に示すように、音声復号装置20は、記録媒体32から読み出したビットストリームから2.8MHz/1ビットのΔΣ変調信号を復元し、アナログローパスフィルタ33を介してアナログ出力信号として出力する。また、音声復号装置20は、記録媒体32から読み出したビットストリームから44kHz/16ビットのPCM信号を生成し、マルチビットD/A(Digital/Analog)変換器34を介してアナログ出力信号として出力する。
このように、本実施の形態における音声符号化装置10、音声復号装置20を用いれば、従来のようにデシメーションフィルタやインターポレーションフィルタを用いた相互変換作業が必要ないため、作業を簡略化し、コストを抑えることができる。
ところで、音声復号装置10においてスペクトル信号Sが必要十分な精度で記録されている場合には、音声復号装置20において元のΔΣ変調信号TΔΣを完全に復元することができるが、スペクトル信号Sが必要十分な精度で記録されていない場合には、音声復号装置20において復元されるΔΣ変調信号T'ΔΣは、元のΔΣ変調信号TΔΣとは完全には一致しないことがある。
すなわち、図9(A)に示すように、元のΔΣ変調信号TΔΣは0/1の2値信号であるが、音声復号装置20における時間−周波数変換は小数点精度で行うため、時間−周波数変換後のΔΣ変調信号T''ΔΣの信号の状態は図9(B)に示すように小数点値である。音声復号装置20の出力は0/1の2値信号であるべきであるため、図9(C)に示すように小数点値が整数値に丸められ、ΔΣ変調信号T'ΔΣとなるが、スペクトル信号Sの記録精度が十分でないと、図9(D)に示すようにTΔΣとT'ΔΣとの間には誤差が発生する。
そこで、図9(D)に示す誤差信号EΔΣ(=TΔΣ−T'ΔΣ)をビットストリームBに含めることにより、元のΔΣ変調信号TΔΣを完全に復元するようにしても構わない。この場合における音声符号化装置、音声復号装置の概略構成を図10、図11に示す。
図10に示す音声符号化装置40において、時間−周波数変換部41は、入力したΔΣ変調信号TΔΣに対してMDCTにより時間−周波数変換を施してスペクトル信号Sを生成し、第1の量子化・符号化部42は、スペクトル信号Sを量子化・符号化して符号C0を生成する。復号・逆量子化部43は、この符号C0を復号・逆量子化してスペクトル信号S’を生成し、周波数−時間変換部44は、このスペクトル信号S’に対してIMDCTにより周波数−時間変換を施してΔΣ変調信号T'ΔΣを復元する。減算器45では、入力したΔΣ変調信号TΔΣから復元したΔΣ変調信号T'ΔΣを減算して誤差信号EΔΣを生成し、第2の量子化・符号化部46は、この誤差信号EΔΣを量子化・符号化して符号C1を生成する。そして、マルチプレクサ47は、符号C0と符号C1とを多重化してビットストリームBを生成し、出力する。
一方、図11に示す音声復号装置50において、デマルチプレクサ51は、ビットストリームBの多重化を解いて符号C0及び符号C1を復元する。第1の復号・逆量子化部52は、符号C0を復号・逆量子化してスペクトル信号S’を生成し、周波数−時間変換部53は、このスペクトル信号S’に対してIMDCTにより周波数−時間変換を施してΔΣ変調信号T'ΔΣを復元する。また、第2の復号・逆量子化部54は、符号C1を復号・逆量子化して誤差信号EΔΣを生成する。そして、加算器55は、ΔΣ変調信号T'ΔΣと誤差信号EΔΣとを加算して入力信号と等しいΔΣ変調信号TΔΣを復元し、出力する。また、周波数選択部56は、スペクトル信号S’の1/Mに相当する低域の周波数成分S'を選択する。部分的周波数−時間変換部57は、この低域の周波数成分S'に対して1/Mのサイズの部分的周波数−時間変換を施し、乗算器58は、信号の振幅をA倍して1フレーム当たりN/MサンプルのPCM信号T'PCMを生成し、出力する。
なお、本発明は上述した実施の形態のみに限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能であることは勿論である。
例えば、上述した実施の形態では、音声符号化装置10において、スペクトル信号Sの全周波数成分を量子化・符号化するものとして説明したが、低域の周波数成分Sのみを量子化・符号化するようにしても構わない。低域の周波数成分Sが高精度に記録されていれば、それ以外の周波数成分Sが存在しなくても、復元されたΔΣ変調信号T'ΔΣは聴覚上十分に高い音質を実現することができる。
また、上述した実施の形態では、ハードウェアの構成として説明したが、これに限定されるものではなく、任意の処理を、CPU(Central Processing Unit)にコンピュータプログラムを実行させることにより実現することも可能である。この場合、コンピュータプログラムは、記録媒体に記録して提供することも可能であり、また、インターネットその他の伝送媒体を介して伝送することにより提供することも可能である。
PCM信号とそのスペクトル分布の一例を示す図である。 ΔΣ変調信号とそのスペクトル分布の一例を示す図である。 PCM信号とΔΣ変調信号とをSNR及び周波数応答について比較した図である。 ΔΣ変調信号の全周波数成分Sを、全周波数成分Sの1/Mに相当する低域の周波数成分Sとそれ以外の周波数成分Sとに分けた図である。 ΔΣ変調信号からPCM信号を生成する方法を説明する図である。 本実施の形態における音声符号化装置の概略構成を示す図である。 図6に対応した音声復号装置の概略構成を示す図である。 ΔΣ変調信号を符号化したビットストリームを記録媒体に記録すると共に、記録媒体に記録されたビットストリームからΔΣ変調信号及びPCM信号を再生する様子を示す図である。 入力されたΔΣ変調信号TΔΣと復元されたΔΣ変調信号T'ΔΣとの間の誤差を示す図である。 入力されたΔΣ変調信号TΔΣを完全に復元する音声符号化装置の概略構成を示す図である。 図10に対応した音声復号装置の概略構成を示す図である。 PCM信号に対する従来の音声符号化装置の概略構成を示す図である。 図12に対応した従来の音声復号装置の概略構成を示す図である。 入力されたPCM信号Tと復元されたPCM信号T’、時間−周波数変換後のスペクトル信号と復号・逆量子化後のスペクトル信号S’との間の誤差を示す図である。 入力されたPCM信号Tを完全に復元する従来の音声符号化装置の概略構成を示す図である。 図15に対応した従来の音声復号装置の概略構成を示す図である。 ΔΣ変調方式とPCM方式との相互変換作業の一例を示す図である。
符号の説明
10 音声符号化装置、11 時間−周波数変換部、12 量子化・符号化部、13 マルチプレクサ、20 音声復号装置、21 デマルチプレクサ、22 復号・逆量子化部、23 周波数−時間変換部、24 周波数選択部、25 部分的周波数−時間変換部、26 乗算器、40 音声符号化装置、41 時間−周波数変換部、42 第1の量子化・符号化部、43 復号・逆量子化部、44 周波数−時間変換部、45 減算器、46 第2の量子化・符号化部、47 マルチプレクサ、50 音声復号装置、51 デマルチプレクサ、52 第1の復号・逆量子化部、53 周波数−時間変換部、54 第2の復号・逆量子化部、55 加算器、56 周波数選択部、57 部分的周波数−時間変換部、58 乗算器

Claims (8)

  1. 入力されたΔΣ変調信号に対して時間−周波数変換を施してスペクトル信号を生成する時間−周波数変換手段と、
    上記時間−周波数変換手段によって生成されたスペクトル信号を量子化及び符号化してビットストリームを生成するスペクトル信号符号化手段と、
    上記スペクトル信号符号化手段によって生成されたビットストリームを復号及び逆量子化してスペクトル信号を生成するビットストリーム復号手段と、
    上記ビットストリーム復号手段によって生成されたスペクトル信号に対して周波数−時間変換を施してΔΣ変調信号を生成する周波数−時間変換手段と、
    上記ビットストリーム復号手段によって生成されたスペクトル信号の低域側の所定の周波数成分に対して周波数−時間変換を施してPCM信号を生成する部分的周波数−時間変換手段と
    を備えることを特徴とする音声符号化復号装置。
  2. 上記スペクトル信号符号化手段によって生成されたビットストリームを復号及び逆量子化し、さらに周波数−時間変換を施して生成されたΔΣ変調信号を、上記入力されたΔΣ変調信号から減算することにより誤差信号を生成する減算手段と、
    上記減算手段によって生成された誤差信号を量子化及び符号化する誤差信号符号化手段と、
    上記誤差信号符号化手段によって量子化及び符号化された上記誤差信号を上記ビットストリームに多重化する多重化手段と、
    上記ビットストリームから上記誤差信号を分離する分離手段と、
    上記分離手段によって分離された上記誤差信号を復号及び逆量子化する誤差信号復号手段と、
    上記周波数−時間変換手段によって生成されたΔΣ変調信号と、上記誤差信号復号手段によって復号及び逆量子化された上記誤差信号とを加算する加算手段と
    をさらに備えることを特徴とする請求項1記載の音声信号符号化復号装置。
  3. 上記スペクトル信号符号化手段は、上記時間−周波数変換手段によって生成されたスペクトル信号の低域側の所定の周波数成分を量子化及び符号化してビットストリームを生成することを特徴とする請求項1記載の音声信号符号化復号装置。
  4. 入力されたΔΣ変調信号に対して時間−周波数変換を施してスペクトル信号を生成する時間−周波数変換工程と、
    上記時間−周波数変換工程にて生成されたスペクトル信号を量子化及び符号化してビットストリームを生成するスペクトル信号符号化工程と、
    上記スペクトル信号符号化工程にて生成されたビットストリームを復号及び逆量子化してスペクトル信号を生成するビットストリーム復号工程と、
    上記ビットストリーム復号工程にて生成されたスペクトル信号に対して周波数−時間変換を施してΔΣ変調信号を生成し、又は上記ビットストリーム復号工程にて生成されたスペクトル信号の低域側の所定の周波数成分に対して周波数−時間変換を施してPCM信号を生成する周波数−時間変換工程と
    を有することを特徴とする音声符号化復号方法。
  5. 入力されたΔΣ変調信号に対して時間−周波数変換を施してスペクトル信号を生成し、該スペクトル信号を量子化及び符号化して生成されたビットストリームを入力し、該ビットストリームを復号及び逆量子化してスペクトル信号を生成するビットストリーム復号手段と、
    上記ビットストリーム復号手段によって生成されたスペクトル信号に対して周波数−時間変換を施してΔΣ変調信号を生成する周波数−時間変換手段と、
    上記ビットストリーム復号手段によって生成されたスペクトル信号の低域側の所定の周波数成分に対して周波数−時間変換を施してPCM信号を生成する部分的周波数−時間変換手段と
    を備えることを特徴とする音声復号装置。
  6. 上記ビットストリームには、該ビットストリームを復号及び逆量子化し、さらに周波数−時間変換を施して生成されたΔΣ変調信号を、上記入力されたΔΣ変調信号から減算することにより生成された誤差信号が、量子化及び符号化されて多重化されており、
    上記ビットストリームから上記誤差信号を分離する分離手段と、
    上記分離手段によって分離された上記誤差信号を復号及び逆量子化する誤差信号復号手段と、
    上記周波数−時間変換手段によって生成されたΔΣ変調信号と、上記誤差信号復号手段によって復号及び逆量子化された上記誤差信号とを加算する加算手段と
    をさらに備えることを特徴とする請求項5記載の音声信号復号装置。
  7. 上記ビットストリームは、時間−周波数変換によって生成されたスペクトル信号の低域側の所定の周波数成分を量子化及び符号化して生成されたものであることを特徴とする請求項5記載の音声信号復号装置。
  8. 入力されたΔΣ変調信号に対して時間−周波数変換を施してスペクトル信号を生成し、該スペクトル信号を量子化及び符号化して生成されたビットストリームを入力し、該ビットストリームを復号及び逆量子化してスペクトル信号を生成するビットストリーム復号工程と、
    上記ビットストリーム復号工程にて生成されたスペクトル信号に対して周波数−時間変換を施してΔΣ変調信号を生成し、又は上記ビットストリーム復号工程にて生成されたスペクトル信号の低域側の所定の周波数成分に対して周波数−時間変換を施してPCM信号を生成する周波数−時間変換工程と
    を有することを特徴とする音声復号方法。
JP2005240313A 2005-08-22 2005-08-22 音声符号化復号装置及び方法、並びに音声復号装置及び方法 Expired - Fee Related JP4682752B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005240313A JP4682752B2 (ja) 2005-08-22 2005-08-22 音声符号化復号装置及び方法、並びに音声復号装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005240313A JP4682752B2 (ja) 2005-08-22 2005-08-22 音声符号化復号装置及び方法、並びに音声復号装置及び方法

Publications (2)

Publication Number Publication Date
JP2007057613A JP2007057613A (ja) 2007-03-08
JP4682752B2 true JP4682752B2 (ja) 2011-05-11

Family

ID=37921211

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005240313A Expired - Fee Related JP4682752B2 (ja) 2005-08-22 2005-08-22 音声符号化復号装置及び方法、並びに音声復号装置及び方法

Country Status (1)

Country Link
JP (1) JP4682752B2 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09261066A (ja) * 1996-03-27 1997-10-03 Matsushita Electric Ind Co Ltd ロスレス符号装置とロスレス記録媒体とロスレス復号装置とロスレス符号復号装置
JP2000254121A (ja) * 1999-03-12 2000-09-19 Ge Yokogawa Medical Systems Ltd 受信信号形成方法および装置並びに超音波撮像方法および装置
JP2003280694A (ja) * 2002-03-26 2003-10-02 Nec Corp 階層ロスレス符号化復号方法、階層ロスレス符号化方法、階層ロスレス復号方法及びその装置並びにプログラム
JP2004102186A (ja) * 2002-09-12 2004-04-02 Matsushita Electric Ind Co Ltd 音響符号化装置及び音響符号化方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09261066A (ja) * 1996-03-27 1997-10-03 Matsushita Electric Ind Co Ltd ロスレス符号装置とロスレス記録媒体とロスレス復号装置とロスレス符号復号装置
JP2000254121A (ja) * 1999-03-12 2000-09-19 Ge Yokogawa Medical Systems Ltd 受信信号形成方法および装置並びに超音波撮像方法および装置
JP2003280694A (ja) * 2002-03-26 2003-10-02 Nec Corp 階層ロスレス符号化復号方法、階層ロスレス符号化方法、階層ロスレス復号方法及びその装置並びにプログラム
JP2004102186A (ja) * 2002-09-12 2004-04-02 Matsushita Electric Ind Co Ltd 音響符号化装置及び音響符号化方法

Also Published As

Publication number Publication date
JP2007057613A (ja) 2007-03-08

Similar Documents

Publication Publication Date Title
JP3926726B2 (ja) 符号化装置および復号化装置
JP4786903B2 (ja) 低ビットレートオーディオコーディング
JP4640020B2 (ja) 音声符号化装置及び方法、並びに音声復号装置及び方法
CN103765509B (zh) 编码装置及方法、解码装置及方法
KR101237413B1 (ko) 오디오 신호의 부호화 및 복호화 방법, 오디오 신호의부호화 및 복호화 장치
JP5215994B2 (ja) 損失エンコ−ドされたデータ列および無損失拡張データ列を用いた、原信号の無損失エンコードのための方法および装置
JP4570250B2 (ja) 信号の量子化変換係数をエントロピーエンコードするシステムと方法
JP2006011456A (ja) 低ビット率符号化/復号化方法及び装置並びにコンピュータ可読媒体
KR20080005325A (ko) 적응적 부호화/복호화 방법 및 장치
USRE46082E1 (en) Method and apparatus for low bit rate encoding and decoding
JPH09204197A (ja) 周波数領域内のlpc予測による時間領域内での知覚ノイズ整形
WO1994028633A1 (fr) Appareil et procede de codage ou decodage de signaux, et support d'enregistrement
WO1999003096A1 (fr) Procede et dispositif de codage et decodage d'informations et support de distribution
KR20080025636A (ko) 대역폭 확장 기법을 이용한 오디오 신호의 부호화/복호화방법 및 장치
JPH1084284A (ja) 信号再生方法および装置
JP3900000B2 (ja) 符号化方法及び装置、復号方法及び装置、並びにプログラム
JP2003523535A (ja) 複数のデータ圧縮フォーマット間でのオーディオ信号の変換方法及び装置
KR100952065B1 (ko) 부호화 방법 및 장치, 및 복호 방법 및 장치
JP2006293400A (ja) 符号化装置および復号化装置
WO1999044291A1 (fr) Dispositif et procede de codage, dispositif et procede de decodage, support d'enregistrement de programme et de donnees
KR100668299B1 (ko) 구간별 선형양자화를 이용한 디지털 신호 부호화/복호화방법 및 장치
JP4682752B2 (ja) 音声符号化復号装置及び方法、並びに音声復号装置及び方法
KR100754389B1 (ko) 음성 및 오디오 신호 부호화 장치 및 방법
JPH1083623A (ja) 信号記録方法、信号記録装置、記録媒体および信号処理方法
JP2003280691A (ja) 音声処理方法および音声処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080808

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101129

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110111

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110124

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140218

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 4682752

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140218

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees