JP2006211243A - ディジタル信号符号化装置,ディジタル信号符号化方法 - Google Patents
ディジタル信号符号化装置,ディジタル信号符号化方法 Download PDFInfo
- Publication number
- JP2006211243A JP2006211243A JP2005020000A JP2005020000A JP2006211243A JP 2006211243 A JP2006211243 A JP 2006211243A JP 2005020000 A JP2005020000 A JP 2005020000A JP 2005020000 A JP2005020000 A JP 2005020000A JP 2006211243 A JP2006211243 A JP 2006211243A
- Authority
- JP
- Japan
- Prior art keywords
- encoding
- prediction
- digital signal
- signal
- prediction coefficient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【課題】予測器による可逆符号化だけでなく,予測器を用いない他の可逆符号化を併用することで,音声信号等に限らず,測定データ等のランダム信号に対しても高い圧縮率の符号化を可能とすること。
【解決手段】 減算器212により算出された残差信号と該残差信号の算出に使用された予測信号を予測する際に適用された予測係数を特定する予測係数特定情報とを符号化する符合器203−1〜203−3と,バッファ201により取得された所定サンプル数のディジタル信号を予測器202を介さずに符号化する符号器203−0と,前記符合器203−1〜203−3および前記符号器203−0により得られる符号の符号長に基づいて,前記符合器203−1〜203−3および前記符号器203−0のいずれか一を選択する符号長計算/選択器204とを備える。
【選択図】図1
【解決手段】 減算器212により算出された残差信号と該残差信号の算出に使用された予測信号を予測する際に適用された予測係数を特定する予測係数特定情報とを符号化する符合器203−1〜203−3と,バッファ201により取得された所定サンプル数のディジタル信号を予測器202を介さずに符号化する符号器203−0と,前記符合器203−1〜203−3および前記符号器203−0により得られる符号の符号長に基づいて,前記符合器203−1〜203−3および前記符号器203−0のいずれか一を選択する符号長計算/選択器204とを備える。
【選択図】図1
Description
本発明は,入力されるディジタル信号を可逆符号化する符号化技術に係り,特に,符号長の異なる予測係数が適用される予測器を複数備え,それら予測器から最適な予測器を選択することで前記ディジタル信号の高効率な圧縮を実現するディジタル信号符号化装置並びにディジタル信号符号化方法に関する。
近年,音声信号やオーディオ信号等のディジタル信号の冗長性を利用して符号化することでデータ量を圧縮し,ディジタル信号の記録/再生,或いは送受信に関する効率を向上させる技術が数多く開発されている。
これらの技術は,大別すると非可逆符号化(非可逆圧縮)と可逆符号化(可逆圧縮)に分けられる。
前者は,圧縮されたデータを復号しても,圧縮前のデータを完全に復元することはできず,MP3やAAC方式に代表されるようにデータの圧縮による聴覚的劣化を伴うものの,比較的高い圧縮率(1/10以下程度でも聴覚上大きな問題がない)の符号化が可能なものである。
一方,後者は,ロスレス符号化とも呼ばれ,圧縮(符号化)前の信号の完全復元が可能であるため聴覚的劣化は生じないが,比較的低い圧縮率(符号化される音声データによるが,概ね1/2程度)の符号化しかできないものである。
そのため,特にメモリ容量に制限のある携帯端末等を用いて前記音声信号を記録,再生するといった使用状況では,その圧縮率の優位性から,非可逆符号化が利用されることが多い。
これらの技術は,大別すると非可逆符号化(非可逆圧縮)と可逆符号化(可逆圧縮)に分けられる。
前者は,圧縮されたデータを復号しても,圧縮前のデータを完全に復元することはできず,MP3やAAC方式に代表されるようにデータの圧縮による聴覚的劣化を伴うものの,比較的高い圧縮率(1/10以下程度でも聴覚上大きな問題がない)の符号化が可能なものである。
一方,後者は,ロスレス符号化とも呼ばれ,圧縮(符号化)前の信号の完全復元が可能であるため聴覚的劣化は生じないが,比較的低い圧縮率(符号化される音声データによるが,概ね1/2程度)の符号化しかできないものである。
そのため,特にメモリ容量に制限のある携帯端末等を用いて前記音声信号を記録,再生するといった使用状況では,その圧縮率の優位性から,非可逆符号化が利用されることが多い。
しかしながら,プログラムや文字データなどはデータが1ビットでも欠落すると異なる結果となることから,これらのデータを圧縮する場合は必ず可逆符号化が用いられる。また,オーディオ分野においても,高性能なオーディオ製品には非可逆符号化による音質劣化さえも許容できないものもある。更に,昨今の計測器分野では,複数チャンネルでセンサ等の出力信号(電圧,電流値等)を長時間計測するような計測装置(データロガー等)にも圧縮技術が用いられるようになってきており,かかる装置で計測された計測データも前記プログラムと同様に圧縮前後におけるデータの欠落は許されないため可逆符号化が採用されている。このように,圧縮前の信号と全く同一の信号が得られる可逆符号化に対するニーズは益々強くなる傾向にあり,その技術的課題となっている圧縮率を向上させる技術の開発が強く望まれている。
そこで,可逆符号化における圧縮率を向上する技術として,特許文献1に提案される音声符号化装置がある。この装置は,特性の異なる(つまりは,適用される予測係数が異なる)複数の予測器により入力された音声信号を予測し,その予測結果に基づいて(つまりは,残差信号を最小とする)それら複数の予測器のうち一つを選択し,その選択された予測器からの出力信号(即ち,残差信号)と該予測器(即ち,予測係数)を特定する信号とを符号化した後に出力するよう構成されている。このように構成された音声符号化装置によれば,音声信号に応じて最適な(即ち,残差信号を最小とし得る)予測器(予測係数)が選択されるため,音声信号を予測する予測精度を向上させることが可能となり,ひいては,符号化後の圧縮率の向上に寄与し得る。
しかしながら,前記特許文献1の音声符号化装置では,特性の異なる複数の予測器を有するものの,各予測器における予測係数は固定長(一定)であることを前提としており,符号化後の音声信号の符号長を最小にするという観点からすれば,必ずしも最適な予測器が選択されているとは言い難い。言い換えれば,予測器による予測精度を向上させるという観点では,予測係数の係数を変更するだけでなく,各予測器毎の予測係数の次数を変える,或いは各予測器毎の予測方式を変える等,各予測器毎の予測係数の符号長を可変長にする方が有利であるが,前記特許文献1の技術では,各予測器の予測係数は固定長であることが前提とならざるを得ず,予測係数の符号長の異なる予測器を適用し,更なる圧縮率の向上を図ることは不可能であった。
しかしながら,前記特許文献1の音声符号化装置では,特性の異なる複数の予測器を有するものの,各予測器における予測係数は固定長(一定)であることを前提としており,符号化後の音声信号の符号長を最小にするという観点からすれば,必ずしも最適な予測器が選択されているとは言い難い。言い換えれば,予測器による予測精度を向上させるという観点では,予測係数の係数を変更するだけでなく,各予測器毎の予測係数の次数を変える,或いは各予測器毎の予測方式を変える等,各予測器毎の予測係数の符号長を可変長にする方が有利であるが,前記特許文献1の技術では,各予測器の予測係数は固定長であることが前提とならざるを得ず,予測係数の符号長の異なる予測器を適用し,更なる圧縮率の向上を図ることは不可能であった。
そこで,このような問題を解決する手法として,本願出願人が先に出願した特許文献2に記載の音声符号化装置(音声符号化方法)がある。この装置は,固定長の予測係数ではなく,例えばフレームデータに応じて適宜算出される異なる予測係数が各予測器に割り当てられ,各予測器では各々の予測係数に基づいて入力された音声信号を予測し,そして,各々の予測器から出力される様々なパターンの複数の符号長を比較して,最小の符号長を出力する予測器を選択するよう構成されている。このような構成により,音声信号の予測精度を向上させ,その結果として,圧縮率を高めている。
特開2001−175295号公報
特開2004−170494号公報
しかしながら,前記各特許文献に記載の音声符号化装置は,音声信号,オーディオ信号などのように,ある程度その発音メカニズム(音声波形等)の推測が可能な信号に対しては,十分な予測精度(予測性能)を得ることができるが,音声信号,オーディオ信号などとは異なり,信号波形を推測できないような信号,例えば計測データ或いはこの計測信号に含まれるノイズ等のランダム雑音などのランダム信号に対しては,予測器による信号の予測が十分にできない場合があり,期待するほどの圧縮効果が得られない場合があり得る。その一方で,前記ランダム信号に限っては,予測器を用いない他の可逆符号化を用いた方が高い圧縮率を実現する場合もあり得る。
そこで,本発明は,前記事情に鑑みてなされたものであり,その目的とするところは,予測器による可逆符号化だけでなく,予測器を用いない他の可逆符号化を併用することで,音声信号等に限らず,測定データ等のランダム信号に対しても高い圧縮率の符号化を可能とするディジタル信号符号化装置並びにディジタル信号符号化方法を提供することにある。
そこで,本発明は,前記事情に鑑みてなされたものであり,その目的とするところは,予測器による可逆符号化だけでなく,予測器を用いない他の可逆符号化を併用することで,音声信号等に限らず,測定データ等のランダム信号に対しても高い圧縮率の符号化を可能とするディジタル信号符号化装置並びにディジタル信号符号化方法を提供することにある。
前記目的を達成するために,本発明は,入力されるディジタル信号を可逆符号化するディジタル信号符号化装置であって,入力される前記ディジタル信号を所定サンプル数毎に取得するサンプル取得手段と,複数の予測係数が適用され,それぞれの予測係数により過去のディジタル信号から現在の前記ディジタル信号の予測信号を予測する少なくとも一の予測手段と,前記予測手段により予測された予測信号と前記サンプル取得手段により現実に取得された所定サンプル数の現在のディジタル信号との間の残差信号を算出する少なくとも一の残差信号算出手段と,前記残差信号算出手段により算出された残差信号と該残差信号の算出に使用された前記予測信号を予測する際に適用された前記予測係数を特定する予測係数特定情報とを符号化する少なくとも一の第1の符号化手段と,前記サンプル取得手段により取得された所定サンプル数のディジタル信号を前記予測手段を介さずに符号化する第2の符号化手段と,前記第1の符号化手段および前記第2の符号化手段により得られる符号の符号長に基づいて,前記第1の符号化手段および前記第2の符号化手段のいずれか一を選択する符号化選択手段と,を具備してなることを特徴とするディジタル信号符号化装置として構成される。
このように構成されることにより,予測器(予測手段)を用いた符号化では十分な圧縮効果を得られないランダム信号等のディジタル信号であっても,高い圧縮率で符号化することが可能となる。
また,前記サンプル取得手段により取得された所定サンプル数のディジタル信号の有効ビット数を検出する有効ビット数検出手段を更に備え,前記第2の符号化手段が,前記有効ビット数検出手段により検出された有効ビット数と該有効ビット数を特定する有効ビット数特定情報とを符号化するものであることが望ましい。例えばフレームデータ中の有効ビットレンジが分かれば他のビットレンジは情報として必要ないため,当該フレームデータを有効ビットレンジ分のデータに圧縮することができる。もちろん,このような符号化(圧縮)は前記第2の符号化手段の一例であって,予測器を用いない符号化であれば他の種々の符号化を適用することが可能である。
このように構成されることにより,予測器(予測手段)を用いた符号化では十分な圧縮効果を得られないランダム信号等のディジタル信号であっても,高い圧縮率で符号化することが可能となる。
また,前記サンプル取得手段により取得された所定サンプル数のディジタル信号の有効ビット数を検出する有効ビット数検出手段を更に備え,前記第2の符号化手段が,前記有効ビット数検出手段により検出された有効ビット数と該有効ビット数を特定する有効ビット数特定情報とを符号化するものであることが望ましい。例えばフレームデータ中の有効ビットレンジが分かれば他のビットレンジは情報として必要ないため,当該フレームデータを有効ビットレンジ分のデータに圧縮することができる。もちろん,このような符号化(圧縮)は前記第2の符号化手段の一例であって,予測器を用いない符号化であれば他の種々の符号化を適用することが可能である。
前記予測手段における予測係数の一例としては,前記サンプル取得手段で取得された所定サンプル数の前記音声信号から線形予測分析により計算された予測係数が考えられる。
また,前記予測手段における予測係数の他の例としては,前記サンプル取得手段で取得された所定サンプル数の前記音声信号から線形予測分析により計算された予測係数を基にベクトル量子化した予測係数が考えられる。
前記予測手段における予測係数の別の例としては,前記符合化選択手段により過去に選択された第1の符合化手段で用いられた前記予測係数が考えられる。
また,前記予測手段における予測係数の他の例としては,前記サンプル取得手段で取得された所定サンプル数の前記音声信号から線形予測分析により計算された予測係数を基にベクトル量子化した予測係数が考えられる。
前記予測手段における予測係数の別の例としては,前記符合化選択手段により過去に選択された第1の符合化手段で用いられた前記予測係数が考えられる。
尚,前述構成の音声符号化装置に適用される音声符号化方法として捉えることで,本発明は,入力されるディジタル信号を可逆符号化するディジタル信号符号化方法であって,入力される前記ディジタル信号を所定サンプル数毎に取得するサンプル取得工程と,複数の予測係数が適用され,それぞれの予測係数により過去のディジタル信号から現在の前記ディジタル信号の予測信号を予測する少なくとも一の予測工程と,前記予測工程により予測された予測信号と前記サンプル取得工程により現実に取得された所定サンプル数の現在のディジタル信号との間の残差信号を算出する少なくとも一の残差信号算出工程と,前記残差信号算出工程により算出された残差信号と該残差信号の算出に使用された前記予測信号を予測する際に適用された前記予測係数を特定する予測係数特定情報とを符号化する少なくとも一の第1の符号化工程と,前記サンプル取得工程により取得された所定サンプル数のディジタル信号を前記予測工程を介さずに符号化する第2の符号化工程と,前記第1の符号化工程および前記第2の符号化工程により得られる符号の符号長に基づいて,前記第1の符号化工程および前記第2の符号化工程のいずれか一を選択する符号化選択工程と,を具備してなることを特徴とするディジタル信号符号化方法と考えることも可能である。
この場合,前記サンプル取得工程により取得された所定サンプル数のディジタル信号の有効ビット数を検出する有効ビット数検出工程を更に備え,前記第2の符号化工程が,前記有効ビット数検出工程により検出された有効ビット数と該有効ビット数を特定する有効ビット数特定情報とを符号化するものであることが好ましい。
この場合の作用については,前述した形態と同様であるため,ここでは省略する。
この場合,前記サンプル取得工程により取得された所定サンプル数のディジタル信号の有効ビット数を検出する有効ビット数検出工程を更に備え,前記第2の符号化工程が,前記有効ビット数検出工程により検出された有効ビット数と該有効ビット数を特定する有効ビット数特定情報とを符号化するものであることが好ましい。
この場合の作用については,前述した形態と同様であるため,ここでは省略する。
以上説明したように,本発明によれば,予測器を用いて符号化する第1の符号化手段と予測器を介さずに符号化する第2の符号化手段とが設けられているため,予測器(予測手段)を用いた符号化では十分な圧縮効果を得られないランダム信号等のディジタル信号であっても,前記第2の符号化手段で符号化されることにより符号化効率(圧縮率)を高めることができる。
以下添付図面を参照しながら,本発明の実施の形態及び実施例について説明し,本発明の理解に供する。尚,以下の実施形態及び実施例は,本発明を具体化した一例であって,本発明の技術的範囲を限定する性格のものではない。
ここに,図1は本発明の第1の実施形態に係るディジタル信号符号化装置Aの概略構成を示すブロック図,図2は本発明の第2の実施形態に係るディジタル信号符号化装置Bの概略構成を示すブロック図,図3は本発明の第1の実施形態に係るディジタル信号符号化装置Aにより生成されたビットストリームE1を復号化するディジタル信号復号化装置Cの概略構成を示すブロック図,図4は本発明の第2の実施形態に係るディジタル信号符号化装置Bにより生成されたビットストリームE2を復号化するディジタル信号復号化装置Dの概略構成を示すブロック図,図5は第2の実施形態の符合化の説明に用いるディジタル信号の一例を示す図,図6はビットストリーム中の予測器識別子及び予測係数特定情報の符号長を説明する図,図7はビットストリームの構成の一例を模式的に示す図,図8はビットストリームの構成の他の例を模式的に示す図,図9は所定のランダム信号に対してゴロム符号化を施した場合の平均ビット長を示すテーブル図,図10はディジタル信号の一例を示す図,図11は音声信号における振幅毎の出現頻度を示す図,図12は予測残差信号における振幅毎の出現頻度を示す図である。
ここに,図1は本発明の第1の実施形態に係るディジタル信号符号化装置Aの概略構成を示すブロック図,図2は本発明の第2の実施形態に係るディジタル信号符号化装置Bの概略構成を示すブロック図,図3は本発明の第1の実施形態に係るディジタル信号符号化装置Aにより生成されたビットストリームE1を復号化するディジタル信号復号化装置Cの概略構成を示すブロック図,図4は本発明の第2の実施形態に係るディジタル信号符号化装置Bにより生成されたビットストリームE2を復号化するディジタル信号復号化装置Dの概略構成を示すブロック図,図5は第2の実施形態の符合化の説明に用いるディジタル信号の一例を示す図,図6はビットストリーム中の予測器識別子及び予測係数特定情報の符号長を説明する図,図7はビットストリームの構成の一例を模式的に示す図,図8はビットストリームの構成の他の例を模式的に示す図,図9は所定のランダム信号に対してゴロム符号化を施した場合の平均ビット長を示すテーブル図,図10はディジタル信号の一例を示す図,図11は音声信号における振幅毎の出現頻度を示す図,図12は予測残差信号における振幅毎の出現頻度を示す図である。
《第1の実施形態》
ここに,本発明の第1の実施形態に係るディジタル信号符号化装置A(以下「符号化装置A」と略す)は,図1に示すブロック図の如く具現化される。
同図に示す如く,本実施形態に係る符号化装置Aは,入力されるディジタル信号を可逆符号化する装置であって,バッファ201(サンプル取得手段の一例),予測器202−1〜202−3(予測手段の一例),減算器212−1〜212−3(残差信号算出手段の一例),符号器203−0(第2の符号化手段の一例),符号器203−1〜203−3(第1の符号化手段の一例),符号長計算/選択器204(符合化選択手段の一例),ビットストリーム生成器205,メモリ部213を具備して概略構成される。
以下に,当該符号化装置Aに入力されたPCMデータ(つまりは,音声信号や計測信号等のディジタル信号)が符号化(圧縮)され,符号データ(圧縮データ)として出力されるまでの各部の処理について,処理の流れ(フロー)に沿って説明する。
ここに,本発明の第1の実施形態に係るディジタル信号符号化装置A(以下「符号化装置A」と略す)は,図1に示すブロック図の如く具現化される。
同図に示す如く,本実施形態に係る符号化装置Aは,入力されるディジタル信号を可逆符号化する装置であって,バッファ201(サンプル取得手段の一例),予測器202−1〜202−3(予測手段の一例),減算器212−1〜212−3(残差信号算出手段の一例),符号器203−0(第2の符号化手段の一例),符号器203−1〜203−3(第1の符号化手段の一例),符号長計算/選択器204(符合化選択手段の一例),ビットストリーム生成器205,メモリ部213を具備して概略構成される。
以下に,当該符号化装置Aに入力されたPCMデータ(つまりは,音声信号や計測信号等のディジタル信号)が符号化(圧縮)され,符号データ(圧縮データ)として出力されるまでの各部の処理について,処理の流れ(フロー)に沿って説明する。
(バッファ201)
先ず,当該符号化装置Aに入力されたPCMデータは,入力端子200から前記バッファ201に入力される。
該バッファ201では,あるサンプル数(例えば800サンプル)毎にフレームと呼ばれる単位で処理可能なように前記PCMデータがバッファリングされる。
該バッファ201に入力されたPCMデータがフレーム化されつつ順次バッファリングされる様子を模式的に示す図が図10である。同図に示す如く,入力されたPCMデータFは所定サンプル数毎にフレーム化され,該バッファ201に順次バッファリングされる。
尚,PCMデータのチャンネル数が複数の場合には,該バッファ201において,各チャンネル相互の相関性を除去する処理を行ってもよい。例えば,PCMデータがLchとRchの2チャンネルであるとすれば,Lch+Rch,或いはLch−Rchの演算処理がそれに該当する。
次に,前記バッファ201によりバッファリングされたフレーム単位のPCMデータ(以下,略して単に「フレームデータ」という)が符号器203−0及び予測器202−1〜202−3の夫々に入力される。
従来は,前記フレームデータは予測器202だけに入力していたが,本発明では,各予測器202だけでなく,直接的にフレームデータが符号器203−0に入力され,この符号器203−0において予測器202を介さずにフレームデータが符号化される。このように,予測器202を介さずに符号器203−0にフレームデータが直接入力される経路を設けた点において本発明は従来と異なる。このような経路を設けたのは,例えばフレームデータがランダム性を有する信号(ランダム信号)である場合は,予測器を介さずに符号化した方が圧縮率(符号化効率)が高い場合もあり得ることを考慮したためである。
先ず,当該符号化装置Aに入力されたPCMデータは,入力端子200から前記バッファ201に入力される。
該バッファ201では,あるサンプル数(例えば800サンプル)毎にフレームと呼ばれる単位で処理可能なように前記PCMデータがバッファリングされる。
該バッファ201に入力されたPCMデータがフレーム化されつつ順次バッファリングされる様子を模式的に示す図が図10である。同図に示す如く,入力されたPCMデータFは所定サンプル数毎にフレーム化され,該バッファ201に順次バッファリングされる。
尚,PCMデータのチャンネル数が複数の場合には,該バッファ201において,各チャンネル相互の相関性を除去する処理を行ってもよい。例えば,PCMデータがLchとRchの2チャンネルであるとすれば,Lch+Rch,或いはLch−Rchの演算処理がそれに該当する。
次に,前記バッファ201によりバッファリングされたフレーム単位のPCMデータ(以下,略して単に「フレームデータ」という)が符号器203−0及び予測器202−1〜202−3の夫々に入力される。
従来は,前記フレームデータは予測器202だけに入力していたが,本発明では,各予測器202だけでなく,直接的にフレームデータが符号器203−0に入力され,この符号器203−0において予測器202を介さずにフレームデータが符号化される。このように,予測器202を介さずに符号器203−0にフレームデータが直接入力される経路を設けた点において本発明は従来と異なる。このような経路を設けたのは,例えばフレームデータがランダム性を有する信号(ランダム信号)である場合は,予測器を介さずに符号化した方が圧縮率(符号化効率)が高い場合もあり得ることを考慮したためである。
(予測器202)
まず,フレームデータが予測器202に入力された経路について説明する。
前記予測器202では,下式(1)の如く,夫々に割り当てられた所定の予測係数αnに基づいて線形予測処理が行われ,過去のサンプルデータx(i)から現在のサンプルの予測値
が予測される。
但し,αn(n=1,2,・・,N)は予測係数である。
ここで,該予測器202には,各予測器に対し,異なる符号長を有する予測係数が割り当てられ,その予測精度の向上が図られている。
そのため,当該符号化装置Aでは,後述するように,前記予測器202のうち一つの予測器を選択するに当たり,その予測器により予測された予測信号を用いて算出される残差信号だけでなく,その予測信号を予測する際に適用された「予測係数を特定する情報(以下「予測係数特定情報」と称す)」の符号長を考慮する必要がある。
ここでは,先ず,前記予測器202の夫々に適用される予測係数,及び予測係数特定情報の符号長について,以下に説明する。
(予測器202−1)
先ず,前記予測器202−1には,バッファリングされたフレームデータを対象として線形予測分析器207で算出された線形予測係数209を割り当てる。
これにより,フレームデータに応じて適宜算出される予測係数によって予測を行うことが可能となり,一定の予測係数による予測に較べ,予測精度を著しく向上させ得る。
尚,前記線形予測分析器207における線形予測係数209の算出方法に関する詳細は,「音のコミュニケーション工学」(社団法人日本音響学会編,コロナ社,1996/8/30初版)に詳しいため,ここでは省略する。
このように前記線形予測係数209が適用される当該予測器202−1では,前記予測係数特定情報の符号長を,前記線形予測分析器207で算出される前記線形予測係数209が4次,各次数毎の予測係数が8bitの場合を考えると,4×8bit=32bitに,後述する予測器識別子の2bitを加算した34bitとすることが可能である(図6(d)参照)。無論,この符号長は一例であって,予測係数の次数や各次数毎の符号長は前述の値に限定されるものではない。
(予測器202−2)
そして,前記予測器202−2には,1フレーム前で使用した予測係数211を割り当てる。つまり,前回,前記符号長計算/選択器204により選択された符号データの符号化の際に用いられた予測係数を一旦メモリ部213に保存しておき,現在のフレームデータを符号化する際に,その保存された前記予測係数211を前記メモリ部213から読み出して使用する。
これは,現在のフレームデータと前回のフレームデータとの間には何らかの相関性があるとの仮定に基づくものであり,例えば,同一或いは類似したデータが繰り返されるPCMデータに対して有効であると解される。
このように前記予測係数211が適用される当該予測器202−2では,前記予測係数特定情報の符号長を,過去の前記予測係数211を使用したことを表すインデックス(フラグ)のみとすることが可能である。つまり,前記フラグの「0」「1」に応じ,前記予測係数211の使用/不使用を判定するよう構成することができる。なお,本実施形態では,識別対象が多いため,前記予測係数211の使用/不使用の判定は,2bitで表された予測器識別子(図6(b)参照)を用いるが,もちろん,この予測器識別子は,識別対象数に応じた任意のビット数(ビット幅)とすることも可能である。尚,本実施形態では,簡単のため過去1フレームのみの予測係数を使用する形態としているが,更に過去のフレームに使用された予測係数を保存しておき,それらを使用する形態とすることも可能である。
(予測器202−3)
そして,前記予測器202−3には,複数の予測係数が予め記憶された予測係数テーブル210から選択された予測係数を割り当てる。
ここで,前記予測係数テーブル210から一つの予測係数を選択する手法として,本実施形態では,前記線形予測分析器207で算出された前記線形予測係数209に最も近い予測係数209′を選択し,該予測係数209′を特定する前記予測係数テーブル210の行番号(以下,テーブルインデックスといい,図1参照)を符号化する,いわゆるベクトル量子化法を用いる。
このような構成により,予め記憶された複数の予測係数から最も高い予測精度を発揮し得る予測係数を選択することが可能となり,より高い圧縮率での符号化を実現し得る。
このように前記予測係数209′が適用される当該予測器202−3では,前記予測係数特定情報の符号長を,該予測係数209′毎に設定された前記テーブルインデックスに,後述する予測器識別子の2bitを加算したbit数とすることが可能である。ここで,前記予測係数テーブル210のテーブルが256通りの場合を考えると,その符号長は,8bitとなるため,この場合の予測係数特定情報は10bitとなる(図6(c)参照)。無論,このテーブル数は一例であって,この値に特定されるものではない。
更に,前記予測係数テーブル210に記憶されている前記予測係数209′は,上述した線形予測係数に限定されるものではなく,これと等価なPARCOR係数,或いはLSP(Line Spectrum Pair)係数等を用いることも可能である。
まず,フレームデータが予測器202に入力された経路について説明する。
前記予測器202では,下式(1)の如く,夫々に割り当てられた所定の予測係数αnに基づいて線形予測処理が行われ,過去のサンプルデータx(i)から現在のサンプルの予測値
ここで,該予測器202には,各予測器に対し,異なる符号長を有する予測係数が割り当てられ,その予測精度の向上が図られている。
そのため,当該符号化装置Aでは,後述するように,前記予測器202のうち一つの予測器を選択するに当たり,その予測器により予測された予測信号を用いて算出される残差信号だけでなく,その予測信号を予測する際に適用された「予測係数を特定する情報(以下「予測係数特定情報」と称す)」の符号長を考慮する必要がある。
ここでは,先ず,前記予測器202の夫々に適用される予測係数,及び予測係数特定情報の符号長について,以下に説明する。
(予測器202−1)
先ず,前記予測器202−1には,バッファリングされたフレームデータを対象として線形予測分析器207で算出された線形予測係数209を割り当てる。
これにより,フレームデータに応じて適宜算出される予測係数によって予測を行うことが可能となり,一定の予測係数による予測に較べ,予測精度を著しく向上させ得る。
尚,前記線形予測分析器207における線形予測係数209の算出方法に関する詳細は,「音のコミュニケーション工学」(社団法人日本音響学会編,コロナ社,1996/8/30初版)に詳しいため,ここでは省略する。
このように前記線形予測係数209が適用される当該予測器202−1では,前記予測係数特定情報の符号長を,前記線形予測分析器207で算出される前記線形予測係数209が4次,各次数毎の予測係数が8bitの場合を考えると,4×8bit=32bitに,後述する予測器識別子の2bitを加算した34bitとすることが可能である(図6(d)参照)。無論,この符号長は一例であって,予測係数の次数や各次数毎の符号長は前述の値に限定されるものではない。
(予測器202−2)
そして,前記予測器202−2には,1フレーム前で使用した予測係数211を割り当てる。つまり,前回,前記符号長計算/選択器204により選択された符号データの符号化の際に用いられた予測係数を一旦メモリ部213に保存しておき,現在のフレームデータを符号化する際に,その保存された前記予測係数211を前記メモリ部213から読み出して使用する。
これは,現在のフレームデータと前回のフレームデータとの間には何らかの相関性があるとの仮定に基づくものであり,例えば,同一或いは類似したデータが繰り返されるPCMデータに対して有効であると解される。
このように前記予測係数211が適用される当該予測器202−2では,前記予測係数特定情報の符号長を,過去の前記予測係数211を使用したことを表すインデックス(フラグ)のみとすることが可能である。つまり,前記フラグの「0」「1」に応じ,前記予測係数211の使用/不使用を判定するよう構成することができる。なお,本実施形態では,識別対象が多いため,前記予測係数211の使用/不使用の判定は,2bitで表された予測器識別子(図6(b)参照)を用いるが,もちろん,この予測器識別子は,識別対象数に応じた任意のビット数(ビット幅)とすることも可能である。尚,本実施形態では,簡単のため過去1フレームのみの予測係数を使用する形態としているが,更に過去のフレームに使用された予測係数を保存しておき,それらを使用する形態とすることも可能である。
(予測器202−3)
そして,前記予測器202−3には,複数の予測係数が予め記憶された予測係数テーブル210から選択された予測係数を割り当てる。
ここで,前記予測係数テーブル210から一つの予測係数を選択する手法として,本実施形態では,前記線形予測分析器207で算出された前記線形予測係数209に最も近い予測係数209′を選択し,該予測係数209′を特定する前記予測係数テーブル210の行番号(以下,テーブルインデックスといい,図1参照)を符号化する,いわゆるベクトル量子化法を用いる。
このような構成により,予め記憶された複数の予測係数から最も高い予測精度を発揮し得る予測係数を選択することが可能となり,より高い圧縮率での符号化を実現し得る。
このように前記予測係数209′が適用される当該予測器202−3では,前記予測係数特定情報の符号長を,該予測係数209′毎に設定された前記テーブルインデックスに,後述する予測器識別子の2bitを加算したbit数とすることが可能である。ここで,前記予測係数テーブル210のテーブルが256通りの場合を考えると,その符号長は,8bitとなるため,この場合の予測係数特定情報は10bitとなる(図6(c)参照)。無論,このテーブル数は一例であって,この値に特定されるものではない。
更に,前記予測係数テーブル210に記憶されている前記予測係数209′は,上述した線形予測係数に限定されるものではなく,これと等価なPARCOR係数,或いはLSP(Line Spectrum Pair)係数等を用いることも可能である。
次に,図6を参照しつつ,前記予測器202に夫々に適用される予測係数における予測係数特定情報の符号長について詳説する。
この予測係数特定情報は,図6に示す如く,予測器識別子とそれ以外のデータ部分により構成される。
尚,前記予測器識別子とは,前記予測係数特定情報の先頭部分に配置され,該予測係数特定情報によって,その予測係数が,上述した前記予測器202のうち,どの予測器に適用された予測係数であるかを表すフラグである。
具体的には,図6(b)の如く,最初の1ビットが1,2ビット目が0であれば1フレーム前の予測係数である(つまりは,前記予測器202−2が適用されている)ことを示し,図6(c)の如く,最初の1ビットが0,2ビット目が1であれば前記予測係数テーブル210から選択された前記予測係数209’である(つまりは,前記予測器202−3が適用されている)ことを示し,図6(d)の如く,最初の1ビットが0,2ビット目も0であれば前記線形予測分析器207で算出された前記線形予測係数209である(つまりは,前記予測器202−1が適用されている)ことを示す。
一方,前記データ部分とは,前記予測器識別子の後に配置され,該データ部分によって,その予測係数を特定するために必要な情報が付与される。
具体的には,図6(b)の如く,1フレーム前の予測係数については前記予測器識別子のみより一意に識別されるため新たな情報(データ部分)は不要であるが,図6(c)の如く,前記予測係数テーブル210から選択された前記予測係数209′については該予測係数209′のテーブルインデックスがこれに該当し,図6(d)の如く,前記線形予測分析器207で算出された前記線形予測係数209については該線形予測係数209自体がこれに該当する。
このように,本実施形態に係る前記符号化装置Aでは,前記予測器202に適用された予測係数特定情報の符号長が,前記予測器202−1が選択される(図6(d)参照)場合には2+32=34bit,前記予測器202−2が選択される(図6(b)参照)場合には2bit,前記予測器202−3が選択される(図6(c)参照)場合には2+8=10bitとなり,各予測器毎に異なることが理解される。
そのため,本実施形態に係る前記符号化装置Aでは,後述する符号長計算/選択器204において,この「予測係数を特定する情報」の符合長の差異を考慮した上で,複数の前記予測器202から,最適な(つまりは,最も圧縮率の高い符号化を行い得る)予測器が選択される。
尚,上述説明では,前記予測器識別子が2bitの固定長であるが,無論,前記予測器識別子は可変長であってもよい。
この予測係数特定情報は,図6に示す如く,予測器識別子とそれ以外のデータ部分により構成される。
尚,前記予測器識別子とは,前記予測係数特定情報の先頭部分に配置され,該予測係数特定情報によって,その予測係数が,上述した前記予測器202のうち,どの予測器に適用された予測係数であるかを表すフラグである。
具体的には,図6(b)の如く,最初の1ビットが1,2ビット目が0であれば1フレーム前の予測係数である(つまりは,前記予測器202−2が適用されている)ことを示し,図6(c)の如く,最初の1ビットが0,2ビット目が1であれば前記予測係数テーブル210から選択された前記予測係数209’である(つまりは,前記予測器202−3が適用されている)ことを示し,図6(d)の如く,最初の1ビットが0,2ビット目も0であれば前記線形予測分析器207で算出された前記線形予測係数209である(つまりは,前記予測器202−1が適用されている)ことを示す。
一方,前記データ部分とは,前記予測器識別子の後に配置され,該データ部分によって,その予測係数を特定するために必要な情報が付与される。
具体的には,図6(b)の如く,1フレーム前の予測係数については前記予測器識別子のみより一意に識別されるため新たな情報(データ部分)は不要であるが,図6(c)の如く,前記予測係数テーブル210から選択された前記予測係数209′については該予測係数209′のテーブルインデックスがこれに該当し,図6(d)の如く,前記線形予測分析器207で算出された前記線形予測係数209については該線形予測係数209自体がこれに該当する。
このように,本実施形態に係る前記符号化装置Aでは,前記予測器202に適用された予測係数特定情報の符号長が,前記予測器202−1が選択される(図6(d)参照)場合には2+32=34bit,前記予測器202−2が選択される(図6(b)参照)場合には2bit,前記予測器202−3が選択される(図6(c)参照)場合には2+8=10bitとなり,各予測器毎に異なることが理解される。
そのため,本実施形態に係る前記符号化装置Aでは,後述する符号長計算/選択器204において,この「予測係数を特定する情報」の符合長の差異を考慮した上で,複数の前記予測器202から,最適な(つまりは,最も圧縮率の高い符号化を行い得る)予測器が選択される。
尚,上述説明では,前記予測器識別子が2bitの固定長であるが,無論,前記予測器識別子は可変長であってもよい。
(減算器212)
上述の如く所定の予測係数が夫々適用され,過去のサンプリングデータから現在のサンプリングデータの予測信号を予測した前記予測器202は,該予測信号を,減算器212−1〜212−3に出力する。
該減算器212では,前記予測器202から入力された前記予測信号
と,前記バッファ201から入力されたサンプルデータx(i)とを用い,下式(2)の如く,残差信号d(i)が算出される。
上述の如く所定の予測係数が夫々適用され,過去のサンプリングデータから現在のサンプリングデータの予測信号を予測した前記予測器202は,該予測信号を,減算器212−1〜212−3に出力する。
該減算器212では,前記予測器202から入力された前記予測信号
(符号器203−0)
前記符号化器203−0〜203−3のうち,符号化器203−0には,上述したように,前記予測器202を介さずに前記バッファ201でバッファリングされたフレームデータが直接入力される。このとき,例えば,前記バッファ201において,入力するフレームデータの先頭に,符号化に当たり予測係数を使用しない旨を示す予測器識別子(図6(a)参照)を付加するなどにより,前記フレームデータを前記符号器203−0に入力させることができる。具体的には,図6(a)の如く,最初の1ビットが1,2ビット目が1であれば符号化器203−0にフレームデータを直接入力する(つまりは,予測係数を使用しない)ことを示す。
前記符号器203−0に入力されたフレームデータは,該符号器203−0において符号化され,その後,符号化されたフレームデータ(以下「符号化フレーム」という)が前記符号長計算/選択器204に出力される。
前記符号化器203−0で行われるフレームデータの符号化については,特にその方法が限定されることはなく,例えば,後述するエントロピー符号化等の種々の符号化方法を適用することが可能である。
前記符号化器203−0〜203−3のうち,符号化器203−0には,上述したように,前記予測器202を介さずに前記バッファ201でバッファリングされたフレームデータが直接入力される。このとき,例えば,前記バッファ201において,入力するフレームデータの先頭に,符号化に当たり予測係数を使用しない旨を示す予測器識別子(図6(a)参照)を付加するなどにより,前記フレームデータを前記符号器203−0に入力させることができる。具体的には,図6(a)の如く,最初の1ビットが1,2ビット目が1であれば符号化器203−0にフレームデータを直接入力する(つまりは,予測係数を使用しない)ことを示す。
前記符号器203−0に入力されたフレームデータは,該符号器203−0において符号化され,その後,符号化されたフレームデータ(以下「符号化フレーム」という)が前記符号長計算/選択器204に出力される。
前記符号化器203−0で行われるフレームデータの符号化については,特にその方法が限定されることはなく,例えば,後述するエントロピー符号化等の種々の符号化方法を適用することが可能である。
(符号器203−1〜203−3)
一方,符号化器203−1〜203−3には,各予測器202毎の残差信号d(i)と,該残差信号d(i)に対応する(つまり,該残差信号d(i)の算出に使用された予測信号を予測する際に適用された)前記予測係数特定情報が入力される。該符号器203−1〜203−3では,前記減算器212から取得した残差信号d(i)と,前記予測器202から取得した前記予測係数特定情報を符号化し,しかる後,符号化された残差信号及び予測係数特定情報を前記符号長計算/選択器204に出力する。以下,符号化された残差信号及び予測係数特定情報と,前記符号化フレームとを総称して「符号化候補」という。
先ず,残差信号d(i)については,その出現頻度の偏りを利用した符号化方法(いわゆるエントロピー符号化)が行われることが望ましい。
該符号器203−1〜203−3において残差信号を符号化する利点は,エントロピー(振幅k[i]の出現確率をp[i]とした時,p[i]×log2(1/p[i])の合計)を小さくできることにある。
これについて,あるPCMデータ(16bit)の振幅の累積度数を表す図11,及び該PCMデータをある所定の予測係数を用いて予測値を予測し,その予測値を用いて算出された残差信号の振幅の累積度数を表した図12を用いて説明する。
両図より明らかな如く,PCMデータの残差信号を算出することによって,その信号に対する振幅の分布は0近傍に集中する。そこで,振幅の分布の偏り(集中)を利用して符号化すれば圧縮率の向上させ得る。
具体的には,振幅が0近傍の信号には短いビット長の符号を割当て,振幅が大きくなるに従いビット長の長い符号を割り当てるように符号化すれば,より圧縮効率を高めることが可能である。尚,上述した説明は,概念的な説明であるが,これら概念をさらに効率よく具現化した符号化手法として公知な技術であるHuffman符号方式,算術符号化方式,或いはレンジコーダ等の手法を用いることが可能である。
このように,該符号器203−1〜203−3において残差信号を符号化することで,より圧縮効率の高い符号化が可能である。
一方,予測係数特定情報については,特にその符号化方法に係る限定はなく,図6(b)〜(d)に示す構造を符号化として捉えることも可能であるし,図6(b)〜(d)に示す構造の予測係数特定情報を,上述したエントロピー符号化等を用い更に符号化してもよい。
つまり,該符号器203−1〜203−3は,前記減算器212から取得した残差信号d(i)と,前記予測器202から取得した予測係数特定情報と,を夫々符号化(両者の符号化方式は同一であっても異なってもよい)すると共に,符号化された夫々の符号を合わせて形成される前記符号化候補を前記符号長計算/選択器204に出力する機能を有する。
一方,符号化器203−1〜203−3には,各予測器202毎の残差信号d(i)と,該残差信号d(i)に対応する(つまり,該残差信号d(i)の算出に使用された予測信号を予測する際に適用された)前記予測係数特定情報が入力される。該符号器203−1〜203−3では,前記減算器212から取得した残差信号d(i)と,前記予測器202から取得した前記予測係数特定情報を符号化し,しかる後,符号化された残差信号及び予測係数特定情報を前記符号長計算/選択器204に出力する。以下,符号化された残差信号及び予測係数特定情報と,前記符号化フレームとを総称して「符号化候補」という。
先ず,残差信号d(i)については,その出現頻度の偏りを利用した符号化方法(いわゆるエントロピー符号化)が行われることが望ましい。
該符号器203−1〜203−3において残差信号を符号化する利点は,エントロピー(振幅k[i]の出現確率をp[i]とした時,p[i]×log2(1/p[i])の合計)を小さくできることにある。
これについて,あるPCMデータ(16bit)の振幅の累積度数を表す図11,及び該PCMデータをある所定の予測係数を用いて予測値を予測し,その予測値を用いて算出された残差信号の振幅の累積度数を表した図12を用いて説明する。
両図より明らかな如く,PCMデータの残差信号を算出することによって,その信号に対する振幅の分布は0近傍に集中する。そこで,振幅の分布の偏り(集中)を利用して符号化すれば圧縮率の向上させ得る。
具体的には,振幅が0近傍の信号には短いビット長の符号を割当て,振幅が大きくなるに従いビット長の長い符号を割り当てるように符号化すれば,より圧縮効率を高めることが可能である。尚,上述した説明は,概念的な説明であるが,これら概念をさらに効率よく具現化した符号化手法として公知な技術であるHuffman符号方式,算術符号化方式,或いはレンジコーダ等の手法を用いることが可能である。
このように,該符号器203−1〜203−3において残差信号を符号化することで,より圧縮効率の高い符号化が可能である。
一方,予測係数特定情報については,特にその符号化方法に係る限定はなく,図6(b)〜(d)に示す構造を符号化として捉えることも可能であるし,図6(b)〜(d)に示す構造の予測係数特定情報を,上述したエントロピー符号化等を用い更に符号化してもよい。
つまり,該符号器203−1〜203−3は,前記減算器212から取得した残差信号d(i)と,前記予測器202から取得した予測係数特定情報と,を夫々符号化(両者の符号化方式は同一であっても異なってもよい)すると共に,符号化された夫々の符号を合わせて形成される前記符号化候補を前記符号長計算/選択器204に出力する機能を有する。
(符号長計算/選択器204)
前記符号長計算/選択器204では,前記符号器203(203−0〜203−3)から入力される複数の符号化候補から一つを選択するに当たり,該符号化候補の符号長が最小であるものを選択し,選択された符号化候補をビットストリーム生成器205へと出力する。
即ち,該符号長計算/選択器204は,符号器203−1〜203−3で符号化された残差信号及び予測係数特定情報とを合わせて構成された符号化データだけでなく,符号器203−0で予測器を介さずに符号化されたフレームデータ(符号化フレーム)をも含めた全ての符号化候補の中から符号長が最小となるものを選択するよう構成されている。そのため,本実施形態によれば,前記予測器202を利用した符号化では高い圧縮率で符号化され,他の符号化方法によれば高い圧縮率で符号化することができるようなディジタル信号が入力される場合でも,該ディジタル信号に対して,高い圧縮率で符号化可能な適切な符号器が選択され得る。
なお,前記符号長計算/選択器204における選択は,フレームデータ単位で行われるため,後述するビットストリームE1(図7)には,符号器203−0で符号化されたデータ及び符号器203−1〜203−3で符号化されたデータが混在することになる。
前記符号長計算/選択器204では,前記符号器203(203−0〜203−3)から入力される複数の符号化候補から一つを選択するに当たり,該符号化候補の符号長が最小であるものを選択し,選択された符号化候補をビットストリーム生成器205へと出力する。
即ち,該符号長計算/選択器204は,符号器203−1〜203−3で符号化された残差信号及び予測係数特定情報とを合わせて構成された符号化データだけでなく,符号器203−0で予測器を介さずに符号化されたフレームデータ(符号化フレーム)をも含めた全ての符号化候補の中から符号長が最小となるものを選択するよう構成されている。そのため,本実施形態によれば,前記予測器202を利用した符号化では高い圧縮率で符号化され,他の符号化方法によれば高い圧縮率で符号化することができるようなディジタル信号が入力される場合でも,該ディジタル信号に対して,高い圧縮率で符号化可能な適切な符号器が選択され得る。
なお,前記符号長計算/選択器204における選択は,フレームデータ単位で行われるため,後述するビットストリームE1(図7)には,符号器203−0で符号化されたデータ及び符号器203−1〜203−3で符号化されたデータが混在することになる。
(ビットストリーム生成器205)
続いて,前記符号長計算/選択器204で選択された一つの符号化候補は,ビットストリーム生成器205でビットストリームとしてパッキングされた後,出力端子206から出力される。
ここに,前記ビットストリーム生成器205によりパッキングされたビットストリームの一例を図7に示す。尚,同図に示すビットストリームE1は,チャンネル数が1のPCMデータから生成されたビットストリームの一例を示す。
同図に示す如く,前記ビットストリームE1は,ファイルヘッダ608と,それに続くフレームデータの2つに大別される。更に,前記フレームデータはフレーム毎にフレームデータ(1)609,フレームデータ(2)610,…に分けられる。ここに,前記フレームデータ(1)609は予測器202を介さずに符号器203−0で符号化されたフレームデータ(符号化フレーム)を含み,前記フレームデータ(2)610はいずれかの予測器202を用いて符号器203−1〜203−3のいずれかで符号化された残差情報等を含むものとする。
先ず,前記ファイルヘッダ608の構成要素について説明する。
該ファイルヘッダ608は,更にヘッダ601と先頭サンプル値602とに分けられる。なお,ビットストリームE1が,チャンネル数が2つ(例えばLchとRchからなるステレオ)のPCMデータから生成されたビットストリームである場合は,前記ファイルヘッダ608には,各チャンネル毎の先頭サンプル値が含まれる。
前記ヘッダ601は,例えば,ビットストリーム(PCMデータ)全体を司る情報,例えばサンプリングレート,チャンネル数,平均ビットレート等の情報が含まれる。
また,前記先頭サンプル値602には,所定のチャンネルの先頭サンプル値が格納される。尚,この先頭サンプル値602はデコードする最初の1フレームを復元するために必要であり,少なくとも予測係数αnの次数(すなわちn)分を各チャンネル毎に確保してあればよい。若しくは,線形予測のために必要な過去のサンプルの初期値をエンコーダ,デコーダ共に0とするなどして予測させるようにすれば,先頭サンプル値602は無くてもよい。このように,該ファイルヘッダ608を構成する前記ヘッダ601及び前記先頭サンプル値602は,固定長である。
続いて,前記符号長計算/選択器204で選択された一つの符号化候補は,ビットストリーム生成器205でビットストリームとしてパッキングされた後,出力端子206から出力される。
ここに,前記ビットストリーム生成器205によりパッキングされたビットストリームの一例を図7に示す。尚,同図に示すビットストリームE1は,チャンネル数が1のPCMデータから生成されたビットストリームの一例を示す。
同図に示す如く,前記ビットストリームE1は,ファイルヘッダ608と,それに続くフレームデータの2つに大別される。更に,前記フレームデータはフレーム毎にフレームデータ(1)609,フレームデータ(2)610,…に分けられる。ここに,前記フレームデータ(1)609は予測器202を介さずに符号器203−0で符号化されたフレームデータ(符号化フレーム)を含み,前記フレームデータ(2)610はいずれかの予測器202を用いて符号器203−1〜203−3のいずれかで符号化された残差情報等を含むものとする。
先ず,前記ファイルヘッダ608の構成要素について説明する。
該ファイルヘッダ608は,更にヘッダ601と先頭サンプル値602とに分けられる。なお,ビットストリームE1が,チャンネル数が2つ(例えばLchとRchからなるステレオ)のPCMデータから生成されたビットストリームである場合は,前記ファイルヘッダ608には,各チャンネル毎の先頭サンプル値が含まれる。
前記ヘッダ601は,例えば,ビットストリーム(PCMデータ)全体を司る情報,例えばサンプリングレート,チャンネル数,平均ビットレート等の情報が含まれる。
また,前記先頭サンプル値602には,所定のチャンネルの先頭サンプル値が格納される。尚,この先頭サンプル値602はデコードする最初の1フレームを復元するために必要であり,少なくとも予測係数αnの次数(すなわちn)分を各チャンネル毎に確保してあればよい。若しくは,線形予測のために必要な過去のサンプルの初期値をエンコーダ,デコーダ共に0とするなどして予測させるようにすれば,先頭サンプル値602は無くてもよい。このように,該ファイルヘッダ608を構成する前記ヘッダ601及び前記先頭サンプル値602は,固定長である。
次に,前記フレームデータ(1)609の構成要素について説明する。
前記フレームデータ(1)609は,符号化方法(方式)を識別するための方式情報603と,符号化フレーム604とに分けられる。
前記符号化フレーム604は言うまでもなく,前記符号長計算/選択器204において符号器203−0から入力された符号化候補(即ち,符号器203−0で符号化されたフレームデータ)が選択された場合のそのフレームデータである。また,前記方式情報603は前記符号化フレーム604の符号化方法(方式)を識別するための情報であって,具体的には,符号器203−0における符号化に適用された符号化方法を識別する情報である。なお,該方式情報603は,ビットストリームE1を復号化する際に用いられる。
前記フレームデータ(1)609は,符号化方法(方式)を識別するための方式情報603と,符号化フレーム604とに分けられる。
前記符号化フレーム604は言うまでもなく,前記符号長計算/選択器204において符号器203−0から入力された符号化候補(即ち,符号器203−0で符号化されたフレームデータ)が選択された場合のそのフレームデータである。また,前記方式情報603は前記符号化フレーム604の符号化方法(方式)を識別するための情報であって,具体的には,符号器203−0における符号化に適用された符号化方法を識別する情報である。なお,該方式情報603は,ビットストリームE1を復号化する際に用いられる。
続いて,前記フレームデータ(2)610の構成要素について説明する。
前記フレームデータ(2)610は,更に方式情報605と,予測係数特定情報606と,残差信号情報607とに分けられる。
前記方式情報605は前記予測係数特定情報606及び残差信号情報607を符号化した符号化方法(方式)を識別するための情報であって,具体的には,対応する符号器における符号化方法,使用した予測器202,使用した予測係数等を識別する情報である。この方式情報605は,ビットストリームE1を復号化する際に用いられる。
前記予測係数特定情報606は,先に説明したように,予測係数を特定する情報であり,このビットストリームE1を復号化する際に用いられる。該予測係数特定情報606に基づいて,ビットストリームE1からPCMデータを復号する装置(ディジタル信号復号化装置C)については後述する。
また,前記残差信号情報607は,残差信号を符号化して得られた符号である。このように,該フレームデータ(2)610を構成する前記予測係数特定情報606及び前記残差信号情報607は両者とも可変長である。
尚,各情報の並び順,或いはチャンネル数は図7示す例に限定されず,任意の形態が可能であることは言うまでもない。
前記フレームデータ(2)610は,更に方式情報605と,予測係数特定情報606と,残差信号情報607とに分けられる。
前記方式情報605は前記予測係数特定情報606及び残差信号情報607を符号化した符号化方法(方式)を識別するための情報であって,具体的には,対応する符号器における符号化方法,使用した予測器202,使用した予測係数等を識別する情報である。この方式情報605は,ビットストリームE1を復号化する際に用いられる。
前記予測係数特定情報606は,先に説明したように,予測係数を特定する情報であり,このビットストリームE1を復号化する際に用いられる。該予測係数特定情報606に基づいて,ビットストリームE1からPCMデータを復号する装置(ディジタル信号復号化装置C)については後述する。
また,前記残差信号情報607は,残差信号を符号化して得られた符号である。このように,該フレームデータ(2)610を構成する前記予測係数特定情報606及び前記残差信号情報607は両者とも可変長である。
尚,各情報の並び順,或いはチャンネル数は図7示す例に限定されず,任意の形態が可能であることは言うまでもない。
次に,前記符号化装置Aにより生成されたビットストリームE1(図7参照)を取得し,復号化可能なディジタル信号復号化装置Cの一例について,図3を参照しながら説明する。
以下に,図3に示すディジタル信号復号化装置C(以下「復号化装置C」と略す)に入力されたビットストリームE1が復号化され,PCMデータとして出力されるまでの各部の処理について,処理の流れに沿って説明する。なお,図1のブロック図に示す符合化装置Aの構成要素と同名称の構成要素についてはその構成は同じであるため,上述した符合化装置Aの説明を参照し,ここではその詳細な説明を省略する。
先ず,前記音声復号化装置Cに入力されたビットストリームE1は、入力端子501を介してビットストリーム解読器502に入力される。
該ビットストリーム解読器502では、ビットストリームE1のセグメントを解読して該ビットストリームE1を各信号成分毎に分解した後に、それら信号成分の振り分けが行われる。
具体的には,前記ビットストリーム解読器502において,ビットストリームE1のファイルヘッダ608がヘッダ601と先頭サンプル値602に分解され,前記先頭サンプル値602がバッファ504および予測器503に振り分けられ、PCMデータの一部(先頭PCMデータ)として出力される。
以下に,図3に示すディジタル信号復号化装置C(以下「復号化装置C」と略す)に入力されたビットストリームE1が復号化され,PCMデータとして出力されるまでの各部の処理について,処理の流れに沿って説明する。なお,図1のブロック図に示す符合化装置Aの構成要素と同名称の構成要素についてはその構成は同じであるため,上述した符合化装置Aの説明を参照し,ここではその詳細な説明を省略する。
先ず,前記音声復号化装置Cに入力されたビットストリームE1は、入力端子501を介してビットストリーム解読器502に入力される。
該ビットストリーム解読器502では、ビットストリームE1のセグメントを解読して該ビットストリームE1を各信号成分毎に分解した後に、それら信号成分の振り分けが行われる。
具体的には,前記ビットストリーム解読器502において,ビットストリームE1のファイルヘッダ608がヘッダ601と先頭サンプル値602に分解され,前記先頭サンプル値602がバッファ504および予測器503に振り分けられ、PCMデータの一部(先頭PCMデータ)として出力される。
また,ビットストリームE1に含まれるフレームデータ(1)609は,方式情報603と符合化フレーム604とに分割され,それぞれのデータが予測器503に出力される。ただし,フレームデータ(1)609は予測器202を用いずに符号器203−0で符合化されたデータであるため,前記予測器503では前記フレームデータ(1)609の先頭に付された予測器識別子(図6(a)参照)を判別して,予測係数を「0」として処理し,方式情報603で特定される符合化方式に対応する復号化方式で復号化した後に,復号されたPCMデータがバッファ504へ順次転送される。もちろん,前記予測器503にフレームデータ(1)609を出力せずに別経路に符号器203−0に対応する復号器(不図示)を設け,該復号器にフレームデータ(1)609を出力して復号化するようにしてもかまわない。
一方,フレームデータ(2)610は方式情報605と予測係数特定情報606と残差信号情報607とに分割され,前記方式情報605と前記残差信号情報607は予測器503に出力され,前記予測係数特定情報606は予測係数形成部505に出力される。
前記予測係数特定情報606は予測係数形成部505に振り分けられ,予測器503に適用する予測係数を特定するために用いられる。具体的には、本実施形態に係る前記符号化装置Aを用いてPCMデータを符号化する際に、前記予測器202(図1参照)に適用された予測係数の特定を行う。つまり、前記予測係数特定情報606に含まれる前記予測器識別子及びそれに付随するデータ部分(図6参照)に基づいて、メモリ部509に記憶しておいた1フレーム前の予測係数506(前記予測器202−2に適用される予測係数211に相当)、予測係数テーブル507に予め記憶された予測係数(前記予測器202−3に適用される予測係数209’に相当)、或いは前記予測係数特定情報606のデータ部分として送信される線形予測係数209(前記予測器202−1に適用される予測係数209に相当)のいずれかが選択される。尚、この予測係数特定情報606は予測器202を用いて符合化されたフレームデータ毎に取得されるものであり、各フレームデータ毎にその符号化(予測)に適用された予測係数が適宜選択される。かかる手順により前記予測器503に適用する予測係数を選択することで、その予測係数は、PCMデータを前記符号化する際に前記予測器202(図1参照)に適用された予測係数と同一にすることが可能となる。
そして、前記予測器503の出力信号と、残差信号情報607とを加算することでPCMデータに復号され、その復号されたPCMデータがバッファ504へ順次転送される。
前記予測係数特定情報606は予測係数形成部505に振り分けられ,予測器503に適用する予測係数を特定するために用いられる。具体的には、本実施形態に係る前記符号化装置Aを用いてPCMデータを符号化する際に、前記予測器202(図1参照)に適用された予測係数の特定を行う。つまり、前記予測係数特定情報606に含まれる前記予測器識別子及びそれに付随するデータ部分(図6参照)に基づいて、メモリ部509に記憶しておいた1フレーム前の予測係数506(前記予測器202−2に適用される予測係数211に相当)、予測係数テーブル507に予め記憶された予測係数(前記予測器202−3に適用される予測係数209’に相当)、或いは前記予測係数特定情報606のデータ部分として送信される線形予測係数209(前記予測器202−1に適用される予測係数209に相当)のいずれかが選択される。尚、この予測係数特定情報606は予測器202を用いて符合化されたフレームデータ毎に取得されるものであり、各フレームデータ毎にその符号化(予測)に適用された予測係数が適宜選択される。かかる手順により前記予測器503に適用する予測係数を選択することで、その予測係数は、PCMデータを前記符号化する際に前記予測器202(図1参照)に適用された予測係数と同一にすることが可能となる。
そして、前記予測器503の出力信号と、残差信号情報607とを加算することでPCMデータに復号され、その復号されたPCMデータがバッファ504へ順次転送される。
このようにして転送され,前記バッファ504に格納されたPCMデータは,該バッファ504の出力信号として出力端子508を介して出力され,これにより,PCMデータへの復号化が完了する。
このように、当該復号化装置Cにおいては、前記符号化装置Aの逆の手順に従って元のPCMデータをロスレス復号化することが可能である。
尚、当該復号化装置Cは、図1で説明した前記符号化装置Aにおける前記バッファ201と対応させるべく前記バッファ504を設けた形態としたが、該バッファ504は不可欠な構成要素ではなく、該バッファ504で順次バッファリングすることなく、復号されたPCMデータを順次出力端子508を介して出力する構成としてもよい。但し、上述の符号化の手順において説明したように、前記符号化装置Aにおける前記バッファ201において各チャンネル間の相関を利用した処理(例えば、2chの音声信号におけるLch+Rch、或いはLch−Rch)が実施される場合には、該バッファ504において逆処理を実施する必要がある。
このように、当該復号化装置Cにおいては、前記符号化装置Aの逆の手順に従って元のPCMデータをロスレス復号化することが可能である。
尚、当該復号化装置Cは、図1で説明した前記符号化装置Aにおける前記バッファ201と対応させるべく前記バッファ504を設けた形態としたが、該バッファ504は不可欠な構成要素ではなく、該バッファ504で順次バッファリングすることなく、復号されたPCMデータを順次出力端子508を介して出力する構成としてもよい。但し、上述の符号化の手順において説明したように、前記符号化装置Aにおける前記バッファ201において各チャンネル間の相関を利用した処理(例えば、2chの音声信号におけるLch+Rch、或いはLch−Rch)が実施される場合には、該バッファ504において逆処理を実施する必要がある。
《第2の実施形態》
次に,本発明の第2の実施形態に係るディジタル信号符号化装置B(以下「符号化装置B」と略す)について図2のブロック図を用いて説明する。なお,図2中において,上述した第1の実施形態の符号化装置Aと同じ構成要素については同符号を付すことによりその説明を省略する。
上述説明した図1示す第1の実施形態の符号化装置Aでは,前記符号器203−0において,エントロピー符号化等の種々の符号化方法を適用することができることについて説明した。
しかし,入力されるディジタル信号のランダム性が強い場合,即ち,入力されるディジタル信号がランダム信号である場合は,振幅の累積度数(図11,図12参照)に偏りが少ないため,エントロピー符号化が効果的に実行されず,即ち,符号化率(圧縮率)が低くなる。前記ランダム信号の一例として,例えば,データロガー等の計測装置により計測された計測データが挙げられる。このような計測データにはランダム雑音が含まれるため,そのデータのランダム性は強い傾向にある。
一般に,ディジタル信号(ディジタルデータ)は,そのデータ長(例えば16bit)の全てのビット数で所定の情報が表されるが,前記計測データ等に代表されるランダム信号においては,実質的に全てのビット数で情報が表されているのではなく,データの先頭から所定のビット数(ビットレンジ,ビット幅)だけで情報を表す場合がある。一般にこのようなビット数は有効ビット数と呼ばれる。
この有効ビット数は,前記ランダム信号にあっては比較的小さい値となることが知られている。
ここで,図9に,16ビット幅のあるランダム信号に対してエントロピー符号化の一つである周知のゴロム符号化(ゴロム・ライス符号化)を施した場合の平均ビット長(平均符号長)を示す。具体的には,図9に示す表の最下欄に,−4〜3の整数値がランダムに発生するランダム信号をゴロム符合化した場合の平均ビット長(平均符号長)を示している。
このように,−4〜3の整数値がランダムに発生するランダム信号に対して,ゴラム符合化1〜4のいずれの符合化方法を適用したとしても,符合化後の平均ビット長は3.5乃至4.5である。しかしながら,前記ランダム信号が示す−4〜3の整数値は3ビットで表すことができるため,16ビット幅のうち,先頭の3ビット以外のビット列を全て除去して,16ビットのランダム信号を3ビットのデータに符号化することができるはずである。
次に,本発明の第2の実施形態に係るディジタル信号符号化装置B(以下「符号化装置B」と略す)について図2のブロック図を用いて説明する。なお,図2中において,上述した第1の実施形態の符号化装置Aと同じ構成要素については同符号を付すことによりその説明を省略する。
上述説明した図1示す第1の実施形態の符号化装置Aでは,前記符号器203−0において,エントロピー符号化等の種々の符号化方法を適用することができることについて説明した。
しかし,入力されるディジタル信号のランダム性が強い場合,即ち,入力されるディジタル信号がランダム信号である場合は,振幅の累積度数(図11,図12参照)に偏りが少ないため,エントロピー符号化が効果的に実行されず,即ち,符号化率(圧縮率)が低くなる。前記ランダム信号の一例として,例えば,データロガー等の計測装置により計測された計測データが挙げられる。このような計測データにはランダム雑音が含まれるため,そのデータのランダム性は強い傾向にある。
一般に,ディジタル信号(ディジタルデータ)は,そのデータ長(例えば16bit)の全てのビット数で所定の情報が表されるが,前記計測データ等に代表されるランダム信号においては,実質的に全てのビット数で情報が表されているのではなく,データの先頭から所定のビット数(ビットレンジ,ビット幅)だけで情報を表す場合がある。一般にこのようなビット数は有効ビット数と呼ばれる。
この有効ビット数は,前記ランダム信号にあっては比較的小さい値となることが知られている。
ここで,図9に,16ビット幅のあるランダム信号に対してエントロピー符号化の一つである周知のゴロム符号化(ゴロム・ライス符号化)を施した場合の平均ビット長(平均符号長)を示す。具体的には,図9に示す表の最下欄に,−4〜3の整数値がランダムに発生するランダム信号をゴロム符合化した場合の平均ビット長(平均符号長)を示している。
このように,−4〜3の整数値がランダムに発生するランダム信号に対して,ゴラム符合化1〜4のいずれの符合化方法を適用したとしても,符合化後の平均ビット長は3.5乃至4.5である。しかしながら,前記ランダム信号が示す−4〜3の整数値は3ビットで表すことができるため,16ビット幅のうち,先頭の3ビット以外のビット列を全て除去して,16ビットのランダム信号を3ビットのデータに符号化することができるはずである。
そこで,本発明の第2の実施形態の符号化装置Bでは,図2のブロック図に示すように,前記バッファ201から前記符号器203−0へ入力されるフレームデータの有効ビット数を検出するビットレンジ検出器302(有効ビット数検出手段の一例)を設け,該ビットレンジ検出器302で検出された有効ビット数を特定する情報(以下「有効ビット数特定情報」という)を前記符号器203−0に入力し,該符号器203−0においては,所定のビット幅(例えば16ビット幅)のフレームデータを前記有効ビット数のデータに符合化するように構成される。このように構成されることにより,ランダム性の高いデータの符合化率(圧縮率)を更に高めることが可能となる。
ここで,図2,図5及び図8を参照しながら前記有効ビット数を用いた符合化の具体例を以下に説明する。
いま,説明を簡単にするため,図5に示すように,10進数表示で−4〜3のいずれかの整数値を示す16ビットのサンプルデータが16個(サンプル401〜416)集まって構成されるフレームデータ40を考える。このフレームデータ40は,縦方向に時間軸をとったデータ群である。また,このフレームデータ40は,先頭から2つのビット(ビット番号0と1)で−4〜3の整数値の絶対値を表し,先頭から3つ目のビット(ビット番号2)がその符号を表す。即ち,先頭から3つ目までのビットが有効ビットであり,その有効ビット数は3である。なお,前記サンプルデータの性質上,前記有効ビットを除く他のビットは,符号と同じビット値となっている。
まず,前記バッファ201でフレーム化され,バッファリングされることにより前記フレームデータ40が取得されると,その後,該フレームデータ40が前記符号器203−0に入力される。このとき,前記フレームデータ40の入力経路に設けられた前記前記ビットレンジ検出器302によって,前記フレームデータ40の有効ビット数が検出される。かかる検出は,例えば,サンプルデータの各ビット番号の値がランダムに出現しているかどうか等により有効ビットの範囲を判定することにより検出することが可能である。もちろん,かかる手法に限定されることはない。
前記有効ビット数が検出されると,その有効ビット数を特定する有効ビット数特定情報が前記ビットレンジ検出器302から前記符号器203−0に入力される。
次に,前記符号器203−0では,入力されたフレームデータ40と有効ビット数情報に基づいて前記フレームデータ40を符合化する。具体的は,16ビットのサンプルデータ401〜416のデータを有効ビット数分の16個のサンプルデータ(以下「ビット制限情報」という,図5中の範囲43)に符合化し,この符合化されたビット制限情報43に前記有効ビット数情報(図5中のビット幅42)を付加した符号データ44に圧縮する。
いま,説明を簡単にするため,図5に示すように,10進数表示で−4〜3のいずれかの整数値を示す16ビットのサンプルデータが16個(サンプル401〜416)集まって構成されるフレームデータ40を考える。このフレームデータ40は,縦方向に時間軸をとったデータ群である。また,このフレームデータ40は,先頭から2つのビット(ビット番号0と1)で−4〜3の整数値の絶対値を表し,先頭から3つ目のビット(ビット番号2)がその符号を表す。即ち,先頭から3つ目までのビットが有効ビットであり,その有効ビット数は3である。なお,前記サンプルデータの性質上,前記有効ビットを除く他のビットは,符号と同じビット値となっている。
まず,前記バッファ201でフレーム化され,バッファリングされることにより前記フレームデータ40が取得されると,その後,該フレームデータ40が前記符号器203−0に入力される。このとき,前記フレームデータ40の入力経路に設けられた前記前記ビットレンジ検出器302によって,前記フレームデータ40の有効ビット数が検出される。かかる検出は,例えば,サンプルデータの各ビット番号の値がランダムに出現しているかどうか等により有効ビットの範囲を判定することにより検出することが可能である。もちろん,かかる手法に限定されることはない。
前記有効ビット数が検出されると,その有効ビット数を特定する有効ビット数特定情報が前記ビットレンジ検出器302から前記符号器203−0に入力される。
次に,前記符号器203−0では,入力されたフレームデータ40と有効ビット数情報に基づいて前記フレームデータ40を符合化する。具体的は,16ビットのサンプルデータ401〜416のデータを有効ビット数分の16個のサンプルデータ(以下「ビット制限情報」という,図5中の範囲43)に符合化し,この符合化されたビット制限情報43に前記有効ビット数情報(図5中のビット幅42)を付加した符号データ44に圧縮する。
ここに,符合化装置Bのビットストリーム生成器205によりパッキングされたビットストリームの一例を図8に示す。尚,同図に示すビットストリームE2は,チャンネル数が1のPCMデータから生成されたビットストリームの一例を示す。
同図に示す如く,前記ビットストリームE2は,ファイルヘッダ608と,それに続くフレームデータの2つに大別される。更に,前記フレームデータはフレーム毎にフレームデータ(1)609,フレームデータ(2)610,…に分けられる。更に,前記フレームデータ(1)609は,符号化方法(方式)を識別するための方式情報603と,前記符号データ44(図5参照)とに分けられる。なお,前記ビットストリームE1に含まれる同一データ(情報)については,同符号を付してその説明を省略する。
このように,有効ビット数を用いた符合化がなされることにより,符合化前は256ビット(16×16ビット)のフレームデータ40が,51ビット(3+3×16ビット)の符号データ,即ち,約20%に圧縮された符号データ44に符合化される。
同図に示す如く,前記ビットストリームE2は,ファイルヘッダ608と,それに続くフレームデータの2つに大別される。更に,前記フレームデータはフレーム毎にフレームデータ(1)609,フレームデータ(2)610,…に分けられる。更に,前記フレームデータ(1)609は,符号化方法(方式)を識別するための方式情報603と,前記符号データ44(図5参照)とに分けられる。なお,前記ビットストリームE1に含まれる同一データ(情報)については,同符号を付してその説明を省略する。
このように,有効ビット数を用いた符合化がなされることにより,符合化前は256ビット(16×16ビット)のフレームデータ40が,51ビット(3+3×16ビット)の符号データ,即ち,約20%に圧縮された符号データ44に符合化される。
次に,前記符号化装置Bにより生成されたビットストリームE2(図8参照)を取得し,復号化可能なディジタル信号復号化装置Dの一例について,図4を参照しながら説明する。以下に,図4に示すディジタル信号復号化装置D(以下「復号化装置D」と略す)に入力されたビットストリームE2が復号化され,PCMデータとして出力されるまでの各部の処理について,処理の流れに沿って説明する。なお,前記復号化装置Cと同じ構成要素には同符号を付して表すことによりその詳細な説明を省略する。
この第2の実施の形態における復号化装置Dは前記復号化装置Cと略同様の構成を有するが,図4に示すように,ビットレンジ拡張器510と経路切換器511とを更に具備する点において構成が異なる。
先ず,前記音声復号化装置Dに入力されたビットストリームE2は、入力端子501を介してビットストリーム解読器502に入力され,ビットストリームE2のセグメントを解読して各信号成分毎に分解された後に、それら信号成分の振り分けが行われる。
具体的には,ファイルヘッダ608がヘッダ601と先頭サンプル値602に分解され,前記先頭サンプル値602がバッファ504および予測器503に振り分けられ、PCMデータの一部(先頭PCMデータ)として出力される。
ビットストリームE2に含まれるフレームデータ(1)609は,方式情報603とビット数特定情報42とビット制限情報43とに分割され,フレームデータ(2)610は方式情報605と予測係数特定情報606と残差信号情報607とに分割される。
この分割されたデータのうち,方式情報603,605,ビット制限情報43及び残差信号情報607が前記経路切換器511に出力される。一方,前記ビット数特定情報42は前記ビットレンジ拡張器510に出力される。
前記経路切換器511は,前記ビットストリーム解読器502から出力された情報を予測器503或いは前記ビットレンジ拡張器510のいずれかにデータを出力するため,入力された方式情報603や入力されたフレームデータ等を参照して,経路R1と経路R2とを切り換えるものである。具体的には,入力されたデータがビット制限情報43を含むものであるか,残差信号情報607を含むものであるかどうかを判定し,ビット制限情報43を含むものである場合には経路R2に切り換えられ,残差信号情報607を含むものである場合には経路R1に切り換えられる。このようにして,データが各部に振り分けられる。なお,前記予測器503で行われる処理については前記復号化装置Cの説明を参照されたい。
前記ビットレンジ拡張器510にビット制限情報43が出力されると,該ビットレンジ拡張器510では,入力したビット制限情報43の制限を該ビット制限情報43に対応するビット数特定情報42に基づいて元のフレームデータに拡張(復号化)する処理が実行される。例えば,図5に示すように,3ビットからなるビット数特定情報42を得てビット制限情報43を,1サンプル16ビットのサンプルデータが16集合したフレームデータ40に拡張する処理が行われる。その後,元に復号化されたフレームデータ40がバッファ504に転送され,前記バッファ504に格納されたフレームデータ40が,該バッファ504の出力信号として出力端子508を介して出力されることにより,PCMデータへの復号化が完了する。
この第2の実施の形態における復号化装置Dは前記復号化装置Cと略同様の構成を有するが,図4に示すように,ビットレンジ拡張器510と経路切換器511とを更に具備する点において構成が異なる。
先ず,前記音声復号化装置Dに入力されたビットストリームE2は、入力端子501を介してビットストリーム解読器502に入力され,ビットストリームE2のセグメントを解読して各信号成分毎に分解された後に、それら信号成分の振り分けが行われる。
具体的には,ファイルヘッダ608がヘッダ601と先頭サンプル値602に分解され,前記先頭サンプル値602がバッファ504および予測器503に振り分けられ、PCMデータの一部(先頭PCMデータ)として出力される。
ビットストリームE2に含まれるフレームデータ(1)609は,方式情報603とビット数特定情報42とビット制限情報43とに分割され,フレームデータ(2)610は方式情報605と予測係数特定情報606と残差信号情報607とに分割される。
この分割されたデータのうち,方式情報603,605,ビット制限情報43及び残差信号情報607が前記経路切換器511に出力される。一方,前記ビット数特定情報42は前記ビットレンジ拡張器510に出力される。
前記経路切換器511は,前記ビットストリーム解読器502から出力された情報を予測器503或いは前記ビットレンジ拡張器510のいずれかにデータを出力するため,入力された方式情報603や入力されたフレームデータ等を参照して,経路R1と経路R2とを切り換えるものである。具体的には,入力されたデータがビット制限情報43を含むものであるか,残差信号情報607を含むものであるかどうかを判定し,ビット制限情報43を含むものである場合には経路R2に切り換えられ,残差信号情報607を含むものである場合には経路R1に切り換えられる。このようにして,データが各部に振り分けられる。なお,前記予測器503で行われる処理については前記復号化装置Cの説明を参照されたい。
前記ビットレンジ拡張器510にビット制限情報43が出力されると,該ビットレンジ拡張器510では,入力したビット制限情報43の制限を該ビット制限情報43に対応するビット数特定情報42に基づいて元のフレームデータに拡張(復号化)する処理が実行される。例えば,図5に示すように,3ビットからなるビット数特定情報42を得てビット制限情報43を,1サンプル16ビットのサンプルデータが16集合したフレームデータ40に拡張する処理が行われる。その後,元に復号化されたフレームデータ40がバッファ504に転送され,前記バッファ504に格納されたフレームデータ40が,該バッファ504の出力信号として出力端子508を介して出力されることにより,PCMデータへの復号化が完了する。
A,B…ディジタル信号符号化装置
C,D…ディジタル信号復号化装置
201…バッファ
202…予測器
203…符号器
204…符号長計算/選択器
205…ビットストリーム生成器
210…予測係数テーブル
212…減算器
213…メモリ部
502…ビットストリーム解読器
503…予測器
504…バッファ
505…予測係数形成部
507…予測係数テーブル
509…メモリ部
510…ビットレンジ拡張部
511…経路切換器
C,D…ディジタル信号復号化装置
201…バッファ
202…予測器
203…符号器
204…符号長計算/選択器
205…ビットストリーム生成器
210…予測係数テーブル
212…減算器
213…メモリ部
502…ビットストリーム解読器
503…予測器
504…バッファ
505…予測係数形成部
507…予測係数テーブル
509…メモリ部
510…ビットレンジ拡張部
511…経路切換器
Claims (7)
- 入力されるディジタル信号を可逆符号化するディジタル信号符号化装置であって,
入力される前記ディジタル信号を所定サンプル数毎に取得するサンプル取得手段と,
複数の予測係数が適用され,それぞれの予測係数により過去のディジタル信号から現在の前記ディジタル信号の予測信号を予測する少なくとも一の予測手段と,
前記予測手段により予測された予測信号と前記サンプル取得手段により現実に取得された所定サンプル数の現在のディジタル信号との間の残差信号を算出する少なくとも一の残差信号算出手段と,
前記残差信号算出手段により算出された残差信号と該残差信号の算出に使用された前記予測信号を予測する際に適用された前記予測係数を特定する予測係数特定情報とを符号化する少なくとも一の第1の符号化手段と,
前記サンプル取得手段により取得された所定サンプル数のディジタル信号を前記予測手段を介さずに符号化する第2の符号化手段と,
前記第1の符号化手段および前記第2の符号化手段により得られる符号の符号長に基づいて,前記第1の符号化手段および前記第2の符号化手段のいずれか一を選択する符号化選択手段と,
を具備してなることを特徴とするディジタル信号符号化装置。 - 前記サンプル取得手段により取得された所定サンプル数のディジタル信号の有効ビット数を検出する有効ビット数検出手段を更に備え,
前記第2の符号化手段が,
前記有効ビット数検出手段により検出された有効ビット数と該有効ビット数を特定する有効ビット数特定情報とを符号化するものである請求項1に記載のディジタル信号符号化装置。 - 前記予測手段における予測係数には,前記サンプル取得手段で取得された所定サンプル数の前記ディジタル信号から線形予測分析により計算された予測係数が含まれてなる請求項1に記載のディジタル信号符号化装置。
- 前記予測手段における予測係数には,前記サンプル取得手段で取得された所定サンプル数の前記ディジタル信号から線形予測分析により計算された予測係数を基にベクトル量子化した予測係数が含まれてなる請求項1に記載のディジタル信号符号化装置。
- 前記予測手段における予測係数には,前記符合化選択手段により過去に選択された第1の符合化手段で用いられた前記予測係数が含まれてなる請求項1に記載のディジタル信号符号化装置。
- 入力されるディジタル信号を可逆符号化するディジタル信号符号化方法であって,
入力される前記ディジタル信号を所定サンプル数毎に取得するサンプル取得工程と,
複数の予測係数が適用され,それぞれの予測係数により過去のディジタル信号から現在の前記ディジタル信号の予測信号を予測する少なくとも一の予測工程と,
前記予測工程により予測された予測信号と前記サンプル取得工程により現実に取得された所定サンプル数の現在のディジタル信号との間の残差信号を算出する少なくとも一の残差信号算出工程と,
前記残差信号算出工程により算出された残差信号と該残差信号の算出に使用された前記予測信号を予測する際に適用された前記予測係数を特定する予測係数特定情報とを符号化する少なくとも一の第1の符号化工程と,
前記サンプル取得工程により取得された所定サンプル数のディジタル信号を前記予測工程を介さずに符号化する第2の符号化工程と,
前記第1の符号化工程および前記第2の符号化工程により得られる符号の符号長に基づいて,前記第1の符号化工程および前記第2の符号化工程のいずれか一を選択する符号化選択工程と,
を具備してなることを特徴とするディジタル信号符号化方法。 - 前記サンプル取得工程により取得された所定サンプル数のディジタル信号の有効ビット数を検出する有効ビット数検出工程を更に備え,
前記第2の符号化工程が,
前記有効ビット数検出工程により検出された有効ビット数と該有効ビット数を特定する有効ビット数特定情報とを符号化するものである請求項6に記載のディジタル信号符号化方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005020000A JP2006211243A (ja) | 2005-01-27 | 2005-01-27 | ディジタル信号符号化装置,ディジタル信号符号化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005020000A JP2006211243A (ja) | 2005-01-27 | 2005-01-27 | ディジタル信号符号化装置,ディジタル信号符号化方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006211243A true JP2006211243A (ja) | 2006-08-10 |
Family
ID=36967614
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005020000A Pending JP2006211243A (ja) | 2005-01-27 | 2005-01-27 | ディジタル信号符号化装置,ディジタル信号符号化方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006211243A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012111512A1 (ja) * | 2011-02-16 | 2012-08-23 | 日本電信電話株式会社 | 符号化方法、復号方法、符号化装置、復号装置、プログラム及び記録媒体 |
JP2020008875A (ja) * | 2013-01-08 | 2020-01-16 | ドルビー・インターナショナル・アーベー | 臨界サンプリングされたフィルタバンクにおけるモデル・ベースの予測 |
CN111968653A (zh) * | 2020-07-15 | 2020-11-20 | 上海今日信息科技有限公司 | 一种轻载荷双Bit自适应增量语音编码译码方法及装置 |
-
2005
- 2005-01-27 JP JP2005020000A patent/JP2006211243A/ja active Pending
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012111512A1 (ja) * | 2011-02-16 | 2012-08-23 | 日本電信電話株式会社 | 符号化方法、復号方法、符号化装置、復号装置、プログラム及び記録媒体 |
JPWO2012111512A1 (ja) * | 2011-02-16 | 2014-07-07 | 日本電信電話株式会社 | 符号化方法、復号方法、符号化装置、復号装置、プログラム及び記録媒体 |
JP5613781B2 (ja) * | 2011-02-16 | 2014-10-29 | 日本電信電話株式会社 | 符号化方法、復号方法、符号化装置、復号装置、プログラム及び記録媒体 |
JP2020008875A (ja) * | 2013-01-08 | 2020-01-16 | ドルビー・インターナショナル・アーベー | 臨界サンプリングされたフィルタバンクにおけるモデル・ベースの予測 |
JP7053545B2 (ja) | 2013-01-08 | 2022-04-12 | ドルビー・インターナショナル・アーベー | 臨界サンプリングされたフィルタバンクにおけるモデル・ベースの予測 |
JP7053545B6 (ja) | 2013-01-08 | 2022-05-16 | ドルビー・インターナショナル・アーベー | 臨界サンプリングされたフィルタバンクにおけるモデル・ベースの予測 |
US11651777B2 (en) | 2013-01-08 | 2023-05-16 | Dolby International Ab | Model based prediction in a critically sampled filterbank |
US11915713B2 (en) | 2013-01-08 | 2024-02-27 | Dolby International Ab | Model based prediction in a critically sampled filterbank |
CN111968653A (zh) * | 2020-07-15 | 2020-11-20 | 上海今日信息科技有限公司 | 一种轻载荷双Bit自适应增量语音编码译码方法及装置 |
CN111968653B (zh) * | 2020-07-15 | 2023-10-27 | 上海今日信息科技有限公司 | 一种轻载荷双Bit自适应增量语音编码译码方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100818268B1 (ko) | 오디오 데이터 부호화 및 복호화 장치와 방법 | |
KR100561869B1 (ko) | 무손실 오디오 부호화/복호화 방법 및 장치 | |
KR101343267B1 (ko) | 주파수 세그먼트화를 이용한 오디오 코딩 및 디코딩을 위한 방법 및 장치 | |
KR101330362B1 (ko) | 오디오 인코딩 방법, 오디오 디코딩 방법 및 오디오 인코더 디바이스 | |
JP6450802B2 (ja) | 音声符号化装置および方法 | |
JP5530454B2 (ja) | オーディオ符号化装置、復号装置、方法、回路およびプログラム | |
JP5688861B2 (ja) | レベル・モードとラン・レングス/レベル・モードの間での符号化を適応させるエントロピー符号化 | |
WO2002103685A1 (fr) | Appareil et procede de codage, appareil et procede de decodage et programme | |
KR20120125513A (ko) | 일반 오디오 및 음성 프레임들을 포함하는 오디오 신호를 위한 인코더 | |
KR20050087956A (ko) | 무손실 오디오 부호화/복호화 방법 및 장치 | |
JP3824607B2 (ja) | 時間−周波数相関性を利用した改善されたオーディオ符号化及び/または復号化方法とその装置 | |
US7444289B2 (en) | Audio decoding method and apparatus for reconstructing high frequency components with less computation | |
Liebchen | An introduction to MPEG-4 audio lossless coding | |
JP2006211243A (ja) | ディジタル信号符号化装置,ディジタル信号符号化方法 | |
JP2008203315A (ja) | オーディオ符号化・復号化装置、方法、及びソフトウェア | |
JP2006003580A (ja) | オーディオ信号符号化装置及びオーディオ信号符号化方法 | |
JP2004246038A (ja) | 音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、および復号化プログラム | |
JP4195598B2 (ja) | 符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、復号化プログラム | |
CN113129913A (zh) | 音频信号的编解码方法和编解码装置 | |
Hidayat et al. | A critical assessment of advanced coding standards for lossless audio compression | |
JP4438655B2 (ja) | 符号化装置、復号装置、符号化方法及び復号方法 | |
JP2004170494A (ja) | 音声符号化装置,音声符号化方法 | |
KR20080092823A (ko) | 부호화/복호화 장치 및 방법 | |
JPH0918348A (ja) | 音響信号符号化装置及び音響信号復号装置 | |
JP2006195066A (ja) | 符号化オーディオ信号の再生装置及び再生方法 |