JP2003195898A

JP2003195898A - 音声データ処理装置、方法及びプログラム

Info

Publication number: JP2003195898A
Application number: JP2001400597A
Authority: JP
Inventors: Norio Suzuki; 典雄鈴木
Original assignee: Yamaha Corp
Current assignee: Yamaha Corp
Priority date: 2001-12-28
Filing date: 2001-12-28
Publication date: 2003-07-09
Anticipated expiration: 2021-12-28
Also published as: JP3624884B2

Abstract

(57)【要約】【課題】音声データを入出力が異なるサンプリング周
波数で符号化、復号する装置を、ハードウェア構成とす
る場合は、回路規模を縮小し、ソフトウェア構成とする
場合は、高速処理を可能にする音声データ処理装置を得
る。【解決手段】サンプリング周波数Ｆs ／２＝１６ＫＨ
ｚの入力音声データを符号化してＦs ＝３２ＫＨｚの符
号化音声データを得る場合、ゼロ挿入部１により入力音
声データのサンプルとサンプルの間に１個のゼロデータ
を挿入して、サンプリング周波数を３２ＫＨｚに変換す
る。この周波数変換されたデータには、１６／２ＫＨｚ
以上のエイリアス成分が含まれているが、これをそのま
まサブバンド解析フィルタバンク２に入力して複数の帯
域信号に分割する。次に、複数の帯域信号のうち８ＫＨ
ｚより高い周波数成分を帯域制限部３により除去した
後、符号化部４で圧縮符号化することにより、３２ＫＨ
ｚの符号化音声データを得ることができる。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、音声データを符号
化する符号化装置、符号化音声データを復号する復号装
置として用いられる音声データ処理装置、方法及びプロ
グラムに関し、特に、入力サンプリング周波数と異なる
出力サンプリング周波数のデータを得る場合に用いて好
適なものである。

【０００２】

【従来の技術】従来、サンプリング周波数Ｆs の音声デ
ータ（オーディオデータ）を帯域分割符号化方式により
圧縮符号化する符号化装置を用いて、サンプリング周波
数Ｆs／ｎの音声データを符号化できるようにする場
合、図８のような構成としていた。ここでは、例えばｎ
＝２とし、Ｆs ＝３２ＫＨｚの音声データを扱う符号化
装置を用いて、Ｆs ／２＝１６ＫＨｚの音声データを符
号化してＦs ＝３２ＫＨｚの符号化音声データを得る場
合について説明する。

【０００３】図８において、Ｆs ／２＝１６ＫＨｚの音
声データが入力されると、リサンプラ部１００におい
て、ゼロ挿入部１０１によりサンプルとサンプルの間に
ｎ−１個（この例では１個）のゼロデータが挿入される
ことにより、Ｆs ＝３２ＫＨｚに周波数変換される。も
し、このゼロデータが挿入されたデータをそのままエン
コーダ部２００のサブバンド解析フィルタバンク２０１
に入力すると、ゼロデータを挿入したことによる本来出
てこないはずの１６／２＝８ＫＨｚ以上のエイリアス成
分が現れてしまう。

【０００４】そこで、次にＬＰＦ（ローパスフィルタ）
からなる補間フィルタ１０２により上記エイリアス成分
を除去した後、サブバンド解析フィルタバンク２０１に
入力する。サブバンド解析フィルタバンク２０１におい
ては、補間フィルタ１０２の出力が複数の帯域に分割さ
れる。分割された複数の帯域信号は符号化部２０２で圧
縮符号化され、Ｆs ＝３２ＫＨｚの符号化音声データと
して出力される。

【０００５】また従来、帯域分割符号化方式で圧縮符号
化されたサンプリング周波数Ｆs の符号化音声データを
復号する復号装置を用いて、サンプリング周波数Ｆs ／
ｎの復号された音声データを出力できるようにする場合
は、図９のような構成としていた。例えばｎ＝２とし、
Ｆs ＝３２ＫＨｚの符号化音声データを扱う復号装置を
用いて、Ｆs ／２＝１６ＫＨｚの音声データを出力する
場合について説明する。

【０００６】図９において、Ｆs ＝３２ＫＨｚの圧縮符
号化された音声データが入力されると、デコーダ部３０
０において、復号部３０１により各帯域毎に復号された
後、サブバンド合成フィルタバンク３０２により各帯域
信号が合成される。この帯域合成出力はリサンプリング
部４００のＬＰＦ４０１によりＦs ／２ｎ＝８ＫＨｚ以
上の周波数成分を除去された後、間引き部４０２で間引
き処理（デシメーション処理）がなされることにより、
Ｆs ／２＝１６ＫＨｚに周波数変換された音声データを
得ることができる。

【０００７】このような符号化装置及び復号装置の構成
は、処理能力の高いＤＳＰ（デジタル信号処理装置）等
を用いたハードウェア構成としたり、あるいはＣＰＵを
用いたソフトウェア構成とすることができる。

【０００８】

【発明が解決しようとする課題】上述した図８の符号化
装置の構成では、音声データが補間フィルタ１０２とサ
ブバンド解析フィルタバンク２０１の２つのフィルタを
通る。また、リサンプラ部１００で１６ＫＨｚ→３２Ｋ
Ｈｚに周波数変換されたデータには、０〜１６／２ＫＨ
ｚの信号成分が含まれ、８ＫＨｚ以上はエイリアス成分
となっている。従って、後段のサブバンド解析フィルタ
バンク２０１の出力のうち上半分である８ＫＨｚ以上の
周波数成分は無駄なものとなっている。

【０００９】また、図９の復号装置の構成では、復号さ
れたデータがサブバンド合成フィルタバンク３０２とＬ
ＰＦ４０１の２つのフィルタを通る。また、サブバンド
合成フィルタ３０２の出力における８ＫＨｚより高い周
波数成分はＬＰＦ４０１で除去されるので、サブバンド
合成フィルタバンク２０１の出力のうち上記８ＫＨｚよ
り高い周波数成分は無駄なものとなっている。

【００１０】従って、従来の符号化装置及び復号装置
は、上記の理由により無駄な演算が多くなり、このた
め、符号化装置及び復号装置をハードウェア構成とする
場合は、回路規模が増大し、ソフトウェア構成とする場
合は、処理速度が低下する等の問題があった。

【００１１】本発明は上記の問題を解決するためになさ
れたもので、ハードウェア構成とする場合は、回路規模
を縮小することができ、ソフトウェア構成とする場合
は、処理速度を向上させることができる符号化装置、復
号装置等の音声データ処理装置、方法、及びこの装置を
ソフトウェア構成とする場合にＣＰＵが実行するプログ
ラムを提供することを目的としている。

【００１２】

【課題を解決するための手段】上記の目的を達成するた
めに、本発明による符号化装置としての音声データ処理
装置は、サンプリング周波数Ｆs ／ｎ（ｎ＞１）の入力
音声データのサンプルとサンプルとの間にｎ−１個のゼ
ロデータを挿入してサンプリング周波数Ｆs の音声デー
タに変換するゼロデータ挿入手段と、前記変換されたサ
ンプリング周波数Ｆs の音声データを複数の帯域信号に
分割するサブバンド解析フィルタバンクと、前記複数の
帯域信号からＦs ／２ｎ以上の帯域信号を除去する帯域
制限手段と、前記帯域信号を除去された音声データを符
号化する符号化手段とを設けたものである。

【００１３】また、本発明による符号化装置としての音
声データ処理装置は、サンプリング周波数Ｆs ／ｎの入
力音声データのサンプルとサンプルとの間にｎ−１個の
ゼロデータを挿入してサンプリング周波数Ｆs の音声デ
ータに変換するゼロデータ挿入手段と、前記変換された
サンプリング周波数Ｆs の音声データを複数の帯域信号
に分割するサブバンド解析フィルタバンクと、前記複数
の帯域信号をそれぞれ正規化して正規化データを得る正
規化手段と、前記正規化データを所定の割当てられたビ
ット数で量子化して量子化データを得る量子化手段と、
前記量子化手段に所定のビット数を割当て、その際、前
記複数の帯域信号のうちＦs ／２ｎ以上の帯域信号に対
応する正規化データに対してゼロビットを割当てるビッ
ト割当手段とを設けたものである。

【００１４】また、本発明による復号装置としての音声
データ処理装置は、サンプリング周波数Ｆs の符号化音
声データを複数の帯域毎に復号する復号化手段と、前記
復号された音声データのＦs ／２ｎ以上の帯域信号を除
去する帯域制限手段と、前記帯域信号を除去された音声
データの残りの帯域信号を合成するサブバンド合成フィ
ルタバンクと、前記合成された音声データを間引きして
サンプリング周波数Ｆs ／ｎの音声データに変換する間
引き手段とを設けたものである。

【００１５】また、本発明による復号装置としての音声
データ処理装置は、サンプリング周波数Ｆs の符号化音
声データを複数の帯域毎に復号する復号化手段と、前記
復号された音声データを逆量子化して逆量子化データを
得る逆量子化手段と、前記逆量子化データを所定のレベ
ルに制御し、その際、Ｆs ／２ｎ以上の帯域と対応する
逆量子化データをゼロレベルに制御するレベル制御手段
と、前記レベル制御された帯域毎のデータを合成して帯
域合成データを得るサブバンド合成フィルタと、前記帯
域合成データを間引きしてサンプリング周波数Ｆs ／ｎ
の音声データを得る間引き手段とを設けたものである。

【００１６】また、本発明による符号化を行うための音
声データ処理方法は、サンプリング周波数Ｆs ／ｎの入
力音声データのサンプルとサンプルとの間にｎ−１個の
ゼロデータを挿入してサンプリング周波数Ｆs の音声デ
ータに変換するステップと、前記変換されたサンプリン
グ周波数Ｆs の音声データを複数の帯域信号に分割する
ステップと、前記複数の帯域信号からＦs ／２ｎ以上の
帯域信号を除去するステップと、前記帯域信号を除去さ
れた音声データを符号化するステップとを設けたもので
ある。

【００１７】また、本発明による復号を行うための音声
データ処理方法は、サンプリング周波数Ｆs の符号化音
声データを複数の帯域毎に復号するステップと、前記復
号された音声データのＦs ／２ｎ以上の帯域信号を除去
するステップと、前記帯域信号を除去された音声データ
の残りの帯域信号を合成するステップと、前記合成され
た音声データを間引きしてサンプリング周波数Ｆs ／ｎ
の音声データに変換するステップとを設けたものであ
る。

【００１８】また、本発明による符号化を行うためのプ
ログラムは、サンプリング周波数Ｆs ／ｎの入力音声デ
ータのサンプルとサンプルとの間にｎ−１個のゼロデー
タを挿入してサンプリング周波数Ｆs の音声データに変
換する処理と、前記変換されたサンプリング周波数Ｆs
の音声データを複数の帯域信号に分割する処理と、前記
複数の帯域信号からＦs ／２ｎ以上の帯域信号を除去す
る処理と、前記帯域信号を除去された音声データを符号
化する処理とをコンピュータに実行させるためのもので
ある。

【００１９】また、本発明による復号を行うためのプロ
グラムは、サンプリング周波数Ｆsの符号化音声データ
を複数の帯域毎に復号する処理と、前記復号された音声
データのＦs ／２ｎ以上の帯域信号を除去する処理と、
前記帯域信号を除去された音声データの残りの帯域信号
を合成する処理と、前記合成された音声データを間引き
してサンプリング周波数Ｆs ／ｎの音声データに変換す
る処理とをコンピュータに実行させるためのものであ
る。

【００２０】

【作用】従って、本発明によれば、符号化を行う場合
は、サブバンド解析フィルタバンクにより帯域分割した
後に帯域制限を行ってエイリアス成分を除去するので、
従来のようにフィルタ処理を２回行わずに済み、処理を
速くできる。また、上記帯域制限は、エイリアス成分の
帯域に対して量子化の際にゼロビットを割当てるだけな
ので、回路構成を簡単にして容易に実現することができ
る。

【００２１】また、復号を行う場合は、サブバンド合成
フィルタで帯域合成する前に帯域制限を行ってエイリア
ス成分の帯域を除去するので、フィルタ処理を２回行わ
ずに済み、処理を速くできる。また、上記帯域制限は、
エイリアス成分の帯域をゼロレベルに制御するだけなの
で、回路構成を簡単にして容易に実現することができ
る。

【００２２】

【発明の実施の形態】以下、本発明の実施の形態を図面
と共に説明する。図１は本発明の第１の実施の形態によ
る符号化装置を概念的に示すブロック図である。１はサ
ンプリング周波数Ｆs ／ｎの入力音声データにゼロデー
タを挿入してサンプリング周波数Ｆs に変換するゼロ挿
入部である。２はＦs に変換された音声データを複数の
帯域信号に分割するサブバンド解析フィルタバンクであ
る。３は複数の帯域信号を帯域制限してエイリアス成分
を除去する帯域制限部である。４はエイリアス成分が除
去された音声データをサンプリング周波数Ｆs で圧縮符
号化する符号化部である。

【００２３】次に、上記構成による動作について説明す
る。ここでは、図示の符号化装置が、本来はサンプリン
グ周波数Ｆs の音声データを帯域分割方式により圧縮符
号化する符号化装置であって、この符号化装置を用いて
Ｆs ／ｎの音声データを符号化してＦs の符号化音声デ
ータを得るものとする。例としてｎ＝２とし、Ｆs ／２
＝１６ＫＨｚの音声データを符号化してＦs ＝３２ＫＨ
ｚの符号化音声データを得る場合について説明する。

【００２４】図１において、Ｆs ／２＝１６ＫＨｚの音
声データが入力されると、ゼロ挿入部１によりサンプル
とサンプルの間にｎ−１個（この例では１個）のゼロデ
ータを挿入する。従って、音声データのサンプル数がｎ
個になり、サンプリング周波数がＦs ／２からＦs ＝３
２ＫＨｚに周波数変換される。

【００２５】この周波数変換されたデータには、図２
（ａ）に示す元のデータのスペクトルに対して、同図
（ｂ）に示すようにＦs ／２ｎ（＝８ＫＨｚ）以上のエ
イリアス成分が含まれているが、これをそのままサブバ
ンド解析フィルタバンク２に入力して、複数の帯域信号
に分割する。次に、複数の帯域信号のうち８ＫＨｚより
高い周波数成分を帯域制限部３により除去する。その
後、符号化部２０２で圧縮符号化することにより、Ｆs
＝３２ＫＨｚの符号化音声データが出力される。

【００２６】本実施の形態においては、サンプリング周
波数が変換されたデータをエイリアス成分を含んだまま
サブバンド解析フィルタバンク２で処理した後、帯域制
限部３でエイリアス成分を除去しているので、図８の従
来の符号化装置における補間フィルタ１０２による処理
を省略することができる。また、帯域制限部３として
は、後述する図４のビット割当部２１においてビット割
当てをしない、あるいはスケールファクタ抽出・正規化
部１８においてスケールファクタをゼロにする等の方法
により、容易に実現することができる。従って、本実施
の形態によれば、処理を高速に行うことかできると共
に、回路規模を縮小することができる。

【００２７】図３は本発明の第２の実施の形態による復
号装置を概念的に示すブロック図である。図３におい
て、５はサンプリング周波数Ｆs の音声データを帯域毎
に復号する復号部、６は復号されたデータのエイリアス
成分を除去する帯域制限部、７は帯域制限されたデータ
の各帯域信号を合成するサブバンド合成フィルタバン
ク、７は帯域合成された音声データを間引きする間引き
部である。

【００２８】次に、上記構成による動作について説明す
る。ここでは、図示の復号装置が、本来はサンプリング
周波数Ｆs の帯域分割方式により圧縮符号化された音声
データを復号してＦs の音声データを出力する復号装置
であって、この復号装置を用いてＦs ／ｎの音声データ
を出力するものとする。例としてｎ＝２とし、Ｆs ＝３
２ＫＨｚの符号化音声データを復号してＦs ／ｎ＝１６
ＫＨｚの音声データを出力する場合について説明する。

【００２９】図３において、復号部５は、入力されたＦ
s ＝３２ＫＨｚの圧縮符号化された音声データを帯域毎
に復号する。もしこの復号されたデータをそのままサブ
バンド合成フィルタ７に入力して処理し、さらに間引き
処理すると、出力にエイリアス成分が折り返し雑音とな
って帯域内に現れてしまう。このため、上記復号された
データを帯域制限部６でエイリアス成分に相当するＦs
／２ｎの帯域信号を除去した後、サブバンド合成フィル
タ７に入力して残りの各帯域信号を合成する。この帯域
合成された音声データは次に間引き部８で間引き処理さ
れることにより、Ｆs ／２＝１６ＫＨｚの音声データを
得ることができる。

【００３０】本実施の形態においては、復号したデータ
をサブバンド合成フィルタ７に入力する前に帯域制限部
６でエイリアス成分を除去しているので、図９のＬＰＦ
４０１による処理を省略することができる。また、帯域
制限部６としては、後述する図６の復号装置におけるレ
ベル制御部２８において、Ｆs ／２ｎ（＝８ＫＨｚ）以
上の帯域がゼロになるように制御することにより、容易
に実現することができる。従って、本実施の形態によれ
ば、処理を高速に行うことかできると共に、回路規模を
縮小することができる。

【００３１】図４は本発明の第３の実施の形態を示すブ
ロック図であり、図１に概念的に示した符号化装置の具
体的な構成例を示すものである。この符号化装置は、サ
ンプリング周波数Ｆs の音声データを帯域分割方式によ
り圧縮符号化してＦs の符号化音声データを出力する従
来の構成部分と、サンプリング周波数Ｆs ／ｎの音声デ
ータを圧縮符号化してＦs の符号化音声データを出力す
る本発明に関する構成部分とを含むものである。

【００３２】図４において、１１はアナログ音声信号が
入力される入力端子、１２はアナログ音声信号から折り
返し雑音となるエイリアス成分を除去するＬＰＦ、１３
はＬＰＦ１２の出力をサンプリング周波数Ｆs でＡ／Ｄ
変換してデジタルの音声データを出力するＡ／Ｄ変換器
である。１４はＦs ／ｎのデジタルの音声データが入力
される入力端子、１５は上記入力音声データのサンプル
とサンプルの間にｎ−１個のゼロデータを挿入してＦs
の音声データに周波数変換するゼロ挿入部である。１６
はＡ／Ｄ変換器１３の出力又はゼロ挿入部１５の出力を
選択するセレクタである。

【００３３】１７は入力音声データを複数帯域に分割す
るサブバンド解析フィルタバンク、１８は複数の帯域信
号を正規化すると共に、その正規化データのスケールフ
ァクタインデックスを求めるスケールファクタ抽出・正
規化部、１９は帯域毎の正規化データを割り当てられた
ビット数で量子化する量子化部、２０は心理聴覚モデル
を使用して入力音声データの耳に聞こえる程度を帯域毎
に求める心理聴覚分析部で、ＦＦＴ（Ｆast Fourier Tr
asform，高速フーリエ変換）処理を行うＦＦＴ処理部
（図示せず）を前処理部として内蔵するものとする。

【００３４】２１は量子化部１９の量子化に際して各帯
域に何ビットを割り当てるかを、心理聴覚分析部２０の
分析結果に基づいて決定するビット割当部、２２はＦs
の入力音声データとＦs ／２の入力音声データとの切り
換え制御信号が入力される入力端子である。２３は量子
化されたデータと制御情報等をビットストリームに組み
立てるビットストリームエンコーダ、２４は符号化音声
データ及び制御情報等を含むビットストリームを出力す
る出力端子である。

【００３５】上記従来の構成部分は、上記１１，１２，
１３，１７〜２１，２３，２４の部分であり、上記本発
明に関する構成部分は、上記１４，１５，１６，２２の
部分である。

【００３６】次に、上記構成による動作について説明す
る。ここでは、ｎ＝２，Ｆs ＝３２ＫＨｚとして説明す
る。まず、入力端子１１にアナログの音声信号が入力さ
れた場合の従来の構成部分の動作について説明する。こ
のときセレクタ１６は入力端子２２に入力された切り換
え制御信号によりＡ／Ｄ変換器１３の出力を選択する。

【００３７】入力端子１１に入力された音声信号はＬＰ
Ｆ１２でＦs ／２以上のエイリアス成分を除去され後、
Ａ／Ｄ変換器１３でＦs ＝３２ＫＨｚでサンプリングさ
れることにより、０〜Ｆs ／２の帯域（０〜１６ＫＨ
ｚ）に有効データを有するデジタルの音声データに変換
される。この音声データはセレクタ１６を介してサブバ
ンド解析フィルタバンク１７と心理聴覚分析部２０に入
力される。

【００３８】サブバンド解析フィルタバンク１７は、そ
れぞれ通過帯域の異なるａ個の並列に設けられた帯域フ
ィルタで構成され、音声データが各帯域フィルタに共通
に入力されることにより、Ｆs ／２の帯域がａ個の帯域
信号に分割される。従って、各帯域フィルタからａ個の
実数の組が得られる。以下の説明においては、サブバン
ド解析フィルタバンク１７から出力されるａ個のサンプ
ル（実数）を１組とし、これをｂ組、組み合わせたサン
プル数ａｂ個のデータを１フレームと言うものとする。

【００３９】次に、スケールファクタ抽出・正規化部１
８では、１フレーム内で、各帯域におけるｂ個の実数に
ついて絶対値が最大の実数を求め、さらに、この絶対値
が最大の実数を１として、他の実数の正規化を行う。従
って、各帯域について−１．０００〜＋１．０００の実
数で表わされる正規化データが得られる。次に、その帯
域の正規化データにおける１が示す実際の値（即ち、絶
対値が最大の実数）を２進数で表現する場合の値（例え
ば、絶対値が最大の実数が８なら２進数で８、１０なら
２進数で１６、１２０なら２進数で１２８等々）をスケ
ールファクタとしてスケールファクタインデックスと対
応して記載されたスケールファクタテーブルから各帯域
におけるスケールファクタインデックスを求めておく。

【００４０】一方、心理聴覚分析部２０では、まず前処
理として、Ａ／Ｄ変換器１３からの１フレーム分のデー
タであるａｂ個のサンプルについてＦＦＴ処理を行う。
この分析の結果、Ｆs ／２の帯域のデータが有効である
ので、ａｂ／２個の複素数で表される有効データが得ら
れる。ここで、各複素数の絶対値を求めておく。

【００４１】次に、上記ａｂ／２個の有効データから次
の条件に基づいて耳に聞こえるであろう音をレベル別に
選択する。（１）大きな帯域成分は多分聞こえる。（２）（１）の成分の周りの音は聞こえ難い。（３）小さな成分は聞こえ難い。（４）（１）〜（３）に、さらに耳の周波数特性（聴覚
特性）を考慮する。

【００４２】上記のようにして聞こえる音のレベルを段
階的に示すデータを得、これをさらに対応する帯域毎に
まとめる。そして、各帯域について上記データを各段階
毎に数値化する。例えば２倍のレベル差をｄＢ（６ｄＢ
で２倍）で表す。

【００４３】次に、ビット割当部２１は、上記ｄＢで表
わされた各段階に対してビット数を割り当てる。例えば
６ｄＢについて１ビットを割り当て、レベル差が大きく
なる程ビット数を多く割当てる。また、総ビット数が所
定のビット数に収まるようにする。従って、このビット
割当部２１からは、帯域毎に何ビットを割当てるかを示
すビット割当情報が出力される。

【００４４】次に、量子化部１９は、スケールファクタ
抽出・正規化部１８から得られる前記正規化データを上
記ビット割当情報により割当てられたビット数で２進数
に変換し、小数点以下を割当てられたビット数だけ取り
出す。

【００４５】次に、ビットストリームエンコーダ２３に
おいて、１フレーム毎にヘッダ部と量子化データ部とが
作成される。ヘッダ部には、前記絶対値が最大の実数を
何ビットで表したかを帯域毎に示す情報が所定ビット数
で記載される。また、上記量子化データ部は、上記ビッ
ト割当情報としてのビットアロケーション情報、帯域毎
の前記スケールファクタインデックス情報等が所定ビッ
ト数で記載され、その後に量子化データが続くようなデ
ータ構成となっている。これらの情報は、スケールファ
クタ抽出・正規化部１８、ビット割当部２１及び量子化
部１９から得られるもので、復号装置により符号化音声
データを復号する際に必要な制御情報として用いられ
る。上記ヘッダ部及び量子化データ部はビットストリー
ムに組み立てられて、出力端子２４からＦs ＝３２ＫＨ
ｚの符号化音声データとして出力される。

【００４６】次に、入力端子１４にＦs ＝１６ＫＨｚの
音声データが入力された場合、即ち、本発明に関する場
合について図５のフローチャートを参照して説明する。
このときセレクタ１６は入力端子２２からの切り換え制
御信号によりゼロ挿入部１５の出力を選択する。

【００４７】入力された音声データは、ゼロ挿入部１５
でサンプルとサンプルの間にｎ−１個（この例では１
個）のゼロデータが挿入されることにより、Ｆs ＝３２
ＫＨｚに変換される（図５のステップＳ１、以下、ステ
ップ略）。これにより、以下の処理を従来と同等に行う
ことができる。尚、このゼロデータが挿入された音声デ
ータは、１６／２＝８ＫＨｚ以上のエイリアス成分を含
んでいる。この音声データはセレクタ１６を介してサブ
バンド解析フィルタバンク１７と心理聴覚分析部２０に
入力される。

【００４８】サブバンド解析フィルタバンク１７では、
前述したように入力音声データはａ個の帯域信号に分割
される（Ｓ２）。分割された帯域信号は次にスケールフ
ァクタ抽出・正規化部１８に入力されて正規化が行われ
ると共に、スケールファクタインデックスが求められる
（Ｓ３）。

【００４９】一方、心理聴覚分析部２０により帯域毎に
耳に聞こえる音を段階的に示す情報が得られ、この情報
に基づいてビット割当部２１が正規化データにビット割
当てを行うが、その際、前記切り換え制御信号に応じて
上記８ＫＨｚ以上のエイリアス成分の帯域についてはビ
ットを割り当てないようにする（Ｓ４）。

【００５０】次に、量子化部１９で正規化データの量子
化を行うが（Ｓ５）、その場合、上記エイリアス成分の
帯域については量子化が省略される。即ち、エイリアス
成分の帯域の割当てビット数を強制的にゼロにすること
により、エイリアス成分を除去することができる。次
に、量子化部１９からの量子化データは、ビットストリ
ームエンコーダ２３において、制御情報と共にビットス
トリームに組み立てられて出力される（Ｓ６）。

【００５１】尚、前記切り換え制御信号に応じてスケー
ルファクタ抽出・正規化部１８における正規化等の処理
をエイリアス成分の帯域については行わないようにすれ
ば、量子化部１９では自動的にその帯域の量子化が行わ
れないので、割当てビット数をゼロにした場合と同等の
効果が得られる。

【００５２】本実施の形態によれば、サンプリング周波
数Ｆs の符号化装置を用いてＦs ／ｎの入力音声データ
を圧縮符号化してＦs の符号化音声データを得ることが
できる。従って、この符号化音声データをサンプリング
周波数Ｆs の符号化音声データを扱う復号装置を用いて
通常の復号処理を行うことができる。また、エイリアス
成分については、量子化や正規化等の処理を行わないよ
うにしているので、全体の処理量を削減できると共に、
簡単な回路、あるいは処理を付加するだけで実現するこ
とができる。

【００５３】図６は本発明の第４の実施の形態を示すブ
ロック図であり、図３に概念的に示した復号装置の具体
的な構成例を示すものである。この復号装置は、サンプ
リング周波数Ｆs の圧縮符号化された音声データを復号
してＦs の音声データを出力する従来の構成部分と、サ
ンプリング周波数Ｆsの圧縮符号化された音声データを
復号してＦs ／ｎの音声データを出力する本発明に関す
る構成部分とを含むものである。

【００５４】図６において、２５はサンプリング周波数
Ｆs の符号化音声データのビットストリームが入力され
る入力端子、２６は入力されたビットストリームから量
子化データと、ビットアロケーション情報及びスケール
ファクタインデックス情報等の制御情報とを分離するビ
ットストリームデコーダ、２７は量子化データをビット
アロケーション情報に基づいて逆量子化して元の正規化
データ（実数）を出力する逆量子化部、２８は逆量子化
された実数データをスケールファクタに基づいてレベル
制御するレベル制御部、２９はレベル制御されたデータ
の各帯域信号を合成するサブバンド合成フィルタ、３０
は切り換え制御信号の入力端子である。

【００５５】３１は分配器で、復号された音声データを
切り換え制御信号に応じて分配する。３２は復号された
音声データをアナログ音声信号に変換するＤ／Ａ変換
器、３３はアナログ音声信号からエイリアス成分を除去
するＬＰＦ、３４はアナログ音声信号の出力端子であ
る。３５は音声データを間引き処理してＦs ／ｎの音声
データを得る間引き部、３６は間引きされたＦs ／ｎの
音声データの出力端子である。

【００５６】上記構成において、上記２５〜２９，３２
〜３４は従来の構成部分、３０，３１，３５，３６は本
発明に関する構成部分である。

【００５７】次に、上記構成による動作について説明す
る。ここでは、ｎ＝２，Ｆs ＝３２ＫＨｚとし、Ｆs ＝
３２ＫＨｚの音声データを出力する場合と、Ｆs ＝１６
ＫＨｚの音声データを出力する場合とについて説明す
る。

【００５８】まず、Ｆs ＝３２ＫＨｚの音声データを出
力する場合について説明する。入力端子２５に帯域分割
方式によりＦs ＝３２ＫＨｚで圧縮符号化された音声デ
ータのビットストリームが入力されると、ビットストリ
ームデコーダ２６は、１フレーム毎に量子化データと、
スケールファクタインデックス情報及びビットアロケー
ション情報を含む制御情報とを分離する。この場合、１
フレームにつき、スケールファクタインデックスは１組
存在し、量子化データはｂ組存在する。次に、逆量子化
部２７は、量子化データを制御情報におけるビットアロ
ケーション情報に基づいて−１〜＋１の元の実数データ
（逆量子化データ）に逆量子化する。

【００５９】次に、レベル制御部２８は、スケールファ
クタテーブルを用いて上記スケールファクタインデック
スからスケールファクタを求め、求められたスケールフ
ァクタを上記実数データに乗算する。これにより、図４
の符号化装置におけるサブバンド解析フィルタバンク１
７の出力と同等の帯域毎の出力データが得られる。この
帯域毎の出力データをサブバンド合成フィルタバンク２
９に入力して、各帯域信号を合成する。

【００６０】この帯域合成された音声データは、入力端
子３０からの切り換え制御信号に応じて分配器３１を介
してＤ／Ａ変換器３２に供給され、アナログ音声信号に
変換される。その後、ＬＰＦ３３でエイリアス成分が除
去されて出力端子３４から出力される。

【００６１】次に、Ｆs ＝１６ＫＨｚの音声データを出
力する場合について図７のフローチャートを参照して説
明する。この場合は、入力音声データにはＦs ／２まで
の帯域のデータが含まれており、これをそのまま１／２
に間引して１６ＫＨｚにすると、１６／２＝８ＫＨｚ以
上のエイリアス成分が発生してしまう。

【００６２】まず、入力端子２５に符号化音声データの
ビットストリームが入力されると、ビットストリームデ
コーダ２６により量子化データと制御情報とに分離され
（Ｓ１１）た後、逆量子化部２７で逆量子化される（Ｓ
１２）。次に、逆量子化された実数データをレベル制御
部２８でスケールファクタインデックスを乗算するが、
このとき、前記切り換え制御信号に応じてエイリアス成
分に相当する８ＫＨｚ以上の帯域に対して強制的にゼロ
を乗算する（Ｓ１３）。

【００６３】この乗算結果をサブバンド合成フィルタバ
ンク２９で合成すれば（Ｓ１４）、エイリアス成分の帯
域が除去され、残りの帯域が合成されたデータを得るこ
とができる。この帯域合成データを前記切り換え制御信
号で制御される分配器３１を介して間引き部３５で１／
２に間引き処理することにより（Ｓ１５）、エイリアス
成分のないＦs ＝１６ＫＨｚの復号された音声データを
出力端子３６に得ることができる。

【００６４】本実施の形態によれば、サンプリング周波
数Ｆs の符号化音声データを扱う復号装置を用いて、ダ
ウンサンプリングされたサンプリング周波数Ｆs ／ｎの
復号された音声データを得ることができる。従って、こ
の音声データを後段のサンプリング周波数Ｆs ／ｎの音
声データしか扱うことのできない処理装置、例えばＤ／
Ａ変換器に入力することができる。また、エイリアス成
分の帯域についてはゼロを乗算するので、エイリアス成
分のない出力音声データを得ることができると共に、簡
単な回路、あるいは処理を付加するだけで実現すること
ができる。

【００６５】次に、本発明の実施の形態によるプログラ
ムについて説明する。本発明による符号化装置や復号装
置等の音声データ処理装置をソフトウェア構成とする場
合、図１〜図７について前述した動作に基づく処理を、
音声データ処理装置のコンピュータシステムにおけるＣ
ＰＵが実行するためのプログラムは、本発明によるプロ
グラムを構成する。

【００６６】このプログラムの記録媒体としては、光磁
気ディスク、光ディスク、半導体メモリ、磁気記録媒体
等を用いることができ、これらをＲＯＭ、ＲＡＭ、ＣＤ
−ＲＯＭ、フレキシブルディスク、メモリカード等に構
成して用いてよい。またこの記録媒体は、インターネッ
ト等のネットワークや電話回線等の通信回線を介してプ
ログラムが送信された場合のサーバやクライアントとな
るコンピュータシステム内部のＲＡＭ等の揮発性メモリ
のように、一定時間プログラムを保持するものも含まれ
る。

【００６７】また上記プログラムは、このプログラムを
記憶装置等に格納したコンピュータシステムから伝送媒
体を介して、あるいは伝送媒体中の伝送波により他のコ
ンピュータシステムに伝送されるものであってもよい。
上記伝送媒体とは、インターネット等のネットワーク
（通信網）や電話回線等の通信回線（通信線）のように
情報を伝送する機能を有する媒体をいうものとする。

【００６８】また、上記プログラムは、前述した機能の
一部を実現するためであってもよい。さらに、前述した
機能をコンピュータシステムに既に記録されているプロ
グラムとの組み合わせで実現できるもの、いわゆる差分
ファイル（差分プログラム）であってもよい。

【００６９】従って、この記録媒体を図１、図３、図
４、図６のシステム又は装置とは異なるシステム又は装
置において用い、そのシステム又は装置のコンピュータ
がこの記録媒体に格納されたプログラムを実行すること
によっても、各実施の形態で説明した機能及び効果と同
等の機能及び効果を得ることができ、本発明の目的を達
成することができる。

【００７０】

【発明の効果】以上説明したように本発明によれば、符
号化を行う場合は、サブバンド解析フィルタバンクによ
る帯域分割の後にエイリアス成分を除去するための帯域
制限を行うので、従来のようにフィルタ処理を２回行わ
ずに済み、処理を速くできる。また、帯域制限は、エイ
リアス成分の帯域の量子化の際にゼロビットを割当てる
だけなので、回路構成を簡単にして容易に実現すること
ができる。

【００７１】また、復号を行う場合は、サブバンド合成
フィルタで帯域合成する前にエイリアス成分の帯域を除
去するための帯域制限を行うので、フィルタ処理を２回
行わずに済み、処理を速くできる。また、帯域制限は、
エイリアス成分の帯域をゼロレベルに制御するだけなの
で、回路構成を簡単にして容易に実現することができ
る。

【００７２】従って、本発明によれば、音声データ処理
装置をハードウェア構成とする場合には、回路構成を簡
単にすることができ、音声データ処理装置をソフトウェ
ア構成とする場合には、処理を高速に行うことができ
る。

【図面の簡単な説明】

【図１】本発明の第１の実施の形態による符号化装置
を示すブロック図である。

【図２】図１の動作を説明するための周波数スペクト
ラムを示す図である。

【図３】本発明の第２の実施の形態による復号装置を
示すブロック図である。

【図４】本発明の第３の実施の形態による符号化装置
を示すブロック図である。

【図５】図４の符号化装置において、サンプリング周
波数Ｆs ／ｎの音声データが入力された場合における動
作を示すフローチャートである。

【図６】本発明の第４の実施の形態による復号装置を
示すブロック図である。

【図７】図５の復号装置において、サンプリング周波
数Ｆs ／ｎの音声データを出力する場合における動作を
示すフローチャートである。

【図８】従来の符号化装置を示すブロック図である。

【図９】従来の復号装置を示すブロック図である。

【符号の説明】

１：ゼロ挿入部、２：サブバンド解析フィルタバンク、
３：帯域制限部、４：符号化部、５：復号部、６：帯域
制限部、７：サブバンド合成フィルタバンク、８：間引
き部、１１：アナログ音声信号の入力端子、１４：Ｆs
／２の音声データの入力端子、１５：ゼロ挿入部、１
６：セレクタ、１７：サブバンド解析フィルタバンク、
１８：スケールファクタ抽出・正規化部、１９：量子化
部、２１：ビット割当部、２２：切り換え制御信号の入
力端子、２３：ビットストリームエンコーダ、２５：符
号化音声データの入力端子、２６：ビットストリームデ
コーダ、２７：逆量子化部、２８：レベル制御部、２
９：サブバンド合成フィルタバンク、３０：切り換え制
御信号の入力端子、３１：分配器、３４：アナログ音声
信号の出力端子、３５：間引き部、３６：Ｆs ／ｎの音
声データの出力端子

Claims

【特許請求の範囲】

【請求項１】サンプリング周波数Ｆs ／ｎ（ｎ＞１）
の入力音声データのサンプルとサンプルとの間にｎ−１
個のゼロデータを挿入してサンプリング周波数Ｆs の音
声データに変換するゼロデータ挿入手段と、前記変換されたサンプリング周波数Ｆs の音声データを
複数の帯域信号に分割するサブバンド解析フィルタバン
クと、前記複数の帯域信号からＦs ／２ｎ以上の帯域信号を除
去する帯域制限手段と、前記帯域信号を除去された音声データを符号化する符号
化手段とを設けたことを特徴とする音声データ処理装
置。
【請求項２】サンプリング周波数Ｆs ／ｎの入力音声
データのサンプルとサンプルとの間にｎ−１個のゼロデ
ータを挿入してサンプリング周波数Ｆs の音声データに
変換するゼロデータ挿入手段と、前記変換されたサンプリング周波数Ｆs の音声データを
複数の帯域信号に分割するサブバンド解析フィルタバン
クと、前記複数の帯域信号をそれぞれ正規化して正規化データ
を得る正規化手段と、前記正規化データを所定の割当てられたビット数で量子
化して量子化データを得る量子化手段と、前記量子化手段に所定のビット数を割当て、その際、前
記複数の帯域信号のうちＦs ／２ｎ以上の帯域信号に対
応する正規化データに対してゼロビットを割当てるビッ
ト割当手段とを設けたことを特徴とする音声データ処理
装置。
【請求項３】前記サンプリング周波数Ｆs に変換され
た音声データとサンプリング周波数Ｆs の入力音声デー
タとを切り換えて前記サブバンド解析フィルタバンクに
入力する切り換え手段を設け、前記ビット割当手段は、
前記サンプリング周波数Ｆs の入力音声データが入力さ
れたときは、前記Ｆs ／２ｎ以上の帯域信号に対応する
正規化データに対するゼロビットの割当ては行わないこ
とを特徴とする請求項２記載の音声データ処理装置。
【請求項４】前記正規化手段は、前記Ｆs ／２ｎ以上
の帯域信号については正規化を行わないことを特徴とす
る請求項２又は３記載の音声データ処理装置。
【請求項５】前記ビット割当て手段は、入力音声デー
タを心理聴覚モデルを用いて分析し、分析結果に基づい
てビット割当てを行うことを特徴とする請求項２，３，
又は４記載の音声データ処理装置。
【請求項６】サンプリング周波数Ｆs の符号化音声デ
ータを複数の帯域毎に復号する復号化手段と、前記復号された音声データのＦs ／２ｎ以上の帯域信号
を除去する帯域制限手段と、前記帯域信号を除去された音声データの残りの帯域信号
を合成するサブバンド合成フィルタバンクと、前記合成された音声データを間引きしてサンプリング周
波数Ｆs ／ｎの音声データに変換する間引き手段とを設
けたことを特徴とする音声データ処理装置。
【請求項７】サンプリング周波数Ｆs の符号化音声デ
ータを複数の帯域毎に復号する復号化手段と、前記復号された音声データを逆量子化して逆量子化デー
タを得る逆量子化手段と、前記逆量子化データを所定のレベルに制御し、その際、
Ｆs ／２ｎ以上の帯域と対応する逆量子化データをゼロ
レベルに制御するレベル制御手段と、前記レベル制御された帯域毎のデータを合成して帯域合
成データを得るサブバンド合成フィルタバンクと、前記帯域合成データを間引きしてサンプリング周波数Ｆ
s ／ｎの音声データを得る間引き手段とを設けたことを
特徴とする音声データ処理装置。
【請求項８】前記サブバンド合成フィルタバンクから
得られる帯域合成データをＤ／Ａ変換してアナログ音声
信号を得るＤ／Ａ変換手段と、前記帯域合成データを前
記間引き手段又はＤ／Ａ変換手段に選択的に入力する切
り換え手段とを設け、前記レベル制御手段は、前記切り
換え手段がＤ／Ａ変換手段を選択したときは前記Ｆs ／
２ｎ以上の帯域と対応する逆量子化データに対するゼロ
レベル制御は行わないことを特徴とする請求項７記載の
音声データ処理装置。
【請求項９】サンプリング周波数Ｆs ／ｎの入力音声
データのサンプルとサンプルとの間にｎ−１個のゼロデ
ータを挿入してサンプリング周波数Ｆs の音声データに
変換するステップと、前記変換されたサンプリング周波数Ｆs の音声データを
複数の帯域信号に分割するステップと、前記複数の帯域信号からＦs ／２ｎ以上の帯域信号を除
去するステップと、前記帯域信号を除去された音声デー
タを符号化するステップとを設けたことを特徴とする音
声データ処理方法。
【請求項１０】サンプリング周波数Ｆs の符号化音声
データを複数の帯域毎に復号するステップと、前記復号された音声データのＦs ／２ｎ以上の帯域信号
を除去するステップと、前記帯域信号を除去された音声データの残りの帯域信号
を合成するステップと、前記合成された音声データを間引きしてサンプリング周
波数Ｆs ／ｎの音声データに変換するステップとを設け
たことを特徴とする音声データ処理方法。
【請求項１１】サンプリング周波数Ｆs ／ｎの入力音
声データのサンプルとサンプルとの間にｎ−１個のゼロ
データを挿入してサンプリング周波数Ｆs の音声データ
に変換する処理と、前記変換されたサンプリング周波数Ｆs の音声データを
複数の帯域信号に分割する処理と、前記複数の帯域信号からＦs ／２ｎ以上の帯域信号を除
去する処理と、前記帯域信号を除去された音声データを符号化する処理
とをコンピュータに実行させるためのプログラム。
【請求項１２】サンプリング周波数Ｆs の符号化音声
データを複数の帯域毎に復号する処理と、前記復号された音声データのＦs ／２ｎ以上の帯域信号
を除去する処理と、前記帯域信号を除去された音声データの残りの帯域信号
を合成する処理と、前記合成された音声データを間引きしてサンプリング周
波数Ｆs ／ｎの音声データに変換する処理とをコンピュ
ータに実行させるためのプログラム。