JP2003195898A - 音声データ処理装置、方法及びプログラム - Google Patents

音声データ処理装置、方法及びプログラム

Info

Publication number
JP2003195898A
JP2003195898A JP2001400597A JP2001400597A JP2003195898A JP 2003195898 A JP2003195898 A JP 2003195898A JP 2001400597 A JP2001400597 A JP 2001400597A JP 2001400597 A JP2001400597 A JP 2001400597A JP 2003195898 A JP2003195898 A JP 2003195898A
Authority
JP
Japan
Prior art keywords
data
band
voice data
sampling frequency
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001400597A
Other languages
English (en)
Other versions
JP3624884B2 (ja
Inventor
Norio Suzuki
典雄 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2001400597A priority Critical patent/JP3624884B2/ja
Publication of JP2003195898A publication Critical patent/JP2003195898A/ja
Application granted granted Critical
Publication of JP3624884B2 publication Critical patent/JP3624884B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 音声データを入出力が異なるサンプリング周
波数で符号化、復号する装置を、ハードウェア構成とす
る場合は、回路規模を縮小し、ソフトウェア構成とする
場合は、高速処理を可能にする音声データ処理装置を得
る。 【解決手段】 サンプリング周波数Fs /2=16KH
zの入力音声データを符号化してFs =32KHzの符
号化音声データを得る場合、ゼロ挿入部1により入力音
声データのサンプルとサンプルの間に1個のゼロデータ
を挿入して、サンプリング周波数を32KHzに変換す
る。この周波数変換されたデータには、16/2KHz
以上のエイリアス成分が含まれているが、これをそのま
まサブバンド解析フィルタバンク2に入力して複数の帯
域信号に分割する。次に、複数の帯域信号のうち8KH
zより高い周波数成分を帯域制限部3により除去した
後、符号化部4で圧縮符号化することにより、32KH
zの符号化音声データを得ることができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声データを符号
化する符号化装置、符号化音声データを復号する復号装
置として用いられる音声データ処理装置、方法及びプロ
グラムに関し、特に、入力サンプリング周波数と異なる
出力サンプリング周波数のデータを得る場合に用いて好
適なものである。
【0002】
【従来の技術】従来、サンプリング周波数Fs の音声デ
ータ(オーディオデータ)を帯域分割符号化方式により
圧縮符号化する符号化装置を用いて、サンプリング周波
数Fs/nの音声データを符号化できるようにする場
合、図8のような構成としていた。ここでは、例えばn
=2とし、Fs =32KHzの音声データを扱う符号化
装置を用いて、Fs /2=16KHzの音声データを符
号化してFs =32KHzの符号化音声データを得る場
合について説明する。
【0003】図8において、Fs /2=16KHzの音
声データが入力されると、リサンプラ部100におい
て、ゼロ挿入部101によりサンプルとサンプルの間に
n−1個(この例では1個)のゼロデータが挿入される
ことにより、Fs =32KHzに周波数変換される。も
し、このゼロデータが挿入されたデータをそのままエン
コーダ部200のサブバンド解析フィルタバンク201
に入力すると、ゼロデータを挿入したことによる本来出
てこないはずの16/2=8KHz以上のエイリアス成
分が現れてしまう。
【0004】そこで、次にLPF(ローパスフィルタ)
からなる補間フィルタ102により上記エイリアス成分
を除去した後、サブバンド解析フィルタバンク201に
入力する。サブバンド解析フィルタバンク201におい
ては、補間フィルタ102の出力が複数の帯域に分割さ
れる。分割された複数の帯域信号は符号化部202で圧
縮符号化され、Fs =32KHzの符号化音声データと
して出力される。
【0005】また従来、帯域分割符号化方式で圧縮符号
化されたサンプリング周波数Fs の符号化音声データを
復号する復号装置を用いて、サンプリング周波数Fs /
nの復号された音声データを出力できるようにする場合
は、図9のような構成としていた。例えばn=2とし、
Fs =32KHzの符号化音声データを扱う復号装置を
用いて、Fs /2=16KHzの音声データを出力する
場合について説明する。
【0006】図9において、Fs =32KHzの圧縮符
号化された音声データが入力されると、デコーダ部30
0において、復号部301により各帯域毎に復号された
後、サブバンド合成フィルタバンク302により各帯域
信号が合成される。この帯域合成出力はリサンプリング
部400のLPF401によりFs /2n=8KHz以
上の周波数成分を除去された後、間引き部402で間引
き処理(デシメーション処理)がなされることにより、
Fs /2=16KHzに周波数変換された音声データを
得ることができる。
【0007】このような符号化装置及び復号装置の構成
は、処理能力の高いDSP(デジタル信号処理装置)等
を用いたハードウェア構成としたり、あるいはCPUを
用いたソフトウェア構成とすることができる。
【0008】
【発明が解決しようとする課題】上述した図8の符号化
装置の構成では、音声データが補間フィルタ102とサ
ブバンド解析フィルタバンク201の2つのフィルタを
通る。また、リサンプラ部100で16KHz→32K
Hzに周波数変換されたデータには、0〜16/2KH
zの信号成分が含まれ、8KHz以上はエイリアス成分
となっている。従って、後段のサブバンド解析フィルタ
バンク201の出力のうち上半分である8KHz以上の
周波数成分は無駄なものとなっている。
【0009】また、図9の復号装置の構成では、復号さ
れたデータがサブバンド合成フィルタバンク302とL
PF401の2つのフィルタを通る。また、サブバンド
合成フィルタ302の出力における8KHzより高い周
波数成分はLPF401で除去されるので、サブバンド
合成フィルタバンク201の出力のうち上記8KHzよ
り高い周波数成分は無駄なものとなっている。
【0010】従って、従来の符号化装置及び復号装置
は、上記の理由により無駄な演算が多くなり、このた
め、符号化装置及び復号装置をハードウェア構成とする
場合は、回路規模が増大し、ソフトウェア構成とする場
合は、処理速度が低下する等の問題があった。
【0011】本発明は上記の問題を解決するためになさ
れたもので、ハードウェア構成とする場合は、回路規模
を縮小することができ、ソフトウェア構成とする場合
は、処理速度を向上させることができる符号化装置、復
号装置等の音声データ処理装置、方法、及びこの装置を
ソフトウェア構成とする場合にCPUが実行するプログ
ラムを提供することを目的としている。
【0012】
【課題を解決するための手段】上記の目的を達成するた
めに、本発明による符号化装置としての音声データ処理
装置は、サンプリング周波数Fs /n(n>1)の入力
音声データのサンプルとサンプルとの間にn−1個のゼ
ロデータを挿入してサンプリング周波数Fs の音声デー
タに変換するゼロデータ挿入手段と、前記変換されたサ
ンプリング周波数Fs の音声データを複数の帯域信号に
分割するサブバンド解析フィルタバンクと、前記複数の
帯域信号からFs /2n以上の帯域信号を除去する帯域
制限手段と、前記帯域信号を除去された音声データを符
号化する符号化手段とを設けたものである。
【0013】また、本発明による符号化装置としての音
声データ処理装置は、サンプリング周波数Fs /nの入
力音声データのサンプルとサンプルとの間にn−1個の
ゼロデータを挿入してサンプリング周波数Fs の音声デ
ータに変換するゼロデータ挿入手段と、前記変換された
サンプリング周波数Fs の音声データを複数の帯域信号
に分割するサブバンド解析フィルタバンクと、前記複数
の帯域信号をそれぞれ正規化して正規化データを得る正
規化手段と、前記正規化データを所定の割当てられたビ
ット数で量子化して量子化データを得る量子化手段と、
前記量子化手段に所定のビット数を割当て、その際、前
記複数の帯域信号のうちFs /2n以上の帯域信号に対
応する正規化データに対してゼロビットを割当てるビッ
ト割当手段とを設けたものである。
【0014】また、本発明による復号装置としての音声
データ処理装置は、サンプリング周波数Fs の符号化音
声データを複数の帯域毎に復号する復号化手段と、前記
復号された音声データのFs /2n以上の帯域信号を除
去する帯域制限手段と、前記帯域信号を除去された音声
データの残りの帯域信号を合成するサブバンド合成フィ
ルタバンクと、前記合成された音声データを間引きして
サンプリング周波数Fs /nの音声データに変換する間
引き手段とを設けたものである。
【0015】また、本発明による復号装置としての音声
データ処理装置は、サンプリング周波数Fs の符号化音
声データを複数の帯域毎に復号する復号化手段と、前記
復号された音声データを逆量子化して逆量子化データを
得る逆量子化手段と、前記逆量子化データを所定のレベ
ルに制御し、その際、Fs /2n以上の帯域と対応する
逆量子化データをゼロレベルに制御するレベル制御手段
と、前記レベル制御された帯域毎のデータを合成して帯
域合成データを得るサブバンド合成フィルタと、前記帯
域合成データを間引きしてサンプリング周波数Fs /n
の音声データを得る間引き手段とを設けたものである。
【0016】また、本発明による符号化を行うための音
声データ処理方法は、サンプリング周波数Fs /nの入
力音声データのサンプルとサンプルとの間にn−1個の
ゼロデータを挿入してサンプリング周波数Fs の音声デ
ータに変換するステップと、前記変換されたサンプリン
グ周波数Fs の音声データを複数の帯域信号に分割する
ステップと、前記複数の帯域信号からFs /2n以上の
帯域信号を除去するステップと、前記帯域信号を除去さ
れた音声データを符号化するステップとを設けたもので
ある。
【0017】また、本発明による復号を行うための音声
データ処理方法は、サンプリング周波数Fs の符号化音
声データを複数の帯域毎に復号するステップと、前記復
号された音声データのFs /2n以上の帯域信号を除去
するステップと、前記帯域信号を除去された音声データ
の残りの帯域信号を合成するステップと、前記合成され
た音声データを間引きしてサンプリング周波数Fs /n
の音声データに変換するステップとを設けたものであ
る。
【0018】また、本発明による符号化を行うためのプ
ログラムは、サンプリング周波数Fs /nの入力音声デ
ータのサンプルとサンプルとの間にn−1個のゼロデー
タを挿入してサンプリング周波数Fs の音声データに変
換する処理と、前記変換されたサンプリング周波数Fs
の音声データを複数の帯域信号に分割する処理と、前記
複数の帯域信号からFs /2n以上の帯域信号を除去す
る処理と、前記帯域信号を除去された音声データを符号
化する処理とをコンピュータに実行させるためのもので
ある。
【0019】また、本発明による復号を行うためのプロ
グラムは、サンプリング周波数Fsの符号化音声データ
を複数の帯域毎に復号する処理と、前記復号された音声
データのFs /2n以上の帯域信号を除去する処理と、
前記帯域信号を除去された音声データの残りの帯域信号
を合成する処理と、前記合成された音声データを間引き
してサンプリング周波数Fs /nの音声データに変換す
る処理とをコンピュータに実行させるためのものであ
る。
【0020】
【作用】従って、本発明によれば、符号化を行う場合
は、サブバンド解析フィルタバンクにより帯域分割した
後に帯域制限を行ってエイリアス成分を除去するので、
従来のようにフィルタ処理を2回行わずに済み、処理を
速くできる。また、上記帯域制限は、エイリアス成分の
帯域に対して量子化の際にゼロビットを割当てるだけな
ので、回路構成を簡単にして容易に実現することができ
る。
【0021】また、復号を行う場合は、サブバンド合成
フィルタで帯域合成する前に帯域制限を行ってエイリア
ス成分の帯域を除去するので、フィルタ処理を2回行わ
ずに済み、処理を速くできる。また、上記帯域制限は、
エイリアス成分の帯域をゼロレベルに制御するだけなの
で、回路構成を簡単にして容易に実現することができ
る。
【0022】
【発明の実施の形態】以下、本発明の実施の形態を図面
と共に説明する。図1は本発明の第1の実施の形態によ
る符号化装置を概念的に示すブロック図である。1はサ
ンプリング周波数Fs /nの入力音声データにゼロデー
タを挿入してサンプリング周波数Fs に変換するゼロ挿
入部である。2はFs に変換された音声データを複数の
帯域信号に分割するサブバンド解析フィルタバンクであ
る。3は複数の帯域信号を帯域制限してエイリアス成分
を除去する帯域制限部である。4はエイリアス成分が除
去された音声データをサンプリング周波数Fs で圧縮符
号化する符号化部である。
【0023】次に、上記構成による動作について説明す
る。ここでは、図示の符号化装置が、本来はサンプリン
グ周波数Fs の音声データを帯域分割方式により圧縮符
号化する符号化装置であって、この符号化装置を用いて
Fs /nの音声データを符号化してFs の符号化音声デ
ータを得るものとする。例としてn=2とし、Fs /2
=16KHzの音声データを符号化してFs =32KH
zの符号化音声データを得る場合について説明する。
【0024】図1において、Fs /2=16KHzの音
声データが入力されると、ゼロ挿入部1によりサンプル
とサンプルの間にn−1個(この例では1個)のゼロデ
ータを挿入する。従って、音声データのサンプル数がn
個になり、サンプリング周波数がFs /2からFs =3
2KHzに周波数変換される。
【0025】この周波数変換されたデータには、図2
(a)に示す元のデータのスペクトルに対して、同図
(b)に示すようにFs /2n(=8KHz)以上のエ
イリアス成分が含まれているが、これをそのままサブバ
ンド解析フィルタバンク2に入力して、複数の帯域信号
に分割する。次に、複数の帯域信号のうち8KHzより
高い周波数成分を帯域制限部3により除去する。その
後、符号化部202で圧縮符号化することにより、Fs
=32KHzの符号化音声データが出力される。
【0026】本実施の形態においては、サンプリング周
波数が変換されたデータをエイリアス成分を含んだまま
サブバンド解析フィルタバンク2で処理した後、帯域制
限部3でエイリアス成分を除去しているので、図8の従
来の符号化装置における補間フィルタ102による処理
を省略することができる。また、帯域制限部3として
は、後述する図4のビット割当部21においてビット割
当てをしない、あるいはスケールファクタ抽出・正規化
部18においてスケールファクタをゼロにする等の方法
により、容易に実現することができる。従って、本実施
の形態によれば、処理を高速に行うことかできると共
に、回路規模を縮小することができる。
【0027】図3は本発明の第2の実施の形態による復
号装置を概念的に示すブロック図である。図3におい
て、5はサンプリング周波数Fs の音声データを帯域毎
に復号する復号部、6は復号されたデータのエイリアス
成分を除去する帯域制限部、7は帯域制限されたデータ
の各帯域信号を合成するサブバンド合成フィルタバン
ク、7は帯域合成された音声データを間引きする間引き
部である。
【0028】次に、上記構成による動作について説明す
る。ここでは、図示の復号装置が、本来はサンプリング
周波数Fs の帯域分割方式により圧縮符号化された音声
データを復号してFs の音声データを出力する復号装置
であって、この復号装置を用いてFs /nの音声データ
を出力するものとする。例としてn=2とし、Fs =3
2KHzの符号化音声データを復号してFs /n=16
KHzの音声データを出力する場合について説明する。
【0029】図3において、復号部5は、入力されたF
s =32KHzの圧縮符号化された音声データを帯域毎
に復号する。もしこの復号されたデータをそのままサブ
バンド合成フィルタ7に入力して処理し、さらに間引き
処理すると、出力にエイリアス成分が折り返し雑音とな
って帯域内に現れてしまう。このため、上記復号された
データを帯域制限部6でエイリアス成分に相当するFs
/2nの帯域信号を除去した後、サブバンド合成フィル
タ7に入力して残りの各帯域信号を合成する。この帯域
合成された音声データは次に間引き部8で間引き処理さ
れることにより、Fs /2=16KHzの音声データを
得ることができる。
【0030】本実施の形態においては、復号したデータ
をサブバンド合成フィルタ7に入力する前に帯域制限部
6でエイリアス成分を除去しているので、図9のLPF
401による処理を省略することができる。また、帯域
制限部6としては、後述する図6の復号装置におけるレ
ベル制御部28において、Fs /2n(=8KHz)以
上の帯域がゼロになるように制御することにより、容易
に実現することができる。従って、本実施の形態によれ
ば、処理を高速に行うことかできると共に、回路規模を
縮小することができる。
【0031】図4は本発明の第3の実施の形態を示すブ
ロック図であり、図1に概念的に示した符号化装置の具
体的な構成例を示すものである。この符号化装置は、サ
ンプリング周波数Fs の音声データを帯域分割方式によ
り圧縮符号化してFs の符号化音声データを出力する従
来の構成部分と、サンプリング周波数Fs /nの音声デ
ータを圧縮符号化してFs の符号化音声データを出力す
る本発明に関する構成部分とを含むものである。
【0032】図4において、11はアナログ音声信号が
入力される入力端子、12はアナログ音声信号から折り
返し雑音となるエイリアス成分を除去するLPF、13
はLPF12の出力をサンプリング周波数Fs でA/D
変換してデジタルの音声データを出力するA/D変換器
である。14はFs /nのデジタルの音声データが入力
される入力端子、15は上記入力音声データのサンプル
とサンプルの間にn−1個のゼロデータを挿入してFs
の音声データに周波数変換するゼロ挿入部である。16
はA/D変換器13の出力又はゼロ挿入部15の出力を
選択するセレクタである。
【0033】17は入力音声データを複数帯域に分割す
るサブバンド解析フィルタバンク、18は複数の帯域信
号を正規化すると共に、その正規化データのスケールフ
ァクタインデックスを求めるスケールファクタ抽出・正
規化部、19は帯域毎の正規化データを割り当てられた
ビット数で量子化する量子化部、20は心理聴覚モデル
を使用して入力音声データの耳に聞こえる程度を帯域毎
に求める心理聴覚分析部で、FFT(Fast Fourier Tr
asform,高速フーリエ変換)処理を行うFFT処理部
(図示せず)を前処理部として内蔵するものとする。
【0034】21は量子化部19の量子化に際して各帯
域に何ビットを割り当てるかを、心理聴覚分析部20の
分析結果に基づいて決定するビット割当部、22はFs
の入力音声データとFs /2の入力音声データとの切り
換え制御信号が入力される入力端子である。23は量子
化されたデータと制御情報等をビットストリームに組み
立てるビットストリームエンコーダ、24は符号化音声
データ及び制御情報等を含むビットストリームを出力す
る出力端子である。
【0035】上記従来の構成部分は、上記11,12,
13,17〜21,23,24の部分であり、上記本発
明に関する構成部分は、上記14,15,16,22の
部分である。
【0036】次に、上記構成による動作について説明す
る。ここでは、n=2,Fs =32KHzとして説明す
る。まず、入力端子11にアナログの音声信号が入力さ
れた場合の従来の構成部分の動作について説明する。こ
のときセレクタ16は入力端子22に入力された切り換
え制御信号によりA/D変換器13の出力を選択する。
【0037】入力端子11に入力された音声信号はLP
F12でFs /2以上のエイリアス成分を除去され後、
A/D変換器13でFs =32KHzでサンプリングさ
れることにより、0〜Fs /2の帯域(0〜16KH
z)に有効データを有するデジタルの音声データに変換
される。この音声データはセレクタ16を介してサブバ
ンド解析フィルタバンク17と心理聴覚分析部20に入
力される。
【0038】サブバンド解析フィルタバンク17は、そ
れぞれ通過帯域の異なるa個の並列に設けられた帯域フ
ィルタで構成され、音声データが各帯域フィルタに共通
に入力されることにより、Fs /2の帯域がa個の帯域
信号に分割される。従って、各帯域フィルタからa個の
実数の組が得られる。以下の説明においては、サブバン
ド解析フィルタバンク17から出力されるa個のサンプ
ル(実数)を1組とし、これをb組、組み合わせたサン
プル数ab個のデータを1フレームと言うものとする。
【0039】次に、スケールファクタ抽出・正規化部1
8では、1フレーム内で、各帯域におけるb個の実数に
ついて絶対値が最大の実数を求め、さらに、この絶対値
が最大の実数を1として、他の実数の正規化を行う。従
って、各帯域について−1.000〜+1.000の実
数で表わされる正規化データが得られる。次に、その帯
域の正規化データにおける1が示す実際の値(即ち、絶
対値が最大の実数)を2進数で表現する場合の値(例え
ば、絶対値が最大の実数が8なら2進数で8、10なら
2進数で16、120なら2進数で128等々)をスケ
ールファクタとしてスケールファクタインデックスと対
応して記載されたスケールファクタテーブルから各帯域
におけるスケールファクタインデックスを求めておく。
【0040】一方、心理聴覚分析部20では、まず前処
理として、A/D変換器13からの1フレーム分のデー
タであるab個のサンプルについてFFT処理を行う。
この分析の結果、Fs /2の帯域のデータが有効である
ので、ab/2個の複素数で表される有効データが得ら
れる。ここで、各複素数の絶対値を求めておく。
【0041】次に、上記ab/2個の有効データから次
の条件に基づいて耳に聞こえるであろう音をレベル別に
選択する。 (1)大きな帯域成分は多分聞こえる。 (2)(1)の成分の周りの音は聞こえ難い。 (3)小さな成分は聞こえ難い。 (4)(1)〜(3)に、さらに耳の周波数特性(聴覚
特性)を考慮する。
【0042】上記のようにして聞こえる音のレベルを段
階的に示すデータを得、これをさらに対応する帯域毎に
まとめる。そして、各帯域について上記データを各段階
毎に数値化する。例えば2倍のレベル差をdB(6dB
で2倍)で表す。
【0043】次に、ビット割当部21は、上記dBで表
わされた各段階に対してビット数を割り当てる。例えば
6dBについて1ビットを割り当て、レベル差が大きく
なる程ビット数を多く割当てる。また、総ビット数が所
定のビット数に収まるようにする。従って、このビット
割当部21からは、帯域毎に何ビットを割当てるかを示
すビット割当情報が出力される。
【0044】次に、量子化部19は、スケールファクタ
抽出・正規化部18から得られる前記正規化データを上
記ビット割当情報により割当てられたビット数で2進数
に変換し、小数点以下を割当てられたビット数だけ取り
出す。
【0045】次に、ビットストリームエンコーダ23に
おいて、1フレーム毎にヘッダ部と量子化データ部とが
作成される。ヘッダ部には、前記絶対値が最大の実数を
何ビットで表したかを帯域毎に示す情報が所定ビット数
で記載される。また、上記量子化データ部は、上記ビッ
ト割当情報としてのビットアロケーション情報、帯域毎
の前記スケールファクタインデックス情報等が所定ビッ
ト数で記載され、その後に量子化データが続くようなデ
ータ構成となっている。これらの情報は、スケールファ
クタ抽出・正規化部18、ビット割当部21及び量子化
部19から得られるもので、復号装置により符号化音声
データを復号する際に必要な制御情報として用いられ
る。上記ヘッダ部及び量子化データ部はビットストリー
ムに組み立てられて、出力端子24からFs =32KH
zの符号化音声データとして出力される。
【0046】次に、入力端子14にFs =16KHzの
音声データが入力された場合、即ち、本発明に関する場
合について図5のフローチャートを参照して説明する。
このときセレクタ16は入力端子22からの切り換え制
御信号によりゼロ挿入部15の出力を選択する。
【0047】入力された音声データは、ゼロ挿入部15
でサンプルとサンプルの間にn−1個(この例では1
個)のゼロデータが挿入されることにより、Fs =32
KHzに変換される(図5のステップS1、以下、ステ
ップ略)。これにより、以下の処理を従来と同等に行う
ことができる。尚、このゼロデータが挿入された音声デ
ータは、16/2=8KHz以上のエイリアス成分を含
んでいる。この音声データはセレクタ16を介してサブ
バンド解析フィルタバンク17と心理聴覚分析部20に
入力される。
【0048】サブバンド解析フィルタバンク17では、
前述したように入力音声データはa個の帯域信号に分割
される(S2)。分割された帯域信号は次にスケールフ
ァクタ抽出・正規化部18に入力されて正規化が行われ
ると共に、スケールファクタインデックスが求められる
(S3)。
【0049】一方、心理聴覚分析部20により帯域毎に
耳に聞こえる音を段階的に示す情報が得られ、この情報
に基づいてビット割当部21が正規化データにビット割
当てを行うが、その際、前記切り換え制御信号に応じて
上記8KHz以上のエイリアス成分の帯域についてはビ
ットを割り当てないようにする(S4)。
【0050】次に、量子化部19で正規化データの量子
化を行うが(S5)、その場合、上記エイリアス成分の
帯域については量子化が省略される。即ち、エイリアス
成分の帯域の割当てビット数を強制的にゼロにすること
により、エイリアス成分を除去することができる。次
に、量子化部19からの量子化データは、ビットストリ
ームエンコーダ23において、制御情報と共にビットス
トリームに組み立てられて出力される(S6)。
【0051】尚、前記切り換え制御信号に応じてスケー
ルファクタ抽出・正規化部18における正規化等の処理
をエイリアス成分の帯域については行わないようにすれ
ば、量子化部19では自動的にその帯域の量子化が行わ
れないので、割当てビット数をゼロにした場合と同等の
効果が得られる。
【0052】本実施の形態によれば、サンプリング周波
数Fs の符号化装置を用いてFs /nの入力音声データ
を圧縮符号化してFs の符号化音声データを得ることが
できる。従って、この符号化音声データをサンプリング
周波数Fs の符号化音声データを扱う復号装置を用いて
通常の復号処理を行うことができる。また、エイリアス
成分については、量子化や正規化等の処理を行わないよ
うにしているので、全体の処理量を削減できると共に、
簡単な回路、あるいは処理を付加するだけで実現するこ
とができる。
【0053】図6は本発明の第4の実施の形態を示すブ
ロック図であり、図3に概念的に示した復号装置の具体
的な構成例を示すものである。この復号装置は、サンプ
リング周波数Fs の圧縮符号化された音声データを復号
してFs の音声データを出力する従来の構成部分と、サ
ンプリング周波数Fsの圧縮符号化された音声データを
復号してFs /nの音声データを出力する本発明に関す
る構成部分とを含むものである。
【0054】図6において、25はサンプリング周波数
Fs の符号化音声データのビットストリームが入力され
る入力端子、26は入力されたビットストリームから量
子化データと、ビットアロケーション情報及びスケール
ファクタインデックス情報等の制御情報とを分離するビ
ットストリームデコーダ、27は量子化データをビット
アロケーション情報に基づいて逆量子化して元の正規化
データ(実数)を出力する逆量子化部、28は逆量子化
された実数データをスケールファクタに基づいてレベル
制御するレベル制御部、29はレベル制御されたデータ
の各帯域信号を合成するサブバンド合成フィルタ、30
は切り換え制御信号の入力端子である。
【0055】31は分配器で、復号された音声データを
切り換え制御信号に応じて分配する。32は復号された
音声データをアナログ音声信号に変換するD/A変換
器、33はアナログ音声信号からエイリアス成分を除去
するLPF、34はアナログ音声信号の出力端子であ
る。35は音声データを間引き処理してFs /nの音声
データを得る間引き部、36は間引きされたFs /nの
音声データの出力端子である。
【0056】上記構成において、上記25〜29,32
〜34は従来の構成部分、30,31,35,36は本
発明に関する構成部分である。
【0057】次に、上記構成による動作について説明す
る。ここでは、n=2,Fs =32KHzとし、Fs =
32KHzの音声データを出力する場合と、Fs =16
KHzの音声データを出力する場合とについて説明す
る。
【0058】まず、Fs =32KHzの音声データを出
力する場合について説明する。入力端子25に帯域分割
方式によりFs =32KHzで圧縮符号化された音声デ
ータのビットストリームが入力されると、ビットストリ
ームデコーダ26は、1フレーム毎に量子化データと、
スケールファクタインデックス情報及びビットアロケー
ション情報を含む制御情報とを分離する。この場合、1
フレームにつき、スケールファクタインデックスは1組
存在し、量子化データはb組存在する。次に、逆量子化
部27は、量子化データを制御情報におけるビットアロ
ケーション情報に基づいて−1〜+1の元の実数データ
(逆量子化データ)に逆量子化する。
【0059】次に、レベル制御部28は、スケールファ
クタテーブルを用いて上記スケールファクタインデック
スからスケールファクタを求め、求められたスケールフ
ァクタを上記実数データに乗算する。これにより、図4
の符号化装置におけるサブバンド解析フィルタバンク1
7の出力と同等の帯域毎の出力データが得られる。この
帯域毎の出力データをサブバンド合成フィルタバンク2
9に入力して、各帯域信号を合成する。
【0060】この帯域合成された音声データは、入力端
子30からの切り換え制御信号に応じて分配器31を介
してD/A変換器32に供給され、アナログ音声信号に
変換される。その後、LPF33でエイリアス成分が除
去されて出力端子34から出力される。
【0061】次に、Fs =16KHzの音声データを出
力する場合について図7のフローチャートを参照して説
明する。この場合は、入力音声データにはFs /2まで
の帯域のデータが含まれており、これをそのまま1/2
に間引して16KHzにすると、16/2=8KHz以
上のエイリアス成分が発生してしまう。
【0062】まず、入力端子25に符号化音声データの
ビットストリームが入力されると、ビットストリームデ
コーダ26により量子化データと制御情報とに分離され
(S11)た後、逆量子化部27で逆量子化される(S
12)。次に、逆量子化された実数データをレベル制御
部28でスケールファクタインデックスを乗算するが、
このとき、前記切り換え制御信号に応じてエイリアス成
分に相当する8KHz以上の帯域に対して強制的にゼロ
を乗算する(S13)。
【0063】この乗算結果をサブバンド合成フィルタバ
ンク29で合成すれば(S14)、エイリアス成分の帯
域が除去され、残りの帯域が合成されたデータを得るこ
とができる。この帯域合成データを前記切り換え制御信
号で制御される分配器31を介して間引き部35で1/
2に間引き処理することにより(S15)、エイリアス
成分のないFs =16KHzの復号された音声データを
出力端子36に得ることができる。
【0064】本実施の形態によれば、サンプリング周波
数Fs の符号化音声データを扱う復号装置を用いて、ダ
ウンサンプリングされたサンプリング周波数Fs /nの
復号された音声データを得ることができる。従って、こ
の音声データを後段のサンプリング周波数Fs /nの音
声データしか扱うことのできない処理装置、例えばD/
A変換器に入力することができる。また、エイリアス成
分の帯域についてはゼロを乗算するので、エイリアス成
分のない出力音声データを得ることができると共に、簡
単な回路、あるいは処理を付加するだけで実現すること
ができる。
【0065】次に、本発明の実施の形態によるプログラ
ムについて説明する。本発明による符号化装置や復号装
置等の音声データ処理装置をソフトウェア構成とする場
合、図1〜図7について前述した動作に基づく処理を、
音声データ処理装置のコンピュータシステムにおけるC
PUが実行するためのプログラムは、本発明によるプロ
グラムを構成する。
【0066】このプログラムの記録媒体としては、光磁
気ディスク、光ディスク、半導体メモリ、磁気記録媒体
等を用いることができ、これらをROM、RAM、CD
−ROM、フレキシブルディスク、メモリカード等に構
成して用いてよい。またこの記録媒体は、インターネッ
ト等のネットワークや電話回線等の通信回線を介してプ
ログラムが送信された場合のサーバやクライアントとな
るコンピュータシステム内部のRAM等の揮発性メモリ
のように、一定時間プログラムを保持するものも含まれ
る。
【0067】また上記プログラムは、このプログラムを
記憶装置等に格納したコンピュータシステムから伝送媒
体を介して、あるいは伝送媒体中の伝送波により他のコ
ンピュータシステムに伝送されるものであってもよい。
上記伝送媒体とは、インターネット等のネットワーク
(通信網)や電話回線等の通信回線(通信線)のように
情報を伝送する機能を有する媒体をいうものとする。
【0068】また、上記プログラムは、前述した機能の
一部を実現するためであってもよい。さらに、前述した
機能をコンピュータシステムに既に記録されているプロ
グラムとの組み合わせで実現できるもの、いわゆる差分
ファイル(差分プログラム)であってもよい。
【0069】従って、この記録媒体を図1、図3、図
4、図6のシステム又は装置とは異なるシステム又は装
置において用い、そのシステム又は装置のコンピュータ
がこの記録媒体に格納されたプログラムを実行すること
によっても、各実施の形態で説明した機能及び効果と同
等の機能及び効果を得ることができ、本発明の目的を達
成することができる。
【0070】
【発明の効果】以上説明したように本発明によれば、符
号化を行う場合は、サブバンド解析フィルタバンクによ
る帯域分割の後にエイリアス成分を除去するための帯域
制限を行うので、従来のようにフィルタ処理を2回行わ
ずに済み、処理を速くできる。また、帯域制限は、エイ
リアス成分の帯域の量子化の際にゼロビットを割当てる
だけなので、回路構成を簡単にして容易に実現すること
ができる。
【0071】また、復号を行う場合は、サブバンド合成
フィルタで帯域合成する前にエイリアス成分の帯域を除
去するための帯域制限を行うので、フィルタ処理を2回
行わずに済み、処理を速くできる。また、帯域制限は、
エイリアス成分の帯域をゼロレベルに制御するだけなの
で、回路構成を簡単にして容易に実現することができ
る。
【0072】従って、本発明によれば、音声データ処理
装置をハードウェア構成とする場合には、回路構成を簡
単にすることができ、音声データ処理装置をソフトウェ
ア構成とする場合には、処理を高速に行うことができ
る。
【図面の簡単な説明】
【図1】 本発明の第1の実施の形態による符号化装置
を示すブロック図である。
【図2】 図1の動作を説明するための周波数スペクト
ラムを示す図である。
【図3】 本発明の第2の実施の形態による復号装置を
示すブロック図である。
【図4】 本発明の第3の実施の形態による符号化装置
を示すブロック図である。
【図5】 図4の符号化装置において、サンプリング周
波数Fs /nの音声データが入力された場合における動
作を示すフローチャートである。
【図6】 本発明の第4の実施の形態による復号装置を
示すブロック図である。
【図7】 図5の復号装置において、サンプリング周波
数Fs /nの音声データを出力する場合における動作を
示すフローチャートである。
【図8】 従来の符号化装置を示すブロック図である。
【図9】 従来の復号装置を示すブロック図である。
【符号の説明】
1:ゼロ挿入部、2:サブバンド解析フィルタバンク、
3:帯域制限部、4:符号化部、5:復号部、6:帯域
制限部、7:サブバンド合成フィルタバンク、8:間引
き部、11:アナログ音声信号の入力端子、14:Fs
/2の音声データの入力端子、15:ゼロ挿入部、1
6:セレクタ、17:サブバンド解析フィルタバンク、
18:スケールファクタ抽出・正規化部、19:量子化
部、21:ビット割当部、22:切り換え制御信号の入
力端子、23:ビットストリームエンコーダ、25:符
号化音声データの入力端子、26:ビットストリームデ
コーダ、27:逆量子化部、28:レベル制御部、2
9:サブバンド合成フィルタバンク、30:切り換え制
御信号の入力端子、31:分配器、34:アナログ音声
信号の出力端子、35:間引き部、36:Fs /nの音
声データの出力端子

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 サンプリング周波数Fs /n(n>1)
    の入力音声データのサンプルとサンプルとの間にn−1
    個のゼロデータを挿入してサンプリング周波数Fs の音
    声データに変換するゼロデータ挿入手段と、 前記変換されたサンプリング周波数Fs の音声データを
    複数の帯域信号に分割するサブバンド解析フィルタバン
    クと、 前記複数の帯域信号からFs /2n以上の帯域信号を除
    去する帯域制限手段と、 前記帯域信号を除去された音声データを符号化する符号
    化手段とを設けたことを特徴とする音声データ処理装
    置。
  2. 【請求項2】 サンプリング周波数Fs /nの入力音声
    データのサンプルとサンプルとの間にn−1個のゼロデ
    ータを挿入してサンプリング周波数Fs の音声データに
    変換するゼロデータ挿入手段と、 前記変換されたサンプリング周波数Fs の音声データを
    複数の帯域信号に分割するサブバンド解析フィルタバン
    クと、 前記複数の帯域信号をそれぞれ正規化して正規化データ
    を得る正規化手段と、 前記正規化データを所定の割当てられたビット数で量子
    化して量子化データを得る量子化手段と、 前記量子化手段に所定のビット数を割当て、その際、前
    記複数の帯域信号のうちFs /2n以上の帯域信号に対
    応する正規化データに対してゼロビットを割当てるビッ
    ト割当手段とを設けたことを特徴とする音声データ処理
    装置。
  3. 【請求項3】 前記サンプリング周波数Fs に変換され
    た音声データとサンプリング周波数Fs の入力音声デー
    タとを切り換えて前記サブバンド解析フィルタバンクに
    入力する切り換え手段を設け、前記ビット割当手段は、
    前記サンプリング周波数Fs の入力音声データが入力さ
    れたときは、前記Fs /2n以上の帯域信号に対応する
    正規化データに対するゼロビットの割当ては行わないこ
    とを特徴とする請求項2記載の音声データ処理装置。
  4. 【請求項4】 前記正規化手段は、前記Fs /2n以上
    の帯域信号については正規化を行わないことを特徴とす
    る請求項2又は3記載の音声データ処理装置。
  5. 【請求項5】 前記ビット割当て手段は、入力音声デー
    タを心理聴覚モデルを用いて分析し、分析結果に基づい
    てビット割当てを行うことを特徴とする請求項2,3,
    又は4記載の音声データ処理装置。
  6. 【請求項6】 サンプリング周波数Fs の符号化音声デ
    ータを複数の帯域毎に復号する復号化手段と、 前記復号された音声データのFs /2n以上の帯域信号
    を除去する帯域制限手段と、 前記帯域信号を除去された音声データの残りの帯域信号
    を合成するサブバンド合成フィルタバンクと、 前記合成された音声データを間引きしてサンプリング周
    波数Fs /nの音声データに変換する間引き手段とを設
    けたことを特徴とする音声データ処理装置。
  7. 【請求項7】 サンプリング周波数Fs の符号化音声デ
    ータを複数の帯域毎に復号する復号化手段と、 前記復号された音声データを逆量子化して逆量子化デー
    タを得る逆量子化手段と、 前記逆量子化データを所定のレベルに制御し、その際、
    Fs /2n以上の帯域と対応する逆量子化データをゼロ
    レベルに制御するレベル制御手段と、 前記レベル制御された帯域毎のデータを合成して帯域合
    成データを得るサブバンド合成フィルタバンクと、 前記帯域合成データを間引きしてサンプリング周波数F
    s /nの音声データを得る間引き手段とを設けたことを
    特徴とする音声データ処理装置。
  8. 【請求項8】 前記サブバンド合成フィルタバンクから
    得られる帯域合成データをD/A変換してアナログ音声
    信号を得るD/A変換手段と、前記帯域合成データを前
    記間引き手段又はD/A変換手段に選択的に入力する切
    り換え手段とを設け、前記レベル制御手段は、前記切り
    換え手段がD/A変換手段を選択したときは前記Fs /
    2n以上の帯域と対応する逆量子化データに対するゼロ
    レベル制御は行わないことを特徴とする請求項7記載の
    音声データ処理装置。
  9. 【請求項9】 サンプリング周波数Fs /nの入力音声
    データのサンプルとサンプルとの間にn−1個のゼロデ
    ータを挿入してサンプリング周波数Fs の音声データに
    変換するステップと、 前記変換されたサンプリング周波数Fs の音声データを
    複数の帯域信号に分割するステップと、 前記複数の帯域信号からFs /2n以上の帯域信号を除
    去するステップと、前記帯域信号を除去された音声デー
    タを符号化するステップとを設けたことを特徴とする音
    声データ処理方法。
  10. 【請求項10】 サンプリング周波数Fs の符号化音声
    データを複数の帯域毎に復号するステップと、 前記復号された音声データのFs /2n以上の帯域信号
    を除去するステップと、 前記帯域信号を除去された音声データの残りの帯域信号
    を合成するステップと、 前記合成された音声データを間引きしてサンプリング周
    波数Fs /nの音声データに変換するステップとを設け
    たことを特徴とする音声データ処理方法。
  11. 【請求項11】 サンプリング周波数Fs /nの入力音
    声データのサンプルとサンプルとの間にn−1個のゼロ
    データを挿入してサンプリング周波数Fs の音声データ
    に変換する処理と、 前記変換されたサンプリング周波数Fs の音声データを
    複数の帯域信号に分割する処理と、 前記複数の帯域信号からFs /2n以上の帯域信号を除
    去する処理と、 前記帯域信号を除去された音声データを符号化する処理
    とをコンピュータに実行させるためのプログラム。
  12. 【請求項12】 サンプリング周波数Fs の符号化音声
    データを複数の帯域毎に復号する処理と、 前記復号された音声データのFs /2n以上の帯域信号
    を除去する処理と、 前記帯域信号を除去された音声データの残りの帯域信号
    を合成する処理と、 前記合成された音声データを間引きしてサンプリング周
    波数Fs /nの音声データに変換する処理とをコンピュ
    ータに実行させるためのプログラム。
JP2001400597A 2001-12-28 2001-12-28 音声データ処理装置 Expired - Fee Related JP3624884B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001400597A JP3624884B2 (ja) 2001-12-28 2001-12-28 音声データ処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001400597A JP3624884B2 (ja) 2001-12-28 2001-12-28 音声データ処理装置

Publications (2)

Publication Number Publication Date
JP2003195898A true JP2003195898A (ja) 2003-07-09
JP3624884B2 JP3624884B2 (ja) 2005-03-02

Family

ID=27605083

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001400597A Expired - Fee Related JP3624884B2 (ja) 2001-12-28 2001-12-28 音声データ処理装置

Country Status (1)

Country Link
JP (1) JP3624884B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005006296A (ja) * 2003-05-21 2005-01-06 Sony Corp データ処理装置、符号化装置および符号化方法、復号装置および復号方法、並びにプログラム
JP2009531905A (ja) * 2006-03-28 2009-09-03 フランス テレコム 変換ドメイン内で効率的なバイノーラルサウンド空間化を行う方法およびデバイス
JP2010091907A (ja) * 2008-10-10 2010-04-22 Sanyo Electric Co Ltd 音声信号処理回路

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005006296A (ja) * 2003-05-21 2005-01-06 Sony Corp データ処理装置、符号化装置および符号化方法、復号装置および復号方法、並びにプログラム
JP4496467B2 (ja) * 2003-05-21 2010-07-07 ソニー株式会社 データ処理装置、符号化装置および符号化方法、復号装置および復号方法、並びにプログラム
JP2009531905A (ja) * 2006-03-28 2009-09-03 フランス テレコム 変換ドメイン内で効率的なバイノーラルサウンド空間化を行う方法およびデバイス
JP2010091907A (ja) * 2008-10-10 2010-04-22 Sanyo Electric Co Ltd 音声信号処理回路

Also Published As

Publication number Publication date
JP3624884B2 (ja) 2005-03-02

Similar Documents

Publication Publication Date Title
KR100634506B1 (ko) 저비트율 부호화/복호화 방법 및 장치
JP3371590B2 (ja) 高能率符号化方法及び高能率復号化方法
TW201007699A (en) Compression of audio scale-factors by two-dimensional transformation
JPH08190764A (ja) ディジタル信号処理方法、ディジタル信号処理装置及び記録媒体
RU2289858C2 (ru) Способ и устройство кодирования аудиосигнала с использованием извлечения гармоник
CN102306494A (zh) 对音频信号编码和解码的方法和设备
JP3900000B2 (ja) 符号化方法及び装置、復号方法及び装置、並びにプログラム
KR100352351B1 (ko) 정보부호화방법및장치와정보복호화방법및장치
EP1249837A2 (en) A method for decompressing a compressed audio signal
JP3353868B2 (ja) 音響信号変換符号化方法および復号化方法
JP2001044847A (ja) 可逆符号化方法、可逆復号化方法、これらの装置及びその各プログラム記録媒体
JP2005037949A (ja) 広域音声信号の圧縮装置および復元装置ならびに圧縮方法および復元方法
JP4359949B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JP3624884B2 (ja) 音声データ処理装置
WO1999044291A1 (fr) Dispositif et procede de codage, dispositif et procede de decodage, support d'enregistrement de programme et de donnees
JPS63201700A (ja) 音声・楽音の帯域分割符号化装置
JP4256189B2 (ja) 音声信号圧縮装置、音声信号圧縮方法及びプログラム
KR100433984B1 (ko) 디지털 오디오 부호화/복호화 장치 및 방법
JPH1083623A (ja) 信号記録方法、信号記録装置、記録媒体および信号処理方法
JP5491193B2 (ja) 音声コード化の方法および装置
KR100928966B1 (ko) 저비트율 부호화/복호화방법 및 장치
JP3504485B2 (ja) 楽音符号化装置および楽音復号化装置および楽音符号化復号化装置およびプログラム記憶媒体
JP2587591B2 (ja) 音声・楽音の帯域分割符号化復号化装置
JP2001094432A (ja) サブバンド符号化・復号方法
JP2000132195A (ja) 信号符号化装置及び方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040721

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040803

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041004

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20041109

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041004

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20041122

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313532

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081210

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081210

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091210

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101210

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101210

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111210

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111210

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121210

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131210

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees