JP2002073067A - オーディオ信号の復号方法、及びオーディオ信号の復号装置 - Google Patents

オーディオ信号の復号方法、及びオーディオ信号の復号装置

Info

Publication number
JP2002073067A
JP2002073067A JP2000268233A JP2000268233A JP2002073067A JP 2002073067 A JP2002073067 A JP 2002073067A JP 2000268233 A JP2000268233 A JP 2000268233A JP 2000268233 A JP2000268233 A JP 2000268233A JP 2002073067 A JP2002073067 A JP 2002073067A
Authority
JP
Japan
Prior art keywords
signal
audio signal
frame
sine wave
bit stream
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000268233A
Other languages
English (en)
Inventor
Takehiko Kuran
武彦 九蘭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP2000268233A priority Critical patent/JP2002073067A/ja
Publication of JP2002073067A publication Critical patent/JP2002073067A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 オーディオ信号の符号化を、適応的に周
波数分析を行い効率的に優勢な周波数成分を抽出して高
い効率で符号化を行って伝送し、伝送された符号化信号
を得て高品質に復号する復号装置を構成することにあ
る。 【解決手段】 供給されるデジタルオーディオ信号の所
定期間をフレーム化回路11によりフレーム化信号とし
て得て周波数成分抽出回路12により第1の一般調和解
析を行い、その結果得られた残差信号を複数に分割して
周波数成分抽出回路14により第2の一般調和解析を行
い、それらにより得られた信号をビットストリーム信号
として伝送し、その信号を高品質のまま復号するデジタ
ルオーディオ信号の復号装置を実現した。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、一般調和解析法に
より圧縮符号化されたオーディオ信号を得て、復号する
オーディオ信号の復号方法、及びオーディオ信号の復号
装置に係る。すなわち、その一般調和解析により符号化
されるオーディオ信号は、特に複数種類の周波数間隔を
有する周波数値を基にしてオーディオ信号の優勢周波数
成分を抽出し、その抽出された周波数成分を基にして圧
縮符号化を行うものであり、そのようにして圧縮符号化
され、伝送された符号化ビットストリームの信号を得て
復号し、オーディオ信号を得るものである。
【0002】
【従来の技術】従来より、オーディオ信号の復号装置に
供給される圧縮符号化オーディオ信号の符号化方法、オ
ーディオ信号の符号化装置には時間周波数変換の手法が
用いられている。
【0003】この手法は、時間領域で供給される信号を
周波数領域の信号に変換し、符号化を行う方法で、人間
の周波数領域における聴覚特性を利用して行うものであ
り、それは人間の聴覚心理が、周波数により検知できる
音圧レベルが異なる、信号レベルの大きな周波数の近傍
にある小レベルの周波数成分の検知力が低いなどの聴覚
上のマスキング効果を利用して信号の圧縮を行う符号化
方式に適した信号処理が出来るからである。
【0004】その従来用いられる時間周波数変換手法
は、高速フーリエ変換(FFT:FastFourier Transfor
m)、変形離散コサイン変換(MDCT:Modified Disc
reteCosine Transform)などであり、これらの手法は、
オーディオ信号を所定の観測区間ごとに区切り、その区
切られた信号を周波数分析することにより伝送する周波
数とそのレベルを求める方法である。
【0005】この様にして求められた周波数分析結果よ
り、聴覚上必要な情報を選択し、符号化して伝送するよ
うなオーディオ信号の符号化方法、及びオーディオ信号
の符号化装置も実現されている。
【0006】
【発明が解決しようとする課題】ところで、この時間周
波数変換方式による符号化方式で用いられる高速フーリ
エ変換(FFT)や変形離散コサイン変換(MDCT)
等の周波数分析手法は、周期的で調和的な信号を分析す
る手法であり、信号を観測した観測区間の外では、観測
区間内の信号が周期的に繰り返すことを仮定している。
【0007】その信号の周期性に関しては、符号化の対
称となるオーディオ信号が、例えば音階に基づいた周波
数成分を有し周期的で連続的な形態を取る場合と、打楽
器などから発せられる単発的で不連続的な信号である場
合とで、また、さらにそれらが複合されている場合な
ど、多種多様である。
【0008】そして、そのように複雑に構成されるオー
ディオ信号の周波数分析を、オーディオ信号の周期と関
連のない観測区間を定めて行うときは、オーディオ信号
の波形と観測する区間の位置関係が異なる場合などで
は、異なった周波数とレベルの分析結果が得られるな
ど、周波数領域の信号に誤差が含まれ易い。
【0009】さらにまた、単発的で過渡的なオーディオ
信号を符号化するには、高い周波数分解能での信号分析
が必要であるが、そのためには観測区間を長くとる必要
がある。しかし、観測区間を長くすると、実際とは異な
る多数の周波数成分も抽出されてしまうなどにより符号
化効率が低下するなど、観測区間の設定が困難な状況に
ある。
【0010】このように、従来の周波数分析法を用いる
符号化方式は、観測区間の設定により誤差を伴った周波
数領域信号が得られる、過渡的なオーディオ信号に対す
る周波数分解能が不足である、観測区間外の波形予測が
困難であるなどの課題を有しており、さらに予測残差の
符号化による符号化効率の向上が困難であるなどによ
り、高能率で良好なオーディオ信号の符号化方法、オー
ディオ信号の符号化装置を提供できない欠点を有してお
り、そのようにしてオーディオ信号を復号する復号装置
と組み合わせてなるオーディオ信号の符号化、及び復号
システムにおいても同じ課題を有している。
【0011】そこで、これらの課題を解決するための手
法として、調和的でない信号に拡張したフーリエ解析の
手法を用いてオーディオ信号を符号化し、復号する手法
がある。その手法は一般調和解析(Generalized Harmon
ic Analysis: GHA)と呼ばれ、例えば牛山聡外によ
る「一般調和解析による波形分析」、信学技法EA93
−103(1994−03)、及び山崎芳男による「音
響信号の時間周波数分析」、日本音響学会誌53巻2号
(1997)などで知られている。
【0012】そのGHAは、観測区間内で原信号から残
差信号電力が最小となる最も優勢な正弦波を抽出し、抽
出した信号成分を除いた残差信号に対しても同様の処理
を繰り返し行う様にする解析手法で、定常的でない僅か
な周波数変動に対しても正確な周波数分析が可能であ
り、さらに観測区間長と周波数分解能は互いに独立に自
由な設定が可能であるため、観測区間を超えた信号の予
測ができるなど、多くの特長を有している。
【0013】このようにして、本発明はFFTやMDC
T等の調和解析よりも精度の高い分析を行うGHAを符
号化装置に用いて、精度の高い周波数分析を行ってオー
ディオ信号の符号化を行うとともに、その符号化された
信号を復号装置に供給して復号することによりオーディ
オ信号の伝送を行うための復号方法、及び復号装置に関
するものである。
【0014】すなわち、その符号化装置に用いられるG
HAは、オーディオ信号の周波数分析を符号化に適した
形に処理を行い、且つFFTなどを用いる場合に比し、
抽出した周波数成分の精度が高く、抽出した周波数成分
を符号化するのに必要な符号量が、入力信号によっては
増大するという課題を解決し、符号化効率を向上させる
ようにしたものであり、そのようなオーディオ信号符号
化装置と組み合わせて用いる復号方法、及び復号装置の
構成を提供するようにし、安価で高品質なデジタルオー
ディオ信号を得る符号化、及び復号を行うシステム構築
がなされるようにするものである。
【0015】
【課題を解決するための手段】本発明は、上記課題を解
決するために以下の1)、2)の手段より成るものであ
る。すなわち、
【0016】1) 供給されるデジタルオーディオ信号
をm×n個(m、nは正の整数)のサンプルの信号によ
り構成される第1のフレーム信号として得、その得られ
た第1のフレーム信号から残差信号電力が最小となる最
も優勢な正弦波を抽出し、その抽出した信号成分を除い
た残差信号を得る優勢な正弦波抽出処理を繰り返して行
うことにより第1の調和解析結果、及び第1の残差信号
を得、その得られた第1の残差信号を時間軸上でm個に
分割してサンプル数がnで構成されるm個の第2のフレ
ーム信号を生成し、その生成されたm個の第2のフレー
ム信号のそれぞれについて優勢な正弦波抽出処理を繰り
返し行うことによりm組の第2の調和解析結果を得、そ
の得られたm組の第2の調和解析結果と、前記第1の調
和解析結果とを用いて前記ディジタルオーディオ信号の
圧縮符号化を行い、圧縮符号化して得られた圧縮符号化
信号と、前記m、nの数値情報を伝送するためのビット
ストリームを生成し、その伝送されたビットストリーム
を復号して、前記デジタルオーディオ信号を得るように
なしたオーディオ信号の復号方法において、前記ビット
ストリームより、前記m、nの数値情報を得て、複数の
正弦波波形データの配置位置を設定する第1のステップ
(22)と、前記ビットストリームより得られる第1、
及び第2の調和解析結果を基に複数の正弦波データを生
成し、それらの正弦波データを前記第1のステップで設
定した、対応する正弦波データの配置位置に、それぞれ
の波形データを配置する第2のステップ(23、24)
と、その第2のステップにより配置された複数の波形デ
ータのうち、同一再生時間に係るデータを加算して読み
出すことにより復号されたデジタルオーディオ信号を生
成する第3のステップ(25)と、よりなることを特徴
とするオーディオ信号の復号方法。
【0017】2) 供給されるデジタルオーディオ信号
をm×n個(m、nは正の整数)のサンプルの信号によ
り構成される第1のフレーム信号として得、その得られ
た第1のフレーム信号から残差信号電力が最小となる最
も優勢な正弦波を抽出し、その抽出した信号成分を除い
た残差信号を得る優勢な正弦波抽出処理を繰り返して行
うことにより第1の調和解析結果、及び第1の残差信号
を得、その得られた第1の残差信号を時間軸上でm個に
分割してサンプル数がnで構成されるm個の第2のフレ
ーム信号を生成し、その生成されたm個の第2のフレー
ム信号のそれぞれについて優勢な正弦波抽出処理を繰り
返し行うことによりm組の第2の調和解析結果を得、そ
の得られたm組の第2の調和解析結果と、前記第1の調
和解析結果とを用いて前記ディジタルオーディオ信号の
圧縮符号化を行い、圧縮符号化して得られた圧縮符号化
信号と、前記m、nの数値情報を伝送するためのビット
ストリームを生成し、その伝送されたビットストリーム
を復号して、前記デジタルオーディオ信号を得るように
なしたオーディオ信号の復号装置において、前記ビット
ストリームより、前記m、nの数値情報を得て、複数の
正弦波データ信号の配置位置を設定するフレーム設定手
段(22)と、前記ビットストリームより得られる第
1、及び第2の調和解析結果を基に複数の正弦波データ
を生成し、それらの正弦波データを前記フレーム設定手
段で設定した、対応する正弦波データの配置位置に、そ
れぞれの波形データを配置する波形サンプル生成手段
(23、24)と、その波形サンプル生成手段により配
置された複数の波形データのうち、同一再生時間に係る
データを加算して読み出すことにより復号されたデジタ
ルオーディオ信号を生成する波形サンプル加算手段(2
5)と、より構成されることを特徴とするオーディオ信
号の復号装置。
【0018】
【発明の実施の形態】以下、本発明のオーディオ信号の
復号方法、及びオーディオ信号の復号装置の実施形態に
つき、好ましい実施例により説明する。図1は、本願発
明に適用されるオーディオ信号の符号化装置の実施例
と、その本願発明の実施例に係る復号装置の概略構成で
ある。
【0019】同図において、オーディオ信号符号化装置
1はフレーム化A回路11、周波数成分抽出A回路1
2、フレーム化B回路13、周波数成分抽出B回路1
4、及びフレーム選択回路15で構成される一般調和解
析部10と、ビットストリーム生成回路16で構成され
る。
【0020】そしてオーディオ信号復号装置2は、ビッ
トストリーム復号回路21、フレーム設定回路22、波
形サンプル生成A回路23、波形サンプル生成B回路2
4、及び波形サンプル加算回路25により構成される。
【0021】つぎに、この様に構成されるオーディオ信
号符号化装置1、及びオーディオ信号復号装置2の動作
について述べる。まず、オーディオ信号符号化装置1へ
の入力信号である符号化の対象とされるデジタルオーデ
ィオ信号はフレーム化回路11に供給され、ここではそ
のデジタルオーディオ信号は第1の観測区間ごとのフレ
ーム信号に分割され、分割されたオーディオ信号は周波
数成分抽出回路12に供給される。
【0022】その周波数成分抽出回路12に供給された
フレーム信号は、第1の周波数間隔の精度で一般調和解
析(GHA)がなされ、後述の方法により第1の優勢な
周波数成分が抽出されて、ビットストリーム生成回路1
6に供給されるとともに、前述のフレーム信号より抽出
されたその第1の優勢な周波数成分を除去した第1の残
差信号を得、その得られた第1の残差信号をフレーム化
B回路13に供給する。
【0023】フレーム化B回路13では、フレーム選択
回路15よりの指示により、前記第1の観測区間と同じ
時間間隔を有する第1の残差信号は、時間軸方向に整数
mで分割されて、m個の第2の観測区間の信号とされ、
それぞれの第2の観測区間の残差信号は周波数成分抽出
B回路14に順次供給される。
【0024】その周波数成分抽出B回路14では、順次
供給されるm個の残差信号について順次一般調和解析が
行われ、第2の優勢な周波数成分が抽出されて、ビット
ストリーム生成回路16に供給されるとともに、残差信
号より抽出された優勢な周波数成分が順次除去され、そ
の残差信号のレベルが所定値となるまで周波数成分の抽
出処理がなされる。
【0025】このようにして抽出された第1、及び第2
の優勢な周波数成分は、第1の観測区間情報、及び第2
の観測区間情報並びに対応する区間位置情報とともにビ
ットストリーム生成回路16においてビットストリーム
として生成され、生成されたビットストリームはオーデ
ィオ信号符号化装置1より出力され、図示しない通信ネ
ットワークを介し、あるいは記録媒体を介してオーディ
オ信号復号装置2に供給される。
【0026】オーディオ信号復号装置2に供給されたビ
ットストリームはビットストリーム復号回路21により
復号され、第1、第2の優勢な周波数成分、第1、第2
の観測区間情報、及びそれらの優勢な周波数成分と対応
するそれぞれの観測区間情報が得られ、得られたそれら
の区間情報はフレーム設定回路22に、また第1の優勢
な周波数成分は波形サンプル生成A回路22に、そして
第2の優勢な周波数成分は波形サンプル生成B回路24
にそれぞれ供給される。
【0027】このようにして、フレーム設定回路23で
は供給された第1、及び第2の観測区間情報に基づいて
波形サンプル生成A回路23、及び波形サンプル生成B
回路24のそれぞれの時間フレームが設定される。
【0028】その波形サンプル生成A回路23では、供
給される第1の優勢な周波数成分に基づいた信号波形が
フレーム設定回路22により設定される時間フレーム上
に生成され、波形サンプル生成B回路24では、供給さ
れる第2の優勢な周波数成分に基づいた信号波形がフレ
ーム設定回路22により設定されるm個の時間フレーム
のうちの対応するフレーム上に生成される。
【0029】このようにして、波形サンプル生成A回路
23、及び波形サンプル生成B回路24より信号波形が
得られ、これらの信号波形は波形サンプル加算回路25
に供給されるが、ここではお互いに同一再生時間である
信号波形が加算されて、ディジタルオーディオ信号が復
号され、復号されたオーディオ信号はオーディオ信号復
号装置2より出力される。
【0030】次に、図2を用いて前述した周波数成分抽
出A回路12の動作につき説明する。同図はその動作を
示すフローチャートである。まず、ステップ1で1フレ
ーム分のデジタルオーディオ信号は周波数成分抽出A回
路12に供給され、ステップ2でその周波数成分が抽出
される。
【0031】ステップ3では周波数成分抽出のされてな
い残差信号のレベルがチェックされ、残差信号レベルが
所定値以下でないときは、再びステップ2に戻り次の周
波数成分が抽出される。残差信号レベルが所定値以下の
ときはステップ4に進み分析結果信号が出力され、一般
調和解析のステップを終了する。
【0032】図3は、図2の要部であるステップ2の周
波数成分抽出の動作を詳細に説明するフローチャートで
あり、さらに詳細に説明する。まず、ステップ11で抽
出すべき複数の周波数の中の1つが選択され、ステップ
12でその周波数の信号成分が抽出され、ステップ13
で抽出された信号成分を除く残差信号が算出され、ステ
ップ14で抽出すべき全ての周波数成分の抽出が行われ
たかどうかがチェックされる。
【0033】抽出処理を行った周波数が最後の周波数で
ないときはステップ11に戻され、最後の周波数である
ときはステップ15に進められ、ステップ15では、複
数の抽出された信号成分の中で最も信号レベルの大きい
最優勢信号成分が選択され、ステップ16で原信号より
最優勢信号の周波数成分が除去され、前述のステップ3
に進められる。
【0034】次に、上述のフレーム選択回路14の動作
について述べる。一般調和解析(GHA)は、従来の周
波数分析に用いられる高速フーリエ変換(FFT)や適
応型離散余弦変換(MDCT)等のいわゆる調和解析よ
りも、精度の高い分析を行えるため、高能率な符号化方
法、符号化装置に使用できるが、その反面、精度が高く
得られる周波数分析結果は、場合によって符号量が増大
し符号化効率を低下させることがあるが、聴覚心理の特
性に合わせてその周波数分析結果を変換して符号化処理
を行うことにより、少ない符号量で高品質の音質を得る
ようにしてオーディオ信号の符号化方法を実現するもの
である。
【0035】図4に人が知覚できる周波数に対する音圧
レベルの特性を示す。同図において曲線は人が知覚でき
る周波数に対する音圧レベルの特性を示しており、この
曲線以下の音圧レベルは知覚することができない。従っ
て、これらの音圧を伝送するときは、とは伝送する
必要がなく、の周波数と音圧のみを伝送すればよい。
【0036】ここで、で示す音圧が、周波数値が少し
異なる2つの音圧スペクトラムにより構成されている場
合では、2つの周波数で構成される信号の音圧レベル
が、可聴限界に近い音圧であるときは2つの周波数は弁
別して聞くことが出来なく、1つの周波数の音として知
覚される。また、その2つの周波数の音圧レベルが異な
るときは、大きな音圧レベルの周波数は知覚できるがレ
ベルの小さな音は知覚できない。
【0037】図5に、音圧レベルの異なる2つの周波数
の知覚レベルの関係を示す。同図においてで示す大き
な音圧の信号に対し、それと小さな周波数差があり、音
圧レベルの小さな信号の知覚レベルに関するものであ
る。
【0038】同図に太い点線で示す曲線が音圧に対す
るマスキング曲線であり、周波数が多少異なる音圧レベ
ルの信号はこのマスキング曲線より大きな音圧レベル
の場合は知覚できるが、この曲線以下のレベルの信号は
知覚することができない。
【0039】この様に、所定レベル以下の小さな音圧の
信号は知覚出来ないので、音響信号の圧縮符号化におい
ては、知覚出来ない信号を除いて符号化を行うことによ
り符号化の効率を高めるようにする。
【0040】以上は、音響信号の知覚の面から見たマス
キング効果の関係であるが、マスキング曲線の近くにあ
る音圧信号については、その信号が単音であるか、複
数の周波数からなる合成音であるかにより知覚のされ方
が異なり、複数の周波数から構成される合成音について
は、それらの1つ1つの周波数の音を知覚することは難
しい。
【0041】従って、知覚され難い複数の周波数からな
るオーディオ信号の符号化は、周波数間隔の広い周波数
により優勢な周波数成分の抽出を行う。そして、周波数
間隔の広い周波数による音の分析はフレーム間隔の短い
オーディオサンプルにより行うようにする。
【0042】そして、フレーム間隔の短いオーディオサ
ンプルの分析は、その音が単発的で過渡的な音である場
合、及び時間とともに周波数が変化しているような音に
対しても、その短い時間間隔の中での優勢な周波数成分
を抽出することができるため、より質の高い音質で符号
化を行なうことが出来る。
【0043】すなわち、前述の図1において、フレーム
化A回路12で、供給されるオーディオ信号のデータ
を、例えばm×nサンプル(m、nは2以上の正の整
数)期間のフレーム長のデータ毎に区切り、その区切ら
れたデータに対して周波数成分抽出A回路による一般調
和解析を行う。
【0044】そして、フレーム化A回路12で、m×n
サンプル期間に比較的連続的に存在する優勢な周波数成
分を抽出し、残差信号レベルが第1の所定値以下となっ
たときその残差信号をフレーム化B回路13に供給す
る。
【0045】ここでは、供給された残差信号をフレーム
長がnサンプルである、m個のフレームのデータに分割
し、分割された各々のデータを周波数成分抽出B回路1
4に供給する。
【0046】その周波数成分抽出B回路14は、m個の
並列に動作する周波数成分抽出回路により、又は1個の
周波数成分抽出回路が時分割処理するように構成され、
m個のnサンプルの残差信号に対する一般調和解析を行
い、m組の周波数成分抽出処理した信号を供給するよう
にする。
【0047】図6に、フレーム分割による一般調和解析
部の構成を示し、説明する。このフレーム分割による一
般調和解析部は、分割フレーム化C回路131、分割フ
レームD回路132、及び分割フレーム選択回路133
よりなるフレーム化B回路13と、周波数成分抽出C回
路141、周波数成分抽出D回路142、及び周波数成
分合成回路146よりなる周波数成分抽出B回路14と
より構成される。
【0048】この様に構成されるフレーム分割による一
般調和解析部について述べる。まず、分割フレーム選択
回路133は周波数成分抽出A回路12より供給される
m×nサンプルのフレームデータの分割方法について、
例えばm×nサンプルのデータを前半部と後半部の2つ
に2等分するか、あるいはp×nサンプル(pは1以上
の整数)と、(m−p)×nサンプルのデータに分割す
るか、さらには3以上の個数に分割するかを選択すると
ともに、そのような分割方法に関する情報は分割フレー
ムC回路131、分割フレームD回路132、及びビッ
トストリーム生成回路16に供給される。
【0049】分割フレームC回路131、及び分割フレ
ームD回路132のそれぞれは、分割フレーム選択回路
133から供給される情報に基づいて、周波数成分抽出
A回路よりフレームデータとして供給される残差信号
の、前半部、及び後半部のそれぞれのデータを取得す
る。
【0050】この様にして取得されたそれぞれの分割さ
れた残差信号のデータは、それぞれが対応する周波数成
分抽出C回路141、及び周波数成分抽出D回路142
において一般調和解析がなされ、それぞれの回路から得
られる優勢な周波数成分は周波数成分合成回路146に
供給される。
【0051】その周波数成分合成回路146では、分割
された前半部、及び後半部より同一の優勢な周波数成分
が抽出されたときは1つの信号に合成するなどの処理を
行うが、分割された前半部、及び後半部のフレームより
異なる周波数成分が抽出された場合は、それらのデータ
はそのままビットストリーム生成回路に供給される。
【0052】なお、この図に示したフレーム分割は2分
割する場合であるが、分割数は2に限ることなく、3、
4、8などの任意の整数値であればよく、その場合はさ
らに多くの周波数成分抽出回路を配置する、又は時分割
処理により複数の分割された信号の一般調和解析を行な
うようにする。
【0053】図7に、そのフレーム分割による一般調和
解析の手順をフローチャーとにより示す。同図におい
て、フレーム化回路11に供給された信号の分割フレー
ムによる一般調和解析の方法を示しており、S34の第
1分析結果出力は周波数成分抽出C回路141より得ら
れる出力信号に、そしてS44の第2分析結果出力は周
波数成分抽出D回路142より得られる出力信号に対応
している。
【0054】このように、この例における一般調和解析
は、最初にフレーム選択回路15により定められたフレ
ーム長で一般調和解析を行い、次にフレーム分割した残
差信号に対する一般調和解析を行うが、そのフレーム分
割をして解析を行うかどうかはオーディオ信号が連続的
で、調和的であるか、あるいは過渡的で、不調和的であ
るかによっても異なり、通常は残差信号レベルに所定の
閾値を設定しておき、そのレベルを監視しつつフレーム
分割処理を行うかどうかを決める。
【0055】図8に、その残差信号レベルを監視しつつ
フレーム分割処理を行うための信号処理のステップを示
す。S22において残差信号レベルが第1の所定のレベ
ル(閾値)以下である判断されたときはS23のフレー
ム分割処理のステップに進められるようになっている。
【0056】このS22で比較の対象となる閾値は、前
述の図2に示すS3に示す値は前述の図4に示す知覚で
きる最低音圧レベル(第2の所定のレベル)に基づいて
設定されるが、フレーム分割に対する第1の所定のレベ
ルはそのS3で設定される第2の所定のレベルに対し
て、例えば調和的な信号に対しては2倍、不調和的な信
号に対しては10倍程度の大きな値を用いるようにす
る。
【0057】このようにして、分割処理ステップを有す
る周波数成分抽出処理は、分析する音響信号の周波数成
分ごとに、適正なフレーム間隔を設定して周波数分析を
行うため、聴覚心理上知覚されやすい信号に対しては精
度の高い周波数成分の抽出が出来、知覚され難い信号に
対しては広い周波数間隔により低い周波数精度による周
波数成分の抽出を行い、それらの分析結果をもとに符号
化効率の高い音響信号の圧縮符号化処理を行なうもので
ある。
【0058】すなわち、最適なオーディオ信号の圧縮符
号化は、前述のような符号化される信号の周波数と信号
レベルに対する知覚の度合いにより分析する周波数間隔
を異ならしめ、その周波数間隔を基に供給される音響信
号の周波数値とレベルの関係を分析し、総符号量に対し
て聴覚上バランスの取れた圧縮オーディオ信号が得られ
るように音響信号の符号化を行うようにする。
【0059】このようにして、一般調和解析部10にお
けるオーディオ信号の周波数成分抽出は、供給されるオ
ーディオ信号に対して適応的にフレーム間隔を設定しな
がら周波数成分の抽出を行うようにしている。
【0060】このようにしてフレーム選択回路15、及
び分割フレーム選択回路133により符号化されるオー
ディオ入力信号に応じて適応的にフレーム長が設定さ
れ、そのフレーム長の信号に対する周波数成分抽出処理
がなされ、そのときに設定されたフレーム長の情報はビ
ットストリーム生成回路16に供給され、フレーム長の
情報を含むビットストリームが生成される。
【0061】そして生成されたビットストリームは復号
装置2のビットストリーム復号回路21に供給され、ビ
ットストリーム復号回路21は供給された複数のフレー
ム長情報と、それらのフレームに対応する圧縮符号化さ
れたオーディオデータが復号され、それらの復号された
フレーム長情報はフレーム設定回路22に供給される。
【0062】そのフレーム設定回路22では、それらの
フレーム長の情報をもとに波形サンプル生成A回路2
3、及び分割されたフレーム長情報は波形サンプル生成
B回路24に供給され、これらの波形サンプル生成回路
は供給されたフレーム長情報をもとに復号されたオーデ
ィオ信号を配置する時間をそれぞれに設定する。
【0063】この様にして、波形サンプル生成A回路2
3は供給される周波数成分抽出A回路12より供給され
た信号に対する波形のサンプルデータを生成してフレー
ム長に対応する位置に配置し、波形サンプル生成B回路
24は供給される周波数成分抽出B回路14より供給さ
れた信号に対する波形のサンプルデータを生成し、分割
フレームに対応する位置にサンプルデータを配置するよ
うにする。
【0064】このようにして生成された波形のサンプル
データは、波形サンプル加算回路25で、同じ再生時間
のオーディオ信号同士が加算され、オーディオ信号が復
号され、復号された信号は復号器2の出力信号として供
給される。
【0065】以上のようにして、この一般調和解析を用
いるオーディオ信号の圧縮符号化方式は、入力されるオ
ーディオ信号の優勢な周波数成分を、複数のフレーム間
隔が用いられて一般調和解析がなされるため、その解析
により抽出された複数の優勢な周波数成分よりオーディ
オ信号を復号するため、オーディオ信号復号装置2は、
オーディオ信号符号化装置1と同一のタイムフレームを
設定し、その設定された同一のタイムフレーム上にそれ
ぞれの抽出された周波数の波形を生成し、それぞれの生
成された周波数の波形は同一時刻の波形サンプルが加算
されるようにしてオーディオ信号を復号するようにする
ものである。
【0066】このようにして一般調和解析により符号化
された信号が伝送され、抽出された周波数の波形を生成
して加算することにより符号化された信号の復号がなさ
れるが、その一般調和解析により抽出された信号は、多
数の正弦波の集合として表すことができ、その正弦波に
よる当該フレーム内の信号x(t) の構成を図9に示す。
【0067】同図において示されるように、抽出される
信号x(t)は、その正弦波の周波数がf1,f2,…,fNのN個
の信号の重ね合わせで表される。ただし、FFTによる
解析結果とは異なり、これらの正弦波は基本波の整数倍
の周波数の関係にある調和的な関係とは異なった非調和
な周波数の関係となっている。
【0068】以上、オーディオ信号の符号化を行い、ビ
ットストリーム信号を生成するオーディオ信号符号化装
置1、及びそのビットストリームの復号を行うオーディ
オ信号復号装置2の構成を前述の図1により、回路ブロ
ックによる構成として示し、説明したが、これらの回路
は例えばDSP(Digital signal processor)を用いて
ソフトウエアにより実現することが出来る。
【0069】DSPは、供給される信号の信号処理をソ
フト的に行うものであり、上述の符号化回路、及び復号
回路を信号処理プログラムにより記述し、回路によりハ
ードウエアとして実現したと同様の動作を、所定のソフ
トウエアによるステップ処理により、符号化、復号の信
号処理を行うことができる。
【0070】以上のように本実施例の装置によれば、供
給されるオーディオ信号を、一般調和解析(GHA)に
より知覚されやすい信号に対しては小さい周波数間隔の
周波数により高い周波数精度で周波数分析を行い、音響
信号を出きるだけ忠実に伝送するようにし、信号レベル
が小さく、あるいは他の優勢な周波数成分によりマスキ
ングされるような残差成分が所定値以下の信号に対して
は周波数間隔を広げて低い周波数精度による周波数分析
を行なうようにしている。
【0071】このようにして周波数分析を行うため、分
析結果としての情報量を少なくでき、この方法に基づい
て抽出したレベルを用いて行うオーディオ信号の符号化
では、符号量をあまり増加させずに、信号品質が良く、
効率の高い符号化ストリームを生成することができると
ともに、そのようにして生成され、伝送されたビットス
トリームの信号を、符号化と同一のフレーム期間を設定
してなる復号器によりそのままの品質で復号する復号器
を構成することができる特徴を有している。
【0072】
【発明の効果】請求項1記載の発明によれば、供給され
るデジタルオーディオ信号を、一般調和解析(GHA)
により知覚されやすい信号に対しては所定のフレーム長
により小さな周波数の間隔で、知覚され難い信号に対し
ては分割されたフレーム長による大きな間隔の周波数に
より、複数のフレーム間隔のオーディオ信号に対して周
波数分析を行うため、この方法に基づいて抽出された周
波数のレベルを用いて行うオーディオ信号の符号化で
は、符号量の増加が少なく、信号品質が良く、効率の高
い符号化ビットストリームを得ることができ、そのよう
にして得られたビットストリームの信号を符号化と同じ
フレーム期間を設定した波形サンプル生成方法により抽
出された複数の周波数の信号波形を生成し、生成された
複数の信号を加算することにより、信号品質の高いオー
ディオ信号を復号するビットストリーム復号方法を提供
することができる効果がある。
【0073】また、請求項2記載の発明によれば、供給
されるデジタルオーディオ信号を、一般調和解析(GH
A)により知覚されやすい信号に対しては所定のフレー
ム長による小さな周波数の間隔で周波数分析を行い、知
覚され難い信号に対しては分割されたフレーム長による
大きな間隔の周波数により周波数分析を行うため、この
方法に基づいて抽出したレベルを用いて行うオーディオ
信号の符号化では、符号量をあまり増加させないで、信
号品質が良く、効率の高い符号化ビットストリームを得
ることができるとともに、そのようにして得られたビッ
トストリームの信号を符号化と同じフレーム期間を設定
した波形サンプル生成手段により抽出された複数の周波
数の信号波形を生成し、加算された信号を出力すること
により、信号品質の高いオーディオ信号を復号する復号
装置を構成することができる効果がある。
【図面の簡単な説明】
【図1】本発明の実施例に係るオーディオ信号の符号
化、及び復号装置の概略ブロック図である。
【図2】本発明の実施例に係るオーディオ信号の符号化
方法に用いられる周波数成分抽出方法の概略フローを示
す図である。
【図3】本発明の実施例に係るオーディオ信号の符号化
方法に用いられる周波数成分抽出方法のフローを示す図
である。
【図4】知覚できる最低音圧レベルの周波数特性を説明
するための図である。
【図5】近接する周波数の音圧に対して知覚できる最低
音圧レベルの特性を説明するための図である。
【図6】本発明の実施例に係るオーディオ信号の符号化
装置の分割フレームによる一般調和解析部のブロック図
である。
【図7】本発明の実施例に係るオーディオ信号の符号化
方法に用いられる分割フレームによる周波数成分抽出方
法のフローを示す図である。
【図8】本発明の実施例に係るオーディオ信号の符号化
方法に用いられる周波数成分抽出方法の分割フレーム処
理に関するフローを示す図である。
【図9】一般調和解析により得られる解析結果を示す数
式である。
【符号の説明】
1 オーディオ信号符号化装置 2 オーディオ信号復号装置 10 一般調和解析部 11 フレーム化A回路 12 周波数成分抽出A回路 13 フレーム化B回路 14 周波数成分抽出B回路 15 フレーム選択回路 16 ビットストリーム生成回路 21 ビットストリーム復号回路 22 フレーム設定回路 23 波形サンプル生成A回路 24 波形サンプル生成B回路 25 及び波形サンプル加算回路 131 分割フレーム化C回路 132 分割フレーム化D回路 133 分割フレーム選択回路 141 周波数成分抽出C回路 142 周波数成分抽出D回路 146 周波数成分合成回路

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】供給されるデジタルオーディオ信号をm×
    n個(m、nは正の整数)のサンプルの信号により構成
    される第1のフレーム信号として得、その得られた第1
    のフレーム信号から残差信号電力が最小となる最も優勢
    な正弦波を抽出し、その抽出した信号成分を除いた残差
    信号を得る優勢な正弦波抽出処理を繰り返して行うこと
    により第1の調和解析結果、及び第1の残差信号を得、
    その得られた第1の残差信号を時間軸上でm個に分割し
    てサンプル数がnで構成されるm個の第2のフレーム信
    号を生成し、その生成されたm個の第2のフレーム信号
    のそれぞれについて優勢な正弦波抽出処理を繰り返し行
    うことによりm組の第2の調和解析結果を得、その得ら
    れたm組の第2の調和解析結果と、前記第1の調和解析
    結果とを用いて前記ディジタルオーディオ信号の圧縮符
    号化を行い、圧縮符号化して得られた圧縮符号化信号
    と、前記m、nの数値情報を伝送するためのビットスト
    リームを生成し、その伝送されたビットストリームを復
    号して、前記デジタルオーディオ信号を得るようになし
    たオーディオ信号の復号方法において、 前記ビットストリームより、前記m、nの数値情報を得
    て、複数の正弦波波形データの配置位置を設定する第1
    のステップと、 前記ビットストリームより得られる第1、及び第2の調
    和解析結果を基に複数の正弦波データを生成し、それら
    の正弦波データを前記第1のステップで設定した、対応
    する正弦波データの配置位置に、それぞれの波形データ
    を配置する第2のステップと、 その第2のステップにより配置された複数の波形データ
    のうち、同一再生時間に係るデータを加算して読み出す
    ことにより復号されたデジタルオーディオ信号を生成す
    る第3のステップと、よりなることを特徴とするオーデ
    ィオ信号の復号方法。
  2. 【請求項2】供給されるデジタルオーディオ信号をm×
    n個(m、nは正の整数)のサンプルの信号により構成
    される第1のフレーム信号として得、その得られた第1
    のフレーム信号から残差信号電力が最小となる最も優勢
    な正弦波を抽出し、その抽出した信号成分を除いた残差
    信号を得る優勢な正弦波抽出処理を繰り返して行うこと
    により第1の調和解析結果、及び第1の残差信号を得、
    その得られた第1の残差信号を時間軸上でm個に分割し
    てサンプル数がnで構成されるm個の第2のフレーム信
    号を生成し、その生成されたm個の第2のフレーム信号
    のそれぞれについて優勢な正弦波抽出処理を繰り返し行
    うことによりm組の第2の調和解析結果を得、その得ら
    れたm組の第2の調和解析結果と、前記第1の調和解析
    結果とを用いて前記ディジタルオーディオ信号の圧縮符
    号化を行い、圧縮符号化して得られた圧縮符号化信号
    と、前記m、nの数値情報を伝送するためのビットスト
    リームを生成し、その伝送されたビットストリームを復
    号して、前記デジタルオーディオ信号を得るようになし
    たオーディオ信号の復号装置において、 前記ビットストリームより、前記m、nの数値情報を得
    て、複数の正弦波データ信号の配置位置を設定するフレ
    ーム設定手段と、 前記ビットストリームより得られる第1、及び第2の調
    和解析結果を基に複数の正弦波データを生成し、それら
    の正弦波データを前記フレーム設定手段で設定した、対
    応する正弦波データの配置位置に、それぞれの波形デー
    タを配置する波形サンプル生成手段と、 その波形サンプル生成手段により配置された複数の波形
    データのうち、同一再生時間に係るデータを加算して読
    み出すことにより復号されたデジタルオーディオ信号を
    生成する波形サンプル加算手段と、より構成されること
    を特徴とするオーディオ信号の復号装置。
JP2000268233A 2000-09-05 2000-09-05 オーディオ信号の復号方法、及びオーディオ信号の復号装置 Pending JP2002073067A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000268233A JP2002073067A (ja) 2000-09-05 2000-09-05 オーディオ信号の復号方法、及びオーディオ信号の復号装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000268233A JP2002073067A (ja) 2000-09-05 2000-09-05 オーディオ信号の復号方法、及びオーディオ信号の復号装置

Publications (1)

Publication Number Publication Date
JP2002073067A true JP2002073067A (ja) 2002-03-12

Family

ID=18755039

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000268233A Pending JP2002073067A (ja) 2000-09-05 2000-09-05 オーディオ信号の復号方法、及びオーディオ信号の復号装置

Country Status (1)

Country Link
JP (1) JP2002073067A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111681639A (zh) * 2020-05-28 2020-09-18 上海墨百意信息科技有限公司 一种多说话人语音合成方法、装置及计算设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111681639A (zh) * 2020-05-28 2020-09-18 上海墨百意信息科技有限公司 一种多说话人语音合成方法、装置及计算设备
CN111681639B (zh) * 2020-05-28 2023-05-30 上海墨百意信息科技有限公司 一种多说话人语音合成方法、装置及计算设备

Similar Documents

Publication Publication Date Title
CN100578621C (zh) 信号处理设备和方法
KR19980028284A (ko) 음성신호재생방법 및 장치, 음성복호화방법 및 장치, 음성합성방법 및 장치와 휴대용 무선단말장치
KR101413967B1 (ko) 오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치
JP2005531024A (ja) 圧縮されたマルチメディアコンテンツからのハッシュを生成する方法
KR20100095585A (ko) 신호 처리 방법 및 장치
KR20100086000A (ko) 오디오 신호 처리 방법 및 장치
JPH10307599A (ja) スプラインを使用する波形補間音声コーディング
JP2008519991A (ja) 音声の符号化及び復号化
WO2003010752A1 (en) Speech bandwidth extension apparatus and speech bandwidth extension method
JP4736812B2 (ja) 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
JPH10319996A (ja) 雑音の効率的分解と波形補間における周期信号波形
JP2003108197A (ja) オーディオ信号復号化装置およびオーディオ信号符号化装置
KR20030011912A (ko) 오디오 코딩
JP3344944B2 (ja) オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法
JP3670217B2 (ja) 雑音符号化装置、雑音復号装置、雑音符号化方法および雑音復号方法
KR20040044389A (ko) 부호화 방법 및 장치, 및 복호 방법 및 장치
JPH09135176A (ja) 情報符号化装置および方法、情報復号化装置および方法、並びに情報記録媒体
JP4578145B2 (ja) 音声符号化装置、音声復号化装置及びこれらの方法
JP2002073067A (ja) オーディオ信号の復号方法、及びオーディオ信号の復号装置
JP4574320B2 (ja) 音声符号化方法、広帯域音声符号化方法、音声符号化装置、広帯域音声符号化装置、音声符号化プログラム、広帯域音声符号化プログラム及びこれらのプログラムを記録した記録媒体
US20160035365A1 (en) Sound encoding device, sound encoding method, sound decoding device and sound decoding method
JP2796408B2 (ja) 音声情報圧縮装置
JP2002076904A (ja) 符号化されたオーディオ信号の復号化方法、及び符号化されたオーディオ信号の復号化装置
JP6713424B2 (ja) 音声復号装置、音声復号方法、プログラム、および記録媒体
JP4618823B2 (ja) 信号符号化装置及び方法