JP2906646B2 - 音声帯域分割符号化装置 - Google Patents
音声帯域分割符号化装置Info
- Publication number
- JP2906646B2 JP2906646B2 JP2305114A JP30511490A JP2906646B2 JP 2906646 B2 JP2906646 B2 JP 2906646B2 JP 2305114 A JP2305114 A JP 2305114A JP 30511490 A JP30511490 A JP 30511490A JP 2906646 B2 JP2906646 B2 JP 2906646B2
- Authority
- JP
- Japan
- Prior art keywords
- evaluation function
- maximum value
- unit
- band
- weighting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/66—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
- H04B1/665—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect
Description
【発明の詳細な説明】 産業上の利用分野 本発明は、テープ,ディスク等の記録,再生系や通
信,放送等の伝送系の高能率符号化に用いられる音声帯
域分割符号化装置に関するものである。
信,放送等の伝送系の高能率符号化に用いられる音声帯
域分割符号化装置に関するものである。
従来の技術 近年、高品位音声信号の高能率符号化を実現する装置
として、音声帯域分割符号化装置が注目を集めている。
として、音声帯域分割符号化装置が注目を集めている。
従来の音声帯域分割符号化装置としては、例えばジー
・スィール(G.THEILE)等によりイー・ビー・ユー・レ
ビュー・テクニカル(EBU REVIEW−TECHNICAL)誌,第2
30号,71頁〜94頁,1988年8月に発表された「高品位音声
信号の低ビットレート符号化 MASCAMシステムの紹介」
(LOW BIT-RATE CODING OF HIGH QUALITY AUDIO SIGNAL
S,AN INTRODUCTION TO MASCAM SYSTEM)と題する論文
(以下、文献1と呼ぶ)や、アール・エヌ・ジェイ・フ
ェルデユース(R.N.J.VELDHUIS)等によりフィリップス
・ジャーナル・オブ・リサーチ(PHILIPS JOURNAL OF R
ESEARCH)誌,第44巻,2/3号,329頁〜343頁,1989年に発
表された「デジタルオーディオ信号の帯域分割符号化」
(SUBBAND CODING OF DIGITAL AUDIO SIGNALS)と題す
る論文(以下、文献2と呼ぶ)に記載されている。
・スィール(G.THEILE)等によりイー・ビー・ユー・レ
ビュー・テクニカル(EBU REVIEW−TECHNICAL)誌,第2
30号,71頁〜94頁,1988年8月に発表された「高品位音声
信号の低ビットレート符号化 MASCAMシステムの紹介」
(LOW BIT-RATE CODING OF HIGH QUALITY AUDIO SIGNAL
S,AN INTRODUCTION TO MASCAM SYSTEM)と題する論文
(以下、文献1と呼ぶ)や、アール・エヌ・ジェイ・フ
ェルデユース(R.N.J.VELDHUIS)等によりフィリップス
・ジャーナル・オブ・リサーチ(PHILIPS JOURNAL OF R
ESEARCH)誌,第44巻,2/3号,329頁〜343頁,1989年に発
表された「デジタルオーディオ信号の帯域分割符号化」
(SUBBAND CODING OF DIGITAL AUDIO SIGNALS)と題す
る論文(以下、文献2と呼ぶ)に記載されている。
以下図面を参照しながら、従来の音声帯域分割符号化
装置とその復号化装置について説明する。
装置とその復号化装置について説明する。
第5図は、従来の音声帯域分割符号化装置のブロック
図を示すものである。
図を示すものである。
第5図において、51は分析フィルタ部、52は最大値情
報決定部、53は評価関数算出部、54はビット割当決定
部、55は量子化部、56は多重化部である。
報決定部、53は評価関数算出部、54はビット割当決定
部、55は量子化部、56は多重化部である。
以上のように構成された音声帯域分割符号化装置につ
いて、以下その動作を説明する。
いて、以下その動作を説明する。
第5図において、分析フィルタ部51は、入力されたデ
ジタル音声信号を複数の部分帯域に分割するための複数
の帯域通過フィルタからなるフィルタ群である。デジタ
ル音声信号のサンプリング周波数が32kHzから48kHzの場
合、人間の聴覚特性の臨界帯域幅に対応して16個から32
個の部分帯域に分割される。分析フィルタ部51はデジタ
ルフィルタであり、例えばインテジャーバンドフィルタ
バンク(INTEGER-BAND FILTER BANK)によって構成され
る。インテジャーバンドフィルタバンクについては、エ
ヌ・エス・ジャイアント(N.S.JAYANT)とピー・ノル
(P.NOLL)によりプレンティス・ホール(PRENTICE-HAL
L)社から1984年に出版された「波形のデジタル符号
化」(DIGITAL CODING OF WAVEFORMS)と題する本の第1
1章(以下、文献3と呼ぶ)に記載されている。インテ
ジャーバンドフィルタバンクでは、全帯域幅の部分帯域
の帯域幅に対する比が整数であり、この比で間引きを行
うことにより、帯域通過信号を低域周波数信号に周波数
変換することができる。しかしながら間引きによって帯
域の境界で折返し歪が発生する。分析フィルタによって
発生するこの折返し歪を合成フィルタでキャンセルする
ことができるフィルタとしてクオドラチャミラーフィル
タ(QUADRATURE MIRROR FILTER,以下、QMFと呼ぶ)が広
く用いられている。QMFでは隣接する部分帯域の信号の
量子化幅が同一であるときには折返し歪をキャンセルす
ることができる。分析フィルタ部51で複数の部分帯域に
分割された信号は5msから20msの所定の時間を有する区
間に区切られる。
ジタル音声信号を複数の部分帯域に分割するための複数
の帯域通過フィルタからなるフィルタ群である。デジタ
ル音声信号のサンプリング周波数が32kHzから48kHzの場
合、人間の聴覚特性の臨界帯域幅に対応して16個から32
個の部分帯域に分割される。分析フィルタ部51はデジタ
ルフィルタであり、例えばインテジャーバンドフィルタ
バンク(INTEGER-BAND FILTER BANK)によって構成され
る。インテジャーバンドフィルタバンクについては、エ
ヌ・エス・ジャイアント(N.S.JAYANT)とピー・ノル
(P.NOLL)によりプレンティス・ホール(PRENTICE-HAL
L)社から1984年に出版された「波形のデジタル符号
化」(DIGITAL CODING OF WAVEFORMS)と題する本の第1
1章(以下、文献3と呼ぶ)に記載されている。インテ
ジャーバンドフィルタバンクでは、全帯域幅の部分帯域
の帯域幅に対する比が整数であり、この比で間引きを行
うことにより、帯域通過信号を低域周波数信号に周波数
変換することができる。しかしながら間引きによって帯
域の境界で折返し歪が発生する。分析フィルタによって
発生するこの折返し歪を合成フィルタでキャンセルする
ことができるフィルタとしてクオドラチャミラーフィル
タ(QUADRATURE MIRROR FILTER,以下、QMFと呼ぶ)が広
く用いられている。QMFでは隣接する部分帯域の信号の
量子化幅が同一であるときには折返し歪をキャンセルす
ることができる。分析フィルタ部51で複数の部分帯域に
分割された信号は5msから20msの所定の時間を有する区
間に区切られる。
最大値情報決定部52は、分析フィルタ部51から各部分
帯域毎に区間内の信号の絶対値の最大値を求め、最大値
情報を出力する。最大値情報としては、例えば最大値を
6ビットで対数量子化したものが用いられる。
帯域毎に区間内の信号の絶対値の最大値を求め、最大値
情報を出力する。最大値情報としては、例えば最大値を
6ビットで対数量子化したものが用いられる。
評価関数算出部53は、聴覚のマスキング規則に基づい
て、ビット割当決定部54で最適なビット割当を行うため
に必要な評価関数を算出する。すなわち、部分帯域分割
数をN,部分帯域番号をi(低周波数から高周波数に順に
番号をつける。1≦i≦N),部分帯域番号iの最大値
情報をPi,信号のパワーをSi,信号によってマスクされる
パワー(以下、マスクトパワーと呼ぶ)をMi,1区間内の
間引き後のサンプル数をLi,割当ビット数をBi,1区間内
でサンプル情報に割当可能な全ビット数をBqとすると、
部分帯域番号iの量子化雑音パワーは次式で求められ
る。
て、ビット割当決定部54で最適なビット割当を行うため
に必要な評価関数を算出する。すなわち、部分帯域分割
数をN,部分帯域番号をi(低周波数から高周波数に順に
番号をつける。1≦i≦N),部分帯域番号iの最大値
情報をPi,信号のパワーをSi,信号によってマスクされる
パワー(以下、マスクトパワーと呼ぶ)をMi,1区間内の
間引き後のサンプル数をLi,割当ビット数をBi,1区間内
でサンプル情報に割当可能な全ビット数をBqとすると、
部分帯域番号iの量子化雑音パワーは次式で求められ
る。
(2Pi/2B1)2/12 したがって、全帯域の量子化雑音パワー対マスクトパ
ワー比(NOISE-TO-MASK RATIO,以下、NMRと呼ぶ)は次
式で与えられる。
ワー比(NOISE-TO-MASK RATIO,以下、NMRと呼ぶ)は次
式で与えられる。
ビット割当決定部54は、次式に示す固定ビットレートの
条件の下でNMRを最小化するビット割当を行う。
条件の下でNMRを最小化するビット割当を行う。
このために評価関数算出部53は、部分帯域番号iの評価
関数Eiとして次式を計算し、出力する。
関数Eiとして次式を計算し、出力する。
Ei=log2(Pi/Mi1/2) =log2Pi−(log2Mi)/2 第6図は評価関数算出部53のフローチャートである。
評価関数算出部53では、最初に分析フィルタ部51からの
各部分帯域の信号を用い、各部分帯域の信号パワーを算
出する。次に、各部分帯域の信号のパワーとマスキング
規則とに基づいて、帯域内の信号によってまた隣接帯域
の信号によってマスキングされて人間の耳には聞こえな
いマスクトパワーを算出する。マスクトパワーの算出法
については、例えば文献2の334頁〜338頁に記載されて
いる。次に、各部分帯域毎に、最大値情報決定部52から
の最大値情報の2を底とする対数から、マスクトパワー
の2を底とする対数に2分の1を掛けたものを引くこと
により評価関数を求め、出力する。
評価関数算出部53では、最初に分析フィルタ部51からの
各部分帯域の信号を用い、各部分帯域の信号パワーを算
出する。次に、各部分帯域の信号のパワーとマスキング
規則とに基づいて、帯域内の信号によってまた隣接帯域
の信号によってマスキングされて人間の耳には聞こえな
いマスクトパワーを算出する。マスクトパワーの算出法
については、例えば文献2の334頁〜338頁に記載されて
いる。次に、各部分帯域毎に、最大値情報決定部52から
の最大値情報の2を底とする対数から、マスクトパワー
の2を底とする対数に2分の1を掛けたものを引くこと
により評価関数を求め、出力する。
第7図はビット割当決定部54のフローチャートであ
る。ビット割当決定部54は、ステップ1で初期化処理を
行った後、ステップ2とステップ3を繰り返すことによ
り、NMRを最小にする部分帯域番号iの割当ビット数Bi
を決定し、出力する。
る。ビット割当決定部54は、ステップ1で初期化処理を
行った後、ステップ2とステップ3を繰り返すことによ
り、NMRを最小にする部分帯域番号iの割当ビット数Bi
を決定し、出力する。
ステップ1では、割当可能なビット数BをBqに、Bi
(1≦i ≦N)を0に設定する。
(1≦i ≦N)を0に設定する。
ステップ2では、評価関数Eiを最大とする部分帯域番
号kを見い出す。
号kを見い出す。
ステップ3では、割当可能なビット数BからLkを引
く。Bが0以上の場合、この部分帯域に割り当てるビッ
ト数Bkを1増加させ、かつ評価関数Ekから1を引く。B
が負の場合、ビット割当処理を終了する。
く。Bが0以上の場合、この部分帯域に割り当てるビッ
ト数Bkを1増加させ、かつ評価関数Ekから1を引く。B
が負の場合、ビット割当処理を終了する。
量子化部55は、分析フィルタ部51からの各部分帯域の
各区間の信号を最大値情報決定部52からの最大値情報を
用いて正規化し、ビット割当決定部54からのビット割当
情報にしたがって各部分帯域の信号を量子化し、サンプ
ル情報として出力する。多重化部56は、量子化部55から
の各部分帯域のサンプル情報と最大値情報決定部52から
の各部分帯域の最大値情報とビット割当決定部54からの
各部分帯域のビット割当情報とを多重化し、符号化信号
を出力する。
各区間の信号を最大値情報決定部52からの最大値情報を
用いて正規化し、ビット割当決定部54からのビット割当
情報にしたがって各部分帯域の信号を量子化し、サンプ
ル情報として出力する。多重化部56は、量子化部55から
の各部分帯域のサンプル情報と最大値情報決定部52から
の各部分帯域の最大値情報とビット割当決定部54からの
各部分帯域のビット割当情報とを多重化し、符号化信号
を出力する。
最大値情報決定部52と評価関数算出部53とビット割当
決定部54と量子化部55と多重化部56はマイクロプロセッ
サで構成できる。
決定部54と量子化部55と多重化部56はマイクロプロセッ
サで構成できる。
第8図は従来の音声帯域分割復号化装置のブロック図
を示すものである。
を示すものである。
第8図において、81は逆多重化部、82は逆量子化部、
83は合成フィルタである。
83は合成フィルタである。
以上のように構成された音声帯域分割復号化装置につ
いて、以下その動作を説明する。
いて、以下その動作を説明する。
第8図において、逆多重化部81は、入力された符号化
信号を各区間に分離し、各区間の信号を各部分帯域毎の
サンプル情報と最大値情報とビット割当情報とに分離
し、出力する。逆量子化部82は、各部分帯域毎に、逆多
重化部81からのサンプル情報をビット割当情報を用いて
逆量子化を行い、次に最大値情報を用いて逆正規化し、
各部分帯域の各区間の信号を再生する。逆多重化部81と
逆量子化部82はマイクロプロセッサで構成できる。合成
フィルタ部83は、複数の帯域通過フィルタからなるフィ
ルタ群であり、逆量子化部82からの各部分帯域の各区間
の信号を合成してデジタル音声信号を再生し、出力す
る。合成フィルタ部83の各帯域通過フィルタは分析フィ
ルタ51とペアをなすデジタルフィルタによって構成され
る。
信号を各区間に分離し、各区間の信号を各部分帯域毎の
サンプル情報と最大値情報とビット割当情報とに分離
し、出力する。逆量子化部82は、各部分帯域毎に、逆多
重化部81からのサンプル情報をビット割当情報を用いて
逆量子化を行い、次に最大値情報を用いて逆正規化し、
各部分帯域の各区間の信号を再生する。逆多重化部81と
逆量子化部82はマイクロプロセッサで構成できる。合成
フィルタ部83は、複数の帯域通過フィルタからなるフィ
ルタ群であり、逆量子化部82からの各部分帯域の各区間
の信号を合成してデジタル音声信号を再生し、出力す
る。合成フィルタ部83の各帯域通過フィルタは分析フィ
ルタ51とペアをなすデジタルフィルタによって構成され
る。
発明が解決しようとする課題 しかしながら、上記従来の音声帯域分割符号化装置で
は、マスキング規則を適用する際の近似誤差によりマス
クトパワーに誤差を生じ、誤差を含んだ評価関数に基づ
いてビット割当を行うので音声信号の品質が劣化すると
いう問題点を有していた。文献2に記載されている音声
帯域分割符号化装置では、マスキング規則の適用時に分
析フィルタの間引きによって発生する折返し歪の影響を
考慮していないので、特に低域の部分帯域で折返し歪が
発生し、音質を劣化させることがある。低域の部分帯域
で折返し歪の影響が大きい理由は、分析および合成フィ
ルタの実現上の課題から低域では部分帯域の帯域幅が臨
界帯域幅より大きく、マスキング効果が小さいことによ
る。また、オリジナルの高品位音声信号との透明性(ト
ランスペアレンシー)を確保するためにビットレートを
上げたときも前記誤差の影響によってビット割当が最適
とならないという問題点があった。
は、マスキング規則を適用する際の近似誤差によりマス
クトパワーに誤差を生じ、誤差を含んだ評価関数に基づ
いてビット割当を行うので音声信号の品質が劣化すると
いう問題点を有していた。文献2に記載されている音声
帯域分割符号化装置では、マスキング規則の適用時に分
析フィルタの間引きによって発生する折返し歪の影響を
考慮していないので、特に低域の部分帯域で折返し歪が
発生し、音質を劣化させることがある。低域の部分帯域
で折返し歪の影響が大きい理由は、分析および合成フィ
ルタの実現上の課題から低域では部分帯域の帯域幅が臨
界帯域幅より大きく、マスキング効果が小さいことによ
る。また、オリジナルの高品位音声信号との透明性(ト
ランスペアレンシー)を確保するためにビットレートを
上げたときも前記誤差の影響によってビット割当が最適
とならないという問題点があった。
本発明は上記従来の問題点を解決するもので、分析フ
ィルタの折返し歪に代表されるマスキング規則適用時の
誤差を減少させビット割当の最適化を図ることにより、
音声信号の品質が向上した音声帯域分割符号化装置を提
供することを目的とする。
ィルタの折返し歪に代表されるマスキング規則適用時の
誤差を減少させビット割当の最適化を図ることにより、
音声信号の品質が向上した音声帯域分割符号化装置を提
供することを目的とする。
課題を解決するための手段 この目的を達成するために本発明の音声帯域分割符号
化装置は、音声信号を複数の部分帯域に分割し、各部分
帯域の信号を所定の時間を有する区間に分割する分析フ
ィルタ部と、各部分帯域毎に、前記区間内の信号の絶対
値の最大値を表わす最大値情報を決定し、出力する最大
値情報決定部と、各部分帯域毎に、前記最大値情報決定
部からの最大値情報の対数から、前記分析フィルタ部か
らの部分帯域の信号と聴覚のマスキング規則とに基づい
て算出した各部分帯域のマスクされるパワーの平方根の
対数に重み付け係数を掛けたものを引くことにより重み
付け評価関数を求め、出力する重み付け評価関数算出部
と、前記重み付け評価関数算出部からの重み付け評価関
数を用いて各部分帯域に割り当てるビット数を決定し、
ビット割当情報を出力するビット割当決定部と、各部分
帯域毎に、前記分析フィルタ部からの部分帯域の信号
を、前記最大値情報決定部からの最大値情報と前記ビッ
ト割当決定部からのビット割当情報とに基づいて量子化
し、サンプル情報を出力する量子化部とを備えたもので
ある。
化装置は、音声信号を複数の部分帯域に分割し、各部分
帯域の信号を所定の時間を有する区間に分割する分析フ
ィルタ部と、各部分帯域毎に、前記区間内の信号の絶対
値の最大値を表わす最大値情報を決定し、出力する最大
値情報決定部と、各部分帯域毎に、前記最大値情報決定
部からの最大値情報の対数から、前記分析フィルタ部か
らの部分帯域の信号と聴覚のマスキング規則とに基づい
て算出した各部分帯域のマスクされるパワーの平方根の
対数に重み付け係数を掛けたものを引くことにより重み
付け評価関数を求め、出力する重み付け評価関数算出部
と、前記重み付け評価関数算出部からの重み付け評価関
数を用いて各部分帯域に割り当てるビット数を決定し、
ビット割当情報を出力するビット割当決定部と、各部分
帯域毎に、前記分析フィルタ部からの部分帯域の信号
を、前記最大値情報決定部からの最大値情報と前記ビッ
ト割当決定部からのビット割当情報とに基づいて量子化
し、サンプル情報を出力する量子化部とを備えたもので
ある。
また本発明の音声帯域分割符号化装置は、音声信号を
複数の部分帯域に分割し、各部分帯域の信号を所定の時
間を有する区間に分割する分析フィルタ部と、各部分帯
域毎に、前記区間内の信号の絶対値の最大値を表わす最
大値情報を決定し、出力する最大値情報決定部と、各部
分帯域毎に、前記最大値情報決定部からの最大値情報の
対数から、前記分析フィルタ部からの部分帯域の信号と
聴覚のマスキング規則とに基づいて算出した各部分帯域
のマスクされるパワーの平方根の対数に複数の重み付け
係数を掛けたものを引くことにより複数の重み付け評価
関数を求め、出力する重み付け評価関数算出部と、前記
重み付け評価関数から既に割り当てられたビット数を引
いた値に応じて前記複数の重み付け評価関数を選択し
て、各部分帯域に割り当てるビット数を決定し、ビット
割当情報を出力するビット割当決定部と、各部分帯域毎
に、前記分析フィルタ部からの部分帯域の信号を、前記
最大値情報決定部からの最大値情報と前記ビット割当決
定部からのビット割当情報とに基づいて量子化し、サン
プル情報を出力する量子化部とを備えたものである 作用 本発明は上記した構成により、重み付け係数の値によ
ってマスキング効果と波形歪の貢献度を可変することが
可能な重み付け評価関数を用いてマスキング効果が小さ
く折返し歪の影響の大きい部分帯域では波形歪の貢献度
を大きくするように部分帯域毎に重み付け係数を設定
し、重み付け評価関数算出部で前記重み付け係数を用い
て重み付け評価関数を算出し、ビット割当決定部で前記
重み付け評価関数を用いて各部分帯域に割り当てるビッ
ト数を決定することによって最適なビット割当を行い、
折返し歪の影響を軽減し、音声信号の品質を向上するこ
とができる。
複数の部分帯域に分割し、各部分帯域の信号を所定の時
間を有する区間に分割する分析フィルタ部と、各部分帯
域毎に、前記区間内の信号の絶対値の最大値を表わす最
大値情報を決定し、出力する最大値情報決定部と、各部
分帯域毎に、前記最大値情報決定部からの最大値情報の
対数から、前記分析フィルタ部からの部分帯域の信号と
聴覚のマスキング規則とに基づいて算出した各部分帯域
のマスクされるパワーの平方根の対数に複数の重み付け
係数を掛けたものを引くことにより複数の重み付け評価
関数を求め、出力する重み付け評価関数算出部と、前記
重み付け評価関数から既に割り当てられたビット数を引
いた値に応じて前記複数の重み付け評価関数を選択し
て、各部分帯域に割り当てるビット数を決定し、ビット
割当情報を出力するビット割当決定部と、各部分帯域毎
に、前記分析フィルタ部からの部分帯域の信号を、前記
最大値情報決定部からの最大値情報と前記ビット割当決
定部からのビット割当情報とに基づいて量子化し、サン
プル情報を出力する量子化部とを備えたものである 作用 本発明は上記した構成により、重み付け係数の値によ
ってマスキング効果と波形歪の貢献度を可変することが
可能な重み付け評価関数を用いてマスキング効果が小さ
く折返し歪の影響の大きい部分帯域では波形歪の貢献度
を大きくするように部分帯域毎に重み付け係数を設定
し、重み付け評価関数算出部で前記重み付け係数を用い
て重み付け評価関数を算出し、ビット割当決定部で前記
重み付け評価関数を用いて各部分帯域に割り当てるビッ
ト数を決定することによって最適なビット割当を行い、
折返し歪の影響を軽減し、音声信号の品質を向上するこ
とができる。
また本発明は上記した構成により、重み付け評価関数
算出部で複数の重み付け評価関数を算出し、ビット割当
決定部で重み付け評価関数から既に割り当てられたビッ
ト数を引いた値に応じて前記複数の重み付け評価関数を
選択して各部分帯域に割り当てるビット数を決定するこ
とによって、割り当てられたビット数による量子化雑音
のマスキング量に応じてマスキング効果と波形歪のビッ
ト割当に及ぼす貢献度を変化した重み付け評価関数を選
択し、割当ビット数が小さいときには、マスキング効果
を活用して効率的にビットを割り当て、割当ビット数が
大きくなり、量子化雑音のマスキング量が一定の閾値以
上となったときには、波形歪に基づいてビットを割り当
てることによって、最適なビット割当を行い、マスキン
グ規則適用時の誤差の影響を軽減し、音声信号の品質、
特に透明性を向上することができる。
算出部で複数の重み付け評価関数を算出し、ビット割当
決定部で重み付け評価関数から既に割り当てられたビッ
ト数を引いた値に応じて前記複数の重み付け評価関数を
選択して各部分帯域に割り当てるビット数を決定するこ
とによって、割り当てられたビット数による量子化雑音
のマスキング量に応じてマスキング効果と波形歪のビッ
ト割当に及ぼす貢献度を変化した重み付け評価関数を選
択し、割当ビット数が小さいときには、マスキング効果
を活用して効率的にビットを割り当て、割当ビット数が
大きくなり、量子化雑音のマスキング量が一定の閾値以
上となったときには、波形歪に基づいてビットを割り当
てることによって、最適なビット割当を行い、マスキン
グ規則適用時の誤差の影響を軽減し、音声信号の品質、
特に透明性を向上することができる。
実施例 以下、本発明の実施例について、図面を参照しながら
説明する。
説明する。
第1図は、本発明の実施例における音声帯域分割符号
化装置のブロック図を示すものである。
化装置のブロック図を示すものである。
第1図において、11は分析フィルタ部、12は最大値情
報決定部、13は重み付け評価関数算出部、14はビット割
当決定部、15は量子化部、16は多重化部である。
報決定部、13は重み付け評価関数算出部、14はビット割
当決定部、15は量子化部、16は多重化部である。
以上のように構成された音声帯域分割符号化装置につ
いて、以下その動作を説明する。
いて、以下その動作を説明する。
本実施例では、音声帯域分割符号化装置としては従来
例と同じものを用いることができる。また、本発明の実
施例のブロック図を表わす第1図において、11,12,15,1
6は、それぞれ第5図に示す従来例の51,52,55,56と同一
の構成要素である。
例と同じものを用いることができる。また、本発明の実
施例のブロック図を表わす第1図において、11,12,15,1
6は、それぞれ第5図に示す従来例の51,52,55,56と同一
の構成要素である。
以下、本発明の2つの実施例についてその動作説明す
る。2つの実施例のブロック図はともに第1図であり、
同一であるが、重み付け評価関数算出部13とビット割当
決定部14の動作が異なる。
る。2つの実施例のブロック図はともに第1図であり、
同一であるが、重み付け評価関数算出部13とビット割当
決定部14の動作が異なる。
最初に、第1の実施例について図面を参照しながらそ
の動作を説明する。
の動作を説明する。
第1図において、分析フィルタ部11は入力されたデジ
タル音声信号を複数の部分帯域に分割するための複数の
帯域通過フィルタからなるフィルタ群である。分析フィ
ルタ部11はデジタルフィルタであり、例えばツリー構成
のQMFで構成できる。分析フィルタ部11で複数の部分帯
域に分割された信号は、5msから20msの所定の時間を有
する区間に区切られる。最大値情報決定部12は、分析フ
ィルタ部11から各部分帯域毎に区間内の信号の絶対値の
最大値を求め、最大値情報を出力する。最大値情報とし
ては、例えば最大値を6ビットで対数量子化したものが
用いられる。重み付け評価関数算出部13は、ビット割当
決定部14で最適なビット割当を行うために必要な重み付
け評価関数を算出する。第2図は、第1の実施例におけ
る重み付け評価関数算出部13のフローチャートである。
本実施例における変数の意味は従来例と同一である。重
み付け評価関数算出部13では、最初に分析フィルタ部11
からの各部分帯域の信号を用いて部分帯域番号iの信号
パワーのSiを算出する。次に、各部分帯域の信号のパワ
ーとマスキング規則とに基づいて、帯域内の信号によっ
てまた隣接帯域の信号によってマスキングされて人間の
耳には聞こえないマスクトパワーMiを算出する。マスク
トパワーの算出法については、例えば文献2に記載され
ている方法による。次に、各部分帯域毎に次式で与えら
れる重み付け評価関数Eiを算出する。
タル音声信号を複数の部分帯域に分割するための複数の
帯域通過フィルタからなるフィルタ群である。分析フィ
ルタ部11はデジタルフィルタであり、例えばツリー構成
のQMFで構成できる。分析フィルタ部11で複数の部分帯
域に分割された信号は、5msから20msの所定の時間を有
する区間に区切られる。最大値情報決定部12は、分析フ
ィルタ部11から各部分帯域毎に区間内の信号の絶対値の
最大値を求め、最大値情報を出力する。最大値情報とし
ては、例えば最大値を6ビットで対数量子化したものが
用いられる。重み付け評価関数算出部13は、ビット割当
決定部14で最適なビット割当を行うために必要な重み付
け評価関数を算出する。第2図は、第1の実施例におけ
る重み付け評価関数算出部13のフローチャートである。
本実施例における変数の意味は従来例と同一である。重
み付け評価関数算出部13では、最初に分析フィルタ部11
からの各部分帯域の信号を用いて部分帯域番号iの信号
パワーのSiを算出する。次に、各部分帯域の信号のパワ
ーとマスキング規則とに基づいて、帯域内の信号によっ
てまた隣接帯域の信号によってマスキングされて人間の
耳には聞こえないマスクトパワーMiを算出する。マスク
トパワーの算出法については、例えば文献2に記載され
ている方法による。次に、各部分帯域毎に次式で与えら
れる重み付け評価関数Eiを算出する。
Ei=log2(Pi/MiW1/2) =log2Pi−(log2Mi)Wi/2 すなわち、最大値情報決定部12からの最大値情報Piの
2を底とする対数から、マスクトパワーの2を底とする
対数に重み付け係数Wiの2分の1を掛けたものを引くこ
とにより重み付け評価関数Eiを求め出力する。
2を底とする対数から、マスクトパワーの2を底とする
対数に重み付け係数Wiの2分の1を掛けたものを引くこ
とにより重み付け評価関数Eiを求め出力する。
ここで、重み付け評価関数Eiの意味について説明す
る。重み付け係数Wiが0のときは、 Ei=log2Pi となる。これは次式で与えられる全帯域の量子化雑音パ
ワーを最小にするための、すなわち波形歪を最小にする
ための評価関数である。
る。重み付け係数Wiが0のときは、 Ei=log2Pi となる。これは次式で与えられる全帯域の量子化雑音パ
ワーを最小にするための、すなわち波形歪を最小にする
ための評価関数である。
一方、重み付け係数Wiが1のときは、 Ei=log2Pi−(log2Mi)/2 となり、従来例で述べた評価関数と一致する。すなわ
ち、重み付け評価関数はNMRを最小にするための評価関
数、あるいは、マスキング効果を大きくする評価関数と
なる。
ち、重み付け評価関数はNMRを最小にするための評価関
数、あるいは、マスキング効果を大きくする評価関数と
なる。
以上のように重み付け評価関数は、与えられた重み付
け係数Wiの値(0〜1)によって、マスキング効果と波
形歪の貢献度(影響度)を可変することが可能となる。
け係数Wiの値(0〜1)によって、マスキング効果と波
形歪の貢献度(影響度)を可変することが可能となる。
第1の実施例では、マスキング効果が小さく折り返し
歪の影響の大きい部分帯域では、波形歪の貢献度が大き
くなるように(すなわち、波形歪を小さくするよう
に)、部分帯域毎に重み付け係数を0またはその近傍の
値に設定し、重み付け評価関数を算出する。逆に、マス
キング効果が大きく折り返し歪の影響の小さい部分帯域
では、マスキング効果の貢献度が大きくなるように、重
み付け係数を1またはその近傍の値に設定し、重み付け
評価関数を算出する。
歪の影響の大きい部分帯域では、波形歪の貢献度が大き
くなるように(すなわち、波形歪を小さくするよう
に)、部分帯域毎に重み付け係数を0またはその近傍の
値に設定し、重み付け評価関数を算出する。逆に、マス
キング効果が大きく折り返し歪の影響の小さい部分帯域
では、マスキング効果の貢献度が大きくなるように、重
み付け係数を1またはその近傍の値に設定し、重み付け
評価関数を算出する。
ビット割当決定部14は、従来例と同一の動作をする。
すなわち、ビット割当決定部14のフローチャートは第7
図によって示される。ビット割当決定部14は、ステップ
1で初期化処理を行った後、重み付け評価関数を用いて
ステップ2とステップ3を繰り返すことにより部分帯域
番号iの割当ビット数Biを決定し、出力する。
すなわち、ビット割当決定部14のフローチャートは第7
図によって示される。ビット割当決定部14は、ステップ
1で初期化処理を行った後、重み付け評価関数を用いて
ステップ2とステップ3を繰り返すことにより部分帯域
番号iの割当ビット数Biを決定し、出力する。
ステップ1では、割当可能なビット数BをBqに、Bi
(1≦i≦N)を0に設定する。
(1≦i≦N)を0に設定する。
ステップ2では、重み付け評価関数Eiを最大とする部
分帯域番号kを見い出す。
分帯域番号kを見い出す。
ステップ3では、割当可能なビット数BからLkを引
く。Bが0以上の場合、この部分帯域に割り当てるビッ
ト数Bkを1増加させ、かつ重み付け評価関数Ekから1を
引く。Bが負の場合、ビット割当処理を終了する。
く。Bが0以上の場合、この部分帯域に割り当てるビッ
ト数Bkを1増加させ、かつ重み付け評価関数Ekから1を
引く。Bが負の場合、ビット割当処理を終了する。
量子化部15は分析フィルタ部11からの各部分帯域の各
区間の信号を最大値情報決定部12からの最大値情報を用
いて正規化し、ビット割当決定部14からのビット割当情
報にしたがって各部分帯域の信号を量子化し、サンプル
情報として出力する。多重化部16は、量子化部15からの
各部分帯域のサンプル情報と最大値情報決定部12からの
各部分帯域の最大値情報とビット割当決定部14からの各
部分帯域のビット割当情報とを多重化し、符号化信号を
出力する。
区間の信号を最大値情報決定部12からの最大値情報を用
いて正規化し、ビット割当決定部14からのビット割当情
報にしたがって各部分帯域の信号を量子化し、サンプル
情報として出力する。多重化部16は、量子化部15からの
各部分帯域のサンプル情報と最大値情報決定部12からの
各部分帯域の最大値情報とビット割当決定部14からの各
部分帯域のビット割当情報とを多重化し、符号化信号を
出力する。
最大値情報決定部12と重み付け評価関数算出部13とビ
ット割当決定部14と量子化部15と多重化部16はマイクロ
プロセッサで構成できる。
ット割当決定部14と量子化部15と多重化部16はマイクロ
プロセッサで構成できる。
以上のように第1の実施例によれば、重み付け係数の
値によってマスキング効果と波形歪の貢献度を可変する
ことが可能な重み付け評価関数を算出する重み付け評価
関数算出部と、重み付け評価関数算出部からの重み付け
評価関数を用いて各部分帯域に割り当てるビット数を決
定するビット割当決定部とを設け、分析フィルタ部の折
返し歪のマスキング量に応じて各部分帯域毎に重み付け
係数を設定することにより、最適なビット割当を行い、
折返し歪の影響を軽減し、音声信号の品質を向上させる
ことができる。
値によってマスキング効果と波形歪の貢献度を可変する
ことが可能な重み付け評価関数を算出する重み付け評価
関数算出部と、重み付け評価関数算出部からの重み付け
評価関数を用いて各部分帯域に割り当てるビット数を決
定するビット割当決定部とを設け、分析フィルタ部の折
返し歪のマスキング量に応じて各部分帯域毎に重み付け
係数を設定することにより、最適なビット割当を行い、
折返し歪の影響を軽減し、音声信号の品質を向上させる
ことができる。
次に、本発明の第2の実施例について図面を参照しな
がらその動作を説明する。
がらその動作を説明する。
第2の実施例においては、分析フィルタ部11,最大値
情報決定部12,量子化部15,多量化部16についてはその動
作は第1の実施例と同一であり、説明を省略する。以
下、第1の実施例と動作が異なる重み付け評価関数算出
部13とビット割当決定部14についてその動作を説明す
る。
情報決定部12,量子化部15,多量化部16についてはその動
作は第1の実施例と同一であり、説明を省略する。以
下、第1の実施例と動作が異なる重み付け評価関数算出
部13とビット割当決定部14についてその動作を説明す
る。
重み付け評価関数算出部13は聴覚のマスキング効果と
波形歪とに基づいて、ビット割当決定部14で最適なビッ
ト割当を行うために必要な複数の重み付け評価関数を算
出する。第3図は、第2の実施例における重み付け評価
関数算出部13のフローチャートである。重み付け評価関
数算出部13では、最初に分析フィルタ部11からの各部分
帯域の信号を用いて部分帯域番号iの信号のパワーSiを
算出する。次に、各部分帯域の信号のパワーとマスキン
グ規則とに基づいて、帯域内の信号によってまた隣接帯
域の信号によって、マスキングされて人間の耳には聞こ
えないマスクトパワーMiを算出する。次に、各部分帯域
毎に、第1の重み付け係数Wi1(1≦i≦N)を有する
重み付け評価関数Ei1を算出する。第2の実施例では、
第1の重み付け係数Wi1をすべて1に設定し、マスキン
グ効果のビット割当におよぼす貢献度を最大にしてい
る。Ei1は次式によって算出される。
波形歪とに基づいて、ビット割当決定部14で最適なビッ
ト割当を行うために必要な複数の重み付け評価関数を算
出する。第3図は、第2の実施例における重み付け評価
関数算出部13のフローチャートである。重み付け評価関
数算出部13では、最初に分析フィルタ部11からの各部分
帯域の信号を用いて部分帯域番号iの信号のパワーSiを
算出する。次に、各部分帯域の信号のパワーとマスキン
グ規則とに基づいて、帯域内の信号によってまた隣接帯
域の信号によって、マスキングされて人間の耳には聞こ
えないマスクトパワーMiを算出する。次に、各部分帯域
毎に、第1の重み付け係数Wi1(1≦i≦N)を有する
重み付け評価関数Ei1を算出する。第2の実施例では、
第1の重み付け係数Wi1をすべて1に設定し、マスキン
グ効果のビット割当におよぼす貢献度を最大にしてい
る。Ei1は次式によって算出される。
Ei1=log2Pi−(log2Mi)/2 すなわち、最大値情報決定部12からの最大値情報Piの
2を底とする対数からマスクトパワーの2を底とする対
数に2分の1を掛けたものを引くことにより重み付け評
価関数Ei1を求める。次に、各部分帯域毎に第2の重み
付け係数Wi2(1≦i≦N)を有する重み付け評価関数E
i2を算出する。第2の実施例では、第2の重み付け係数
Wi2(1≦i≦N)を0に設定し、波形歪のビット割当
におよぼす貢献度を最大にしている。Ei2は次式によっ
て算出される。
2を底とする対数からマスクトパワーの2を底とする対
数に2分の1を掛けたものを引くことにより重み付け評
価関数Ei1を求める。次に、各部分帯域毎に第2の重み
付け係数Wi2(1≦i≦N)を有する重み付け評価関数E
i2を算出する。第2の実施例では、第2の重み付け係数
Wi2(1≦i≦N)を0に設定し、波形歪のビット割当
におよぼす貢献度を最大にしている。Ei2は次式によっ
て算出される。
Ei2=log2Pi すなわち、最大値情報決定部12からの最大値情報Piの
2を底とする対数を算出することにより、第2の重み付
け評価関数Ei2を求める。重み付け評価関数算出部13は
以上のようにして求めた第1と第2の重み付け評価関数
をビット割当決定部14に出力する。
2を底とする対数を算出することにより、第2の重み付
け評価関数Ei2を求める。重み付け評価関数算出部13は
以上のようにして求めた第1と第2の重み付け評価関数
をビット割当決定部14に出力する。
第4図は第2の実施例におけるビット割当決定部14の
フローチャートである。ビット割当決定部14は、ステッ
プ1で初期化処理を行った後、重み付け評価関数を用い
てステップ2とステップ3を繰り返すことにより部分帯
域番号iの割当ビット数Biを決定し、出力する。
フローチャートである。ビット割当決定部14は、ステッ
プ1で初期化処理を行った後、重み付け評価関数を用い
てステップ2とステップ3を繰り返すことにより部分帯
域番号iの割当ビット数Biを決定し、出力する。
ステップ1では、jを1に設定し、第1の重み付け評
価関数を選択する。割当可能なビット数BをBqに、Bi
(1≦i≦N)を0に設定する。
価関数を選択する。割当可能なビット数BをBqに、Bi
(1≦i≦N)を0に設定する。
ステップ2では、重み付け評価関数Eijを最大とする
部分帯域番号kを見い出す。
部分帯域番号kを見い出す。
ステップ3では、jが1のときはステップ2で見つけ
た重み付け評価関数の最大値Emaxと閾値Tを比較し、閾
値以下のときはjを2に設定しステップ2に戻る。jが
1でないときおよび重み付け評価関数の最大値が閾値よ
り大きいときには、割当可能なビット数BからLkを引
く。Bが0以上の場合、この部分帯域に割り当てるビッ
ト数Bkを1増加させ、かつ2つの重み付け評価関数Ek1
とEk2から1を引く。Bが負の場合、ビット割当処理を
終了する。
た重み付け評価関数の最大値Emaxと閾値Tを比較し、閾
値以下のときはjを2に設定しステップ2に戻る。jが
1でないときおよび重み付け評価関数の最大値が閾値よ
り大きいときには、割当可能なビット数BからLkを引
く。Bが0以上の場合、この部分帯域に割り当てるビッ
ト数Bkを1増加させ、かつ2つの重み付け評価関数Ek1
とEk2から1を引く。Bが負の場合、ビット割当処理を
終了する。
重み付け評価関数算出部13とビット割当決定部14はマ
イクロプロセッサで構成できる。
イクロプロセッサで構成できる。
以上のように第2の実施例によれば、複数の重み付け
係数を有する重み付け評価関数算出部とビット割当決定
部とを設けることにより、割当ビット数が小さいときに
はマスキング効果を活用して効率的にビットを割り当
て、割当ビット数が大きくなり、量子化雑音のマスキン
グ量が一定の閾値以上となったときには、波形歪に基づ
いてビットを割り当てることによって最適なビット割当
を行い、マスキング規則適用時の誤差の影響を軽減し、
音声信号の品質、特に透明性を向上させることができ
る。
係数を有する重み付け評価関数算出部とビット割当決定
部とを設けることにより、割当ビット数が小さいときに
はマスキング効果を活用して効率的にビットを割り当
て、割当ビット数が大きくなり、量子化雑音のマスキン
グ量が一定の閾値以上となったときには、波形歪に基づ
いてビットを割り当てることによって最適なビット割当
を行い、マスキング規則適用時の誤差の影響を軽減し、
音声信号の品質、特に透明性を向上させることができ
る。
なお、第1および第2の実施例において、ビットレー
トは固定としたが、ビットレートを可変とし、ビットレ
ートに応じて重み付け係数あるいは閾値を設定してもよ
い。
トは固定としたが、ビットレートを可変とし、ビットレ
ートに応じて重み付け係数あるいは閾値を設定してもよ
い。
また、第1および第2の実施例において、マスクトパ
ワーの算出には分析フィルタ部からの部分帯域の信号を
用いたが、マスキング規則のより精度の高い適用を目的
としてFFT分析器のような周波数分解能の高い分析器を
設け、その出力を用いてマスクトパワーの算出を行って
もよい。
ワーの算出には分析フィルタ部からの部分帯域の信号を
用いたが、マスキング規則のより精度の高い適用を目的
としてFFT分析器のような周波数分解能の高い分析器を
設け、その出力を用いてマスクトパワーの算出を行って
もよい。
発明の効果 以上のように本発明は、重み付け係数の値によってマ
スキング効果と波形歪の貢献度を可変することが可能な
重み付け評価関数を算出する重み付け評価関数算出部
と、重み付け評価関数算出部からの重み付け評価関数を
用いて各部分帯域に割り当てるビット数を決定するビッ
ト割当決定部とを設け、分析フィルタ部の折返し歪のマ
スキング量に応じて各部分帯域毎に重み付け係数を設定
することにより最適なビット割当を行い、折返し歪の影
響を軽減し、音声信号の品質を向上させることができ
る。
スキング効果と波形歪の貢献度を可変することが可能な
重み付け評価関数を算出する重み付け評価関数算出部
と、重み付け評価関数算出部からの重み付け評価関数を
用いて各部分帯域に割り当てるビット数を決定するビッ
ト割当決定部とを設け、分析フィルタ部の折返し歪のマ
スキング量に応じて各部分帯域毎に重み付け係数を設定
することにより最適なビット割当を行い、折返し歪の影
響を軽減し、音声信号の品質を向上させることができ
る。
また本発明は、複数の重み付け評価関数を算出する重
み付け評価関数算出部と、重み付け評価関数から割当ビ
ット数を引いた値に応じて、重み付け評価関数算出部か
らの複数の重み付け評価関数を選択して各部分帯域に割
り当てるビット数を決定するビット割当決定部とを設
け、割当ビット数が小さいときには、マスキング効果を
活用してビットを割り当て、割当ビット数が大きくなり
量子化雑音のマスキング量が一定の閾値以上となったと
きには、波形歪に基づいてビットを割り当てることによ
って最適なビット割当を行い、マスキング規則適用時の
誤差の影響を軽減し、音声信号の品質、特に透明性を向
上させることができる。
み付け評価関数算出部と、重み付け評価関数から割当ビ
ット数を引いた値に応じて、重み付け評価関数算出部か
らの複数の重み付け評価関数を選択して各部分帯域に割
り当てるビット数を決定するビット割当決定部とを設
け、割当ビット数が小さいときには、マスキング効果を
活用してビットを割り当て、割当ビット数が大きくなり
量子化雑音のマスキング量が一定の閾値以上となったと
きには、波形歪に基づいてビットを割り当てることによ
って最適なビット割当を行い、マスキング規則適用時の
誤差の影響を軽減し、音声信号の品質、特に透明性を向
上させることができる。
第1図は本発明の実施例における音声帯域分割符号化装
置の構成を示すブロック図、第2図は本発明の第1の実
施例における重み付け評価関数算出部のフローチャー
ト、第3図は本発明の第2の実施例における重み付け評
価関数算出部のフローチャート、第4図は本発明の第2
の実施例におけるビット割当決定部のフローチャート、
第5図は従来の音声帯域分割符号化装置の構成を示すブ
ロック図、第6図は従来の評価関数算出部のフローチャ
ート、第7図は従来のビット割当決定部のフローチャー
ト、第8図は従来の音声帯域分割復号化装置の構成を示
すブロック図である。 11……分析フィルタ部、12……最大値情報決定部、13…
…重み付け評価関数算出部、14……ビット割当決定部、
15……量子化部、16……多重化部。
置の構成を示すブロック図、第2図は本発明の第1の実
施例における重み付け評価関数算出部のフローチャー
ト、第3図は本発明の第2の実施例における重み付け評
価関数算出部のフローチャート、第4図は本発明の第2
の実施例におけるビット割当決定部のフローチャート、
第5図は従来の音声帯域分割符号化装置の構成を示すブ
ロック図、第6図は従来の評価関数算出部のフローチャ
ート、第7図は従来のビット割当決定部のフローチャー
ト、第8図は従来の音声帯域分割復号化装置の構成を示
すブロック図である。 11……分析フィルタ部、12……最大値情報決定部、13…
…重み付け評価関数算出部、14……ビット割当決定部、
15……量子化部、16……多重化部。
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G10C 3/00 - 9/18 H03M 7/30 H04B 14/04 JOISファイル(JICST)
Claims (4)
- 【請求項1】音声信号を複数の部分帯域に分割し、各部
分帯域の信号を所定の時間を有する区間に分割する分析
フィルタ部と、 各部分帯域毎に、前記区間内の信号の絶対値の最大値を
表わす最大値情報を決定し、出力する最大値情報決定部
と、 各部分帯域毎に、前記最大値情報決定部からの最大値情
報の対数から、前記分析フィルタ部からの部分帯域の信
号と聴覚のマスキング規則とに基づいて算出した各部分
帯域のマスクされるパワーの平方根の対数に0〜1の所
望の重み付け係数を掛けたものを引くことにより重み付
け評価関数を求め、出力する重み付け評価関数算出部
と、 前記重み付け評価関数算出部からの重み付け評価関数を
用いて各部分帯域に割り当てるビット数を決定し、ビッ
ト割当情報を出力するビット割当決定部と、 各部分帯域毎に、前記分析フィルタ部からの部分帯域の
信号を前記最大値情報決定部からの最大値情報と前記ビ
ット割当決定部からのビット割当情報とに基づいて量子
化し、サンプル情報を出力する量子化部とを具備した音
声帯域分割符号化装置。 - 【請求項2】分析フィルタ部の折返し歪のマスキング量
に応じて各部分帯域毎に重み付け係数を設定する重み付
け評価関数算出部を有する請求項1記載の帯域分割符号
化装置。 - 【請求項3】音声信号を複数の部分帯域に分割し、各部
分帯域の信号を所定の時間を有する区間に分割する分析
フィルタ部と、 各部分帯域毎に、前記区間内の信号の絶対値の最大値を
表わす最大値情報を決定し、出力する最大値情報決定部
と、 各部分帯域毎に、前記最大値情報決定部からの最大値情
報の対数から前記分析フィルタ部からの部分帯域の信号
と聴覚のマスキング規則とに基づいて算出した各部分帯
域のマスクされるパワーの平方根の対数に0〜1の所望
の重み付け係数を掛けたものを引くことにより複数の重
み付け評価関数を求め、出力する重み付け評価関数算出
部と、 前記重み付け評価関数から既に割り当てられたビット数
を引いた値に応じて前記複数の重み付け評価関数を選択
して、各部分帯域に割り当てるビット数を決定し、ビッ
ト割当情報を出力するビット割当決定部と、 各部分帯域毎に、前記分析フィルタ部からの部分帯域の
信号を、前記最大値情報決定部からの最大値情報と前記
ビット割当決定部からのビット割当情報とに基づいて量
子化し、サンプル情報を出力する量子化部とを具備した
音声帯域分割符号化装置。 - 【請求項4】重み付け評価関数から割当ビット数を引い
た値が、閾値より大きいときには重み付け係数の値が1
の重み付け評価関数を選択し、閾値以下のときには重み
付け係数の値が0の重み付け評価関数を選択するビット
割当決定部を有する請求項3記載の音声帯域分割符号化
装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2305114A JP2906646B2 (ja) | 1990-11-09 | 1990-11-09 | 音声帯域分割符号化装置 |
US07/786,798 US5301255A (en) | 1990-11-09 | 1991-11-05 | Audio signal subband encoder |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2305114A JP2906646B2 (ja) | 1990-11-09 | 1990-11-09 | 音声帯域分割符号化装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH04177300A JPH04177300A (ja) | 1992-06-24 |
JP2906646B2 true JP2906646B2 (ja) | 1999-06-21 |
Family
ID=17941271
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2305114A Expired - Fee Related JP2906646B2 (ja) | 1990-11-09 | 1990-11-09 | 音声帯域分割符号化装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US5301255A (ja) |
JP (1) | JP2906646B2 (ja) |
Families Citing this family (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3189401B2 (ja) * | 1992-07-29 | 2001-07-16 | ソニー株式会社 | 音声データ符号化方法及び音声データ符号化装置 |
KR950008637B1 (ko) * | 1993-04-08 | 1995-08-03 | 삼성전자주식회사 | 부밴드 코딩시스템의 신호처리장치 |
EP0709006B1 (en) * | 1993-07-16 | 1997-03-05 | Dolby Laboratories Licensing Corporation | Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions |
US5623577A (en) * | 1993-07-16 | 1997-04-22 | Dolby Laboratories Licensing Corporation | Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions |
KR100269213B1 (ko) * | 1993-10-30 | 2000-10-16 | 윤종용 | 오디오신호의부호화방법 |
JP3024467B2 (ja) * | 1993-12-10 | 2000-03-21 | 日本電気株式会社 | 音声符号化装置 |
DE69426860T2 (de) * | 1993-12-10 | 2001-07-19 | Nec Corp | Sprachcodierer und Verfahren zum Suchen von Codebüchern |
JP3024468B2 (ja) * | 1993-12-10 | 2000-03-21 | 日本電気株式会社 | 音声復号装置 |
KR950022322A (ko) * | 1993-12-29 | 1995-07-28 | 김주용 | 최적 비트할당 방법 |
US5764698A (en) * | 1993-12-30 | 1998-06-09 | International Business Machines Corporation | Method and apparatus for efficient compression of high quality digital audio |
KR0134318B1 (ko) * | 1994-01-28 | 1998-04-29 | 김광호 | 채널간의 마스킹특성을 고려한 비트할당장치 및 그 방법과 복호화장치 |
WO1995022818A1 (en) * | 1994-02-17 | 1995-08-24 | Motorola Inc. | Method and apparatus for group encoding signals |
US5742734A (en) * | 1994-08-10 | 1998-04-21 | Qualcomm Incorporated | Encoding rate selection in a variable rate vocoder |
JP2778482B2 (ja) * | 1994-09-26 | 1998-07-23 | 日本電気株式会社 | 帯域分割符号化装置 |
US5654952A (en) * | 1994-10-28 | 1997-08-05 | Sony Corporation | Digital signal encoding method and apparatus and recording medium |
EP0722225A3 (de) * | 1994-11-17 | 2000-06-07 | Deutsche Thomson-Brandt Gmbh | Audiosignalkodierung mittels Kurzzeitspektren und einem psychoakustischen Modell |
TW316302B (ja) * | 1995-05-02 | 1997-09-21 | Nippon Steel Corp | |
US5913186A (en) * | 1996-03-25 | 1999-06-15 | Prometheus, Inc. | Discrete one dimensional signal processing apparatus and method using energy spreading coding |
FR2749723B1 (fr) * | 1996-06-06 | 1998-09-04 | France Telecom | Procede et dispositif de codage en compression d'un signal numerique |
US8908872B2 (en) | 1996-06-07 | 2014-12-09 | That Corporation | BTSC encoder |
US5796842A (en) * | 1996-06-07 | 1998-08-18 | That Corporation | BTSC encoder |
GB2343801B (en) * | 1997-08-21 | 2001-09-12 | Data Fusion Corp | Method and apparatus for acquiring wide-band pseudorandom noise encoded waveforms |
US6091773A (en) * | 1997-11-12 | 2000-07-18 | Sydorenko; Mark R. | Data compression method and apparatus |
US6363338B1 (en) * | 1999-04-12 | 2002-03-26 | Dolby Laboratories Licensing Corporation | Quantization in perceptual audio coders with compensation for synthesis filter noise spreading |
GB2349054A (en) * | 1999-04-16 | 2000-10-18 | Nds Ltd | Digital audio signal encoders |
US7030863B2 (en) * | 2000-05-26 | 2006-04-18 | America Online, Incorporated | Virtual keyboard system with automatic correction |
DE69932861T2 (de) * | 1999-10-30 | 2007-03-15 | Stmicroelectronics Asia Pacific Pte Ltd. | Verfahren zur kodierung eines audiosignals mit einem qualitätswert für bit-zuordnung |
DE19959037B4 (de) * | 1999-12-08 | 2004-04-29 | Robert Bosch Gmbh | Verfahren zur Dekodierung von digitalen Audiodaten |
SE0202159D0 (sv) | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
JP3870193B2 (ja) | 2001-11-29 | 2007-01-17 | コーディング テクノロジーズ アクチボラゲット | 高周波再構成に用いる符号器、復号器、方法及びコンピュータプログラム |
US20040002859A1 (en) * | 2002-06-26 | 2004-01-01 | Chi-Min Liu | Method and architecture of digital conding for transmitting and packing audio signals |
AU2003252727A1 (en) * | 2002-08-01 | 2004-02-23 | Matsushita Electric Industrial Co., Ltd. | Audio decoding apparatus and audio decoding method based on spectral band repliction |
SE0202770D0 (sv) | 2002-09-18 | 2002-09-18 | Coding Technologies Sweden Ab | Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks |
EP1543307B1 (en) * | 2002-09-19 | 2006-02-22 | Matsushita Electric Industrial Co., Ltd. | Audio decoding apparatus and method |
DE10328777A1 (de) * | 2003-06-25 | 2005-01-27 | Coding Technologies Ab | Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals |
DE102004024855A1 (de) * | 2004-05-19 | 2005-12-15 | Océ Document Technologies GmbH | Verfahren und Vorrichtung zur Interpolation und Korrektur eines Bildes |
JP2006119723A (ja) * | 2004-10-19 | 2006-05-11 | Canon Inc | 画像処理装置、画像処理方法 |
DE102005002195A1 (de) * | 2005-01-17 | 2006-07-27 | Siemens Ag | Verfahren und Anordnung zur Regeneration eines optischen Datensignals |
US8781822B2 (en) * | 2009-12-22 | 2014-07-15 | Qualcomm Incorporated | Audio and speech processing with optimal bit-allocation for constant bit rate applications |
US10003377B1 (en) * | 2016-12-19 | 2018-06-19 | Cisco Technology, Inc. | Spread spectrum acoustic communication techniques |
US10404319B1 (en) | 2018-07-09 | 2019-09-03 | Cisco Technology, Inc. | Fast correlation of prometheus orthonormal sets (PONS) for communications |
US10396846B1 (en) | 2018-10-12 | 2019-08-27 | Cisco Technology, Inc. | Adaptive decoding of spread spectrum signals using multiple correlator peaks |
US10601459B1 (en) | 2018-11-02 | 2020-03-24 | Cisco Technology, Inc. | Efficient handling of clock offset in spread spectrum decoders |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4291405A (en) * | 1979-09-07 | 1981-09-22 | Bell Telephone Laboratories, Incorporated | Error reduction speech communication system |
FR2481026B1 (ja) * | 1980-04-21 | 1984-06-15 | France Etat | |
GB8330885D0 (en) * | 1983-11-18 | 1983-12-29 | British Telecomm | Data transmission |
US4622680A (en) * | 1984-10-17 | 1986-11-11 | General Electric Company | Hybrid subband coder/decoder method and apparatus |
US4817146A (en) * | 1984-10-17 | 1989-03-28 | General Electric Company | Cryptographic digital signal transceiver method and apparatus |
CA1220282A (en) * | 1985-04-03 | 1987-04-07 | Northern Telecom Limited | Transmission of wideband speech signals |
US4935963A (en) * | 1986-01-24 | 1990-06-19 | Racal Data Communications Inc. | Method and apparatus for processing speech signals |
DE3639753A1 (de) * | 1986-11-21 | 1988-06-01 | Inst Rundfunktechnik Gmbh | Verfahren zum uebertragen digitalisierter tonsignale |
JPH0636158B2 (ja) * | 1986-12-04 | 1994-05-11 | 沖電気工業株式会社 | 音声分析合成方法及び装置 |
DE3703143A1 (de) * | 1987-02-03 | 1988-08-11 | Thomson Brandt Gmbh | Verfahren zur uebertragung eines audiosignals |
NL8700985A (nl) * | 1987-04-27 | 1988-11-16 | Philips Nv | Systeem voor sub-band codering van een digitaal audiosignaal. |
US4805193A (en) * | 1987-06-04 | 1989-02-14 | Motorola, Inc. | Protection of energy information in sub-band coding |
US4982283A (en) * | 1988-05-06 | 1991-01-01 | General Electric Company | Line-sequential pyramid processing of a plurality of raster-scanned image variables |
US4964166A (en) * | 1988-05-26 | 1990-10-16 | Pacific Communication Science, Inc. | Adaptive transform coder having minimal bit allocation processing |
NL8901032A (nl) * | 1988-11-10 | 1990-06-01 | Philips Nv | Coder om extra informatie op te nemen in een digitaal audiosignaal met een tevoren bepaald formaat, een decoder om deze extra informatie uit dit digitale signaal af te leiden, een inrichting voor het opnemen van een digitaal signaal op een registratiedrager, voorzien van de coder, en een registratiedrager verkregen met deze inrichting. |
US5142656A (en) * | 1989-01-27 | 1992-08-25 | Dolby Laboratories Licensing Corporation | Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio |
US4987480A (en) * | 1989-07-11 | 1991-01-22 | Massachusetts Institute Of Technology | Multiscale coding of images |
US5054075A (en) * | 1989-09-05 | 1991-10-01 | Motorola, Inc. | Subband decoding method and apparatus |
JP2751564B2 (ja) * | 1990-05-25 | 1998-05-18 | ソニー株式会社 | ディジタル信号符号化装置 |
-
1990
- 1990-11-09 JP JP2305114A patent/JP2906646B2/ja not_active Expired - Fee Related
-
1991
- 1991-11-05 US US07/786,798 patent/US5301255A/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH04177300A (ja) | 1992-06-24 |
US5301255A (en) | 1994-04-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2906646B2 (ja) | 音声帯域分割符号化装置 | |
CA2166551C (en) | Computationally efficient adaptive bit allocation for coding method and apparatus | |
US5632003A (en) | Computationally efficient adaptive bit allocation for coding method and apparatus | |
US5737718A (en) | Method, apparatus and recording medium for a coder with a spectral-shape-adaptive subband configuration | |
JP3134455B2 (ja) | 高能率符号化装置及び方法 | |
JP4033898B2 (ja) | 知覚符号化システムのサブバンドに波形予測を適用する装置及び方法 | |
EP0424016A2 (en) | Perceptual coding of audio signals | |
EP1600946A1 (en) | Method and apparatus for encoding/decoding a digital signal | |
Musmann | Genesis of the MP3 audio coding standard | |
JPH06232761A (ja) | 高能率符号化又は復号化方法及び装置 | |
EP0697665B1 (en) | Method and apparatus for encoding, transmitting and decoding information | |
US7613609B2 (en) | Apparatus and method for encoding a multi-channel signal and a program pertaining thereto | |
JPH0816195A (ja) | ディジタルオーディオ符号化方法及び装置 | |
JPH0846518A (ja) | 情報符号化方法及び復号化方法、情報符号化装置及び復号化装置、並びに情報記録媒体 | |
JP3277699B2 (ja) | 信号符号化方法及び装置並びに信号復号化方法及び装置 | |
US20050254586A1 (en) | Method of and apparatus for encoding/decoding digital signal using linear quantization by sections | |
CA2165450C (en) | Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions | |
JP3297238B2 (ja) | 適応的符号化システム及びビット割当方法 | |
JP2993324B2 (ja) | 音声高能率符号化装置 | |
KR100340368B1 (ko) | 고능률부호화장치,복호화장치및디지털데이터도출방법 | |
JPH1032494A (ja) | ディジタル信号処理方法及び処理装置、ディジタル信号記録方法及び記録装置、記録媒体並びにディジタル信号送信方法及び送信装置 | |
Lam et al. | Perceptual suppression of quantization noise in low bitrate audio coding | |
JPH08167247A (ja) | 高能率符号化方法及び装置、並びに伝送媒体 | |
JPH06291670A (ja) | ディジタルオーディオ信号の符号化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |