JP2906646B2 - 音声帯域分割符号化装置 - Google Patents

音声帯域分割符号化装置

Info

Publication number
JP2906646B2
JP2906646B2 JP2305114A JP30511490A JP2906646B2 JP 2906646 B2 JP2906646 B2 JP 2906646B2 JP 2305114 A JP2305114 A JP 2305114A JP 30511490 A JP30511490 A JP 30511490A JP 2906646 B2 JP2906646 B2 JP 2906646B2
Authority
JP
Japan
Prior art keywords
evaluation function
maximum value
unit
band
weighting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2305114A
Other languages
English (en)
Other versions
JPH04177300A (ja
Inventor
清隆 永井
康志 中嶋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2305114A priority Critical patent/JP2906646B2/ja
Priority to US07/786,798 priority patent/US5301255A/en
Publication of JPH04177300A publication Critical patent/JPH04177300A/ja
Application granted granted Critical
Publication of JP2906646B2 publication Critical patent/JP2906646B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、テープ,ディスク等の記録,再生系や通
信,放送等の伝送系の高能率符号化に用いられる音声帯
域分割符号化装置に関するものである。
従来の技術 近年、高品位音声信号の高能率符号化を実現する装置
として、音声帯域分割符号化装置が注目を集めている。
従来の音声帯域分割符号化装置としては、例えばジー
・スィール(G.THEILE)等によりイー・ビー・ユー・レ
ビュー・テクニカル(EBU REVIEW−TECHNICAL)誌,第2
30号,71頁〜94頁,1988年8月に発表された「高品位音声
信号の低ビットレート符号化 MASCAMシステムの紹介」
(LOW BIT-RATE CODING OF HIGH QUALITY AUDIO SIGNAL
S,AN INTRODUCTION TO MASCAM SYSTEM)と題する論文
(以下、文献1と呼ぶ)や、アール・エヌ・ジェイ・フ
ェルデユース(R.N.J.VELDHUIS)等によりフィリップス
・ジャーナル・オブ・リサーチ(PHILIPS JOURNAL OF R
ESEARCH)誌,第44巻,2/3号,329頁〜343頁,1989年に発
表された「デジタルオーディオ信号の帯域分割符号化」
(SUBBAND CODING OF DIGITAL AUDIO SIGNALS)と題す
る論文(以下、文献2と呼ぶ)に記載されている。
以下図面を参照しながら、従来の音声帯域分割符号化
装置とその復号化装置について説明する。
第5図は、従来の音声帯域分割符号化装置のブロック
図を示すものである。
第5図において、51は分析フィルタ部、52は最大値情
報決定部、53は評価関数算出部、54はビット割当決定
部、55は量子化部、56は多重化部である。
以上のように構成された音声帯域分割符号化装置につ
いて、以下その動作を説明する。
第5図において、分析フィルタ部51は、入力されたデ
ジタル音声信号を複数の部分帯域に分割するための複数
の帯域通過フィルタからなるフィルタ群である。デジタ
ル音声信号のサンプリング周波数が32kHzから48kHzの場
合、人間の聴覚特性の臨界帯域幅に対応して16個から32
個の部分帯域に分割される。分析フィルタ部51はデジタ
ルフィルタであり、例えばインテジャーバンドフィルタ
バンク(INTEGER-BAND FILTER BANK)によって構成され
る。インテジャーバンドフィルタバンクについては、エ
ヌ・エス・ジャイアント(N.S.JAYANT)とピー・ノル
(P.NOLL)によりプレンティス・ホール(PRENTICE-HAL
L)社から1984年に出版された「波形のデジタル符号
化」(DIGITAL CODING OF WAVEFORMS)と題する本の第1
1章(以下、文献3と呼ぶ)に記載されている。インテ
ジャーバンドフィルタバンクでは、全帯域幅の部分帯域
の帯域幅に対する比が整数であり、この比で間引きを行
うことにより、帯域通過信号を低域周波数信号に周波数
変換することができる。しかしながら間引きによって帯
域の境界で折返し歪が発生する。分析フィルタによって
発生するこの折返し歪を合成フィルタでキャンセルする
ことができるフィルタとしてクオドラチャミラーフィル
タ(QUADRATURE MIRROR FILTER,以下、QMFと呼ぶ)が広
く用いられている。QMFでは隣接する部分帯域の信号の
量子化幅が同一であるときには折返し歪をキャンセルす
ることができる。分析フィルタ部51で複数の部分帯域に
分割された信号は5msから20msの所定の時間を有する区
間に区切られる。
最大値情報決定部52は、分析フィルタ部51から各部分
帯域毎に区間内の信号の絶対値の最大値を求め、最大値
情報を出力する。最大値情報としては、例えば最大値を
6ビットで対数量子化したものが用いられる。
評価関数算出部53は、聴覚のマスキング規則に基づい
て、ビット割当決定部54で最適なビット割当を行うため
に必要な評価関数を算出する。すなわち、部分帯域分割
数をN,部分帯域番号をi(低周波数から高周波数に順に
番号をつける。1≦i≦N),部分帯域番号iの最大値
情報をPi,信号のパワーをSi,信号によってマスクされる
パワー(以下、マスクトパワーと呼ぶ)をMi,1区間内の
間引き後のサンプル数をLi,割当ビット数をBi,1区間内
でサンプル情報に割当可能な全ビット数をBqとすると、
部分帯域番号iの量子化雑音パワーは次式で求められ
る。
(2Pi/2B1)2/12 したがって、全帯域の量子化雑音パワー対マスクトパ
ワー比(NOISE-TO-MASK RATIO,以下、NMRと呼ぶ)は次
式で与えられる。
ビット割当決定部54は、次式に示す固定ビットレートの
条件の下でNMRを最小化するビット割当を行う。
このために評価関数算出部53は、部分帯域番号iの評価
関数Eiとして次式を計算し、出力する。
Ei=log2(Pi/Mi1/2) =log2Pi−(log2Mi)/2 第6図は評価関数算出部53のフローチャートである。
評価関数算出部53では、最初に分析フィルタ部51からの
各部分帯域の信号を用い、各部分帯域の信号パワーを算
出する。次に、各部分帯域の信号のパワーとマスキング
規則とに基づいて、帯域内の信号によってまた隣接帯域
の信号によってマスキングされて人間の耳には聞こえな
いマスクトパワーを算出する。マスクトパワーの算出法
については、例えば文献2の334頁〜338頁に記載されて
いる。次に、各部分帯域毎に、最大値情報決定部52から
の最大値情報の2を底とする対数から、マスクトパワー
の2を底とする対数に2分の1を掛けたものを引くこと
により評価関数を求め、出力する。
第7図はビット割当決定部54のフローチャートであ
る。ビット割当決定部54は、ステップ1で初期化処理を
行った後、ステップ2とステップ3を繰り返すことによ
り、NMRを最小にする部分帯域番号iの割当ビット数Bi
を決定し、出力する。
ステップ1では、割当可能なビット数BをBqに、Bi
(1≦i ≦N)を0に設定する。
ステップ2では、評価関数Eiを最大とする部分帯域番
号kを見い出す。
ステップ3では、割当可能なビット数BからLkを引
く。Bが0以上の場合、この部分帯域に割り当てるビッ
ト数Bkを1増加させ、かつ評価関数Ekから1を引く。B
が負の場合、ビット割当処理を終了する。
量子化部55は、分析フィルタ部51からの各部分帯域の
各区間の信号を最大値情報決定部52からの最大値情報を
用いて正規化し、ビット割当決定部54からのビット割当
情報にしたがって各部分帯域の信号を量子化し、サンプ
ル情報として出力する。多重化部56は、量子化部55から
の各部分帯域のサンプル情報と最大値情報決定部52から
の各部分帯域の最大値情報とビット割当決定部54からの
各部分帯域のビット割当情報とを多重化し、符号化信号
を出力する。
最大値情報決定部52と評価関数算出部53とビット割当
決定部54と量子化部55と多重化部56はマイクロプロセッ
サで構成できる。
第8図は従来の音声帯域分割復号化装置のブロック図
を示すものである。
第8図において、81は逆多重化部、82は逆量子化部、
83は合成フィルタである。
以上のように構成された音声帯域分割復号化装置につ
いて、以下その動作を説明する。
第8図において、逆多重化部81は、入力された符号化
信号を各区間に分離し、各区間の信号を各部分帯域毎の
サンプル情報と最大値情報とビット割当情報とに分離
し、出力する。逆量子化部82は、各部分帯域毎に、逆多
重化部81からのサンプル情報をビット割当情報を用いて
逆量子化を行い、次に最大値情報を用いて逆正規化し、
各部分帯域の各区間の信号を再生する。逆多重化部81と
逆量子化部82はマイクロプロセッサで構成できる。合成
フィルタ部83は、複数の帯域通過フィルタからなるフィ
ルタ群であり、逆量子化部82からの各部分帯域の各区間
の信号を合成してデジタル音声信号を再生し、出力す
る。合成フィルタ部83の各帯域通過フィルタは分析フィ
ルタ51とペアをなすデジタルフィルタによって構成され
る。
発明が解決しようとする課題 しかしながら、上記従来の音声帯域分割符号化装置で
は、マスキング規則を適用する際の近似誤差によりマス
クトパワーに誤差を生じ、誤差を含んだ評価関数に基づ
いてビット割当を行うので音声信号の品質が劣化すると
いう問題点を有していた。文献2に記載されている音声
帯域分割符号化装置では、マスキング規則の適用時に分
析フィルタの間引きによって発生する折返し歪の影響を
考慮していないので、特に低域の部分帯域で折返し歪が
発生し、音質を劣化させることがある。低域の部分帯域
で折返し歪の影響が大きい理由は、分析および合成フィ
ルタの実現上の課題から低域では部分帯域の帯域幅が臨
界帯域幅より大きく、マスキング効果が小さいことによ
る。また、オリジナルの高品位音声信号との透明性(ト
ランスペアレンシー)を確保するためにビットレートを
上げたときも前記誤差の影響によってビット割当が最適
とならないという問題点があった。
本発明は上記従来の問題点を解決するもので、分析フ
ィルタの折返し歪に代表されるマスキング規則適用時の
誤差を減少させビット割当の最適化を図ることにより、
音声信号の品質が向上した音声帯域分割符号化装置を提
供することを目的とする。
課題を解決するための手段 この目的を達成するために本発明の音声帯域分割符号
化装置は、音声信号を複数の部分帯域に分割し、各部分
帯域の信号を所定の時間を有する区間に分割する分析フ
ィルタ部と、各部分帯域毎に、前記区間内の信号の絶対
値の最大値を表わす最大値情報を決定し、出力する最大
値情報決定部と、各部分帯域毎に、前記最大値情報決定
部からの最大値情報の対数から、前記分析フィルタ部か
らの部分帯域の信号と聴覚のマスキング規則とに基づい
て算出した各部分帯域のマスクされるパワーの平方根の
対数に重み付け係数を掛けたものを引くことにより重み
付け評価関数を求め、出力する重み付け評価関数算出部
と、前記重み付け評価関数算出部からの重み付け評価関
数を用いて各部分帯域に割り当てるビット数を決定し、
ビット割当情報を出力するビット割当決定部と、各部分
帯域毎に、前記分析フィルタ部からの部分帯域の信号
を、前記最大値情報決定部からの最大値情報と前記ビッ
ト割当決定部からのビット割当情報とに基づいて量子化
し、サンプル情報を出力する量子化部とを備えたもので
ある。
また本発明の音声帯域分割符号化装置は、音声信号を
複数の部分帯域に分割し、各部分帯域の信号を所定の時
間を有する区間に分割する分析フィルタ部と、各部分帯
域毎に、前記区間内の信号の絶対値の最大値を表わす最
大値情報を決定し、出力する最大値情報決定部と、各部
分帯域毎に、前記最大値情報決定部からの最大値情報の
対数から、前記分析フィルタ部からの部分帯域の信号と
聴覚のマスキング規則とに基づいて算出した各部分帯域
のマスクされるパワーの平方根の対数に複数の重み付け
係数を掛けたものを引くことにより複数の重み付け評価
関数を求め、出力する重み付け評価関数算出部と、前記
重み付け評価関数から既に割り当てられたビット数を引
いた値に応じて前記複数の重み付け評価関数を選択し
て、各部分帯域に割り当てるビット数を決定し、ビット
割当情報を出力するビット割当決定部と、各部分帯域毎
に、前記分析フィルタ部からの部分帯域の信号を、前記
最大値情報決定部からの最大値情報と前記ビット割当決
定部からのビット割当情報とに基づいて量子化し、サン
プル情報を出力する量子化部とを備えたものである 作用 本発明は上記した構成により、重み付け係数の値によ
ってマスキング効果と波形歪の貢献度を可変することが
可能な重み付け評価関数を用いてマスキング効果が小さ
く折返し歪の影響の大きい部分帯域では波形歪の貢献度
を大きくするように部分帯域毎に重み付け係数を設定
し、重み付け評価関数算出部で前記重み付け係数を用い
て重み付け評価関数を算出し、ビット割当決定部で前記
重み付け評価関数を用いて各部分帯域に割り当てるビッ
ト数を決定することによって最適なビット割当を行い、
折返し歪の影響を軽減し、音声信号の品質を向上するこ
とができる。
また本発明は上記した構成により、重み付け評価関数
算出部で複数の重み付け評価関数を算出し、ビット割当
決定部で重み付け評価関数から既に割り当てられたビッ
ト数を引いた値に応じて前記複数の重み付け評価関数を
選択して各部分帯域に割り当てるビット数を決定するこ
とによって、割り当てられたビット数による量子化雑音
のマスキング量に応じてマスキング効果と波形歪のビッ
ト割当に及ぼす貢献度を変化した重み付け評価関数を選
択し、割当ビット数が小さいときには、マスキング効果
を活用して効率的にビットを割り当て、割当ビット数が
大きくなり、量子化雑音のマスキング量が一定の閾値以
上となったときには、波形歪に基づいてビットを割り当
てることによって、最適なビット割当を行い、マスキン
グ規則適用時の誤差の影響を軽減し、音声信号の品質、
特に透明性を向上することができる。
実施例 以下、本発明の実施例について、図面を参照しながら
説明する。
第1図は、本発明の実施例における音声帯域分割符号
化装置のブロック図を示すものである。
第1図において、11は分析フィルタ部、12は最大値情
報決定部、13は重み付け評価関数算出部、14はビット割
当決定部、15は量子化部、16は多重化部である。
以上のように構成された音声帯域分割符号化装置につ
いて、以下その動作を説明する。
本実施例では、音声帯域分割符号化装置としては従来
例と同じものを用いることができる。また、本発明の実
施例のブロック図を表わす第1図において、11,12,15,1
6は、それぞれ第5図に示す従来例の51,52,55,56と同一
の構成要素である。
以下、本発明の2つの実施例についてその動作説明す
る。2つの実施例のブロック図はともに第1図であり、
同一であるが、重み付け評価関数算出部13とビット割当
決定部14の動作が異なる。
最初に、第1の実施例について図面を参照しながらそ
の動作を説明する。
第1図において、分析フィルタ部11は入力されたデジ
タル音声信号を複数の部分帯域に分割するための複数の
帯域通過フィルタからなるフィルタ群である。分析フィ
ルタ部11はデジタルフィルタであり、例えばツリー構成
のQMFで構成できる。分析フィルタ部11で複数の部分帯
域に分割された信号は、5msから20msの所定の時間を有
する区間に区切られる。最大値情報決定部12は、分析フ
ィルタ部11から各部分帯域毎に区間内の信号の絶対値の
最大値を求め、最大値情報を出力する。最大値情報とし
ては、例えば最大値を6ビットで対数量子化したものが
用いられる。重み付け評価関数算出部13は、ビット割当
決定部14で最適なビット割当を行うために必要な重み付
け評価関数を算出する。第2図は、第1の実施例におけ
る重み付け評価関数算出部13のフローチャートである。
本実施例における変数の意味は従来例と同一である。重
み付け評価関数算出部13では、最初に分析フィルタ部11
からの各部分帯域の信号を用いて部分帯域番号iの信号
パワーのSiを算出する。次に、各部分帯域の信号のパワ
ーとマスキング規則とに基づいて、帯域内の信号によっ
てまた隣接帯域の信号によってマスキングされて人間の
耳には聞こえないマスクトパワーMiを算出する。マスク
トパワーの算出法については、例えば文献2に記載され
ている方法による。次に、各部分帯域毎に次式で与えら
れる重み付け評価関数Eiを算出する。
Ei=log2(Pi/MiW1/2) =log2Pi−(log2Mi)Wi/2 すなわち、最大値情報決定部12からの最大値情報Piの
2を底とする対数から、マスクトパワーの2を底とする
対数に重み付け係数Wiの2分の1を掛けたものを引くこ
とにより重み付け評価関数Eiを求め出力する。
ここで、重み付け評価関数Eiの意味について説明す
る。重み付け係数Wiが0のときは、 Ei=log2Pi となる。これは次式で与えられる全帯域の量子化雑音パ
ワーを最小にするための、すなわち波形歪を最小にする
ための評価関数である。
一方、重み付け係数Wiが1のときは、 Ei=log2Pi−(log2Mi)/2 となり、従来例で述べた評価関数と一致する。すなわ
ち、重み付け評価関数はNMRを最小にするための評価関
数、あるいは、マスキング効果を大きくする評価関数と
なる。
以上のように重み付け評価関数は、与えられた重み付
け係数Wiの値(0〜1)によって、マスキング効果と波
形歪の貢献度(影響度)を可変することが可能となる。
第1の実施例では、マスキング効果が小さく折り返し
歪の影響の大きい部分帯域では、波形歪の貢献度が大き
くなるように(すなわち、波形歪を小さくするよう
に)、部分帯域毎に重み付け係数を0またはその近傍の
値に設定し、重み付け評価関数を算出する。逆に、マス
キング効果が大きく折り返し歪の影響の小さい部分帯域
では、マスキング効果の貢献度が大きくなるように、重
み付け係数を1またはその近傍の値に設定し、重み付け
評価関数を算出する。
ビット割当決定部14は、従来例と同一の動作をする。
すなわち、ビット割当決定部14のフローチャートは第7
図によって示される。ビット割当決定部14は、ステップ
1で初期化処理を行った後、重み付け評価関数を用いて
ステップ2とステップ3を繰り返すことにより部分帯域
番号iの割当ビット数Biを決定し、出力する。
ステップ1では、割当可能なビット数BをBqに、Bi
(1≦i≦N)を0に設定する。
ステップ2では、重み付け評価関数Eiを最大とする部
分帯域番号kを見い出す。
ステップ3では、割当可能なビット数BからLkを引
く。Bが0以上の場合、この部分帯域に割り当てるビッ
ト数Bkを1増加させ、かつ重み付け評価関数Ekから1を
引く。Bが負の場合、ビット割当処理を終了する。
量子化部15は分析フィルタ部11からの各部分帯域の各
区間の信号を最大値情報決定部12からの最大値情報を用
いて正規化し、ビット割当決定部14からのビット割当情
報にしたがって各部分帯域の信号を量子化し、サンプル
情報として出力する。多重化部16は、量子化部15からの
各部分帯域のサンプル情報と最大値情報決定部12からの
各部分帯域の最大値情報とビット割当決定部14からの各
部分帯域のビット割当情報とを多重化し、符号化信号を
出力する。
最大値情報決定部12と重み付け評価関数算出部13とビ
ット割当決定部14と量子化部15と多重化部16はマイクロ
プロセッサで構成できる。
以上のように第1の実施例によれば、重み付け係数の
値によってマスキング効果と波形歪の貢献度を可変する
ことが可能な重み付け評価関数を算出する重み付け評価
関数算出部と、重み付け評価関数算出部からの重み付け
評価関数を用いて各部分帯域に割り当てるビット数を決
定するビット割当決定部とを設け、分析フィルタ部の折
返し歪のマスキング量に応じて各部分帯域毎に重み付け
係数を設定することにより、最適なビット割当を行い、
折返し歪の影響を軽減し、音声信号の品質を向上させる
ことができる。
次に、本発明の第2の実施例について図面を参照しな
がらその動作を説明する。
第2の実施例においては、分析フィルタ部11,最大値
情報決定部12,量子化部15,多量化部16についてはその動
作は第1の実施例と同一であり、説明を省略する。以
下、第1の実施例と動作が異なる重み付け評価関数算出
部13とビット割当決定部14についてその動作を説明す
る。
重み付け評価関数算出部13は聴覚のマスキング効果と
波形歪とに基づいて、ビット割当決定部14で最適なビッ
ト割当を行うために必要な複数の重み付け評価関数を算
出する。第3図は、第2の実施例における重み付け評価
関数算出部13のフローチャートである。重み付け評価関
数算出部13では、最初に分析フィルタ部11からの各部分
帯域の信号を用いて部分帯域番号iの信号のパワーSiを
算出する。次に、各部分帯域の信号のパワーとマスキン
グ規則とに基づいて、帯域内の信号によってまた隣接帯
域の信号によって、マスキングされて人間の耳には聞こ
えないマスクトパワーMiを算出する。次に、各部分帯域
毎に、第1の重み付け係数Wi1(1≦i≦N)を有する
重み付け評価関数Ei1を算出する。第2の実施例では、
第1の重み付け係数Wi1をすべて1に設定し、マスキン
グ効果のビット割当におよぼす貢献度を最大にしてい
る。Ei1は次式によって算出される。
Ei1=log2Pi−(log2Mi)/2 すなわち、最大値情報決定部12からの最大値情報Piの
2を底とする対数からマスクトパワーの2を底とする対
数に2分の1を掛けたものを引くことにより重み付け評
価関数Ei1を求める。次に、各部分帯域毎に第2の重み
付け係数Wi2(1≦i≦N)を有する重み付け評価関数E
i2を算出する。第2の実施例では、第2の重み付け係数
Wi2(1≦i≦N)を0に設定し、波形歪のビット割当
におよぼす貢献度を最大にしている。Ei2は次式によっ
て算出される。
Ei2=log2Pi すなわち、最大値情報決定部12からの最大値情報Piの
2を底とする対数を算出することにより、第2の重み付
け評価関数Ei2を求める。重み付け評価関数算出部13は
以上のようにして求めた第1と第2の重み付け評価関数
をビット割当決定部14に出力する。
第4図は第2の実施例におけるビット割当決定部14の
フローチャートである。ビット割当決定部14は、ステッ
プ1で初期化処理を行った後、重み付け評価関数を用い
てステップ2とステップ3を繰り返すことにより部分帯
域番号iの割当ビット数Biを決定し、出力する。
ステップ1では、jを1に設定し、第1の重み付け評
価関数を選択する。割当可能なビット数BをBqに、Bi
(1≦i≦N)を0に設定する。
ステップ2では、重み付け評価関数Eijを最大とする
部分帯域番号kを見い出す。
ステップ3では、jが1のときはステップ2で見つけ
た重み付け評価関数の最大値Emaxと閾値Tを比較し、閾
値以下のときはjを2に設定しステップ2に戻る。jが
1でないときおよび重み付け評価関数の最大値が閾値よ
り大きいときには、割当可能なビット数BからLkを引
く。Bが0以上の場合、この部分帯域に割り当てるビッ
ト数Bkを1増加させ、かつ2つの重み付け評価関数Ek1
とEk2から1を引く。Bが負の場合、ビット割当処理を
終了する。
重み付け評価関数算出部13とビット割当決定部14はマ
イクロプロセッサで構成できる。
以上のように第2の実施例によれば、複数の重み付け
係数を有する重み付け評価関数算出部とビット割当決定
部とを設けることにより、割当ビット数が小さいときに
はマスキング効果を活用して効率的にビットを割り当
て、割当ビット数が大きくなり、量子化雑音のマスキン
グ量が一定の閾値以上となったときには、波形歪に基づ
いてビットを割り当てることによって最適なビット割当
を行い、マスキング規則適用時の誤差の影響を軽減し、
音声信号の品質、特に透明性を向上させることができ
る。
なお、第1および第2の実施例において、ビットレー
トは固定としたが、ビットレートを可変とし、ビットレ
ートに応じて重み付け係数あるいは閾値を設定してもよ
い。
また、第1および第2の実施例において、マスクトパ
ワーの算出には分析フィルタ部からの部分帯域の信号を
用いたが、マスキング規則のより精度の高い適用を目的
としてFFT分析器のような周波数分解能の高い分析器を
設け、その出力を用いてマスクトパワーの算出を行って
もよい。
発明の効果 以上のように本発明は、重み付け係数の値によってマ
スキング効果と波形歪の貢献度を可変することが可能な
重み付け評価関数を算出する重み付け評価関数算出部
と、重み付け評価関数算出部からの重み付け評価関数を
用いて各部分帯域に割り当てるビット数を決定するビッ
ト割当決定部とを設け、分析フィルタ部の折返し歪のマ
スキング量に応じて各部分帯域毎に重み付け係数を設定
することにより最適なビット割当を行い、折返し歪の影
響を軽減し、音声信号の品質を向上させることができ
る。
また本発明は、複数の重み付け評価関数を算出する重
み付け評価関数算出部と、重み付け評価関数から割当ビ
ット数を引いた値に応じて、重み付け評価関数算出部か
らの複数の重み付け評価関数を選択して各部分帯域に割
り当てるビット数を決定するビット割当決定部とを設
け、割当ビット数が小さいときには、マスキング効果を
活用してビットを割り当て、割当ビット数が大きくなり
量子化雑音のマスキング量が一定の閾値以上となったと
きには、波形歪に基づいてビットを割り当てることによ
って最適なビット割当を行い、マスキング規則適用時の
誤差の影響を軽減し、音声信号の品質、特に透明性を向
上させることができる。
【図面の簡単な説明】
第1図は本発明の実施例における音声帯域分割符号化装
置の構成を示すブロック図、第2図は本発明の第1の実
施例における重み付け評価関数算出部のフローチャー
ト、第3図は本発明の第2の実施例における重み付け評
価関数算出部のフローチャート、第4図は本発明の第2
の実施例におけるビット割当決定部のフローチャート、
第5図は従来の音声帯域分割符号化装置の構成を示すブ
ロック図、第6図は従来の評価関数算出部のフローチャ
ート、第7図は従来のビット割当決定部のフローチャー
ト、第8図は従来の音声帯域分割復号化装置の構成を示
すブロック図である。 11……分析フィルタ部、12……最大値情報決定部、13…
…重み付け評価関数算出部、14……ビット割当決定部、
15……量子化部、16……多重化部。
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G10C 3/00 - 9/18 H03M 7/30 H04B 14/04 JOISファイル(JICST)

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】音声信号を複数の部分帯域に分割し、各部
    分帯域の信号を所定の時間を有する区間に分割する分析
    フィルタ部と、 各部分帯域毎に、前記区間内の信号の絶対値の最大値を
    表わす最大値情報を決定し、出力する最大値情報決定部
    と、 各部分帯域毎に、前記最大値情報決定部からの最大値情
    報の対数から、前記分析フィルタ部からの部分帯域の信
    号と聴覚のマスキング規則とに基づいて算出した各部分
    帯域のマスクされるパワーの平方根の対数に0〜1の所
    望の重み付け係数を掛けたものを引くことにより重み付
    け評価関数を求め、出力する重み付け評価関数算出部
    と、 前記重み付け評価関数算出部からの重み付け評価関数を
    用いて各部分帯域に割り当てるビット数を決定し、ビッ
    ト割当情報を出力するビット割当決定部と、 各部分帯域毎に、前記分析フィルタ部からの部分帯域の
    信号を前記最大値情報決定部からの最大値情報と前記ビ
    ット割当決定部からのビット割当情報とに基づいて量子
    化し、サンプル情報を出力する量子化部とを具備した音
    声帯域分割符号化装置。
  2. 【請求項2】分析フィルタ部の折返し歪のマスキング量
    に応じて各部分帯域毎に重み付け係数を設定する重み付
    け評価関数算出部を有する請求項1記載の帯域分割符号
    化装置。
  3. 【請求項3】音声信号を複数の部分帯域に分割し、各部
    分帯域の信号を所定の時間を有する区間に分割する分析
    フィルタ部と、 各部分帯域毎に、前記区間内の信号の絶対値の最大値を
    表わす最大値情報を決定し、出力する最大値情報決定部
    と、 各部分帯域毎に、前記最大値情報決定部からの最大値情
    報の対数から前記分析フィルタ部からの部分帯域の信号
    と聴覚のマスキング規則とに基づいて算出した各部分帯
    域のマスクされるパワーの平方根の対数に0〜1の所望
    の重み付け係数を掛けたものを引くことにより複数の重
    み付け評価関数を求め、出力する重み付け評価関数算出
    部と、 前記重み付け評価関数から既に割り当てられたビット数
    を引いた値に応じて前記複数の重み付け評価関数を選択
    して、各部分帯域に割り当てるビット数を決定し、ビッ
    ト割当情報を出力するビット割当決定部と、 各部分帯域毎に、前記分析フィルタ部からの部分帯域の
    信号を、前記最大値情報決定部からの最大値情報と前記
    ビット割当決定部からのビット割当情報とに基づいて量
    子化し、サンプル情報を出力する量子化部とを具備した
    音声帯域分割符号化装置。
  4. 【請求項4】重み付け評価関数から割当ビット数を引い
    た値が、閾値より大きいときには重み付け係数の値が1
    の重み付け評価関数を選択し、閾値以下のときには重み
    付け係数の値が0の重み付け評価関数を選択するビット
    割当決定部を有する請求項3記載の音声帯域分割符号化
    装置。
JP2305114A 1990-11-09 1990-11-09 音声帯域分割符号化装置 Expired - Fee Related JP2906646B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2305114A JP2906646B2 (ja) 1990-11-09 1990-11-09 音声帯域分割符号化装置
US07/786,798 US5301255A (en) 1990-11-09 1991-11-05 Audio signal subband encoder

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2305114A JP2906646B2 (ja) 1990-11-09 1990-11-09 音声帯域分割符号化装置

Publications (2)

Publication Number Publication Date
JPH04177300A JPH04177300A (ja) 1992-06-24
JP2906646B2 true JP2906646B2 (ja) 1999-06-21

Family

ID=17941271

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2305114A Expired - Fee Related JP2906646B2 (ja) 1990-11-09 1990-11-09 音声帯域分割符号化装置

Country Status (2)

Country Link
US (1) US5301255A (ja)
JP (1) JP2906646B2 (ja)

Families Citing this family (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3189401B2 (ja) * 1992-07-29 2001-07-16 ソニー株式会社 音声データ符号化方法及び音声データ符号化装置
KR950008637B1 (ko) * 1993-04-08 1995-08-03 삼성전자주식회사 부밴드 코딩시스템의 신호처리장치
EP0709006B1 (en) * 1993-07-16 1997-03-05 Dolby Laboratories Licensing Corporation Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions
US5623577A (en) * 1993-07-16 1997-04-22 Dolby Laboratories Licensing Corporation Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions
KR100269213B1 (ko) * 1993-10-30 2000-10-16 윤종용 오디오신호의부호화방법
JP3024467B2 (ja) * 1993-12-10 2000-03-21 日本電気株式会社 音声符号化装置
DE69426860T2 (de) * 1993-12-10 2001-07-19 Nec Corp Sprachcodierer und Verfahren zum Suchen von Codebüchern
JP3024468B2 (ja) * 1993-12-10 2000-03-21 日本電気株式会社 音声復号装置
KR950022322A (ko) * 1993-12-29 1995-07-28 김주용 최적 비트할당 방법
US5764698A (en) * 1993-12-30 1998-06-09 International Business Machines Corporation Method and apparatus for efficient compression of high quality digital audio
KR0134318B1 (ko) * 1994-01-28 1998-04-29 김광호 채널간의 마스킹특성을 고려한 비트할당장치 및 그 방법과 복호화장치
WO1995022818A1 (en) * 1994-02-17 1995-08-24 Motorola Inc. Method and apparatus for group encoding signals
US5742734A (en) * 1994-08-10 1998-04-21 Qualcomm Incorporated Encoding rate selection in a variable rate vocoder
JP2778482B2 (ja) * 1994-09-26 1998-07-23 日本電気株式会社 帯域分割符号化装置
US5654952A (en) * 1994-10-28 1997-08-05 Sony Corporation Digital signal encoding method and apparatus and recording medium
EP0722225A3 (de) * 1994-11-17 2000-06-07 Deutsche Thomson-Brandt Gmbh Audiosignalkodierung mittels Kurzzeitspektren und einem psychoakustischen Modell
TW316302B (ja) * 1995-05-02 1997-09-21 Nippon Steel Corp
US5913186A (en) * 1996-03-25 1999-06-15 Prometheus, Inc. Discrete one dimensional signal processing apparatus and method using energy spreading coding
FR2749723B1 (fr) * 1996-06-06 1998-09-04 France Telecom Procede et dispositif de codage en compression d'un signal numerique
US8908872B2 (en) 1996-06-07 2014-12-09 That Corporation BTSC encoder
US5796842A (en) * 1996-06-07 1998-08-18 That Corporation BTSC encoder
GB2343801B (en) * 1997-08-21 2001-09-12 Data Fusion Corp Method and apparatus for acquiring wide-band pseudorandom noise encoded waveforms
US6091773A (en) * 1997-11-12 2000-07-18 Sydorenko; Mark R. Data compression method and apparatus
US6363338B1 (en) * 1999-04-12 2002-03-26 Dolby Laboratories Licensing Corporation Quantization in perceptual audio coders with compensation for synthesis filter noise spreading
GB2349054A (en) * 1999-04-16 2000-10-18 Nds Ltd Digital audio signal encoders
US7030863B2 (en) * 2000-05-26 2006-04-18 America Online, Incorporated Virtual keyboard system with automatic correction
DE69932861T2 (de) * 1999-10-30 2007-03-15 Stmicroelectronics Asia Pacific Pte Ltd. Verfahren zur kodierung eines audiosignals mit einem qualitätswert für bit-zuordnung
DE19959037B4 (de) * 1999-12-08 2004-04-29 Robert Bosch Gmbh Verfahren zur Dekodierung von digitalen Audiodaten
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
JP3870193B2 (ja) 2001-11-29 2007-01-17 コーディング テクノロジーズ アクチボラゲット 高周波再構成に用いる符号器、復号器、方法及びコンピュータプログラム
US20040002859A1 (en) * 2002-06-26 2004-01-01 Chi-Min Liu Method and architecture of digital conding for transmitting and packing audio signals
AU2003252727A1 (en) * 2002-08-01 2004-02-23 Matsushita Electric Industrial Co., Ltd. Audio decoding apparatus and audio decoding method based on spectral band repliction
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
EP1543307B1 (en) * 2002-09-19 2006-02-22 Matsushita Electric Industrial Co., Ltd. Audio decoding apparatus and method
DE10328777A1 (de) * 2003-06-25 2005-01-27 Coding Technologies Ab Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals
DE102004024855A1 (de) * 2004-05-19 2005-12-15 Océ Document Technologies GmbH Verfahren und Vorrichtung zur Interpolation und Korrektur eines Bildes
JP2006119723A (ja) * 2004-10-19 2006-05-11 Canon Inc 画像処理装置、画像処理方法
DE102005002195A1 (de) * 2005-01-17 2006-07-27 Siemens Ag Verfahren und Anordnung zur Regeneration eines optischen Datensignals
US8781822B2 (en) * 2009-12-22 2014-07-15 Qualcomm Incorporated Audio and speech processing with optimal bit-allocation for constant bit rate applications
US10003377B1 (en) * 2016-12-19 2018-06-19 Cisco Technology, Inc. Spread spectrum acoustic communication techniques
US10404319B1 (en) 2018-07-09 2019-09-03 Cisco Technology, Inc. Fast correlation of prometheus orthonormal sets (PONS) for communications
US10396846B1 (en) 2018-10-12 2019-08-27 Cisco Technology, Inc. Adaptive decoding of spread spectrum signals using multiple correlator peaks
US10601459B1 (en) 2018-11-02 2020-03-24 Cisco Technology, Inc. Efficient handling of clock offset in spread spectrum decoders

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4291405A (en) * 1979-09-07 1981-09-22 Bell Telephone Laboratories, Incorporated Error reduction speech communication system
FR2481026B1 (ja) * 1980-04-21 1984-06-15 France Etat
GB8330885D0 (en) * 1983-11-18 1983-12-29 British Telecomm Data transmission
US4622680A (en) * 1984-10-17 1986-11-11 General Electric Company Hybrid subband coder/decoder method and apparatus
US4817146A (en) * 1984-10-17 1989-03-28 General Electric Company Cryptographic digital signal transceiver method and apparatus
CA1220282A (en) * 1985-04-03 1987-04-07 Northern Telecom Limited Transmission of wideband speech signals
US4935963A (en) * 1986-01-24 1990-06-19 Racal Data Communications Inc. Method and apparatus for processing speech signals
DE3639753A1 (de) * 1986-11-21 1988-06-01 Inst Rundfunktechnik Gmbh Verfahren zum uebertragen digitalisierter tonsignale
JPH0636158B2 (ja) * 1986-12-04 1994-05-11 沖電気工業株式会社 音声分析合成方法及び装置
DE3703143A1 (de) * 1987-02-03 1988-08-11 Thomson Brandt Gmbh Verfahren zur uebertragung eines audiosignals
NL8700985A (nl) * 1987-04-27 1988-11-16 Philips Nv Systeem voor sub-band codering van een digitaal audiosignaal.
US4805193A (en) * 1987-06-04 1989-02-14 Motorola, Inc. Protection of energy information in sub-band coding
US4982283A (en) * 1988-05-06 1991-01-01 General Electric Company Line-sequential pyramid processing of a plurality of raster-scanned image variables
US4964166A (en) * 1988-05-26 1990-10-16 Pacific Communication Science, Inc. Adaptive transform coder having minimal bit allocation processing
NL8901032A (nl) * 1988-11-10 1990-06-01 Philips Nv Coder om extra informatie op te nemen in een digitaal audiosignaal met een tevoren bepaald formaat, een decoder om deze extra informatie uit dit digitale signaal af te leiden, een inrichting voor het opnemen van een digitaal signaal op een registratiedrager, voorzien van de coder, en een registratiedrager verkregen met deze inrichting.
US5142656A (en) * 1989-01-27 1992-08-25 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US4987480A (en) * 1989-07-11 1991-01-22 Massachusetts Institute Of Technology Multiscale coding of images
US5054075A (en) * 1989-09-05 1991-10-01 Motorola, Inc. Subband decoding method and apparatus
JP2751564B2 (ja) * 1990-05-25 1998-05-18 ソニー株式会社 ディジタル信号符号化装置

Also Published As

Publication number Publication date
JPH04177300A (ja) 1992-06-24
US5301255A (en) 1994-04-05

Similar Documents

Publication Publication Date Title
JP2906646B2 (ja) 音声帯域分割符号化装置
CA2166551C (en) Computationally efficient adaptive bit allocation for coding method and apparatus
US5632003A (en) Computationally efficient adaptive bit allocation for coding method and apparatus
US5737718A (en) Method, apparatus and recording medium for a coder with a spectral-shape-adaptive subband configuration
JP3134455B2 (ja) 高能率符号化装置及び方法
JP4033898B2 (ja) 知覚符号化システムのサブバンドに波形予測を適用する装置及び方法
EP0424016A2 (en) Perceptual coding of audio signals
EP1600946A1 (en) Method and apparatus for encoding/decoding a digital signal
Musmann Genesis of the MP3 audio coding standard
JPH06232761A (ja) 高能率符号化又は復号化方法及び装置
EP0697665B1 (en) Method and apparatus for encoding, transmitting and decoding information
US7613609B2 (en) Apparatus and method for encoding a multi-channel signal and a program pertaining thereto
JPH0816195A (ja) ディジタルオーディオ符号化方法及び装置
JPH0846518A (ja) 情報符号化方法及び復号化方法、情報符号化装置及び復号化装置、並びに情報記録媒体
JP3277699B2 (ja) 信号符号化方法及び装置並びに信号復号化方法及び装置
US20050254586A1 (en) Method of and apparatus for encoding/decoding digital signal using linear quantization by sections
CA2165450C (en) Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions
JP3297238B2 (ja) 適応的符号化システム及びビット割当方法
JP2993324B2 (ja) 音声高能率符号化装置
KR100340368B1 (ko) 고능률부호화장치,복호화장치및디지털데이터도출방법
JPH1032494A (ja) ディジタル信号処理方法及び処理装置、ディジタル信号記録方法及び記録装置、記録媒体並びにディジタル信号送信方法及び送信装置
Lam et al. Perceptual suppression of quantization noise in low bitrate audio coding
JPH08167247A (ja) 高能率符号化方法及び装置、並びに伝送媒体
JPH06291670A (ja) ディジタルオーディオ信号の符号化方法

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees