JP3131542B2 - 符号化復号化装置 - Google Patents

符号化復号化装置

Info

Publication number
JP3131542B2
JP3131542B2 JP06263562A JP26356294A JP3131542B2 JP 3131542 B2 JP3131542 B2 JP 3131542B2 JP 06263562 A JP06263562 A JP 06263562A JP 26356294 A JP26356294 A JP 26356294A JP 3131542 B2 JP3131542 B2 JP 3131542B2
Authority
JP
Japan
Prior art keywords
frequency band
bits
encoding
unit
power
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP06263562A
Other languages
English (en)
Other versions
JPH07202823A (ja
Inventor
晴光 宮川
修一 河間
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP06263562A priority Critical patent/JP3131542B2/ja
Priority to US08/344,166 priority patent/US5684922A/en
Priority to DE69418994T priority patent/DE69418994T2/de
Priority to EP94308732A priority patent/EP0661821B1/en
Publication of JPH07202823A publication Critical patent/JPH07202823A/ja
Application granted granted Critical
Publication of JP3131542B2 publication Critical patent/JP3131542B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、楽音、音声の適応ビ
ット配分を行う符号化復号化装置のビット配分手段に関
わる。
【0002】
【従来の技術】楽音、音声等の入力ディジタル信号を、
人間の聴覚心理特性を利用して、高能率で圧縮する符号
化復号化の方式としては、時間軸上の信号を複数の周波
数帯域に分割して符号化する帯域分割符号化や、時間軸
上の信号を周波数軸上の信号に変換(直交変換)して複
数の周波数帯域に分割し各帯域毎に符号化する変換符号
化、あるいはこれらを組み合わせたものが知られてい
る。これらの高能率符号化は、いずれも時間軸上の入力
ディジタル信号を時間軸上の所定単位時間(フレーム)
でブロック化した後、いくつかの周波数帯域に分割し、
各周波数帯域にて量子化し符号化する。
【0003】時間軸上の信号を周波数帯域に分割した
り、周波数軸上の信号に変換(直交変換)したりする際
には、定常的な信号のみが存在する場合は長い時間(以
下「ブロック長」という。)の分析を行って周波数分解
能を向上させる一方、急な信号変化のある場合はブロッ
ク長を短くして時間分解能を向上させるようにしている
ものがある(特開平4−302531)。
【0004】また、上記各周波数帯域でデータを量子化
し符号化する際には、元々限られている符号化のビット
数の総数に納まるように、信号の量子化ビット数を有効
に配分する必要がある。このビット配分を入力信号に適
応して行う方式として適応ビット配分方式が知られてい
る。適応ビット配分方式では、マスキング効果や最小可
聴限等の聴覚心理特性を使って、人間の耳が聞こえない
周波数帯域の信号を削除したり(量子化のためのビット
を割り当てない)、楽音データを量子化する際に生じる
量子化誤差が人間の耳に聞こえないレベルに抑えるよう
に周波数帯域毎に量子化ビット数を分配する。
【0005】マスキング効果には同時マスキングと継時
マスキングがあり、同時マスキングとは、ある大きな音
が他の音を聞こえにくくする現象をいう。継時マスキン
グとは、時間的に前の音が後の音をマスクしたり(順方
向マスキング)、その反対(逆方向マスキング)にマス
クすることをいう。最小可聴限(最小可聴値)は、音を
知覚できる最小の音圧レベルのことであり、4kHz付近
の音の感度が高く、低周波、高周波になるほど感度が悪
くなっていく周波数特性を持つ。
【0006】適応ビット配分方式の中には、ブロック内
の信号のパターンによりマスキング効果の適用の可否を
変えるものもある(特開平3−132217)。
【0007】また、適応ビット配分方式の中には、各周
波数帯域のパワーSを求め、各周波数帯域のパワーによ
る他の周波数帯域に対するマスキング閾値M(音を聞く
ことができる最小のパワー)を求め、各周波数帯域をm
ビットで量子化した時の量子化雑音パワーN(m)より、
マスキング閾値対雑音比R(m)(=M/N(m))を計算
し、各周波数帯域のRの中で最小となるRを探し、この
周波数帯域にビットを割り当てRを更新し、再び最小の
Rを探し出してはビットを割り当てていくという反復法
がある。ここで、マスキング閾値Mの計算方法は、一般
的な聴覚特性を持つ人のマスキング特性をもとにしてい
る。
【0008】この適応ビット配分を行う符号化復号化装
置として、MD(ミニ・ディスク)やDCC(デジタル
・コンパクト・カセット)等が挙げられる。これらの装
置の実際の符号化復号化方式はそれぞれ、ATRAC
(アダプティブ・トランスフォーム・アコースティック
・コーディング)、PASC(プリシジョン・アダプテ
ィブ・サブバンド・コーディング)と呼ばれている。
【0009】
【発明が解決しようとする課題】ところで、従来の符号
化復号化装置は、信号変化の程度に応じてブロック長を
変化させる場合、ブロック長の長短によらず同じ聴覚特
性を用いてビット配分を行っている。このため、実時間
の符号化を行う場合、ブロック長の短いものにより計算
量が制限されたり、急激な信号変化時と定常信号時とで
聴覚特性の差などが考慮されないという欠点がある。
【0010】そこで、この発明の第1の目的は、信号変
化の程度に応じてブロック長を変化させるとともに、適
応ビット配分方式でブロック長の長短に応じて最適の聴
覚特性を採用することにより、音質を高めることができ
る符号化復号化装置を提供することにある。
【0011】また、入力信号が正弦波信号等のスペクト
ル帯域の狭い信号(以下、単に「正弦波信号」とい
う。)である場合、正弦波信号の含まれる周波数帯域だ
けがパワーが大きく、その周波数帯域より遠くなるほど
パワーは急激に小さくなる。このとき、正弦波信号の含
まれる周波数帯域(便宜上I1とする)から離れた他の
周波数帯域(便宜上I2とする)では、上記正弦波信号
によるマスキングの影響がほとんど無く、自身のパワー
によるマスキングの影響が一番大きくなる。その結果、
正弦波信号の含まれる周波数帯域I1の信号対マスキン
グ閾値比(SMR)(パワーSと(自身の)マスキング
閾値Mとの比を意味する。)と、上記正弦波信号による
マスキングの影響が無い周波数帯域I2の信号対マスキ
ング閾値比(SMR)との間には、大きな違いが現れな
い。つまり、信号Sと量子化雑音パワーNの相対的な関
係より、周波数帯域I1のマスキング閾値対雑音比(M
NR)R(=M/N=(S/N)(S/M))と、周波数帯
域I2のマスキング閾値対雑音比(MNR)Rとが、同
じような値となる。ここで、従来の適応ビット配分方式
では、マスキング閾値対雑音比(MNR)Rのみに基づ
いてビット配分を行っているため、周波数帯域I1に割
り当てられるビット数と、周波数帯域I2に割り当てら
れるビット数とが、同じような値となる。このため、も
し、正弦波信号のマスキングの影響を受けない周波数帯
域I2が多数あると、正弦波信号の含まれる周波数帯域
1に配分されるビット数が少なくなり、このビット数
で量子化したときの量子化誤差が大きくなる。このた
め、符号化した正弦波信号を復号化したとき、量子化誤
差が聞こえて音質が劣化する恐れがある。
【0012】そこで、この発明の第2の目的は、正弦波
信号を符号化しても音質の劣化を起こさない符号化復号
化装置を提供することにある。
【0013】また、大きいパワーを持つ周波数帯域(便
宜上I3とする)の近傍の周波数帯域(便宜上I4とす
る)はそのパワーが大きいにもかかわらず、マスキング
閾値Mが非常に高くなるときがある。このとき、S<M
となって、ビットを割り当てなくても、つまりN(0)=
Sであるから、マスキング閾値対雑音比(MNR)Rは
1より大きな数値となる。このため、周波数帯域I4
ビットは割り当てられず、この周波数帯域I4は削除さ
れる。一般的な人であれば、このような音、すなわちパ
ワーが大きい周波数帯域I3の近傍の周波数帯域I4が削
除された音を聞いても違和感を覚えない。しかし、聴覚
に優れた人は、この周波数帯域I4が削除されたことを
認識して違和感を覚える場合がある。
【0014】そこで、この発明の第3の目的は、聴覚に
優れた人にもこのような違和感を与えない符号化復号化
装置を提供することにある。
【0015】また、楽音の再生装置に低域強調機能のよ
うな特定の周波数成分を強調する機能が付いている場合
がある。このような再生装置で、上記適応ビット配分方
式で復号化した音を再生するとき、もし、符号化時に上
記周波数成分にビットが十分に割り当てられなくて、こ
の周波数成分を含む周波数帯域IsのMNRが1より少
し大きい程度であったとすると、上記周波数成分の量子
化誤差が強調される恐れがある。これを図14を用いて
説明する。図14(a)は上記適応ビット配分方式で復号
化した再生音について、ある時点のパワースペクトルと
マスキング閾値、量子化誤差のパワースペクトルを示し
ている。実線L1が再生音のパワースペクトル、破線L2
がその再生音によるマスキング閾値、点線L3が再生音
中に含まれる量子化誤差信号のパワースペクトルをそれ
ぞれ表している。上記再生装置で、図14(b)に示す度
合の低域強調を行ったとき、増加した各スペクトルを図
14(a)で各線の細線l1,l2,l3で表している。図1
4(b)の各軸のスケールは図14(a)と同じである。図1
4(a)から分かるように、再生音の低域が強調されると
共にマスキング閾値も低域が上昇している。が、それ以
上に量子化誤差のパワーが上昇して、マスキング閾値を
超えてしまう箇所が存在している。この箇所では、量子
化誤差が知覚されるという問題がある。
【0016】そこで、この発明の第4の目的は、特定の
周波数成分を強調する機能を持つ再生装置を用いて復号
化した音を再生するとき、強調される周波数成分を含む
周波数帯域で量子化誤差を抑えることができ、音質の劣
化を防止することができる符号化復号化装置を提供する
ことにある。
【0017】
【課題を解決するための手段】上記目的を達成するた
め、請求項1に記載の符号化復号化装置は、楽音、音声
またはこれらの組み合わせからなるディジタル入力信号
を符号化する符号化部と、上記符号化部によって符号化
された信号を復号化する復号化部とを備えた符号化復号
化装置であって、上記符号化部は、上記入力信号の変化
の程度に応じて、上記入力信号を所定のブロック長に時
分割してブロック化するブロック長決定部と、上記各ブ
ロックの信号を複数の周波数帯域に分割して周波数帯域
信号を生成する周波数帯域分割部と、聴覚心理特性を反
映して上記各周波数帯域のパワーの大きさから各周波数
帯域のマスキング閾値対雑音比を求め、このマスキング
閾値対雑音比の大小に基づいて上記各周波数帯域に配分
すべき量子化ビット数を決定するビット配分部と、上記
ビット配分部から上記量子化ビット数を表す情報を受け
て、この情報に基づいて、上記各周波数帯域に所定のビ
ット数を配分しつつ上記周波数帯域信号を量子化して符
号列を生成する量子化部とを有し、上記ビット配分部
は、上記ブロック長決定部から上記ブロック長を表す情
報を受けて、上記ブロック長の長短に応じて、異なる聴
覚心理特性を採用する手段を有することを特徴としてい
る。
【0018】また、請求項2に記載の符号化復号化装置
は、楽音、音声またはこれらの組み合わせからなるディ
ジタル入力信号を符号化する符号化部と、上記符号化部
によって符号化された信号を復号化する復号化部とを備
えた符号化復号化装置であって、上記符号化部は、上記
入力信号を、所定の時分割単位毎に、複数の周波数帯域
に分割して周波数帯域信号を生成する周波数帯域分割部
と、聴覚心理特性を反映して上記各周波数帯域のパワー
の大きさから各周波数帯域のマスキング閾値対雑音比を
求め、このマスキング閾値対雑音比の大小に基づいて上
記各周波数帯域に配分すべき量子化ビット数を決定する
ビット配分部と、上記ビット配分部から上記量子化ビッ
ト数を表す情報を受けて、この情報に基づいて、上記各
周波数帯域に所定のビット数を配分しつつ上記周波数帯
域信号を量子化して符号列を生成する量子化部とを有
し、上記ビット配分部は、上記各周波数帯域に配分され
る最大ビット数を各周波数帯域毎に制限する手段を有す
ることを特徴としている。
【0019】また、請求項3に記載の符号化復号化装置
は、請求項2に記載の符号化復号化装置において、上記
ビット配分部の上記手段は、全周波数帯域のパワーと一
の周波数帯域のパワーとの比に基づいて、上記一の周波
数帯域に配分される最大ビット数を決定することを特徴
としている。
【0020】また、請求項4に記載の符号化復号化装置
は、請求項2に記載の符号化復号化装置において、上記
ビット配分部の上記手段は、一の周波数帯域のパワーの
大きさに基づいて、上記一の周波数帯域に配分される最
大ビット数を決定することを特徴としている。
【0021】また、請求項5に記載の符号化復号化装置
は、請求項2に記載の符号化復号化装置において、上記
ビット配分部の上記手段は、全周波数帯域のパワーと一
の周波数帯域のパワーとの比、および、上記一の周波数
帯域のパワーの大きさとに基づいて、上記各周波数帯域
に配分される量子化ビット数を決定することを特徴とし
ている。
【0022】また、請求項6に記載の符号化復号化装置
は、請求項2及至5のいずれか一つに記載の符号化復号
化装置において、上記ビット配分部は、一の周波数帯域
のマスキング閾値対雑音比が1以下である場合、上記一
の周波数帯域に配分される最大ビット数についての制限
を解除する手段を有することを特徴としている。
【0023】また、請求項7に記載の符号化復号化装置
は、請求項2及至6のいずれか一つに記載の符号化復号
化装置において、上記ビット配分部は、配分した全量子
化ビット数が全周波数帯域に配分し得る所定の総数に満
たない場合、上記各周波数帯域に配分されたビット数が
それぞれ上記最大ビット数に等しいかどうかを判断し
て、各周波数帯域に配分されたビット数がそれぞれ上記
最大ビット数に等しいとき、上記最大ビット数について
の制限を緩和または解除する手段を有することを特徴と
している。
【0024】また、請求項8に記載の符号化復号化装置
は、楽音、音声またはこれらの組み合わせからなるディ
ジタル入力信号を符号化する符号化部と、上記符号化部
によって符号化された信号を復号化する復号化部とを備
えた符号化復号化装置であって、上記符号化部は、上記
入力信号を、所定の時分割単位毎に、複数の周波数帯域
に分割して周波数帯域信号を生成する周波数帯域分割部
と、聴覚心理特性を反映して上記各周波数帯域のパワー
の大きさから各周波数帯域のマスキング閾値対雑音比を
求め、このマスキング閾値対雑音比の大小に基づいて上
記各周波数帯域に配分すべき量子化ビット数を決定する
ビット配分部と、上記ビット配分部から上記量子化ビッ
ト数を表す情報を受けて、この情報に基づいて、上記各
周波数帯域に所定のビット数を配分しつつ上記周波数帯
域信号を量子化して符号列を生成する量子化部とを有
し、上記ビット配分部は、全周波数帯域のパワーに対し
て一の周波数帯域のパワーが一定比率以上であるかどう
かを判断して、上記一定比率以上のパワーを持つ一の周
波数帯域に、上記マスキング閾値対雑音比の大小にかか
わらず少なくとも最低量子化ビット数を割り当てる手段
を有することを特徴としている。
【0025】また、請求項9に記載の符号化復号化装置
は、楽音、音声またはこれらの組み合わせからなるディ
ジタル入力信号を符号化する符号化部と、上記符号化部
によって符号化された信号を復号化する復号化部とを備
えた符号化復号化装置であって、上記符号化部は、上記
入力信号を、所定の時分割単位毎に、複数の周波数帯域
に分割して周波数帯域信号を生成する周波数帯域分割部
と、聴覚心理特性を反映して上記各周波数帯域のパワー
の大きさから各周波数帯域のマスキング閾値対雑音比を
求め、このマスキング閾値対雑音比の大小に基づいて上
記各周波数帯域に配分すべき量子化ビット数を決定する
ビット配分部と、上記ビット配分部から上記量子化ビッ
ト数を表す情報を受けて、この情報に基づいて、上記各
周波数帯域に所定のビット数を配分しつつ上記周波数帯
域信号を量子化して符号列を生成する量子化部とを有
し、上記ビット数配分部は、予め定められた特定の周波
数帯域に、予め定められた分だけ余分にビット数を割り
当てる手段を有することを特徴としている。
【0026】また、請求項10に記載の符号化復号化装
置は、請求項9に記載の符号化復号化装置において、上
記ビット配分部は、全周波数帯域に配分し得る量子化ビ
ット数の総数から上記特定の周波数帯域に余分に配分す
べきビット数を差し引いた残りのビット数を各周波数帯
域に割り当て、続いて、上記余分に配分すべきビット数
を上記特定の周波数帯域に加算する手段を有することを
特徴としている。
【0027】また、請求項11に記載の符号化復号化装
置は、請求項9に記載の符号化復号化装置において、上
記ビット配分部は、上記周波数帯域のパワーの大きさか
ら各周波数帯域毎の信号対マスキング閾値比を求め、上
記特定の周波数帯域の信号対マスキング閾値比に予め定
められた値を加えた後、この信号対マスキング閾値比を
用いて上記マスキング閾値対雑音比を求める手段を有す
ることを特徴としている。
【0028】また、請求項12に記載の符号化復号化装
置は、楽音、音声またはこれらの組み合わせからなるデ
ィジタル入力信号を符号化する符号化部と、上記符号化
部によって符号化された信号を復号化する復号化部とを
備えた符号化復号化装置であって、上記符号化部は、上
記入力信号の変化の程度に応じて、上記入力信号を所定
のブロック長に時分割してブロック化するブロック長決
定部と、上記各ブロックの信号を複数の周波数帯域に分
割して周波数帯域信号を生成する周波数帯域分割部と、
聴覚心理特性を反映して上記各周波数帯域のパワーの大
きさから各周波数帯域のマスキング閾値対雑音比を求
め、このマスキング閾値対雑音比の大小に基づいて上記
各周波数帯域に配分すべき量子化ビット数を決定するビ
ット配分部と、上記ビット配分部から上記量子化ビット
数を表す情報を受けて、この情報に基づいて、上記各周
波数帯域に所定のビット数を配分しつつ上記周波数帯域
信号を量子化して符号列を生成する量子化部とを有し、
上記ビット配分部は、上記ブロック長決定部から上記ブ
ロック長を表す情報を受けて、上記ブロック長の長短に
応じて、異なる聴覚心理特性を採用する手段と、上記各
周波数帯域に配分される最大ビット数を各周波数帯域毎
に制限する手段と、全周波数帯域のパワーに対して一の
周波数帯域のパワーが一定比率以上であるかどうかを判
断して、上記一定比率以上のパワーを持つ一の周波数帯
域に、上記マスキング閾値対雑音比の大小にかかわらず
少なくとも最低量子化ビット数を割り当てる手段と、予
め定められた特定の周波数帯域に、予め定められた分だ
け余分にビット数を割り当てる手段との4つの手段のう
ち2つ以上の手段を有することを特徴としている。
【0029】
【作用】請求項1の符号化復号化装置では、符号化部の
ビット配分部は、ブロック長決定部からブロック長を表
す情報を受けて、上記ブロック長の長短に応じて、異な
る聴覚心理特性を採用する。したがって、ブロック長が
長いときには、計算量が多いがマスキング効果の大きい
聴覚心理特性、例えば同時マスキングを適用できる。一
方、ブロック長が短いときには、マスキング効果が小さ
いが計算量が少ない聴覚心理特性、例えば継時マスキン
グを適用できる。つまり、計算量とマスキング閾値の精
度という二律排反の関係を克服でき、常に最適の聴覚心
理特性を採用して量子化誤差を低減することができる。
したがって、高音質な再生音を得ることができる。
【0030】請求項2の符号化復号化装置は、符号化部
のビット配分部は、各周波数帯域に配分される最大ビッ
ト数を各周波数帯域毎に制限する。したがって、複数の
周波数帯域のうちパワーが大きい周波数帯域I1から離
れたパワーが小さい周波数帯域I2に対して、マスキン
グ閾値対雑音比(MNR)の大小にかかわらず、配分で
きる量子化ビットの最大数が制限される。すなわち、正
弦波信号が入力された時、正弦波信号が含まれる周波数
帯域I1から離れたパワーが小さい周波数帯域I2では、
たとえ正弦波信号の含まれる周波数帯域I1と同じよう
な大きさのマスキング閾値対雑音比(MNR)を持って
いたとしても、最大ビット数が有効に制限される。この
結果、上記パワーが小さい周波数帯域I2に配分された
であろうビット数が、他の周波数帯域、特に正弦波信号
の含まれる周波数帯域I1に配分される。したがって、
上記正弦波信号を復号化したとき、従来に比して量子化
誤差が低減され、音質が高まる。
【0031】請求項3の符号化復号化装置では、符号化
部のビット配分部は、全周波数帯域のパワーと一の周波
数帯域のパワーとの比に基づいて、上記一の周波数帯域
に配分される最大ビット数を決定する。この場合、入力
信号が大きいときに、パワーが小さい周波数帯域へのビ
ット配分が有効に制限される。
【0032】請求項4の符号化復号化装置では、符号化
部のビット配分部は、一の周波数帯域のパワーの大きさ
に基づいて、上記一の周波数帯域に配分される最大ビッ
ト数を決定する。この場合、入力信号が小さいときに、
パワーが小さい周波数帯域へのビット配分が有効に制限
される。
【0033】請求項5の符号化復号化装置では、符号化
部のビット配分部は、全周波数帯域のパワーと一の周波
数帯域のパワーとの比、および、上記一の周波数帯域の
パワーの大きさとに基づいて、上記各周波数帯域に配分
される量子化ビット数を決定する。この場合、入力信号
の大小にかかわらず、パワーが小さい周波数帯域へのビ
ット配分が有効に制限される。
【0034】ここで、上記ビット配分部による最大ビッ
ト数の制限が厳しい場合、パワーが大きい周波数帯域I
1から離れたパワーが小さい周波数帯域I2に対して、十
分なビット数が割り当てられなくて、その周波数帯域I
2での量子化誤差が聞こえてしまう可能性がある。つま
り、上記パワーが小さい周波数帯域I2のマスキング閾
値対雑音比(MNR)が1以下のときである。そこで、
請求項6の符号化復号化装置では、上記ビット配分部
は、一の周波数帯域のマスキング閾値対雑音比が1以下
である場合、上記一の周波数帯域に配分される最大ビッ
ト数についての制限を解除する。このようした場合、元
々最大ビット数の制限を受ける周波数帯域ではマスキン
グ閾値対雑音比が1を超えるまでビット数の割り当てが
なされ、マスキング閾値が1を超えた時点で直ちにビッ
ト数の割り当てが止まる。したがって、請求項2の符号
化復号化装置と同様に正弦波信号が含まれる周波数帯域
1の量子化誤差が低減される上、パワーが小さい周波
数帯域I2の量子化誤差が低減される。したがって、復
号化時の音質が改善される。
【0035】また、上記ビット配分部による最大ビット
数の制限が厳しい場合、全ての周波数帯域のビット数が
最大ビット数と等しい(あるいは超えている)にもかか
わらず、配分した全量子化ビット数が全周波数帯域に配
分し得る所定の総数に満たない可能性がある。つまり、
各周波数帯域の最大ビット数が小さいため、まだ配分で
きるビット数が余る恐れがある。そこで、請求項7の符
号化復号化装置では、上記ビット配分部は、配分した全
量子化ビット数が全周波数帯域に配分し得る所定の総数
に満たない場合、上記各周波数帯域に配分されたビット
数がそれぞれ上記最大ビット数に等しいかどうかを判断
して、各周波数帯域に配分されたビット数がそれぞれ上
記最大ビット数に等しいとき、上記最大ビット数につい
ての制限を緩和または解除する。したがって、量子化ビ
ット数の総数の範囲内でビット配分が有効に行われる。
すなわち、上記制限により本来のビット数より少ないビ
ット数が割り当てられたパワーが小さい周波数帯域I2
に対して、少し余分にビットが配分されるので、この周
波数帯域I2でのマスキング閾値対雑音比(MNR)が
改善され、復号化時の音質が改善される。
【0036】請求項8の符号化復号化装置では、符号化
部のビット配分部は、全周波数帯域のパワーに対して一
の周波数帯域のパワーが一定比率以上であるかどうかを
判断して、上記一定比率以上のパワーを持つ一の周波数
帯域に、上記マスキング閾値対雑音比の大小にかかわら
ず少なくとも最低量子化ビット数を割り当てる。したが
って、他の周波数帯域I3のパワーの影響によって、一
定比率以上のパワーを持つ周波数帯域I4が完全に削除
されるようなことがない。したがって、従来と異なり、
聴覚特性に優れた人にも違和感を持たせなくて済み、高
音質の再生音を提供することができる。
【0037】また、楽音の再生装置に低域強調機能のよ
うな特定の周波数成分を強調する機能が付いている場合
がある。このような再生装置で、上記適応ビット配分方
式で復号化した音を再生するとき、もし、符号化時に上
記周波数成分にビットが十分に割り当てられなくて、こ
の周波数成分を含む周波数帯域Isのマスキング閾値対
雑音比(MNR)が1より少し大きい程度であったとす
ると、上記周波数成分の量子化誤差が強調される恐れが
ある。そこで、請求項9の符号化復号化装置では、符号
化部のビット数配分部は、予め定められた特定の周波数
帯域Isに、予め定められた分だけ余分にビット数を割
り当てる。これにより、上記特定の周波数帯域Isの量
子化誤差は通常より小さくなり、再生装置で強調したと
きにこの誤差が強調されても、この誤差が知覚されなく
なる。
【0038】また、請求項10の符号化復号化装置で
は、符号化部のビット配分部は、全周波数帯域に配分し
得る量子化ビット数の総数から上記特定の周波数帯域I
sに余分に配分すべきビット数を差し引いた残りのビッ
ト数を各周波数帯域に割り当て、続いて、上記余分に配
分すべきビット数を上記特定の周波数帯域Isに加算す
る。したがって、最終的に全周波数帯域に配分されたビ
ット数が、上記量子化ビット数の総数の範囲内に収ま
る。
【0039】また、請求項11の符号化復号化装置で
は、符号化部のビット配分部は、上記周波数帯域のパワ
ーの大きさから各周波数帯域毎の信号対マスキング閾値
比(SMR)を求め、上記特定の周波数帯域Isの信号
対マスキング閾値比(SMR)に予め定められた値を加
えた後、この信号対マスキング閾値比(SMR)を用い
て上記マスキング閾値対雑音比(MNR)を求める。こ
のようにした場合、上記周波数帯域Isは、信号対マス
キング閾値比(SMR)の増加分によって、ビット配分
されやすくなり、請求項9の符号化復号化装置と同様に
上記特定の周波数帯域Isの量子化誤差が小さくなる。
この結果、量子化誤差がマスキング閾値を超えるのを防
止でき、量子化誤差が知覚されなくなる。しかも、この
場合のビット配分は、全周波数帯域の信号対マスキング
閾値比(SMR)のバランスを考慮したものである。す
なわち、もし、強調される特定の周波数帯域Isに信号
成分が無い場合は、この周波数帯域Isの信号対マスキ
ング閾値比(SMR)はデシベル換算で元々負の無限大
かそれに相当する値となっているので、強調による加算
は無視されて、この周波数帯域Isにビット配分される
ことはない。したがって、ビット配分の無駄をなくすこ
とができる。また、強調しても他の周波数帯域の信号に
上記周波数帯域Isの信号自身あるいは量子化誤差がマ
スクされてしまう場合は、他のマスキングされない周波
数帯域に比べ、ビット配分する前のマスキング閾値対雑
音比(MNR)が大きな値となる(もちろん強調される
前の値よりは小さな値であるが、まだマスキングされな
い周波数帯域のMNRに比べると大きい)ので、この周
波数帯域Isにはビット配分されにくくなる。したがっ
て、強調による無駄なビット配分を防ぐことができる。
【0040】また、請求項12の符号化復号化装置で
は、符号化部のビット配分部は、請求項1,2,8,9
のビット配分部が有する計4つの手段のうち2つ以上の
手段を有している。したがって、請求項1,2,8,9
による上述の4つの作用のうち2つ以上のものを組み合
わせた作用を奏することができる。しかも、上記4つの
手段は、個々にハードウエアによっても実現されるが、
ディジタル信号プロセッサ等の装置上ですべてソフトウ
エアによっても実現され得る。
【0041】
【実施例】以下、この発明の符号化復号化装置を実施例
により詳細に説明する。
【0042】図1は第1実施例の符号化復号化装置のブ
ロック構成を示している。
【0043】この符号化復号化装置は、ブロック長決定
部1、周波数帯域分割部2、ビット配分部3、量子化部
4およびマルチプレクサ5からなる符号化部と、伝送路
6と、デマルチプレクサ7、逆量子化部8および周波数
帯域合成部9からなる復号化部とを備えている。上記ビ
ット配分部3には、パワー計算部31と、マスキング閾
値計算部32と、SMR(信号対マスキング閾値比)計
算部33と、MNR(マスキング閾値対雑音比)計算部
34と、ビット配分計算部35とが含まれている。伝送
路6は、無線系、有線系または蓄積系のものである。
【0044】説明の便宜上、まず、この符号化復号化装
置全体の働きを述べ、続いて、上記符号化部のビット配
分部3の働きを述べる。
【0045】ディジタル入力信号は、まず、上記符号化
部のブロック長決定部1に入力される。ブロック長決定
部1は、入力信号の変化の程度に基づいてブロック長を
決定する。すなわち、長いブロック長(サンプル数10
24)を8個の短いブロック長のサブブロックに分割
し、隣接するサブブロックの最大振幅の比が一定値以上
である場合は短いブロック長を選択し、それ以外の場合
は長いブロック長を選択する。ここで、サブブロックの
番号をj=0〜7とする。長いブロック長の場合は、サ
ブブロックはブロックと同じである(j=0)。
【0046】このようにして決定されたブロック長を持
つ入力信号は、周波数帯域分割部2にて複数の周波数帯
域に分割される。この分割方式としては、フーリエ変換
等の周波数変換やバンドパスフィルタバンク等がある。
周波数変換のときは、変換によって得られる複数の周波
数成分によって周波数帯域が構成されるものとする。
【0047】周波数帯域信号はビット配分部3と量子化
部4に入力される。ビット配分部3では、後述するよう
に、周波数帯域信号より量子化ビット数を求め、その情
報を量子化部4に送り、量子化部4ではこの情報を元に
周波数帯域信号を量子化し、符号化する。
【0048】このようにして得られた各周波数帯域信号
の符号とビット配分情報、ブロック長情報などの補助情
報(上記符号を復号化部で復号化するのに必要な情報
で、量子化、符号化の方式による)は、マルチプレクサ
5で多重化されて、符号列として伝送路6に送られる。
【0049】上記復号化部のデマルチプレクサ7は伝送
路6から符号列を取り込み、各周波数帯域信号の符号と
ビット配分情報、ブロック長情報などの補助情報に分解
する。そして、補助情報を使って各周波数帯域信号の符
号を復号化し、逆量子化部7でビット配分情報などの補
助情報に基づき逆量子化して周波数帯域信号に復元す
る。この信号は周波数帯域合成部9にて合成され、これ
によりディジタル出力信号が得られる。
【0050】次に、上記符号化部のビット配分部3の働
きを詳細に述べる。
【0051】まず、決定されたブロック長を持つディジ
タル入力信号について、パワー計算部31で各周波数帯
域のパワーSjiを求める。ここで、iは周波数帯域を区
別するためのインデックス(0以上の整数)とする。
【0052】次に、マスキング閾値計算部32で、図2
のフローチャートに従って、上記決定されたブロック長
に応じて最適の聴覚心理特性を採用して、各周波数帯域
のマスキング閾値Mjiを求める。すなわち、まず上記決
定されたブロック長が長いか短いかを判断する(S
1)。ブロック長が長いときは、聴覚心理特性として例
えば同時マスキングを用いて、公知の方法により、マス
キングレベルを計算する(S2)。例えば図17(a)に
示すように、まずディジタル入力信号をフーリエ変換し
てフーリエ係数の絶対値(ヒストグラムで示す)を求め
る。なお、図中、縦方向に延びる各破線は臨界帯域、す
なわち人間が聴覚で周波数分析を行っていると仮定した
場合の分析単位となる帯域A1,A2,…,A7の境界を
示している。次に、同図(b)に示すように、各臨界帯域
1,A2,…,A7内のフーリエ係数の2乗和を各臨界
帯域のパワーSA1,SA2,…,SA7として求めると
ともに、このパワーSA1,SA2,…,SA7を各臨界
帯域A1,A2,…,A7の上端に置く。次に、各臨界帯
域のパワーSA1,SA2,…,SA7を最小可聴限Yと
比較して、最小可聴限Yよりも大きいパワーをそのまま
残す一方、最小可聴限Yより小さいパワーを0とする。
この例では、パワーSA7がマスクされて0となってい
る。そして、図18に示すように、残された各臨界帯域
のパワーSA1,SA2,…,SA6の箇所(各臨界帯域
1,A2,…,A7の上端)に各パワーの値に依存した
高さのピークを持つマスキング曲線Mp(破線で示す)
を求める。一方、ブロック長が短いときは、聴覚心理特
性として例えば継時マスキングを用いて、公知の方法に
より、マスキングレベルを計算する(S3)。すなわ
ち、ステップS2と同様に、ディジタル入力信号をフー
リエ変換してフーリエ係数の絶対値を求め、さらに各臨
界帯域A1,A2,…,A7内のフーリエ係数の2乗和を
各臨界帯域のパワーSA1,SA2,…,SA7として求
める。図20はk番目の臨界帯域Akにおいて、一定周
期でパワーSAkの値をサンプリングしたときの状態を
示している。この図20において、各サンプリング箇所
(時間t)に各サンプリング時間tのパワーSAkに依
存した高さのピークを持つマスキング曲線Mc(破線で
示す)を求める。このとき、高いピークに隠れる低いピ
ーク(1点鎖線で示す)は無視する。最小可聴限Ykは
時間tの方向に一定である。次に、ステップS2または
S3で得られたマスキングレベルと最小可聴限との大小
を比較して(S4)、大きい方をマスキング閾値とする
(S5,S6)。すると、例えば図19に示すように、
各臨界帯域のパワーによるマスキング曲線Mpと最小可
聴限Yとの包絡線がトータルのマスキング曲線Mとして
得られる。なお、ブロック長に基づいて採用する聴覚心
理特性は、この例の外に様々なパターンや程度が考えら
れる。
【0053】次に、図1に示すSMR計算部33で各周
波数帯域毎の信号対マスキング閾値比Pjiを次式より求
める。
【0054】 Pji=Sji/Mji …(1) なお、PjiはSMRとも表され、各周波数帯域のフーリ
エ係数とマスキング曲線(閾値)との比である。例えば
図21に示すように、対数グラフでは、各周波数帯域の
フーリエ係数の絶対値がマスキング閾値Mを超えた部分
(実線部分)の長さが正のSMRに相当する。
【0055】次に、MNR計算部34で各周波数帯域毎
のマスキング閾値対雑音比Rji(m)を求めながら、各周
波数帯域の量子化ビット数mを決定する。マスキング閾
値対雑音比Rji(m)は次式で求める。
【0056】 Rji(m)=Q(m)/Pji …(2) ここで、Q(m)は、周波数帯域をmビットで量子化した
時の信号対量子化雑音パワー比Q(m)である。このQ
(m)はSji/N(m)でも計算できるが、信号の特性を利
用した統計処理により予め求めておくことができる。N
(m)はmビットで量子化した時の量子化雑音パワーであ
る。
【0057】次に、ビット配分計算部35で、図3のフ
ローチャートに従って、各サブブロック、各周波数帯域
の量子化ビット数mを決定する。ここで、配分可能な量
子化ビット数の総数をBとする。まず、S11にて初期
化を行う。つまり、今までのビット配分総数を示す変数
bに0を入れるとともに、各サブブロック、各周波数帯
域の量子化ビット数をmjiとし、0を入れておく。次に
S12で、式(2)を用いてRji(mji)を計算する。S1
3で最小のRji(mji)を探し出し(このときの周波数
帯域のインデックスj,iをJ,Iとする)、S14で、
JIに1(もし、mJIが0であったら最低量子化ビット
数(通常は2))を加える。そして、このときのRJI(m
JI)を式(2)を用いて更新する。また、変数bに今JI
に配分したビット数と同じ数を加える。つまり、(周波
数帯域JIに含まれる量子化の対象信号の数)×1(m
JIが0なら最小量子化ビット数2)を変数bに加える。
S15では、変数bが配分可能の量子化ビット数の総数
Bと等しくなったかどうかをチェックする。もし、等し
くなければS12に戻ってビット配分を継続する一方、
等しければビット配分を終了する。これを、すべてのサ
ブブロックにわたって繰り返す。つまり、長いブロック
長の場合はj=0のみ行い、短いブロック長の場合はj
=0〜7について繰り返す。
【0058】このように、この符号化復号化装置では、
ブロック長決定部1によって入力信号の変化の程度に応
じてブロック長を決定し、この決定されたブロック長の
長短に応じて、マスキング閾値計算部32によって聴覚
心理特性を選択しているので、ブロック長が長いとき
は、聴覚心理特性として計算量が多いがマスキング効果
が大きいものを採用できる一方、ブロック長が短いとき
は、聴覚心理特性として継時マスキングのみを適用する
ことにより、計算量の削減を図ることができる。つま
り、計算量とマスキング閾値精度との二律背反の関係を
克服して、常に最適の聴覚心理特性を採用して量子化誤
差を低減することができる。したがって、高音質な再生
音を得ることができる。
【0059】図4は第2実施例の符号化復号化装置のブ
ロック構成を示している。
【0060】この符号化復号化装置は、周波数帯域分割
部101、ビット配分部102、量子化部103および
マルチプレクサ104からなる符号化部と、伝送路10
5と、デマルチプレクサ106、逆量子化部107およ
び周波数帯域合成部108からなる復号化部とを備えて
いる。上記ビット配分部102には、パワー計算部12
1と、マスキング閾値計算部122と、SMR(信号対
マスキング閾値比)計算部123と、MNR(マスキン
グ閾値対雑音比)計算部124と、最大ビット数決定部
125と、ビット配分計算部126が含まれている。伝
送路105は、無線系、有線系または蓄積系のものであ
る。
【0061】説明の便宜上、まず、この符号化復号化装
置全体の働きを述べ、続いて、上記符号化部のビット配
分部102の働きを述べる。
【0062】この例では、各構成部において、数ミリか
ら数十ミリ秒程度の時間(フレーム)単位で、ビットの
配分、量子化、符号化などの処理が行われるものとす
る。
【0063】ディジタル入力信号は、周波数帯域分割部
101にて複数の周波数帯域に分割される。この分割方
式としては、フーリエ変換等の周波数変換やバンドパス
フィルタバンク等がある。周波数変換のときは、変換に
よって得られる複数の周波数成分によって周波数帯域が
構成されるものとする。
【0064】周波数帯域信号はビット配分部102と量
子化部103に入力される。ビット配分部102では、
後述するように、周波数帯域信号より量子化ビット数を
求め、その情報を量子化部103に送り、量子化部10
3ではこの情報を元に周波数帯域信号を量子化し、符号
化する。
【0065】このようにして得られた各周波数帯域信号
の符号とビット配分情報などの補助情報(上記符号を復
号化部で復号化するのに必要な情報で、量子化、符号化
の方式による)は、マルチプレクサ104で多重化さ
れ、符号列として伝送路105に送られる。
【0066】上記復号化部のデマルチプレクサ106は
伝送路105から符号列を取り込み、各周波数帯域信号
の符号とビット配分情報などの補助情報に分解する。そ
して、補助情報を使って各周波数帯域信号の符号を復号
化する。逆量子化部107でビット配分情報などの補助
情報に基づき逆量子化して周波数帯域信号に復元する。
この信号は周波数帯域合成部108にて合成され、これ
によりディジタル出力信号が得られる。
【0067】次に、上記符号化部のビット配分部102
の働きを詳細に述べる。
【0068】ディジタル入力信号について、パワー計算
部121でフレーム内の各周波数帯域のパワーSiを求
め、マスキング閾値計算部122でパワーSiを元に公
知の手段で各周波数帯域のマスキング閾値Miを求め
る。ここで、iは周波数帯域を区別するためのインデッ
クス(0以上の整数)とする。パワー計算部121で
は、さらに全帯域のパワーSp(=ΣSi)を求める。次
に、SMR計算部123で各周波数帯域毎の信号対マス
キング閾値比(SMR)Piを次式より求める。
【0069】 Pi=Si/Mi …(101) ここで、Siの代わりに周波数帯域iの信号帯域の中での
最大振幅値の2乗を使うこともある。そして、MNR計
算部124で各周波数帯域毎のマスキング閾値対雑音比
(MNR)Ri(m)を求める。ビット配分計算部126
はMNR計算部124で求めたマスキング閾値対雑音比
(MNR)Ri(m)を使って、各周波数帯域の量子化ビ
ット数mを決定する。マスキング閾値対雑音比(MN
R)Ri(m)は次式で求める。
【0070】 Ri(m)=Q(m)/Pi …(102) ここで、Q(m)は、周波数帯域をmビットで量子化した
時の信号対量子化雑音パワー比(SNR)Q(m)であ
る。このQ(m)はSi/N(m)でも計算できるが、信号
の特性を利用した統計処理により予め求めておくことが
できる。N(m)はmビットで量子化した時の量子化雑音
パワーである。最大ビット数決定部125は、各周波数
帯域のパワーSiと全帯域パワーSpとを比較して、各周
波数帯域に配分できる最大のビット数を決定する。
【0071】上記ビット配分計算部126と最大ビット
数決定部125は、具体的には図5のフローチャートに
従って、各周波数帯域の量子化ビット数mを決定する。
ここで、各周波数帯域の信号の量子化、符号化に配分で
きるビット数の総数をB、各周波数帯域に配分できる最
大のビット数をLiとする。
【0072】まず、S101で、最大ビット数決定部1
25は、後述する決定方法により、各周波数帯域のパワ
ーSiの大きさに基づいて、各周波数帯域に配分できる
最大のビット数Liを決定する。次に、S102にて、
ビット配分計算部126の初期化を行う。すなわち、今
までのビット配分総数を示す変数bに0を入れておく。
各周波数帯域の量子化ビット数をmiとし、0を入れて
おく。次に、S103で、MNR計算部124にて式
(102)を使ってRi(mi)を計算する。次に、S104
で、最小のRi(mi)を探し出す(このときの周波数帯
域のインデックスiをIとする)。次に、S105で、
Iに1(もし、mIが0であったら最低量子化ビット数
(通常は2))を加える。この結果mI=LIとなったか
どうかをチェックして、mI=LIとなった場合は、この
後、上記周波数帯域IはS104での探索対象から除外
する。さらに、MNR計算部124にてRI(mI)を式
(102)を使って更新する。また、変数bに今周波数帯
域Iに配分したビット数と同じ数を加える。つまり、
(周波数帯域Iに含まれる量子化の対象信号の数)×1
(mIが0なら最小量子化ビット数2)を変数bに加え
る。次に、S106では、変数bが配分可能の量子化ビ
ット数の総数Bと等しくなったかどうかをチェックす
る。もし、等しくなければS104に戻ってビット配分
を継続する一方、等しければビット配分を終了する。
【0073】上記最大ビット数決定部125は、各周波
数帯域のパワーSiの大きさに基づいて、次のいずれか
の決定方法により各周波数帯域に配分できる最大のビッ
ト数Liを決定する。
【0074】第1の決定方法では、各周波数帯域に配分
できる最大のビット数Liを、周波数帯域iのパワーSi
と先にパワー計算部121で求めた全帯域のパワーSp
との比Fiから求める。すなわち、 Fi=Si/Sp を求め、このFiが小さいほど各周波数帯域の最大のビ
ット数Liを少なくするように決定する。ここで、Fiと
Liとの対応関係を図6に例示する。図6で、縦軸Liの
16という数は元々の量子化の最大ビット数である。ま
た、横軸Fiのa0、a2、a3、a4はそれぞれ最大のビ
ット数Liの0、2、3、4ビットの閾値であり、0か
ら1までの値を取る。a0、a2、a3、a4が1に近付く
ほど制限が厳しくなることを意味する。a0の値として
0に近い値にしておけば、周波数帯域分割部101にお
いてその分割計算上で生じた誤差信号に対してビット配
分せずに済ませる一方、通常の微小信号には(上限はあ
るが)ビット配分を行うことができる。この決定方法
は、入力信号が大きいときに、パワーSiが小さい周波
数帯域へのビット配分を制限する効果が大きい。しか
し、入力信号が小さく全体のパワーSp自身が小さいと
きは、ほとんどのFiが閾値a0、a2、a3、a4よりも
大きくなるため、実質上ビット配分が制限されない可能
性がある。
【0075】第2の決定方法では、各周波数帯域に配分
できる最大のビット数Liを、周波数帯域iのパワーSi
自身を使って求める。このとき、SiとLiとの対応関係
は図6において横軸のFiをSiに置き換えたものとな
る。当然閾値a0、a2、a3、a4の単位はSiと同じで
ある。この決定方法は入力信号が小さいときに、パワー
Siが小さい周波数帯域へのビット配分を制限する効果
が大きい。しかし、入力信号が大きいときは、ほとんど
のSiが閾値a0、a2、a3、a4よりも大きくなるた
め、実質上ビット配分が制限されない可能性がある。
【0076】そこで、第3の決定方法では、各周波数帯
域に配分できる最大のビット数Liを、上記第1,第2
の決定方法を組み合わせて決定する。すなわち、まず、
周波数帯域iにおいて、第1の決定方法(Fiによる方
法)にてLiを決定し、もし、Liに制限値(図6の例で
あれば4以下の数値)が入っていなければ、引続き第2
の決定方法(Siによる方法)にてLiを決定する。これ
により、入力信号の大小にかかわらず、パワーSiが小
さい周波数帯域へのビット配分を有効に制限することが
できる。なお、第2の決定方法(Siによる方法)を先
に行い、第1の決定方法(Fiによる方法)を後に行う
こともできる。
【0077】このように、この符号化復号化装置は、複
数の周波数帯域のうちパワーSiが大きい周波数帯域
(便宜上I1とする)から離れたパワーSiが小さい周波
数帯域(便宜上I2とする)に対して、マスキング閾値
対雑音比(MNR)Ri(m)の大小にかかわらず、配分
できる最大ビット数Liを制限することができる。した
がって、正弦波信号が入力された時、正弦波信号が含ま
れる周波数帯域I1から離れたパワーが小さい周波数帯
域I2の最大ビット数を有効に制限できる。つまり、M
NR計算部124にて求めたマスキング閾値対雑音比
(MNR)が同程度であっても、パワーが小さい周波数
帯域I2には上記制限された最大ビット数Li分のビット
数を超える配分が行われない。この結果、上記パワーが
小さい周波数帯域I2に配分されたであろうビット数
が、他の周波数帯域、特に正弦波信号の含まれる周波数
帯域I1に配分される。したがって、上記正弦波信号を
復号化したとき、従来に比して量子化誤差を少なくで
き、音質を高めることができる。
【0078】ここで、もし、最大ビット数決定部125
での制限が厳しい場合、パワーSiが小さい周波数帯域
において、マスキング閾値対雑音比(MNR)RI(mI)
が1より小さい値のままでビット配分が終わってしまう
可能性がある。このとき、この周波数帯域で量子化誤差
が知覚される恐れがある。
【0079】そこで、上記ビット配分計算部126と最
大ビット数決定部125は、図7のフローチャートに従
って、各周波数帯域の量子化ビット数mを決定するよう
にしても良い。すなわち、S111〜S114まで図5
のS101〜S104と全く同様に処理を進めた後、S
115で、ビット配分計算部126により、RI(mI)が
1を超えたかどうかをチェックする。RI(mI)≦1であ
ればビット配分中はm IはLIの制限を受けないようにす
る。そして、RI(mI)>1となったときに、mIとLI
の大小を比較する。mI≧LIとなった場合は、この後、
上記周波数帯域IはS114での探索対象から除外す
る。さらに、MNR計算部124にてRI(mI)を式(1
02)を使って更新する。また、変数bに今周波数帯域
Iに配分した分と同じビット数を加える。次に、S11
6では、変数bが配分可能の量子化ビット数の総数をB
と等しくなったかどうかをチェックする。もし、等しく
なければS114に戻ってビット配分を継続する一方、
等しければビット配分を終了する。
【0080】このようにした場合、元々最大ビット数の
制限を受ける周波数帯域ではマスキング閾値対雑音比が
1を超えるまでビット数の割り当てがなされ、マスキン
グ閾値が1を超えた時点で直ちにビット数の割り当てが
止まる。すなわち、最大ビット数を制限できる上、マス
キング閾値対雑音比(MNR)RI(mI)が1より小さい
値のままでビット配分が終わる可能性を解消できる。し
たがって、正弦波信号が含まれる周波数帯域I1の量子
化誤差を低減できる上、パワーが小さい周波数帯域I2
の量子化誤差を低減できる。したがって、復号化時の音
質を改善できる。
【0081】また、最大ビット数決定部125での制限
が厳しい場合、全ての周波数帯域のビット数がLiと等
しい(あるいは超えている)にもかかわらずb<Bとな
る可能性がある。つまり、各周波数帯域の最大ビット数
Liが小さいため、まだ配分できるビット数が余る恐れ
がある。
【0082】そこで、上記ビット配分計算部126と最
大ビット数決定部125は、図8のフローチャートに従
って、各周波数帯域の量子化ビット数mを決定するよう
にしても良い。すなわち、S121〜S125まで図5
のS101〜S105と全く同様に処理を進めた後、S
126にてbとBとの大小を比較する。B>bであれ
ば、S127にて全て周波数帯域のビット数miがLiと
等しくなっている(あるいは超えている)かどうかを調
べる。全ての周波数帯域でビット数miがLiと等しい
(あるいは超えている)ような状況が起きたときは、S
128で最大ビット数決定部125での制限を緩くして
Liを大きくする一方、ある周波数帯域でmi<Liであ
ればLiはそのままの大きさとして、再度S124に戻
る。処理を継続して、S126で変数bが配分可能の量
子化ビット数の総数Bと等しくなったときビット配分を
終了する。
【0083】このように、一通りビット配分した後、ま
だ配分できるビットが余っている場合、Liを大きくし
て再びビット配分するので、量子化ビット数の総数Bの
範囲内でビット配分を有効に行うことができる。上記制
限により本来のビット数より少ないビット数が割り当て
られたパワーが小さい周波数帯域I2に対して、少し余
分にビットを配分するので、この周波数帯域I2でのマ
スキング閾値対雑音比(MNR)を改善でき、復号化時
の音質を改善できる。なお、S125は図7のS115
でも良い。
【0084】図9は第3実施例の符号化復号化装置のブ
ロック構成を示している。
【0085】この符号化復号化装置は、周波数帯域分割
部201、ビット配分部202、量子化部203および
マルチプレクサ204からなる符号化部と、伝送路20
5と、デマルチプレクサ206、逆量子化部207およ
び周波数帯域合成部208からなる復号化部とを備えて
いる。上記ビット配分部202には、パワー計算部22
1と、マスキング閾値計算部222と、SMR(信号対
マスキング閾値比)計算部223と、MNR(マスキン
グ閾値対雑音比)計算部224と、パワー判定部225
と、ビット配分計算部226とが含まれている。伝送路
205は、無線系、有線系または蓄積系のものである。
【0086】説明の便宜上、まず、この符号化復号化装
置全体の働きを述べ、続いて、上記符号化部のビット配
分部202の働きを述べる。
【0087】この例では、各構成部において、数ミリか
ら数十ミリ秒程度の時間(フレーム)単位で、ビットの
配分、量子化、符号化などの処理が行われるものとす
る。
【0088】ディジタル入力信号は、周波数帯域分割部
201にて複数の周波数帯域に分割される。この分割方
式としては、フーリエ変換等の周波数変換やバンドパス
フィルタバンク等がある。周波数変換のときは、変換に
よって得られる複数の周波数成分によって周波数帯域が
構成されるものとする。
【0089】周波数帯域信号はビット配分部202と量
子化部203に入力される。ビット配分部202では、
後述するように、周波数帯域信号より量子化ビット数を
求め、その情報を量子化部203に送り、量子化部20
3ではこの情報を元に周波数帯域信号を量子化し、符号
化する。
【0090】このようにして得られた各周波数帯域信号
の符号とビット配分情報などの補助情報(上記符号を復
号化部で復号化するのに必要な情報で、量子化、符号化
の方式による)は、マルチプレクサ204で多重化さ
れ、符号列として伝送路205に送られる。
【0091】上記復号化部のデマルチプレクサ206は
伝送路205から符号列を取り込み、各周波数帯域信号
の符号とビット配分情報などの補助情報に分解する。そ
して、補助情報を使って各周波数帯域信号の符号を復号
化する。逆量子化部207でビット配分情報などの補助
情報に基づき逆量子化して周波数帯域信号に復元する。
この信号は周波数帯域合成部208にて合成され、これ
によりディジタル出力信号が得られる。
【0092】次に、上記符号化部のビット配分部202
の働きを詳細に述べる。
【0093】ディジタル入力信号について、パワー計算
部221でフレーム内の各周波数帯域のパワーSiを求
め、マスキング閾値計算部222でパワーSiを元に公
知の手段で各周波数帯域のマスキング閾値Miを求め
る。ここで、iは周波数帯域を区別するためのインデッ
クス(0以上の整数)とする。パワー計算部221で
は、さらに全帯域のパワーSp(=ΣSi)を求める。次
に、SMR計算部223で各周波数帯域毎の信号対マス
キング閾値比(SMR)Piを次式より求める。
【0094】 Pi=Si/Mi …(201) ここで、Siの代わりに周波数帯域iの信号帯域の中での
最大振幅値の2乗を使うこともある。そして、MNR計
算部224で各周波数帯域毎のマスキング閾値対雑音比
(MNR)Ri(m)を求める。ビット配分計算部226
はMNR計算部224で求めたマスキング閾値対雑音比
(MNR)Ri(m)を使って、各周波数帯域の量子化ビ
ット数mを決定する。マスキング閾値対雑音比(MN
R)Ri(m)は次式で求める。
【0095】 Ri(m)=Q(m)/Pi …(202) ここで、Q(m)は、周波数帯域をmビットで量子化した
時の信号対量子化雑音パワー比(SNR)Q(m)であ
る。このQ(m)はSi/N(m)でも計算できるが、信号
の特性を利用した統計処理により予め求めておくことが
できる。N(m)はmビットで量子化した時の量子化雑音
パワーである。パワー判定部225は、各周波数帯域の
パワーSiと全帯域パワーSpとを比較して、各周波数帯
域のパワーSiがある閾値より大きいと判定した時、そ
の周波数帯域に必ずビット配分する。
【0096】上記ビット配分計算部226とパワー判定
部225は、具体的には図10のフローチャートに従っ
て、各周波数帯域の量子化ビット数mを決定する。ここ
で、各周波数帯域の信号の量子化、符号化に配分できる
ビット数の総数をBとする。
【0097】まず、S201にて、ビット配分計算部2
26の初期化を行う。すなわち、今までのビット配分総
数を示す変数bに0を入れておく。各周波数帯域の量子
化ビット数をmiとし、0を入れておく。次に、S20
2にて、パワー判定部225は、 Si>aSp (ただし、aは0<a<1を満たす
定数) となる周波数帯域iについてはmiに最低量子化ビット
数(通常は2)を割り当てる。つまり、mi=2とす
る。この不等式は、全帯域のパワーSpに対して、ある
周波数帯域のパワーSiがどの程度大きいかを調べるも
のであり、aはそのパワーの程度を表す定数である。こ
の不等式よりパワーSiが大きい周波数帯域は、マスキ
ング閾値対雑音比(MNR)の大小にかかわらず、必ず
ビット配分されることになる。そして、変数bに今周波
数帯域iに配分したビット数と同じ数を加える。つま
り、(その周波数帯域iに含まれる量子化の対象信号の
数)×2ビットを変数bに加える。この2ビットは最低
量子化ビット数を意味している。次に、S203で、M
NR計算部224にて式(202)を使ってでRi(mi)を
計算する。次に、S204で、最小のRi(mi)を探し
出し(このときの周波数帯域のインデックスiをIとす
る)、S205で、mIに1(もし、mIが0であったら
最低量子化ビット数(通常は2))を加える。そして、
このときのRI(mI)をMNR計算部224にて式(20
2)を用いて更新する。また、変数bに今周波数帯域I
に配分したビット数と同じ数を加える。つまり、(周波
数帯域Iに含まれる量子化の対象信号の数)×1(mI
が0なら最小量子化ビット数2)を変数bに加える。S
206では、変数bが配分可能の量子化ビット数の総数
Bと等しくなったかどうかをチェックする。もし、等し
くなければS204に戻ってビット配分を継続する一
方、等しければビット配分を終了する。
【0098】このように、この符号化復号化装置は、パ
ワー判定部225によって、各周波数帯域のパワーSi
の全帯域のパワーSpに対する比率を判定して、この判
定結果に基づいて、一定比率a以上のパワーSiを持つ
周波数帯域(便宜上I4とする)に少なくとも最低量子
化ビット数を割り当てて、必ずビット配分を行ってい
る。すなわち、他の周波数帯域(便宜上I3とする)の
パワーの影響によって、一定比率a以上のパワーSiを
持つ周波数帯域I4が完全に削除されるようなことがな
い。したがって、従来と異なり、聴覚特性に優れた人に
も違和感を持たせなくて済み、高音質の再生音を提供す
ることができる。
【0099】図11は第4実施例の符号化復号化装置の
ブロック構成を示している。
【0100】この符号化復号化装置は、周波数帯域分割
部301、ビット配分部302、量子化部303および
マルチプレクサ304からなる符号化部と、伝送路30
5と、デマルチプレクサ306、逆量子化部307およ
び周波数帯域合成部308からなる復号化部とを備えて
いる。上記ビット配分部302には、パワー計算部32
1と、マスキング閾値計算部322と、SMR(信号対
マスキング閾値比)計算部323と、MNR(マスキン
グ閾値対雑音比)計算部324と、予備ビット数保存部
325と、ビット配分計算部326とが含まれている。
伝送路305は、無線系、有線系または蓄積系のもので
ある。
【0101】説明の便宜上、まず、この符号化復号化装
置全体の働きを述べ、続いて、上記符号化部のビット配
分部302の働きを述べる。
【0102】この例では、各構成部において、数ミリか
ら数十ミリ秒程度の時間(フレーム)単位で、ビットの
配分、量子化、符号化などの処理が行われるものとす
る。
【0103】ディジタル入力信号は、周波数帯域分割部
301にて複数の周波数帯域に分割される。この分割方
式としては、フーリエ変換等の周波数変換やバンドパス
フィルタバンク等がある。周波数変換のときは、変換に
よって得られる複数の周波数成分によって周波数帯域が
構成されるものとする。
【0104】周波数帯域信号はビット配分部302と量
子化部303に入力される。ビット配分部302では、
後述するように、周波数帯域信号より量子化ビット数を
求め、その情報を量子化部303に送り、量子化部30
3ではこの情報を元に周波数帯域信号を量子化し、符号
化する。
【0105】このようにして得られた各周波数帯域信号
の符号とビット配分情報などの補助情報(上記符号を復
号化部で復号化するのに必要な情報で、量子化、符号化
の方式による)は、マルチプレクサ304で多重化さ
れ、符号列として伝送路305に送られる。
【0106】上記復号化部のデマルチプレクサ306は
伝送路305から符号列を取り込み、各周波数帯域信号
の符号とビット配分情報などの補助情報に分解する。そ
して、補助情報を使って各周波数帯域信号の符号を復号
化する。逆量子化部307でビット配分情報などの補助
情報に基づき逆量子化して周波数帯域信号に復元する。
この信号は周波数帯域合成部308にて合成され、これ
によりディジタル出力信号が得られる。この後、図示し
ない再生装置で、特定の周波数帯域が最大E[dB]だけ
強調されるものとする。
【0107】次に、上記符号化部のビット配分部302
の働きを詳細に述べる。
【0108】ディジタル入力信号について、パワー計算
部321でフレーム内の各周波数帯域のパワーSiを求
め、マスキング閾値計算部322でパワーSiを元に公
知の手段で各周波数帯域のマスキング閾値Miを求め
る。ここで、iは周波数帯域を区別するためのインデッ
クス(0以上の整数)とする。パワー計算部321で
は、さらに全帯域のパワーSp(=ΣSi)を求める。次
に、SMR計算部323で各周波数帯域毎の信号対マス
キング閾値比(SMR)Piを次式より求める。
【0109】 Pi=Si/Mi …(301) ここで、Siの代わりに周波数帯域iの信号帯域の中での
最大振幅値の2乗を使うこともある。そして、MNR計
算部324で各周波数帯域毎のマスキング閾値対雑音比
(MNR)Ri(m)を求める。ビット配分計算部326
はMNR計算部324で求めたマスキング閾値対雑音比
(MNR)Ri(m)を使って、各周波数帯域の量子化ビ
ット数mを決定する。マスキング閾値対雑音比(MN
R)Ri(m)は次式で求める。
【0110】 Ri(m)=Q(m)/Pi …(302) ここで、Q(m)は、周波数帯域をmビットで量子化した
時の信号対量子化雑音パワー比(SNR)Q(m)であ
る。このQ(m)はSi/N(m)でも計算できるが、信号
の特性を利用した統計処理により予め求めておくことが
できる。N(m)はmビットで量子化した時の量子化雑音
パワーである。例えば、量子化誤差の分布が量子化幅の
間で一様であれば、 Q(m)=6m[dB] …(303) とすることができる。N(m)はmビットで量子化した時
の量子化雑音パワーである。予備ビット数保存部325
は、予めビット数Bpを持っており、ビット配分計算部
326でのビットの配分が終了した時点で、強調される
特定の周波数帯域Isのビット数にこのBpを足す。この
Bpの値としては、特定の周波数帯域Isを強調すること
により増加する量子化誤差の増加を抑えるだけの値とす
る。例えば、式(303)で規定した信号対量子化雑音パ
ワー比(SNR)Q(m)=6[dB]を使うものとする
と、最大E[dB]の強調が行われるとき、E/6に最も
近いか等しい最小の整数値をBpとする。
【0111】上記ビット配分計算部326と予備ビット
数保存部325は、具体的には、図12のフローチャー
トに従って、各周波数帯域の量子化ビット数mを決定す
る。各周波数帯域の信号の量子化、符号化に配分できる
ビット数の総数をBとする。詳しくは、元々のビット数
の総数のうち、予備ビット数保存部325で保存してい
るビット数の分Bp×(周波数帯域Isに含まれる量子化
の対象信号の数)を除いたものをビット数の総数Bとす
る。
【0112】まず、S301にて、ビット配分計算部3
26の初期化を行う。すなわち、今までのビット配分総
数を示す変数bに0を入れておく。各周波数帯域の量子
化ビット数をmiとし、0を入れておく。次に、S30
2で、式(302)を使ってRi(mi)を計算する。次に、
S303で、MNR計算部324にて最小のRi(mi)
を探し出す(このときの周波数帯域のインデックスiを
Iとする)。次に、S304で、mIに1(もし、mI
0であったら最小量子化ビット数(通常は2))を加え
る。さらに、MNR計算部324にてRI(mI)を式(3
02)を使って更新する。また、変数bに今周波数帯域
Iに配分したビット数と同じ数を加える。つまり、(周
波数帯域Iに含まれる量子化の対象信号の数)×1(m
Iが0なら最小量子化ビット数2)を変数bに加える。
次に、S305では、変数bが配分可能の量子化ビット
数の総数Bと等しくなったかどうかをチェックする。も
し、等しくなければS303に戻ってビット配分を継続
する一方、等しければS306に進む。S306では、
特定の周波数帯域Isのビット数mIsに、予備ビット数
保存部325で保存しているビット数Bpを加算する。
すなわち、特定の周波数帯域Isにビット数を余分に配
分して、ビット配分を終了する。
【0113】このように、この符号化復号化装置は、強
調される特定の周波数帯域Isに、予備ビット数保存部
325で保存しているビット数Bpを余分に配分するの
で、この余分に配分されたビット数に対応して上記周波
数帯域Isの量子化誤差が小さくなる。逆に言えば、再
生で強調された後の上記周波数帯域Isの量子化誤差の
大きさは、ビット数が通常に配分され再生で強調されな
かった場合の量子化誤差の大きさを超えることはない。
これは、先に述べたように、最大E[dB]の強調が行わ
れるとき、BpをE/6に最も近いか等しい最小の整数
値に設定したからである。この結果、量子化誤差がマス
キング閾値を超えるのを防止でき、量子化誤差が知覚さ
れるのを防止することができる。
【0114】なお、当然ながら、強調される周波数帯
域、すなわちビット数Bpを余分に配分すべき周波数帯
域Isは、1つに限られるものではなく、複数であって
も良い。
【0115】ここで、上の例では、強調される周波数帯
域Isに信号成分が無い場合であっても、必ずこの周波
数帯域Isにビットが配分される。また、強調しても他
の周波数帯域の信号に上記周波数帯域Isの信号自身あ
るいは量子化誤差がマスクされてしまう場合であって
も、必ずこの周波数帯域にビットが配分される。このた
め、ビット配分に無駄が生じる可能性がある。
【0116】そこで、図11の予備ビット数保存部32
5は、ビット数を保存する代わりに、再生で強調される
値自身Eを持つこととしても良い。具体的には、上記ビ
ット配分計算部326と予備ビット数保存部325は、
図13のフローチャートに従って、各周波数帯域の量子
化ビット数を決定する。すなわち、まず、S310にお
いて、SMR計算部322にて強調される特定の周波数
帯域Isの信号対マスキング閾値比(SMR)PIsに、
予備ビット数保存部325で保存している値Eをデシベ
ル換算で加算する。この後、S311からS315ま
で、図12のS301からS305までと同じ処理を行
ってビット配分を行う。なお、各周波数帯域の信号の量
子化、符号化に配分できるビット数の総数をBとする。
上の例と違って、余分に配分するビット数は考慮しな
い。
【0117】このようにした場合、上記周波数帯域Is
は、信号対マスキング閾値比(SMR)PIsの増加分E
によって、ビット配分されやすくなる。ビット数が余分
に配分されたとき、それに対応して上記周波数帯域Is
の量子化誤差が小さくなる。この結果、上の例と同様
に、量子化誤差がマスキング閾値を超えるのを防止で
き、量子化誤差が知覚されるのを防止することができ
る。しかも、この例でのビット配分は、全周波数帯域の
信号対マスキング閾値比(SMR)のバランスを考慮し
たものであり、単純に強調分Eに相当したビット数を配
分するものではない。もし、強調される周波数帯域Is
に信号成分が無い場合は、信号対マスキング閾値比(S
MR)PIsはデシベル換算で元々負の無限大かそれに相
当する値となっているので、強調による加算は無視され
て、この周波数帯域Isにビット配分されることはな
い。したがって、ビット配分の無駄をなくすことができ
る。また、強調しても他の周波数帯域の信号に上記周波
数帯域Isの信号自身あるいは量子化誤差がマスクされ
てしまう場合は、他のマスキングされない周波数帯域に
比べ、ビット配分する前のS312でのマスキング閾値
対雑音比(MNR)RIs(0)が大きな値となる(もちろ
ん強調される前の値よりは小さな値であるが、まだマス
キングされない周波数帯域のMNRに比べると大きい)
ので、この周波数帯域Isにはビット配分されにくくな
る。したがって、強調による無駄なビット配分を防ぐこ
とができる。
【0118】なお、上記第1実施例乃至第4実施例の特
長のうち2つ以上の特長を同一の符号化復号化装置に具
備させることもできる。
【0119】図15は、上記第1実施例乃至第4実施例
の特長のすべてを具備した第5実施例の符号化復号化装
置のブロック構成を示している。
【0120】この符号化復号化装置は、ブロック長決定
部401、周波数帯域分割部402、ビット配分部40
3、量子化部404およびマルチプレクサ405からな
る符号化部と、伝送路406と、デマルチプレクサ40
7、逆量子化部408および周波数帯域合成部409か
らなる復号化部とを備えている。上記ビット配分部40
3には、パワー計算部431と、マスキング閾値計算部
432と、SMR計算部433と、MNR計算部434
と、ビット配分計算部435と、最大ビット数決定部4
36と、パワー判定部437と、予備ビット数保存部4
38とが含まれている。これらの各要素は、それぞれ同
一名称の要素、すなわち第1実施例(図1)のブロック
長決定部1、周波数帯域分割部2、ビット配分部3、量
子化部4、マルチプレクサ5、伝送路6、デマルチプレ
クサ7、逆量子化部8、周波数帯域合成部9、パワー計
算部31、マスキング閾値計算部32、SMR計算部3
3、MNR計算部34、ビット配分計算部35、第2実
施例(図4)の最大ビット数決定部125、第3実施例
(図9)のパワー判定部225、第4実施例(図11)
の予備ビット数保存部325と同一か類似の働きをす
る。この内、全く同一の働きをするものについては説明
を省略する。最大ビット数決定部436は、第2実施例
の最大ビット数決定部125に対してさらにブロックj
も考慮したもので、ブロックjの周波数帯域iにおける
最大ビット数Ljiを第2実施例の最大ビット数決定部1
25と同じ方法で決定する。パワー判定部437も同様
に、ブロックjも考慮して、第3実施例のパワー判定部
225と同じ方法でブロックjの周波数帯域iにビット
をあらかじめ配分するかどうかを決定する。
【0121】次に、ビット配分部403のビット配分計
算部435がどのように各ブロックjの各周波数帯域i
の量子化ビット数mjiを決定するかを図16のフローチ
ャートに従って説明する。ここで、各ブロック、周波数
帯域の信号の量子化、符号化に配分できるビット数の総
数をBとする。詳しくは、元々のビット数の総数のう
ち、予備ビット数保存部438で保存しているビット数
の分Bp×(周波数帯域Isに含まれる量子化の対象信号
の数)×ブロック数を除いたものをビット数の総数す
る。
【0122】まず、S401にて、最大ビット数決定部
436は、各ブロック各帯域のパワーSjiに基づいて、
各ブロックの各周波数帯域に配分できる最大のビット数
Ljiを第2実施例で述べた方法によって決定する。次
に、S402にてビット配分計算部435の初期化を行
う。すなわち、今までのビット配分総数を示す変数bに
0を入れておく。また、各ブロックの各周波数帯域の量
子化ビット数をmjiとし、0を入れておく。次に、S4
03にて、パワー判定部437は、 Sji>aSp (ただし、aは0<a<1を満たす定
数) となるブロックjの周波数帯域iについてmjiに最低量
子化ビット数(通常は2)を割り当てる。つまり、mji
=2とする。次に、S404で、MNR計算部434に
て式(2)を使ってRji(mji)を計算する。次にS4
05で、最小のRji(mji)を探し出し(このときのブ
ロック、周波数帯域のインデックスj,iをそれぞれ
J,Iとする)、S406でmJIに1(もし、mJIが0
であったら最低量子化ビット数(通常は2))を加え
る。この結果、mJI=LJIとなったかどうかをチェック
して、mJI=LJIとなった場合は、この後、上記ブロッ
クJの周波数帯域IはS405での探索対象から除外す
る。さらに、MNR計算部434にてRJI(mJI)を式
(2)を使って更新する。また、変数bに今ブロックJ
の周波数帯域Iに配分したビット数と同じ数を加える。
つまり、(ブロックJの周波数帯域Iに含まれる量子化
の対象信号の数)×1(mJIが0なら最低量子化ビット
数2)を変数bに加える。次に、S407では、変数b
が配分可能のビット数の総数Bと等しくなったかどうか
をチェックする。もし、等しくなければS405に戻っ
てビット配分を継続する一方、等しければS408に進
む。S408では、各ブロックの特定の周波数帯域Is
のビット数mjIsに予備ビット数保存部438で保存し
ているビット数Bpを加算する。すなわち、特定の周波
数帯域Isにビット数を余分に配分して、ビット配分を
終了する。
【0123】このように、この符号化復号化装置では、
第1実施例乃至第4実施例の特長を少しも犠牲にするこ
となく、すべて生かすことができる。すなわち、第1
に、ブロック長の長短に応じて、異なる聴覚心理特性を
採用しているので、ブロック長が長いときには、計算量
が多いがマスキング効果の大きい聴覚心理特性、例えば
同時マスキングを適用できる一方、ブロック長が短いと
きには、マスキング効果が小さいが計算量が少ない聴覚
心理特性、例えば継時マスキングを適用できる。つま
り、計算量とマスキング閾値の精度という二律排反の関
係を克服でき、常に最適の聴覚心理特性を採用できる。
第2に、各周波数帯域に配分される最大ビット数を各周
波数帯域毎に制限するので、複数の周波数帯域のうちパ
ワーが大きい周波数帯域I1から離れたパワーが小さい
周波数帯域I2に対して、マスキング閾値対雑音比(M
NR)の大小にかかわらず、配分できる量子化ビットの
最大数を制限できる。したがって、パワーが小さい周波
数帯域I2に配分されたであろうビット数を、他の周波
数帯域、特に正弦波信号の含まれる周波数帯域I1によ
り多く配分できる。第3に、全周波数帯域のパワーに対
して一の周波数帯域のパワーが一定比率a以上であるか
どうかを判断して、この比率a以上のパワーを持つ周波
数帯域に少なくとも最低量子化ビット数を割り当てるの
で、他の周波数帯域I3のパワーの影響によって、一定
比率a以上のパワーを持つ周波数帯域I4が完全に削除
されるのを防止できる。したがって、聴覚特性に優れた
人にも違和感を与えないようにすることができる。第4
に、予め定められた特定の周波数帯域Isに、予め定め
られた分だけ余分にビット数を割り当てるので、上記周
波数帯域Isの量子化誤差を通常より小さくできる。し
たがって、再生装置で強調したときにこの誤差が強調さ
れても、この誤差が知覚されるのを防止できる。したが
って、高音質の再生音を提供することができる。
【0124】これらの特長を発揮するビット配分部40
3は、個々にハードウエアによっても実現できるが、デ
ィジタル信号プロセッサ(DSP)等の装置上ですべて
ソフトウエアによっても実現することができる。
【0125】
【発明の効果】以上より明らかなように、請求項1の符
号化復号化装置では、符号化部のビット配分部は、ブロ
ック長決定部からブロック長を表す情報を受けて、上記
ブロック長の長短に応じて、異なる聴覚心理特性を採用
する。したがって、ブロック長が長いときには、計算量
が多いがマスキング効果の大きい聴覚心理特性、例えば
同時マスキングを適用できる。一方、ブロック長が短い
ときには、マスキング効果が小さいが計算量が少ない聴
覚心理特性、例えば継時マスキングを適用できる。つま
り、計算量とマスキング閾値の精度という二律排反の関
係を克服でき、常に最適の聴覚心理特性を採用して量子
化誤差を低減することができる。したがって、高音質な
再生音を得ることができる。
【0126】請求項2の符号化復号化装置は、符号化部
のビット配分部は、各周波数帯域に配分される最大ビッ
ト数を各周波数帯域毎に制限する。したがって、複数の
周波数帯域のうちパワーが大きい周波数帯域I1から離
れたパワーが小さい周波数帯域I2に対して、マスキン
グ閾値対雑音比(MNR)の大小にかかわらず、配分で
きる量子化ビットの最大数が制限される。すなわち、正
弦波信号が入力された時、正弦波信号が含まれる周波数
帯域I1から離れたパワーが小さい周波数帯域I2では、
たとえ正弦波信号の含まれる周波数帯域I1と同じよう
な大きさのマスキング閾値対雑音比(MNR)を持って
いたとしても、最大ビット数を有効に制限できる。この
結果、上記パワーが小さい周波数帯域I2に配分された
であろうビット数を、他の周波数帯域、特に正弦波信号
の含まれる周波数帯域I1により多く配分できる。した
がって、上記正弦波信号を復号化したとき、従来に比し
て量子化誤差を低減され、音質を高めることができる。
【0127】請求項3の符号化復号化装置では、符号化
部のビット配分部は、全周波数帯域のパワーと一の周波
数帯域のパワーとの比に基づいて、上記一の周波数帯域
に配分される最大ビット数を決定するので、入力信号が
大きいときに、パワーが小さい周波数帯域へのビット配
分を有効に制限できる。
【0128】請求項4の符号化復号化装置では、符号化
部のビット配分部は、一の周波数帯域のパワーの大きさ
に基づいて、上記一の周波数帯域に配分される最大ビッ
ト数を決定するので、入力信号が小さいときに、パワー
が小さい周波数帯域へのビット配分を有効に制限でき
る。
【0129】請求項5の符号化復号化装置では、符号化
部のビット配分部は、全周波数帯域のパワーと一の周波
数帯域のパワーとの比、および、上記一の周波数帯域の
パワーの大きさとに基づいて、上記各周波数帯域に配分
される量子化ビット数を決定するので、入力信号の大小
にかかわらず、パワーが小さい周波数帯域へのビット配
分を有効に制限できる。
【0130】請求項6の符号化復号化装置では、上記ビ
ット配分部は、一の周波数帯域のマスキング閾値対雑音
比が1以下である場合、上記一の周波数帯域に配分され
る最大ビット数についての制限を解除するので、元々最
大ビット数の制限を受ける周波数帯域ではマスキング閾
値対雑音比が1を超えるまでビット数を割り当て、マス
キング閾値が1を超えた時点で直ちにビット数の割り当
てを停止する。したがって、請求項2の符号化復号化装
置と同様に正弦波信号が含まれる周波数帯域I1の量子
化誤差を低減できる上、パワーが小さい周波数帯域I2
の量子化誤差を低減できる。したがって、復号化時の音
質を改善できる。
【0131】請求項7の符号化復号化装置では、上記ビ
ット配分部は、配分した全量子化ビット数が全周波数帯
域に配分し得る所定の総数に満たない場合、上記各周波
数帯域に配分されたビット数がそれぞれ上記最大数に等
しいかどうかを判断して、各周波数帯域に配分されたビ
ット数がそれぞれ上記最大数に等しいとき、上記最大ビ
ット数についての制限を緩和または解除するので、量子
化ビット数の総数の範囲内でビット配分を有効に行うこ
とができる。したがって、上記制限により本来のビット
数より少ないビット数が割り当てられたパワーが小さい
周波数帯域Iに対して、少し余分にビットを配分する
ので、この周波数帯域Iでのマスキング閾値対雑音比
(MNR)を改善でき、復号化時の音質を改善できる。
【0132】請求項8の符号化復号化装置では、符号化
部のビット配分部は、全周波数帯域のパワーに対して一
の周波数帯域のパワーが一定比率以上であるかどうかを
判断して、上記一定比率以上のパワーを持つ一の周波数
帯域に、上記マスキング閾値対雑音比の大小にかかわら
ず少なくとも最低量子化ビット数を割り当てるので、他
の周波数帯域I3のパワーの影響によって、一定比率以
上のパワーを持つ周波数帯域I4が完全に削除されるの
を防止できる。したがって、従来と異なり、聴覚特性に
優れた人にも違和感を持たせなくて済み、高音質の再生
音を提供することができる。
【0133】また、楽音の再生装置に低域強調機能のよ
うな特定の周波数成分を強調する機能が付いている場合
がある。このような再生装置で、上記適応ビット配分方
式で復号化した音を再生するとき、もし、符号化時に上
記周波数成分にビットが十分に割り当てられなくて、こ
の周波数成分を含む周波数帯域Isのマスキング閾値対
雑音比(MNR)が1より少し大きい程度であったとす
ると、上記周波数成分の量子化誤差が強調される恐れが
ある。そこで、請求項9の符号化復号化装置では、符号
化部のビット数配分部は、予め定められた特定の周波数
帯域Isに、予め定められた分だけ余分にビット数を割
り当てるので、上記特定の周波数帯域Isの量子化誤差
は通常より小さくなる。したがって、再生装置で強調し
たときにこの誤差が強調されても、この誤差が知覚され
るのを防止できる。したがって、従来と異なり、聴覚特
性に優れた人にも違和感を持たせなくて済み、高音質の
再生音を提供することができる。
【0134】また、請求項10の符号化復号化装置で
は、符号化部のビット配分部は、全周波数帯域に配分し
得る量子化ビット数の総数から上記特定の周波数帯域I
sに余分に配分すべきビット数を差し引いた残りのビッ
ト数を各周波数帯域に割り当て、続いて、上記余分に配
分すべきビット数を上記特定の周波数帯域Isに加算す
るので、最終的に全周波数帯域に配分されたビット数
を、上記量子化ビット数の総数の範囲内に収めることが
できる。
【0135】また、請求項11の符号化復号化装置で
は、符号化部のビット配分部は、上記周波数帯域のパワ
ーの大きさから各周波数帯域毎の信号対マスキング閾値
比(SMR)を求め、上記特定の周波数帯域Isの信号
対マスキング閾値比(SMR)に予め定められた値を加
えた後、この信号対マスキング閾値比(SMR)を用い
て上記マスキング閾値対雑音比(MNR)を求める。し
たがって、上記周波数帯域Isは、信号対マスキング閾
値比(SMR)の増加分によって、ビット配分されやす
くなり、請求項9の符号化復号化装置と同様に上記特定
の周波数帯域Isの量子化誤差が小さくなる。この結
果、量子化誤差がマスキング閾値を超えるのを防止で
き、量子化誤差が知覚されるのを防止できる。しかも、
この場合のビット配分は、全周波数帯域の信号対マスキ
ング閾値比(SMR)のバランスを考慮したものであ
る。すなわち、もし、強調される特定の周波数帯域Is
に信号成分が無い場合は、この周波数帯域Isの信号対
マスキング閾値比(SMR)はデシベル換算で元々負の
無限大かそれに相当する値となっているので、強調によ
る加算は無視されて、この周波数帯域Isにビット配分
されることはない。したがって、ビット配分の無駄をな
くすことができる。また、強調しても他の周波数帯域の
信号に上記周波数帯域Isの信号自身あるいは量子化誤
差がマスクされてしまう場合は、他のマスキングされな
い周波数帯域に比べ、ビット配分する前のマスキング閾
値対雑音比(MNR)が大きな値となる(もちろん強調
される前の値よりは小さな値であるが、まだマスキング
されない周波数帯域のMNRに比べると大きい)ので、
この周波数帯域Isにはビット配分されにくくなる。し
たがって、強調による無駄なビット配分を防ぐことがで
きる。
【0136】また、請求項12の符号化復号化装置で
は、符号化部のビット配分部は、請求項1,2,8,9
のビット配分部が有する計4つの手段のうち2つ以上の
手段を有している。したがって、請求項1,2,8,9
による上述の4つの効果のうち2つ以上のものを組み合
わせた効果を奏することができる。しかも、上記4つの
手段は、個々にハードウエアによっても実現できるが、
ディジタル信号プロセッサ等の装置上ですべてソフトウ
エアによっても実現することができる。
【図面の簡単な説明】
【図1】 この発明の第1実施例の符号化復号化装置の
ブロック構成を示す図である。
【図2】 上記符号化復号化装置のマスキング閾値計算
部によるマスキング閾値の計算の仕方を説明するフロー
チャートを示す図である。
【図3】 上記符号化復号化装置によるビット数の配分
の仕方を説明するフローチャートを示す図である。
【図4】 この発明の第2実施例の符号化復号化装置の
ブロック構成を示す図である。
【図5】 上記符号化復号化装置によるビット配分の仕
方を説明するフローチャートを示す図である。
【図6】 上記符号化復号化装置の最大ビット数決定部
による最大ビット数のの決定方法を説明する図である。
【図7】 上記符号化復号化装置による別のビット配分
の仕方を説明するフローチャートを示す図である。
【図8】 上記符号化復号化装置によるさらに別のビッ
ト配分の仕方を説明するフローチャートを示す図であ
る。
【図9】 この発明の第3実施例の符号化復号化装置の
ブロック構成を示す図である。
【図10】 上記符号化復号化装置によるビット配分の
仕方を説明するフローチャートを示す図である。
【図11】 この発明の第4実施例の符号化復号化装置
のブロック構成を示す図である。
【図12】 上記符号化復号化装置によるビット配分の
仕方を説明するフローチャートを示す図である。
【図13】 上記符号化復号化装置による別のビット配
分の仕方を説明するフローチャートを示す図である。
【図14】 再生装置で低域を強調したときの再生音と
量子化誤差とについてのパワースペクトル、マスキング
閾値および量子化誤差を示す図である。
【図15】 この発明の第5実施例の符号化復号化装置
のブロック構成を示す図である。
【図16】 上記符号化復号化装置によるビット配分の
仕方を説明するフローチャートを示す図である。
【図17】 同時マスキングによるマスキング曲線の求
め方を説明する図である。
【図18】 同時マスキングによるマスキング曲線の求
め方を説明する図である。
【図19】 求めたマスキング曲線を示す図である。
【図20】 継時マスキングによるマスキング曲線の求
め方を説明する図である。
【図21】 各周波数帯域の信号対マスキング閾値比
(SMR)の求め方を説明する図である。
【符号の説明】
1,401 ブロック長決定部 2,101,201,301,402 周波数帯域分割
部 3,102,202,302,403 ビット配分部 4,103,203,303,404 量子化部 5,104,204,304,405 マルチプレクサ 6,105,205,305,406 伝送路 7,106,206,306,407 デマルチプレク
サ 8,107,207,307,408 逆量子化部 9,108,208,308,409 周波数帯域合成
部 31,121,221,321,431 パワー計算部 32,122,222,322,432 マスキング閾
値計算部 33,123,223,323,433 SMR計算部 34,124,224,324,434 MNR計算部 35,126,226,326,435 ビット配分計
算部 125,436 最大ビット数決定部 225,437 パワー判定部 325,438 予備ビット数保存部
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平6−216861(JP,A) 特開 平3−167927(JP,A) 特開 平5−91062(JP,A) 特表 平6−504893(JP,A) (58)調査した分野(Int.Cl.7,DB名) H04B 14/00 - 14/04 H03M 7/30 G10L 19/00 G10L 19/02

Claims (12)

    (57)【特許請求の範囲】
  1. 【請求項1】 楽音、音声またはこれらの組み合わせか
    らなるディジタル入力信号を符号化する符号化部と、上
    記符号化部によって符号化された信号を復号化する復号
    化部とを備えた符号化復号化装置であって、 上記符号化部は、 上記入力信号の変化の程度に応じて、上記入力信号を所
    定のブロック長に時分割してブロック化するブロック長
    決定部と、 上記各ブロックの信号を複数の周波数帯域に分割して周
    波数帯域信号を生成する周波数帯域分割部と、 聴覚心理特性を反映して上記各周波数帯域のパワーの大
    きさから各周波数帯域のマスキング閾値対雑音比を求
    め、このマスキング閾値対雑音比の大小に基づいて上記
    各周波数帯域に配分すべき量子化ビット数を決定するビ
    ット配分部と、 上記ビット配分部から上記量子化ビット数を表す情報を
    受けて、この情報に基づいて、上記各周波数帯域に所定
    のビット数を配分しつつ上記周波数帯域信号を量子化し
    て符号列を生成する量子化部とを有し、 上記ビット配分部は、上記ブロック長決定部から上記ブ
    ロック長を表す情報を受けて、上記ブロック長の長短に
    応じて、異なる聴覚心理特性を採用する手段を有するこ
    とを特徴とする符号化復号化装置。
  2. 【請求項2】 楽音、音声またはこれらの組み合わせか
    らなるディジタル入力信号を符号化する符号化部と、上
    記符号化部によって符号化された信号を復号化する復号
    化部とを備えた符号化復号化装置であって、 上記符号化部は、 上記入力信号を、所定の時分割単位毎に、複数の周波数
    帯域に分割して周波数帯域信号を生成する周波数帯域分
    割部と、 聴覚心理特性を反映して上記各周波数帯域のパワーの大
    きさから各周波数帯域のマスキング閾値対雑音比を求
    め、このマスキング閾値対雑音比の大小に基づいて上記
    各周波数帯域に配分すべき量子化ビット数を決定するビ
    ット配分部と、 上記ビット配分部から上記量子化ビット数を表す情報を
    受けて、この情報に基づいて、上記各周波数帯域に所定
    のビット数を配分しつつ上記周波数帯域信号を量子化し
    て符号列を生成する量子化部とを有し、 上記ビット配分部は、上記各周波数帯域に配分される最
    大ビット数を各周波数帯域毎に制限する手段を有するこ
    とを特徴とする符号化復号化装置。
  3. 【請求項3】 請求項2に記載の符号化復号化装置にお
    いて、 上記ビット配分部の上記手段は、全周波数帯域のパワー
    と一の周波数帯域のパワーとの比に基づいて、上記一の
    周波数帯域に配分される最大ビット数を決定することを
    特徴とする符号化復号化装置。
  4. 【請求項4】 請求項2に記載の符号化復号化装置にお
    いて、 上記ビット配分部の上記手段は、一の周波数帯域のパワ
    ーの大きさに基づいて、上記一の周波数帯域に配分され
    る最大ビット数を決定することを特徴とする符号化復号
    化装置。
  5. 【請求項5】 請求項2に記載の符号化復号化装置にお
    いて、 上記ビット配分部の上記手段は、全周波数帯域のパワー
    と一の周波数帯域のパワーとの比、および、上記一の周
    波数帯域のパワーの大きさとに基づいて、上記各周波数
    帯域に配分される量子化ビット数を決定することを特徴
    とする符号化復号化装置。
  6. 【請求項6】 請求項2及至5のいずれか一つに記載の
    符号化復号化装置において、 上記ビット配分部は、一の周波数帯域のマスキング閾値
    対雑音比が1以下である場合、上記一の周波数帯域に配
    分される最大ビット数についての制限を解除する手段を
    有することを特徴とする符号化復号化装置。
  7. 【請求項7】 請求項2及至6のいずれか一つに記載の
    符号化復号化装置において、 上記ビット配分部は、配分した全量子化ビット数が全周
    波数帯域に配分し得る所定の総数に満たない場合、上記
    各周波数帯域に配分されたビット数がそれぞれ上記最大
    ビット数に等しいかどうかを判断して、各周波数帯域に
    配分されたビット数がそれぞれ上記最大ビット数に等し
    いとき、上記最大ビット数についての制限を緩和または
    解除する手段を有することを特徴とする符号化復号化装
    置。
  8. 【請求項8】 楽音、音声またはこれらの組み合わせか
    らなるディジタル入力信号を符号化する符号化部と、上
    記符号化部によって符号化された信号を復号化する復号
    化部とを備えた符号化復号化装置であって、 上記符号化部は、 上記入力信号を、所定の時分割単位毎に、複数の周波数
    帯域に分割して周波数帯域信号を生成する周波数帯域分
    割部と、 聴覚心理特性を反映して上記各周波数帯域のパワーの大
    きさから各周波数帯域のマスキング閾値対雑音比を求
    め、このマスキング閾値対雑音比の大小に基づいて上記
    各周波数帯域に配分すべき量子化ビット数を決定するビ
    ット配分部と、 上記ビット配分部から上記量子化ビット数を表す情報を
    受けて、この情報に基づいて、上記各周波数帯域に所定
    のビット数を配分しつつ上記周波数帯域信号を量子化し
    て符号列を生成する量子化部とを有し、 上記ビット配分部は、全周波数帯域のパワーに対して一
    の周波数帯域のパワーが一定比率以上であるかどうかを
    判断して、上記一定比率以上のパワーを持つ一の周波数
    帯域に、上記マスキング閾値対雑音比の大小にかかわら
    ず少なくとも最低量子化ビット数を割り当てる手段を有
    することを特徴とする符号化復号化装置。
  9. 【請求項9】 楽音、音声またはこれらの組み合わせか
    らなるディジタル入力信号を符号化する符号化部と、上
    記符号化部によって符号化された信号を復号化する復号
    化部とを備えた符号化復号化装置であって、 上記符号化部は、 上記入力信号を、所定の時分割単位毎に、複数の周波数
    帯域に分割して周波数帯域信号を生成する周波数帯域分
    割部と、 聴覚心理特性を反映して上記各周波数帯域のパワーの大
    きさから各周波数帯域のマスキング閾値対雑音比を求
    め、このマスキング閾値対雑音比の大小に基づいて上記
    各周波数帯域に配分すべき量子化ビット数を決定するビ
    ット配分部と、 上記ビット配分部から上記量子化ビット数を表す情報を
    受けて、この情報に基づいて、上記各周波数帯域に所定
    のビット数を配分しつつ上記周波数帯域信号を量子化し
    て符号列を生成する量子化部とを有し、 上記ビット数配分部は、予め定められた特定の周波数帯
    域に、予め定められた分だけ余分にビット数を割り当て
    る手段を有することを特徴とする符号化復号化装置。
  10. 【請求項10】 請求項9に記載の符号化復号化装置に
    おいて、 上記ビット配分部は、全周波数帯域に配分し得る量子化
    ビット数の総数から上記特定の周波数帯域に余分に配分
    すべきビット数を差し引いた残りのビット数を各周波数
    帯域に割り当て、続いて、上記余分に配分すべきビット
    数を上記特定の周波数帯域に加算する手段を有すること
    を特徴とする符号化復号化装置。
  11. 【請求項11】 請求項9に記載の符号化復号化装置に
    おいて、 上記ビット配分部は、上記周波数帯域のパワーの大きさ
    から各周波数帯域毎の信号対マスキング閾値比を求め、
    上記特定の周波数帯域の信号対マスキング閾値比に予め
    定められた値を加えた後、この信号対マスキング閾値比
    を用いて上記マスキング閾値対雑音比を求める手段を有
    することを特徴とする符号化復号化装置。
  12. 【請求項12】 楽音、音声またはこれらの組み合わせ
    からなるディジタル入力信号を符号化する符号化部と、
    上記符号化部によって符号化された信号を復号化する復
    号化部とを備えた符号化復号化装置であって、 上記符号化部は、 上記入力信号の変化の程度に応じて、上記入力信号を所
    定のブロック長に時分割してブロック化するブロック長
    決定部と、 上記各ブロックの信号を複数の周波数帯域に分割して周
    波数帯域信号を生成する周波数帯域分割部と、 聴覚心理特性を反映して上記各周波数帯域のパワーの大
    きさから各周波数帯域のマスキング閾値対雑音比を求
    め、このマスキング閾値対雑音比の大小に基づいて上記
    各周波数帯域に配分すべき量子化ビット数を決定するビ
    ット配分部と、 上記ビット配分部から上記量子化ビット数を表す情報を
    受けて、この情報に基づいて、上記各周波数帯域に所定
    のビット数を配分しつつ上記周波数帯域信号を量子化し
    て符号列を生成する量子化部とを有し、 上記ビット配分部は、上記ブロック長決定部から上記ブ
    ロック長を表す情報を受けて、上記ブロック長の長短に
    応じて、異なる聴覚心理特性を採用する手段と、上記各
    周波数帯域に配分される最大ビット数を各周波数帯域毎
    に制限する手段と、全周波数帯域のパワーに対して一の
    周波数帯域のパワーが一定比率以上であるかどうかを判
    断して、上記一定比率以上のパワーを持つ一の周波数帯
    域に、上記マスキング閾値対雑音比の大小にかかわらず
    少なくとも最低量子化ビット数を割り当てる手段と、予
    め定められた特定の周波数帯域に、予め定められた分だ
    け余分にビット数を割り当てる手段との4つの手段のう
    ち2つ以上の手段を有することを特徴とする符号化復号
    化装置。
JP06263562A 1993-11-25 1994-10-27 符号化復号化装置 Expired - Fee Related JP3131542B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP06263562A JP3131542B2 (ja) 1993-11-25 1994-10-27 符号化復号化装置
US08/344,166 US5684922A (en) 1993-11-25 1994-11-23 Encoding and decoding apparatus causing no deterioration of sound quality even when sine-wave signal is encoded
DE69418994T DE69418994T2 (de) 1993-11-25 1994-11-25 Kodier- und Dekodierapparat welcher keine Tonqualität verschlechtert, sogar wenn ein Sinuswellen-Signal dekodiert wird
EP94308732A EP0661821B1 (en) 1993-11-25 1994-11-25 Encoding and decoding apparatus causing no deterioration of sound quality even when sinewave signal is encoded

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP5-295015 1993-11-25
JP29501593 1993-11-25
JP06263562A JP3131542B2 (ja) 1993-11-25 1994-10-27 符号化復号化装置

Publications (2)

Publication Number Publication Date
JPH07202823A JPH07202823A (ja) 1995-08-04
JP3131542B2 true JP3131542B2 (ja) 2001-02-05

Family

ID=26546075

Family Applications (1)

Application Number Title Priority Date Filing Date
JP06263562A Expired - Fee Related JP3131542B2 (ja) 1993-11-25 1994-10-27 符号化復号化装置

Country Status (4)

Country Link
US (1) US5684922A (ja)
EP (1) EP0661821B1 (ja)
JP (1) JP3131542B2 (ja)
DE (1) DE69418994T2 (ja)

Families Citing this family (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2842276B2 (ja) * 1995-02-24 1998-12-24 日本電気株式会社 広帯域信号符号化装置
JP3491425B2 (ja) * 1996-01-30 2004-01-26 ソニー株式会社 信号符号化方法
DE19629132A1 (de) * 1996-07-19 1998-01-22 Daimler Benz Ag Verfahren zur Verringerung von Störungen eines Sprachsignals
JP3328532B2 (ja) 1997-01-22 2002-09-24 シャープ株式会社 デジタルデータの符号化方法
FR2768547B1 (fr) * 1997-09-18 1999-11-19 Matra Communication Procede de debruitage d'un signal de parole numerique
JPH11143497A (ja) 1997-11-10 1999-05-28 Matsushita Electric Ind Co Ltd 圧縮されたテーブルを用いてサブバンドごとに量子化係数を復号化する方法
US6134274A (en) * 1997-12-23 2000-10-17 At&T Corp Method and apparatus for allocating data for transmission via discrete multiple tones
DE69940918D1 (de) * 1998-02-26 2009-07-09 Sony Corp Verfahren und vorrichtung zur kodierung/dekodierung sowie programmaufzeichnungsträger und datenaufzeichnungsträger
US6115689A (en) * 1998-05-27 2000-09-05 Microsoft Corporation Scalable audio coder and decoder
JP3515903B2 (ja) * 1998-06-16 2004-04-05 松下電器産業株式会社 オーディオ符号化のための動的ビット割り当て方法及び装置
JP3784993B2 (ja) * 1998-06-26 2006-06-14 株式会社リコー 音響信号の符号化・量子化方法
US7058572B1 (en) * 2000-01-28 2006-06-06 Nortel Networks Limited Reducing acoustic noise in wireless and landline based telephony
US6671667B1 (en) * 2000-03-28 2003-12-30 Tellabs Operations, Inc. Speech presence measurement detection techniques
US7508944B1 (en) * 2000-06-02 2009-03-24 Digimarc Corporation Using classification techniques in digital watermarking
CN1338834A (zh) * 2000-08-19 2002-03-06 华为技术有限公司 基于网络协议的低速语音编码方法
JP4618873B2 (ja) * 2000-11-24 2011-01-26 パナソニック株式会社 オーディオ信号符号化方法、オーディオ信号符号化装置、音楽配信方法、および、音楽配信システム
US7930170B2 (en) * 2001-01-11 2011-04-19 Sasken Communication Technologies Limited Computationally efficient audio coder
DE10119980C1 (de) * 2001-04-24 2002-11-07 Bosch Gmbh Robert Verfahren zur Codierung von Audiodaten
US7328151B2 (en) * 2002-03-22 2008-02-05 Sound Id Audio decoder with dynamic adjustment of signal modification
KR100462611B1 (ko) * 2002-06-27 2004-12-20 삼성전자주식회사 하모닉 성분을 이용한 오디오 코딩방법 및 장치
CN1666571A (zh) * 2002-07-08 2005-09-07 皇家飞利浦电子股份有限公司 音频处理
JP4009781B2 (ja) * 2003-10-27 2007-11-21 カシオ計算機株式会社 音声処理装置及び音声符号化方法
US7406412B2 (en) * 2004-04-20 2008-07-29 Dolby Laboratories Licensing Corporation Reduced computational complexity of bit allocation for perceptual coding
JP2008503766A (ja) * 2004-06-21 2008-02-07 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオエンコードの方法
KR100682890B1 (ko) * 2004-09-08 2007-02-15 삼성전자주식회사 비트량 고속제어가 가능한 오디오 부호화 방법 및 장치
JP4725127B2 (ja) * 2005-02-16 2011-07-13 ソニー株式会社 復号装置および方法、記録媒体、並びにプログラム
US7627481B1 (en) * 2005-04-19 2009-12-01 Apple Inc. Adapting masking thresholds for encoding a low frequency transient signal in audio data
KR100851970B1 (ko) * 2005-07-15 2008-08-12 삼성전자주식회사 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치
JP2007264154A (ja) * 2006-03-28 2007-10-11 Sony Corp オーディオ信号符号化方法、オーディオ信号符号化方法のプログラム、オーディオ信号符号化方法のプログラムを記録した記録媒体及びオーディオ信号符号化装置
US8718121B2 (en) * 2006-10-12 2014-05-06 Jds Uniphase Corporation Test device and method of detecting an imbalance in a power level of a channel
JP4984983B2 (ja) * 2007-03-09 2012-07-25 富士通株式会社 符号化装置および符号化方法
WO2008146183A1 (en) * 2007-05-29 2008-12-04 Nxp B.V. Device and method to reduce power consumption
GB2454208A (en) * 2007-10-31 2009-05-06 Cambridge Silicon Radio Ltd Compression using a perceptual model and a signal-to-mask ratio (SMR) parameter tuned based on target bitrate and previously encoded data
JP5262171B2 (ja) 2008-02-19 2013-08-14 富士通株式会社 符号化装置、符号化方法および符号化プログラム
CN102171950B (zh) * 2008-10-01 2014-02-26 空中客车作业有限公司 数字信号处理器、通信设备、通信系统及操作数字信号处理器的方法
US9881625B2 (en) * 2011-04-20 2018-01-30 Panasonic Intellectual Property Corporation Of America Device and method for execution of huffman coding
US9183846B2 (en) * 2011-12-02 2015-11-10 Hytera Communications Corp., Ltd. Method and device for adaptively adjusting sound effect
JP6098038B2 (ja) * 2012-03-19 2017-03-22 富士通株式会社 音声補正装置、音声補正方法及び音声補正用コンピュータプログラム
CN110706715B (zh) * 2012-03-29 2022-05-24 华为技术有限公司 信号编码和解码的方法和设备
JP6179087B2 (ja) * 2012-10-24 2017-08-16 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用コンピュータプログラム
US20150025894A1 (en) * 2013-07-16 2015-01-22 Electronics And Telecommunications Research Institute Method for encoding and decoding of multi channel audio signal, encoder and decoder
CN104934034B (zh) 2014-03-19 2016-11-16 华为技术有限公司 用于信号处理的方法和装置
JP2015227912A (ja) * 2014-05-30 2015-12-17 富士通株式会社 オーディオ符号化装置、および方法
JP6398607B2 (ja) * 2014-10-24 2018-10-03 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム
US9704497B2 (en) 2015-07-06 2017-07-11 Apple Inc. Method and system of audio power reduction and thermal mitigation using psychoacoustic techniques
WO2021012872A1 (zh) 2019-07-25 2021-01-28 腾讯科技(深圳)有限公司 一种编码参数调控方法、装置、设备及存储介质
CN110557129B (zh) * 2019-09-12 2021-04-09 北京维普无限智能技术有限公司 一种多码制无线信号静噪方法

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL8700985A (nl) * 1987-04-27 1988-11-16 Philips Nv Systeem voor sub-band codering van een digitaal audiosignaal.
NL8901032A (nl) * 1988-11-10 1990-06-01 Philips Nv Coder om extra informatie op te nemen in een digitaal audiosignaal met een tevoren bepaald formaat, een decoder om deze extra informatie uit dit digitale signaal af te leiden, een inrichting voor het opnemen van een digitaal signaal op een registratiedrager, voorzien van de coder, en een registratiedrager verkregen met deze inrichting.
CA2140678C (en) * 1989-01-27 2001-05-01 Louis Dunn Fielder Coder and decoder for high-quality audio
US5142656A (en) * 1989-01-27 1992-08-25 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
ES2109296T3 (es) * 1989-01-27 1998-01-16 Dolby Lab Licensing Corp Codificador, descodificador y codificador/descodificador con transformacion de baja frecuencia de bits para audioinformacion de alta calidad.
US5109417A (en) * 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5185800A (en) * 1989-10-13 1993-02-09 Centre National D'etudes Des Telecommunications Bit allocation device for transformed digital audio broadcasting signals with adaptive quantization based on psychoauditive criterion
JP2870050B2 (ja) * 1989-10-18 1999-03-10 ソニー株式会社 ディジタルデータの高能率符号化方法
JP2861238B2 (ja) * 1990-04-20 1999-02-24 ソニー株式会社 ディジタル信号符号化方法
US5206884A (en) * 1990-10-25 1993-04-27 Comsat Transform domain quantization technique for adaptive predictive coding
US5365553A (en) * 1990-11-30 1994-11-15 U.S. Philips Corporation Transmitter, encoding system and method employing use of a bit need determiner for subband coding a digital signal
EP0506394A2 (en) * 1991-03-29 1992-09-30 Sony Corporation Coding apparatus for digital signals
JPH04302531A (ja) * 1991-03-29 1992-10-26 Sony Corp ディジタルデータの高能率符号化方法
DE69217590T2 (de) * 1991-07-31 1997-06-12 Matsushita Electric Ind Co Ltd Verfahren und Einrichtung zur Kodierung eines digitalen Audiosignals

Also Published As

Publication number Publication date
JPH07202823A (ja) 1995-08-04
EP0661821B1 (en) 1999-06-09
DE69418994T2 (de) 1999-12-02
EP0661821A1 (en) 1995-07-05
DE69418994D1 (de) 1999-07-15
US5684922A (en) 1997-11-04

Similar Documents

Publication Publication Date Title
JP3131542B2 (ja) 符号化復号化装置
KR100348368B1 (ko) 디지털 음향 신호 부호화 장치, 디지털 음향 신호 부호화방법 및 디지털 음향 신호 부호화 프로그램을 기록한 매체
KR100269213B1 (ko) 오디오신호의부호화방법
JP2906646B2 (ja) 音声帯域分割符号化装置
EP0966108B1 (en) Dynamic bit allocation apparatus and method for audio coding
JP5175028B2 (ja) デジタル信号の符号化方法及び装置ならびに復号化方法及び装置
KR100310214B1 (ko) 신호인코딩또는디코딩장치와레코딩매체
JPH08190764A (ja) ディジタル信号処理方法、ディジタル信号処理装置及び記録媒体
JPH07336232A (ja) 情報符号化方法及び装置、情報復号化方法及び装置、並びに情報記録媒体
JP4055336B2 (ja) 音声符号化装置及びそれに用いる音声符号化方法
US7583804B2 (en) Music information encoding/decoding device and method
KR0137472B1 (ko) 오디오 신호 코딩 방법
JPH0846518A (ja) 情報符号化方法及び復号化方法、情報符号化装置及び復号化装置、並びに情報記録媒体
JP3557674B2 (ja) 高能率符号化方法及び装置
JP3189401B2 (ja) 音声データ符号化方法及び音声データ符号化装置
US6128593A (en) System and method for implementing a refined psycho-acoustic modeler
JP2000151413A (ja) オーディオ符号化における適応ダイナミック可変ビット割り当て方法
JP3146121B2 (ja) 符号化復号化装置
KR0144841B1 (ko) 음향신호의 적응적 부호화 및 복호화장치
JP3200886B2 (ja) オーディオ信号処理方法
JPH0918348A (ja) 音響信号符号化装置及び音響信号復号装置
JP3141853B2 (ja) オーディオ信号処理方法
JPH0750589A (ja) サブバンド符号化装置
JP3134384B2 (ja) 符号化装置及び方法
JP2001109497A (ja) オーディオ信号符号化装置およびオーディオ信号符号化方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081117

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091117

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees