JPH0653911A - 音声データ符号化方法及び音声データ符号化装置 - Google Patents

音声データ符号化方法及び音声データ符号化装置

Info

Publication number
JPH0653911A
JPH0653911A JP4202614A JP20261492A JPH0653911A JP H0653911 A JPH0653911 A JP H0653911A JP 4202614 A JP4202614 A JP 4202614A JP 20261492 A JP20261492 A JP 20261492A JP H0653911 A JPH0653911 A JP H0653911A
Authority
JP
Japan
Prior art keywords
level
correction value
quantization error
level correction
audio data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP4202614A
Other languages
English (en)
Other versions
JP3189401B2 (ja
Inventor
Hiroyuki Suzuki
浩之 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP20261492A priority Critical patent/JP3189401B2/ja
Priority to EP93304865A priority patent/EP0581435A3/en
Priority to KR1019930014498A priority patent/KR940003232A/ko
Publication of JPH0653911A publication Critical patent/JPH0653911A/ja
Priority to US08/684,329 priority patent/US5642383A/en
Application granted granted Critical
Publication of JP3189401B2 publication Critical patent/JP3189401B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10009Improvement or modification of read or write signals
    • G11B20/10046Improvement or modification of read or write signals filtering or equalising, e.g. setting the tap weights of an FIR filter
    • G11B20/10203Improvement or modification of read or write signals filtering or equalising, e.g. setting the tap weights of an FIR filter baseline correction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00007Time or data compression or expansion
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Use Of Switch Circuits For Exchanges And Methods Of Control Of Multiplex Exchanges (AREA)

Abstract

(57)【要約】 【構成】 人間の聴覚特性に応じてディジタル音声デー
タを再量子化する音声データ符号化装置において、量子
化誤差を求める量子化誤差算出部303と、量子化誤差
と入力レベルとからレベル補正値を求めるレベル補正値
算出部304と、レベル補正値に応じてディジタル音声
データのレベル補正を行うレベル補正部308とを有す
るレベル補正回路を設ける。 【効果】 大振幅入力時のクリッピングによるノイズの
発生を効率良く抑制するのみならず、抑制の際のレベル
変動も人間の聴感上好ましいものにできる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、いわゆる高能率符号化
によって入力ディジタルデータの符号化を行ない、これ
を伝送,記録,再生し、復号化して再生信号を得るディ
ジタル音声データ符号化方法及び符号化装置に関するも
のである。
【0002】
【従来の技術】オーディオ或いは音声等の信号の高能率
符号化の手法には種々あるが、例えば「ICASSP 1980 Th
e critical band coder digital encoding of the perc
eptualrequirements of the auditory system M.A.Kran
sner MIT 」では、聴覚マスキングを利用することで、
各帯域毎に必要な信号対雑音比を得て固定的なビット割
当を行なう手法が述べられている。しかしこの手法で
は、サイン波入力で特性を測定する場合にビット割当が
固定的であるため、特性値がそれほど良い値とならな
い。
【0003】これらの問題を解決するために、ビット割
当に使用できる全ビットを、各小ブロック毎にあらかじ
め定められた固定ビット割当パターン分と、各ブロック
の信号の大きさに依存したビット配分を行なう分とに分
割使用し、その分割比を入力信号に関係する信号に依存
させ、前記信号のスペクトルが滑らかなほど前記固定ビ
ット割当パターン分への分割比率を大きくするような高
能率符号化装置が提案されている。
【0004】この方法によれば、例えばサイン波入力の
ように、特定のスペクトルにエネルギーが集中する場合
には、そのスペクトルを含むブロックに多くのビットを
割り当てる事により、全体の信号対雑音特性を著しく改
善することができる。一般に、急峻なスペクトル成分を
もつ信号に対して人間の聴覚は極めて敏感であるため、
このような方法を用いる事によって信号対雑音特性を改
善することは、単に測定上の数値を向上させるばかりで
なく、聴感上の音質を改善するのに有効である。
【0005】しかし、入力信号に依存したビットの割り
当てを、単に信号対雑音特性を改善させるという事を基
準にして行なうと、例えばトライアングルの音のよう
に、急峻なスペクトル成分を多数含む信号を低いビット
レートで圧縮しようとした場合には、各スペクトルに対
応するブロックに十分なビットが割り当てられず、聴感
上、十分な音質を得ることができない。
【0006】そこで、本件出願人は、先に、ビット割当
に使用できる全ビットを、どの短時間に対しても予め定
められた固定ビット割当パターン分と、各ブロックの信
号の大きさに依存したビット配分を行なう分とに分割使
用し、固定ビット割当パターンに加えて、各ブロックの
信号の大きさに依存したビット配分についても、そのブ
ロックの対応する帯域に応じて重み付けする事により、
上述の課題を解決する手法を提案している。
【0007】ここで、上記重み付けの際には、高域側の
雑音は人間の耳の感度のために低域側の雑音より耳につ
きにくく、また、低域側の信号にマスクされやすいとい
う事実を踏まえて、低域側のブロックにより多くのビッ
トが割り付けられるようにすると効果的である。
【0008】一方、前述の様々な手法を用いた圧縮装置
に大振幅(0dB付近)の信号が入力されると、量子化
誤差の影響により伸張装置の出力部において有限の語長
に変換した際にオーバーフローを生じ、クリッピングに
よる高調波が発生するようになる。この高調波は、アナ
ログの信号に変換した際に折り返しによって圧縮装置に
入力された信号よりも低い周波数となり、人間に雑音と
して認識されることになる。この問題に対しては、圧縮
装置において量子化誤差の分をあらかじめ補正すること
によって容易に解決できる。
【0009】
【発明が解決しようとする課題】上記提案の手法は上述
したように音声データの圧縮において非常に有効なもの
である。しかしながら、前述の提案のような手法を用い
ると量子化誤差は入力の信号によって変化し、より効果
的な手法では低域側の量子化誤差は比較的小さくなる
が、高域側の量子化誤差はそれに比べ大きくなる傾向が
生じる。従って量子化誤差の大きい部分に合わせて補正
を行うと量子化誤差の小さい部分のレベル変動が無視で
きなくなる虞れがある。また、量子化誤差の小さい部分
のレベル変動が無視できる程度の補正では量子化誤差の
大きい部分でのオーバーフローを防ぐことが出来なくな
る虞れがある。
【0010】そこで本発明は、このような実情に鑑みて
なされたものであり、量子化誤差の小さい部分のレベル
変動を押さえつつ、量子化誤差の大きい部分のレベル変
動を補正することによって大振幅(0dB付近)の入力
に対する伸張装置でのオーバフローを防ぎ、可聴帯域で
の雑音の増加を抑えて聴感上良好な音質を得られるレベ
ル補整手法を用いた音声データ符号化方法及び符号化装
置の提供を目的とするものである。
【0011】
【課題を解決するための手段】本発明の音声データ符号
化方法は、上述の目的を達成するために提案されたもの
であり、人間の聴覚特性に応じてディジタル音声データ
を再量子化する音声データ符号化方法であって、量子化
誤差を求め、その量子化誤差と入力レベルとからレベル
補正値を求め、このレベル補正値に応じてディジタル音
声データのレベル補正を行うようにしたものである。
【0012】さらに量子化誤差と無関係でかつ一定な、
誤差を固定的に補正する固定補正値を発生し、この固定
補正値と量子化誤差とに応じたレベル補正を行うように
する。
【0013】また、上記レベル補正は、量子化誤差が予
め設定した値を越えた場合に行い、予め決められた音声
データの圧縮率に応じて行うようにする。
【0014】次に、本発明の音声データ符号化装置は、
人間の聴覚特性に応じてディジタル音声データを再量子
化する音声データ符号化装置であって、量子化誤差を求
める量子化誤差算出手段と、上記量子化誤差と入力レベ
ルとからレベル補正値を求めるレベル補正値算出手段
と、上記レベル補正値に応じてディジタル音声データの
レベル補正を行うレベル補正手段とを有してなるもので
ある。
【0015】さらに量子化誤差と無関係でかつ一定な、
誤差を固定的に補正する固定補正値を発生する固定補正
値発生手段を有し、上記固定補正値と量子化誤差とに応
じたレベル補正を行うようにする。
【0016】ここで、本発明の音声データ符号化方法又
は符号化装置での符号化の際には、音声データを所定時
間で分割されたブロックに対して予め定められた所定ビ
ット数のビットを、固定ビットと割当ビットとに分割使
用すると共に、入力信号のスペクトルに応じて上記固定
ビットと割当ビットの分割比を可変する。
【0017】また、上記符号化の際には、直交変換を利
用するようにしている。
【0018】すなわち、本発明に係る音声データ符号化
方法及び音声データ符号化装置によれば、上記レベル補
正の際に符号化にともなう量子化誤差の量を判断し、量
子化誤差の大きい部分ではより大きなレベル補正を行
い、量子化誤差の小さい部分では小さいレベル補正を行
うことによって、上述の問題を解決する。
【0019】ここで、上記量子化誤差の量から決定され
るレベルの補正値は、周波数軸上で可変とするととも
に、時間軸上でも可変とするとより効果的である。
【0020】また、量子化誤差の量と補正値を一義的に
決めるのではなく、入力信号の振幅情報と加味し、補正
の変換率、例えば振幅圧縮の特性を切り替える手法でも
良好な結果が得られる。
【0021】一方、レベル補正値を変化させる際、急激
な変化は人間の聴感上悪い作用を及ぼすので、急激な変
化を抑制するような手法、例えばヒステリシス特性を持
たせる等の手法を併用するとより効果的である。
【0022】
【作用】本発明によれば、量子化誤差と入力レベルとか
ら求めたレベル補正値に応じて音声データのレベル補正
を行うようにしているため、聴感にあった効率の良いビ
ット割当を実現する際に、量子化誤差の影響による伸張
装置でのオーバーフローから生じる低域の雑音の発生を
抑制できる。しかも、その際の比較的量子化誤差の少な
い部分のレベル変動も容易に押さえることが出来る。し
たがって、より低いビットレートで高音質の音楽信号を
符号化することが可能となる。
【0023】
【実施例】以下、本発明の音声データ符号化方法及びこ
の方法が適用される音声データ符号化装置の実施例を図
面を参照しながら説明する。
【0024】本実施例の音声データ符号化装置は、図1
に示すような人間の聴覚特性に応じてディジタル音声デ
ータを再量子化する音声データ符号化装置であって、こ
の図1のレベル補正回路22,23,24には、図3に
示すような、量子化誤差を求める量子化誤差算出部30
3と、上記量子化誤差と入力レベルとからレベル補正値
を求めるレベル補正値算出部304と、上記レベル補正
値に応じてディジタル音声データのレベル補正を行うレ
ベル補正部308とを有してなるものである。
【0025】さらに、上記図1のレベル補正回路22,
23,24には、図3に示すように、量子化誤差と無関
係でかつ一定な、誤差を固定的に補正する固定補正値を
発生する固定補正値発生部(固定補正値表)306を有
しており、図1の本実施例の音声データ符号化装置では
上記固定補正値と量子化誤差とに応じたレベル補正を行
うようにしている。
【0026】以下、図1〜図4を用いて本実施例の符号
化方法及び符号化装置について詳細に説明する。なお、
本発明には、オーディオPCM信号等の入力ディジタル
信号を、いわゆる帯域分割符号化(SBC)、適応変換
符号化(ATC)及び適応ビット割当て(APC−A
B)等の各技術を用いる高能率符号化技術を適用するこ
とができる。
【0027】先ず、図1に示す本実施例の音声データ符
号化装置(高能率符号化装置)では、入力ディジタル信
号をフィルタ等により複数の周波数帯域に分割すると共
に、各周波数帯域毎に直交変換を行って、得られた周波
数軸のスペクトルデータを、後述する人間の聴覚特性を
考慮したいわゆる臨界帯域幅(クリティカルバンド)毎
に適応的にビット割当して符号化している。もちろんフ
ィルタ等による非ブロッキングの周波数分割幅は等分割
幅としてもよい。
【0028】さらに、本発明実施例においては、上記直
交変換の前に入力信号に応じて適応的にブロックサイズ
(ブロック長)を変化させると共に、クリティカルバン
ド単位もしくは高域では臨界帯域幅(クリティカルバン
ド)を更に細分化したブロックでフローティング処理を
行っている。
【0029】なお、上記クリティカルバンドとは、人間
の聴覚特性を考慮して分割された周波数帯域であり、あ
る純音の周波数近傍の同じ強さの狭帯域バンドノイズに
よって当該純音がマスクされるときのそのノイズの持つ
帯域のことである。このクリティカルバンドは、高域ほ
ど帯域幅が広くなっており、0〜20kHzの全周波数帯
域が例えば25のクリティカルバンドに分割される。
【0030】すなわち、図1において、入力端子10に
は例えば0〜20kHzのオーディオPCM信号が供給さ
れている。この入力信号は、例えばいわゆるQMFフィ
ルタ等の帯域分割フィルタ11により0〜10kHz帯域
と10kHz〜20kHz帯域とに分割され、0〜10kHz
帯域の信号は同じくいわゆるQMFフィルタ等の帯域分
割フィルタ12により0〜5kHz帯域と5kHz〜10k
Hz帯域とに分割される。
【0031】なお、上記QMFフィルタは、例えば、19
76 R.E.Crochiere Digital codingof speech in subba
ndsBell Syst.Tech. J. Vol.55,No.8 1976 に述べられ
ている。さらに、例えば、ICASSP 83,BOSTON Polyphase
Quadrature filters-A newsubband coding techniqueJ
oseph H. Rothweilerには、等バンド幅のフィルタ分割
手法が述べられている。
【0032】上記帯域分割フィルタ11からの10kHz
〜20kHz帯域の信号は直交変換回路の一例であるModi
fied Discrete Cosine Transform(MDCT)回路13に送
られ、上記帯域分割フィルタ12からの5kHz〜10k
Hz帯域の信号はMDCT回路14に送られ、上記帯域分
割フィルタ12からの0〜5kHz帯域の信号はMDCT
回路15に送られることにより、それぞれMDCT処理
される。
【0033】なお、上記MDCTについては、ICASSP 1
987 Subband/Transform CodingUsing Filter Bank De
signs Based on Time Domain Aliasing CancellationJ.
P.Princen A.B.Bradley Univ. of Surrey Royal Melb
ourne Inst.of Tech. に述べられている。また、上述し
た直交変換としては、例えば、入力オーディオ信号を所
定単位時間(フレーム)でブロック化し、当該ブロック
毎に高速フーリエ変換(FFT),コサイン変換(DC
T)等も考えられる。
【0034】ここで、本実施例の符号化装置での符号化
の際には、音声データを所定時間で分割したブロックに
対して予め定められた所定ビット数のビットを、固定ビ
ットと割当ビットとに分割使用すると共に、入力信号の
スペクトルに応じて上記固定ビットと割当ビットの分割
比を可変するようにしている。
【0035】このため、上記各帯域分割フィルタ11,
12の各出力は、上記MDCT回路13,14,15で
の直交変換の前に、入力信号に応じて適応的にブロック
サイズ(ブロック長)を変化させると共にクリティカル
バンド単位もしくは高域では臨界帯域幅(クリティカル
バンド)を更に細分化したブロックBでフローティング
処理を行うためのブロックBを決定するブロック決定回
路19,20,21にも送られる。
【0036】上記ブロック決定回路19,20,21に
よる各MDCT回路13,14,15へのブロックサイ
ズの具体例を図2に示す。この図2の具体例において、
本実施例では、高域側ほど周波数帯域を広げると共に時
間分解能を高め(ブロック長を短くし)ている。すなわ
ち、低域側の0〜5kHz帯域の信号でのブロックbL及
び中域の5kHz〜10kHz帯域の信号でのブロックbM
に対して、高域側の10kHz〜20kHz帯域の信号に
は、図中bH1,bH2のブロックで合計2回のMDC
Tが施される。
【0037】言い換えれば、本実施例では、各帯域の直
交変換ブロックサンプル数を同じにして装置の簡易化を
図りながら、クリティカルバンド幅の狭い低域側では周
波数分解能を高め、過渡的な信号に対して優勢な成分を
多く含む高域側では時間分解能を高めるようにしてい
る。また、各々の帯域は、信号の時間的変化が大きい場
合を想定して更に1/2、1/4の適応的なブロック分
割とすることも可能である。
【0038】再び図1に戻って、各MDCT回路13,
14,15にてMDCT処理されて得られた周波数軸上
のスペクトルデータあるいはMDCT係数データは、上
記臨界帯域(クリティカルバンド)又は高域では更にク
リティカルバンドを分割した帯域毎にまとめられて適応
ビット割当回路16,17,18及びレベル補正回路2
2,23,24に送られている。
【0039】上記適応ビット割当回路16,17,18
は、臨界帯域(クリティカルバンド)又は高域では更に
クリティカルバンドを分割した帯域毎に必要なビットレ
ートとなるように割り当てビット数を決定し、当該ビッ
ト数の割り当てを示す情報(ビット長情報)を、それぞ
れ対応する上記レベル補正回路22,23,24及び符
号化回路25,26,27へと送る。
【0040】上記各レベル補正回路22,23,24で
は、上記適応ビット割当回路16,17,18によって
割り当てられたビット数から、量子化で発生する量子化
誤差を求め、上記周波数軸上のスペクトルデータ或いは
MDCT係数データに対して、上記量子化誤差に応じた
レベル補正を施して、上記符号化回路25,26,27
へ送る。なおこの時のレベル補正の方法としては、入力
信号の大きさに応じて補正をかける方法でも良く、ま
た、入力信号の大きさによらず一定値としてもかまわな
い。
【0041】上記符号化回路25,26,27では、上
記レベル補正が施された周波数軸上のスペクトルデータ
或いはMDCT係数データを、上記対応する適応ビット
割当回路16,17,18で割り当てられたビット数に
応じて再量子化している。
【0042】このようにして符号化されたデータは、出
力端子28,29,30を介して取り出される。また、
このとき、どのような信号の大きさに関する正規化がな
されたかを示す、フローティング情報と、どのようなビ
ット長で量子化がされたかを示すビット長情報(これら
情報は上記ブロック決定回路19,20,21から得ら
れる)も出力端子31,32,33を介して後段の構成
に同時に送られる。
【0043】次に、図3に示す各レベル補正回路22,
23,24の具体的構成及び動作について説明する。
【0044】この図3において、上記図1における各M
DCT回路13,14,15の出力は、図3の入力端子
302に供給される。この各MDCT回路13,14,
15からの出力は、上記レベル補正部308、レベル補
正値算出部305及び量子化誤差算出部303に送られ
る。
【0045】また、図1における各適応ビット割当回路
16,17,18の出力は、図3の入力端子301を介
して量子化誤差算出部303に送られる。当該量子化誤
差算出部303では、上記適応ビット割当回路16,1
7,18の出力と先のMDCT回路13,14,15の
出力とから量子化誤差を求める。すなわち、当該量子化
誤差算出部303では、スペクトラムの大きさに対する
ビットの割当数から量子化誤差を求める。
【0046】この量子化誤差算出部303の出力は、先
のMDCT回路13,14,15の出力と共に、レベル
補正値算出部304へと送られ、ここでスペクトラムの
大きさと量子化誤差から各スペクトラム毎のレベル補正
値が求められる。なお、この時、上記レベル補正値は何
本かのスペクトラムをまとめたバンド毎に求めるように
してもよい。
【0047】また、同時に、システム固有の固定的誤差
を補正するための情報が予め用意されている固定補正値
発生部(固定補正値表)306からの当該固定的誤差を
補正するための情報が、上記レベル補正値算出部304
に送られる。なお、この固定の補正値はゼロであっても
かまわない。
【0048】上述のようにして求められたレベル補正値
は、変化量抑制部305へ送られる。この変化量抑制部
305では、急激なレベル補正によって発生する人間の
聴感上の違和感を低減するようなレベル変化の抑制処理
を行う。すなわち、当該変化量抑制部305では、過去
の補正値を保持する過去の補正値発生部(過去の補正値
表)307から供給される当該過去の補正値と、上記レ
ベル補正値算出部304の出力とが比較され、上記過去
の補正値と上記レベル補正値算出部304の出力との変
化が一定以上ある場合はレベル補正値を修正する。な
お、この時の修正法は一定率で行っても良いし、特定の
特性、あるいは近似式によって行っても良い。上記変化
量抑制部305によって修正を受けたレベル補正値は、
レベル補正部308へ入力され、当該レベル補正部30
8で図1におけるMDCT回路13,14,15の出力
のレベルが補正され、出力端子309から図1における
符号化回路25,26,27へ送られる。
【0049】なお、本実施例では、上記図1のレベル補
正回路22,23,24並びに符号化回路25,26,
27を別回路としているが、同一の回路として実施して
も容易に構成できる。
【0050】図4を用いて上述した本発明実施例の符号
化方法及び符号化装置における効果について説明する。
【0051】例えば、図4の(a) に示すように、人間に
聞こえやすい低域での量子化誤差を小さく、聞こえにく
い高域での量子化誤差を大きく量子化した場合におい
て、周波数に関係なく固定のレベル補正を行うと、図4
の(b) に示すように量子化誤差の小さい低域のレベル変
化Lが無視できなくなる。
【0052】この場合、本発明実施例の符号化方法を用
いて、例えば図4の(c) のように、量子化誤差に応じた
レベル補正を行うと、低域におけるレベル変動は無視で
きる程度となる。なお、このとき、低域と高域でのレベ
ルに差が生じる結果となるが、もともとの量子化誤差量
が人間の聴感特性を応用して決定した結果であるから、
このレベル差も聴感上の大きな問題とはならない。
【0053】
【発明の効果】上述のように、本発明の音声データ符号
化方法においては、レベル補正の際に符号化に伴う量子
化誤差の量を判断し、量子化誤差の大きい部分ではより
大きなレベル補正を行い、量子化誤差の小さい部分では
小さいレベル補正を行うことによって、大振幅入力時の
クリッピングによるノイズの発生を効率良く抑制するだ
けでなく抑制の際のレベル変動も人間の聴感上好ましい
ものとすることができ、したがって、小規模で音質のよ
い音声データ符号化装置を実現することができる。
【図面の簡単な説明】
【図1】本実施例の音声データ符号化装置の構成例を示
すブロック回路図である。
【図2】本実施例装置における信号の周波数及び時間分
割を示す図である。
【図3】本実施例装置のレベル補正回路の一具体例を示
すブロック回路図である。
【図4】本発明実施例の効果の一例を説明するための図
である。
【符号の説明】
10・・・・・・・・・・音声信号の入力端子 11,12・・・・・・・帯域分割フィルタ 13,14,15・・・・MDCT回路 16,17,18・・・・適応ビット割当回路 19,20,21・・・・ブロックサイズ決定回路 22,23,24・・・・レベル補正回路 25,26,27・・・・符号化回路 28,29,30・・・・符号化データの出力端子 31,32,33・・・・ビット長情報,フローティン
グ情報の出力端子

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 人間の聴覚特性に応じてディジタル音声
    データを再量子化する音声データ符号化方法おいて、 量子化誤差を求め、その量子化誤差と入力レベルとから
    レベル補正値を求め、このレベル補正値に応じてディジ
    タル音声データのレベル補正を行うことを特徴とする音
    声データ符号化方法。
  2. 【請求項2】 さらに量子化誤差と無関係でかつ一定
    な、誤差を固定的に補正する固定補正値を発生し、この
    固定補正値と上記量子化誤差とに応じたレベル補正を行
    うことを特徴とする請求項1記載の音声データ符号化方
    法。
  3. 【請求項3】 上記レベル補正は、上記量子化誤差が予
    め設定した値を越えた場合に行うことを特徴とする請求
    項1記載の音声データ符号化方法。
  4. 【請求項4】 上記レベル補正は、予め決められた音声
    データの圧縮率に応じて行うことを特徴とする請求項1
    記載の音声データ符号化方法。
  5. 【請求項5】 人間の聴覚特性に応じてディジタル音声
    データを再量子化する音声データ符号化装置において、 量子化誤差を求める量子化誤差算出手段と、 上記量子化誤差と入力レベルとからレベル補正値を求め
    るレベル補正値算出手段と、 上記レベル補正値に応じてディジタル音声データのレベ
    ル補正を行うレベル補正手段とを有してなることを特徴
    とする音声データ符号化装置。
  6. 【請求項6】 さらに量子化誤差と無関係でかつ一定
    な、誤差を固定的に補正する固定補正値を発生する固定
    補正値発生手段を有し、 上記固定補正値と上記量子化誤差とに応じたレベル補正
    を行うことを特徴とする請求項5記載の音声データ符号
    化装置。
  7. 【請求項7】 符号化の際には、音声データを所定時間
    で分割されたブロックに対して予め定められた所定ビッ
    ト数のビットを、固定ビットと割当ビットとに分割使用
    すると共に、入力信号のスペクトルに応じて上記固定ビ
    ットと割当ビットの分割比を可変することを特徴とする
    請求項1、2、3、4、5及び6記載の音声データ符号
    化方法又は音声データ符号化装置
  8. 【請求項8】 上記符号化の際には、直交変換を利用す
    ることを特徴とする請求項7記載の音声データ符号化方
    法又は音声データ符号化装置。
JP20261492A 1992-07-29 1992-07-29 音声データ符号化方法及び音声データ符号化装置 Expired - Fee Related JP3189401B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP20261492A JP3189401B2 (ja) 1992-07-29 1992-07-29 音声データ符号化方法及び音声データ符号化装置
EP93304865A EP0581435A3 (en) 1992-07-29 1993-06-22 Audio data coding methods and apparatus
KR1019930014498A KR940003232A (ko) 1992-07-29 1993-07-29 음성 데이타 부호화 방법
US08/684,329 US5642383A (en) 1992-07-29 1996-07-19 Audio data coding method and audio data coding apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP20261492A JP3189401B2 (ja) 1992-07-29 1992-07-29 音声データ符号化方法及び音声データ符号化装置

Publications (2)

Publication Number Publication Date
JPH0653911A true JPH0653911A (ja) 1994-02-25
JP3189401B2 JP3189401B2 (ja) 2001-07-16

Family

ID=16460313

Family Applications (1)

Application Number Title Priority Date Filing Date
JP20261492A Expired - Fee Related JP3189401B2 (ja) 1992-07-29 1992-07-29 音声データ符号化方法及び音声データ符号化装置

Country Status (4)

Country Link
US (1) US5642383A (ja)
EP (1) EP0581435A3 (ja)
JP (1) JP3189401B2 (ja)
KR (1) KR940003232A (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3186307B2 (ja) * 1993-03-09 2001-07-11 ソニー株式会社 圧縮データ記録装置及び方法
US5946652A (en) * 1995-05-03 1999-08-31 Heddle; Robert Methods for non-linearly quantizing and non-linearly dequantizing an information signal using off-center decision levels
US6047035A (en) * 1998-06-15 2000-04-04 Dspc Israel Ltd. Method and device for quantizing the input to soft decoders
EP0989559A1 (en) * 1998-09-23 2000-03-29 Deutsche Thomson-Brandt Gmbh Disturbance detection in a data signal
US6937912B1 (en) * 1999-04-16 2005-08-30 Orban, Inc. Anti-aliased clipping by band-limited modulation with step functions
US7010491B1 (en) * 1999-12-09 2006-03-07 Roland Corporation Method and system for waveform compression and expansion with time axis
US6678656B2 (en) * 2002-01-30 2004-01-13 Motorola, Inc. Noise reduced speech recognition parameters
KR100456693B1 (ko) * 2002-03-28 2004-11-10 삼성전자주식회사 다중채널 통신 시스템의 비트 할당을 최적화하여 셋업시간을 최소화하는 방법
US7156612B2 (en) * 2005-04-05 2007-01-02 Pratt & Whitney Canada Corp. Spigot arrangement for a split impeller
US7418394B2 (en) * 2005-04-28 2008-08-26 Dolby Laboratories Licensing Corporation Method and system for operating audio encoders utilizing data from overlapping audio segments
JP5125797B2 (ja) * 2008-06-19 2013-01-23 富士通株式会社 振幅抑圧装置および信号送信装置
JP2012103395A (ja) * 2010-11-09 2012-05-31 Sony Corp 符号化装置、符号化方法、およびプログラム

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU564770B2 (en) * 1981-07-17 1987-08-27 Nippon Electric Co. Ltd. Forward and inverse quantization by varying a reference step size
US4535472A (en) * 1982-11-05 1985-08-13 At&T Bell Laboratories Adaptive bit allocator
IL80103A0 (en) * 1986-09-21 1987-01-30 Eci Telecom Limited Adaptive differential pulse code modulation(adpcm)system
NL8700985A (nl) * 1987-04-27 1988-11-16 Philips Nv Systeem voor sub-band codering van een digitaal audiosignaal.
US4956871A (en) * 1988-09-30 1990-09-11 At&T Bell Laboratories Improving sub-band coding of speech at low bit rates by adding residual speech energy signals to sub-bands
JPH03117919A (ja) * 1989-09-30 1991-05-20 Sony Corp ディジタル信号符号化装置
JPH04127747A (ja) * 1990-09-19 1992-04-28 Toshiba Corp 可変レート符号化方式
JP2906646B2 (ja) * 1990-11-09 1999-06-21 松下電器産業株式会社 音声帯域分割符号化装置
JP3134337B2 (ja) * 1991-03-30 2001-02-13 ソニー株式会社 ディジタル信号符号化方法
KR930009436B1 (ko) * 1991-12-27 1993-10-04 삼성전자 주식회사 파형부호화/복호화 장치 및 방법
JP3134455B2 (ja) * 1992-01-29 2001-02-13 ソニー株式会社 高能率符号化装置及び方法

Also Published As

Publication number Publication date
JP3189401B2 (ja) 2001-07-16
EP0581435A3 (en) 1996-09-04
EP0581435A2 (en) 1994-02-02
US5642383A (en) 1997-06-24
KR940003232A (ko) 1994-02-21

Similar Documents

Publication Publication Date Title
JP3134455B2 (ja) 高能率符号化装置及び方法
US5737718A (en) Method, apparatus and recording medium for a coder with a spectral-shape-adaptive subband configuration
KR100397690B1 (ko) 데이터부호화장치및그방법
JP3297051B2 (ja) 適応ビット配分符号化装置及び方法
JP3343962B2 (ja) 高能率符号化方法及び装置
KR100310214B1 (ko) 신호인코딩또는디코딩장치와레코딩매체
JP3153933B2 (ja) データ符号化装置及び方法並びにデータ復号化装置及び方法
US5699484A (en) Method and apparatus for applying linear prediction to critical band subbands of split-band perceptual coding systems
WO1994028633A1 (fr) Appareil et procede de codage ou decodage de signaux, et support d'enregistrement
US6415251B1 (en) Subband coder or decoder band-limiting the overlap region between a processed subband and an adjacent non-processed one
JPH07160292A (ja) 多層符号化装置
US5781586A (en) Method and apparatus for encoding the information, method and apparatus for decoding the information and information recording medium
US5754127A (en) Information encoding method and apparatus, and information decoding method and apparatus
JP3189401B2 (ja) 音声データ符号化方法及び音声データ符号化装置
JP3557674B2 (ja) 高能率符号化方法及び装置
JPH09101799A (ja) 信号符号化方法及び装置
US6064698A (en) Method and apparatus for coding
JP3291948B2 (ja) 高能率符号化方法及び装置、並びに伝送媒体
JPH07221650A (ja) 情報符号化方法及び装置並びに情報復号化方法及び装置
KR100340368B1 (ko) 고능률부호화장치,복호화장치및디지털데이터도출방법
JPH07336231A (ja) 信号符号化方法及び装置、信号復号化方法及び装置、並びに記録媒体
JP3134384B2 (ja) 符号化装置及び方法
JPH08237130A (ja) 信号符号化方法及び装置、並びに記録媒体
JP3141853B2 (ja) オーディオ信号処理方法
JP3200886B2 (ja) オーディオ信号処理方法

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20010417

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090518

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100518

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100518

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110518

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120518

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees