JPH07273657A - 情報符号化方法及び装置、情報復号化方法及び装置、並びに情報伝送方法及び情報記録媒体 - Google Patents

情報符号化方法及び装置、情報復号化方法及び装置、並びに情報伝送方法及び情報記録媒体

Info

Publication number
JPH07273657A
JPH07273657A JP6064855A JP6485594A JPH07273657A JP H07273657 A JPH07273657 A JP H07273657A JP 6064855 A JP6064855 A JP 6064855A JP 6485594 A JP6485594 A JP 6485594A JP H07273657 A JPH07273657 A JP H07273657A
Authority
JP
Japan
Prior art keywords
gain control
information
signal
control correction
waveform
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6064855A
Other languages
English (en)
Other versions
JP3186412B2 (ja
Inventor
Kiyouya Tsutsui
京弥 筒井
Hedoru Robaato
ロバート・ヘドル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP06485594A priority Critical patent/JP3186412B2/ja
Publication of JPH07273657A publication Critical patent/JPH07273657A/ja
Priority to US08/868,665 priority patent/US5752224A/en
Application granted granted Critical
Publication of JP3186412B2 publication Critical patent/JP3186412B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Abstract

(57)【要約】 【目的】 アタック部の振幅変化の度合に応じたゲイン
制御により、より効率的でより音質の高い符号化、復号
化を行うと共に、プリエコー発生を防止する。 【構成】 (A)のアタック部の直前レベルがある程度
以上の信号波形SW1には(B)に示すゲイン制御量が
比較的小さいゲイン制御関数G1を適用し、アタック部
直前のレベルが非常に低い信号波形SW2にはゲイン制
御量が比較的大きい(例えば40dB以上70dB以
下)ゲイン制御関数G2を適用してゲイン制御、ゲイン
制御補正の処理を行う。このように信号波形のアタック
部における振幅変化の度合いに応じてゲイン制御量を変
化させることによって、プリエコーの発生と、周波数領
域でのエネルギの拡散による効率低下とを回避してい
る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、いわゆる高能率符号化
によって入力ディジタルデータの符号化を行ない伝送、
記録、再生し、復号化して再生信号を得る、ディジタル
データなどの情報を符号化する情報符号化方法及び装
置、情報復号化方法及び装置、並びに情報伝送方法及び
情報記録媒体に関するものである。
【0002】
【従来の技術】従来より、オーディオ或いは音声等の信
号の高能率符号化の手法には種々あるが、例えば、時間
軸の信号を所定時間単位でブロック化してこのブロック
毎の時間軸の信号を周波数軸上の信号に変換(スペクト
ル変換)して複数の周波数帯域に分割し、各帯域毎に符
号化するブロック化周波数帯域分割方式であるいわゆる
変換符号化や、時間軸上のオーディオ信号等をブロック
化しないで、複数の周波数帯域に分割して符号化する非
ブロック化周波数帯域分割方式であるいわゆる帯域分割
符号化(サブ・バンド・コーディング:SBC)等を挙
げることができる。また、上述の帯域分割符号化と変換
符号化とを組み合わせた高能率符号化の手法も考えられ
ており、この場合には、例えば、上記帯域分割符号化で
帯域分割を行った後、該各帯域毎の信号を周波数軸上の
信号にスペクトル変換し、このスペクトル変換された各
帯域毎に符号化が施される。
【0003】ここで、上述した帯域分割符号化において
用いられる帯域分割用フィルタとしては、例えばQMF
などのフィルタがあり、このQMFのフィルタは、文献
「ディジタル・コーディング・オブ・スピーチ・イン・
サブバンズ」("Digital coding of speech in subband
s" R.E.Crochiere, Bell Syst.Tech. J., Vol.55,No.8
1976) に述べられている。このQMFのフィルタは、
帯域を等バンド幅に2分割するものであり、当該フィル
タにおいては上記分割した帯域を後に合成する際にいわ
ゆるエリアシングが発生しないことが特徴となってい
る。
【0004】また、文献「ポリフェイズ・クァドラチュ
ア・フィルターズ −新しい帯域分割符号化技術」("Po
lyphase Quadrature filters -A new subband coding t
echnique", Joseph H. Rothweiler ICASSP 83, BOSTON)
には、等帯域幅のフィルタ分割手法が述べられている。
このポリフェイズ・クァドラチュア・フィルタにおいて
は、信号を等バンド幅の複数の帯域に分割する際に一度
に分割できることが特徴となっている。
【0005】また、上述したスペクトル変換としては、
例えば、入力オーディオ信号を所定単位時間(フレー
ム)でブロック化し、当該ブロック毎に離散フーリエ変
換(DFT)、離散コサイン変換(DCT)、モディフ
ァイド離散コサイン変換(MDCT)等を行うことで時
間軸を周波数軸に変換するようなスペクトル変換があ
る。なお、上記MDCTについては、文献「時間領域エ
リアシング・キャンセルを基礎とするフィルタ・バンク
設計を用いたサブバンド/変換符号化」("Subband/Tran
sform Coding Using Filter Bank Designs Based on Ti
me Domain AliasingCancellation," J.P.Princen A.B.B
radley, Univ. of Surrey Royal MelbourneInst. of Te
ch. ICASSP 1987)に述べられている。
【0006】このようにフィルタやスペクトル変換によ
って帯域毎に分割された信号を量子化することにより、
量子化雑音が発生する帯域を制御することができ、いわ
ゆるマスキング効果などの性質を利用して聴覚的により
高能率な符号化を行うことができる。また、ここで量子
化を行う前に、各帯域毎に、例えばその帯域における信
号成分の絶対値の最大値で正規化を行うようにすれば、
さらに高能率な符号化を行うことができる。
【0007】ここで、周波数帯域分割された各周波数成
分を量子化する場合の周波数分割幅としては、例えば人
間の聴覚特性を考慮した帯域幅を用いることが多い。す
なわち、一般に高域ほど帯域幅が広くなるような臨界帯
域(クリティカルバンド)と呼ばれている帯域幅で、オ
ーディオ信号を複数(例えば25バント)の帯域に分割
することがある。また、この時の各帯域毎のデータを符
号化する際には、各帯域毎に所定のビット配分或いは、
各帯域毎に適応的なビット割当て(ビットアロケーショ
ン)による符号化が行われる。例えば、上記MDCT処
理されて得られた係数データを上記ビットアロケーショ
ンによって符号化する際には、上記各ブロック毎のMD
CT処理により得られる各帯域毎のMDCT係数データ
に対して、適応的な割当てビット数で符号化が行われる
ことになる。ビット割当手法としては、次の2手法が知
られている。
【0008】例えば、文献「音声信号の適応変換符号
化」("Adaptive Transform Coding of Speech Signal
s", IEEE Transactions of Accoustics, Speech, and S
ignal Processing, vol.ASSP-25, No.4, August 1977
)では、各帯域毎の信号の大きさをもとに、ビット割
当を行っている。この方式では、量子化雑音スペクトル
が平坦となり、雑音エネルギー最小となるが、聴感覚的
にはマスキング効果が利用されていないために実際の雑
音感は最適ではない。
【0009】また、例えば文献「臨界帯域符号化器 −
ディジタル・エンコーディング・オブ・パーセプチュア
ル・リクワイアメンツ・オブ・ジ・オーディトリィ・シ
ステム」("The critical band coder --digital encod
ing of the perceptual requirements of the auditor
y system", M.A.Kransner MIT, ICASSP 1980)では、聴
覚マスキングを利用することで、各帯域毎に必要な信号
対雑音比を得て固定的なビット割当を行う手法が述べら
れている。しかしこの手法では、サイン波入力で特性を
測定する場合でも、ビット割当が固定的であるために特
性値がそれほど良い値とならない。
【0010】これらの問題を解決するために、ビット割
当に使用できる全ビットが、各小ブロック毎にあらかじ
め定められた固定ビット割当パターン分と、各ブロック
の信号の大きさに依存したビット配分を行う分に分割使
用され、その分割比を入力信号に関係する信号に依存さ
せ、前記信号のスペクトルが滑らかなほど前記固定ビッ
ト割当パターン分への分割比率を大きくする高能率符号
化装置が提案されている。
【0011】この方法によれば、サイン波入力のよう
に、特定のスペクトルにエネルギーが集中する場合には
そのスペクトルを含むブロックに多くのビットを割り当
てる事により、全体の信号対雑音特性を著しく改善する
ことができる。一般に、急峻なスペクトル成分をもつ信
号に対して人間の聴覚は極めて敏感であるため、このよ
うな方法を用いる事により、信号対雑音特性を改善する
ことは、単に測定上の数値を向上させるばかりでなく、
聴感上、音質を改善するのに有効である。
【0012】ビット割り当ての方法にはこの他にも数多
くのやり方が提案されており、さらに聴覚に関するモデ
ルが精緻化され、符号化装置の能力があがれば聴覚的に
みてより高能率な符号化が可能になる。
【0013】ところで、波形信号をスペクトルに変換す
る方法として上述のDFTやDCTを使用した場合に
は、M個のサンプルからなる時間ブロックで変換を行う
とM個の独立な実数データが得られる。時間ブロック間
の接続歪みを軽減するために、通常、両隣のブロックと
それぞれM1 個のサンプルずつオーバーラップさせるの
で、平均して、DFTやDCTでは(M−M1 )個のサ
ンプルに対してM個の実数データを量子化して符号化す
ることになる。
【0014】これに対してスペクトルに変換する方法と
して上述のMDCTを使用した場合には、両隣の時間と
N個ずつオーバーラップさせた2M個のサンプルから、
独立なM個の実数データが得られるので平均して、MD
CTではM個のサンプルに対してM個の実数データを量
子化して符号化することになる。復号化装置において
は、このようにしてMDCTを用いて得られた符号から
各ブロックにおいて逆変換を施して得られた波形要素を
互いに干渉させながら加え合わせることにより、波形信
号を再構成することができる。
【0015】一般に変換のための時間ブロックを長くす
ることによって、スペクトルの周波数分解能が高まり特
定のスペクトル成分にエネルギーが集中する。したがっ
て、両隣のブロックと半分ずつオーバーラップさせて長
いブロック長で変換を行い、しかも得られたスペクトル
信号の個数が、元の時間サンプルの個数に対して増加し
ないMDCTを使用することにより、DFTやDCTを
使用した場合よりも効率の良い符号化を行うことが可能
となる。また、隣接するブロック同士に十分長いオーバ
ーラップを持たせることによって、波形信号のブロック
間歪みを軽減することもできる。
【0016】このように、信号をいったん周波数成分に
分解し、その周波数成分を量子化して符号化する方法を
用いると、その周波数成分を復号化して合成して得られ
た波形信号にも量子化雑音が発生するが、もし、元々の
信号成分が急激に変化する場合には、波形信号上の量子
化雑音は必ずしも元の信号波形が大きくない部分でも大
きくなってしまい、この量子化雑音が同時マスキングに
よって隠蔽されないため聴感上の障害になる。音が急激
に大きくなるアタック部でこのようにして発生する量子
化雑音はプリエコーと呼ばれる。
【0017】特に、スペクトル変換を使用して多数の周
波数成分に分解した場合には、時間分解能が悪くなり、
長い期間にわたってプリエコーが発生してしまう。
【0018】ここで、帯域分割の際にスペクトル変換を
使用した場合のプリエコーの発生の動作原理について、
図7を参照しながら説明する。
【0019】図7の(A)に示す窓関数あるいはウィン
ドウ関数を用いて、入力波形信号SWに順スペクトル変
換を施したスペクトル信号に量子化雑音QNが加わった
場合に、この量子化雑音が加わったスペクトル信号に逆
スペクトル変換を施して再び時間軸上の波形信号に戻す
と、その量子化雑音は変換ブロック全体に拡がってしま
う。ここで、入力信号波形が(B)のように変換ブロッ
クの途中で急激に大きくなった場合には、元の信号波形
が小さい区間においては、量子化雑音QNが信号波形S
Wに対して大きくなってしまうため、同時マスキングが
効かず、プリエコーとして聴感上の障害になる。
【0020】ここで、スペクトル変換の変換長を短くす
れば上記の量子化雑音の発生期間も短くなるが、そうす
ると周波数分解能が悪くなり、準定常的な部分における
符号化効率が悪くなってしまう。このような問題を解決
する手段として、信号波形が急激に変化する部分におい
てのみ周波数分解能を犠牲にして変換長を短くする、と
いう方法が提案されている。
【0021】図8はこのようなプリエコーによる聴感上
の障害を軽減するために考案された従来技術の一例につ
いて説明するための図である。一般に、準定常的な信号
波形に対しては、変換ブロック長を長くした方が特定の
スペクトル係数に対してエネルギーが集中するので符号
化効率は高くなるが、音の大きさが急激に変化する部分
では変換ブロック長が長いと上述のプリエコーが問題に
なる。
【0022】そこで、音の大きさが急激に変化する部
分、例えば図8の(B)に示すような入力信号波形SW
の振幅が急激に大きくなるところでは、図8の(A)に
示すように、変換ブロック長を短くするような短変換窓
関数あるいは短変換ウィンドウ関数を掛けるようにし、
これによって上記プリエコーの発生期間を十分短くすれ
ば、元の信号によるいわゆる逆向マスキングが効き、聴
感上の障害が無くなる。図8の方法ではこのことを利用
して信号波形の各部分の性質に応じて変換ブロック長を
選択的に切り替えている。
【0023】この方法を用いると、準定常部では十分な
周波数分解能が確保されると共に、アタック部における
プリエコーも発生期間が十分に短くなりいわゆる逆向マ
スキングにより隠蔽されるため、効率の良い符号化が可
能となる。
【0024】しかし、このように変換長を可変にする方
法では、異なる長さの変換に対応した変換手段を符号化
装置、符号化装置に設ける必要がある。さらにこの方法
では、変換によって得られるスペクトル成分の数は変換
長の長さに比例するため、各スペクトル成分が対応する
周波数帯域も変換長によって異なり、複数のスペクトル
を、例えば臨界帯域幅毎にまとめて符号化しようとした
場合に、各臨界帯域に含まれるスペクトルの数も異なっ
てしまい、符号化、復号化の処理が煩雑になってしま
う。このように、変換長を可変にするやり方では、符号
化装置、復号化装置とも複雑なものになってしまう、と
いう欠点がある。
【0025】ところで、変換ブロック長を一定にしたま
まで上記プリエコーの問題を解決するための方法とし
て、特開平3−132228号公報には、入力された波
形信号に対して適応ゲイン制御を行った後、DFTやD
CTを用いてスペクトル信号に変換して符号化を行う方
法が述べられている。ここでゲイン制御とは、パワーレ
ベルの小さいところではそのゲインを大きく(振幅を増
幅)することである。
【0026】この方法においては、符号化装置はスペク
トル信号への変換を行う前に、アタック部ではゲインを
急激に下げたゲイン制御を行い、アタック部以外では減
衰に応じてそのゲインを再び上げて行くようゲイン制御
を行っており、復号化装置は、逆スペクトル変換して得
られた信号波形に対してゲイン制御を補正する逆ゲイン
制御を施した信号を出力する。このようにすると、マス
キング・レベルが低くなる小振幅の信号部分における量
子化雑音が抑圧される。また、変換長を常に一定にする
ことができるため、符号化装置、復号化装置の構成を簡
単にすることができる。
【0027】しかしながら、 この方法では信号の減衰
時にもゲイン制御を行う必要がある。一般にゲイン制御
を行うことは元の信号波形を歪ませることになるので、
スペクトルに変換した場合にエネルギーの分布が分散さ
れ、効率的な符号化を行うことが困難になる。特に信号
の減衰時には、前の音が後に発生した発生した音をマス
クする順向マスキングが有効に作用するため、量子化雑
音の発生を時間的に制御するよりも雑音レベルそのもの
を下げることが重要である。また、常にゲイン制御の処
理を行うことは、演算処理量の面から見ても好ましくな
い。
【0028】変換ブロック長を一定にしたままでプリエ
コーを防止する他の方法として、例えば特開昭61−2
01526号公報や特開昭63−7023号公報に示す
ような技術が知られている。これらの公報には、符号化
装置において、入力信号波形を時間ブロック毎に切り出
してウィンドウを掛けた後、アタック部を検出し、アタ
ック部直前の小振幅の波形を増幅してからDFTやDC
Tを用いてスペクトル信号に変換して符号化し、復号化
装置においては、復元されたスペクトル信号に逆DFT
(Inverse DFT:IDFT)や逆DCT(Inverse D
CT:IDCT)等の逆変換を施してから符号化装置で
アタック部直前の信号を増幅したことを補正する処理を
施すことにより、プリエコーを防止する方法が提案され
ている。この場合も、変換長を常に一定にでき、符号化
装置、復号化装置の構成を簡単にすることができる。
【0029】ここで図9は、上記特開昭61−2015
26号公報や特開昭63−7023号公報において示さ
れているウィンドウ化処理技術を用いた符号化復号化に
ついての動作原理を説明したものであり、図10及び図
11は、この技術を用いた符号化装置及び復号化装置の
処理の流れを示したものである。
【0030】図10の入力端子400には、例えば図9
の(A)に示すような信号波形が入力されており、ウィ
ンドウ回路401においては、時間的に順次連続しかつ
相互に重畳する時間窓を設定し時間波形信号を切り出す
ように、図9の(B)に示すウィンドウ関数(上記特開
昭61−201526号公報で言う特性カーブ)が掛け
合わされる。アタック部検出回路402は、入力信号の
振幅が急激に大きくなる箇所(アタック部)を検出す
る。ゲイン制御回路403においては、もしアタック部
が検出された場合には微小振幅部分を増幅するように処
理を行い、またアタック部が検出されなかった場合には
増幅処理を行わない。ゲイン制御回路403からの出力
は、順スペクトル変換回路404に送られてDFT、D
CT等によりスペクトル信号に変換される。こうして得
られたスペクトル信号は、正規化・量子化回路405に
て正規化および量子化された後、符号化回路406によ
って符号化され、出力端子407より符号列として取り
出される。
【0031】また、図11に示す復号化装置において
は、入力端子410に供給された符号列信号に対して、
復号化回路411にて上記符号化回路406での符号化
の逆の復号化が施され、逆正規化・逆量子化回路412
に送られる。逆正規化・逆量子化回路412からの出力
は、逆スペクトル変換回路413でIDFTやIDCT
等により時間領域への逆変換が行われた後に、ゲイン制
御補正回路414に送られて、上記符号化装置で施され
たゲイン制御処理を補正する処理が施される。ゲイン制
御補正回路414からの出力は、隣接ブロック合成回路
415に送られて隣接ブロックとの合成がなされ、出力
端子416を介して取り出される。
【0032】この方法では、上述のようにウィンドウ関
数が施された後、変形された波形信号に対してアタック
部の検出処理が行われるので、ブロックの両端において
は大振幅の部分も緩和されてしまい、例えば図9に示す
ように、ブロックBL1においては、アタック部が検出
されず、次のブロックBL2においてのみアタック部が
検出されることが生じ得るが、スペクトル変換として上
記DFTやDCTを用いた場合には、順スペクトル変換
を施して得られたスペクトルに対して逆スペクトル変換
を施せば元の時系列ブロックが完全に復元されるため、
復号化装置においてブロック毎にゲイン制御の補正処理
を施せば問題は生じない。
【0033】
【発明が解決しようとする課題】しかしながら、上述の
資料の中で具体的なゲイン制御量として示されているも
のは、その値が比較的小さく、例えば、上述の特開昭6
1−201526号、特開昭63−7023号公報に記
載のものでは、アタック部検出のための連続するサブブ
ロック間で20dB以上の差が有った時にゲイン制御を
行うものとしている。その具体例で示されているものに
おいて、ゲイン制御量が5すなわちアタック部直前の振
幅を5倍にしたものであるプリエコーは量子化雑音であ
るため、圧縮率が上がるにつれてより大きな聴感上の障
害となるが、圧縮率が高くなって例えば、44.1kH
z,16ビットでサンプリングされた20kHzのオー
ディオ信号を符号化して1チャネルあたり64キロビッ
ト/秒以下にしようとした場合に、ゲイン制御量が数倍
程度では、例えばカスタネット等の非常にアタックの強
い音楽信号に対してプリエコーによる音質劣化を回避す
ることはできなかった。
【0034】本発明は、このような実情に鑑みてなされ
たものであり、アタック部の振幅変化の度合に応じたゲ
イン制御を可能とし、より効率的でより音質の高い符号
化、復号化、記録あるいは伝送が行え、構成も簡単で、
圧縮率が高い場合であっても効果的にプリエコー防止が
行えるような情報符号化方法及び装置、情報復号化方法
及び装置、並びに情報伝送方法及び情報記録媒体の提供
を目的とするものである。
【0035】
【課題を解決するための手段】本発明はこのような実情
に鑑みてなされたものであり、本発明の情報符号化方法
は、入力信号を周波数成分に分解する周波数成分分解処
理と、上記周波数成分分解処理への入力波形信号のゲイ
ン制御処理と、上記周波数成分分解処理の出力情報及び
上記ゲイン制御の制御情報の符号化処理とを行い、波形
信号が急激に大きくなる部分でのゲイン制御処理のゲイ
ン制御量は複数種類の大きさから選択的に決定し、その
ゲイン制御量の最大値は40dB以上であることを特徴
とするものである。
【0036】また、本発明の情報符号化装置は、入力信
号を周波数成分に分解する周波数成分分解手段と、上記
周波数成分分解手段への入力波形信号のゲイン制御手段
と、上記周波数成分分解手段の出力情報及び上記ゲイン
制御の制御情報の符号化手段とを有し、波形信号が急激
に大きくなる部分でのゲイン制御処理のゲイン制御量は
複数種類の大きさから選択的に決定し、そのゲイン制御
量の最大値は40dB以上であることを特徴とするもの
である。
【0037】さらに、本発明の情報復号化方法は、周波
数成分信号及びゲイン制御補正情報の復号化処理と、波
形信号を合成する波形信号合成処理と、上記波形信号合
成処理の出力波形信号のゲイン制御補正処理とを行い、
波形信号が急激に大きくなる部分でのゲイン制御補正処
理のゲイン制御補正量は上記ゲイン制御補正情報の内容
に基づいて決定される複数の大きさの中から選択され、
ゲイン制御補正量に対応するゲイン制御量の最大値は4
0dB以上であることを特徴とする。
【0038】また、本発明の情報復号化装置は、周波数
成分信号及びゲイン制御補正情報の復号化手段と、波形
信号を合成する波形信号合成手段と、上記波形信号合成
手段の出力波形信号のゲイン制御補正手段とを有し、波
形信号が急激に大きくなる部分でのゲイン制御補正処理
のゲイン制御補正量は上記ゲイン制御補正情報の内容に
基づいて決定される複数の大きさの中から選択され、ゲ
イン制御補正量に対応するゲイン制御量の最大値は40
dB以上であることを特徴とする。
【0039】さらに本発明の情報伝送方法及び情報記録
媒体は、周波数成分信号情報及びゲイン制御補正情報が
伝送され、上記ゲイン制御補正情報はゲイン制御補正量
の情報を含み、波形信号が急激に大きくなる部分でのゲ
イン制御補正量は複数種類の中から選択され、当該ゲイ
ン制御補正量に対応するゲイン制御量の最大値は40d
B以上であることを特徴とする。
【0040】ここで、本発明においては、上記ゲイン制
御量の最大値は70dB以下である。また、符号化によ
る圧縮率は1/4以下である。さらに、上記周波数成分
分解処理は、時間軸上の信号を周波数軸上の信号に変換
するスペクトル変換処理を含む。またさらに、入力信号
は音響信号である。
【0041】また、本発明の伝送方法は記録方法も含む
ものである。
【0042】
【作用】本発明によれば、波形信号が急激に大きくなる
部分でのゲイン制御処理のゲイン制御量は複数種類の大
きさから選択的に決定し、そのゲイン制御量の最大値は
40dB以上とすること、すなわち、アタック部でのゲ
イン制御量を、そのアタック部での変化の度合いに応じ
て最大の場合アタック部直前において少なくとも40d
B以上のゲイン制御を行うことにより、圧縮率の高い場
合にも効果的にプリエコーを防止し、より効率的でより
音質の高い符号化、復号化、伝送を可能としている。
【0043】
【実施例】以下、本発明の好ましい実施例について、図
面を参照にしながら説明する。
【0044】図1は本発明の情報符号化方法が適用され
る符号化装置の実施例のブロック回路図を示したもので
ある。この図1において、入力端子100を介して符号
化装置に入力されたオーディオ信号は、帯域分割回路1
01によって帯域分割される。この帯域分割回路101
における帯域分割手段としては、前述したQMF等のフ
ィルタによる分割手段を用いても、また、MDCT等の
スペクトル変換によって得られたスペクトルを帯域毎に
グループ化するという手段を用いてもよい。また、一
旦、フィルタによって幾つかの帯域に分割されたものに
対してスペクトル変換を行ない、これによって得られた
スペクトルを帯域毎にグループ化するという手段を用い
てもよい。さらに、この帯域分割による各帯域の幅は均
一であっても、例えば臨界帯域幅に合わせるように不均
一にとっても良い。なお、図1の例では四つの帯域に分
割されているが、もちろんこの数はさらに多くしても、
或いは少なくしてもよい。
【0045】上記帯域分割回路101によって帯域分割
された信号は、ある時間ブロック毎に各帯域に対応する
正規化回路111,112,113,114によって正
規化が施され、ここでそれぞれ正規化係数と被正規化信
号に分解される。それぞれの被正規化信号は、それぞれ
量子化精度決定回路141の出力である量子化精度情報
に基づいて量子化回路121,122,123、124
によって量子化され、ここで被正規化・量子化信号へと
変換される。なお、図1においては、上記量子化精度決
定回路141からの各量子化回路121,122,12
3,124への量子化精度情報のうち、上記量子化回路
122へ送られる量子化精度情報は端子152を介し、
上記量子化回路123へ送られる量子化精度情報は端子
153を介し、上記量子化回路124へ送られる量子化
精度情報は端子154を介してそれぞれ対応する回路に
送られる。
【0046】上記量子化回路121,122,123,
124からの各被正規化・量子化信号と、上記正規化回
路111,112,113,114からの各正規化係数
と、上記量子化精度決定回路141からの各量子化精度
情報とは、マルチプレクサ131によって、順次符号列
とされ、この符号列が端子103から出力される。この
符号列は、その後、ディスク状やテープ状あるいは半導
体などの記録媒体に記録され、または伝送系から送信さ
れる。
【0047】ここで、図1の例においては、上記量子化
精度決定回路141は上記帯域分割回路101によって
帯域分割された各信号に基づいて上記量子化精度を計算
しているが、帯域分割前の端子100を介した信号から
計算することも可能であり、また、各正規化回路11
1,112,113,114からの正規化係数に基づい
て計算することも可能である。さらに、当該量子化精度
決定回路141での計算は、マスキング効果等の聴覚現
象に基づいて行なうことができるものであり、上記各量
子化精度情報は上述したようにマルチプレクサ131を
介して出力されて後に復号化装置に送られるものであ
る。このため、復号化装置で使われる聴覚モデルは任意
に設定することができることになる。
【0048】一方、図2は本発明の情報復号化方法が適
用される図1の符号化装置に対応する復号化装置の実施
例のブロック回路図を示したものである。この図2にお
いて、本実施例の復号化装置の端子201に入力された
符号情報(前記符号列)は、デマルチプレクサ202に
送られ、ここで各帯域毎の量子化精度情報と、正規化係
数と、被正規化・量子化信号とに分離復元される。各帯
域毎の量子化精度情報、正規化係数、被正規化・量子化
信号は、それぞれ各帯域に対応する信号成分構成回路2
11,212,213,214に送られ、ここで各帯域
毎に信号成分が構成される。これら各信号成分構成回路
211,212,213,214からの信号成分は、帯
域合成回路221によって合成されてオーディオ信号と
なされて端子251から出力される。
【0049】次に、図3は、本発明の実施例を適用した
場合のウィンドウ化処理時のゲイン制御動作について説
明するための図である。
【0050】ここで、前述した従来例において述べられ
ている方法では、特にゲイン制御量の最大値が20dB
程度に設定されていると、例えば、カスタネットの音の
ように、全帯域或いは高域において、数m秒の短い期間
に波形信号が40dB以上変化するような場合には、例
えば、44.1kHz,16ビットでサンプリングされ
た20kHzのオーディオ信号を符号化して1チャネル
あたり64キロビット/秒以下にしようとしても、ゲイ
ン制御によってはプリエコーを十分に抑えることはでき
ない。
【0051】そこで、本発明の方法では、信号波形のア
タック部における振幅変化の度合いに応じてゲイン制御
量を変化させ、その振幅変化が大きい場合には、40d
B以上のゲイン制御を行うことによって、この問題を解
決している。すなわち、本発明の方法では、図3に示す
ように信号波形SW1に対しては、ゲイン制御量が比較
的小さいゲイン制御関数G1を適用してゲイン制御、ゲ
イン制御補正の処理を行い、信号波形SW2に対して
は、ゲイン制御量が比較的大きいゲイン制御関数G2を
適用してゲイン制御、ゲイン制御補正の処理を行う。た
だし、ここで、信号波形SW2においては、このアタッ
ク部で40dB程度の振幅変化が生じており、ゲイン制
御関数G2のゲイン制御量であるR2の値は図3のスケ
ールからは読み取れないが、40dB程度である。
【0052】また、ゲイン制御量を極端に大きくするこ
とは周波数領域でのエネルギの拡散による符号化効率の
低下を招き、音質劣化を生じさせることになるが、ゲイ
ン制御量の上限を70dB以内に押さえることにより、
44.1kHz、16ビットでサンプリングされた20
kHzのオーディオ信号を符号化して1チャネルあたり
128キロビット/秒以下にする場合に、このような周
波数領域でのエネルギの拡散による符号化効率の低下に
よる音質劣化とプリエコーによる音質劣化の双方を、効
果的に抑制することができる。
【0053】図3の(C)は、このように処理を行った
場合のそれぞれの量子化雑音の発生の仕方を示したもの
である。この図3の(C)に示されているように、信号
波形SW1の量子化雑音のアタック部以前の量子化雑音
は、ゲイン制御補正処理による雑音抑圧作用が比較的小
さいため、信号波形SW2の量子化雑音のアタック部以
前の量子化雑音に比較して大きいが、全体を通しての量
子化雑音のエネルギは小さくなっている。これに対し
て、信号波形SW2に対する全体を通しての量子化雑音
のエネルギは比較的大きいが、アタック部以前の量子化
雑音は十分に低く押さえられている。プリエコーは聴感
上の大きな障害となるため、このように全体の雑音エネ
ルギを低下させることに優先させて抑圧させることが望
ましい。
【0054】次に、図4は、本発明の実施例を実際に信
号の符号化に適用する場合に、アタック部を検出してゲ
イン制御関数を生成させる処理の流れの例を示したもの
である。例えば、この処理を、前記図10の符号化装置
のアタック部検出回路402に相当する処理に組み込む
ことによって、本発明の符号化方法を実現することがで
きる。
【0055】この図4においては、例えば長さ2Mのブ
ロックをN個のサブブロックに分割し、I番サブブロッ
クにおける最大振幅値P[I] を、I番サブブロックまで
の連続するK個のサブブロックにおける最大振幅値Q
[I] と比較し、それが所定の比率以上になっている場合
にはアタック部が検出されたものとしている。また、最
終的に滑らかな過渡部をもつゲイン制御関数を構成し
て、スペクトルに変換した場合のエネルギーの拡散を防
いでいる。
【0056】すなわち、図4の最初のステップS1にお
いては、1ブロックをN分割したサブブロックの内のI
番サブブロックまでの連続するK個のサブブロック、す
なわちI−K+1番サブブロックからI番サブブロック
までの最大振幅値Q[I] を求め、ステップS2では、I
番サブブロックにおける最大振幅値P[I] を求めてい
る。次のステップS3では、I=0とし、ステップS4
において、上記ゲイン制御量としてのRを、I番までの
K個のサブブロックの最大振幅Q[I] の、その直後のサ
ブブロックの最大振幅P[I+1] に対する比率で求めてい
る。次のステップS5のTは所定の閾値であり、上記R
がTより大きい場合に、アタック部が検出されたものと
して、ステップS9に進んでいる。NOのときにはステ
ップS6に進み、Iをインクリメントして、ステップS
7でIがブロック終端のサブブロック番号Nに達したか
否かを判別し、I=NとなるまでステップS4以降を繰
り返している。ステップS7でYESと判別されたとき
には、ステップS8でL=0、すなわちアタック無しと
し、R=1として、ステップS10に進む。上記ステッ
プS5でYES、すなわちアタックが見つかったときに
は、ステップS9に進んで、L=Iとし、Rには上記ス
テップS4で求められたRの値の整数値を代入する。す
なわち、このブロックにおけるアタック部以前の長さは
サブブロックL個分であると解釈され、この時のRの値
がゲイン制御量を表す。ステップS9の処理を終えて、
ステップS10に進む。
【0057】ステップS10では、アタック位置Lまで
のサブブロックのゲイン制御関数をRとし、残りを1に
すると共に、最終的に滑らかな過渡部を持つように補間
処理を行った後、処理を終了している。すなわち、この
ステップS10において、LとRの値に基づいてゲイン
制御関数g(n) が構成されるが、アタック部直前のサブ
ブロックでは関数値が滑らかに補間する。これは周波数
領域に変換した場合にエネルギー分布の拡散を防ぎ、効
率の良い符号化を可能にするためである。
【0058】このように、アタック部のゲイン制御量を
信号のレベルに応じて変化させることにより、圧縮率の
高い場合にも効果的にプリエコーを防止することができ
るという利点がある。
【0059】なお、この例では、ゲイン制御はアタック
部の直前でのみ増幅されるようになされているが、これ
は既に説明したように、特に順向マスキングの効果を利
用したものである。ただしもちろん、減衰時に小振幅部
分で増幅がされるようにゲイン制御をすることも可能で
あり、例えばスペクトル変換のブロック長が極端に長
く、順向マスキング効果が十分期待できないような場合
には、減衰時に小振幅部分で増幅するようにしても良
い。また、検出するアタック部の数は、一つのブロック
に対して必ずしも一つである必要は無い。
【0060】ゲイン制御関数としてステップ状に急激に
変化するものを使用すると、スペクトルに変換した場合
に、そのエネルギーが拡散してしまい、符号化の効率が
落ちる。そのため制御関数は、アタック部においてもあ
る程度滑らかに変化するような形状を持つことが望まし
い。ただし、その区間は十分に短くなければプリエコー
が聞こえてしまうので、人間の聴覚を考慮して、ゲイン
制御関数は1msec程度の過渡区間を持ち、その区間内で
例えばサイン波形状のように滑らかな変化をさせること
が望ましい。次ブロックの先頭にアタックが生じる場合
に備えて、アタック部の検出範囲を次ブロックの先頭の
サブブロックまで広げておくことによって、ゲイン制御
関数に滑らかな過渡部を持たせながら、上述の逆変換時
に隣接するブロック間で波形要素を干渉させることがで
きるための条件を充足させることが可能である。
【0061】このように、本発明の方法あるいは装置
は、音響波形をディジタル信号に変換したものを処理す
る装置に適用することも可能であるし、また、一旦ファ
イルになっている波形信号をコンピュータ等で処理する
場合に適用することもできる。また、このようにして得
られた符号を記録媒体に記録することも伝送することも
もちろん可能である。また本発明は、つねに一定のビッ
トレートで符号化を行う場合にも、割り当てられるビッ
ト数がブロック毎に異なるように時間的に変化するビッ
トレートで符号化を行う場合にも適用することが可能で
ある。
【0062】以上の説明においては、符号化装置におい
てディジタル化された波形信号を直接スペクトル変換を
使ってスペクトル信号に変換する場合について述べた
が、もちろん、一旦帯域分割フィルタを使用して分割さ
れた帯域毎にスペクトル変換を使ってスペクトル信号に
変換する場合についても本発明の方法を適用することが
できる。
【0063】次に、図5は、本発明の方法で符号化され
た情報を記録媒体に記録するときの記録フォーマットあ
るいは伝送するときの伝送フォーマットの例について示
したものである。
【0064】この図5に示す例において、各ブロックの
符号は、各ブロックの符号は、アタック部検出フラグと
スペクトル信号符号、及びアタック部検出フラグの内容
によっては、それらに加えて、アタック部位置情報とゲ
イン制御情報から成るゲイン制御補正関数生成情報とに
より構成されている。アタック位置情報としては、例え
ば、図4のLの値を記録すればよく、ゲイン制御量情報
としては、例えば図4のRの値を記録すればよい。実際
の音楽信号においてプリエコーが問題となるアタック部
の存在するブロックの割合は低いので、このようにアタ
ック位置情報とゲイン制御量情報は実際にアタック部の
存在するブロックだけに記録しておくと効率が良い。た
だし勿論、全てのブロックにおいてゲイン制御補正関数
生成情報を記録するようにしてもよく、この場合、実際
にアタック部の存在しないブロックにおいては、例え
ば、L=0、R=1として記録しておけばよい。
【0065】次に、図6は、上記図5に示される記録情
報から復号化手段がゲイン制御補正関数h(n) を生成す
る処理例を示したものである。
【0066】例えば、この図6に示す処理を、前記図1
1の復号化装置のゲイン制御補正回路414に相当する
処理に組み込み、生成されたゲイン制御補正関数h(n)
を逆スペクトル変換回路413によって構成された波形
信号要素に乗じることによって、本発明による復号化方
法を実現することができる。もちろん、アタック部が検
出されていないブロックにおいては、実際にh(n) を乗
じる処理を省略するようにしても良い。
【0067】この図6の例においては、ステップS21
で上記アタック検出フラグを検出し、フラグが0のと
き、すなわちアタックが検出されていないときには、ス
テップS22に進んで、ゲイン制御補正関数h(n) を1
にし、終了する。フラグが1のとき、すなわちアタック
が検出されているときには、ステップS23に進み、こ
のブロックの先頭からサブブロックL個分のゲイン制御
関数g(n) をRとし、上記補間処理を行って最終的なゲ
イン制御関数g(n) を求める。次のステップS24で
は、このゲイン制御関数g(n) の逆数1/g(n) を計算
してゲイン制御補正関数h(n) を求めている。
【0068】なお、本発明の方法は、例えば前述した特
開平3−132228号公報に記載されている方法等に
適用することも勿論可能である。
【0069】また、波形信号を直接スペクトル変換によ
って周波数成分に分解する場合だけでなく、例えば、一
旦、帯域分割フィルタによって帯域分割された波形信号
をスペクトル変換によって周波数成分分解する場合に
も、もちろん本発明の方法を適用することができる。さ
らに、フィルタによって波形信号を周波数成分に分解す
る場合にも適用することができる。本発明でいう周波数
成分とはこれらの処理によって得られるものをすべて含
むものであるが、プリエコーが特に大きな問題となるス
ペクトル変換を含む処理で得られる周波数成分に関連し
て適用される場合に、本発明の方法は特にその効果が大
きい。
【0070】さらに、本発明の方法は、音響波形をディ
ジタル信号に変換したものを処理する装置に適用するこ
とも可能であるし、また、一旦ファイルになっている波
形信号をコンピュータ等で処理する場合に適用すること
もできる。また、このようにして得られた符号を記録媒
体に記録することも伝送することももちろん可能であ
る。また本発明の方法は、つねに一定のビットレートで
符号化を行う場合にも、割り当てられるビット数がブロ
ック毎に異なるように時間的に変化するビットレートで
符号化を行う場合にも適用することが可能である。
【0071】以上、音響波形信号を量子化した場合の量
子化雑音を目立たなくさせる場合に関して説明を行なっ
たが、本発明の方法は他の種類の信号の量子化雑音の発
生を目立たせなくする上でも有効であり、例えば画像信
号にも適用することが可能である。しかし、音響信号に
おけるアタック部分でのプリエコーは聴感上の大きな障
害となるため、本発明を音響信号に適用することは非常
に有効である。また、本発明の方法はもちろん多チャネ
ルの音響信号に対して適用可能である。
【0072】
【発明の効果】以上の説明からも明らかなように、本発
明に係る情報符号化方法及び装置においては、波形信号
が急激に大きくなる部分でのゲイン制御処理のゲイン制
御量は複数種類の大きさから選択的に決定し、そのゲイ
ン制御量の最大値は40dB以上とすること、すなわ
ち、アタック部でのゲイン制御量を、そのアタック部で
の変化の度合いに応じて最大の場合アタック部直前にお
いて非常に大きなゲイン制御として少なくとも40dB
以上のゲイン制御を行うことにより、圧縮率の高い場合
にも効果的にプリエコーを防止し、より効率的でより音
質の高い符号化を可能としている。
【0073】また、本発明の情報復号化方法及び装置に
おいても、波形信号が急激に大きくなる部分でのゲイン
制御補正処理のゲイン制御補正量はゲイン制御補正情報
の内容に基づいて決定される複数の大きさの中から選択
されており、ゲイン制御補正量に対応するゲイン制御量
の最大値は40dB以上となされたものを用いるため、
効率的な処理が行え、品質の高い信号を再生することが
できる。
【0074】また、これを音響信号あるいはオーディオ
信号に適用することにより、効率的な処理と共に、プリ
エコーの発生を防止することができる。
【0075】さらに、このような情報符号化方法あるい
は装置で符号化された信号を伝送又は情報記録媒体に記
録するすることで、効率のよい伝送又は記録が可能であ
る。
【図面の簡単な説明】
【図1】本発明の実施例が適用される符号化装置の概略
構成を示すブロック回路図である。
【図2】本発明の実施例が適用される復号化装置の概略
構成を示すブロック回路図である。
【図3】本発明の実施例におけるウィンドウ化処理時の
ゲイン制御の動作を説明するための図である。
【図4】本発明の実施例の符号化方法におけるゲイン制
御関数生成の処理手順の一例を概略的に示すフローチャ
ートである。
【図5】本発明の実施例の符号化により得られた符号列
の記録状態を示す図である。
【図6】本発明の実施例の復号化方法の処理手順の一部
の例を概略的に示すフローチャートである。
【図7】変換符号化におけるプリエコー発生の動作原理
を説明するための図である。
【図8】従来の変換窓長可変による符号化復号化技術の
動作原理を説明するための図である。
【図9】従来のウィンドウ化処理技術を用いた符号化復
号化の動作原理を説明するための図である。
【図10】従来のウィンドウ化処理技術による符号化装
置の概略構成を示すブロック図である。
【図11】従来のウィンドウ化処理技術による復号化装
置の概略構成を示すブロック図である。
【符号の説明】
101 帯域分割手段 111〜114 正規化回路 121〜124 量子化回路 131 マルチプレクサ 141 量子化精度決定回路 202 デマルチプレクサ 211〜214 信号成分構成回路 221 帯域合成回路
フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 H04B 14/04 Z

Claims (30)

    【特許請求の範囲】
  1. 【請求項1】 入力信号を周波数成分に分解する周波数
    成分分解処理と、 上記周波数成分分解処理への入力波形信号のゲイン制御
    処理と、 上記周波数成分分解処理の出力情報及び上記ゲイン制御
    の制御情報の符号化処理とを行い、 波形信号が急激に大きくなる部分でのゲイン制御処理の
    ゲイン制御量は複数種類の大きさから選択的に決定し、
    当該ゲイン制御量の最大値は40dB以上であることを
    特徴とする情報符号化方法。
  2. 【請求項2】 上記ゲイン制御量の最大値は70dB以
    下であることを特徴とする請求項1記載の情報符号化方
    法。
  3. 【請求項3】 符号化による圧縮率は1/4以下である
    ことを特徴とする請求項1又は2記載の情報符号化方
    法。
  4. 【請求項4】 上記周波数成分分解処理は、時間軸上の
    信号を周波数軸上の信号に変換するスペクトル変換処理
    を含むことを特徴とする請求項1から請求項3のうちの
    いずれか1項に記載の情報符号化方法。
  5. 【請求項5】 入力信号は音響信号であることを特徴と
    する請求項1から請求項4のうちのいずれか1項に記載
    の情報符号化方法。
  6. 【請求項6】 周波数成分信号及びゲイン制御補正情報
    の復号化処理と、 波形信号を合成する波形信号合成処理と、 上記波形信号合成処理の出力波形信号のゲイン制御補正
    処理とを行い、 波形信号が急激に大きくなる部分でのゲイン制御補正処
    理のゲイン制御補正量は上記ゲイン制御補正情報の内容
    に基づいて決定される複数の大きさの中から選択され、
    ゲイン制御補正量に対応するゲイン制御量の最大値は4
    0dB以上であることを特徴とする情報復号化方法。
  7. 【請求項7】 上記ゲイン制御補正量に対応するゲイン
    制御量の最大値は70dB以下であることを特徴とする
    請求項6記載の情報復号化方法。
  8. 【請求項8】 上記復号化を行う符号の符号化による圧
    縮率は1/4以下であることを特徴とする請求項6又は
    7記載の情報復号化方法。
  9. 【請求項9】 上記波形信号合成処理は、周波数軸上の
    信号を時間軸上の信号に変換する逆スペクトル変換処理
    を含むことを特徴とする請求項6から請求項8のうちの
    いずれか1項に記載の情報復号化方法。
  10. 【請求項10】 出力信号は音響信号であることを特徴
    とする請求項6から請求項9のうちのいずれか1項に記
    載の情報復号化方法。
  11. 【請求項11】 周波数成分信号情報及びゲイン制御補
    正情報が伝送され、上記ゲイン制御補正情報はゲイン制
    御補正量の情報を含み、波形信号が急激に大きくなる部
    分でのゲイン制御補正量は複数種類の中から選択され、
    当該ゲイン制御補正量に対応するゲイン制御量の最大値
    は40dB以上であることを特徴とする情報伝送方法。
  12. 【請求項12】 上記ゲイン制御補正量に対応するゲイ
    ン制御量の最大値は70dB以下であることを特徴とす
    る請求項11記載の情報伝送方法。
  13. 【請求項13】 上記情報の符号化による圧縮率は1/
    4以下であることを特徴とする請求項11又は12記載
    の情報伝送方法。
  14. 【請求項14】 上記周波数成分信号は、時間軸上の信
    号を周波数軸上の信号に変換するスペクトル変換を含む
    処理によって得られたものであることを特徴とする請求
    項11から請求項13のうちのいずれか1項に記載の情
    報伝送方法。
  15. 【請求項15】 信号は音響信号であることを特徴とす
    る請求項11から請求項14のうちのいずれか1項に記
    載の情報伝送方法。
  16. 【請求項16】 入力信号を周波数成分に分解する周波
    数成分分解手段と、 上記周波数成分分解手段への入力波形信号のゲイン制御
    手段と、 上記周波数成分分解手段の出力情報及び上記ゲイン制御
    の制御情報の符号化手段とを有し、 波形信号が急激に大きくなる部分でのゲイン制御処理の
    ゲイン制御量は複数種類の大きさから選択的に決定し、
    当該ゲイン制御量の最大値は40dB以上であることを
    特徴とする情報符号化装置。
  17. 【請求項17】 上記ゲイン制御量の最大値は70dB
    以下であることを特徴とする請求項16記載の情報符号
    化装置。
  18. 【請求項18】 符号化による圧縮率は1/4以下であ
    ることを特徴とする請求項16又は17記載の情報符号
    化装置。
  19. 【請求項19】 上記周波数成分分解手段は、時間軸上
    の信号を周波数軸上の信号に変換するスペクトル変換手
    段を含むことを特徴とする請求項16から請求項18の
    うちのいずれか1項に記載の情報符号化装置。
  20. 【請求項20】 入力信号は音響信号であることを特徴
    とする請求項16から請求項19のうちのいずれか1項
    に記載の情報符号化装置。
  21. 【請求項21】 周波数成分信号及びゲイン制御補正情
    報の復号化手段と、 波形信号を合成する波形信号合成手段と、 上記波形信号合成手段の出力波形信号のゲイン制御補正
    手段とを有し、 波形信号が急激に大きくなる部分でのゲイン制御補正処
    理のゲイン制御補正量は上記ゲイン制御補正情報の内容
    に基づいて決定される複数の大きさの中から選択され、
    ゲイン制御補正量に対応するゲイン制御量の最大値は4
    0dB以上であることを特徴とする情報復号化装置。
  22. 【請求項22】 上記ゲイン制御補正量に対応するゲイ
    ン制御量の最大値は70dB以下であることを特徴とす
    る請求項21記載の情報復号化装置。
  23. 【請求項23】 上記復号化を行う符号の符号化による
    圧縮率は1/4以下であることを特徴とする請求項21
    又は22記載の情報復号化装置。
  24. 【請求項24】 上記波形信号合成手段は、周波数軸上
    の信号を時間軸上の信号に変換する逆スペクトル変換処
    理を含むことを特徴とする請求項21から請求項23の
    うちのいずれか1項に記載の情報復号化装置。
  25. 【請求項25】 出力信号は音響信号であることを特徴
    とする請求項21から請求項24のうちのいずれか1項
    に記載の情報復号化装置。
  26. 【請求項26】 周波数成分信号情報及びゲイン制御補
    正情報が記録され、上記ゲイン制御補正情報はゲイン制
    御補正量の情報を含み、波形信号が急激に大きくなる部
    分でのゲイン制御補正量は複数種類の中から選択され、
    当該ゲイン制御補正量に対応するゲイン制御量の最大値
    は40dB以上であることを特徴とする情報記録媒体。
  27. 【請求項27】 上記ゲイン制御補正量に対応するゲイ
    ン制御量の最大値は70dB以下であることを特徴とす
    る請求項26記載の情報記録媒体。
  28. 【請求項28】 上記情報の符号化による圧縮率は1/
    4以下であることを特徴とする請求項26又は27記載
    の情報記録媒体。
  29. 【請求項29】 上記周波数成分信号は、時間軸上の信
    号を周波数軸上の信号に変換するスペクトル変換を含む
    処理によって得られたものであることを特徴とする請求
    項26から請求項28のうちのいずれか1項に記載の情
    報記録媒体。
  30. 【請求項30】 信号は音響信号であることを特徴とす
    る請求項26から請求項29のうちのいずれか1項に記
    載の情報記録媒体。
JP06485594A 1994-04-01 1994-04-01 情報符号化方法、情報復号化方法、及び情報伝送方法 Expired - Lifetime JP3186412B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP06485594A JP3186412B2 (ja) 1994-04-01 1994-04-01 情報符号化方法、情報復号化方法、及び情報伝送方法
US08/868,665 US5752224A (en) 1994-04-01 1997-06-04 Information encoding method and apparatus, information decoding method and apparatus information transmission method and information recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP06485594A JP3186412B2 (ja) 1994-04-01 1994-04-01 情報符号化方法、情報復号化方法、及び情報伝送方法

Publications (2)

Publication Number Publication Date
JPH07273657A true JPH07273657A (ja) 1995-10-20
JP3186412B2 JP3186412B2 (ja) 2001-07-11

Family

ID=13270227

Family Applications (1)

Application Number Title Priority Date Filing Date
JP06485594A Expired - Lifetime JP3186412B2 (ja) 1994-04-01 1994-04-01 情報符号化方法、情報復号化方法、及び情報伝送方法

Country Status (2)

Country Link
US (1) US5752224A (ja)
JP (1) JP3186412B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002103683A1 (fr) * 2001-06-15 2002-12-27 Sony Corporation Appareil et procede de codage
JP2003533717A (ja) * 2000-05-08 2003-11-11 ノキア コーポレイション 多重帯域能力を有する通信接続においてソース信号帯域の変更を行う方法及び構成
CN111081226A (zh) * 2018-10-18 2020-04-28 北京搜狗科技发展有限公司 语音识别解码优化方法及装置

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6167093A (en) * 1994-08-16 2000-12-26 Sony Corporation Method and apparatus for encoding the information, method and apparatus for decoding the information and method for information transmission
JPH09148937A (ja) * 1995-11-21 1997-06-06 Sony Corp 符号化処理方法、復号化処理方法、符号化処理装置および復号化処理装置
JP3491425B2 (ja) 1996-01-30 2004-01-26 ソニー株式会社 信号符号化方法
JP3496411B2 (ja) * 1996-10-30 2004-02-09 ソニー株式会社 情報符号化方法及び復号化装置
TW384434B (en) 1997-03-31 2000-03-11 Sony Corp Encoding method, device therefor, decoding method, device therefor and recording medium
JP3282661B2 (ja) * 1997-05-16 2002-05-20 ソニー株式会社 信号処理装置および方法
JP2000101439A (ja) 1998-09-24 2000-04-07 Sony Corp 情報処理装置および方法、情報記録装置および方法、記録媒体、並びに提供媒体
CA2290037A1 (en) 1999-11-18 2001-05-18 Voiceage Corporation Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals
JP3507743B2 (ja) * 1999-12-22 2004-03-15 インターナショナル・ビジネス・マシーンズ・コーポレーション 圧縮オーディオデータへの電子透かし方法およびそのシステム
US7711123B2 (en) * 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
DE60225130T2 (de) * 2001-05-10 2009-02-26 Dolby Laboratories Licensing Corp., San Francisco Verbesserung der transientenleistung bei kodierern mit niedriger bitrate durch unterdrückung des vorgeräusches
US20020172350A1 (en) * 2001-05-15 2002-11-21 Edwards Brent W. Method for generating a final signal from a near-end signal and a far-end signal
CN100479511C (zh) * 2003-04-04 2009-04-15 日本胜利株式会社 音频/视频记录装置、记录方法、再现装置、再现方法
CA2562259C (en) * 2004-05-07 2011-03-29 Tyco Thermal Controls Llc Adjustable cable connector wire guide and connector assembly incorporating the same
US20060062407A1 (en) * 2004-09-22 2006-03-23 Kahan Joseph M Sound card having feedback calibration loop
US7292502B2 (en) * 2005-03-30 2007-11-06 Bbn Technologies Corp. Systems and methods for producing a sound pressure field
US7769189B1 (en) * 2005-04-12 2010-08-03 Apple Inc. Preserving noise during editing of a signal
US8538761B1 (en) * 2005-08-01 2013-09-17 Apple Inc. Stretching/shrinking selected portions of a signal
US8364294B1 (en) 2005-08-01 2013-01-29 Apple Inc. Two-phase editing of signal data
EP1758096A1 (de) * 2005-08-23 2007-02-28 Rainer Schierle Verfahren und Vorrichtung zur Mustererkennung in akustischen Aufnahmen
JP4688701B2 (ja) * 2006-03-09 2011-05-25 富士通東芝モバイルコミュニケーションズ株式会社 通信端末
US8463603B2 (en) 2008-09-06 2013-06-11 Huawei Technologies Co., Ltd. Spectral envelope coding of energy attack signal
US8498874B2 (en) * 2009-09-11 2013-07-30 Sling Media Pvt Ltd Audio signal encoding employing interchannel and temporal redundancy reduction
FR2992766A1 (fr) * 2012-06-29 2014-01-03 France Telecom Attenuation efficace de pre-echos dans un signal audionumerique
US9336791B2 (en) * 2013-01-24 2016-05-10 Google Inc. Rearrangement and rate allocation for compressing multichannel audio

Family Cites Families (74)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3349183A (en) * 1963-10-29 1967-10-24 Melpar Inc Speech compression system transmitting only coefficients of polynomial representations of phonemes
US4184049A (en) * 1978-08-25 1980-01-15 Bell Telephone Laboratories, Incorporated Transform speech signal coding with pitch controlled adaptive quantizing
CH645501GA3 (ja) * 1981-07-24 1984-10-15
US4492930A (en) * 1981-10-13 1985-01-08 Microdyne Corporation Automatic gain control system
US4625286A (en) * 1982-05-03 1986-11-25 Texas Instruments Incorporated Time encoding of LPC roots
US4535472A (en) * 1982-11-05 1985-08-13 At&T Bell Laboratories Adaptive bit allocator
JPH07118159B2 (ja) * 1982-12-06 1995-12-18 ソニー株式会社 Pcm信号記録方法
DE3314384A1 (de) * 1983-04-21 1984-10-25 Siemens AG, 1000 Berlin und 8000 München Uebertragungssystem
JPH07118160B2 (ja) * 1983-06-18 1995-12-18 ソニー株式会社 ディジタル情報信号の記録方法
US4516241A (en) * 1983-07-11 1985-05-07 At&T Bell Laboratories Bit compression coding with embedded signaling
US4696040A (en) * 1983-10-13 1987-09-22 Texas Instruments Incorporated Speech analysis/synthesis system with energy normalization and silence suppression
GB8421498D0 (en) * 1984-08-24 1984-09-26 British Telecomm Frequency domain speech coding
JPS61107818A (ja) * 1984-10-30 1986-05-26 Nec Corp エントロピ−符号化方式とその装置
DE3506912A1 (de) * 1985-02-27 1986-08-28 Telefunken Fernseh Und Rundfunk Gmbh, 3000 Hannover Verfahren zur uebertragung eines audiosignals
US4885790A (en) * 1985-03-18 1989-12-05 Massachusetts Institute Of Technology Processing of acoustic waveforms
US4748579A (en) * 1985-08-14 1988-05-31 Gte Laboratories Incorporated Method and circuit for performing discrete transforms
JP2792853B2 (ja) * 1986-06-27 1998-09-03 トムソン コンシューマー エレクトロニクス セイルズ ゲゼルシャフト ミット ベシュレンクテル ハフツング オーディオ信号の伝送方法及び装置
JPH0734291B2 (ja) * 1986-07-28 1995-04-12 株式会社日立製作所 デイジタル信号記録再生システム
EP0267344B1 (en) * 1986-10-30 1993-09-01 International Business Machines Corporation Process for the multi-rate encoding of signals, and device for carrying out said process
DE3639753A1 (de) * 1986-11-21 1988-06-01 Inst Rundfunktechnik Gmbh Verfahren zum uebertragen digitalisierter tonsignale
AU604807B2 (en) * 1986-12-19 1991-01-03 Sony Corporation Data recorder and method
US4903301A (en) * 1987-02-27 1990-02-20 Hitachi, Ltd. Method and system for transmitting variable rate speech signal
NL8700985A (nl) * 1987-04-27 1988-11-16 Philips Nv Systeem voor sub-band codering van een digitaal audiosignaal.
US4882754A (en) * 1987-08-25 1989-11-21 Digideck, Inc. Data compression system and method with buffer control
JP2618916B2 (ja) * 1987-09-10 1997-06-11 富士通株式会社 動き補償のブロックサイズ決定方法
JPH0213135A (ja) * 1988-06-30 1990-01-17 Sony Corp ディジタル信号伝送装置
JPH0783315B2 (ja) * 1988-09-26 1995-09-06 富士通株式会社 可変レート音声信号符号化方式
EP0370277A3 (de) * 1988-11-24 1991-09-18 Siemens Aktiengesellschaft Subband-Übertragungssystem
US5297236A (en) * 1989-01-27 1994-03-22 Dolby Laboratories Licensing Corporation Low computational-complexity digital filter bank for encoder, decoder, and encoder/decoder
US5222189A (en) * 1989-01-27 1993-06-22 Dolby Laboratories Licensing Corporation Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio
US5109417A (en) * 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5479562A (en) * 1989-01-27 1995-12-26 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding audio information
EP0610975B1 (en) * 1989-01-27 1998-09-02 Dolby Laboratories Licensing Corporation Coded signal formatting for encoder and decoder of high-quality audio
US5357594A (en) * 1989-01-27 1994-10-18 Dolby Laboratories Licensing Corporation Encoding and decoding using specially designed pairs of analysis and synthesis windows
US5142656A (en) * 1989-01-27 1992-08-25 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5016107A (en) * 1989-05-09 1991-05-14 Eastman Kodak Company Electronic still camera utilizing image compression and digital storage
US4932062A (en) * 1989-05-15 1990-06-05 Dialogic Corporation Method and apparatus for frequency analysis of telephone signals
DE69031517T2 (de) * 1989-06-30 1998-02-26 Nippon Electric Co Variable Blocklängenkodierung für unterschiedliche Charakteristiken der Eingangsabtastwerte
JP2844695B2 (ja) * 1989-07-19 1999-01-06 ソニー株式会社 信号符号化装置
US5115240A (en) * 1989-09-26 1992-05-19 Sony Corporation Method and apparatus for encoding voice signals divided into a plurality of frequency bands
FR2653280B1 (fr) * 1989-10-13 1992-01-10 France Etat Dispositif d'allocation de bits pour signal audio-numerique transforme, a quantification adaptative sur critere psycho-auditif.
US5185800A (en) * 1989-10-13 1993-02-09 Centre National D'etudes Des Telecommunications Bit allocation device for transformed digital audio broadcasting signals with adaptive quantization based on psychoauditive criterion
GB2237463B (en) * 1989-10-16 1994-01-05 John Moffatt Automatic volume control system
US5040217A (en) * 1989-10-18 1991-08-13 At&T Bell Laboratories Perceptual coding of audio signals
JPH03132228A (ja) * 1989-10-18 1991-06-05 Victor Co Of Japan Ltd 直交変換信号符号化復号化方式
US5150387A (en) * 1989-12-21 1992-09-22 Kabushiki Kaisha Toshiba Variable rate encoding and communicating apparatus
JP2913731B2 (ja) * 1990-03-07 1999-06-28 ソニー株式会社 ディジタルデータの高能率符号化方法
CN1062963C (zh) * 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
JP2861238B2 (ja) * 1990-04-20 1999-02-24 ソニー株式会社 ディジタル信号符号化方法
JP2751564B2 (ja) * 1990-05-25 1998-05-18 ソニー株式会社 ディジタル信号符号化装置
JP3185214B2 (ja) * 1990-06-12 2001-07-09 日本電気株式会社 改良dctの順変換計算装置および逆変換計算装置
JPH0472909A (ja) * 1990-07-13 1992-03-06 Sony Corp オーディオ信号の量子化誤差低減装置
US5244705A (en) * 1990-08-24 1993-09-14 Sony Corporation Disc-shaped recording medium
JP3141241B2 (ja) * 1990-08-24 2001-03-05 ソニー株式会社 ディスク記録装置及びディスク再生装置
JP3033156B2 (ja) * 1990-08-24 2000-04-17 ソニー株式会社 ディジタル信号符号化装置
ZA921988B (en) * 1991-03-29 1993-02-24 Sony Corp High efficiency digital data encoding and decoding apparatus
EP0506394A2 (en) * 1991-03-29 1992-09-30 Sony Corporation Coding apparatus for digital signals
KR100312664B1 (ko) * 1991-03-29 2002-12-26 소니 가부시끼 가이샤 디지탈신호부호화방법
JP3134337B2 (ja) * 1991-03-30 2001-02-13 ソニー株式会社 ディジタル信号符号化方法
JP3134338B2 (ja) * 1991-03-30 2001-02-13 ソニー株式会社 ディジタル音声信号符号化方法
KR100268623B1 (ko) * 1991-06-28 2000-10-16 이데이 노부유끼 압축 데이타 기록 재생 장치 및 신호 처리 방법
ES2164640T3 (es) * 1991-08-02 2002-03-01 Sony Corp Codificador digital con asignacion dinamica de bits de cuantificacion.
DE4225434A1 (de) * 1991-08-02 1993-02-04 Sony Corp Vorrichtung zur aufzeichnung und wiedergabe von komprimierten digitalen daten auf bzw. von einem aufzeichnungstraeger und dabei anwendbares verfahren zur bitentfernung
JP3178026B2 (ja) * 1991-08-23 2001-06-18 ソニー株式会社 ディジタル信号符号化装置及び復号化装置
JP3198550B2 (ja) * 1991-09-03 2001-08-13 ソニー株式会社 圧縮データ記録方法及び圧縮データ記録再生装置
JP3158556B2 (ja) * 1991-09-27 2001-04-23 ソニー株式会社 ディスク記録装置及びディスク再生装置
US5349549A (en) * 1991-09-30 1994-09-20 Sony Corporation Forward transform processing apparatus and inverse processing apparatus for modified discrete cosine transforms, and method of performing spectral and temporal analyses including simplified forward and inverse orthogonal transform processing
JP3141450B2 (ja) * 1991-09-30 2001-03-05 ソニー株式会社 オーディオ信号処理方法
EP0786874B1 (en) * 1991-09-30 2000-08-16 Sony Corporation Method and apparatus for audio data compression
US5388159A (en) * 1991-12-20 1995-02-07 Clarion Co., Ltd. Equalizing circuit for reproduced signals
JP3134455B2 (ja) * 1992-01-29 2001-02-13 ソニー株式会社 高能率符号化装置及び方法
JP3508146B2 (ja) * 1992-09-11 2004-03-22 ソニー株式会社 ディジタル信号符号化復号化装置、ディジタル信号符号化装置及びディジタル信号復号化装置
JP3127600B2 (ja) * 1992-09-11 2001-01-29 ソニー株式会社 ディジタル信号復号化装置及び方法
GB2277839A (en) * 1993-05-08 1994-11-09 Motorola Israel Ltd Gain control using mixer

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003533717A (ja) * 2000-05-08 2003-11-11 ノキア コーポレイション 多重帯域能力を有する通信接続においてソース信号帯域の変更を行う方法及び構成
WO2002103683A1 (fr) * 2001-06-15 2002-12-27 Sony Corporation Appareil et procede de codage
US6850179B2 (en) 2001-06-15 2005-02-01 Sony Corporation Encoding apparatus and encoding method
CN111081226A (zh) * 2018-10-18 2020-04-28 北京搜狗科技发展有限公司 语音识别解码优化方法及装置
CN111081226B (zh) * 2018-10-18 2024-02-13 北京搜狗科技发展有限公司 语音识别解码优化方法及装置

Also Published As

Publication number Publication date
JP3186412B2 (ja) 2001-07-11
US5752224A (en) 1998-05-12

Similar Documents

Publication Publication Date Title
JP3186412B2 (ja) 情報符号化方法、情報復号化方法、及び情報伝送方法
JP3307138B2 (ja) 信号符号化方法及び装置、並びに信号復号化方法及び装置
US5825320A (en) Gain control method for audio encoding device
JP3277692B2 (ja) 情報符号化方法、情報復号化方法及び情報記録媒体
JP4373006B2 (ja) スケーラブル音声コーダとデコーダ
US5731767A (en) Information encoding method and apparatus, information decoding method and apparatus, information recording medium, and information transmission method
JP3277682B2 (ja) 情報符号化方法及び装置、情報復号化方法及び装置、並びに情報記録媒体及び情報伝送方法
JP3186292B2 (ja) 高能率符号化方法及び装置
JPH08223049A (ja) 信号符号化方法及び装置、信号復号化方法及び装置、情報記録媒体並びに情報伝送方法
WO1994028633A1 (fr) Appareil et procede de codage ou decodage de signaux, et support d'enregistrement
US20040196770A1 (en) Coding method, coding device, decoding method, and decoding device
JPH1084284A (ja) 信号再生方法および装置
JP3557674B2 (ja) 高能率符号化方法及び装置
KR970002686B1 (ko) 오디오 신호의 전송방법
JP3341440B2 (ja) 情報符号化方法及び装置、情報復号化方法及び装置、並びに情報記録媒体
JP3513178B2 (ja) 情報符号化又は復号化方法、並びに装置
JPH07168593A (ja) 信号符号化方法及び装置、信号復号化方法及び装置、並びに信号記録媒体
JP3263881B2 (ja) 情報符号化方法及び装置、情報復号化方法及び装置並びに情報記録媒体及び情報伝送方法
US6765930B1 (en) Decoding apparatus and method, and providing medium
JP3413691B2 (ja) 情報符号化方法及び装置、情報復号化方法及び装置、並びに情報記録媒体及び情報送信方法
JP3230365B2 (ja) 情報符号化方法及び装置並びに情報復号化方法及び装置
JPH11330974A (ja) エンコード方法、デコード方法、エンコード装置、デコード装置、ディジタル信号記録方法、ディジタル信号記録装置、記録媒体、ディジタル信号送信方法及びディジタル信号送信装置
JP3513879B2 (ja) 情報符号化方法及び情報復号化方法
JPH07106977A (ja) 情報復号化装置
JP3134383B2 (ja) ディジタルデータの高能率符号化方法及び装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20010410

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080511

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090511

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100511

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100511

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110511

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120511

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130511

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130511

Year of fee payment: 12

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term