JP2000114975A - 音響信号符号化方法及び装置、音響信号復号化方法及び装置並びに記録媒体 - Google Patents

音響信号符号化方法及び装置、音響信号復号化方法及び装置並びに記録媒体

Info

Publication number
JP2000114975A
JP2000114975A JP10285624A JP28562498A JP2000114975A JP 2000114975 A JP2000114975 A JP 2000114975A JP 10285624 A JP10285624 A JP 10285624A JP 28562498 A JP28562498 A JP 28562498A JP 2000114975 A JP2000114975 A JP 2000114975A
Authority
JP
Japan
Prior art keywords
amplitude
time
signal
series signal
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10285624A
Other languages
English (en)
Other versions
JP4193243B2 (ja
JP2000114975A5 (ja
Inventor
Shiro Suzuki
志朗 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP28562498A priority Critical patent/JP4193243B2/ja
Priority to US09/412,556 priority patent/US7580893B1/en
Publication of JP2000114975A publication Critical patent/JP2000114975A/ja
Publication of JP2000114975A5 publication Critical patent/JP2000114975A5/ja
Application granted granted Critical
Publication of JP4193243B2 publication Critical patent/JP4193243B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】 【課題】 信号の拡散を効果的に抑制する。 【解決手段】 原信号Sを複数Mの帯域に分割する帯域
分割フィルタバンク部1401と、信号符号化の区間長
であるブロック長を複数に分割したサブブロック長単位
で、上記複数の周波数帯域に分割されたそれぞれの帯域
の信号の振幅を検出してこの振幅に基づいてそれぞれの
帯域の信号の振幅を操作するとともに、帯域に分割され
た信号をスペクトルに変換するスペクトル変換部140
2と、正規化および量子化を施す正規化部1403およ
び量子化部1404と、これら各部により処理された信
号から符号列Cを生成する符号生成部1405とを有し
ている。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音響信号を符号化
及び/又は復号化する音響信号符号化及び/又は復号化
方法及び装置、音響信号を復号化する音響信号符号化方
法及び装置、およびこれらについてのプログラムや信号
が記録された記録媒体に関する。
【0002】
【従来の技術】オーディオ或いは音声等の信号の高能率
符号化の手法には種々あるが、例えば、時間軸上のオー
ディオ信号等をブロック化しないで、複数の周波数帯域
に分割して符号化する非ブロック化周波数帯域分割方式
である、帯域分割符号化(subband coding; SBC)や、
時間軸の信号を周波数軸上の信号に変換(スペクトル変
換)して複数の周波数帯域に分割し、各帯域毎に符号化
するブロック化周波数帯域分割方式、いわゆる変換符号
化等を挙げることができる。また、上述の帯域分割符号
化と変換符号化とを組み合わせた高能率符号化の手法も
考えられており、この場合には、例えば、上記帯域分割
符号化で帯域分割を行った後、該各帯域毎の信号を周波
数軸上の信号にスペクトル変換し、このスペクトル変換
された各帯域毎に符号化が施される。ここで上述した周
波数帯域分割を行うフィルターとしては、例えばクアド
ラチュア鏡映フィルター(quadrature mirror filter;Q
MF)があり、“Digital coding of speech in subband
s”, R.E.Crochiere, Bell Syst.Tech. J. Vol.55,No.8
1976に、述べられている。また、“Polyphase Quadrat
ure filters -A new subband coding technique”, Jos
eph H. Rothweiler, ICASSP 83, BOSTON には多相クア
ドラチュアフィルター(polyphase quadrature filter;
PQF)と呼ばれる等バンド幅のフィルター分割手法が述
べられている。
【0003】ここで、上述したスペクトル変換として
は、例えば、入力オーディオ信号を所定単位時間のフレ
ームでブロック化し、当該ブロック毎に離散フーリエ変
換(discrete fourier transformation;DFT)、離散コ
サイン変換(discrete cosine transformation;DCT)、
変形離散コサイン変換(modified discrete cosine tra
nsformation;MDCT)等を行うことで時間軸を周波数軸に
変換するようなスペクトル変換がある。MDCTについ
ては“Subband/Transform Coding Using FilterBank De
signs Based on Time Domain Aliasing Cancellatio
n”, J.P.Princen &A.B.Bradley, ICASSP 1987, Univ.
of Surrey Royal Melbourne Inst.of Tech. に述べら
れている。
【0004】このようにフィルターやスペクトル変換に
よって帯域毎に分割された信号を量子化することによ
り、量子化雑音が発生する帯域を制御することができ、
マスキング効果などの性質を利用して聴覚的により高能
率な符号化を行なうことができる。また、ここで量子化
を行なう前に、各帯域毎に、例えばその帯域における信
号成分の絶対値の最大値で正規化を行なうようにすれ
ば、さらに高能率な符号化を行なうことができる。
【0005】周波数帯域分割された各周波数成分を量子
化する周波数分割幅としては、例えば人間の聴覚特性を
考慮した帯域分割が行われる。すなわち、一般に臨界帯
域(クリティカルバンド)と呼ばれている高域程帯域幅
が広くなるような帯域幅で、オーディオ信号を例えば3
2バンドのような複数の帯域に分割することがある。ま
た、この時の各帯域毎のデータを符号化する際には、各
帯域毎に所定のビット配分或いは、各帯域毎に適応的な
ビットアロケーションすなわちビット割当てによる符号
化が行われる。例えば、上記MDCT処理されて得られ
た係数データを上記ビットアロケーションによって符号
化する際には、上記各ブロック毎のMDCT処理により
得られる各帯域毎のMDCT係数データに対して、適応
的な割当てビット数で符号化が行われることになる。ビ
ット割当手法としては、次の2手法が知られている。
【0006】IEEE Transactions of Accoustics, Speec
h,and Signal Processing, vol. ASSP-25, No.4, Augus
t 1977 では、各帯域毎の信号の大きさをもとに、ビッ
ト割当を行なっている。この方式では、量子化雑音スペ
クトルが平坦となり、雑音エネルギー最小となるが、聴
感覚的にはマスキング効果が利用されていないために実
際の雑音感は最適ではない。また、M.A.Kransner, “Th
e critical band coder--digital encoding of the pe
rceptual requirements of the auditory system”, IC
ASSP 1980, MIT では、聴覚マスキングを利用すること
で、各帯域毎に必要な信号対雑音比を得て固定的なビッ
ト割当を行なう手法が述べられている。しかしこの手法
ではサイン波入力で特性を測定する場合でも、ビット割
当が固定的であるために特性値がそれほど良い値となら
ない。これらの問題を解決するために、ビット割当に使
用できる全ビットが、各小ブロック毎にあらかじめ定め
られた固定ビット割当パターン分と、各ブロックの信号
の大きさに依存させ、前記信号のスペクトルが滑らかな
ほど前記固定ビット割当パターン分への分割比率を大き
くする高能率符号化が提案されている。
【0007】この方法によれば、サイン波入力のよう
に、特定のスペクトルにエネルギーが集中する場合には
そのスペクトルを含むブロックに多くのビットを割り当
てる事により、全体の信号対雑音特性を著しく改善する
ことができる。一般に、急峻なスペクトル成分をもつ信
号に対して人間の聴覚は極めて敏感であるため、このよ
うな方法を用いる事により、信号対雑音特性を改善する
ことは、単に測定上の数値を向上させるばかりでなく、
聴感上、音質を改善するのに有効である。
【0008】ビット割り当ての方法にはこの他にも数多
くのやり方が提案されており、さらに聴覚に関するモデ
ルが精緻化され、符号化装置の能力があがれば聴覚的に
みてより高能率な符号化が可能になる。
【0009】このように、信号をいったん周波数成分に
分解し、その周波数成分を量子化して符号化する方法を
用いると、その周波数成分を復号化して合成して得られ
た波形信号にも量子化雑音が発生するが、もし、元々の
信号成分が急激に変化する場合には、波形信号上の量子
化雑音は必ずしも元の信号波形が大きくない部分でも大
きくなってしまい、このプリ/ポストエコーと呼ばれる
量子化雑音が同時マスキングによって隠蔽されないため
聴感上の障害になる。特にスペクトル変換を使用して多
数の周波数成分に分解した場合には時間分解能が悪くな
り、長い期間にわたって大きな量子化雑音が発生してし
まう。ここで、スペクトル変換の変換長を短くすれば上
記の量子化雑音の発生期間も短くなるが、そうすると周
波数分解能が悪くなり、準定常的な部分における符号化
効率が悪くなってしまう。このような問題を解決する手
段として、信号の周波数分解能を犠牲にして変換長を短
くするという方法が提案されているが、変換長を短くす
ることで1つの変換ブロックに対するビットが減少して
しまい、十分な量子化精度が得られないために音質上大
きな障害となる場合もある。
【0010】その対策として、変換フレーム長を固定と
したままにプリ/ポストエコーを抑制することのできる
音響時系列信号の復号化/符号化のために、符号化装置
においては音響時系列信号がブロック内で時間的に大き
く変化する場合にも変換ブロック長は固定のままで、微
小振幅領域の振幅を増加するように信号を操作してから
周波数スペクトルに変換/量子化を行い、また操作され
た振幅情報も符号化列中に記録する方法が提案されてい
る。
【0011】復号化装置においては符号化装置の逆操作
を行い、周波数スペクトルから復元された音響時系列信
号に対し、符号化列に記録された振幅情報により符号化
装置と逆の振幅情報操作を行う。
【0012】上記操作により、音響時系列信号がブロッ
ク内で大きく変化する場合の微小振幅領域に発生するプ
リ/ポストエコーを効果的に抑制することが可能とな
る。また上記振幅情報操作は、音響時系列信号を帯域分
割フィルタを用いて帯域分割を行い、各帯域毎に振幅情
報操作を行うことでより効果的にプリ/ポストエコーを
効果的に抑制することが可能となることも示されてい
る。
【0013】
【発明が解決しようとする課題】しかしながら、聴感上
障害となるのはプリ/ポストエコーのみではなかった。
特に問題となるのは、変換符号化方法において、フレー
ム長を特に長めに設定した場合である。ブロック長を長
くすればするほど周波数分解能が向上するので符号化効
率は向上するが、本来の音響時系列信号ではある局所的
時間に発生したある特定の周波数成分の時系列信号が、
復号化された音響時系列信号においてはブロック内に拡
散してしまい聴感上障害となってしまう場合がある。こ
の現象は本来の音響時系列信号がブロック内で大きく変
化しない場合にも発生することがあり、従来のプリ/ポ
ストエコーを抑制する装置では解決可能な問題ではなか
った。
【0014】本発明は、上述の実情に鑑みてなされるも
のであって、局所的時間に発生したある特定の周波数成
分の時系列信号が、復号化された音響時系列信号におい
て拡散することによる聴覚上の障害を抑制するような、
音響信号符号化方法および装置、音響信号復号化方法お
よび装置並びに記録媒体を提供することを目的とする。
【0015】
【発明を解決するための手段】上述の課題を解決するた
めに、本発明に係る音響信号符号化方法は、時系列信号
を符号化するものであって、上記時系列信号を複数の周
波数帯域に分割する周波数帯域分割工程と、上記時系列
信号の符号化の区間長であるブロック長を複数に分割し
たサブブック長単位で、上記複数の周波数帯域に分割さ
れたそれぞれの帯域の時系列信号の振幅を検出する振幅
検出工程と、上記振幅検出工程で検出された少なくとも
一つの周波数帯域の振幅情報に基づいて、上記時系列信
号の振幅を操作する振幅操作工程と、上記振幅操作工程
において振幅を操作された時系列信号を周波数成分に変
換する周波数成分変換工程と、上記周波数成分変換工程
からの周波数成分に正規化/量子化を施す正規化/量子
化工程とを有するものである。
【0016】本発明に係る音響信号符号化装置は、時系
列信号を符号化するものであって、上記時系列信号を複
数の周波数帯域に分割する周波数帯域分割手段と、上記
時系列信号の符号化の区間長であるブロック長を複数に
分割したサブブロック長単位で、上記複数の周波数帯域
に分割されたそれぞれの帯域の時系列信号の振幅を検出
する振幅検出手段と、上記振幅検出手段で検出された少
なくとも一つの周波数帯域の振幅情報に基づいて、上記
時系列信号の振幅を操作する振幅操作手段と、上記振幅
操作手段において振幅を操作された時系列信号を周波数
成分に変換する周波数成分変換手段と、上記周波数成分
変換手段からの周波数成分に正規化/量子化を施す正規
化/量子化手段とを有するものである。
【0017】本発明に係る音響信号復号化方法は、時系
列信号の符号化の区間長であるブロック長を複数に分割
したサブブロック長について、周波数帯域に分割された
上記時系列信号の各帯域毎の振幅情報に基づいて、上記
時系列信号の振幅を操作した後、この時系列信号を周波
数成分に変換して各周波数成分について符号化/量子化
を施して符号化してなる符号列が入力し、この符号列を
復号する音響信号復号化方法において、上記符号列を分
解する分解工程と、上記分解工程からの信号に逆量子化
/逆正規化を施して周波数成分とする逆量子化/逆正規
化工程と、上記逆量子化/逆正規化工程からの周波数成
分を時系列信号に合成する合成工程と、上記合成工程で
合成された時系列信号の符号化の区間長であるブロック
長を複数に分割したサブブロック長について、この時系
列信号の振幅を操作する振幅操作工程とを有するもので
ある。
【0018】本発明に係る音響信号復号化装置は、時系
列信号の符号化の区間長であるブロック長を複数に分割
したサブブロック長について、周波数帯域に分割された
上記時系列信号の各帯域ごとの振幅情報に基づいて、上
記時系列信号の振幅を操作した後、この時系列信号を周
波数成分に変換して各周波数成分について符号化/量子
化を施して符号化してなる符号列が入力し、この符号列
を復号する復号化装置において、上記符号列を分解する
分解手段と、上記分解手段からの信号に逆量子化/逆正
規化を施して周波数成分とする逆量子化/逆正規化手段
と、上記逆量子化/逆正規化手段からの周波数成分を時
系列信号に合成する合成手段と、上記合成手段で合成さ
れた時系列信号の符号化の区間長であるブロック長を複
数に分割したサブブロック長について、この時系列信号
の振幅を操作する振幅操作手段とを有するものである。
【0019】本発明に係る記録媒体は、時系列信号を複
数の周波数帯域に分割する周波数帯域分割処理と、上記
時系列信号の符号化の区間長であるブロック長を複数に
分割したサブブロック長単位で、上記複数の周波数帯域
に分割されたそれぞれの帯域の時系列信号の振幅を検出
する振幅検出処理と、上記振幅検出処理で検出された少
なくとも一つの周波数帯域の振幅情報に基づいて、上記
時系列信号の振幅を操作する振幅操作処理と、上記振幅
操作処理において振幅を操作された時系列信号を周波数
成分に分解する周波数成分変換処理と、上記周波数成分
変換処理からの周波数成分に正規化/量子化を施す正規
化/量子化処理との各処理を有する、時系列信号を符号
化する音響信号符号化のプログラムが記録されてなるも
のである。
【0020】また、本発明に係る記録媒体は、符号列を
分解する分解処理と、上記分解処理からの信号に逆量子
化/逆正規化を施して周波数成分とする逆量子化/逆正
規化処理と、上記逆量子化/逆正規化処理からの周波数
成分を時系列信号に合成する合成処理と、上記合成処理
で合成された時系列信号の符号化の区間長であるブロッ
ク長を複数に分割したサブブロック長について、この時
系列信号の振幅を操作する振幅操作処理との各処理を有
する、時系列信号の符号化の区間長であるブロック長を
複数に分割したサブブロック長について、周波数帯域に
分割された上記時系列信号の各帯域毎の振幅情報に基づ
いて、この時系列信号の振幅を操作した後、この時系列
信号を周波数成分に分解して各周波数成分について符号
化/量子化を施して符号化してなる符号列が入力し、こ
の符号列を復号する復号化方法のプログラムが記録され
てなるものである。
【0021】そして、本発明に係る記録媒体は、時系列
信号を複数の周波数帯域に分割する周波数帯域分割工程
と、上記時系列信号の符号化の区間長であるブロック長
を複数に分割したサブブロック単位で、上記複数の周波
数帯域に分割されたそれぞれの帯域の時系列信号の振幅
を検出する振幅検出工程と、上記振幅検出処理にて検出
された少なくとも一つの周波数帯域の振幅情報に基づい
て、上記時系列信号の振幅を操作する振幅操作工程と、
上記振幅操作工程において振幅を操作された時系列信号
を周波数成分に分解する周波数成分変換工程と、上記周
波数成分変換工程からの周波数成分に正規化/量子化を
施す正規化/量子化工程とを有し、時系列信号を符号化
する音響信号符号化方法において上記時系列信号が符号
化された符号列が記録されてなるものである。
【0022】以上において述べたような構成により、本
発明では、局所的時間に発生した周波数成分がフレーム
内に拡散する現象を抑制するために、音響時系列信号を
複数の帯域に分割して解析を行い、局所的に発生してい
る周波数成分の時系列信号を検出し高精度に振幅情報操
作を行うことによって周波数分解能の向上による符号化
効率の向上、および局所的に発生した周波数成分がフレ
ーム内に拡散する現象の抑制を可能とした。
【0023】
【発明の実施の形態】以下、本発明の実施の形態につい
て、図面を参照して説明する。
【0024】すなわち、この実施の形態は、先ずオーデ
ィオ/音声などの音響信号をスペクトルに変換してのち
符号化処理を施して符号列を生成する符号化方法および
装置、符号列を分解して復号化処理を施してスペクトル
に再構成してのち音響信号に逆変換を行う復号化方法お
よび装置、音響信号の符号化および復号化を行う符号化
/復号化装置、ならびに音響信号の符号化および復号化
の手順等を記録した記録媒体についての実施の形態につ
いて説明する。
【0025】まず、音響信号符号化装置の実施の形態と
しては、図1に示すような構成のものを挙げることがで
きる。
【0026】この音響信号符号化装置1は、時系列信号
Sを振幅操作情報Gによって振幅操作を行った後にスペ
クトルFに分解するスペクトル変換部101と、そのス
ペクトルFを正規化情報Nによって正規化する正規化部
102と、正規化されたスペクトルFNを量子化情報Q
によって量子化する量子化部103と、量子化されたス
ペクトルFQ、振幅操作情報G、正規化情報Nおよび量
子化情報をもとに符号列Cを生成する符号列生成部10
4とを有している。
【0027】スペクトル変換部101は、この符号化装
置1に入力する時系列信号Sに振幅操作を施した後に周
波数成分であるスペクトルFに分解する。そして、スペ
クトルFを正規化部102に、振幅操作情報Gを符号列
生成部104に、それぞれ出力する。
【0028】正規化部102は、スペクトル変換部10
1から入力するスペクトルFに正規化を施す。そして、
正規化されたスペクトルFNを量子化部103に、正規
化情報Nを符号列生成部104に、それぞれ出力する。
【0029】量子化部103は、正規化部103から入
力する正規化されたスペクトルFNに量子化を施す。そ
して、量子化されたスペクトルFQおよび量子化情報Q
を符号列生成部104に出力する。
【0030】符号列生成部104は、スペクトル変換部
101からの振幅操作情報G、正規化部102からの正
規化情報N、量子化部103からの量子化情報Qに基づ
いて、量子化部103からの量子化されたスペクトルF
Qを符号化して、符号列Cを出力する。
【0031】この符号化装置1のスペクトル変換部10
1は、図2に示すような構成のスペクトル変換部2とし
て具体化することができる。
【0032】このスペクトル変換部2は、入力される時
系列信号Sをブロック化してブロック化信号SBとする
ブロック化部201と、ブロック化信号SBに振幅操作
を施して振幅操作されたブロック信号SBCとするとと
もに振幅操作情報Gを外部に出力する振幅処理部202
と、振幅操作されたブロック化信号SBCに窓関数Wを
作用させて窓関数Wを作用させたブロック化信号SBG
Wとする窓関数作用部203と、窓関数Wを作用させた
ブロック化信号SBGWにスペクトル変換を施してスペ
クトルFを出力するスペクトル変換手段204とを有し
ている。
【0033】スペクトル変換部2に入力する時系列信号
Sは、ブロック化部201によってある長さの時区間に
ブロック化されてブロック化信号SBとされる。ブロッ
ク化信号SBは、振幅処理部202によって後述の部分
に使用するために振幅操作を受けて振幅操作されたブロ
ック化信号SBGとされる。振幅操作されたブロック化
信号SBGは、周波数分解能向上のために窓関数作用部
203によって適切な窓関数Wを作用させ窓関数Wを作
用させたブロック化信号SBGWとされる。窓関数Wを
作用させたブロック化信号SBGWは、スペクトル変換
手段204によってスペクトル変換を施されてスペクト
ルFとなされる。
【0034】上記符号化装置1のスペクトル変換部10
1は、図3に示すような構成のスペクトル変換部3とし
ても構成することができる。
【0035】このスペクトル変換部3は、入力される時
系列信号Sをブロック化してブロック化信号SBとする
ブロック化部201と、ブロック化信号SBに窓関数W
を作用させて窓関数Wを作用させたブロック化信号とす
る窓関数作用部302と、窓関数Wを作用させたブロッ
ク化信号SBWに振幅操作を施し振幅操作されたブロッ
ク化信号SBWとするとともに外部に振幅操作情報Gを
出力する振幅処理部303と、振幅操作されたブロック
化信号SBGWにスペクトル変換を施してスペクトルF
とするスペクトル変換手段304とを有している。
【0036】スペクトル変換部3に入力する時系列信号
Sは、ブロック化部301によってある長さの時区間に
ブロック化される。ブロック化部301からのブロック
化信号SBは、このブロック化信号SBの前後に生成さ
れるブロック化信号との整合性を持たせるために窓関数
作用部302によって適切な窓関数Wを作用させた窓関
数Wを作用させたブロック化信号WSBとなされる。こ
の窓関数Wを作用させたブロック化信号WBSは、後述
する部分に使用するため振幅処理部303によって振幅
操作Gを受ける。この振幅操作されたブロック化信号S
BWGをスペクトル変換手段304によってスペクトル
Fに変換する。
【0037】上述した符号化装置1のスペクトル変換部
を具体化した、スペクトル変換部2と、スペクトル変換
部3との信号処理の違いは、窓関数Wを振幅操作前に作
用させるか後に作用させるかの違いである。すなわち、
前後のブロック化信号との整合性を重視するか、または
振幅操作を重視するかの違いではある。したがって、適
切な窓関数Wの選択によりどちらの方法を用いても後述
する部分に使用することが可能である。
【0038】スペクトル変換部3の操作は、図4に示す
ように具体化することができる。
【0039】図4中の(a)に示す原信号Sを、一定の
時区間のブロックBで分割しブロック化を行う。この際
ブロックBは前後のブロックBと半分の領域を共有して
持つ。すなわち、図4中の(b)に示す窓関数W1の時
区間の後半は(c)に示す窓関数W2の時区間の前半と
共通している。また、窓関数W2の時区間の後半は、図
4中の(d)に示す窓関数W3の時区間の前半と共通し
ている。そして、共有される領域の合成振幅が原信号に
等しくなるような窓関数W1から窓関数W3を作用させ
ることによって、図4中の(e)に示すブロック化信号
SBW1、(f)に示すブロック化信号SBW2および
(g)に示すブロック化信号SBW3を得る。これらブ
ロック毎に振幅操作Gを行い、スペクトルFに変換を行
う。今後、簡単化のためSBWをSBと表すことにす
る。
【0040】続いて、ブロック化信号SBに対して振幅
を操作しないでスペクトル変換を行う場合についての問
題を図5以降を参照しながら説明する。
【0041】図5は、後述する音響信号の処理の前提と
なる技術を説明するために、特徴のあるブロック化信号
である原信号SBを考え、この原信号SBについて行う
波形操作についてしめすものである。
【0042】このブロック化信号SBは周波数が1KH
zと一定で、ある領域毎に振幅のみが変化する信号であ
る。信号の振幅を検出するためには1つのブロックBを
一定の小領域毎にサブブロックBsと呼ぶ小ブロック毎
に分割し解析を行う。図5中の(a)に示すブロック化
信号SBの振幅変化は、このサブブロックBs毎に規則
的に生じているものとする。
【0043】このブロック化信号SBをスペクトル変換
することを考えると、信号の周波数は一定ではあるが、
サブブロックBs毎に振幅が変化しているので、スペク
トル変換によって得られるスペクトルFの分布は図5中
の(b)に示すように1KHzに最大振幅をもつもの
の、他の周波数成分をも持つ分布になってしまい、符号
化効率は悪化する。
【0044】スペクトル成分Fを逆スペクトル変換によ
ってブロック化信号SBに戻すことを考える。その場合
は、図6中の(a)に示す振幅特性を逆スペクトル変換
すれば本来の信号Sが復元されるはずではあるが、正規
化/量子化の精度が十分でない符号化/復号化スペクト
ルに逆スペクトル変換を施した場合には図6中の(b)
に示すように振幅変化の肩が鈍った復元信号SB’とな
る。このような信号波形の変化は聴感上の障害になるこ
とが経験上知られており、対策を必要とする。
【0045】スペクトル変換を行う長さをブロックBか
らサブブロックBsに変更すると、図7中の(a)に示
す原信号をスペクトル変換した理想振幅特性は(b)に
示すようになる。即ち振幅が変化しないサブブロック毎
にスペクトル変換を行えば、どの時間においてもスペク
トルの成分は1KHzのみであるということになる。
【0046】この場合、前後のサブブロックとの整合性
が完全であれば符号化効率は飛躍的に向上し振幅変化も
高精度に保存されるが、変換のブロック長を切り替える
手段が必要となり符号化装置の規模が大きく複雑になっ
てしまう。またブロック長を分割することによって、1
つのサブブロックに対するビット量も分割されることに
なり、こと高能率に符号化を行おうとする場合には変換
ブロック内でのビット配分が大きく減少するのでビット
割当アルゴリズムも複雑/困難なものとなる。
【0047】本実施の形態では、ブロックBを一定とし
たままでブロックB内の振幅を一定に保つ操作を行うも
とする。このような振幅操作を行う振幅操作部の構成
を、図8に示す。
【0048】この振幅処理部8は、入力されたブロック
化信号SBの振幅を解析して振幅操作情報GBを出力す
る振幅解析部801と、上記ブロック化信号SBおよび
振幅情報GBに基づいて振幅操作情報SBGを出力する
振幅操作部806とを有している。振幅処理部8におい
ては、ブロック化信号SBを2分配し、その一方を振幅
解析部801によって振幅を解析し、振幅操作情報を得
る。
【0049】振幅解析部801は、ブロック化信号SB
をサブブロック信号SBsに分割するサブブロック分割
部802と、サブブロック毎の振幅情報GBsを検出す
る振幅変化検出部803と、1つ前のブロックのサブブ
ロックの振幅操作情報GBs−1を保持しておく振幅変
化情報保持部804と、振幅情報GBs,GBs−1か
ら振幅操作情報GBを生成する振幅操作情報生成部80
5から構成される。
【0050】振幅解析部801に入力したブロック化信
号SBは、サブブロック分割部802にてサブブロック
信号SBsに分割される。サブブロック分割部802か
らのサブブロック信号SBsは、振幅変化検出部803
で検出された振幅情報GBsは、振幅変化情報保持部8
04および振幅操作情報生成部805にそれぞれ出力さ
れる。振幅変化情報保持部804では、振幅変化検出部
803からの振幅情報GBsを1ブロック遅延させる。
振幅操作情報生成部805では、振幅変化検出部803
からの振幅情報GBsおよび振幅変化情報保持部804
からの1ブロック遅延された振幅情報GBs−1をもと
に、振幅操作情報GBを生成する。
【0051】振幅操作部806は、振幅操作情報生成部
805からの振幅操作情報GBをもとブロック化信号S
Bに対して実際に振幅操作を施して、振幅操作信号SB
Gを出力する。
【0052】振幅操作情報生成部805では、サブブロ
ック毎の振幅を検出して振幅操作情報GBを作成する
が、サブブロック毎に非連続に振幅操作を行うとギブス
現象が発生して周波数分解能を悪化させる場合があるの
で、振幅操作は図9中の(a)に示すように過渡部を設
けるようにする。
【0053】また前後のブロックの整合性を計るために
図9中の(a)に示すようなブロック1の振幅操作情報
1とブロック2の振幅操作情報2の連結部の差分を吸収
し(b)の実線で示すように振幅操作量を一致させるこ
とで前後ブロックの整合性を確保する。この場合にも振
幅操作はサブブロック毎に行なわれる。サブブロック間
の振幅操作情報を接続する場合には、図9中の(b)の
実線で示す直線補間よりも点線で示すように滑らかな曲
線によって振幅操作情報を補間したほうが、不連続性に
よって発生するギブス現象を少なくすることが可能であ
る。
【0054】続いて、実際の振幅操作の方法について、
図10に示す具体例を参照して説明する。
【0055】図10中の(a)は図5中の(a)に示し
た信号と同一のものである。この信号に対して振幅操作
を行うが、振幅操作は説明の簡単化のため1つのブロッ
クBのみを対象とし、また振幅操作量はサブブロックB
s毎に一定に変化するものとする。即ち図10(a)に
示すように振幅変化はサブブロックBs毎に非連続的に
検出を行うこととすることを注意されたい。
【0056】図10中の(a)においては、原信号の振
幅はサブブロックBs毎にGa,Gb,Gc,Gd,G
e,Gfと徐々に増加している。この振幅をブロックB
内で一定に保つように、振幅操作情報を図10中の
(b)に示すように振幅情報生成部によって作成する。
【0057】作成された振幅操作情報は、ブロックB内
の振幅を一定のGfに保つため、それぞれGf/Ga,
Gf/Gb,Gf/Gc,Gf/Gd,Gf/Ge,G
f/Gf=1と振幅操作量が決定され、振幅操作部によ
って図10中の(a)に対して振幅操作を行いって
(c)を得る。
【0058】図10(c)は、振幅はGfと一定の1KHz
の信号であるから、その理想振幅特性は図10(d)の
実線で示すように振幅Gfの単スペクトルとなる。ただ
しブロックBの長さは有限であるので実際の振幅特性は
図10中の(d)の点線で示すように幾分拡がった分布
になるが、図5中の(b)に示した振幅特性と比較した
場合には遥かに高い符号化効率を得ることが可能とな
る。
【0059】図10中の(a)に示した振幅特性が理想
的なスペクトル変換を行ったものであるとして、図11
中の(a)に示すように単スペクトルになった場合を仮
定し、この単スペクトルを逆スペクトル変換すると図1
1中の(b)に示すような振幅Gfが一定の信号を得
る。
【0060】この図11中の(b)に対して、スペクト
ル変換前に行った図10中の(b)の振幅操作と逆の振
幅操作である図11中の(c)の逆振幅操作を行うと、
復元信号(d)を得ることができる。この図11中の
(d)に示した復元信号は、図6中の(b)に示した復
元信号SB’と比較した場合、原信号である図10中の
(a)により忠実なものとなる。
【0061】このように、スペクトル変換前と逆スペク
トル変換後の信号に対して振幅操作を行うことで、高能
率かつ高精度に信号波形の符号化が可能となる。そし
て、聴感上の障害となりうるブロック内での振幅の変化
を最小限に抑制することができる。
【0062】さて今までは単周波数成分しか持たない理
想的な条件の下で説明してきたが、今度は一般的な例を
用いて解説する。
【0063】図12中の(a)は、様々な周波数成分を
もった信号である。この信号を符号化/復号化を行うと
その信号波形は(b)のように変化してしまう現象が生
じる場合がある。このような信号の振幅変化は聴感上の
障害となる。
【0064】図12において符号化前/復号化後の信号
の振幅が変化してしまう原因は、原信号を幾つかの帯域
に分割することで詳しく解析可能となる。図12中の
(a)に示す原信号を図13中の(a)に示す低周波数
成分信号及び図13中の(b)に示す高周波成分信号に
分割して解析を行うと、低周波数成分信号の振幅変化と
比較して高周波数成分信号の振幅変化が大きいことがわ
かる。
【0065】振幅変化の少ない低周波数成分は図13中
の(c)に示すように図13中の(a)に示した原信号
高精度に復元されているが、振幅変化の大きい高周波数
成分は図13中の(d)に示すように本来の図13中の
(b)に示した原信号とは大きく変化していることがわ
かる。この高周波数成分の信号の変化が、復元信号の振
幅変化となり聴感上の障害となる。
【0066】即ち、原信号の振幅変化よりも帯域分割さ
れた信号毎の振幅変化が大きい場合があり、原信号の振
幅を一定に操作しただけでは図10、図11に示したよ
うに、原信号を精度よく復元することはできない。
【0067】上述のような前提の下に、以下では、本発
明の実施の形態について説明する。以下で述べる実施の
形態により、上述したような課題が解決される。
【0068】本実施の形態における符号化装置において
は、音響信号を複数の帯域に分割し、その音響信号のサ
ブブロック単位で上記複数の周波数帯域に分割されたそ
れぞれの帯域の信号の振幅を検出し、少なくとも一つの
振幅情報に基づいて上記音響信号の振幅を操作するもの
である。
【0069】この符号化装置は、図14に示すような構
成に具体化することができる。
【0070】この符号化装置14は、入力信号を複数M
の帯域信号SD1からSDMに分割する帯域フィルタバ
ンク部1401と、帯域フィルタバンク部1401から
の帯域信号SD1からSDMについてそれぞれスペクト
ル変換を行いスペクトルFD1からFDMとするととも
に振幅操作情報Gを生成するスペクトル変換部1402
と、スペクトル変換部1402からのスペクトルFD1
からFDMのそれぞれについて正規化を行い正規化スペ
クトルFN1からFNMとするとともに正規化情報Nを
生成する正規化部1403と、正規化部1403からの
正規化スペクトルFN1からFNMのそれぞれの帯域に
ついて量子化を行い量子化スペクトルFQ1からFQM
とするとともに量子化情報Qを生成する量子化部140
4と、スペクトル変換部1402からの振幅操作情報
G、正規化部1403からの正規化情報N、および量子
化部1404からの量子化情報Q、量子化部1404か
らの量子化スペクトルFQ1からFQMについて符号列
を生成する符号生成部1403とを有している。
【0071】この符号化装置14に入力する原信号S
は、帯域分割フィルタバンク部1401によって複数M
の帯域信号SD1からSDMに分割される。この時用い
られる分割フィルタバンク1401には、前述したQM
FフィルタバンクやPQFフィルタバンクなどが用いら
れる。帯域信号SD1からSDMは、それぞれの帯域の
スペクトル変換部1402によってスペクトル変換され
る。このスペクトル変換部1402は、振幅操作を行う
図2または図3、及び図8に示したような部分を有して
おり、SD1からSDMを振幅操作情報Gによって振幅
操作を施してスペクトルFD1からFDMに変換を行
う。
【0072】ここで、帯域フィルタバンク部1401に
よって、各帯域に分割された原信号は、スペクトル変換
部1402にて各帯域毎に振幅を検出される。そして、
少なくとも一つの周波数帯域の振幅情報に基づいて振幅
操作が施された後にスペクトル変換が施される。
【0073】スペクトルFD1からFDMは正規化情報
Nによって正規化部1403で正規化され正規化スペク
トルFN1からFDMとなる。正規化スペクトルFN1
からFDMは量子化情報Qによって量子化部1404で
量子化され量子化スペクトルFQ1からFQMとなり、
G,N、Qとともに符号列生成部1405によってそれ
ぞれ符号CFQ1〜CFQM、CG、CN、CQに変換
され、これらが多重化された符号列Cが出力される。
【0074】符号化装置14から出力される符号列C
は、この符号列Cの単位であるフレーム毎に、図15に
示すように構成されている。すなわち、1フレーム分の
符号列は、振幅操作情報CG1からCGM、正規化情報
CN、量子化情報CQおよび量子化スペクトルCFQ1
からCFQMの順序で配列して構成されている。
【0075】この符号化装置は、原信号をある帯域毎に
分割してその分割された信号毎に対して図10、図11
に示したような振幅操作を行うことにより符号化を行う
ものである。この符号化装置は、帯域に分割した信号に
対して上述した振幅操作を行うことにより、図12、図
13に示したような符号化前/復号化後の信号の振幅変
化を抑制することが可能とするものである。
【0076】続いて、上記符号化装置14において、帯
域分割数Mを2に設定した例について、図16を参照し
て説明する。
【0077】図12中の(a)に示す原信号を、帯域分
割フィルタ1401によって図16中の(a)に示す低
周波数成分信号と(c)に示す高周波数成分信号に分割
する。これら信号に対して、図10に示したような振幅
操作を行ことによって図16中の(b)の振幅操作低周
波数信号及び図16中の(d)の振幅操作高周波数信号
へ振幅操作を行ったのちにスペクトル変換を施すこと
で、高能率かつ高精度に信号波形の符号化を可能とし、
復元信号の振幅変化による聴感上の障害を最小限に抑制
することができる。
【0078】続いて、原信号を帯域分割したそれぞれの
帯域の振幅情報のみを利用する符号化装置について、図
17を参照して説明する。この符号化装置16は、図1
3に示した復元信号の振幅変化による聴感上の障害の抑
制のために、帯域分割した振幅情報のみを利用するもの
である。
【0079】この符号化装置16は、入力された原信号
Sを複数Mの帯域信号SD1からSDMに分割する帯域
分割フィルタバンク1601と、帯域信号SD1からS
DMおよび原信号Sをもとに振幅解析およびスペクトル
変換を行い振幅操作情報GおよびスペクトルFを生成す
るスペクトル変換部1602と、スペクトルFを正規化
して正規化スペクトルFNとするとともに正規化情報N
を生成する正規化部1606と、正規化スペクトルFN
を量子化する量子化して量子化スペクトルFQとすると
ともに量子化情報Qを生成する量子化部1607と、振
幅操作信号G、正規化情報Nおよび量子化情報Q、量子
化スペクトルFQに基づいて符号列Cを生成する符号生
成部1608とを有している。
【0080】上記スペクトル変換部1602は、帯域分
割フィルタバンク1601からの帯域信号SD1からS
DMをそれぞれ振幅解析して振幅解析情報GBおよび振
幅操作情報Gを生成する振幅解析部1603と、原信号
Sおよび振幅解析情報GBに基づいて振幅操作を行い振
幅操作された信号SBCを出力する振幅操作部1604
と、振幅操作された信号SBCにスペクトル変換を施し
てスペクトルFを出力するスペクトル変換手段1605
とを有している。
【0081】まず入力信号である原信号Sは2分配さ
れ、一方の信号を帯域分割フィルタバンク部1601に
よって複数の帯域信号SD1からSDMに分割し、それ
ぞれの帯域信号毎に振幅解析部1603によって振幅情
報を解析し振幅操作情報GBを得る。振幅操作部160
4では、振幅操作情報GBによって原信号Sを振幅操作
部1604によって振幅を操作を行って振幅操作された
信号SBGとし、スペクトル変換手段1605によって
スペクトルFに変換が施される。
【0082】スペクトルFは、正規化情報Nによって正
規化部1606で正規化され正規化スペクトルFNとな
る。正規化スペクトルFNは量子化情報Qによって量子
化部1607で量子化され量子化スペクトルFQとな
り、G、N、Qとともに符号列生成部1608によって
符号CFQ,CG,CN,CQに変換され、これらが多
重化されて符号列Cとして出力される。
【0083】符号化装置16から出力される符号列C
は、この符号列Cの単位であるフレーム毎に、図18に
示すように構成されている。すなわち、1フレーム分の
符号列は、振幅操作情報CG、正規化情報CN、量子化
情報CQおよび量子化スペクトルCFQの順序で配列し
て構成されている。
【0084】続いて、上記符号化装置16において、帯
域分割数Mを2に設定した例について、図19を参照し
て説明する。
【0085】図19中の(a)に示す原信号は、帯域分
割フィルタ1601によって図17中の(b)の低周波
数成分信号と(c)の高周波数成分信号に分割される。
符号化装置16は、これらの信号を解析し、振幅変化量
が大きい帯域の振幅情報のみを使用して原信号に対して
振幅操作を行うので、図19中の(d)の振幅操作信号
は振幅が一定になっていないため、高能率かつ高精度に
信号波形の符号化を可能とすることは保証できないが、
振幅変化の大きい高周波数成分の復元信号の振幅変化に
よる聴感上の障害を抑制することは可能である。
【0086】ブロック内をサブブロックに分割し振幅操
作を行うことが音質上有効であることを示してきたが、
サブブロック毎の振幅情報をすべて符号化して記録する
ことは情報量の増加を意味し、高能率符号化と相反する
ものである。このため、振幅情報の制限を行い、振幅操
作にかかる情報の削減を行う手法について説明する。
【0087】実査にゲインコントロールを行う変化点を
設定し、変化点から次の変化点を一つの領域として、各
領域毎に最大振幅値がGfになるようにゲインコントロ
ールを行う。
【0088】図20中の(a)は原信号SBの振幅情報
を示したものである。先頭のサブブロックから振幅量を
検出し、変化量及び変化量の順序が示されている。ここ
で聴感上の障害がなるべく発生しないように振幅変化量
が少ない順に制限を行うことで振幅操作情報の増加を抑
制する。
【0089】図20中の(b)は振幅操作を行うサブブ
ロックを変化量の大きい順から3つに限定したものであ
る。ここでは図に示したように実際にゲインコントロー
ルを行う変化点を設定し、変化点から次の変化点までを
一つの領域として、各領域毎に最大振幅値がGfになる
ようにゲインコントロールを行う例を示す。
【0090】図20中の(c)は図20中の(b)から
導出した振幅操作情報GBであり、この振幅操作情報G
Bを原信号SBに対して操作させたものが図20中の
(d)の振幅操作信号SBGとなる。
【0091】図20中の(d)の振幅はブロック内で一
定ではないが、振幅変化の大きいサブブロックに関して
振幅操作を行い、振幅変化の少ないサブブロックの情報
を削減しており、符号化/復号化による信号波形上の振
幅変化が大きく現れやすい部分に関して確実に操作を行
うことで、復号化信号に現れる聴感上の障害を抑制する
ことが可能である。
【0092】図21も振幅操作にかかる情報量の削減を
行う手法を示したものである。
【0093】図21中の(a)には原信号SBの振幅情
報を示したものである。先頭のサブブロックから振幅量
を検出し、変化量及び変化量の順序が示されている。こ
こで聴感上の障害がなるべく発生しないように振幅変化
量がある一定のしきい値より少ない場合に制限を行うこ
とで振幅操作情報の増加を抑制する。
【0094】図21中の(b)は振幅操作を行うサブブ
ロック間の振幅変化量がしきい値以下の場合、隣接する
サブブロックと合成することで振幅情報を削減してい
る。ここでは、各変化点において検出された変化量がし
きい値以下の場合、その変化点に隣接するサブブロック
の振幅が大きい方の最大振幅値がGfになるように振幅
操作を行う例である。
【0095】図21中の(c)は、図21中の(b)か
ら導出した振幅操作情報GBであり、この振幅操作情報
GBを原信号SBに対して操作させたものが図21中の
(d)の振幅操作信号SBGとなる。
【0096】図21中の(d)の振幅はブロック内で一
定ではないが、振幅変化の大きいサブブロックに関して
振幅操作を行い、振幅変化の少ないサブブロックの情報
を削減しており、符号化/復号化による信号波形上の振
幅変化が大きく現れやすい部分に関して確実に操作を行
うことで、復号化信号に現れる聴感上の障害を抑制する
ことが可能である。
【0097】次に、逆正規化されたスペクトルを時系列
信号に合成するための逆スペクトル変換部について説明
する。
【0098】逆スペクトル変換部29は、図22に示す
ような構成に具体化される。この逆スペクトル変換部2
9は、入力されたスペクトルFに逆スペクトル変換を施
して復元ブロック信号SBとする逆スペクトル変換手段
2901と、復元ブロック信号SBおよび外部から入力
された振幅操作情報Gに基づいて逆振幅操作を施してS
B/Gとする逆振幅操作部2902と、SB/Gに窓関
数Wを作用させてSBW/Gとする窓関数作用部290
3と、SBW/Gに逆ブロック化を施して時系列信号
S’とする逆ブロック化部2904とから構成されてい
る。
【0099】この逆スペクトル変換部29においては、
まず復号化されたスペクトルFを逆スペクトル変換手段
2901によって逆スペクトル変換を施し復元ブロック
化信号SBを得る。この復元ブロック化信号SBに対し
符号化装置によって行われた振幅操作Gと逆の振幅操作
を逆振幅操作部2902によって施す。逆振幅操作が施
された復元ブロック化信号SBは、前後のブロックとの
整合性を保つために窓関数作用部2903によって窓関
数Wを作用させ、逆ブロック化部2904によって前後
のブロックとの合成が行われれ、復元された時系列信号
S’を得る。
【0100】逆スペクトル変換部は、図23に示すよう
な構成としても具体化される。
【0101】この逆スペクトル変換部30は、入力され
たスペクトルFに逆スペクトル変換を施して復元ブロッ
ク信号SBとする逆スペクトル変換手段3001と、復
元ブロック化信号SBに窓関数Wを作用させてSBWと
する窓関数作用部3002と、SBWおよび外部から入
力された振幅操作情報Gに基づいて逆振幅操作を施して
SBW/Gとする逆振幅操作部3003と、SBW/G
に逆ブロック化を施して時系列信号S’とする逆ブロッ
ク化部3004とを有している。
【0102】この逆スペクトル変換部30においては、
まず復号化されたスペクトルFを逆スペクトル変換手段
3001によって逆スペクトル変換を施し復元ブロック
化信号SBを得る。この復元ブロック化信号SBに前後
のブロックとの整合性を保つために窓関数作用部300
2によって窓関数を作用させ、さらに符号化装置によっ
て行われた振幅操作Gと逆の振幅操作を逆振幅操作部3
003によって施す。逆振幅操作が施された復元ブロッ
ク化信号SBは、逆ブロック化部3004によって前後
のブロックとの合成が行われ、復元信号S’を得る。
【0103】続いて、図22に示した逆ブロック化部2
9における操作は、図24に示すように具体化すること
ができる。
【0104】図24において、図中の(a)に示す各ブ
ロック毎に逆スペクトル変換された復元ブロック化信号
SB/G1、図中の(b)に示す復元ブロック化信号S
B/G2、および図中の(c)に示す復元ブロック化信
号SB/G3(c)は、前後のブロックと半分の領域を
共有して持ち、共有される領域の合成振幅が原信号に等
しくなるように、図中の(d)に示す窓関数W1、図中
の(e)に示す窓関数W2、および図中の(f)に示す
窓関数W3(f)を作用させることによって、図中の
(g)に示す復元信号S’を得る。
【0105】図24に示した逆スペクトル変換部29の
逆振幅操作部2902は、図25の逆振幅操作部32に
示すように具体化することができる。
【0106】この逆振幅操作部32は、入力された振幅
操作情報Gから振幅を復元する振幅復元部3201と、
入力された振幅操作信号SBおよび振幅復元部3201
からの逆振幅操作情報1/GBをもとに復元ブロック化
信号SB/Gを生成する逆振幅操作部3204とを有し
ている。
【0107】振幅復元部3201は、振幅操作情報Gを
保持して1ブロック遅延させる振幅操作情報保持部32
02と、振幅操作情報保持部3202からの遅延された
振幅操作情報および振幅操作情報Gに基づいて逆振幅操
作情報を生成する逆振幅操作情報生成部3203とを有
している。
【0108】この逆振幅操作部32においては、まず振
幅操作情報Gを用いて振幅復元部3201によって、符
号化装置で行った振幅操作と逆の振幅操作情報1/GB
を生成し、復元ブロック化信号SBに対して逆振幅操作
部3204によって振幅操作を行い、復元ブロック化信
号SB/Gを得る。
【0109】振幅復元部3201の内部では、前のブロ
ックの振幅操作情報を保持しておく振幅変化情報保持部
3202からの振幅情報G−1及び現在のブロックの振
幅情報Gから逆振幅操作情報生成部3203によっによ
って逆振幅操作情報1/GBを生成する。
【0110】逆振幅情報生成部3204では、図26に
示すようにサブブロック毎の振幅を復元して振幅操作を
行う逆振幅操作情報1/GBを作成する。符号化装置に
おいてサブブロック間の振幅操作量を曲線によって補間
されている場合には、逆振幅操作信号の振幅を正確に復
元するため復号化装置においても曲線補間する必要があ
る。
【0111】符号化装置において帯域分割フィルタを用
いて帯域毎信号に分割し、帯域毎に振幅操作を行って符
号化された符号列に対する復号化装置は図27に示すよ
うに具体化される。
【0112】この復号化装置34は、入力された符号列
Cを複数Mの量子化スペクトルFQ1からFQMに分解
する符号分解部3401と、符号分解部3401からの
量子化スペクトルFQ1からFQMに逆量子化を施して
正規化スペクトルFN1からFNMとする逆量子化部3
402と、逆量子化部3402からの正規化スペクトル
FN1からFNMに逆正規化を施してスペクトルFD1
からFDMとする逆正規化部3493と、逆正規化部3
403からのスペクトルFN1からFNMに逆スペクト
ル変換を施して復元信号SD1からSDMとする逆スペ
クトル変換部3404と、復元信号SD1からSDMを
帯域合成して時系列信号SD’とする帯域合成フィルタ
バンク部3405とを有している。
【0113】この符号化復号化装置においては、符号列
Cは符号列分解部3401によって帯域毎に量子化スペ
クトルFQ1からFQMに分解されるとともに、符号列
Cから量子化情報Q、正規化情報Nおよび振幅操作情報
Nが抽出される。
【0114】符号分解部3401による分解により得ら
れたFQ1からFQMまでの量子化スペクトルは、量子
化情報Qを用いて逆量子化部3402によって正規化ス
ペクトルFN1からFNMに逆量子化され、正規化情報
Nを用いて逆正規化部3403によってスペクトルFD
1からFDMに逆正規化され、逆スペクトル変換部34
04によって帯域毎の復元信号SD1からSDMに合成
される。帯域毎の復元信号SD1からSDMは帯域合成
フィルタバンク部3405によってすべての帯域信号を
含む復元信号S’に復元される。
【0115】逆スペクトル変換部は図22に示した逆ス
ペクトル変換部29、図23に示した逆スペクトル変換
部30のように構成され、逆振幅操作はGをもとに行わ
れる。
【0116】図28は振幅操作を行わずに符号化/復号
化を行った場合と振幅操作を行い符号化/復号化を行っ
た場合の結果を比較したものである。
【0117】図28中の(a)に示す波形は、図12中
の(a)に示した原信号の波形の高周波数成分信号であ
り、これを振幅操作しないで符号化/復号化した場合に
は復元信号は図28中の(b)に示す波形のようにな
り、原信号に比較して復元信号の振幅が大きく変化して
おり聴感上障害が発生する。
【0118】一方、図28中の(c)に示す波形は図2
8中の(a)示す波形に対して、図10に示したように
符号化装置においてブロック内の振幅が一定になるよう
に振幅操作を行った信号である。この図28中の(c)
示す波形を符号化し復号化時に逆の振幅操作を行うこと
で図28中の(a)に示す波形に忠実な振幅を持つ図2
8中の(d)に示す波形の復元信号を得ることができ
る。
【0119】符号化装置において帯域分割フィルタを用
いて帯域毎信号に分割し、各帯域の振幅情報のみを利用
して符号化された符号列に対する復号化装置36は図2
9に示すように具体化される。
【0120】この復号化装置36は、入力された符号列
Cを、量子化スペクトルFQ、量子化情報Q、正規化情
報N、および振幅操作情報Gに分解する符号分解部36
01と、符号列分解部3601からの量子化スペクトル
FQおよび量子化情報Qに基づいて正規化スペクトルF
Nを生成する逆量子化部3602と、逆量子化部360
2からの正規化スペクトルFNおよび符号分解部360
1からの正規化情報に基づいてスペクトルFを復元する
逆正規化部3603と、逆正規化部3603からのスペ
クトルFからのスペクトルFおよび符号分解部3601
からの振幅操作情報Gに基づいて逆スペクトル変換を施
して時系列信号G’を復元する逆スペクトル変換部36
06とを有している。
【0121】この符号化装置36においては、帯域毎の
振幅情報を得るために帯域分割フィルタを必要とした
が、復号化装置では帯域分割されていない信号の逆振幅
操作のみを行えば良いので、図27に示した符号化復号
化装置34のような帯域合成フィルタ3405は必要と
しないため、後述する図34に示す基本的な復号化装置
24と同じ構成となり、構造が簡単になるという利点が
ある。
【0122】図30は振幅操作を行わずに符号化/復号
化を行った場合と振幅操作を行い符号化/復号化を行っ
た結果を比較したものである。図30中の(a)に示す
波形は図12に示した高周波数成分信号であり、これを
振幅操作しないで符号化/復号化した場合には復元信号
は図30中の(b)に示す波形のようになり、原信号に
比較して復元信号の振幅が大きく変化しており聴感上障
害が発生する。
【0123】一方、図30中の(c)に示す波形は図3
0中の(a)に示した原信号の波形に対して、図17に
示したように符号化装置において高周波数成分の信号が
ブロック内の振幅が一定になるように振幅操作を行った
信号である。この図30中の(c)に示す波形を符号化
し復号化時に逆の振幅操作を行うことで図30中の
(c)に示す波形に忠実な振幅を持つ図30中の(c)
に示す復元信号を得ることができる。
【0124】次に、上述のように振幅操作が施された後
に符号化された符号化データを復号化する復号化装置に
ついて説明する。
【0125】まず、符号化装置によって生成された符号
列Cを、記録媒体に記録、または通信によって伝送を行
うような符号列記録装置について説明する。
【0126】この符号列記録装置21は、図31に示す
ように、入力される符号列Cに暗号化を施すための鍵情
報Kを選択する鍵情報選択部2101と、鍵情報Kによ
って振幅操作情報符号列CGに足対して暗号化を施す振
幅操作情報符号列暗号化部2102と、暗号化された振
幅情報暗号化符号列CKとそれ以外の符号列C−CGを
一つの符号列に再構築した符号列CRを出力する符号列
再構築部2103と、符号列再構築部2103にて再構
築された符号列CRを実際に記録する符号列記録部21
04を有してなる。
【0127】図31に示した符号列記録装置21の振幅
操作情報符号列暗号化部2102は、図32に示すよう
に具体化することができる。
【0128】この振幅操作情報符号列暗号化部22は、
入力された符号列Cから振幅操作情報符号列CGの抽出
を行うとともに振幅操作情報以外の符号列C−CGを出
力する振幅操作情報符号列の抽出部2201と、振幅操
作情報符号列の抽出部2201からの振幅操作情報符号
列CGおよび入力された鍵情報Kに基づいて符号列を暗
号化して振幅操作情報暗号化符号列を出力する符号列暗
号化部2202とを有している。
【0129】この振幅操作情報符号列暗号化部22にお
いては、符号列Cから振幅情操作情報のみを振幅操作情
報符号列抽出部2201によって抽出した振幅操作情報
符号列CGに対し鍵情報Kを用いて符号列暗号化部22
02によって暗号化を行う。振幅操作情報符号列暗号化
部22は鍵情報K、振幅情報暗号化符号列CKおよび振
幅情報以外の符号列C−CGを出力する。
【0130】符号列記録装置21によって記録/伝送さ
れる符号列CRでは、図33に示すように、振幅操作情
報に関する符号列がフレーム毎の符号列の先頭部に記録
される。このように記録することで、復号化装置におい
ては符号列の先頭を検査しただけで、その符号列が暗号
化されてるかいないかを判定可能となる。無論、符号列
の先頭以外に記録しても一向に問題はない。
【0131】符号列記録装置によって記録/伝送された
符号列CRを復元する復号化装置は、図34に示すよう
に、記録/伝送されてきた符号列CRを復号化装置に取
り込むために符号列読出部2401、符号列Cを分解す
る符号列分解部2402、分解された符号列Qを基に逆
量子化を行う逆量子化部2403、逆量子化されたスペ
クトルFQに対して逆正規化を行う逆正規化2404、
及び逆正規化されたスペクトルFを復元信号S’に合成
する逆スペクトル変換部2405を有してなる。
【0132】符号列読み出し部2401は、記録媒体ま
たは通信回線からの符号列CRおよび鍵情報Kに基づい
て符号列の読み出しを行い、符号列Cを出力する。
【0133】符号列分解部2402は、符号列Cを分解
して量子化スペクトルFQ、量子化情報Q、正規化情報
および振幅操作情報Gを得る。
【0134】逆量子化部2403は、量子化スペクトル
FQおよび量子化情報Qをもとに逆量子化を行い、正規
化スペクトルFNを出力する。
【0135】逆量子化部2404は、正規化スペクトル
FNおよび正規化情報Nをもとに逆正規化を行い、スペ
クトルFを出力する。
【0136】逆スペクトル変換部2405は、スペクト
ルFおよび振幅操作情報Gをもとに、逆スペクトル変換
を行い、時系列信号S’を出力する。
【0137】図34に示した復号化装置24の符号列読
出部2401は、図35の符号列読出部25に示すよう
に具体化することができる。
【0138】この符号列読出部25においては、符号列
CRに暗号化され記録されている振幅操作情報暗号化符
号列CKを解読し振幅操作情報CGを得る振幅操作情報
符号列解読部2501と、符号列Cを再構築する符号列
再構築部2502によって構成される。
【0139】記録媒体/通信から入力される符号列CR
は、振幅操作情報符号列解読部2501にて、別途入手
される鍵情報Kにより、振幅操作情報CGに解読され
る。そして、符号列再構築部2502により符号列Cに
再構築される。
【0140】図35に示した符号列読出部25に備えら
れる振幅操作情報符号列解読部2501は、図36に示
す振幅操作情報符号列解読部26にに示すように具体化
することができる。
【0141】この振幅操作符号列解読部26は、入力さ
れる符号列を分割し、暗号化符号列CKおよび振幅操作
情報以外の符号列CR−CGを出力する符号列分割部2
602と、別途入手された鍵情報Kを検査し、偽の場合
には振幅操作情報なし、すなわちCG=0を出力し、真
の場合には符号列解読部に入力する鍵情報検査部260
1と、符号列分割部2602からの暗号化符号列CKお
よび鍵情報検査部2601からの情報を入力され、振幅
操作情報符号列CGを出力する符号列解読部2603と
を有している。
【0142】この振幅操作符号列解読部26において
は、まず符号列CRを符号列分割部2602によって暗
号化されている振幅操作情報暗号化符号列CK及びその
他符号列CR−CGに分割する。暗号化されている振幅
操作情報暗号化符号列CKを符号列解読部2603によ
って解読するには、暗号化に用いたものと同じ鍵情報K
を必要とする。鍵情報を入手するためには符号列の著作
者に対し、許可を受けることによって鍵情報Kを入手す
るものとする。
【0143】入手した鍵情報Kを鍵情報検査部2601
よって検査し、暗号化された鍵情報Kに等しい場合は符
号列解読部2603によって解読を行い振幅操作情報符
号列CGを得ることが可能であるが、鍵情報Kが一致し
ない場合には振幅操作情報は0として出力される。この
ため、復号化装置では正しい復号化を行うことができな
くなり、本来の信号に比較して振幅が大きく異なる信号
となってしまう。
【0144】符号列CRには、予め解読に必要な初期鍵
情報KIを図37に示すように埋め込むことも可能であ
る。すなわち、図37に示す符号列CRにおいては、先
頭の振幅操作情報暗号化符号列に、初期鍵情報KIが続
いている。
【0145】また図38に示すように復号化装置では鍵
情報がない場合でも、ある一定期間Dは鍵情報を必要と
しないでも暗号化された符号列の解読を可能とし、ある
一定期間D後には解読が不可能になるように記録装置及
び復号化装置を構成することも可能である。この機能を
初期鍵情報KIにも適用することが可能であり、一定期
間D後には初期鍵情報KIを使用不可とすることで、正
しい復号化をできなくすることも可能である。
【0146】即ち、ある一定期間Dのみ無償で記録され
た音楽などを聞くことが可能であるが、一定期間D後は
使用料を支払わなければ正しい復号化が行えずに悪い音
質の音楽しか聞くことができなくなる。
【0147】このように振幅操作情報のみをを暗号化す
ることで、符号列が何の音楽を記録しているかはわかる
が、実際に音楽としては楽しむことができないようにす
ることで、著作権保護や課金システムとして利用可能で
ある。
【0148】次に、本発明に係る記録媒体の実施の形態
について説明する。
【0149】この記録媒体としては、時系列信号を複数
の周波数帯域に分割する周波数帯域分割処理と、上記時
系列信号の符号化の区間長であるブロック長を複数に分
割したサブブロック長単位で、上記複数の周波数帯域に
分割されたそれぞれの帯域の時系列信号の振幅を検出す
る振幅検出処理と、上記振幅検出工程で検出された少な
くとも一つの周波数帯域の振幅情報に基づいて、上記時
系列信号の振幅を操作する振幅操作処理と、上記振幅操
作処理において振幅を操作された時系列信号を周波数成
分に分解する周波数成分変換処理と、上記周波数成分変
換処理からの周波数成分に正規化/量子化を施す正規化
/量子化処理との各処理を有する、時系列信号を符号化
する音響信号符号化のプログラムが記録されてなる記録
媒体を挙げることができる。
【0150】また、この記録媒体としては、符号列を分
解する分解処理と、上記分解処理からの信号に逆量子化
/逆正規化を施して周波数成分とする逆量子化/逆正規
化処理と、上記逆量子化/逆正規化処理からの周波数成
分を時系列信号に合成する合成処理と、上記合成処理で
合成された時系列信号の符号化の区間長であるブロック
長を複数に分割したサブブロック長について、この時系
列信号の振幅を操作する振幅操作処理との各処理を有す
る、時系列信号の符号化の区間長であるブロック長を複
数に分割したサブブロック長について、周波数帯域に分
割された上記時系列信号の各帯域毎の振幅情報に基づい
て、この時系列信号の振幅を操作した後、この時系列信
号を周波数成分に分解して各周波数成分について符号化
/量子化を施して符号化してなる符号列が入力し、この
符号列を復号する復号化方法のプログラムが記録されて
なる記録媒体を挙げることができる。
【0151】そして、この記録媒体としては、時系列信
号を複数の周波数帯域に分割する周波数帯域分割工程
と、上記時系列信号の符号化の区間長であるブロック長
を複数に分割したサブブロック単位で、上記複数の周波
数帯域に分割されたそれぞれの帯域の時系列信号の振幅
を検出する振幅検出工程と、上記振幅検出処理にて検出
された少なくとも一つの周波数帯域の振幅情報に基づい
て、上記時系列信号の振幅を操作する振幅操作工程と、
上記振幅操作工程において振幅を操作された時系列信号
を周波数成分に分解する周波数成分変換工程と、上記周
波数成分変換工程からの周波数成分に正規化/量子化を
施す正規化/量子化工程とを有し、時系列信号を符号化
する音響信号符号化方法において上記時系列信号が符号
化された符号列が記録されてなる記録媒体を挙げること
ができる。
【0152】このような記録媒体は、例えば、いわゆる
CD−ROM等のディスク媒体として提供される。ま
た、この記録媒体は、例えばマルチメディア通信回線と
しても提供される。
【0153】以上説明したように、本発明では、スペク
トル変換を施す場合に、変換フレーム内に局所的に発生
する特定の周波数成分の時系列信号の拡散を抑制するた
めに、入力信号を複数の帯域に分割して解析を行って、
信号の振幅を操作することによって信号の拡散を効果的
に抑制するものである。
【0154】
【発明の効果】上述のように、本発明においてはブロッ
ク内の振幅操作を行うことで、符号化効率が高くかつ高
精度な符号化を可能とした。特に本発明では原信号を帯
域毎に分割することで最適な振幅操作を行うことで、よ
り符号化効率及び符号化精度の向上が可能となった。
【図面の簡単な説明】
【図1】符号化装置の構成を示すブロック図である。
【図2】スペクトル変換部の構成を示すブロック図であ
る。
【図3】スペクトル変換部の構成を示すブロック図であ
る。
【図4】スペクトル変換部における操作を示す図であ
る。
【図5】ブロック化信号に対して振幅を操作しないで変
換する場合についての問題を説明する図である。
【図6】スペクトル成分を逆スペクトル変換によってブ
ロック化信号に戻すことを説明する図である。
【図7】スペクトル変換を行う長さをブロックからサブ
ブロックに変更することを説明する図である。
【図8】振幅操作部の構成を示すブロック図である。
【図9】振幅操作に過渡期を設けることを説明する図で
ある。
【図10】実際の振幅操作を説明する具体例である。
【図11】単スペクトルである場合の具体例を説明する
図である。
【図12】複数の周波数成分を含む場合の具体例を説明
する図である。
【図13】原信号を帯域に分割することによる解析を説
明する図である。
【図14】符号化装置の構成を示すブロック図である。
【図15】フレームのデータ構成を示す図である。
【図16】原信号を帯域分割してそれぞれの帯域の振幅
情報のみを利用する方法を説明する図である。
【図17】符号化装置の構成を示す図である。
【図18】フレームのデータ構成を示す図である。
【図19】符号化装置において帯域分割数を2とした場
合を説明する図である。
【図20】振幅操作にかかる情報量の削減を行う手法を
示す図である。
【図21】振幅操作にかかる情報量の削減を行う手法を
示す図である。
【図22】逆スペクトル変換部の構成を示すブロック図
である。
【図23】逆スペクトル変換部の構成を示すブロック図
である。
【図24】逆ブロック化部における操作を説明する図で
ある。
【図25】逆振幅操作部における構成を示すブロック図
である。
【図26】サブブロック毎の振幅を復元して行う振幅操
作を説明する図である。
【図27】符号化復号化装置の構成を示すブロック図で
ある。
【図28】振幅操作を行わずに符号化/復号化を行った
場合と、帯域別に振幅操作を行って符号化/復号化を行
った場合の結果を比較する図である。
【図29】復号化装置の構成を示すブロック図である。
【図30】振幅操作を行わずに符号化/復号化を行った
場合と、帯域別に振幅操作を行って符号化/復号化を行
った場合の結果を比較する図である。
【図31】符号列記録装置の構成を示すブロック図であ
る。
【図32】振幅操作情報符号列暗号化部の構成を示すブ
ロック図である。
【図33】符号列のデータ構成を示す図である。
【図34】復号化装置の構成を示すブロック図である。
【図35】符号列読出部の構成を示すブロック図であ
る。
【図36】振幅操作情報符号列解読部の構成を示すブロ
ック図である。
【図37】符号列に含まれる初期鍵情報を説明する図で
ある。
【図38】初期化鍵情報の有効期限を説明する図であ
る。
【符号の説明】
1 符号化装置、24 復号化装置、34 符号化復号
化装置、101 スペクトル変換部、102 正規化
部、103 量子化部、104 符号列生成部、C 符
号列、F スペクトル、G 振幅操作情報、N 正規化
情報、Q 量子化情報、S 時系列信号

Claims (37)

    【特許請求の範囲】
  1. 【請求項1】 時系列信号を符号化する音響信号符号化
    方法において、 上記時系列信号を複数の周波数帯域に分割する周波数帯
    域分割工程と、 上記時系列信号の符号化の区間長であるブロック長を複
    数に分割したサブブック長単位で、上記複数の周波数帯
    域に分割されたそれぞれの帯域の時系列信号の振幅を検
    出する振幅検出工程と、 上記振幅検出工程で検出された少なくとも一つの周波数
    帯域の振幅情報に基づいて、上記時系列信号の振幅を操
    作する振幅操作工程と、 上記振幅操作工程において振幅を操作された時系列信号
    を周波数成分に変換する周波数成分変換工程と、 上記周波数成分変換工程からの周波数成分に正規化/量
    子化を施す正規化/量子化工程とを有することを特徴と
    する音響信号符号化方法。
  2. 【請求項2】 上記周波数成分変換工程は、上記時系列
    信号をスペクトル変換により周波数成分に変換すること
    を特徴とする請求項1記載の音響信号符号化方法。
  3. 【請求項3】 上記スペクトル変換を行う際に、上記時
    系列信号の区間長を示すブロック長は一定とし、上記ブ
    ロック長は上記時系列信号における前後のブロック長と
    重なり合うことを特徴とする請求項2記載の音響信号符
    号化方法。
  4. 【請求項4】 上記振幅操作工程は、上記ブロック長に
    おいて上記時系列信号の振幅に所定値以上の変動が存在
    すると、そのブロック長内の振幅を一定に保つように振
    幅操作することを特徴とする請求項1記載の音響信号符
    号化方法。
  5. 【請求項5】 上記周波数成分変換工程は、上記時系列
    信号をスペクトル変換する際に周波数分解能を向上させ
    ることにより符号化効率を向上させることを特徴とする
    請求項6記載の音響信号符号化方法。
  6. 【請求項6】 上記振幅操作工程は、上記振幅検出工程
    により上記ブロック長において特定の周波数成分の時系
    列信号に所定値以上の変動が検出されると、そのブロッ
    ク長内の特定の周波数成分の時系列信号の振幅を一定に
    保つように振幅操作することを特徴とする請求項1記載
    の音響信号符号化方法。
  7. 【請求項7】 上記周波数成分変換工程は、上記時系列
    信号をスペクトル変換する際に特定の周波数成分の周波
    数分解能を向上させることにより特定の周波数成分の符
    号化効率を向上させることを特徴とする請求項6記載の
    音響信号符号化方法。
  8. 【請求項8】 上記帯域分割工程においては、上記振幅
    情報の検出のために帯域分割フィルタを用いることを特
    徴とする請求項6記載の音響信号符号化方法。
  9. 【請求項9】 上記振幅操作工程は帯域分割された時系
    列信号毎に振幅操作を行い、上記周波数成分変換工程は
    上記振幅操作工程で振幅操作された各時系列信号をスペ
    クトル変換することを特徴とする請求項8記載の音響信
    号符号化方法。
  10. 【請求項10】 上記振幅操作工程は上記帯域分割フィ
    ルタを用いて帯域分割された時系列信号毎については該
    振幅情報のみを用い、帯域分割を行わない上記時系列信
    号に振幅操作を施し、上記周波数成分変換工程は上記振
    幅操作工程で振幅操作を施された帯域分割を行わない上
    記時系列信号をスペクトル変換することを特徴とする請
    求項8記載の音響信号符号化方法。
  11. 【請求項11】 上記振幅操作工程は、振幅操作を行う
    数を制限することを特徴とする請求項1記載の音響信号
    符号化方法。
  12. 【請求項12】 上記振幅操作工程は、振幅操作量が小
    さいものから制限を行うことを特徴とする請求項11記
    載の音響信号符号化方法。
  13. 【請求項13】 上記振幅操作工程は、振幅操作量が所
    定値より小さいと、隣接する振幅操作情報と合成を行う
    ことにより振幅操作数の制限を行うことを特徴とする請
    求項13記載の音響信号符号化方法。
  14. 【請求項14】 上記振幅操作は、振幅操作量が滑らか
    に変化するときには曲線補間することにより振幅操作数
    を制限することを特徴とする請求項11記載の音響信号
    符号化方法。
  15. 【請求項15】 時系列信号を符号化する音響信号符号
    化装置において、 上記時系列信号を複数の周波数帯域に分割する周波数帯
    域分割手段と、 上記時系列信号の符号化の区間長であるブロック長を複
    数に分割したサブブロック長単位で、上記複数の周波数
    帯域に分割されたそれぞれの帯域の時系列信号の振幅を
    検出する振幅検出手段と、 上記振幅検出手段で検出された少なくとも一つの周波数
    帯域の振幅情報に基づいて、上記時系列信号の振幅を操
    作する振幅操作手段と、 上記振幅操作手段において振幅を操作された時系列信号
    を周波数成分に変換する周波数成分変換手段と、 上記周波数成分変換手段からの周波数成分に正規化/量
    子化を施す正規化/量子化手段とを有することを特徴と
    する音響信号符号化装置。
  16. 【請求項16】 時系列信号の符号化の区間長であるブ
    ロック長を複数に分割したサブブロック長について、周
    波数帯域に分割された上記時系列信号の各帯域毎の振幅
    情報に基づいて、上記時系列信号の振幅を操作した後、
    この時系列信号を周波数成分に変換して各周波数成分に
    ついて符号化/量子化を施して符号化してなる符号列が
    入力し、この符号列を復号する音響信号復号化方法にお
    いて、 上記符号列を分解する分解工程と、 上記分解工程からの信号に逆量子化/逆正規化を施して
    周波数成分とする逆量子化/逆正規化工程と、 上記逆量子化/逆正規化工程からの周波数成分を時系列
    信号に合成する合成工程と、 上記合成工程で合成された時系列信号の符号化の区間長
    であるブロック長を複数に分割したサブブロック長につ
    いて、この時系列信号の振幅を操作する振幅操作工程と
    を有することを特徴とする音響信号復号化方法。
  17. 【請求項17】 上記符号列は、上記符号列の振幅操作
    についての振幅操作情報を含み、その振幅操作情報は暗
    号化されていることを特徴とする請求項16記載の音響
    信号復号化方法。
  18. 【請求項18】 上記振幅操作情報の暗号化を解除する
    暗号解除工程を有し、上記分解工程で上記符号列から取
    り出された振幅操作情報は、上記暗号化解除工程で暗号
    化が解除されることを特徴とする請求項17記載の音響
    信号復号化方法。
  19. 【請求項19】 上記暗号解除工程は、上記振幅制御情
    報の暗号化を解除するために鍵の符号を必要とすること
    を特徴とする請求項18記載の音響信号復号化方法。
  20. 【請求項20】 上記暗号解除工程は、上記振幅制御情
    報の暗号化を所定期間内は解除することができるが、上
    記期間を経過すると上記振幅制御情報の暗号化を解除す
    るためには鍵の符号を必要とすることを特徴とする請求
    項18記載の音響信号復号化方法。
  21. 【請求項21】 上記合成手段は、上記周波数成分を逆
    スペクトル変換により時系列信号に合成することを特徴
    とする請求項16記載の音響信号復号化方法。
  22. 【請求項22】 上記逆スペクトル変換の際には、上記
    周波数成分および上記時系列信号の区間長を示すブロッ
    ク長とし、上記ブロック長は、上記周波数成分および上
    記時系列信号における前後のブロック長とは重なり合う
    ことを特徴とする請求項21記載の音響信号復号化方
    法。
  23. 【請求項23】 上記振幅操作工程は、上記ブロック長
    において振幅操作情報が記録されているとその振幅操作
    情報を復元し、さらにその振幅操作情報を逆の振幅操作
    を行うことを特徴とする請求項22記載の音響信号復号
    化方法。
  24. 【請求項24】 上記振幅操作工程は、上記時系列信号
    をスペクトル変換する際に周波数分解能を向上させるこ
    とにより符号化効率を向上させるために行った振幅操作
    と逆の操作を行うことにより上記時系列信号の振幅を本
    来の振幅に復元させることを特徴とする請求項23記載
    の音響信号復号化方法。
  25. 【請求項25】 上記振幅操作工程は、上記ブロック長
    において特定の周波数成分の時系列信号に対する振幅操
    作情報が記録されていると、その逆の振幅操作を行うこ
    とを特徴とする請求項22記載の音響信号復号化方法。
  26. 【請求項26】 上記振幅操作工程は、上記時系列信号
    をスペクトル変換する際に特定の周波数成分の時系列信
    号における周波数分解能を向上させることにより符号化
    効率を向上させるために行った振幅操作と逆の操作を行
    うことにより上記時系列信号の本来の振幅に復元するこ
    とを特徴とする請求項25記載の音響信号復号化方法。
  27. 【請求項27】 特定の周波数成分の時系列信号の振幅
    情報の検出には帯域分割フィルタが用いられたことを特
    徴とする請求項26記載の音響信号復号化方法。
  28. 【請求項28】 上記符号列は、上記帯域分割フィルタ
    を用いて帯域分割された時系列信号毎に振幅操作を行っ
    てからスペクトル変換を行って得られた周波数成分を時
    系列信号に変換したものであって、上記合成工程にて分
    割された帯域毎に逆スペクトル変換を行って得られた時
    系列信号に対して、上記振幅操作工程で逆振幅操作を行
    い、帯域合成フィルタによって帯域分割されたすべての
    帯域信号を含む時系列信号を復元することを特徴とする
    請求項27記載の音響信号復号化方法。
  29. 【請求項29】 上記符号列は、上記帯域分割フィルタ
    を用いて帯域分割された時系列信号毎に振幅のみを検出
    し、振幅操作は帯域分割を行っていない上記時系列信号
    に行ってからスペクトル変換を行って得られた周波数成
    分を時系列信号に変換したものであって、上記合成工程
    にて逆スペクトル変換を行って得られた時系列信号に対
    して上記振幅操作工程で逆振幅操作を行うことを特徴と
    する請求項27記載の音響信号復号化方法。
  30. 【請求項30】 上記振幅操作工程は、振幅操作の制限
    を受けた情報を復元することを特徴とする請求項22記
    載の音響信号復号化方法。
  31. 【請求項31】 上記振幅操作工程は、振幅操作量が小
    さいものから制限を受けた情報を復元することを特徴と
    する請求項30記載の音響信号復号化方法。
  32. 【請求項32】 上記振幅操作工程は、振幅操作量が所
    定値より小さいと複数の振幅操作量を合成された情報を
    復元することを特徴とする請求項30記載の音響信号復
    号化方法。
  33. 【請求項33】 上記振幅操作工程は、振幅操作量が曲
    線保管された情報を復元することを特徴とする請求項3
    0記載の音響信号復号化方法。
  34. 【請求項34】 時系列信号の符号化の区間長であるブ
    ロック長を複数に分割したサブブロック長について、周
    波数帯域に分割された上記時系列信号の各帯域ごとの振
    幅情報に基づいて、上記時系列信号の振幅を操作した
    後、この時系列信号を周波数成分に変換して各周波数成
    分について符号化/量子化を施して符号化してなる符号
    列が入力し、この符号列を復号する音響信号復号化装置
    において、 上記符号列を分解する分解手段と、 上記分解手段からの信号に逆量子化/逆正規化を施して
    周波数成分とする逆量子化/逆正規化手段と、 上記逆量子化/逆正規化手段からの周波数成分を時系列
    信号に合成する合成手段と、 上記合成手段で合成された時系列信号の符号化の区間長
    であるブロック長を複数に分割したサブブロック長につ
    いて、この時系列信号の振幅を操作する振幅操作手段と
    を有することを特徴とする音響信号復号化装置。
  35. 【請求項35】 時系列信号を複数の周波数帯域に分割
    する周波数帯域分割処理と、 上記時系列信号の符号化の区間長であるブロック長を複
    数に分割したサブブロック長単位で、上記複数の周波数
    帯域に分割されたそれぞれの帯域の時系列信号の振幅を
    検出する振幅検出処理と、 上記振幅検出処理で検出された少なくとも一つの周波数
    帯域の振幅情報に基づいて、上記時系列信号の振幅を操
    作する振幅操作処理と、 上記振幅操作処理において振幅を操作された時系列信号
    を周波数成分に分解する周波数成分変換処理と、 上記周波数成分変換処理からの周波数成分に正規化/量
    子化を施す正規化/量子化処理との各処理を有する、時
    系列信号を符号化する音響信号符号化のプログラムが記
    録されてなる記録媒体。
  36. 【請求項36】 符号列を分解する分解処理と、 上記分解処理からの信号に逆量子化/逆正規化を施して
    周波数成分とする逆量子化/逆正規化処理と、 上記逆量子化/逆正規化処理からの周波数成分を時系列
    信号に合成する合成処理と、 上記合成処理で合成された時系列信号の符号化の区間長
    であるブロック長を複数に分割したサブブロック長につ
    いて、この時系列信号の振幅を操作する振幅操作処理と
    の各処理を有する、時系列信号の符号化の区間長である
    ブロック長を複数に分割したサブブロック長について、
    周波数帯域に分割された上記時系列信号の各帯域毎の振
    幅情報に基づいて、この時系列信号の振幅を操作した
    後、この時系列信号を周波数成分に分解して各周波数成
    分について符号化/量子化を施して符号化してなる符号
    列が入力し、この符号列を復号する復号化方法のプログ
    ラムが記録されてなる記録媒体。
  37. 【請求項37】 時系列信号を複数の周波数帯域に分割
    する周波数帯域分割工程と、 上記時系列信号の符号化の区間長であるブロック長を複
    数に分割したサブブロック単位で、上記複数の周波数帯
    域に分割されたそれぞれの帯域の時系列信号の振幅を検
    出する振幅検出工程と、 上記振幅検出処理にて検出された少なくとも一つの周波
    数帯域の振幅情報に基づいて、上記時系列信号の振幅を
    操作する振幅操作工程と、 上記振幅操作工程において振幅を操作された時系列信号
    を周波数成分に分解する周波数成分変換工程と、 上記周波数成分変換工程からの周波数成分に正規化/量
    子化を施す正規化/量子化工程とを有し、時系列信号を
    符号化する音響信号符号化方法において上記時系列信号
    が符号化された符号列が記録されてなる記録媒体。
JP28562498A 1998-10-07 1998-10-07 音響信号符号化方法及び装置、音響信号復号化方法及び装置並びに記録媒体 Expired - Fee Related JP4193243B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP28562498A JP4193243B2 (ja) 1998-10-07 1998-10-07 音響信号符号化方法及び装置、音響信号復号化方法及び装置並びに記録媒体
US09/412,556 US7580893B1 (en) 1998-10-07 1999-10-05 Acoustic signal coding method and apparatus, acoustic signal decoding method and apparatus, and acoustic signal recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP28562498A JP4193243B2 (ja) 1998-10-07 1998-10-07 音響信号符号化方法及び装置、音響信号復号化方法及び装置並びに記録媒体

Publications (3)

Publication Number Publication Date
JP2000114975A true JP2000114975A (ja) 2000-04-21
JP2000114975A5 JP2000114975A5 (ja) 2005-11-10
JP4193243B2 JP4193243B2 (ja) 2008-12-10

Family

ID=17693950

Family Applications (1)

Application Number Title Priority Date Filing Date
JP28562498A Expired - Fee Related JP4193243B2 (ja) 1998-10-07 1998-10-07 音響信号符号化方法及び装置、音響信号復号化方法及び装置並びに記録媒体

Country Status (2)

Country Link
US (1) US7580893B1 (ja)
JP (1) JP4193243B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002158589A (ja) * 2000-09-11 2002-05-31 Matsushita Electric Ind Co Ltd 符号化装置および復号化装置
WO2002103683A1 (fr) * 2001-06-15 2002-12-27 Sony Corporation Appareil et procede de codage
JP2003110429A (ja) * 2001-09-28 2003-04-11 Sony Corp 符号化方法及び装置、復号方法及び装置、伝送方法及び装置、並びに記録媒体
JP2006119363A (ja) * 2004-10-21 2006-05-11 Casio Comput Co Ltd 音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法
JP2007272238A (ja) * 2000-12-14 2007-10-18 Sony Corp 符号化装置および方法、復号装置および方法、並びに記録媒体

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3870193B2 (ja) * 2001-11-29 2007-01-17 コーディング テクノロジーズ アクチボラゲット 高周波再構成に用いる符号器、復号器、方法及びコンピュータプログラム
JP4899359B2 (ja) 2005-07-11 2012-03-21 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
JP4876574B2 (ja) * 2005-12-26 2012-02-15 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
US8326617B2 (en) * 2007-10-24 2012-12-04 Qnx Software Systems Limited Speech enhancement with minimum gating
US8606566B2 (en) * 2007-10-24 2013-12-10 Qnx Software Systems Limited Speech enhancement through partial speech reconstruction
US8015002B2 (en) 2007-10-24 2011-09-06 Qnx Software Systems Co. Dynamic noise reduction using linear model fitting
CN102208188B (zh) 2011-07-13 2013-04-17 华为技术有限公司 音频信号编解码方法和设备

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5095392A (en) * 1988-01-27 1992-03-10 Matsushita Electric Industrial Co., Ltd. Digital signal magnetic recording/reproducing apparatus using multi-level QAM modulation and maximum likelihood decoding
DE3925663A1 (de) * 1989-08-03 1991-02-07 Thomson Brandt Gmbh Digitales signalverarbeitungssystem
US5687281A (en) * 1990-10-23 1997-11-11 Koninklijke Ptt Nederland N.V. Bark amplitude component coder for a sampled analog signal and decoder for the coded signal
US6400996B1 (en) * 1999-02-01 2002-06-04 Steven M. Hoffberg Adaptive pattern recognition based control system and method
JP3123286B2 (ja) * 1993-02-18 2001-01-09 ソニー株式会社 ディジタル信号処理装置又は方法、及び記録媒体
US7171016B1 (en) * 1993-11-18 2007-01-30 Digimarc Corporation Method for monitoring internet dissemination of image, video and/or audio files
US6681029B1 (en) * 1993-11-18 2004-01-20 Digimarc Corporation Decoding steganographic messages embedded in media signals
US5731767A (en) * 1994-02-04 1998-03-24 Sony Corporation Information encoding method and apparatus, information decoding method and apparatus, information recording medium, and information transmission method
TW295747B (ja) * 1994-06-13 1997-01-11 Sony Co Ltd
US5654952A (en) * 1994-10-28 1997-08-05 Sony Corporation Digital signal encoding method and apparatus and recording medium
JPH08190764A (ja) * 1995-01-05 1996-07-23 Sony Corp ディジタル信号処理方法、ディジタル信号処理装置及び記録媒体
JPH08223049A (ja) * 1995-02-14 1996-08-30 Sony Corp 信号符号化方法及び装置、信号復号化方法及び装置、情報記録媒体並びに情報伝送方法
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
JP4326031B2 (ja) * 1997-02-06 2009-09-02 ソニー株式会社 帯域合成フィルタバンク及びフィルタリング方法並びに復号化装置
US6064954A (en) * 1997-04-03 2000-05-16 International Business Machines Corp. Digital audio signal coding
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002158589A (ja) * 2000-09-11 2002-05-31 Matsushita Electric Ind Co Ltd 符号化装置および復号化装置
JP4508490B2 (ja) * 2000-09-11 2010-07-21 パナソニック株式会社 符号化装置および復号化装置
JP2007272238A (ja) * 2000-12-14 2007-10-18 Sony Corp 符号化装置および方法、復号装置および方法、並びに記録媒体
JP4548444B2 (ja) * 2000-12-14 2010-09-22 ソニー株式会社 符号化装置および方法、復号装置および方法、並びに記録媒体
WO2002103683A1 (fr) * 2001-06-15 2002-12-27 Sony Corporation Appareil et procede de codage
US6850179B2 (en) 2001-06-15 2005-02-01 Sony Corporation Encoding apparatus and encoding method
JP2003110429A (ja) * 2001-09-28 2003-04-11 Sony Corp 符号化方法及び装置、復号方法及び装置、伝送方法及び装置、並びに記録媒体
JP2006119363A (ja) * 2004-10-21 2006-05-11 Casio Comput Co Ltd 音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法
JP4626261B2 (ja) * 2004-10-21 2011-02-02 カシオ計算機株式会社 音声符号化装置及び音声符号化方法

Also Published As

Publication number Publication date
JP4193243B2 (ja) 2008-12-10
US7580893B1 (en) 2009-08-25

Similar Documents

Publication Publication Date Title
ES2237706T3 (es) Reconstruccion de componentes de alta frecuencia.
US7627482B2 (en) Methods, storage medium, and apparatus for encoding and decoding sound signals from multiple channels
KR100402189B1 (ko) 오디오신호압축방법
EP1701452B1 (en) System and method for masking quantization noise of audio signals
US6253165B1 (en) System and method for modeling probability distribution functions of transform coefficients of encoded signal
US6240380B1 (en) System and method for partially whitening and quantizing weighting functions of audio signals
JP4296752B2 (ja) 符号化方法及び装置、復号方法及び装置、並びにプログラム
JP4622164B2 (ja) 音響信号符号化方法及び装置
CN103594090A (zh) 使用时间分辨率能选择的低复杂性频谱分析/合成
WO1995021489A1 (fr) Methode et appareil de codage de donnees, methode et appareil de decodage de donnees, support d'enregistrement de donnees et mode de transmission de donnees
JP4193243B2 (ja) 音響信号符号化方法及び装置、音響信号復号化方法及び装置並びに記録媒体
TR201808452T4 (tr) Algısal ses kodeklerinde harmonik sinyaller için faz uyum kontrolü.
JPH1084284A (ja) 信号再生方法および装置
RU2368018C2 (ru) Кодирование аудиосигнала с низкой скоростью передачи битов
JP2002372996A5 (ja)
JP4657570B2 (ja) 音楽情報符号化装置及び方法、音楽情報復号装置及び方法、並びにプログラム及び記録媒体
JPH0846518A (ja) 情報符号化方法及び復号化方法、情報符号化装置及び復号化装置、並びに情報記録媒体
JP3557674B2 (ja) 高能率符号化方法及び装置
KR100952065B1 (ko) 부호화 방법 및 장치, 및 복호 방법 및 장치
WO1999044291A1 (fr) Dispositif et procede de codage, dispositif et procede de decodage, support d'enregistrement de programme et de donnees
JPH09135176A (ja) 情報符号化装置および方法、情報復号化装置および方法、並びに情報記録媒体
JP7279160B2 (ja) サブバンド併合および時間領域エイリアシング低減を使用した適応的な非均一時間/周波数タイリングによる知覚音声符号化
Wang et al. Time-varying MMSE modulated lapped transform and its applications to transform coding for speech and audio signals
JP3263881B2 (ja) 情報符号化方法及び装置、情報復号化方法及び装置並びに情報記録媒体及び情報伝送方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050921

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050921

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071108

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071113

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080115

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080603

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080804

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20080815

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080902

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080915

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111003

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121003

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131003

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees