JPH11177434A - 音声符号化復号方式 - Google Patents

音声符号化復号方式

Info

Publication number
JPH11177434A
JPH11177434A JP9280836A JP28083697A JPH11177434A JP H11177434 A JPH11177434 A JP H11177434A JP 9280836 A JP9280836 A JP 9280836A JP 28083697 A JP28083697 A JP 28083697A JP H11177434 A JPH11177434 A JP H11177434A
Authority
JP
Japan
Prior art keywords
orthogonal transform
low
quantization
transform coefficient
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9280836A
Other languages
English (en)
Other versions
JP3765171B2 (ja
Inventor
Kazunobu Kondou
多伸 近藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP28083697A priority Critical patent/JP3765171B2/ja
Priority to US09/167,072 priority patent/US6141637A/en
Publication of JPH11177434A publication Critical patent/JPH11177434A/ja
Application granted granted Critical
Publication of JP3765171B2 publication Critical patent/JP3765171B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 従来のベクトル量子化と同等レベルのビット
レートで、しかも音声品質の劣化が少ない音声符号化復
号方式を提供する。 【解決手段】 音声信号は、MDCT部1で所定区間毎
に時間領域から周波数領域に直交変換されて直交変換係
数が求められる。LPC分析部2、ピッチ成分分析部4
及びパワースペクトラム分析部6は、音声信号を分析し
て補助情報を求める。演算手段3,5,7は補助情報に
よって直交変換係数を平滑化し、この平滑化された直交
変換係数をベクトル量子化部8でベクトル量子化する。
平滑化された直交変換係数のベクトル量子化前後の低域
成分をそれぞれ低域成分抽出部10,12で抽出してベ
クトル量子化誤差を求め、これをスカラー量子化部14
でスカラー量子化して低域補正情報を得る。この低域補
正情報は、量子化インデックス及び補助情報と共に符号
化出力として出力される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、音声や楽音等の
信号(以下、総称して「音声信号」と呼ぶ)を時間領域
から周波数領域へ直交変換してベクトル量子化すること
により音声信号を圧縮符号化する音声符号化復号方式に
関する。
【0002】
【従来の技術】従来より、低ビットレートで高品質の圧
縮符号化が可能である音声信号の圧縮符号化方式として
ベクトル量子化が広く知られている。ベクトル量子化
は、符号帳(コードブック)を用いて音声信号波形を一
定区間毎に量子化することにより、その情報量を格段に
削減することができるため、音声情報の通信分野等に広
く使用されている。符号帳は多くの学習サンプルデータ
を用いて一般化Lloydアルゴリズム等によって学習され
る。しかし、これによって得られた符号帳は、学習サン
プルデータの持つ特性に大きく影響を受ける。従って、
符号帳が特定の特性に偏らないようにするためには、相
当数のサンプルデータを用いて学習を行う必要がある
が、それでも全てのパターンを網羅することは不可能で
ある。このため、符号帳はなるべくランダムなデータを
用いて作成される。
【0003】一方、音声信号を圧縮符号化する場合、音
声信号のパワースペクトルの偏りに着目して音声信号を
直交変換(FFT,DCT,MDCT等)することで圧
縮効率を高めることがなされている。これをベクトル量
子化に適用する場合、直交変換係数の振幅は予め特定の
レベルに固定化しておくことが望ましい。振幅値がバラ
バラであると、多くの符号ビットが必要になる上、それ
に対応する符号ベクトルの数も膨大になるからである。
このため、直交変換係数をベクトル量子化する場合に
は、音声信号を線形予測分析(LPC)してそのスペ
クトル包絡を予測する、移動平均予測等を用いてフレ
ーム間の相関を取り除く、ピッチ予測を行う、聴覚
心理特性を用いて帯域に依存する冗長性を取り除く等の
手法を用いて、音声信号の周波数スペクトル(直交変換
係数)を平滑化し、ベクトル量子化に適したデータとし
てから符号帳の学習を行うようにしている(例えば「周
波数領域重み付けインタリーブベクトル量子化(TwinV
Q)によるオーディオ符号化」岩上他:日本音響学会講
演論文集,平成6年10月,pp339)。なお、これら直
交変換係数を平滑化するための情報は、補助情報として
量子化インデックスと共に伝送される。
【0004】
【発明が解決しようとする課題】ところで、音声信号は
多くの場合、定常的な調波構造を有するため、周波数領
域に変換された変換係数列の包絡には細かいスパイク状
の凹凸が現れる。この凹凸は線形予測やピッチ予測を組
み合わせても十分に表現することは難しい。このため、
上述した平滑化技術を用いても音声信号の周波数スペク
トルの平滑化はまだ十分とはいえないのが現状である。
【0005】振幅値がある程度固定されていることを前
提とするベクトル量子化では、平滑化しきれなかった部
分にベクトル量子化誤差が顕著に現れる。特にピッチ性
の高い音声信号の場合、低域で現れるベクトル量子化誤
差が目立った聴感上の劣化を引き起こす。しかし、低域
成分の再現性を高めるために符号ビット数を多くする
と、前述したように符号ベクトル数が膨大になり、ビッ
トレートも増大するという問題がある。
【0006】この発明は、このような問題点に鑑みなさ
れたもので、従来のベクトル量子化と同等レベルのビッ
トレートで、しかも音声品質の劣化が少ない音声符号化
復号方式を提供することを目的とする。
【0007】
【課題を解決するための手段】この発明に係る音声符号
化復号方式は、音声信号を所定区間毎に時間領域から周
波数領域に直交変換して直交変換係数を求めると共に、
前記音声信号を分析して求められた補助情報によって前
記直交変換係数を平滑化し、この平滑化された直交変換
係数をベクトル量子化して量子化インデックスを得、更
に前記平滑化された直交変換係数の低域成分のベクトル
量子化誤差を抽出してこれをスカラー量子化して低域補
正情報を得、前記量子化インデックスを前記低域補正情
報及び前記補助情報と共に符号化出力として出力する音
声符号化装置と、この音声符号化装置から出力される符
号化出力に含まれる前記量子化インデックスをベクトル
逆量子化して前記直交変換係数を復号すると共に、前記
低域補正情報を復号して前記復号された直交変換係数の
低域成分を補正し、この補正された直交変換係数を前記
補助情報に基づいて平滑化前の状態に復元した後、周波
数領域から時間領域に逆直交変換して前記音声信号を復
号する音声復号装置とを備えたことを特徴とする。
【0008】この発明に係る音声符号化装置は、音声信
号を所定区間毎に時間領域から周波数領域に直交変換し
て直交変換係数を出力する直交変換手段と、前記音声信
号を分析して前記直交変換係数を平滑化するための補助
情報を求める音声信号分析手段と、この音声信号分析手
段で求められた補助情報によって前記直交変換係数を平
滑化する演算手段と、この演算手段から得られる平滑化
された直交変換係数をベクトル量子化して量子化インデ
ックスを出力するベクトル量子化手段と、このベクトル
量子化手段で得られた量子化インデックスを逆量子化し
て復号直交変換係数を出力するベクトル逆量子化手段
と、前記演算手段から出力される直交変換係数と前記ベ
クトル逆量子化手段から出力される復号直交変換係数の
低域成分の誤差を抽出する低域誤差抽出手段と、この低
域誤差抽出手段から抽出される低域成分の誤差をスカラ
ー量子化して低域補正情報を出力するスカラー量子化手
段と、前記音声信号分析手段からの補助情報、前記ベク
トル量子化手段からの量子化インデックス及び前記スカ
ラー量子化手段からの低域補正情報を符号化出力として
出力する合成手段とを備えたことを特徴とする。
【0009】この発明に係る音声復号装置は、音声信号
の直交変換係数を平滑化するための補助情報、平滑され
た直交変換係数をベクトル量子化して得られた量子化イ
ンデックス及び前記平滑化された直交変換係数の低域成
分のベクトル量子化誤差をスカラー量子化して得られた
低域補正情報を含む符号化情報を入力し、前記量子化イ
ンデックス、低域補正情報及び補助情報をそれぞれ分離
する情報分離手段と、この情報分離手段で分離された量
子化インデックスをベクトル逆量子化して直交変換係数
を出力するベクトル逆量子化手段と、前記情報分離手段
で分離された低域補正情報を復号するスカラー逆量子化
手段と、前記情報分離手段で分離された補助情報を復号
する補助情報復号手段と、前記ベクトル逆量子化手段で
得られた直交変換係数の低域成分を前記復号された低域
補正情報によって補正すると共に、この補正された直交
変換係数を前記復号された補助情報に基づいて平滑化前
の状態に復元する演算手段と、この演算手段の出力を周
波数領域から時間領域に逆直交変換して前記音声信号を
復号する逆直交変換手段とを備えたことを特徴とする。
【0010】また、この発明に係る媒体に記憶された音
声符号化復号プログラムは、音声信号を所定区間毎に時
間領域から周波数領域に直交変換して直交変換係数を求
めると共に、前記音声信号を分析して求められた補助情
報によって前記直交変換係数を平滑化し、この平滑化さ
れた直交変換係数をベクトル量子化して量子化インデッ
クスを得、更に前記平滑化された直交変換係数の低域成
分のベクトル量子化誤差を抽出してこれをスカラー量子
化して低域補正情報を得、前記量子化インデックスを前
記低域補正情報及び前記補助情報と共に符号化出力とし
て出力する音声符号化処理と、この音声符号化処理によ
って出力される符号化出力に含まれる前記量子化インデ
ックスをベクトル逆量子化して前記直交変換係数を復号
すると共に、前記低域補正情報を復号して前記復号され
た直交変換係数の低域成分を補正し、この補正された直
交変換係数を前記補助情報に基づいて平滑化前の状態に
復元した後、周波数領域から時間領域に逆直交変換して
前記音声信号を復号する音声復号処理とを含むことを特
徴とする。
【0011】この発明では、音声信号を分析して求めら
れた補助情報によって直交変換係数を平滑化すると共
に、平滑化された直交変換係数の低域成分のベクトル量
子化誤差を抽出してこれをスカラー量子化して低域補正
情報を得、量子化インデックスを低域補正情報及び補助
情報と共に符号化出力として出力する。このため、直交
変換係数の低域成分は、低域補正情報によって補正する
ことで正確に再現可能になり、聴感上目立った音質の劣
化を防止することができる。低域補正情報は、直交変換
係数のベクトル量子化誤差、即ち直交変換係数の量子化
前後の振幅差に基づく誤差成分であり、しかも低域成分
(例えば0〜2kHz程度)に限定されているので、ス
カラー量子化による符号ビット数の増加は僅かで済むこ
とになる。
【0012】
【発明の実施の形態】以下、図面を参照して、この発明
の好ましい実施の形態について説明する。図1は、この
発明の一実施例に係る音声符号化復号システムにおける
音声符号化装置(送信側)の構成を示すブロック図であ
る。ディジタルの時系列信号からなる音声信号は、直交
変換手段としてのMDCT(Modified Discrete Cosine
Transform)部1及び音声分析手段であるLPC(Line
ar Predictive Coding)分析部2にそれぞれ供給され
る。MDCT部1では、音声信号を、所定サンプル数を
1フレームとしてフレーム毎に切り出し、時間領域から
周波数領域へMDCT変換してMDCT係数を出力す
る。LPC分析部2は、1フレームの時系列信号を共分
散法、自己相関法等のアルゴリズムを用いてLPC分析
し、音声信号のスペクトラム包絡を予測係数(LPC係
数)として求めると共に、得られたLPC係数を量子化
して量子化LPC係数を出力する。
【0013】MDCT部1から出力されるMDCT係数
は、割算器3に入力され、LPC分析部2から出力され
るLPC係数で除算されることにより、その振幅値が正
規化(平坦化)される。割算器3の出力は、ピッチ成分
分析部4に供給され、ピッチ成分を抽出される。抽出さ
れたピッチ成分は減算器5で正規化されたMDCT係数
から分離される。ピッチ成分を分離された正規化MDC
T係数は、パワースペクトラム分析部6に入力され、こ
こでサブバンド毎のパワースペクトラムが求められる。
即ち、MDCT係数の振幅包絡は、実際にはLPC分析
によるパワースペクトラム包絡と相違するため、ピッチ
成分を分離された正規化MDCT係数から再度スペクト
ラム包絡を求めて、これを割算器7によって正規化す
る。ここでは、LPC分析部2、ピッチ成分分析部4及
びパワースペクトラム分析部6が音声信号分析手段を構
成し、量子化されたLPC係数、ピッチ情報及びサブバ
ンド情報が補助情報となる。また、割算器3,7及び減
算器5がMDCT係数の平滑化のための演算手段であ
る。
【0014】補助情報により平坦化されたMDCT係数
は、重み付きベクトル量子化部8でベクトル量子化され
る。ここでは、MDCT係数と符号帳との照合によって
最もマッチングする符号ベクトルの量子化インデックス
が符号化出力として求められる。ベクトル量子化に際し
ては、聴覚心理モデル分析部9が補助情報に基づいて聴
覚心理モデルを分析し、マスキング効果等を考慮して聴
感的に量子化歪みを最小にするような重み付けを行う。
【0015】また、この装置では、ベクトル量子化誤差
による低域成分の歪みを補正するため、ベクトル量子化
誤差をスカラー量子化して得られた低域補正情報を符号
化出力に付加する。即ち、平坦化されたMDCT係数の
低域成分が低域成分抽出部10で抽出される。また、量
子化インデックスをベクトル逆量子化部11で逆量子化
して復号された平坦化MDCT係数の低域成分が低域成
分抽出部12で抽出される。低域成分抽出部10,12
の出力の差分が減算器13で求められる。これらベクト
ル逆量子化部11、低域成分抽出部10,12及び減算
器13が低域誤差抽出手段を構成している。これら低域
成分抽出部10,12の動作設定値は、発明者実験で
は、90Hzから1kHzの範囲の成分を抽出するよう
に設定して、聴感上良好な結果が得られているが、さら
に抽出範囲を拡大する場合その上下限値としては、0H
zから2kHz程度までが妥当と考えられる。この低域
量子化誤差はスカラー量子化部14でスカラー量子され
る。これによって低域補正情報が得られる。
【0016】以上の処理で求められた量子化インデック
ス、補助情報及び低域補正情報は、合成手段としてのマ
ルチプレクサ15に供給され、ここで合成されて符号化
出力として出力される。
【0017】一方、図2に示す音声復号装置(受信側)
では、上記と逆の処理によって音声信号が復号される。
即ち、上述した符号化出力は、情報分離手段であるデマ
ルチプレクサ21によって量子化インデックス、補助情
報及び低域補正情報に分離される。ベクトル逆量子化部
22では、送信側のベクトル量子化部8と同じ符号帳を
用いてMDCT係数を復号する。低域補正情報はスカラ
ー逆量子化部23で復号され、得られた低域誤差分が加
算器24においてMDCT係数に加算されることで復号
されたMDCT係数の低域成分が補正される。また、デ
マルチプレクサ21で分離された補助情報のうちサブバ
ンド情報は、パワースペクトラム復号部25で復号され
て乗算器26に供給され、低域補正されたMDCT係数
に乗算される。補助情報のうちピッチ情報は、ピッチ成
分復号部27で復号されて加算器28に供給され、スペ
クトラム補正されたMDCT係数に加算される。補助情
報のうちLPC係数は、LPC復号部29で復号されて
乗算器30に供給され、ピッチ補正されたMDCT係数
に乗算される。これら補助情報によって補正されたMD
CT係数は、IMDCT部31で逆MDCT処理されて
周波数領域から時間領域に変換されて元の音声信号が復
号される。
【0018】このシステムによれば、ベクトル量子化前
の平滑化MDCT係数と、ベクトル量子化後の平滑化M
DCT係数との差分(ベクトル量子化誤差)の低域成分
をスカラー量子化して低域補正情報として伝送し、復号
側でベクトル逆量子化されたMDCT係数に低域補正情
報から復号される差分を加算することでベクトル量子化
誤差を低減することができる。スカラー量子化されるの
はベクトル量子化誤差の低域部分のみであるから、僅か
な情報量の付加で足りることになる。
【0019】図3は、ベクトル量子化前の原平滑化MD
CT係数、ベクトル量子化後の復号平滑化MDCT係数
及びその差分として現れるベクトル量子化誤差成分を示
す図である。この図に示すように、音声信号のピッチ成
分に相当する部分に大きな量子化誤差が見られる。この
点に着目して、ベクトル量子化誤差をスカラー量子化す
る場合、具体的には次のような方法を用いることができ
る。
【0020】例えば、図4は、ベクトル量子化誤差を各
周波数毎に評価して、量子化誤差が大きい順に予め定め
られた特定の数だけ周波数位置(帯域No.)と量子化
誤差のペアを符号化する例である。この場合、帯域N
o.を表すビット数をn、量子化誤差を表すビット数を
m、符号化すべきペアの数をNとしたとき、N(n+
m)が低域補正情報のビット数となる。また、図5は、
予め定めた周波数帯域について全ての周波数位置の量子
化誤差を符号化する例である。この場合には、帯域N
o.を特定する必要がないため、量子化誤差を表すビッ
ト数をk、符号化する周波数帯域のバンド数をMとした
とき、低域補正情報のビット数はMkとなる。
【0021】音声信号の場合、ピッチ性の高い信号と破
裂音、摩擦音のようにランダムな信号とが存在するた
め、上記2つの量子化方式をベクトル量子化誤差の性質
に応じて切り換えるようにしても良い。即ち、ピッチ性
の高い信号の場合、図3のように、量子化誤差は特定の
間隔で大きく現れるが、その他の部分の誤差は極めて少
ないので、量子化誤差のビット数mを大きな値とすると
共に、符号化すべきペアの数Nを小さな値とする。ま
た、破裂音や摩擦音の場合には、比較的小さな量子化誤
差が広い範囲にわたって現れるので、量子化ビット数k
を小さな値に設定する。そして、スカラー量子化部14
で、ベクトル量子化誤差のパターンを評価して、いずれ
か一方の量子化方式を選択すると共に、量子化方式を示
す1ビットのモード情報を符号化データの先頭に追加す
る。これにより、低域補正情報として僅かの情報量の追
加で従前の符号帳をそのまま使用した場合でも、原音に
近い高品質の復号音が得られる音声符号化復号方式を実
現することができる。
【0022】図6は、従来システムにおける原音声信号
と復号音声信号との間の誤差信号を、横軸に時間軸とし
て示した図であり、図7は同じく上述した実施例のシス
テムにおける原音声信号と復号音声信号との間の誤差信
号を示す図である。これらの図からも明らかなように、
この発明のシステムによれば、量子化誤差が全体的に減
少している。特に図6のAの部分に特徴的に現れている
ように、ピッチの明確な音の部分では、従来方式の場
合、大きな量子化誤差が現れているのに対して、本方式
の場合、逆に誤差が小さくなっており、この発明がピッ
チの大きな信号に対して特に効果的であることが明らか
になった。
【0023】また、図8は低域補正情報による補正をし
た場合としなかった場合のベクトル量子化誤差のスペク
トラムをそれぞれ示したものである。この図において、
縦軸は誤差振幅を示すPCMサンプルデ−タ振幅スケ−
ルでありその上下限値は±(2の15乗)となる。また
横軸はサブバンドNo(fs=22.05kHz、フレ
−ム長512サンプルとして、時間軸周波数軸変換の一
つであるMDCTを施した際に、fs/2の周波数がサ
ブバンドNo=512となるよう換算された周波数スケ
−ル)であり、例えば図中のサブバンドNo=30は6
46Hzに相当している。この図から明らかなように、
補正を行わない場合には低域で大きな量子化誤差が現れ
ているのに対し、本方式のように補正を行った場合に
は、低域での量子化誤差が大幅に小さくなっていること
が分かる。
【0024】なお、以上の実施例では、音声符号化装置
及び音声復号装置をそれぞれハードウェアにて構成した
例について説明したが、図1及び図2の各ブロックを機
能ブロックとして捉えれば、ソフトウェアによっても実
現可能である。この場合、音声符号化復号処理プログラ
ムは、FD、CD−ROM等の適当な媒体に記録され、
又は通信媒体を介して提供されることになる。
【0025】
【発明の効果】以上述べたように、この発明によれば、
音声信号を分析して求められた補助情報によって直交変
換係数を平滑化すると共に、平滑化された直交変換係数
の低域成分のベクトル量子化誤差を抽出してこれをスカ
ラー量子化して低域補正情報を得、量子化インデックス
を低域補正情報及び補助情報と共に符号化出力として出
力して、直交変換係数の低域成分を、低域補正情報によ
って補正するようにしているので、僅かな情報量の付加
だけで高品質の復号音を得ることができるという効果を
奏する。
【図面の簡単な説明】
【図1】 この発明の一実施例に係る音声符号化復号シ
ステムにおける符号化装置のブロック図である。
【図2】 同システムにおける復号装置のブロック図で
ある。
【図3】 同システムにおけるベクトル量子化誤差を示
す図である。
【図4】 同システムにおける低域補正情報の一例を示
す図である。
【図5】 同システムにおける低域補正情報の他の例を
示す図である。
【図6】 従来システムによる符号化誤差信号を示す波
形図である。
【図7】 本システムによる符号化誤差信号を示す波形
図である。
【図8】 従来システムと本システムによる量子化誤差
スペクトラムをそれぞれ示す図である。
【符号の説明】
1…MDCT部、2…LPC分析部、4…ピッチ成分分
析部、6…パワースペクトラム分析部、8…重み付きベ
クトル量子化部、9…聴覚心理モデル分析部、10,1
2…低域成分抽出部、11,22…ベクトル逆量子化
部、14…スカラー量子化部、15…マルチプレクサ、
21…デマルチプレクサ、23…スカラー逆量子化部、
25…パワースペクトラム復号部、27…ピッチ成分復
号部、29…LPC復号部、31…IMDCT部。

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 音声信号を所定区間毎に時間領域から周
    波数領域に直交変換して直交変換係数を求めると共に、
    前記音声信号を分析して求められた補助情報によって前
    記直交変換係数を平滑化し、この平滑化された直交変換
    係数をベクトル量子化して量子化インデックスを得、更
    に前記平滑化された直交変換係数の低域成分のベクトル
    量子化誤差を抽出してこれをスカラー量子化して低域補
    正情報を得、前記量子化インデックスを前記低域補正情
    報及び前記補助情報と共に符号化出力として出力する音
    声符号化装置と、 この音声符号化装置から出力される符号化出力に含まれ
    る前記量子化インデックスをベクトル逆量子化して前記
    直交変換係数を復号すると共に、前記低域補正情報を復
    号して前記復号された直交変換係数の低域成分を補正
    し、この補正された直交変換係数を前記補助情報に基づ
    いて平滑化前の状態に復元した後、周波数領域から時間
    領域に逆直交変換して前記音声信号を復号する音声復号
    装置とを備えたことを特徴とする音声符号化復号方式。
  2. 【請求項2】 音声信号を所定区間毎に時間領域から周
    波数領域に直交変換して直交変換係数を出力する直交変
    換手段と、 前記音声信号を分析して前記直交変換係数を平滑化する
    ための補助情報を求める音声信号分析手段と、 この音声信号分析手段で求められた補助情報によって前
    記直交変換係数を平滑化する演算手段と、 この演算手段から得られる平滑化された直交変換係数を
    ベクトル量子化して量子化インデックスを出力するベク
    トル量子化手段と、 このベクトル量子化手段で得られた量子化インデックス
    を逆量子化して復号直交変換係数を出力するベクトル逆
    量子化手段と、 前記演算手段から出力される直交変換係数と前記ベクト
    ル逆量子化手段から出力される復号直交変換係数の低域
    成分の誤差を抽出する低域誤差抽出手段と、 この低域誤差抽出手段から抽出される低域成分の誤差を
    スカラー量子化して低域補正情報を出力するスカラー量
    子化手段と、 前記音声信号分析手段からの補助情報、前記ベクトル量
    子化手段からの量子化インデックス及び前記スカラー量
    子化手段からの低域補正情報を符号化出力として出力す
    る合成手段とを備えたことを特徴とする音声符号化装
    置。
  3. 【請求項3】 音声信号の直交変換係数を平滑化するた
    めの補助情報、平滑された直交変換係数をベクトル量子
    化して得られた量子化インデックス及び前記平滑化され
    た直交変換係数の低域成分のベクトル量子化誤差をスカ
    ラー量子化して得られた低域補正情報を含む符号化情報
    を入力し、前記量子化インデックス、低域補正情報及び
    補助情報をそれぞれ分離する情報分離手段と、 この情報分離手段で分離された量子化インデックスをベ
    クトル逆量子化して直交変換係数を出力するベクトル逆
    量子化手段と、 前記情報分離手段で分離された低域補正情報を復号する
    スカラー逆量子化手段と、 前記情報分離手段で分離された補助情報を復号する補助
    情報復号手段と、 前記ベクトル逆量子化手段で得られた直交変換係数の低
    域成分を前記復号された低域補正情報によって補正する
    と共に、この補正された直交変換係数を前記復号された
    補助情報に基づいて平滑化前の状態に復元する演算手段
    と、 この演算手段の出力を周波数領域から時間領域に逆直交
    変換して前記音声信号を復号する逆直交変換手段とを備
    えたことを特徴とする音声復号装置。
  4. 【請求項4】 音声信号を所定区間毎に時間領域から周
    波数領域に直交変換して直交変換係数を求めると共に、
    前記音声信号を分析して求められた補助情報によって前
    記直交変換係数を平滑化し、この平滑化された直交変換
    係数をベクトル量子化して量子化インデックスを得、更
    に前記平滑化された直交変換係数の低域成分のベクトル
    量子化誤差を抽出してこれをスカラー量子化して低域補
    正情報を得、前記量子化インデックスを前記低域補正情
    報及び前記補助情報と共に符号化出力として出力する音
    声符号化処理と、 この音声符号化処理によって出力される符号化出力に含
    まれる前記量子化インデックスをベクトル逆量子化して
    前記直交変換係数を復号すると共に、前記低域補正情報
    を復号して前記復号された直交変換係数の低域成分を補
    正し、この補正された直交変換係数を前記補助情報に基
    づいて平滑化前の状態に復元した後、周波数領域から時
    間領域に逆直交変換して前記音声信号を復号する音声復
    号処理とを含む音声符号化復号プログラムを記憶してな
    る媒体。
JP28083697A 1997-10-07 1997-10-14 音声符号化復号方式 Expired - Fee Related JP3765171B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP28083697A JP3765171B2 (ja) 1997-10-07 1997-10-14 音声符号化復号方式
US09/167,072 US6141637A (en) 1997-10-07 1998-10-06 Speech signal encoding and decoding system, speech encoding apparatus, speech decoding apparatus, speech encoding and decoding method, and storage medium storing a program for carrying out the method

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP9-273186 1997-10-07
JP27318697 1997-10-07
JP28083697A JP3765171B2 (ja) 1997-10-07 1997-10-14 音声符号化復号方式

Publications (2)

Publication Number Publication Date
JPH11177434A true JPH11177434A (ja) 1999-07-02
JP3765171B2 JP3765171B2 (ja) 2006-04-12

Family

ID=26550553

Family Applications (1)

Application Number Title Priority Date Filing Date
JP28083697A Expired - Fee Related JP3765171B2 (ja) 1997-10-07 1997-10-14 音声符号化復号方式

Country Status (2)

Country Link
US (1) US6141637A (ja)
JP (1) JP3765171B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010111630A (ko) * 2000-06-12 2001-12-19 니시무로 타이죠 시간/피치 변환 장치 및 시간/피치 변환 방법
US7289951B1 (en) 1999-07-05 2007-10-30 Nokia Corporation Method for improving the coding efficiency of an audio signal
WO2009093714A1 (ja) * 2008-01-24 2009-07-30 Nippon Telegraph And Telephone Corporation 符号化方法、復号化方法、それらの装置、及びそれらのプログラムと記録媒体
JP2009532738A (ja) * 2006-04-04 2009-09-10 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション Mdct領域におけるオーディオ信号音量測定と改良

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7228280B1 (en) 1997-04-15 2007-06-05 Gracenote, Inc. Finding database match for file based on file characteristics
US6339804B1 (en) * 1998-01-21 2002-01-15 Kabushiki Kaisha Seiko Sho. Fast-forward/fast-backward intermittent reproduction of compressed digital data frame using compression parameter value calculated from parameter-calculation-target frame not previously reproduced
WO1999048084A1 (de) * 1998-03-19 1999-09-23 Siemens Aktiengesellschaft Verfahren und vorrichtung zur bearbeitung eines tonsignals
US8326584B1 (en) * 1999-09-14 2012-12-04 Gracenote, Inc. Music searching methods based on human perception
US7069208B2 (en) * 2001-01-24 2006-06-27 Nokia, Corp. System and method for concealment of data loss in digital audio transmission
US7447639B2 (en) * 2001-01-24 2008-11-04 Nokia Corporation System and method for error concealment in digital audio transmission
JP3902762B2 (ja) * 2001-03-29 2007-04-11 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 信号を伝送するためのデータの減少されたデータストリーム
KR20040024870A (ko) * 2001-07-20 2004-03-22 그레이스노트 아이엔씨 음성 기록의 자동 확인
KR20090046939A (ko) * 2002-09-24 2009-05-11 인터디지탈 테크날러지 코포레이션 계산효율적인 수학 엔진
CN100507485C (zh) * 2003-10-23 2009-07-01 松下电器产业株式会社 频谱编码装置和频谱解码装置
JP4977471B2 (ja) * 2004-11-05 2012-07-18 パナソニック株式会社 符号化装置及び符号化方法
JP5032314B2 (ja) * 2005-06-23 2012-09-26 パナソニック株式会社 オーディオ符号化装置、オーディオ復号化装置およびオーディオ符号化情報伝送装置
WO2009086033A1 (en) 2007-12-20 2009-07-09 Dean Enterprises, Llc Detection of conditions from sound

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5396576A (en) * 1991-05-22 1995-03-07 Nippon Telegraph And Telephone Corporation Speech coding and decoding methods using adaptive and random code books
US5684920A (en) * 1994-03-17 1997-11-04 Nippon Telegraph And Telephone Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein
TW321810B (ja) * 1995-10-26 1997-12-01 Sony Co Ltd
JPH1091194A (ja) * 1996-09-18 1998-04-10 Sony Corp 音声復号化方法及び装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7289951B1 (en) 1999-07-05 2007-10-30 Nokia Corporation Method for improving the coding efficiency of an audio signal
US7457743B2 (en) 1999-07-05 2008-11-25 Nokia Corporation Method for improving the coding efficiency of an audio signal
KR20010111630A (ko) * 2000-06-12 2001-12-19 니시무로 타이죠 시간/피치 변환 장치 및 시간/피치 변환 방법
JP2009532738A (ja) * 2006-04-04 2009-09-10 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション Mdct領域におけるオーディオ信号音量測定と改良
WO2009093714A1 (ja) * 2008-01-24 2009-07-30 Nippon Telegraph And Telephone Corporation 符号化方法、復号化方法、それらの装置、及びそれらのプログラムと記録媒体
JP5097217B2 (ja) * 2008-01-24 2012-12-12 日本電信電話株式会社 符号化方法、符号化装置、及びそのプログラムと記録媒体
US8724734B2 (en) 2008-01-24 2014-05-13 Nippon Telegraph And Telephone Corporation Coding method, decoding method, apparatuses thereof, programs thereof, and recording medium

Also Published As

Publication number Publication date
JP3765171B2 (ja) 2006-04-12
US6141637A (en) 2000-10-31

Similar Documents

Publication Publication Date Title
KR101171098B1 (ko) 혼합 구조의 스케일러블 음성 부호화 방법 및 장치
KR100427753B1 (ko) 음성신호재생방법및장치,음성복호화방법및장치,음성합성방법및장치와휴대용무선단말장치
EP1262956B1 (en) Signal encoding method and apparatus
KR100958144B1 (ko) 오디오 압축
US5778335A (en) Method and apparatus for efficient multiband celp wideband speech and music coding and decoding
US6678655B2 (en) Method and system for low bit rate speech coding with speech recognition features and pitch providing reconstruction of the spectral envelope
JP4121578B2 (ja) 音声分析方法、音声符号化方法および装置
JP3765171B2 (ja) 音声符号化復号方式
JPH0869299A (ja) 音声符号化方法、音声復号化方法及び音声符号化復号化方法
JP2010530154A (ja) 音声信号中に埋め込まれた隠れデータの回復
JPH10149199A (ja) 音声符号化方法、音声復号化方法、音声符号化装置、音声復号化装置、電話装置、ピッチ変換方法及び媒体
JPH10105194A (ja) ピッチ検出方法、音声信号符号化方法および装置
JP2003108197A (ja) オーディオ信号復号化装置およびオーディオ信号符号化装置
JPH10105195A (ja) ピッチ検出方法、音声信号符号化方法および装置
JP3297749B2 (ja) 符号化方法
JP3237178B2 (ja) 符号化方法及び復号化方法
JP2000132193A (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JP3348759B2 (ja) 変換符号化方法および変換復号化方法
JP2796408B2 (ja) 音声情報圧縮装置
JP3576485B2 (ja) 固定音源ベクトル生成装置及び音声符号化/復号化装置
JP4618823B2 (ja) 信号符号化装置及び方法
JP3297750B2 (ja) 符号化方法
JP3010655B2 (ja) 圧縮符号化装置及び方法、並びに復号装置及び方法
JP4826580B2 (ja) 音声信号の再生方法及び装置
JP3266920B2 (ja) 音声符号化装置及び音声復号化装置並びに音声符号化復号化装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040402

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050620

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050628

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050826

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050920

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051121

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20051129

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060104

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060117

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313532

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090203

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100203

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110203

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees