JPH09281995A - 信号符号化装置及び方法 - Google Patents

信号符号化装置及び方法

Info

Publication number
JPH09281995A
JPH09281995A JP8115678A JP11567896A JPH09281995A JP H09281995 A JPH09281995 A JP H09281995A JP 8115678 A JP8115678 A JP 8115678A JP 11567896 A JP11567896 A JP 11567896A JP H09281995 A JPH09281995 A JP H09281995A
Authority
JP
Japan
Prior art keywords
signal
output
performance
pulses
band
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8115678A
Other languages
English (en)
Inventor
Kazunori Ozawa
一範 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP8115678A priority Critical patent/JPH09281995A/ja
Priority to CA002201217A priority patent/CA2201217C/en
Priority to DE69708191T priority patent/DE69708191T2/de
Priority to EP97106008A priority patent/EP0801377B1/en
Priority to US08/840,318 priority patent/US5857168A/en
Publication of JPH09281995A publication Critical patent/JPH09281995A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】 【課題】低ビットレートでも良好な音質の得られる信号
符号化装置の提供。 【解決手段】入力した信号を予め定められた時間長のフ
レームに分割し予め定められた複数個の帯域に分割する
帯域分割部150と、入力信号からスペクトル包絡を表
すスペクトルパラメータを求めるパラメータ計算部20
0と、スペクトルパラメータをもとに複数個の帯域に対
して性能要求値を求める性能計算部320と、帯域分割
部の出力信号に対して、複数個のパルスから構成される
音源信号を求める音源部4001〜400Nと、性能計算
部の出力に応じてパルスの個数を帯域毎に適応的に割り
当てる割当部330を有し、パラメータ計算部と音源部
の出力信号を組み合わせて出力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声や音楽などの
信号を低いビットレートで高品質に符号化するための信
号符号化装置に関する。
【0002】
【従来の技術】音声信号を高能率に符号化する方式とし
ては、例えば、M.Schroeder and B.
Atal氏による「“Code-excited Linear predictio
n: Highquality speech at very low bit rates”(コ
ード・エキサイテッド リニアプレディクション:ハイ
クオリティ スピーチ アト ベリーロービットレー
ト)」(Proc. ICASSP, pp. 937-940, 1985年))と題
する論文(文献1)や、Kleijn氏らによる「“Im
proved speech quality and efficient vector quantiz
ation in CELP”(イムプルーブド スピーチ クオリ
ティ アンド エフィシェント ベクトル クウオンタ
イザーション イン セルピ)」(Proc. ICASSP, pp.
155-158, 1988年)と題する論文(文献2)などに記載
されている、音源をベクトル量子化された雑音で表現す
る、CELP(Code Excited LinearPredictive Codin
g;符号駆動型線形予測符号)が知られている。
【0003】この従来のCELP方式では、送信側で
は、フレーム毎(例えば20ms)に音声信号から線形
予測(LPC)分析を用いて、音声信号のスペクトル特
性を表すスペクトルパラメータを抽出する。
【0004】フレームをさらにサブフレーム(例えば5
ms)に分割し、サブフレーム毎に過去の音源信号を基
に適応コードブック(符号帳)におけるパラメータ(ピ
ッチ周期に対応する遅延パラメータとゲインパラメー
タ)を抽出し、適応コードブックにより前記サブフレー
ムの音声信号をピッチ予測する。
【0005】ピッチ予測して求めた音源信号に対して、
予め定められた種類の雑音信号からなる音源コーブック
(ベクトル量子化コードブック)から最適な音源コード
ベクトルを選択し、最適なゲインを計算することによ
り、音源信号を量子化する。
【0006】音源ベクトルの選択の仕方は、選択した雑
音信号により合成した信号と、前記残差信号との誤差電
力を最小化するように行う。そして、選択されたコード
ベクトルの種類を表すインデクスとゲインならびに、前
記スペクトルパラメータと適応コードブックのパラメー
タをマルチプレクサ部により組み合わせて伝送する。受
信側の説明は省略する。
【0007】また、上記CELP方式をもとに、音声だ
けでなく、音楽信号などの非定常な信号に対応するため
に、入力信号を複数個の帯域(サブバンド)に分割した
上で、各サブバンド毎にCELP符号化を行なう方式が
知られている。これについては、例えば、M.Yong
氏らによる「“Subband vector excitation coding wit
h adaptive bit allocation”(サブバンド・ベクトル
・エキサイテーション・コーディング ウイズ アダプ
ティブ ビットアロケーション)」(Proc. ICASSP, p
p. 743-746, 1989年))と題する論文(文献3)等が参
照される。
【0008】上記文献3記載の方法では、帯域が8kH
zの入力信号を2個のサブバンド(サブバンド1の帯域
は0−2kHz、サブバンド2は2−4kHz)に分割
する。
【0009】その後、各帯域の入力信号をもとに予測残
差パワを計算し、さらに予測残差パワの帯域間での比を
計算し、これから各帯域での符号化に必要な量子化ビッ
ト数を適応的に割り当てている。
【0010】
【発明が解決しようとする課題】上記した従来の方式で
は、音源コードブックから最適な音源コードベクトルを
選択するのに多大な演算量を要するという問題があっ
た。
【0011】これは、上記文献1や文献2に記載の方法
では、音源コードベクトルを選択するのに、各コードベ
クトルに対して一旦フィルタリングもしくは畳み込み演
算を行ない、この演算をコードブックに格納されている
コードベクトルの個数だけ繰り返すことに起因してい
る。
【0012】例えば、コードブックのビット数がBビッ
トで、次元数がNのときは、フィルタリングあるいは畳
み込み演算のときのフィルタあるいはインパルス応答長
をKとすると、演算量は1秒当たり、N×K×2B×8
000/Nだけ必要となる。一例として、B=10、N
=40、k=10とすると、1秒当たり81,920,000回の
演算が必要となり、演算量が極めて膨大であるという問
題点があった。
【0013】さらに、上記文献3の従来方式において
は、サブバンド間で符号化に必要な量子化ビット数を割
り当てる場合に、各サブバンドの予測残差パワをもとに
ビット割り当て、符号化を行なっていた。
【0014】従って、サブバンドで音源を確保するため
に実際に必要な符号化性能を満たすようにビットを割り
当てているわけではないので、特に、音声以外の非定常
な信号(例えば音楽信号など)に対しては、音質的に不
十分であった。
【0015】さらに、演算量を削減するために、音源信
号をコードブック以外(例えば複数個のパルスの組合せ
など)を用いて表す場合に、ビット数の割り当てではパ
ルスの個数とうまく整合しなかった。
【0016】従って、本発明は、上記事情に鑑みて為さ
れたものであって、その目的は、上述の問題を解決と、
比較的少ない演算量で音質の劣化の少ない信号符号化方
式を提供することにある。
【0017】
【課題を解決するための手段】前記目的を達成するた
め、本発明によれば、入力した信号を予め定められた時
間長のフレームに分割し予め定められた複数個の帯域に
分割する帯域分割手段と、前記入力信号からスペクトル
包絡を表すスペクトルパラメータを求めるパラメータ計
算手段と、前記スペクトルパラメータをもとに複数個の
帯域に対して性能要求値を求める性能計算手段と、前記
帯域分割手段の出力信号に対して、複数個のパルスから
構成される音源信号を求める符号化手段と、前記性能計
算手段の出力に応じて前記パルスの個数を前記帯域毎に
適応的に割り当てる割当手段と、を含み、前記パラメー
タ計算手段の出力信号と前記符号化手段の出力信号とを
組み合わせて出力することを特徴とする信号符号化装置
により達成することができる。
【0018】本発明は、パラメータ計算手段から出力さ
れるスペクトルパラメータをフレーム長よりも短い時間
間隔毎に補間する補間手段と、前記補間手段の出力をも
とに複数個の帯域に対して性能要求値を求める性能計算
手段とを有することを特徴とする。
【0019】本発明は、割当手段において、パルスの個
数と性能の関係を示したテーブルを有し、性能計算手段
からの要求性能と前記テーブルとを用いてパルスの個数
を帯域毎に適応的に割り当てることを特徴とする。
【0020】また、本発明は、第2の視点において、入
力した信号を予め定められた時間長のフレームに分割し
予め定められた複数個の帯域に分割する帯域分割手段
と、前記帯域分割手段の出力信号からスペクトル包絡を
表すスペクトルパラメータを求めるパラメータ計算手段
と、前記スペクトルパラメータをもとに複数個の帯域に
対して性能要求値を求める性能計算手段と、前記帯域分
割手段の出力信号に対して、複数個のパルスから構成さ
れる音源信号を求める符号化手段と、前記性能計算手段
の出力に応じて前記パルスの個数を前記帯域毎に適応的
に割り当てる割当手段を有し、前記パラメータ計算手段
と前記符号化手段の出力信号を組み合わせて出力するこ
とを特徴とする信号符号化装置を提供する。
【0021】本発明は、パラメータ計算手段から出力さ
れるスペクトルパラメータをフレーム長よりも短い時間
間隔毎に補間する補間手段と、前記補間手段の出力をも
とに複数個の帯域に対して性能要求値を求める性能計算
手段とを有することを特徴とする。
【0022】本発明は、割当手段において、パルスの個
数と性能の関係を示したテーブルを有し、性能計算手段
からの要求性能と前記テーブルとを用いてパルスの個数
を帯域毎に適応的に割り当てることを特徴とする。
【0023】そして、本発明は、第3の視点において、
入力した音声信号を予め定められた時間長のフレームに
分割し前記入力信号からスペクトルパラメータを求める
スペクトルパラメータ計算手段と、前記入力信号から特
徴量を抽出してモードを判別するモード判別手段と、前
記スペクトルパラメータをもとに複数個の帯域に対して
性能要求値を求める性能計算手段と、前記帯域分割手段
の出力信号に対して、複数個のパルスから構成される音
源信号を求める符号化手段と、前記モード判別手段の出
力と前記性能計算手段の出力に応じて前記パルスの個数
を前記帯域毎に適応的に割り当てる割当手段を有し、前
記パラメータ計算手段と前記符号化手段の出力信号と前
記モード判別手段の出力とを組み合わせて出力すること
を特徴とする信号符号化装置を提供する。
【0024】本発明は、パラメータ計算手段から出力さ
れるスペクトルパラメータをフレーム長よりも短い時間
間隔毎に補間する補間手段と、前記補間手段の出力をも
とに複数個の帯域に対して性能要求値を求める性能計算
手段とを有することを特徴とする。
【0025】本発明は、割当手段において、パルスの個
数と性能の関係を示したテーブルを有し、モード判別手
段からの出力により前記テーブルを切替え、性能計算手
段からの要求性能と前記テーブルとを用いてパルスの個
数を帯域毎に適応的に割り当てることを特徴とする。
【0026】さらに、本発明は、第4の視点において、
入力した信号を予め定められた時間長のフレームに分割
し予め定められた複数個の帯域に分割する帯域分割手段
と、前記帯域分割手段の出力信号からスペクトル包絡を
表すスペクトルパラメータを求めるパラメータ計算手段
と、前記帯域分割手段の出力信号から特徴量を抽出して
モードを判別するモード判別手段と、前記スペクトルパ
ラメータをもとに複数個の帯域に対して性能要求値を求
める性能計算手段と、前記帯域分割手段の出力信号に対
して、複数個のパルスから構成される音源信号を求める
符号化手段と、前記モード判別手段の出力と前記性能計
算手段の出力に応じて前記パルスの個数を前記帯域毎に
適応的に割り当てる割当手段を有し、前記パラメータ計
算手段と前記符号化手段の出力信号と前記モード判別手
段の出力とを組み合わせて出力することを特徴とする信
号符号化装置を提供する。
【0027】本発明は、パラメータ計算手段から出力さ
れるスペクトルパラメータをフレーム長よりも短い時間
間隔毎に補間する補間手段と、前記補間手段の出力をも
とに複数個の帯域に対して性能要求値を求める性能計算
手段とを有することを特徴とする。
【0028】本発明によれば、割当手段において、パル
スの個数と性能の関係を示したテーブルを有し、モード
判別手段からの出力により前記テーブルを切替え、性能
計算手段からの要求性能と前記テーブルとを用いてパル
スの個数を帯域毎に適応的に割り当てることを特徴とす
る。
【0029】
【発明の実施の形態】本発明の各種実施の形態を以下に
説明する。
【0030】本発明は、第1の実施の形態において、入
力信号を予め定められたフレーム毎に複数個の帯域に分
割し、入力信号からスペクトル包絡を表すスペクトルパ
ラメータ(例えばLPC係数)を計算し(図1の20
0)、スペクトルパラメータをもとに前記各々の帯域に
対して性能要求値を求め(図1の320)、性能要求値
に従い、各帯域において音源信号を表すためのパルスの
個数を適応的に割り当て(図1の330)、符号化部
(図1の400)においてこのパルス数に従い、音源信
号を表すパルスを計算して符号化を行ない、スペクトル
パラメータ量子化手段(図1の210)の出力と、符号
化手段400の出力信号とをマルチプレクサ500で組
み合わせて出力するものである。
【0031】本発明は、その第2の実施の形態におい
て、図5を参照すると、スペクトルパラメータをフレー
ム長よりも短い時間間隔毎に補間し(図5の670)、
補間パラメータをもとに各々の帯域の性能要求値を求め
る。
【0032】本発明は、その第3の実施の形態におい
て、図6を参照すると、前記第1の実施の形態におい
て、パルスの個数と性能の関係を示したテーブル(図6
の651)を帯域毎に予め保有しておき、性能要求値と
テーブルを用いて各帯域のパルスの個数を適応的に割り
当てる。
【0033】本発明は、その第4の実施の形態におい
て、図7を参照すると、入力信号を予め定められたフレ
ーム毎に複数個の帯域に分割し(図7の150)、帯域
分割信号からスペクトル包絡を表すスペクトルパラメー
タ(例えばLPC係数)を計算し、スペクトルパラメー
タをもとに前記各々の帯域に対して性能要求値を求め
(図7の320)、性能要求値に従い、各帯域において
音源信号を表すためのパルスの個数を適応的に割り当て
る(図7の330)。
【0034】本発明は、その第5の実施の形態として、
前記第4の実施の形態において、スペクトルパラメータ
をフレーム長よりも短い時間間隔毎に補間し、補間パラ
メータをもとに各々の帯域の性能要求値を求める。
【0035】本発明は、その第6の実施の形態として、
図11を参照すると、前記第4の実施の形態において、
パルスの個数と性能の関係を示したテーブル(図11の
651)を帯域毎に予め保有しておき、性能要求値とテ
ーブルを用いて各帯域のパルスの個数を適応的に割り当
てる。
【0036】本発明は、第7の実施の形態において、図
12を参照すると、入力信号を予め定められたフレーム
毎に複数個の帯域に分割し、入力信号からスペクトル包
絡を表すスペクトルパラメータ(例えばLPC係数)を
計算し、入力信号から特徴量を抽出しモードを判別し、
スペクトルパラメータをもとに前記各々の帯域に対して
性能要求値を求め、性能要求値に従い、各帯域において
音源信号を表すためのパルスの個数を適応的に割り当て
る。
【0037】本発明は、その第8の実施の形態として、
図14を参照すると、前記第7の実施の形態において、
スペクトルパラメータをフレーム長よりも短い時間間隔
毎に補間し、補間パラメータをもとに各々の帯域の性能
要求値を求める。
【0038】本発明は、その第9の実施の形態として、
図15を参照すると、前記第7の実施の形態において、
パルスの個数と性能の関係を示したテーブルを帯域毎に
予め保有しておき、性能要求値とテーブルを用いて各帯
域のパルスの個数を適応的に割り当てる。
【0039】本発明は、第10の実施の形態において、
図16を参照すると、入力信号を予め定められたフレー
ム毎に複数個の帯域に分割し、帯域分割信号からスペク
トル包絡を表すスペクトルパラメータ(例えばLPC係
数)を計算し、帯域分割信号から特徴量を抽出しモード
を判別し、スペクトルパラメータをもとに前記各々の帯
域に対して性能要求値を求め、性能要求値に従い、各帯
域において音源信号を表すためのパルスの個数を適応的
に割り当てる。
【0040】本発明は、第11の実施の形態として、図
18を参照すると、前記第10の実施の形態において、
スペクトルパラメータをフレーム長よりも短い時間間隔
毎に補間し、補間パラメータをもとに各々の帯域の性能
要求値を求める。
【0041】本発明は、第12の実施の形態として、図
20を参照すると、前記第10の実施の形態においてパ
ルスの個数と性能の関係を示したテーブルを帯域毎に予
め保有しておき、性能要求値とテーブルを用いて各帯域
のパルスの個数を適応的に割り当てる。
【0042】
【実施例】図1は、本発明に係る信号符号化装置の第1
の実施の形態の構成例をブロック図にて示したものであ
る。
【0043】図1を参照すると、入力端子100から信
号を入力し、フレーム分割回路110では信号をフレー
ム(例えば20ms)毎に分割する。
【0044】スペクトルパラメータ計算回路200は、
フレームの入力信号に対して、窓(例えば24ms)を
かけて信号を切り出して、スペクトルパラメータを予め
定められた次数(例えばP=16次)計算する。
【0045】ここで、スペクトルパラメータの計算に
は、周知のLPC分析や、Burg分析等を用いること
ができる。ここでは、Burg分析を用いることとす
る。Burg分析の詳細については、例えば中溝著によ
る刊行物(「信号解析とシステム同定」と題した単行本
(コロナ社1988年刊)の82〜87頁)(文献4)
等に記載が参照されるもので、ここではその説明を省略
する。
【0046】さらに、スペクトルパラメータ計算回路2
00では、Burg法により計算された線形予測係数α
i(i=1,…,10)を量子化や補間に適したLSP
パラメータに変換し出力する。
【0047】ここで、線形予測係数からLSPへの変換
は、菅村他による(“線スペクトル対(LSP)音声分
析合成方式による音声情報圧縮”)と題した論文(電子
通信学会論文誌、J64−A、pp.599−606、
1981年)(文献5)を参照することができる。
【0048】スペクトルパラメータ量子化回路210で
は、スペクトル量子化コードブック215を使用し、L
SPパラメータを効率的に量子化する。量子化は、次式
(1)で与えられる歪みを最小化する量子化値を出力す
ることで行なう。
【0049】
【数1】
【0050】ここで、LSP(i)、QLSP
(i)j、W(i)はそれぞれ、量子化前のi次目のL
SP、量子化後のj番目の結果、重み係数である。
【0051】LSPパラメータのベクトル量子化の手法
は周知の手法を用いることができる。具体的な方法は、
複数段のベクトル量子化器を接続して用いる多段スプリ
ットベクトル手法が知られており、例えば、特開平4−
171500号公報(特願平2−297600号)(文
献6)、特開平4−363000号公報(特願平3−2
61925号)(文献7)や、特開平5−6199号公
報(特願平3−155049号)(文献8)や、T.N
omura et al.による「“LSP Coding Using
VQ-SVQ With Interpolation in 4.075 kbps M-LCELP S
peech Coder”(LSP コーディング ユージング
VQ−SVQ ウィズ インタポレーション イン
4.075kbps M−LCELP スピーチ コー
ダ)」と題した論文(Proc. Mobile Multimedia Commun
ication, pp. B. 2. 5, 1993)(文献9)等が参照され
る。
【0052】また、スペクトルパラメータ量子化回路2
10は、量子化LSPを線形予測係数αi′(i=1,
…,P)に変換し、インパルス応答計算回路310へ出
力する。また、量子化LSPを表すインデクスをマルチ
プレクサ400に出力する。
【0053】インパルス応答計算回路310は、3種類
のインパルス応答を予め定められた点数だけ計算する。
【0054】第1は、z変換が次式(2)で表される聴
感重み付け合成フィルタのインパルス応答hw(n)で
ある。
【0055】
【数2】
【0056】第2は、z変換が次式(3)で表される聴
聴感重み付けフィルタのインパルス応答w(n)であ
る。
【0057】
【数3】
【0058】第3は、z変換が次式(4)で表される合
成フィルタのインパルス応答h(n)である。
【0059】
【数4】
【0060】第1、第2のインパルス応答を分割回路3
40に出力し、第3のインパルス応答(即ち合成フィル
タのインパルス応答h(n))を性能計算回路320に
出力する。
【0061】性能計算回路320は、第3のインパルス
応答h(n)を入力し、複数個の帯域に対する性能要求
値を求める。
【0062】ここで、性能要求値としては、信号対マス
キング比(SMR:Signal to Masking Threshold Rati
o)を用いる。これは、あるレベルの信号とそれに起因
する聴覚のマスキングレベルとの比に近似的に対応して
いる。具体的には、次の動作を行なう。
【0063】インパルス応答を予め定められた点数Lで
FFT(高速フーリエ変換)し、次式(5)からパワス
ペクトル密度を計算する。
【0064】
【数5】
【0065】ここで、Y(k)はh(n)FFTしたス
ペクトル、Re(・),Im(・)は、それぞれ、FF
Tの実部、虚部を示す。
【0066】このパワスペクトル密度を用いて、各帯域
毎に、最小マスキングしきい値LTmin(t)(dB)
を計算する。
【0067】
【数6】
【0068】ここで、t1,t2は、それぞれ、帯域tの
始端、終端番号を示す。
【0069】次に、帯域tで、次式(7)により信号対
マスキング比SMR(t)を求める。
【0070】 SMR(t)=Lsb(t)−LTmin(t)(dB) …(7)
【0071】ここで、Lsb(t)、LTmin(t)は、
それぞれ、帯域tでの音圧レベル、最小マスキングしき
い値を示す。
【0072】また、Lsb(t)は次式(8)で求める。
【0073】
【数7】
【0074】帯域t毎に求めたSMR(t)の値を割り
当て回路330に出力する。なお、マスキングしきい値
の計算には、J.Johnston氏による「“Transf
ormcoding of audio signals using perceptual noise
criteria”(トランスフォーム コーディング オブ
オーディオ シグナルズ ユージング パセプチュアル
ノイズ クライテリア)」と題した論文(IEEE Journ
al of Selected Arers in Communications, vol.6, pp.
314-323, 1988)(文献10)等を参照できる。
【0075】割り当て回路330は、帯域毎にSMR
(t)に従い、パルス数の適応割り当てを行なう。一例
として、簡便には、1パルス当たりの符号化S/N比
(信号対雑音比)をA dBと仮定し、SMR(t)を
Aで除して必要なパルスの個数を求めることができる。
【0076】このようにして、各帯域毎に、パルスの割
り当て数を計算し、符号化回路4001〜400Nに出力
する。ただし、この割り当てのときに、帯域を合計した
伝送ビット数Bを計算し、B=Rとなるように、パルス
の個数を調整する。ここで、Rは予め定められた伝送速
度である。また、次式(9)が成り立つ。
【0077】
【数8】
【0078】ここで、b(t)は帯域tにおける割り当
てパルス数及び他の伝送情報から計算した帯域tの伝送
ビット数、Nは帯域の個数である。
【0079】分割回路340は、第1、第2のインパル
ス応答をインパルス応答計算回路310から入力し、そ
れぞれに対し、帯域分割を行なうフィルタのインパルス
応答を畳み込み(convolution)演算し、それぞれに対
して各帯域のインパルス応答を求め、符号化回路400
へ出力する。
【0080】なお、帯域分割フィルタとしては、QMF
(クアドラチュアミラーフィルタ;Quadrature Mirror
Filter)が知られている。
【0081】このフィルタの構成については、例えば、
P.Vaidyanathan氏による「“Multirate
digital filters, filter banks, polyphase networks,
andapplications: A tutorial”,(マルチレート・デ
ィジタル・フィルタ、フィルタ・バンク、ポリフェース
・ネットワーク及びアプリケーション:チュートリア
ル)」と題した論文(Proc. IEEE, val.78, pp. 56-93,
1990)(文献11)が参照される。
【0082】以下では、帯域tにおける第1のインパル
ス応答をhwt(n)、第2のインパルス応答をw
t(n)と記すものとする。
【0083】符号化回路4001〜400Nは、異なる帯
域に対して共通の動作を行なうので、代表として、符号
化回路1 4001について説明する。
【0084】図2は、符号化回路1 4001の構成を
示すブロック図である。
【0085】図2において、入力端子401,402,
403,404から、それぞれ、帯域tの入力信号xt
(n)、第2のインパルス応答wt(n)、第1のイン
パルス応答hwt(n)、帯域tのパルス割り当て数を入
力する。
【0086】聴感重み付け回路410は、帯域tの信号
t(n)とwt(n)から、次式(10)に従い、聴感
重み付け信号xwt(n)を計算する。
【0087】 xwt(n)=xt(n)*wt(n) …(10)
【0088】ここで、記号“*”は畳み込み演算を示
す。
【0089】減算器415は、xwt(n)から応答信号
zt(n)を減算する。
【0090】応答信号計算回路450は、入力信号を零
t(n)=0とした応答信号をフレーム長よりも短い
サブフレーム分計算し、減算器415へ出力する。ここ
で、応答信号xzt(n)は次式(11)で表される。
【0091】 xzt(n)=dt(n)*hwt(n) …(11)
【0092】但し、 dt(n)=0,(n≧0) dt(n)=vt(n),(n<0) …(12)
【0093】減算器415は、次式(13)により、聴
感重み付け信号から応答信号を1サブフレーム分減算
し、xwt′(n)を適応コードブック回路420へ出力
する。
【0094】 xwt′(n)=xwt(n)−xzt(n) …(13)
【0095】適応コードブック回路420は、ゲイン量
子化回路440から過去の音源信号vt(n)を、減算
器415から出力信号xwt′(n)を入力する。ピッチ
に対応する遅延Tを次式(14)の歪みを最小化するよ
うに求め、遅延を表すインデクスを端子464に出力す
る。
【0096】
【数9】
【0097】ここで、 ywt(n−T)=vt(n−T)*hwt(n) …(15) である。
【0098】ゲインβを次式(16)に従い求める。
【0099】
【数10】
【0100】ここで、女性の声や子供の声に対して、遅
延の抽出度精度を向上させるために、遅延を整数サンプ
ルではなく、小数サンプル値で求めてもよい。具体的な
方法は、例えば、P. Kroonらによる、「“Pitch predic
tors with high temporal resolution”(ピッチ プレ
ディクターズ ウイズ ハイ テムポラル レゾルーシ
ョン)」と題した論文(Proc. ICASSP, pp. 661-664, 1
990年)(文献12)等が参照される。
【0101】さらに、適応コードブック回路420では
次式(17)に従いピッチ予測を行ない、予測残差信号
wt(n)を音源量子化回路40へ出力する。
【0102】 ewt(n)=xwt′(n)−βvt(n−T)*hwt(n) …(17)
【0103】音源量子化回路430では、端子404か
ら入力した個数K(t)のパルスについて、位置と振幅
を探索する。
【0104】パルスの位置の計算は、例えば、パルスを
たてる位置を限定して探索することにより、探索に要す
る演算量を低減化することができる。例えば、ACEL
P(Argebratic Code Excited Linear Prediction)方
式が提案されている。これは、例えば、C.Lafla
mmeらによる「“16 kbps wideband speech codingte
chnique based on algebratic CELP”(16kbps
ワイドバンド スピーチ コーディング テクニーク
ベースド オン アルジブレイテック CELP)」と
題した論文(Proc. ICASSP, pp.13-16, 1991)(文献1
3)等を参照することができる。
【0105】この方法によれば、音源信号を複数個のパ
ルスで表し、各パルスの位置を限定して予め定められた
ビット数で表し伝送する。さらに、各パルスの振幅は+
1.0もしくは−1.0と極性に限定されているため、
位置の探索に要する演算量を大幅に低減化できる。
【0106】別な方法として、パルスの振幅は、K
(t)個まとめてベクトル量子化することもできる。こ
の方法の方が、極性を表すのに比べ性能が改善される
が、演算量はやや増大する。
【0107】複数パルスの振幅を量子化するためのコー
ドブックを、多量の信号を用いて予め学習して格納して
おくこともできる。コードブックの学習法は、例えば、
Linde氏らによる「“An algorithm for vector qu
antization design”(アンアルゴリズム フォア ベ
クタ クオンタイゼーション デザイン)」と題した論
文(IEEE Trans. Commun., pp.84-95, January, 198
0)(文献13)等を参照できる。
【0108】振幅、位置の情報はゲイン量子化回路44
0に出力される。
【0109】ゲイン量子化回路440は、ゲインコード
ブック445からゲインコードベクトルを読み出し、選
択された振幅と位置に対して、次式(18)を最小化す
るようにゲインコードベクトルを選択する。
【0110】ここでは、適応コードブックのゲインとパ
ルスで表した音源のゲインの両者を同時にベクトル量子
化する例について示す。
【0111】
【数11】
【0112】ここで、βk′、Gk′は、ゲインコードブ
ック445に格納された2次元ゲインコードブックにお
けるk番目のコードベクトルである。選択されたゲイン
コードベクトルを表すインデクスを端子461に出力す
る。
【0113】ゲインコードブック445は、上記文献1
3に従い、予め学習しておく。
【0114】図3は、本発明の別の実施例の構成を示す
ブロック図である。
【0115】図3を参照して、LPC分析回路550
は、分割回路340から、帯域tにおける第1のインパ
ルス応答をhwt(n)、第2のインパルス応答をw
t(n)を入力する。各々のインパルス応答に対して、
予め定められた遅れ次数Pの自己相関関数を計算する。
【0116】一例として、hwt(n)に対する自己相関
C(j)の求め方を次式(19)に示す。
【0117】
【数12】
【0118】ここで、Lは自己相関を計算するときのイ
ンパルス応答の長さを示す。wt(n)に対しても同様
にして自己相関を計算する。
【0119】次に、各々の自己相関に対して、次数Pの
LPC分析を行ない、線形予測係数を求め、これらとh
wt(n)を符号化回路に出力する。これを全ての帯域に
ついて行なう。
【0120】帯域tのインパルス応答hwt(n)、wt
(n)に対する線形予測係数をそれぞれ、αht(i),
αwt(i)(i=1,...P)とする。
【0121】図4は、符号化回路6001の構成を示す
ブロック図である。端子601、602、603、60
4、605から、入力信号、αwt(i)、hwt(n)、
αwt(i)、パルス割り当て個数を入力する。
【0122】聴感重み付け回路610は次式(20)の
フィルタリング処理により重み付けを行なう。
【0123】
【数13】
【0124】応答信号計算回路620は、適応コードブ
ック、音源パルスの振幅、位置、ゲインコードベクトル
のインデクスを入力し、インデクスに対応するコードベ
クトルを読み出し、まず次式(21)にもとづき駆動音
源信号vt(n)を求める。
【0125】
【数14】
【0126】vt(n)は適応コードブック回路420
に出力される。
【0127】次に、次式(22)により、応答信号swt
(n)をサブフレーム毎に計算する。
【0128】
【数15】
【0129】さらに、保存されているフィルタメモリの
値を用いて、入力信号を零dt(n)=0とした応答信
号を1サブフレーム分計算し、減算器415へ出力す
る。ここで、応答信号xzt(n)は次式(23)で表さ
れる。
【0130】
【数16】
【0131】但し、n−i≦0のときは y(n−i)=p(N+(n−i)) …(24) xzt(n−i)=swt(N+(n−i)) …(25) である。
【0132】図5は、本発明の第2の実施の形態の構成
例を示すブロック図である。図5において、図1と同一
の要素には同一の参照番号が付されており、以下では図
1に示した実施例との相違点のみを説明する。
【0133】図5を参照して、補間回路670は、スペ
クトルパラメータ計算回路200から入力した線形予測
係数を、フレーム長よりも短いサブフレーム毎に補間
し、補間したパラメータをインパルス応答計算回路31
0に出力する。補間を行なうためには、例えばLSPに
一旦変換し、LSP上で補間した後に、線形予測係数に
逆変換する。
【0134】また、スペクトルパラメータ量子化回路2
10から、量子化されたLSPを入力し、これをサブフ
レーム単位で補間し、補間結果を線形予測係数に逆変換
してインパルス応答計算回路310に出力する。
【0135】なお、補間回路670は、図3の構成に付
加することもできる。
【0136】図6は、本発明の第3の実施の形態の構成
例を示すブロック図である。図6において、図1と同一
の要素には同一の参照番号が付されており、以下では図
1に示した実施例との相違点のみを説明する。
【0137】図6を参照して、割り当て回路650は、
帯域毎に、パルスの個数とS/N性能の関係を示したテ
ーブル651を予め作成しておく。例えば、多量の信号
に対して、予め、各帯域毎にパルスの個数を変化させて
平均S/Nを測定し、これを帯域毎にテーブルに格納し
ておく。
【0138】性能計算回路320から帯域tに対してS
MR(t)を入力し、この要求値を満たすべくテーブル
を参照して、パルスの個数を割り当てる。具体的な処理
を次に示す。
【0139】まず、各帯域のパルスの個数を1とし、サ
ブバンドt毎にテーブルからSNR(t)を求める。次
式(26)でMNR(t)を計算する。
【0140】 MNR(t)=SNR(t)−SMR(t)(dB) …(26)
【0141】全ての帯域合計のビット数を計算し、割り
当て可能ビット数を算出する。
【0142】MNR(t)が最小の帯域において、パル
ス数を1パルス増やし、SNR(t)の値を修正し、割
り当て可能ビットの計算を行なう。
【0143】これらを繰り返し、割り当て可能なビット
が負にならない限り、これらの処理を繰り返す。
【0144】なお、割り当て回路650、テーブル65
1は、図3の構成に付加することもできる。
【0145】図7は、本発明の第4の実施の形態の構成
例を示すブロック図である。図7において、図1と同一
の要素には同一の参照番号が付されており、以下では図
1に示した実施例との相違点のみを説明する。
【0146】図7を参照して、符号化回路7001〜7
00Nは、帯域分割回路150から、予め定められた複
数個の帯域に分割された信号を入力する。帯域tの信号
をxt(n)とする。符号化回路7001〜700Nは共
通の動作を行なうので、符号化回路7001のみを、図
8を参照して説明する。
【0147】図8において、端子701、702から、
信号xt(n)、割り当てパルス数K(t)をそれぞれ
入力する。スペクトルパラメータ計算回路710は、信
号xt(n)に対して、スペクトルパラメータとして線
形予測係数を予め定められた次数Pだけ計算する。具体
的な動作は、入力信号が異なる点を除けばスペクトルパ
ラメータ計算回路200と同一である。
【0148】インパルス応答計算回路730は、スペク
トルパラメータ計算回路710から線形予測係数α
t(i)、スペクトルパラメータ量子化回路210から
量子化された線形予測係数αt′(i)を入力し、次式
に従い、2種のインパルス応答を計算する。
【0149】インパルス応答計算回路730は、スペク
トルパラメータ計算回路710から線形予測係数α
t(i)、スペクトルパラメータ量子化回路210から
量子化された線形予測係数αt′(i)を入力し、次式
(27)、(28)に従い、2種のインパルス応答を計
算する。
【0150】第1のインパルス応答回路hwt(n)は次
式(27)の伝達特性を有するフィルタのインパルス応
答である。
【0151】
【数17】
【0152】第2のインパルス応答は、次式(28)の
伝達特性を有する合成フィルタのインパルス応答h
t(n)である。
【0153】
【数18】
【0154】前者は、適応コードブック回路420、音
源計算回路430、ゲイン量子化回路440に出力す
る。また、後者のインパルス応答は、端子708から出
力する。
【0155】聴感重み付け回路740は、入力信号xt
(n)と2種の線形予測係数αt(i)とαt′(i)を
入力し、次式(29)に示す伝達特性Hw(z)を有す
るフィルタでフィルタリングを行ない、聴感重み付け信
号xwt(n)を計算し、減算器415に出力する。
【0156】
【数19】
【0157】ここで、γは、聴感重み付け量を制御する
重み係数である。
【0158】このフィルタリング処理は、z変換上で次
式のように表せる。
【0159】 Xwt(z)=Xt(z)Hw(z) …(30)
【0160】重み付け信号計算回路796は、適応コー
ドブック、パルスの振幅、位置、ゲインコードベクトル
に関するインデクスを入力し、インデクスからそれに対
応するコードベクトルを読み出し、まず次式(31)に
もとづき駆動音源信号vt(n)を求める。
【0161】
【数20】
【0162】vt(n)は適応コードブック回路420
に出力される。
【0163】次に、スペクトルパラメータ計算回路71
0の出力パラメータ、スペクトルパラメータ量子化回路
210の出力パラメータを用いて次式(32)により、
応答信号swt(n)を計算し、応答信号計算回路795
へ出力する。
【0164】
【数21】
【0165】応答信号計算回路795は、スペクトルパ
ラメータ計算回路710から、線形予測係数αt(i)
を入力し、スペクトルパラメータ量子化回路210か
ら、量子化して復元した線形予測係数αt′(i)を入
力し、保存されているフィルタメモリの値を用いて、入
力信号を零dt(n)=0とした応答信号を1サブフレ
ーム分計算し、減算器415へ出力する。ここで、応答
信号xzt(n)は次式(33)で表される。
【0166】
【数22】
【0167】但し、n−i≦0のときは yt(n−i)=p(N+(n−i)) …(34) xzt(n−i)=swt(N+(n−i)) …(35)
【0168】ここで、Nはサブフレーム長を示す。swt
(n)、p(n)は、式(35)の重み付け信号計算回
路の出力信号を示す。
【0169】再度図7を参照して、帯域合成回路710
は、各帯域の符号化回路7001〜700Nから出力され
たインパルス応答ht(n)を入力し、帯域合成フィル
タに通して、全帯域のインパルス応答h(n)を予め定
められた点数だけ計算し、性能計算回路320に出力す
る。ここで、帯域合成フィルタには、周知のQMF合成
フィルタを用いることができる。詳細は前記文献11を
参照することができる。
【0170】図9は、本発明の第5の実施の形態の構成
例を示すブロック図である。図9において、図7と同一
の要素には同一の参照番号が付されており、以下では図
7に示した第4の実施の形態との相違点のみを説明す
る。
【0171】すなわち、本実施例においては、符号化回
路8001〜800Nの動作が異なるので、図10に、符
号化回路8001の構成を示す。なお、図10におい
て、図8と同一の要素には同一の参照番号が付されてお
り、以下では図8に示した第4の実施の形態との相違点
のみを説明する。
【0172】図10を参照して、図8に示した符号化回
路との相違点は、補間回路670である。補間回路67
0は、図5に示した補間回路670と同一動作を行な
う。すなわち、補間回路670は、スペクトルパラメー
タ計算回路710から入力した線形予測係数を、フレー
ム長よりも短いサブフレーム毎に補間し、補間したパラ
メータをインパルス応答計算回路730に出力する。補
間を行なうためには、例えばLSPに一旦変換し、LS
P上で補間した後に、線形予測係数に逆変換する。
【0173】また、スペクトルパラメータ量子化回路7
10から、量子化されたLSPを入力し、これをサブフ
レーム単位で補間し、補間結果を線形予測係数に逆変換
してインパルス応答計算回路730に出力する。
【0174】図11は、本発明の第6の実施の形態の構
成例を示すブロック図である。図11と図9の相違点
は、割り当て回路650である。割り当て回路650
は、図6の割り当て回路と同一の動作を行ない、テーブ
ル651を用いて、帯域毎にパルスの個数を割り当て
る。
【0175】図12は、本発明の第7の実施の形態の構
成例を示すブロック図である。図12と図1の相違点
は、モード判別回路800と割り当て回路810であ
る。
【0176】図12を参照して、モード判別回路800
は、フレーム分割回路110からフレーム単位で入力信
号を受取り、モード判別情報を割り当て回路810とマ
ルチプレクサ500へ出力する。ここでは、モード判別
に、現在のフレームの特徴量を用いる。特徴量として
は、例えば、フレームで平均したピッチ予測ゲインを用
いる。ピッチ予測ゲインの計算は、例えば次式(36)
を用いる。
【0177】
【数23】
【0178】ここで、Lはフレームに含まれるサブフレ
ームの個数である。なお、Lは1でもよい。Pi、Ei
それぞれ、i番目のサブフレームでの音声パワ、ピッチ
予測誤差パワであり、次式(37)、(38)で与えら
れる。
【0179】
【数24】
【0180】ここで、Tiは予測ゲインを最大化する最
適遅延である。
【0181】フレーム平均ピッチ予測ゲインGを予め定
められた1個あるいは複数個のしきい値と比較して複数
種類のモードに分割する。モードの個数としては、例え
ば4を用いることができる。
【0182】割り当て回路810は、帯域毎に、SMR
(t)とモード判別情報に従い、パルス数の適応割り当
てを行なう。一例として、簡便には、1パルス当たりの
符号化S/Nをモードに応じてAjdB(j=1,...,
U:Uはモードの個数)と仮定し、SMR(t)をAj
で除して必要なパルスの個数を求めることができる。こ
のようにして、各帯域毎に、パルスの割り当て数K
(t)を計算し、符号化回路4001〜400Nに出力す
る。ただし、この割り当てのときに、複数帯域合計の伝
送ビット数Bを計算し、B=Rとなるように、パルスの
個数を調整する。ここで、Rは予め定められた伝送速度
である。また、次式(39)が成り立つ。
【0183】
【数25】
【0184】ここで、b(t)は帯域tにおける割り当
てパルス及び他の伝送情報から計算した帯域tの伝送ビ
ット数、Nは帯域の個数である。
【0185】なお、符号化回路4001〜400Nにおい
ても、モード判別情報を用いて、適応コードブックの動
作やゲインコードブックを切替える構成にすることもで
きる。また、スペクトルパラメータ量子化回路210に
おいても、モード判別情報を用いて、コードブック21
5を切替える構成にすることもできる。
【0186】図13は、本発明の第7の実施の形態の変
形例を示すブロック図である。図13を参照して、本実
施例においては、図12の構成において、LPC分析回
路550を付加し、分割回路340において帯域分割さ
れたインパルス応答を用いて、各帯域毎に、自己相関を
求めLPC分析により線形予測係数を計算する。さら
に、符号化回路6001〜600Nは、帯域毎に線形予測
係数を入力して符号化を行なう。LPC分析回路55
0、符号化回路6001〜600Nは、図3の構成と同一
である。
【0187】図14は、本発明の第8の実施の形態の構
成例を示すブロック図である。図12の構成において、
補間回路670を付加している。補間回路670は、図
5の構成と同一である。
【0188】図15は、本発明の第9の実施の形態の構
成例を示すブロック図である。割り当て回路900は、
モード判別回路800からモード判別情報を入力する。
割り当て回路900は、帯域毎に、パルスの個数とS/
N性能の関係を示したテーブルをモード毎に予め作成し
ておく。これらをテーブル9101から910Uとする。
ここで、Uはモードの個数である。例えば、多量の信号
に対して、予め、各帯域毎にかつモード毎にパルスの個
数を変化させて平均S/N比を測定し、これを帯域毎に
かつモード毎にテーブルに格納しておく。
【0189】性能計算回路320から帯域tに対してS
MR(t)を入力し、さらに、モード判別回路800か
らフレームのモード判別情報を入力し、モード毎に参照
すべきテーブルを切替えて、この要求値を満たすべく、
パルスの個数を割り当てる。具体的な処理を次に示す。
【0190】まず、各帯域のパルスの個数を1とし、サ
ブバンドt毎に、モードUに対してテーブルからSNR
U(t)を求める。次式(40)でMNRU(t)を計算
する。
【0191】 MNRU(t)=SNRU(t)−SMR(t)(dB) …(40)
【0192】全ての帯域合計のビット数を計算し、割り
当て可能ビット数を算出する。
【0193】MNRU(t)が最小の帯域において、パ
ルス数を1パルス増やし、SNR(t)の値を修正し、
割り当て可能ビットの計算を再度行なう。これらを繰り
返し、割り当て可能なビットが負にならない限り、これ
らの処理を繰り返す。
【0194】なお、符号化回路4001〜400Nにおい
ても、モード判別情報を用いて、適応コードブックの動
作やゲインコードブックを切替える構成にすることもで
きる。また、スペクトルパラメータ量子化回路210に
おいても、モード判別情報を用いて、コードブック21
5を切替える構成にすることもできる。
【0195】図16は、本発明の第10の実施の形態の
構成例を示すブロック図である。
【0196】図16を参照して、割り当て回路1010
は、符号化回路10001〜1000Nの各々から帯域毎
にモード判別情報を入力し、帯域毎にパルスの個数を割
り当てる。帯域毎に、SMR(t)とモードに従い、パ
ルス数の適応割り当てを行なう。
【0197】一例として、簡便には、帯域毎に1パルス
当たりの符号化S/N比をAU(t)dBと仮定し、S
MR(t)をAU(t)で除して、帯域毎に必要なパル
スの個数を求めることができる。このようにして、各帯
域毎に、パルスの割り当て数を計算し、符号化回路10
001〜1000Nに出力する。ただし、この割り当ての
ときに、複数帯域合計の伝送ビット数Bを計算し、B=
Rとなるように、パルスの個数を調整する。ここで、R
は予め定められた伝送速度である。また、次式(41)
が成り立つ。
【0198】
【数26】
【0199】ここで、bU(t)は、帯域tにおけるモ
ードUでの割り当てパルス数と他の伝送情報から計算し
た帯域tのモードUにおける伝送ビット数、Nは帯域の
個数である。
【0200】このような構成にすることにより、帯域
毎、モード毎により精度の高いパルス割り当てを実現す
ることができる。
【0201】符号化回路10001〜1000Nの構成
を、図17を参照して説明する。なお、符号化回路10
001〜1000Nは同一の構成であるので、代表して、
符号化回路1 10001を説明する。
【0202】図17において、モード判別回路1020
は、端子701からフレーム単位で帯域tの入力信号を
受取り、モード判別情報を端子1021から出力する。
ここでは、モード判別に、現在のフレームの特徴量を用
いる。特徴量としては、例えば、フレームで平均したピ
ッチ予測ゲインを用いる。ピッチ予測ゲインの計算は、
例えば次式(42)を用いる。
【0203】
【数27】
【0204】ここで、Lはフレームに含まれるサブフレ
ームの個数である。なお、Lは1でもよい。Pi、Ei
それぞれ、i番目のサブフレーム帯域tの入力信号のパ
ワ、ピッチ予測誤差パワを示し、次式(43)、(4
4)で与えられる。
【0205】
【数28】
【0206】ここで、Ttは帯域tにおける、予測ゲイ
ンを最大化する最適遅延である。
【0207】フレーム平均ピッチ予測ゲインGを予め定
められた1個あるいは複数個のしきい値と比較して複数
種類のモードに分割する。モードの個数としては、例え
ば4を用いることができる。
【0208】図18は、本発明の第11の実施の形態の
構成例を示すブロック図である。図16とは、符号化回
路11001〜1100Nの構成が異なるので、符号化回
路11001の構成を図19に示す。
【0209】図19において、図17と相違する点は、
補間回路670が付加されている点である。
【0210】図20は、本発明の第12の実施の形態の
構成例を示すブロック図である。
【0211】割り当て回路1150は、帯域毎に、パル
スの個数とS/N性能の関係を示したテーブルをモード
毎に予め作成しておく。これらをテーブル11201
ら1120Uとする。ここで、Uはモードの個数であ
る。例えば、多量の信号に対して、予め、各帯域毎にか
つモード毎にパルスの個数を変化させて平均S/N比を
測定し、これを帯域毎にかつモード毎にテーブルに格納
しておく。
【0212】性能計算回路320から帯域tに対してS
MR(t)を入力し、さらに、符号化回路10001
1000Nから帯域毎にモード判別情報を入力し、SM
R(t)の要求値を満たすべく、モード毎に参照すべき
テーブルを切替えて、パルスの個数を割り当てる。具体
的な処理を次に示す。
【0213】まず、各帯域のパルスの個数を1とし、サ
ブバンドt毎に、モードUに対してテーブルからSNR
U(t)を求める。そして、次式(45)によりMNRU
(t)を計算する。
【0214】 MNRU(t)=SNRU(t)−SMR(t)(dB) …(45)
【0215】次に、全ての帯域合計のビット数を計算
し、割り当て可能ビット数を算出する。
【0216】MNRが最小の帯域において、パルス数を
1パルス増やし、SNRU(t)の値を修正し、割り当
て可能ビットの計算を再度行なう。これらを繰り返し、
割り当て可能なビットが負にならない限り、これらの処
理を繰り返す。
【0217】上記各実施の形態の説明では、音源計算回
路において、パルスの振幅を極性で表したが、複数個の
振幅をまとめてベクトル量子化する構成をとることによ
り、さらに性能を改善することができる。
【0218】さらに、複数セットの位置の候補に対し
て、振幅ベクトル量子化コードブックと位置とを組み合
わせて探索し、最適な組合せを選択することで性能が向
上する。以下に具体的に説明する。ここでは、簡単のた
めに、M個のパルスの位置を2セット計算するものとす
る。
【0219】まず、第1セットの位置に対して、振幅コ
ードブックから振幅コードブックを読み出し、歪みを最
小化する振幅コードベクトルを選択し、第1の歪みD1
を計算する。次に、第2セットの位置に対してコードブ
ックから振幅を読み出し、上記と同様の処理を繰り返
し、第2の歪みD2を計算する。次に、第1と第2の歪
みを比較し、より小さい方の歪みを与える位置と振幅コ
ードベクトルの組合せを選択する。
【0220】
【発明の効果】以上説明したように、本発明によれば、
音源信号を複数個のパルスで表すことにより、演算量を
削減することができる。
【0221】また、本発明によれば、入力信号または帯
域分割された信号からスペクトルパラメータを求め、こ
れをもとに複数個の帯域に対して、好ましくは信号対マ
スキング値の計算から性能要求値を算出し、これをもと
に、パルスの個数を帯域毎に適応的に割り当てることに
より、非定常な音楽信号などに対しても従来よりも良好
な音質を得ることができる。また、パルス数の適応割り
当てに必要な情報を新たに伝送する必要がないという利
点がある。
【0222】さらに、本発明によれば、スペクトルパラ
メータをフレーム長よりも短いサブフレーム毎に補間す
ることで、時間的に滑らかなパルス割当を行なうことが
できる。
【0223】そして、本発明においては、パルスの個数
と性能との関係を示したテーブルを予め有し、これを用
いてパルス数の適応割り当てを帯域毎に行なうことによ
り、簡便でより精度の高い割り当てを行なうことができ
る。
【0224】さらに、本発明においては、入力信号もし
くは、帯域分割された信号からモード判別を行ない、モ
ード情報も使用して帯域毎にパルスの適応割り当てを行
なうことにより、パルスの割り当ての精度がさらに改善
され、音質が向上する。また、この割り当てには、帯域
毎に、モード毎に前記テーブルを切替えて行なうことに
より、簡便な処理で実現できる。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態を示す図である。
【図2】本発明の第1の実施の形態における符号化回路
4001の構成を示すブロック図である。
【図3】本発明の第1の実施の形態の変形を示す図であ
る。
【図4】図3の符号化回路4001の構成を示す図であ
る。
【図5】本発明の第2の実施の形態を示す図である。
【図6】本発明の第3の実施の形態を示す図である。
【図7】本発明の第4の実施の形態を示す図である。
【図8】図7の符号化回路7001の構成を示す図であ
る。
【図9】本発明の第5の実施の形態の構成を示す図であ
る。
【図10】図9の符号化回路8001の構成を示す図で
ある。
【図11】本発明の第6の実施の形態の構成を示す図で
ある。
【図12】本発明の第7の実施の形態の構成を示す図で
ある。
【図13】本発明の第7の実施の形態の変形例を示す図
である。
【図14】本発明の第8の実施の形態の構成を示す図で
ある。
【図15】本発明の第9の実施の形態の構成を示す図で
ある。
【図16】本発明の第10の実施の形態の構成を示す図
である。
【図17】図16の符号化回路10001の構成を示す
図である。
【図18】本発明の第11の実施の形態の構成を示す図
である。
【図19】図18の符号化回路11001の構成を示す
図である。
【図20】本発明の第12の実施の形態の構成を示す図
である。
【符号の説明】
110 フレーム分割回路 150 帯域分割回路 200,710 スペクトルパラメータ計算回路 210 スペクトルパラメータ量子化回路 215 コードブック 310,730 インパルス応答計算回路 320 性能計算回路 330,650,810,900,1010,1150
割り当て回路 340 分割回路 4001〜400N,6001〜600N,7001〜70
N,8001〜800N,10001〜1000N,11
001〜1100N 符号化回路 410,610,740 聴感重み付け回路 415 減算器 420 適応コードブック回路 430 音源計算回路 440 ゲイン量子化回路 445 ゲインコードブック 450,620,795 応答信号計算回路 500 マルチプレクサ 550 LPC分析回路 651,9101〜910U,11201〜1120 テ
ーブル 670 補間回路 710 帯域合成回路 796 重み付け信号合成回路 800,1020 モード判別回路

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】入力した信号を予め定められた時間長のフ
    レームに分割し予め定められた複数個の帯域に分割する
    帯域分割手段と、 前記入力信号からスペクトル包絡を表すスペクトルパラ
    メータを求めるパラメータ計算手段と、 前記スペクトルパラメータをもとに複数個の帯域に対し
    て性能要求値を求める性能計算手段と、 前記帯域分割手段の出力信号に対して、複数個のパルス
    から構成される音源信号を求める符号化手段と、 前記性能計算手段の出力に応じて前記パルスの個数を前
    記帯域毎に適応的に割り当てる割当手段と、 を含み、 前記パラメータ計算手段の出力信号と前記符号化手段の
    出力信号とを組み合わせて出力することを特徴とする信
    号符号化装置。
  2. 【請求項2】前記パラメータ計算手段から出力されるス
    ペクトルパラメータをフレーム長よりも短い時間間隔毎
    に補間する補間手段と、 前記補間手段の出力をもとに複数個の帯域に対して性能
    要求値を求める性能計算手段と、 を更に有することを特徴とする請求項1記載の信号符号
    化装置。
  3. 【請求項3】前記割当手段が、前記パルスの個数と性能
    の関係を示したテーブルを有し、 前記性能計算手段からの要求性能と、前記テーブルと、
    を用いて前記パルスの個数を帯域毎に適応的に割り当て
    る、 ことを特徴とする請求項1記載の信号符号化装置。
  4. 【請求項4】入力した信号を予め定められた時間長のフ
    レームに分割し予め定められた複数個の帯域に分割する
    帯域分割手段と、 前記帯域分割手段の出力信号からスペクトル包絡を表す
    スペクトルパラメータを求めるパラメータ計算手段と、 前記スペクトルパラメータをもとに複数個の帯域に対し
    て性能要求値を求める性能計算手段と、 前記帯域分割手段の出力信号に対して、複数個のパルス
    から構成される音源信号を求める符号化手段と、 前記性能計算手段の出力に応じて前記パルスの個数を前
    記帯域毎に適応的に割り当てる割当手段と、 を含み、 前記パラメータ計算手段と前記符号化手段との出力信号
    を組み合わせて出力することを特徴とする信号符号化装
    置。
  5. 【請求項5】前記パラメータ計算手段から出力されるス
    ペクトルパラメータをフレーム長よりも短い時間間隔毎
    に補間する補間手段と、 前記補間手段の出力をもとに複数個の帯域に対して性能
    要求値を求める性能計算手段と、 を有することを特徴とする請求項4記載の信号符号化装
    置。
  6. 【請求項6】前記割当手段が、前記パルスの個数と性能
    の関係を示したテーブルを有し、前記性能計算手段から
    の要求性能と、前記テーブルと、を用いて、前記パルス
    の個数を帯域毎に適応的に割り当てる、 ことを特徴とする請求項4記載の信号符号化装置。
  7. 【請求項7】入力した音声信号を予め定められた時間長
    のフレームに分割し前記入力した音声信号からスペクト
    ルパラメータを求めるスペクトルパラメータ計算手段
    と、 前記入力した音声信号から特徴量を抽出してモードを判
    別するモード判別手段と、 前記スペクトルパラメータをもとに複数個の帯域に対し
    て性能要求値を求める性能計算手段と、 出力信号に対して、複数個のパルスから構成される音源
    信号を求める符号化手段と、 前記モード判別手段の出力と前記性能計算手段の出力に
    応じて前記パルスの個数を前記帯域毎に適応的に割り当
    てる割当手段と、 を含み、 前記スペクトルパラメータ計算手段と前記符号化手段と
    の出力信号と前記モード判別手段の出力とを組み合わせ
    て出力することを特徴とする信号符号化装置。
  8. 【請求項8】前記スペクトルパラメータ計算手段から出
    力されるスペクトルパラメータをフレーム長よりも短い
    時間間隔毎に補間する補間手段と、 前記補間手段の出力をもとに複数個の帯域に対して性能
    要求値を求める性能計算手段と、を有することを特徴と
    する請求項7記載の信号符号化装置。
  9. 【請求項9】前記割当手段が、パルスの個数と性能の関
    係を示したテーブルを有し、前記モード判別手段からの
    出力により前記テーブルを切替え、 前記性能計算手段からの要求性能と前記テーブルとを用
    いてパルスの個数を帯域毎に適応的に割り当てる、 ことを特徴とする請求項7記載の信号符号化装置。
  10. 【請求項10】入力した信号を予め定められた時間長の
    フレームに分割し予め定められた複数個の帯域に分割す
    る帯域分割手段と、 前記帯域分割手段の出力信号からスペクトル包絡を表す
    スペクトルパラメータを求めるパラメータ計算手段と、 前記帯域分割手段の出力信号から特徴量を抽出してモー
    ドを判別するモード判別手段と、 前記スペクトルパラメータをもとに複数個の帯域に対し
    て性能要求値を求める性能計算手段と、 前記帯域分割手段の出力信号に対して、複数個のパルス
    から構成される音源信号を求める符号化手段と、 前記モード判別手段の出力と前記性能計算手段の出力と
    に応じて前記パルスの個数を前記帯域毎に適応的に割り
    当てる割当手段と、 を含み、 前記パラメータ計算手段と前記符号化手段との出力信号
    と前記モード判別手段の出力とを組み合わせて出力する
    ことを特徴とする信号符号化装置。
  11. 【請求項11】前記パラメータ計算手段から出力される
    スペクトルパラメータをフレーム長よりも短い時間間隔
    毎に補間する補間手段と、 前記補間手段の出力をもとに複数個の帯域に対して性能
    要求値を求める性能計算手段と、 を有することを特徴とする請求項10記載の信号符号化
    装置。
  12. 【請求項12】前記割当手段が、パルスの個数と性能の
    関係を示したテーブルを有し、前記モード判別手段から
    の出力により前記テーブルを切替え、前記性能計算手段
    からの要求性能と前記テーブルとを用いてパルスの個数
    を帯域毎に適応的に割り当てることを特徴とする請求項
    10記載の信号符号化装置。
  13. 【請求項13】入力信号を所定のフレーム毎に複数個の
    帯域に分割し、該入力信号からスペクトル包絡を表すス
    ペクトルパラメータを計算し、該スペクトルパラメータ
    をもとに前記複数個の帯域に対して性能要求値を求め、
    該性能要求値に従い、各帯域において音源信号を表すた
    めのパルスの個数を適応的に割り当て、このパルス数に
    従い音源信号を表すパルスを計算して符号化を行ない、
    該スペクトルパラメータ計算出力と符号化出力とを組み
    合わせて出力することを特徴とする信号符号化方法。
JP8115678A 1996-04-12 1996-04-12 信号符号化装置及び方法 Pending JPH09281995A (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP8115678A JPH09281995A (ja) 1996-04-12 1996-04-12 信号符号化装置及び方法
CA002201217A CA2201217C (en) 1996-04-12 1997-03-27 Method and apparatus for coding signal while adaptively allocating number of pulses
DE69708191T DE69708191T2 (de) 1996-04-12 1997-04-11 Vorrichtung zur Signalkodierung
EP97106008A EP0801377B1 (en) 1996-04-12 1997-04-11 Apparatus for coding a signal
US08/840,318 US5857168A (en) 1996-04-12 1997-04-14 Method and apparatus for coding signal while adaptively allocating number of pulses

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8115678A JPH09281995A (ja) 1996-04-12 1996-04-12 信号符号化装置及び方法

Publications (1)

Publication Number Publication Date
JPH09281995A true JPH09281995A (ja) 1997-10-31

Family

ID=14668580

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8115678A Pending JPH09281995A (ja) 1996-04-12 1996-04-12 信号符号化装置及び方法

Country Status (5)

Country Link
US (1) US5857168A (ja)
EP (1) EP0801377B1 (ja)
JP (1) JPH09281995A (ja)
CA (1) CA2201217C (ja)
DE (1) DE69708191T2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998052188A1 (fr) * 1997-05-15 1998-11-19 Matsushita Electric Industrial Co., Ltd. Codeur de signaux audio, decodeur de signaux audio, et procede de codage et de decodage de signaux audio
US6826526B1 (en) 1996-07-01 2004-11-30 Matsushita Electric Industrial Co., Ltd. Audio signal coding method, decoding method, audio signal coding apparatus, and decoding apparatus where first vector quantization is performed on a signal and second vector quantization is performed on an error component resulting from the first vector quantization
US6865534B1 (en) 1998-06-15 2005-03-08 Nec Corporation Speech and music signal coder/decoder
US6904404B1 (en) 1996-07-01 2005-06-07 Matsushita Electric Industrial Co., Ltd. Multistage inverse quantization having the plurality of frequency bands
WO2005069277A1 (ja) * 2004-01-19 2005-07-28 Matsushita Electric Industrial Co., Ltd. 音声信号符号化方法、音声信号復号化方法、送信機、受信機、及びワイヤレスマイクシステム
WO2008108082A1 (ja) * 2007-03-02 2008-09-12 Panasonic Corporation 音声復号装置および音声復号方法

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030096444A (ko) * 1996-11-07 2003-12-31 마쯔시다덴기산교 가부시키가이샤 음원 벡터 생성 장치 및 방법
US6208962B1 (en) * 1997-04-09 2001-03-27 Nec Corporation Signal coding system
JP3166697B2 (ja) * 1998-01-14 2001-05-14 日本電気株式会社 音声符号化・復号装置及びシステム
JP2001318698A (ja) * 2000-05-10 2001-11-16 Nec Corp 音声符号化装置及び音声復号化装置
US7596486B2 (en) * 2004-05-19 2009-09-29 Nokia Corporation Encoding an audio signal using different audio coder modes
US8712766B2 (en) * 2006-05-16 2014-04-29 Motorola Mobility Llc Method and system for coding an information signal using closed loop adaptive bit allocation
JP5400059B2 (ja) * 2007-12-18 2014-01-29 エルジー エレクトロニクス インコーポレイティド オーディオ信号処理方法及び装置
GB2473266A (en) 2009-09-07 2011-03-09 Nokia Corp An improved filter bank
EP2980798A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Harmonicity-dependent controlling of a harmonic filter tool
US9729416B1 (en) 2016-07-11 2017-08-08 Extrahop Networks, Inc. Anomaly detection using device relationship graphs
US10063434B1 (en) 2017-08-29 2018-08-28 Extrahop Networks, Inc. Classifying applications or activities based on network behavior
US10116679B1 (en) 2018-05-18 2018-10-30 Extrahop Networks, Inc. Privilege inference and monitoring based on network behavior

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5261027A (en) * 1989-06-28 1993-11-09 Fujitsu Limited Code excited linear prediction speech coding system
EP0443548B1 (en) * 1990-02-22 2003-07-23 Nec Corporation Speech coder
US5170396A (en) * 1990-06-14 1992-12-08 Introtek International, L.P. Data valid detector circuit for manchester encoded data
JP3114197B2 (ja) * 1990-11-02 2000-12-04 日本電気株式会社 音声パラメータ符号化方法
JP3151874B2 (ja) * 1991-02-26 2001-04-03 日本電気株式会社 音声パラメータ符号化方式および装置
JP3143956B2 (ja) * 1991-06-27 2001-03-07 日本電気株式会社 音声パラメータ符号化方式
CA2075156A1 (en) * 1991-08-02 1993-02-03 Kenzo Akagiri Digital encoder with dynamic quantization bit allocation
US5598504A (en) * 1993-03-15 1997-01-28 Nec Corporation Speech coding system to reduce distortion through signal overlap
JP2970407B2 (ja) * 1994-06-21 1999-11-02 日本電気株式会社 音声の励振信号符号化装置
CA2127520C (en) * 1994-07-06 2001-01-16 Gordon J. Reesor Signal processing circuit
JPH08272395A (ja) * 1995-03-31 1996-10-18 Nec Corp 音声符号化装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6826526B1 (en) 1996-07-01 2004-11-30 Matsushita Electric Industrial Co., Ltd. Audio signal coding method, decoding method, audio signal coding apparatus, and decoding apparatus where first vector quantization is performed on a signal and second vector quantization is performed on an error component resulting from the first vector quantization
US6904404B1 (en) 1996-07-01 2005-06-07 Matsushita Electric Industrial Co., Ltd. Multistage inverse quantization having the plurality of frequency bands
US7243061B2 (en) 1996-07-01 2007-07-10 Matsushita Electric Industrial Co., Ltd. Multistage inverse quantization having a plurality of frequency bands
WO1998052188A1 (fr) * 1997-05-15 1998-11-19 Matsushita Electric Industrial Co., Ltd. Codeur de signaux audio, decodeur de signaux audio, et procede de codage et de decodage de signaux audio
US6865534B1 (en) 1998-06-15 2005-03-08 Nec Corporation Speech and music signal coder/decoder
WO2005069277A1 (ja) * 2004-01-19 2005-07-28 Matsushita Electric Industrial Co., Ltd. 音声信号符号化方法、音声信号復号化方法、送信機、受信機、及びワイヤレスマイクシステム
WO2008108082A1 (ja) * 2007-03-02 2008-09-12 Panasonic Corporation 音声復号装置および音声復号方法
US8554548B2 (en) 2007-03-02 2013-10-08 Panasonic Corporation Speech decoding apparatus and speech decoding method including high band emphasis processing

Also Published As

Publication number Publication date
CA2201217A1 (en) 1997-10-12
EP0801377A2 (en) 1997-10-15
US5857168A (en) 1999-01-05
DE69708191T2 (de) 2002-03-28
DE69708191D1 (de) 2001-12-20
EP0801377A3 (en) 1998-09-23
EP0801377B1 (en) 2001-11-14
CA2201217C (en) 2000-07-25

Similar Documents

Publication Publication Date Title
JP3094908B2 (ja) 音声符号化装置
US6401062B1 (en) Apparatus for encoding and apparatus for decoding speech and musical signals
JPH09281995A (ja) 信号符号化装置及び方法
EP0657874B1 (en) Voice coder and a method for searching codebooks
JP3541680B2 (ja) 音声音楽信号の符号化装置および復号装置
JP3335841B2 (ja) 信号符号化装置
US7680669B2 (en) Sound encoding apparatus and method, and sound decoding apparatus and method
JP3266178B2 (ja) 音声符号化装置
JP3063668B2 (ja) 音声符号化装置及び復号装置
JP3616432B2 (ja) 音声符号化装置
JP3360545B2 (ja) 音声符号化装置
EP1154407A2 (en) Position information encoding in a multipulse speech coder
JP3153075B2 (ja) 音声符号化装置
JP3299099B2 (ja) 音声符号化装置
JP3319396B2 (ja) 音声符号化装置ならびに音声符号化復号化装置
JP3249144B2 (ja) 音声符号化装置
JPH08185199A (ja) 音声符号化装置
JP3089967B2 (ja) 音声符号化装置
JP3092654B2 (ja) 信号符号化装置
JP3092436B2 (ja) 音声符号化装置
JPH08320700A (ja) 音声符号化装置
JP3192051B2 (ja) 音声符号化装置
JP3144244B2 (ja) 音声符号化装置
JPH10133696A (ja) 音声符号化装置
JPH09319399A (ja) 音声符号化装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 19990622