JPH0439679B2 - - Google Patents

Info

Publication number
JPH0439679B2
JPH0439679B2 JP59096036A JP9603684A JPH0439679B2 JP H0439679 B2 JPH0439679 B2 JP H0439679B2 JP 59096036 A JP59096036 A JP 59096036A JP 9603684 A JP9603684 A JP 9603684A JP H0439679 B2 JPH0439679 B2 JP H0439679B2
Authority
JP
Japan
Prior art keywords
lpc
label
signal
decoding
lsp
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP59096036A
Other languages
English (en)
Other versions
JPS60239798A (ja
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed filed Critical
Priority to JP59096036A priority Critical patent/JPS60239798A/ja
Priority to CA000481382A priority patent/CA1226947A/en
Publication of JPS60239798A publication Critical patent/JPS60239798A/ja
Priority to US07/421,313 priority patent/US4975955A/en
Publication of JPH0439679B2 publication Critical patent/JPH0439679B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0018Speech coding using phonetic or linguistical decoding of the source; Reconstruction using text-to-speech synthesis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は音声信号の符号化/復号化装置に関
し、特にLSP(Line Spectrum Pairs)パラメー
タに基づくパターンマツチングを用いた音声信号
符号化/復号化装置に関する。
〔従来の技術〕
音声信号の符号化伝送に関しては、伝送データ
ビツトレートの削減は伝送回線を有効活用する上
できわめて大きな問題である。音声信号をスペク
トル情報と音源情報に分離して伝送し、受信側で
これらの情報を基にして原音声を再生する方式は
低伝送データビツトレートを計る目的で多用され
ている。
例えばボコーダにおいては、音声信号のスペク
トル情報としてLPC、LSP、PARCOR係数等が、
また音源情報としては有声無声判別、ピツチ、残
差情報等が採用されている。ボコーダによれば、
音声信号の伝送ビツトレートは4.8Kb/s程度を
達成できるが再生音質は必らずしも満足できるも
のではない。これはボコーダが本質的に入力音声
波形情報を符号化するものでないことに起因す
る。
再生音質を改善するために波形情報として複数
のパルスの位置と振幅を符号化して伝送する例と
して、マルチパルス型の音声符号化技術がある。
マルチパルス型の音声符号化技術については、例
えばB.S.Atal et al、著論文 “A New Model of LPC Excitation for
Producing Natural Sounding Speech at Low
Bit Rates,” Proc.ICAS SP82,pp614−617(1982)に詳し
い。
しかしながら、かかる符号化技術では再生音質
は改善されるものの、得られたマルチパルスの符
号化に要するビツトレートが高く、通常9.6Kb/
s程度にも達してしまう。
そこで、データビツトレートの大幅な削減を可
能にするとともに、再生音質を改善するために提
案されたのがパターンマツチング方式である。こ
の方式は予め用意した多種類を標準的なスペクト
ル包絡情報の各々(標準パターン)にラベルを付
し、入力音声信号を分析して得られるスペクトル
情報と標準パターンとのパターンマツチングを両
者の距離を求めることにより行ない、入力音声ス
ペクトルに最近似(最小距離)の標準パターンの
ラベルを符号化して伝送するものである。上記の
如きパターンマツチング方式を用いると、スペク
トル情報の伝送に要するビツトが極端に少なくて
済むので全体として伝送ビツトレートの大幅な低
減が可能であるが、次のような問題点も含んでい
る。
〔発明が解決しようとする問題点〕
即ち、この方式ではスペクトル情報として使わ
れる特徴パラメータはパターンマツチング歪の比
較的小さいLSPパラメータであり、入力音声の
LSPパラメータパターン(入力パターン)と標準
パターンとの距離は、LSPパラメータのスペクト
ル感度(LSPパラメータの各要素に独立に微少変
化を与えたときのスペクトル包絡を歪として定義
される)を介した近似式により算出される。とこ
ろが、スペクトル感度は、LSPパラメータの各要
素間の周波数間隔△ωが接近してくると、その値
は不正確なものとなることが実験的に確認されて
いる。言い換えると、△ωが小さくなると、LSP
パラメータの各要素の微少な変化が全体のスペク
トル包絡特性に大きな影響を与えるために高精度
なパターンマツチングが困難になる。特に、LSP
分析して得られるLSP周波数間隔△ωは、一般的
に小さい周波数間隔の頻度が、大きい周波数間隔
に比して高いため、この問題が顕著に現われてく
る。
〔問題点を解決するための手段〕
本発明になる音声信号符号化/復号化装置は、
入力音声信号から線形予測係数(LPC)パラメ
ータを求めるLPC分析手段と;前記LPCパラメ
ータから抽出する線スペクトル対(LSP)パラメ
ータのスペクトル感度の過度の敏感さを抑圧する
ように前記LPCパラメータを所定量減衰せしめ
るLPCパラメータ減衰手段;前記減衰された
LPCパラメータから線スペクトル対(LSP)パ
ラメータを求め各入力音声パターン毎の入力パタ
ーンとして出力するLSP分析手段と;予め定めた
各種音声信号をLSP分析して得られたLSPパラメ
ータから成る標準パターンを各標準パターンにラ
ベルを付して記憶する標準パターンメモリと;前
記標準パターンメモリに記憶されている標準パタ
ーンの中から前記入力パターンに最も類似するパ
ターンを選択し、選択された標準パターンのラベ
ルを符号化して出力するパターンマツチング手段
と;前記入力音声信号の残差信号を発生して符号
化する残差信号発生手段とを備えた符号化装置
と;前記符号化装置から伝送路を介して提供され
る前記ラベルと前記残差信号にもとづいて前記入
力音声信号を再生する復号化装置とを備えて成
る。
〔実施例〕
第1図AおよびBはそれぞれ、本発明の一実施
例の分析側(符号化装置)Aと合成側(復号化装
置)Bのブロツク図である。
第1図を参照すると、入力音声信号IinはLow
Pass Filter(LPF)を内蔵するA/Dコンバータ
1によつてまず低減フイルタリングされたのち所
定のサンプリング周波数8KHzでデジタル化され
る。低減フイルタリングは本実施例の場合3.2K
Hz以上の高域を遮断するものであり、これを8K
Hzのサンプリング周波数でサンプリングしつつ所
定のビツト数の量子化データとしてLPC分析器
2に供給する。
LPC分析器2は、こうして供給された量子化
データを所定サンプル分ずついつたんバツフアメ
モリにストアしたのち、これを読出して所定の基
本フレーム周期ごとに予め設定する窓関数との乗
算を実施して極度に鋭いスペクトルピークの平滑
化を図り、線形予測分析を行ない基本フレームご
とにn次の線形予測係数、本実施例では10次のα
パラメータ(α1−α10)を抽出する。このように
して行なわれる線形予測分析は入力音声信号Iin
を形成する特徴パラメータとしてのスペクトル分
布情報と音源情報のうち、スペクトル分布情報と
してのスペクトル包絡を求めるものである。こう
して得られたαパラメータは、減衰係数乗算器3
において、減衰係数テーブルメモリ4から読み出
された減衰係数γと乗算されてLSP分析器5に送
出される。
LSP分析器5は入力された減衰αパラメータ群
を利用して10次のLSP群を分析、抽出しこれをパ
タンマツチング器6に供給する。パタンマツチン
グ器6は次のようにして標準パターンメモリ7の
標準パターンとのマツチング処理を行ない、スペ
クトル距離が最小の標準パタンを選択する。この
場合、αパラメータには減衰係数が乗算されてお
り、LSPの周波数間隔があまり狭すぎることに起
因するスペクトル感度の過剰敏感さを抑止する。
LSP分析およびパタンマツチングを詳述すれば次
のとおりである。
LSP分析器5は、入力した減衰係数乗算後の
LPC係数を利用してLSP係数を求める。このLSP
係数はαパラメータやkパラメータ(偏自己相関
係数)とともに声道の共振特性を表わすパラメー
タとしてしばしば利用されるものであり、声門を
仮想的に完全開放および完全閉塞した場合の声道
伝達関数の線スペクトル周波数ペアによるパラメ
ータであることはよく知られている。
LSP分析器5は、減衰係数乗算器3から入力す
る減衰処理後の線形予測係数αパラメータをよく
知られたNewtonの反復法を利用する高次方程式
を解く方法やDFTと零点探索法の組合わせによ
つて10次のLSP係数に変換する。こうして得られ
るLSP係数は、前述した如く声道フイルタの伝達
関数を周波数領域で表現する線スペクトルω1
ω2……ω10である。このLSP変換に先立つて実施
されるLPC係数の減衰係数乗算処理によれば、
後述するように、LSP係数の最小周波数間隔が拡
大されてパタンマツチング処理が容易となり、ま
た合成側における音声合成用の全極型デジタルフ
イルタの動作安定性も高まる。
上述した標準パタンは予め用意した音声資料を
LSP分析して得られる標準的LSP係数の分布パタ
ンであり、予め設定する種類、本実施例では212
種類を用意し、またスペクトル距離は次の(1)式に
示すDijによつて基本的に示される。
Dij=1/π∫〓〓{Si(ω)−Si(ω)}2dω……(1) (1)式においてSi(ω)、Sj(ω)はそれぞれ入力パタ
ーンと標準パターンの対数スペクトルである。(1)
式は通常次の(2)式の近似式に変換利用される。
DijNK=1 WK{PK (i)−PK (j)2 ………(2) (2)式においてPK (i)、PK (j)は入力パターンおよび
標準パターンにおけるN次のLSP係数、WKはN
次のLSPスペクトル感度である。上述したNは全
極型のLPCデジタルフイルタの次数、本実施例
にあつては10と対応し、そのLSP周波数対ω1
ω2、……ω10を示す。さらにN次のスペクトル感
度Wは前述したようにN次、本実施例の場合は10
次のLSP係数の微少変化によつて発生するスペク
トル変化の程度を示す。
このようにして設定された分析フレームごとの
LSP係数に対応して選択されたLSP標準パタン番
号(ラベル)はマルチプレクサ9に供給される。
以上の説明から明らかなように、このような、パ
タンマツチング方式を採用すれば、各分析フレー
ムのスペクトル情報はラベルのみの伝送符号化で
済むから伝送ビツトレートが大幅に削減される。
ここで本発明の基本的特徴であるLPC係数
(αパラメータ)に減算係数を乗算する(減衰さ
せる)ことの意義について詳細に説明する。
第2図はLSP周波数間隔△ωの統計的頻度分布
を示す。図から明らかなように、αパラメータに
減衰係数γが乗算されていない場合(減衰係数γ
=1.0が乗算されている場合で実線で示される)
には、△ωの小さい範囲(π/100〜4π/100
〔rad〕)に頻度が高い。また第3図には減衰係数
γとLSPパラメータの最小周波数間隔△ωMINとの
関係が示され、γ=1(減衰されていない)のと
きには、△ωMINは小さいことがわかる。一方、第
4図には、10次LSP分析して得られたLSPパラメ
ータω1とω2との間隔とパターンマツチング歪の
分布範囲との関係が示されている。ここでパタン
マツチング歪とは、パタンマツチングによつて選
択された標準パタンと入力パタンとの各特徴要素
間の累積距離を示す。
第4図から明らかなことは、LSP周波数間隔が
小さい程、パターンマツチング歪が大きくなるこ
とである。従つて第2図のγ=1.0で示す場合の
ようにLPC係数であるαパラメータ値から直接
にLSPパラメータを求めると、LSP周波数間隔は
小さい値となる傾向が高く、その結果、パターン
マツチング歪が拡大されてパターンマツチング精
度が劣化し再生音質を劣化を生起する。
一方、第2図から、αパラメータに減衰係数γ
=0.9又はγ=0.8を乗算した後にLSPパラメータ
を求めると、LSP周波数間隔△ωは高い値に移行
し、高い値の△ωが得られることになる。このこ
とは、第3図に示す減衰係数γと△ωMINとの関係
からも明確な傾向として理解できる。つまり、α
パラメータに減衰係数を乗算することによつて
LSP周波数間隔△ωが拡大され、その結果、パタ
ーンマツチング歪が低減されてパターンマツチン
グ精度が向上し、再生音質が向上する。
以上で音声信号のスペクトル情報の符号化、伝
送が為されるが、残差情報は残差情報発生回路8
にてA/D変換器1からの入力音声を基にして各
種方式で得られ、符号化されてマルチプレクサ9
に供給される。
一方、合成側(受信側)では、こうして多重化
伝送された音声信号のスペクトル情報(標準パタ
ーンのラベル)と残差情報とをデマルチプレクサ
10で分離し、残差情報はLPC合成フイルタ1
2に励振信号として供給される。またスペクトル
情報を示す標準パターンのラベルはαパラメータ
復号器11に供給される。
αパラメータ復号化器11は第1図Aに示す分
析側とは逆の操作により標準パタンラベル(番
号)からαパラメータα1〜α10を分析フレームご
とに復号化しLPC合成フイルタ12に送出する。
LPC合成フイルタ12は、このようにして入
力されたαパラメータ群をフイルタ係数とし、残
差信号を駆動音源とするデジタルフイルタであ
り、量子化された入力音声信号を再生しD/Aコ
ンバータ13に送出する。
D/Aコンバータ13は量子化された入力音声
信号をアナログ化しLPF(Low Pass Filter)等
を介してもとの入力音声信号に復元する。
次に分析側における残差信号発生回路について
説明する。第5図はその例で最も簡単な例であ
る。αパラメータ復号器81は、標準パタンメモ
リ7と同様な標準パターンテーブルを備え、第1
図Aに示すパターンマツチング器6で得られた標
準パターンラベル(番号)を受け、当該ラベルに
対応するαパラメータα1〜α10を読み出してLPC
逆フイルタ82に供給する。LPC逆フイルタ8
2は、第1図Bに示すLPC合成フイルタ12と
は逆の周波数応答特性を有し、A/Dコンバータ
1からの入力音声信号と、前記αパラメータα1
α10とを受け、入力音声信号からスペクトル情報
を除去した残差情報を除去した残差情報を得た
後、符号化してマルチプレクサ9に送出する。
第6図Aは残差信号発生回路の他の例を示し、
前述したマルチパルスを残差情報として用いるこ
とによつて音声の大幅な向上とデータビツトレー
トの低減を計つている。このマルチパルス分析は
最適な駆動音源信号系列としての残差波形符号化
の1手法であり、残差波形を複数個のインパルス
系列いわゆるマルチパルスで表現し、このマルチ
パルス駆動音源モデルを利用して得られる合成波
形と原入力音声信号とが最近似するようなインパ
ルス系列を探索し符号化するもので、低伝送ビツ
トレートを可能とする。
マルチパルス分析器83はD/Aコンバータ1
の出力する量子化入力音声信号とαパラメータ復
号化器81から供給を受けるαパラメータを受
け、分析フレームごとにマルチパルス分析を実施
し最適マルチパルス系列を決定し、符号化してマ
ルチプレクサ9に供給する。
一方、合成側は第6図Bに示す如く、デマルチ
プレクサ10で分離されたマルチパルス情報が音
源再生器14に入力され、そこで分析フレーム毎
の最適な音源パルス系列としてのマルチパルスを
再生してLPC合成フイルタ12に送出する。
第7図Aには第6図Aにおけるマルチパルス分
析と符号化の高能率化を計るためにピツチ予測手
段を付加した例が示されている。
ピツチ分析器84はA/Dコンバータ1の出力
する量子化された入力音声信号を受けると、自己
相関処理等によつてピツチ分析を実施しピツチ周
期およびひとつ先の予測ピツチに関する情報とし
てのピツチゲイン等の分析情報を分析フレームご
とに抽出し、これらの分析情報をピツチ予測係数
としてマルチパルス分析器83およびマルチプレ
クサ9に送出する。マルチパルス分析器83はピ
ツチ予測器を内蔵してピツチ予測を実施し、この
ピツチ予測によつて伝送不要となるパルス群を除
去したマルチパルス系列に関する情報、すなわち
パルス位置、正規化振幅、最大振幅、パルス数に
関する符号化データをマルチプレクサ9に出力す
る。
このような予測情報を介してもピツチ周期の分
析処理が可能である理由は、一般的に言つてたか
だか10mSECといつた短時間の分析フレームでは
ピツチ周期の急激な変化はなくさらに音声信号の
内容にもよるが複数の分析フレームにわたつても
ほぼ一様なピツチ周期で継続することもしばしば
あり、音声区間のかなりの範囲のピツチ予測が可
能となることに起因する。
一方、第7図Bに示す合成側ではデマルチプレ
クサ10によつて多重化分離されたピツチ予測係
数と波形情報に関するデータは音源再生器15に
供給される。音源再生器15はピツチ予測器を備
え、これら入力を利用して分析側で除去したパル
ス群を含む音源パルスとしてのマルチパルス系列
を再生し、これをLPC合成フイルタ12に供給
する。他の構成は第1図Bと同じである。
第8図Aには、第7図Aの改良例が示されてお
り、伝送ビツトレートの更に大幅な低減を可能と
する例が示されている。
デシメーシヨン器16はA/Dコンバータ1に
よつて8KHzのサンプリング周波数でサンプリン
グされた入力音声信号の量子化データをいつたん
24KHzで再サンプルを実施したのち、その1/4ご
とのサンプルを利用することによつて8KHzサン
プリングを6KHzサンプリングに変換して必要と
するデータビツトレートの低減を図る、いわゆる
デシメート(Decimate)サンプリングを実施す
る。このようなサンプリングレートのデシメート
実施にあたつては、デシメートによつて伝送デー
タの特性が失なわれない配慮が必要である。通常
の音声波形の伝送あるいはボコーダ等では音声信
号を3.2〜3.4KHz程度の高域遮断周波数のLPFで
低減フイルタリングして利用しており、この通過
周波数帯域それ自体は原音声信号の自然性を保存
するのに十分であることは立証されている。本実
施例にあつては入力音声の低周波フイルタリング
の遮断周波数は3.5KHzとしており、かつこの遮
断周波数近傍におけるLPFの減衰特性の影響を
受けて除去しても差支えないデータ分も考慮する
と、6KHzのデシメートサンプリングによる音質
の劣化は殆んど問題とはならず、伝送データビツ
トレートの大幅な改善効果が得られる。
このことは音声信号の低周波フイルタリングの
遮断周波数が3.4KHzであつても基本的には殆ん
ど変らない。なお上述したアツプサンプリング周
波数24KHzはA/Dコンバータ1におけるサンプ
リング周波数8KHzと、デシメートせんとするサ
ンプリング周波数6KHzとの最小公倍数を選択し
て設定したものである。
第8図Aに示す分析側はこのようなサンプリン
グ周波数デシメーシヨン以外は第7図Aの場合と
ほぼ同様に分析処理を実施したうえマルチプレク
サ9を介して合成側に送出される。
第8図Bの合成側では、LPC合成フイルタ1
2までは第7図Bに示す合成側とほぼ同じ動作で
6KHzのデシメートサンプリング周波数による量
子化入力音声信号を再生したあと、これをインタ
ポレーシヨン器17に供給する。
インタポレーシヨン器17は6KHzのサンプリ
ング周波数によるデータ間を24KHzのサンプリン
グ周波数によるサンプル値にインタポレーシヨン
(補間)したうえ、さらにその1/3ずつの値をとる
ようにデシメートサンプリングして8KHzのサン
プル値として8KHz回線として出力する。
かくして第7図A,Bに示す実施例よりもさら
にデータビツトレートを低減した音声波形の符号
化復号化が可能となり、この実施例においては
4.8kb/sの音声CODECとしての波形符号化が容
易に実施できる。以上の実施例は第4図AとBに
示す実施例に基本的に適用できることは明らかで
ある。
以上説明した如く本発明によれば、減衰係数を
乗じて、スペクトル感度の過度の敏感さを抑圧す
るように最小の周波数間隔を拡大したLSPパラメ
ータを利用したパターンマツチングによる標準パ
タンのラベル伝送と、ピツチ予測を含むマルチパ
ルスを利用した残差情報伝送ならびに量子化入力
音声のデシメーシヨン処理の併用によつて、パタ
ーンマツチング歪を著しく抑圧し、かつデータレ
ートを著しく削減しうる音声符号化/復号化装置
が実現できるという効果がある。
【図面の簡単な説明】
第1図AとBは本発明の一実施例の基本的構成
を示すブロツク図であり、それぞれ分析側(伝送
側)と合成側(受信側)のブロツク図、第2図は
LSPパラメータの周波数間隔△ωの統計的頻度分
布を示す図、第3図は周波数間隔△ωとパターン
マツチング歪との関係を示す図、第4図は本発明
で用いるLPC係数に乗算されるべき減衰係数と
周波数間隔△ωとの関係図、第5図は第1図Aに
おける残差波形発生回路の一例を示す図で、
LPC逆フイルタを用いた例を示す図、第6図A
とBは残差波形発生回路の他の例を示し、マルチ
パルス分析に基づく分析側ブロツク図と合成側ブ
ロツク図、第7図AとBは第6図AとBに示す残
差波形発生回路の改良例を示す分析側と合成側の
ブロツク図、第8図AとBは第6図Aと第7図A
に示すマルチパルス分析に基づく残差波形発生回
路の改良例を示し、デシメートサンプリングを採
用した分析側と合成側のブロツク図である。 1……A/Dコンバータ、2……LPC分析器、
3……減衰係数乗算器、4……減衰係数テーブル
メモリ、5……LSP分析器、6……パターンマツ
チング器、7……標準パターンメモリ、8……残
差情報発生回路、9……マルチプレクサ、10…
…デマルチプレクサ、11……αパラメータ復号
器、12……LPC合成フイルタ、13……D/
Aコンバータ、14……音源再生器、15……音
源再生器、16……デシメーシヨン器、17……
インタポレーシヨン器、81……αパラメータ復
号器、82……LPC逆フイルタ、83……マル
チパルス分析器、84……ピツチ分析器。

Claims (1)

  1. 【特許請求の範囲】 1 入力音声信号から線形予測係数(LPC)パ
    ラメータを求めるLPC分析手段と;前記LPCパ
    ラメータから抽出する線スペクトル対(LSP)パ
    ラメータのスペクトル感度の過度の敏感さを抑圧
    するように前記LPCパラメータを所定量減衰せ
    しめるLPCパラメータ減衰手段と;前記減衰さ
    れたLPCパラメータから線スペクトル対(LSP)
    パラメータを求め各入力音声パターン毎の入力パ
    ターンとして出力するLSP分析手段と;予め定め
    た各種音声信号をLSP分析して得られたLSPパラ
    メータから成る標準パターンを各標準パターンに
    ラベルを付して記憶する標準パターンメモリと;
    前記標準パターメモリに記憶されている標準パタ
    ーンの中から前記入力パターンに最も類似するパ
    ターンを選択し、選択された標準パターンのラベ
    ルを符号化して出力するパターンマツチング手段
    と;前記入力音声信号の残差信号を発生して符号
    化する残差信号発生手段とを備えた符号化装置
    と;前記符号化装置から伝送路を介して提供され
    る前記ラベルと前記残差信号にもとづいて前記入
    力音声信号を再生する復号化装置とを備えて成る
    ことを特徴とする音声信号符号化/復号化装置。 2 特許請求の範囲第1項において、前記復号化
    装置は、前記ラベルを受け、このラベルの標準パ
    ターンに対応するLPCパラメータを復号し出力
    するLPCパラメータ復号化手段と;前記残差信
    号と前記復号されたLPCパラメータとに基づい
    て前記入力音声信号を合成する合成フイルタと;
    この合成フイルタの出力をD/A変換するD/A
    変換器とを含むことを特徴とする音声信号符号
    化/復号化装置。 3 特許請求の範囲第1項において、前記残差信
    号発生手段は、前記パターンマツチング手段から
    のラベルを受け、このラベルの標準パターンに対
    応するLPCパラメータを発生するLPC復号手段
    と;前記LPC復号手段からのLPCパラメータと
    前記入力音声信号とを受け、残差信号を発生する
    手段とを含むことを特徴とする音声信号符号化/
    復号化装置。 4 特許請求の範囲第1項において、前記残差信
    号発生手段は、前記パターンマツチング手段から
    のラベルを受け、このラベルが付された標準パタ
    ーンに対応するLPCパラメータを発生するLPC
    復号手段と;前記入力音声信号と前記LPC復号
    手段からのLPCパラメータとを受け、複数のパ
    ルスの位置と振幅情報から成るマルチパルス信号
    とを発生し、符号化するマルチパルス分析手段と
    を含むことを特徴とする音声信号符号化/復号化
    装置。 5 特許請求の範囲第4項において、前記復号化
    装置は、前記ラベルを受け、このラベルが付され
    た標準パターンに対応するLPCラパメータを発
    生するLPC復号手段と;前記符号化されたマル
    チパルス信号を復号して音源信号として出力する
    音源再生手段と、前記復号手段からのLPCパラ
    メータと、前記音源再生手段からの音源信号とに
    基づいて音声信号を合成する合成フイルタと;こ
    の合成フイルタの出力をアナログ信号に変換する
    D/A変換器とを含むことを特徴とする音声信号
    符号化/復号化装置。 6 特許請求の範囲第1項において、前記残差信
    号発生手段は、前記パターンマツチング手段から
    のラベルを受け、このラベルが付された標準パタ
    ーンに対応するLPCパラメータを発生するLPC
    復号手段と;前記入力音声信号のピツチ周期を分
    析し、時間的に先向するピツチ周期を予測し、ピ
    ツチ予測係数を出力する手段と;前記入力音声信
    号と、前記LPC復号手段からLPCパラメータお
    よび前記ピツチ予測係数とを受け、前記ピツチ予
    測により不要になるパルスを除去した複数のパル
    スの位置および振幅情報から成るマルチパルス信
    号を出力するマルチパルス分析手段とを含むこと
    を特徴とする音声信号符号化/復号化装置。 7 特許請求の範囲第6項において、前記復号化
    装置は、前記ラベルを受け、このラベルが付され
    た標準パターンに対応するLPCパラメータを発
    生するLPC復号手段と、前記マルチパルス信号
    および前記ピツチ予測係数を受け、前記マツチパ
    ルス分析手段で除去されたパルスをも含む複数の
    パルスの位置および振幅情報信号を出力する音源
    再生手段と;前記LPC復号手段からのLPCパラ
    メータと、前記音源再生手段からの音源信号とに
    基づいて音声信号を合成する合成フイルタと;こ
    の合成フイルタの出力をアナログ信号に変換する
    D/A変換器とを含むことを特徴とする音声信号
    符号化/復号化装置。 8 特許請求の範囲第1項において、前記LPC
    分析手段は、入力音声信号をデイジタル信号に変
    換するA/D変換器と;前記A/D変換器の出力
    を、前記A/D変換のサンプリング周波数よりも
    高い周波数でサンプリングして得られるサンプリ
    ング信号から所定間隔のサンプリング信号を抽出
    するデシメーシヨン手段とを含むことを特徴とす
    る音声信号符号化/復号化装置。 9 特許請求の範囲第8項において、前記復号化
    装置は、前記ラベルを受け、このラベルの標準パ
    ターンに対応するLPCパラメータを出力する復
    号化手段と;前記残差信号と前記復号化手段から
    のLPCパラメータとに基づいて音声信号を合成
    する合成フイルタと;前記合成フイルタの出力を
    前記所定間隔で抽出されたサンプリング信号間
    を、より高い周波数のサンプリング値に補間した
    後、前記A/D変換器のサンプリング周波数に一
    致したサンプリング信号を出力するインターポレ
    ーシヨン手段と;前記インターポレーシヨン手段
    からの出力をアナログ信号に変換するD/A変換
    器とを含むことを特徴とする音声信号符号化/復
    号化装置。
JP59096036A 1984-05-14 1984-05-14 音声信号符号化/復号化装置 Granted JPS60239798A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP59096036A JPS60239798A (ja) 1984-05-14 1984-05-14 音声信号符号化/復号化装置
CA000481382A CA1226947A (en) 1984-05-14 1985-05-13 Speech signal coding and/or decoding system
US07/421,313 US4975955A (en) 1984-05-14 1989-10-13 Pattern matching vocoder using LSP parameters

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59096036A JPS60239798A (ja) 1984-05-14 1984-05-14 音声信号符号化/復号化装置

Publications (2)

Publication Number Publication Date
JPS60239798A JPS60239798A (ja) 1985-11-28
JPH0439679B2 true JPH0439679B2 (ja) 1992-06-30

Family

ID=14154239

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59096036A Granted JPS60239798A (ja) 1984-05-14 1984-05-14 音声信号符号化/復号化装置

Country Status (3)

Country Link
US (1) US4975955A (ja)
JP (1) JPS60239798A (ja)
CA (1) CA1226947A (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0634197B2 (ja) * 1985-12-04 1994-05-02 日本電気株式会社 音声符号化方法とその装置
EP0755047B1 (en) * 1990-11-02 2002-04-10 Nec Corporation Speech parameter encoding method capable of transmitting a spectrum parameter at a reduced number of bits
SE467806B (sv) * 1991-01-14 1992-09-14 Ericsson Telefon Ab L M Metod att kvantisera linjespektralfrekvenser (lsf) vid beraekning av parametrar foer ett analysfilter ingaaende i en talkodare
US5450522A (en) * 1991-08-19 1995-09-12 U S West Advanced Technologies, Inc. Auditory model for parametrization of speech
CA2084323C (en) * 1991-12-03 1996-12-03 Tetsu Taguchi Speech signal encoding system capable of transmitting a speech signal at a low bit rate
CA2105269C (en) * 1992-10-09 1998-08-25 Yair Shoham Time-frequency interpolation with application to low rate speech coding
JP2947012B2 (ja) * 1993-07-07 1999-09-13 日本電気株式会社 音声符号化装置並びにその分析器及び合成器
US6044343A (en) * 1997-06-27 2000-03-28 Advanced Micro Devices, Inc. Adaptive speech recognition with selective input data to a speech classifier
US6032116A (en) * 1997-06-27 2000-02-29 Advanced Micro Devices, Inc. Distance measure in a speech recognition system for speech recognition using frequency shifting factors to compensate for input signal frequency shifts
US6070136A (en) * 1997-10-27 2000-05-30 Advanced Micro Devices, Inc. Matrix quantization with vector quantization error compensation for robust speech recognition
US6067515A (en) * 1997-10-27 2000-05-23 Advanced Micro Devices, Inc. Split matrix quantization with split vector quantization error compensation and selective enhanced processing for robust speech recognition
US6240299B1 (en) * 1998-02-20 2001-05-29 Conexant Systems, Inc. Cellular radiotelephone having answering machine/voice memo capability with parameter-based speech compression and decompression
US6347297B1 (en) 1998-10-05 2002-02-12 Legerity, Inc. Matrix quantization with vector quantization error compensation and neural network postprocessing for robust speech recognition
US6219642B1 (en) 1998-10-05 2001-04-17 Legerity, Inc. Quantization using frequency and mean compensated frequency input data for robust speech recognition
US6792405B2 (en) * 1999-12-10 2004-09-14 At&T Corp. Bitstream-based feature extraction method for a front-end speech recognizer
CN101604525B (zh) * 2008-12-31 2011-04-06 华为技术有限公司 基音增益获取方法、装置及编码器、解码器

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58198095A (ja) * 1982-05-14 1983-11-17 日本電気株式会社 線スペクトル型音声分析合成装置
JPS5912499A (ja) * 1982-07-12 1984-01-23 松下電器産業株式会社 音声符号化装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3624302A (en) * 1969-10-29 1971-11-30 Bell Telephone Labor Inc Speech analysis and synthesis by the use of the linear prediction of a speech wave
US4301329A (en) * 1978-01-09 1981-11-17 Nippon Electric Co., Ltd. Speech analysis and synthesis apparatus
US4220819A (en) * 1979-03-30 1980-09-02 Bell Telephone Laboratories, Incorporated Residual excited predictive speech coding system
US4270027A (en) * 1979-11-28 1981-05-26 International Telephone And Telegraph Corporation Telephone subscriber line unit with sigma-delta digital to analog converter
US4661915A (en) * 1981-08-03 1987-04-28 Texas Instruments Incorporated Allophone vocoder
US4472832A (en) * 1981-12-01 1984-09-18 At&T Bell Laboratories Digital speech coder
CA1203906A (en) * 1982-10-21 1986-04-29 Tetsu Taguchi Variable frame length vocoder
CA1197619A (en) * 1982-12-24 1985-12-03 Kazunori Ozawa Voice encoding systems
US4707858A (en) * 1983-05-02 1987-11-17 Motorola, Inc. Utilizing word-to-digital conversion
US4701954A (en) * 1984-03-16 1987-10-20 American Telephone And Telegraph Company, At&T Bell Laboratories Multipulse LPC speech processing arrangement

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58198095A (ja) * 1982-05-14 1983-11-17 日本電気株式会社 線スペクトル型音声分析合成装置
JPS5912499A (ja) * 1982-07-12 1984-01-23 松下電器産業株式会社 音声符号化装置

Also Published As

Publication number Publication date
US4975955A (en) 1990-12-04
JPS60239798A (ja) 1985-11-28
CA1226947A (en) 1987-09-15

Similar Documents

Publication Publication Date Title
US4821324A (en) Low bit-rate pattern encoding and decoding capable of reducing an information transmission rate
KR100615480B1 (ko) 음성 대역 확장 장치 및 음성 대역 확장 방법
EP0477960B1 (en) Linear prediction speech coding with high-frequency preemphasis
USRE43099E1 (en) Speech coder methods and systems
JP4302978B2 (ja) 音声コーデックにおける擬似高帯域信号の推定システム
JPH0439679B2 (ja)
JPS5936275B2 (ja) 残留励起予測音声符号化方式
KR0155315B1 (ko) Lsp를 이용한 celp보코더의 피치 검색방법
JPH0782360B2 (ja) 音声分析合成方法
JP3916934B2 (ja) 音響パラメータ符号化、復号化方法、装置及びプログラム、音響信号符号化、復号化方法、装置及びプログラム、音響信号送信装置、音響信号受信装置
JPH05265495A (ja) 音声符号化装置並びにその分析器及び合成器
JP3552201B2 (ja) 音声符号化方法および装置
JP3192999B2 (ja) 音声符号化方法および音声符号化方法
JPH0235994B2 (ja)
JP2629762B2 (ja) ピッチ抽出装置
JPS61252600A (ja) Lsp型パタンマツチングボコ−ダ
JPH0449960B2 (ja)
JPH0736484A (ja) 音響信号符号化装置
JPH043878B2 (ja)
JPS6087400A (ja) マルチパルス型音声符号復号化装置
JPH077275B2 (ja) 音声信号符号化方式とその装置
JPH10105200A (ja) 音声符号化/復号化方法
JPS61272800A (ja) バ−スト音声通信装置
JPS58211797A (ja) 帯域分割型ボコ−ダ
JPH0738115B2 (ja) 音声分析合成装置