JPS60239798A - 音声信号符号化/復号化装置 - Google Patents

音声信号符号化/復号化装置

Info

Publication number
JPS60239798A
JPS60239798A JP59096036A JP9603684A JPS60239798A JP S60239798 A JPS60239798 A JP S60239798A JP 59096036 A JP59096036 A JP 59096036A JP 9603684 A JP9603684 A JP 9603684A JP S60239798 A JPS60239798 A JP S60239798A
Authority
JP
Japan
Prior art keywords
waveform
analysis
encoding
audio signal
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP59096036A
Other languages
English (en)
Other versions
JPH0439679B2 (ja
Inventor
哲 田口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP59096036A priority Critical patent/JPS60239798A/ja
Priority to CA000481382A priority patent/CA1226947A/en
Publication of JPS60239798A publication Critical patent/JPS60239798A/ja
Priority to US07/421,313 priority patent/US4975955A/en
Publication of JPH0439679B2 publication Critical patent/JPH0439679B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0018Speech coding using phonetic or linguistical decoding of the source; Reconstruction using text-to-speech synthesis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔技術分野〕 本発明は音声波形符号化復号化装置に関し、特にボコー
ダ(Vocoder ) のデータビットレート領域に
おいて、音声信号のサイドインフォメーションに対して
はLSPバタンマツチングを実施し、音声信号に含まれ
る波形情報としての残差波形情報とともに分析側から合
成側に送出し再び音声信号を再生するという手段によっ
て伝送データビットレートの大幅な低減を図って音声波
形の符号化および復号化を実施しうる音声COD E 
C(COderDECorder) としての音声波形
符号化復号化装置に関する。
〔従来技術〕
音声信号の波形符号化を実施して伝送路を介して分析側
から合成側圧送出し、いわゆる波形伝送の形式で音声信
号を伝送したうえ合成側ではこれを復号化してもとの音
声信号を再生する音声C0DECは、再生される音声品
質がボコーダに比してかなり優れたものが得られるため
近時多用されつつある。このような波形符号化を前提と
する音声符号化技術は、ボコーダの如く音声信号の生成
モデル化による分析、合成技術に比して音声波形自体を
符号化しそ送出するため本質的に再生音声品質が優れた
ものが得られるもの9、音声信号の符号化速度すなわち
データビットレートもボコーダの場合に比して著しく増
大するという欠点がある。
波形符号化伝送は、音声波形の巨視的特徴としてのスペ
クトル包絡やピッチ情報等のいわゆるサイドインフォメ
ーション(,5ide information)とし
て知られる特徴データと、音源情報に関する特徴データ
であシ波形情報でもある残差波形とを分析側から合成側
に伝送し、合成側ではこれらデータを利用してふたたび
原音声波形の再生をはか名のが通常の一般的な手法であ
り、ボコーダが残差波形のモデル化データを伝送するの
に比して本質的に忠実性の高い原音声信号の弗生が図れ
るが。
反面音声信号の符号化データビットレートもボコーダが
たかだか4.8 k b/s (キロビット/秒)程度
であるのに比し、マルチパルス型の如くデータビットレ
ートの効率化を図ったものでも9.6kb/s程度を必
要とし、さらに通常一般の波形伝送の場合Kti 16
 kb/s〜32 kb/s といったようにデータビ
ットレートの増大を見込まなければならないという欠点
がある。
〔発明の目的〕
本発明の目的は上述した欠点を除去し、LPC分析によ
って得たLPG係数をそのまま利用することなくこれに
予め設定した減衰係数を乗じたものとしたうえ、さらK
このLPG係数にもとづいて実施するL 8 P 、<
タンマツチングによって効率的に抽出したサイドインフ
ォメーションを残差波形情報とともに分析側から合成側
に送出するという音声波形符号化手段を備えることによ
ってデータビットレートを大幅に低減し、ボコーダのデ
ータビットレート領域でも音声信号波形の符号化が図れ
る音声波形符号化復号化装置を提供することにある。
〔発明の構成〕
本発明の装置は、音声信号波形を符号化する分析側と伝
送路を介して送出された符号化音声信号波形の復号化を
行なう合成側とを備えて音声信号の伝送を図る音声波形
符号化復号化装置において、音声信号波形ノL P C
(Linear PredictionCoeffic
ient、線形予測係数)分析を行なって得られるLP
G係数に予め設定する減衰係数の乗算を施したうえさら
K L 8 P (Line 8pectrumPai
rs、線スペクトル周波数対)分析によるバタンマツチ
ングを実施して得られる音声信号波形のサイドインフォ
メーションとしてのスペクトル分布情報等の符号化と音
声信号波形の音源情報としての残差波形データの符号化
とを分析側で実施し符号化音声波形データとして送出す
る音声波形符号化手段と、前記符号化音声波形データを
合成側で復号化したうえ音声信号波形を再生する音声波
形復号化手段とを備えて構成される。
〔実施例〕
次に図面を参照して本発明の詳細な説明する。
第1回内は本発明の第1の実施例における分析側(符号
化側)の構成を示すブロック図、第1図(均は本発明の
第1の実施例における合成側(復号化側)の構成を示す
ブロック図、第2回内は本発明の第2の実施例における
分析側の構成を示すブロック図、第2回申】は本発明の
第2の実施例における合成側の構成を示すブロック図、
第31四は本発明の第3の実施例における分析側の構成
を示すブロック図、第3図(均は本発明の第3の実施例
における合成側の構成を示すブロック図、第4図面は本
発明の第4の実施例における分析側の構成を示すブロッ
ク図、第4図(Blは本発明の第4の実施例における合
成側の構成を示すブロック図である。
以下に第1図乃至第4図を参照しつつ本発明を説明する
第1図(A)K示す第1の実施例の分析側は、〜勺コン
バータl、LPG分析品2.減衰係数乗算器3、減衰係
数テーブルメモ!74.LSP分析器5゜バタンマツチ
ング器6.標準バタンメモリ7、α復号化器3.LPC
逆フィルタ9およびマルチプレクサ10を備えて構成さ
れ、また第1図(B)K示す第1の実施例における合成
側は、デマルチプレクサト1.α復号化器12.LPC
合成フィルタ13、D/Aコンバータ14等を備えて構
成される。
入力音声信号101はA/Dコンバータ1によってまず
低域フィルタリングされたのち所定のサンプリング周波
数8 K f(zでデジタル化される。
低域フィルタリングは本実施例の場合3.2KHz以上
の高域、を遮断するものであり、これをBKHzのサン
プリング周波数でサンプリングしつつ所定のビット数の
量子化データとしてLPG分析器2に供給する。
LPC分析器2は、こうして供給された量子化データを
所定サンプル分ずついったんバッファメモリにストアし
たのち、これを読出して所定の基本フレーム周期ごとに
予め設定する窓関数との乗算を実施して極度に鋭いスペ
クトルピークの平滑化を図ったのち、線形予測分析を行
ない基本フレームごとKn次の線形予測係数、本実施例
では1゜次のαパラメータを抽出する。このようにして
行なわれる線形予測分析は入力音声信号101を形成す
る特徴パラメータとしてのスペクトル分布情報と前置情
報のうち、スペクトル分布情報としてのスペクトル包絡
を全極型フィルタモデルで近似せしめてめるものであり
、またスペクトル包絡はピッチ情報とともに入力音声信
号の巨視的構造特徴を示す、いわゆるサイドインフォメ
ーションとしてもよく知られている。一般的な波形伝送
手段においては入力音声信号はこのようなサイドイン7
オメーシ冒ンと、入力音声信号の微細構造を示す音源波
形情報、いわゆる残差波形情報とに分解したうえ、符号
化したサイドインフォメーションを符号化残差波形情報
とともに多重化して波形符号化データとして分析側から
合成側に波形伝送し1合成側ではこの波形符号化データ
の復号化を実施して原音声信号を再生するのが波形符号
化および復号化の基本的手段となっているが、このよう
な手段では分析側から合成側に伝送すべきデータのビッ
トレートがボコーダに比して著しく増大してしまうこと
は前述したとおりであり、本実施例では次のようにして
データビットレートの低減を図りボコーダのピットレー
ト領域での波形伝送を可能ならしめている。
すなわち、LPC分析器2から出力された10次のαパ
ラメータは減衰係数乗算器3において予め定めた減衰係
数を乗算することによってデータビットレートの低減を
図るとともに後述するようにLAP間隔感度の問題が発
生しないように音声信号スペクトル感度の尖鋭度をダウ
ンさせたものとする。波形伝送によりて音声信号を伝送
する場合にはボコーダにおける場合はどサイドインフォ
メーションの完全さは必要とせず、従って線形予測によ
って得られる10次のαパラメータα1゜α2.α3・
・・・・・α10は実用上再生音声の品質に殆んど影響
を与えない範囲での減衰を図ってもよい。
減衰係数テーブルメモリ4は音声資料に関する各種の計
測、実験等にもとづいて予め設定した減衰係数テーブル
をαパラメータα1〜α10のそれぞれについてストア
しておくものであり、これらα1〜α10それぞれの減
衰係数が読出されてα1〜α10との乗算が実行され、
パラメータ減衰を受けたのちLSP分析器5に供給され
る。
LAP分析器5はこのようにして入力した減衰αパラメ
ータ群を利用して10次のLSP群を分析、抽出しこれ
をバタンマツチング器6に供給する。バタンマツチング
器6は次のようにして標準バタンメモリ7の標準バタン
とのマツチング処理を行ないマツチングが全般的に優れ
ている標線バタンを選択するが、この場合、αパラメー
タには減衰係数が乗算されており、LSPの周波数間隔
がちまり狭すぎてスペクトルの変化が滑らかでなくなる
、いわゆるスペクトル感度の過剰敏感さを抑止するだめ
の等測的スペクトルQダンプも実効的に行なわれること
となる。LAP分析およびバタンマツチングを詳述すれ
ば次のとおシである。
LSP分析器5は、入力した減衰係数乗算後のLPC係
数を利用してLSP係数をめる。このLAP係数はαパ
ラメータやにパラメータ(偏自己相関係数)とともに声
道の共振特性を表わすパラメータとしてしばしば利用さ
れるものであり、声門を仮想的に完全開放および完全閉
塞した場合の声道伝達関数の線スペクトル周波数ペアに
よるパラメータであることはよく知られている。
LSP分析器5は、減衰係数乗算器3から入力する減衰
処理後の線形予測係数αパラメータをよく知られたNe
wtonの反復法を利用する高次方程式法によって10
次のL8P係数に変換する。こうして得られるLSP係
数は、前述した如く声道フィルタの伝達関数を周波数領
域で表現する線スペクトルω1.ω2・・・・・・ω1
0であり、このL8P変半に先立って実施されるLPC
係数の減衰係数乗算処理によってLAP係数の最小周波
数間隔が拡大されて後述するバタンマツチング処理が容
易となり、また合成側に卦ける音声合成用の全権型デジ
タルフィルタの動作安定性も高めている。
なお、本実施例ではN ew t o nの反覆法を利
用する高次方程式を利用してL8P周波数をめているが
、この方法とともによく知られている零点探索法を利用
して実施しても一向に差支えない。
こうして得られたLS?係数は、標準バタンメモリ7に
ストアされている標準バタンとバタンマツチング器6で
照合し、分析したLAP係数と最も空間ベクトル距離が
近い標準バタンを選択する。
このマツチングはマツチング特性が全般的にすぐれてい
るもの、すなわち全周波数範囲にわたって空間ベクトル
距離、いわゆるスペクトル距離が接近しているものを標
準バタンから選択する。
N次のLAP係数のそれぞれはN次のパラメータ空間に
おけるひとつの空間ベクトルを表わすものと考えること
ができ、従ってLAP係数による周波数間の空間ベクト
ルを表わすスペクトル距離は二つのLSP係数の近似度
を表わすマツチング尺度として利用されることはよく知
られている。
上述した標市バタンは予め音声資料をLSP分析して得
られる標準的LSP係数の分布バタンであり、予め設定
する種類、本実施例では212種類を用意し、またスペ
クトル距離は次の(1)式に示すDijによって基本的
に示される。
(1)式においてie JはそれぞれL8P分析におけ
る処理単位区間としてのフレーム番号、81 (ω)。
8j(ω)ハフレームtt Jの対数スペクトルである
(1)式は通常次の(2)式の近似式に変換利用される
(2)式においてpK(i)、 pK(j)はフレーム
iおよびjKおけるN次のLAP係数、WKはN次のL
8Pスペクトル感度である。上述したNは全極型のLP
Gデジタルフィルタの次数、本実施例にあっては10と
対応し、そのL8P周波数対ω1.ω2゜・・・・・・
ω1oを示す。さらにN次のスペクトル感度WKは8次
1本実施例の場合は10次のL8P係数の微少変化によ
って発生するスペクトル変化の程度を示す。
このようにして設定された分析フレームごとのLAP係
数に対応して選択されたLSP標準パタン番号は分析フ
レームごとのサイドインフォメーションとしてマルチプ
レクサ10に送出される。
LAPバタンマツチングによって決定されるサイドイン
フォメーションはたかだか数100ビット程度のビット
レートで送出が可能であり、かくしてボコーダにおける
サイドインフォメーション送出に比して大幅に所要ビッ
トレートの低減が図れる。
さて、サイドインフォメーションとともに分析側から送
出される残差波形は入力音声信号の微細構造を示すもの
であり、次のようにして形成される。
LPG逆フィルタ9は、第1図(均に示す如き通常のL
PG合成フィルタ13とは逆特性の周波数応答を有する
ものとして構成され、入力ライン901を介してA/D
コンバータ1の出力すなわち量子化された入力音声信号
を受け、また入力ライン902を介してはα復号化器8
からαパラメータαl−α10を受ける。α復号化器8
は標準バタン番号のそれぞれに対応する標準バタンテー
ブルを備えバタンマツチング器6から分析フレームごと
の標準バタン番号データを受けるとこれに対応するαパ
ラメータ、αl−α10を読出してLPG逆フィルタ9
に供給する。
LPG逆フィルタ9は入力ライン901,902を介し
てこれら入力を供給されると入力音声信号からサイドイ
ンフォメーションとしてのスペクトル包絡を除去した残
差波形分のみを量子化して出力し出力ライン903を介
してこれをマルチプレクサ10に送出する。
マルチプレクサ10はこうして入力した標準バタン番号
データおよび残差波形データな所定の形式で多重化した
うえ波形伝送データとして伝送路1001を介して第1
図(B)に示す合成側に伝送される。
第1図(均の合成側はデマルチプレクサ11. α復号
止器12.LPC合成フィルタ13および店値コンバー
14等を備えて構成される。
デマルチプレクサ11は、分析側から多重化伝送された
波形伝送データの多重化分離処理を行ないもとの符号化
データに復元する。このうち残差波形データは出力ライ
ス1101を介してLPG合成フィルタ13に%また標
準バタン番号データは出力ライン1102を介してα復
号止器12に供給される。
α復号止器12は第1回内に示す分析側と同様にして標
準バタン番号データからαパラメータαl〜αioを分
析フレームごとに復号化しこれらを出力ライン1201
を介してLPG合成フィルタ13に送出する。
LPG合成フィルタ13は、このようにして入力されα
パラメータ群をフィルタ係数とし、残差波形を駆動音源
としてデジタルフィルタを動作し量子化入力音声信号を
再生しこれを出力ライン1301を介してD/Aコンバ
ータ14に送出する。
D/Aコンバータ14は量子化入力音声信号をアナログ
化しL P G (LOW Pa5s Filter)
等を介してもとの入力音声信号に復元し出力ライン14
01に送出、かくしてサイドインフォメーションに対し
てはLAPを利用したバタンマツチングを実施して残差
波形データとともに符号化して分析側から合成側に低ビ
ットレートで送出しうる符号化復号化処理が可能となる
第2図(3)および(5)は本発明の第2の実施例の音
声波形符号化復号化装置の分析側(5)および合成側(
均の構成を示すブロック図であり、第2回置のマルチパ
ルス分析器15ならびに第2図CB)の音源再生器16
を除き他の同一記号のものはいずれもそれぞれ第1図(
A)および(均記載のものと同一であり。
これらに関する詳細な説明は省略する。
第2図(N、(均によって示す第2の実施例は第1図(
5)、(均による第1の実施例における波形情報の符号
化、すなわち残差波形の抽出ならびに符号化がLPG逆
フィルタを利用して実施しているのに代えてマルチパル
ス分析にもとづいて実施し、さらに所要データビットレ
ートの低減を図るものである。
マルチパルス分析にもとづいて、入力音声信号に含まれ
る波形情報としての残差波形を抽出、符号化し波形伝送
する手法はデータビットレートを減少しうる等の理由で
近時マルチパルスボコーダ等の分野に多用されつつある
このマルチパルス分析は最適な駆動音源信号系列として
の残差波形符号化の1手法であり、残差波形を複数個の
インパルス系列いわゆるマルチ・くルスで表現し、この
マルチパルス駆動音源モデルを利用して得られる合成波
形と原入力音声信号とが最近似するようなインパルス系
列を探索し符号化するもので低い伝送ビットレート領域
でも有効な手段とされている。
入力音声信号の駆動音源信号系列を複数個のインパルス
系列で表現したうえ最適のインパルス系列を探索しこれ
を符号化して波形情報として送出する技術については、
B、8. Atal et al、 ”ANew Mo
del of LPCExcitation for 
Pro −ducing Natural Sound
ing 8peech at LowBit Rate
s、” ProC,ICA38P 8SL pp614
−617(1982)、 あるいは、「マルチパルス駆
動形音声符号化法の検討」、電気通信学会2通信方式研
究会、1983年3月23日、小澤、荒関他その他に詳
述されている。
第2図(2)のマルチパルス分析器15はD/Aコンバ
ータ1の出力する量子化入力音声信号とα復号化器8か
ら供給を受けるαパラメータを利用し分析フレームとと
にマルチパルス分析を実施し最適マルチパルス系列を決
定しつつこJtにもとづいて所定の波形情報を形成、符
号化したうえ出力ライン1501を介してマルチプレク
サ10に送出されバタンマツチング器6から出力される
符号化標準バタン番号データとともにマルチプレクサ1
0によって所定の形式で多重化した後伝送路1001を
介して第2図(B)に示す合成側に伝送される。
第2図(ト)において、デマルチプレクサ11は分析側
から供給を受けた多重化信号の多重化分離を行ない、波
形情報は出力ライン1101を介して音源再生器16に
、また標準バタン番号データは出力ライン1102を介
してα復号比容12に供給する。
音源再生器16は、波形情報として代表された音源情報
に基いて分析フレームごとの最適音源パルス系列として
のマルチパルスを再生し、これをLPC合成フィルタ1
3の駆動音源として出力する。LPC合成フィルタ13
はα復号比容12から供給されるαパラメータ、α1〜
α10をフィルタ係数とし量子化入力音声を再生し、か
くして第1図(勾、(均よりもさらに伝送データビット
レートの低減化を図った音声波形符号化復号化が実施で
きる。
第3図(Al、(B)はそれぞれ本発明による音声波形
符号化復号化装置の第3の実施例の分析11(A)、合
成側(均の構成を示すブロック図である。
第3図体)、@けマルチパルス分析器17.ピッチ分析
器18および音源再生器19がそれぞれ第2図(相、(
均に示す内容と異なっているが他の同一記号の構成品は
全く同一内容であるのでこれらに関する詳細な説明は省
略する。
第3図(〜、(B)によって示す第3の実施例は第2図
(A)、(B)Kおけるマルチパルス分析、ならびに符
号化の高能率処理化を目的とし次のようにしてピッチ予
測手段を付与するものである。
第3図(5)におけるピッチ分析器18はA/D =f
fンバータ1の出力する量子化入力音声信号を受けると
この入力に対する自己相関処理等を介してピッチ分析を
実施しピッチ周期およびひとつ先の予測ピッチに関する
情報としてのピッチゲイン等の分析情報を分析フレーム
ごとに抽出し、これらの分析情報をピッチ予測係数とし
て出力ライン1801を介してマルチパルス分析器17
およびマルチプレクサ10に送出する。マルチパルス分
析器17はピッチ予測器を内蔵してピッチ予測を実施し
、このピッチ予測によって伝送不要となる。パルス群を
除去したマルチパルス系列に関する情報、すなわちパル
ス位置、正規化振幅、最大振幅、パルス数に関するデー
タを波形情報として出力ライン1701に出力する。
このような予測情報送出手段を介してもピッチ周期の分
析処理が可能である理由は、一般的に言りてたかだか1
0m5ECといった短時間の分析フレームではピッチ周
期の急激な変化はなくさらに音声信号の内容にもよるが
複数の分析フレームにわたってもほぼ一様なピッチ周期
で継続することもしばしばあり、音声区間のかなりの範
囲のピッチ予測が可能となることに起因する。
マルチプレクv10は標準バタン番号データ、ピッチ予
測係数、波形情報の入力群を所定の形式で多重化したう
え伝送路1001を介して合成側に伝送する。
一方、第3図(B)に示す合成側ではデマルチプレクサ
11によって多重化分離されたピッチ予測係数と波形情
報に関するデータはそれぞれ出力ライン1101.11
03を介し音源再生器19に供給される。
音源再生器19はピッチ予測器を備え、これら入力を利
用して分析側で除去したパルス群を含む音源パルスとし
てのマルチパルス系列を再生しこれをLPG合成フィル
タ13に供給し、他は第2図(A)、(B)と同様にし
て入力音声信号を再生し、第2図(A)、(B)よりも
さらにデータビットレートを低減した波形伝送が図れる
第4図(5)、(B)は本発明による音声波形符号化復
号化装置の第4の実施例における分析側(A)および合
成側の構成を示すブロック図であり、デシメーション器
20とインタポレーション器21とを備えているほかは
第3図(5)、(B)による分析側と合成側とほぼ同一
の構成でありこれらに関する詳細な説明は省略する。
第4図(A)に訃いて、デシメーション器20は〜勺コ
ンバータ1によって8K)(zのサンプリング周波数で
サンプリングされた入力音声信号の量子化データをいっ
たん24 K Hzで再サンプルを実施したのち、その
1/4ごとのサンプルを利用することによって3 K 
Hzサンプリングを6KHzサンプリングに変換して必
要とするデータビットレートの低減を図る、いわゆるデ
シメート(Decimate)サンプリングを実施する
。このようなサンプリングレートのデシメート実施にあ
たっては、デシメートによって伝送データの特性が失な
われない配慮が必要である。通常の音声波形の伝送ある
いはボコーダ等では音声信号を3.2〜3.4 K H
z程度の高域遮断周波数のLPFで低域フィルタリング
して利用しており、この通過周波数帯域それ自体は原音
声信号の自然性を保存するのに十分であることは立証さ
れている。本実施例にあっては入力音声の低周波フィル
タリングの遮断周波数は3.2K)Izとしており、か
つこの遮断周波数近傍忙おけるLPFの減衰特性の影響
を受けて除去しても差支えないデータ分も考慮すると、
5KHzのデシメートサンプリングによる音質の劣化は
殆んど問題とはならず、伝送データビットレートの大幅
な改善効果が得られる。
このことは音声信号の低周波フィルタリングの遮断周波
数が3.4KHzであっても基本的には殆んど変らない
。な訃上述したアップサンプリング周波数24KHzは
A/Dコンバータ1におけるサンプリング周波数3KH
zと、゛デシノートせんとするサンプリング周波数6K
Hzとの最小公倍数を選択して設定したものである。
第4図(〜に示す分析側はこのようなサンプリング周波
数デシメーション以外は第3図(5)の場合とほぼ同様
に分析処理を実施したうえマルチプレクサ10、伝送路
1001を介して第4図(B)に示す合成側に波形情報
とサイドインフォメーションとを送出する。
第4図(B)の合成側では、LPG合成フィルタ13ま
では第3図(B)に示す合成側とほぼ同じ動作で6KH
zのデシメートサンプリング周波数による量子化入力音
声信号を再生したあと、これをインタボレーション器2
1に供給する。
インタポレーション器21は5KHzのサンプリング周
波数によるデータ間を24 K Hzのサンプリング周
波数によるサンプル値にインタボレーション(補間)し
たうえ、さらにその173ずつの値をとるようにデシメ
ートサンプリングして3KHzのサンプル値として8 
K Hz回線としての出力ライン1401に送出する。
かくして第3図(A)、(B)によって示す第3の実施
例よ勺もさらにデータビットレートを低減した音声波形
の符号化復号化が可能となり、この第4の実施例におい
ては4.8kb/8の音声C0DECとしての波形符号
化が容易に実施できる。
本発明はサイドインフォメーションに対して減衰係数を
乗じたLPGを利用してバタンマツチングを実施し、残
差波形とともに分析側から合成側に送出するとともに、
この場合さらに残差波形に対するマルチパルス符号化手
段、このマルチIくルス符号化手段九対するピッチ予測
技術の適用1分析側でのデシメーション追加等によって
符号化分析波形情報の伝送データビットレートを大幅に
低減し1通常はボコーダの伝送データビットレート領域
で波形の符号化を実施してこれを合成側で復号化する音
声C0DECとしての音声波形符号化復号化装置を構成
する点に基本的な特徴を有するものであり第1図(A)
、(B)〜第4図(〜、(均に示す本発明の実施例の変
形も種種考えられる。
たとえば、上記各実施例における合成側のLPGフィル
タは全権型のデジタルフィルタとしているが、これはN
on −Po1e型のものに変換してもはぼ同様に実施
しうろことは明らかである。
さらにLSPバタンマツチング用の標準メモリは212
種類としてい、るがこの種類もマツチング内容を勘案し
任意に選択しうろことは明らかである。
またLP8分析は10次のαパラメータを分析しておる
が、この次数も分析対象を考慮し任意に決定しうるもの
であり、以上はすべて本発明の主旨を損なうことなくい
ずれも容易に実施しうる。
〔発明の効果〕
以上説明した如く本発明によれば、サイドインフォメー
ションに対しては減衰係数を乗じたLPC係数を利用す
るLSPバタンマツチングを実施して残差波形情報とと
もに分析側から合成側に送出するとともに、なお残差波
形の伝送手段にはピッチ予測を含むマルチパルス符号化
手段を適用しうるものとし、さらに分析側では分析波形
に対するデシメーション、合成側では合成波形に対する
インタボレーションも実施しうる手段を備えて音声波形
の符号化ならびに復号化を図ることによって大幅にデー
タビットレートの低減を図9約4.8 kb/sのボコ
ーダのデータビットレート領域でも波形伝送が可能な音
声波形符号化復号化装置が実現できるという効果がある
【図面の簡単な説明】
第1図(A)け本発明の第1の実施例における分析側(
符号化側)の構成を示すブロック図、第1図(B)は本
発明の第1の実施例における合成側(復号化側)の構成
を示すブロック図、第2図(A)は本発明の第2の実施
例における分析側の構成を示すブロック図、第2図(B
)は本発明の第2の実施例における合成側の構成を示す
ブロック図、第3図(A)は本発明の第3の実施例にお
ける分析側の構成を示すブロック図、第3図(B)は本
発明の第3の実施例における合成側の構成を示すフ;ロ
ック図、第4図(5)は本発明の第4の実施例における
分析側の構成を示すブロック図、第4図(B)は本発明
の第4の実施例における合成側の構成を示すブロック図
である。 1・・・・・・A/Dコンバータ、2・・・・・・LP
C分析器、3・・・・・・減衰係数乗算器、4・・・・
・・減衰係数テーブルメモリ、5・・・・・L8P分析
器、6・・・・・・バタンマツチング器、7・・・・・
・標準バタンメモリ% 8・・・・・・α復号化器、9
・・・・・・LPC逆フィルタ、10・・・・・・マル
チプレクサ、11・・・・・・デマルチプレクサ、12
・・・・・・α復号化器、13・・・・・・LPC合成
フィルタ、14・・・・・・D/Aコンバータ、15・
・・・・・マルチ/<ルス分析器%16・・・・・・音
源再生器、17・−・・・・マルチ?くルス分析器、1
8・・・・・・ピラリ分析器、19・・・・・・音源再
生器、20・・・・・・デシメーション器% 21・・
・・・・インタボレーション器。 手続補正書輸発) 1.事件の表示 昭和59年特 許 願第096036
号2、発明の名称 音声信号符号化/復号化製置3、′
補正をする者 事件との関係 出 願 人 東京都港区芝五丁目33番1号 (423) 日本電気株式会社 代表者 関本忠弘 4、代理人 〒108 東京都港区芝五丁目37番8号 住友三口]
ビル5、補正の対象 願書の「発明の名称」の欄、明細書および図面6、補正
の内容 (D 願書の「発明の名称」: 「音声波形符号化復号化装置」とあるのを「音声信号符
号化/復号化装置」に訂正する。 〔■〕「明細書」: 全文を別紙のとおり訂正する。 [11) r図 面」: 図面を別添第1図(5)、(B)〜第8図囚、(B)と
差し替える。 代理人 弁理士 内 原 晋 ゝ。 明 細 書 1、発明の名称 音声信号符号化/復号化装置 2、特許請求の範囲 (1) 入力音声信号から線形予測係数(LPG)をめ
るLPC分析手段と;得られたLPGパラメータを所定
量減衰せしめる減衰手段と;前記減衰されたLPCパラ
メータからL8P(Line Spectrum Pa
1rs)パラメータをめ各入力音声パターン毎の入カバ
ターンとして出方するLAP分析手段と; 予め定めた各種音声信号をLSP分析して得られたLS
Pパラメータから成る標準パターンを各標準パターンに
ラベルを付して記憶する標準パターンメモリと; 前記標準パターンメモリに記憶されている標準パターン
の中から前記入カバターンに最も類似するパターンを選
択し、選択された標準パターンのラベルを符号化して復
号化装置に出力する手段と: 前記入力音声信号の残差信号を発生して符号化する手段
と、を備えることを特徴とする音声信号符号化/復号化
装置 (2、特許請求の範囲第(1)項において、前記復号化
装置は、前記ラベルを受け、このラベルの標準パターン
に対応するLPGバジメータを出力する復号化手段と;
前記残差信号と前記復号されたLPCパラメータとに基
づいて音声信号を合成する合成フィルタと;この合成フ
ィルタの出力をD/A変換するD/A変換器とを含むこ
とを特徴とする音声信号符号化/復号化装置。 (3)特許請求の範囲第(1)項において、前記残差信
号発生手段は、前記パターンマツチング手段からのラベ
ルを受け、このラベルの標準パターンに対応するLPG
パラメータを発生するLPC復号手段と;前記復号手段
からのLPCパラメータと前記入力音声信号とを受け、
残差信号を発生する手段とを含むことを特徴とする音声
信号符号化/復号化装置。 (4)特許請求の範囲第(1)項において、前記残差信
号発生手段は、前記パターンマツチング手段からのラベ
ルを受け、このラベルが付された標準パターンに対応す
るLPCパラメータを発生するLPC復号手段と;前記
入力音声信号と前記復号手段からのLPCパラメータと
を受け、複数のパルスの位置と振幅情報から成るマルチ
パルス信号とを発生し、符号化するマルチパルス分析手
段とを含むことを特徴とする音声信号符号化/復号化装
置。 (5) 特許請求の範囲第(4)項において、前記復号
化装置は、前記ラベルを受け、このラベルが付された標
準パターンに対応するLPCパラメータを発生するLP
C復号手段と;前記符号化されたマルチパルス信号を復
号して音源信号として出力する音源再生手段と、前記復
号手段からのLPCパラメータと、前記音源再生手段か
らの音源信号とに基づいて音声信号を合成する合成フィ
ルタと;この合成フィルタの出力をアナログ信号に変換
するD/A変換器とを含むことを特徴とする音声信号符
号化/復号化装置。 (6)特許請求の範囲第(1)項において、前記残差信
号発生手段は、前記パターンマツチング手段からのラベ
ルを受け、このラベルが付された標準パターンに対応す
るLPGパラメータを発生するLPC復号手段と;前記
入力音声信号のピッチ周期を分析し、時間的に先向する
ピッチ周期を予測し、ピッチ予測係数を出力する手段と
;前記入力音声信号と、前記LPC復号手段からのLP
Cパラメータおよび前記ピッチ予測係数とを受け、前記
ピッチ予測により不要になるパルスを除去した複数のパ
ルスの位置および振幅情報から成るマルチパルス信号を
出力するマルチパルス分析手段とを含むことを特徴とす
る音声信号符号化/復号化装置。 (7)特許請求の範囲第(6)項において、前記復号化
装置は、前記ラベルを受け、このラベルが付された標準
パターンに対応するLPCバ2メータを発生するLPC
復号手段と;前記マルチパルス信号および前記ピッチ予
測係数を受け、前記マルチパルス分析手段で除去された
パルスを本含む複数のパルスの位置および振幅情報信号
を出力する音源再生手段と;前記復号手段からのLPC
パラメータと、前記音源再生手段からの音源信号とに基
づいて音声信号を合成する合成フィルタと;この合成フ
ィルタの出力をアナログ信号に変換するD/A変換器と
を含むことを特徴とする音声信号符号化/復号化装置。 (8)特許請求の範囲第(1)項において、前記LPC
分析手段は入力音声信号をディジタル信号に変換するA
/D変換器と;前記A/D変換器の出力を、前記A/D
変換のサンプリング周波数よりも高い周波数でサンプリ
ングして得られるサンプリング信号から所定間隔のサン
プリング信号を抽出するデシメーション手段とを含むこ
とを特徴とする音声信号符号化/復号化装置。 (9)特許請求の範囲第(8)項において、前記復号化
装置は、前照2ペルを受け、このラベルの標準パターン
に対応するLPCパラメータを出力する復号化手段と;
前記残差信号と前記復号化手段からのLPCパラメータ
とに基づいて音声信号を合成する合成フィルタと;前記
合成フィルタの出力を前記所定間隔で抽出されたサンプ
リング信号間を、より高い周波数のサンプリング値に補
間した後、前記A/D変換器のサンプリング周波数に一
致したサンプリング信号を出力するインターポレーショ
ン手段と;前記インターポレーション手段からの出力を
アナログ信号に変換するD/A変換器とを含むことを特
徴とする音声信号符号化/復号化装置。 3、発明の詳細な説明 〔産業上の利用分野〕 本発明は音声信号の符号化/復号化装置に関し、特にL
 8 P (Line 8pectrum Pa1rs
 )パラメータに基づくパターンマツチングを用いた音
声信号符号化/復号化装置に関する。 〔従来の技術〕 音声信号の符号化伝送に関して社、伝送データビットレ
ートの削減は伝送回線を有効活用する上できわめて大き
な課題である。音声信号をスペクトル情報と音源情報に
分離して伝送し、受信側でこれらの情報を基にして原音
声を再生する方式は低伝送データビットレートを計る目
的で多用されている。 例えばボコーダにおいては、音声信号のスペクトル情報
としてLPC,LAP、PARCOR係数等が、また音
源情報としては有声無声判別、ピッチ。 残差情報等が採用されている。ボコーダによれば、音声
信号の伝送ビットレートは4.8Kb/s程度を達成で
きるが再生音質は必らずしも満足できるものではない。 これはボコーダが本質的に入力音声波形情報を符号化す
るものでないことに起因するO 再生音質を改善するために波形情報として複数のパルス
の位置と振幅を符号化して伝送する例として、マルチパ
ルス型の音声符号化技術がある。 マルチパルス型の音声符号化技術については、例えばB
、8.Atal et al、著論文’A New M
odel of LPCExcitation for
Producing Natural Soundin
g 5peech at LowBit Rates、
” Proc、ICAS Sr 82.pp614−617
(1982)に詳しい。 しかしながら、かかる符号化技術では再生音質は改善さ
れるものの、得られたマルチパルスの符号化に要するビ
ットレートが高く、通常9.6 K b/ s程度にも
達してしまう。 そこで、データビットレートの大幅な削減を可能にする
とともに、再生音質を改善するために提案されたのがパ
ターンマツチング方式である。この方式は予め用意した
多情類の標準的なスペクトル包絡情報の各々(標準パタ
ーン)にラベルを付し、入力音声信号を分析して得られ
るスペクトル情報と標準パターンとのパターンマツチン
グを両者の距離をめることにより行ない、入力音声スペ
クトルに最近似(最小距離)の標準パターンの2ベルを
符号化して伝送するものである。上記の如きパターンマ
ツチング方式を用いると、スペクトル情報の伝送に要す
るビットが極端に少なくて済むので全体として伝送ビッ
トレートの大幅な低減が可能であるが、次のような問題
点も含んでいる0 〔発明が解決しようとする問題点〕 即ち、この方式ではスペクトル情報として使われる特徴
パラメータはパターンマツチング歪の比較的小さいLS
Pパラメータであり、入力音声のLSFパラメータパタ
ーン(入カバターン)と標準パターンとの距離は、LS
Pパラメータのスペクトル感度(LSPパラメータの各
要素に独立に微少変化を与えたときのスペクトル包絡の
歪として定義される)を介した近似式により算出される
。 ところが、スペクトル感度は、L8Pパラメータの各要
素間の周波数間隔△ωが接近してくると、その値は不正
確なものとなることが実験的に確認されている。言い換
えると、Δωが小さくなると、L8Pパラメータの各要
素の微小な変化が全体のスペクトル包絡特性に大きな影
響を与えるために高精度なパターンマツチングが困難に
なる。特に、LSP分析して得られるLSP周波数間隔
Δωけ、一般的に小さい周波数間隔の頻度麩大きい周波
数間隔に比して高いため、この問題が顕著に現われてく
る。 〔問題点を解決するための手段〕 本発明になる音声信号符号化/復号化装置は、入力音声
信号から線形予測係数(LPC)をめるLPC分析手段
と;得られたLPCパラメータを所定量減衰せしめる減
衰手段と;前記減衰されたLPCパラメータからL 8
 P (Line Spectrum Pa1rs)パ
ラメータをめ各入力音声パターン毎の入カバターンとし
て出力するLAP分析手段と;予め定めた各種音声信号
をLAF分析して得られたL8Pパラメータから成る標
準パターンを各標準パターンにラベルを付して記憶する
標準パターンメモリと:前記標準パターンメモリに記憶
されている標準パターンの中から前記入カバターンに最
も類似するパターンを選択し、選択された標準パターン
のラベルを符号化して復号化装置に出力する手段と;前
記入力音声信号の残差信号を発生して符号化する手段と
を備える。 〔実施例〕 第1図を参照すると、入力音声信号IinはLoivP
ass Filter (LPF )を内蔵するA/D
コンバータIKよってまず低域フィルタリングされたの
ち所定のサンプリング周波数8KHzでデジタル化され
る。低域フィルタリングは本実施例の場合3.2 KH
z以上の高域を遮断するものであシ、これを8KHzの
サンプリング周波数でサンプリングしつつ所定のビット
数の量子化データとしてLPC分析器2に供給する。 LPC分析器2は、こうして供給された量子化データを
所定サンプル分ずついったんバックアメモリにストアし
たのち、これを読出して所定の基本7レ一ム周期ごとに
予め設定する窓関数との垂算を実施して極度に鋭いスペ
クトルビークの平滑化を図り、線形予測分析を行ない基
本フレームごとにn次の線形予測係数、本実施例では1
0次のαパラメータ(αl−αlo)を抽出する。この
ようにして行なわれる線形予測分析は入力音声信号Ii
nを形成する特徴パラメータとしてのスペクトル分布情
報と音源情報のうち、スペクトル分布情報としてのスペ
クトル包絡をめるものである。こうして得られたαパラ
メータは、減衰係数乗算器3において、減疑係数テーブ
ルメモリ4から読み出でれた減衰係数γと乗算されてL
AF分析器5に送出される。 LAF分析器5は入力された減衰αパラメータ群を利用
して10次のLaF3を分析、抽出しこれをバタンマツ
チング器6に供給する。ノくタンマツチング器6は次の
ようにして標準バタンメモリ7の標準バタンとのマツチ
ング処理を行ない、スペクトル距離が最小の標準バタン
を選択する。こクトル感度の過剰敏感さを抑止する。L
SP分析およびバタンマツチングを詳連すれは次のとお
りである。 LAF分析器5は、入力した減衰係数乗算後のLPC係
数を利用してLSF係数をめる。このL8P係数はαパ
ラメータやにパラメータ(偏自己相関係数)とともに声
道の共振特性を表わすノくラメータとしてしばしば利用
されるものであり、声門を仮想的に完全開放および完全
閉塞した場合の声道伝達関数の線スペクトル周波数ペア
によるパラメータであることはよく知られている。 LSP分析器5は、減衰係数乗算器3から入力する減衰
処理後の線形予測係数αパラメータをよ係数に変換する
。こうして得られるL8P係数は、前述した如く声道フ
ィルタの伝達関数を周波数領域で表現する線スペクトル
ω1.ω2・・・・・・ω1゜である。 このLSP変換に先立って実施されるLPC係数の減衰
係数乗算処理によれば、後述するように、LSP係数の
最小周波数間隔が拡大されてバタンマツチング処理が容
易となり、また合成側における音声合成用の全極型デジ
タルフィルタの動作安定性も高まる。 上述した標準バタンは予め用意した音声資料をL8P分
析して得られる標準的L8P係数の分布バタンであり、
予め設定する種類、本実施例では212種類を用意し、
またスペクトル距離は次の(1)式に示すDijによっ
て基本的に示される。 (1)式においてS’f”L Sjiω)はそれぞれ入
カバターンと標準バタンの対数スペクトルである。(1
)式は通常法の(2)式の近似式に変換利用される。 (2)式においてpKti) 、 p K(j )は入
カバターンおよび標準パターンにおけるN次のLSP係
数、”KはN次のL8Pスペクトル感度である。上述し
たNは全極型のLPCデジタルフィルタの次数、本実施
例にあっては10と対応し、そのLAP周波数対ω1.
ω2.・・・・・・ω1゜を示す。さらにN次のスペク
トル感度Wは前述したようにN次、本実施例の場合は1
0次のLSP係数の微少変化によって発生するスペクト
ル変化の程度を示す。 このようにして設定された分析フレームごとのL8F係
数に対応して選択されたLSP標準バタン番号(ラベル
)はマルチプレクサ9に供給される。以上の説明から明
らかなように、このようU。 バタンマツチング方式を採用すれば、各分析フレームの
スペクトル情報はラベルのみの伝送符号化で済むから伝
送ビットレートが大幅に削減芒れる。 ここで本発明の基本的特徴であるLPC係数(αパラメ
ータ)に減算係数を乗算する(減衰させる)ことの意義
について詳細に説明する。 第2図(5)はL8Plil波数間隔Δωの統計的頻度
分布を示す。図から明らかなように、αパラメータに減
衰係数γが乗算されていない場合(減衰係数γ=1.0
が乗算されている場合で実線Aで示される)には、Δω
の小さい範囲(π/100〜4π/100(rad))
に頻度が高い。また第2図(B)には減衰係数γとLS
Pパラメータの最小周波数間隔ΔωMINと一 の関係が示され、γ=1(減衰されていない)ときには
、Δωヶ□、は小さいことがわかる。一方、第3図には
、10次LAP分析して得られたLAFパラメータωl
とω鵞との間隔とパターンマッチング歪の分布範囲との
関係が示されている。ここで距離を示す。 第3図から明らかなことは、L8P周波数間隔係数であ
るαパラメータ値から直接にLSPパラメータをめると
、L8P周波数間隔は小さい値となる傾向が高く、その
結果、パターンマツチング歪が拡大されてパターンマツ
チング精度が劣化し告生音質の劣化を生起する。 一方、第2図書から、αパラメータに減衰係数γ=09
又はγ=08を乗算した後にLSFパラメータをめると
、LAP周波数間隔Δωは高い値に移行し、高い値のΔ
ωが得られることになる。このことは、第S図共に示す
減衰係数rとΔωMINとの関係からも明確な傾向とし
、て理解できる。つ首り、αパラメータに減衰係数を乗
算することによってLSP8$数間隔Δωが拡大され、
その結果、パターンマツチング歪が低減されてパターン
マツチング精度が向上し、再生音質が向上する。 以上で音声信号のスペクトル情報の符号化、伝送が為さ
れるが、残差情報は残差情報発生回路8にてA/D変換
器1からの入力音声を基にして各種方式で得られ、符号
化されてマルチプレクサ9に供給される。 一方、合成側(受信側)では、こうして多重化伝送され
た音声信号のスペクトル情報(標準パターンのラベル)
と残′差情報とをデマルチプレクサ10で分離し、残差
情報はLPG合成フィルタ12に励振信号として供給さ
れる。またスペクトル情報を示す標準パターンのラベル
けαパラメータ復析側とは逆の操作により標準バタンラ
ベル(番号)からαパラメータα1〜α1oを分析7レ
ームごとに復号化しLPC合成フィルタ12に送出する
。 LPC合成フィルタ12は、このようにして入力された
αパラメータ群をフィルタ係数とし、残差信号を駆動音
源とするデジタルフィルタであり、量子化された入力音
声信号を再生しD/Aコンバータ14に送出する。 D/Aコンバータ13は量子化された入力音声信号をア
ナログ化しLPC(Lovr Pa5s Filter
 )等を介してもとの入力音声信号に復元する。 次に分析側における残差信号発生回路について説明する
。第5図はその例で最も簡単な例である。 αパラメータ復号器81は、標準バタンメモリ7と同様
な標準パターンテーブルを備え、第1回置に示すパター
ンマツチング器6で得られた標準パターンラベル(番号
)を受け、当該ラベルに対応するαパラメータα1〜α
1oを読み出してLPC逆フィルタ82に供給する。L
PC逆フィルタ82は、第1図(13)に示すLPC合
成フィルタ12とは逆の周波数応答特性を有し、A/D
変換器1からの入力音声信号と、前記αパラメータαl
〜α10とを受け、入力音声信号からスペクトル情報を
除去した残差情報を除去した残差情報を得た後、符号化
してマルチプレクサ9に送出する。 第6図(5)は残差信号発生回路の他の例を示し、前述
したマルチパルスを残差情報として用いることによって
音声の大幅な向上とデータビットレートの低減を計って
いる。このマルチパルス分析は最適な駆動音源信号系列
としての残差波形符号化の1手法であり、残差波形を被
数個のインパルス系列いわゆるマルチパルスで表現し、
このマルチパルス駆動音源モデルを利用して得られる合
成波形と原入力音声信号とが最近似するようなインパル
ス系列を探索し符号化するもので、低伝送ビットレート
を可能とする。 マルチパルス分析器83はD / Aコンバータ1の出
力する量子化入力音声信号とαパラメータ復号化器81
から供給を受けるαパラメータを受け、分析フレームご
とにマルチパルス分析を実施し最適マルチパルス系列を
決定し、符号化してマルチプレクサ9に供給する。 一方、合成側は第6図(B)に示す如く、デマルチプレ
クサ10で分離されたマルチパルス情報が音源再生器1
4に入力畑れ、そとで分析フレーム毎の最適な音源パル
ス系列としてのマルチパルスを再生して合成フィルタ1
2に送出する。 第7図(A+には第6図(A)におけるマルチパルス分
析と符号化の高能率化を計るためにピッチ予測手段を付
加した例が示さオ]ている。 ピッチ分析器84はA/Dコンバータlの出力する量子
化された入力音声信号を受けると、自己相関処理等によ
ってピンチ分析を実施しピッチ周期およびひとつ先の予
測ピッチに関する情報としてのピッチゲイン等の分析情
報を分析フレームごとに抽出し、これらの分析情報をピ
ッチ予測係数としてマルチパルス分析器83およびマル
チプレクサ9に送出する。マルチパルス分析器83はピ
ッチ予測器を内蔵してピッチ予測を実施し、このピッチ
予測によって伝送不要となるパルス群を除去したマルチ
パルス系列に関する情報、すなわちパルス位置、正規化
振幅、最太娠幅、パルス数に関する符号化データをマル
チプレクサ9に出力する。 このような予測情報を介してもピッチ周期の分析処理が
可能である理由は、一般的に言ってたかだか10m5E
Cといった短時間の分析フレームではピッチ周期の急倣
な変化はなくづらに音声信号の内容にもよるが複数の分
析フレームにわたってもほぼ一様なピッチ周期で継続す
ることもしばしはあり、音声区間のかなりの範囲のピッ
チ予測が可能となることに起因する。 一方、第7図(B)に示す合成側ではテマルチプレクサ
10によって多重化分離されたピッチ予測係数と波形情
報に関するデータは音源再生器15に供給される。音源
再生器15はピッチ予測器を備え、これら入力を利用し
て分析側で除去したパルス群を含む音源パルスとしての
マルチパルス系列第8図(5)には、第7図(5)の改
良例が示されており、伝送ビットレートの更に大幅な低
減を可能とする例が示されている。 デシメーション器16はA/Dコンバータ1によって8
KHzのサンプリング周波数でサンプリングされた入力
音声信号の量子化データをいったん24KHzで再サン
プルを実施したのち、その1/4ごとのサンプルを利用
することによって8KHzサンプリングを6KHzサン
プリングに変換して必要とするデータビットレートの低
減を図る、いわゆるデシメート(Decimate )
サンプリングを実施する。このようなサンプリングレー
トのデシメート実施にあたっては、デシメートによって
伝送データの特性が失なわれない配慮が必要である。通
常の音声波形の伝送あるいはボコーダ等では音声信号を
3,2〜3.4KHz程度の高域遮断周波数のLPFで
低域フィルタリングして利用しておシ、この通過周波数
帯域それ自体は原音声信号の自然性を保存するのに十分
であることは立証されている。本実施例にあっては入力
音声の低周波フィルタリングの遮断周波数は3.2KH
zとしており、かつこの遮断周波数近傍におけるLPF
の減衰特性の影響を受けて除去しても差支えないデータ
分も考慮すると、6KH2のデシメートサンプリングに
よる音質の劣化は殆んど問題とはならず、伝送データビ
ットレートの大幅な改善効果が得られる。 このことは音声信号の低同波フィルタリングの遮断周波
数が3.4 KHzであっても基本的には殆んど変らな
い。なお上述したアップサンプリング周波数24KHz
はA/Dコンバータ1におけるサンプリング周波数8K
Hzと、デシメートせんとするサンプリング周波数6K
Hzとの最小公倍数を選択して設定したものである。 第8図(5)に示す分析側はこのようなサンプリング同
波数デシメーション器外は第7図(5)の場合とほぼ同
様に分析処理を実施したうえマルチプレクサ9を介して
合成側に送出される。 第8図IB)の合成側では、LPC合成フィルタ12ま
では第7図(B)に示す合成側とほぼ同じ動作で6KH
zのデシメートサンプリング周波数による量子化入力音
声信号を再生したあと、これをインタボレージ甘ン器1
7に供給する。 インタボレーション器17は6KHzのサンプリング周
波数によるデータ間を24KHzのサンプリング周波数
によるサンプル値にインタボレーション(補間)したう
え、さらにその1/3ずつの値をとるようにデシメート
サンプリングして8KHzのサンプル値として8KHz
 @ 線として出力する。 かくして第7図(A) 、 (B)に示す実施例よりも
さらにデータビットレートを低減した音声波形の符号化
復号化が可能となり、この実施例においては4、gkb
/sの音声C0IJECとしての波形符号化が容易に実
施できる。以上の実施例は第1回置と(B)に示す実施
例に基本的に適用できることは明らかである。 4、図面の簡単な説明 第1図(5)と(B)は本発明の基本的構成ブロック図
であり、それぞれ分析側(伝送側)と合成側(受信側)
のブロック図、第2図W舎吋はLSPパラメータの周波
数間隔Δωの統計的頻度分布と肯称隼5.− を示す図
、第 3図は周波数間隔Δωとパターンマツチング歪との関係
を示す図、第4図は本発明で用いるLPC係数に乗算さ
れるべき減衰係数と周波数間隔Δωとの関係図、第5図
は第1図CA)における残差波形発生回路の一例を示す
図で、LPC逆フィルタを用いた例を示す図、第6図(
5)と(B)は残差波形発生回路の他の例を示し、マル
チパルス分析に基づく分析側ブロツク図と合成側ブロツ
ク図、第7図面と(B)は第6図(5)と(B)に示す
残差波形発生回路の改良例を示す分析側と合成側のブロ
ック図、第8図(5)と(B)は第6図(5)と第7図
(5)に示すマルチパルス分析に基づく残差波形発生回
路の改良例を示し、デシメートサンプリングを採用した
分析側と合成側のブロック図である。 1・・・・・・A/D変換器、2・・・・・・LPC分
析器、3・・・・・・乗算器、4・・・・・・減衰係数
(γ)メモリ、5・旧・・LSP分析器、6・・・・・
・パターンマツチング器、7・・・・・・標準パターン
メモリ、8・・・・・・残差電力発生器、9・・・・・
・マルチプレクサ、1o・旧・・テマルチプレクサ、1
1・・・・・・α復号器、12・・・・・・LPC合成
フィルタ、13・・・・・・D/A変換器。 代理人 弁理士 内 原 音 L”yt 革I I!I(A) 茅l阿CB) 井2 閃 $31!a θ、/ oJ θ、3 Aひ〔とoL、/J 算4TEJ オl酊(A) ノn 芽1回(I3) 芽Z菊(A) 等7囚(ガ)

Claims (4)

    【特許請求の範囲】
  1. (1)音声信号波形を符号化する分析側と伝送路を介し
    て送出された符号化音声信号波形の復号化を行なう合成
    側とを備えて音声信号の伝送を図る音声波形符号化復号
    化装置において、音声信号波形のL P C(Line
    ar Prediction Coe −fficie
    nt、線形予測係数)分析を行なって得られるLPG係
    数に予め設定する減衰係数の乗算を施したうえ、さらI
    CL S P (Line SpectrumPair
    s、 lljスペクトル周波数対)分析によるバタンマ
    ツチングを実施して得られる音声信号波形のサイドイン
    フォメーションとしてのスペクトル分布情報等の符号化
    と音声信号波形の音源情報としての残差波形データの符
    号化とを分析側で実施し符号化音声波形データとして送
    出する音声波形符号化手段と、前記符号化音声波形デー
    タを合成側で復号化したうえ音声信号波形を再生する音
    声波形復号化手段とを備えて成ることを特徴とする音声
    波形符号化復号化装置。
  2. (2) 前記残差波形データを分析側から合成側に伝送
    する手段としてマルチパルス符号化を実施することを特
    徴とする特許請求範囲第(1)項記載の音声波形符号化
    復号化装置。
  3. (3)前記残差波形データを分析側から合成側に伝送す
    る際にマルチパルス符号化を実施するとと4にこのマル
    チパルス符号化において必要とする音声信号波形のピッ
    チ情報はこれを予測値として供給することを特徴とする
    特許請求範囲第(1)項記載の音声波形符号化復号化装
    置。
  4. (4) 前記残差波形データの伝送手段としてピッチ予
    測値を供給しつつマルチパルス符号化を実施するととも
    に分析側では分析波形のデシメーション(decima
    tion)を実施し合成側では合成波形のインタポレー
    ション(1nterpolation)を実施すること
    を特徴とする特許請求範囲第(1)項記載の音声波形符
    号化復号化装置。
JP59096036A 1984-05-14 1984-05-14 音声信号符号化/復号化装置 Granted JPS60239798A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP59096036A JPS60239798A (ja) 1984-05-14 1984-05-14 音声信号符号化/復号化装置
CA000481382A CA1226947A (en) 1984-05-14 1985-05-13 Speech signal coding and/or decoding system
US07/421,313 US4975955A (en) 1984-05-14 1989-10-13 Pattern matching vocoder using LSP parameters

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59096036A JPS60239798A (ja) 1984-05-14 1984-05-14 音声信号符号化/復号化装置

Publications (2)

Publication Number Publication Date
JPS60239798A true JPS60239798A (ja) 1985-11-28
JPH0439679B2 JPH0439679B2 (ja) 1992-06-30

Family

ID=14154239

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59096036A Granted JPS60239798A (ja) 1984-05-14 1984-05-14 音声信号符号化/復号化装置

Country Status (3)

Country Link
US (1) US4975955A (ja)
JP (1) JPS60239798A (ja)
CA (1) CA1226947A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62133498A (ja) * 1985-12-04 1987-06-16 日本電気株式会社 音声符号化方法とその装置
EP0753841A2 (en) * 1990-11-02 1997-01-15 Nec Corporation Speech parameter encoding method capable of transmitting a spectrum parameter at a reduced number of bits

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE467806B (sv) * 1991-01-14 1992-09-14 Ericsson Telefon Ab L M Metod att kvantisera linjespektralfrekvenser (lsf) vid beraekning av parametrar foer ett analysfilter ingaaende i en talkodare
US5450522A (en) * 1991-08-19 1995-09-12 U S West Advanced Technologies, Inc. Auditory model for parametrization of speech
CA2084323C (en) * 1991-12-03 1996-12-03 Tetsu Taguchi Speech signal encoding system capable of transmitting a speech signal at a low bit rate
CA2105269C (en) * 1992-10-09 1998-08-25 Yair Shoham Time-frequency interpolation with application to low rate speech coding
JP2947012B2 (ja) * 1993-07-07 1999-09-13 日本電気株式会社 音声符号化装置並びにその分析器及び合成器
US6032116A (en) * 1997-06-27 2000-02-29 Advanced Micro Devices, Inc. Distance measure in a speech recognition system for speech recognition using frequency shifting factors to compensate for input signal frequency shifts
US6044343A (en) * 1997-06-27 2000-03-28 Advanced Micro Devices, Inc. Adaptive speech recognition with selective input data to a speech classifier
US6070136A (en) * 1997-10-27 2000-05-30 Advanced Micro Devices, Inc. Matrix quantization with vector quantization error compensation for robust speech recognition
US6067515A (en) * 1997-10-27 2000-05-23 Advanced Micro Devices, Inc. Split matrix quantization with split vector quantization error compensation and selective enhanced processing for robust speech recognition
US6240299B1 (en) * 1998-02-20 2001-05-29 Conexant Systems, Inc. Cellular radiotelephone having answering machine/voice memo capability with parameter-based speech compression and decompression
US6347297B1 (en) 1998-10-05 2002-02-12 Legerity, Inc. Matrix quantization with vector quantization error compensation and neural network postprocessing for robust speech recognition
US6219642B1 (en) 1998-10-05 2001-04-17 Legerity, Inc. Quantization using frequency and mean compensated frequency input data for robust speech recognition
US6792405B2 (en) * 1999-12-10 2004-09-14 At&T Corp. Bitstream-based feature extraction method for a front-end speech recognizer
CN101604525B (zh) * 2008-12-31 2011-04-06 华为技术有限公司 基音增益获取方法、装置及编码器、解码器

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58198095A (ja) * 1982-05-14 1983-11-17 日本電気株式会社 線スペクトル型音声分析合成装置
JPS5912499A (ja) * 1982-07-12 1984-01-23 松下電器産業株式会社 音声符号化装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3624302A (en) * 1969-10-29 1971-11-30 Bell Telephone Labor Inc Speech analysis and synthesis by the use of the linear prediction of a speech wave
US4301329A (en) * 1978-01-09 1981-11-17 Nippon Electric Co., Ltd. Speech analysis and synthesis apparatus
US4220819A (en) * 1979-03-30 1980-09-02 Bell Telephone Laboratories, Incorporated Residual excited predictive speech coding system
US4270027A (en) * 1979-11-28 1981-05-26 International Telephone And Telegraph Corporation Telephone subscriber line unit with sigma-delta digital to analog converter
US4661915A (en) * 1981-08-03 1987-04-28 Texas Instruments Incorporated Allophone vocoder
US4472832A (en) * 1981-12-01 1984-09-18 At&T Bell Laboratories Digital speech coder
CA1203906A (en) * 1982-10-21 1986-04-29 Tetsu Taguchi Variable frame length vocoder
CA1197619A (en) * 1982-12-24 1985-12-03 Kazunori Ozawa Voice encoding systems
US4707858A (en) * 1983-05-02 1987-11-17 Motorola, Inc. Utilizing word-to-digital conversion
US4701954A (en) * 1984-03-16 1987-10-20 American Telephone And Telegraph Company, At&T Bell Laboratories Multipulse LPC speech processing arrangement

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58198095A (ja) * 1982-05-14 1983-11-17 日本電気株式会社 線スペクトル型音声分析合成装置
JPS5912499A (ja) * 1982-07-12 1984-01-23 松下電器産業株式会社 音声符号化装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62133498A (ja) * 1985-12-04 1987-06-16 日本電気株式会社 音声符号化方法とその装置
JPH0634197B2 (ja) * 1985-12-04 1994-05-02 日本電気株式会社 音声符号化方法とその装置
EP0753841A2 (en) * 1990-11-02 1997-01-15 Nec Corporation Speech parameter encoding method capable of transmitting a spectrum parameter at a reduced number of bits
EP0755047A2 (en) * 1990-11-02 1997-01-22 Nec Corporation Speech parameter encoding method capable of transmitting a spectrum parameter at a reduced number of bits
EP0755047A3 (en) * 1990-11-02 1997-04-23 Nec Corp Method for coding a speech parameter capable of transmitting a spectral parameter at a reduced rate
EP0753841A3 (en) * 1990-11-02 1997-04-23 Nec Corp Method for coding a speech parameter capable of transmitting a spectral parameter at a reduced rate

Also Published As

Publication number Publication date
JPH0439679B2 (ja) 1992-06-30
CA1226947A (en) 1987-09-15
US4975955A (en) 1990-12-04

Similar Documents

Publication Publication Date Title
JP3557662B2 (ja) 音声符号化方法及び音声復号化方法、並びに音声符号化装置及び音声復号化装置
EP0477960B1 (en) Linear prediction speech coding with high-frequency preemphasis
JPS60239798A (ja) 音声信号符号化/復号化装置
USRE43099E1 (en) Speech coder methods and systems
KR100275429B1 (ko) 음성 부호화 장치
JPH11327597A (ja) 音声符号化装置及び音声復号化装置
KR100499047B1 (ko) 서로 다른 대역폭을 갖는 켈프 방식 코덱들 간의 상호부호화 장치 및 그 방법
WO2002071394A1 (en) Sound encoding apparatus and method, and sound decoding apparatus and method
JP3537008B2 (ja) 音声符号化通信方式とその送受信装置
JP2615548B2 (ja) 高能率音声符号化方式とその装置
JP2000132193A (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JP4578145B2 (ja) 音声符号化装置、音声復号化装置及びこれらの方法
JP3916934B2 (ja) 音響パラメータ符号化、復号化方法、装置及びプログラム、音響信号符号化、復号化方法、装置及びプログラム、音響信号送信装置、音響信号受信装置
JP3088204B2 (ja) コード励振線形予測符号化装置及び復号化装置
JP2001318698A (ja) 音声符号化装置及び音声復号化装置
JP3319396B2 (ja) 音声符号化装置ならびに音声符号化復号化装置
JPS61252600A (ja) Lsp型パタンマツチングボコ−ダ
JP3063087B2 (ja) 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置
JP3192999B2 (ja) 音声符号化方法および音声符号化方法
JP2629762B2 (ja) ピッチ抽出装置
JPH0449960B2 (ja)
JPH02160300A (ja) 音声符号化方式
JPH043878B2 (ja)
JP2005062410A (ja) 音声信号の符号化方法
JPH10105200A (ja) 音声符号化/復号化方法