JP2946528B2 - 音声符号化復号化方法及びその装置 - Google Patents

音声符号化復号化方法及びその装置

Info

Publication number
JP2946528B2
JP2946528B2 JP1118631A JP11863189A JP2946528B2 JP 2946528 B2 JP2946528 B2 JP 2946528B2 JP 1118631 A JP1118631 A JP 1118631A JP 11863189 A JP11863189 A JP 11863189A JP 2946528 B2 JP2946528 B2 JP 2946528B2
Authority
JP
Japan
Prior art keywords
signal
function
circuit
spectrum parameter
sound source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1118631A
Other languages
English (en)
Other versions
JPH02299000A (ja
Inventor
英輔 花田
一範 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP1118631A priority Critical patent/JP2946528B2/ja
Publication of JPH02299000A publication Critical patent/JPH02299000A/ja
Application granted granted Critical
Publication of JP2946528B2 publication Critical patent/JP2946528B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、音声信号を低いビットレートで効率的に符
号化,復号化するための音声符号化復号化方法と音声符
号化装置と音声復号化装置に関する。
〔従来の技術〕
音声信号を低いビットレート、例えば16kb/s程度以下
で伝送する方法としては、マルチパルス符号化法などが
知られている。これらは音源信号を複数個のパルスの組
合せ(マルチパルス)で表し、声道の特徴をデジタルフ
ィルタで表し、音源パルスの情報とフィルタの係数を、
一定時間区間(フレーム)毎に求めて伝送している。こ
の方法の詳細については、例えばアラセキ、オザワ、オ
ノ、オチアイ氏による“Multi−pulse Excited Speech
Coder Based on Maximum Cross−correlation Search A
lgorithm",(GLOBECOM 83,IEEE Global Telecommunicat
ion,講演番号23.3,1983)(文献1)に記載されてい
る。この方法では、声道情報と音源信号を分離してそれ
ぞれ表現すること、および音源信号を表現する手段とし
て複数のパルス列の組合せ(マルチパルス)を用いるこ
とにより、復号後に良好な音声信号を出力することがで
きる。
〔発明が解決しようとする課題〕
しかしながら、この従来方法ではビットレートが充分
に高く音源パルスの数が充分なときは音質が良好であっ
たが、ビットレートを下げて行くと音質が低下するとい
う問題点があった。
この問題点を改善するために、伝送する音源パルス数
を削減する方法として、マルチパルス音源のピッチ毎の
準周期性(ピッチ相関)を利用したピッチ予測マルチパ
ルス法が提案されている。この方法の詳細は、例えば、
特願昭58−139022号明細書(文献2)に詳しく記載され
ている。しかし、削減が可能なパルス数には限界があ
る。
一方、伝送すべきスペクトルパラメータが、1フレー
ムに対して分析次数の個数存在する。スペクトルパラメ
ータを量子化する方法としては、周知の方法であるスカ
ラー量子化、または効率よく量子化する方法として周知
の方法であるベクトル量子化を用いることが多い。ベク
トル量子化については、例えばアール・エム・グレイ氏
による“ベクトル・クォンタイゼイション・フォー・ス
ピーチ・コーディング・アンド・リコグニション”(ア
メリカ音響学会誌80、Q1,1986)(R.M.Gray,“Vector q
uantization for speech coding and recognition"(J.
Acoust,Soc.America,vol.80,Suppl.1,Q1,1986)(文献
3)に詳しく記載されている。
さらに、予め定められた個数の関数を用いてスペクト
ルパラメータを効率よく表現する手法として、テンポラ
ルデコンポジションがある。テンポラルデコンポジショ
ンについては、例えばビー・エス・アタール氏による
“エフィシェント・コーディング・オブ・エルピーシー
・パラメターズ・バイ・テンポラル・デコンポジショ
ン”(アイ・シー・エー・エー・エス・ピー83、講演番
号2.6 1983)(B.S.Atal,“EFFICIENT CODING OF LPC P
AREME−TERS BY TEMPORAL DECOMPOSITION"(ICAASP 83,
2.6pp.81−84,1983)(文献4)に詳しく記載されてい
る。
しかし、スカラー量子化を用いた場合は、伝送するべ
き情報が多くなり、このままでビットレートを下げて行
くと顕著に音質が劣化するという問題点がある。また、
ベクトル量子化を用いた場合にも、伝送効率はよくなる
ものの、最適なベクトルを求めるための計算量が非常に
多く、また再生された音質も低下するという問題点があ
った。さらに、前記文献4にみられるようなテンポラル
デコンポジションについても、最適な関数を求めるため
の計算量が非常に多いうえ計算方法が複雑であり、実用
に供するのは困難であった。
本発明の目的は、ビットレートが高いところでも、ま
たビットレートを下げていっても従来よりも良好な音声
を再生することが可能で、少ない演算量で実現可能な音
声符号化復号化方法と音声符号化装置と音声復号化装置
とを提供することにある。
〔課題を解決するための手段〕
本発明は、離散的な音声信号を入力し、予め定められ
た時間長のフレーム毎にスペクトル包絡を表すスペクト
ルパラメータと音源信号を抽出し、前記スペクトルパラ
メータと前記音源信号を量子化して組み合わせて伝送
し、前記組み合わされた信号から前記音源信号と前記ス
ペクトルパラメータを分離し復元し、前記音声信号を良
好に再生して出力する音声符号化復号化方法において、 前記スペクトルパラメータを、予め複数個の関数を有
し前記関数の中から前記予め用意された関数の自己相関
と、前記予め用意された関数と前記スペクトルパラメー
タとの相互相関を用いて最適な関数を選択して、前記ス
ペクトルパラメータを量子化することを特徴とする。
本発明の音声符号化装置は、入力した離散的な音声信
号系列から短時間スペクトル特性を表すスペクトルパラ
メータを求めるスペクトルパラメータ計算回路と、 前記スペクトルパラメータを、予め複数個の関数を有
し前記関数の中から、前記予め用意された関数の自己相
関と、前記予め用意された関数と前記スペクトルパラメ
ータとの相互相関を用いて最適な関数を選択して表現す
るスペクトルパラメータ量子化回路と、 前記量子化されたスペクトルパラメータを逆量子化す
る逆量子化回路と、 前記逆量子化回路の出力を用いて前記音声信号の音源
信号を複数個のパルス列を用いて表して符号化する音源
信号計算回路と、 前記スペクトルパラメータを表す関数を表す符号と前
記マルチパス列を表す符号とを組み合わせて出力するマ
ルチプレクサ回路とを有することを特徴とする。
本発明の音声復号化装置は、音源信号を表す符号と、
音声信号のスペクトルパラメータを表すための最適な関
数を表す符号とを入力して分離し復号化するデマルチプ
レクサ回路と、 予め保有する複数個の関数から前記復号化された関数
を表す符号により、最適な関数を選択し短時間スペクト
ル特性を表すスペクトルパラメータを計算するスペクト
ルパラメータ復号回路と、 音源信号を用いてマルチプレクサ列を復元し音源信号
を復元する音源信号復元回路と、 前記復元された音源信号と前記スペクトルパラメータと
を用いて音声信号を合成する合成フィルタ回路とを有す
ることを特徴とする。
〔作用〕
本発明は、前記文献2のピッチ予測マルチパルス符号
化法において、少ない伝送情報量で、音声信号を従来方
法より効率的に表現するために、伝送するべきスペクト
ルパラメータを予め定められた複数個の関数の中から、
前記入力された信号を最適に表現するものを少ない計算
量で選択して表す。
本発明の作用を、第2図を用いて説明する。第2図
は、スペクトルパラメータを予め定められた個数の関数
を用いて表現するための量子化器のブロック図である。
第2図において、入力端子300からは量子化すべきス
ペクトルパラメータの時系列yi(n)が入力される。コ
ードブック250には、予め定められた複数個の関数φ
(n)がコードとして納められている。最適なコード及
びゲインを計算するために自己相関計算回路252は硬度
の自己相関を、相互相関計算回路251はコードと入力信
号との相互相関を計算する。自己相関計算回路252の出
力と相互相関計算回路251の出力を用いて、ゲイン計算
回路260は選択されたコードにかけるべき最適なゲイン
を計算する。誤差計算回路265は、選択されたコードに
ゲインをかけ、入力信号との誤差を計算し、選択したコ
ードのインデクス及び最適なゲイン、及び誤差を出力す
る。コードブック選択回路270は、各コードブックに対
する誤差計算回路265の出力を保持し、全てのコードブ
ックに対して求めた誤差の内最小となる最適なコードの
インデクス及び前記最適なコードに対応する前記最適な
ゲインを出力する。
以下、本発明の作用を式を用いて説明する。入力音声
から算出された複数個のスペクトルパラメータの時系列
のうち、i番目のもの(以下、これをi次のパラメータ
時系列と呼ぶ)をyi(n)とする。このi次のパラメー
タ時系列yi(n)を表現するために用いる関数をφで表
し、そのうちk番目のものをφ(n)で表す。これを
用いると、次の式(1)が成り立つ。
(n)=aikφ(n) (1) ここで(n)は、関数φ(n)を用いてパラメ
ータ時系列yi(n)を近似した時系列を表し、aikは、
i次のパラメータ時系列における、関数φ(n)にか
かるゲインである。従って、最適な近似を行うためには
最適な関数φ(n)及びゲインaikを見つければよ
い。従来技術では、前記文献4に示されているような誤
差尺度を用いて最適な関数を算出している、さらに文献
4においては、前記算出された関数と計算されたゲイン
を再度交互的に修正して誤差を小さくしている。
これに対し、本発明においては、次の式(2)で表す
誤差Eを考える。
(2)式は、分析次数の個数だけ存在するパラメータ
時系列のうちi次のパラメータ時系列に対する関数φ
(n)及びゲインaikを用いた場合の入力信号yi(n)
との誤差を示す式である。ここでn1は関数φ(n)を
用いて表現しようとするパラメータ時系列区間(フレー
ム)の始端を表し、n2は前記表現しようとする区間の終
端を表す。
前記(2)式をゲインaikについて最小化すると、aik
は(3)式によって求められる。
このとき、誤差Eは次の形となるので、 Eを最小化する関数φ(n)は、(4)式の第2項を
最小化する、即ちゲインaikを最小化するように選択す
ればよい。なお、関数φ(n)は、種々の多項式関数
を用いてもよいし、音声信号中から学習によって求めて
もよい。
以上示したような方法を用いることによって、前記文
献4における方法に対して大幅に計算量を削減した上、
誤差を良好に小さく保つことが可能である。
〔実施例〕
第1図は、音声符号化復号化方法を実施する音声符号
化装置及び音声復号化装置を示す。
音声符号化装置の入力端子500から離散的な音声信号
を入力する 時間分割回路510は、入力された音声信号を、時間的
に一様なフレーム毎(例えば100msec.毎)に分割する。
ピッチパラメータ計算回路515は、ピッチの微細構造
を表すピッチパラメータを計算する。計算方法は、前記
文献2に示されているような方法を用いる。
量子化器516は、前記求められたピッチパラメータを
量子化する。
逆量子化器518は、量子化した結果を用いて逆量子化
して出力する。
スペクトルパラメータ計算回路520では、前記分割し
た区間の音声信号のスペクトルを表すスペクトルパラメ
ータを、周知のLPC分析法によって求める。求められた
スペクトルパラメータに対しては、コードブック521の
中に予め定められた個数用意されたコードを用いて、作
用の項において説明したような方法によりゲイン回路52
2において各コードに対して最適なゲインを計算する。
コードブック選択回路525は、各コードブックに対す
るゲイン計算回路522の出力である誤差の内最小である
ものを選択し、選択されたコードのインデクスと最適な
ゲインを出力する。
逆量子化器530は、コードブック選択回路525の出力で
ある前記選択されたコードのインデクスと最適なゲイン
を用いて逆量子化して出力する。
重み付け回路540は、逆量子化されたスペクトルパラ
メータを用いて前記分割された音声信号に重み付けを行
う。重み付けの方法は、特願昭59−27435号明細書(文
献5)の重み付け回路200を参照することができる。
インパルス応答計算回路550は、逆量子化されたピッ
チパラメータと逆量子化されたスペクトルパラメータを
用いてインパルス応答を計算する。具体的な方法は前記
文献2を参照できる。
自己相関計算回路560は、前記インパルス応答の自己
相関を計算し音源パルス計算回路580へ出力する。自己
相関の計算法は、前記文献2の自己相関関数計算回路18
0を参照することができる。
相互相関計算回路570は、前記重み付けられた信号と
前記インパルス応答との相互相関を計算して、音源パル
ス計算回路580へ出力する。具体的な方法は前記文献2
を参照できる。
音源パルス計算回路580では、マルチパルスをピッチ
予測により、予め定められた個数だけ求める。マルチパ
ルス列の計算方法については、前記文献2の音源パルス
計算回路210を参照することができる。
量子化器585は、音源マルチパルス列を量子化して符
号を出力する。
量子化器590の出力であるマルチパルス列を量子化し
た符号、量子化器516の出力であるピッチパラメータを
量子化した符号、さらに量子化器525の出力である前記
選択されたコードのインデクスと最適なゲインを表す符
号は、それぞれマルチプレクサ630の入力となる。マル
チプレクサ630は以上の各符号を組み合わせて出力す
る。
一方、受信側では、デマルチプレクサ710は、マルチ
パルス列の符号、ピッチパラメータの符号、前記選択さ
れたコードのインデクスと最適なゲインを表す符号を分
離して出力する。
音源パルス復号器720は、マルチパルスの振幅,位置
を復号する。
コードブック選択回路752は、インデクスを復号し、
受信側と同じコードブック751の中から前記復号したイ
ンデクスに対応するコードを選択する。
ゲイン回路750は、ゲインを復号し、前記選択された
コードと復号されたゲインを用いてスペクトルパラメー
タを復号し出力する。
ピッチパラメータ復号器740は、送信側の逆量子化器5
18と同じ働きをする。
パルス発生器730は、前記マルチパルス列による音源
信号を発生させる。
ピッチ再生フィルタ755は、前記求められた音源信号
と前記復号されたピッチパラメータを入力として、ピッ
チを再生した合成音源信号を再生する。
スペクトル包絡フィルタ回路760では、前記音源信号
及び前記復号されたスペクトルパラメータを用いて合成
音波形を求めて出力端子770へ出力する。
以上述べた構成は本発明の一構成にすぎず、種々の変
形も可能である。
マルチパルスの計算方法としては、前記文献1に示し
た方法の他に、種々の周知な方法を用いることができ
る。
また、スペクトルパラメータとしては、他の周知はパ
ラメータ(線スペクトル対,ケプストラム,メルケプス
トラム,対数断面積比等)を用いることもできる。
〔発明の効果〕
本発明によれば、スペクトルパラメータを予め定めら
れた複数個の関数を用いて表すことで、従来方法に比べ
非常に少ない計算量で、かつ従来方法に比べ少ない伝送
情報量で音声信号を良好に表すことができるという大き
な効果がある。
【図面の簡単な説明】
第1図は本発明による音声符号化復号化方法とその装置
の一実施例の構成を示すブロック図、 第2図は本発明の作用を示すブロック図である。 500……入力端子 510……時間分割回路 515……ピッチパラメータ計算回路 520……スペクトルパラメータ計算回路 516,590……量子化器 518,530……逆量子化器 521,751……コードブック 522,260……ゲイン計算回路 540……重み付け回路 550……インパルス応答計算回路 560,252……自己相関計算回路 570,251……相互相関計算回路 580……音源パルス計算回路 730……パルス発生器 755……ピッチ再生フィルタ 760……スペクトル包絡フィルタ 630……マルチプレクサ 710……デマルチプレクサ 720……音源パルス復号器 740……ピッチパラメータ復号器 750……ゲイン回路 770……出力端子
フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G10L 3/00 - 9/20 H03M 7/30 H04B 14/04 JICSTファイル(JOIS)

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】離散的な音声信号を入力し、予め定められ
    た時間長のフレーム毎にスペクトル包絡を表すスペクト
    ルパラメータと音源信号を抽出し、前記スペクトルパラ
    メータと前記音源信号を量子化して組み合わせて伝送
    し、前記組み合わされた信号から前記音源信号と前記ス
    ペクトルパラメータを分離し復元し、前記音声信号を良
    好に再生して出力する音声符号化復号化方法において、 前記スペクトルパラメータを、予め複数個の関数を有し
    前記関数の中から前記予め用意された関数の自己相関
    と、前記予め用意された関数と前記スペクトルパラメー
    タとの相互相関を用いて最適な関数を選択して、前記ス
    ペクトルパラメータを量子化することを特徴とする音声
    符号化復号化方法。
  2. 【請求項2】入力した離散的な音声信号系列から短時間
    スペクトル特性を表すスペクトルパラメータを求めるス
    ペクトルパラメータ計算回路と、 前記スペクトルパラメータを、予め複数個の関数を有し
    前記関数の中から、前記予め用意された関数の自己相関
    と、前記予め用意された関数と前記スペクトルパラメー
    タとの相互相関を用いて最適な関数を選択して表現する
    スペクトルパラメータ量子化回路と、 前記量子化されたスペクトルパラメータを逆量子化する
    逆量子化回路と、 前記逆量子化回路の出力を用いて前記音声信号の音源信
    号を複数個のパルス列を用いて表して符号化する音源信
    号計算回路と、 前記スペクトルパラメータを表す関数を表す符号と前記
    マルチパス列を表す符号とを組み合わせて出力するマル
    チプレクサ回路とを有することを特徴とする音声符号化
    装置。
  3. 【請求項3】音源信号を表す符号と、音声信号のスペク
    トルパラメータを表すための最適な関数を表す符号とを
    入力して分離し復号化するデマルチプレクサ回路と、 予め保有する複数個の関数から前記復号化された関数を
    表す符号により、最適な関数を選択し短時間スペクトル
    特性を表すスペクトルパラメータを計算するスペクトル
    パラメータ復号回路と、 音源信号を用いてマルチプレクサ列を復元し音源信号を
    復元する音源信号復元回路と、 前記復元された音源信号と前記スペクトルパラメータと
    を用いて音声信号を合成する合成フィルタ回路とを有す
    ることを特徴とする音声復号化装置。
JP1118631A 1989-05-15 1989-05-15 音声符号化復号化方法及びその装置 Expired - Lifetime JP2946528B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1118631A JP2946528B2 (ja) 1989-05-15 1989-05-15 音声符号化復号化方法及びその装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1118631A JP2946528B2 (ja) 1989-05-15 1989-05-15 音声符号化復号化方法及びその装置

Publications (2)

Publication Number Publication Date
JPH02299000A JPH02299000A (ja) 1990-12-11
JP2946528B2 true JP2946528B2 (ja) 1999-09-06

Family

ID=14741312

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1118631A Expired - Lifetime JP2946528B2 (ja) 1989-05-15 1989-05-15 音声符号化復号化方法及びその装置

Country Status (1)

Country Link
JP (1) JP2946528B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5058115A (en) * 1989-03-10 1991-10-15 International Business Machines Corp. Fault tolerant computer memory systems and components employing dual level error correction and detection with lock-up feature

Also Published As

Publication number Publication date
JPH02299000A (ja) 1990-12-11

Similar Documents

Publication Publication Date Title
JP2940005B2 (ja) 音声符号化装置
US5027405A (en) Communication system capable of improving a speech quality by a pair of pulse producing units
JPH09152896A (ja) 声道予測係数符号化・復号化回路、声道予測係数符号化回路、声道予測係数復号化回路、音声符号化装置及び音声復号化装置
JP3582589B2 (ja) 音声符号化装置及び音声復号化装置
JP3303580B2 (ja) 音声符号化装置
JP2946528B2 (ja) 音声符号化復号化方法及びその装置
JP2829978B2 (ja) 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置
KR0155798B1 (ko) 음성신호 부호화 및 복호화 방법
JP3035960B2 (ja) 音声符号化復号化方法及びその装置
JP2853170B2 (ja) 音声符号化復号化方式
JP3063087B2 (ja) 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置
JPH028900A (ja) 音声符号化復号化方法並びに音声符号化装置及び音声復合化装置
JP2560682B2 (ja) 音声信号符号化復号化方法とその装置
JP3552201B2 (ja) 音声符号化方法および装置
JP2615862B2 (ja) 音声符号化復号化方法とその装置
JP3006790B2 (ja) 音声符号化復号化方法及びその装置
JP3192051B2 (ja) 音声符号化装置
JP3103108B2 (ja) 音声符号化装置
JPH05127700A (ja) 音声符号化復号化方法およびそのための装置
JP3128226B2 (ja) 音声符号化方法
JP3202212B2 (ja) 音声符号化装置及び音声符号化方法
JP3017747B2 (ja) 音声符号化装置
JP2844590B2 (ja) 音声符号化方式とその装置
JPH04243300A (ja) 音声符号化方式
JPH0632035B2 (ja) 音声符号化方法とその装置