JPH01258000A - 音声信号符号化復号化方法並びに音声信号符号化装置及び音声信号復号化装置 - Google Patents

音声信号符号化復号化方法並びに音声信号符号化装置及び音声信号復号化装置

Info

Publication number
JPH01258000A
JPH01258000A JP63085193A JP8519388A JPH01258000A JP H01258000 A JPH01258000 A JP H01258000A JP 63085193 A JP63085193 A JP 63085193A JP 8519388 A JP8519388 A JP 8519388A JP H01258000 A JPH01258000 A JP H01258000A
Authority
JP
Japan
Prior art keywords
sound source
audio signal
parameter
section
pitch
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63085193A
Other languages
English (en)
Inventor
Kazunori Ozawa
一範 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP63085193A priority Critical patent/JPH01258000A/ja
Publication of JPH01258000A publication Critical patent/JPH01258000A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は音声信号を低いビットレートで効率的に符号化
、復号化するための音声信号符号化復号化方法並びに音
声信号符号化装置及び音声信号復号化装置に関し、特に
聴覚の特性と対応の良い特徴パラメータにもとづいて音
声を非一様に分割し、分割した区間において音声信号の
特徴を表すパラメータを求めて符号化、復号化すること
のできる音声信号符号化復号化方法並びにそれに用いる
装置に関する。
〔従来の技術〕
音声信号を低い伝送ビットレート、例えば4.8k b
 / s程度以下で伝送する方法としては、ピッチ補間
マルチパルス符号化法などが知られている。
これらは音源信号を複数個のパルスの組合せ(マルチパ
ルス)で表し、声帯の特性をデジタルフィルタで表し、
音源パルスの情報とフィルタの係数を、一定時間区間(
フレーム)毎に求めて伝送している。この方法の詳細に
ついては、例えばOzawa 。
へraseki氏による“Low Bit Rate 
Multi−pulseSpeech Coder w
ith Natural 5peech Qualit
y”(Proc、 1.C,A、S、S、P、、講演番
号9.7.1986) (文献1)に記載されている。
これらの方法では、伝送情報量、特に音源情報を低減す
るために、固定長フレーム内の1つのピッチ区間に対し
てのみ音源パルス列を求めて伝送することによって、伝
送すべき音源パルス数を低減している。
〔発明が解決しようとする課題〕
しかしながら、この従来の方法では、音源パルス、フィ
ルタ係数を求める区間長を一定(文献1では20m5)
としていた。従って、母音区間ではほぼ周期的な波形が
連続し音声の特徴が余り変化していないにも拘わらず、
20m5という短時間毎に情報を伝送するということで
、非常に効率が悪く、他方、子音区間では速い音声の特
徴の変化に追随出来ずに音質劣化が起こるという問題点
があった。また、特にこの問題点はビットレートが8k
 b / sよりもかなり低い場合に顕著であった。
上述の問題を更に具体的に説明すると、まず、よく知ら
れているように、母音区間は、発生速度にも依存するが
、一般に100〜300m5と時間長が長く、この半分
以上は音声信号の特徴が殆ど変化しない定常区間とみな
せる。従って、従来方法の如く、これを短い20m5程
度のフレーム区間毎に分析しているのでは効率が非常に
悪かった。一方、子音区間では音声の特徴の変化が速い
ために、20m5のフレームでは長すぎて音声の変化に
対応した精度の良い分析が難しく、再生音声の音質が劣
化していた。
そこで、これらの問題点を改善するために、例えばMa
rkel、 Gray氏による”Linear Pre
dictionof 5peech“第10章(Spr
inger−Verlag社、 1976)(文献2)
にあるように、lQm s程度の固定長フレームで求め
たスペクトルのフレーム間での差分の変化をもとに、フ
レーム長を固定区間の整数倍に可変にする方法が提案さ
れているが、この改善策でも、問題がある。すなわち、
かかる方法においては、上述のようにしたときに聴覚と
の対応づけの良くない特徴パラメータを用いてフレーム
長の可変を行っていることと、フレーム長の可変方法が
固定区間長を基にしており自由度がないために、フレー
ム長の増大区間を増してビットレートを低減すると、音
質が大きく劣化するという問題点があった。
さらにこれらの従来方法では、声道の特性を表すスペク
トルパラメータの量子化には、各々のスペクトルパラメ
ータの瞬時的な歪を小さくするスカラ量子化を通常用い
ており、スペクトルパラメータ間の周波数上の相関を利
用してあらかじめ所定ビット数のコードブックを作成し
ておき、前記パラメータをこのコードブックの一つの符
号で表現することにより伝送情報量を温かに低減するベ
クトル量子化の手法は取り入れられていなかった。
従って、この点からも、伝送情報量の低減において、ベ
クトル量子化の手法を用いるものに比し、劣っていた。
ベクトル量子化は、上述のように伝送情報量の低減を可
能とするから、ビットレート低域の有力な手段の一つで
はある。しかしながら、従来のベクトル量子化法では、
ビットレート低減には有効なものの、通常は、例えばV
、Linde″An Algorithmfor Ve
ctor Quantizater Design ’
(IEEE Trans。
Comm、、 C0M−28,PP、、 1980) 
 (文献3)にあるように、音声の特徴の全く異なる母
音、過渡部、子音部等を一種類の有限ビット数(例えば
10ビット程度)のコードブックで表しているため、こ
のような有限ビット数のコードブックを用いて音声の特
徴の大きく異なる音韻のスペクトルパラメータを良好に
表現することは難しく、従って、従来のベクトル量子化
法では、音質が劣化していた。さらに、スペクトルパラ
メータにベクトル量子化を適用する際に、通常20m5
の固定長フレーム毎に行っているので、前述の固定長フ
レームの場合と同様な問題点があった。
本発明の目的は、音源信号伝送に必要な情報量を大幅に
低減することができ、ビットレートを大幅に下げても合
成音声の聴覚的な劣化を非常に少なくすることのできる
改良された音声信号符号化復号化方法並びに音声信号符
号化装置及び音声信号復号化装置を提供することにある
〔課題を解決するための手段〕
本発明の音声信号符号化復号化方法は、離散的な音声信
号を入力し聴覚の特性と対応の良い方法により前記音声
信号を非一様な区間に分割し、その分割された区間の全
部または一部の区間における前記音声信号のスペクトル
を表すパラメータを求め、このパラメータの周波数上の
相関を利用して作成した複数種類のコードブックのうち
一種類のコードブックを選択し前記コードブックを用い
てパラメータを量子化し、前記区間の全部または一部の
区間における音源信号を複数個のパルス列の組合せで表
して伝送し、 伝送されたパルス列を用いて前記区間の音源信号を復元
し前記選択されたコードブックを用いてスペクトルパラ
メータを復号して前記音声信号を表す合成音声信号を出
力することを特徴としている。
また、本発明の音声信号符号化装置は、入力した離散的
な音声信号系列から聴覚の特性と対応の良い特徴パラメ
ータを抽出しそのパラメータを用いて音声信号を非一様
な時間区間にセグメンテーションするセグメンテーショ
ン回路と、分割された区間全部または一部の区間の音声
信号からピッチ周期を表すピッチパラメータを計算する
ピッチ計算回路と、 短時間スペクトル特性を表すスペクトルパラメータを求
め、前記区間の音声信号の性質に応じてパラメータの周
波数上の相関を利用して作成した複数個のコードブック
の中から一種類のコードブックを選択しスペクトルパラ
メータを前記コードブックを用いて量子化するスペクト
ルパラメータ計算回路と、 分割された区間の全部または一部の区間における音源信
号を表す複数個のパルス列の組合せを計算する音源パル
ス計算回路と、 スペクトルパラメータとピッチパラメータと音源パルス
列を組み合わせて出力するマルチプレクサ回路とを有す
ることを特徴としている。
更に、本発明の音声信号復号化装置は、音声信号のスペ
クトルパラメータを表す符号とピッチパラメータを表す
符号と音源パルス列を表す符号とを入力して分割するデ
マルチプレクサ回路と、 複数種類のコードブックの中から一種類のコードブンク
を選択して前記コードブックを用いてスペクトルパラメ
ータを復号化するスペクトルパラメータ復号回路と、 ピッチパラメータと音源パルス列を用いて非一様に分割
された区間全体の音源信号を復元する音源復元回路と、 復元された音源信号とスペクトルパラメータを用いて前
記区間の音声信号を合成する合成フィルタとを有するこ
とを特徴としている。
〔作用〕
上記のようにして音声信号の符号化復号化を行うため、
音源信号伝送に必要な情報量を大幅に低減でき、しかも
ビットレートを大幅に下げても合成音声の聴覚的な劣化
の非常に少ない符号化復号化処理を行える。加えて、従
来のベクトル量子化法よりも音質の劣化は少ない。
音声信号符号化装置は、上記構成のセグメンテーション
回路、ピッチ計算回路、スペクトルパラメータ計算回路
、音源パルス計算回路、マルチプレクサ回路を有するこ
とにより、上述のような符号化処理が行える。音声信号
復号化装置は、上記構成のデマルチプレクサ回路、スペ
クトルパラメータ復号回路、音源復元回路、合成フィル
タを有することにより、その復号化処理を行える。
〔実施例〕 次に、本発明の実施例について図面を参照して説明する
第1図は本発明による音声信号符号化復号化方法並びに
音声信号符号化装置及び音声信号復号化装置の一実施例
の構成を示すブロック図であり、また、第2図はその原
理の説明に供するブロック図である。
本発明に係る音声信号の符号化復号化方法は、離散的な
音声信号を入力し聴覚の特性と対応の良い方法により音
声信号を非一様な区間に分割し分割された区間の全部ま
たは一部の区間における音源信号を複数個のパルス列の
組合せで表して伝送し、前記パルス列を用いて前記区間
の音源信号を復元して゛音声信号を良好に表す合成音声
信号を出力することを基本としている。かかる音声信号
符号化復号化方法は、本出願人の同日出願に係るもので
あるが、本発明では、更にこれに加えて、送信側、受信
側において、それぞれ次のような処理が加味される。
すなわち、送信側では、離散的な音声信号を入力し聴覚
の特性と対応の良い方法により音声信号を非一様な区間
に分割し分割された区間の全部または一部の区間におけ
る音声信号のスペクトルを表すパラメータを求め、パラ
メータの周波数上の相関を利用して作成した複数種類の
コードブックのうち一種類のコードブックを選択し前記
コードブックを用いて前記パラメータを量子化し、前記
区間の全部または一部の区間における音源信号を複数個
のパルス列の組合せで表して伝送し、受信側では、前記
パルス列を用いて前記区間の音源信号を復元し前記選択
されたコードブックを用いてスペクトルパラメータを復
号して音声信号を良好に表す合成音声信号を出力する。
以下、まず、本発明に従う符号化処理の原理について、
第2図(a)を用いて説明する。図において、セグメン
テーション尺度計算部400は、音声信号を入力し、音
声特徴変化の速い子音部でも精度よく分析できるような
短時間区間(例えば5m5)毎に、聴覚の特性との対応
の良いセグメンテーション尺度を計算する。ここではこ
の尺度として、動的尺度D (t)を用いる。この尺度
は5ms毎に求めたLPCケプストラムCi  (1≦
i≦p)を用いて下式の様に書ける。
ここで、aiは、 である。
尚、この計算法についての詳細な説明はFurui氏に
よる@On the Role of 5pectra
l Transitionfor 5peech Pe
ception”と題した論文(J、Acoustic
alSociety of America、 vol
、80.pp、l016−1025.1986)(文献
4)に記載されているので、ここでは詳細は省略する。
また、(1)式のかわりにパワ環a。
を含めた(3)式や他の良好な方法を用いることも出来
る。
セグメンテーション部410は、セグメンテーション尺
度を入力して、音声信号を非一様に分割(セグメンテー
ション)する。これは前記(1)あるいは(3)式の尺
度を用いて行う。まず前記尺度の極大値の付近毎に音声
信号をあらかじめ分割する。ここで、前記文献4に記さ
れているように、前記尺度の極大値の前後数IQm s
の部分は、子音から母音、母音から子音への調音結合部
分にほぼ対応しており、音韻知覚の際の聴覚的に非常に
重要な部分であることが報告されている。従ってこのよ
うな聴覚的に重要な部分を除き前記尺度がある程度連続
的に小さくなる箇所で音声信号をセグメンテーションす
る。セグメンテーションした様子を第2図(b)に示す
。ここで第2図(b)の上段は音声波形、下段は動的尺
度とセグメンテーションの一例を示す。
次に、LPG分析部430はセグメンテーションされた
区間全体あるいはこの中の一部分(例えば10m s 
、 20m s 、あるいは有声音のときは代表的な−
ピッチ区間程度)の音声信号を分析してLPC係数を求
める。なお、一部分の音声信号から求める場合は、セグ
メンテーション部410で求めたケプストラムから周知
の方法によってLPG係数に変換することもできる。ピ
ッチ計算部435は、セグメンテーションされた区間の
一部あるいは全体の音声信号から周知の方法によってピ
ッチ周期およびピッチゲイン(ピッチ周期だけ離れた所
の自己相関係数)の計算を行う。判別部445はピッチ
ゲインを用いてあらかじめ定められたしきい値と比較す
ることによってセグメンテーションされた区間が母音定
常部か否かの判別を行う。ここでこの判別には、セグメ
ンテーション区間内の電力とピンチゲインの値があらか
じめ定められたしきい値よりも大きいか否かによって判
別する方法を用いることができる。
ベクトル量子化部440はLPG係数のベクトル量子化
を行う。ベクトル量子化部440ではLPG係数間の周
波数軸上の相関を利用してあらかじめ作成した複数種類
(M)のコードブック(符号帳)を有していることを特
徴としている。例えば母音定常部のLPG係数に最適な
コードブック、子音部に最適なコードブック、過渡部に
最適なコードブックという具合である。また各コードブ
ックは各部の音声の特徴に最適なようにり、−LMビッ
トで表されている。コードブック作成法としては例えば
前記文献3を参照することができる。ここでは簡単の為
に、M=2とし、母音定常部に最適なコードブック44
11とそれ以外の区間に対して最適なコードブック44
1□を有する場合を考える。まず判別情報を用いて選択
部442においてコードブック4411と441□のい
ずれかのコードブックを選択する。そして選択されたコ
ードブックの内からLPG係数との距離が最も小さ(j
<るコードベクトルを求め、これを表す符号を出力する
。さらにこの符号から復号化部425においてLPG係
数を復号化して出力する。ここでこの距離尺度としては
2乗距離がもっとも単純であり周知であるが、これ以外
にも種々のものが提案されている。これらの距離尺度に
ついての詳細はA、Gersho氏らによる”Vect
or quantization :^Pattern
−matchingtechnique for 5p
eech coding”(IEEE Communi
cation Magazine、 pp、15−21
.1983) (文献5)に述べられているのでここで
は説明を省略する。さらに効率的なベクトル量子化法と
して予測ベクトル符号化なども知られており、これら種
々の効率的なベクトル量子化法については前記文献5の
他に例えばR,M、Gray氏らによる“Vector
 quantizationfor 5peech c
oding and recognition ” (
J、 Acoustical Soc、 Americ
a、 vol−80+ 5upp1.1.Q1+ 19
86)(文献6)にも述べられており、これらの効率的
な方法を用いることもできる。更に、ベクトル量子化部
440では母音定常部に対してはベクトル量子化を区間
全体で行っても良いし、ビットレートをさらに減らすた
めに、母音のスペクトル特徴がそれほど変化していない
ことを利用して、前記区間の一部の区間のLPG係数に
対してのみベクトル量子化を行うようにしても良い。
音源計算部420は、セグメンテーションされた区間が
母音定常部のときは、前記セグメンテーション区間をピ
ンチ区間の周期毎のサブフレームに分割し、そのうちの
1つのピッチ区間について、音源パルス列を計算する。
ここで音源パルス列の計算には、特願昭59−2724
35号明細書(文献7)を参照することができる。従っ
て、本発明によれば、従来方式に比べ1ピッチ区間(代
表区間)の音源パルスの数を大幅に増やすことが可能で
あるため、後述のように他のピッチ区間は補間処理を用
いて復元するとしても、前記区間全体の音源信号を良好
に表すことができる。
他の方法としては、代表区間で求めた音源パルスを基準
として各ピッチ区間に毎に次式で定義される重みづけ2
乗誤差を最小化するように振幅係数Ck1位置Tkを求
めて伝送しても良い。
E= ・・・ (4) ここでh (n)は合成フィルタのインパルス応答、w
 (n)はマルチパルス法(文献7)で既知の重みづけ
関数、gilmiは代表区間のi番目のパルスの振幅9
位置、x (n)は代表区間以外のピンチ区間の音声信
号を表す。Cア、Tkはマルチパルス法の音源パルスの
振幅と位置を求める方法と同じ方法で求めることができ
、これについては前記文献7を参照できる。この方法に
よれば、前述の音源パルスを補間する方法よりは情報量
が若干増加するが、特性はさらに改善されると期待でき
る。
また上式において情報量を減らすためにTkとしてはピ
ッチ計算部435で求めたピッチ周期Tを用いても良い
。このようにすると各ピッチ毎にT。
を送らなくても良い。
一方、前記セグメンテーション区間が母音定常部でない
ときは、区間全体で音源パルス列を求める。
送信側の伝送情報は音源パルス列の振幅1位置、セグメ
ンテーションされた区間の長さを示すセグメンテーショ
ン情報、ピッチ周期、判別情報である。さらにピッチ区
間毎に(4)式の係数を求める構成のときにはこれらも
伝送する。受信側では、母音定常部の時は、伝送された
音源パルス列の振幅と位置をピッチ周期毎に滑らかに変
化させたり、セグメンテーションされた区間の間での音
源信号に補間処理を施し、伝送されたピッチ区間以外の
ピッチ区間のパルス列を復元しセグメンテーションされ
た区間の音源信号を復元する。
次に、第1図を参照して説明する。
第1図において、送信側は音声信号符号化装置を、また
受信側は音声信号復号化装置をそれぞれ含み、両者間に
は適宜の伝送路が設けられている。
音声信号符号化装置は、入力した離散的な音声信号系列
から聴覚の特性と対応の良い特徴パラメータを抽出し前
記パラメータを用いて前記音声信号を非一様な時間区間
にセグメンテーションするセグメンテーション回路と、
前記分割された区間全部または一部の区間の音声信号か
らピッチ周期を表すピッチパラメータを計算するピッチ
計算回路と、短時間スペクトル特性を表すスペクトルパ
ラメータを求め、前記区間の音声信号の性質に応じてパ
ラメータの周波数上の相関を利用して作成した複数個の
コードブックの中から一種類のコードブックを選択し前
記スペクトルパラメータを前記コードブックを用いて量
子化するスペクトルパラメータ計算回路と、前記分割さ
れた区間の全部または一部の区間における音源信号を表
す複数個のパルス列の組合せを計算する音源パルス計算
回路と、前記スペクトルパラメータと前記ピッチパラメ
ータと前記音源パルス列を組み合わせて出力するマルチ
プレクサ回路とを有する。
音声信号復号化装置は、音声信号のスペクトルパラメー
タを表す符号とピッチパラメータを表す符号と音源パル
ス列を表す符号とを入力して分離するデマルチプレクサ
回路と、複数種類のコードブックの中から一種類のコー
ドブックを選択して前記コードブックを用いてスペクト
ルパラメータを復号するスペクトルパラメータ復号回路
と、前記ピッチパラメータと前記音源パルス列を用いて
非一様に分割された区間全体の音源信号を復元する音源
復元回路と、前記復元された音源信号と前記スペクトル
パラメータを用いて前記区間の音声信号を合成する合成
フィルタとを有する。
音声信号符号化、復号化処理は、以下のようにしてなさ
れる。
本発明の一実施例を示す第1図において、入力端子50
0から離散的な音声信号を入力する。セグメンテーショ
ン尺度計算回路505は第2図(a)のセグメンテーシ
ョン尺度計算部400と同一の計算を行い、セグメンテ
ーション尺度を出力する。
セグメンテーション回路510は第2図(a)のセグメ
ンテーション部410と同一の処理を行い、音声信号を
非一様な区間にセグメンテーションし、セグメンテーシ
ョン区間の長さを表すセグメンテーション情報とセグメ
ンテーションされた音声信号を出力する。LPG計算回
路520は第2図(a)のLPC分析部430と同一の
処理を行い、セグメンテーションされた音声信号につい
て、LPG分析を行い、LPG係数ベクトル量子化器5
30へ出力する。ピッチ計算回路535は前記第2図(
a)に関して説明したピッチ計算部435と判別部44
5の動作を行い、前記音声信号に対して、良く知られて
いるように自己相関法によりピッチ周期T、ピッチゲイ
ンPgを計算し、Pgの値を用いて前記区間の音声信号
が母音定常部かそうでないかを判別し、Pgと判別情報
を出力する。ベクトル量子化器530は前記第2図(a
)の説明中で述べたベクトル量子化部440と同一の動
作を行い、LPC係数を所定のビット数で量子化しマル
チプレクサ600へ出力する。逆量子化器537は、母
音定常部用の逆量子化テーブルとそれ以外用の2種類を
有し、判別情報を用いて逆量子化テーブルを切り替えて
量子化した結果を逆量子化して出力する。
重みづけ回路540は、セグメンテーションされた音声
信号と逆量子化されたLPG係数を用いて前記信号に重
みづけを施す。重みづけの方法は前記文献7の重みづけ
回路(200)を参照することができる。インパルス応
答計算回路560は逆量子化されたLPG係数を用いて
インパルス応答を計算する。インパルス応答計算の方法
は前記文献5のインパルス応答計算回路(170)を参
照することができる。自己相関関数計算回路570は前
記インパルス応答の自己相関関数を計算し音源パルス計
算回路580へ出力する。自己相関関数の計算法は前記
文献7の自己相関関数計算回路(180)を参照するこ
とができる。相互相関関数計算回路550は前記重みづ
けられた信号と前記インパルス応答との相互相関関数を
計算して音源パルス計算回路580へ出力する。この計
算法については、前記文献7の相互相関関数計算回路(
210)を参照することができる。
音源パルス計算回路580は、セグメンテーションされ
た区間が母音定常部の時は、前記第2図(a)の説明中
で述べた様に、前記区間をピッチ周期毎のサブフレーム
に分割して中央付近のサブフレーム区間について音源パ
ルス列を計算する。
一方、母音定常部でないときは、前記区間全体に対して
音源パルス列を計算する。音源パルス列の計算法につい
ては前記文献7の駆動信号計算回路(220)を参照す
ることができる。量子化器590は前記音源パルス列の
振幅9位置を所定のビット数で量子化してマルチプレク
サ600へ出力する。量子化器590の動作は前記文献
7の符号化回路(230)を参照することが出来る。マ
ルチプレクサ600は量子化された音源パルス列、LP
G係数、ピンチ周期、セグメンテーション情報、判別情
報を組み合わせて出力する。
一方、受信側では、デマルチプレクサ610は、音源パ
ルス情報、LPG係数、ピッチ周期、セグメンテーショ
ン情報、判別情報を分離して出力する。音源パルス復号
器620は音源パルス列の振幅。
位置を復号する。LPC復号器640は送信側の逆量子
化器537と同一の動作を行う。とッチ復号器645は
ピッチ周期を復号する。音源復元器630は判別情報、
セグメンテーション情報を入力して、区間が母音定常部
の時は、復号した1ピッチ区間の音源パルス列を用いて
セグメンテーション区間全体の音源信号を復元し出力す
る。ここで伝送されていないピッチ区間の音源パルス列
の復元法としては、隣接セグメンテーション区間の音源
パルス列を用いて補間処理によって復元する方法などが
知られており、この詳細については前記文献7を参照す
ることかできる。またこれ以外にも他の周知な方法を用
いることもできる。一方、区間が母音定常部でないとき
には、受信した音源パルス列を用いて前記区間の音源信
号を発生して出力する。補間器650は復号したLPG
係数、判別情報、ピッチ周期を用いて、セグメンテーシ
ョン区間が母音定常部のときはピンチ周期毎にLPG係
数をPARCOR係数上で補間する。一方、前記区間が
母音定常部でないときには係数を補間せずに合成フィル
タ660へ出力する。これは母音定常部以外では音声信
号のスペクトル特徴の変化が速いので補間によってかえ
って大きな歪が入ることを防ぐ為である。合成フィルタ
660はLPG係数、復元された音源信号、セグメンテ
ーション情報を用いてセグメンテーション区間全体にお
ける音声信号を合成し端子670を通して出力する。
以上のように、上記構成によれば、聴覚の特性と対応づ
けのよい特徴パラメータを用いて音声信号を非一様にセ
グメンテーションし、さらにセグメンテーションされた
区間のスペクトルの特徴によって、複数種類のベクトル
量子化器を切り替えてスペクトルパラメータの量子化を
行い、さらに前記区間が母音定常部のときはその区間の
うちの1ピッチ区間について音源パルス列を求め、そう
でないときは区間全体で音源パルス列を求めているので
、音源信号伝送に必要な情報量を大幅に低減することが
できる。従ってビットレートを大幅に下げても合成音声
の聴覚的な劣化は非常に少ない。
上述した実施例はあくまで本発明の一実施例に過ぎずそ
の変形例を種々考えられる。
例えば、セグメンテーションされた区間が母音定常部で
あるときには、相互相関関数計算回路550は前記区間
全体に対してではなく、前記区間の中央付近の1ピッチ
区間に対してのみ相互相関関数を計算しても良い。これ
は実際に音源パルス列を求めるのは1ピッチ区間である
ためである。この方法では特性は少し劣化するが演算量
はほぼP/N(ここでPはピッチ周期、Nは母音定常部
のセグメンテーション区間の長さ)に低減できる。
また、音源パルスの計算法としては上述の実施例の他に
周知の良好な方法を用いることもできる。
これについては、K、Ozawa“A 5tudy o
f Pu1seSearch Algorithms 
for Multi−pulse 5peechCod
ec Realization”(J、5electe
d Area ofCommunications+ 
pp、+ 1987) (文献8)を参照することがで
きる。
また、セグメンテーションされた区間が母音定常部のと
きは、音源パルス列を求める1ピッチ区間としては、固
定ではなく、最も良好な合成音声が得られるように、求
めるべきピッチ区間をセグメンテーションされた区間内
で探索して求めるようにすることもできる。この処理に
よって音質はさらに良好になるが演算量は若干増加する
。具体的な方法については前記文献7を参照することが
できる。
また、前記第2図(a)でも説明したように、送信側で
代表区間の音源パルス列を基準にして、伝送されていな
い他のピッチ区間を良好に表すような係数を前記(4)
式を用いて計算して伝送するようにしても良い。但し、
この場合、特性は更に改善されるが伝送情報量は若干増
加する。
また、前記第2図(a)で説明したように、ベクトル量
子化器の種類を2種類以上(例えば、母音定常部、過渡
部、子音部など)に増やすことによってさらに精度の良
い量子化を行うことができる。
また、合成フィルタ660の係数の補間法としては、対
数断面積比上や他のパラメータ上で補間することもでき
る。さらに補間法としては線形補間以外に対数補間等を
用いることもできる。これらの方法の詳細についてはB
、S、Ata1氏らによる“5peech Analy
sis and 5ynthesis by Line
arPrediction of the 5peec
h Wave″(J、 Acous t、 Soc 。
America、 pp、637−655.1971 
)  (文献9)を参照することができる。
また、受信側でピッチ周期をピッチ区間毎に線形補間に
よって滑らかに変化させることによって合成音質はさら
に改善される。
〔発明の効果〕
以上説明したように、本発明の音声信号符号化復号化方
法によれば、音声信号を符号化し伝送して復号化したと
き、音声信号を良好に表す合成音声信号を得ることがで
きる。従来の固定長フレームによるものや、あるいは固
定長フレームで求めたスペクトルのフレーム間での差分
の変化を基にフレーム長を可変にするものに比し音質の
劣化を少なくすることができる。聴覚の特性と対応づけ
のよい特徴パラメータを用いて音声信号を非一様に分割
することができると共に、分割された区間が母音定常部
のときはその区間のうち1ピッチ区間について音源パル
ス列を求め、そうでないときは区間全体で音源パルスを
求めることが可能であり、かつこれに加えて、スペクト
ルパラメータの量子化にあたっては、分割された区間の
全部または一部の区間における音声信号のスペクトルを
表すパラメータを求め、そのパラメータの周波数上の相
関を利用して作成した複数種類のコードブックのうち一
種類を選択的に用いて量子化を行うから、この点で従来
のヘクトル景子化法よりも音質の劣化が少なく、音源信
号伝送に必要な情報量を大幅に低減することができると
同時にビットレートを大幅に下げても合成音声の聴覚的
な劣化の非常に少ない符号化復号化処理を行うことがで
きるので、特に低いビットレートで効率的に符号化、復
号化する場合に適している。
さらに本発明によれば、音声信号符号化復号化方法を実
施するのに好適な音声信号符号化装置及び復号化装置が
得られる。
【図面の簡単な説明】
第1図は本発明による音声信号符号化復号化法法並びに
音声信号符号化装置及び音声信号復号化装置の一実施例
の構成を示すブロック図、第2図は本発明の説明に供す
る原理ブロック図及び波形図である。 400  ・・・セグメンテーション尺度計算部410
  ・・・セグメンテーション部420  ・・・音源
計算部 430 ・・・LPG分析部 435  ・・・ピッチ計算部 440  ・・・ベクトル量子化部 505  ・・・セグメンテーション尺度計算回路51
0  ・・・セグメンテーション回路520  ・・・
LPG計算回路 530  ・・・ベクトル量子化器 535  ・・・ピッチ計算回路 540  ・・・重みづけ回路 550  ・・・相互相関関数計算回路560 ・・・
インパルス応答計算回路570  ・・・自己相関関数
計算回路590  ・・・量子化器 600  ・・・マルチプレクサ 610  ・・・デマルチプレクサ 620.640 ・・・復号器 630  ・・・音源復元器 650 ・・・補間器 660  ・・・合成フィルタ

Claims (3)

    【特許請求の範囲】
  1. (1)離散的な音声信号を入力し聴覚の特性と対応の良
    い方法により前記音声信号を非一様な区間に分割し、そ
    の分割された区間の全部または一部の区間における前記
    音声信号のスペクトルを表すパラメータを求め、このパ
    ラメータの周波数上の相関を利用して作成した複数種類
    のコードブックのうち一種類のコードブックを選択し前
    記コードブックを用いてパラメータを量子化し、前記区
    間の全部または一部の区間における音源信号を複数個の
    パルス列の組合せで表して伝送し、 伝送されたパルス列を用いて前記区間の音源信号を復元
    し前記選択されたコードブックを用いてスペクトルパラ
    メータを復号して前記音声信号を表す合成音声信号を出
    力する音声信号符号化復号化方法。
  2. (2)入力した離散的な音声信号系列から聴覚の特性と
    対応の良い特徴パラメータを抽出しそのパラメータを用
    いて音声信号を非一様な時間区間にセグメンテーション
    するセグメンテーション回路と、 分割された区間全部または一部の区間の音声信号からピ
    ッチ周期を表すピッチパラメータを計算するピッチ計算
    回路と、 短時間スペクトル特性を表すスペクトルパラメータを求
    め、前記区間の音声信号の性質に応じてパラメータの周
    波数上の相関を利用して作成した複数個のコードブック
    の中から一種類のコードブックを選択しスペクトルパラ
    メータを前記コードブックを用いて量子化するスペクト
    ルパラメータ計算回路と、 分割された区間の全部または一部の区間における音源信
    号を表す複数個のパルス列の組合せを計算する音源パル
    ス計算回路と、 スペクトルパラメータとピッチパラメータと音源パルス
    列を組み合わせて出力するマルチプレクサ回路とを有す
    る音声信号符号化装置。
  3. (3)音声信号のスペクトルパラメータを表す符号とピ
    ッチパラメータを表す符号と音源パルス列を表す符号と
    を入力して分割するデマルチプレクサ回路と、 複数種類のコードブックの中から一種類のコードブック
    を選択して前記コードブックを用いてスペクトルパラメ
    ータを復号化するスペクトルパラメータ復号回路と、 ピッチパラメータと音源パルス列を用いて非一様に分割
    された区間全体の音源信号を復元する音源復元回路と、 復元された音源信号とスペクトルパラメータを用いて前
    記区間の音声信号を合成する合成フィルタとを有する音
    声信号復号化装置。
JP63085193A 1988-04-08 1988-04-08 音声信号符号化復号化方法並びに音声信号符号化装置及び音声信号復号化装置 Pending JPH01258000A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63085193A JPH01258000A (ja) 1988-04-08 1988-04-08 音声信号符号化復号化方法並びに音声信号符号化装置及び音声信号復号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63085193A JPH01258000A (ja) 1988-04-08 1988-04-08 音声信号符号化復号化方法並びに音声信号符号化装置及び音声信号復号化装置

Publications (1)

Publication Number Publication Date
JPH01258000A true JPH01258000A (ja) 1989-10-16

Family

ID=13851813

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63085193A Pending JPH01258000A (ja) 1988-04-08 1988-04-08 音声信号符号化復号化方法並びに音声信号符号化装置及び音声信号復号化装置

Country Status (1)

Country Link
JP (1) JPH01258000A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02287400A (ja) * 1989-04-28 1990-11-27 Toshiba Corp 予測残差信号ベクトル量子化方式
JPH0475100A (ja) * 1990-07-17 1992-03-10 Sharp Corp 符号化装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02287400A (ja) * 1989-04-28 1990-11-27 Toshiba Corp 予測残差信号ベクトル量子化方式
JPH0475100A (ja) * 1990-07-17 1992-03-10 Sharp Corp 符号化装置

Similar Documents

Publication Publication Date Title
KR100487136B1 (ko) 음성복호화방법및장치
KR100873836B1 (ko) Celp 트랜스코딩
EP1224662B1 (en) Variable bit-rate celp coding of speech with phonetic classification
JP3346765B2 (ja) 音声復号化方法及び音声復号化装置
JP3557662B2 (ja) 音声符号化方法及び音声復号化方法、並びに音声符号化装置及び音声復号化装置
JPH0353300A (ja) 音声符号化装置
KR19990006262A (ko) 디지털 음성 압축 알고리즘에 입각한 음성 부호화 방법
JPH096397A (ja) 音声信号の再生方法、再生装置及び伝送方法
WO2002043052A1 (en) Method, device and program for coding and decoding acoustic parameter, and method, device and program for coding and decoding sound
EP1597721B1 (en) 600 bps mixed excitation linear prediction transcoding
KR20040045586A (ko) 서로 다른 대역폭을 갖는 켈프 방식 코덱들 간의상호부호화 장치 및 그 방법
JP2002268686A (ja) 音声符号化装置及び音声復号化装置
JPH0944195A (ja) 音声符号化装置
US7089180B2 (en) Method and device for coding speech in analysis-by-synthesis speech coders
JPH07225599A (ja) 音声の符号化方法
JP3916934B2 (ja) 音響パラメータ符号化、復号化方法、装置及びプログラム、音響信号符号化、復号化方法、装置及びプログラム、音響信号送信装置、音響信号受信装置
JPH01258000A (ja) 音声信号符号化復号化方法並びに音声信号符号化装置及び音声信号復号化装置
KR0155798B1 (ko) 음성신호 부호화 및 복호화 방법
JP3319396B2 (ja) 音声符号化装置ならびに音声符号化復号化装置
JPH0258100A (ja) 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置
JPH08234795A (ja) 音声符号化装置
JPH01233499A (ja) 音声信号符号化復号化方法及びその装置
JP3006790B2 (ja) 音声符号化復号化方法及びその装置
JP3055901B2 (ja) 音声信号符号化復号化方法及び音声信号符号化装置
JP3063087B2 (ja) 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置