JPH01233499A - 音声信号符号化復号化方法及びその装置 - Google Patents

音声信号符号化復号化方法及びその装置

Info

Publication number
JPH01233499A
JPH01233499A JP63060906A JP6090688A JPH01233499A JP H01233499 A JPH01233499 A JP H01233499A JP 63060906 A JP63060906 A JP 63060906A JP 6090688 A JP6090688 A JP 6090688A JP H01233499 A JPH01233499 A JP H01233499A
Authority
JP
Japan
Prior art keywords
sound source
audio signal
parameter
pitch
sections
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63060906A
Other languages
English (en)
Inventor
Kazunori Ozawa
一範 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP63060906A priority Critical patent/JPH01233499A/ja
Publication of JPH01233499A publication Critical patent/JPH01233499A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は音声信号を低いピットレートで効率的に符号化
及び復号化するための音声信号符号化復号化方法及びそ
の装置に関し、特に聴覚の特性と対応の良い特徴パラメ
ータに基づいて音声信号を非一様に分割し分割した区間
において音声信号の特徴を表すパラメータと音源とを求
めて効率的に符号化及び復号化するための音声信号符号
化復号化方法及びその装置に関する。
〔従来の技術〕
音声信号を低い伝送と、トレード、例えば4.8kb/
s程度以下で伝送する方式としては、ビ、チ補間マルチ
パルス符号化法などが知られている。
これらは音源信号を複数個のパルスの組合せ(マルチパ
ルス)で表し、P帯の特性をデジタルフィルタで表し、
音源パルスの情報(振幅と位it)とフィルタの係数を
一定時間区間(フレーム)毎に求めて伝送している。こ
の方法の詳細については。
例えばOzawa 、Araseki氏による”Low
 t3it RatetlJulti −pulse 
5peech Coder with Natural
Speech Quality’(Proc、I、C,
A+8,8.P、、講演番号9,7.1986)(文献
1)に記載されているのでここでは説明は略す。これら
の方法では、伝送情報量、特に音源情報の伝送量を大福
に低減するために、固定長フレーム(20ms)内には
いるいくつかのピッチ区間の内、1つのピッチ区間に対
してのみ音源パルス列をもとめて伝送していた。
〔発明が解決しようとする課題〕
しかしながらこの従来法でハ1.音源パルス、フィルタ
係数を求める区間長を一定(文献lでFi20ms)と
していた。従って、母音区間ではほぼ周期的な波形が連
続し音声の特徴が余シ変化していないにも拘ず、2Qm
sという短時間毎に情報を伝送するということで非常に
効率が悪<、また子音区間では数msという速い音声の
特徴(フォルマントなど)の変化に追随出来ずに音質劣
化が起こるという問題点があった。また、特にこの問題
点はビットレートが8k b / sよシもかなシ低い
場合に顕著であった。よく知られているように、母音区
間は発声速度にも依存するが、一般に100〜3QQm
sと時間長が長く、この手分以上は音声信号の特徴が殆
ど変化しない定常区間と見なせる。
従って、これを短い2 Q m s 程度のフレーム区
間毎に分析しているのでは効率が非常に悪かった。
一方、子音区間では音声の特徴の変化が速いために、2
0m5のフレームでは長すぎて音声の変化に対応した精
度の良い分析が難しく、再生音声の音質が劣化していた
従来、これらの問題点を改善するために1例えばMar
kel 、Gray氏による”Linear Pred
ictionof 5peech’第1O章(Spri
nger−Verlag社。
1976年)(文献2)にあるように、  10m5程
度の固定長フレームで求めたスペクトルのフレーム間で
の差分の変化をもとに、この変化が小さいときは、フレ
ーム長を固定長区間の整数倍に可変にする方法が提案さ
れている。しかしながら。
このようにしたときに、聴感との対応ずけの良くない特
徴パラメータを用いてフレーム長の可変を行っているこ
と(この場合はフレーム間のスペクトルの差)と、フレ
ーム長の可変性が固定区間長を基にしてその整数倍とし
ており自由度がないために、フレーム長の増大区間を増
してと、トレードを低減すると音質が大きく劣化すると
いう問題点があった。
さらに、これらの従来方式では、声道の特性を表すスペ
クトルパラメータの量子化には、それぞれのスペクトル
パラメータの瞬時的な歪を小さくするスカラ量子化を通
常用いていた。スペクトルパラメータ間の周波数軸上の
相関を利用してあらかじめ所定のと、ト数のコードブッ
クを作成しておき、スペクトルパラメータをこのコード
7°ツクの一つの符号で表現することにより伝送情報量
を遥かに低減するベクトル量子化や、スペクトルパラメ
ータの時間系列の周波数軸上及び時間軸上の相関を利用
してマトリクス状のコード7゛ツクを作成しておき、ス
ペクトルパラメータの時間系列をこの符号で表すマトリ
クス量子化の手法は取シ入れられていなかった。しかし
ながら、従来のベクトル量子化やマトリクス量子化法で
は、ビットレート低減には有効なものの1通常は例えば
Y、Linde”An Algorithm for 
Vector QuantizaterDesign’
(IEERTrans、Comm、、C0M−28。
1980)(文献3)にあるよりに、音声の特徴の全く
異なる母音、過度部、子音部等を区別せずに一種類の有
限ビット数(例えば10ビット程度)のコードン、りで
表しているため、このような−種類のみの有限ビット数
のコードン、りを用いて音声の特徴の大きく異なる部分
のスペクトルパラメータを良好に表現することは難しく
、子音や過度部などでは特に音質が劣化していた。さら
にスペクトルパラメータにベクトル量子化を適用する際
に1通常20 m s位の固定長フレーム毎に分析した
スペクトルパラメータに対して行っているので、前述の
固定長フレームの場合と同様な問題点があった。
〔課題を解決するだめの手段〕
本発明の音声信号符号化復号化方法は、離散的な音声信
号を人力し聴覚の特性と対応の良い方法により前記音声
信号を非一様な区間に分割し1分割された区間の全部ま
たは一部の区間における前記音声信号のスペクトルを表
すパラメータを求め。
前記パラメータの周波数軸上の相関ろるいは周波数軸上
及び時間軸上の相関を利用して作成しておいた複数種類
のコードブックを用いて前記パラメータを表し、前記分
割された区間の全部または一部の区間における音源信号
を複数個のパルス列の組合せで表して伝送し、前記パル
ス列を用いて前記音源信号を復元し、前記コードン、り
を用いてスペクトルパラメータを復号して前記音声信号
を良好に表す合成音声信号を出力する構成である。
本発明の音声信号符号化装置は1人力した離散的な音声
信号系列から聴覚の特性と対応の良い特徴パラメータを
抽出し前記特徴パラメータを用いて前記音声信号系列を
非一様な時間区間に分割するセグメンテーシ曹ン手段と
、前記分割された区間の全部または一部の区間における
音声信号からピッチ周期を表すビ、チパラメータを計算
するビ、チ計算手段と、短時間スペクトル特性を表すス
ペクトルパラメータを求め前記スペクトルパラメータの
周波数軸上の相関あるいは周波数軸上及び時間軸上の相
関を利用して作成しておいた複数種類のコードン、りの
中から前記音声信号の性質に応じて一種類を選択して前
記スペクトルパラメータを量子化するスペクトルパラメ
ータ計算手段と。
前記分割された区間の全部または一部の区間における音
源信号を表す複数個のパルス列を計算する音源パルス計
算手段と、前記スペクトルパラメータと前記ビ、チパラ
メータと前記パルス列を表す符号とを組み合わせて出力
するマルチプレクサ手段とを備える。
本発明の音声信号復号化装置1iFi、音声信号のスペ
クトルパラメータとビ、チパラメータと音源パルス列を
表す符号とを人力して分離するデマルチプレクサ手段と
、前記スペクトルパラメータの周波数軸上の相関あるい
は周波数軸上及び時間軸上の相関を利用して作成してお
いた複数棟類のコードン、りを用いて前記スペクトルパ
ラメータを復号するスペクトルパラメータ復号手段と、
前記ビ、チパラメータと前記音源パルス列を表す符号と
を用いて非一様に分割された区間全体の音源信号を復元
する音源復元手段と、復元された音源信号と前記スペク
トルパラメータとを用いて前記区間の音声信号を合成す
る合成フィルタ手段とを備える。
〔作用〕
本発明の作用を第2図fa)を用いて説明する。同図に
おいて、セグメンテーション尺度計算部400は音声信
号を人力し、音声特徴変化の速い子音部でも精度よく分
析できるような短時間区間(例えば5ms )毎に、聴
覚の特性との対応の良いセグメンテーション部度を計算
する。ここでは、この尺度として動的尺度D [tlを
用いる。この尺度は5ms毎に求めたLPCケプストラ
ムCiを用いて下式の様に書ける。
尚、この計算法についての詳細な説明はFurui氏に
よる’On the Role of 5pectra
l Transitionfor 5peech Pe
ception’と題した論文(J。
Acoustical 5ociety of Ame
rica、vol、80゜[)I)、1016−102
5.1986)(文献4)に記載されているので、ここ
では詳細は省略する。また(1)式の代りにパワ環aQ
を含めた(3)式や他の良好な方法を用いることも出来
る。
セグメンテーション部410はセグメンテーション尺度
を人力して、音声信号を非一様に分割(セグメンテーシ
ョン)する。これは上記(1)するいは(3)式の尺度
を用いて行う。まず、上記尺度の極大1直の付近毎に音
声信号をあらかじめ分割する。
ここで、上記文献4に記されているように、上記尺度の
極大値の前後数I Qmsの部分は、子音から母音、母
音から子音への調音結合部分にほぼ対応しており、音韻
知覚の際の聴覚的に非常に重要な部分であることが報告
されている。従って、このような聴覚的に重要な部分を
除き上記尺度がある程度連続的にあらかじめ定められた
しきい値よりも小さくなる箇所で音声信号をセグメンテ
ーションする。動的尺度音用いてセグメンテーションし
た様子を第2図tblに示す。ここで、第2図(blの
上段は音声波形、下段はセグメンテーションされた一例
を示す。ここで、動的尺度は実線で、かつセグメンテー
ションした箇所は垂直の破線で示されている。
次に、LPC分析部430はセグメンテーションされた
区間全体あるいはこの中の一部分(例えばioms、2
0m5.あるいは有声音のときは代表的な一ピッチ区間
程度)の音声信号を分析してLL’C係数を求める。な
お、一部分の音声信号から求める場合は、セグメンテー
ション部400で求めたケプストラムから周知の方法に
よってLPG係数に変換することもできる。ピッチ計算
部435はセグメンテーションされた区間の一部あるい
は全体の音声信号から周知の方法によってビ、チ周期お
よびピッチゲイン(ピッチ周期だけ離れた所の自己相関
係数の値)の計算を行う。判別部445はピッチゲイン
を用いてあらかじめ定められたしきい這と比較すること
によってセグメンテーションされた区間が母音定常部か
の判別を行なう。ここで、この判別にはセグメンテーシ
ョン区間内の1力とピッチゲインの1直があらかじめ定
められたしきい値よシも大きいか否かによって判別する
方法を用いることができるが、他の良好な方法を用いる
こともできる。
マトリクス/ベクトル童子化部440はLPC係数のベ
クトル量子化またはマトリクス量子化を行う。この量子
化部440ではLPC係数間の周波数軸上の相関を利用
してあらかじめ定められた複数種類(Ml)のベクトル
コードブック(符号帳)4411と、上記係数の時系列
に対して2周波数上及び時間フレーム間の相関を利用し
てあらかじめ定められた複数種類(M2)のマトリクス
コードブック4412を有していることを特徴としてい
る。ここで、セグメンテーションされた区間が母音定常
部では周波数方向のみならず時間方向の相関も非常に強
いので1両方向の相関を利用して伝送すべき情報を遥か
に低減するために、マトリクスコードブック4412を
用いて符号化する。それ以外の区間では1周波数方向の
相関が強いので。
複数種類のベクトルコードブック4411を用いる。こ
れは例えば子音部に最適なベクトルコードズック、過渡
部に最適なベクトル量子化法、りという具合いである。
また、各コードブックは各部の音声を良好に表せるよう
に異なるビット数であられされている。ベクトルコード
ブック作成法としては1例えば上記文献3を参照するこ
とができる。また、マトリクスコードブックの作成法は
例えばS、Roucos氏らによる’Segment 
Quantizationfor Very−1ow−
rate 5peech Coding’、(Proc
+ICASSF、1565−1568.1982)(文
献5)や白木氏らによる1音声の時空間パターン符号化
の最適法1(日本音響学会資料885−45)(文献6
)などを参照することができる。ここでは簡単の為にM
L”1 #”!”Lとし、母音定常部に最適なマトリク
ス量子化プ、り4412とそれ以外の区間に対して最適
なベクトルコードブック4411を有する場合を考える
。まず1判別情報を用いて選択部442においてコード
ブック4411 。
4412のいずれかのコードブックを選択する。
そして選択されたコードブックの内からLPC係数との
距離が最も小さくなるコードベクトルを求め、これを表
す符号を出方する。ここで、この距離尺度としては2乗
距離が最も単純であシ周知であるが、これ以外にも種々
のものが提案されている。これらの距離尺度についての
詳細は入、Gersh。
氏による’Vector Quantization:
A pattern−matching techni
que for 5peech coding’(IE
Eh:  CommunicationMagazin
e、pp、15−21.1983)(文献7)に述べら
れているのでここでは説明を省略する。さらに、効率的
なベクトル量子化法として予測ベクトル符号化なども知
られておシ、これら種々の効率的なベクトル量子化法に
ついては上記文献7の他に例えば几0M。
Gray氏による”Vector Quantizat
ion forSpeech Coding and 
Recognition’(J、Acoustica1
8oc、America、vol、80,81pl)1
,1.Ql、1986 )(文献8)にも述べられてお
り、これらの効率的な方法を用いることもできる。更に
、量子化部440では母音定常部に対してはマトリクス
量子化を区間全体のLi’C係数の時系列にたいして行
っても良いし、ビットレート全ざらに減らすために、母
音のスペクトル特徴がそれほど変化していないことを利
用して上記区間の一部の区間のLPC係数の時系列に対
してのみマトリクス量子化を行うようにしても良い。こ
の符号から復号化部425においてLPC係数を復号化
して出力す4復号化部425ではマトリクスコード1ツ
ク4411に対応する復号化テーブルとベクトルコード
ブック4412に対応する復号化テーブルとを有してい
る。
音源計算部420はセグメンテーションされた区間が母
音定常部のときは、上記セグメンテーシ曹ン区間ヲピッ
チ区間の周期毎のサブフレームに分割し、そのうちの1
つのピッチ区間について音源パルス列を計算する。ここ
で音源パルス列の計算には、特願昭59−272435
号明細書(文献9)を鯵照することができる。
従って1本発明によれば、従来方式に比べ1ピッチ区間
(代表区間)の音源パルスの数を大幅に増やすことが可
能であるため、後述のように他のど、チ区間は補間処理
を用いて後元するとしても、上記区間全体の音源信号を
良好に表すことができる。他の方法としては、代表区間
で求めた音源パルスを基準として各ピッチ区間に毎に次
式で定義される重みすけ2乗誤差Eを最小化するように
振幅係数Ck1位置Tkを求めて伝送しても良い。
E=Σ((xhfn)  Chi:glb(n  mt
  Th))*W(nl)”、・・・・・・・・・・・
(4) ここで、h(nlは合成フィルタのインパルス応答。
W(nlは重みすけフィルタのインパルス応答1g、。
町は代表区間のi番目のパルスの振幅1位置、Xk(n
lは代表区間以外のに番目のピッチ区間の音声信号を表
す。Ck、Tkはマルチパルス法の音源パルスの振幅と
位置を求める方法と同じ方法で求めることができ、これ
については上記文献9を参照できる。この方法によれば
、前述の音源パルスを補間する方法よりは情報量を若干
増加するが、特性は延らに改善されると期待される。ま
た、上式において情報量を減らすためにTkとしてはピ
ッチ計算部435で求めたピッチ周期Tを1(1いても
良い。このようにすると各ピッチ毎にTkを送らなくて
も良い。一方、上記セグメンテーション区間が母音定常
部でないときは1区間全体で音源パルス列を求める。送
信側の伝送情報はマトリクスあるいはベクトル量子化さ
れた符号、音源パルス列の振幅1位置、セグメンテーシ
オンされた区間の長さを示すセグメンテーション情報、
ピッチ周期1刹別情報である。さらに、ピッチ区間毎に
(4)式の係数を求める構成のときには周知の技術を用
いてこれらを効率的に符号化して伝送する。受信側では
、母音定常部のときは伝送された音源パルス列の振幅と
位相をピッチ周期毎に滑らかに変化させたシ、セクメン
テーシ冒ンされた区間の間での音源信号に補間処理を施
し、伝送されたピッチ区間以外のピッチ区間のパルス列
を復元しセグメンテーションされた区間の音源信号を復
元して信号を合成する。
〔実施例〕
次に1本発明について図面を参照して説明する。
本発明の一実施例を示す第1図(alにおいて、入力端
子500から離散的な音声信号を人力する。
セグメンテーション尺度計算回路505ri第2図のセ
グメンテーション尺度計算部400と同一の計算を行い
、セグメンテーション尺度を出力する。
セグメンテーション回路510は第2図のセグメンテー
ション部410と同一の処理を行い、音声信号を非一様
な区間にセグメンテーションし、セグメンテーション区
間の長さを表すセグメンテーション情報とセグメンテー
ションされた音声信号を出力する。LPG計算回路52
0は第2図のLPC分析部430と同一の処理を行い、
セグメンテーションされた音声信号について、Lk’C
分析を行い、LPC係数マトリクス/ベクトル童子化器
530へ出力する。ピッチ計算回路535は第2図のピ
ッチ計算部435と判別部445とを含む動作を行い、
音声信号に対して、良く刈られているように自己相関法
によりビッテ周期T、ピッチゲインPgを計算し、Pg
O値を用いて上記区間の音声信号が母音定常部か否かを
判別し、ピッチ周期と判別情報を出力する。
マトリクス/ベクトル量子化器530は作用の項で述べ
たマトリクス/ベクトル量子化部440と同一の動作を
行い、LPCPC係数定のピット数で量子化し符号をマ
ルチプレクサ600へ出力する。マトリクス/ベクトル
復号器537は第2図の復号化部425と同一の動作を
行い1判別情報を用いて復号化テーブルを切シ替えて量
子化した結果を復号化して出力する。
重みすけ回路540はセグメンテーションされた音声信
号と復号化された1、、PC係数を用いて上記音声信号
に重みずけを施す。重みずけの方法は上記文献9の重み
すけ回路を参照することができる。インパルス応答計算
回路560は復号化されたLPG係数を用いてインパル
ス応答を計算する。
インパルス応答計算の方法は上記文献8のインパルス応
答計算回路を参照することができる。自己相関関数計算
回路570jriインパルス応答の自己相関関数を計算
し音源パルス計算回路580へ出力する。自己相関関数
の計算法は上記文献8の自己相関関数計算回路を3照す
ることができる。相互相関関数計算回路550は重みず
けられた信号とインパルス応答との相互相関関数を計算
して音源パルス計算回路580へ出方する。この計算法
については、上記文献9の相互相関関数計算回路を参照
することができる。ピッチ復号器585はピッチ周期を
復号して音源パルス計算回路580へ出力する。音源パ
ルス計算回路580はセグメンテーションされた区間が
母音定常部のときは。
作用の項で述べた様に、上記区間をピッチ周期毎のサブ
フレームに分割して中央付近のサブフレーム区間につい
て音源パルス列を計算する。一方。
母音定常部でないときは、上記区間全体に対して音源パ
ルス列を計算する。音源パルス列の計算法については上
記文献9の駆動信号計算回路220を参照することがで
きる。童子化器590は音源パルス列の嶽幅1位置を所
足のビット数で量子化してマルチプレクt600へ出力
する。量子化器590の動作は上記文献8の符号化回路
を参照することができる。マルチプレクサ600はf#
パルス列、L+i’C係数、ピッチ周期、セグメンテー
ジョン情報1判別情報を表す符号を組み合わせて出力す
る。
一方、受信側において、デマルチプレクサ610は音源
パルス情報、LPC係数、ピッチ周期、セグメンテーシ
ョン情報1判別情報?表す符号を分離して出力する。音
源パルス復号器620は音源パルス列の振幅1位置を復
号する。マ) IJクス/ベクトル復号器640は送信
側の復号器537と同一の動作を行う。ピッチ復号器6
45は送信側のピッチ復号器585と同一の動作全行い
、ピッチ周期を復号する。音源復元器630は判別情報
ピッチ周期を人力して、セグメンテーションされた区間
が母音定常部のときは、復号した1ピッチ区間の音源パ
ルス列を用いてセグメンテーション区間全体の音源信号
を復元して出力する。(ここで。
伝送されていないピッチ区間の音源)<ルス列の復元法
としては、隣接セグメンテーション区間の音源パルス列
を用いて補間処理によって復元する方法などが知られて
おシ、この詳細については上記文献9を参照できる。ま
た、これ以外にも他の周知の方法を用いることもでさる
。一方、上記区間が母音定常部でないときには、受信し
た音源パルス列を用いて上記区間の音源信号を発生して
出力する。補間器650は復号したLi’C係数1係数
1報別情報チ周期を用いて、セグメンテーション区間が
母音定常部のときは、ピッチ周期毎にLk’C保数をP
入bCOル係数上で補間する。一方。
上記区間が母音定常部でないときVこは、係数を補間せ
ずに合成フィルタ660へ出力する。これは母音足常部
以外では音声信号のスペクトル特徴の変化が速いので補
間によってかえって大きな歪が入ることを防ぐ為である
。合成フィルタ660はLl’C係数、復元きれた音源
信号、セグメンテーション情報を用いてセグメンテーシ
ョン区間全体における音声信号を合成し、端子670を
通して出力する。
上述した実施例はあくまで本発明の一実施例に洒ぎずそ
の変形例も極々考えられる。例えば、セグメンテーショ
ンされた区間が母音定常部であるときには、相互相関関
数計算回路550は上記区間全体に対してではなく、上
記区間の中央付近の1ピッチ区間に対してのみ相互相関
関数を計算しても良い。これは母音定常部の場合は実際
に音源パルス列を求めるのはlピッチ区間であるためで
ある。この方法では特性は少し劣化するが、演算量はほ
ぼP/Hに低減できる(ここでPはピッチ周期、Ntr
i母音定常部のセグメンテーション区間の長さ)。また
、音源パルスの計算法としては上述の実施例の他に周知
の良好な方法を用いることもできる。これにライては、
 K、Ozawa ”A 5tudyof Pu1se
 5earchλIgorithms for Mul
ti−pulseSpeech Codec凡eal 
1zation’(J、5electedArea o
f Communications、 l 987 )
 (文献10)を参照することができる。まだ、セグメ
ンテーションされた区間が母音定常部のときは、音源ノ
(ルス列を求める1ピッチ区間としては固定ではなく。
最も良好な合成音声が得られるように、求めるべきピッ
チ区間をセグメンテーションされた区間内で探索して求
めるようにすることもできる。この処理によって音質は
さらに良好になるが演算量は若干増加する。具体的な方
法に付いては上記文献9を参照することができる。また
、上記作用の項でも説明したように、送信側で代表区間
の音源パルス列を基準にして、伝送されていない他のピ
ッチ区間を良好に表すような係数を上記(4)式を用い
て計算して周知の方法により効率的に符号化して伝送す
るようにしても良い。但し、この場合1%性は更に改善
されるが、伝送情報f1は若干増加する。また、上記作
用の項で説明したように、マトリクス量子化器、ベクト
ル量子化器を2種類以上、例えば母音定常部数種類、過
渡部、子音部などに増やすことによってさらに精度の良
い童子化を行うことができる。また1合成フィルタ66
0の係数の補間法としては、対数断面積比や他のパラメ
ータ上で補間することもできる。ざらに、補間法として
は線形補間以外に対数補間等を用いることもできる。こ
れらの方法の詳細についてはB、8゜Ata1氏らによ
る 5peech Analysis andSynt
hesis by Linear Predictio
n of theSpeech Wave’(J、Ac
oust 、Soc、America、pp。
637−655.1971)(文献11)を参照するこ
とができる。さらに、受信側でピッチ周期をピッチ区間
毎に、例えば線形補間によって滑らかに変化させること
によって合成音質はさらに改善される。
〔発明の効果〕
以上述べたように本発明によれば、聴覚の特性と対応ず
けのよい特徴パラメータを用いて音声信号を非一様にセ
グメンテーションし、さらにセグメンテーションされた
区間のスペクトルの特徴によって、複数種類のマトリク
ス量子化器、ベクトル量子化器を切υ替えてスペクトル
パラメータの非常に効率的な童子化を行い、さらに上記
区間が母音定常部のときはその区間のうちの1ビ、チ区
間について音源パルス列を求め、そうでないときは区間
全体で音源パルス列を求めているので、音源信号伝送に
必要な情報量を大幅に低減することができる。従って、
ビットレートを大幅に下げても合成音声の聴覚的な劣化
は非常に少ない。
【図面の簡単な説明】
第1図は本発明の一実施例を示す構成図、第2図tal
及び第2図(blは本発明の詳細な説明するだめの図で
ある。 505・・・・・・セグメンテーション尺度計算回路、
510・・・・・・セグメンテーション回路、58o・
・・・・・音源パルス計算回路、52o・・・・・・L
PC計算回路。 535・・・・・・ピッチ計算回路、53o・・・・・
・マトリクス/ベクトル量子化器、540・・・川重み
ずけ回路。 550・・・・・・相互相関関数計算回路、56o・・
・・・・インパルス応答計算回、J、570・・・・・
・自己相関関数計算回路、585.645・・・・・・
ピッチ復号器。 590・・・・・・量子化器、600・・自・・マルチ
プレクサ。 610・・・・・・デマルチプレクブ、537.640
・・・・・・マトリクス/ベクトル復号器、62o・・
・・・・音源パルス復号器、630・・・・・・音源復
元器、65o・・・・・・補間器、66o・・・・・・
合成フィルタ。 代理人 弁理士  内 原   晋

Claims (1)

  1. 【特許請求の範囲】 1)離散的な音声信号を入力し聴覚の特性と対応の良い
    方法により前記音声信号を非一様な区間に分割し、分割
    された区間の全部または一部の区間における前記音声信
    号のスペクトルを表すパラメータを求め、前記パラメー
    タの周波数軸上の相関あるいは周波数軸上及び時間軸上
    の相関を利用して作成しておいた複数種類のコードブッ
    クを用いて前記パラメータを表し、前記分割された区間
    の全部または一部の区間における音源信号を複数個のパ
    ルス列の組合せで表して伝送し、前記パルス列を用いて
    前記音源信号を復元し、前記コードブックを用いてスペ
    クトルパラメータを復号して前記音声信号を良好に表す
    合成音声信号を出力することを特徴とする音声信号符号
    化復号化方法。 (2)入力した離散的な音声信号系列から聴覚の特性と
    対応の良い特徴パラメータを抽出し前記特徴パラメータ
    を用いて前記音声信号系列を非一様な時間区間に分割す
    るセグメンテーション手段と、前記分割された区間の全
    部または一部の区間における音声信号からピッチ周期を
    表すピッチパラメータを計算するピッチ計算手段と、短
    時間スペクトル特性を表すスペクトルパラメータを求め
    前記スペクトルパラメータの周波数軸上の相関あるいは
    周波数軸上及び時間軸上の相関を利用して作成しておい
    た複数種類のコードブックの中から前記音声信号の性質
    に応じて一種類を選択して前記スペクトルパラメータを
    量子化するスペクトルパラメータ計算手段と、前記分割
    された区間の全部または一部の区間における音源信号を
    表す複数個のパルス列を計算する音源パルス計算手段と
    、前記スペクトルパラメータと前記ピッチパラメータと
    前記パルス列を表す符号とを組み合わせて出力するマル
    チプレクサ手段とを備えることを特徴とする音声信号符
    号化装置。 (3)音声信号のスペクトルパラメータとピッチパラメ
    ータと音源パルス列を表す符号とを入力して分離するデ
    マルチプレクサ手段と、前記スペクトルパラメータの周
    波数軸上及び時間軸上の相関を利用して作成しておいた
    複数種類のコードブックを用いて前記スペクトルパラメ
    ータを復号するスペクトルパラメータ復号手段と、前記
    ピッチパラメータと前記音源パルス列を表す符号とを用
    いて非一様に分割された区間全体の音源信号を復元する
    音源復元手段と、復元された音源信号と前記スペクトル
    パラメータとを用いて前記区間の音声信号を合成する合
    成フィルタ手段とを備えることを特徴とする音声信号復
    号化装置。
JP63060906A 1988-03-14 1988-03-14 音声信号符号化復号化方法及びその装置 Pending JPH01233499A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63060906A JPH01233499A (ja) 1988-03-14 1988-03-14 音声信号符号化復号化方法及びその装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63060906A JPH01233499A (ja) 1988-03-14 1988-03-14 音声信号符号化復号化方法及びその装置

Publications (1)

Publication Number Publication Date
JPH01233499A true JPH01233499A (ja) 1989-09-19

Family

ID=13155873

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63060906A Pending JPH01233499A (ja) 1988-03-14 1988-03-14 音声信号符号化復号化方法及びその装置

Country Status (1)

Country Link
JP (1) JPH01233499A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0728495A (ja) * 1990-12-20 1995-01-31 Sip Soc It Per Esercizio Delle Telecommun Pa 音声信号の組み込み式コード化システム
JP2011247950A (ja) * 2010-05-24 2011-12-08 National Institute Of Advanced Industrial & Technology 信号特徴抽出装置および信号特徴抽出方法
JP5432896B2 (ja) * 2008-06-09 2014-03-05 株式会社Nttドコモ 受信装置及び無線品質算出方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0728495A (ja) * 1990-12-20 1995-01-31 Sip Soc It Per Esercizio Delle Telecommun Pa 音声信号の組み込み式コード化システム
JP5432896B2 (ja) * 2008-06-09 2014-03-05 株式会社Nttドコモ 受信装置及び無線品質算出方法
JP2011247950A (ja) * 2010-05-24 2011-12-08 National Institute Of Advanced Industrial & Technology 信号特徴抽出装置および信号特徴抽出方法

Similar Documents

Publication Publication Date Title
KR100615113B1 (ko) 주기적 음성 코딩
EP0360265B1 (en) Communication system capable of improving a speech quality by classifying speech signals
KR100679382B1 (ko) 가변 속도 음성 코딩
KR100264863B1 (ko) 디지털 음성 압축 알고리즘에 입각한 음성 부호화 방법
JPH0353300A (ja) 音声符号化装置
JPH096397A (ja) 音声信号の再生方法、再生装置及び伝送方法
JPH10187196A (ja) 低ビットレートピッチ遅れコーダ
JP4874464B2 (ja) 遷移音声フレームのマルチパルス補間的符号化
US5027405A (en) Communication system capable of improving a speech quality by a pair of pulse producing units
EP1597721B1 (en) 600 bps mixed excitation linear prediction transcoding
KR20040045586A (ko) 서로 다른 대역폭을 갖는 켈프 방식 코덱들 간의상호부호화 장치 및 그 방법
KR100480341B1 (ko) 광대역 저전송률 음성 신호의 부호화기
US7089180B2 (en) Method and device for coding speech in analysis-by-synthesis speech coders
JPH01233499A (ja) 音声信号符号化復号化方法及びその装置
JPH0258100A (ja) 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置
KR0155798B1 (ko) 음성신호 부호화 및 복호화 방법
JP3063087B2 (ja) 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置
JPH01258000A (ja) 音声信号符号化復号化方法並びに音声信号符号化装置及び音声信号復号化装置
JP2992998B2 (ja) 音声符号化復号化装置
Drygajilo Speech Coding Techniques and Standards
JP3055901B2 (ja) 音声信号符号化復号化方法及び音声信号符号化装置
JP3006790B2 (ja) 音声符号化復号化方法及びその装置
JP3103108B2 (ja) 音声符号化装置
JP2946528B2 (ja) 音声符号化復号化方法及びその装置
JPH02160300A (ja) 音声符号化方式