JP2844590B2 - 音声符号化方式とその装置 - Google Patents
音声符号化方式とその装置Info
- Publication number
- JP2844590B2 JP2844590B2 JP59272435A JP27243584A JP2844590B2 JP 2844590 B2 JP2844590 B2 JP 2844590B2 JP 59272435 A JP59272435 A JP 59272435A JP 27243584 A JP27243584 A JP 27243584A JP 2844590 B2 JP2844590 B2 JP 2844590B2
- Authority
- JP
- Japan
- Prior art keywords
- parameter
- pitch
- circuit
- representing
- pulse train
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Description
【発明の詳細な説明】
(産業上の利用分野)
本発明は音声信号を低いビットレイトで高品質に符号
化するための符号化方法とその装置に関する。 (従来技術) 音声信号を低い伝送ビットレイト(例えば4.8kbps程
度)で符号化する方式として、ボコーダ(VOCODER)が
知られている。この方法については、原理については例
えば、エム アーム シュレイダー(M.R.SCROEDER)氏
による「ボコーダズ:アナリシス アンド シンセシス
オブ スピーチ(VOCODERS:ANALYSIS AND SYNTHESIS
OF SPEECH)」と題した論文(PROC.IEEE,p.p.720-734,M
AY,1966;文献1)」等に詳細に説明されている。また、
線形予測分析法を用いるボコーダとしてエル ピー シ
ー ボコーダ(LPC VOCODER)が知られており、その内
容については、例えは、ジエー ディー マーケル(J.
D.MARKEL)氏らによる「ア リニアー プレディクショ
ン ボコーダ ベイスド アポン ザ オートコリレイ
ション メソッド(ALINEAR PREDICTION VOCODER BASED
UPON THE AUTOCORRELATION METHOD)」と題した論文
(IEEE TRANS.A.S.S.P.,p.p.124-134,APPIL,1974;文献
2)」等に詳細に説明されている。本発明はVOCODERの
音源部を改良したものであり、LPC VOCODERと密接な関
係があるので、以下LPC VOCODERについて合成部の構成
を中心に概略を説明する。 第4図は、文献2に記載のLPC VOCODERの合成部(受
信部)を示すブロック図である。合成部は音源発生部50
0と合成フィルタ回路510からなる。音源発生部500はイ
ンパルス発生器501と雑音発生器502と有声/無声切り替
え回路503と、ゲイン回路504から構成される。VOCODER
では、音声信号は短時間(例えば20m sec)毎に有声と
無声の2種にわけられ、有声の場合は、インパルス発生
器501からピッチ周期Pdの時間間隔をもつパルス列が発
生される。一方無声の場合は、雑音発生器502から白色
雑音が発生される。有声/無声の制御は、切り換え回路
503にておこなわれる。このようにして発生された信号
に対して、ゲイン回路504にてゲインGがあたえられ、
音源信号d(n)として合成フィルタ510へ出力され
る。合成フィルタ510では音源信号d(n)とフィルタ
パラメータKiを用いて音声x(n)を合成し出力する。
ここでピッチ周期Pd、有声/無声切り換え信号(V/U
V)、ゲインG、フィルタパラメータKiは分析側(送信
側)においてあらかじめ定められた時間ごとに計算され
受信側に伝送される。 (発明が解決しようとする問題点) 以上説明したLPC VOCODERにおいては、伝送情報は、
ピッチ周期、有声/無声信号、ゲイン、フィルタパラメ
ータであり、これらの情報から音声信号を合成できるの
で伝送ビットレイトをひくく(例えば4.8k bps程度)す
ることができる。しかしながら、この従来法では品質の
良好な音声を合成することは困難であった。それは音声
を有声と無声という2種の極端なクラスにわけているの
で、有声/無声の判別誤りがおきた場合はおおきな品質
劣化をひきおこすといる欠点があった。また、音源信号
は、有声の場合には音源を1ピッチあたり1個のインパ
ルスで表しており、位相情報を含まないため個人性はか
なり損なわれており、その合成音は所謂「機械的な音」
であった。また、無声と有声の切り換わり部では音源を
良好に表すことができず、劣化がおきていた。更に、ピ
ッチ周期がずれて求まった場合には、おおきな品質劣化
を引き起こすという欠点があった。本発明は、比較的少
ない演算量で、低い伝送ビットレイトでも高品質な音声
を合成することのできる高能率音声符号化方式とその装
置を提供することを目的をする。 (問題を解決するための手段) 本発明の音声符号化方式は、送信側では離散的な音声
信号を入力し、あらかじめ定められた時間間隔に分割
し、前記音声信号から短時間スペクトル包絡を表すスペ
クトルパラメータとピッチを表すピッチパラメータとを
抽出して符号化し、前記時間間隔を前記ピッチパラメー
タを用いて前記時間間隔よりも短い時間区間に分割し、
前記音声信号と前記ピッチパラメータをもとにして前記
音声信号を表すための代表的な音源パルスを前記ピッチ
パラメータに応じて求めた時間区間のうちの代表的な区
間に対しあらかじめ定められた個数だけ求めて符号化
し、前記ピッチパラメータを表す符号と前記スペクトル
パラメータを表す符号と前記代表的な音源パルス列の表
す符号とを組み合わせて出力し、受信側では前記組み合
わされた符号を入力し、前記ピッチパラメータを表す符
号と前記スペクトルパラメータを表す符号と前記代表的
な音源パルス列を表す符号とを分離して復号し、前記復
号されたピッチパラメータに応じて前記時間間隔を前記
時間間隔よりも短い時間区間に分割し、前記代表的な区
間以外の区間では、前記復号されたピッチパラメータと
前記復号された音源パルス列と過去の時間間隔における
代表的な音源パルス列とをもとに前記音源パルス列に対
し前記区間毎にピッチに同期してなめらかな変化を与え
る処理をほどこして他の時間区間の駆動音源信号を復元
し前記復元された駆動音源信号と前記復元されたスペク
トルパラメータをもとに前記音声信号を合成することを
特徴とする。 また、本発明の音声符号化装置は、入力した音声信号
をあらかじめ定められた時間間隔に分割し前記音声信号
から短時間スペクトル包絡を表すスペクトルパラメータ
とピッチを表すピッチパラメータとを抽出し符号化する
パラメータ計算回路と、前記時間間隔を前記ピッチパラ
メータを用いて前記時間間隔よりも短い時間区間に分割
し、前記音声信号と前記ピッチパラメータと前記スペク
トルパラメータをもとにして前記音声信号を表すための
代表的な音源パルス列を前記ピッチパラメータに応じて
求めた時間区間のうちの代表的な区間に対しあらかじめ
定められた個数だけ求めて符号化する駆動信号計算回路
と、前記パラメータ計算回路の出力符号と前記駆動信号
計算回路の出力符号とを組み合わせて出力するマルチプ
レクサ回路とを有することを特徴とする。 更に本発明の音声復号化装置は、あらかじめ定められ
た時間間隔毎にピッチパラメータを表す符号とスペクト
ルパラメータを表す符号と音源パルス列を表す符号とが
組み合わされた符号系列が入力され、前記ピッチパラメ
ータを表す符号と前記スペクトルパラメータを表す符号
と前記音源パルス列を表す符号とを分離して復号するデ
マルチプレクサ回路と、前記復号されたピッチパラメー
タに応じて前記時間間隔を前記時間間隔よりも短い時間
区間に分割し、代表的な区間以外の区間では、前記復号
されたピッチパラメータと前記復号された音源パルス列
と過去の時間間隔における代表的な音源パルス列とをも
とに前記音源パルス列に対して前記区間毎にピッチに同
期してなめらかな変化を与える処理をほどこして他の時
間区間における駆動音源信号を復元する駆動音源信号復
元回路と、前記復元された駆動音源信号と前記復号され
たスペクトルパラメータをもとに音声信号を合成し出力
する合成フィルタ回路とを有することを特徴とする。 (作用) 本発明は音源信号をつねに第5図に示すように複数個
のパルスの組み合わせ(マルチパルス)で表し、有声部
と無声部でパルスと雑音を切り換えないことを特徴とす
る。第5図において横軸は離散的な時間を、縦軸が振幅
を表す。音声はこのマルチパルスと合成フィルタから合
成される。音源を表すパルスの振幅と位置を求める方法
としては、例えばアナリシス−バイ−シンセンス(ANAL
YSIS−by−SYNTHESIS;A−b−S)の方法を用いる方法
が知られており、その詳細についてはビー エス アタ
ル(B.S.ATAL)氏らによる「ア ニュー モデル オブ
エル ピー シー エクサイテイション フォー プ
ロデューシング ナチュラル サウンディング スピー
チ アット ロウ ビット レイツ(A NEW MODEL OF L
PC EXCITATION FOR PRODUCING NATURAL SOUNDING SPEEC
H AT LOW BIT RATES)」と題した論文(PROC.I.C.A.S.
S.P.,p.p.614-617,1982;文献3)等に説明されている。
また高速に求める方法として、相関演算にもとづく方法
が知られており、詳細な特願昭57-231606号明細書(文
献4)等に記載されているのでここでは説明を省略す
る。 更に本発明は音声信号の周期性を利用しており、送信
側では音声信号を表すための代表的な音源パルスを代表
的な1ピッチ区間に対し、あらかじめ定めた個数だけ計
算し、このパルスの振幅、位置と音声信号のスペクトル
包絡特性を表すスペクトルパラメータとピッチ周期情報
とを伝送する。受信側では代表的なパルスの振幅、位置
とピッチ周期情報を用いて、前後のフレームからの補間
処理により、この代表的なパルスを時間的になめらかに
変化させながら駆動音源信号を復元し、この駆動音源信
号と、補間処理により時間的になめらかに変化させて求
めたスペクトルパラメータとを用いて高品質な音声信号
を合成すること特徴としている。 (実施例) 以下、本発明の実施例について図面を参照して詳細に
説明する。第1図(a)は本発明による高能率音声符号
化方式の送信側の一実施例を示すブロック図であり、第
1図(b)は受信側の一実施例を示すブロック図であ
る。 第1図(a)において、音声信号X(n)が入力さ
れ、あらかじめ定められたサンプル数だけバッファメモ
リ回路110に蓄積される。次にKパラメータ計算回路140
は、バッファメモリ回路110からあらかじめ定められた
サンプル数の音声信号を入力し、音声信号のスペクトル
包絡を表すKパラメータを計算する。ここでKパラメー
タはPARCOR係数と同一のパラメータである。Kパラメー
タの計算法としては、自己相関法がよく知られている。
この方法の詳細については、ジョン マクホウル氏(JO
HNMAKHOUL)氏らによる「クォンタイゼイションプロパ
ディズ オブ トランスミッション パラメータズ イ
ン リニア プリディクティブ システンズ(QUANTIZA
TION PROPERTIES OF TRANSMISSINO PARMETERS IN LINEA
R PREDICTIVE SYSTEMS)」と題した論文(IEEE TRANS.
A.S.S.P.,p.p.309-321,1983;文献5)等に述べられてい
るので、ここでは説明を省略する。 第1図(a)にもどって、KパラメータKiは、Kパラ
メータ符号化回路160へ出力される。Kパラメータ符号
化回路160は、あらかじめ定められた量子化ビット数に
基ずいてKiを符号化し、符号lKiをマルチプレクサ260へ
出力する。また、Kパラメータ符号化回路160は、lKiを
復号化して得たKパラメータ復号値Ki′を用い、予測係
数値ai′に変換し、インパルス応答計算回路170と重み
ずけ回路200とへ出力する。またKパラメータ復号値Ki
を補間回路255へ出力する。 ピッチ分析回路130は、バッファメモリ回路110の出力
を用いてピッチ周期Pを計算する。Pの計算法は、例え
ば、アール ブイ コックス(R.V.COX)氏らによる
「リアル タム インプリメンティション オブ タイ
ム ドメイン ハーモニック スケィリング オブ ス
ピーチ シグナルズ(REAL-TIME IMPLEMENTATION OF TI
ME DOMAIN HARMONIC SCALING OF SPEECH SIGNALS)と題
した論文(IEEE TRANS.A.S.S.P.,p.p.258-272,1983;文
献6)等で述べられている方法を用いることができる。 ピッチ符号化回路150は、ピッチ周期Pdをあらかじめ
さだめられた量子化ビット数で量子化符号化し、符号ld
をマルチプレクサ260へ出力する。また復号化して得たP
d′を駆動信号計算回路220、及び補間回路255へ出力す
る。 インパルス応答計算回路170は、Kパラメータ符号回
路160から予測係数値ai′を入力し、重みずけされた合
成フィルタの伝達関数を表すインパルス応答hw(n)を
計算する。ここでhw(n)の計算には、例えば特願昭59
-042305号明細書の第4図(a)に記載のインパルス応
答計算回路210と同一の方法を用いることができる。イ
ンパルス応答hw(n)は、自己相関関数計算回路180と
相互相関関数計算回路210とへ出力される。 自己相関関数計算回路180はインパルス応答計算回路1
70からインパルス応答hw(n)を入力し、次式に従い自
己相関関数を計算する。 自己相関関数Rhh(・)は駆動信号計算回路220へ出力さ
れる。 次に減算器120はバッファメモリ回路110の音声信号X
(n)から合成フィルタ回路250の出力を1フレーム分
減算し、結果e(n)を重みずけ回路200へする。重み
ずけ回路200はe(n)を入力し、またKパラメータ符
号回路160から予測係数ai′を入力し、e(n)に対し
重みずけを施して求めたew(n)を出力する。ここでew
(n)の計算には、例えば特願昭59-042305号明細書の
第4図(a)に記載の重みずけ回路410と同一の方法を
用いることができる。相互相関関数計算回路210は、重
みずけ回路200からew(n)を入力し、インパルス応答
計算回路170からインパルス応答hw(n)を入力し、次
式に従い相互相関関数hx(m)を計算する。 相互相関関数hx(m)は駆動信号計算回路220へ出力
される。 次に駆動信号計算回路220は、音声信号を表す音源信
号として、パルス系列を代表的なピッチ区間に対して計
算する。この手順を次に示す。まず最初に、フレームを
ピッチ周期Pd′ごとのサブフレームに分割する。この分
割にはピッチ励振位置を知る必要があるが、これは音源
を表すパルス列を求めることにより知ることができる。
つまり、第1番目のパルスの位置から、ピッチの励振位
置を知ることができる。ここでパルス列の計算には、例
えば特願昭57-231606号明細書の第(21)式で示した方
法を用いることができる。第2図(a)に1フレームの
音声波形を、第2図(b)に第1番目に求まるパルスg1
とこのパルスの位置を用いて分割したサブフレームのよ
うすを示す。次の処理としてサブフレーム毎に、あらか
じめ定められた個数のパルスを計算する。代表的なピッ
チ区間の選定法としては、例えば絶対値の大きなパルス
を含むサブフレームを代表ピッチ区間とし、この区間に
含まれるパルスを代表パルスとする方法を用いることが
できる。このようにして求めた代表ピッチパルスを第2
図(c)に示す。パルスの振幅、位置は符号器230へ出
力される。また、サブフレーム位相T、代表ピッチ区間
のサブフレーム番号(第2図(c)では3)を代表ピッ
チ位置としてあらかじめ定められたビット数で符号化
し、マルチプレクサ260へ出力する。符号化回路230は、
入力したパルスの振幅、位置を符号化する。そして、代
表ピッチ区間のパルスの振幅、位置の符号をマルチプレ
クサへ出力する。また、入力した全てのパルスの振幅、
位置の復号値gi′mi′を駆動信号復元回路240へ出力す
る。ここでパルスの符号化法には、例えば特願昭57-231
605号明細書に記載の符号化回路250と同一の方法を用い
ることができる。他の符号化法として、可変長符号化
法、あるいは、差分符号化法等種々の方法が考えられ
る。 駆動信号復元回路240は、符号化回路230から入力した
パルスの振幅および位置の復号値を用いて、1フレーム
分のパルスを発生させ、これを駆動音源信号として合成
フィルタ回路250へ出力する。 補間回路255は、ピッチ周期Pd′、サブフレーム位相
T、代表ピッチ位置を入力する。そして、フレームをピ
ッチ周期Pd′ごとのサブフレームに分割し、Kパラメー
タをこのサブフレームごとに補間する。ここで補間は直
線補間とし、1フレーム過去及び1フレーム先のKパラ
メータの値を用いる。この補間のようすを第3図に示
す。図において第jフレームのi番目のKパラメータK
ijは、1フレーム過去の値Kij-1,及び1フレーム先の値
Kij+1を用いて、サブフレーム毎に補間がおこなわれ
る。代表ピッチ区間には、Kパラメータ符号化回路160
から入力したKパラメータ復号値を用いる。このように
して補間して求めたKパラメータは、合成フィルタ回路
250へ出力される。 合成フィルタ250は、駆動音源信号、及び補間された
Kパラメータを入力し、1フレーム分の応答信号X
(n)を計算する。ここでこの計算には、例えば特願昭
57-231605号明細書に記載の合成フィルタ回路320と同一
の方法を用いることができる。 マルチプレクサ回路260は、Kパラメータ符号化回路1
60の符号lKiとピッチ符号化回路150の符号ldと符号化回
路230の符号及びサブフレーム位相、代表ピッチ位置を
入力し、これらを組あわせて送信側出力端子270から出
力する。以上で本発明による高能率音声符号化方式の送
信側の説明を終了する。 次に、本発明による音声符号化方式の受信側の構成に
ついて、第1図(b)を参照して説明する。 デマルチプレクサ290は、受信側入力端子280から入力
した符号のうち、Kパラメータをあらわす符号と、ピッ
チ周期を表す符号と、パルスの振幅、位置を表す符号
と、サブフレーム位相、代表ピッチ位置を表す符号とを
分離して、それぞれKパラメータ復号回路330、ピッチ
復号回路320、パルス復号回路300、駆動信号復元回路34
0へ出力する。 Kパラメータ復号回路330は、Kパラメータを復号し
て復号値Ki′を補間回路335へ出力する。 ピッチ復号回路320は、ピッチ周期Pd′を復号して、
駆動信号復元回路340、補間回路335へ出力する。 パルス復号回路300はパルス振幅gi′、位置mi′を復
号して駆動信号復元回路340へ出力する。 駆動信号復元回路340は、まずサブフレーム位相、代
表ピッチ位置を表す符号と、ピッチ周期Pd′を入力し、
フレームをピッチ周期Pd′ごとのサブフレームに分割す
る。そして代表ピッチ位置で表されるサブフレーム区間
に対して位置m′に振幅g′のパルスを発生させる。次
に、代表ピッチパルスと1フレーム過去、及び1フレー
ム先の代表的なパルスを用いてサブフレーム毎にパルス
を補間して求める。こうして全てのサブフレームについ
てパルスを発生させ駆動音源信号を復元し、1フレーム
分の駆動音源信号を合成フィルタ回路350へ出力する。 補間回路335は、送信側の補間回路255と同一の動作を
し、復号されたKパラメータをピッチ周期ごとに補間
し、補間されたパラメータを合成フィルタ回路350へ出
力する。 合成フィルタ回路350は、駆動音源信号、補間された
Kパラメータを入力し、送信側の合成フィルタ回路250
と同一の動作をして、1フレーム分の合成音声信号X
(n)を計算し受信側出力端子360から出力する。 以上で本発明による高能率音声符号化方式の受信側の
説明をおえる。 駆動信号計算回路220におけるパルス計算法として
は、本実施例でのべた方法の他に種々の方法を用いるこ
とができる。例えばパルスを1つ求めるごとに過去に求
めたパルスの振幅を調整する方法を用いることができ
る。この方法の詳細については小野氏らによる「マルチ
パルス駆動型音声符号化法における音源パルス探索法の
検討」と題した論文(日本音響学会講演論文集157、198
3;文献7)等に述べられているのでここでは説明を省略
する。 また、駆動信号計算回路220にてパルスを求めるさい
に、フレームをサブフレームに分割した後に、サブフレ
ームごとにパルスを求めていたが、サブフレームに分割
せずに、フレーム全体に対してあらかじめ定めた個数の
パルスを求めるようにしてもよい。更に、本実施例の送
信側では、Kパラメータの値はフレーム内で一定(つま
り合成フィルタの特性がフレーム内で変化しない)とし
て、このフレーム内のサブフレームごとにパルスを求め
たが、Kパラメータの値をサブフレーム毎になめらかに
変化させながらパルスを求めてもよい。具体的には、K
パラメータの値の前後のフレームのKパラメータの値を
用いてサブフレーム毎に補間し、この値を予測係数に変
換して、重みずけ回路200、インパルス応答計算回路17
0、合成フィルタ回路250に出力し、サブフレーム毎に係
数を更新して求めた相互相関関係、自己相関関係を用い
たパルスを計算する。このようにしたほうが、より良好
な音声を合成できる。また、パルス及びKパラメータの
値を補間するさいに、送信側では、代表的なピッチ区間
の位置を求め伝送し、この区間を基準としてピッチ周期
に同期させて補間していたが、パルス及びKパラメータ
のいずれか一方、あるいは両方とも、あらかじめ定めら
れたピッチ区間(例えば、フレームの中央付近のピッチ
区間)を基準として補間を施してもよい。両方ともこの
ような補間法を用いる場合は、代表ピッチ区間の位置を
表す符号を伝送しなくてもよく、伝送ビットレイトを減
らすことができる。また、代表ピッチ区間として、絶対
値の大きなパルスを含むサブフレームを選択していた
が、例えばフレーム中央のサブフレームを選択する方法
や良好な音声を再生できるような区間を選択する方法
等、他の方法を用いることもできる。また、サブフレー
ム分割を行うときにピッチ周期は一定としていたが、こ
の値も前後のフレームのピッチ周期を用いて補間するよ
うにしてもよい。一方、パルス及びKパラメータをピッ
チ周期に同期させずに補間する方法も考えられる。この
場合は、フレームをあらかじめ定められた時間間隔(例
えば2.5m sec程度)に区切り、この区間毎に補間処理を
行う。この場合はサブフレーム位相は伝送しなくてもよ
い。ここで、補間の基準区間としては、代表区間を送信
側で求めてもよいし、あらかじめ定めておいてもよい
(例えばフレーム中中央付近)。後者の場合には、サブ
フレーム位相と代表ピッチ位置を伝送しなくてもよく、
更にビットレイトを減らすことができる。 次に、パルス、合成フィルタのパラメータ、ピッチ周
期の補間法としては、直線補間以外の方法も考えられ
る。例えば、パルス、ピッチ周期については、対数補間
等も考えられる。また、合成フィルタのパラメータを補
間する場合、本実施例ではKパラメータについて補間し
たが、例えば予測係数を補間する方法(但し、この場合
はフィルタの安定性をチェックする必要がある)や、対
数断面積関数を補間する方法や、自己相関関数を補間す
る方法等を用いることもできる。これらの具体的な方法
は、ビー エス アタル(B.S.ATAL)氏らによる「スピ
ーチ アナリシス アンド シンセシス バイリニアー
プリディクション オブ ザ スピーチ ウェイブ
(SPEECH ANALYSIS AND SYNTHESIS BY LINEAR PREDICTI
ON OF THE SPEECH WAVE)と題した論文(J.ACOUST.SOC.
AM.,.p.p.637-655,1971;文献8)等で述べられているの
で説明は省略する。 本実施例では、フレーム長一定としてKパラメータの
分析および音源パルス列の計算をしたが、フレーム長は
可変としてもよい。このようにした場合には、音声の変
化部では、フレーム長を短くし、定常部ではフレーム長
を長くできるので、伝送ビットレイトを低減することが
できる。更に、ピッチ周期に応じて(例えばピッチ周期
の整数倍)フレーム長を決めるようにすれば、本実施例
で述べたサブフレーム位相も送らなくてよいので、更に
伝送ビットレイトを低減することができる。 本発明の他の構成法として、第1図(a)に於ける駆
動信号復元回路240、合成フィルタ回路250、補間回路25
5、減算回路120を省略して構成をとることもできる。こ
のようにした場合は、送信側で音声信号を合成しなくて
もよく、装置構成を簡略化することができる。 尚、ディジタル信号処理の分野でよく知られているよ
うに、自己相関関数はパワスペクトルから計算すること
もできる。また、相互相関関数はクロスパワスペクトル
から計算することもできる。これらの対応関係について
は、エー ブイ オッペンハイム(A.V.OPPENHEIM)氏
らによる「ディジタル信号処理(DIGITAL SIGNAL PROCE
SSING)」と題した単行本(文献9)等の第8章にて詳
細に説明されているので、ここでは説明を省略する。 (発明の効果) 本発明によれば、音源信号を複数個のパルス列(マル
チパルス)の組み合わせで表すと共に、音声信号の周期
性を利用して、音声信号を良好に表すように代表的なピ
ッチ区間のパルスを求めて伝送し、この代表的なピッチ
パルスを時間的になめらかに変化させながら駆動音源信
号を復元し音声を合成しているので、低い伝送ビットレ
イトにおいても高品質な音声を合成できるという効果が
ある。
化するための符号化方法とその装置に関する。 (従来技術) 音声信号を低い伝送ビットレイト(例えば4.8kbps程
度)で符号化する方式として、ボコーダ(VOCODER)が
知られている。この方法については、原理については例
えば、エム アーム シュレイダー(M.R.SCROEDER)氏
による「ボコーダズ:アナリシス アンド シンセシス
オブ スピーチ(VOCODERS:ANALYSIS AND SYNTHESIS
OF SPEECH)」と題した論文(PROC.IEEE,p.p.720-734,M
AY,1966;文献1)」等に詳細に説明されている。また、
線形予測分析法を用いるボコーダとしてエル ピー シ
ー ボコーダ(LPC VOCODER)が知られており、その内
容については、例えは、ジエー ディー マーケル(J.
D.MARKEL)氏らによる「ア リニアー プレディクショ
ン ボコーダ ベイスド アポン ザ オートコリレイ
ション メソッド(ALINEAR PREDICTION VOCODER BASED
UPON THE AUTOCORRELATION METHOD)」と題した論文
(IEEE TRANS.A.S.S.P.,p.p.124-134,APPIL,1974;文献
2)」等に詳細に説明されている。本発明はVOCODERの
音源部を改良したものであり、LPC VOCODERと密接な関
係があるので、以下LPC VOCODERについて合成部の構成
を中心に概略を説明する。 第4図は、文献2に記載のLPC VOCODERの合成部(受
信部)を示すブロック図である。合成部は音源発生部50
0と合成フィルタ回路510からなる。音源発生部500はイ
ンパルス発生器501と雑音発生器502と有声/無声切り替
え回路503と、ゲイン回路504から構成される。VOCODER
では、音声信号は短時間(例えば20m sec)毎に有声と
無声の2種にわけられ、有声の場合は、インパルス発生
器501からピッチ周期Pdの時間間隔をもつパルス列が発
生される。一方無声の場合は、雑音発生器502から白色
雑音が発生される。有声/無声の制御は、切り換え回路
503にておこなわれる。このようにして発生された信号
に対して、ゲイン回路504にてゲインGがあたえられ、
音源信号d(n)として合成フィルタ510へ出力され
る。合成フィルタ510では音源信号d(n)とフィルタ
パラメータKiを用いて音声x(n)を合成し出力する。
ここでピッチ周期Pd、有声/無声切り換え信号(V/U
V)、ゲインG、フィルタパラメータKiは分析側(送信
側)においてあらかじめ定められた時間ごとに計算され
受信側に伝送される。 (発明が解決しようとする問題点) 以上説明したLPC VOCODERにおいては、伝送情報は、
ピッチ周期、有声/無声信号、ゲイン、フィルタパラメ
ータであり、これらの情報から音声信号を合成できるの
で伝送ビットレイトをひくく(例えば4.8k bps程度)す
ることができる。しかしながら、この従来法では品質の
良好な音声を合成することは困難であった。それは音声
を有声と無声という2種の極端なクラスにわけているの
で、有声/無声の判別誤りがおきた場合はおおきな品質
劣化をひきおこすといる欠点があった。また、音源信号
は、有声の場合には音源を1ピッチあたり1個のインパ
ルスで表しており、位相情報を含まないため個人性はか
なり損なわれており、その合成音は所謂「機械的な音」
であった。また、無声と有声の切り換わり部では音源を
良好に表すことができず、劣化がおきていた。更に、ピ
ッチ周期がずれて求まった場合には、おおきな品質劣化
を引き起こすという欠点があった。本発明は、比較的少
ない演算量で、低い伝送ビットレイトでも高品質な音声
を合成することのできる高能率音声符号化方式とその装
置を提供することを目的をする。 (問題を解決するための手段) 本発明の音声符号化方式は、送信側では離散的な音声
信号を入力し、あらかじめ定められた時間間隔に分割
し、前記音声信号から短時間スペクトル包絡を表すスペ
クトルパラメータとピッチを表すピッチパラメータとを
抽出して符号化し、前記時間間隔を前記ピッチパラメー
タを用いて前記時間間隔よりも短い時間区間に分割し、
前記音声信号と前記ピッチパラメータをもとにして前記
音声信号を表すための代表的な音源パルスを前記ピッチ
パラメータに応じて求めた時間区間のうちの代表的な区
間に対しあらかじめ定められた個数だけ求めて符号化
し、前記ピッチパラメータを表す符号と前記スペクトル
パラメータを表す符号と前記代表的な音源パルス列の表
す符号とを組み合わせて出力し、受信側では前記組み合
わされた符号を入力し、前記ピッチパラメータを表す符
号と前記スペクトルパラメータを表す符号と前記代表的
な音源パルス列を表す符号とを分離して復号し、前記復
号されたピッチパラメータに応じて前記時間間隔を前記
時間間隔よりも短い時間区間に分割し、前記代表的な区
間以外の区間では、前記復号されたピッチパラメータと
前記復号された音源パルス列と過去の時間間隔における
代表的な音源パルス列とをもとに前記音源パルス列に対
し前記区間毎にピッチに同期してなめらかな変化を与え
る処理をほどこして他の時間区間の駆動音源信号を復元
し前記復元された駆動音源信号と前記復元されたスペク
トルパラメータをもとに前記音声信号を合成することを
特徴とする。 また、本発明の音声符号化装置は、入力した音声信号
をあらかじめ定められた時間間隔に分割し前記音声信号
から短時間スペクトル包絡を表すスペクトルパラメータ
とピッチを表すピッチパラメータとを抽出し符号化する
パラメータ計算回路と、前記時間間隔を前記ピッチパラ
メータを用いて前記時間間隔よりも短い時間区間に分割
し、前記音声信号と前記ピッチパラメータと前記スペク
トルパラメータをもとにして前記音声信号を表すための
代表的な音源パルス列を前記ピッチパラメータに応じて
求めた時間区間のうちの代表的な区間に対しあらかじめ
定められた個数だけ求めて符号化する駆動信号計算回路
と、前記パラメータ計算回路の出力符号と前記駆動信号
計算回路の出力符号とを組み合わせて出力するマルチプ
レクサ回路とを有することを特徴とする。 更に本発明の音声復号化装置は、あらかじめ定められ
た時間間隔毎にピッチパラメータを表す符号とスペクト
ルパラメータを表す符号と音源パルス列を表す符号とが
組み合わされた符号系列が入力され、前記ピッチパラメ
ータを表す符号と前記スペクトルパラメータを表す符号
と前記音源パルス列を表す符号とを分離して復号するデ
マルチプレクサ回路と、前記復号されたピッチパラメー
タに応じて前記時間間隔を前記時間間隔よりも短い時間
区間に分割し、代表的な区間以外の区間では、前記復号
されたピッチパラメータと前記復号された音源パルス列
と過去の時間間隔における代表的な音源パルス列とをも
とに前記音源パルス列に対して前記区間毎にピッチに同
期してなめらかな変化を与える処理をほどこして他の時
間区間における駆動音源信号を復元する駆動音源信号復
元回路と、前記復元された駆動音源信号と前記復号され
たスペクトルパラメータをもとに音声信号を合成し出力
する合成フィルタ回路とを有することを特徴とする。 (作用) 本発明は音源信号をつねに第5図に示すように複数個
のパルスの組み合わせ(マルチパルス)で表し、有声部
と無声部でパルスと雑音を切り換えないことを特徴とす
る。第5図において横軸は離散的な時間を、縦軸が振幅
を表す。音声はこのマルチパルスと合成フィルタから合
成される。音源を表すパルスの振幅と位置を求める方法
としては、例えばアナリシス−バイ−シンセンス(ANAL
YSIS−by−SYNTHESIS;A−b−S)の方法を用いる方法
が知られており、その詳細についてはビー エス アタ
ル(B.S.ATAL)氏らによる「ア ニュー モデル オブ
エル ピー シー エクサイテイション フォー プ
ロデューシング ナチュラル サウンディング スピー
チ アット ロウ ビット レイツ(A NEW MODEL OF L
PC EXCITATION FOR PRODUCING NATURAL SOUNDING SPEEC
H AT LOW BIT RATES)」と題した論文(PROC.I.C.A.S.
S.P.,p.p.614-617,1982;文献3)等に説明されている。
また高速に求める方法として、相関演算にもとづく方法
が知られており、詳細な特願昭57-231606号明細書(文
献4)等に記載されているのでここでは説明を省略す
る。 更に本発明は音声信号の周期性を利用しており、送信
側では音声信号を表すための代表的な音源パルスを代表
的な1ピッチ区間に対し、あらかじめ定めた個数だけ計
算し、このパルスの振幅、位置と音声信号のスペクトル
包絡特性を表すスペクトルパラメータとピッチ周期情報
とを伝送する。受信側では代表的なパルスの振幅、位置
とピッチ周期情報を用いて、前後のフレームからの補間
処理により、この代表的なパルスを時間的になめらかに
変化させながら駆動音源信号を復元し、この駆動音源信
号と、補間処理により時間的になめらかに変化させて求
めたスペクトルパラメータとを用いて高品質な音声信号
を合成すること特徴としている。 (実施例) 以下、本発明の実施例について図面を参照して詳細に
説明する。第1図(a)は本発明による高能率音声符号
化方式の送信側の一実施例を示すブロック図であり、第
1図(b)は受信側の一実施例を示すブロック図であ
る。 第1図(a)において、音声信号X(n)が入力さ
れ、あらかじめ定められたサンプル数だけバッファメモ
リ回路110に蓄積される。次にKパラメータ計算回路140
は、バッファメモリ回路110からあらかじめ定められた
サンプル数の音声信号を入力し、音声信号のスペクトル
包絡を表すKパラメータを計算する。ここでKパラメー
タはPARCOR係数と同一のパラメータである。Kパラメー
タの計算法としては、自己相関法がよく知られている。
この方法の詳細については、ジョン マクホウル氏(JO
HNMAKHOUL)氏らによる「クォンタイゼイションプロパ
ディズ オブ トランスミッション パラメータズ イ
ン リニア プリディクティブ システンズ(QUANTIZA
TION PROPERTIES OF TRANSMISSINO PARMETERS IN LINEA
R PREDICTIVE SYSTEMS)」と題した論文(IEEE TRANS.
A.S.S.P.,p.p.309-321,1983;文献5)等に述べられてい
るので、ここでは説明を省略する。 第1図(a)にもどって、KパラメータKiは、Kパラ
メータ符号化回路160へ出力される。Kパラメータ符号
化回路160は、あらかじめ定められた量子化ビット数に
基ずいてKiを符号化し、符号lKiをマルチプレクサ260へ
出力する。また、Kパラメータ符号化回路160は、lKiを
復号化して得たKパラメータ復号値Ki′を用い、予測係
数値ai′に変換し、インパルス応答計算回路170と重み
ずけ回路200とへ出力する。またKパラメータ復号値Ki
を補間回路255へ出力する。 ピッチ分析回路130は、バッファメモリ回路110の出力
を用いてピッチ周期Pを計算する。Pの計算法は、例え
ば、アール ブイ コックス(R.V.COX)氏らによる
「リアル タム インプリメンティション オブ タイ
ム ドメイン ハーモニック スケィリング オブ ス
ピーチ シグナルズ(REAL-TIME IMPLEMENTATION OF TI
ME DOMAIN HARMONIC SCALING OF SPEECH SIGNALS)と題
した論文(IEEE TRANS.A.S.S.P.,p.p.258-272,1983;文
献6)等で述べられている方法を用いることができる。 ピッチ符号化回路150は、ピッチ周期Pdをあらかじめ
さだめられた量子化ビット数で量子化符号化し、符号ld
をマルチプレクサ260へ出力する。また復号化して得たP
d′を駆動信号計算回路220、及び補間回路255へ出力す
る。 インパルス応答計算回路170は、Kパラメータ符号回
路160から予測係数値ai′を入力し、重みずけされた合
成フィルタの伝達関数を表すインパルス応答hw(n)を
計算する。ここでhw(n)の計算には、例えば特願昭59
-042305号明細書の第4図(a)に記載のインパルス応
答計算回路210と同一の方法を用いることができる。イ
ンパルス応答hw(n)は、自己相関関数計算回路180と
相互相関関数計算回路210とへ出力される。 自己相関関数計算回路180はインパルス応答計算回路1
70からインパルス応答hw(n)を入力し、次式に従い自
己相関関数を計算する。 自己相関関数Rhh(・)は駆動信号計算回路220へ出力さ
れる。 次に減算器120はバッファメモリ回路110の音声信号X
(n)から合成フィルタ回路250の出力を1フレーム分
減算し、結果e(n)を重みずけ回路200へする。重み
ずけ回路200はe(n)を入力し、またKパラメータ符
号回路160から予測係数ai′を入力し、e(n)に対し
重みずけを施して求めたew(n)を出力する。ここでew
(n)の計算には、例えば特願昭59-042305号明細書の
第4図(a)に記載の重みずけ回路410と同一の方法を
用いることができる。相互相関関数計算回路210は、重
みずけ回路200からew(n)を入力し、インパルス応答
計算回路170からインパルス応答hw(n)を入力し、次
式に従い相互相関関数hx(m)を計算する。 相互相関関数hx(m)は駆動信号計算回路220へ出力
される。 次に駆動信号計算回路220は、音声信号を表す音源信
号として、パルス系列を代表的なピッチ区間に対して計
算する。この手順を次に示す。まず最初に、フレームを
ピッチ周期Pd′ごとのサブフレームに分割する。この分
割にはピッチ励振位置を知る必要があるが、これは音源
を表すパルス列を求めることにより知ることができる。
つまり、第1番目のパルスの位置から、ピッチの励振位
置を知ることができる。ここでパルス列の計算には、例
えば特願昭57-231606号明細書の第(21)式で示した方
法を用いることができる。第2図(a)に1フレームの
音声波形を、第2図(b)に第1番目に求まるパルスg1
とこのパルスの位置を用いて分割したサブフレームのよ
うすを示す。次の処理としてサブフレーム毎に、あらか
じめ定められた個数のパルスを計算する。代表的なピッ
チ区間の選定法としては、例えば絶対値の大きなパルス
を含むサブフレームを代表ピッチ区間とし、この区間に
含まれるパルスを代表パルスとする方法を用いることが
できる。このようにして求めた代表ピッチパルスを第2
図(c)に示す。パルスの振幅、位置は符号器230へ出
力される。また、サブフレーム位相T、代表ピッチ区間
のサブフレーム番号(第2図(c)では3)を代表ピッ
チ位置としてあらかじめ定められたビット数で符号化
し、マルチプレクサ260へ出力する。符号化回路230は、
入力したパルスの振幅、位置を符号化する。そして、代
表ピッチ区間のパルスの振幅、位置の符号をマルチプレ
クサへ出力する。また、入力した全てのパルスの振幅、
位置の復号値gi′mi′を駆動信号復元回路240へ出力す
る。ここでパルスの符号化法には、例えば特願昭57-231
605号明細書に記載の符号化回路250と同一の方法を用い
ることができる。他の符号化法として、可変長符号化
法、あるいは、差分符号化法等種々の方法が考えられ
る。 駆動信号復元回路240は、符号化回路230から入力した
パルスの振幅および位置の復号値を用いて、1フレーム
分のパルスを発生させ、これを駆動音源信号として合成
フィルタ回路250へ出力する。 補間回路255は、ピッチ周期Pd′、サブフレーム位相
T、代表ピッチ位置を入力する。そして、フレームをピ
ッチ周期Pd′ごとのサブフレームに分割し、Kパラメー
タをこのサブフレームごとに補間する。ここで補間は直
線補間とし、1フレーム過去及び1フレーム先のKパラ
メータの値を用いる。この補間のようすを第3図に示
す。図において第jフレームのi番目のKパラメータK
ijは、1フレーム過去の値Kij-1,及び1フレーム先の値
Kij+1を用いて、サブフレーム毎に補間がおこなわれ
る。代表ピッチ区間には、Kパラメータ符号化回路160
から入力したKパラメータ復号値を用いる。このように
して補間して求めたKパラメータは、合成フィルタ回路
250へ出力される。 合成フィルタ250は、駆動音源信号、及び補間された
Kパラメータを入力し、1フレーム分の応答信号X
(n)を計算する。ここでこの計算には、例えば特願昭
57-231605号明細書に記載の合成フィルタ回路320と同一
の方法を用いることができる。 マルチプレクサ回路260は、Kパラメータ符号化回路1
60の符号lKiとピッチ符号化回路150の符号ldと符号化回
路230の符号及びサブフレーム位相、代表ピッチ位置を
入力し、これらを組あわせて送信側出力端子270から出
力する。以上で本発明による高能率音声符号化方式の送
信側の説明を終了する。 次に、本発明による音声符号化方式の受信側の構成に
ついて、第1図(b)を参照して説明する。 デマルチプレクサ290は、受信側入力端子280から入力
した符号のうち、Kパラメータをあらわす符号と、ピッ
チ周期を表す符号と、パルスの振幅、位置を表す符号
と、サブフレーム位相、代表ピッチ位置を表す符号とを
分離して、それぞれKパラメータ復号回路330、ピッチ
復号回路320、パルス復号回路300、駆動信号復元回路34
0へ出力する。 Kパラメータ復号回路330は、Kパラメータを復号し
て復号値Ki′を補間回路335へ出力する。 ピッチ復号回路320は、ピッチ周期Pd′を復号して、
駆動信号復元回路340、補間回路335へ出力する。 パルス復号回路300はパルス振幅gi′、位置mi′を復
号して駆動信号復元回路340へ出力する。 駆動信号復元回路340は、まずサブフレーム位相、代
表ピッチ位置を表す符号と、ピッチ周期Pd′を入力し、
フレームをピッチ周期Pd′ごとのサブフレームに分割す
る。そして代表ピッチ位置で表されるサブフレーム区間
に対して位置m′に振幅g′のパルスを発生させる。次
に、代表ピッチパルスと1フレーム過去、及び1フレー
ム先の代表的なパルスを用いてサブフレーム毎にパルス
を補間して求める。こうして全てのサブフレームについ
てパルスを発生させ駆動音源信号を復元し、1フレーム
分の駆動音源信号を合成フィルタ回路350へ出力する。 補間回路335は、送信側の補間回路255と同一の動作を
し、復号されたKパラメータをピッチ周期ごとに補間
し、補間されたパラメータを合成フィルタ回路350へ出
力する。 合成フィルタ回路350は、駆動音源信号、補間された
Kパラメータを入力し、送信側の合成フィルタ回路250
と同一の動作をして、1フレーム分の合成音声信号X
(n)を計算し受信側出力端子360から出力する。 以上で本発明による高能率音声符号化方式の受信側の
説明をおえる。 駆動信号計算回路220におけるパルス計算法として
は、本実施例でのべた方法の他に種々の方法を用いるこ
とができる。例えばパルスを1つ求めるごとに過去に求
めたパルスの振幅を調整する方法を用いることができ
る。この方法の詳細については小野氏らによる「マルチ
パルス駆動型音声符号化法における音源パルス探索法の
検討」と題した論文(日本音響学会講演論文集157、198
3;文献7)等に述べられているのでここでは説明を省略
する。 また、駆動信号計算回路220にてパルスを求めるさい
に、フレームをサブフレームに分割した後に、サブフレ
ームごとにパルスを求めていたが、サブフレームに分割
せずに、フレーム全体に対してあらかじめ定めた個数の
パルスを求めるようにしてもよい。更に、本実施例の送
信側では、Kパラメータの値はフレーム内で一定(つま
り合成フィルタの特性がフレーム内で変化しない)とし
て、このフレーム内のサブフレームごとにパルスを求め
たが、Kパラメータの値をサブフレーム毎になめらかに
変化させながらパルスを求めてもよい。具体的には、K
パラメータの値の前後のフレームのKパラメータの値を
用いてサブフレーム毎に補間し、この値を予測係数に変
換して、重みずけ回路200、インパルス応答計算回路17
0、合成フィルタ回路250に出力し、サブフレーム毎に係
数を更新して求めた相互相関関係、自己相関関係を用い
たパルスを計算する。このようにしたほうが、より良好
な音声を合成できる。また、パルス及びKパラメータの
値を補間するさいに、送信側では、代表的なピッチ区間
の位置を求め伝送し、この区間を基準としてピッチ周期
に同期させて補間していたが、パルス及びKパラメータ
のいずれか一方、あるいは両方とも、あらかじめ定めら
れたピッチ区間(例えば、フレームの中央付近のピッチ
区間)を基準として補間を施してもよい。両方ともこの
ような補間法を用いる場合は、代表ピッチ区間の位置を
表す符号を伝送しなくてもよく、伝送ビットレイトを減
らすことができる。また、代表ピッチ区間として、絶対
値の大きなパルスを含むサブフレームを選択していた
が、例えばフレーム中央のサブフレームを選択する方法
や良好な音声を再生できるような区間を選択する方法
等、他の方法を用いることもできる。また、サブフレー
ム分割を行うときにピッチ周期は一定としていたが、こ
の値も前後のフレームのピッチ周期を用いて補間するよ
うにしてもよい。一方、パルス及びKパラメータをピッ
チ周期に同期させずに補間する方法も考えられる。この
場合は、フレームをあらかじめ定められた時間間隔(例
えば2.5m sec程度)に区切り、この区間毎に補間処理を
行う。この場合はサブフレーム位相は伝送しなくてもよ
い。ここで、補間の基準区間としては、代表区間を送信
側で求めてもよいし、あらかじめ定めておいてもよい
(例えばフレーム中中央付近)。後者の場合には、サブ
フレーム位相と代表ピッチ位置を伝送しなくてもよく、
更にビットレイトを減らすことができる。 次に、パルス、合成フィルタのパラメータ、ピッチ周
期の補間法としては、直線補間以外の方法も考えられ
る。例えば、パルス、ピッチ周期については、対数補間
等も考えられる。また、合成フィルタのパラメータを補
間する場合、本実施例ではKパラメータについて補間し
たが、例えば予測係数を補間する方法(但し、この場合
はフィルタの安定性をチェックする必要がある)や、対
数断面積関数を補間する方法や、自己相関関数を補間す
る方法等を用いることもできる。これらの具体的な方法
は、ビー エス アタル(B.S.ATAL)氏らによる「スピ
ーチ アナリシス アンド シンセシス バイリニアー
プリディクション オブ ザ スピーチ ウェイブ
(SPEECH ANALYSIS AND SYNTHESIS BY LINEAR PREDICTI
ON OF THE SPEECH WAVE)と題した論文(J.ACOUST.SOC.
AM.,.p.p.637-655,1971;文献8)等で述べられているの
で説明は省略する。 本実施例では、フレーム長一定としてKパラメータの
分析および音源パルス列の計算をしたが、フレーム長は
可変としてもよい。このようにした場合には、音声の変
化部では、フレーム長を短くし、定常部ではフレーム長
を長くできるので、伝送ビットレイトを低減することが
できる。更に、ピッチ周期に応じて(例えばピッチ周期
の整数倍)フレーム長を決めるようにすれば、本実施例
で述べたサブフレーム位相も送らなくてよいので、更に
伝送ビットレイトを低減することができる。 本発明の他の構成法として、第1図(a)に於ける駆
動信号復元回路240、合成フィルタ回路250、補間回路25
5、減算回路120を省略して構成をとることもできる。こ
のようにした場合は、送信側で音声信号を合成しなくて
もよく、装置構成を簡略化することができる。 尚、ディジタル信号処理の分野でよく知られているよ
うに、自己相関関数はパワスペクトルから計算すること
もできる。また、相互相関関数はクロスパワスペクトル
から計算することもできる。これらの対応関係について
は、エー ブイ オッペンハイム(A.V.OPPENHEIM)氏
らによる「ディジタル信号処理(DIGITAL SIGNAL PROCE
SSING)」と題した単行本(文献9)等の第8章にて詳
細に説明されているので、ここでは説明を省略する。 (発明の効果) 本発明によれば、音源信号を複数個のパルス列(マル
チパルス)の組み合わせで表すと共に、音声信号の周期
性を利用して、音声信号を良好に表すように代表的なピ
ッチ区間のパルスを求めて伝送し、この代表的なピッチ
パルスを時間的になめらかに変化させながら駆動音源信
号を復元し音声を合成しているので、低い伝送ビットレ
イトにおいても高品質な音声を合成できるという効果が
ある。
【図面の簡単な説明】
第1図(a)、(b)は、本発明による高能率音声符号
化方式の一実施例を表すブロック図、第2図(a)〜
(c)は駆動信号計算回路220における処理内容の一例
を示す図、第3図は補間回路の処理例を示す図、第4図
は従来方式の合成側の構成を示すブロック図、第5図は
マルチパルスで表した音源信号の一例を示す図である。 図において 110……バッファメモリ回路 120……減算回路 250,350……合成フィルタ回路 200……重みずけ回路 170……インパルス応答計算回路 180……自己相関関数計算回路 210……相互相関関数計算回路 220……駆動信号計算回路 240,340……駆動信号復元回路 130……ピッチ分析回路 140……Kパラメータ計算回路 150……ピッチ符号化回路 160……Kパラメータ符号化回路 230……符号化回路 255,335……補間回路 260……マルチプレクサ 290……デマルチプレクサ 300……パルス復号回路 320……ピッチ復号回路 330……Kパラメータ復号回路 をそれぞれ示す。
化方式の一実施例を表すブロック図、第2図(a)〜
(c)は駆動信号計算回路220における処理内容の一例
を示す図、第3図は補間回路の処理例を示す図、第4図
は従来方式の合成側の構成を示すブロック図、第5図は
マルチパルスで表した音源信号の一例を示す図である。 図において 110……バッファメモリ回路 120……減算回路 250,350……合成フィルタ回路 200……重みずけ回路 170……インパルス応答計算回路 180……自己相関関数計算回路 210……相互相関関数計算回路 220……駆動信号計算回路 240,340……駆動信号復元回路 130……ピッチ分析回路 140……Kパラメータ計算回路 150……ピッチ符号化回路 160……Kパラメータ符号化回路 230……符号化回路 255,335……補間回路 260……マルチプレクサ 290……デマルチプレクサ 300……パルス復号回路 320……ピッチ復号回路 330……Kパラメータ復号回路 をそれぞれ示す。
─────────────────────────────────────────────────────
フロントページの続き
(58)調査した分野(Int.Cl.6,DB名)
G10L 3/00,5/00 - 5/04,9/14
Claims (1)
- (57)【特許請求の範囲】 1.送信側では離散的な音声信号を入力し、あらかじめ
定められた時間間隔に分割し、前記音声信号から短時間
スペクトル包絡を表すスペクトルパラメータとピッチを
表すピッチパラメータとを抽出して符号化し、前記時間
間隔を前記ピッチパラメータを用いて前記時間間隔より
も短い時間区間に分割し、前記音声信号と前記ピッチパ
ラメータをもとにして前記音声信号を表すための代表的
な音源パルス列を前記ピッチパラメータに応じて求めた
時間区間のうちの代表的な区間に対しあらかじめ定めら
れた個数だけ求めて符号化し、前記ピッチパラメータを
表す符号と前記スペクトルパラメータを表す符号と前記
代表的な音源パルス列を表す符号とを組み合わせて出力
し、受信側では前記組み合わされた符号を入力し、前記
ピッチパラメータを表す符号と前記スペクトルパラメー
タを表す符号と前記代表的な音源パルス列を表す符号と
を分離して復号し、前記復号されたピッチパラメータに
応じて前記時間間隔を前記時間間隔よりも短い時間区間
に分割し、前記代表的な区間以外の区間では、前記復号
されたピッチパラメータと前記復号された音源パルス列
と過去の時間間隔における代表的な音源パルス列とをも
とに前記音源パルス列に対し前記区間毎にピッチに同期
してなめらかな変化を与える処理をほどこして他の時間
区間の駆動音源信号を復元し前記復元された駆動音源信
号と前記復元されたスペクトルパラメータをもとに前記
音声信号を合成することを特徴とする音声符号化方式。 2.入力した音声信号をあらかじめ定められた時間間隔
に分割し前記音声信号から短時間スペクトル包絡を表す
スペクトルパラメータとピッチを表すピッチパラメータ
とを抽出し符号化するパラメータ計算回路と、前記時間
間隔を前記ピッチパラメータを用いて前記時間間隔より
も短い時間区間に分割し、前記音声信号と前記ピッチパ
ラメータと前記スペクトルパラメータをもとにして前記
音声信号を表すための代表的な音源パルス列を前記ピッ
チパラメータに応じて求めた時間区間のうちの代表的な
区間に対しあらかじめ定められた個数だけ求めて符号化
する駆動信号計算回路と、前記パラメータ計算回路の出
力符号と前記駆動信号計算回路の出力符号とを組み合わ
せて出力するマルチプレクサ回路とを有することを特徴
とする音声符号化装置。 3.あらかじめ定められた時間間隔毎にピッチパラメー
タを表す符号とスペクトルパラメータを表す符号と音源
パルス列を表す符号とが組み合わされた符号系列が入力
され、前記ピッチパラメータを表す符号と前記スペクト
ルパラメータを表す符号と前記音源パルス列を表す符号
とを分離して復号するデマルチプレクサ回路と、前記復
号されたピッチパラメータに応じて前記時間間隔を前記
時間間隔よりも短い時間区間に分割し、代表的な区間以
外の区間では、前記復号されたピッチパラメータと前記
復号された音源パルス列と過去の時間間隔における代表
的な音源パルス列とをもとに前記音源パルス列に対して
前記区間毎にピッチに同期してなめらかな変化を与える
処理をほどこして他の時間区間における駆動音源信号を
復元する駆動音源信号復元回路と、前記復元された駆動
音源信号と前記復号されたスペクトルパラメータをもと
に音声信号を合成し出力する合成フィルタ回路とを有す
ることを特徴とする音声復号化装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59272435A JP2844590B2 (ja) | 1984-12-24 | 1984-12-24 | 音声符号化方式とその装置 |
CA000498407A CA1252568A (en) | 1984-12-24 | 1985-12-23 | Low bit-rate pattern encoding and decoding capable of reducing an information transmission rate |
US06/813,167 US4821324A (en) | 1984-12-24 | 1985-12-24 | Low bit-rate pattern encoding and decoding capable of reducing an information transmission rate |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59272435A JP2844590B2 (ja) | 1984-12-24 | 1984-12-24 | 音声符号化方式とその装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS61150000A JPS61150000A (ja) | 1986-07-08 |
JP2844590B2 true JP2844590B2 (ja) | 1999-01-06 |
Family
ID=17513869
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP59272435A Expired - Lifetime JP2844590B2 (ja) | 1984-12-24 | 1984-12-24 | 音声符号化方式とその装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2844590B2 (ja) |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5816297A (ja) * | 1981-07-22 | 1983-01-29 | ソニー株式会社 | 音声合成方式 |
JPS59116793A (ja) * | 1982-12-24 | 1984-07-05 | 日本電気株式会社 | 音声符号化装置 |
-
1984
- 1984-12-24 JP JP59272435A patent/JP2844590B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPS61150000A (ja) | 1986-07-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2940005B2 (ja) | 音声符号化装置 | |
JP3180762B2 (ja) | 音声符号化装置及び音声復号化装置 | |
JP2903533B2 (ja) | 音声符号化方式 | |
JP2615548B2 (ja) | 高能率音声符号化方式とその装置 | |
JP2844589B2 (ja) | 音声信号符号化方法とその装置 | |
JP3303580B2 (ja) | 音声符号化装置 | |
JP2829978B2 (ja) | 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置 | |
JP2844590B2 (ja) | 音声符号化方式とその装置 | |
JP2560682B2 (ja) | 音声信号符号化復号化方法とその装置 | |
JP2956068B2 (ja) | 音声符号化復号化方式 | |
JP2508002B2 (ja) | 音声符号化方法とその装置 | |
JP2001142499A (ja) | 音声符号化装置ならびに音声復号化装置 | |
JP2853170B2 (ja) | 音声符号化復号化方式 | |
JP3063087B2 (ja) | 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置 | |
JP3055901B2 (ja) | 音声信号符号化復号化方法及び音声信号符号化装置 | |
JP2847730B2 (ja) | 音声符号化方式 | |
JP2946528B2 (ja) | 音声符号化復号化方法及びその装置 | |
JPH0833756B2 (ja) | 音声信号符号化方法とその装置 | |
JP2615862B2 (ja) | 音声符号化復号化方法とその装置 | |
JP2629762B2 (ja) | ピッチ抽出装置 | |
JPH077275B2 (ja) | 音声信号符号化方式とその装置 | |
JPS62207036A (ja) | 音声符号化方式とその装置 | |
JPS63127299A (ja) | 音声信号符号化・復号化方式およびその装置 | |
JP3128226B2 (ja) | 音声符号化方法 | |
JPS62133498A (ja) | 音声符号化方法とその装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
EXPY | Cancellation because of completion of term |