JPS6238500A - 高能率音声符号化方式とその装置 - Google Patents

高能率音声符号化方式とその装置

Info

Publication number
JPS6238500A
JPS6238500A JP60178911A JP17891185A JPS6238500A JP S6238500 A JPS6238500 A JP S6238500A JP 60178911 A JP60178911 A JP 60178911A JP 17891185 A JP17891185 A JP 17891185A JP S6238500 A JPS6238500 A JP S6238500A
Authority
JP
Japan
Prior art keywords
sound source
parameter
pitch
signal
representing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP60178911A
Other languages
English (en)
Other versions
JP2615548B2 (ja
Inventor
一範 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP60178911A priority Critical patent/JP2615548B2/ja
Priority to CA000498407A priority patent/CA1252568A/en
Priority to US06/813,167 priority patent/US4821324A/en
Publication of JPS6238500A publication Critical patent/JPS6238500A/ja
Application granted granted Critical
Publication of JP2615548B2 publication Critical patent/JP2615548B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は音声信号を低いビットレイトで高品質に符号化
するための符号化方法とその装置に関する。
(従来の技術) 音声信号を低い伝送ビットレイト(例えば4.8kbp
s程度)で符号化する方式として、ボコーダ(VOCO
DER)が知られている。この方法については、原理に
ついては例えば、エムアールシュレイダー(M−R,5
CROEDER)氏によるパボコーダズ:アナリシスア
ンドシンセシスオブスピーチ″C′VOCODER8:
ANALYSIS AND 5YNTHESIS 0F
SPEECH” )と題した論文(PROC,IEEE
、 p、p、720−734゜MAY、1966X文献
1)等に詳細に説明されている。また、線形予測分析法
を用いるボコーダとしてエルピーシ−ボコーダ(LPC
VOCODER)が知られており、その内容については
例えば、シェープイーマーケル(J、D、 MARKE
L )氏らによる″アーリニアープレディクションボコ
ーダベイスドアポン、ザオートコリレイションメソッド
”’ (” A LINEARPREDICTION 
VOCODERBASED UPON THEAUTO
CORRELATION METHOD ” )と題し
た論文(IEEE TRANS、 A、S、S、P、、
p、p、 124−134.APRIL、 1974 
)(文献2)等に詳細に説明されている。本発明はVO
CODEHの音源部を改良したものであり、LPCVO
CODERと密接な関係があるので、以下LPCVOC
ODERについて合成部の構成を中心に概略を説明する
第4図は、文献2に記載のLPCvOCODERの合成
部(受信部)を示すブロック図である。合成部は音源発
生部500と合成フィルタ510からなる。音源発生部
500はインパルス発生器501と雑音発生器502と
有声l無声切りかえ回路503と、ゲイン回路504か
ら構成される。VOCODERでは、音声信号は短時間
(例えば20m5ec)毎に有声と無声の2種にわけら
れ、有声の場合は、インパルス発生器501からピッチ
周期Pdの時間間隔をもつパルス列が発生される。一方
、無声の場合は、雑音発生器502から白色雑音が発生
される。有声l無声の制御は、切り換え回路503にて
おこなわれる。このようにして発生された信号に対して
、ゲイン回路504にてゲインGがあたえられ、音源信
号d(n)として合成フィルタ510へ出力される。
合成フィルタ510では音源信号d(n)とフィルタパ
ラメータKiを用いて音声x(n)を合成し出力する。
ここでピッチ周期Pd、有声l無声切り換え信号(V/
UV)、ゲインG、フィルタパラメータKiは分析側(
送信側)においてあらかじめ定められた時間ごとに計算
され、受信側に伝送される。
(発明が解決しようとする問題点) 以上説明したLPCVOCODERにおいては、伝送情
報は、ピッチ周期、有声l無声信号、ゲイン、フィルタ
パラメータであり、これらの情報から音声信号を合成で
きるので、伝送ビットレイトを低く(例えば48kbp
s程度)することヴできる。しかしながら、この従来法
では品質の良好な音声を合成することは困難であった。
それは、音源信号は有声の場合は音源を1ピツチあたり
1個のインパルスで表わしており、更に位相情報も含ま
ないので、自然性はかなり損なわれており、その合成音
はいわゆる機械的な音であった。また、音声を有声と無
声という2種の極端なりラスにわけ、音源をインパルス
音源か雑音源に切り替えているので、有声/無声の判別
誤りがおきた場合は大きな品質劣化をひきおこすという
欠点があった。また、無声と有声の切り換わり部では音
源を良好に表わすことができず、劣化がおきていた。更
に、ピッチ周期がずれて求まった場合には、大きな品質
劣化を引き起こすという欠点があった。
音源を改良する方法として、例えば特願昭59゜272
435号明細書(文献3)等に記載されているように、
音源をパルス列の組み合わせで表わし、代表的なピッチ
区間のパルス列を伝送する方法が知られている。この方
法ではピッチ周期の明瞭な有声区間では前述の問題点を
改善し良好な品質を得ることができるが、ピッチが明瞭
でなく音源が雑音的になる無声区間、及び、無声区間と
有声区間との過渡部では、伝送ビットレイトが低い場合
、音源を良好に表わせず、品質が劣化するという欠点が
あった。
本発明の目的は、比較的少ない演算量で、4゜8kbp
’s程度の低い伝送ビットレイトでも高品質な音声を合
成することのできる高能率音声符号化方式とその装置を
提供することにある。
(問題を解決するための手段) 本発明の高能率音声符号化方式は、送信側では離散的な
音声信号を入力しあらかじめ定められた時間区間に分割
し、前記音声信号から短時間スペクトル包絡を表わすス
ペクトルパラメータとピッチを表わすピッチパラメータ
とを抽出し、前記音声信号を表わすための音源を代表区
間のパルス列かまたはパルスと雑音の組み合わせで表わ
し、前記音源を表わす情報と前記ピッチパラメータと前
記スペクトルパラメータとを組み合わせて出力し、受信
側では前記ピッチパラメータと前記音源を表わす情報を
もとに前記代表区間のパルス列に対し時間的になめらか
な変化を与える処理をほどこし駆動音源信号を復元して
前記スペクトルパラメータとをもちいて前記音声信号を
合成することを特徴とする。
また、本発明の符号化装置は、入力した音声信号をあら
かじめ定められた時間区間に分割し前記音声信号から短
時間スペクトル包絡を表わすスペクトルパラメータとピ
ッチを表わすピッチパラメータとを抽出し符号化するパ
ラメータ計算回路と、前記音声信号と前記ピッチパラメ
ータと前記スペクトルパラメータをもとにして代表区間
のパルス列による音源とパルスと雑音の組み合わせによ
る音源のうちで音声信号をより良好に表わし得る音源信
号を求め前記音源を表わす情報を符号化する駆動信号計
算回路と、前記パラメータ計算回路の出力符号と前記駆
動信号計算回路の出力符号とを組み合わせて出力するマ
ルチプレクサ回路とを有することを特徴とする。
更に本発明の復号化装置は、ピッチパラメータを表わす
符号とスペクトルパラメータを表わす符号と音源情報を
表わす符号とが組み合わされた符号系列が入力され前記
ピッチパラメータを表わす符号と前記スペクトルパラメ
ータを表わす符号と前記音源情報を表わす符号とを分離
して復号するデマルチプレクサ回路と、前記復号された
ピッチパラメータと前記復号された音源情報をもとに代
表区間のパルス列を音源とする場合は前記代表区間のパ
ルス列に対して時間的になめらかな変化を与える処理を
施しパルスと雑音を音源とする場合は前記音源情報を基
にパルスと雑音を発生して駆動音源信号を復元する駆動
音源信号復元回路と、前記駆動音源信号と前記復号され
たスペクトルパラメータとをもとに音声信号を合成し出
力する合成フィルタ回路とを有することを特徴とする。
(作用) 本発明は、音声信号の周期性を利用して前記文献3に記
載のように代表的な1ピッチ区間のパルス列で表わした
音源信号と、パルスと雑音源との組み合わせによる音源
信号のうち、音声信号をより良好に表わすことのできる
音源信号を選択することを特徴とする。代表的な1ピッ
チ区間のパルス列を求める方法としては、前記文献3に
記載の方法を用いることができる。また、パルス列の振
幅と位置を求める方法としては、前言己文献3に記載の
方法の他に、例えばアナリシスーバイーシンセシス(A
NALYSIS −by −5YNTHESIS;A−
b −S)の手法を用いる方法が知られており、その詳
細についてはビーエスアタル(B、S、ATAL)氏ら
による″アニューモデルオブエルピーシーエクサイテイ
ションフオープロデューシングナチュラルサウンヂイン
ダスピーチアットロウビットレイツ”(″ANEW  
MODEL  OF  LPCEXCITATION 
 FORPRODUCINGNATURALSOUND
INGSPEECHATLOW BIT RATES”
 ) ト題した論文(PROC,1,C,A、S、S。
P、、p、p、 614−617.1982) (文献
4)等に説明されている。
一方、パルスと雑音の組み合わせによる音源の求め方は
、フレーム全体に対してパルス列をあらかじめ定められ
た個数だけ求めたあとで、雑音源の振幅と位相を計算す
る。
(実施例) 以下、本発明の実施例について図面を参照して詳細に説
明する。第1図(a)は本発明による高能率音声符号化
方式の送信側の一実施例を示すブロック図であり、第1
図(b)は受信側の一実施例を示すブロック図である。
第1図(a)において、音声信号X(n)が入力されあ
らかじめ定められたサンプル数だけバッファメモリ回路
110に蓄積される。次ににパラメータ計算回路140
は、バッファメモリ回路110からあらかじめ定められ
たサンプル数の音声信号を入力し、音声信号のスペクト
ル包絡を表わすにパラメータを計算する。ここでにパラ
メータはPARCOR係数と同一のパラメータである。
Kパラメータの計算法としては、自己相関法がよく知ら
れている。この方法の詳細については、ジョンマコウル
氏(JOHNMAKE(OUL)氏ら(こよる”りオン
タイゼイションプロパティズオプトランスミッションパ
ラメターズインリニアプリディクティプシステムズ(P
REDICTIVE SYSTEMS” )と題した論
文(IEEETRANS、 A、S、S、P、、p、p
、309−321.1983)(文献5)等に述べられ
ているので、ここでは説明を省略する。第1図(a)に
もどって、KパラメータKiは、Kパラメータ符号化回
路160へ出力される。Kパラメータ符号化回路160
は、あらかじめ定められた量子化ビット数に基づいてK
iを符号化し、符号liをマルチプレクサ260へ出力
する。また、Kパラメータ符号化回路160は、liを
復号化して得たにパラメータ復号値Ki’ を用い、予
測係数値ai′ に変換し、インパルス応答計算゛回路
170と重みずけ回路200とへ出力する。またにパラ
メータ復号値Ki′ を補間回路255へ出力する。
ピッチ分析回路130は、バッファメモリ回路110の
出力を用いてピッチ周期Pdを計算する。Pdの計算法
は、例えば、アールブイコックス(R,V、C0X)氏
らによる″リアルタイムインプリメンティションオプタ
イムドメインハーモニツクスヶイリングオプスピーチシ
グナルズ(”REAL−TIME題した論文(IEEE
 TRANS、 A、 S、 S、 P、、p、 p、
 258−272゜1983 ) (文献6)等で述べ
られている方法を用いることができる。
ピッチ符号化回路150は、ピッチ周期Pdをあらかじ
め定められた量子化ビット数で量子化符号化し、符号1
dをマルチプレクサ260へ出力する。また復号化して
得たPd’ を駆動信号計算回路220へ出力する。
インパルス応答計算回路170は、Kパラメータ符号化
回路160から予測係数値ai′ を入力し、重みずけ
された合成フィルタの伝達関数を表わすインパルス応答
hw(n)を計算する。ここで、hw(n)の計算には
、例えば特願昭59−042305号明細書(文献7)
の第4図(a)に記載のインパルス応答計算回路210
と同一の方法を用いることができる。インパルス応答h
w(n)は、自己相関関数計算回路180と相互相関関
数計算回路210とへ出力される。
自己相関関数計算回路180は、インパルス応答計算回
路170からインパルス応答hw(n)を入力し、自己
相関関数Rhh(m)を計算し、駆動信号計算回路22
0へ出力する。ここでRhh(m)の計算には例えば前
記文献7に記載の自己相関関数計算回路180と同一の
方法を用いることができる。
次に減算器120は、バッファメモリ回路110の音声
信号X(n)から合成フィルタ回路250の出力を1フ
レーム分減算し、結果e(n)を重みすけ回路200へ
出力する。重みずけ回路200は、e(n)を入力し、
また、Kパラメータ符号化回路160がら予測係数ai
′ を入力し、e(n)に対し重みずけを施して求めた
eW(n)を出力する。ここでe(n)の計算には、例
えば前記文献7の第4図(a)に記載の重みすけ回路4
10と同一の方法を用いることができる。
相互相関関数計算回路210は、重みずけ回路200か
らew(n)を入力し、インパルス応答計算回路170
からインパルス応答hw(n)を入力し相互相関関数ψ
、x(m)を計算し、駆動信号計算回路220へ出力す
る。ここで、hx(m)の計算には例えば前記文献7に
記載の相互相関関数計算回路210と同一の方法を用い
ることができる。
次に、駆動信号計算回路220は、音声信号を表わす音
源信号として、まず代表的なピッチ区間のパルス列を計
算する。次にパルス列と雑音源による音源信号を計算し
、これらのうち、音声信号をより良好に表わし得る音源
信号を選択する。ピッチが明瞭か否かの判別には、簡便
法としてはピッチゲインPgt−用いることができる。
音源信号の求め方を以下で説明する。代表的なピッチ区
間のパルス列の計算法としては、例えば前記文献3に記
載の駆動信号計算回路220と同一の方法を用いること
ができる。従ってここでは簡単に説明するにとどめる。
まず最初に、フレームをピッチ周期Pd′ ごとのサブ
フレームに分割する。この分割には、ピッチの励振位置
を知る必要があるが、これは音源を表わすパルス列を求
めることにより知ることができる。つまり、第1番目に
求めたパルスの位置から、ピッチの励振位置を知ること
ができる。ここでパルス列の計算には、例えば特願昭5
7−231606号明細書(文献8)に記載の第(21
)式で示した方法を用いることができる。第2図(a)
に1フレームの音声波形を、第2図(b)に第1番目に
求まるパルスg1とこのパルスの位置を用いて分割した
サブフレームのようすを示す。次にサブフレーム毎に、
あらかじめ定められた個数のパルスを計算する。ピッチ
区間の選定法としては、例えばフレームの中央付近のサ
ブフレームを代表ピッチ区間とし、この区間に含まれる
パルスを代表パルスとする方法が考えられる。
このようにして求めた代表ピッチパルスを第2図(C)
に示す。代表ピッチ区間のパルス列の振幅、位置は符号
器230へ出力される。また、サブフレーム位相T、代
表ピッチ区間のサブフレーム番号(図2(C)では3)
は代表ピッチ位置としてあらかじめ定められたビット数
で符号化され、マルチプレクサ260へ出力される。
次に、パルスと雑音による音源の求めかたを示す。まず
フレーム全体に対しあらかじめ定められた個数りのパル
スを前述の方法を用いて求める。このパルスを用いて信
号X(n)を合成し、原音声信号X(n)から合成信号
X(n)を減算した信号X’ (n)を求め、X’ (
n)を良好に表わすように雑音源を選択する。この計算
の具体的な方法を次に示す。今、雑音源をq(n)、雑
音源の振幅をG、合成フィルタのインパルス応答をh(
n)とすると、雑音源から合成される信号X(n)と信
号X’ (n)との誤差電力εは次式により表わせる。
C=Σ[工’ (n)−2(n)]”       (
la)=Σ[x’ (n)−G−q(n)XA(n)]
2(1b)雑音源の振幅G、は上式を最小化するように
求めることができる。
具体的には、雑音源のパターンをあらかじめ定められた
種類(例えばB種)だけ雑音メモリ225に記憶してお
き、雑音メモリ225から1種類ずつ雑音源をよみだす
。そして(1b)式を基に最適な振幅Gを求め、このと
きの誤差電力を計算しておく。そして、以上の処理を雑
音源の種類(B種)だけ繰り返し、誤差電力を最も小さ
くするような雑音源の種類を求めるわけである。以上述
べた音源計算処理は、無声区間と有声区間の過渡部のよ
うに、音源の特性が少しずつ変化している場合は特に効
果的である。
以上のようにして求めた2種の音源のうち、音声信号と
合成信号との誤差電力をより小さくする音源を選択し、
この音源をあられす音源情報を符号化回路230へ出力
する。
符号化回路230は、パルス列が入力された場合には、
パルス列の振幅、位置を符号化する。そして、パルス列
の振幅、位置の符号をマルチプレクサ260へ出力する
。また、パルス列の振幅、位置の復号値″ を駆動信号
復元回路240へ出力すgi  ツ四 る。ここで、パルスの符号化法には、例えば前記文献8
に記載の符号化回路250と同一の方法を用いることが
できる。
パルスと雑音源の情報が入力された場合には、パルス列
に対しては上述の方法と同じ方法を用いて符号化し、雑
音源に対しては、振幅と雑音の種類を表わす符号をあら
かじめ定められたビット数で符号化し、符号をマルチプ
レクサへ出力する。
また、復号化した値を駆動信号復元回路240へ出力す
る。
駆動信号復元回路240は、符号化回路230から入力
した復号値を用いて、1フレ一ム分の音源信号を発生さ
せ、これを駆動音源信号として、合成フィルタ回路25
0へ出力する。
補間回路255は、音源としてパルス列がもちいられる
場合は、ピッチ周期Pd’ 、サブフレーム位相T、代
表ピッチ位置を入力しピッチ周期Pd′ ごとに分割さ
れたサブフレームに対し、Kパラメータを補間する。こ
こで、補間は直線補間とし、1フレーム過去及び1フレ
ーム先のにパラメータの値をもちいて行なう。この補間
のようすを第3図に示す。図において第jフレームのi
番目のにパラメータKi、jは、1フレーム過去の値K
i、j l、及び1フレーム先の値Ki、j+1を用い
て、サブフレーム毎に補間がおこなわれる。このように
して補間口て求めたにパラメータは、合成フィルタ回路
250へ出力される。
音源としてパルスと雑音が用いられる場合は、あらかじ
め定められたサンプル区間毎に補間が行なわれる、補間
されたにパラメータは合成フィルタ回路250へ出力さ
れる。合成フィルタ回路250は、駆動音源信号、及び
補間されたにパラメータを入力し、1フレ一ム分の応答
信号X(n)を計算する。ここで、この計算には、例え
ば前記文献8に記載の合成フィルタ回路320と同一の
方法を用いることができる。
マルチプレクサ回路260は、Kパラメータ符号化回路
160の符号lkiとピッチ符号化回路150の符号l
dと符号化回路230の符号を入力し、パルス列が用い
られる場合は更にサブフレーム位相、代表ピッチ位置を
入力し、これらを組あわせて送信側出力端子270から
出力する。以上で本発明による高能率音声符号化方式の
送信側の説明を終了する。
次に、本発明による音声符号化方式の受信側の構成につ
いて、第1図(b)を参照して説明する。
デマルチプレクサ290は、受信側入力端子280から
入力した符号のうち、Kパラメータを表わす符号と、ピ
・シチ周期を表わす符号と、音源情報を表わす符号とを
分離して、それぞれにパラメータ復号回路330、ピッ
チ復号回路320、復号回路300へ出力する。
Kパラメータ復号回路330は、Kパラメータを復号し
て復号値Ki’ を補間回路335へ出力する。
ピッチ復号回路320は、ピッチ周期Pd’  を復号
して、駆動信号復元回路340、補間回路335へ出力
する。
復号回路300は音源情報を復号し駆動信号復元回路3
40へ出力する。
駆動信号復元回路340は、ピッチ周期復号値Pd’ 
を用いて、これが0以外の値であれば音源としてパルス
列が用いられると判別して、サブフレーム位相、代表ピ
ッチ位置を表わす符号を音源情報から分離して復号し、
これらを用いてフレームをピッチ周期Pd’ ごとのサ
ブフレームに分割する。
そして代表ピッチ位置で表されるサブフレーム区間に対
して位置m′ に振幅g′のパルスを発生させる。次に
、代表ピッチパルスと1フレーム過去、及び1フレーム
先の代表的なパルスを用いてサブフレーム毎にパルスを
補間して求める□。こうして1フレ一ム全体についてパ
ルスを発生させ駆動音源信号を復元し合成フィルタ回路
350へ出力する。
一方パルスと雑音が音源として用いられる場合は、パル
ス列の振幅、位置と雑音源の振幅、種類を表わす符号を
音源情報がら分離して復号する。
雑音源に対しては、送信側の雑音メモリ回路225と同
一の雑音が記憶されている雑音メモリ310に対し、復
号した種類を読み出し開始位置として、あらかじめ定め
られたサンプル数だけ雑音信号を読み出し、これに振幅
Gを乗じて音源を再生する。
今、雑音信号のサンプル値をqi(n)とすると、音源
信1v(n)は次式により表わせる。
V(n)= (rqi(n)            
(2)上式でiは雑音メモリ310に記憶されている雑
音信号の種類を示す。
上式の音源信号に復号したパルス列を加算して駆動音源
信号を復元し、合成フィルタ回路350へ出力する。
補間回路335は、送信側の補間回路255と同一の動
作をし、復号されたにパラメータをピッチ周期ごとに補
間し、補間されたにパラメータを合成フィルタ回路35
0へ出力する。
合成フィルタ回路350は、駆動音源信号、補間された
にパラメータを入力し、送信側の合成フィルタ回路25
0と同一の動作をして1フレ一ム分の合成音声信号X(
n)を計算し、受信側出力端子360から出力する。
以上で本発明による高能率音声符号化方式の受信側の説
明をおえる。
駆動信号計算回路220において、無声区間での種々の
音声を良好に表わすとともに、無声区間と有声区間との
間で良好な遷移を実現するために、音源をパルスと雑音
で表わす場合に、パルス数を0から数個まで適応的にか
えるようにしてもよい。
この場合はパルス数を表わす情報を伝送する必要がある
(例えばフレームあたり2ビット程度)。演算量を減ら
す方法としては、例えばピッチ符号化回路で1ピツチ離
れた自己相関関数の値からピッチゲインを求め、ピッチ
ゲインの大きさにより有声か無声かを送信側で音源信号
計算の前に判別し、有声の場合は音源信号として代表ピ
ッチ区間のパルス列、無声の場合は雑音とパルス列の組
み合わせを用いるようにしてもよい。また有声無声の判
別方法としては、他の周知な方法を用いることができる
駆動信号計算回路220におけるパルス計算法としては
、本実施例でのべた方法の他に、種々の方法を用いるこ
とができる。例えばパルスを1つ求めるごとに過去に求
めたパルスの振幅を調整する方法を用いることができる
。この方法の詳細については小野比らによる″マルチパ
ルス駆動型音声符号化法における音源パルス探索法の検
討″と題した論文(日本音響学会講演論文集157.1
983) (文献9)等に述べられているのでここでは
説明を省略する。
また、駆動信号計算回路220にてパルス列を求めるさ
いに、フレームをサブフレームに分割した後に、サブフ
レームごとにパルス列を求めていたが、サブフレームに
分割せずに、フレーム全体に対してあらかじめ定められ
た個数のパルスを求めそのうちのサブフレームにはいる
パルスを用いるよう“にしてもよい。
一方、雑音源を計算する別な方法としては、例えば、サ
ブフレーム毎にガウス分布に従うランダムな雑音信号を
発生させ、雑音信号から合成した信号とサブフレーム区
間の音声信号との誤差電力を最小化するような雑音を選
択する方法が知られている。この方法の詳細については
、ビーエスアタル(B、 S、 ATAL)氏らによる
″ストキャスティックコーディングオブスピーチシグナ
ルズアットベリイロウビットレイツ”(”5TOCHA
STICCODING OF 5PEECH5IGNA
LS AT VERY LOWBIT RATES” 
)と題した論文(PROC−、ICC84,pp。
1610−1613.1984) (文献10)等を参
照することができる。また、他の方法としては、雑音源
は1種としてあらかじめ定められたサンプル数だけ用意
しておき、音声信号を予測した予測残差信号から雑音源
の振幅と位相(読み出し位置)を求める方法が知られて
いる。この方法では予測残差上で計算を行なうので演算
量を低減することができる。この方法の詳細については
大山氏によるパ残差を雑音でモデル化した駆動音源によ
る線形予測分析合成方式″と題した論文(日本音響学会
講演論文集昭和59年10月165−166頁)(文献
11)を参照することができる。また、音源の特性がほ
ぼ一定な無声区間では、前記文献2のように固定の雑音
源を用い振幅のみ伝送し、過渡部では雑音源の振幅と種
類を送るようにしてもよい。更に、無声区間では常に雑
音源は固定としてもよい。
本実施例の送信側では、有声区間に於いてフレーム内の
サブフレームごとにパルスを求めるときに、Kパラメー
タの値はフレーム内で一定(つまり合成フィルタの特性
がフレーム内で変化しない)としていたが、Kパラメー
タの値をサブフレーム毎になめらかに変化させながらパ
ルスを求めてもよい。具体的には、Kパラメータの値を
前後のフレームのにパラメータの値を用いてサブフレー
ム毎に補間し、この値を予測係数に変換して、重みすけ
回路200、インパルス応答計算回路170、合成フィ
ルタ回路250に出力し、サブフレーム毎に係数を更新
して求めた相互相関関数、自己相関関数を用いてパルス
を計算する。このようにしたほうが時間的に滑らかなス
ペクトル変化が得られ、品質のより高い音声を合成でき
る。また、パルス及びにパラメータの値を補間するさい
に、代表的なピッチ区間を基準としてピッチ周期に同期
させて補間しててもよいし、パルス及びにパラメータの
いずれか一方、あるいは両方とも、あらかじめ定められ
たピッチ区間(例えば、フレームの中央付近のピッチ区
間)を基準として補間を施してもよい。両者ともにこの
ような補間法を用いる場合は、代表ピッチ区間の位置を
表わす符号を伝送しなくてもよく、伝送ビットレイトを
減らすことができる。一方、パルス及びにパラメータを
ピッチ周期に同期させずに補間する方法も考えられる。
この場合は、フレームをあらかじめ定められた時間間隔
(例えば2.5m5ec程度)に区切り、この区間毎に
補間処理を行なう。この場合はサブフレーム位相は伝送
しなくてもよいので伝送ビットレイトを減らすことがで
きる。この場合は、補間の基準区間としては、代表区間
を送信側でさがしてもよいし、あらかじめ定めておいて
もよい(例えばフレーム中央付近)。後者の場合には、
サブフレーム位相と代表ピッチ位置を伝送しなくてもよ
く、更にビットレイトを減らすことができる。
演算量を減らす方法として、Kパラメータの補間処理は
受信側のみで行なうようにしてもよい。
このようにすることにより、送信側の補間回路255を
省略することができる。
また、代表ピッチ区間の選択法として、絶対値の大きな
パルスを含むサブフレームを選択する方法等、他の方法
を用いることもできる。また良好な音声を再生できる区
間をフレーム毎に探索することもできる。また、サブフ
レーム分割を行なうときにピッチ周期は一定としていた
が、この値も前後のフレームのピッチ周期を用いて補間
するようにしてもよい。このほうがピッチ周期の変化が
時間的に滑らかとなり、より良好な音声を得ることがで
きる。
次に、パルス、合成フィルタのパラメータ、ピッチ周期
の補間法としては、直線補間以外の方法も考えられる。
例えば、パルス、ピッチ周期については、対数補間等も
考えられる。また、合成フィルタのパラメータを補間す
る場合、本実施例ではにパラメータについて補間したが
、例えば、予測係数(但し、この場合はフィルタの安定
性をチェックする必要がある)、対数断面積関数、フォ
ルマントパラメータや自己相関関数を補間する方法等を
用いることもできる。これらの具体的な方法は、ビーエ
スアタル(B、S、ATAL)氏らによる″スピーチア
ナリシスアンドシンセシスパイリニアープリディクショ
ンオプザスピーチウエイと題した論文(J、ACOUS
T、SOC,AM、、p−p、637−655゜197
1) (文献12)等に述べられているので、説明は省
略する。
本実施例では、フレーム長は一定としてにパラメータの
分析および音源パルス列の計算をしたが、フレーム長は
可変としてもよい。このようにした場合には、音声の変
化部では、フレーム長を短くし、定常部ではフレーム長
を長くできるので、伝送ビットレイトを低減することが
できる。
更に、ピッチ周期に応じて(例えばピッチ周期の整数倍
)フレーム長を決めるようにすれば、本実施例で述べた
サブフレーム位相も送らなくてよいので、更に伝送ビッ
トレイトを低減することができる。本発明の他の構成法
として、図1(a)に於ける駆動信号復元回路240、
合成フィルタ回路250、補間回路255、減算回路1
20を省略した構成をとることもできる。このようにし
た場合は、送信側で音声信号を合成しなくてもよく、装
置構成を簡略化することができる。
尚、ディジタル信号処理の分野でよく知られているよう
に、自己相関関数はパワスペクトルから計算することも
できる。また、相互相関関数はクロスパワスペクトルか
ら計算することもできる。
これらの対応関係については、エーブイオッペンハイム
(A、V、OPPENHEIM)氏らによる″ディジタ
ル信号処理”DIGITAL 5IGNAL PROC
ESSING”と題した単行本(文献13)等の第8章
にて詳細に説明されているので、ここでは説明を省略す
る。
(本発明の効果) 以上述べたように本発明によれば、音源信号として、音
声信号の周期性を利用した代表的な1ピッチ区間のパル
ス列による音源と、パルスと雑音の組み合わせによる音
源のうち、音声信号をより良好に再生できる音源信号を
選択しているため、低い伝送ビットレイトにおいても有
声区間、無声区間及び無声区間と有声区間の過渡部に拘
らず高品質な音声を合成できるという効果がある。
【図面の簡単な説明】
第1図(a)、(b)は、本発明による高能率音声符号
化方式の一実施例を表わすブロック図、第2図は駆動信
号計算回路220における処理内容の一例を示す図、第
3図は、補間回路255の処理例を示す図、第4図は従
来方式の合成側の構成を示すブロック図である。

Claims (3)

    【特許請求の範囲】
  1. (1)送信側では離散的な音声信号を入力しあらかじめ
    定められた時間間隔に分割し、前記音声信号から短時間
    スペクトル包絡を表わすスペクトルパラメータとピッチ
    を表わすピッチパラメータとを抽出し、前記音声信号を
    表わすための音源を代表区間のパルス列かまたはパルス
    と雑音の組み合わせで表わし、前記音源を表わす情報と
    前記ピッチパラメータと前記スペクトルパラメータとを
    組み合わせて出力し、受信側では前記ピッチパラメータ
    と前記音源を表わす情報をもとに前記代表区間のパルス
    列に対し時間的になめらかな変化を与える処理をほどこ
    し駆動音源信号を復元して前記スペクトルパラメータと
    をもちいて前記音声信号を合成することを特徴とする高
    能率音声符号化方式。
  2. (2)入力した音声信号をあらかじめ定められた時間区
    間に分割し前記音声信号から短時間スペクトル包絡を表
    わすスペクトルパラメータとピッチを表わすピッチパラ
    メータとを抽出し符号化するパラメータ計算回路と、前
    記音声信号と前記ピッチパラメータと前記スペクトルパ
    ラメータをもとにして代表区間のパルス列による音源と
    パルスと雑音の組み合わせによる音源のうちで音声信号
    をより良好に表わし得る音源を求め前記音源を表わす情
    報を符号化する駆動信号計算回路と、前記パラメータ計
    算回路の出力符号と前記駆動信号計算回路の出力符号と
    を組み合わせて出力するマルチプレクサ回路とを有する
    ことを特徴とする高能率音声符号化装置。
  3. (3)ピッチパラメータを表わす符号とスペクトルパラ
    メータを表わす符号と音源情報を表わす符号とが組み合
    わされた符号系列が入力され前記ピッチパラメータを表
    わす符号と前記スペクトルパラメータを表わす符号と前
    記音源情報を表わす符号とを分離して復号するデマルチ
    プレクサ回路と、前記復号されたピッチパラメータと前
    記復号された音源情報をもとに代表区間のパルス列を音
    源とする場合は前記代表区間のパルス列に対して時間的
    になめらかな変化を与える処理を施しパルスと雑音を音
    源とする場合は前記音源情報を基にパルスと雑音を発生
    して駆動音源信号を復元する駆動音源信号復元回路と、
    前記駆動音源信号と前記復号されたスペクトルパラメー
    タとをもとに音声信号を合成し出力する合成フィルタ回
    路とを有することを特徴とする高能率音声復号化装置。
JP60178911A 1984-12-24 1985-08-13 高能率音声符号化方式とその装置 Expired - Lifetime JP2615548B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP60178911A JP2615548B2 (ja) 1985-08-13 1985-08-13 高能率音声符号化方式とその装置
CA000498407A CA1252568A (en) 1984-12-24 1985-12-23 Low bit-rate pattern encoding and decoding capable of reducing an information transmission rate
US06/813,167 US4821324A (en) 1984-12-24 1985-12-24 Low bit-rate pattern encoding and decoding capable of reducing an information transmission rate

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60178911A JP2615548B2 (ja) 1985-08-13 1985-08-13 高能率音声符号化方式とその装置

Publications (2)

Publication Number Publication Date
JPS6238500A true JPS6238500A (ja) 1987-02-19
JP2615548B2 JP2615548B2 (ja) 1997-05-28

Family

ID=16056824

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60178911A Expired - Lifetime JP2615548B2 (ja) 1984-12-24 1985-08-13 高能率音声符号化方式とその装置

Country Status (1)

Country Link
JP (1) JP2615548B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01253800A (ja) * 1988-04-04 1989-10-11 Nec Corp 音声合成装置
JPH01293400A (ja) * 1988-05-23 1989-11-27 Nec Corp 音声符号化復号化方法並びに音声符号化装置及び音声復号化装置
JPH0258100A (ja) * 1988-08-24 1990-02-27 Nec Corp 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置
JPH0284700A (ja) * 1988-09-21 1990-03-26 Nec Corp 音声符号化復号化装置
JPH0291698A (ja) * 1988-09-28 1990-03-30 Nec Corp 音声符号化復号化方式
JPH02139600A (ja) * 1988-10-20 1990-05-29 Nec Corp 音声符号化復号化方式及びその装置
JPH0353300A (ja) * 1989-07-20 1991-03-07 Nec Corp 音声符号化装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5816297A (ja) * 1981-07-22 1983-01-29 ソニー株式会社 音声合成方式
JPS597999A (ja) * 1982-07-07 1984-01-17 日本電気株式会社 音声レベル量子化・再生方法およびその装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5816297A (ja) * 1981-07-22 1983-01-29 ソニー株式会社 音声合成方式
JPS597999A (ja) * 1982-07-07 1984-01-17 日本電気株式会社 音声レベル量子化・再生方法およびその装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01253800A (ja) * 1988-04-04 1989-10-11 Nec Corp 音声合成装置
JPH01293400A (ja) * 1988-05-23 1989-11-27 Nec Corp 音声符号化復号化方法並びに音声符号化装置及び音声復号化装置
JPH0258100A (ja) * 1988-08-24 1990-02-27 Nec Corp 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置
JPH0284700A (ja) * 1988-09-21 1990-03-26 Nec Corp 音声符号化復号化装置
JPH0291698A (ja) * 1988-09-28 1990-03-30 Nec Corp 音声符号化復号化方式
JPH02139600A (ja) * 1988-10-20 1990-05-29 Nec Corp 音声符号化復号化方式及びその装置
JPH0353300A (ja) * 1989-07-20 1991-03-07 Nec Corp 音声符号化装置

Also Published As

Publication number Publication date
JP2615548B2 (ja) 1997-05-28

Similar Documents

Publication Publication Date Title
JP2940005B2 (ja) 音声符号化装置
JP3180762B2 (ja) 音声符号化装置及び音声復号化装置
JP2615548B2 (ja) 高能率音声符号化方式とその装置
JP2844589B2 (ja) 音声信号符号化方法とその装置
JP3255190B2 (ja) 音声符号化装置並びにその分析器及び合成器
JP3303580B2 (ja) 音声符号化装置
JPH07101358B2 (ja) マルチパルス符号化方法および装置
JP2829978B2 (ja) 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置
JP3583945B2 (ja) 音声符号化方法
JP2956068B2 (ja) 音声符号化復号化方式
JP3299099B2 (ja) 音声符号化装置
JP2560682B2 (ja) 音声信号符号化復号化方法とその装置
JP2508002B2 (ja) 音声符号化方法とその装置
JP2844590B2 (ja) 音声符号化方式とその装置
JP2001142499A (ja) 音声符号化装置ならびに音声復号化装置
JP2853170B2 (ja) 音声符号化復号化方式
JP2658438B2 (ja) 音声符号化方法とその装置
JP3063087B2 (ja) 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置
JPS62133498A (ja) 音声符号化方法とその装置
JPS63127299A (ja) 音声信号符号化・復号化方式およびその装置
JPH043878B2 (ja)
JP2004061558A (ja) 音声符号化復号方式間の符号変換方法及び装置とその記憶媒体
JP2817196B2 (ja) 音声符号化方式
JPS62207036A (ja) 音声符号化方式とその装置
JPH06102900A (ja) 音声符号化方式および音声復号化方式

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term