JPS5915299A - 音声分析装置 - Google Patents
音声分析装置Info
- Publication number
- JPS5915299A JPS5915299A JP57124621A JP12462182A JPS5915299A JP S5915299 A JPS5915299 A JP S5915299A JP 57124621 A JP57124621 A JP 57124621A JP 12462182 A JP12462182 A JP 12462182A JP S5915299 A JPS5915299 A JP S5915299A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- information
- output signal
- speech
- spectral envelope
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
- Telephone Function (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔発明の技術分野〕
この発明は、音声を低ビツトレイトの信号に符号化して
送信もしくは記録し再生側はこの信号に基づき音声を再
生する音声分析装置に関するものである。
送信もしくは記録し再生側はこの信号に基づき音声を再
生する音声分析装置に関するものである。
音声信号を2.4〜9.6Kb/s程度の比較的低い伝
送速度で符号化する音声分析合成系が最近広く用いられ
ている。
送速度で符号化する音声分析合成系が最近広く用いられ
ている。
このような音声分析合成系は、音声信号から音声を特徴
ずけるパラメータとして、スペクトル包絡情報、ピッチ
清報および振幅情報を抽出しで伝送するもので1例えば
スペクトル包絡IR報として部分自己相関係数を用いた
音声分析装置が知られている(例えば特公昭49−18
007号)。
ずけるパラメータとして、スペクトル包絡情報、ピッチ
清報および振幅情報を抽出しで伝送するもので1例えば
スペクトル包絡IR報として部分自己相関係数を用いた
音声分析装置が知られている(例えば特公昭49−18
007号)。
音声分析合成系では、一般に一定時間毎例えば20m
JeC毎にパラメータを抽出して符号化する。
JeC毎にパラメータを抽出して符号化する。
上記部分自己相関係数を用いた分析合成系の場合例えば
1次から10次までの部分自己相関係数を用いて各々を
8ビツトで符号化し、さらにピッチ情報として7ビツト
、振幅情報として7ビツト。
1次から10次までの部分自己相関係数を用いて各々を
8ビツトで符号化し、さらにピッチ情報として7ビツト
、振幅情報として7ビツト。
送受間の同期をと−るための同門信号を2ビツトで符号
化すれば、この分析合成系は4.8k bit/s で
音声を伝送できる。
化すれば、この分析合成系は4.8k bit/s で
音声を伝送できる。
杏ころで音声は庫a」あるいはrsuJ といった言
葉のうち、「a」あるいはruJのように声帯が撮動し
て発声される母音と、「k」あるいはrsJのように声
帯が振動せずに発声される子音とに大別される。このよ
うな音声に対し、従来の音声分析合成系による再生音は
特に子音の明瞭度が低く、これが合成音声における音声
劣化の大きな原因となっている。
葉のうち、「a」あるいはruJのように声帯が撮動し
て発声される母音と、「k」あるいはrsJのように声
帯が振動せずに発声される子音とに大別される。このよ
うな音声に対し、従来の音声分析合成系による再生音は
特に子音の明瞭度が低く、これが合成音声における音声
劣化の大きな原因となっている。
これは、母音の場合に、声帯から送られた周期的な空気
流が口腔で共振して音声となり、一般に部分自己相関係
数等を用いた音声合成器の全極型フィルタでよく近似さ
せることができるが、子音の場合には空気流が口腔から
の放射によりあるいは口腔での共振とのどから鼻へ抜け
る空気流上の混合により音声となるものであり、一般に
上記の全極型フィルタでは、よく近似できないからであ
る。
流が口腔で共振して音声となり、一般に部分自己相関係
数等を用いた音声合成器の全極型フィルタでよく近似さ
せることができるが、子音の場合には空気流が口腔から
の放射によりあるいは口腔での共振とのどから鼻へ抜け
る空気流上の混合により音声となるものであり、一般に
上記の全極型フィルタでは、よく近似できないからであ
る。
この発明は上記の事情に基づきなされたもので。
分析合成系においで符号化速度を犠牲にすることなく子
音を明瞭に再生するこ吉ができしたがって合成音声の音
質を向上し得る音声分析装置を提供しようとするもので
ある。
音を明瞭に再生するこ吉ができしたがって合成音声の音
質を向上し得る音声分析装置を提供しようとするもので
ある。
この発明は、音声入力信号からスペクトル包絡情報を表
わす複数(P1個のパラメータを抽出するとともにこの
入力信号をスペクトル包絡が平坦化された信号に変換し
て出力する第1の手段と、この出力信号の平均電力に比
例した[n報を抽出する第2の手段と、同じくこの出力
信号の低域成分を選択的に取出す第3の手段き、音声の
有声・無声情報を抽出する第4の手段と、前記スペクト
ル包絡情報を表わすパラメータ、前記出力信号の平均電
力に比例した情報および前記出力信号の低域成分を受入
した符号化する第5の手段とを備えている。
わす複数(P1個のパラメータを抽出するとともにこの
入力信号をスペクトル包絡が平坦化された信号に変換し
て出力する第1の手段と、この出力信号の平均電力に比
例した[n報を抽出する第2の手段と、同じくこの出力
信号の低域成分を選択的に取出す第3の手段き、音声の
有声・無声情報を抽出する第4の手段と、前記スペクト
ル包絡情報を表わすパラメータ、前記出力信号の平均電
力に比例した情報および前記出力信号の低域成分を受入
した符号化する第5の手段とを備えている。
上記第1の手段としては例えば分析フィルタが第2の手
段としては例えばスペクトル包絡が平坦化された残差信
号の平均電力を求める振幅平均化回路が、第3の手段と
して例えば残差信号をp波する低域p波器およびこの低
域沖波器の出力信号をダウンサンプリングするダウンサ
ンプリング回路が、第4の手段きして例えば音声信号の
基本周波数を抽出するピッチ抽出器が、第5の手段とし
て符号化回路がそれぞれ用いられる。
段としては例えばスペクトル包絡が平坦化された残差信
号の平均電力を求める振幅平均化回路が、第3の手段と
して例えば残差信号をp波する低域p波器およびこの低
域沖波器の出力信号をダウンサンプリングするダウンサ
ンプリング回路が、第4の手段きして例えば音声信号の
基本周波数を抽出するピッチ抽出器が、第5の手段とし
て符号化回路がそれぞれ用いられる。
このような構成により、有声音の場合ζこはP個のスペ
クトル包絡情報を表わすパラメータをすべて符号化して
送信もしくは記録し、無声音の場合には送信もしくは記
録するスペクトル包絡情報を表わすパラメータの数をp
−m(o<m<p )個tこ減少ンプリングした信号を
符号化して送信もしくは記録することを特徴としている
。
クトル包絡情報を表わすパラメータをすべて符号化して
送信もしくは記録し、無声音の場合には送信もしくは記
録するスペクトル包絡情報を表わすパラメータの数をp
−m(o<m<p )個tこ減少ンプリングした信号を
符号化して送信もしくは記録することを特徴としている
。
音声を高次の全極型モデルとして分析し、音声信号が無
声音の場合には低次の全極型モデルとして分析するとと
もに、残差信号をダウンサンプリングして送信するので
、符号化速度を犠牲にするこさなく有声音・無声音とも
によく近似でき良好な品質の音声を合成することができ
る。
声音の場合には低次の全極型モデルとして分析するとと
もに、残差信号をダウンサンプリングして送信するので
、符号化速度を犠牲にするこさなく有声音・無声音とも
によく近似でき良好な品質の音声を合成することができ
る。
以下図面を参照してこの発明の一実施例を説明する。
この実施例は、添付図面に示すように、音声の分析回路
10吉合成回路20によって構成されている。
10吉合成回路20によって構成されている。
音声分析回路10において1例えば8kHzのクロック
で125μsec毎にサンプリングされた音声信号は、
入力端子11を通じて分析フィルタ12に導かれる。分
析フィルタ12は、音声信号のスペクトル包絡を平坦化
するとともに音声のスペクトル包絡を表わすパラメータ
を抽出するもので1例えば格子形フィルタと部分自己相
関係数を抽出する相関器とを10段縦続して接続したも
のである。
で125μsec毎にサンプリングされた音声信号は、
入力端子11を通じて分析フィルタ12に導かれる。分
析フィルタ12は、音声信号のスペクトル包絡を平坦化
するとともに音声のスペクトル包絡を表わすパラメータ
を抽出するもので1例えば格子形フィルタと部分自己相
関係数を抽出する相関器とを10段縦続して接続したも
のである。
この分析フィルタ12において2例えば20m5eCl
; 毎に1次から10次までの部分自己相関係数ml←(1
=1〜10)を奇声信号から抽出して符号化回路13へ
出力するとともに、残差信号を振幅平均化回路14、ピ
ッチ抽出器15.低域p波器16に出力している。
; 毎に1次から10次までの部分自己相関係数ml←(1
=1〜10)を奇声信号から抽出して符号化回路13へ
出力するとともに、残差信号を振幅平均化回路14、ピ
ッチ抽出器15.低域p波器16に出力している。
部幅平均化回路14は受入した残差信号の平均部幅電力
rpを、(f′算し、同じ< 20m5ec毎に符号化
回路13に供給している。ピッチ抽出器15は。
rpを、(f′算し、同じ< 20m5ec毎に符号化
回路13に供給している。ピッチ抽出器15は。
音声信号のピッチ周波数を決定するもので、母音等の有
声音の場合には、そのピッチ周波数Ptを抽出し、子音
等の無声音の場合にはピッチ周波数なしくP+=O)と
して符号化回路13に供給する。
声音の場合には、そのピッチ周波数Ptを抽出し、子音
等の無声音の場合にはピッチ周波数なしくP+=O)と
して符号化回路13に供給する。
低域p波器16は、供給された音声信号の残差信号にお
ける低域成分のみを取出し、ダウンサンプリング回路1
7を介してナシプリング周波数を減少させた後符号化回
路13へ信号e 、/を出力する。このダウンサンプリ
ング回路17は符号化される残差信号の数を減少させる
ためのものである。
ける低域成分のみを取出し、ダウンサンプリング回路1
7を介してナシプリング周波数を減少させた後符号化回
路13へ信号e 、/を出力する。このダウンサンプリ
ング回路17は符号化される残差信号の数を減少させる
ためのものである。
例えば低域p波器16のカットオフ周波数を1KHzと
すれば、ダウンサンプリング回路17は入μsec毎に
符号化回路13に送られることになり。
すれば、ダウンサンプリング回路17は入μsec毎に
符号化回路13に送られることになり。
20m5ecの間Iこは40個の残差信号et/が得ら
れる。
れる。
符号化回路13は、前記分析フィルター2.部幅平均化
回路14.ピッチ抽出回路15およびダウンサンプリン
グ回路17から送られる信号を。
回路14.ピッチ抽出回路15およびダウンサンプリン
グ回路17から送られる信号を。
それぞれ適当4ビツト数で符号化しで伝送するが。
このときヒ0ツヂ抽出回路15から送られてくる信す
号によに符号ビットの割当を変化させる。
例えば、ピッチ抽出回路15から送られてくる信号が有
声音であることを表わしていれば、すな化し、さらに同
期信号の2ビツトを付加して、20m5ec毎に96ビ
ツトを端子18から送信する。
声音であることを表わしていれば、すな化し、さらに同
期信号の2ビツトを付加して、20m5ec毎に96ビ
ツトを端子18から送信する。
一方、ピッチ抽出回路15から送られてくる信号が無声
音であることを表わしている場合すなわまでの部分自己
関係数は送信ぜ1゛1代りにダウンサンプリング回路1
7から出力される残差信号e t/を符号化して伝送す
る。前述のように、 2Qmsecの間に40個の残
差信号が供給されるので、この残差信号は6Mを用いて
40ビツトに符号化でき、る。
音であることを表わしている場合すなわまでの部分自己
関係数は送信ぜ1゛1代りにダウンサンプリング回路1
7から出力される残差信号e t/を符号化して伝送す
る。前述のように、 2Qmsecの間に40個の残
差信号が供給されるので、この残差信号は6Mを用いて
40ビツトに符号化でき、る。
このようにして、無声音のときには5個の部分自己相関
係数ki(i−1〜5)をそれぞれ8ビツトで符号化し
た40ビットサ、残差信号e t/を符号化した40ビ
ット吉、ピッチ周波数P+および振幅情報r、を符号化
したそれぞれ7ビツトにさらに同期信号2ビツトを付加
して、出方端子18を介し20m5ec毎に96ビツト
を送信する。
係数ki(i−1〜5)をそれぞれ8ビツトで符号化し
た40ビットサ、残差信号e t/を符号化した40ビ
ット吉、ピッチ周波数P+および振幅情報r、を符号化
したそれぞれ7ビツトにさらに同期信号2ビツトを付加
して、出方端子18を介し20m5ec毎に96ビツト
を送信する。
したがって有声音のときも、無声音のときも。
信号の伝送速度は同一である。
これに対し、音声合成回路2oの側においては。
入力端子21に壺大した信号系列は復号化回路22によ
り復号化される。
り復号化される。
復号化回路22では、ピッチ周波数が0か否か数Prが
0すなわち無声音と判別した場合には、残差信号et′
を残差波形発生器23に出力するとともに、スイッチ回
路24を残差信号発生器23からの信号が導通ずるよう
に切換え、さらに振幅情える。
0すなわち無声音と判別した場合には、残差信号et′
を残差波形発生器23に出力するとともに、スイッチ回
路24を残差信号発生器23からの信号が導通ずるよう
に切換え、さらに振幅情える。
P。
一方、ピッチ周波数−8=F〜0すなわち有声音である
と判別した場合には、ピッチ周波1’lP+ をインパ
ルス発生器27に出力する吉ともに、スイッチ回路24
をインパルス回路27からの信号が導通ずるように切換
え、さらに振幅情報r、を乗算器25に導くとともに、
1〜10次の部分自己相関係数ん 一4i(i=l 〜10)を合成フィルタ26に供給す
る。
と判別した場合には、ピッチ周波1’lP+ をインパ
ルス発生器27に出力する吉ともに、スイッチ回路24
をインパルス回路27からの信号が導通ずるように切換
え、さらに振幅情報r、を乗算器25に導くとともに、
1〜10次の部分自己相関係数ん 一4i(i=l 〜10)を合成フィルタ26に供給す
る。
したがって無声音の場合には残差波形発生器23で再生
された残差信号e(がスイッチ回路25を介して乗算器
25に導かれ、また有声音の場合にはインパルス発生器
で、ピッチ周波数PLにしたがって一定周期毎に発生さ
れたインパルス列がスイッ子回路24を介して乗算器2
5に導かれる。乗算出力ず゛る。
された残差信号e(がスイッチ回路25を介して乗算器
25に導かれ、また有声音の場合にはインパルス発生器
で、ピッチ周波数PLにしたがって一定周期毎に発生さ
れたインパルス列がスイッ子回路24を介して乗算器2
5に導かれる。乗算出力ず゛る。
このようにして合成フィルタ26に供給された信号は、
スペクトル包絡の修正を受けて出力端子28より合成音
声信号として出力される。
スペクトル包絡の修正を受けて出力端子28より合成音
声信号として出力される。
以上のように、音声合成回路20において、有声音の場
合にはスペクトル包絡が一様な信号で励振される10次
の全極型フィルタで音声の合成が行なわれ、無声音の場
合には、残差信号で励振される5次の全極型フィルタで
音声の合成が行なわれることになり、音声の発生過橿に
よく近似した伝送に用いられる信号のビット数は同一で
あり符号化速度を犠牲にすることは全くない。
合にはスペクトル包絡が一様な信号で励振される10次
の全極型フィルタで音声の合成が行なわれ、無声音の場
合には、残差信号で励振される5次の全極型フィルタで
音声の合成が行なわれることになり、音声の発生過橿に
よく近似した伝送に用いられる信号のビット数は同一で
あり符号化速度を犠牲にすることは全くない。
なお、この発明は上記実施例に限定されるものではなく
要旨を変更しない範囲においで種々変形して実施するこ
とができる。
要旨を変更しない範囲においで種々変形して実施するこ
とができる。
例えば5分析フィルタ12としでは部分自己相関係数を
抽出するものに限定されず、線スペクトル対パラメータ
やケプストラムパラメータのようなスペクトル包絡情報
を表現するパラメータのものであれば用いることができ
る。またピッチ抽出器15としては、上記実施例のよう
に分析フィルタ12の出力信号を受入するものに限らr
、端子11よりの音声信号を直接受入して分析するよう
に構成することもできる。
抽出するものに限定されず、線スペクトル対パラメータ
やケプストラムパラメータのようなスペクトル包絡情報
を表現するパラメータのものであれば用いることができ
る。またピッチ抽出器15としては、上記実施例のよう
に分析フィルタ12の出力信号を受入するものに限らr
、端子11よりの音声信号を直接受入して分析するよう
に構成することもできる。
ざらに残差波形発生器23としては、単に残差信号e、
を出力するものではなく残差信号et+ /を受入し高
調波信号を合成して出力する構成を吉ることもできる。
を出力するものではなく残差信号et+ /を受入し高
調波信号を合成して出力する構成を吉ることもできる。
このような構成にさると1合成音声の自然性をさらに向
上することができる。
上することができる。
さらに、上記実施例では、この発明を通信システムに用
いる場合を想定して主として説明したが、これを音声の
記録装置さして用いる場合には、端子18の出力信号を
メモリに蓄え、端子21の信号はメモリから読み出すよ
うに4−ることもできる。
いる場合を想定して主として説明したが、これを音声の
記録装置さして用いる場合には、端子18の出力信号を
メモリに蓄え、端子21の信号はメモリから読み出すよ
うに4−ることもできる。
このよう、な構成をとる場合には同期信号は不安となり
、省略することができる。
、省略することができる。
)
添付図面はこの発明の一実施例(\示す概略的構−成図
である。 10・・・音声分析回路 11・・・入力端子12・
・・分析フィルタ −3・・・符号化回路14・・・
振幅平均化回路 15・・・ピッチ抽出器16・・・低
域沖波器 17・・・ダウンサンプリング回路
である。 10・・・音声分析回路 11・・・入力端子12・
・・分析フィルタ −3・・・符号化回路14・・・
振幅平均化回路 15・・・ピッチ抽出器16・・・低
域沖波器 17・・・ダウンサンプリング回路
Claims (1)
- 【特許請求の範囲】 入力1号からスペクトル包絡情報を表わす複数個のパラ
メータを抽出するとともlここの人、力信号をスペクト
ル包絡が平坦化された信号に変換して出力する手段と、
この出力信号の平均電力に比例した情報を抽出する手段
と、同じくこの出力信号の低域成分を選択的に取出す手
段と、音声の有声。 無声情報を抽出する手段と、前記スペクトル包絡情報を
表わすパラメータ、前記出力信号の平均電力に比例した
情報および前記出力信号の低域成分を受入して符号化す
る手段とを具備し、音声が無声音のききには有声音のと
きに比し相対的に少な゛い数のスペクトル包絡情報を表
わすパラメータを送信もしくは記録するとともにこのパ
ラメータの数を減少゛させる代りに前記低域成分を選択
的に取出す手段の出力信号を符号化して送信もしくは記
録することを特徴とする音声分析装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57124621A JPS5915299A (ja) | 1982-07-17 | 1982-07-17 | 音声分析装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57124621A JPS5915299A (ja) | 1982-07-17 | 1982-07-17 | 音声分析装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS5915299A true JPS5915299A (ja) | 1984-01-26 |
Family
ID=14889947
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP57124621A Pending JPS5915299A (ja) | 1982-07-17 | 1982-07-17 | 音声分析装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS5915299A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6183014A (ja) * | 1984-06-20 | 1986-04-26 | シカゴ・ロ−ハイド・マニフアクチユアリング・コンパニ− | シ−ルモ−ルドおよび方法 |
US6751716B2 (en) | 2000-04-21 | 2004-06-15 | Sharp Kabushiki Kaisha | Semiconductor storage device, control device, and electronic apparatus |
-
1982
- 1982-07-17 JP JP57124621A patent/JPS5915299A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6183014A (ja) * | 1984-06-20 | 1986-04-26 | シカゴ・ロ−ハイド・マニフアクチユアリング・コンパニ− | シ−ルモ−ルドおよび方法 |
US6751716B2 (en) | 2000-04-21 | 2004-06-15 | Sharp Kabushiki Kaisha | Semiconductor storage device, control device, and electronic apparatus |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0380572B1 (en) | Generating speech from digitally stored coarticulated speech segments | |
KR100615480B1 (ko) | 음성 대역 확장 장치 및 음성 대역 확장 방법 | |
US6463406B1 (en) | Fractional pitch method | |
JPS61121616A (ja) | ベクトル量子化法によつて音声信号を符号化、復号化するための方法と装置 | |
TW521265B (en) | Relative pulse position in CELP vocoding | |
JPH02201500A (ja) | 音声合成装置 | |
JPS5915299A (ja) | 音声分析装置 | |
JPS6162100A (ja) | マルチパルス型符号化復号化装置 | |
JP3510168B2 (ja) | 音声符号化方法及び音声復号化方法 | |
US6859775B2 (en) | Joint optimization of excitation and model parameters in parametric speech coders | |
JP3063087B2 (ja) | 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置 | |
JP2615991B2 (ja) | 線形予測型音声分析合成装置 | |
JP3006790B2 (ja) | 音声符号化復号化方法及びその装置 | |
JPS62102294A (ja) | 音声符号化方式 | |
JPS60237500A (ja) | マルチパルス型ボコ−ダ | |
JP2615862B2 (ja) | 音声符号化復号化方法とその装置 | |
Gavat et al. | Speech synthesis module for Romanian language | |
EP1326236B1 (en) | Efficient implementation of joint optimization of excitation and model parameters in multipulse speech coders | |
JPS61128299A (ja) | 音声処理装置 | |
JPS5831393A (ja) | 音声合成器 | |
GB2266213A (en) | Digital signal coding | |
JPH043878B2 (ja) | ||
JPH0675599A (ja) | 音声符号化法及び音声復号化法並びに音声符復号化装置 | |
JPS60260100A (ja) | 音声合成器 | |
JPS60239799A (ja) | マルチパルス型ボコ−ダ |