JPS5915299A

JPS5915299A - 音声分析装置

Info

Publication number: JPS5915299A
Application number: JP57124621A
Authority: JP
Inventors: 誠中村; 文夫杉山; 比呂志嵩
Original assignee: Tokyo Shibaura Electric Co Ltd
Current assignee: Toshiba Corp
Priority date: 1982-07-17
Filing date: 1982-07-17
Publication date: 1984-01-26

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔発明の技術分野〕この発明は、音声を低ビツトレイトの信号に符号化して
送信もしくは記録し再生側はこの信号に基づき音声を再
生する音声分析装置に関するものである。

〔発明の技術的背景とその問題点〕

音声信号を２．４〜９．６Ｋｂ／ｓ程度の比較的低い伝
送速度で符号化する音声分析合成系が最近広く用いられ
ている。

このような音声分析合成系は、音声信号から音声を特徴
ずけるパラメータとして、スペクトル包絡情報、ピッチ
清報および振幅情報を抽出しで伝送するもので１例えば
スペクトル包絡ＩＲ報として部分自己相関係数を用いた
音声分析装置が知られている（例えば特公昭４９−１８
００７号）。

音声分析合成系では、一般に一定時間毎例えば２０ｍ　
ＪｅＣ毎にパラメータを抽出して符号化する。

上記部分自己相関係数を用いた分析合成系の場合例えば
１次から１０次までの部分自己相関係数を用いて各々を
８ビツトで符号化し、さらにピッチ情報として７ビツト
、振幅情報として７ビツト。

送受間の同期をと−るための同門信号を２ビツトで符号
化すれば、この分析合成系は４．８ｋ　ｂｉｔ／ｓ　で
音声を伝送できる。

杏ころで音声は庫ａ」あるいはｒｓｕＪ　　といった言
葉のうち、「ａ」あるいはｒｕＪのように声帯が撮動し
て発声される母音と、「ｋ」あるいはｒｓＪのように声
帯が振動せずに発声される子音とに大別される。このよ
うな音声に対し、従来の音声分析合成系による再生音は
特に子音の明瞭度が低く、これが合成音声における音声
劣化の大きな原因となっている。

これは、母音の場合に、声帯から送られた周期的な空気
流が口腔で共振して音声となり、一般に部分自己相関係
数等を用いた音声合成器の全極型フィルタでよく近似さ
せることができるが、子音の場合には空気流が口腔から
の放射によりあるいは口腔での共振とのどから鼻へ抜け
る空気流上の混合により音声となるものであり、一般に
上記の全極型フィルタでは、よく近似できないからであ
る。

〔発明の目的〕

この発明は上記の事情に基づきなされたもので。

分析合成系においで符号化速度を犠牲にすることなく子
音を明瞭に再生するこ吉ができしたがって合成音声の音
質を向上し得る音声分析装置を提供しようとするもので
ある。

〔発明の概要〕

この発明は、音声入力信号からスペクトル包絡情報を表
わす複数（Ｐ１個のパラメータを抽出するとともにこの
入力信号をスペクトル包絡が平坦化された信号に変換し
て出力する第１の手段と、この出力信号の平均電力に比
例した［ｎ報を抽出する第２の手段と、同じくこの出力
信号の低域成分を選択的に取出す第３の手段き、音声の
有声・無声情報を抽出する第４の手段と、前記スペクト
ル包絡情報を表わすパラメータ、前記出力信号の平均電
力に比例した情報および前記出力信号の低域成分を受入
した符号化する第５の手段とを備えている。

上記第１の手段としては例えば分析フィルタが第２の手
段としては例えばスペクトル包絡が平坦化された残差信
号の平均電力を求める振幅平均化回路が、第３の手段と
して例えば残差信号をｐ波する低域ｐ波器およびこの低
域沖波器の出力信号をダウンサンプリングするダウンサ
ンプリング回路が、第４の手段きして例えば音声信号の
基本周波数を抽出するピッチ抽出器が、第５の手段とし
て符号化回路がそれぞれ用いられる。

このような構成により、有声音の場合ζこはＰ個のスペ
クトル包絡情報を表わすパラメータをすべて符号化して
送信もしくは記録し、無声音の場合には送信もしくは記
録するスペクトル包絡情報を表わすパラメータの数をｐ
−ｍ（ｏ＜ｍ＜ｐ　）個ｔこ減少ンプリングした信号を
符号化して送信もしくは記録することを特徴としている
。

音声を高次の全極型モデルとして分析し、音声信号が無
声音の場合には低次の全極型モデルとして分析するとと
もに、残差信号をダウンサンプリングして送信するので
、符号化速度を犠牲にするこさなく有声音・無声音とも
によく近似でき良好な品質の音声を合成することができ
る。

〔発明の実施例〕

以下図面を参照してこの発明の一実施例を説明する。

この実施例は、添付図面に示すように、音声の分析回路
１０吉合成回路２０によって構成されている。

音声分析回路１０において１例えば８ｋＨｚのクロック
で１２５μｓｅｃ毎にサンプリングされた音声信号は、
入力端子１１を通じて分析フィルタ１２に導かれる。分
析フィルタ１２は、音声信号のスペクトル包絡を平坦化
するとともに音声のスペクトル包絡を表わすパラメータ
を抽出するもので１例えば格子形フィルタと部分自己相
関係数を抽出する相関器とを１０段縦続して接続したも
のである。

この分析フィルタ１２において２例えば２０ｍ５ｅＣｌ
；毎に１次から１０次までの部分自己相関係数ｍｌ←（１
＝１〜１０）を奇声信号から抽出して符号化回路１３へ
出力するとともに、残差信号を振幅平均化回路１４、ピ
ッチ抽出器１５．低域ｐ波器１６に出力している。

部幅平均化回路１４は受入した残差信号の平均部幅電力
ｒｐを、（ｆ′算し、同じ＜　２０ｍ５ｅｃ毎に符号化
回路１３に供給している。ピッチ抽出器１５は。

音声信号のピッチ周波数を決定するもので、母音等の有
声音の場合には、そのピッチ周波数Ｐｔを抽出し、子音
等の無声音の場合にはピッチ周波数なしくＰ＋＝Ｏ）と
して符号化回路１３に供給する。

低域ｐ波器１６は、供給された音声信号の残差信号にお
ける低域成分のみを取出し、ダウンサンプリング回路１
７を介してナシプリング周波数を減少させた後符号化回
路１３へ信号ｅ　、／を出力する。このダウンサンプリ
ング回路１７は符号化される残差信号の数を減少させる
ためのものである。

例えば低域ｐ波器１６のカットオフ周波数を１ＫＨｚと
すれば、ダウンサンプリング回路１７は入μｓｅｃ毎に
符号化回路１３に送られることになり。

２０ｍ５ｅｃの間Ｉこは４０個の残差信号ｅｔ／が得ら
れる。

符号化回路１３は、前記分析フィルター２．部幅平均化
回路１４．ピッチ抽出回路１５およびダウンサンプリン
グ回路１７から送られる信号を。

それぞれ適当４ビツト数で符号化しで伝送するが。

このときヒ０ツヂ抽出回路１５から送られてくる信す号によに符号ビットの割当を変化させる。

例えば、ピッチ抽出回路１５から送られてくる信号が有
声音であることを表わしていれば、すな化し、さらに同
期信号の２ビツトを付加して、２０ｍ５ｅｃ毎に９６ビ
ツトを端子１８から送信する。

一方、ピッチ抽出回路１５から送られてくる信号が無声
音であることを表わしている場合すなわまでの部分自己
関係数は送信ぜ１゛１代りにダウンサンプリング回路１
７から出力される残差信号ｅ　ｔ／を符号化して伝送す
る。前述のように、　　２Ｑｍｓｅｃの間に４０個の残
差信号が供給されるので、この残差信号は６Ｍを用いて
４０ビツトに符号化でき、る。

このようにして、無声音のときには５個の部分自己相関
係数ｋｉ（ｉ−１〜５）をそれぞれ８ビツトで符号化し
た４０ビットサ、残差信号ｅ　ｔ／を符号化した４０ビ
ット吉、ピッチ周波数Ｐ＋および振幅情報ｒ、を符号化
したそれぞれ７ビツトにさらに同期信号２ビツトを付加
して、出方端子１８を介し２０ｍ５ｅｃ毎に９６ビツト
を送信する。

したがって有声音のときも、無声音のときも。

信号の伝送速度は同一である。

これに対し、音声合成回路２ｏの側においては。

入力端子２１に壺大した信号系列は復号化回路２２によ
り復号化される。

復号化回路２２では、ピッチ周波数が０か否か数Ｐｒが
０すなわち無声音と判別した場合には、残差信号ｅｔ′
を残差波形発生器２３に出力するとともに、スイッチ回
路２４を残差信号発生器２３からの信号が導通ずるよう
に切換え、さらに振幅情える。

Ｐ。

一方、ピッチ周波数−８＝Ｆ〜０すなわち有声音である
と判別した場合には、ピッチ周波１’ｌＰ＋　をインパ
ルス発生器２７に出力する吉ともに、スイッチ回路２４
をインパルス回路２７からの信号が導通ずるように切換
え、さらに振幅情報ｒ、を乗算器２５に導くとともに、
１〜１０次の部分自己相関係数ん一４ｉ（ｉ＝ｌ　〜１０）を合成フィルタ２６に供給す
る。

したがって無声音の場合には残差波形発生器２３で再生
された残差信号ｅ（がスイッチ回路２５を介して乗算器
２５に導かれ、また有声音の場合にはインパルス発生器
で、ピッチ周波数ＰＬにしたがって一定周期毎に発生さ
れたインパルス列がスイッ子回路２４を介して乗算器２
５に導かれる。乗算出力ず゛る。

このようにして合成フィルタ２６に供給された信号は、
スペクトル包絡の修正を受けて出力端子２８より合成音
声信号として出力される。

以上のように、音声合成回路２０において、有声音の場
合にはスペクトル包絡が一様な信号で励振される１０次
の全極型フィルタで音声の合成が行なわれ、無声音の場
合には、残差信号で励振される５次の全極型フィルタで
音声の合成が行なわれることになり、音声の発生過橿に
よく近似した伝送に用いられる信号のビット数は同一で
あり符号化速度を犠牲にすることは全くない。

なお、この発明は上記実施例に限定されるものではなく
要旨を変更しない範囲においで種々変形して実施するこ
とができる。

例えば５分析フィルタ１２としでは部分自己相関係数を
抽出するものに限定されず、線スペクトル対パラメータ
やケプストラムパラメータのようなスペクトル包絡情報
を表現するパラメータのものであれば用いることができ
る。またピッチ抽出器１５としては、上記実施例のよう
に分析フィルタ１２の出力信号を受入するものに限らｒ
、端子１１よりの音声信号を直接受入して分析するよう
に構成することもできる。

ざらに残差波形発生器２３としては、単に残差信号ｅ、
を出力するものではなく残差信号ｅｔ＋　／を受入し高
調波信号を合成して出力する構成を吉ることもできる。

このような構成にさると１合成音声の自然性をさらに向
上することができる。

さらに、上記実施例では、この発明を通信システムに用
いる場合を想定して主として説明したが、これを音声の
記録装置さして用いる場合には、端子１８の出力信号を
メモリに蓄え、端子２１の信号はメモリから読み出すよ
うに４−ることもできる。

このよう、な構成をとる場合には同期信号は不安となり
、省略することができる。

【図面の簡単な説明】

）添付図面はこの発明の一実施例（＼示す概略的構−成図
である。１０・・・音声分析回路　　１１・・・入力端子１２・
・・分析フィルタ　　−３・・・符号化回路１４・・・
振幅平均化回路　１５・・・ピッチ抽出器１６・・・低
域沖波器　　　１７・・・ダウンサンプリング回路

Claims

【特許請求の範囲】入力１号からスペクトル包絡情報を表わす複数個のパラ
メータを抽出するとともｌここの人、力信号をスペクト
ル包絡が平坦化された信号に変換して出力する手段と、
この出力信号の平均電力に比例した情報を抽出する手段
と、同じくこの出力信号の低域成分を選択的に取出す手
段と、音声の有声。無声情報を抽出する手段と、前記スペクトル包絡情報を
表わすパラメータ、前記出力信号の平均電力に比例した
情報および前記出力信号の低域成分を受入して符号化す
る手段とを具備し、音声が無声音のききには有声音のと
きに比し相対的に少な゛い数のスペクトル包絡情報を表
わすパラメータを送信もしくは記録するとともにこのパ
ラメータの数を減少゛させる代りに前記低域成分を選択
的に取出す手段の出力信号を符号化して送信もしくは記
録することを特徴とする音声分析装置。