JPS6232800B2 - - Google Patents
Info
- Publication number
- JPS6232800B2 JPS6232800B2 JP54095897A JP9589779A JPS6232800B2 JP S6232800 B2 JPS6232800 B2 JP S6232800B2 JP 54095897 A JP54095897 A JP 54095897A JP 9589779 A JP9589779 A JP 9589779A JP S6232800 B2 JPS6232800 B2 JP S6232800B2
- Authority
- JP
- Japan
- Prior art keywords
- pole
- circuit
- poles
- frequency
- interpolation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 238000004458 analytical method Methods 0.000 claims description 21
- 230000015572 biosynthetic process Effects 0.000 claims description 15
- 238000003786 synthesis reaction Methods 0.000 claims description 15
- 238000001228 spectrum Methods 0.000 claims description 3
- 230000005540 biological transmission Effects 0.000 description 18
- 238000004364 calculation method Methods 0.000 description 9
- 238000000034 method Methods 0.000 description 9
- 238000013139 quantization Methods 0.000 description 3
- 239000002131 composite material Substances 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000006866 deterioration Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 239000012925 reference material Substances 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
【発明の詳細な説明】
本発明は音声情報の分析合成を行なう音声分析
合成装置に関する。音声波形は10〜30ミリ秒程度
の分析窓で分析した際の周波数スペクトラム特性
が電話帯域程度の周波数範囲内にフオルマントと
呼ばれる数個のエネルギーの集中した周波数成分
を有している。このことから音声波形を10次程度
の線形予測係数を用いて近似的に表現することに
より音質をあまり劣化させずに情報量の圧縮がで
きることが、下記参照資料(1)等により知られてい
る。
合成装置に関する。音声波形は10〜30ミリ秒程度
の分析窓で分析した際の周波数スペクトラム特性
が電話帯域程度の周波数範囲内にフオルマントと
呼ばれる数個のエネルギーの集中した周波数成分
を有している。このことから音声波形を10次程度
の線形予測係数を用いて近似的に表現することに
より音質をあまり劣化させずに情報量の圧縮がで
きることが、下記参照資料(1)等により知られてい
る。
「最大スペクトル推定法をもちいた音声情報圧
縮」板倉、斉藤 日本音響学会誌vol.27.No.9
1971(1) また、分析側において20〜30ミリ秒程度の分析
フレーム周期毎に抽出された前記線形予測係数
を、量子化して伝送パラメータとして合成側に伝
送し、合成側では前記量子化された線形予測係数
を前記分析フレーム以下の周期(例えば5ミリ
秒)毎に補間して得られる値を用いることによ
り、分析フレームの切替り時点において生ずる不
連続性を軽減させて比較的合成音質の良い音声分
析合成方式が知られている。
縮」板倉、斉藤 日本音響学会誌vol.27.No.9
1971(1) また、分析側において20〜30ミリ秒程度の分析
フレーム周期毎に抽出された前記線形予測係数
を、量子化して伝送パラメータとして合成側に伝
送し、合成側では前記量子化された線形予測係数
を前記分析フレーム以下の周期(例えば5ミリ
秒)毎に補間して得られる値を用いることによ
り、分析フレームの切替り時点において生ずる不
連続性を軽減させて比較的合成音質の良い音声分
析合成方式が知られている。
しかしながら、線形予測係数は物理的な意味が
明確でないため、比較的効率的な量子化が行ない
難く、また、音質を向上させるために合成側にお
いてパラメータの値の補間を行なう際にもフオル
マントの連続的な変化の保障が必ずしもない等の
欠点を持つている。
明確でないため、比較的効率的な量子化が行ない
難く、また、音質を向上させるために合成側にお
いてパラメータの値の補間を行なう際にもフオル
マントの連続的な変化の保障が必ずしもない等の
欠点を持つている。
そこで、前記線形予測係数を極周波数およびバ
ンド巾に変換して伝送パラメータとして用いる方
式が知られている。しかしながら、この方式は音
源による極等も含まれるため、フオルマント対応
する極を選んで順序付をすることが必要となる。
ンド巾に変換して伝送パラメータとして用いる方
式が知られている。しかしながら、この方式は音
源による極等も含まれるため、フオルマント対応
する極を選んで順序付をすることが必要となる。
本発明の目的は比較的大きな圧縮率で、且つ、
合成音品質の良い音声分析合成装置を提供するこ
とにある。
合成音品質の良い音声分析合成装置を提供するこ
とにある。
本発明は、分析部における複数個の極周波数と
バンド巾を算出する手段と、前記極周波数とバン
ド巾データを用いて前記極を分類して順序付する
手段と、極周波数およびバンド巾を符号化する手
段と、合成部における補間すべきか否かを判別す
る補間判別回路と、前記補間判別回路の判別結果
に従い極周波数値およびバンド巾値の補間を行な
う補間回路と前記補間値等を用いて音声波形を合
成する手段とから構成されている。
バンド巾を算出する手段と、前記極周波数とバン
ド巾データを用いて前記極を分類して順序付する
手段と、極周波数およびバンド巾を符号化する手
段と、合成部における補間すべきか否かを判別す
る補間判別回路と、前記補間判別回路の判別結果
に従い極周波数値およびバンド巾値の補間を行な
う補間回路と前記補間値等を用いて音声波形を合
成する手段とから構成されている。
本発明の特徴は、あらかじめ与えられる有限個
の極の番号を伝送パラメータとして用いるととも
に、分析側で極周波数およびバンド巾データを参
照して極を分類した後、極周波数の順に順序付を
行ない、合成側で極の周波数およびバンド巾の補
間を選択的に行なうことにある。一般に音声波形
より抽出された極のなかにはフオルマントを表わ
すQの大きい極と音源波形等により生ずるQの小
さい極とが混在している。そこで極の順序づけ方
式としては、例えば極のQ(極周波数/バンド
巾)を比較して極をQの大きいものと小さいもの
との二通りに分類し、それぞれの分類内で極周波
数の小さい順序に並べることにより分析フレーム
間でのフオルマントの対応が比較的良い順序付を
行なうことができる。
の極の番号を伝送パラメータとして用いるととも
に、分析側で極周波数およびバンド巾データを参
照して極を分類した後、極周波数の順に順序付を
行ない、合成側で極の周波数およびバンド巾の補
間を選択的に行なうことにある。一般に音声波形
より抽出された極のなかにはフオルマントを表わ
すQの大きい極と音源波形等により生ずるQの小
さい極とが混在している。そこで極の順序づけ方
式としては、例えば極のQ(極周波数/バンド
巾)を比較して極をQの大きいものと小さいもの
との二通りに分類し、それぞれの分類内で極周波
数の小さい順序に並べることにより分析フレーム
間でのフオルマントの対応が比較的良い順序付を
行なうことができる。
また、伝送パラメータとしては、あらかじめ用
意される有限個の極のなかから最も近い極の番号
を伝送パラメータとして用いることにより直接極
周波数値、バンド巾値を量子化して伝送する方式
あるいは線形予測係数を量子化して伝送する方式
に比較して少ない情報量で伝送することができる
ことは明らかである。ここで、あらかじめ用意す
べき極としては、例えば、電話帯域程度の周波数
帯域内の極の極周波数およびバンド巾を聴覚的に
許される程度の精度で量子化して得られる極を用
いることができる。
意される有限個の極のなかから最も近い極の番号
を伝送パラメータとして用いることにより直接極
周波数値、バンド巾値を量子化して伝送する方式
あるいは線形予測係数を量子化して伝送する方式
に比較して少ない情報量で伝送することができる
ことは明らかである。ここで、あらかじめ用意す
べき極としては、例えば、電話帯域程度の周波数
帯域内の極の極周波数およびバンド巾を聴覚的に
許される程度の精度で量子化して得られる極を用
いることができる。
合成側においては、前記分析側にあらかじめ用
意される極に対応した2次の線形予測係数を用意
しておき、分析側で得られる前記極の番号に従つ
て該当する線形予測係数を引き出して合成する。
合成回路は伝送パラメータとして5個の極の番号
を用いたとすれば、5個の2次巡回型フイルタを
縦列接続したもので実現される。
意される極に対応した2次の線形予測係数を用意
しておき、分析側で得られる前記極の番号に従つ
て該当する線形予測係数を引き出して合成する。
合成回路は伝送パラメータとして5個の極の番号
を用いたとすれば、5個の2次巡回型フイルタを
縦列接続したもので実現される。
パラメータの補間方式としては、例えば分析側
で得られた相隣子分析フレームにおける同順位の
二つの極の極周波数とバンド巾の線形補間値を算
出し、あらかじめ用意されている極のなかから前
記補間値に最も近い極を選択し、前記選択された
極に対する線形予測係数を用いることができる。
で得られた相隣子分析フレームにおける同順位の
二つの極の極周波数とバンド巾の線形補間値を算
出し、あらかじめ用意されている極のなかから前
記補間値に最も近い極を選択し、前記選択された
極に対する線形予測係数を用いることができる。
この際、極の順序付エラーにより異なるフオル
マントどうしが補間された場合、(特にフオルマ
ント周波数の差が大きい場合)には、大きな音質
の劣下が生じる。
マントどうしが補間された場合、(特にフオルマ
ント周波数の差が大きい場合)には、大きな音質
の劣下が生じる。
本発明においては前記の順序付エラーによる音
質の劣化を防ぐために前記補間される二つの極の
周波数の差が、あらかじめ定められた値を越えた
場合には補間を行なわない。
質の劣化を防ぐために前記補間される二つの極の
周波数の差が、あらかじめ定められた値を越えた
場合には補間を行なわない。
また、線形予測係数より極周波数、バンド巾を
算出する方法に関しては、前記参照資料(1)に詳し
いので、ここでは説明を省略する。
算出する方法に関しては、前記参照資料(1)に詳し
いので、ここでは説明を省略する。
次に図面を参照して本発明を詳細に説明する。
図は本発明の一実施例を示すブロツク図である。
図は本発明の一実施例を示すブロツク図である。
まず、音声波形が音声波形入力端子3より分析
部1内の自己相関算出回路4とピツチ抽出回路1
1と有声無声判別回路12にそれぞれ入力され
る。自己相関算出回路5は前記音声波形より10次
程度の短時間自己相関係数を算出し線形予測係数
算出回路6に出力する。線形予測係数算出路6は
前記短時間自己相関係数より線形予測係数を算出
し極パラメータ算出回路6に出力する。極パラメ
ータ算出回路6は、前記線形予測係数より極の周
波数とバンド巾を算出し、Q比較回路7および極
データ順序付回路8に出力する。Q比較回路7は
前記極周波数とバンド巾よりQ値(極周波数値/
バンド巾値)を算出し、最もQの小さい極を選択
(例えば2個)し、その極の番号を極データ順序
付回路8に出力する極データ順序付回路8は、Q
比較回路7より出力される前記極の番号に従つ
て、まず、Qの小さい前記2個の極に対して極周
波数の小さい順に順序付を行なつた後、Qの大き
い極に対して極周波数の小さい順に極の順序付を
行ない前記順序に従つて極周波数およびバンド巾
データを極番号生成回路10に出力する。極番号
生成回路10は、極量子化データテーブル9にあ
らかじめ記憶されている極周波数、バンド巾デー
タのなかから前記極データ順序付回路8より出力
される極周波数およびバンド巾データに最も近い
ものに対する番号を順次検出し、その番号を極番
号データ伝送路13を介して合成部2内の補間判
別回路25に伝送する。
部1内の自己相関算出回路4とピツチ抽出回路1
1と有声無声判別回路12にそれぞれ入力され
る。自己相関算出回路5は前記音声波形より10次
程度の短時間自己相関係数を算出し線形予測係数
算出回路6に出力する。線形予測係数算出路6は
前記短時間自己相関係数より線形予測係数を算出
し極パラメータ算出回路6に出力する。極パラメ
ータ算出回路6は、前記線形予測係数より極の周
波数とバンド巾を算出し、Q比較回路7および極
データ順序付回路8に出力する。Q比較回路7は
前記極周波数とバンド巾よりQ値(極周波数値/
バンド巾値)を算出し、最もQの小さい極を選択
(例えば2個)し、その極の番号を極データ順序
付回路8に出力する極データ順序付回路8は、Q
比較回路7より出力される前記極の番号に従つ
て、まず、Qの小さい前記2個の極に対して極周
波数の小さい順に順序付を行なつた後、Qの大き
い極に対して極周波数の小さい順に極の順序付を
行ない前記順序に従つて極周波数およびバンド巾
データを極番号生成回路10に出力する。極番号
生成回路10は、極量子化データテーブル9にあ
らかじめ記憶されている極周波数、バンド巾デー
タのなかから前記極データ順序付回路8より出力
される極周波数およびバンド巾データに最も近い
ものに対する番号を順次検出し、その番号を極番
号データ伝送路13を介して合成部2内の補間判
別回路25に伝送する。
合成部2内の補間判別回路25は、制御回路1
6より補間判別回路制御データ伝送路24を介し
て与えられる制御データに従つて、前記極番号デ
ータを先行するフレームにおける同順位の極番号
データと比較し、その差が、あらかじめ定められ
た値を越えるときは補間データを“0”とし、越
えない時は補間データを“1”として前記極番号
データとともに補間回路21に出力する。
6より補間判別回路制御データ伝送路24を介し
て与えられる制御データに従つて、前記極番号デ
ータを先行するフレームにおける同順位の極番号
データと比較し、その差が、あらかじめ定められ
た値を越えるときは補間データを“0”とし、越
えない時は補間データを“1”として前記極番号
データとともに補間回路21に出力する。
補間回路21に入力された前記極番号データ
は、制御回路16より補間回路制御データ伝送路
20を介して入力される補間回路制御データおよ
び前記補間データに従い、補間データが“1”の
ときは、相隣る分析フレームにおける同順位の極
番号の補間を行ない、補間データが“0”のとき
は、補間を行なわずに線形予測係数テーブル22
に出力する。線形予測テーブル22からは前記極
番号の補間値に従つて該線形予測係数が、2次フ
イルタ回路23に出力される。一方、音源波形生
成回路18は、制御回路16より音源波形生成回
路制御データ伝送路17を介して与えられる音源
波形生成回路制御データに従つて、前記ピツテ周
期データおよび有声無声データを用いて音源波形
を生成し、2次フイルタ回路23に出力する。2
次フイルタ回路、23は制御回路16より2次フ
イルタ回路制御データ伝送路19を介して与えら
れる2次フイルタ回路制御データに従つて、前記
線形予測係数および音源波形を用いて合成波形を
生成し合成波形出力端子26より出力する。
は、制御回路16より補間回路制御データ伝送路
20を介して入力される補間回路制御データおよ
び前記補間データに従い、補間データが“1”の
ときは、相隣る分析フレームにおける同順位の極
番号の補間を行ない、補間データが“0”のとき
は、補間を行なわずに線形予測係数テーブル22
に出力する。線形予測テーブル22からは前記極
番号の補間値に従つて該線形予測係数が、2次フ
イルタ回路23に出力される。一方、音源波形生
成回路18は、制御回路16より音源波形生成回
路制御データ伝送路17を介して与えられる音源
波形生成回路制御データに従つて、前記ピツテ周
期データおよび有声無声データを用いて音源波形
を生成し、2次フイルタ回路23に出力する。2
次フイルタ回路、23は制御回路16より2次フ
イルタ回路制御データ伝送路19を介して与えら
れる2次フイルタ回路制御データに従つて、前記
線形予測係数および音源波形を用いて合成波形を
生成し合成波形出力端子26より出力する。
以上の説明においては、極の順序付を分析側で
行ない、極の補間を行なうか否かの判断は合成側
で行なうものとしたが、前記極の順序付をも合成
側で行なうように構成することによつても同様の
効果を有する。音声分析合成装置が実現できるこ
とは明らかである。
行ない、極の補間を行なうか否かの判断は合成側
で行なうものとしたが、前記極の順序付をも合成
側で行なうように構成することによつても同様の
効果を有する。音声分析合成装置が実現できるこ
とは明らかである。
図は本発明の実施例を説明するためのブロツク
図である。図において1は分析部、2は合成部、
3は音声波形入力端子、4は自己相関算出回路、
5は線形予測係数算出回路、6は極パラメータ算
出回路、7はQ比較回路、8は極データ順序付回
路、9は極量子化データテーブル、10は極番号
生成回路、11はピツチ抽出回路、12は有声無
声判別回路、13は極番号データ伝送路、14は
ピツチデータ伝送路、15は有声無声データ伝送
路、16は制御回路、17は音源波形生成回路制
御データ伝送路、18は音源波形生成回路、19
は2次フイルタ回路制御データ伝送路、20は補
間回路制御データ伝送路、21は補間回路、22
は線形予測係数テーブル、23は2次フイルタ回
路 24は補間判別回路制御データ伝送路、25
は補間判別回路 26は合成波形出力端子、であ
る。
図である。図において1は分析部、2は合成部、
3は音声波形入力端子、4は自己相関算出回路、
5は線形予測係数算出回路、6は極パラメータ算
出回路、7はQ比較回路、8は極データ順序付回
路、9は極量子化データテーブル、10は極番号
生成回路、11はピツチ抽出回路、12は有声無
声判別回路、13は極番号データ伝送路、14は
ピツチデータ伝送路、15は有声無声データ伝送
路、16は制御回路、17は音源波形生成回路制
御データ伝送路、18は音源波形生成回路、19
は2次フイルタ回路制御データ伝送路、20は補
間回路制御データ伝送路、21は補間回路、22
は線形予測係数テーブル、23は2次フイルタ回
路 24は補間判別回路制御データ伝送路、25
は補間判別回路 26は合成波形出力端子、であ
る。
Claims (1)
- 1 音声波形の周波数スペクトラムを複数個の極
の周波数特性で近似することにより情報量圧縮を
行なう音声分析合成装置において、入力音声より
極周波数を求めQの値の大小を比較することによ
り極を分類しさらに極周波数順に極を順序付する
手段と、相隣るフレームにおける前記順序付され
た極の極周波数を比較し、補間するか否かを判別
する回路と、前記判別結果に従つて極周波数およ
びバンド巾を補間する手段とを有することを特徴
とする音声分析合成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9589779A JPS5619100A (en) | 1979-07-26 | 1979-07-26 | Voice analysis and synthesis device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9589779A JPS5619100A (en) | 1979-07-26 | 1979-07-26 | Voice analysis and synthesis device |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS5619100A JPS5619100A (en) | 1981-02-23 |
JPS6232800B2 true JPS6232800B2 (ja) | 1987-07-16 |
Family
ID=14150089
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP9589779A Granted JPS5619100A (en) | 1979-07-26 | 1979-07-26 | Voice analysis and synthesis device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS5619100A (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57144600A (en) * | 1981-03-03 | 1982-09-07 | Nippon Electric Co | Voice synthesizer |
JPS59178224A (ja) * | 1983-03-30 | 1984-10-09 | Teijin Ltd | 延伸ポリエステルフイルム |
JPH0638520B2 (ja) * | 1986-02-03 | 1994-05-18 | ポリプラスチックス株式会社 | 発光素子装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS53127205A (en) * | 1977-04-13 | 1978-11-07 | Nippon Hoso Kyokai <Nhk> | Audio analysis and synthesis system |
-
1979
- 1979-07-26 JP JP9589779A patent/JPS5619100A/ja active Granted
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS53127205A (en) * | 1977-04-13 | 1978-11-07 | Nippon Hoso Kyokai <Nhk> | Audio analysis and synthesis system |
Also Published As
Publication number | Publication date |
---|---|
JPS5619100A (en) | 1981-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5774835A (en) | Method and apparatus of postfiltering using a first spectrum parameter of an encoded sound signal and a second spectrum parameter of a lesser degree than the first spectrum parameter | |
US6681204B2 (en) | Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal | |
US4821324A (en) | Low bit-rate pattern encoding and decoding capable of reducing an information transmission rate | |
CA2179228C (en) | Method and apparatus for reproducing speech signals and method for transmitting same | |
RU2257556C2 (ru) | Квантование коэффициентов усиления для речевого кодера линейного прогнозирования с кодовым возбуждением | |
EP0810585B1 (en) | Speech encoding and decoding apparatus | |
JP3254687B2 (ja) | 音声符号化方式 | |
JPH0395600A (ja) | 音声コーディング装置及び音声エンコーディング方法 | |
CA2399253C (en) | Speech decoder and method of decoding speech involving frequency expansion | |
US6073093A (en) | Combined residual and analysis-by-synthesis pitch-dependent gain estimation for linear predictive coders | |
JPH05232997A (ja) | 音声符号化装置 | |
JP3684751B2 (ja) | 信号符号化方法及び装置 | |
CA1334688C (en) | Multi-pulse type encoder having a low transmission rate | |
JP3888097B2 (ja) | ピッチ周期探索範囲設定装置、ピッチ周期探索装置、復号化適応音源ベクトル生成装置、音声符号化装置、音声復号化装置、音声信号送信装置、音声信号受信装置、移動局装置、及び基地局装置 | |
US5553194A (en) | Code-book driven vocoder device with voice source generator | |
JPS6232800B2 (ja) | ||
US4908863A (en) | Multi-pulse coding system | |
EP0729133B1 (en) | Determination of gain for pitch period in coding of speech signal | |
US7031913B1 (en) | Method and apparatus for decoding speech signal | |
JPH04301900A (ja) | 音声符号化装置 | |
JPH0990997A (ja) | 音声符号化装置、音声復号化装置、音声符号化復号化方法および複合ディジタルフィルタ | |
JPH0738119B2 (ja) | 音声波形符号復号化装置 | |
JP2000132195A (ja) | 信号符号化装置及び方法 | |
JPH045700A (ja) | 音声復号化装置及び音声符号化・復号化装置 | |
JPS6136800A (ja) | 可変長フレ−ム音声分析合成方式 |