JPH0229236B2 - - Google Patents

Info

Publication number
JPH0229236B2
JPH0229236B2 JP57095929A JP9592982A JPH0229236B2 JP H0229236 B2 JPH0229236 B2 JP H0229236B2 JP 57095929 A JP57095929 A JP 57095929A JP 9592982 A JP9592982 A JP 9592982A JP H0229236 B2 JPH0229236 B2 JP H0229236B2
Authority
JP
Japan
Prior art keywords
frequency
band
low
sound source
waveform
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP57095929A
Other languages
English (en)
Other versions
JPS58211797A (ja
Inventor
Satoru Taguchi
Masanori Kobayashi
Takayuki Ishikawa
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP57095929A priority Critical patent/JPS58211797A/ja
Publication of JPS58211797A publication Critical patent/JPS58211797A/ja
Publication of JPH0229236B2 publication Critical patent/JPH0229236B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Developing Agents For Electrophotography (AREA)
  • Solid-Sorbent Or Filter-Aiding Compositions (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Description

【発明の詳細な説明】 本発明は帯域分割型ボコーダとくに帯域分割線
形予測型ボコーダに関する。
近年における線形予測型音声分析法(LPC分
析法)の確立により、実用的な線形予測型ボコー
ダが広く普及されつつある。
このLPC分析法は音声のスペクトラム包絡を
全極型モデルで近似するものであるが、これには
従来、経験的に知られたフオルマント帯域幅の過
少推定と比較的にエネルギの小さい第3フオルマ
ントの近似性が悪いという二つの欠点があるとさ
れている。
上述の第1の欠点は、第1フオルマント等エネ
ルギの集中する周波数スペクトラムの極が過度に
集中するために起るものと考えられる。
最近、このような特定の周波数に極が集中する
のを防ぐために、音声帯域を複数のサブバンドに
分割し、各サブバンドに対しそれぞれ適当な次数
のLPC分析を行ない極の適宜な分散を計る帯域
分割型線形予測分析法が検討されている。
この方式は、帯域の分割を適当に選ぶことによ
り、上述の第1の欠点ばかりでなく第2の欠点を
も緩和し、線形予測型ボコーダの音質改善に貢献
する有力な手段になる可能性を秘めている。
しかしながら従来、このような帯域分割を行な
つた場合においても、合成音を生成する際に用い
る励振用音源に対しては帯域分割による特殊性を
特に考慮せず、従来の方式がそのまま踏襲されて
いる。そのため合成音を肉声の構造により近ずけ
自然性を改善するという点で必らずしも充分では
ないという欠点を有している。
本発明の目的は上述の従来の欠点を除去するに
ある。
第(1)の発明の帯域分割型ボコーダは、入力音声
信号を複数の音声伝送帯域に分割しそれぞれの帯
域について線形予測分析を行う帯域分割型ボコー
ダにおいて、予め定めた低群側の帯域に対しては
制御された繰り返し周波数をもつ波形列を音源と
しまた予め定めた高群側の帯域に対しては前記制
御された繰り返し周波数をもつ波形列と雑音とを
前記入力音声信号の有声度に応じて合成し音源と
して音声合成を行う手段を有する。
また、第(2)の発明の帯域分割型ボコーダは、入
力音声信号を複数の音声伝送帯域に分割しそれぞ
れの帯域について線形予測分析を行う帯域分割型
ボコーダにおいて、前記入力音声信号の有声度が
予め定めた中位の範囲にあるときは予め定めた低
群側の帯域に対しては制御された繰り返し周波数
をもつ波形列を音源としまた予め定めた高群側の
帯域に対しては前記制御された繰り返し周波数を
もつ波形列と雑音とを合成し音源として音声合成
を行ない、前記有声度が前記中位の範囲よりも高
い範囲のときは前記低群側の帯域および前記高群
側の帯域いずれに対しても前記制御された繰り返
し周波数をもつ波形列を音源として音声合成を行
ない、前記有声度が前記中位の範囲よりも低い範
囲のときは前記低群側の帯域および前記高群側の
帯域いずれに対しても前記制御された繰り返し周
波数をもつ波形列と前記雑音とを合成し音源とし
て音声合成を行なう手段を有する。
次に、図面を参照して本発明を詳細に説明す
る。
第1図、第2図、第3図および第4図は本発明
の一実施例を示すブロツク図であり、第1図は全
体の構成を示すブロツク図、第2図は送信側の構
成を示すブロツク図、第3図は第(1)の発明の一実
施例の受信側の構成を示すブロツク図および第4
図は第(2)の発明の一実施例の受信側の構成を示す
ブロツク図である。
本実施例は第1図に示すように送信側1、受信
側2/2′および伝送路3から構成される。
送信側1は、さらに第2図に示すように、低域
フイルタおよびA/D変換器101、ウインドウ
処理器102、フーリエ変換器103、パワース
ペクトラムメモリ104、低域側自已相関係数計
測器105、低域側線形予測係数分析器106、
高域側自已相関係数計測器107、高域側線形予
測係数分析器108、有声度計測器109、ピツ
チ抽出器110および符号化器111を有する。
また第(1)の発明の実施例の受信側2は第3図に
示すように復号化器201、低域側LPCフイル
タ202、低域側補間器203、低域側帯域フイ
ルタ204、高域側LPCフイルタ205、高域
側補間器206、周波数変換器207、高域側帯
域フイルタ208、低域高域合成器209、D/
A変換器および低域フイルタ210、ピツチ発生
器211、擬声帯波形発生器212、雑音発生器
213、可変合成器214、低域側可変利得増幅
器215および高域側可変利得増幅器216を有
する。
また第(2)の発明の実施例の受信側2′は、第4
図に示すように、第3図のすべての構成要素を含
むほかに、さらにそれに加えて音源切替/制御部
217を含んでいる。
さて、伝送すべき音声波形は、第2図に示す送
信側1の音声入力端子1000から入力され、低
域フイルタおよびA/D変換器101の低域フイ
ルタにより、例えば3333Hz以上の高域成分が遮断
されたものが、例えば8000Hz標本化周波数により
標本化され、A/D変換器により例えば12ビツト
のデジタル信号に量子化され、ウインドウ処理器
102に供給される。
ウインドウ処理器102は、入力した量子化音
声信号を、一旦、内部のメモリに格納する。この
メモリは、前記量子化音声信号の、例えば、
30mSEC分(240サンプル分)を記憶し、これに
ハミングウインドウまたは矩形ウインドウ等のウ
インドウ関数を乗ずるウインドウ処理を行なう。
このようなウインドウ処理は、例えば10mSEC周
期で繰り返され、これが基本分析周期(以後基本
フレーム周期)となる。
さて、ウインドウ処理された音声波形データ
は、基本フレーム周期ごとに、フーリエ変換器1
03、有声度計測器109およびピツチ抽出器1
10に供給される。
フーリエ変換器103は、入力した前述のウイ
ンドウ処理された音声波形データを用い、これを
フーリエ変換することにより、各周波数のスペク
トラム成分を求め、さらにこの絶対値の2乗をと
ることにより各周波数におけるパワースペクトラ
ム成分に変換して、これをパワースペクトラムメ
モリ104に格納する。こうしてメモリ104に
格納されたパワースペクトラム成分を表わす各デ
ータは、低域側自已相関係数計測器105および
高域側自已相関係数計測器107により自由に読
み出され、以下に述べるように自已相関係数を計
測するのに用いられる。
さて、低域側自已相関係数計測器105は、前
記パワースペクトラムの低域側、例えば0から
1333Hzのパワースペクトラムの成分をメモリ10
4から読み出し、これにフーリエ逆変換を施すこ
とにより必要な範囲内の各遅れ時間における自已
相関係数を計測し、これを低域側線形予測係数分
析器106に供給する。また、これとともに計測
器105は、計測した遅れ時間0の自已相関係数
を、この基本フレーム周期における低域側短時間
平均電力として、出力ライン1050を介し、符
号化器111に供給する。
分析器106は、供給された自已相関係数デー
タの組からKパラメータを所定の次数まで、例え
ばオートコリレーシヨン(AUTO
CORRELATION)法等の線形予測分析法により
抽出し、抽出された低域側Kパラメータを符号化
器111に供給する。
一方、高域側自已相関係数計測器107は、前
記パワースペクトラムの高域側、上記の例では
1333Hzから3333Hzのパワースペクトラムの成分を
メモリ104から読み出し、これにフーリエ逆変
換を施すことにより、必要な範囲内の各遅れ時間
における自已相関係数を計測し、これを高域側線
形予測係数分析器108に供給する。但し、上述
のフーリエ変換の演算に当つて、1333Hzから3333
Hzのパワースペクトラム成分を、1333Hzだけ周波
数の低い方に周波数シフトし、0から2000Hzのパ
ワースペクトラムと見做してフーリエ逆変換を実
行し、自已相関係数を計測する。また、これとと
もに計測器107は、計測した遅れ時間0の自已
相関係数を、この基本フレーム周期における高域
側短時間平均電力として、出力ライン1070を
介し符号化器111に供給する。
なお、上述の低域側自已相関係数計測器105
および高域側自已相関係数計測器107で行なう
フーリエ逆変換は、パワースペクトラムがスカラ
量(実数成分のみで虚数成分を含まない量)であ
るために、必らずしもフーリエ逆変換に限定され
る必要はなく、フーリエ変換またはコサイン変換
のいずれを用いてもよい。
分析器108は、供給された自已相関係数のデ
ータの組から、Kパラメータを所定の次数まで、
例えばオートコリレーシヨン法等の線形予測分析
法により抽出し、抽出された高域側Kパラメータ
を符号化器111に供給する。
なお、上述のオートコリレーシヨン法の詳細に
ついては、例えば、ジヨンマツコール(John
Makhoul):“リニアプレデイクレヨン(Linear
Prediction):アチユートリアルレビユー(A
Tutorial Review)”、Proceedings of the
IEEE、Vol.63、No.4、pp.561〜580、April、
1975を参照されたい なおまた、分析器106および108による低
域側および高域側の線形予測係数分析に際して
は、これらに入力される音声信号の周波数帯域
が、上述のように、低域側は0から1333Hzまで、
また高域側は0から2000Hzまでとなり、その最高
周波数がもとの標本化周期できまる最高周波数
4000Hzに対し、それぞれ1/3および1/2に制限され
ているため、線形予測分析を行う場合の標本化周
期は、それぞれもとの標本化周期の3倍および2
倍にデシメート(decimate)したものを用いた
ことと等価となる。
さて、有声度計測器109は、ウインドウ処理
された前記音声波形データの供給を受け、各基本
フレーム周期ごとに、このフレーム中の音声信号
の有声度を計測し、その計測結果を有声度表示信
号として出力ライン1090を介して符号化器1
11に供給する。この有声度計測器109は、例
えば、特開昭54−151303有声無声判別装置を応用
し、そこで得られる判別式の値を有声度表示信号
として用いることができる。
ピツチ抽出器110は、供給された前記ウイン
ドウ処理された音声波形データから、各基本フレ
ーム周期におけるピツチ周波数データを抽出し、
これを符号化器111に供給する。
符号化器111は、こうして供給された各種デ
ータを符号化して伝送フレームを作成し、各基本
フレームごとに一伝送フレームずつ伝送路3を介
して受信側2/2′に送出する。
さて、受信側2/2′においては、伝送路3を
介して伝送された上述の伝送フレームを受信し、
それに従つて以下に述べるようにして音声を合成
する。
最初に、第3図に示す、第(1)の発明の一実施例
の受信側2について説明する。
受信側2においては、第3図に示すように、伝
送路3を介して伝送された前記伝送フレームが、
復号化器201に次々に供給される。
復号化器201は、これらの伝送フレームを復
号化することにより、送信側の各データを再生
し、これらの各データをそれぞれ下記のように供
給する。
まず、再生された低域側Kパラメータを低域側
LPCフイルタ202に供給し、同様に、再生さ
れた高域側Kパラメータを高域側LPCフイルタ
205に供給する。また、再生された有声度表示
信号を出力ライン2010を介して可変合成器2
14の可変合成制御信号として供給する。さら
に、再生されたピツチ周波数データをピツチ周波
数制御信号としてピツチ発生器211に供給す
る。
復号化器201は、さらにまた、再生された低
域側短時間平均電力を出力ライン2011を介し
て、低域側利得制御情報として低域側可変利得増
幅器215に供給する。同様に再生された高域側
短時間平均電力を出力ライン2012を介して高
域側利得制御情報として高域側可変利得増幅器2
16に供給する。
さて、ピツチ発生器211はピツチ周波数デー
タにより指定された繰り返し周波数をもつインパ
ルスデータを発生し、これを擬声帯波形発生器2
12に供給する。
擬声帯波形発生器212は、供給されたインパ
ルスデータの指定する時間位置に予め定められた
波形をもつ擬声帯波形を発生する。
すなわち、ピツチ発生器211からの出力デー
タは、第5図Aに示すように、ピツチパルスの発
生時点tp0、tp1、tp2、……を示す情報だけを含む
データであるが、擬声帯波形発生器212は、第
5図Bに示すように、指定された各ピツチパルス
の時点を基準として、第5図Cに示すような予め
定められた擬声帯波形をもつ擬声帯波形列を発生
する。この擬声帯波形発生器212は、ROM
(読出し専用メモリ)に予め定めた擬声帯波形デ
ータを書き込んでおき、各ピツチパルスの発生時
点ごとにこのROMの内容を順次読み出すことに
より容易に実現することができる。この擬声帯波
形発生器212の使用は、後述する音源励振デー
タをより肉声に近ずけることを目的としたもの
で、場合によつてはこれを省略することもできる
(第5図B)の擬声帯波形列のかわりに第5図A
のピツチパルス列をそのまま用いることもでき
る)。
さて、擬声帯波形発生器212の出力は、一方
ではライン2120を介して可変合成器214の
一方の入力信号として供給され、もう一方ではラ
イン2121を介して低域側可変利得増幅器21
5の入力に供給される。
可変合成器214は一方ではライン2120を
介して供給される前述の擬声帯波形列と、他方で
は雑音発生器213からライン2130を介して
供給される雑音データとを、ライン2010を介
して供給される有声度表示信号による前記可変合
成制御信号の制御に応答して可変合成する。
すなわち、合成器214は、擬声帯波形発生器
212の出力Pに荷重係数WPを掛け、また雑音
発生器213の出力Nに荷重係数WNを掛けて両
者を加算し、出力Eを E=WPP+WNN として合成するが、この荷重係数WPおよびWN
は、有声度表示信号の予め定めた関数とする。す
なわち、荷重係数WPは有声度表示信号の表示す
る有声度Vが高くなるに従つて増加する特定の関
数であり、また荷重係数WNは有声度表示信号の
表示する有声度Vが低くなるに従つて増加する特
定の関数とする。この結果、可変合成器214の
出力2140は、有声度表示信号の表示する有声
度Vが著るしく高い場合には擬声帯波形列が雑音
に比較して圧倒的に大きくなり、その結果雑音は
無視することができ、また逆に有声度Vが著るし
く低い場合には雑音が擬声帯波形列に比較して圧
倒的に大きくなり、その結果出力2140は雑音
のみと見做せるように合成される。こうして合成
された可変合成器214の合成出力は、出力ライ
ン2140を介して高域側可変利得増幅器216
の入力に供給される。
さて、低域側可変利得増幅器215は、ライン
2121を介して供給された擬声帯波形列を、ラ
イン2011を介して供給された低域側短時間平
均電力で荷重することにより可変増幅し、これを
励振信号ライン2150を介して低域側LPCフ
イルタ202に音源励振データとして供給する。
また高域側可変利得増幅器216は、ライン21
40を介して供給された前述の可変合成器214
の合成出力をライン2012を介して供給される
高域側短時間平均電力で荷重することにより可変
増幅し、これを励振信号ライン2160を介して
高域側LPCフイルタ205に音源励振データと
して供給する。
さて、再生された低域側Kパラメータの供給を
受けた低域側LPCフイルタ202は、その内部
において、供給されたKパラメータをαパラメー
タに変換し、このαパラメータをLPCフイルタ
のフイルタ係数として使用し、ライン2150を
介して供給された音源励振データと、このフイル
タ係数とより低域側の音声波形データを合成し、
これを低域側補間器203に供給する。
前述の送信側におけるデシメートのため、こう
して低域側のKパラメータから合成された低域側
音声波形データは、その標本化周期が正常の標本
化周期の3倍になつている。低域側補間器203
は、供給されたこの音声波形データを1333Hzの低
域フイルタを通すことによつて補間し正常の標本
化周期の音声波形データを作成し、これを低域側
帯域フイルタ204に供給する。
低域側帯域フイルタ204は、供給されたデー
タを、例えば300Hzから1333Hzまでの帯域をもつ
帯域フイルタを通すことにより不要帯域の周波数
成分を除去して低域側の音声波形データを生成
し、低域高域合成器209の一方の入力に供給す
る。
一方、再生された高域側Kパラメータの供給を
受けた高域側LPCフイルタ205は、その内部
において、供給されたKパラメータをαパラメー
タに変換し、このαパラメータをLPCフイルタ
のフイルタ係数として使用し、ライン2160を
介して供給された音源励振データとこのフイルタ
係数とより高域側の音声波形データを合成し、こ
れを高域側補間器206に供給する。
前述の送信側1における処理のため、高域側K
パラメータは、もとの音声信号の1333Hzから3333
Hzの成分を周波数シフトすることにより0から
2000Hzまでの帯域にうつしこれを正常の2倍の標
本化周期にデシメートした音声波形に対するKパ
ラメータとなつている。従つて、このKパラメー
タから合成された音声波形データは、その標本化
周期が正常の標本化周期の2倍であり、また、そ
の周波数が1333Hzだけ低い方に周波数シフトされ
た波形となつている。
そこで、高域側補間器206は、供給されたこ
の音声波形データを2000Hzの低域フイルタを通す
ことにより補間し正常の標本化周期の音声波形デ
ータを作成し、これを周波数変換器207に供給
する。
周波数変換器207は、供給されたこの音声波
形データに1333Hzの正弦波を掛けて音声波形の周
波数を1333Hzだけシフトし、これを高域側帯域フ
イルタ208に供給する。
高域側帯域フイルタ208は、供給されたデー
タを1333Hzから3333Hzまでの帯域をもつ帯域フイ
ルタを通すことにより不要帯域の周波数成分を除
去して高域側音声波形データを生成し、低域高域
合成器209の他方の入力側に供給する。
低域高域合成器209は供給された低域側音声
波形データと高域側音声波形データとを加算して
合成する。かくしてその出力には帯域分割線形予
測型ボコーダの合成音声データが生成され、D/
A変換器および低域フイルタ210に供給され
る。
D/A変換器および低域フイルタ210は、供
給された合成音声データをD/A変換器によりア
ナログ音声信号に変換し、さらに低域フイルタに
より4000Hz以上の成分を遮断し、合成された音声
信号として出力端子2000より出力する。
以上の説明より明らかなように、この実施例の
ボコーダは、音声帯域を高域側と低域側とに分割
し、低域側に対しては抽出されたピツチ周波数に
より制御される繰り返し周波数をもつ擬声帯波形
列(またはピツチパルス列)を音源として用い、
また高域側に対しては前記擬声帯波形列(または
ピツチパルス列)と雑音とを可変合成したものを
音源として用いて音声合成を行なつている。
これは、音声発生機構をモデル化した場合に、
周波数の比較的低い領域では空気振動は体積流と
なりピツチパルスによる繰り返し構造が明瞭にな
るが、周波数の比較的高い領域においては体積流
とならずピツチ構造が不明瞭となる点をより忠実
にシミユレートし、合成音声を一層肉声に近ずけ
自然性を改善したものである。
以上の実施例においては、低域側の帯域と高域
側の帯域とで異なる音源構成を用いることによ
り、より忠実に発声機構をシユミレートしたもの
であるが、これをさらに一歩進めたものが以下に
示す第(2)の発明である。
次に第(2)の発明の一実施例について図面を参照
して詳細に説明する。
本実施例の送信側1は第2図に示した第(1)の発
明の送信側の実施例と全く同一である。
それに対して受信側2′は第4図に示すように、
第3図に示した第(1)の発明の受信側の実施例のす
べての構成要素を含むほかに、さらにそれに加え
て、音源切替/制御部217を含んでいる。
この音源切替/制御部217は、その第1の入
力として擬声帯波形列を供給する擬声帯波形発生
器212の出力ライン2120と、その第2の入
力として擬声帯波形列と雑音との合成出力を供給
する可変合成器214の出力ライン2140と、
その第3の入力として復号化器201の復号化さ
れた有声度表示信号を供給する出力ライン201
0を有し、その第1の出力として低域側可変利得
増幅器215に低域側音源情報を供給する出力ラ
イン2170と、その第2の出力として高域側可
変利得増幅器216に高域側音源情報を供給する
出力ライン2171を有している。この音源切
替/制御部217の機能は、ライン2010を介
して供給される有声度表示信号の表示する有声度
Vに応答して、出力ライン2170および出力ラ
イン2171を、入力ライン2120および21
40に対し、第6図に示すように選択的に接続替
えすることである。
すなわち、ライン2010を介して供給される
有声度表示信号の表示する有声度Vに対し、予め
定めた二つのスレシホールド値VhおよびVlをVh
>Vlなるように選び、有声度VがVhVVlな
る範囲にあるときは、これを中位の有声度領域に
あるとして、この場合には低域側可変利得増幅器
215に入力するライン2170を擬声帯波形列
を供給するライン2120に接続し、かつ高域側
可変利得増幅器216に入力するライン2171
を擬声帯波形列と雑音との合成出力を供給するラ
イン2140に接続する。この結果、中位の有声
度の領域では、第(1)の発明の実施例と同様に、低
域側の励振音源としては擬声帯波形列が用いら
れ、また高域側の励振音源としては擬声帯波形列
と雑音との合成出力が用いられることになる。
これに対して、有声度VがV>Vhの範囲にあ
るときは、これも高位の有声度の領域にあると定
義して、この場合には低域側および高域側に入力
するそれぞれのライン2170およびライン21
71ともに擬声帯波形列を供給するライン212
0に接続する。この結果、高位の有声度の領域で
は低域側および高域側とも同じ励振音源として擬
声帯波形列が用いられる。
さらにまた、有声度VがV<Vlの範囲にある
ときはこれを低位の有声度の領域にあると定義し
て、この場合には低域側および高域側に入力する
それぞれのライン2170およびライン2171
ともに擬声帯波形列と雑音との合成出力を供給す
るライン2140に接続する。この結果低位の有
声度の領域では、低域側および高域側ともに同じ
励振音源として擬声帯波形列と雑音とが合成され
た合成出力が用いられる。
以上のように、本実施例を用いると、有声度に
応答し低域側および高域側に対し、第(1)の発明の
実施例よりもさらに一層適切な励振音源を供給す
ることができる。
なお、以上の第(1)および第(2)の発明の実施例に
おいては、伝送帯域を高域側と低域側とに2分割
しただけであるが、この分割数をさらに増し、こ
れら分割した帯域を低群側に属する帯域と高群側
に属する帯域とに区別し、低群側に属する帯域に
対しては、その音源として対応する上述の実施例
の低域側に対する音源と同じ構成の音源を用い、
また高群側に属する帯域に対しては対応する上述
の実施例の高域側に対する音源と同じ構成の音源
を用いるようにすることもできる。
また、高域側と低域側との分離するのに使用し
た1333Hzの分割周波数は単なる一例でありこれに
限るものではない。
同様に、デシメートの比率も一例を示したにす
ぎない。
また、制御された繰り返し周波数をもつ音源波
形としては、すでに説明したように、擬声帯波形
列またはピツチパルス列を用いることができる。
また、以上に述べた各実施例においては、送信
側で帯域分割を行なうに当つて、まず全帯域のパ
ワースペクトラムを求めこれを各帯域に分割した
が、このかわりに時間軸上で取り扱かい、入力波
形を帯域フイルタを用いて分割してから周波数シ
フトにより基底帯域におとし、この波形を帯域幅
に応じてデシメートしてから線形予測分析を行な
うという構成をとることもできる。
さらにまた、以上の各実施例の合成側において
は、低域側および高域側で別別に時間軸上の出力
波形を求め、これを時間軸上で合成したが、この
かわりに以下に示すように周波数領域で合成して
から時間軸上の波形を生成するようにすることも
できる。
すなわち、復号化器201で再生した低域側お
よび高域側のKパラメータを用い低域側および高
域側のスペクトトル包絡を演算し、これと、再生
した低域側および低域側短時間平均電力情報(ラ
イン2011およびライン2012)とにより全
帯域自已相関係数を算出する。この全帯域自已相
関係数から線形予測分析により全帯域のαパラメ
ータを算出し、このαパラメータをフイルタ係数
とする全帯域LPCフイルタを構成する。また、
前述の低域側および高域側の短時間平均電力情報
と低域側および高域側のスペクトル包絡情報とよ
り全帯域予測残差電力を算出し、これを、前述の
全帯域LPCフイルタに励振信号を供給する全帯
域可変利得増幅器の利得制御信号として用いる。
一方、この全帯域可変利得増幅器の入力に用い
る音源情報を下記のようにして生成する。すなわ
ち、前述の実施例の低域側可変利得増幅器215
に供給すべき信号(すなわちライン2121また
はライン2170)を、いつたも、特定の低域側
帯域特性をもつ低域側音源帯域フイルタを通した
出力と、前述の実施例の高域側可変利得増幅器2
16に供給すべき信号(すなわちライン2140
またはライン2171)を、いつたん、特定の高
域側帯域特性をもつ高域側音源帯域フイルタを通
した出力とを加算により合成し、これを前述の全
帯域可変利得増幅器の入力音源情報として供給す
る。
上述のような方法をとることにより、各帯域の
Kパラメータ情報を周波数領域で合成するような
処理形式をとる実施例が得られる。なお、上述の
低域側音源帯域フイルタおよび高域側音源帯域フ
イルタの帯域特性を可変とし、これを復号化した
有声度表示信号(ライン2010)を用いて有声
度に応答して最適な帯域特性になるように制御す
ることもできる。
以上のように、本発明を用いると帯域分割型ボ
コーダの合成音を肉声の構造に近ずけ、自然性を
改善するという効果がある。
【図面の簡単な説明】
第1図は第(1)および第(2)の発明の一実施例の全
体の構成を示すブロツク図、第2図は前記実施例
の送信側の詳細を示すブロツク図、第3図は第(1)
の発明の前記実施例の受信側の詳細を示すブロツ
ク図、第4図は第(2)の発明の前記実施例の受信側
の詳細を示すブロツク図、第5図Aはピツチパル
ス列を、第5図Bは擬声帯波形列を、また第5図
Cは擬声帯波形をそれぞれ説明するためのタイム
チヤート、第6図は前記第4図に使用されている
音源切替/制御部217の動作を説明するための
図である。 図において、1……送信側、2……第(1)の発明
の実施例の受信側、2′……第(2)の発明の実施例
の受信側、3……伝送路、101……低域フイル
タおよびA/D変換器、102……ウインドウ処
理器、103……フーリエ変換器、104……パ
ワースペクトラムメモリ、105……低域側自已
相関係数計測器、106……低域側線形予測係数
分析器、107……高域側自已相関係数計測器、
108……高域側線形予測係数分析器、109…
…有声度計測器、110……ピツチ抽出器、11
1……符号化器、201……復号化器、202…
…低域側LPCフイルタ、203……低域側補間
器、204……低域側帯域フイルタ、205……
高域側LPCフイルタ、206……高域側補間器、
207……周波数変換器、208……高域側帯域
フイルタ、209……低域高域合成器、210…
…D/A変換器および低域フイルタ、211……
ピツチ発生器、212……擬声帯波形発生器、2
13……雑音発生器、214……可変合成器、2
15……低域側可変利得増幅器、216……高域
側可変利得増幅器、217……音源切替/制御
部。

Claims (1)

  1. 【特許請求の範囲】 1 入力音声信号を複数の音声伝送帯域に分割し
    それぞれの帯域について線形予測分析を行う帯域
    分割型ボコーダにおいて、予め定めた低群側の帯
    域に対しては制御された繰り返し周波数をもつ波
    形列を音源としまた予め定めた高群側の帯域に対
    しては前記制御された繰り返し周波数をもつ波形
    列と雑音とを前記入力音声信号の有声度に応じて
    合成し音源として音声合成を行う手段を有するこ
    とを特徴とする帯域分割型ボコーダ。 2 入力音声信号を複数の音声伝送帯域に分割し
    それぞれの帯域について線形予測分析を行う帯域
    分割型ボコーダにおいて、 前記入力音声信号の有声度が予め定めた中位の
    範囲にあるときは予め定めた低群側の帯域に対し
    ては制御された繰り返し周波数をもつ波形列を音
    源としまた予め定めた高群側の帯域に対しては前
    記制御された繰り返し周波数をもつ波形列と雑音
    とを合成し音源として音声合成を行ない、 前記有声度が前記中位の範囲よりも高い範囲の
    ときは前記低群側の帯域および前記高群側の帯域
    いずれに対しても前記制御された繰り返し周波数
    をもつ波形列を音源として音声合成を行ない、 前記有声度が前記中位の範囲よりも低い範囲の
    ときは前記低群側の帯域および前記高群側の帯域
    いずれに対しても前記制御された繰り返し周波数
    をもつ波形列と前記雑音とを合成し音源として音
    声合成を行なう手段を有する ことを特徴とする帯域分割型ボコーダ。
JP57095929A 1982-06-04 1982-06-04 帯域分割型ボコ−ダ Granted JPS58211797A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57095929A JPS58211797A (ja) 1982-06-04 1982-06-04 帯域分割型ボコ−ダ

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57095929A JPS58211797A (ja) 1982-06-04 1982-06-04 帯域分割型ボコ−ダ

Publications (2)

Publication Number Publication Date
JPS58211797A JPS58211797A (ja) 1983-12-09
JPH0229236B2 true JPH0229236B2 (ja) 1990-06-28

Family

ID=14150955

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57095929A Granted JPS58211797A (ja) 1982-06-04 1982-06-04 帯域分割型ボコ−ダ

Country Status (1)

Country Link
JP (1) JPS58211797A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2581696B2 (ja) * 1987-07-23 1997-02-12 沖電気工業株式会社 音声分析合成器

Also Published As

Publication number Publication date
JPS58211797A (ja) 1983-12-09

Similar Documents

Publication Publication Date Title
US5485543A (en) Method and apparatus for speech analysis and synthesis by sampling a power spectrum of input speech
KR100615480B1 (ko) 음성 대역 확장 장치 및 음성 대역 확장 방법
US7013270B2 (en) Determining linear predictive coding filter parameters for encoding a voice signal
EP1422693B1 (en) Pitch waveform signal generation apparatus; pitch waveform signal generation method; and program
US4776015A (en) Speech analysis-synthesis apparatus and method
US4991215A (en) Multi-pulse coding apparatus with a reduced bit rate
JPH0439679B2 (ja)
JPH10124089A (ja) 音声信号処理装置及び方法、並びに、音声帯域幅拡張装置及び方法
KR0155315B1 (ko) Lsp를 이용한 celp보코더의 피치 검색방법
Ferreira An odd-DFT based approach to time-scale expansion of audio signals
JPH08305396A (ja) 音声帯域拡大装置および音声帯域拡大方法
JPH0229236B2 (ja)
Sun Voice quality conversion in TD-PSOLA speech synthesis
JPH0229235B2 (ja)
JPS5850357B2 (ja) 音声分析合成装置
JPS5855992A (ja) 音声分析合成方式
JPS6087400A (ja) マルチパルス型音声符号復号化装置
JPS60260100A (ja) 音声合成器
JPWO2020171034A1 (ja) 音信号生成方法、生成モデルの訓練方法、音信号生成システムおよびプログラム
JPH08160993A (ja) 音声分析合成器
Crossman et al. Multipulse-excited channel vocoder
JPS61236600A (ja) パタンマツチングボコ−ダ
JPH0235998B2 (ja)
Saha et al. Comparison of Musical Pitch Analysis Between LPC and CELP
JPS593493A (ja) 帯域分割型ボコ−ダ