JPS59157698A - 音声合成装置 - Google Patents
音声合成装置Info
- Publication number
- JPS59157698A JPS59157698A JP58032011A JP3201183A JPS59157698A JP S59157698 A JPS59157698 A JP S59157698A JP 58032011 A JP58032011 A JP 58032011A JP 3201183 A JP3201183 A JP 3201183A JP S59157698 A JPS59157698 A JP S59157698A
- Authority
- JP
- Japan
- Prior art keywords
- speech
- frame
- unvoiced
- residual waveform
- sound source
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
この発明は単語よシ小さい音声単位を記憶しておき、そ
れらを仮名文字列やアクセント位置等の入力情報によっ
て順次結合して任意の単語や文章の音声信号を合成する
法則合成による音声合成装置に関するものでちる。
れらを仮名文字列やアクセント位置等の入力情報によっ
て順次結合して任意の単語や文章の音声信号を合成する
法則合成による音声合成装置に関するものでちる。
〈背 景〉
従来単語よシ小さい音声単位を、音声の特徴を表わすパ
ラメータにして記憶しておき、それらを結合して任意の
単語音声信号を合成する法則合ぼ方式による音声合成方
式が知られている。この方式における合成フィルタを駆
動する音源情報としては有声音フレーム(区間)ではパ
ルスが、無声音区間(フレーム)では白色雑音がそれぞ
れ用いられていた(従来方式1とする)。この方式では
無声音フレームでは一律に白色雑音駆動を合成フィルタ
に対して行なっているため、無声音フレームの音韻性が
あいまいとなシ、異聴の原因ともなってお一シ合成音声
の明瞭性や自然性に関して大幅な品質の向上は難かしか
った。
ラメータにして記憶しておき、それらを結合して任意の
単語音声信号を合成する法則合ぼ方式による音声合成方
式が知られている。この方式における合成フィルタを駆
動する音源情報としては有声音フレーム(区間)ではパ
ルスが、無声音区間(フレーム)では白色雑音がそれぞ
れ用いられていた(従来方式1とする)。この方式では
無声音フレームでは一律に白色雑音駆動を合成フィルタ
に対して行なっているため、無声音フレームの音韻性が
あいまいとなシ、異聴の原因ともなってお一シ合成音声
の明瞭性や自然性に関して大幅な品質の向上は難かしか
った。
この点を改良する方法として音声信号を線形予測分析し
た後のスペクトル微細構造を有している残差波形の利用
が提案され(従来方式2とする)−。
た後のスペクトル微細構造を有している残差波形の利用
が提案され(従来方式2とする)−。
明瞭性や自然性の向上がはかられている。しかしこれは
残差波形がパルス状に近くピッチ制御が容易な男声には
適用できるが、減衰の小さい残差波形を有する女声には
適用が難しい。また有声音フレーム、無声音フレームと
も残差波形を記憶しておくため記憶容量が増大する。さ
らに有声音フレームでは1ピッチ分の残差波形を切シ出
さねばならない。現在残差波形から1ピッチ分の波形を
自動的に精度良く切シ出す方法は確立されておらず、人
手によっているため多大の労力が費されるという欠点を
有していた。
残差波形がパルス状に近くピッチ制御が容易な男声には
適用できるが、減衰の小さい残差波形を有する女声には
適用が難しい。また有声音フレーム、無声音フレームと
も残差波形を記憶しておくため記憶容量が増大する。さ
らに有声音フレームでは1ピッチ分の残差波形を切シ出
さねばならない。現在残差波形から1ピッチ分の波形を
自動的に精度良く切シ出す方法は確立されておらず、人
手によっているため多大の労力が費されるという欠点を
有していた。
〈発明の概要〉
この発明の目的はこれらの欠点を除去し、さらに明瞭性
を維持するために有声音フレームはパルスで駆動し、1
sh1.!sl’、lIなど明瞭性に大きな効果のある
無声音フレームは分析時の残差波形で駆動することを特
徴とした音声合成装置を提供することにある。
を維持するために有声音フレームはパルスで駆動し、1
sh1.!sl’、lIなど明瞭性に大きな効果のある
無声音フレームは分析時の残差波形で駆動することを特
徴とした音声合成装置を提供することにある。
〈従来技術〉
以下図面を用いて詳しく説明する。
第1図は従来方式1を示す機能ブロック図である。入力
端子11からの仮名文字やアクセント位置などの入力情
報は前処理部12に入力され、これらの情報から結合す
べき音声単位列及びピッチ周波数列、時間長系列などの
韻律情報が設定される。音声単位結合部13において前
処理部12からの前記音声単位列によシ音声単位ファイ
ル14から順次音声単位パラメータを読出し、前記韻律
情報によってピッチ時間長等を制御して音声単位パラメ
ータを結合する。音声合成部15は音源信号と声道情報
とから音声信号を合成する部分であって、順次音声単位
結合部13から送られてくる音声単位パラメータをみて
有声音フレームであれば音源信号としてパルス生成部1
6よシビッチ周期毎にパルスを取込み、無声音フレーム
であれば雑音生成部17よシ雑音を取込んで音声合成デ
ィジタルフィルタへ入力し、かつ前記パラメータによシ
そのフィルタの定数(特性)を制御して音声合成を行な
う。その合成音声信号を出力端子18へ出力する。
端子11からの仮名文字やアクセント位置などの入力情
報は前処理部12に入力され、これらの情報から結合す
べき音声単位列及びピッチ周波数列、時間長系列などの
韻律情報が設定される。音声単位結合部13において前
処理部12からの前記音声単位列によシ音声単位ファイ
ル14から順次音声単位パラメータを読出し、前記韻律
情報によってピッチ時間長等を制御して音声単位パラメ
ータを結合する。音声合成部15は音源信号と声道情報
とから音声信号を合成する部分であって、順次音声単位
結合部13から送られてくる音声単位パラメータをみて
有声音フレームであれば音源信号としてパルス生成部1
6よシビッチ周期毎にパルスを取込み、無声音フレーム
であれば雑音生成部17よシ雑音を取込んで音声合成デ
ィジタルフィルタへ入力し、かつ前記パラメータによシ
そのフィルタの定数(特性)を制御して音声合成を行な
う。その合成音声信号を出力端子18へ出力する。
この方式は処理内容が簡単であるが、音源信号をパルス
と雑音とでモデル化しているため明瞭性が低いという欠
点があった。
と雑音とでモデル化しているため明瞭性が低いという欠
点があった。
従来方式2では第2図に示すように入力情報は前処理部
12、音声単位結合部13及び音声単位ファイル14に
よシ従来方式1と同様に処理される。音声合成部15に
おいては有声音フレームであれば、分析時に得られる残
差波形から1ピッチ分の残差波形を残差波形ピッチ制御
部19において0づめ又は打切シ等によシ伸縮操作を施
した残差波形を用い、無声音フレームであれば残差波形
をそのまま使用している。これらの残差波形は残差波形
ファイル21に記憶されである。
12、音声単位結合部13及び音声単位ファイル14に
よシ従来方式1と同様に処理される。音声合成部15に
おいては有声音フレームであれば、分析時に得られる残
差波形から1ピッチ分の残差波形を残差波形ピッチ制御
部19において0づめ又は打切シ等によシ伸縮操作を施
した残差波形を用い、無声音フレームであれば残差波形
をそのまま使用している。これらの残差波形は残差波形
ファイル21に記憶されである。
この方χは明瞭性は向上するが前記の残差波形のピッチ
制御が必要となり処理量が増大し、さらにピッチ制御が
難しい女声への適用は困難となる。
制御が必要となり処理量が増大し、さらにピッチ制御が
難しい女声への適用は困難となる。
〈実施例〉−
第3図はこの発明による音声合成装置の一例を示し、入
力情報は前処理部12、音声単位結合部13及び音声単
位ファイル14によシ従来方式と同様に処理される。音
声合成部15において音源信号として有声音フレームで
あればパルス生成部16よシピツチ周期毎にパルスを取
込み、無声音フレームであれば残差波形ファイル21か
らの残差波形をそのまま使用し、音声単位結合部13よ
シ送られてくる音声単位パラメータによシ制御されるデ
ィジタルフィルタによって音声信号を合成する。
力情報は前処理部12、音声単位結合部13及び音声単
位ファイル14によシ従来方式と同様に処理される。音
声合成部15において音源信号として有声音フレームで
あればパルス生成部16よシピツチ周期毎にパルスを取
込み、無声音フレームであれば残差波形ファイル21か
らの残差波形をそのまま使用し、音声単位結合部13よ
シ送られてくる音声単位パラメータによシ制御されるデ
ィジタルフィルタによって音声信号を合成する。
〈効 果〉
第4図に従来方式1、従来方式2及びこの発明装置によ
シそれぞれ合成された音声の明瞭度を示す。実験サンプ
ルは男性の発声した拗音を除<67音節番用いている。
シそれぞれ合成された音声の明瞭度を示す。実験サンプ
ルは男性の発声した拗音を除<67音節番用いている。
従来方式1に比べこの発明装置は大きな明瞭度の改善が
みられる。また従来方式2と比べてもそれほど大きな差
はない。
みられる。また従来方式2と比べてもそれほど大きな差
はない。
第5図に個別音韻正聴率を示す。第5図において曲線2
2は従来方式1、曲線23は従来方式2、曲線24はこ
の発明装置にそれぞれ対するものである。第5図より従
来方式1で特に異聴をおこしやすいltl、lkl、l
sl、1tsI等の無声音フレームの多い音韻の明瞭性
がこの発明装置では太きく向上し無声音フレームに残差
波形を用いた効果があられれている。
2は従来方式1、曲線23は従来方式2、曲線24はこ
の発明装置にそれぞれ対するものである。第5図より従
来方式1で特に異聴をおこしやすいltl、lkl、l
sl、1tsI等の無声音フレームの多い音韻の明瞭性
がこの発明装置では太きく向上し無声音フレームに残差
波形を用いた効果があられれている。
次に音声単位ファイル作成に費やす労力を考えると、こ
の発明装置では音声単位の切シ出しに人手を要するが、
それ以後はほぼ自動的にファイル作成ができ、従来方式
1と伺等の労力で済む。しかし従来方式2では有声音フ
レームで1ピッチ分の残差波形の切シ出しを行なわねば
ならず、そのための労力は膨大なものとなる。また残差
波形の記憶容量についてもこの発明装置では無声音フレ
ームだけ残差波形を蓄えておくためそれほど大きくない
。無声音フレームは音声全体に比べると高々数10分の
1であるため実現性は高い。音声合成時の音源信号とし
てパルスか残差波形かを選択するだめの音源選択情報は
音声単位ツーアイル中に割当ててもよいし、ピッチ情報
が0であるか否かを判別することによつ七も実現できる
。
の発明装置では音声単位の切シ出しに人手を要するが、
それ以後はほぼ自動的にファイル作成ができ、従来方式
1と伺等の労力で済む。しかし従来方式2では有声音フ
レームで1ピッチ分の残差波形の切シ出しを行なわねば
ならず、そのための労力は膨大なものとなる。また残差
波形の記憶容量についてもこの発明装置では無声音フレ
ームだけ残差波形を蓄えておくためそれほど大きくない
。無声音フレームは音声全体に比べると高々数10分の
1であるため実現性は高い。音声合成時の音源信号とし
てパルスか残差波形かを選択するだめの音源選択情報は
音声単位ツーアイル中に割当ててもよいし、ピッチ情報
が0であるか否かを判別することによつ七も実現できる
。
以上説明したようにこの発明は音源情報に有声音フレー
ムはパルス、無声音フレームは残差波形を用いることに
より明瞭性、自然性を損うことなくファイル作成の労力
及び時間の短縮、女声への適用などが可能となシ効果は
大きい。
ムはパルス、無声音フレームは残差波形を用いることに
より明瞭性、自然性を損うことなくファイル作成の労力
及び時間の短縮、女声への適用などが可能となシ効果は
大きい。
第1図及び第2図はそれぞれ従来の法則合成方式を示す
機能ブロック図、第3図はこの発明による音声合成装置
の一例を示す機能ブロック図、第4図は従来方式1、従
来方式2とこの発明装置との音節明瞭度を示す図、第5
図はその場合の個別音韻正聴率を示す図である。 11:入力端子、12:前処理部、13:音節単位結合
部、14:音声単位ファイル、15:音声合成部、1′
6:パルス生成部、17:雑音生成部、18:出力端子
、19:残差波形ピッチ制御部、21:残差波形ファイ
ル。 特許出願人 日本電信電話公社 代 理 人 草 野 卓オ 1vA オ 2 図 才3図 14図 ;j−5°図 漬
機能ブロック図、第3図はこの発明による音声合成装置
の一例を示す機能ブロック図、第4図は従来方式1、従
来方式2とこの発明装置との音節明瞭度を示す図、第5
図はその場合の個別音韻正聴率を示す図である。 11:入力端子、12:前処理部、13:音節単位結合
部、14:音声単位ファイル、15:音声合成部、1′
6:パルス生成部、17:雑音生成部、18:出力端子
、19:残差波形ピッチ制御部、21:残差波形ファイ
ル。 特許出願人 日本電信電話公社 代 理 人 草 野 卓オ 1vA オ 2 図 才3図 14図 ;j−5°図 漬
Claims (1)
- (1)゛単語より小さい音声単位を結合して任意の単語
や文章等の音声信号を生成する法則合成方式による音声
合成装置において、音源信号としてパルスを発生するパ
ルス発生手段と、無声音に対す分析残差波形を記憶する
記憶手段と、合成フレームが有声音フレームか無声音フ
レームかを判別する判別手段と、その判別手段が有声音
フレームと判別すると上記パルス発生手段よりのパルス
をピッチ情報にもとすきパルス列として発生して音源信
号とし、無声音フレームと判別すると上記記憶手段の残
差波形を音源信号とする手段とを有することを特徴とす
る音声合成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58032011A JPS59157698A (ja) | 1983-02-28 | 1983-02-28 | 音声合成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58032011A JPS59157698A (ja) | 1983-02-28 | 1983-02-28 | 音声合成装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS59157698A true JPS59157698A (ja) | 1984-09-07 |
Family
ID=12346924
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP58032011A Pending JPS59157698A (ja) | 1983-02-28 | 1983-02-28 | 音声合成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS59157698A (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS576898A (en) * | 1980-06-13 | 1982-01-13 | Nippon Electric Co | Voice synthesizer |
JPS5722297A (en) * | 1980-07-15 | 1982-02-05 | Matsushita Electric Works Ltd | Voice synthesizing system |
-
1983
- 1983-02-28 JP JP58032011A patent/JPS59157698A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS576898A (en) * | 1980-06-13 | 1982-01-13 | Nippon Electric Co | Voice synthesizer |
JPS5722297A (en) * | 1980-07-15 | 1982-02-05 | Matsushita Electric Works Ltd | Voice synthesizing system |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS62160495A (ja) | 音声合成装置 | |
JPH031200A (ja) | 規則型音声合成装置 | |
JPH0632020B2 (ja) | 音声合成方法および装置 | |
EP0561752B1 (en) | A method and an arrangement for speech synthesis | |
Acero | Source-filter models for time-scale pitch-scale modification of speech | |
JP5175422B2 (ja) | 音声合成における時間幅を制御する方法 | |
JPH05307395A (ja) | 音声合成装置 | |
JP2002525663A (ja) | ディジタル音声処理装置及び方法 | |
JPS59157698A (ja) | 音声合成装置 | |
JP3394281B2 (ja) | 音声合成方式および規則合成装置 | |
JP3081300B2 (ja) | 残差駆動型音声合成装置 | |
JPS5914752B2 (ja) | 音声合成方式 | |
JP3113101B2 (ja) | 音声合成装置 | |
JPH02293900A (ja) | 音声合成装置 | |
JP2809769B2 (ja) | 音声合成装置 | |
JP3241582B2 (ja) | 韻律制御装置及び方法 | |
JPH11161297A (ja) | 音声合成方法及び装置 | |
JPS63262699A (ja) | 音声分析,合成装置 | |
JPH01118200A (ja) | 音声合成方式 | |
JPH04233597A (ja) | 音声規則合成装置 | |
JPH01244499A (ja) | 音声素片ファイル作成装置 | |
JPS60153099A (ja) | 規則型音声合成装置 | |
Morton | Naturalness in synthetic speech | |
JPS58162998A (ja) | 音声合成方式 | |
JPS63131191A (ja) | 規則型音声合成装置 |