JP2674280B2 - 音声合成装置 - Google Patents

音声合成装置

Info

Publication number
JP2674280B2
JP2674280B2 JP2127282A JP12728290A JP2674280B2 JP 2674280 B2 JP2674280 B2 JP 2674280B2 JP 2127282 A JP2127282 A JP 2127282A JP 12728290 A JP12728290 A JP 12728290A JP 2674280 B2 JP2674280 B2 JP 2674280B2
Authority
JP
Japan
Prior art keywords
sound source
unit
vocal tract
information
phoneme
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2127282A
Other languages
English (en)
Other versions
JPH0421900A (ja
Inventor
謙二 松井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2127282A priority Critical patent/JP2674280B2/ja
Publication of JPH0421900A publication Critical patent/JPH0421900A/ja
Application granted granted Critical
Publication of JP2674280B2 publication Critical patent/JP2674280B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Electrophonic Musical Instruments (AREA)

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、テキストを音声に変換する音声合成装置に
関する。
従来の技術 音声合成方式には混在色々な方式が考案されており、
たとえば、LPC系のパラメータを用いたLSP、RARCOR、ケ
プストラム方式や、ターミナルアナログ系のホルマント
合成方式等である。この中でホルマント合成方式は人間
の発声機構に対して物理的な対応が最も良く、古くから
用いられている方式である。
第6図は従来例のホルマント音声合成方式の構成を示
すものである。ここでは簡単のため母音の合成のみを考
える。同図に於て、11は音源波生成部、12は共振器や反
共振器からなるホルマント合成部である。まず、音源波
生成部1で所望の基本周波数の音源波を合成する。現在
用いられている音源波モデルは、第6図に示すように、
連続したパルス列、あるいは自然音源波をまねた形状の
ものが用いられている。この音源信号がホルマント合成
部12に入力され声道の共振特性を付与されて合成音とし
て出力される。
この手法では、上記のような音源信号で取り扱える音
源情報は非常に少なく、ある程度以上の自然性は望むこ
とができない。自然な音源信号は、個人性、性別、年
齢、等の音声にとって非常に重要な情報を持っていると
言われている。然るに上記のような従来の音源モデルで
は重要な情報が大幅に欠落して合成器からの出力が機械
的な音声になるのが実情である。
発明が解決しようとする課題 本発明は上記のような従来例の欠点を鑑み、自然性の
高い合成音を出力できる技術を提供するものである。
課題を解決するための手段 本発明は、入力音声信号と入力信号の音素系列情報を
基に音素認識する音素認識部と、上記入力音声信号から
声道の共振特性を打ち消す作用をする白色化フィルタ部
と、上記白色化フィルタ部に接続され、且つ上記音素認
識部に接続されて白色化フィルタ部から得られる声道パ
ラメータ系列のうち音素認識部で得られた認識結果を基
にして各音素の声道パラメータを抽出する声道パラメー
タ抽出部と、上記声道パラメータ抽出部の出力である声
道パラメータ系列を格納する声道パラメータ格納部と、
上記白色化フィルタ部に接続された音源波形や基本周波
数の音源情報を抽出する音源情報抽出部と、抽出した音
源情報を格納する音源情報格納部と、上記音源情報格納
部の音源信号を用いて任意の長さの音源信号を再生する
音源信号再生部と、上記音源信号再生部の出力である音
源信号の基本周波数を制御する基本周波数制御部と、上
記基本周波数制御部の出力である音源信号の振幅、周波
数、位相情報に揺らぎを付与する揺らぎ制御部と、上記
揺らぎ制御部により揺らぎを付与された音源情報と上記
声道パラメータ格納部から出力される声道パラメータ情
報とを用いて音声合成処理を行う声道フィルタ部を具備
することを特徴とする音声合成装置である。
作 用 上記手段を用いることより、自然音源の持つきめ細か
な情報を失う事無く音声合成処理が行え高品質な音声が
得られる。
実施例 第1図は、自然音源の持つきめ細かな情報を失う事な
く高品質な音声合成処理を目的とした本発明の一実施例
における音声合成装置の構成を示すものである。
同図に於て、1は音源格納部、2は音源再生部、3は
基本周波数制御部、4は揺らぎ制御部、5は声道フィル
タ部である。
上記のように構成された本実施例の音声合成装置につ
いて以下その動作を説明する。ここでは簡単のため母音
の合成のみを考える。
音源格納部1には予め自然音声から声道の共振特性な
どを取り除いた音源信号のうち例えば基本周波数の一周
期分あるいは複数周期分が格納されている。音声合成を
行う場合、まず、音源再生部2が音源格納部1から必要
な一周期分または複数周期分の音源信号を取り出しその
波形を繰り返して次の基本周波数制御部3に送出する。
このとき音源信号の前端と後端を滑らかに接続する。こ
の接続方法の一例を説明する。第2図は、この波形接続
の一例を示したものである。音源波形をディジタル化し
S[i](i=1,2,...,N)とし、次の距離尺度D
(k)を定義する。
このD(k)を最小にする値kを算出し、i=0とi
=kの点を接続する。また、この距離は、 等も考えられる。
次に基本周波数制御部3で音源再生部2から出力され
た音源波を所望の基本周波数に変換する。この変換方法
は例えば音源信号をディジタル化し各サンプル点間を線
形補間する。第3図はこの線形補間の様子を示したもの
である。
次に揺らぎ制御部4で基本周波数制御部3から出力さ
れた音源信号に例えばランダムな振幅変調、位相変調、
周波数変調等を行い自然音声の持つ揺らぎを付加する。
この揺らぎ制御部4からの出力は声道フィルタ部5に入
力される。ここでは声道フィルタ部5としてホルマント
合成方式を例にとって考える。第4図はホルマント合成
による声道フィルタ部5の信号処理の様子を示したもの
である。ここでは所望の音韻の各ホルマント周波数に対
応する共振器が音源信号のスペクトルを変化させ合成音
として出力させる。
以上、説明したように本実施例によれば、自然音源を
効果的に利用し高品質な合成音を出力出来る。
次に、任意の音質で高品質な合成を行うことを目的と
した本発明の音声合成装置を説明する。例においても簡
単のため母音の合成のみを考える。
同図に於て、6は入力音声信号の各音素を認識する音
素認識部、7は白色化フィルタ部、8は声道パラメータ
抽出部、9は声道パラメータ格納部、10は音源情報抽出
部である。
先ず操作者が所望の音質を本合成装置に登録する場
合、操作者はその音質の自然音声を音素認識部6に入力
する。このとき、予め決められた母音系列を入力するよ
うにしておくと便利である。音素認識部6は入力された
音声から各母音の認識および各音素間の境界位置等の情
報を抽出する。一方、音素認識部6に入力されたものと
同じ信号を白色化フィルタ部7に入力する。白色化フィ
ルタ部7は、声道の共振特性を取り除く操作を行うと同
時にホルマント周波数等の声道パラメータの情報も算出
する。第5図では、例として各ホルマント周波数に対応
する反共振器が各ホルマントの共振特性を打ち消す場合
を示す。この白色化フィルタ部7の出力と音素認識部6
の出力から声道パラメータ抽出部8は各母音の定常部の
位置を検出し、次に、その母音の持つ各ホルマントの周
波数やバンド幅等の声道に関するパラメータを抽出し、
声道パラメータ格納部9に格納する。音源情報抽出部10
は白色化フィルタ部7の出力である声道特性を取り除か
れた信号のうち母音定常部の部分を代表的な音源波形と
して抽出し音源格納部1に格納する。
以上で所望の音質の音声を合成するための準備が完了
した。この後の合成の処理に関しては第1図で説明した
処理と同等であり、音源格納部1及び声道パラメータ格
納部9に格納された特定の音質に対応する情報により高
品質でかつ所望の声質に近い合成音が得られる。
以上説明したように本実施例によれば、特定の人の声
を分析してその特徴を格納することにより自然音源を利
用し高品質でかつ希望の声質の合成が可能になる。
発明の効果 以上のように本発明によれば、音源にパルスや単純な
モデルでなく、自然音声から取り出した音源波を繰り返
し用いる事により極めて自然性の高い合成音が得られ
る。
さらに、音源波が音声の個人性に大きく寄与している
ことから、この合成装置に音源波の抽出手段、声道パラ
メータの抽出手段等を付属させることにより任意の音質
での高品質な合成が実現できその実用的効果は大きい。
【図面の簡単な説明】
第1図は本発明の第1実施例における音声合成装置のブ
ロック図、第2図は本発明に於ける音源信号の接続の様
子を示す図、第3図は本実施例における音源信号の基本
周波数制御の様子を示す図、第4図は声道フィルタ部の
動作例を示す図、第5図は本発明の第2の実施例におけ
る音声合成装置のブロック図、第6図は従来の音声合成
装置のブロック図である。 1……音源格納部、2……音源再生部、3……基本周波
数制御部、4……揺らぎ制御部、5……声道フィルタ
部、6……音素認識部、7……白色化フィルタ部、8…
…声道パラメータ抽出部、9……声道パラメータ格納
部、10……音源情報抽出部、11……音源波生成部、12…
…ホルマント合成部。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】入力音声信号と入力信号の音素系列情報を
    基に音素認識する音素認識部と、上記入力音声信号から
    声道の共振特性を打ち消す作用をする白色化フィルタ部
    と、上記白色化フィルタ部に接続され、且つ上記音素認
    識部に接続されて白色化フィルタ部から得られる声道パ
    ラメータ系列のうち音素認識部で得られた認識結果を基
    にして各音素の声道パラメータを抽出する声道パラメー
    タ抽出部と、上記声道パラメータ抽出部の出力である声
    道パラメータ系列を格納する声道パラメータ格納部と、
    上記白色化フィルタ部に接続され音源波形や基本周波数
    の音源情報を抽出する音源情報抽出部と、抽出した音源
    情報を格納する音源情報格納部と、上記音源情報格納部
    の音源信号を用いて任意の長さの音源信号を再生する音
    源信号再生部と、上記音源信号再生部の出力である音源
    信号の基本周波数を制御する基本周波数制御部と、上記
    基本周波数制御部の出力である音源信号の振幅、周波
    数、位相情報に揺らぎを付与する揺らぎ制御部と、上記
    揺らぎ制御部により揺らぎを付与された音源情報と上記
    声道パラメータ格納部から出力される声道パラメータ情
    報とを用いて音声合成処理を行う声道フィルタ部を具備
    することを特徴とする音声合成装置。
JP2127282A 1990-05-16 1990-05-16 音声合成装置 Expired - Fee Related JP2674280B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2127282A JP2674280B2 (ja) 1990-05-16 1990-05-16 音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2127282A JP2674280B2 (ja) 1990-05-16 1990-05-16 音声合成装置

Publications (2)

Publication Number Publication Date
JPH0421900A JPH0421900A (ja) 1992-01-24
JP2674280B2 true JP2674280B2 (ja) 1997-11-12

Family

ID=14956118

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2127282A Expired - Fee Related JP2674280B2 (ja) 1990-05-16 1990-05-16 音声合成装置

Country Status (1)

Country Link
JP (1) JP2674280B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004049304A1 (ja) * 2002-11-25 2004-06-10 Matsushita Electric Industrial Co., Ltd. 音声合成方法および音声合成装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58168097A (ja) * 1982-03-29 1983-10-04 日本電気株式会社 音声合成装置
JPH0266600A (ja) * 1988-08-31 1990-03-06 Nec Corp 音声合成方式
JPH03144498A (ja) * 1989-10-30 1991-06-19 Ricoh Co Ltd 音源信号生成装置

Also Published As

Publication number Publication date
JPH0421900A (ja) 1992-01-24

Similar Documents

Publication Publication Date Title
JP2763322B2 (ja) 音声処理方法
Bonada et al. Synthesis of the singing voice by performance sampling and spectral models
JP2002328695A (ja) テキストからパーソナライズ化音声を生成する方法
JP4170217B2 (ja) ピッチ波形信号生成装置、ピッチ波形信号生成方法及びプログラム
JPH0677200B2 (ja) デジタル化テキストの音声合成用デジタルプロセッサ
JPH031200A (ja) 規則型音声合成装置
US5381514A (en) Speech synthesizer and method for synthesizing speech for superposing and adding a waveform onto a waveform obtained by delaying a previously obtained waveform
JPH0641557A (ja) 音声合成のための方法および装置
JP2001034280A (ja) 電子メール受信装置および電子メールシステム
Tang et al. Voice transformations: from speech synthesis to mammalian vocalizations.
JP2674280B2 (ja) 音声合成装置
JPH05307395A (ja) 音声合成装置
JP3394281B2 (ja) 音声合成方式および規則合成装置
JP2956069B2 (ja) 音声合成装置のデータ処理方式
JP3967571B2 (ja) 音源波形生成装置、音声合成装置、音源波形生成方法およびプログラム
JP2591289B2 (ja) 音声合成装置
JP2001100777A (ja) 音声合成方法及び装置
JP2580123B2 (ja) 音声合成装置
Yazu et al. The speech synthesis system for an unlimited Japanese vocabulary
Ferencz et al. The new version of the ROMVOX text-to-speech synthesis system based on a hybrid time domain-LPC synthesis technique
CN114974271A (zh) 一种基于声道滤波和声门激励的语音重构方法
JPS63285597A (ja) 音素接続形パラメ−タ規則合成方式
Cooke Audio Morphing Stuart Nicholas Wrigley 29 April 1998
JPH01211798A (ja) 音声の規則合成装置
JP2003173198A (ja) 音声辞書作成装置、音声合成装置、音声辞書作成方法、音声合成方法及びプログラム

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees