JPH03174199A - 音声合成装置 - Google Patents

音声合成装置

Info

Publication number
JPH03174199A
JPH03174199A JP1312269A JP31226989A JPH03174199A JP H03174199 A JPH03174199 A JP H03174199A JP 1312269 A JP1312269 A JP 1312269A JP 31226989 A JP31226989 A JP 31226989A JP H03174199 A JPH03174199 A JP H03174199A
Authority
JP
Japan
Prior art keywords
speech
voice
parameter
string
synthesized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1312269A
Other languages
English (en)
Other versions
JP2809769B2 (ja
Inventor
Shigetoshi Saito
成利 斉藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP1312269A priority Critical patent/JP2809769B2/ja
Publication of JPH03174199A publication Critical patent/JPH03174199A/ja
Application granted granted Critical
Publication of JP2809769B2 publication Critical patent/JP2809769B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的コ (産業上の利用分野) 本発明は自然性が高く聞き取り易い合成音声を生成する
ことのできる音声合成装置に関する。
(従来の技術) 優れたマンマシンインターフェースを実現する技術の1
つに音声合成装置がある。この音声合成の手法としては
従来より種々提唱されているが、中でも原理的に無限の
語堂(単語や文)に対する合成音声を生成可能な規則合
成法が注目されている。
この種の規則合成法による音声合成は、基本的には入力
文字列を触板してその音韻記号列と韻律情報とを求め、
音声素片ファイルを参照して上記音韻記号列から求めら
れる音声パラメータ列と前記韻律情報から求められる韻
律パラメータ列とに従って、予め定められた規則に基づ
いて音源生成やディジタルフィルタリング等の処理を施
すことにより前記入力文字列が示す合成音声を生成出力
するものである。従ってこのような規則合成法によれば
、任意の単語やフレーズの合成音声を容易に生成し得る
と云う利点がある。
然し乍ら、規則合成法により生成される合成音声は、一
般に自然音声に比較して了鯉度の点では高品質ではある
が、無声化する母音(無声化母音)を含む単語や文章を
規則合成するような場合、その音声パワーが不自然に変
化して聞き難くなり易いと云うl?:1題がある。つま
り無声化母音に対する音声パワーを適切に設定すること
が難しく、この結果、無声化母音を含む合成音声のパワ
ーが不自然に凹凸して聞き難くなると云う不具合がある
このような無声化母音を含む合成音声の不自然化の原因
の1つは、従来では専ら各種の音声素片に対する音声パ
ワーを成る条件の下で一義的に定めている点にある。こ
の為、例えばヘッドホンを通して聞く合成音声が聞き取
り易くても、これをスピーカを通して聞くと、そこに含
まれる無声化母音が非常に聞き取り難くなる等の問題が
生じている。
(発明が解決しようとする課題) このように従来にあっては、規則合成に供される各種の
音声素片の音声パワーを一義的に定めているので、成る
音声出力機器を通して聞く合成音声が聞き取り易くても
、その音声出力機器が変わると無声化母音に対する音声
パワーが不自然に変化して非常に聞き取り難くなると云
う不具合があった。
本発明はこのような事情を考慮してなされたもので、そ
の目的とするところは、音声出力機器に応じて常に聞き
取り易く自然性の高い合成音声を生成出力することので
きる音声合成装置を堤供することにある。
[発明の構成] (課題を解決するための手段) 本発明は、入力文字列を解析してg韻記号列と韻律情報
とを求める手段と、音声素片ファイルを参照して上記音
韻記号列から音声パラメータ列を生成する手段と、前記
韻律情報に従って韻律パラメータ列を生成する手段と、
この韻律パラメータ列と前記音声パラメータ列とに従っ
て音声を規則合成して出力する手段とを具備した音声合
成装置であって、 特に無声化母音の音声パラメータの生成時に前記音声素
片ファイルから求められる音声パワーを表すパラメータ
の値を、合成音声の出力対象機器に応じて変更する手段
を設けたことを特徴とするものである。
また或いは合成音声の出力対象機器に応じた複数種類の
無声化母音に対する音声素片を前記音声素片ファイルに
予め格納しておき、無声化母音の音声パラメータの生成
時には合成音声の音声出力機器に応じた音声素片を前記
音声素片ファイルから選択する手段を設けたことを特徴
とするものである。
(作 用) 本発明によれば、入力文字列を解析してその入力文字列
が示す合成音声を規則合成する際、そこに無声化母音が
含まれる場合には、音声出力機器に応じて上記無声化母
音に対する音声素片の音声パワーを表すパラメータの値
を変更するので、或いは音声出力機器に応じて予め求め
られている音声パワーのパラメータを持つ無声化母音の
音声素片を選択して音声パラメータ列を生成するので、
音声出力機器に応じた自然性の高い合成音声、つまり無
声化母音の音声パワーが不自然に変化することのない滑
らかで聞き取り易い合成音声を生成出力することが可能
となる。
(実施例) 以下、図面を参照して本発明の実施例に係る音声合成装
置について説明する。
第1図は第1の実施例を示す音声合成装置の要部概略構
成図である。第1図においてlは入力文字列を解析して
その音韻記号列と韻律情報とを求める文字列解析部であ
る。この文字列解析部1に与えられる文字列は、例えば
ホスト計算機の制御の下で生成された音声メツセージ情
報を示す文字コード列等からなる。
音声パラメータ列生成装置2は、上記文字列解析装置1
にて求められた入力文字列に対する音韻記号列を入力し
、音声素片ファイル3を参照して音声の規則合成に供さ
れる音声パラメータ列を生成する。また韻律パラメータ
生成装置4は上記文字列解析装置lにて求められた入力
文字列に対する韻律情報に基づいて音声の規ロリ合成に
供せられる韻律パラメータ列を生成する。このような音
韻パラメータ列および韻律パラメータ列を生成するに際
しては、適宜アクセント検定が行われて合成音声に対す
るアクセント情報が付加される。
音声合成器5はこのようにして求められた音韻パラメー
タ列および韻律パラメータ列に基づいて音源の生成とそ
の声道特性を近似したディジタルフィルタリング処理を
丈行し、前記入力文字列が示す合成音声を所定の規則に
従い音声合成し、これを所定の音声出力機器(ヘッドホ
ンやスピーカ等)に出力する。
しかしてこの実施例装置が特徴とするところは、パラメ
ータ変更部6を備えている点にある。このパラメータ変
更部Bは、前記音声素片ファイル3から読み出されて音
声パラメータの生成に用いられる音声素片の音声パワー
を表すパラメータを値を、音声出力機器の種別に応じて
変更するものである。
即ち、パラメータ変更部6は、前記文字列解析部1にて
入力文字列中に無声化母音が含まれることが検出された
°とさ、この無声化母音に対する音声パラメータを前記
音声素片ファイル3を参照して生成する際、音声木片フ
ァイル3から読み出されて音声パラメータ列生成装置2
に与えられる目音声素片の音声パワーを表すパラメータ
の値を変更するものである。
この無声化母音は[キ、り、シ、ス、チ、ツ。
ヒ、)、ビ、ブ]からなるもので、発声(音声合成)の
際に無声化する母音である。例えば[機城キカイ]にお
ける[キ]が発声(音声合成)の際に無声化する母音と
なる。
パラメータ変更部6は、このような無声化母音に対する
音声パラメータの生成時に、その時の音声出力機器の種
別に応じてその音声パワーを表すパラメータの値を変更
する。
具体的には第2図に示すように、例えばケプストラムパ
ラメータ[CO,C1,c 2.〜C25]の中の音声
パワーを表す0次の項のパラメータ[Co1の値から音
声出力機器の種別に応じて定まる一定の値αを減じ、そ
の音声出力機器の特性に応じたパラメータ[CO°コを
全てのフレームについてそれぞれ生成し、これを音声パ
ラメータ列生成装置2に与える。
尚、音声パワーを表すパラメータ[CG]以外のパラメ
ータ[CO,C1,C2,〜C25] 1:ツいテ!、
tそのまま音声パラメータ列生成装置2に与えられる。
このパラメータ変更部6における無声化母音についての
音声パワーを表すパラメータの値を変更による効果につ
いて説明すると、前述した[機城;キカイコなる出語を
規則合成法により音声合成する場合、一般にその音声出
力機器がスピーカであるかヘッドホンであるか、更には
電話回線を等して出力されるかによって上述した無声化
する母音[キ]の聞こえ方が違ってくる。
例えばスピーカを通して聞こえる合成音声の[機械;キ
カイ]なる単語が自然で、その無声化母音の音声パワー
が適切である場合、これをそのままヘッドホンを通して
聞くと上記無声化母音[キ]の部分が異常に大きく聞こ
え、不自然となる。逆にヘッドホンを通して聞こえる合
成音声の[機械;キカイコなる単語が自然で、その無声
化母音の音声パワーが適切である場合、これをそのまま
スピーカを通して聞くと上記無声化母音[キコの部分が
小さくな−り過ぎ、不自然に聞こえる。このような合成
音声の聞こえ方の違いは、音声出力機器の特性に起因す
るものであり、上述したスピーカやヘッドホンを通して
合成音声を出力する場合のみならず、これを電話回線を
介して転送して音声出力する場合にも、その転送・:1
)載持性の制限やノイズによる信号品質劣化、更にはハ
ンドセットによる月耳での聴取等の出力特性の異なりか
ら合成音声、特に無声化母音部分が違って聞こえる。
このような音声出力機器の種別の異なりに対処するべく
、前記パラメータ変更部6では無声化母音についての音
声パラメータの生成■3に、その音声出力機器に応じて
音声素片の音声パワーを示すパラメータの値を変更する
ものとなっている。
かくしてこのような機能を備えた実施例装置によれば、
音声出力機器に応じて無声化母音に対する音声素片の音
声パワーを示すパラメータの値を、その音声出力機器に
応じて変更するので、自然性が高く聞き取り易い合成音
声を効果的に生成することが可能となる。しかも音声素
片ファイル3に格納された音声素片の音声パワーを示す
パラメータの値を変更するだけで、非常に簡易にその合
成音声の出力制御を行うことができる。
ところで上述した第1の実施例では音声出力機器に応じ
て無声化母音に対する音声素片の音声パワーを示すパラ
メータの値を変更したが、例えば第3図に本発明の第2
の実施例を示すように、音声素片ファイル3として予め
音声出力機器の種別に対応した複数の素J4゛ファイル
を準備しておき、これを音声出力機器に応じて選択的に
用いるようにしても良い。
即ち、無声化母音を除く音声素片を格納した素片ファイ
ル3aと、音声出力機器に応じた音声素片を各別に格納
したヘッドホン用、スピーカー用。
電話口線用の無声化母音素片ファイル3b、3c、3d
をそれぞれ準備しておき、音声パラメータの生成時にフ
ァイル選択部7を介してこれらの音声素片ファイル3a
、〜3dを選択的に用いるようにする。
このように構成した場合には、ファイル選択部7は前記
文字列角り折部lによる入力文字列の解析結果に従って
無声化母音を除く音声素片ファイル3aの選択と、無声
化母音については音声出力機器に応じた無声化母音素片
ファイル3b、3c、adの選択とを行うことになる。
このようなファイル選択により前述した第1の実施例と
同様な効果が奏せられる。
尚、本発明は上述した実施例に限定されるものではない
。例えば音声木片のパラメータとしては、前述したケプ
ストラムパラメータのみならず、LPGパラメータやP
ARCORパラメータ。
LSPパラメータ、ホルマントパラメータ等を、その音
声合成の仕様に応じて適宜採用nJ能である。
まだ第1の実施例では、無声化母音に対する音声素片の
音声パワーを示すパラメータの値を音声出力機器に応じ
て定められる一定の値を減算してその音声出力機器の特
性に応じたパラメータを生成したが、音声素片ファイル
3に格納されている基中となる音声素片によっては、一
定の値を加算するようにしても良く、或いは成る係数を
乗算処理してそのパラメータの変更を行うことも可能で
ある。つまり音声素片ファイル3に格納される音声素片
は、例えば種々の音声出力機器に対する合成音声の出力
視聴によるプリレファレンス等によって設定されるが、
そのときに定める音声素片に応じてパラメータ変更の為
の係数等を定めておけば良いものである。
また特にヘッドホンを等して合成音声を出力するような
場合には、ヘッドホンからの音声が直接的に耳に伝達さ
れ、耳による聴取特性の個人羞が大きいことから、マニ
ュアル的に任意に無声化母音に対する音声パワーを設定
可能とする手段を設けておくことも好ましい。その他、
音声出力機器の設定については、音声合成装置の利用分
野毎にその初期設定時にプリセット的に定めることも一
1能であるが、音声合成時にその都度指定し得るように
することも可能である。その他、本発明はその要旨を逸
脱しない範囲で種々変形して実施することができる。
[発明の効果] 以上説明したように本発明によれば、無声化母音を含む
合成音声を生成する際、その無声化母音の音声素片にお
ける音声パワーを表すパラメータの値を音声出力機器に
応じて変更するので、どのような種別の音声出力機器を
用いる場合でも、聞き取り易く、自然性の高い合成音声
を出力することができる等の実用上多大なる効果が奏せ
られる。
【図面の簡単な説明】
第1図は本発明の一実施例に係る音声合成装置の要部概
略構成図、第2図は第1図に示す実施例装置における無
声化母音の音声素片における音声パワーを表すパラメー
タの値の変更処理の概念を示す図、第3図は本発明の別
の実施例に係る音声合成装置の要部概略構成図である。 l・・・文字列解析部、2・・・音声パラメータ列生成
装置、3・・・音声素片ファイル、3a・・・無声化母
音を除く音声素片ファイル、3b・・・ヘッドホン用無
声化母音素片ファイル、3C・・・スピーカ用無声化母
音素片ファイル、3d・・・電話回線用無声化母音素片
ファイル、4・・・韻律パラメータ列生成装置、5・・
・音声合成器、6・・・パラメータ変更部、7・・・フ
ァイル選択部。

Claims (2)

    【特許請求の範囲】
  1. (1)入力文字列を解析して音韻記号列と韻律情報とを
    求める手段と、音声素片ファイルを参照して上記音韻記
    号列から音声パラメータ列を生成する手段と、前記韻律
    情報に従って韻律パラメータ列を生成する手段と、この
    韻律パラメータ列と前記音声パラメータ列とに従って音
    声を規則合成して出力する手段とを具備した音声合成装
    置において、 無声化母音の音声パラメータの生成時に前記音声素片フ
    ァイルから求められる音声パワーを表すパラメータの値
    を合成音声の出力対象機器に応じて変更する手段を設け
    たことを特徴とする音声合成装置。
  2. (2)入力文字列を解析して音韻記号列と韻律情報とを
    求める手段と、音声素片ファイルを参照して上記音韻記
    号列から音声パラメータ列を生成する手段と、前記韻律
    情報に従って韻律パラメータ列を生成する手段と、この
    韻律パラメータ列と前記音声パラメータ列とに従って音
    声を規則合成して出力する手段とを具備した音声合成装
    置において、 合成音声の出力対象機器に応じた複数種類の無声化母音
    に対する音声素片を前記音声素片ファイルに予め格納し
    ておき、無声化母音の音声パラメータの生成時には合成
    音声の音声出力機器に応じた音声素片を前記音声素片フ
    ァイルから選択する手段を設けたことを特徴とする音声
    合成装置。
JP1312269A 1989-12-02 1989-12-02 音声合成装置 Expired - Fee Related JP2809769B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1312269A JP2809769B2 (ja) 1989-12-02 1989-12-02 音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1312269A JP2809769B2 (ja) 1989-12-02 1989-12-02 音声合成装置

Publications (2)

Publication Number Publication Date
JPH03174199A true JPH03174199A (ja) 1991-07-29
JP2809769B2 JP2809769B2 (ja) 1998-10-15

Family

ID=18027210

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1312269A Expired - Fee Related JP2809769B2 (ja) 1989-12-02 1989-12-02 音声合成装置

Country Status (1)

Country Link
JP (1) JP2809769B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008020840A (ja) * 2006-07-14 2008-01-31 Sharp Corp 音声合成装置、音声合成方法およびコンピュータを音声合成装置として機能させるためのプログラム、ならびに、フィルタ生成装置、フィルタ生成方法およびコンピュータをフィルタ生成装置として機能させるためのプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008020840A (ja) * 2006-07-14 2008-01-31 Sharp Corp 音声合成装置、音声合成方法およびコンピュータを音声合成装置として機能させるためのプログラム、ならびに、フィルタ生成装置、フィルタ生成方法およびコンピュータをフィルタ生成装置として機能させるためのプログラム

Also Published As

Publication number Publication date
JP2809769B2 (ja) 1998-10-15

Similar Documents

Publication Publication Date Title
Ladefoged Elements of acoustic phonetics
EP1213704A2 (en) Speech synthesis apparatus and method
US6826530B1 (en) Speech synthesis for tasks with word and prosody dictionaries
JP2005070430A (ja) 音声出力装置および方法
JP4564416B2 (ja) 音声合成装置および音声合成プログラム
JP3518898B2 (ja) 音声合成装置
AU769036B2 (en) Device and method for digital voice processing
JPH0419799A (ja) 音声合成装置
JPH03174199A (ja) 音声合成装置
JP2005286876A (ja) 環境音提示装置及び補聴器調整装置
EP1543497A1 (en) Method of synthesis for a steady sound signal
Olive et al. Rule‐synthesis of speech by word concatenation: a first step
KR100812770B1 (ko) 화이트 노이즈를 이용한 배속 나레이션 음성신호 제공 방법및 장치
CA2436606A1 (en) Improved speech transformation system and apparatus
JP2007256815A (ja) 音声再生装置、音声再生方法、音声再生プログラム
JP5925493B2 (ja) 会話保護システム及び会話保護方法
JPH08171395A (ja) 音声合成装置
JP3241582B2 (ja) 韻律制御装置及び方法
JP2014085403A (ja) 英語学習装置、方法及び記録媒体
JP2016206591A (ja) 語学学習用コンテンツ配信システム、語学学習用コンテンツ生成装置、および、語学学習用コンテンツ再生プログラム
JPH05173587A (ja) 音声合成装置
JP4297433B2 (ja) 音声合成方法及びその装置
JP5782751B2 (ja) 音声合成装置
JPS6367400B2 (ja)
JP2004157238A (ja) 携帯端末

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees