JPH0756589A - 音声合成方法 - Google Patents

音声合成方法

Info

Publication number
JPH0756589A
JPH0756589A JP5207491A JP20749193A JPH0756589A JP H0756589 A JPH0756589 A JP H0756589A JP 5207491 A JP5207491 A JP 5207491A JP 20749193 A JP20749193 A JP 20749193A JP H0756589 A JPH0756589 A JP H0756589A
Authority
JP
Japan
Prior art keywords
voice
speech
prosody
voices
synthesized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5207491A
Other languages
English (en)
Inventor
Tomohisa Hirokawa
智久 広川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP5207491A priority Critical patent/JPH0756589A/ja
Publication of JPH0756589A publication Critical patent/JPH0756589A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 音声属性による区分化種別を無音、無声、有
声の三種に限定した区分化精度のよい音声合成方法を提
供する。 【構成】 合成されるべき音声に対応する音声を音声入
力部11に入力し、入力された音声を音声分析・区分化
部13において分析してその音声属性に従って当該入力
音声を区分化し、区分化された音声からその韻律特性を
韻律特性抽出部14において抽出し、抽出された韻律特
性に基づいて規則により設定された合成音声の時間長、
パワーその他の韻律特性を変更し、所望の韻律を有する
音声を合成する音声合成方法において、音声属性による
区分化種別を無音、無声、有声の三種とする音声合成方
法。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、音声合成方法に関
し、特に、入力音声から韻律特性を抽出し、この抽出さ
れた韻律特性に基づいて規則により設定された合成音声
の韻律特性を変更する音声合成方法に関する。
【0002】
【従来の技術】この種の音声合成方法の従来例について
説明する。従来、音声を使用するサービスにおいては、
予め決められた既に記憶されている音声断片を使用し、
これらを編集して音声メッセージを作成する「編集によ
る音声合成方法」が開発されている。しかし、この「編
集による音声合成方法」はサービスの種類、内容が自ず
と限定され、また音声応答用の音声メッセージの作成に
も、音声収録からメッセージ作成に到るまで多大の労力
を必要とし、更に、同一のアナウンサーに依らなければ
ならないという欠点を有していた。これらの問題を解決
するために、日本語文章を音声に変換する「規則による
音声合成方法」が提案されている。この方法によれば、
出力音声に制限はなく、同一アナウンサーを確保しなけ
ればならないという問題は解決されるが、規則に基づい
て音声を合成しているため、イントネーション、音声合
成に使用する単位音声のパワー、時間長その他の韻律特
性を任意に変更することが難しく、合成された音声の不
自然に聞こえるところの韻律特性の修正、所望する韻律
特性を有する音声メッセージを得ることは困難であっ
た。また、上述の韻律特性の変更を容易にするためにこ
れをディスプレイ上に図形の形で表示し、マウスその他
のポインティング機器により視覚的に変更作業を行い、
合成音声による確認を行いながら音声メッセージを作成
するという提案もなされている。しかし、この作業は聴
覚的に不自然な箇所を見い出し、図形上において視覚的
に韻律特性に修正を加えるというものであるところか
ら、経験と音声学的な知見とを必要とされる作業であ
り、通常のオペレータには困難な作業であった。しか
も、適用されるサービスによっては独特のイントネーシ
ョン、音の高さおよび強さを必要とする場合があり、デ
ィスプレイ上の修正はこれには殆ど対処することができ
なかった。
【0003】
【発明が解決しようとする課題】上述の如き問題を解決
するために、合成しようとする音声メッセージと同一の
音声をオペレータが入力し、入力された音声の韻律情報
のみを音声合成に利用することが考えられる。即ち、合
成音質はそのまま維持し、イントネーションその他の韻
律情報をオペレータの発声した音声の韻律情報に合わせ
る方法である。しかし、この場合、オペレータによる入
力音声の韻律特性の抽出が充分に精度良く行なわれなけ
れば合成音声の品質は向上しない。現状の音声区分化技
術は音声合成に使用する単位音声の区分化までを充分な
精度で自動的に行うことは困難である。
【0004】この発明は、入力された音声を充分精度良
く自動的に区分化し、区分化された音声のそれぞれから
その韻律特性を抽出し、抽出された韻律特性に基づいて
規則により設定された合成音声の韻律特性を変更する音
声合成方法を提供するものである。
【0005】
【課題を解決するための手段】合成されるべき音声に対
応する音声を音声入力部11に入力し、入力された音声
を音声分析・区分化部13において分析してその音声属
性に従って当該入力音声を区分化し、区分化された音声
からその韻律特性を韻律特性抽出部14において抽出
し、抽出された韻律特性に基づいて規則により設定され
た合成音声の時間長、パワーその他の韻律特性を変更
し、所望の韻律を有する音声を合成する音声合成方法に
おいて、音声属性による区分化種別を無音、無声、有声
の三種とする音声合成方法を構成した。
【0006】
【実施例】この発明の音声合成方法の実施例を図1を参
照して説明する。先ず、合成しようとする音声メッセー
ジに変換されるべき漢字カナ混じり文字情報である日本
語テキストが日本語テキスト入力部1に入力される。こ
の入力情報は、次いで音声合成情報変換部2において変
換処理が施され、文節の区切り記号、カナ読み列情報、
アクセント情報に変換され、カナ読み列は更に音声合成
に使用する単位音声を表す記号列に分解される。そし
て、韻律特性設定部3においてはアクセント情報、区切
り記号に基づいて規則により各単位音声の時間長、パワ
ー、ピッチ周波数その他の韻律特性が設定される。これ
らの情報は音声合成部4において音声合成処理されて合
成音声が作成される。
【0007】合成音声メッセージの品質が充分ではない
場合、音声合成情報には韻律情報修正部10においてオ
ペレータの操作により修正が加えられる。この際、オペ
レータの修正操作により所望の韻律特性を得ることが困
難な場合が往々にしてある。特に、合成音声メッセージ
は不自然であるものと感知することはできるが、不自然
にしている原因は何処にあるのかを的確に把握し、適切
な修正を施すことが困難な場合は、オペレータ自身が音
声を入力し、この入力された音声の韻律特性を抽出して
これに基づいて規則により設定された合成音声の韻律特
性を変更すると好適であることが判っている。
【0008】ここで、オペレータは合成しようとしてい
る音声メッセージと同一の音声を所望の韻律により発声
してこれを音声入力部11により入力し、音声信号切り
出し部12において入力された音声について音声部分の
切り出し処理を行なう。音声信号の切り出し処理は入力
信号の先頭から短時間電力を計算し、当該電力値がある
閾値を超えたところで音声の始端と判断し、同様に入力
信号の後尾から短時間電力を計算し、閾値を超えたとこ
ろで音声の終端と判断するものである。切り出された音
声信号は、音声分析・区分化部13において大まかに無
音、無声、有声の三種のカテゴリーに区分化処理され
る。音声分析処理においては、音声区分化に必要なパラ
メータ、例えば短時間パワー、零交差数、分析残差信号
相関係数、ケプストラム係数差分、高域/低域周波数成
分比を一定時間毎に計算する。この一定時間をフレーム
長と呼び、通常一定の波形が保たれていると考えられる
30msecで分析する。この様な音声分析を一定時間
毎シフトしながら、切り出し音声全体に対して実行す
る。この一定時間の時間シフトをフレームシフトと呼
び、通常5msecに設定される。音声区分化において
は、上述の分析パラメータを参照して入力音声を上述の
三種のカテゴリーに区分化する。フレームシフトが5m
secの場合、区分化精度は5msecになるが、抽出
した韻律特性による音声合成を考慮すれば、5msec
の精度は聴覚的に充分満足するものである。
【0009】無音部と有音部の切り分けは、短時間パワ
ー値、および音声区間切り出しに使用した閾値を参照し
て容易に行うことができる。有音部における有声部と無
声部の切り分けは、零交差数、分析残差信号相関係数、
高域/低域周波数成分比その他のパラメータを単独に、
或はこれらを複数組み合わせて使用することにより充分
な精度で実施することができる。入力波形について三種
の区分化を行った音声の例を模式的に示すと、図2の如
くになる。
【0010】韻律特性抽出部14においては、規則によ
り設定された合成音声の韻律特性の変更に使用される韻
律特性を、区分化された音声信号から抽出する処理を行
う。韻律特性抽出部14において抽出された韻律特性は
音声合成部4に入力され、規則により設定された合成音
声の韻律特性を変更するのに使用される。韻律特性の内
の時間長特性は区分化された位置情報より容易に抽出す
ることができる。そして、パワー特性は区分化された音
声信号の平均パワーを計算することにより求めることが
できる。
【0011】一方、合成しようとする音声メッセージの
単位音声系列は既知であるので、先見的知識により、三
種のカテゴリーに区分された各々のブロックに分割され
る単位音声の内容、および規則により設定された単位音
声毎の時間長特性、パワー情報は予め把握されている。
従って、時間長に関しては区分化ブロック毎に抽出した
値に一致させ、ブロック内の各単位音声の時間長は規則
により設定した値にブロック長の比を乗ずることにより
求めることができる。即ち、規則により設定された区分
化ブロック長をBr 、入力音声から求めた区分化ブロッ
ク長をBv 、ブロック内の各単位音声長をTi とすれ
ば、修正される各単位音声長は Tnew =Ti ×(Bv /Br ) で求められる。
【0012】同様に区分化ブロック内の各単位音声パワ
ーPnew も、規則で設定された区分化ブロック内平均パ
ワーをPr 、入力音声から得られた区分化ブロック内平
均パワーをPv とすれば、 Pnew =Pi ×(Pv /pr ) で求められる。
【0013】従来の規則による音声合成においては、特
に、時間長およびパワー値の設定誤りが合成音声の不自
然さを増している場合が多い。ここで、音声合成情報の
時間長特性、およびパワー特性を上述の如くに変更し、
変更された情報に基づいて音声を合成すれば、オペレー
タの発声に近い韻律特性を有する音声メッセージを合成
することができる。オペレータは合成された音声メッセ
ージの音声品質の確認を行い、品質が充分良好であれば
これを音声メッセージ登録部5に音声メッセージとして
登録し、すべての処理は完了する。
【0014】
【発明の効果】以上の通りであって、入力音声をその特
徴に従って区分化し、その韻律特性を抽出するに際し
て、区分化カテゴリーを音声合成に用いる単位音声の種
別ではなくしてより区分化精度のよい無音、無声、有声
の三種に限定することにより、入力音声の韻律特性の抽
出が充分に精度良く行なわれることとなり、従って合成
音声の品質を向上することができる。即ち、この様にし
て得られた韻律特性に基づいて規則により設定された合
成音声の韻律特性を変更することにより、自然でしかも
所望の韻律特性を有する合成音を容易に得ることができ
る。
【図面の簡単な説明】
【図1】この発明による音声合成方法のフロー図。
【図2】無音、無声、有声の三種のカテゴリーによる音
声区分化を説明する図であり、(a)は音声区分化の模
式図、を示し、(b)は区分化結果の例を示す。
【符号の説明】
1 日本語テキスト入力部 2 音声合成情報変換部 3 韻律特性設定部 4 音声合成部 5 音声メッセージ登録部 10 韻律情報修正部 11 音声入力部 12 音声信号切り出し部 13 音声分析・区分化部 14 韻律特性抽出部

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 合成されるべき音声に対応する音声を入
    力し、入力された音声を分析してその音声属性に従って
    当該入力音声を区分化し、区分化された音声からその韻
    律特性を抽出し、抽出された韻律特性に基づいて規則に
    より設定された合成音声の時間長、パワーその他の韻律
    特性を変更し、所望の韻律を有する音声を合成する音声
    合成方法において、音声属性による区分化種別を無音、
    無声、有声の三種とすることを特徴とする音声合成方
    法。
JP5207491A 1993-08-23 1993-08-23 音声合成方法 Pending JPH0756589A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5207491A JPH0756589A (ja) 1993-08-23 1993-08-23 音声合成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5207491A JPH0756589A (ja) 1993-08-23 1993-08-23 音声合成方法

Publications (1)

Publication Number Publication Date
JPH0756589A true JPH0756589A (ja) 1995-03-03

Family

ID=16540611

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5207491A Pending JPH0756589A (ja) 1993-08-23 1993-08-23 音声合成方法

Country Status (1)

Country Link
JP (1) JPH0756589A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008185911A (ja) * 2007-01-31 2008-08-14 Arcadia:Kk 音声合成装置
WO2010084830A1 (ja) * 2009-01-23 2010-07-29 株式会社コナミデジタルエンタテインメント 音声処理装置、チャットシステム、音声処理方法、情報記憶媒体、ならびに、プログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008185911A (ja) * 2007-01-31 2008-08-14 Arcadia:Kk 音声合成装置
WO2010084830A1 (ja) * 2009-01-23 2010-07-29 株式会社コナミデジタルエンタテインメント 音声処理装置、チャットシステム、音声処理方法、情報記憶媒体、ならびに、プログラム
JP2010169925A (ja) * 2009-01-23 2010-08-05 Konami Digital Entertainment Co Ltd 音声処理装置、チャットシステム、音声処理方法、ならびに、プログラム

Similar Documents

Publication Publication Date Title
JPH0833744B2 (ja) 音声合成装置
JPH031200A (ja) 規則型音声合成装置
US6212501B1 (en) Speech synthesis apparatus and method
JPH0887297A (ja) 音声合成システム
JPH08335096A (ja) テキスト音声合成装置
CA2343071A1 (en) Device and method for digital voice processing
JPH0756589A (ja) 音声合成方法
JP3292218B2 (ja) 音声メッセージ作成装置
JP2536169B2 (ja) 規則型音声合成装置
EP1589524B1 (en) Method and device for speech synthesis
JPH064090A (ja) テキスト音声変換方法および装置
JPH05224688A (ja) テキスト音声合成装置
JPH05281984A (ja) 音声合成方法および装置
Dessai et al. Development of Konkani TTS system using concatenative synthesis
JPH09179576A (ja) 音声合成方法
JP2703253B2 (ja) 音声合成装置
JP2577372B2 (ja) 音声合成装置および方法
JPH01204100A (ja) テキスト音声合成方式
JP3522005B2 (ja) 音声合成装置
JPH0635913A (ja) 文章読み上げ装置
JPH1011083A (ja) テキスト音声変換装置
JPH0644247A (ja) 音声合成装置
JPH1063287A (ja) 発音訓練装置
JPH08160990A (ja) 音声合成装置
JPH06138894A (ja) 音声合成装置及び音声合成方法