JPH0792986A - 音声合成方法 - Google Patents

音声合成方法

Info

Publication number
JPH0792986A
JPH0792986A JP5240932A JP24093293A JPH0792986A JP H0792986 A JPH0792986 A JP H0792986A JP 5240932 A JP5240932 A JP 5240932A JP 24093293 A JP24093293 A JP 24093293A JP H0792986 A JPH0792986 A JP H0792986A
Authority
JP
Japan
Prior art keywords
rule
speech
basic
setting rule
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5240932A
Other languages
English (en)
Inventor
Masanobu Abe
匡伸 阿部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP5240932A priority Critical patent/JPH0792986A/ja
Publication of JPH0792986A publication Critical patent/JPH0792986A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 基本となる規則を元にしてこれに発話様式を
特徴づける変換を施すことにより様々な発話様式を実現
することができる音声合成方法を提供する。 【構成】 任意語または任意テキスト音声を合成する音
声合成方法において、基本となる規則101に対して変
換操作を施し、基本となる発話様式とは異なる発話様式
を実現する音声合成方法。基本となる規則101として
基本周波数設定規則106、音韻継続時間設定規則10
4、および音声のパワー設定規則108を採用する音声
合成方法。基本となる規則として基本周波数設定規則1
06、音韻継続時間設定規則104、音声のパワー設定
規則108および音声単位素片選択規則102を採用す
る音声合成方法。音声のパワー変換操作を基本周波数変
換結果に応じて行う音声合成方法。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、音声合成方法に関
し、特に、漢字仮名まじり文を音声に変換する規則によ
る音声合成方法において合成音声の発話様式を変換する
音声合成方法に関する。
【0002】
【従来の技術】従来の規則による音声合成方法は、合成
された結果の音声がテキストの意味内容を正確に伝達す
る明瞭性を確保し、自然な抑揚を有して聞き取り易い音
声を合成することをその主たる目的とするものであっ
た。合成された結果の音声が明瞭性を確保すると共に聞
き取り易いものでありさえすればよいというのであれ
ば、この目的を達成するテキスト合成規則を一通り有し
ていればそれで必要充分である。この様な理由から、テ
キストが相違しても、合成規則を変化させてテキストが
相違したことに対応する制御は行なわない。従って、ど
の様なテキストが入力されようとも、これらに対して一
通りの共通するテキスト合成規則を適用して合成音声を
生成していた。
【0003】
【発明が解決しようとする課題】日常生活の経験を勘案
してみれば、テキストにはそれぞれにふさわしい特有の
好適な読み方である発話様式がある。例えば、ニュー
ス、株価情報、天気予報の読み上げ方と小説或は物語の
読み上げ方とは大きく異なる。ラジオ或はテレビから流
れてくるコマーシャルの音声も独特な印象を有してい
る。この様に、読み上げるテキスト内容、読み上げの状
況に対応して音声の調子を変化させることは、音声合成
方法にとってこれを重要な機能の一つであると言うこと
ができる。
【0004】この発明は、規則による音声合成方法にお
いて、音声合成されるべきテキストに対してそれぞれに
対応する好適なテキスト合成規則を適用してそれにふさ
わしい発話様式の合成音声を生成する音声合成方法を提
供するものである。
【0005】
【課題を解決するための手段】任意語または任意テキス
ト音声を合成する音声合成方法において、基本となる規
則101に対して変換操作を施し、基本となる発話様式
とは異なる発話様式を実現する音声合成方法を構成し
た。そして、上述の音声合成方法において、基本となる
規則101として基本周波数設定規則106、音韻継続
時間設定規則104、および音声のパワー設定規則10
8を採用する音声合成方法を構成した。
【0006】また、基本となる規則として基本周波数設
定規則106、音韻継続時間設定規則104、音声のパ
ワー設定規則108、および音声単位素片選択規則10
2を採用する音声合成方法を構成した。更に、音声のパ
ワー変換操作を基本周波数変換結果に応じて行う音声合
成方法をも構成した。
【0007】
【実施例】この発明の実施例を図1を参照して説明す
る。この説明においては、発話様式に対応して変化させ
るパラメータは単位素片のフォルマント周波数、音声の
パワー、継続時間、基本周波数であるものとして説明す
る。そして、従来の規則による音声合成方法はニュース
或は天気予報に好適な発話様式に近似するものと考えら
れるので、以下においてはこれを「普通調」と称すると
共に、これを「基本となる規則」とする。また、この音
声合成装置においては、これによる普通調の合成音声
を、小説或は物語りの読み上げ風である「朗読調」とラ
ジオ或はテレビから流れてくるコマーシャル風である
「コマーシャル調」に変換することを具体例として説明
する。
【0008】図1において、101は従来の規則による
音声合成装置において制御パラメータを設定する基本と
なる規則であり、単位素片選択規則102、継続時間設
定規則104、基本周波数設定規則106、パワー設定
規則108より成る。103は単位素片選択規則102
により選択された単位素片に対してその単位素片の有す
る普通調のフォルマント周波数を朗読調或はコマーシャ
ル調に好適なフォルマント周波数に変換するフォルマン
ト周波数変換規則である。この変換に使用される変換規
則は表1に示される通りのものであり、音韻に無関係に
全音韻の平均に従って変換する。
【0009】
【表1】 ここで、変換規則は、普通調、朗読調およびコマーシャ
ル調に関してコードブックを作成してそれぞれのコード
ベクトルが同じ音韻を表現するような対応づけを求めた
後に各コードベクトルのフォルマントを求めることによ
り得ることもできる。そして、フォルマント周波数の変
換は、音声を全極型のフィルタにより近似し、その極周
波数を変形することによって行うことができる(詳細
は、水野、阿部、広川「制御自由度の高いフォルマント
周波数変換法」、聴覚研究会資料、H92-53, pp1-8, 19
92年11月、参照)。
【0010】105は継続時間設定規則104により得
られた継続時間を変換する継続時間変換規則である。こ
の変換規則は、表1に示される通りの平均的に変換する
変換規則を使用する。継続時間制御は、有声音部分につ
いては1ピッチ波形を繰り返して使用するか或は間引き
するかにより行い、無声音部分については或る部分の波
形を繰り返して使用するか或は間引きするかにより行
う。
【0011】107は基本周波数設定規則106により
得られた基本周波数を変換する基本周波数変換規則であ
る。この変換規則は表1に示される通りの平均的に変換
する変換規則を使用する。基本周波数パタンをグローバ
ルモデルとローカルモデルによりモデル化する方法によ
り各発話様式間の変換規則を統計的手法により精密に作
成することも考えられる(詳細は、阿部、佐藤「音節を
制御単位とする基本周波数の2階層制御方式」、信学技
法、sp92-5, pp33-40, 1992 年5月、参照)。基本周波
数の制御は、ピッチ同期して窓関数を掛け、所望の基本
周波数のインターバルで重ね合わせる方式により行うこ
とができる(詳細は、E.Moulines, F. Charpentier,
“Pitch-Syncronous Waveform Processing Techniques
for Text-to-Speech Synthesis using Diphones,“Spee
ch Communication, Vol. 9, pp.453-467, Dec. 1990、
参照)。
【0012】109はパワー設定規則108により得ら
れたパワーを変換するパワー変換規則である。この変換
規則は、表1に示される通りの平均的に変換する変換規
則を使用する。また、基本周波数設定規則と音声のパワ
ー設定規則の変換操作として、両規則の変換操作をそれ
ぞれ独立に操作するのではなく、音声のパワー変換操作
を基本周波数変換結果に応じて行う方法もある。例え
ば、基本周波数の大きさに応じてパワーの変換比率を適
応的に設定する。
【0013】この発明は、規則による音声合成装置のテ
キスト合成規則を、すべてのテキストに適用することが
できる規則と発話様式に応じて変化させなければならな
い規則とに大別できるものと考える。そして、すべての
テキストに適用することができる基本となる規則を元に
して発話様式に応じて変化させなければならない部分を
基本となる規則の一部を変形することにより得る。この
様にすることにより、規則によるテキスト音声合成装置
において、効率的に、且つ容易にテキストに対応する好
適な発話様式を実現することができる。
【0014】この発明の発話様式変換方法は規則による
合成音声のバリエーションを拡大するのに有効に利用す
ることができる。即ち、従来の規則による音声合成方法
は一通りの発話様式でしか音声合成することができなか
ったのであるが、この発明の発話様式変換方法によれ
ば、例えば、宣伝文を読み上げるのに好適な発話様式、
物語りを読むのに好適な発話様式その他、使用状況或は
使用者の要求に対応した合成音声を生成することができ
る。
【0015】
【発明の効果】以上の通りであって、この発明は、基本
となる規則を元にしてこれに発話様式を特徴づける変換
を施すことにより、様々な発話様式を実現することがで
きる。
【図面の簡単な説明】
【図1】この発明の実施例を説明する図。
【符号の説明】
101 基本となる規則 102 単位素片選択規則 103 フォルマント周波数変換規則 104 継続時間設定規則 105 継続時間変換規則 106 基本周波数設定規則 107 基本周波数変換規則 108 パワー設定規則 109 パワー変換規則

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 任意語または任意テキスト音声を合成す
    る音声合成方法において、基本となる規則に対して変換
    操作を施し、基本となる発話様式とは異なる発話様式を
    実現することを特徴とする音声合成方法。
  2. 【請求項2】 請求項1に記載される音声合成方法にお
    いて、基本となる規則として基本周波数設定規則、音韻
    継続時間設定規則、および音声のパワー設定規則を採用
    することを特徴とする音声合成方法。
  3. 【請求項3】 請求項1に記載される音声合成方法にお
    いて、基本となる規則として基本周波数設定規則、音韻
    継続時間設定規則、音声のパワー設定規則、および音声
    単位素片選択規則を採用することを特徴とする音声合成
    方法。
  4. 【請求項4】 請求項2或は請求項3に記載される音声
    合成方法において、音声のパワー変換操作を基本周波数
    変換結果に応じて行うことを特徴とする音声合成方法。
JP5240932A 1993-09-28 1993-09-28 音声合成方法 Pending JPH0792986A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5240932A JPH0792986A (ja) 1993-09-28 1993-09-28 音声合成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5240932A JPH0792986A (ja) 1993-09-28 1993-09-28 音声合成方法

Publications (1)

Publication Number Publication Date
JPH0792986A true JPH0792986A (ja) 1995-04-07

Family

ID=17066792

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5240932A Pending JPH0792986A (ja) 1993-09-28 1993-09-28 音声合成方法

Country Status (1)

Country Link
JP (1) JPH0792986A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19980065482A (ko) * 1997-01-10 1998-10-15 김광호 스피킹 스타일을 변경하는 음성 합성 방법
WO2010137385A1 (ja) 2009-05-28 2010-12-02 インターナショナル・ビジネス・マシーンズ・コーポレーション 話者適応のための基本周波数の移動量学習装置、基本周波数生成装置、移動量学習方法、基本周波数生成方法及び移動量学習プログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19980065482A (ko) * 1997-01-10 1998-10-15 김광호 스피킹 스타일을 변경하는 음성 합성 방법
WO2010137385A1 (ja) 2009-05-28 2010-12-02 インターナショナル・ビジネス・マシーンズ・コーポレーション 話者適応のための基本周波数の移動量学習装置、基本周波数生成装置、移動量学習方法、基本周波数生成方法及び移動量学習プログラム
US8744853B2 (en) 2009-05-28 2014-06-03 International Business Machines Corporation Speaker-adaptive synthesized voice

Similar Documents

Publication Publication Date Title
Isewon et al. Design and implementation of text to speech conversion for visually impaired people
US7010488B2 (en) System and method for compressing concatenative acoustic inventories for speech synthesis
US11763797B2 (en) Text-to-speech (TTS) processing
CN102227770A (zh) 音质变换装置、音高变换装置及音质变换方法
JPH1138989A (ja) 音声合成装置及び方法
Macon et al. Concatenation-based midi-to-singing voice synthesis
WO2008147649A1 (en) Method for synthesizing speech
JP2001034280A (ja) 電子メール受信装置および電子メールシステム
US20020072909A1 (en) Method and apparatus for producing natural sounding pitch contours in a speech synthesizer
JPH05113795A (ja) 音声合成装置
JPH08335096A (ja) テキスト音声合成装置
JPH0792986A (ja) 音声合成方法
KR100759172B1 (ko) 음성 합성 장치, 음성 합성 방법, 및 음성 합성 프로그램을기억한 기억 매체
KR0134707B1 (ko) 다이폰 단위를 이용한 엘에스피(lsp)방식의 음성 합성 방법
JPH09179576A (ja) 音声合成方法
JPH05224688A (ja) テキスト音声合成装置
JPH1185193A (ja) 音声データベースにおける音素片情報最適化方法、及び音素片情報最適化装置
JP2703253B2 (ja) 音声合成装置
JP4056647B2 (ja) 波形接続型音声合成装置および方法
Šef et al. Speaker (GOVOREC): a complete Slovenian text-to speech system
Eady et al. Pitch assignment rules for speech synthesis by word concatenation
JP2910587B2 (ja) 音声合成装置
Juergen Text-to-Speech (TTS) Synthesis
Datta et al. Introduction to ESOLA
Rank et al. VieCtoS speech synthesizer, technical overview