JPH04349499A - 音声合成システム - Google Patents

音声合成システム

Info

Publication number
JPH04349499A
JPH04349499A JP3121671A JP12167191A JPH04349499A JP H04349499 A JPH04349499 A JP H04349499A JP 3121671 A JP3121671 A JP 3121671A JP 12167191 A JP12167191 A JP 12167191A JP H04349499 A JPH04349499 A JP H04349499A
Authority
JP
Japan
Prior art keywords
speech
variable word
voice
synthesis
variable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP3121671A
Other languages
English (en)
Inventor
Kanji Kunisawa
國澤 寛治
Akira Yamamura
山村 彰
Junko Omukai
大向 順子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Electric Works Co Ltd
Original Assignee
Matsushita Electric Works Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Works Ltd filed Critical Matsushita Electric Works Ltd
Priority to JP3121671A priority Critical patent/JPH04349499A/ja
Publication of JPH04349499A publication Critical patent/JPH04349499A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、固定文の合成音声と可
変語の合成音声を組み合わせて音声合成を行う音声合成
システムに関するものである。
【0002】
【従来の技術】音声合成方式には、録音編集方式、パラ
メータ編集方式、テキスト合成方式の3種類がある。録
音編集方式は、記憶容量が大きくなるが、合成音の品質
が高く、ハードウェアも簡単なもので構成できる。
【0003】パラメータ編集方式は、録音編集方式と比
べて、合成音の品質が略同じで、記憶容量が小さいもの
を実現することができるが、現在のところそれを実現す
るためのハードウェアのコストが高いという問題がある
。またテキスト合成方式の場合は録音編集方式やパラメ
ータ編集方式のように、予め出力させたい音声に対応す
る自然音声を録音(・圧縮)して記憶させる作業が不要
であり、文字列だけを入力すれば任意の音声が出力でき
るが、現状の技術レベルでは合成音の品質が低い。
【0004】これらのことにより、出力させる音声が極
端に多くなく、その内容が前もって決まっている場合は
、録音編集方式が用いられる。音声合成装置としては、
出力する音声の内容が、いくつかの定型文から成り、各
定型文の中の一部の単語の内容が例えば人名や地名とな
っていろいろと変わるようなものが実用的である。
【0005】このような音声を録音編集方式により出力
させることをまず考えてみると、この場合、その単語を
可変語、定型文から可変語を除いたものを固定文とする
。例えば駅における電車案内を考えてみると、「ホーム
に          電車が入ります。」が固定文で
下線部分に入る「大阪行きの」や「京都行き」等の語句
が可変語となる。
【0006】さて出力音声を記憶させる最も単純な方法
は各可変語に対応した全ての定型文を記憶することであ
るが、このようにすると記憶容量が非常に大きくなって
しまう。そこで各固定文と各可変語のみを記憶し、それ
らを組み合わせて出力することが考えられる。ところが
、録音編集方式の問題点の一つは前述のように、予め出
力させたい音声に対応する自然音声を録音する作業が必
要であるということである。この録音作業をユーザが行
う場合、静かな場所で丁寧に発声しなければならない等
、ユーザにとってはかなり負担のかかる作業であった。
【0007】事実、録音編集的方式を利用するべきであ
ると考えられる分野でもテキスト合成方式が利用される
機会が増えている。これにより、システム構築時には録
音作業は必要であるが、構築後に出力音声の追加が生じ
た場合には、録音作業は行われずに追加できるようにし
たいという希望もある。
【0008】そのため一つの方法として、図5に示す音
声合成装置20が考えられる。この音声合成装置20は
、出力音声制御信号に基づいて通常は音声データ選択信
号により固定文音声データファイル21、可変語音声デ
ータファイル22のいずれかから音声データを選択して
、録音編集方式合成部23で合成を行ない、合成音を出
力する。また可変語の追加時には文字列を用いてテキス
ト合成部24でテキスト合成を行なって生成された合成
音を出力するものである。
【0009】つまりこの録音編集方式のみの合成では可
変語の追加が発生するたびに録音を行うことはかなりの
負担であり、このようにテキスト合成方式により文字列
の入力だけで音声データの作成が行えると、操作性が非
常に高くなる。尚前述のようにテキスト合成方式の合成
音の品質は低いが、テキスト合成によって出力される音
声は追加された可変語だけであるから出力される頻度は
一般に高くなく、また単語程度の音声であるから、許容
できる範囲であり、より実用的なシステムであると考え
られる。
【0010】
【発明が解決しようとする課題】しかし上記システムで
はテキスト合成部24のハードウェアが高コストである
ために、音声合成装置20全体が高コストになってしま
うという問題である。本発明は、かかる問題点に鑑みて
為されたもので、その目的とするところは固定文と可変
語とからなり、可変語の追加が後から行え、しかも音声
合成装置部分を低コストで実現できる音声合成システム
を提供するにある。
【0011】
【課題を解決するための手段】上述の目的を達成するた
めに、請求項1記載の発明は、記憶した固定文の音声デ
ータと可変語の音声データを録音編集方式合成部により
合成して出力する音声合成システムにおいて、可変語に
対応する文字列より合成するテキスト合成部と、テキス
ト合成した音声波形から可変語の音声データを作成する
録音編集方式符号化部とを備え、この作成された可変語
の音声データを追加の可変語の音声データとして記憶す
るものである。
【0012】請求項2記載の発明は、記憶した固定文の
音声データと可変語の音声データを録音編集方式合成部
により合成して出力する音声合成システムにおいて、可
変語に対応する自然音声を符号化するパラメータ編集方
式符号化部と、符号化された可変語のデータの韻律情報
を固定文の韻律情報に合うように加工する韻律情報変形
部と、この韻律情報が加工され符号化された可変語のデ
ータを復号化するパラメータ編集方式復号化部と、可変
語に対応する文字列より、韻律情報を固定文の韻律情報
に合うようにして合成を行うテキスト合成部と、これら
復号若しくは合成された音声波形から可変語の音声デー
タを作成する録音編集方式符号化部とを備え、この作成
された可変語の音声データを追加の可変語の音声データ
として記憶するものである。
【0013】
【作用】而して請求項1記載の発明によれば、テキスト
合成部で一旦合成した音声波形より録音編集方式符号化
部で作成せる可変語の音声データを、追加の可変語の音
声データとして使用するから、音声合成装置部分を録音
編集方式合成部で構成でき、そのためテキスト合成部を
も並設した音声合成装置に比べて安価に製作でき、また
テキスト合成部で合成された音声波形を録音編集方式符
号化部で符号化するため、テキスト合成部からリアルタ
イムで音声波形を生成する必要がなく、そのためテキス
ト合成部に安価な回路が使用でき、結果音声データ作成
装置部分のコストも安価となり、しかも複数の音声合成
装置に1つの音声データ作成装置を対応させることがで
きるから、システム全体のコストが安価となる。
【0014】また請求項2記載の発明によれば、自然音
声の可変語も文字列による可変語も追加できる上に、固
定文の韻律情報に合わせて韻律情報を加工して合成せる
音声波形を録音編集方式符号化部で符号化するため、音
声合成装置で韻律に高い自然性を持った音声を合成出力
することができる。またテキスト合成部や、パラメータ
編集方式符号化部及び復号化部からリアルタイムで音声
波形を生成する必要がないため、テキスト合成部やパラ
メータ編集方式符号化部及び復号化部に安価な回路が使
用でき、請求項1記載の発明と同様に結果音声データ作
成装置部分のコストも安価となり、また複数の音声合成
装置に1つの音声データ作成装置を対応させることがで
きるから、システム全体のコストが安価となる。
【0015】
【実施例】以下本発明を実施例により説明する。 (実施例1)本実施例システムでは音声合成装置1と、
音声データ作成装置2とは別々になっており、図2に示
す音声合成装置1はデータファイルとして、固定文音声
データファイル3と、可変語音声データファイル4とを
記憶し、外部から与えられる音声データ選択信号Sに従
った音声系列(固定文と可変語によって構成される)を
録音編集方式合成部5によって合成出力する。
【0016】一方音声データ作成装置2は図1に示すよ
うに固定文音声データ合成部2A、可変語音声データ合
成部2Bに分けられ、固定文音声データ合成部2Aでは
記憶させる固定文音声データに対応する自然音声を録音
編集方式符号化部6により録音、圧縮、符号化して固定
文音声データファイル3を作成する。また可変語音声デ
ータ合成部2Bでは可変語音声データに対応する自然音
声から録音編集方式符号化部6’により録音、圧縮、符
号化したり、或いは可変号音声データに対応する文字列
からテキスト合成部7によりテキスト合成を行って生成
させた音声波形を、録音編集方式符号化部6’により、
録音、圧縮、符号化して、可変語音声データファイル4
を作成する。これら音声データファイル3、4は音声合
成装置1において記憶される。
【0017】このように本発明は音声合成装置1を音声
データ作成装置2と分離し、しかも音声合成装置1は録
音編集方式合成部5のみで構成されるため安価に製作で
きる。さて、固定文と可変語とを組み合わせて音声を出
力する方法では、一般に韻律の自然性が悪くなるが、可
変語の韻律情報を固定文の韻律情報に合わせて合成する
ことにより、自然性を向上させることができる。テキス
ト合成方式により可変語を作成する場合はこのようなこ
とは容易に行えるが、録音編集方式で韻律情報を加工す
ることは困難である。
【0018】(実施例2)本実施例の音声データ作成装
置2では図3に示すように固定文音声データ作成部2A
が、固定文と可変語からなる自然音声を取り込んで固定
文を固定文抽出部8で抽出した後、録音編集方式符号化
部6で録音、圧縮、符号化して固定文音声データファイ
ル3を作成するとともに、韻律情報抽出部9より抽出し
た固定文の韻律情報を可変語音声データ合成部2Bの韻
律情報変形部10及びテキスト合成部7に与えるように
なっている。
【0019】一方可変語音声データ合成部2Bでは自然
音声の可変語の場合、パラメータ編集方式符号化部11
により符号化した後、韻律情報を韻律情報変形部10に
より、固定文の韻律情報に合うように加工した後、パラ
メータ編集方式復号化部12により復号化して生成した
合成音を録音編集方式符号化部6’で録音、圧縮、符号
化して可変語音声データファイル4を作成するようにな
っている。
【0020】また文字列から可変語データを作成する場
合には、テキスト合成部7により、固定文の韻律情報に
合わせて可変語の韻律情報を合成して合成音を生成し、
その合成音を録音編集方式符号化部6’で録音、圧縮、
符号化して可変語音声データファイル4を作成する。こ
のように固定文の韻律情報に合わせて可変語の韻律情報
を合成することにより、固定語と可変語との組み合わせ
で音声を出力する際の自然性を確保している。
【0021】(実施例3)本実施例の音声データ作成装
置2では、上記の韻律情報の加工としてピッチパターン
の加工のみを行うもので、この場合文音声のピッチパタ
ーンは、単語、文節に固有のアクセント成分と、主とし
て文構造や声門下圧現象に伴うピッチ降下などにより決
定される成分(話調成分)とからなることが知られてい
る。そこでまず固定文音声データ作成部2Aに自然音声
として取り込んだ固定語と可変語とからなる文より可変
語抽出部13で可変語を抽出し、更に可変語の部分に一
つの単語を適当に割り当てた文に対応する自然音声から
可変語の部分の話調成分を話調成分抽出部14で抽出し
、この抽出した話調成分を可変語音声データ作成部2B
に送るようになっている。
【0022】一方可変語音声データ作成部2Bでは自然
音声の可変語をパラメータ編集方式符号化部11で符号
化し、その中のピッチパラメータからアクセント成分抽
出部15でアクセント成分を抽出し、この抽出したアク
セント成分をピッチパターン生成部16で先の話調成分
に重畳し、これによってできたピッチパターンを元のピ
ッチパターンと置き換え、そのパラメータによりパラー
メータ編集方式復号化部12で復号化を行い、生成され
た音声波形を録音編集方式符号化部6’で符号化して可
変語音声データファイル4を作成するのである。
【0023】またテキスト合成で可変語を追加する場合
には、上記話調成分にテキスト合成部7内のアクセント
成分生成部17で抽出したアクセント成分を重畳してで
きるピッチパターンにより合成を行ってできた音声波形
を録音編集方式符号化部6’で符号化して可変語音声デ
ータファイル4を作成するのである。上記実施例2、3
で用いるパラメータ編集方式はコストを意識しなければ
高品質な合成音を生成することができるので、このよう
にすることにより、韻律の自然性の高い音声合成が行え
る。
【0024】尚実施例1、2では可変語は各固定文ごと
に用意することになる。また実施例1〜3は共に、テキ
スト合成を行う場合の合成単位を、固定文を作成すると
きの自然音声の話者によって作成することとする。また
可変語の内容として固有名詞の場合が多いので、アクセ
ントに関してはユーザが選べるようにしも良く、この方
がより実用的である。
【0025】
【発明の効果】請求項1記載の発明は、可変語に対応す
る文字列より合成するテキスト合成部と、テキスト合成
した音声波形から可変語の音声データを作成する録音編
集方式符号化部とを備え、この作成された可変語の音声
データを追加の可変語の音声データとして記憶するから
、音声合成装置部分を録音編集方式合成部で構成でき、
そのためテキスト合成部をも並設した音声合成装置に比
べて安価に製作でき、またテキスト合成部で合成された
音声波形を録音編集方式符号化部で符号化するため、テ
キスト合成部からリアルタイムで音声波形を生成する必
要がなく、そのためテキスト合成部に安価な回路が使用
でき、結果音声データ作成装置部分のコストも安価とな
り、しかも複数の音声合成装置に1つの音声データ作成
装置を対応させることができるから、システム全体のコ
ストが安価となるという効果がある。
【0026】また請求項2記載の発明は、可変語に対応
する自然音声を符号化するパラメータ編集方式符号化部
と、符号化された可変語のデータの韻律情報を固定文の
韻律情報に合うように加工する韻律情報変形部と、この
韻律情報が加工され符号化された可変語のデータを復号
化するパラメータ編集方式復号化部と、可変語に対応す
る文字列より、韻律情報を固定文の韻律情報に合うよう
にして合成を行うテキスト合成部と、これら復号若しく
は合成された音声波形から可変語の音声データを作成す
る録音編集方式符号化部とを備え、この作成された可変
語の音声データを追加の可変語の音声データとして記憶
するから、自然音声の可変語も文字列による可変語も追
加できる上に、固定文の韻律情報に合わせて韻律情報を
加工して合成せる音声波形を録音編集方式符号化部で符
号化するため、音声合成装置で韻律に高い自然性を持っ
た音声を合成出力することができる。またテキスト合成
部や、パラメータ編集方式符号化部及び復号化部からリ
アルタイムで音声波形を生成する必要がないため、テキ
スト合成部やパラメータ編集方式符号化部及び復号化部
に安価な回路が使用でき、請求項1記載の発明と同様に
結果音声データ作成装置部分のコストも安価となり、ま
た複数の音声合成装置に1つの音声データ作成装置を対
応させることができるから、システム全体のコストが安
価となるという効果がある。
【図面の簡単な説明】
【図1】本発明の実施例1に用いる音声データ作成装置
の構成図である。
【図2】本発明の実施例1に用いる音声合成装置の構成
図である。
【図3】本発明の実施例2に用いる音声データ作成装置
の構成図である。
【図4】本発明の実施例3に用いる音声データ作成装置
の構成図である。
【図5】従来例の音声合成装置の構成図である。
【符号の説明】
2    音声データ作成装置 2A  固定文音声データ作成部 2B  可変語音声データ作成部 3    固定文音声データファイル 4    可変語音声データファイル 6    録音編集方式符号化部 6’  録音編集方式符号化部 7    テキスト合成部

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】記憶した固定文の音声データと可変語の音
    声データを録音編集方式合成部により合成して出力する
    音声合成システムにおいて、可変語に対応する文字列よ
    り合成するテキスト合成部と、テキスト合成した音声波
    形から可変語の音声データを作成する録音編集方式符号
    化部とを備え、この作成された可変語の音声データを追
    加の可変語の音声データとして記憶することを特徴する
    音声合成システム。
  2. 【請求項2】記憶した固定文の音声データと可変語の音
    声データを録音編集方式合成部により合成して出力する
    音声合成システムにおいて、可変語に対応する自然音声
    を符号化するパラメータ編集方式符号化部と、符号化さ
    れた可変語のデータの韻律情報を固定文の韻律情報に合
    うように加工する韻律情報変形部と、この韻律情報が加
    工され符号化された可変語のデータを復号化するパラメ
    ータ編集方式復号化部と、可変語に対応する文字列より
    、韻律情報を固定文の韻律情報に合うようにして合成を
    行うテキスト合成部と、これら復号若しくは合成された
    音声波形から可変語の音声データを作成する録音編集方
    式符号化部とを備え、この作成された可変語の音声デー
    タを追加の可変語の音声データとして記憶することを特
    徴とする音声合成システム。
JP3121671A 1991-05-28 1991-05-28 音声合成システム Withdrawn JPH04349499A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3121671A JPH04349499A (ja) 1991-05-28 1991-05-28 音声合成システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3121671A JPH04349499A (ja) 1991-05-28 1991-05-28 音声合成システム

Publications (1)

Publication Number Publication Date
JPH04349499A true JPH04349499A (ja) 1992-12-03

Family

ID=14817014

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3121671A Withdrawn JPH04349499A (ja) 1991-05-28 1991-05-28 音声合成システム

Country Status (1)

Country Link
JP (1) JPH04349499A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003019528A1 (fr) * 2001-08-22 2003-03-06 International Business Machines Corporation Procede de production d'intonation, dispositif de synthese de signaux vocaux fonctionnant selon ledit procede et serveur vocal
US6930688B1 (en) 2000-11-16 2005-08-16 Lsi Logic Corporation Generator of graphics in computer system
JP2007212884A (ja) * 2006-02-10 2007-08-23 Fujitsu Ltd 音声合成装置、音声合成方法、及びコンピュータプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6930688B1 (en) 2000-11-16 2005-08-16 Lsi Logic Corporation Generator of graphics in computer system
WO2003019528A1 (fr) * 2001-08-22 2003-03-06 International Business Machines Corporation Procede de production d'intonation, dispositif de synthese de signaux vocaux fonctionnant selon ledit procede et serveur vocal
JP2007212884A (ja) * 2006-02-10 2007-08-23 Fujitsu Ltd 音声合成装置、音声合成方法、及びコンピュータプログラム

Similar Documents

Publication Publication Date Title
US6442517B1 (en) Methods and system for encoding an audio sequence with synchronized data and outputting the same
US5153913A (en) Generating speech from digitally stored coarticulated speech segments
JP2001034282A (ja) 音声合成方法、音声合成のための辞書構築方法、音声合成装置、並びに音声合成プログラムを記録したコンピュータ読み取り可能な媒体
JP2971796B2 (ja) 低ビット速度のオーディオエンコーダおよびデコーダ
WO2004109659A1 (ja) 音声合成装置、音声合成方法及びプログラム
JPH0527789A (ja) 音声合成装置
JPH04349499A (ja) 音声合成システム
KR100694395B1 (ko) 웨이브 테이블 기반의 미디 합성 방법
JPH0419799A (ja) 音声合成装置
US7092878B1 (en) Speech synthesis using multi-mode coding with a speech segment dictionary
JP3632901B2 (ja) 数字音声波形の作成方法、数字音声の合成方法および装置
JP3059751B2 (ja) 残差駆動型音声合成装置
JP2577372B2 (ja) 音声合成装置および方法
JPH0451100A (ja) 音声情報圧縮装置
JP3219822B2 (ja) 音声合成用符号化装置及び復号化装置
JPH03160500A (ja) 音声合成装置
JP3086458B2 (ja) 音声合成装置
US5740319A (en) Prosodic number string synthesis
JP2000231396A (ja) セリフデータ作成装置、セリフ再生装置、音声分析合成装置及び音声情報転送装置
JPH0419800A (ja) 音声合成装置
JP2003271198A (ja) 圧縮データ処理装置、方法および圧縮データ処理プログラム
JPS62254196A (ja) 音声合成方式
JPS63110500A (ja) 音声時間長デ−タ生成装置
JPS6021098A (ja) 音声合成方法
JP2001166787A (ja) 音声合成装置および自然言語処理方法

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19980806