JPH04331997A

JPH04331997A - 音声合成装置のアクセント成分制御方式

Info

Publication number: JPH04331997A
Application number: JP3101105A
Authority: JP
Inventors: Kazuya Hasegawa; 和也長谷川
Original assignee: Meidensha Corp; Meidensha Electric Manufacturing Co Ltd
Current assignee: Meidensha Corp; Meidensha Electric Manufacturing Co Ltd
Priority date: 1991-05-07
Filing date: 1991-05-07
Publication date: 1992-11-19
Anticipated expiration: 2015-07-24
Also published as: JP3070127B2; US5463713A

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、規則合成方式による音
声合成装置に係り、特に入力テキストに対する抑揚制御
のうちのアクセント成分制御方式に関する。

【０００２】

【従来の技術】規則合成方式による音声合成装置は、図
５に示すように、テキスト入力部１からの入力テキスト
に対し、日本語処理部２による形態素解析によってポー
ズの位置，単語・文節の句切りや辞書を参照した読みが
な変換とアクセント付与がなされる。例えば、入力テキ
ストが「今日はいい天気です」にあるとき、日本語処理
結果は下記表となる。

【０００３】

【表１】

【０００４】この処理結果のテキストに対し、抑揚制御
部３ではフレーズパターン算出部３Ａによってテキスト
に含まれるモーラ（子音＋母音で表される音の最小単位
）の数から得られるフレーズ成分（ポーズで挟まれた一
息で話すときの音の高低）を算出し、アクセントパター
ン算出部３Ｂによってアクセント成分（単語が個々に持
つ音の高低）を算出し、夫々の成分を図６に示すように
重ね合わせた抑揚制御パターンを算出する。フレーズ成
分は人が話すときの出始めの高いピッチから次第に声門
下圧の低下による低いピッチへの低下になる。また、ア
クセント成分は上述のように解析単位毎に１つのピッチ
目標値を与えてその間を直線補間する場合と、解析単位
毎に３点のピッチ目標値を与えてその間を直線補間する
場合がある。

【０００５】後者のアクセント成分算出は、ＣＶ単位（
子音＋母音）とＶ単位（母音）別に下記表に示す区分

【
０００６】

【表２】

【０００７】

【表３】

【０００８】に目標値Ｐ１〜Ｐ３を与え、＊印で示す区
分のピッチは前後のデータから直線補間する。

【０００９】音声合成部４は抑揚処理部３で付与された
抑揚制御パターンに従って各音節のピッチを調整し、ま
た各音節に対応づけた音源波パターンと調音フィルタの
パラメータから調音フィルタの応答出力として合成音声
を得る。

【００１０】上述のように、従来の抑揚制御方式は、入
力テキストに含まれるモーラの数によるフレーズ成文と
モーラ毎のアクセント成分等の合成により合成音声に抑
揚を持たせる。このうち、アクセント成分は、１モーラ
当たり複数の目標ピッチを持たせ、その間のピッチ変化
は補間処理によって決定される。

【００１１】ここで、アクセント成分はアクセントの高
低から単純にピッチが決定されるため、画一的なピッチ
変化になって機械的な合成音声になり易かった。また、
音節と音節及び文節と文節のつながりについては全く考
慮されていないため、モーラの前後を含めたアクセント
の変化に滑らかさが無くなる場合が生じ、音節又は文全
体としては不自然な合成音声になることがあった。

【００１２】そこで、モーラ単位及びモーラのつながり
のアクセント変化に自然性を高める抑揚制御方式を本願
出願人は既に提案している。

【００１３】この抑揚制御方式は、アクセント環境に応
じて、即ち当該モーラのアクセントの高低とフレーズ内
位置と継続音韻か否かと前後モーラのアクセントの高低
と文節句切りとの位置関係及び当該モーラ内の前後のピ
ッチ目標値に応じて、当該モーラ内のピッチの変化係数
を線形関数演算で求め、この演算結果でアクセント成分
量を制御する。

【００１４】

【発明が解決しようとする課題】アクセント環境に応じ
たアクセントパターンの制御では、ピッチの変化係数が
制御用変数を持つため、メンテナンスや変数設定時にア
クセントパターンがどのようなものになるかを直感的に
イメージするのが難しくなる。この問題はアクセントパ
ターンが多くなるほど増長される。また、アクセントパ
ターン生成のための関数や変数設定が複雑になる。

【００１５】本発明の目的は、アクセント環境に応じた
アクセントパターンの生成，修正，変更を容易にし、ま
たアクセントパターンのイメージ把握を容易にするアク
セント成分制御方式を提供することにある。

【００１６】

【課題を解決するための手段】本発明は前記課題の解決
を図るため、日本語処理された入力テキストに対し、該
入力テキストのフレーズ内モーラ数からフレーズ成分の
抑揚制御パターンを得、該入力テキストのフレーズ内各
モーラに定めるピッチ目標値をアクセント環境に応じて
補正及び補間処理によってアクセント成分の抑揚制御パ
ターンを得、前記フレーズ成分とアクセント成分を重ね
合わせて入力テキストの抑揚制御パターンを得る規則合
成方式の音声合成装置において、前記モーラのアクセン
ト環境別に基本アクセントパターンをテーブル化して記
憶する基本アクセントパターンテーブルと、入力される
モーラのアクセント環境に対応する基本アクセントパタ
ーンを前記テーブルから得て当該モーラのピッチを補正
する基本アクセントパターン生成処理部と、この処理部
の処理結果を日本語処理された句切り内モーラ数とモー
ラ位置によって補正してアクセント成分の抑揚制御パタ
ーンを得る補正処理部とを備え、前記基本アクセントパ
ターンテーブルにはアクセント環境別に実音声から抽出
生成したピッチデータを記憶し、該データの修正によっ
てアクセント成分を修正・変更することを特徴とする。

【００１７】

【作用】上記方式になる本発明は、モーラのアクセント
環境別に実音声から基本アクセントパターンデータを生
成及びテーブル化して記憶しておき、モーラのアクセン
ト成分を得るのに当該モーラのアクセント環境に応じて
テーブルデータを取り出してアクセントパターンの生成
処理を行い、その他の要因によるアクセント変化を補正
処理部で補正することでアクセント成分とする。これに
より、アクセントパターンの把握はテーブルデータから
直感的にイメージされ、また修正・変更は該テーブルデ
ータの修正・変更で済むようにする。

【００１８】また、本発明では、テーブルデータとして
アクセント環境別に加えてモーラに対するアクセント句
境界別又はモーラの属性別にパターンを変えることで一
層実音声に近付けたアクセント成分を得、これによるア
クセントパターンの増大にもテーブルデータ化すること
でアクセントパターンの把握及び生成，修正等を容易に
する。

【００１９】

【実施例】図１は本発明の一実施例を示す装置構成図で
ある。同図が図５と異なる部分は、アクセントパターン
算出部３Ｂに代えてアクセントパターン生成処理部５を
設けた点にある。

【００２０】アクセントパターン生成処理部５には入力
テキストの日本語処理結果として区切り内モーラ数と当
該モーラのアクセントパターン（前記表１参照）が与え
られる。このデータに対し、アクセントパターン生成処
理部５は、基本アクセントパターン生成処理部６と、基
本アクセントパターンテーブル７及び補正処理部８で構
成される。

【００２１】基本アクセントパターン生成処理部６は、
入力されたアクセント環境に対応する基本アクセントパ
ターンをテーブル７から読み出すための処理を行う。こ
の基本アクセントパターンテーブル７は、原音声のピッ
チ分析によって得られたパターンデータをテーブル化し
て予め記憶するもので、複数点のアクセント量が当該モ
ーラのアクセントとその前後アクセントとの組み合わせ
別にテーブル化される。

【００２２】図２は基本アクセントテーブル作成手順図
を示す。（ａ）に示す実音声データベースは、人間によ
るアクセント環境別の発声音のピッチ分析によってアク
セントパターンをサンプルデータとして収集する。例え
ば、低いアクセントＬと高いアクセントＨとの組み合わ
せがＬＨＬになる複数の原音声のピッチデータを収集す
る。これらデータはアクセント環境別に収集されること
から、当該モーラのアクセントの高低変化（ＬＨＬ等）
が同じでも日本語処理結果のアクセントパターンから求
める継続音韻の有無，前後モーラのアクセント高低，文
節区切り等によって個々の組み合わせになるアクセント
環境別にデータ収集される。

【００２３】同図（ｂ）に示す基本アクセントパターン
テーブルは、実音声データベースのサンプルデータをア
クセント環境別に平均化することでサンプルデータのピ
ッチを基本アクセントパターンとして求める。このデー
タがテーブル７に記憶される。

【００２４】図１に戻って、補正処理部８は、基本アク
セントパターン生成処理部６で生成された基本アクセン
トパターンを使い、このパターンを日本語処理されたア
クセントパターンの句切り内モーラ数とモーラ位置等に
よる補正量を求め、この補正量により基本アクセントパ
ターンを補正してアクセントパターンデータとしてフレ
ーズパターンとの合成のための出力を得る。

【００２５】上述の構成になるアクセントパターン生成
処理部５を備えることにより、アクセントパターンテー
ブル７には全てのアクセント環境に対応するアクセント
パターンデータが用意されることから、メンテナンスや
補正量設定の際にアクセント環境をインデックスとして
当該データを容易に検索できる。また、アクセントパタ
ーンは当該モーラについて複数点のアクセント量（ピッ
チ）としてテーブル７に記憶されることから、メンテナ
ンス等の際に当該モーラにおけるアクセントパターンの
イメージ把握が従来の変数係数や関数からのそれに較べ
て直感的で容易になり、係数の設定，修正等も容易にす
る。また、アクセントパターンデータは実音声から生成
され、従来の関数設定等に較べて容易になるし、実音声
に近いアクセントパターンになる。

【００２６】図３は本発明の他の実施例を示し、基本ア
クセントパターンテーブルを示す。同図では、実音声デ
ータベースからアクセント環境別に基本アクセントパタ
ーンテーブルを作成するのに、同じアクセント環境でも
アクセント句境界を当該モーラの先行に含む場合（前に
有り）と、当該モーラの後続に含む場合（後に有り）と
、アクセント境界を含まない場合（無し）とに応じて異
なるアクセントパターンになるアクセント量（ピッチ）
設定にする。

【００２７】このように、当該モーラに対するアクセン
ト句境界位置に応じた個別の基本アクセントパターンテ
ーブルを用意することにより、アクセントパターンの生
成処理結果にはアクセント句の境界が明確になり、明瞭
なアクセント句境界を持つ合成音声、即ちメリハリを持
たせた抑揚を持つ合成音声を得ることができる。

【００２８】図４は本発明の実施例を示し、基本アクセ
ントパターンテーブルを示す。同図ではアクセント環境
別に基本アクセントパターンテーブルを作成するのに、
モーラの属性（モーラの構成の違い）に応じて異なるア
クセントパターンになるアクセント量設定にする。モー
ラの属性は日本語処理結果として基本アクセントパター
ン生成処理部６に句切り内モーラ数及びアクセントパタ
ーンと共に与えられ、この属性とアクセント環境に応じ
てテーブルの同じ属性のものが取り出される。

【００２９】このようにモーラの属性に応じた個別の基
本アクセントパターンテーブルを用意することにより、
同じアクセント環境でも当該モーラが母音モーラか、有
声子音＋母音モーラか、無声子音＋母音モーラかによっ
て異なるアクセントパターンを得ることができ、さらに
母音部が長音部か否かによっても異なるアクセントパタ
ーンを得ることができる。これにより、モーラの属性の
違いによって異なる抑揚になる人の音声に近付けた合成
音声を得ることができる。

【００３０】

【発明の効果】以上のとおり、本発明によれば、モーラ
のアクセント環境別の基本アクセントパターンをテーブ
ル化して記憶しておき、日本語処理したモーラのアクセ
ント環境に応じてテーブルデータを取り出してアクセン
ト生成処理を行い、句切り等による補正処理でアクセン
ト成分を得るため、アクセント環境別のアクセントパタ
ーンの把握がテーブルデータから直感的に行うことがで
き、また修正・変更にはテーブルデータの修正・変更に
よって容易になされるし、これら処理後のイメージ把握
も容易になる。また、基本アクセントパターンの生成は
実音声からなされるため、アクセントパターンデータの
生成に従来の関数や変数設定によることなく容易になさ
れ、しかも実音声が持つ微妙なアクセント変化に近付け
たアクセント成分を得ることができる。

【００３１】また、本発明はアクセントパターンの生成
をアクセント環境のほかに当該モーラの句境界別にする
こと、又はモーラの属性別にすることにより、実音声に
近付けたアクセント成分生成になる。これらパターン生
成処理を付加した場合にもそのイメージ把握やパターン
修正・変更が難しくなることはない。

【図面の簡単な説明】

【図１】本発明の一実施例を示す装置構成図。

【図２】実施例における基本アクセントパターンテーブ
ルの作成手順図。

【図３】他の実施例の基本アクセントパターンテーブル
図。

【図４】他の実施例の基本アクセントパターンテーブル
図。

【図５】音声合成装置の構成図。

【図６】抑揚処理態様図。

【符号の説明】

１…テキスト入力部、２…日本語処理部、３…抑揚制御
部、３Ａ…フレーズパターン算出部、４…音声合成部、
５…アクセントパターン生成処理部、６…基本アクセン
トパターン生成処理部、７…基本アクセントパターンテ
ーブル、８…補正処理部。

Claims

【特許請求の範囲】

【請求項１】　　日本語処理された入力テキストに対し
、該入力テキストのフレーズ内モーラ数からフレーズ成
分の抑揚制御パターンを得、該入力テキストのフレーズ
内各モーラに定めるピッチ目標値をアクセント環境に応
じて補正及び補間処理によってアクセント成分の抑揚制
御パターンを得、前記フレーズ成分とアクセント成分を
重ね合わせて入力テキストの抑揚制御パターンを得る規
則合成方式の音声合成装置において、前記モーラのアク
セント環境別に基本アクセントパターンをテーブル化し
て記憶する基本アクセントパターンテーブルと、入力さ
れるモーラのアクセント環境に対応する基本アクセント
パターンを前記テーブルから得て当該モーラのピッチを
補正する基本アクセントパターン生成処理部と、この処
理部の処理結果を日本語処理された句切り内モーラ数と
モーラ位置によって補正してアクセント成分の抑揚制御
パターンを得る補正処理部とを備え、前記基本アクセン
トパターンテーブルにはアクセント環境別に実音声から
抽出生成したピッチデータを記憶し、該データの修正に
よってアクセント成分を修正・変更することを特徴とす
る音声合成装置のアクセント成分制御方式。
【請求項２】　　前記基本アクセントパターンテーブル
は、モーラのアクセント環境別かつアクセント句境界が
当該モーラの前に有る場合と後に有る場合と句境界が無
い場合に分けて異なる基本アクセントパターンを持つこ
とを特徴とする特許請求の範囲第１項に記載の音声合成
装置のアクセント成分制御方式。
【請求項３】　　前記基本アクセントパターンテーブル
は、モーラのアクセント環境別かつ当該モーラが母音モ
ーラ，有声子音と母音モーラ，無声子音と母音モーラ及
び該母音部が長音部か否かによって定めるモーラの属性
別に基本アクセントパターンを持つことを特徴とする特
許請求の範囲第１項に記載の音声合成装置のアクセント
成分制御方式。