JPH04331997A - 音声合成装置のアクセント成分制御方式 - Google Patents
音声合成装置のアクセント成分制御方式Info
- Publication number
- JPH04331997A JPH04331997A JP3101105A JP10110591A JPH04331997A JP H04331997 A JPH04331997 A JP H04331997A JP 3101105 A JP3101105 A JP 3101105A JP 10110591 A JP10110591 A JP 10110591A JP H04331997 A JPH04331997 A JP H04331997A
- Authority
- JP
- Japan
- Prior art keywords
- accent
- mora
- pattern
- basic
- component
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000015572 biosynthetic process Effects 0.000 title claims description 9
- 238000003786 synthesis reaction Methods 0.000 title claims description 9
- 238000012937 correction Methods 0.000 claims abstract description 12
- 238000012545 processing Methods 0.000 claims description 38
- 238000000034 method Methods 0.000 claims description 12
- 241001417093 Moridae Species 0.000 claims description 11
- 238000001308 synthesis method Methods 0.000 claims description 3
- 230000004075 alteration Effects 0.000 abstract 1
- 239000011295 pitch Substances 0.000 description 24
- 238000010586 diagram Methods 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 7
- 230000008859 change Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 241000282414 Homo sapiens Species 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 235000010678 Paulownia tomentosa Nutrition 0.000 description 1
- 240000002834 Paulownia tomentosa Species 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
- G10L13/10—Prosody rules derived from text; Stress or intonation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/04—Details of speech synthesis systems, e.g. synthesiser structure or memory management
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【0001】
【産業上の利用分野】本発明は、規則合成方式による音
声合成装置に係り、特に入力テキストに対する抑揚制御
のうちのアクセント成分制御方式に関する。
声合成装置に係り、特に入力テキストに対する抑揚制御
のうちのアクセント成分制御方式に関する。
【0002】
【従来の技術】規則合成方式による音声合成装置は、図
5に示すように、テキスト入力部1からの入力テキスト
に対し、日本語処理部2による形態素解析によってポー
ズの位置,単語・文節の句切りや辞書を参照した読みが
な変換とアクセント付与がなされる。例えば、入力テキ
ストが「今日はいい天気です」にあるとき、日本語処理
結果は下記表となる。
5に示すように、テキスト入力部1からの入力テキスト
に対し、日本語処理部2による形態素解析によってポー
ズの位置,単語・文節の句切りや辞書を参照した読みが
な変換とアクセント付与がなされる。例えば、入力テキ
ストが「今日はいい天気です」にあるとき、日本語処理
結果は下記表となる。
【0003】
【表1】
【0004】この処理結果のテキストに対し、抑揚制御
部3ではフレーズパターン算出部3Aによってテキスト
に含まれるモーラ(子音+母音で表される音の最小単位
)の数から得られるフレーズ成分(ポーズで挟まれた一
息で話すときの音の高低)を算出し、アクセントパター
ン算出部3Bによってアクセント成分(単語が個々に持
つ音の高低)を算出し、夫々の成分を図6に示すように
重ね合わせた抑揚制御パターンを算出する。フレーズ成
分は人が話すときの出始めの高いピッチから次第に声門
下圧の低下による低いピッチへの低下になる。また、ア
クセント成分は上述のように解析単位毎に1つのピッチ
目標値を与えてその間を直線補間する場合と、解析単位
毎に3点のピッチ目標値を与えてその間を直線補間する
場合がある。
部3ではフレーズパターン算出部3Aによってテキスト
に含まれるモーラ(子音+母音で表される音の最小単位
)の数から得られるフレーズ成分(ポーズで挟まれた一
息で話すときの音の高低)を算出し、アクセントパター
ン算出部3Bによってアクセント成分(単語が個々に持
つ音の高低)を算出し、夫々の成分を図6に示すように
重ね合わせた抑揚制御パターンを算出する。フレーズ成
分は人が話すときの出始めの高いピッチから次第に声門
下圧の低下による低いピッチへの低下になる。また、ア
クセント成分は上述のように解析単位毎に1つのピッチ
目標値を与えてその間を直線補間する場合と、解析単位
毎に3点のピッチ目標値を与えてその間を直線補間する
場合がある。
【0005】後者のアクセント成分算出は、CV単位(
子音+母音)とV単位(母音)別に下記表に示す区分
子音+母音)とV単位(母音)別に下記表に示す区分
【
0006】
0006】
【表2】
【0007】
【表3】
【0008】に目標値P1〜P3を与え、*印で示す区
分のピッチは前後のデータから直線補間する。
分のピッチは前後のデータから直線補間する。
【0009】音声合成部4は抑揚処理部3で付与された
抑揚制御パターンに従って各音節のピッチを調整し、ま
た各音節に対応づけた音源波パターンと調音フィルタの
パラメータから調音フィルタの応答出力として合成音声
を得る。
抑揚制御パターンに従って各音節のピッチを調整し、ま
た各音節に対応づけた音源波パターンと調音フィルタの
パラメータから調音フィルタの応答出力として合成音声
を得る。
【0010】上述のように、従来の抑揚制御方式は、入
力テキストに含まれるモーラの数によるフレーズ成文と
モーラ毎のアクセント成分等の合成により合成音声に抑
揚を持たせる。このうち、アクセント成分は、1モーラ
当たり複数の目標ピッチを持たせ、その間のピッチ変化
は補間処理によって決定される。
力テキストに含まれるモーラの数によるフレーズ成文と
モーラ毎のアクセント成分等の合成により合成音声に抑
揚を持たせる。このうち、アクセント成分は、1モーラ
当たり複数の目標ピッチを持たせ、その間のピッチ変化
は補間処理によって決定される。
【0011】ここで、アクセント成分はアクセントの高
低から単純にピッチが決定されるため、画一的なピッチ
変化になって機械的な合成音声になり易かった。また、
音節と音節及び文節と文節のつながりについては全く考
慮されていないため、モーラの前後を含めたアクセント
の変化に滑らかさが無くなる場合が生じ、音節又は文全
体としては不自然な合成音声になることがあった。
低から単純にピッチが決定されるため、画一的なピッチ
変化になって機械的な合成音声になり易かった。また、
音節と音節及び文節と文節のつながりについては全く考
慮されていないため、モーラの前後を含めたアクセント
の変化に滑らかさが無くなる場合が生じ、音節又は文全
体としては不自然な合成音声になることがあった。
【0012】そこで、モーラ単位及びモーラのつながり
のアクセント変化に自然性を高める抑揚制御方式を本願
出願人は既に提案している。
のアクセント変化に自然性を高める抑揚制御方式を本願
出願人は既に提案している。
【0013】この抑揚制御方式は、アクセント環境に応
じて、即ち当該モーラのアクセントの高低とフレーズ内
位置と継続音韻か否かと前後モーラのアクセントの高低
と文節句切りとの位置関係及び当該モーラ内の前後のピ
ッチ目標値に応じて、当該モーラ内のピッチの変化係数
を線形関数演算で求め、この演算結果でアクセント成分
量を制御する。
じて、即ち当該モーラのアクセントの高低とフレーズ内
位置と継続音韻か否かと前後モーラのアクセントの高低
と文節句切りとの位置関係及び当該モーラ内の前後のピ
ッチ目標値に応じて、当該モーラ内のピッチの変化係数
を線形関数演算で求め、この演算結果でアクセント成分
量を制御する。
【0014】
【発明が解決しようとする課題】アクセント環境に応じ
たアクセントパターンの制御では、ピッチの変化係数が
制御用変数を持つため、メンテナンスや変数設定時にア
クセントパターンがどのようなものになるかを直感的に
イメージするのが難しくなる。この問題はアクセントパ
ターンが多くなるほど増長される。また、アクセントパ
ターン生成のための関数や変数設定が複雑になる。
たアクセントパターンの制御では、ピッチの変化係数が
制御用変数を持つため、メンテナンスや変数設定時にア
クセントパターンがどのようなものになるかを直感的に
イメージするのが難しくなる。この問題はアクセントパ
ターンが多くなるほど増長される。また、アクセントパ
ターン生成のための関数や変数設定が複雑になる。
【0015】本発明の目的は、アクセント環境に応じた
アクセントパターンの生成,修正,変更を容易にし、ま
たアクセントパターンのイメージ把握を容易にするアク
セント成分制御方式を提供することにある。
アクセントパターンの生成,修正,変更を容易にし、ま
たアクセントパターンのイメージ把握を容易にするアク
セント成分制御方式を提供することにある。
【0016】
【課題を解決するための手段】本発明は前記課題の解決
を図るため、日本語処理された入力テキストに対し、該
入力テキストのフレーズ内モーラ数からフレーズ成分の
抑揚制御パターンを得、該入力テキストのフレーズ内各
モーラに定めるピッチ目標値をアクセント環境に応じて
補正及び補間処理によってアクセント成分の抑揚制御パ
ターンを得、前記フレーズ成分とアクセント成分を重ね
合わせて入力テキストの抑揚制御パターンを得る規則合
成方式の音声合成装置において、前記モーラのアクセン
ト環境別に基本アクセントパターンをテーブル化して記
憶する基本アクセントパターンテーブルと、入力される
モーラのアクセント環境に対応する基本アクセントパタ
ーンを前記テーブルから得て当該モーラのピッチを補正
する基本アクセントパターン生成処理部と、この処理部
の処理結果を日本語処理された句切り内モーラ数とモー
ラ位置によって補正してアクセント成分の抑揚制御パタ
ーンを得る補正処理部とを備え、前記基本アクセントパ
ターンテーブルにはアクセント環境別に実音声から抽出
生成したピッチデータを記憶し、該データの修正によっ
てアクセント成分を修正・変更することを特徴とする。
を図るため、日本語処理された入力テキストに対し、該
入力テキストのフレーズ内モーラ数からフレーズ成分の
抑揚制御パターンを得、該入力テキストのフレーズ内各
モーラに定めるピッチ目標値をアクセント環境に応じて
補正及び補間処理によってアクセント成分の抑揚制御パ
ターンを得、前記フレーズ成分とアクセント成分を重ね
合わせて入力テキストの抑揚制御パターンを得る規則合
成方式の音声合成装置において、前記モーラのアクセン
ト環境別に基本アクセントパターンをテーブル化して記
憶する基本アクセントパターンテーブルと、入力される
モーラのアクセント環境に対応する基本アクセントパタ
ーンを前記テーブルから得て当該モーラのピッチを補正
する基本アクセントパターン生成処理部と、この処理部
の処理結果を日本語処理された句切り内モーラ数とモー
ラ位置によって補正してアクセント成分の抑揚制御パタ
ーンを得る補正処理部とを備え、前記基本アクセントパ
ターンテーブルにはアクセント環境別に実音声から抽出
生成したピッチデータを記憶し、該データの修正によっ
てアクセント成分を修正・変更することを特徴とする。
【0017】
【作用】上記方式になる本発明は、モーラのアクセント
環境別に実音声から基本アクセントパターンデータを生
成及びテーブル化して記憶しておき、モーラのアクセン
ト成分を得るのに当該モーラのアクセント環境に応じて
テーブルデータを取り出してアクセントパターンの生成
処理を行い、その他の要因によるアクセント変化を補正
処理部で補正することでアクセント成分とする。これに
より、アクセントパターンの把握はテーブルデータから
直感的にイメージされ、また修正・変更は該テーブルデ
ータの修正・変更で済むようにする。
環境別に実音声から基本アクセントパターンデータを生
成及びテーブル化して記憶しておき、モーラのアクセン
ト成分を得るのに当該モーラのアクセント環境に応じて
テーブルデータを取り出してアクセントパターンの生成
処理を行い、その他の要因によるアクセント変化を補正
処理部で補正することでアクセント成分とする。これに
より、アクセントパターンの把握はテーブルデータから
直感的にイメージされ、また修正・変更は該テーブルデ
ータの修正・変更で済むようにする。
【0018】また、本発明では、テーブルデータとして
アクセント環境別に加えてモーラに対するアクセント句
境界別又はモーラの属性別にパターンを変えることで一
層実音声に近付けたアクセント成分を得、これによるア
クセントパターンの増大にもテーブルデータ化すること
でアクセントパターンの把握及び生成,修正等を容易に
する。
アクセント環境別に加えてモーラに対するアクセント句
境界別又はモーラの属性別にパターンを変えることで一
層実音声に近付けたアクセント成分を得、これによるア
クセントパターンの増大にもテーブルデータ化すること
でアクセントパターンの把握及び生成,修正等を容易に
する。
【0019】
【実施例】図1は本発明の一実施例を示す装置構成図で
ある。同図が図5と異なる部分は、アクセントパターン
算出部3Bに代えてアクセントパターン生成処理部5を
設けた点にある。
ある。同図が図5と異なる部分は、アクセントパターン
算出部3Bに代えてアクセントパターン生成処理部5を
設けた点にある。
【0020】アクセントパターン生成処理部5には入力
テキストの日本語処理結果として区切り内モーラ数と当
該モーラのアクセントパターン(前記表1参照)が与え
られる。このデータに対し、アクセントパターン生成処
理部5は、基本アクセントパターン生成処理部6と、基
本アクセントパターンテーブル7及び補正処理部8で構
成される。
テキストの日本語処理結果として区切り内モーラ数と当
該モーラのアクセントパターン(前記表1参照)が与え
られる。このデータに対し、アクセントパターン生成処
理部5は、基本アクセントパターン生成処理部6と、基
本アクセントパターンテーブル7及び補正処理部8で構
成される。
【0021】基本アクセントパターン生成処理部6は、
入力されたアクセント環境に対応する基本アクセントパ
ターンをテーブル7から読み出すための処理を行う。こ
の基本アクセントパターンテーブル7は、原音声のピッ
チ分析によって得られたパターンデータをテーブル化し
て予め記憶するもので、複数点のアクセント量が当該モ
ーラのアクセントとその前後アクセントとの組み合わせ
別にテーブル化される。
入力されたアクセント環境に対応する基本アクセントパ
ターンをテーブル7から読み出すための処理を行う。こ
の基本アクセントパターンテーブル7は、原音声のピッ
チ分析によって得られたパターンデータをテーブル化し
て予め記憶するもので、複数点のアクセント量が当該モ
ーラのアクセントとその前後アクセントとの組み合わせ
別にテーブル化される。
【0022】図2は基本アクセントテーブル作成手順図
を示す。(a)に示す実音声データベースは、人間によ
るアクセント環境別の発声音のピッチ分析によってアク
セントパターンをサンプルデータとして収集する。例え
ば、低いアクセントLと高いアクセントHとの組み合わ
せがLHLになる複数の原音声のピッチデータを収集す
る。これらデータはアクセント環境別に収集されること
から、当該モーラのアクセントの高低変化(LHL等)
が同じでも日本語処理結果のアクセントパターンから求
める継続音韻の有無,前後モーラのアクセント高低,文
節区切り等によって個々の組み合わせになるアクセント
環境別にデータ収集される。
を示す。(a)に示す実音声データベースは、人間によ
るアクセント環境別の発声音のピッチ分析によってアク
セントパターンをサンプルデータとして収集する。例え
ば、低いアクセントLと高いアクセントHとの組み合わ
せがLHLになる複数の原音声のピッチデータを収集す
る。これらデータはアクセント環境別に収集されること
から、当該モーラのアクセントの高低変化(LHL等)
が同じでも日本語処理結果のアクセントパターンから求
める継続音韻の有無,前後モーラのアクセント高低,文
節区切り等によって個々の組み合わせになるアクセント
環境別にデータ収集される。
【0023】同図(b)に示す基本アクセントパターン
テーブルは、実音声データベースのサンプルデータをア
クセント環境別に平均化することでサンプルデータのピ
ッチを基本アクセントパターンとして求める。このデー
タがテーブル7に記憶される。
テーブルは、実音声データベースのサンプルデータをア
クセント環境別に平均化することでサンプルデータのピ
ッチを基本アクセントパターンとして求める。このデー
タがテーブル7に記憶される。
【0024】図1に戻って、補正処理部8は、基本アク
セントパターン生成処理部6で生成された基本アクセン
トパターンを使い、このパターンを日本語処理されたア
クセントパターンの句切り内モーラ数とモーラ位置等に
よる補正量を求め、この補正量により基本アクセントパ
ターンを補正してアクセントパターンデータとしてフレ
ーズパターンとの合成のための出力を得る。
セントパターン生成処理部6で生成された基本アクセン
トパターンを使い、このパターンを日本語処理されたア
クセントパターンの句切り内モーラ数とモーラ位置等に
よる補正量を求め、この補正量により基本アクセントパ
ターンを補正してアクセントパターンデータとしてフレ
ーズパターンとの合成のための出力を得る。
【0025】上述の構成になるアクセントパターン生成
処理部5を備えることにより、アクセントパターンテー
ブル7には全てのアクセント環境に対応するアクセント
パターンデータが用意されることから、メンテナンスや
補正量設定の際にアクセント環境をインデックスとして
当該データを容易に検索できる。また、アクセントパタ
ーンは当該モーラについて複数点のアクセント量(ピッ
チ)としてテーブル7に記憶されることから、メンテナ
ンス等の際に当該モーラにおけるアクセントパターンの
イメージ把握が従来の変数係数や関数からのそれに較べ
て直感的で容易になり、係数の設定,修正等も容易にす
る。また、アクセントパターンデータは実音声から生成
され、従来の関数設定等に較べて容易になるし、実音声
に近いアクセントパターンになる。
処理部5を備えることにより、アクセントパターンテー
ブル7には全てのアクセント環境に対応するアクセント
パターンデータが用意されることから、メンテナンスや
補正量設定の際にアクセント環境をインデックスとして
当該データを容易に検索できる。また、アクセントパタ
ーンは当該モーラについて複数点のアクセント量(ピッ
チ)としてテーブル7に記憶されることから、メンテナ
ンス等の際に当該モーラにおけるアクセントパターンの
イメージ把握が従来の変数係数や関数からのそれに較べ
て直感的で容易になり、係数の設定,修正等も容易にす
る。また、アクセントパターンデータは実音声から生成
され、従来の関数設定等に較べて容易になるし、実音声
に近いアクセントパターンになる。
【0026】図3は本発明の他の実施例を示し、基本ア
クセントパターンテーブルを示す。同図では、実音声デ
ータベースからアクセント環境別に基本アクセントパタ
ーンテーブルを作成するのに、同じアクセント環境でも
アクセント句境界を当該モーラの先行に含む場合(前に
有り)と、当該モーラの後続に含む場合(後に有り)と
、アクセント境界を含まない場合(無し)とに応じて異
なるアクセントパターンになるアクセント量(ピッチ)
設定にする。
クセントパターンテーブルを示す。同図では、実音声デ
ータベースからアクセント環境別に基本アクセントパタ
ーンテーブルを作成するのに、同じアクセント環境でも
アクセント句境界を当該モーラの先行に含む場合(前に
有り)と、当該モーラの後続に含む場合(後に有り)と
、アクセント境界を含まない場合(無し)とに応じて異
なるアクセントパターンになるアクセント量(ピッチ)
設定にする。
【0027】このように、当該モーラに対するアクセン
ト句境界位置に応じた個別の基本アクセントパターンテ
ーブルを用意することにより、アクセントパターンの生
成処理結果にはアクセント句の境界が明確になり、明瞭
なアクセント句境界を持つ合成音声、即ちメリハリを持
たせた抑揚を持つ合成音声を得ることができる。
ト句境界位置に応じた個別の基本アクセントパターンテ
ーブルを用意することにより、アクセントパターンの生
成処理結果にはアクセント句の境界が明確になり、明瞭
なアクセント句境界を持つ合成音声、即ちメリハリを持
たせた抑揚を持つ合成音声を得ることができる。
【0028】図4は本発明の実施例を示し、基本アクセ
ントパターンテーブルを示す。同図ではアクセント環境
別に基本アクセントパターンテーブルを作成するのに、
モーラの属性(モーラの構成の違い)に応じて異なるア
クセントパターンになるアクセント量設定にする。モー
ラの属性は日本語処理結果として基本アクセントパター
ン生成処理部6に句切り内モーラ数及びアクセントパタ
ーンと共に与えられ、この属性とアクセント環境に応じ
てテーブルの同じ属性のものが取り出される。
ントパターンテーブルを示す。同図ではアクセント環境
別に基本アクセントパターンテーブルを作成するのに、
モーラの属性(モーラの構成の違い)に応じて異なるア
クセントパターンになるアクセント量設定にする。モー
ラの属性は日本語処理結果として基本アクセントパター
ン生成処理部6に句切り内モーラ数及びアクセントパタ
ーンと共に与えられ、この属性とアクセント環境に応じ
てテーブルの同じ属性のものが取り出される。
【0029】このようにモーラの属性に応じた個別の基
本アクセントパターンテーブルを用意することにより、
同じアクセント環境でも当該モーラが母音モーラか、有
声子音+母音モーラか、無声子音+母音モーラかによっ
て異なるアクセントパターンを得ることができ、さらに
母音部が長音部か否かによっても異なるアクセントパタ
ーンを得ることができる。これにより、モーラの属性の
違いによって異なる抑揚になる人の音声に近付けた合成
音声を得ることができる。
本アクセントパターンテーブルを用意することにより、
同じアクセント環境でも当該モーラが母音モーラか、有
声子音+母音モーラか、無声子音+母音モーラかによっ
て異なるアクセントパターンを得ることができ、さらに
母音部が長音部か否かによっても異なるアクセントパタ
ーンを得ることができる。これにより、モーラの属性の
違いによって異なる抑揚になる人の音声に近付けた合成
音声を得ることができる。
【0030】
【発明の効果】以上のとおり、本発明によれば、モーラ
のアクセント環境別の基本アクセントパターンをテーブ
ル化して記憶しておき、日本語処理したモーラのアクセ
ント環境に応じてテーブルデータを取り出してアクセン
ト生成処理を行い、句切り等による補正処理でアクセン
ト成分を得るため、アクセント環境別のアクセントパタ
ーンの把握がテーブルデータから直感的に行うことがで
き、また修正・変更にはテーブルデータの修正・変更に
よって容易になされるし、これら処理後のイメージ把握
も容易になる。また、基本アクセントパターンの生成は
実音声からなされるため、アクセントパターンデータの
生成に従来の関数や変数設定によることなく容易になさ
れ、しかも実音声が持つ微妙なアクセント変化に近付け
たアクセント成分を得ることができる。
のアクセント環境別の基本アクセントパターンをテーブ
ル化して記憶しておき、日本語処理したモーラのアクセ
ント環境に応じてテーブルデータを取り出してアクセン
ト生成処理を行い、句切り等による補正処理でアクセン
ト成分を得るため、アクセント環境別のアクセントパタ
ーンの把握がテーブルデータから直感的に行うことがで
き、また修正・変更にはテーブルデータの修正・変更に
よって容易になされるし、これら処理後のイメージ把握
も容易になる。また、基本アクセントパターンの生成は
実音声からなされるため、アクセントパターンデータの
生成に従来の関数や変数設定によることなく容易になさ
れ、しかも実音声が持つ微妙なアクセント変化に近付け
たアクセント成分を得ることができる。
【0031】また、本発明はアクセントパターンの生成
をアクセント環境のほかに当該モーラの句境界別にする
こと、又はモーラの属性別にすることにより、実音声に
近付けたアクセント成分生成になる。これらパターン生
成処理を付加した場合にもそのイメージ把握やパターン
修正・変更が難しくなることはない。
をアクセント環境のほかに当該モーラの句境界別にする
こと、又はモーラの属性別にすることにより、実音声に
近付けたアクセント成分生成になる。これらパターン生
成処理を付加した場合にもそのイメージ把握やパターン
修正・変更が難しくなることはない。
【図1】本発明の一実施例を示す装置構成図。
【図2】実施例における基本アクセントパターンテーブ
ルの作成手順図。
ルの作成手順図。
【図3】他の実施例の基本アクセントパターンテーブル
図。
図。
【図4】他の実施例の基本アクセントパターンテーブル
図。
図。
【図5】音声合成装置の構成図。
【図6】抑揚処理態様図。
1…テキスト入力部、2…日本語処理部、3…抑揚制御
部、3A…フレーズパターン算出部、4…音声合成部、
5…アクセントパターン生成処理部、6…基本アクセン
トパターン生成処理部、7…基本アクセントパターンテ
ーブル、8…補正処理部。
部、3A…フレーズパターン算出部、4…音声合成部、
5…アクセントパターン生成処理部、6…基本アクセン
トパターン生成処理部、7…基本アクセントパターンテ
ーブル、8…補正処理部。
Claims (3)
- 【請求項1】 日本語処理された入力テキストに対し
、該入力テキストのフレーズ内モーラ数からフレーズ成
分の抑揚制御パターンを得、該入力テキストのフレーズ
内各モーラに定めるピッチ目標値をアクセント環境に応
じて補正及び補間処理によってアクセント成分の抑揚制
御パターンを得、前記フレーズ成分とアクセント成分を
重ね合わせて入力テキストの抑揚制御パターンを得る規
則合成方式の音声合成装置において、前記モーラのアク
セント環境別に基本アクセントパターンをテーブル化し
て記憶する基本アクセントパターンテーブルと、入力さ
れるモーラのアクセント環境に対応する基本アクセント
パターンを前記テーブルから得て当該モーラのピッチを
補正する基本アクセントパターン生成処理部と、この処
理部の処理結果を日本語処理された句切り内モーラ数と
モーラ位置によって補正してアクセント成分の抑揚制御
パターンを得る補正処理部とを備え、前記基本アクセン
トパターンテーブルにはアクセント環境別に実音声から
抽出生成したピッチデータを記憶し、該データの修正に
よってアクセント成分を修正・変更することを特徴とす
る音声合成装置のアクセント成分制御方式。 - 【請求項2】 前記基本アクセントパターンテーブル
は、モーラのアクセント環境別かつアクセント句境界が
当該モーラの前に有る場合と後に有る場合と句境界が無
い場合に分けて異なる基本アクセントパターンを持つこ
とを特徴とする特許請求の範囲第1項に記載の音声合成
装置のアクセント成分制御方式。 - 【請求項3】 前記基本アクセントパターンテーブル
は、モーラのアクセント環境別かつ当該モーラが母音モ
ーラ,有声子音と母音モーラ,無声子音と母音モーラ及
び該母音部が長音部か否かによって定めるモーラの属性
別に基本アクセントパターンを持つことを特徴とする特
許請求の範囲第1項に記載の音声合成装置のアクセント
成分制御方式。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3101105A JP3070127B2 (ja) | 1991-05-07 | 1991-05-07 | 音声合成装置のアクセント成分制御方式 |
US08/232,438 US5463713A (en) | 1991-05-07 | 1994-04-21 | Synthesis of speech from text |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3101105A JP3070127B2 (ja) | 1991-05-07 | 1991-05-07 | 音声合成装置のアクセント成分制御方式 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH04331997A true JPH04331997A (ja) | 1992-11-19 |
JP3070127B2 JP3070127B2 (ja) | 2000-07-24 |
Family
ID=14291801
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP3101105A Expired - Lifetime JP3070127B2 (ja) | 1991-05-07 | 1991-05-07 | 音声合成装置のアクセント成分制御方式 |
Country Status (2)
Country | Link |
---|---|
US (1) | US5463713A (ja) |
JP (1) | JP3070127B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0763814A2 (en) * | 1995-09-15 | 1997-03-19 | AT&T Corp. | System and method for determining pitch contours |
JP2010079168A (ja) * | 2008-09-29 | 2010-04-08 | Toshiba Corp | 読み上げ情報生成装置、読み上げ情報生成方法及びプログラム |
Families Citing this family (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69327774T2 (de) * | 1992-11-18 | 2000-06-21 | Canon Information Systems, Inc. | Prozessor zur Umwandlung von Daten in Sprache und Ablaufsteuerung hierzu |
US5903867A (en) * | 1993-11-30 | 1999-05-11 | Sony Corporation | Information access system and recording system |
JP3450411B2 (ja) * | 1994-03-22 | 2003-09-22 | キヤノン株式会社 | 音声情報処理方法及び装置 |
JPH086591A (ja) * | 1994-06-15 | 1996-01-12 | Sony Corp | 音声出力装置 |
US20010003647A1 (en) * | 1995-06-07 | 2001-06-14 | Ji Sun | Coreatant-including electrochemiluminescent compounds, methods, systems and kits utilizing same |
US5893132A (en) | 1995-12-14 | 1999-04-06 | Motorola, Inc. | Method and system for encoding a book for reading using an electronic book |
WO1997022065A1 (en) * | 1995-12-14 | 1997-06-19 | Motorola Inc. | Electronic book and method of storing at least one book in an internal machine-readable storage medium |
US5761681A (en) * | 1995-12-14 | 1998-06-02 | Motorola, Inc. | Method of substituting names in an electronic book |
US5761682A (en) * | 1995-12-14 | 1998-06-02 | Motorola, Inc. | Electronic book and method of capturing and storing a quote therein |
US5815407A (en) * | 1995-12-14 | 1998-09-29 | Motorola Inc. | Method and device for inhibiting the operation of an electronic device during take-off and landing of an aircraft |
US5884262A (en) * | 1996-03-28 | 1999-03-16 | Bell Atlantic Network Services, Inc. | Computer network audio access and conversion system |
JPH1039895A (ja) * | 1996-07-25 | 1998-02-13 | Matsushita Electric Ind Co Ltd | 音声合成方法および装置 |
JPH1078952A (ja) * | 1996-07-29 | 1998-03-24 | Internatl Business Mach Corp <Ibm> | 音声合成方法、音声合成装置、ハイパーテキストの制御方法及び制御装置 |
US5950162A (en) * | 1996-10-30 | 1999-09-07 | Motorola, Inc. | Method, device and system for generating segment durations in a text-to-speech system |
US7027568B1 (en) | 1997-10-10 | 2006-04-11 | Verizon Services Corp. | Personal message service with enhanced text to speech synthesis |
KR100238189B1 (ko) * | 1997-10-16 | 2000-01-15 | 윤종용 | 다중 언어 tts장치 및 다중 언어 tts 처리 방법 |
JP3576840B2 (ja) * | 1997-11-28 | 2004-10-13 | 松下電器産業株式会社 | 基本周波数パタン生成方法、基本周波数パタン生成装置及びプログラム記録媒体 |
CA2366952A1 (en) | 1999-03-15 | 2000-09-21 | British Telecommunications Public Limited Company | Speech synthesis |
JP2000305585A (ja) * | 1999-04-23 | 2000-11-02 | Oki Electric Ind Co Ltd | 音声合成装置 |
US6178402B1 (en) | 1999-04-29 | 2001-01-23 | Motorola, Inc. | Method, apparatus and system for generating acoustic parameters in a text-to-speech system using a neural network |
JP2001100776A (ja) * | 1999-09-30 | 2001-04-13 | Arcadia:Kk | 音声合成装置 |
US6526382B1 (en) | 1999-12-07 | 2003-02-25 | Comverse, Inc. | Language-oriented user interfaces for voice activated services |
JP2001293247A (ja) * | 2000-02-07 | 2001-10-23 | Sony Computer Entertainment Inc | ゲーム制御方法 |
IL139347A0 (en) * | 2000-10-30 | 2001-11-25 | Speech generating system and method | |
US20040030555A1 (en) * | 2002-08-12 | 2004-02-12 | Oregon Health & Science University | System and method for concatenating acoustic contours for speech synthesis |
US7593842B2 (en) * | 2002-12-10 | 2009-09-22 | Leslie Rousseau | Device and method for translating language |
CN101379549B (zh) * | 2006-02-08 | 2011-11-23 | 日本电气株式会社 | 声音合成装置、声音合成方法 |
JP4744338B2 (ja) * | 2006-03-31 | 2011-08-10 | 富士通株式会社 | 合成音声生成装置 |
CN101606190B (zh) * | 2007-02-19 | 2012-01-18 | 松下电器产业株式会社 | 用力声音转换装置、声音转换装置、声音合成装置、声音转换方法、声音合成方法 |
CN101627427B (zh) * | 2007-10-01 | 2012-07-04 | 松下电器产业株式会社 | 声音强调装置及声音强调方法 |
JP2014038282A (ja) * | 2012-08-20 | 2014-02-27 | Toshiba Corp | 韻律編集装置、方法およびプログラム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BG24190A1 (en) * | 1976-09-08 | 1978-01-10 | Antonov | Method of synthesis of speech and device for effecting same |
NL8200726A (nl) * | 1982-02-24 | 1983-09-16 | Philips Nv | Inrichting voor het genereren van de auditieve informatie van een verzameling karakters. |
JPH0642158B2 (ja) * | 1983-11-01 | 1994-06-01 | 日本電気株式会社 | 音声合成装置 |
US4799261A (en) * | 1983-11-03 | 1989-01-17 | Texas Instruments Incorporated | Low data rate speech encoding employing syllable duration patterns |
-
1991
- 1991-05-07 JP JP3101105A patent/JP3070127B2/ja not_active Expired - Lifetime
-
1994
- 1994-04-21 US US08/232,438 patent/US5463713A/en not_active Expired - Fee Related
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0763814A2 (en) * | 1995-09-15 | 1997-03-19 | AT&T Corp. | System and method for determining pitch contours |
EP0763814A3 (en) * | 1995-09-15 | 1998-06-03 | AT&T Corp. | System and method for determining pitch contours |
JP2010079168A (ja) * | 2008-09-29 | 2010-04-08 | Toshiba Corp | 読み上げ情報生成装置、読み上げ情報生成方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP3070127B2 (ja) | 2000-07-24 |
US5463713A (en) | 1995-10-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3070127B2 (ja) | 音声合成装置のアクセント成分制御方式 | |
JP2006227589A (ja) | 音声合成装置および音声合成方法 | |
JPH0632020B2 (ja) | 音声合成方法および装置 | |
JP2761552B2 (ja) | 音声合成方法 | |
JP2001242882A (ja) | 音声合成方法及び音声合成装置 | |
JP5106274B2 (ja) | 音声処理装置、音声処理方法及びプログラム | |
CA2343071A1 (en) | Device and method for digital voice processing | |
van Rijnsoever | A multilingual text-to-speech system | |
JPH0580791A (ja) | 音声規則合成装置および方法 | |
JPH07140996A (ja) | 音声規則合成装置 | |
JP3303428B2 (ja) | 音声合成装置のアクセント成分基本テーブルの作成方法 | |
JPH0887289A (ja) | 音声規則合成装置 | |
JP2961819B2 (ja) | 音声合成装置の抑揚制御方法 | |
JP3614874B2 (ja) | 音声合成装置及び方法 | |
JP5999092B2 (ja) | ピッチパタン生成方法、ピッチパタン生成装置、音声合成装置およびピッチパタン生成プログラム | |
JPH06332490A (ja) | 音声合成装置のアクセント成分基本テーブルの作成方法 | |
JP2703253B2 (ja) | 音声合成装置 | |
JP2001265374A (ja) | 音声合成装置及び記録媒体 | |
JP3314116B2 (ja) | 音声規則合成装置 | |
JP3397406B2 (ja) | 音声合成装置及び音声合成方法 | |
JP3292218B2 (ja) | 音声メッセージ作成装置 | |
JPH09292897A (ja) | 音声合成装置 | |
JP2573587B2 (ja) | ピッチパタン生成装置 | |
JPH0990987A (ja) | 音声合成方法及び装置 | |
JPH06138894A (ja) | 音声合成装置及び音声合成方法 |