JPH05134691A - 音声合成方法および装置 - Google Patents

音声合成方法および装置

Info

Publication number
JPH05134691A
JPH05134691A JP3311570A JP31157091A JPH05134691A JP H05134691 A JPH05134691 A JP H05134691A JP 3311570 A JP3311570 A JP 3311570A JP 31157091 A JP31157091 A JP 31157091A JP H05134691 A JPH05134691 A JP H05134691A
Authority
JP
Japan
Prior art keywords
boundary
clauses
determining
bunsetsus
degree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3311570A
Other languages
English (en)
Other versions
JP3006240B2 (ja
Inventor
Kazuhiro Suzuki
和洋 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP3311570A priority Critical patent/JP3006240B2/ja
Publication of JPH05134691A publication Critical patent/JPH05134691A/ja
Application granted granted Critical
Publication of JP3006240B2 publication Critical patent/JP3006240B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】文全体の構造を完全に分析することなく、ロー
カルな文節間の係り受けの情報と発声長等の制限とに基
づいてポーズ、イントネーション、アクセントを制御す
る。 【構成】ローカル・アナリシス処理部4では辞書情報に
基づいて前後3つの文節の間の係り受けα、βおよび
α'の有無を決定し、この係り受けの有無α、βおよび
α'のパターンから暫定的なポーズ、イントネーション
を決定し、こののちグローバル・アナリシス処理部5で
発話長制限やイントネーションの継続長の制限に基づい
てポーズ、イントネーションの位置を修正する。音素片
情報生成部6で、ポーズ、イントネーション等の発話属
性をも考慮して音素片情報が生成され、音声合成部2に
供給され、発音される。

Description

【発明の詳細な説明】
【0001】
【産業上の応用分野】この発明は日本語テキスト音声合
成に関し、とくに任意の日本語文に対して、ポーズ、ア
クセントおよびイントネーションなどの発話の属性を簡
易に求め、自然な韻律を生成できるようにしたものであ
る。
【0002】
【従来の技術】日本語テキスト音声合成において、ポー
ズの位置、アクセント、イントネーションなどがどうな
っているかといった発話構造を正しく求め、自然な韻律
を持った合成音声を生成することは、合成音声の聞き易
さの点で重要なことである。
【0003】しかしながら、これらの情報は文字の並び
からすぐに求められるものではない。ポーズに関してい
えば、句読点で文がある程度区分されているものの、実
際には句読点のない文は新聞を始め、非常に多くみら
れ、単なる句読点だけの処理ではポーズの挿入位置の決
定に不十分である。また、アクセントについても、前後
間で修飾、被修飾の関係があるかないかでアクセントの
形式が異なってくる。さらに、ポーズと同様に文中のあ
る程度大きな区切りでイントネーションの変化が生じて
いる。
【0004】従来よりこれらのポーズ、アクセント、イ
ントネーションなどといった発話の属性は文の構造と関
連していることが明らかになっている(「統語構造を利
用した韻律記号導出アルゴリズム」、藤崎博也等、日本
音響学会講演論文集、昭和61年3月pp167−16
8)。しかしながら、文全体の構造を正確に求めること
は、単語の意味、文の意味、さらには文脈など様々な情
報が必要であり、しかも非常に煩雑な計算を必要とし、
実際に実現するのは大変困難である。
【0005】また、一方において、こうした構造を用い
ず、付属語の種類や文節の前後の関係だけを考慮して、
話調構造を求めているものもある。しかしながら、こう
したものは、十分に発話の属性が実現されないため、そ
の合成音声は、切れ切れであったり、また逆に切れ目の
ないものであったりして、人間の発声する音声の自然性
を再現できていない(特開昭60−246436号公
報、特開昭61−77896号公報)。こうしたもの
は、とくに比較的長い文章や複雑な構造を持った文章に
対しては、不向きであり、任意の文章に自然な韻律を生
成する必要のあるテキスト音声合成には十分ではない。
【0006】他の関連特許文献としては、特開平2−1
15898号公報および特開昭51−28702号公報
がある。前者では、文節の結合の強さと、発声長とでポ
ーズ挿入位置を決定している。後者では、構文ツリーの
深さと句の長さとからポーズ挿入位置を決定している。
しかしながら、いずれも部分的なかかり受け関係を用い
て発話の属性を決定することを開示していない。
【0007】
【発明が解決しようとしている問題点】この発明は、以
上の事情を考慮した上でなされたものであり、文全体の
構造を求めることなく、簡易な処理が可能であり、しか
も発話の本来の属性に忠実にポーズ、アクセントおよび
イントネーションを決定できる音声合成方法および装置
を提供することを目的としている。
【0008】
【問題を解決するための手段】この発明は、文の局所的
構造と人間の発声における制約とに着目しなされたもの
である。この発明では、文全体の構文解析をすることな
く、以下の二つの処理で文の話調構造を決定する。ま
ず、最初の段階では、隣合わせたN個の文節の間の局所
的な構造に着目して、その係り受けの関係から局所的に
決まる話調構造を求めている。Nはたとえば3である。
Nが3の場合、3つの文節の間の係り受けのパターン
は、2x2x2個すなわち8個である。この中の2つの
パターンは実現不可能なため他のパターンに置き換えら
れ、正しい組み合わせは6個となる。3文節間での係り
受け構造をとらえることによって、局所的な構造を正確
に求めることができる。つぎの段階では、求められた文
の局所的な構造と、人間の発声の制限や発話のスタイ
ル、発話のバランスを考慮し、文全体にわたる発話構造
を求める。人が音声を発声する場合、文の構造がいかな
るものであろうと、一息で読める長さやイントネーショ
ンは制限されてくる。本発明は、このような点に着目
し、その観点から出てくる幾つかの発話の条件をもと
に、前段階で求められた局所的な話調構造に修正を加
え、文法的にも発話的にも最適な文全体の発話構造の設
定を行なう。
【0009】
【実施例】以下この発明を日本語テキスト音声合成に適
用した一実施例について図面を参照して説明しよう。な
おテキスト音声合成は任意の入力テキストから自動的に
音声合成を行なうものであり、一般に(1)テキスト入
力、(2)文章解析、(3)音声合成及び(4)音声出
力の4つのステージを有している。(2)のステージで
は漢字・カナ変換辞書や韻律規則を参照して音韻および
韻律のデータを決定する。(3)のステージではパラメ
ータ・ファイルを参照して合成パラメータを順次取り出
すようにする。この発明の関連するは(2)のステージ
の一部分にあたる。他のステージは従前のものと同様に
行うので、ここでは詳細な説明を省略する。
【0010】図1は、この実施例の日本語テキスト音声
合成システムを全体として示すものであり、この図にお
いて、文章解析部1はかな漢字混じりの日本語文入力を
受け取って文章解析を行い、その結果を音声合成部2に
供給する。音声合成部2は文章解析結果に基づいて音声
合成を行う。文章解析部1は、文節分割処理部3、ロー
カル・アナリシス処理4、グローバル・アナリシス処理
部5および音素片情報生成処理部6から構成されてい
る。
【0011】文節分割処理部3では、入力されたテキス
トを自立語辞書、付属語辞書を用いて最長一致法により
文節列に分割する。この時点で、テキストの読みの情
報、単語の文法情報およびアクセントが得られる。ロー
カル・アナリシス処理部4では、得られた文法情報をも
とに求められた文節列に対して隣接する3文節間の部分
的な係り受けの関係を求める。この時点において、文の
局所的な構造から、それに関連する話調構造(アクセン
ト結合)が得られ、また、文全体にわたる話調構造の初
期設定を行なうことができる。グローバル・アナリシス
処理部5では、ローカル・アナリシス処理部4で求めら
れた話調構造の初期設定に対し、人間の発話の制限や発
声のスタイルやバランスなどを考慮して修正し、ポーズ
の位置やイントネーションといった文全体に関連する話
調構造を最終的に決定する。音素片情報生成処理部6で
は求められた各種の話調構造をもとに、実際に音声合成
部2で音声を合成するためのデータとなる音素片データ
を作成している。作成された音素片のデータは、音声合
成部2へ渡され、ここで音声波形が生成され合成音声が
出力される。
【0012】つぎに文節分割処理部3の処理について説
明する。図1において、入力された日本語文は、文節に
分割される。この分割に際しては、自立語辞書、および
付属語辞書を用い、二文節最長一致法を用いている。こ
の過程で、文節の係り受けの関係を明らかにするための
文節の修飾の情報を単語の品詞や付属語の種類などから
修飾情報のテーブルを用いて生成する。この文節分割の
例を図2に示す。たとえば、文章 「四国の南には前線を伴う発達した低気圧がある。」 の最初の3つの文節について考えてみよう。最初の文節
「四国の」は名詞「四国」と付属語「の」という2つの
単語に分解できる。この単語の並びから文節の係り受け
の性質を求めるため、係り受け情報のテーブルを参照す
る。この場合、この文節の受けの情報は先頭にくる単語
が「四国」であることから名詞ということが、また、文
節の係りの情報は付属語「の」の性質より、名詞または
用言ということになる。
【0013】つぎにローカル・アナリシス処理部4の処
理について説明する。文節分割で分割された、係り受け
情報が割り出された文節列に対して、つぎに、ローカル
・アナリシス処理を行なう。この処理の流れを図3に示
す。ローカル・アナリシス処理では、最初に、文節間の
局所的な構造を調べ、その構造から局所的に決まる話調
構造を生成し、さらに、文全体の話調構造の候補として
の初期設定を行なう。まず、図4に示したように3つの
文節ごとに窓枠をかけ、この中の文節間の関係、文の局
所的な構造を求める。この解析の例を図5に示す。ここ
では、先頭の「四国の」、「南には」、「前線を」の3
つの文節の係り受けの可能性を調べている。
【0014】3つの文節の係り受けは、求められた文節
の係り受けの情報をもとに、図5のα、β、α' の3つ
の矢印で示した係り受けのパターンの組み合わせで表現
される。αは第1文節Aと第2文節Bとの間の係り受け
に関する。βは第1文節Aと第3文節Cとの間の係り受
けに関し、α'は第2文節Bと第3文節Cとの間の係り
受けに関するものである。図5の例では「四国の」とい
う文節は「南には」にも「前線を」にも係ることが可能
であり、あいまい性を持っている。そして、「南には」
と「前線を」の間には係り受けの関係はない。
【0015】この3つの係り受けの有り無しをそれぞれ
(1,0)で表現すると3文節間の係り受けは図6に示
した8種類となり、図5の例は (α,β,α') =(1,
1,0)のパターン(ケース6)に当たる。なお文末に
関しては、係り受けのない仮想の文節を考え、文の最終
文節には(0,0,0)というパターン、また文の最後
から2つの文節については(1,0,0)または(0,
0,0)のパターンを当てはめる。以上の処理で各文節
間に(α,β,α')で表現される8つパターンが指定
されたが、この中で、つぎの2つのパターンは係り受け
非交差の法則から、つぎのパターンに修正することがで
きる。 ケース6(1,1,0) → ケース0(1,0,0) ケース7(1,1,1) → ケース2(1,0,1)
【0016】以上求められた計6つのパターンをもと
に、以下に示した4つの、話調構造を求めるためのルー
ルにより、文節Aと文節Bとの間にどのような話調構造
を指定するかを得ることができる。これらのルールは、
文節A、文節B間の結合の強さの度合いに応じている。 (1)(α,β,α')=(1,0,0)または(1,
0,1)の場合 この場合は、文節A、B間は極めて強い結合を持ってい
るためアクセント結合を行なう。 (2)(α,β,α')=(1,1,1) この場合は、文節A、B間はあいまい結合となってい
る。この部分の話調構造の指定はつぎのグローバル・ア
ナリシス処理で行なう。 (3)(α,β,α')=(0,1,1) この場合は、文節A、B間にはある程度大きな切れ目が
ある。ここでは、イントネーションの変化(声の調子の
立て直し)を行なうが、これについてもつぎのグローバ
ル・アナリシス処理で文全体を考慮して決定する。 (4)(α,β,α')=(0,0,0)または(0,
0,1) この場合は、文節A、B間には極めて大きな切れ目があ
る。ここでは、ポーズを指定する。
【0017】以上のローカル・アナリシス処理におい
て、文節間の局所的に決まるアクセント結合の位置やポ
ーズ位置の候補、イントネーションの変化の位置の候補
を得ることができた。これらの情報をもとに人間の発声
の制限や文全体のバランス、スタイルなどを考慮してグ
ローバル・アナリシス処理において、最終的な発話構造
を決定できる。
【0018】つぎにグローバル・アナリシス処理部6の
処理について説明する。図7はグローバル・アナリシス
処理部6の処理を示す。まず、グローバル・アナリシス
処理では、発声の要因を考慮し、ローカル・アナリシス
処理部5で設定された話調構造が、制限値の範囲内であ
るかどうかをチェックする。つぎに、これらの制限を超
えている場合に分割スタイル、バランスを考慮して最適
な話調構造を指定する。
【0019】グロバール・アナリシス処理部6で用いら
れる制限値は、以下の2つである。これらは、いずれ
も、人の発声の要因や聴感上の自然性に起因している。 ・一回の呼気で続けられる長さ(呼気段落)の最長値
LBMAX(25モーラ) ・一回のイントネーションで続けられる長さ(話調成
分)の最長値 LPMAX(22モーラ) ローカル・アナリシス処理において設定された話調構造
に対して、これらの制限値が当てはまっているかどうか
を見ていき、制限値を超えているものがある場合に、以
下のような分割を行なう。なおグローバル・アナリシス
はまず呼気段落について実行され、つぎに話調成分につ
いて実行される。
【0020】まず、長い呼気段落または話調成分の中で
最も切れやすい文節間を求めるため、各文節間での分割
スコアを求める。ここで先頭からi番目の文節間での分
割スコアをSiとするとSiは下記のような式によって計
算される。
【数1】 ここでPWi、MWiはそれぞれその文節間の位置に関す
る重みと修飾の種類に関する重みである。
【0021】まず、文節間の位置に関する重みPWiを
求めるために、制限値よりも長い呼気段落または話調成
分をいくつに分割するかの値、分割数Nを求める。 この
とき、話調成分に関しては分割数Nは常に2で、呼気段
落の分割に限り、Nは2以上の数としている。以下に
Nの決定式を示す。ここで4/5の値は、経験的に求め
られたものである。
【数2】 各文節間のその呼気段落の先頭からのモーラ数をMiと
すると位置に関する重みは、つぎの式で与えられる。
【数3】 ここで、W1、W2の値は呼気段落の分割と話調成分の
分割で異なり以下の通りである。この値も経験的に求め
られたものである W1:60 W2:30 (呼気段落分割の場合) W1:90 W2: 0 (話調成分分割の場合)
【0022】また、修飾の種類に関する重みMWiは下
記のように与えられている。
【数4】 ここで、CWiは修飾の種類に基づいて経験的に求めら
れた重み付けであり、図8で示されるようなテーブルが
用意されており、このテーブルの値を参照することによ
って求められる。このように計算された中で最もスコア
の高い文節間で分割することにより、最適な位置での分
割が可能となる。なおこの処理は、再帰的に繰り返さ
れ、グローバル・アナリシス処理部6の2つの条件をす
べて満たすまで続けられる。
【0023】以上、ローカル・アナリシス処理、グロー
バル・アナリシス処理を通して求められた話調構造は、
最後に読みの情報と組み合わされ、音素片処理において
各素片ごとのデータに変換される。各素片のデータは、
素片の長さ、アクセントパターン、話調パターンを生成
するパラメーターを持っている。また、ポーズについて
は無音に対応する素片データをポーズ位置に挿入するこ
とによって実現する。このデータをもとに音声合成部2
により、合成音声が出力される。
【0024】つぎに具体的な処理の例を下記の[表1]
〜[表7]に示す。入力日本語文は[表1]に示すよう
に、「四国の南には前線を伴う発達した低気圧があ
る。」である。この入力日本語文は、まず、形態素解析
され、[表2]に示すような文節の情報が得られる。こ
こで、ローカル・アナリシス処理を行なう場合、[表
3]に示すように3文節係り受けパターンが求められ、
[表4]に示すように話調構造の初期設定がなされる。
さらに、[表5]に示しように、グローバル・アナリシ
ス処理において、制限を当てはめる。この例において
は、全文が一つの呼気段落となり、呼気段落の最長値の
制限に当てはまる。そこで、各文節境界ごとに分割に関
する位置の重みPWと修飾の種類に関する重みMWを求
め、その積として分割スコアが与えられる。この場合は
[表6]に示すように「南には」と「前線を」の間が最
も高く、ここにポーズを挿入する。最後に、求められた
話調構造は音素片情報生成処理において、[表7]に示
すような音声合成部2で処理される音素片ごとのデータ
の形式に変換され、音声合成部2に送られる。
【0025】[表1] 入力文 四国の南には前線を伴う発達した低気圧がある。 [表2] 文節分割処理 四国の → 南には → 前線を → 伴う → 分割形態 (名詞+「ノ」) (名詞+「ニ」「ハ」) (名詞+「ヲ」) (動詞(連体形)) 受け情報 名詞 名詞 名詞 動詞 係り情報 名詞,動詞 用言 動詞 名詞 → 発達した 低気圧がある。 (サ変名詞+「シ」「タ」) (名詞+「カ゛」「アル」) 動詞 名詞,動詞 名詞 [表3] ローカル・アナリシス処理(その1) 四国の 南には 前線を 伴う 発達した 低気圧がある。 α 1 0 1 0 1 0 β 1→0 1 1→0 1 0 0 α' 0 1 0 1 0 0 モーラ数 4 5 5 4 6 8
【表1】 [表5] グローバル・アナリシス処理(その1) (呼気段落の最長値 25モーラ < 32モーラ) 四国の 南には 前線を 伴う 発達した 低気圧がある。 M 4 9 14 18 24 PW 45 64 83 83 60 MW 3 80 9 30 9 PW*MW 135 5120 747 2490 540 *
【表2】
【表3】
【0026】なお以上の例では話調成分の継続長が制限
値22を超えないので、話長成分の特性はローカル・ア
ナリシスのままであり、修正されない。22を超えると
きには上述の呼気段落の修正と同様に行える。またアク
セントは基本的には文節または単語レベルで決定され、
アクセント結合等のローカル・アナリシスの結果で修正
が加わる。さらにポーズやイントネーションで微調整さ
れる。
【0027】また図1の実施例は各機能を実現する複数
のブロックで構成されているが、このようなブロックを
ハードウェアで実現してもよいし、コンピュータたとえ
ばパーソナル・コンピュータのソフトウェアとして実現
してもよい。また一部をソフトウェアとし、他をハード
ウェアまたは拡張用のカードで実現してもよい。
【0028】
【発明の効果】以上説明したように。この発明によれ
ば、文が文節に分割され、その文法情報が分かっている
場合に、文の局所的な構造と発話の制限だけを考慮し
て、比較的簡単に発話構造などを求めることができる。
この発明は日本語テキスト音声合成において、発声速度
を変化させる場合や発声のスタイルを変える場合にで
も、制限のパラメーターを変更するだけで対応ができ
る。たとえば、早い発声を実現するときは、呼気段落の
最長値を長くすることによって、よりポーズの少ない話
調構造を実現でき、逆に、呼気段落の最長値を短くすれ
ば、区切りの多い明確な発声のスタイルを実現できる。
【図面の簡単な説明】
【図1】 この発明の一実施例の音声合成システムを全
体として示すブロック図である。
【図2】 上述実施例の文節分割を説明する図である。
【図3】 上述実施例のローカル・アナリシスを説明す
る図である。
【図4】 上述実施例のローカル・アナリシスを説明す
る図である。
【図5】 上述実施例のローカル・アナリシスを説明す
る図である。
【図6】 上述実施例のローカル・アナリシスを説明す
る図である。
【図7】 上述実施例のグローバル・アナリシスを説明
する図である。
【図8】 上述実施例のグローバル・アナリシスを説明
する図である。
【符合の説明】
1…文章解析部 2…音声合成部 3…文節分割処理部 4…ローカル・アナリシス処理部 5…グローバル・アナリシス処理部 6…音素片情報生成処理部

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 入力文字列を文節に分割するステップ
    と、 隣接する文節の境界の各々において、当該境界の周囲の
    所定数の文節の間の係り受け関係を辞書情報に基づいて
    決定するステップと、 上記境界の各々について、上記周囲の所定数の文節の間
    の係り受け関係に基づいて当該境界の前後の文節の結合
    度を判別するステップと、 上記結合度と発声長の制約とに基づいて当該境界にポー
    ズを挿入するかどうかを決定するステップとを有するこ
    とを特徴とする音声合成方法。
  2. 【請求項2】 上記所定数を3とした請求項1記載の音
    声合成方法。
  3. 【請求項3】 上記係り受け関係を、当該境界の前の1
    文節、当該境界の後の1文節、および上記後の1文節の
    後の1文節の間について決定する請求項2記載の音声合
    成方法。
  4. 【請求項4】 入力文字列を文節に分割するステップ
    と、 隣接する文節の境界の各々において、当該境界の周囲の
    所定数の文節の間の係り受け関係を辞書情報に基づいて
    決定するステップと、 上記境界の各々について、上記周囲の所定数の文節の間
    の係り受け関係に基づいて当該境界の前後の文節の結合
    度を判別するステップと、 上記結合度とイントネーション1つ当たりの継続長の制
    約とに基づいて当該境界の後にイントネーションを挿入
    するかどうかを決定するステップとを有することを特徴
    とする音声合成方法。
  5. 【請求項5】 入力文字列を文節に分割するステップ
    と、 隣接する文節の境界の各々において、当該境界の周囲の
    所定数の文節の間の係り受け関係を辞書情報に基づいて
    決定するステップと、 上記境界の各々について、上記周囲の所定数の文節の間
    の係り受け関係に基づいて当該境界の前後の文節の結合
    度を判別するステップと、 上記結合度に基づいてアクセントを修正するステップと
    を有することを特徴とする音声合成方法。
  6. 【請求項6】 入力文字列を文節に分割するステップ
    と、 隣接する文節の境界の各々において、当該境界の周囲の
    所定数の文節の間の係り受け関係を辞書情報に基づいて
    決定するステップと、 上記境界の各々について、上記周囲の所定数の文節の間
    の係り受け関係に基づいて当該境界の前後の文節の結合
    度を判別するステップと、 上記結合度と発声長の制約とに基づいて当該境界にポー
    ズを挿入するかどうかを決定するステップと、 上記結合度とイントネーション1つ当たりの継続長の制
    約とに基づいて当該境界の後にイントネーションを挿入
    するかどうかを決定するステップと、 上記結合度に基づいてアクセントを修正するステップと
    を有することを特徴とする音声合成方法。
  7. 【請求項7】 上記イントネーションおよびポーズの有
    無に基づいて、アクセントの修正を行う請求項6記載の
    音声合成方法。
  8. 【請求項8】 入力文字列を文節に分割する手段と、 隣接する文節の境界の各々において、当該境界の周囲の
    所定数の文節の間の係り受け関係を辞書情報に基づいて
    決定する手段と、 上記境界の各々について、上記周囲の所定数の文節の間
    の係り受け関係に基づいて当該境界の前後の文節の結合
    度を判別する手段と、 上記結合度と発声長の制約とに基づいて当該境界にポー
    ズを挿入するかどうかを決定する手段とを有することを
    特徴とする音声合成装置。
  9. 【請求項9】 入力文字列を文節に分割する手段と、 隣接する文節の境界の各々において、当該境界の周囲の
    所定数の文節の間の係り受け関係を辞書情報に基づいて
    決定する手段と、 上記境界の各々について、上記周囲の所定数の文節の間
    の係り受け関係に基づいて当該境界の前後の文節の結合
    度を判別する手段と、 上記結合度とイントネーション1つ当たりの継続長の制
    約とに基づいて当該境界の後にイントネーションを挿入
    するかどうかを決定する手段とを有することを特徴とす
    る音声合成装置。
  10. 【請求項10】 入力文字列を文節に分割する手段と、 隣接する文節の境界の各々において、当該境界の周囲の
    所定数の文節の間の係り受け関係を辞書情報に基づいて
    決定する手段と、 上記境界の各々について、上記周囲の所定数の文節の間
    の係り受け関係に基づいて当該境界の前後の文節の結合
    度を判別する手段と、 上記結合度に基づいてアクセントを修正する手段とを有
    することを特徴とする音声合成装置。
JP3311570A 1991-10-31 1991-10-31 音声合成方法および装置 Expired - Fee Related JP3006240B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3311570A JP3006240B2 (ja) 1991-10-31 1991-10-31 音声合成方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3311570A JP3006240B2 (ja) 1991-10-31 1991-10-31 音声合成方法および装置

Publications (2)

Publication Number Publication Date
JPH05134691A true JPH05134691A (ja) 1993-05-28
JP3006240B2 JP3006240B2 (ja) 2000-02-07

Family

ID=18018825

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3311570A Expired - Fee Related JP3006240B2 (ja) 1991-10-31 1991-10-31 音声合成方法および装置

Country Status (1)

Country Link
JP (1) JP3006240B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002149180A (ja) * 2000-11-16 2002-05-24 Matsushita Electric Ind Co Ltd 音声合成装置および音声合成方法
JP2015102773A (ja) * 2013-11-27 2015-06-04 日産自動車株式会社 音声発生装置、音声変形装置及び方法
JP2015102772A (ja) * 2013-11-27 2015-06-04 日産自動車株式会社 音声発生装置、音声変形装置及び方法
JP2015102771A (ja) * 2013-11-27 2015-06-04 日産自動車株式会社 音声発生装置、音声変形装置及び方法
CN116312485A (zh) * 2023-05-23 2023-06-23 广州小鹏汽车科技有限公司 语音识别方法、装置及车辆

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5847719A (ja) * 1981-09-11 1983-03-19 Hitachi Ltd 仕分制御装置
JPS60195596A (ja) * 1984-03-19 1985-10-04 三洋電機株式会社 音声合成装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5847719A (ja) * 1981-09-11 1983-03-19 Hitachi Ltd 仕分制御装置
JPS60195596A (ja) * 1984-03-19 1985-10-04 三洋電機株式会社 音声合成装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002149180A (ja) * 2000-11-16 2002-05-24 Matsushita Electric Ind Co Ltd 音声合成装置および音声合成方法
JP4636673B2 (ja) * 2000-11-16 2011-02-23 パナソニック株式会社 音声合成装置および音声合成方法
JP2015102773A (ja) * 2013-11-27 2015-06-04 日産自動車株式会社 音声発生装置、音声変形装置及び方法
JP2015102772A (ja) * 2013-11-27 2015-06-04 日産自動車株式会社 音声発生装置、音声変形装置及び方法
JP2015102771A (ja) * 2013-11-27 2015-06-04 日産自動車株式会社 音声発生装置、音声変形装置及び方法
CN116312485A (zh) * 2023-05-23 2023-06-23 广州小鹏汽车科技有限公司 语音识别方法、装置及车辆
CN116312485B (zh) * 2023-05-23 2023-08-25 广州小鹏汽车科技有限公司 语音识别方法、装置及车辆

Also Published As

Publication number Publication date
JP3006240B2 (ja) 2000-02-07

Similar Documents

Publication Publication Date Title
US6751592B1 (en) Speech synthesizing apparatus, and recording medium that stores text-to-speech conversion program and can be read mechanically
US6778962B1 (en) Speech synthesis with prosodic model data and accent type
US6470316B1 (en) Speech synthesis apparatus having prosody generator with user-set speech-rate- or adjusted phoneme-duration-dependent selective vowel devoicing
EP0688011B1 (en) Audio output unit and method thereof
US6829581B2 (en) Method for prosody generation by unit selection from an imitation speech database
JP2006048056A (ja) 混合言語テキスト音声合成
WO2004066271A1 (ja) 音声合成装置,音声合成方法および音声合成システム
HIROSE et al. A system for the synthesis of high-quality speech from texts on general weather conditions
JP3006240B2 (ja) 音声合成方法および装置
KR100499116B1 (ko) 음성합성을 위한 끊어읽기 방법 및 그 장치
JPH0580791A (ja) 音声規則合成装置および方法
JP3142160B2 (ja) 発音記号生成装置
JP3397406B2 (ja) 音声合成装置及び音声合成方法
JP3357796B2 (ja) 音声合成装置及び同装置における韻律情報生成方法
JP4056647B2 (ja) 波形接続型音声合成装置および方法
JP3031691B2 (ja) 音声規則合成装置
JP3364820B2 (ja) 合成音声出力方法及び装置
JP3088211B2 (ja) 基本周波数パタン生成装置
JP3314116B2 (ja) 音声規則合成装置
JP2888847B2 (ja) 文章読み上げ装置とその方法及び言語処理装置とその方法
JPH05210482A (ja) 発音辞書管理方法
JPH08160983A (ja) 音声合成装置
JPH02234198A (ja) テキスト音声合成システム
JPH08328578A (ja) テキスト音声合成装置
Evans et al. A multi-lingual speech synthesiser for blind people

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees