JPH04167000A - テキスト音声合成装置 - Google Patents
テキスト音声合成装置Info
- Publication number
- JPH04167000A JPH04167000A JP2294232A JP29423290A JPH04167000A JP H04167000 A JPH04167000 A JP H04167000A JP 2294232 A JP2294232 A JP 2294232A JP 29423290 A JP29423290 A JP 29423290A JP H04167000 A JPH04167000 A JP H04167000A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- phonetic symbol
- line
- symbol string
- phonetic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002194 synthesizing effect Effects 0.000 title abstract 3
- 238000012545 processing Methods 0.000 claims abstract description 12
- 230000015572 biosynthetic process Effects 0.000 claims description 15
- 238000003786 synthesis reaction Methods 0.000 claims description 15
- 230000011218 segmentation Effects 0.000 abstract description 7
- 238000012937 correction Methods 0.000 abstract description 2
- 230000033764 rhythmic process Effects 0.000 abstract 3
- 238000001514 detection method Methods 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 238000000605 extraction Methods 0.000 description 3
- 238000000034 method Methods 0.000 description 3
- 238000011017 operating method Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
本発明は、発音記号列の編集を行うことが可能なテキス
ト音声合成装置に関する。
ト音声合成装置に関する。
従来の技術
従来、テキスト音声合成装置は、言語処理部がコード化
された文字列を言語解析して、読み、アクセント、イン
トネーション、その他の音声出力制御情報を含んだ「発
音記号列」を出力し、音声合成部がその発音記号列を解
釈して、合成音声に変換する装置である。従って、入力
としてコード化された文字列を与えてやれば、自動的に
音声で出力されるのが通常の使い方である。
された文字列を言語解析して、読み、アクセント、イン
トネーション、その他の音声出力制御情報を含んだ「発
音記号列」を出力し、音声合成部がその発音記号列を解
釈して、合成音声に変換する装置である。従って、入力
としてコード化された文字列を与えてやれば、自動的に
音声で出力されるのが通常の使い方である。
しかし、同形語の読み分けや、例外的なアクセント結合
をする単語への対応など言語解析の解析精度が十分でな
いこと、また、ポーズやイントネーションに対するユー
ザの好みなどのために、言語解析の出力である発音記号
列が必ずしもユーザの所望する音声出力を表現しない場
合がある。
をする単語への対応など言語解析の解析精度が十分でな
いこと、また、ポーズやイントネーションに対するユー
ザの好みなどのために、言語解析の出力である発音記号
列が必ずしもユーザの所望する音声出力を表現しない場
合がある。
発明が解決しようとする課題
そこで、発音記号列をユーザが直接編集することによっ
て、所望の音声出力を得たいという要望が出てくる。従
来のテキスト音声合成装置では、発音記号列を編集する
場合、一般に、次の2つの方法がある。
て、所望の音声出力を得たいという要望が出てくる。従
来のテキスト音声合成装置では、発音記号列を編集する
場合、一般に、次の2つの方法がある。
(1)汎用的なテキストエディタを用いて、発音記号列
ファイルを編集する。
ファイルを編集する。
(2)言語解析結果などから考えられる発音記号列候補
をあるる単位毎に内部に保持しておき、ユーザはその候
補の中から適切なものを選択する。
をあるる単位毎に内部に保持しておき、ユーザはその候
補の中から適切なものを選択する。
まず、(1)の方法の場合には、きめ細かな韻律制御が
可能であるが、発音記号列は韻律を表現するために人工
的に定義された記号列であり、記号の定義を熟知してい
ないと、思うように韻律の指定ができないため、素人が
発音記号列を編集するのは困難である。また、(2)の
方法の場合には、予めシステムが用意した候補の中から
選択するため、候補の中にユーザが所望する音声出力を
表現するものがない場合にはどうしようもない。
可能であるが、発音記号列は韻律を表現するために人工
的に定義された記号列であり、記号の定義を熟知してい
ないと、思うように韻律の指定ができないため、素人が
発音記号列を編集するのは困難である。また、(2)の
方法の場合には、予めシステムが用意した候補の中から
選択するため、候補の中にユーザが所望する音声出力を
表現するものがない場合にはどうしようもない。
課題を解決するための手段
そこで、このような問題点を解決するために、請求項1
記載の発明では、コード化された文字列を言語解析して
、読み、アクセント、イントネーション等の音声出力制
御情報を含んだ発音記号列を出力する言語処理部を設け
、前記発音記号列を合成音声に変換する音声合成部を設
け、前記発音記号列を編集する発音記号列エディタを設
けた。
記載の発明では、コード化された文字列を言語解析して
、読み、アクセント、イントネーション等の音声出力制
御情報を含んだ発音記号列を出力する言語処理部を設け
、前記発音記号列を合成音声に変換する音声合成部を設
け、前記発音記号列を編集する発音記号列エディタを設
けた。
請求項2記載の発明では、請求項1記載の発明において
、発音記号列エディタは、修正語の内容を音声を用いて
入力できる音声入力手段を有するようにした。
、発音記号列エディタは、修正語の内容を音声を用いて
入力できる音声入力手段を有するようにした。
作用
請求項1記載の発明は、発音記号列を編集する発音記号
列エディタを設けたことによって、ユーザが出力音声の
韻律を直接指定できるようになる。
列エディタを設けたことによって、ユーザが出力音声の
韻律を直接指定できるようになる。
請求項2記載の発明は、請求項1記載の発明において、
音声入力手段により修正語の内容を音声を用いて入力で
きるようにすることによって、複雑な発音記号列の定義
を知らなくても容易に発音記号列を編集でき、しかも、
きめ細かな韻律の指定ができるようになる。
音声入力手段により修正語の内容を音声を用いて入力で
きるようにすることによって、複雑な発音記号列の定義
を知らなくても容易に発音記号列を編集でき、しかも、
きめ細かな韻律の指定ができるようになる。
実施例
まず、本発明の第一の実施例を第1図及び第2図に基づ
いて説明する。本装置は、第1図に示すように、言語処
理部1と音声合成部2と発音記号列エディタ3とを備え
ている。この場合、前記言語処理部lは、コード化され
た文字列を言語解析し、読み、アクセント、イントネー
ション等の音声出力制御情報を含んだ発音記号列を出方
する働きがある。前記音声合成部2は、前記発音記号列
を合成音声に変換する働きがある。
いて説明する。本装置は、第1図に示すように、言語処
理部1と音声合成部2と発音記号列エディタ3とを備え
ている。この場合、前記言語処理部lは、コード化され
た文字列を言語解析し、読み、アクセント、イントネー
ション等の音声出力制御情報を含んだ発音記号列を出方
する働きがある。前記音声合成部2は、前記発音記号列
を合成音声に変換する働きがある。
前記発音記号列エディタ3は、第2図に示すように、音
声入力手段としての音声人ノコ部4とセグメンテ−ジョ
ン部5と韻律抽出部6と発生記号列生成部7と編集作業
制御部8と発音記号列ファイル9とを備えており、前記
発音記号列を編集する働きがある。前記発音記号列エデ
ィタ3は、修正語の内容を音声を用いて入力できる音声
入力手段としての音声入力部4を備えている。
声入力手段としての音声人ノコ部4とセグメンテ−ジョ
ン部5と韻律抽出部6と発生記号列生成部7と編集作業
制御部8と発音記号列ファイル9とを備えており、前記
発音記号列を編集する働きがある。前記発音記号列エデ
ィタ3は、修正語の内容を音声を用いて入力できる音声
入力手段としての音声入力部4を備えている。
このような構成において、以下、発音記号列エディタ3
が言語解析結果を利用しない場合について述べる。
が言語解析結果を利用しない場合について述べる。
まず、言語処理部1により、入力された文章aのコード
化された文字列を言語解析し、音声出力制御情報を含ん
だ発音記号列すを出力する。
化された文字列を言語解析し、音声出力制御情報を含ん
だ発音記号列すを出力する。
次に、この出力された発音記号列しは発音記号列エディ
タ3により編集が行われる。すなわち、ユーザが変更し
たい部分を予め指定しておき、そ ゛れに対
する変更後の読み方(ここでは、単に、読みたけではな
く、アクセント、ポーズなども含めて「読み方」と呼ぶ
)を音声入力部4により音声で入力して基本的な編集作
業を行う。この場合、発音記号列エディタ3が言語処理
結果を利用せず、入力される音声の読みの予測ができな
いので、入力音声の認識が困Mとなる。そこで、まず、
読みの変更をキーボードから行い、読みが確定した後で
、アクセント、ポーズなどの韻律の変更を音声で行う。
タ3により編集が行われる。すなわち、ユーザが変更し
たい部分を予め指定しておき、そ ゛れに対
する変更後の読み方(ここでは、単に、読みたけではな
く、アクセント、ポーズなども含めて「読み方」と呼ぶ
)を音声入力部4により音声で入力して基本的な編集作
業を行う。この場合、発音記号列エディタ3が言語処理
結果を利用せず、入力される音声の読みの予測ができな
いので、入力音声の認識が困Mとなる。そこで、まず、
読みの変更をキーボードから行い、読みが確定した後で
、アクセント、ポーズなどの韻律の変更を音声で行う。
また、ここでは、発音記号列すを編集するわけであるが
、ユーザの使いやすさを考えて、ユーザに表示されるの
は人力された文章aの文字列であり、システムは、その
文字列と発音記号列すとの対応づけ情報をもっており、
ユーザが文字列」−で変更を加えると、その結果が発音
記号列すに反映されるようになっている。
、ユーザの使いやすさを考えて、ユーザに表示されるの
は人力された文章aの文字列であり、システムは、その
文字列と発音記号列すとの対応づけ情報をもっており、
ユーザが文字列」−で変更を加えると、その結果が発音
記号列すに反映されるようになっている。
そして、変更個所の指定がなされた後、ユーザの音声が
音声入力部4から入力されると、セグメンテーション部
5が、その読み(既に分かっている)をもとに入力され
た音声を音節毎にセグメンテーションする。次に、韻律
抽出部6が、アクセント、ポーズの位置を検出する。次
に、発音記号列生成部7がその結果をもとにユーザの入
力した音声と同じ韻律を表す発音記号列すを生成し、こ
の生成された発音記号列すは編集作業制御部8に送られ
発音記号列ファイル9と情報交換を行うことによって、
修正指定部分を新たに生成された発音記号列すで置き換
える。そして、このようにして得られた発音記号列すを
、音声合成部2により合成音声Cに変換して出ツノする
。
音声入力部4から入力されると、セグメンテーション部
5が、その読み(既に分かっている)をもとに入力され
た音声を音節毎にセグメンテーションする。次に、韻律
抽出部6が、アクセント、ポーズの位置を検出する。次
に、発音記号列生成部7がその結果をもとにユーザの入
力した音声と同じ韻律を表す発音記号列すを生成し、こ
の生成された発音記号列すは編集作業制御部8に送られ
発音記号列ファイル9と情報交換を行うことによって、
修正指定部分を新たに生成された発音記号列すで置き換
える。そして、このようにして得られた発音記号列すを
、音声合成部2により合成音声Cに変換して出ツノする
。
上述したように、コード化された文字列を言語解析して
、読み、アクセント、イントネーション等の音声量ツノ
制御情報を含んだ発音記号列すを出力する言語処理部1
と、その発音記号列すを合成音声Cに変換する音声合成
部2と、前記発音記号列すを編集する発音記号列エディ
タ3とを設けたので、ユーザが出力音声の韻律を直接指
定することが可能となる。
、読み、アクセント、イントネーション等の音声量ツノ
制御情報を含んだ発音記号列すを出力する言語処理部1
と、その発音記号列すを合成音声Cに変換する音声合成
部2と、前記発音記号列すを編集する発音記号列エディ
タ3とを設けたので、ユーザが出力音声の韻律を直接指
定することが可能となる。
また、発音記号列エディタ3は、修正語の内容を音声を
用いて入力できる音声入力部4を有しているので、複雑
な発音記号列すの定義を知らなくても容易に発音記号列
すを編集することができ、しかも、これによりきめ細か
な韻律の指定が可能となる。
用いて入力できる音声入力部4を有しているので、複雑
な発音記号列すの定義を知らなくても容易に発音記号列
すを編集することができ、しかも、これによりきめ細か
な韻律の指定が可能となる。
次に、本発明の第二の実施例を第3図及び第4図に基づ
いて説明する。なお、前述した第一・の実施例(第1図
、第2図参照)と同一部分についての説明は省略し、そ
の同一部分については同一符号を用いる。
いて説明する。なお、前述した第一・の実施例(第1図
、第2図参照)と同一部分についての説明は省略し、そ
の同一部分については同一符号を用いる。
第3図は本装置の全体的な動作原理を示すブロック図、
第4図は発音記号列エディタ3の基本的構成及びその動
作手順を示すブロック図である。
第4図は発音記号列エディタ3の基本的構成及びその動
作手順を示すブロック図である。
本実施例では、発音記号列エディタ3の基本的な操作及
びユーザインターフェイスは、前述した第一の実施例と
変わりはないが、ここでは、アクセント、ポーズだけで
なく、読みも音声で修正できるものとする。このため、
前述したセグメンテ−ジョン部5の代わりに、音節認識
部10(ただし、セグメンテーションの機能は含む)を
設けた。
びユーザインターフェイスは、前述した第一の実施例と
変わりはないが、ここでは、アクセント、ポーズだけで
なく、読みも音声で修正できるものとする。このため、
前述したセグメンテ−ジョン部5の代わりに、音節認識
部10(ただし、セグメンテーションの機能は含む)を
設けた。
このような構成において、以下、発音記号列エディタ3
が言語解析結果を利用する場合について述べる。ただし
、その言語解析結果には、複数の解析候補が保持されて
おり、言語解析結果として、最初にユーザに示されるも
のは、最も確からしいとシステムが判断した候補のみで
あるとする。
が言語解析結果を利用する場合について述べる。ただし
、その言語解析結果には、複数の解析候補が保持されて
おり、言語解析結果として、最初にユーザに示されるも
のは、最も確からしいとシステムが判断した候補のみで
あるとする。
そして、変更個所の指定がなされた後、ユーザの音声が
入力されると、音節認識部10が入力音声の音節を認識
し、セグメンテーションを行う。
入力されると、音節認識部10が入力音声の音節を認識
し、セグメンテーションを行う。
音節の認識は、音声入力部4より入ツクされた音声を言
語解析候補の何れかと一致すると仮定して行う。従って
、これにより言語解析候補の中に正解が存在する可能性
が十分高いとすれば、音節認識率は十分高く保てると考
えられる。
語解析候補の何れかと一致すると仮定して行う。従って
、これにより言語解析候補の中に正解が存在する可能性
が十分高いとすれば、音節認識率は十分高く保てると考
えられる。
その後、音節の認識が行われた後は、第一の実施例と同
様にして、韻律抽出部6がアクセント、ポーズの位置を
検出し、発音記号列生成部7がその結果をもとにユーザ
の入力した音声と同じ韻律を表す発音記号列すを生成し
、この生成された発音記号列すは編集作業制御部8に送
られ発音記号列ファイル9と情報交換を行うことによっ
て、修正指定部分を新たに生成された発音記号列すで置
き換える。
様にして、韻律抽出部6がアクセント、ポーズの位置を
検出し、発音記号列生成部7がその結果をもとにユーザ
の入力した音声と同じ韻律を表す発音記号列すを生成し
、この生成された発音記号列すは編集作業制御部8に送
られ発音記号列ファイル9と情報交換を行うことによっ
て、修正指定部分を新たに生成された発音記号列すで置
き換える。
このようにして得られた発音記号列すを、音声合成部2
により合成音声Cに変換して出力することによって、第
一の実施例の場合と同様な効果を得ることが可能となる
。
により合成音声Cに変換して出力することによって、第
一の実施例の場合と同様な効果を得ることが可能となる
。
発明の効果
請求項1記載の発明は、コード化された文字列を言語解
析して、読み、アクセント、イントネーション等の音声
出力制御情報を含んだ発音記号列を出力する言語処理部
を設け、前記発音記号列を合成音声に変換する音声合成
部を設け、前記発音記号列を編集する発音記号列エディ
タを設けたので、ユーザが出力音声の韻律を直接指定す
ることができるようになるものである。
析して、読み、アクセント、イントネーション等の音声
出力制御情報を含んだ発音記号列を出力する言語処理部
を設け、前記発音記号列を合成音声に変換する音声合成
部を設け、前記発音記号列を編集する発音記号列エディ
タを設けたので、ユーザが出力音声の韻律を直接指定す
ることができるようになるものである。
請求項2記載の発明は、請求項1記載の発明において、
発音記号列エディタは、修正語の内容を音声を用いて入
力できる音声人力手段を有するようにしたので、複髄な
発音記号列の定義を知らなくても容易に発音記号列を編
集でき、しかも、きめ細かな韻律の指定ができるように
なるものである。
発音記号列エディタは、修正語の内容を音声を用いて入
力できる音声人力手段を有するようにしたので、複髄な
発音記号列の定義を知らなくても容易に発音記号列を編
集でき、しかも、きめ細かな韻律の指定ができるように
なるものである。
第1図は本発明の第一の実施例を示すブロック図、第2
図はその発音記号列エディタの基本的構成及びその動作
手順を示すブロック図、第3図は本発明の第二の実施例
を示すブロック図、第4図はその発音記号列エディタの
基本的構成及びその動作手順を示すブロック図である。 ■・・・言語処理部、2・・音声合成部、3・・・発音
記−12=
図はその発音記号列エディタの基本的構成及びその動作
手順を示すブロック図、第3図は本発明の第二の実施例
を示すブロック図、第4図はその発音記号列エディタの
基本的構成及びその動作手順を示すブロック図である。 ■・・・言語処理部、2・・音声合成部、3・・・発音
記−12=
Claims (1)
- 【特許請求の範囲】 1、コード化された文字列を言語解析し、読み、アク
セント、イントネーシヨン等の音声出力制御情報を含ん
だ発音記号列を出力する言語処理部と、前記発音記号列
を合成音声に変換する音声合成部と、前記発音記号列を
編集する発音記号列エディタとを設けたことを特徴とす
るテキスト音声合成装置。 2、発音記号列エディタは、修正語の内容を音声を用
いて入力できる音声入力手段を有することを特徴とする
請求項1記載のテキスト音声合成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2294232A JPH04167000A (ja) | 1990-10-31 | 1990-10-31 | テキスト音声合成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2294232A JPH04167000A (ja) | 1990-10-31 | 1990-10-31 | テキスト音声合成装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH04167000A true JPH04167000A (ja) | 1992-06-12 |
Family
ID=17805054
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2294232A Pending JPH04167000A (ja) | 1990-10-31 | 1990-10-31 | テキスト音声合成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH04167000A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007248886A (ja) * | 2006-03-16 | 2007-09-27 | Mitsubishi Electric Corp | 読み修正装置 |
-
1990
- 1990-10-31 JP JP2294232A patent/JPH04167000A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007248886A (ja) * | 2006-03-16 | 2007-09-27 | Mitsubishi Electric Corp | 読み修正装置 |
JP4704254B2 (ja) * | 2006-03-16 | 2011-06-15 | 三菱電機株式会社 | 読み修正装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Isewon et al. | Design and implementation of text to speech conversion for visually impaired people | |
Huang et al. | Whistler: A trainable text-to-speech system | |
EP0831460B1 (en) | Speech synthesis method utilizing auxiliary information | |
EP1377964B1 (en) | Speech-to-speech generation system and method | |
JP2021511536A (ja) | 多言語テキスト音声合成方法 | |
JPS62160495A (ja) | 音声合成装置 | |
US6212501B1 (en) | Speech synthesis apparatus and method | |
JP4964695B2 (ja) | 音声合成装置及び音声合成方法並びにプログラム | |
KR20010018064A (ko) | 음운환경과 묵음구간 길이를 이용한 텍스트/음성변환 장치 및그 방법 | |
JPH0887297A (ja) | 音声合成システム | |
JPH08335096A (ja) | テキスト音声合成装置 | |
Mengko et al. | Indonesian Text-To-Speech system using syllable concatenation: Speech optimization | |
JP4409279B2 (ja) | 音声合成装置及び音声合成プログラム | |
van Rijnsoever | A multilingual text-to-speech system | |
JPH04167000A (ja) | テキスト音声合成装置 | |
JP3060276B2 (ja) | 音声合成装置 | |
JP2536169B2 (ja) | 規則型音声合成装置 | |
JP2021148942A (ja) | 声質変換システムおよび声質変換方法 | |
JP2703253B2 (ja) | 音声合成装置 | |
JP3522005B2 (ja) | 音声合成装置 | |
JP3034554B2 (ja) | 日本語文章読上げ装置及び方法 | |
Narupiyakul et al. | A stochastic knowledge-based Thai text-to-speech system | |
JPS62119591A (ja) | 文章読上げ装置 | |
JPH02251998A (ja) | 音声合成装置 | |
KR100608643B1 (ko) | 음성 합성 시스템의 억양 모델링 장치 및 방법 |