JPH04167000A

JPH04167000A - テキスト音声合成装置

Info

Publication number: JPH04167000A
Application number: JP2294232A
Authority: JP
Inventors: Junko Komatsu; 小松　順子
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 1990-10-31
Filing date: 1990-10-31
Publication date: 1992-06-12

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】産業上の利用分野本発明は、発音記号列の編集を行うことが可能なテキス
ト音声合成装置に関する。

従来の技術従来、テキスト音声合成装置は、言語処理部がコード化
された文字列を言語解析して、読み、アクセント、イン
トネーション、その他の音声出力制御情報を含んだ「発
音記号列」を出力し、音声合成部がその発音記号列を解
釈して、合成音声に変換する装置である。従って、入力
としてコード化された文字列を与えてやれば、自動的に
音声で出力されるのが通常の使い方である。

しかし、同形語の読み分けや、例外的なアクセント結合
をする単語への対応など言語解析の解析精度が十分でな
いこと、また、ポーズやイントネーションに対するユー
ザの好みなどのために、言語解析の出力である発音記号
列が必ずしもユーザの所望する音声出力を表現しない場
合がある。

発明が解決しようとする課題そこで、発音記号列をユーザが直接編集することによっ
て、所望の音声出力を得たいという要望が出てくる。従
来のテキスト音声合成装置では、発音記号列を編集する
場合、一般に、次の２つの方法がある。

（１）汎用的なテキストエディタを用いて、発音記号列
ファイルを編集する。

（２）言語解析結果などから考えられる発音記号列候補
をあるる単位毎に内部に保持しておき、ユーザはその候
補の中から適切なものを選択する。

まず、（１）の方法の場合には、きめ細かな韻律制御が
可能であるが、発音記号列は韻律を表現するために人工
的に定義された記号列であり、記号の定義を熟知してい
ないと、思うように韻律の指定ができないため、素人が
発音記号列を編集するのは困難である。また、（２）の
方法の場合には、予めシステムが用意した候補の中から
選択するため、候補の中にユーザが所望する音声出力を
表現するものがない場合にはどうしようもない。

課題を解決するための手段そこで、このような問題点を解決するために、請求項１
記載の発明では、コード化された文字列を言語解析して
、読み、アクセント、イントネーション等の音声出力制
御情報を含んだ発音記号列を出力する言語処理部を設け
、前記発音記号列を合成音声に変換する音声合成部を設
け、前記発音記号列を編集する発音記号列エディタを設
けた。

請求項２記載の発明では、請求項１記載の発明において
、発音記号列エディタは、修正語の内容を音声を用いて
入力できる音声入力手段を有するようにした。

作用請求項１記載の発明は、発音記号列を編集する発音記号
列エディタを設けたことによって、ユーザが出力音声の
韻律を直接指定できるようになる。

請求項２記載の発明は、請求項１記載の発明において、
音声入力手段により修正語の内容を音声を用いて入力で
きるようにすることによって、複雑な発音記号列の定義
を知らなくても容易に発音記号列を編集でき、しかも、
きめ細かな韻律の指定ができるようになる。

実施例まず、本発明の第一の実施例を第１図及び第２図に基づ
いて説明する。本装置は、第１図に示すように、言語処
理部１と音声合成部２と発音記号列エディタ３とを備え
ている。この場合、前記言語処理部ｌは、コード化され
た文字列を言語解析し、読み、アクセント、イントネー
ション等の音声出力制御情報を含んだ発音記号列を出方
する働きがある。前記音声合成部２は、前記発音記号列
を合成音声に変換する働きがある。

前記発音記号列エディタ３は、第２図に示すように、音
声入力手段としての音声人ノコ部４とセグメンテ−ジョ
ン部５と韻律抽出部６と発生記号列生成部７と編集作業
制御部８と発音記号列ファイル９とを備えており、前記
発音記号列を編集する働きがある。前記発音記号列エデ
ィタ３は、修正語の内容を音声を用いて入力できる音声
入力手段としての音声入力部４を備えている。

このような構成において、以下、発音記号列エディタ３
が言語解析結果を利用しない場合について述べる。

まず、言語処理部１により、入力された文章ａのコード
化された文字列を言語解析し、音声出力制御情報を含ん
だ発音記号列すを出力する。

次に、この出力された発音記号列しは発音記号列エディ
タ３により編集が行われる。すなわち、ユーザが変更し
たい部分を予め指定しておき、そ　　　　　　゛れに対
する変更後の読み方（ここでは、単に、読みたけではな
く、アクセント、ポーズなども含めて「読み方」と呼ぶ
）を音声入力部４により音声で入力して基本的な編集作
業を行う。この場合、発音記号列エディタ３が言語処理
結果を利用せず、入力される音声の読みの予測ができな
いので、入力音声の認識が困Ｍとなる。そこで、まず、
読みの変更をキーボードから行い、読みが確定した後で
、アクセント、ポーズなどの韻律の変更を音声で行う。

また、ここでは、発音記号列すを編集するわけであるが
、ユーザの使いやすさを考えて、ユーザに表示されるの
は人力された文章ａの文字列であり、システムは、その
文字列と発音記号列すとの対応づけ情報をもっており、
ユーザが文字列」−で変更を加えると、その結果が発音
記号列すに反映されるようになっている。

そして、変更個所の指定がなされた後、ユーザの音声が
音声入力部４から入力されると、セグメンテーション部
５が、その読み（既に分かっている）をもとに入力され
た音声を音節毎にセグメンテーションする。次に、韻律
抽出部６が、アクセント、ポーズの位置を検出する。次
に、発音記号列生成部７がその結果をもとにユーザの入
力した音声と同じ韻律を表す発音記号列すを生成し、こ
の生成された発音記号列すは編集作業制御部８に送られ
発音記号列ファイル９と情報交換を行うことによって、
修正指定部分を新たに生成された発音記号列すで置き換
える。そして、このようにして得られた発音記号列すを
、音声合成部２により合成音声Ｃに変換して出ツノする
。

上述したように、コード化された文字列を言語解析して
、読み、アクセント、イントネーション等の音声量ツノ
制御情報を含んだ発音記号列すを出力する言語処理部１
と、その発音記号列すを合成音声Ｃに変換する音声合成
部２と、前記発音記号列すを編集する発音記号列エディ
タ３とを設けたので、ユーザが出力音声の韻律を直接指
定することが可能となる。

また、発音記号列エディタ３は、修正語の内容を音声を
用いて入力できる音声入力部４を有しているので、複雑
な発音記号列すの定義を知らなくても容易に発音記号列
すを編集することができ、しかも、これによりきめ細か
な韻律の指定が可能となる。

次に、本発明の第二の実施例を第３図及び第４図に基づ
いて説明する。なお、前述した第一・の実施例（第１図
、第２図参照）と同一部分についての説明は省略し、そ
の同一部分については同一符号を用いる。

第３図は本装置の全体的な動作原理を示すブロック図、
第４図は発音記号列エディタ３の基本的構成及びその動
作手順を示すブロック図である。

本実施例では、発音記号列エディタ３の基本的な操作及
びユーザインターフェイスは、前述した第一の実施例と
変わりはないが、ここでは、アクセント、ポーズだけで
なく、読みも音声で修正できるものとする。このため、
前述したセグメンテ−ジョン部５の代わりに、音節認識
部１０（ただし、セグメンテーションの機能は含む）を
設けた。

このような構成において、以下、発音記号列エディタ３
が言語解析結果を利用する場合について述べる。ただし
、その言語解析結果には、複数の解析候補が保持されて
おり、言語解析結果として、最初にユーザに示されるも
のは、最も確からしいとシステムが判断した候補のみで
あるとする。

そして、変更個所の指定がなされた後、ユーザの音声が
入力されると、音節認識部１０が入力音声の音節を認識
し、セグメンテーションを行う。

音節の認識は、音声入力部４より入ツクされた音声を言
語解析候補の何れかと一致すると仮定して行う。従って
、これにより言語解析候補の中に正解が存在する可能性
が十分高いとすれば、音節認識率は十分高く保てると考
えられる。

その後、音節の認識が行われた後は、第一の実施例と同
様にして、韻律抽出部６がアクセント、ポーズの位置を
検出し、発音記号列生成部７がその結果をもとにユーザ
の入力した音声と同じ韻律を表す発音記号列すを生成し
、この生成された発音記号列すは編集作業制御部８に送
られ発音記号列ファイル９と情報交換を行うことによっ
て、修正指定部分を新たに生成された発音記号列すで置
き換える。

このようにして得られた発音記号列すを、音声合成部２
により合成音声Ｃに変換して出力することによって、第
一の実施例の場合と同様な効果を得ることが可能となる
。

発明の効果請求項１記載の発明は、コード化された文字列を言語解
析して、読み、アクセント、イントネーション等の音声
出力制御情報を含んだ発音記号列を出力する言語処理部
を設け、前記発音記号列を合成音声に変換する音声合成
部を設け、前記発音記号列を編集する発音記号列エディ
タを設けたので、ユーザが出力音声の韻律を直接指定す
ることができるようになるものである。

請求項２記載の発明は、請求項１記載の発明において、
発音記号列エディタは、修正語の内容を音声を用いて入
力できる音声人力手段を有するようにしたので、複髄な
発音記号列の定義を知らなくても容易に発音記号列を編
集でき、しかも、きめ細かな韻律の指定ができるように
なるものである。

【図面の簡単な説明】

第１図は本発明の第一の実施例を示すブロック図、第２
図はその発音記号列エディタの基本的構成及びその動作
手順を示すブロック図、第３図は本発明の第二の実施例
を示すブロック図、第４図はその発音記号列エディタの
基本的構成及びその動作手順を示すブロック図である。 ■・・・言語処理部、２・・音声合成部、３・・・発音
記−１２＝

Claims

【特許請求の範囲】　１、コード化された文字列を言語解析し、読み、アク
セント、イントネーシヨン等の音声出力制御情報を含ん
だ発音記号列を出力する言語処理部と、前記発音記号列
を合成音声に変換する音声合成部と、前記発音記号列を
編集する発音記号列エディタとを設けたことを特徴とす
るテキスト音声合成装置。　２、発音記号列エディタは、修正語の内容を音声を用
いて入力できる音声入力手段を有することを特徴とする
請求項１記載のテキスト音声合成装置。