JPH04166899A - テキスト・音声変換装置 - Google Patents

テキスト・音声変換装置

Info

Publication number
JPH04166899A
JPH04166899A JP2291973A JP29197390A JPH04166899A JP H04166899 A JPH04166899 A JP H04166899A JP 2291973 A JP2291973 A JP 2291973A JP 29197390 A JP29197390 A JP 29197390A JP H04166899 A JPH04166899 A JP H04166899A
Authority
JP
Japan
Prior art keywords
text
phoneme
speech
prosodic
prosodic symbol
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2291973A
Other languages
English (en)
Inventor
Takashi Yato
隆 矢頭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2291973A priority Critical patent/JPH04166899A/ja
Publication of JPH04166899A publication Critical patent/JPH04166899A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] この発明は音声合成、特に文字コードで記述されたテキ
ストを入力して、それを音声に変換して出力するテキス
ト・音声変換装置に関するものである。
[従来の技術] 文字情報を入力として、それを合成音に変換して出力す
るテキスト・音声変換装置は、出力語粟の制限がないこ
とがら、音声の蓄積・再生型の音声合成にとって変わる
技術として、種々の利用分野での応用が期待されている
従来この種の装置は第2図に示されるような構成で実現
されていた。
図において、文字コードよりなる文章データ(以後テキ
ストと呼ぶ)がホストコンピュータ12からインタフェ
ース部11を通してテキスト分析規則 えられたテキストを、単語辞書7及び種々のテキスト分
析規則を用いて単語ごとに区分化し各単語の読みとアク
セントの他、文章全体の抑揚を表わすイントネーション
記号などの、文章を音声として読み上げるなめに必要な
音ml、韻律記号列を生゛成し、音声合成部9へ送出す
る。音声合成部9では、音韻、韻律記号列をもとに入力
文章に対応する音声を合成し、スピーカ10より出力す
る。
第3図(A)に、テキストの1文章の例えば、「任意の
文章を音声合成します」という文章から第3図(B)に
示す音韻記号と韻律記号の表の規則に基づき変換して得
られた、音韻・韻律記号列41の例、rPに]ンイノ、
ブ)ンショウーヲ。
P3オンセーゴ)−セージマスPO」を示す。第3頭(
B)において、音韻記号はカタカナで表しており、韻律
記号にはアクセント記号(]:強アクセント、)1弱ア
クセント)、フレーズ記号(Pl:文頭用、P2、P3
:文中用、PO:文末用)、ポーズ記号(、:小ポーズ
用1、:中ポーズ用、。;大ポーズ用)を含んでいる。
しかし、テキスト・音声変換装置が、日常使われる漢字
かな混じり文章を解析し、完全な障み、アクセント、イ
ントネーション等を得ることは現状では不可能に近く、
また、正確な音韻、韻律記号列を得るためには意味分析
を含めた非常に高度な分析を必要とし現実的ではない。
そのため、通常の文章読み上げ装置では、テキスト分析
結果である音韻、韻律記号列には、多くの場合、単語の
読み、アクセント、あるいは文章のイントネーションに
誤りを含んでおり、使用者の期待通りの合成音はなかな
か得られないのが実情である。従って、テキストに沿っ
て正しく合成音を生成する為には、デキスト分析結果で
ある音韻、韻律記号列を一旦フアイル化し、この音韻、
韻律記号列ファイルに対して、使用者自身がある程度の
修正を加える必要がある。
「発明が解決しようとする課題] しかしながら、前記音韻・韻律記号列ファイルは、音韻
情報であるかな表記、もしくはローマ字表記の発音記号
に加え、韻律情報である単語の区切り、アクセント、ポ
ーズの長さ、イントネーションを表わす記号など、様々
な制御記号が挿入されているため、日常見慣れている漢
字かな表記のテキストに比べ非常に見難く、音韻・韻律
記号列ファイルのみを見て元のテキストを思い浮かべる
のは、かなりの困難を伴う。ましてや音韻・韻律記号列
ファイルから合成される音声の調子を知ることは、よほ
どの熟練者でないかぎり不可能に近い。そのため従来の
テキスト・音声変換装置では、音韻・韻律記号列ファイ
ルを修正し、意図する合成音を作り上げることは、−m
ユーザーでは非常に困難であるという問題点があった。
この発明は、以上述べた課題に鑑み為されたものであり
、その目的とするところは、使用者の意図する合成音を
容易に生成しうるテキスト・音声変換装置を提供するこ
とである。
[課題を解決するための手段」 この発明は上記目的を達成するために従来のテキスト・
音声変換装置を改良したものである。
つまり、文字コードから形成されるテキストを入力し、
所望の分析を行って、前記テキストに対応する合成音に
変換して出力するテキスト・音声変換装置において、前
記テキストを形成する各文字コードに対応する音韻記号
及び韻律記号のデータを得て、前記テキストと並行して
表示する表示手段と、音韻・韻律記号修正情報を取り込
む入力手段と、前記音韻・韻律記号のデータを前記音韻
・韻律記号修正情報に基づき修正し記憶する音韻・韻律
記号修正手段を有し、修正後の音韻・韻律記号のデータ
に基づいて合成音を得ることを特徴とする。
[作用] この発明によれば、文字コードから形成されるテキスト
を入力し、所望の分析、つまり前記テキストを形成する
各文字データに対応する、かな表記又はローマ字表記の
発音記号と、単語の区切りとアクセントの位置とポーズ
の長さとイントネーションを表す記号のデータを含む音
韻記号及び韻律記号のデータを得て、前記テキストと並
行して前記テキストの1文章毎に対応する音韻・韻律記
号のデータを表示する表示手段と、音韻・韻律記号修正
情報を取り込む入力手段と、前記音韻・韻律記号のデー
タを、前記音韻・韻律記号修正情報に基づき修正し記憶
する音韻・韻律記号修正手段を有し、修正後の音韻・韻
律記号のデータに基づいて合成音を得ることによって使
用者の意図とする合成音を容易に生成し得る。
[実施例] 次にこの発明に係るテキスト・音声変換装置の好適な一
実施例を図面を用いて詳述する。
第1図はこの発明に係るテキスト・音声変換装置のブロ
ック図である。第3図は音韻・韻律記号列の例を示す。
第4図は第1図に示されている主制御部1の動作フロー
チャートを示すものである。
第1図において、テキスト・音声変換装置は、主制御部
1と、表示部2と、テキスト記憶部5と、テキスト分析
部6と、単語辞書7と、音韻・韻律記号列記憶部8と、
音声合成部9と、スピーカ10とで構成される。以下に
このテキスト・音声変換装置の動作を説明する。
主制御部1は、まず現在の状態がテキスト・音声変換完
了か否かを判断し、完了であればテキスト変換を終了す
る。しかし変換が始められた状態の場合は予め文字コー
ドよりなる文章データのテキストが記憶されているテキ
スト記憶部5より順次テキストが供給され(ステップ2
2)、入力したテキストは表示部2に出力して表示させ
る(ステップ23)とともに、テキスト分析部6に供給
する(ステップ24)。
テキスト分析部6は、主制御部1より供給されたテキス
トを単語辞書7を用いてテキスト分析を行う。単語辞書
7はいろいろな漢字などに対する読み方の情報、そのア
クセント位置の情報、文法情報などを含む。テキスト分
析部6は、単語辞書7及び種々のテキスト分析規則を用
いて単語ごとに区分化し各単語の読みとアクセントの他
、文章全体の抑揚を表すインt・ネーション記号などの
、文章を音声として読み上げるなめに必要な音韻・韻律
記号列を生成し、主制御部1−に供給する(ステップ2
4)。
主制御部1は供給された音韻・韻律記号列を音声合成部
9に供給する(ステップ25)とともに、キーボード検
査(ステップ26)を行って音韻・韻律記号列記憶部8
に蓄積する(ステップ27)。
音声合成部9は、主制御部1より供給されな音韻・韻律
記号列に基づいて音声を合成し、スピーカ10より合成
音を出力する。尚音声合成部9は特別な方法で合成音を
得るのではなく、従来知られている、例えば波形重畳方
式、PARCOR(Partial  autocor
relatiOn:偏(自己)相関)方式、ホルマント
合成方式、音声素片合成方式、波形符号化方式などの合
成方式で合成音を得ることができる。
尚主制御部1は、上記一連の動作中、常にキーボード3
から入力される信号を監視している。つまり、キーボー
ド3から入力された信号は、主制御部1において読み込
まれるまでキーボードバッファメモリ4に一時的に蓄え
られており、主制御部1は上記一連の動作において、テ
キストの一文章を供給されて、この文章の音韻・韻律記
号列を音声合成部9に供給した時点において、キーボー
ドバッファメモリ4を検査(ステップ26)し、前記1
文章を処理中にキーボード3からの入力信号の有無を判
定する。
キーボード3から入力された信号がキーボード= 9 
− バッファメモリ4に供給されていなければ、次の文章の
テキスト・音声変換に処理を進める(ステップ27→2
1→22へと進む)が、もし、入力信号がキーボードバ
ッファメモリ4に供給されていれば、テキスト・音声変
換処理を中断し、キーボード3から入力信号がキーボー
ドバッファメモリ4に供給された時点においてテキスト
・音声変換処理を行っていたテキストの1文章と、当該
文章に対するテキスト分析結果である音韻・韻律記号列
を表示部2に並行して表示(ステ・レプ28)し、キー
ボード3からの命令入力待ち状態に待機される(ステッ
プ29)。
第3図(C)にテキストの1文章42「任意の文章を音
声合成します」と、前記音ml・韻律きごうの表を用い
て得られた音韻・韻律記号列41rPに]ンイノ、ブ)
ンショウーヲ、P3オンセーゴ)−セージマスPO」を
並行して表示した例を示す。
ここでオペレータは3つの選択モードを選択する状態に
待機される(ステップ29)。その第1のモード(再生
モード)は、前記表示部2に表示された音韻・韻律記号
列に基づく音声の合成(ステップ32)、第2のモード
(修正モード)は、前記表示部2に表示された音韻・韻
律記号列の修正(ステップ30.31)、そして第3の
モード(変換再開モード)は、前記テキスト・音声変換
処理の再開(ステップ27)である。以下に上記3つの
モードにおける動作を詳述する。
前記再生モードが選択されると、主制御部1は、主制御
部1の内部−時記憶メモリ(図示しない)に保持されて
いる前記中断が入力された時点で処理中の1文章に対す
る音韻・韻律記号列を、音声合成部9に供給(ステップ
32)し、前記命令入力待ち状態(ステップ29)に再
び戻って待機される。音声合成部9は、主制御部1より
供給された音韻・韻律記号列に基づいて音声を合成し、
スプーカ10より合成音を出力する。すなわち第1のモ
ードでは、最後に音声出力された文章に対する再合成の
モードである。
前記修正モードが選択されると、主制御部1は、修正プ
ログラム(例えばエディタ)を起動(ステップ30)し
て、現在表示している音韻・韻律記号列に対する修正モ
ード(ステップ31)となる。
この修正は、主制御部1の内部の一時記憶メモリに保持
されている音韻・韻律記号列に対して行われる。オペレ
ータは、表示部2を見ながら所望の合成音が得られるよ
うにキーボード3から修正情報を入力して主制御部1に
取り込み、内部の前記−時記憶メモリに記憶されている
音韻・韻律記号列を修正する。表示部2には修正対象に
なる音韻・韻律記号列に対応する漢字かな混じり表記の
テキストが、並行して表示されるために、オペレータは
音韻・韻律記号列を容易に判読することができる。修正
が完了すれば、オペレータは修正プログラムを終了させ
、主制御部1は前記命令入力待ち状態(ステップ29)
に再び戻って待機される。
前記変換再開モードが選択されると、主制御部]−は、
−時記憶メモリに保持している音韻・韻律記号列を、音
韻・韻律記号列記憶部8に記憶(ステップ27)し、中
断されたテキスト・音声変換動作を再開する。
以上の動作により、オペレータは、まず通常のテキスト
・音声変換を行って合成音を出力し、聴音によって確認
する。この合成音の読み、アクセント、イントネーショ
ンなどに特に問題がなければ聞き流し次の合成音の聴取
を行う。しかしながら、合成音の聴取の途中において、
読み上げが不自然な部分がある場合には、キーボード3
から信号を入力してテキスト・音声変換を中断させる。
ここでオペレータは、異常を発見した文書中において問
題箇所が明らかであれば、直ちに前記第2のモードであ
る修正モードに移って音韻・韻律記号列の修正を行う(
ステップ30.31)が、もし、どの部分がどのように
不自然であるか十分に把握できない場合には、前記第1
のモードである再生モードにおいて問題文章の聴取(ス
テップ32)を繰り返し、問題箇所を明らかにしてから
修正を行う。修正を行った後、再生モードで合成音を聴
取し、修正が十分であったかを確認する。不十分な点が
あれば、上記の動作を繰り返して修正を完全なものにし
て行く。
中断させた文章の修正処理が完了すれば、前記第3のモ
ードである変換再開モードにおいてテキスト・音声変換
処理を再開(ステップ27→21→22)させ、後続の
文章に対する合成音の確認作業を進めていく。
以上のようにしてテキスt・記憶部5の全テキストに対
して1文章ごとに対応する合成音の確認、及び音韻・韻
律記号の修正を行うことによって、最終的に音韻・韻律
記号列記憶部8には、入力されたテキストに対する修正
された音韻・韻律記号列ができ上がる。このテキスト・
音声変換装置はテキストを入力として合成音に変換する
機能に加え、音韻・韻律記号列記憶部8から音韻・韻律
記号列を読み出し、これを音声合成部9に供給して合成
音を合成する機能を備えており、この機能によって修正
された音韻・韻律記号列による、オペレータの意図とす
る合成音を直ちに得ることができる。
「発明の効果」 以上述べたようにこの発明によれば、次のような効果を
発揮する。
修正すべき音韻・韻律記号列と、当該音韻・韻律記号列
に対応する入力テキストを並行して表示して確認するた
め、オペレータは音韻・韻律記号列から容易にその合成
音の内容を読み取ることができる。
更に修正部分を含む音韻・韻律記号列を直ちに音声に変
換できるため、修正が妥当であったか否かをその場で合
成音で確認できる。そのため、熟練者でなくても意図と
する合成音を得るための音韻・韻律記号列の修正が容易
に行える。
したがって、音声合成装置で入力テキストから音声合成
音を得るための作業が効率的に、更に正確に行えるとい
う効果がある。
【図面の簡単な説明】
第1図は本発明に係るテキスト・音声変換装置の実施例
のブロック図、第2図は従来のテキスト・音声変換装置
のブロック図、第3図は音韻・韻律記号列の例を示す図
、第4図は第1図に示されている主制御部の動作を説明
するフローチャートである。 図中、1は主制御部、2は表示部、3はキーボード、4
はキーボードバッファメモリ、5はテキスト記憶部、6
はテキスト分析部、7は音声合成部、8は音韻・韻律記
号列記憶部、9は音声合成部、10はスピーカ、11は
インターフェース部、12はホス■・コンピュータであ
る。

Claims (1)

  1. 【特許請求の範囲】 文字コードから形成されるテキストを入力し、所望の分
    析を行って、前記テキストに対応する合成音に変換して
    出力するテキスト・音声変換装置において、 前記テキストを形成する各文字コードに対応する音韻記
    号及び韻律記号のデータを得て、前記テキストと並行し
    て表示する表示手段と、 音韻・韻律記号修正情報を取り込む入力手段と、前記音
    韻・韻律記号のデータを前記音韻・韻律記号修正情報に
    基づき修正し記憶する音韻・韻律記号修正手段を有し、
    修正後の音韻・韻律記号のデータに基づいて合成音を得
    ることを特徴とするテキスト・音声変換装置。
JP2291973A 1990-10-31 1990-10-31 テキスト・音声変換装置 Pending JPH04166899A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2291973A JPH04166899A (ja) 1990-10-31 1990-10-31 テキスト・音声変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2291973A JPH04166899A (ja) 1990-10-31 1990-10-31 テキスト・音声変換装置

Publications (1)

Publication Number Publication Date
JPH04166899A true JPH04166899A (ja) 1992-06-12

Family

ID=17775864

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2291973A Pending JPH04166899A (ja) 1990-10-31 1990-10-31 テキスト・音声変換装置

Country Status (1)

Country Link
JP (1) JPH04166899A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR960042520A (ko) * 1995-05-29 1996-12-21 다까노 야스아끼 음성 합성 장치

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR960042520A (ko) * 1995-05-29 1996-12-21 다까노 야스아끼 음성 합성 장치

Similar Documents

Publication Publication Date Title
US8155958B2 (en) Speech-to-text system, speech-to-text method, and speech-to-text program
JP3142803B2 (ja) テキストを音声に変換するシンセサイザ
EP1096472B1 (en) Audio playback of a multi-source written document
US20090281808A1 (en) Voice data creation system, program, semiconductor integrated circuit device, and method for producing semiconductor integrated circuit device
JPH10222187A (ja) 発話文書作成装置,発話文書作成方法および発話文書作成手順をコンピュータに実行させるプログラムを格納したコンピュータ読み取り可能な記録媒体
JP4409279B2 (ja) 音声合成装置及び音声合成プログラム
JP3589972B2 (ja) 音声合成装置
JPH04166899A (ja) テキスト・音声変換装置
JPS6184771A (ja) 音声入力装置
JP3284976B2 (ja) 音声合成装置及びコンピュータ可読記録媒体
JP3414326B2 (ja) 音声合成用辞書登録装置及び方法
JPH0634175B2 (ja) 文章読上げ装置
JPH08221095A (ja) 文章読み上げ方法
JP2004258561A (ja) 歌唱合成用データ入力プログラムおよび歌唱合成用データ入力装置
JP2576499B2 (ja) 音声出力機能を備えたワ−ドプロセツサ
JPS62212870A (ja) 文章読み上げ校正装置
JPH04199421A (ja) 文書読上げ装置
JP3280729B2 (ja) 発音記号作成装置
JP2016122033A (ja) 記号列生成装置、音声合成装置、音声合成システム、記号列生成方法、及びプログラム
JPH01300334A (ja) 文章読み上げ装置
JPH1063651A (ja) 中国語入力装置
JPH04177526A (ja) 文章読み上げ装置
JPH02234198A (ja) テキスト音声合成システム
JP2001166790A (ja) 書き起こしテキスト自動生成装置、音声認識装置および記録媒体
JPH08328578A (ja) テキスト音声合成装置