JPH09251300A - テキスト音声変換装置 - Google Patents

テキスト音声変換装置

Info

Publication number
JPH09251300A
JPH09251300A JP8060411A JP6041196A JPH09251300A JP H09251300 A JPH09251300 A JP H09251300A JP 8060411 A JP8060411 A JP 8060411A JP 6041196 A JP6041196 A JP 6041196A JP H09251300 A JPH09251300 A JP H09251300A
Authority
JP
Japan
Prior art keywords
data
notation
text
character
ruby
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8060411A
Other languages
English (en)
Inventor
Yoshinao Umezawa
義尚 梅澤
Yasuhiro Chiyou
康宏 頂
勝美 ▲高▼橋
Katsumi Takahashi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP8060411A priority Critical patent/JPH09251300A/ja
Publication of JPH09251300A publication Critical patent/JPH09251300A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 本発明は、テキストデータの中に分数表記、
日付表記またはルビ表記等があっても、これらを正しく
音声データに変換することのできるテキスト音声変換装
置の提供を課題とする。 【解決手段】 テキストデータの中に記述記号データと
文字データとからなる表記データがあるとこれを検出す
る検出手段11と、前記記述記号データの読み方を文字
データとして予め記憶している記憶手段12と、前記検
出手段11が検出した記述記号データを前記記憶手段1
2に記憶された文字データに置き換える置換手段13と
を備え、記述記号データと文字データとからなる表記デ
ータを文字データだけからなる新たな表記データに置き
換えた後に音声データへの変換を行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、日本語文章を表記
するためのテキストデータを、音声として出力可能な音
声データに変換するテキスト音声変換装置に関するもの
である。
【0002】
【従来の技術】テキスト音声変換装置とは、テキストデ
ータを音声データに変換するものである。ただし、ここ
でいうテキストデータとは、日本語文章(漢字仮名混じ
り文)を表記(表示あるいは印字)するためのデータで
あり、文字データと記述記号データと制御コードとから
なるデータのことである。なお、文字データは漢字、平
仮名、片仮名、数字、アルファベット等の文字の表記
を、また記述記号データは「、(てん)」、「。(ま
る)」、「/(スラッシュ記号)」等の記述記号の表記
を、さらに制御コードはルビ(振り仮名)表記指示や図
表表記等を、それぞれ行うためのものである。また、音
声データとは、例えばスピーカー等を用いれば音声とし
て出力することが可能なアナログデータのことである。
【0003】このようなテキスト音声変換装置の一例と
して、例えば図9に示すようなものがある。このテキス
ト音声変換装置は、データ入力部1と、制御部2と、辞
書記憶部3と、音声合成部4と、音声出力部5とを備え
ているものである。データ入力部1は、例えば図示しな
いパーソナルコンピュータ(以下、パソコンと略す)等
に接続されるRS232C等のインターフェースからな
るもので、このパソコン等で生成されたテキストデータ
を受け取るものである。制御部2は、例えばCPU(Ce
ntral Processing Unit )とROM(Read Only Memor
y)とRAM(Random Access Memory)との組み合わせ
からなるものであり、データ入力部1で受け取ったテキ
ストデータに対する解析を行って、音声合成に必要なパ
ラメータ(以下、合成パラメータと称す)を生成するも
のである。そのために、制御部2は、テキスト解析部2
aと合成パラメータ生成部2bとしての機能を有してい
る。
【0004】テキスト解析部2aは、テキストデータの
読み、アクセント、イントネーション等を決定して、音
韻韻律記号列(以下、中間言語と称す)を生成するもの
である。合成パラメータ生成部2bは、テキスト解析部
2aで生成された中間言語から、音声素片(音の種
類)、各音韻の継続時間(音の長さ)、ピッチ(声の高
さ)、振幅(声の大きさ)の時間変化パターンなどの合
成パラメータを生成するものである。なお、この制御部
2では、予めROMに格納されたプログラムに従ってC
PUが処理を行うことにより、上述の機能を果たすよう
になっている。
【0005】辞書記憶部3は、例えばROMやRAMか
らなり、制御部2における中間言語及び合成パラメータ
の生成に必要な情報を予め記憶しているものである。そ
のために、辞書記憶部3は、単語辞書記憶部3a及び音
声素片記憶部3bとしての機能を有している。単語辞書
記憶部3aは、テキスト解析部2aでの中間言語の生成
に必要な情報である形態素(単語)の表記、読み、品
詞、アクセント位置、前後の接続情報等を記憶している
ものである。音声素片記憶部3bは、合成パラメータ生
成部2bでの合成パラメータの生成に必要な情報である
音声素片を示すデータを記憶しているものである。音声
素片とは、合成波形を作るための基本単位であり、この
音声素片を接続することにより音声波形が作られるよう
になっている。よって、音声素片記憶部3bでは、音の
種類に応じて様々な音声素片を予め記憶している。
【0006】音声合成部4は、例えばDSP(Digital
Signal Processor)からなるものであり、制御部2の合
成パラメータ生成部2bにより生成された合成パラメー
タを基に、波形重畳法により音声波形を合成するもので
ある。音声出力部5は、例えばD/A(デジタル/アナ
ログ)コンバータからなるものであり、音声合成部4で
合成された音声波形を内蔵バッファに一時保持した後
に、所定速度のクロック信号に従ってデジタル/アナロ
グ変換することにより、アナログデータである音声デー
タを得るものである。
【0007】このように構成されたテキスト音声変換装
置では、以下のようにしてテキストデータを音声データ
に変換するようになっている。このテキスト音声変換装
置では、データ入力部1で受け取ったテキストデータを
音声データに変換する際に、先ずテキスト解析部2a
が、単語辞書記憶部3aに記憶されている情報を基づい
て、変換する基となるテキストデータから中間言語を生
成する。ただし、通常、漢字仮名混じり文の中
の「、」、「。」などの記述記号は、日本語として発音
しない。したがって、テキスト解析部2aでは、テキス
トデータの中から記述記号データ及び制御コードを除去
して、文字データについてのみ中間言語の生成を行う。
【0008】テキスト解析部2aが文字データについて
のみ中間言語を生成すると、合成パラメータ生成部2b
は、音声素片記憶部3bに記憶されている情報を基に、
前記中間言語から合成パラメータを生成する。そして、
音声合成部4はその合成パラメータを基に音声波形を合
成し、さらに音声出力部5はD/A変換によって音声デ
ータを得る。つまり、このテキスト音声変換装置では、
テキストデータの中の文字データだけを音声データに変
換するようになっているので、変換後の音声データを出
力した場合に、自然な日本語音声の出力を実現できるよ
うになっている。
【0009】
【発明が解決しようとする課題】ところで、漢字仮名混
じり文においては、スラッシュ記号を分数や日付の表記
に用いることが頻繁にある。例えば、「2/3」という
表記を「3分の2」という意味で用いたり、あるいは
「2月3日」という意味で用いたりする。このような場
合に、上述のテキスト音声変換装置では、記述記号デー
タを削除して文字データだけを音声データに変換するた
めに、正しい変換が行われない。すなわち、「2/3」
を「さんぶんのに」あるいは「にがつみっか」とせずに
「にさん」としてしまう。
【0010】また、上述のテキスト音声変換装置では、
漢字仮名混じり文においてルビが付されている場合に
も、正しい変換が行われない。一般に、テキストデータ
は、ルビを付す場合に、テキストデータの2行分を用
い、前(横書き文書の場合の上側)の行をルビ行とし、
後(横書き文書の場合の下側)の行をルビが付される行
とし、さらにルビ行にはその行がルビ行であることを示
すための制御コードが与えられるようになっている。し
たがって、このテキスト音声変換装置では、制御コード
を削除して文字データだけを音声データに変換するため
に、ルビ行とルビが付される行とを重複して変換してし
まう。例えば「運命」という文字に「サダメ」というル
ビが付されていると、「サダメ」を「さだめ」とした後
に、さらに「運命」を「うんめい」としてしまう。
【0011】つまり、上述のテキスト音声変換装置で
は、入力されたテキストデータの中に、例えば記述記号
を含む分数表記や日付表記のように、音声データへの変
換を必要とする記述記号と文字との組み合わせからなる
表記があると、これらを正しい音声データに変換するこ
とができない。また、ルビ表記についても同様である。
これらの表記を正しく変換しようとすると、テキストデ
ータを入力する以前の時点でこれらの表記に対する修正
を加えなければならず、結果として音声データへの変換
を容易に行うことができなくなってしまう。
【0012】そこで、本発明は、入力されたテキストデ
ータの中に、音声データへの変換を必要とする記述記号
と文字との組み合わせからなる表記(例えば分数表記、
日付表記等)やルビ表記に対応するものがあっても、こ
れらを正しい音声データに変換することのできるテキス
ト音声変換装置を提供することを目的とする。
【0013】
【課題を解決するための手段】本発明は、上記目的を達
成するために案出されたテキスト音声変換装置で、文字
を表記するための文字データと記述記号を表記するため
の記述記号データとからなるテキストデータが入力され
ると、このテキストデータを音声として出力可能な音声
データに変換するものであって、さらに、入力されたテ
キストデータの中に、音声データへの変換を必要とする
記述記号データと文字データとの組み合わせからなる表
記データがあると、その表記データを検出する検出手段
と、前記変換を必要とする記述記号データにより表記さ
れる記述記号の読み方を文字データとして予め記憶して
いる記憶手段と、前記検出手段が検出した表記データを
この表記データの中の文字データと前記記憶手段に記憶
された文字データとの組み合わせからなる新たな表記デ
ータに置き換え、その新たな表記データに対して前記音
声データへの変換を行わせる置換手段とを備える。
【0014】上記構成のテキスト音声変換装置によれ
ば、入力されたテキストデータの中に、例えば分数表記
や日付表記に用いるスラッシュ記号のように音声データ
への変換を必要とする記述記号データと文字データとの
組み合わせからなる表記データがあると、検出手段がそ
の表記データを検出する。そして、記憶手段に記憶され
た文字データを基に、置換手段が検出手段によって検出
された表記データを文字データだけの組み合わせからな
る新たな表記データに置き換え、この新たな表記データ
に対して音声データへの変換を行わせる。したがって、
このテキスト音声変換装置では、音声データへの変換を
必要とする記述記号データと文字データとの組み合わせ
からなる表記データであっても、この表記データを本来
の意味を有する音声データに変換することとなる。
【0015】また、本発明のテキスト音声変換装置は、
文字を表記するための文字データと、ルビを表記するた
めの文字データであるルビデータと、前記ルビが付され
る文字を指示する制御コードとからなるテキストデータ
が入力されると、そのテキストデータから前記制御コー
ドを除去して前記文字データと前記ルビデータとを音声
データに変換するものにおいて、さらに、入力されたテ
キストデータの中に前記制御コードがあると、その制御
コードを基にルビデータとこのルビデータに対応する文
字データとを検出する検出手段と、この検出手段が検出
したルビデータと文字データとを置き換え、かつ、置き
換え後の文字データを削除する置換手段とを備える。
【0016】上記構成のテキスト音声変換装置によれ
ば、入力されたテキストデータの中にルビ表記がある
と、検出手段がそのルビ表記におけるルビデータとこの
ルビデータに対応する文字データとを検出する。そし
て、置換手段がこれらのルビデータと文字データとを置
き換え、かつ、置き換え後の文字データを削除する。し
たがって、このテキスト音声変換装置では、テキストデ
ータの中にルビ表記があっても、そのルビ表記における
ルビデータだけを音声データに変換することとなる。
【0017】
【発明の実施の形態】以下、図面に基づき本発明に係わ
るテキスト音声変換装置について説明する。
【0018】〔第1の実施の形態〕ここでは、分数を表
記するための分数表記データに対応するテキスト音声変
換装置について説明する。なお、分数表記データとは、
数字を表記するための文字データ(以下、数字データと
称す)と、分数を表記する記述記号であるスラッシュ記
号を表記するための分数記号データ(以下、スラッシュ
データと称す)との組み合わせからなる表記データであ
るものとする。また、数字データには、分数の分子を表
記するための分子データと、分数の分母を表記するため
の分母データがあるものとする。
【0019】本実施の形態のテキスト音声変換装置は、
図1に示すように、従来のテキスト音声変換装置(図9
参照)に加えて、データ入力部1と制御部2との間に分
数検出変換部10が設けられているものである。分数検
出変換部10は、例えばCPU、ROM及びRAMの組
み合わせからなるものであり、検出手段11と、記憶手
段12と、置換手段13と、出力バッファ14とを備え
てなるものである。
【0020】検出手段11は、データ入力部1で受け取
ったテキストデータの中に、音声データへの変換を必要
とする記述記号データと文字データとの組み合わせから
なる表記データがあると、これを検出するものである。
ただし、音声データへの変換を必要とする記述記号デー
タとは、テキストデータから記述記号データを除去して
文字データだけを音声データに変換した場合に、その音
声データによって得られる意味が元のテキストデータに
おける意味と異なってしまうような記述記号データのこ
とである。つまり、検出手段11は、具体的には、例え
ば「2/3(3ぶんの2と読む)」といった分数を表記
するためにスラッシュデータと数字データとの組み合わ
せからなる分数表記データを検出するものである。その
ために、検出手段11では、判断機能11aと、データ
保持機能11bとを有している。
【0021】判断機能11aは、データ入力部1で受け
取ったテキストデータの1文字毎(あるいは1記述記号
毎)に、これらが数字データまたはスラッシュデータで
あるか否かを判断する機能である。データ保持機能11
bは、数字データを格納するための配列BUNSI(n)及び配
列BUNBO(m)を備え、これら配列BUNSI(n)及び配列BUNBO
(m)により数字データを一時的に保持する機能である。
ただし、配列BUNSI(n)、配列BUNBO(m)は、格納する数字
データの文字数に応じて、変数n、mが可変するように
なっている。
【0022】記憶手段12は、音声データへの変換を必
要とする記述記号データにより表記される読み方を、文
字データとして予め記憶しているものである。具体的に
は、この記憶手段12では、分数の表記に用いる文字デ
ータで、かつ、スラッシュデータの読み方である「ぶん
の」を表記するための文字データを記憶している。置換
手段13は、記憶手段12に記憶された文字データを用
いて、検出手段11が検出した分数表記データを、この
分数表記データの中の文字データと記憶手段12に記憶
された文字データとの組み合わせからなる新たな分数表
記データに置き換えるものである。出力バッファ14
は、検出手段11や置換手段13で処理されたテキスト
データを、制御部2へ送出するためのバッファとして機
能するものである。
【0023】次に、以上のように構成されたテキスト音
声変換装置において、テキストデータを音声データに変
換する場合の動作例について、特に分数検出変換部10
での分数表記データに対する処理動作例について、図2
のフローチャートを参照して説明する。
【0024】データ入力部1がテキストデータを受け取
ると、分数検出変換部10では、初期化処理を行う。す
なわち、検出手段11は、データ保持機能11bの配列
BUNSI(n)及び配列BUNBO(m)の変数n、mをそれぞれ
「0」とし(ステップ101、以下ステップをSと略
す)、また出力バッファ14は、その内部を空にする
(S102)。初期化処理が終了すると、検出手段11
は、データ入力部1(または図示しない内部バッファ)
からテキストデータを1文字分受け取って、これをテキ
ストデータT1 とする(S103)。そして、検出手段
11では、判断機能11aによりテキストデータT1
数字データであるか否かを判断する(S104)。
【0025】テキストデータT1 が数字データでなけれ
ば、以降に続くテキストデータは分数表記データではな
いため、検出手段11は、このテキストデータT1 を出
力バッファ14(OUT)へ送出する(S105)。ま
た、テキストデータT1 が数字データであれば、以降に
続くテキストデータは分数表記データである可能性があ
るため、検出手段11は、データ保持機能11bの配列
BUNSI(n)にテキストデータT1 を格納し、その後に変数
nをインクリメントする(S106)。
【0026】配列BUNSI(n)にテキストデータT1 を格納
すると、続いて検出手段11は、新たなテキストデータ
を1文字分受け取って、これをテキストデータTn とす
る(S107)。そして、検出手段11では、判断機能
11aによりテキストデータTn が数字データであるか
否かを判断する(S108)。ここで、テキストデータ
n が数字データであれば、分数の分子を表記するため
の数字列が続いていると考えられるため、検出手段11
では、テキストデータをデータ保持機能11bの配列BU
NSI(n)に格納するステップから上述のステップを繰り返
す(S106〜S108)。一方、テキストデータTn
が数字データでなければ、続いて検出手段11は、判断
機能11aによりこのテキストデータTn がスラッシュ
データであるか否かを判断する(S109)。
【0027】テキストデータTn がスラッシュデータで
なければ、テキストデータT1 からテキストデータTn
までのテキストデータは分数表記データではなく、単な
る数字列を表記するためのものなので、検出手段11
は、配列BUNSI(n)に入力されている全てのテキストデー
タ(テキストデータT1 からテキストデータTn-1
で)とテキストデータTn とを出力バッファ14へ送出
する(S110)。また、テキストデータTn がスラッ
シュデータであれば、これらが分数表記データである可
能性があるため、検出手段11は、さらに新たなテキス
トデータを1文字分受け取って、これをテキストデータ
n+1 とする(S111)。そして、検出手段11で
は、判断機能11aによりテキストデータTn+1 が数字
データであるか否かを判断する(S112)。
【0028】テキストデータTn+1 が数字データでなけ
れば、テキストデータT1 からテキストデータTn+1
でのテキストデータが分数表記データとは成り得ないた
め、検出手段11は、配列BUNSI(n)に入力されている全
てのテキストデータと、テキストデータTn (スラッシ
ュデータ)と、テキストデータTn+1 とを出力バッファ
14へ送出する(S113)。また、テキストデータT
n+1 が数字データであれば、検出手段11は、データ保
持機能11bの配列BUNBO(m)にテキストデータTn+1
格納し、その後に変数mをインクリメントする(S11
4)。
【0029】配列BUNBO(m)にテキストデータTn+1 を格
納すると、続いて検出手段11は、さらに新たなテキス
トデータを1文字分受け取って、これをテキストデータ
mとする(S115)。そして、検出手段11では、
テキストデータTm が数字データであるか否かを判断す
る(S116)。ここで、テキストデータTm が数字デ
ータであれば、分数の分母の表記するための数字列が続
いている考えられるため、検出手段11では、テキスト
データをデータ保持機能11bの配列BUNBO(m)に格納す
るステップから上述のステップを繰り返す(S114〜
S116)。
【0030】一方、テキストデータTm が数字データで
なければ、検出手段11は、分数表記データが確定した
ものとする。そして、置換手段13は、配列BUNSI(n)及
び配列BUNBO(m)に格納されている全てのテキストデータ
と、記憶手段12が記憶している文字データとを取り出
して、これらを配列BUNBO(m)から取り出したテキストデ
ータ(分母データ)、記憶手段12から取り出した「ぶ
んの」を表記するための文字データ、配列BUNSI(n)から
取り出したテキストデータ(分子データ)の順で出力バ
ッファ14へ送出する。つまり、置換手段13は、検出
手段11が検出した分数表記データを文字データだけの
組み合わせからなる新たな分数表記データに置き換える
(S117)。
【0031】テキストデータが出力バッファ14へ送出
されると、出力バッファ14は、そのテキストデータを
さらに制御部2へ送出(OUT)する(S118)。そ
して、制御部2は、出力バッファ14からのテキストデ
ータに対する解析を行って、文字データについてのみ合
成パラメータを生成する。合成パラメータが生成される
と、音声合成部4はその合成パラメータを基に音声波形
を合成し、さらに音声出力部5はD/A変換によって音
声データを得る。
【0032】このように、本実施の形態のテキスト音声
変換装置では、テキストデータの中にスラッシュデータ
と数字データとの組み合わせからなる分数表記データが
あると、検出手段11がこれを検出するとともに、置換
手段13が記憶手段12に記憶された文字データを基
に、この分数表記データを文字データだけの組み合わせ
からなる新たな分数表記データに置き換え、この新たな
分数表記データを音声データに変換するようになってい
る。したがって、このテキスト音声変換装置では、入力
されたテキストデータの中にスラッシュデータを含む分
数表記データがあっても、この分数表記データを、分数
表記データが本来有する意味の音声データとして変換す
ることが可能となる。これにより、例えばテキストデー
タを入力する以前の時点で分数表記データに対する修正
を加える必要がなくなるので、容易で、かつ、正しい音
声データへの変換を実現できるようになる。
【0033】〔第2の実施の形態〕ここでは、日付を表
記するための日付表記データに対応するテキスト音声変
換装置について説明する。なお、日付表記データとは、
数字データと、日付を表記する記述記号であるスラッシ
ュ記号を表記するための日付記号データ(以下、スラッ
シュデータと称す)との組み合わせからなる表記データ
であるものとする。また、数字データには、日付におけ
る月日の月を表記するための月データと、月日の日を表
記するための日データがあるものとする。ただし、上述
した第1の実施の形態と同一の構成要素については、同
一の符号を与えてその説明を省略する。
【0034】本実施の形態のテキスト音声変換装置は、
図3に示すように、第1の実施の形態における分数検出
変換部10に替わり、日付検出変換部20が設けられて
いるものである。日付検出変換部20は、例えばCP
U、ROM及びRAMの組み合わせからなるものであ
り、検出手段21と、記憶手段22と、置換手段23
と、出力バッファ14とを備えてなるものである。
【0035】検出手段21は、判断機能11aとデータ
保持機能21bとを有し、例えば「2/3(2月3日と
読む)」といった日付を表記するための日付表記データ
を検出するものである。なお、データ保持機能21bで
は、配列MONTH(n)及び配列DAY(m)を備え、これら配列MO
NTH(n)及び配列DAY(m)に数字データを一時的に保持する
ようになっている。記憶手段22は、日付表記データの
中の月データと日データとに対応する第1の文字データ
及び第2の文字データを予め記憶しているものである。
つまり、記憶手段22は、日付の表記に用いる文字デー
タで、かつ、スラッシュデータの読み方である「月」及
び「日」を表記するための文字データを記憶しているも
のである。置換手段23は、記憶手段22に記憶された
文字データを用いて、検出手段21が検出した日付表記
データを文字データだけの組み合わせからなる新たな日
付表記データに置き換えるものである。
【0036】次に、以上のように構成されたテキスト音
声変換装置における日付検出変換部20での日付表記デ
ータに対する処理動作例について、図4のフローチャー
トを参照して説明する。ただし、ここでは、第1の実施
の形態との相違点のみを説明するものとする。データ入
力部1から受け取ったテキストデータの中に日付表記デ
ータがあると、日付検出変換部20では、検出手段21
がその日付表記データを検出する。ただし、日付表記デ
ータを構成する数字データは、データ保持機能21bの
配列MONTH(n)と配列DAY(m)とに格納されている(S20
1〜S216)。
【0037】検出手段21が日付表記データを検出し、
その日付表記データが確定したものとすると、置換手段
23は、配列MONTH(n)及び配列DAY(m)に格納されている
全てのテキストデータと、記憶手段22が記憶している
文字データとを取り出して、これらを配列MONTH(n)から
取り出したテキストデータ(月データ)、記憶手段22
から取り出した「月」を表記するための文字データ(第
1の文字データ)、配列DAY(m)から取り出したテキスト
データ(日データ)、記憶手段22から取り出した
「日」を表記するための文字データ(第2の文字デー
タ)の順で出力バッファ14へ送出する。つまり、置換
手段23は、検出手段21が検出した日付表記データを
文字データだけの組み合わせからなる新たな日付表記デ
ータに置き換える(S217)。
【0038】このように、本実施の形態のテキスト音声
変換装置では、テキストデータの中にスラッシュデータ
と数字データとの組み合わせからなる日付表記データが
あると、検出手段21がこれを検出するとともに、置換
手段23が記憶手段22に記憶された文字データを基
に、この日付表記データを文字データだけの組み合わせ
からなる新たな日付表記データに置き換え、この新たな
日付表記データを音声データに変換するようになってい
る。したがって、このテキスト音声変換装置では、入力
されたテキストデータの中にスラッシュデータを含む日
付表記データがあっても、上述した第1の実施の形態の
場合と同様に、容易で、かつ、正しい音声データへの変
換を実現できるようになる。
【0039】〔第3の実施の形態〕ここでは、分数表記
データと日付表記データとの両方に対応するテキスト音
声変換装置について説明する。ただし、上述した第1ま
たは第2の実施の形態と同一の構成要素については、同
一の符号を与えてその説明を省略する。
【0040】本実施の形態のテキスト音声変換装置は、
図5に示すように、データ入力部1と制御部2との間に
前処理部30が設けられているものである。前処理部3
0は、例えばCPU、ROM及びRAMの組み合わせか
らなるものであり、検出手段31と、決定手段32と、
記憶手段33と、置換手段34と、出力バッファ14と
を備えてなるものである。検出手段31は、判断機能1
1aとデータ保持機能31bとを有し、例えば「2/
3」といった数字データとスラッシュデータとの組み合
わせからなる表記データを検出するものである。なお、
データ保持機能31bでは、配列A(n)及び配列B(m)を備
え、これら配列A(n)及び配列B(m)に数字データを一時的
に保持するようになっている。
【0041】決定手段32は、例えばユーザが操作する
ことが可能なスイッチからなるもので、このスイッチの
切り替えに従って、以下に説明するスラッシュフラグ
(SFLAG )の中のいずれか一つを生成するものである。
スラッシュフラグは、数字データとスラッシュデータと
の組み合わせからなる表記データを、分数表記データと
するか、日付表記データとするか、または単なる記号を
含む表記データとするかを決定するためのものである。
つまり、スラッシュフラグには、表記データを分数表記
データとして扱うためのフラグである「FRACT 」と、日
付表記データとして扱うためのフラグである「DATE」
と、単なる記号を含む表記データとして扱うためのフラ
グである「NORMAL」とがある。なお、決定手段32は、
物理的なスイッチであっても良いし、また電気信号によ
るメモリスイッチであっても構わない。
【0042】記憶手段33は、「ぶんの」を表記するた
めの文字データと、「月」及び「日」を表記するための
文字データとを、それぞれ予め記憶しているものであ
る。置換手段34は、設定手段33で生成されたスラッ
シュフラグが「FRACT 」または「DATE」であると、検出
手段31が検出した表記データを、記憶手段33に記憶
された文字データを用いて、文字データだけの組み合わ
せからなる新たな分数表記データまたは新たな日付表記
データに置き換えるものである。ただし、置換手段34
では、この置き換えを行う際にスラッシュフラグに従っ
て、例えば、配列B(m)から取り出したテキストデータ、
「ぶんの」を表記するための文字データ、配列A(n)から
取り出したテキストデータの順で出力バッファ14へ送
出するか、あるいは配列A(n)から取り出したテキストデ
ータ、「月」を表記するための文字データ、配列B(m)か
ら取り出したテキストデータ、「日」を表記するための
文字データの順で出力バッファ14へ送出するかを判断
するようになっている。
【0043】次に、以上のように構成されたテキスト音
声変換装置における前処理部30でのテキストデータに
対する処理動作例について、図6のフローチャートを参
照して説明する。ただし、ここでは、第1または第2の
実施の形態との相違点のみを説明するものとする。デー
タ入力部1から受け取ったテキストデータの中に数字デ
ータとスラッシュデータとの組み合わせからなる表記デ
ータがあると、前処理部30では、検出手段31がその
表記データを検出する。ただし、この表記データの中の
数字データは、データ保持機能31bの配列A(n)と配列
B(m)とに格納されている(S301〜S316)。
【0044】検出手段31が数字データとスラッシュデ
ータとの組み合わせからなる表記データを検出し、その
表記データの中の数字データが配列A(n)及び配列B(m)に
格納されると、続いて置換手段34は、決定手段32に
よって生成されたスラッシュフラグを確認する(S31
7)。スラッシュフラグが「FRACT 」であると、置換手
段34は、第1の実施の形態における置換手段13と同
様に、検出手段31が検出した表記データを文字データ
だけの組み合わせからなる新たな分数表記データに置き
換える(S318)。また、スラッシュフラグが「DAT
E」であると、置換手段34は、第2の実施の形態にお
ける置換手段23と同様に、検出手段31が検出した表
記データを文字データだけの組み合わせからなる新たな
日付表記データに置き換える(S319)。さらに、ス
ラッシュフラグが「NORMAL」であると、置換手段34
は、検出手段31が検出した表記データに対して何も処
理を行わずそのままの表記データとする(S320)。
【0045】このように、本実施の形態のテキスト音声
変換装置では、決定手段32が設けられたことによっ
て、検出手段31が検出した表記データを分数表記デー
タとするか、日付表記データとするか、あるいは単なる
表記データとするかを決定できるようになっている。し
たがって、このテキスト音声変換装置では、ユーザの意
図により音声データへの変換形態を自由に切り替えるこ
とが可能となり、第1、第2の実施の形態に加えてさら
に機能が充実し、装置としての汎用性が増大することと
なる。
【0046】〔第4の実施の形態〕ここでは、ルビ表記
に対応するテキスト音声変換装置について説明する。た
だし、上述した第1、第2または第3の実施の形態と同
一の構成要素については、同一の符号を与えてその説明
を省略する。
【0047】本実施の形態のテキスト音声変換装置は、
図7に示すように、データ入力部1と制御部2との間に
ルビ行検出変換部40が設けられているものである。ル
ビ行検出変換部40は、例えばCPU、ROM及びRA
Mの組み合わせからなるものであり、検出手段41と、
置換手段42と、出力バッファ14とを備えてなるもの
である。
【0048】検出手段41は、入力されたテキストデー
タの中にルビ表記があると、ルビを表記するための文字
データであるルビデータと、前記ルビが付される文字を
表記するための文字データである被ルビデータとを検出
するものである。ただし、このテキスト音声変換装置に
入力されるテキストデータは、ルビ表記を行う場合に、
テキストデータの2行分を用い、前の行をルビ行とし後
の行をルビが付される行とし、さらにルビ行にはその行
がルビ行であることを示すための制御コードが与えられ
るようになっている。したがって、検出手段41では、
テキストデータの中に制御コードがあると、この制御コ
ードを基にルビデータと被ルビデータとを検出するよう
になっている。そのために、検出手段41では、判断機
能41aと、データ保持機能41bとを有している。
【0049】判断機能41aは、データ入力部1で受け
取ったテキストデータの中にルビ行を示す制御コードが
あるか否かを判断するとともに、前記テキストデータに
おける1行分の文字数を認識するものである。データ保
持機能41bは、文字データを格納するための配列RUBI
(COLUMN)及び配列HONBUN(COLUMN)を備え、これら配列RU
BI(COLUMN)及び配列HONBUN(COLUMN)により文字データを
一時的に保持する機能である。ただし、配列RUBI(COLUM
N)、配列HONBUN(COLUMN)は、格納する文字データの文字
数に応じて、変数COLUMNが可変するようになっている。
置換手段42は、検出手段41がルビデータと被ルビデ
ータとを検出すると、これらルビデータと被ルビデータ
とを置き換え、かつ、置き換え後の被ルビデータを削除
するものである。
【0050】次に、以上のように構成されたテキスト音
声変換装置におけるルビ行検出変換部40でのテキスト
データに対する処理動作例について、図8のフローチャ
ートを参照して説明する。
【0051】データ入力部1がテキストデータを受け取
ると、ルビ行検出変換部40では、初期化処理を行う。
すなわち、検出手段11は、判断機能41aがテキスト
データにおける1行分の文字数を「MOJI」として認識し
(S401)、さらに出力バッファ14がその内部を空
にする(S402)。ただし、判断機能41aによる
「MOJI」の認識は、パソコン等からの情報を基に行って
も、またユーザが直接設定してもよい。初期化処理が終
了すると、検出手段41は、データ入力部1(または図
示しない内部バッファ)からテキストデータを1文字分
受け取って、これをテキストデータT1 とする(S40
3)。そして、検出手段41では、判断機能41aによ
りテキストデータT1 がルビ行を示す制御コードである
か否かを判断する(S404)。
【0052】テキストデータT1 が制御コードでなけれ
ば、以降に続くテキストデータはルビデータではないた
め、検出手段41は、このテキストデータT1 を出力バ
ッファ14(OUT)へ送出する(S405)。また、
テキストデータT1 が制御コードであれば、以降に続く
テキストデータはルビデータであるため、検出手段41
は、先ずデータ保持機能41bの配列RUBI(COLUMN)の変
数COLUMNを「0」とし(S406)、続いて新たなテキ
ストデータ(ルビデータ)を1文字分受け取って、これ
をテキストデータTn とする(S407)。そして、配
列RUBI(COLUMN)の変数COLUMNをインクリメントするとと
もに(S408)、この配列RUBI(COLUMN)にテキストデ
ータTn を格納する(S409)。ただし、配列RUBI(C
OLUMN)はルビデータを格納するものである。したがっ
て、ルビ行の中で、ルビデータのないカラムには「スペ
ース」が格納され、ルビデータのあるカラムにはそのル
ビデータが格納される。
【0053】配列RUBI(COLUMN)にテキストデータTn
格納すると、検出手段41は、判断機能41aによりテ
キストデータにおける1行分の文字数である「MOJI」と
配列RUBI(COLUMN)の変数COLUMNとの比較を行い(S41
0)、これらが等しくなるまで上述のステップを繰り返
す(S407〜S410)。「MOJI」と変数COLUMNとが
等しくなると、すなわちルビデータの検出が終了する
と、次に検出手段41では、データ保持機能41bの配
列HONBUN(COLUMN)の変数COLUMNを「0」とし(S41
1)、続いて新たなテキストデータ(被ルビデータ)を
1文字分受け取って、これをテキストデータTm とする
(S412)。そして、配列HONBUN(COLUMN)の変数COLU
MNをインクリメントする(S413)。
【0054】ここで、検出手段41は、配列RUBI(COLUM
N)に格納されている中のテキストデータTm と同一のカ
ラムをチェックし、その同一カラムに格納されたテキス
トデータ、すなわちテキストデータTm 対応するテキス
トデータが「スペース」であるか否かを判断する(S4
14)。配列RUBI(COLUMN)内のテキストデータが「スペ
ース」であれば、テキストデータTm は被ルビデータで
はないので、検出手段41では、配列HONBUN(COLUMN)に
そのテキストデータTm を格納する(S415)。
【0055】また、配列RUBI(COLUMN)内のテキストデー
タが「スペース」でなければ、テキストデータTm は被
ルビデータであるので、置換手段42は、このテキスト
データTm ではなく、配列RUBI(COLUMN)内のテキストデ
ータを配列HONBUN(COLUMN)に格納させる(S416)。
そして、置換手段42では、このテキストデータTm
削除する。つまり、置換手段42は、検出手段41が検
出したルビデータを被ルビデータとを置き換える。
【0056】配列HONBUN(COLUMN)にテキストデータTm
または配列RUBI(COLUMN)内のテキストデータを格納する
と、検出手段41は、判断機能41aによりテキストデ
ータにおける1行分の文字数である「MOJI」と配列HONB
UN(COLUMN)の変数COLUMNとの比較を行い(S417)、
これらが等しくなるまで上述のステップを繰り返す(S
412〜S417)。「MOJI」と変数COLUMNとが等しく
なると、ルビデータと被ルビデータとの検出、及びこれ
らの置き換えが終了したので、置換手段42では、配列
HONBUN(COLUMN)に格納されている全てのテキストデータ
を出力バッファ14へ送出する(S418)。そして、
出力バッファ14は、そのテキストデータをさらに制御
部2へ送出(OUT)する(S419)。
【0057】このように、本実施の形態のテキスト音声
変換装置では、テキストデータの中にルビ表記がある
と、検出手段41がそのルビ表記におけるルビデータと
被ルビデータとを検出するとともに、置換手段42がこ
れらのルビデータと被ルビデータとを置き換えるように
なっている。したがって、このテキスト音声変換装置で
は、入力されたテキストデータの中にルビ表記があって
も、このルビ表記におけるルビだけを音声データに変換
することが可能となる。これにより、例えばテキストデ
ータを入力する以前の時点でルビ表記に対する修正を加
える必要がなくなるので、容易で、かつ、正しい音声デ
ータへの変換を実現できるようになる。
【0058】なお、上述した第1、第2及び第3の実施
の形態では、それぞれ数字データとスラッシュデータと
の組み合わせからなる分数表記データまたは日付表記デ
ータに対応するテキスト音声変換装置について説明した
が、本発明はこれに限定されるものではない。例えば、
アルファベットを表記するための文字データとスラッシ
ュデータとの組み合わせからなる分数表記データ
や、「’96.4.1」といったように表記される日付
表記データに対してであっても適用可能である。さら
に、本発明は、分数表記データや日付表記データだけで
はなく、例えば「12:20」を「12時20分」と置き換えた
り、「3.5」を「3てん5」と置き換えたり、「√
2」を「ルート2」と置き換えたりする場合にも適用可
能である。
【0059】
【発明の効果】以上に説明したように、本発明のテキス
ト音声変換装置は、変換するテキストデータの中に音声
データへの変換を必要とする記述記号データと文字デー
タとの組み合わせからなる表記データがあると、この表
記データを文字データだけの組み合わせからなる新たな
表記データに置き換え、この新たな表記データを音声デ
ータに変換するようになっている。したがって、このテ
キスト音声変換装置では、記述記号データと文字データ
との組み合わせからなる表記データを、この表記データ
が本来有する意味の音声データとして変換することが可
能となるので、例えばテキストデータを入力する以前の
時点で表記データに対する修正を加える必要がなくな
り、結果として容易で、かつ、正しい音声データへの変
換を実現できるようになる。
【0060】また、本発明のテキスト音声変換装置は、
変換するテキストデータの中にルビ表記があると、その
ルビ表記におけるルビデータを、このルビデータにより
ルビが付される文字データと置き換えるようになってい
る。したがって、このテキスト音声変換装置では、ルビ
表記におけるルビだけを音声データに変換することが可
能となるので、上述した記述記号データと文字データと
の組み合わせからなる表記データの場合と同様の効果が
得られる。
【図面の簡単な説明】
【図1】本発明に係わるテキスト音声変換装置の第1の
実施の形態の概略構成を示すブロック図である。
【図2】図1のテキスト音声変換装置での分数表記デー
タに対する処理動作例を示すフローチャートである。
【図3】本発明に係わるテキスト音声変換装置の第2の
実施の形態の概略構成を示すブロック図である。
【図4】図3のテキスト音声変換装置での日付表記デー
タに対する処理動作例を示すフローチャートである。
【図5】本発明に係わるテキスト音声変換装置の第3の
実施の形態の概略構成を示すブロック図である。
【図6】図5のテキスト音声変換装置での分数表記デー
タ及び日付表記データに対する処理動作例を示すフロー
チャートである。
【図7】本発明に係わるテキスト音声変換装置の第4の
実施の形態の概略構成を示すブロック図である。
【図8】図7のテキスト音声変換装置でのルビ表記に対
する処理動作例を示すフローチャートである。
【図9】従来のテキスト音声変換装置の概略構成を示す
ブロック図である。
【符号の説明】
11、21、31、41 検出手段 12、22、33 記憶手段 13、23、34、42 置換手段 32 決定手段

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 文字を表記するための文字データと記述
    記号を表記するための記述記号データとからなるテキス
    トデータが入力されると、該テキストデータを音声とし
    て出力可能な音声データに変換するテキスト音声変換装
    置であって、 入力されたテキストデータの中に、音声データへの変換
    を必要とする記述記号データと文字データとの組み合わ
    せからなる表記データがあると、該表記データを検出す
    る検出手段と、 前記変換を必要とする記述記号データにより表記される
    記述記号の読み方を文字データとして予め記憶している
    記憶手段と、 前記検出手段が検出した表記データを、該表記データの
    中の文字データと前記記憶手段に記憶された文字データ
    との組み合わせからなる新たな表記データに置き換え、
    該新たな表記データに対して前記音声データへの変換を
    行わせる置換手段とが設けられたことを特徴とするテキ
    スト音声変換装置。
  2. 【請求項2】 前記表記データが分数を表記するための
    分数表記データであり、かつ、該分数表記データは前記
    分数の分子を表記するための文字データである分子デー
    タと、前記分数を表記するための記述記号データである
    分数記号データと、前記分数の分母を表記するための文
    字データである分母データとからなる場合に、前記置換
    手段は、前記分数記号データを前記記憶手段に記憶され
    た文字データに置き換えるとともに、前記分母データ、
    置き換え後の文字データ、前記分子データの順でこれら
    を組み合わせ、これを新たな分数表記データとするもの
    であることを特徴とする請求項1記載のテキスト音声変
    換装置。
  3. 【請求項3】 前記表記データが日付における月日を表
    記するための日付表記データであり、かつ、該日付表記
    データは前記月日の月を表記するための文字データであ
    る月データと、日付を表記するための記述記号データで
    ある日付記号データと、前記月日の日を表記するための
    文字データである日データとからなる場合に、前記置換
    手段は、前記日付記号データを、前記記憶手段に記憶さ
    れ前記月データ及び前記日データのそれぞれに対応する
    第1の文字データと第2の文字データとに置き換えると
    ともに、前記月データ、前記第1の文字データ、前記日
    データ、前記第2の文字データの順でこれらを組み合わ
    せ、これを新たな日付表記データとするものであること
    を特徴とする請求項1記載のテキスト音声変換装置。
  4. 【請求項4】 前記表記データが分数を表記するための
    分数表記データであるか、若しくは日付を表記するため
    の日付表記データであるかを決定する決定手段が設けら
    れたことを特徴とする請求項1記載のテキスト音声変換
    装置。
  5. 【請求項5】 文字を表記するための文字データと、ル
    ビを表記するための文字データであるルビデータと、前
    記ルビが付される文字を指示する制御コードとからなる
    テキストデータが入力されると、該テキストデータから
    前記制御コードを除去して前記文字データと前記ルビデ
    ータとを音声データに変換するテキスト音声変換装置に
    おいて、 入力されたテキストデータの中に前記制御コードがある
    と、該制御コードを基にルビデータと該ルビデータに対
    応する文字データとを検出する検出手段と、 該検出手段が検出したルビデータと文字データとを置き
    換え、かつ、置き換え後の文字データを削除する置換手
    段とを備えることを特徴とするテキスト音声変換装置。
JP8060411A 1996-03-18 1996-03-18 テキスト音声変換装置 Pending JPH09251300A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8060411A JPH09251300A (ja) 1996-03-18 1996-03-18 テキスト音声変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8060411A JPH09251300A (ja) 1996-03-18 1996-03-18 テキスト音声変換装置

Publications (1)

Publication Number Publication Date
JPH09251300A true JPH09251300A (ja) 1997-09-22

Family

ID=13141419

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8060411A Pending JPH09251300A (ja) 1996-03-18 1996-03-18 テキスト音声変換装置

Country Status (1)

Country Link
JP (1) JPH09251300A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19990067832A (ko) * 1998-01-14 1999-08-25 이데이 노부유끼 정보송수신장치,정보송신장치,정보수신장치및정보송수신방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19990067832A (ko) * 1998-01-14 1999-08-25 이데이 노부유끼 정보송수신장치,정보송신장치,정보수신장치및정보송수신방법

Similar Documents

Publication Publication Date Title
KR100403293B1 (ko) 음성합성방법, 음성합성장치 및 음성합성프로그램을기록한 컴퓨터판독 가능한 매체
US6490563B2 (en) Proofreading with text to speech feedback
JP2001092484A (ja) 認識単語登録方法、音声認識方法、音声認識装置、認識単語登録のためのソフトウエア・プロダクトを格納した記憶媒体、音声認識のためのソフトウエア・プロダクトを格納した記憶媒体
JP2005078211A (ja) 中国語入力プログラム
JPH09251300A (ja) テキスト音声変換装置
JP2002207728A (ja) 表音文字生成装置及びそれを実現するためのプログラムを記録した記録媒体
JP6619932B2 (ja) 形態素解析装置およびプログラム
KR100702483B1 (ko) 한자 입력 시스템 및 그 방법
JP6197523B2 (ja) 音声合成装置、言語辞書修正方法及び言語辞書修正用コンピュータプログラム
JP3762300B2 (ja) テキスト入力処理装置及び方法並びにプログラム
JP3589972B2 (ja) 音声合成装置
JP2009199434A (ja) アルファベット文字列日本語読み変換装置及びアルファベット文字列日本語読み変換プログラム
JP2002207557A (ja) 日本語入力システム、日本語入力方法、および、記録媒体
JP2003005776A (ja) 音声合成装置
JP3414326B2 (ja) 音声合成用辞書登録装置及び方法
JPH11338498A (ja) 音声合成装置
JP2009258369A (ja) 音声認識辞書生成装置及び音声認識処理装置
JP5125404B2 (ja) 省略語判定装置、コンピュータプログラム、テキスト解析装置及び音声合成装置
JP2000010579A (ja) 音声合成装置及びコンピュータ可読記録媒体
JP2006098552A (ja) 音声情報生成装置、音声情報生成プログラム及び音声情報生成方法
JP3048793B2 (ja) 文字変換装置
JP2001166790A (ja) 書き起こしテキスト自動生成装置、音声認識装置および記録媒体
CN114327090A (zh) 日文输入方法以及相关装置、设备
JPH08272780A (ja) 中国語入力処理装置及び中国語入力処理方法及び言語処理装置及び言語処理方法
JPS6024630A (ja) 制御情報付きカナ文字列形成方式