JPH05333893A - 文書読み上げ装置 - Google Patents

文書読み上げ装置

Info

Publication number
JPH05333893A
JPH05333893A JP4137178A JP13717892A JPH05333893A JP H05333893 A JPH05333893 A JP H05333893A JP 4137178 A JP4137178 A JP 4137178A JP 13717892 A JP13717892 A JP 13717892A JP H05333893 A JPH05333893 A JP H05333893A
Authority
JP
Japan
Prior art keywords
reading
voice data
document
voice
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4137178A
Other languages
English (en)
Inventor
Kenichiro Kobayashi
賢一郎 小林
Hiromi Saito
裕美 斎藤
Isamu Iwai
勇 岩井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba AVE Co Ltd
Original Assignee
Toshiba Corp
Toshiba AVE Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba AVE Co Ltd filed Critical Toshiba Corp
Priority to JP4137178A priority Critical patent/JPH05333893A/ja
Publication of JPH05333893A publication Critical patent/JPH05333893A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】特殊文字が混在する文書についても自然な読み
上げを可能とする。 【構成】日本語解析部4は、文書データ1について、単
語の情報が記述されている単語辞書5を参照しながら、
単語の単位とこの単語の読みに関する情報を求める。音
声データ生成部8は、日本語解析部4による解析結果を
もとに音声データを生成するものであって、文字列に特
殊文字が含まれる場合に、特殊文字の読みと特殊文字と
連続する数字の読みとを入れ替えた読みの音声データを
生成する。音声合成装置12は、音声データ生成部8に
よって生成された音声データに応じて、音声発生装置1
3から音声を発生させる。また、設定バッファ6に、音
声データ生成部8による読みの入れ替えを行なうか否か
を示す情報を設定し、この情報に応じて音声データ生成
部8による読みの入れ替えを行なう。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、日本語解析処理と音声
合成処理を用いた文書読み上げ装置に関する。
【0002】
【従来の技術】従来の音声読み上げ装置においては、日
本語解析の結果得られる単語列に対して、そのまま読み
を扱っていた。このため、「100円」に対しては「ひ
ゃくえん」という読みを生成できるが、「¥100」に
対しては「えんひゃく」という読みの生成を行ってい
た。
【0003】
【発明が解決しようとする課題】このように、従来の音
声読み上げ装置においては、「¥100」のような特殊
文字を含む文字列に対しては「えんひゃく」という読み
の生成を行ってしまい、自然な文書の読み上げを行なう
ことができなかった。これは、「¥」に限らず、「$」
などの他の特殊文字、すなわち単位記号について問題と
なる。
【0004】本発明は前記のような点に鑑みてなされた
もので、特殊文字が混在する文書についても自然な読み
上げが可能な文書読み上げ装置を提供することを目的と
する。
【0005】
【課題を解決するための手段】本発明は、文書データを
保持する文書記憶手段と、単語の情報が記述されている
単語辞書と、前記単語辞書を用いて前記文書データを構
成する単語の単位と同単語の読みに関する情報を求める
日本語解析手段と、前記日本語解析手段による解析結果
をもとに音声データを生成するものであって、前記文書
データに含まれる特殊文字の読みと前記特殊読みと連続
する数字の読みとを入れ替えた読みの音声データを生成
する音声データ生成手段と、前記音声データ生成手段に
よって生成された音声データに応じて音声を発生させる
音声発生手段とを具備することを特徴とする。
【0006】また、前記音声データ生成手段による読み
の入れ替えを行なうか否かを示す情報を設定するための
設定手段をさらに具備し、前記音声データ生成手段は、
前記設定手段に設定された情報の内容に応じて音声デー
タの生成を行なうことを特徴とする。
【0007】
【作用】このような構成によれば、特殊文字と連続する
数字の読みを入れ替えて音声データを生成することによ
り、「¥1000」のような文字列についても、この文
字列がもつ本来の意味に従う自然な読み上げが行なわれ
る。
【0008】
【実施例】以下、図面を参照して本発明の一実施例を説
明する。図1は同実施例に係わる文書読み上げ装置の構
成を示すブロック図である。図1に示すように、文書デ
ータ1、入力装置2、制御部3、日本語解析部4、単語
辞書5、設定バッファ6、解析結果バッファ7、音声デ
ータ生成部8、音声データ生成規則9、特殊文字テーブ
ル10、音声データバッファ11、音声合成装置12、
音声発生装置13、表示装置14によって構成されてい
る。
【0009】音声データ1は、計算機により処理可能な
形で表された複数の文書で、日本語ワードプロセッサな
どの文書作成装置により作成されたり、OCR(光学的
文字読取装置)などにより計算機の中に読み込まれたも
のである。
【0010】入力装置2は、キーボードなどによって構
成され、制御部3に対する文書読み上げ処理の開始の指
示、読み上げの対象となる文書の指定、その文書を読み
上げる条件の指示等を行なうためのものである。制御部
3は、装置全体の制御を司るものである。
【0011】日本語解析部4は、文書に対して単語の形
態情報、読み情報、アクセント情報、単語間の共起情報
などを収めた単語辞書5を参照しながら、形態的、構文
的、意味的に解析を行ない、文書を単語単位に切り分
け、各単語の情報をまとめた解析結果を解析結果バッフ
ァ7に対して書き込む。
【0012】単語辞書5は、日本語解析部4における日
本語解析のために参照されるもので、見出し毎に品詞の
他、前述したような情報が登録されている。設定バッフ
ァ6は、文書の読み上げの条件に関するデータを設定す
るためのものである。設定バッファ6には、特殊文字、
すなわち単位記号について読みの入れ替えを行なうか否
かを指定するデータが含まれる。設定バッファ6の詳細
については後述する。解析結果バッファ7は、日本語解
析部4による解析結果、すなわち読み、アクセント型、
拍数、品詞、活用形等が格納される。詳細については後
述する。
【0013】音声データ生成部8は、音声データ生成規
則9、及び特殊文字テーブル10を参照しながら、解析
結果バッファ7に格納された解析結果をもとに、音声デ
ータを生成し、音声データバッファ11に格納する。
【0014】音声データ生成規則9は、日本語解析結果
から音声データを生成するための規則データが登録され
ている。特殊文字テーブル10は、読みの中で入れ替え
を行なうべき特殊文字(単位記号)を登録するためのも
のである。音声データバッファ11は、音声データ生成
部8によって生成された、音声合成のもとになる音声デ
ータを格納するためのものである。
【0015】音声合成装置12は、音韻列と、各種制御
コードからなるデータを受け取ることにより電気的な音
声信号に変換する装置であり、このデータは音声データ
と同じ形式をとっている。
【0016】音声合成装置12は、設定バッファ6に設
定された読み上げの速度、高さ、強さ等に応じて、音声
データバッファ11に格納された音声データに対応する
音声用の電気信号を生成して、スピーカなどにより構成
される音声発生装置13から音声を出力させる。表示装
置14は、CRTやLCD等によって構成され、オペレ
ータによる各種設定や読み上げ文書の指定等を行なうた
めの画面を表示する。
【0017】次に、図2に示すフローチャートを参照し
ながら、具体例を示しながら一連の処理の流れについて
説明する。まず、文書データ1から読み上げの対象とす
る文書の選択が行なわれる(ステップS1)。例えば、
文書データ1中の複数の文書の文書名等を表示装置14
に表示させて、オペレータによって入力装置2を用いて
任意に選択させる。図3には、読み上げ対象として選択
された文書の一部を表している。
【0018】また、制御部3は、表示装置14に読み上
げ条件を設定するための画面を表示させる。オペレータ
は、表示装置14に表示されている指示に従いながら、
入力装置2から文書読み上げ時の条件を設定することが
できる(ステップS2)。ここで、設定できる条件とし
ては、基本の読み上げの速度、音質、高さ、強さ、読み
上げ終了の設定時間、強調文字の特殊読み上げの有無、
強調文字の特殊読み上げ時の変更点、特殊読み上げの有
無、休みの長さ、特殊文字の読みの入れ替えの有無など
がある。制御部3に入力された読み上げ条件に関するデ
ータは、設定バッファ6に、図4に示すように格納され
る。
【0019】オペレータによって指定された文書のデー
タは、制御部3を通して日本語解析部4に渡される。日
本語解析部4が参照する単語辞書5は、図5に示すよう
に、見出し毎に品詞、読み、アクセント型、意味、共起
情報等が対応づけられたデータ構造をとっている。
【0020】日本語解析部4は、単語辞書5を用いて、
制御部3から与えられた文書データについて日本語解
析、すなわち形態的、構文的、意味的に解釈し、単語毎
に分割し、解析する(ステップS3)。この解析結果
は、制御部3を介して、解析結果バッファ7に対して書
き込まれる。図6には解析バッファ7に格納される解析
結果のデータ構造を示している。
【0021】日本語解析部4は、文書の解析が終了する
と、文書の解析が終了したことを示す信号を制御部3に
対して送る。この信号に応じて制御部3は、音声データ
生成部8に対して起動をかける。
【0022】音声データ生成部8は、解析結果バッファ
7に格納された内容について、1単語毎に、音声データ
生成規則9、及び特殊文字テーブル10を参照しながら
音声データの作成を行なう。音声データ生成部8は、設
定バッファ6に設定された特殊文字の読みの入れ替えの
有無を判別する(ステップS4)。読みの入れ替えが
「有」に設定されている場合、音声データ生成部8は、
特殊文字テーブル10を参照して(ステップS5)、読
みの入れ替えの対象となる特殊文字、すなわち単位記号
であるか判別する(ステップS6)。
【0023】特殊文字であった場合、この文字に続く文
字が数字であるかを判別する(ステップS7)。特殊文
字と数字が連続している場合、音声データ生成部8は、
特殊文字と数字の読みの入れ替えを行なう(ステップS
8)。そして、音声データ生成部8は、音声データ生成
規則9に登録された規則に従って音声データを作成す
る。作成された音声データは、制御部3を通して、音声
データバッファ11に格納される。
【0024】解析結果バッファ7中の全ての単語につい
ての音声データ作成が終了していなければ(ステップS
10)、音声データ生成部8は、次の単語を処理対象と
して入力し(ステップS11)、前述のようにして音声
データの作成を行なう。
【0025】なお、ステップS4において、読みの入れ
替えが「無」に設定されている場合には、元の文書にお
ける単語順に、音声データの作成が行なわれる(ステッ
プS9)。また、特殊文字ではない場合(ステップS
6)、または特殊文字であったとしても続く文字が数字
ではない場合(ステップS7)には、同様に元の文書に
おける単語順に、音声データの作成が行なわれる(ステ
ップS9)。図7には音声データ作成のための音声デー
タ生成規則の一例を示し、図8には出力される音声デー
タの一例を示している。
【0026】図7は五段動詞でアクセントの形が0型で
ない場合で、その活用形が未然形の場合は、そのアクセ
ントの形を0型にするという規則の例である。また、図
8には、音声データバッファ11に格納される音声デー
タのフォーマットを示している。ここで読み上げ文字列
データにおいて、カタカナ文字は発声の対象となる音で
ある読みデータを表し、「^」はアクセントの位置を表
し、「.」は設定バッファ6に設定されている長さ(m
秒)の休みを表している。
【0027】図8に示すように、「¥」が特殊文字とし
て登録されている場合には、この文字に続く「100
0」が数字であるため、「¥1000」の読みが「えん
/せん」ではなく「せん/えん」になっている。
【0028】また、特殊文字テーブル10の内容が図9
に示すように、「¥」が登録され「No. 」が登録されて
いない場合には、図10に示すように処理が実行され
る。すなわち、図10(a)に示すような「¥」と「N
o. 」が混在する入力文について日本語解析を行った結
果、図10(b)に示すような結果が得られたものとす
る。
【0029】音声データ生成部8は、図10(c)に示
すように、「¥1000」の読みについては前述のよう
にして読みの入れ替えを行なうが、「No. 」に関しては
後ろに続く文字が数字「5」であるが、「No. 」が特殊
文字として登録されていないため、「なんばー/ご」と
いう読みになる。
【0030】音声データ生成部8は、解析結果バッファ
7の内容に対して全ての処理が終了すると、制御部3に
対して音声データが作成できたことを示す信号を送る。
音声データが作成できたことを示す信号が送られた制御
部3は、設定バッファ6を参照して、音声データバッフ
ァ11に格納された音声データを音声合成装置12に送
る。
【0031】音声合成装置12は、制御部3からの音声
データを、設定バッファ6に設定された読み上げ条件を
参照して、電気的な音声信号に変換し、この電気信号に
よってスピーカなどによる音声発生装置13から実際の
合成音として出力させる(ステップS12)。以上の処
理を文書中の全ての文について繰り返して行なうことに
より(ステップS13)、文書の読み上げが行なわれ
る。
【0032】このようにして、文書中に存在する「¥」
などの特殊文字(単位記号)が存在する場合には、読み
の入れ替えが行なわれて音声データが生成されるので、
自然な文書の読み上げを行なうことができるようにな
る。
【0033】なお、前記実施例においては、貨幣の単位
記号を例にして説明したが、対象とする特殊文字はこれ
に限るものではない。また、特殊文字の後ろに続く後ろ
の数字の読みと特殊文字の読みとを入れ替えるものとし
て説明したが、特殊文字の種類によっては特殊文字の前
に連続する数字の読みと入れ替えるようにしても良い。
さらに、設定バッファ6に設定された特殊文字の読みの
入れ替えの有無に応じて、特殊文字データ10に登録さ
れた特殊文字の全てについて読みの入れ替えを行なうか
否かを決定しているが、特殊文字毎に読みの入れ替えの
有無を設定できるようにしても良い。
【0034】
【発明の効果】以上のように本発明によれば、文書中に
特殊な文字である単位記号が混在する場合に、この単位
記号と連続する数字の読みと単位記号の読みとの入れ替
えを行って音声データを生成することができるので、自
然な文書の読み上げが可能となるものである。
【図面の簡単な説明】
【図1】本発明の一実施例に係わる文書読み上げ装置の
構成を示すブロック図。
【図2】同実施例における文書読み上げ処理の流れを説
明するためのフローチャート。
【図3】読み上げ対象として選択された文書の一部を表
す図。
【図4】設定バッファ6に設定される読み上げ条件を説
明するための図。
【図5】単語辞書5のデータ構造を説明するための図。
【図6】解析バッファ7に格納される解析結果のデータ
構造を説明するための図。
【図7】音声データ生成規則の一例を示す図。
【図8】音声データの一例を示す図。
【図9】特殊文字テーブル10の登録内容の一例を示す
図。
【図10】特殊文字の読みの入れ替えを説明するための
図。
【符号の説明】
1…文書データ、2…入力装置、3…制御部、4…日本
語解析部、5…単語辞書、6…設定バッファ、7…解析
結果バッファ、8…音声データ生成部、9…音声データ
生成規則、10…特殊文字テーブル、11…音声データ
バッファ、12…音声合成装置、13…音声発生装置、
14…表示装置。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 岩井 勇 神奈川県川崎市幸区柳町70番地 株式会社 東芝柳町工場内

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 文書データを保持する文書記憶手段と、 単語の情報が記述されている単語辞書と、 前記単語辞書を用いて前記文書データを構成する単語の
    単位と同単語の読みに関する情報を求める日本語解析手
    段と、 前記日本語解析手段による解析結果をもとに音声データ
    を生成するものであって、前記文書データに含まれる特
    殊文字の読みと前記特殊読みと連続する数字の読みとを
    入れ替えた読みの音声データを生成する音声データ生成
    手段と、 前記音声データ生成手段によって生成された音声データ
    に応じて音声を発生させる音声発生手段と、 を具備したことを特徴とする文書読み上げ装置。
  2. 【請求項2】 前記音声データ生成手段による読みの入
    れ替えを行なうか否かを示す情報を設定するための設定
    手段をさらに具備し、 前記音声データ生成手段は、前記設定手段に設定された
    情報の内容に応じて音声データの生成を行なうことを特
    徴とする請求項1記載の文書読み上げ装置。
JP4137178A 1992-05-28 1992-05-28 文書読み上げ装置 Pending JPH05333893A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4137178A JPH05333893A (ja) 1992-05-28 1992-05-28 文書読み上げ装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4137178A JPH05333893A (ja) 1992-05-28 1992-05-28 文書読み上げ装置

Publications (1)

Publication Number Publication Date
JPH05333893A true JPH05333893A (ja) 1993-12-17

Family

ID=15192641

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4137178A Pending JPH05333893A (ja) 1992-05-28 1992-05-28 文書読み上げ装置

Country Status (1)

Country Link
JP (1) JPH05333893A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08272392A (ja) * 1995-03-30 1996-10-18 Sanyo Electric Co Ltd 音声出力装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08272392A (ja) * 1995-03-30 1996-10-18 Sanyo Electric Co Ltd 音声出力装置

Similar Documents

Publication Publication Date Title
JPH05181491A (ja) 音声合成装置
JPH07181992A (ja) 文書読上げ装置及び方法
JP3230868B2 (ja) 音声合成装置
JPH06282290A (ja) 自然言語処理装置およびその方法
JPH05333893A (ja) 文書読み上げ装置
JP2580565B2 (ja) 音声情報辞書作成装置
JPH06119144A (ja) 文書読み上げ装置
JPH08272388A (ja) 音声合成装置及びその方法
JP3093498B2 (ja) 文書読み上げ装置
JPH0731509B2 (ja) 音声分析装置
JPH06176023A (ja) 音声合成システム
JP2801622B2 (ja) テキスト音声合成方法
JPH0836395A (ja) 音声データの生成方法及び文書読上装置
JP2966954B2 (ja) 文書読上げ指示装置
JP2680643B2 (ja) 規則合成装置の文字表示方法
JPH08160983A (ja) 音声合成装置
JP2614912B2 (ja) 文章読み上げ装置
JPH05960Y2 (ja)
JPH05210482A (ja) 発音辞書管理方法
JP2584236B2 (ja) 規則音声合成装置
JP2888847B2 (ja) 文章読み上げ装置とその方法及び言語処理装置とその方法
JPH04177526A (ja) 文章読み上げ装置
JPH07160685A (ja) 文章読み上げ装置
JPH01119822A (ja) 文章読み上げ装置
JPH02234198A (ja) テキスト音声合成システム