JPH07121537A - 文書処理装置及びその方法 - Google Patents

文書処理装置及びその方法

Info

Publication number
JPH07121537A
JPH07121537A JP5267234A JP26723493A JPH07121537A JP H07121537 A JPH07121537 A JP H07121537A JP 5267234 A JP5267234 A JP 5267234A JP 26723493 A JP26723493 A JP 26723493A JP H07121537 A JPH07121537 A JP H07121537A
Authority
JP
Japan
Prior art keywords
word
document
phrase
substituted
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP5267234A
Other languages
English (en)
Inventor
Takanari Ueda
隆也 上田
Shiro Ito
史朗 伊藤
Minoru Fujita
稔 藤田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP5267234A priority Critical patent/JPH07121537A/ja
Publication of JPH07121537A publication Critical patent/JPH07121537A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 ユーザにとって読み上げられた文書の内容が
理解し易い文書処理装置を提供する。 【構成】 文書処理装置に、文書を記憶する文書DB1
03と、文書DB103により記憶された文書中の語句
より、音声出力された場合に同定し難い語句を判別し、
同定し難いと判別された語句を、同定し易い同意の語句
に置換する置換部107と、置換後の文書を合成音声に
より読み上げる音声合成部111、音声出力部112と
を具える。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声合成によって、記
憶された文書を読み上げる文書処理装置に関するもので
ある。
【0002】
【従来の技術】音声規則合成技術の向上により、文書を
計算機によって読み上げることが可能となってきてい
る。これを用いて、記憶された文書の内容を、ディスプ
レイに表示する代わりに、合成音声によって読み上げ、
スピーカ等より音声出力させることもできる。従って、
両出力装置を併設することにより、状況に応じて出力形
態を選択可能とする、よりよいインターフェースを実現
できるようになってきている。例えば、データベースよ
り文書を検索し、検索結果を読み上げさせることもでき
る。
【0003】
【発明が解決しようとしている課題】しかしながら、上
記従来の装置により、文書を読み上げさせた場合には、
耳で聞いただけでは、同音異義語が多くて区別できない
語や、分かりにくい難しい語も存在する。このような語
が文書中にあると、これをそのまま音声合成し、読み上
げただけでは、音声出力された情報を聞いているユーザ
がその意味を理解できず、ユーザへ情報伝達が十分にで
きないという危険性があった。
【0004】本発明は、上述した従来の課題を解決し、
ユーザにとって読み上げられた文書の内容が理解し易い
文書処理装置を提供することを目的とする。
【0005】
【課題を解決するための手段】上記課題を解決するため
に、本発明の文書処理装置は、文書を記憶する文書記憶
手段と、該文書記憶手段により記憶された文書中の語句
より、音声出力された場合に同定し難い語句を判別する
判別手段と、該判別手段により同定し難いと判別された
語句を、同定し易い同意の語句に置換する置換手段と、
前記文書記憶手段に記憶された文書を、合成音声により
読み上げる読み上げ手段とを具える。
【0006】また、本発明の他の態様によれば、文書処
理方法に、文書メモリに記憶された文書中の語句より、
音声出力された場合に同定し難い語句を判別する判別工
程と、該判別工程により同定し難いと判別された語句
を、同定し易い同意の語句に置換する置換工程と、前記
文書メモリに記憶された文書中で、前記判別工程により
同定し難いと判別された語句を、前記置換工程により同
定し易い同意の語句に置換して、該文書を合成音声によ
り読み上げる読み上げ工程とを具えることを特徴とす
る。
【0007】
【作用】かかる本発明の構成において、文書記憶手段に
より記憶された文書中の語句により、判別手段が音声出
力された場合に同定し難い語句を判別し、同定し難いと
判別された語句を、前記置換手段により同定し易い同意
の語句に置換して、読み上げ手段が、置換後の文書を読
み上げる。
【0008】また、他の態様によれば、判別工程によ
り、文書メモリに記憶された文書中で、音声出力された
場合同定し難い語句を判別し、同定し難いと判別された
語句を、置換工程により同定し易い同意の語句に置換し
て、該文書を読み上げ工程において、合成音声により読
み上げる。
【0009】
【実施例】以下、図面を参照して本発明の実施例を詳細
に説明する。本実施例では、文書データベースから文書
を検索して、その結果得られた文書を読み上げるシステ
ムを例にとる。
【0010】図1は、本発明の一実施例に係る文書処理
装置の構成を示すブロック図である。
【0011】同図において、101は検索条件を入力す
る入力部、102は検索処理を行なう検索部、103は
文書を格納する文書データベース、104は検索処理の
結果得られた文書の形態素解析・構文解析などを行なう
文解析部、105は文解析部104で行なう文解析に用
いる解析辞書、106は文解析部104で解析した結果
を保持する解析結果保持部である。次に、107は解析
された文書中で置換すべき語を置換する置換部、108
は置換すべき語とそれを置き換える語とを対応させて記
述した置換語辞書、109は形態素生成を行なう形態素
生成部、110は形態素生成部109で行なう形態素生
成に用いる生成辞書、111は音声規則合成によって文
書の内容を音声に変換する音声合成部、112は合成さ
れた音声を出力する音声出力部である。
【0012】図2は、上述の文書処理装置のハードウェ
ア構成を示す図である。同図において、201は図3の
フローチャートに示す制御手順を記憶する制御メモリで
ある。これはROMであってもよいし、RAMであって
もよい。202はメモリで、解析結果を保持する解析結
果保持部106を有する。203は検索条件等の入力を
行なうためのキーボードである。204は制御メモリ2
01に記憶されている制御手順にしたがって処理を行な
う中央処理装置である。205は、文書データベース1
03、解析辞書105、置換語辞書108、生成辞書1
10、を有するディスク装置である。206は音声合成
のためのD/A変換装置である。207は音声を出力す
るスピーカである。208は各構成要素を接続するため
のバスである。
【0013】図3は、図1に示した装置における動作の
処理手順を示すフローチャートである。本図を参照しな
がら本発明の一実施例の動作を説明する。
【0014】まず、ステップS301で検索処理を行な
う。ここでは、入力部101で入力された検索条件を満
足する文書を、文書データーベース103の中から検索
部102によって検索する。ステップS302では、検
索の結果得られた文書を文書データーベース103から
取り出す。
【0015】次に、ステップS303に移り、取り出し
た文書の解析処理を行なう。ここでは、解析辞書105
を使って、形態素解析や構文解析などを行なう。この手
法については一般に知られている手法によればよい。解
析の結果、文書中の各文が単語に区切られ、各単語に品
詞がつけられる。解析した結果は、解析結果保持部10
6に保持する。
【0016】次に文書中の各単語について、置換対象語
かどうかを調べる。
【0017】ここで、置換語辞書108の内容の例を図
4に示す。この辞書には、置換すべき語(置換対象語)
と、それを置き換える語(置換語)が記述してある。置
換対象語としては、同音異義語の存在する語や難しい語
などが予め登録されているものとする。この例では、同
音異義の「追及する」「追究する」「追求する」の3語
が置換対象語になっており、各々の置換語として「問い
ただす」「探究する」「追い求める」が登録されてい
る。
【0018】まず、ステップS304では、全ての単語
についての処理が終わったかどうかを調べる。処理が終
わっていれば、ステップS311で音声合成処理を行な
う。ステップS311では、解析結果保持部106に保
持された解析結果を元に、音声合成部111で文書の音
声合成処理を行ない、音声出力部112に文書の内容を
出力する。そして処理を終了する。
【0019】一方、ステップS304でまだ未処理の単
語が残っていれば、ステップS305に移り、文書から
次の単語を取り出す。ステップS306では、置換部1
07において、取り出した単語が置換対象語かどうかを
調べる。これは、その単語が置換語辞書108に出てい
るかどうかによって判定することができる。置換対象語
でなかった場合はステップS304に戻って次の単語の
処理に移る。
【0020】ステップS306で置換対象語だった場合
は、それを置き換える語(置換語)が置換語辞書108
に記述されているので、ステップS307でそれを取り
出す。ステップS308では、元々の置換対象語が活用
語かどうかを調べる。これは解析結果保持部106に保
持されている解析結果の品詞から判定することができ
る。活用語でなかった場合は、ステップS310に飛
び、解析結果保持部106に保持されている解析結果の
うち、置換対象語の情報(品詞、読みなど)を置換語の
情報(品詞、読みなど)で置き換える。
【0021】ステップS308の判定で、活用語だった
場合は、ステップS309で置換語の活用処理を行な
う。すなわち、形態素生成部109、置換語を文中の置
換対象語と同じ活用形に変換する。その後、ステップS
310で、解析結果保持部106に保持されている解析
結果のうちの置換対象語の情報(品詞、読みなど)を、
置換語の情報(品詞、読みなど)で置き換える。そして
ステップS304に戻り、次の単語の処理に移る。
【0022】次に、実例を示して、本実施例のさらなる
説明を行なう。検索結果の文書中に、図5に示すように
「企業は利潤を追求して」という箇所があったとする。
この中で「追求し(て)」は、図7に示すように動詞
「追求する」の連用形として解析される。「追求する」
が図4のように置換語辞書108に置換対象語として登
録されていた場合、「追求する」を置換語の「追い求め
る」に置換する。ここで「追求する」は活用語なので、
置換語を同じ活用形である連用形に変換して「追い求め
(て)」とし、図8に示すように解析結果保持部106
の内容を書き換える。この結果、この箇所は図6に示す
ように「企業は利潤を追い求めて」となる。
【0023】(他の実施例) 1.上記実施例では、同音異義語の存在する語や難しい
語を置換語辞書に登録しておき、その辞書に出ている語
を置換語と置き換えるようにした。しかし、上記実施例
の置換語辞書の代わりに、同義語をグループとしてまと
めた同義語辞書を備えることにより、以下のような方法
で実施することもできる。
【0024】その場合、まず、同音異義語の存在する語
については、読みが同じ語が存在するかどうかを解析辞
書で調べて、もし存在していたら同義語辞書を検索して
同義語を得る。個々の同義語について、同音異義語が存
在するかどうかを調べ、同音異義語のない同義語を選択
し、元の語と置換する。もし、同義語が存在しない、も
しくは、同音異義語のない同義語が存在しなければ元の
語をそのまま用いる。
【0025】また、難しい語(難語)については、解析
辞書中にマークをつけておけば、解析結果において難語
を判定することができる。上の例と同様に同義語辞書で
同義語を得て、個々の同義語について、難語かどうかを
調べ、難語でない語を選択し、元の語と置換する。も
し、同義語が存在しない、もしくは、難語でない同義語
が存在しなければ元の語をそのまま用いる。
【0026】2.同音異義語があっても、用いられる頻
度が極端に異なれば、ユーザが聞いたときに理解できな
い危険性は小さい。そこで、前記の実施例で同音異義語
があるかどうかを判定する際に、各々の語の頻度を考慮
し、同音異義語のほうが置換語より頻度が小さく、両者
の頻度差がある値より大きければ、置換しないようにし
てもよい。
【0027】3.上記実施例では、同音異義語の存在す
る語等が存在した場合に、それを置換するようにした
が、外国語の単語が存在した場合に、それを訳語で置換
するというようにしてもよい。例えば英語の単語が日本
語文中に存在した場合、従来はアルファベットで読み上
げるとか、その部分を英語の音声合成装置を使って読み
上げるということが行なわれている。しかし、それでは
ユーザが理解しにくい。そこで、対訳辞書を用意してお
き、その語の訳語を求め、それを読み上げるようにす
る。また、置き換えるのでなく原語の単語に訳語を追加
する形で読み上げてもよい。この実施例は別に実施して
もよいし、前述の実施例と組み合わせて実施してもよい
ものである。
【0028】4.上記実施例では、置換語辞書がシステ
ムで用意されているとしたが、それだけでなく、ユーザ
ごとのユーザ辞書を用意し、各ユーザが置換対象語と置
換語を登録できるようにしてもよい。
【0029】5.上記実施例では、文書検索装置に適用
する場合について説明したが、文書検索装置以外でも、
文書校正のように、文書中の語を忠実に読まなければな
らない場合を除けば、ユーザが指定した文書を読み上げ
るいかなる場合についても同様に実施できる。
【0030】6.上記実施例では入力手段がキーボード
であったが、音声入力などのほかの手段であってもよ
い。
【0031】
【発明の効果】以上で説明したように、本発明によれ
ば、文書を読み上げる際に、文書中の耳で聞いて判別し
づらい語句が、判別し易い同意の語句に置換されて読み
上げられるので、ユーザに文書内容が正しく伝達できる
という効果がある。
【図面の簡単な説明】
【図1】本発明に係る文書処理装置の実施例の基本構成
図である。
【図2】本発明実施例のシステム構成を示すブロック図
である。
【図3】本発明実施例の処理手順を示す動作フローチャ
ートである。
【図4】置換辞書の構成の例を示す図である。
【図5】置換対象語を含む文書の例を示す図である。
【図6】図5の文書の置換結果を示す図である。
【図7】図5の文書の解析結果を示す図である。
【図8】図7の解析された文書の置換結果を示す図であ
る。
【符号の説明】
101 入力部 102 検索部 103 文書データベース 104 文解析部 105 解析辞書 106 解析結果保持部 107 置換部 108 置換語辞書 109 形態素生成部 110 生成辞書 111 音声合成部 112 音声出力部 201 制御メモリ 202 メモリ 203 キーボード 204 中央処理装置 205 ディスク 206 D/A変換装置 207 スピーカ 208 バス
フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 8125−5L G06F 15/38 V 8125−5L Q

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 文書を記憶する文書記憶手段と、 該文書記憶手段により記憶された文書中の語句より、音
    声出力された場合に同定し難い語句を判別する判別手段
    と、 該判別手段により同定し難いと判別された語句を、同定
    し易い同意の語句に置換する置換手段と、 前記文書記憶手段に記憶された文書を、合成音声により
    読み上げる読み上げ手段とを具え、 該読み上げ手段が、前記判別手段により同定し難いと判
    別された語句を、前記置換手段により同定し易い同意の
    語句に置換して読み上げることを特徴とする文書処理装
    置。
  2. 【請求項2】 文書メモリに記憶された文書中に語句よ
    り、音声出力された場合に同定し難い語句を判別する判
    別工程と、 該判別工程により同定し難いと判別された語句を、同定
    し易い同意の語句に置換する置換工程と、 前記文書メモリに記憶された文書中で、前記判別工程に
    より同定し難いと判別された語句を、前記置換工程によ
    り同定し易い同意の語句に置換して、該文書を合成音声
    により読み上げる読み上げ工程とを具えることを特徴と
    する文書処理方法。
JP5267234A 1993-10-26 1993-10-26 文書処理装置及びその方法 Withdrawn JPH07121537A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5267234A JPH07121537A (ja) 1993-10-26 1993-10-26 文書処理装置及びその方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5267234A JPH07121537A (ja) 1993-10-26 1993-10-26 文書処理装置及びその方法

Publications (1)

Publication Number Publication Date
JPH07121537A true JPH07121537A (ja) 1995-05-12

Family

ID=17442005

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5267234A Withdrawn JPH07121537A (ja) 1993-10-26 1993-10-26 文書処理装置及びその方法

Country Status (1)

Country Link
JP (1) JPH07121537A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006227425A (ja) * 2005-02-18 2006-08-31 National Institute Of Information & Communication Technology 音声再生装置及び発話支援装置
JP2009139677A (ja) * 2007-12-07 2009-06-25 Toshiba Corp 音声処理装置及びそのプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006227425A (ja) * 2005-02-18 2006-08-31 National Institute Of Information & Communication Technology 音声再生装置及び発話支援装置
JP2009139677A (ja) * 2007-12-07 2009-06-25 Toshiba Corp 音声処理装置及びそのプログラム
US8170876B2 (en) 2007-12-07 2012-05-01 Kabushiki Kaisha Toshiba Speech processing apparatus and program

Similar Documents

Publication Publication Date Title
US20020120451A1 (en) Apparatus and method for providing information by speech
JPH0782498B2 (ja) 機械翻訳システム
JP3706758B2 (ja) 自然言語処理方法,自然言語処理用記録媒体および音声合成装置
JP2008204133A (ja) 回答検索装置及びコンピュータプログラム
JPH07121537A (ja) 文書処理装置及びその方法
JP6411015B2 (ja) 音声合成装置、音声合成方法、およびプログラム
JP4643183B2 (ja) 翻訳装置および翻訳プログラム
KR20200004176A (ko) 선택적 음성 모델의 적용에 기초한 번역 기능을 제공하는 텍스트 음성 변환 장치 및 그 동작 방법
JPH06119144A (ja) 文書読み上げ装置
JP2966473B2 (ja) 文書作成装置
JPH10228471A (ja) 音声合成システム,音声用テキスト生成システム及び記録媒体
JP2003022266A (ja) 文章語文体変換システムおよび文章語文体変換処理プログラム
JPH09281993A (ja) 発音記号生成装置
JPH1166068A (ja) 機械翻訳装置および機械翻訳方法ならびに機械翻訳プログラムを記録した記録媒体
JPH10105552A (ja) 機械翻訳システム
JPH09185629A (ja) 機械翻訳方法
JP3277560B2 (ja) 機械翻訳装置
JP2001184345A (ja) 言語処理装置
JPH09185623A (ja) 言語処理装置及び方法
JPH08202720A (ja) 機械翻訳装置
JPH0512332A (ja) 翻訳処理装置
JPH06325082A (ja) 機械翻訳装置
JPH04362774A (ja) 文書読み上げ装置
JPH03225468A (ja) 機械翻訳装置
JPH05225232A (ja) テキスト自動前編集装置

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20001226