JPH09325796A

JPH09325796A - 文書朗読装置

Info

Publication number: JPH09325796A
Application number: JP8143990A
Authority: JP
Inventors: Tetsuo Yoshida; 哲雄吉田
Original assignee: Oki Electric Industry Co Ltd
Current assignee: Oki Electric Industry Co Ltd
Priority date: 1996-06-06
Filing date: 1996-06-06
Publication date: 1997-12-16

Abstract

(57)【要約】【課題】原文を音声によって正確にかつ確実に理解で
きると共に、効率的に聞き取ることができるようにす
る。【解決手段】入力された原文のテキストデータから音
声合成手段により音声出力を得る文書朗読装置である。
音声では分からない原文中の文字列に解説文を付加する
と共に、この原文と解説文の音声タイプ及び音像定位を
異ならせる。一度聞いた内容を選択的に聞き直す聞き直
し制御手段（４０１、４０２）と、朗読内容を一定単位
ごとに選択的に省略するスキップ手段（４０１）とを備
え、聞き取れなかった部分を聞き直し、必要がない部分
は省略する。また、囲み記事内等の原文の文書配置の変
化に伴って音声タイプ又は音像定位を変化させる。これ
により、朗読中の文章の本文に対する位置付けを認識で
き、より正確に理解できる。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、テキストデータと
して取り込んだ文字情報を、音声合成手段により音声出
力する文書朗読装置に関するものである。

【０００２】

【従来の技術】

参考文献『匂坂芳典「音声合成のための言語処理と音
律制御」人工知能学会誌 Vol.3 No.4 pp.431-437
1988年7月』音声合成システムは日本語テキストデータから音声合成
する技術である。近年の音声合成技術の進歩により、こ
の音声合成システムを用いてテキストデータを音声変換
することで、任意の文章をより自然に近い音声で出力す
る文書朗読装置の実現が可能な状況になってきた。

【０００３】このような文書朗読装置に用いる従来の音
声合成システムとしては、図２に示すものが一般に知ら
れている。図２は従来の音声合成システムの構成例を示
す説明図である。

【０００４】この音声合成システムは、テキスト解析部
Ｓ１と音声制御情報生成部Ｓ２と音声合成パラメータ生
成部Ｓ３とから構成されている。

【０００５】テキスト解析部Ｓ１においては、テキスト
データとして電子化された漢字仮名混じりの文章が入力
されると、先ず入力文章の解析が行われ、構成単語・形
態素の同定及び簡単な構文処理等がなされる。この解析
により、各単語の読み、アクセント等が読み出され、品
詞・活用、係り受け関係等の構文情報が得られる。

【０００６】音声制御情報生成部Ｓ２においては、テキ
スト解析部Ｓ１でのテキスト解析結果を受け、単語の読
みに対して音韻規則が適用されて、単語の連なりによる
連濁、音便等の情報が生成され、基本アクセント等に対
して音律規則が適用されて、音韻時間長等の音声合成に
必要な制御情報が生成される。

【０００７】音声合成パラメータ生成部Ｓ３において
は、音韻規則によって得られた音韻系列に従って、音声
合成単位のデータファイルから声道共振特性等を表すス
ペクトル・パラメータの時系列が得られる。また、句の
アクセントや発話境界等の情報を元に声帯の基本周波数
の時間変化パタンが生成される。そして、音声合成単位
のデータファイルから得られる音源情報と声帯の基本周
波数の時間変化パタンに基づいて、音源生成部で駆動音
源信号が生成される。生成された駆動音源信号は声道特
性を模擬するディジタルフィルタを励振する。この励振
されたディジタルフィルタにより音声波形が生成され
る。

【０００８】このように、人間の朗読過程を模擬して、
電子化された漢字仮名混じりの文章から自然に近い音声
出力を得ることができる。

【０００９】この音声合成システムを文書朗読装置に用
いることで、任意の文章をより自然に近い音声で出力す
ることができるようになる。

【００１０】

【発明が解決しようとする課題】しかしながら、前記従
来の音声合成システムを用いた文書朗読装置では、電子
化された文章の内容をそのまま音声にするだけであるた
め、文章を音声として聞いただけでは判断がつかず、意
味が分からない場合がある。例えば、新聞記事等のよう
に、目で読むことを想定して書かれた文章が、そのまま
の内容で機械的に朗読された場合、その音声がいかに正
確かつ流暢であっても、目で見た場合と異なり、どうし
ても理解できない単語、漢字、文字、語句、熟語、用語
等の文字列や相互に区別できない文字列が存在する。具
体的な例としては、文章の前後関係からも推測不可能は
同音異義語や固有名詞の漢字等があり、このような状況
は少なからず発生する。

【００１１】この結果、従来の文書朗読装置では、音声
を聞き取ることは容易であっても、聞き取った文章の内
容を理解することは容易ではないという問題点がある。

【００１２】さらに、固有名詞等について常に正しい読
み方ができるようにするには、日本語単語辞書に大容量
の知識情報を登録しなければならず、装置が大型化して
しまうという問題点がある。

【００１３】

【課題を解決するための手段】前記課題を解決するため
に第１の発明は、入力された原文のテキストデータを音
声出力させる文書朗読装置において、文字列を解説する
解説文が記憶された解説文記憶手段と、この解説文記憶
手段に記憶された解説文の解説対象文字列と原文とを照
合する照合手段と、この照合手段によって検出された原
文中の解説が必要な文字列に解説文を付加して音声出力
の対象とさせる解説文付加手段とを備えたことを特徴と
する。

【００１４】解説文を付加することにより、原文を音声
として聞いただけでは分からない文字列を正確にかつ確
実に理解することができるようになる。

【００１５】第２の発明は、前記原文を朗読する音声出
力と前記解説文を朗読する音声出力とで、音声合成特性
を変化させる音声合成手段と、音像定位特性を変化させ
る音像定位特性付与手段の一方又は両方を備えたことを
特徴とする。

【００１６】原文を朗読する音声出力と解説文を朗読す
る音声出力の音声合成特性を変化させると、声質タイプ
が互いに異なったものになる。また、音像定位特性を変
化させると、原文と解説文の音声が異なった位置、方向
から聞こえる。これにより、原文と解説文とを明確に区
別することができる。

【００１７】第３の発明は、前記解説文が、解説を要す
る文字列の内容に応じて複数レベルの解説内容を有し、
これらのうちの１又は複数を選択して、原文に付加する
ことを特徴とする。

【００１８】聴取者の好みに合わせて解説内容のレベル
を選択することで、理解しやすくて聞きやすい文書の朗
読が可能になる。

【００１９】第４の発明では、一度聞いた内容を選択的
に聞き直す聞き直し制御手段を備えたことを特徴とす
る。

【００２０】よく理解できなかったり、聞き取れなかっ
た場合等において聞き直したいときは、聞き直し制御手
段によって選択的に聞き直す。これにより、より確実に
かつ正確に原文の内容を理解することができるようにな
る。

【００２１】第５の発明は、音声出力する内容を一定単
位に区分し、この単位ごとに選択的に音声出力を省略し
得るスキップ手段を備えたことを特徴とする。

【００２２】文書の朗読を聞いているときに、不要と思
ったり、飛ばし読みをしたい部分がある場合等には、ス
キップ手段によって、一定単位ごとに選択的に音声出力
を省略する。これにより、効率的に文書の内容を聞くこ
とができる。

【００２３】第６の発明は、音声出力する内容を一定単
位に区分し、この単位ごとに選択的に音声出力を省略し
得るスキップ手段と、このスキップ手段によるスキップ
処理に際して音声によりスキップ処理をするか否かの確
認をするスキップ確認手段と、このスキップ確認手段に
よる確認動作に対して音声又はスイッチ操作によりスキ
ップ処理をするか否かを指示する応答手段とを備えたこ
とを特徴とする。

【００２４】朗読途中でスキップ確認手段によってスキ
ップをするか否かの確認があると、応答手段によってス
キップ処理をするか否かを指示する。スキップ処理をす
る場合は、スキップ手段によって一定単位ごとに選択的
に音声出力を省略する。これにより、より効率的に原文
の内容を聞き取ることができる。

【００２５】第７の発明は、原文入力の際に文書配置情
報を同時に入力し、文書配置の変化に伴って音声合成特
性又は音像定位特性の一方又は両方を変化させることを
特徴とする。

【００２６】文書配置の変化、例えば囲みの中の文章や
図中の文章等と他の文章とで、音声合成特性又は音像定
位特性を変化させるので、朗読されている文章が本文と
異なる位置付けのものであることを認識することができ
る。これにより、原文の内容をより正確に理解すること
ができる。

【００２７】

【発明の実施の形態】以下に、本発明の実施形態を添付
図面を参照しながら説明する。

【００２８】［第１の実施形態］図１は本発明に係る文
書朗読装置の第１の実施形態の説明図である。

【００２９】本実施形態の文書朗読装置１は主に、バッ
ファメモリ１０１とテキスト解析部１０２と音声制御情
報生成部１０３と音声合成部１０４と音像制御部１０５
とラウドスピーカーシステム１０６Ｒ,１０６Ｌと文書
属性管理部１０８とを備えて構成されている。

【００３０】バッファメモリ１０１には日本語の漢字仮
名混じりの文章がテキストデータｔｄとして格納されて
いる。例えば、新聞紙面をＯＣＲ装置のような文書認識
装置によってテキストに変換されたデータが格納され、
テキスト解析部１０２に適宜出力される。

【００３１】テキスト解析部１０２は、バッファメモリ
１０１からのテキストデータｔｄを解析して、構成単語
・形態素の同定及び簡単な構文処理等を行う。さらに、
テキスト解析部１０２には、後述する要解説単語辞書１
０７及び解説モード設定メモリ１０９がそれぞれ接続さ
れ、解説が必要な単語等を検出して、解説文が付加され
るようになっている。

【００３２】音声制御情報生成部１０３では、テキスト
解析部１０２からの語彙情報及び構文情報を受けて、音
韻系列及び音韻時間長等の制御情報が生成される。

【００３３】音声合成部１０４では、音声制御情報生成
部１０３からの制御情報を受け、これに基づいて合成音
声データが生成されると共に、この合成音声データと同
期した文書属性境界情報が生成される。さらに、音声合
成部１０４は、声質タイプを切り替える機能を有し、複
数種類の声質の音声合成を可能にしている。この声質タ
イプの切り替えは、文書属性管理部１０８からの文書属
性データに基づいて、原文と解説文との境界で行われ
る。

【００３４】音像制御部１０５は、音声合成部１０４か
らの合成音声データに基づいて、左右のラウドスピーカ
ーシステム１０６Ｒ,１０６Ｌを駆動する。この音像制
御部１０５の具体的な構成例を図３に示す。図中の３０
１は音像定位特性付与部である。この音像定位特性付与
部３０１は、音声合成部１０４からの合成音声データが
入力される入力端子１０から先が２系統の回路に分岐さ
れ、前記各ラウドスピーカーシステム１０６Ｒ,１０６
Ｌにそれぞれ接続されている。この２系統の回路はそれ
ぞれ、フィルタ１２,１３と分岐器１４,１９と前方強調
フィルタ１５,２０と後方強調フィルタ１６,２１と合成
器１７,２２と出力端子１８,２３とから構成されてい
る。各系統の前方強調フィルタ１５,２０及び後方強調
フィルタ１６,２１には選択器２４が接続されている。
フィルタ１２,１３は音像定位の畳み込み演算を行うＦ
ＩＲ型のフィルタである。分岐器１４,１９では、フィ
ルタ１２,１３から出力される音響信号が分岐されて、
前方強調フィルタ１５,２０と後方強調フィルタ１６,２
１と合成器１７,２２にそれぞれ出力される。前方強調
フィルタ１５,２０は、入力された音響信号に対してク
ロストーク成分を付加することによって音像の前方への
定位の距離感を強調して出力する。後方強調フィルタ１
６,２１は前方強調フィルタ１５,２０と逆のフィルタ特
性を有する。合成器１７,２２は、分岐器１４,１９、前
方強調フィルタ１５,２０及び後方強調フィルタ１６,２
１から出力される音響信号を合成し、特性付与音響信号
を出力する。選択器２４は、前方強調フィルタ１５,２
０又は後方強調フィルタ１６,２１を選択する。

【００３５】各出力端子１８,２３には出力増幅器３０
６Ｒ,３０６Ｌが接続され、これらの出力増幅器３０６
Ｒ,３０６Ｌが各出力端子３０７Ｒ,３０７Ｌを介して各
ラウドスピーカーシステム１０６Ｒ,１０６Ｌにそれぞ
れ接続されている。各出力増幅器３０６Ｒ,３０６Ｌ
は、出力バッファ及びディジタル・アナログ変換器（い
ずれも図示せず）を含んで構成され、各出力端子１８,
２３からの出力データである左及び右チャンネル用の音
声出力データがこの出力増幅器３０６Ｒ,３０６Ｌでア
ナログ音声信号に変換されて、各ラウドスピーカーシス
テム１０６Ｒ,１０６Ｌを駆動するようになっている。

【００３６】選択器２４には音像位置決定回路３０５が
接続されている。この音像位置決定回路３０５の音像位
置決定回路入力端子３０３には、音声合成部１０４から
の合成音声データと同期した文書属性境界情報が入力さ
れる。文書属性管理部入力端子３０４には、文書属性管
理部１０８からの属性管理情報が入力される。選択器２
４は、これらの情報を基に前方強調フィルタ１５,２０
と後方強調フィルタ１６,２１を選択的に制御する（音
像定位特性付与部３０１の詳細は特開平６−２６１３９
９参照）。

【００３７】図１中の文書属性管理部１０８は、前記テ
キスト解析部１０２、音声制御情報生成部１０３、音声
合成部１０４及び音像制御部１０５にそれぞれ接続さ
れ、文書属性の管理を行う。この文書属性管理とは、主
に原文と解説文とを区別することであり、各処理データ
に対して文書属性の対応付けを行う。即ち、各処理部１
０２,１０３,１０４,１０５に入力したデータの文書属
性を判断して、その文書属性情報を各処理部１０２,１
０３,１０４,１０５に出力する。各処理部１０２,１０
３,１０４,１０５では、それぞれの部分に入力されたデ
ータを、その文書属性に応じて処理する。

【００３８】要解説単語辞書１０７は、解説が必要な単
語、漢字、文字、語句、熟語、用語等の文字列が格納さ
れた辞書である。この要解説単語辞書１０７は、テキス
ト解析部１０２においてバッファメモリ１０１からのテ
キストデータｔｄが解析される際に、各単語等の文字列
が要解説単語辞書１０７と照合され、解説が必要な文字
列が検出される。要解説単語辞書１０７では、前記解説
が必要な文字列が下記の解説レベルに応じて区分されて
いる。

【００３９】ｍ＝０：解説なしｍ＝１：耳で聞いただけでは難解な一般的ではない
専門用語等のみ解説ｍ＝２：一般的でない固有名詞のみ解説ｍ＝３：ｍ＝１とｍ＝２の両方の解説ｍ＝４：比較的難解な語句全般の解説要解説単語辞書１０７には、この区分に応じて、解説が
必要な文字列とそれに対応した短い解説文が登録されて
いる。例えば「河崎」という文字に対しては「カワはサ
ンズイの河と書きます。」という解説文が登録されてい
る。さらに、要解説単語辞書１０７には、比較的読み方
の問題の多い漢字（複数の読み方があって特定できない
漢字等）とその解説文が登録されており、テキスト解析
部１０２において読み方が特定できない文字等に対して
適用される。

【００４０】解説モード設定メモリ１０９は、テキスト
解析部１０２において付加される解説文の解説レベルを
予め設定しておくメモリで、モード設定操作によって、
聴取者の好みのレベルに予め設定される。テキスト解析
部１０２では、この解説モード設定メモリ１０９で設定
された解説レベルの解説文が付加される。

【００４１】［動作］以上のように構成された文書朗読
装置１は、次のように動作する。

【００４２】ＯＣＲ装置等によって新聞や書籍等の文章
が読み込まれ、テキストデータｔｄに変換されてバッフ
ァメモリ１０１に格納される。このバッファメモリ１０
１に格納されたテキストデータｔｄはテキスト解析部１
０２に入力される。このテキスト解析部１０２では、入
力文章の解析が行われ、構成単語・形態素の同定及び簡
単な構文処理がなされる。この解析により、各単語の読
み、アクセント等が読み出され、品詞・活用、係り受け
関係等の構文情報が得られる。これと同時に、各単語等
が要解説単語辞書１０７と照合され、解説が必要な文字
列が検出される。

【００４３】要解説単語辞書１０７との照合によって、
解説文の付与が必要な単語等が検出された場合は、解説
文挿入処理がなされる。テキスト解析部１０２では、要
解説単語辞書１０７からの要解説単語検出信号を受け
て、バッファメモリ１０１に中断指示信号Ｗを送出して
テキストデータｔｄの読み出しを中断する。これと同時
に、要解説単語辞書１０７から対応する解説文データを
入力し、前記単語等に付加する。この解説文データとし
ては、解説モード設定メモリ１０９によって設定された
解説レベルｍに応じた内容のデータが要解説単語辞書１
０７から出力される。

【００４４】その後、再びバッファメモリ１０１からテ
キストデータｔｄが読み出され、このデータが処理され
ると同時に要解説単語辞書１０７と照合され、必要な場
合には解説文挿入処理が行われる。このようにして生成
された原文及び付加解説文の語彙情報と構文情報は、音
声制御情報生成部１０３に入力されると共に、文書属性
管理部１０８にも入力されて原文と付加解説文が区別さ
れた状態で管理される。

【００４５】音声制御情報生成部１０３では、テキスト
解析部１０２からの入力データ及び文書属性管理部１０
８からの文書属性情報に対して音韻規則及び韻律規則が
適用されて、音韻系列すなわち音声表記データ、音韻時
間長、発話境界ポーズ長、文節アクセント、原文と解説
文の境界情報である文書属性境界等の制御情報が生成さ
れる。これらの制御情報は、原文及び解説文のデータと
共に音声合成部１０４へ出力される。

【００４６】音声合成部１０４では、音韻規則によって
得られた音韻系列に従って、音声合成単位のデータファ
イルから、声道共振特性等を表すスペクトル・パラメー
タの時系列が生成される。また、句のアクセントや発話
境界等の情報を元に、声帯の基本周波数の時間変化パタ
ンが生成される。さらに、文書属性境界で原文の声質タ
イプと付加解説文の声質タイプとが切り替えられる。こ
のようにして音声合成単位のデータファイルから得られ
る音源情報と、声帯の基本周波数の時間変化パタンとに
基づいて、音源生成部（図示せず）で駆動音源信号が生
成される。この駆動音源信号によって声道特性を模擬す
るディジタルフィルタが励振されることにより、音声波
形が生成される。このようにして生成された原文朗読音
声信号及び付加解説文音声信号は音像制御部１０５に入
力される。

【００４７】音像制御部１０５では、音像定位特性付与
部３０１に入力された原文朗読音声信号及び付加解説文
音声信号が、各ラウドスピーカーシステム１０６Ｒ,１
０６Ｌに対応して、左チャンネル及び右チャンネルのス
テレオ音響信号に分けられ、それぞれに音像定位特性が
付与される。具体的には、それぞれの文書属性に応じた
音声の発生位置（ステレオ音響再生空間にいる聴取者に
とって発生音声の聞こえる方向）である音像の定位する
位置が、原文朗読音声と付加解説文音声とで区別して設
定される。

【００４８】このようにして音像定位特性が付与された
原文朗読音声信号及び付加解説文音声信号によって各ラ
ウドスピーカーシステム１０６Ｒ,１０６Ｌが駆動され
る。これにより、例えば原文朗読音声は前方から聞こ
え、付加解説文音声は原文朗読音声と異なる声質で後方
から聞こえる。

【００４９】［効果］以上のように、要解説単語辞書１
０７に、耳で聞いただけでは分からない単語、漢字、文
字、語句、熟語、同音異義語、用語等や読み方が特定で
きない漢字等の解説文を登録して、対応する単語等に解
説文を付加するようにしたので、朗読の内容を全て正確
に理解することができるようになる。この結果、聴取者
にとって非常に分かりやすい文書朗読装置１を実現する
ことができるようになる。

【００５０】特に、読み方が複数あって特定できない漢
字に解説文を付加するようにしたので、聴取者はその漢
字を容易に理解することができるようになる。さらに、
このような単語等の読み方の正解度を上げるために、文
章を理解して対処する機能や大容量の知識辞書を文書朗
読装置１に備える必要がなくなり、小型で簡易な文書朗
読装置１を実現することができるようになる。

【００５１】また、原文朗読音声と付加解説文音声と
で、その音像位置及び声質を変えるようにしたので、こ
れらを明確に区別して認識することができるようにな
り、原文の内容を損ねることなく、朗読される原文の内
容を全て明確に理解することができるようになる。

【００５２】［第２の実施形態］次に本発明の第２の実
施形態を図４に基づいて説明する。本実施形態の文書朗
読装置２は、解説文等の聞き直し及びスキップの機能を
備え、聴取者が解説文等を聞き直したい場合には再度朗
読し、聞きたくない場合にはスキップさせることができ
るようにしたものである。なお、文書朗読装置２の全体
構成は、前述した第１の実施形態の文書朗読装置１とほ
ぼ同様であるので、同一部分には同一符号を付してその
説明を省略する。

【００５３】本実施形態の文書朗読装置２を第１の実施
形態の文書朗読装置１と比較した場合の構成的な特徴は
次の２点である。その１点は、聞き直し／スキップ要求
選択制御手段４０１、聞き直し記事／所望記事キーワー
ド入力手段４０２、キーワード検索手段４０３及び直前
テキストバッファ４０４を追加した点である。他の１点
は、文書属性管理部１０８が、原文と付加解説文との区
別以外に、見出し、囲み記事内等の原文の構成情報を扱
う点である。

【００５４】バッファメモリ１０１では、電子化された
テキストデータｔｄを一時的に記憶してテキスト解析部
１０２に出力するが、このとき同時に構成の種類を区別
する属性指示データａｄが出力されるようになってい
る。ここで、構成の種類とは、ＯＣＲ装置により新聞、
雑誌、書籍等を読み取った場合に、前記テキストデータ
ｔｄと共に得られる情報であって、例えば見出し、囲み
記事内、図や表中の挿入文、章・節・段落等を区別する
文書配置情報である。この構成の種類を基準にして聞き
直しやスキップ処理が行われる。この構成の種類のデー
タは、文書属性管理部１０８によって管理される。この
文書属性管理部１０８では、構成の種類のデータは、付
加解説文と区別された状態で、文書データと対応させて
管理される。

【００５５】聞き直し／スキップ要求選択制御手段４０
１及び聞き直し記事／所望記事キーワード入力手段４０
２は、その入力部分をスイッチ操作、ペン入力、音声入
力等で実現することができる。音声入力の場合は、例え
ば単語単位の認識が可能なレベルの単語音声認識装置に
よる音声制御インターフェースを用いることで実現が可
能である。

【００５６】聞き直し／スキップ要求選択制御手段４０
１はテキスト解析部１０２に接続され、聞き直し要求又
はスキップ要求をテキスト解析部１０２に出力する。こ
の聞き直し要求又はスキップ要求は、前述したように、
聞き直しスイッチ（図示せず）等を用いたり、単語音声
認識装置（図示せず）による音声制御によって行われ
る。特に、音声制御による場合には、聞き直し要求等の
ために、単語音声認識装置に「もう一度」「スキップ」
等の単語を予め登録しておく。そして、入力された音声
情報から、単語音声認識技術により最も類似度の高い登
録単語を特定し、テキスト解析部１０２に聞き直し要求
又はスキップ要求の制御情報を送出する。

【００５７】聞き直し要求の場合は、文書属性管理部１
０８で管理されている構成の種類、例えば改行によって
区切られるブロックを単位として、１つ前のブロックか
ら朗読を再開する。そして、聞き直し要求による再朗読
箇所については、要解説単語辞書１０７での解説レベル
の設定モードｍを、解説が多くなる方向に自動的にレベ
ル変更して、理解を助けるように設定されている。

【００５８】スキップ要求の場合も同様に、一定単位ご
とにスキップするように、テキスト解析部１０２にて処
理される。このスキップ動作のときには、例えば「スキ
ップしますか？」というスキップの希望を確認する要確
認箇所を、見出し、目次の項目、段落等の文書属性区分
境界ごとに予め設定しておく。例えば、新聞記事の場合
は各見出しや囲み記事ごとに、雑誌の場合は目次の項目
ごとに、章・節構成の書籍の場合は章ごとに、設定して
おく。

【００５９】聞き直し記事／所望記事キーワード入力手
段４０２は、聞き直したい部分を検索するためのキーワ
ードを入力する手段である。この聞き直し記事／所望記
事キーワード入力手段４０２により入力されたキーワー
ドを手がかりにして、聞き直したい部分を検索し、再朗
読させる。この聞き直し記事／所望記事キーワード入力
手段４０２は、具体的には、キーボード、ペン入力、音
声入力等の手段で構成されている。

【００６０】キーワード検索手段４０３は、聞き直し記
事／所望記事キーワード入力手段４０２によって入力さ
れたキーワードを手がかりにして聞き直したい部分を検
索する手段である。このキーワード検索手段４０３で
は、既に朗読されたテキストデータの中に複数のキーワ
ードがある場合には直前に位置するものが対象になる。

【００６１】直前テキストバッファ４０４は、テキスト
解析部１０２に接続された一時記憶メモリであり、バッ
ファメモリ１０１からテキスト解析部１０２に入力され
たテキストデータｔｄが先入れ先出し方式で一時的に記
憶される。この直前テキストバッファ４０４に記憶され
たテキストデータｔｄは、聞き直し要求時に、テキスト
解析部１０２に読み出されて、聞き直し処理がなされ
る。これにより、バッファメモリ１０１を再アクセスせ
ずに、聞き直しをすることを可能にしている。

【００６２】［動作］まず、ＯＣＲ装置によって雑誌、
新聞、書籍等を読み取る。読み取られたデータは、文章
に関するテキストデータｔｄと、本文、見出し、表や図
等を区別する情報である構成の種類に関する属性指示デ
ータａｄとからなり、バッファメモリ１０１に入力され
る。バッファメモリ１０１内の文章に関するテキストデ
ータｔｄは、テキスト解析部１０２に入力されて、前記
第１実施形態と同様にして処理され、解説文の付加等が
行われる。

【００６３】属性指示データａｄは、テキスト解析部１
０２で処理されて、原文中の見出し、囲み記事内、目次
の項目等の文書属性区分境界が知覚され、構成の種類と
共に文書属性管理部１０８に、原文及び付加解説文と区
別して、格納される。さらに、文書属性区分境界情報に
基づいて、原文の中のスキップ希望の要確認箇所にスキ
ップ確認のことば「スキップしますか？」が挿入され
る。

【００６４】その後、音声制御情報生成部１０３で制御
情報が生成され、音声合成部１０４で原文、付加解説文
及びスキップ確認の音声信号がその声質タイプを切り替
えた状態で生成され、音像制御部１０５で音像定位特性
が付与される。このようにして生成された音声信号によ
って、各ラウドスピーカーシステム１０６Ｒ,１０６Ｌ
が駆動され、例えば原文朗読音声は前方から聞こえ、付
加解説文音声は原文朗読音声と異なる声質で後方から聞
こえ、さらにスキップ確認音声は付加解説文音声及び原
文朗読音声と異なる声質で側方から聞こえるようにす
る。これにより、原文朗読音声と付加解説文音声とスキ
ップ確認音声とがそれぞれ明確に区別される。

【００６５】また、囲みの中の文章や図中の単語、文章
等がある場合には、これらの文章は、原文、付加解説文
及びスキップ確認の声質及び音像位置と異なるように設
定され、各音声をそれぞれ明確に区別できるようにす
る。

【００６６】一方、原文朗読音声又は付加解説文音声を
聞いているときに、よく理解できなかったり、聞き取れ
なかった場合には、聞き直し要求を行う。具体的には、
聞き直し／スキップ要求選択制御手段４０１に対してス
イッチ操作や音声（「もう一度」等の音声指示）によっ
て聞き直しを要求する。これにより、テキスト解析部１
０２へ聞き直し制御情報が送出され、予め設定されたブ
ロック単位で、直前の段落や節の始め等から再度朗読が
開始される。なお、聞き直しの際の再朗読開始位置は、
キーワードの指定がないため、デフォルト設定となり、
直前の段落等から朗読を再開する。このとき、付加解説
文の解説レベルの設定モードは、再朗読する内容をより
よく理解できるように、解説が多くなる方向に自動的に
レベル変更される。

【００６７】キーワードによる聞き直しを行う場合は、
聞き直し記事／所望記事キーワード入力手段４０２によ
ってキーワードを入力する。キーワード検索手段４０３
では、入力されたキーワードを基に検索処理が行われ
る。検索処理では、第１段階として、直前テキストバッ
ファ４０４を対象に検索が行われる。該当するキーワー
ドであって直前のものが見つかれば、そのキーワードを
含むブロックの始めから再朗読が行われる。

【００６８】第１段階の検索でキーワードが見つからな
い場合には、第２段階として直前テキストバッファ４０
４に一時記憶されたデータよりも古いテキストデータｔ
ｄをバッファメモリ１０１から読み込み、解析して検索
する。該当するキーワードであって直前のものが見つか
れば、そのキーワードを含むブロックの始めから再朗読
を行う。

【００６９】また、スキップ要求の際には、朗読途中で
スキップ希望の要確認箇所にかかると、それまでと異な
った声質及び音像位置で「スキップしますか？」という
スキップ希望の確認の付加音声が流れる。これに対し
て、聞き直し／スキップ要求選択制御手段４０１により
スキップ要求を選択すると、次のブロックの始めにスキ
ップする。

【００７０】［効果］以上の構成の文書朗読装置２にお
いても、前記第１実施形態の文書朗読装置１と同様の作
用、効果を奏することができる。

【００７１】さらに、本実施形態の文書朗読装置２では
聞き直し機能を備えたので、よく聞き取れなかった部分
を聞き直すことができ、原文の内容をより確実にかつ正
確に理解することができるようになる。

【００７２】また、キーワードを用いて聞き直す部分を
検索できるようにしたので、目で読む読書のときに行う
読み直しと同様に、理解が不十分だった場所を特定して
聞き直すことができ、原文の内容全体をより確実にかつ
正確に理解することができるようになる。さらに、キー
ワードの検索を行う場合に、検索処理の第１段階とし
て、直前テキストバッファ４０４を検索するようにした
ので、速やかにキーワードを見つけ出すことができ、高
速の聞き直しができるようになる。

【００７３】また、原文と付加解説文とスキップ確認と
で、その声質及び音像位置を異ならせて設定したので、
各音声を明確に区別できるようになり、聴取者に原文の
構成や配置の情報を分かりやすく知覚させることができ
る。

【００７４】さらに、囲みの中の文章や図中の文章等
を、他の文章と、その声質及び音像位置を異ならせたの
で、朗読されている文章が本文と異なる位置付けのもの
であることを認識することができ、原文の内容をより正
確に理解することができるようになる。

【００７５】［変形例］（１）前記実施例では、文書朗読装置１,２を複数の
処理ブロックによって構成したが、この構成は、それぞ
れの機能を有する個別の回路によって実現してもよく、
LSI（大規模集積回路）等を用いてソフトウエアによっ
て機能を分割して実現してもよい。

【００７６】（２）前記各実施形態に係る文書朗読装
置１,２は、主に視覚障害者による利用を対象にしてい
るが、視覚の利用が制限された状態や手で本等を持てな
い状態、例えば車の運転中、満員電車の車内でも利用す
ることができる。また、音声通話だけが可能な電話機等
の通信端末でも、文書データにアクセスして情報を得る
ことができる。

【００７７】（３）テキストデータｔｄから音声を合
成する技術については、前記各実施形態に示した技術に
限らず、既存の他の技術を用いてもよいことはいうまで
もない。

【００７８】（４）原文朗読音声、付加解説文音声等
のすべてについて、その声質及び音像位置を異ならせた
が、声質のみ又は音像位置のみを異ならせるようにして
もよい。この場合にも十分に区別することができる。さ
らに、原文の内容等から他の付加説明文等と十分に区別
できる場合には、声質又は音像位置を異ならせなくても
よい。

【００７９】（６）第２の実施形態では、スキップ処
理において文書属性区分境界ごとに「スキップしますか
？」という確認のことばを挿入したが、この確認のこと
ばは挿入せずに、任意の位置でスキップ処理を行えるよ
うにしてもよい。この場合、１つのブロックの始めや途
中の位置でスキップ要求が行われると、次のブロックに
スキップすることになる。

【００８０】

【発明の効果】以上、詳述したように本発明の文書朗読
装置によれば次のような効果を奏することができる。

【００８１】（１）原文中の解説が必要な文字列に解
説文を付加して音声合成を行うようにしたので、原文を
音声として聞いただけでは分からない文字列を正確にか
つ確実に理解することができるようになる。

【００８２】（２）原文を朗読する音声出力と解説文
を朗読する音声出力とで、音声合成特性又は音像定位特
性の一方又は両方を変化させるようにしたので、原文と
解説文とを、異なる声質タイプで、異なった位置、方向
から聞くことができ、原文と解説文とを明確に区別する
ことができるようになる。

【００８３】（３）解説文が、解説を要する文字列の
内容に応じて複数レベルの解説内容を有し、これらのう
ちの１又は複数を選択して、原文に付加するようにした
ので、聴取者の好みに合わせて解説内容のレベルを選択
することができ、理解しやすくて聞きやすい文書の朗読
が可能になる。

【００８４】（４）一度聞いた内容を選択的に聞き直
す聞き直し制御手段を備えたので、一度聞いた内容を選
択的に聞き直すことができ、より確実にかつ正確に原文
の内容を理解することができるようになる。

【００８５】（５）音声出力する内容を一定単位に区
分し、この単位ごとに選択的に音声出力を省略し得るス
キップ手段を備えたので、朗読内容を選択的に省略する
ことができ、朗読文書の内容を効率的に聞くことができ
るようになる。

【００８６】（６）スキップ手段によるスキップ処理
をするか否かを確認するスキップ確認手段と、スキップ
処理をするか否かを指示する応答手段とを備えたので、
朗読文章を一定単位ごとに選択的に省略することがで
き、より効率的に原文の内容を聞き取ることができるよ
うになる。

【００８７】（７）原文の文書配置の変化に伴って、
音声合成特性又は音像定位特性の一方又は両方を変化さ
せることにより、原文の内容を、その文書配置の相違に
応じて音声タイプ又は音像定位の異なった音声出力とす
ることができるため、囲みの中の文章や図中の文章等が
朗読されているときに、その文章が本文と異なる位置付
けのものであることを認識することができる。これによ
り、原文の内容をより正確に理解することができる。

【図面の簡単な説明】

【図１】本発明の第１実施形態に係る文書朗読装置の構
成を示すブロック図である。

【図２】従来の文書朗読装置に用いられる音声合成シス
テムの構成を示すブロック図である。

【図３】本発明に係る音像制御部を示すブロック図であ
る。

【図４】本発明の第２実施形態に係る文書朗読装置の構
成を示すブロック図である。

【符号の説明】

１０１：バッファメモリ、１０２：テキスト解析部、１
０３：音声制御情報生成部、１０４：音声合成部、１０
５：音像制御部、１０６Ｒ,１０６Ｌ：ラウンドスピー
カーシステム、１０７：要解説単語辞書、１０８：文書
属性管理部、１０９：解説モード設定メモリ、４０１：
聞き直し／スキップ要求選択制御手段、４０２：聞き直
し記事／所望記事キーワード入力手段、４０３：キーワ
ード検索手段。４０４：直前テキストバッファ。

Claims

【特許請求の範囲】

【請求項１】入力された原文のテキストデータを音声
出力させる文書朗読装置において、文字列を解説する解説文が記憶された解説文記憶手段
と、この解説文記憶手段に記憶された解説文の解説対象文字
列と原文とを照合する照合手段と、この照合手段によって検出された原文中の解説が必要な
文字列に解説文を付加して音声出力の対象とさせる解説
文付加手段とを備えたことを特徴とする文書朗読装置。
【請求項２】請求項１に記載の文書朗読装置におい
て、前記原文を朗読する音声出力と前記解説文を朗読する音
声出力とで、音声合成特性を変化させる音声合成手段
と、音像定位特性を変化させる音像定位特性付与手段の
一方又は両方を備えたことを特徴とする文書朗読装置。
【請求項３】請求項１又は２に記載の文書朗読装置に
おいて、前記解説文が、解説を要する文字列の内容に応じて複数
レベルの解説内容を有し、これらのうちの１又は複数を
選択して、原文に付加することを特徴とする文書朗読装
置。
【請求項４】請求項１ないし３のいずれかに記載の文
書朗読装置において、一度聞いた内容を選択的に聞き直す聞き直し制御手段を
備えたことを特徴とする文書朗読装置。
【請求項５】請求項１ないし４のいずれかに記載の文
書朗読装置において、音声出力する内容を一定単位に区分し、この単位ごとに
選択的に音声出力を省略し得るスキップ手段を備えたこ
とを特徴とする文書朗読装置。
【請求項６】請求項１ないし５のいずれかに記載の文
書朗読装置において、音声出力する内容を一定単位に区分し、この単位ごとに
選択的に音声出力を省略し得るスキップ手段と、このスキップ手段によるスキップ処理に際して音声によ
りスキップ処理をするか否かの確認をするスキップ確認
手段と、このスキップ確認手段による確認動作に対して音声又は
スイッチ操作によりスキップ処理をするか否かを指示す
る応答手段とを備えたことを特徴とする文書朗読装置。
【請求項７】請求項１ないし６のいずれかに記載の文
書朗読装置において、原文入力の際に文書配置情報を同時に入力し、文書配置
の変化に伴って音声合成特性又は音像定位特性の一方又
は両方を変化させることを特徴とする文書朗読装置。