JP4036741B2

JP4036741B2 - テキスト読み上げシステム及び方法

Info

Publication number: JP4036741B2
Application number: JP2002368651A
Authority: JP
Inventors: 智佳子松本; 一宏渡辺
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2002-12-19
Filing date: 2002-12-19
Publication date: 2008-01-23
Anticipated expiration: 2022-12-19
Also published as: JP2004198830A

Description

【０００１】
【発明の属する技術分野】
本発明は、複数行にまたがった絵文字や記号あるいは文字列が存在するテキストデータであっても違和感の無い合成音に変換することができるテキスト読み上げシステム及び方法に関する。
【０００２】
【従来の技術】
昨今のコンピュータ技術の急速な進展によって、音声を用いたアプリケーションが多々開発されるようになっており、特にテキストデータを合成音声等を用いて読み上げるテキスト読み上げシステムは、様々なアプリケーションに汎用的に用いられるようになってきている。
【０００３】
そして、従来のテキスト読み上げシステムにおいては、（特許文献１）に開示されているように、同じ記号文字列が連続して表記されている場合、連続した記号文字列については、別の読みや音等を規定している読み上げデータに変換して、合成音として出力される、あるいは無音化することによって音声出力されないようにしている。
【０００４】
図１に従来のテキスト読み上げシステムの構成図を示す。図１において、テキストデータ入力部１から記号や文字が混在しているテキストデータが入力されると、読み上げデータ生成部２へと渡される。
【０００５】
読み上げデータ生成部２においては、まずテキストデータ解析部４によって入力されたテキストデータのデータ種別が順次解析される。次に、切出部５によって、入力されたテキストデータから、行方向に同一種別のデータが連続しているテキストデータ部分が切り出される。切り出されたテキストデータ部分は、変換部６において、通常とは異なる別の読み情報を有する読み上げデータや、特定の音として出力するためのＷＡＶファイル等の音データ、あるいは無音データ等に変換される。
【０００６】
そして、変換部６において変換された各種の読み上げデータは、音声出力部３において、従来の言語処理や波形処理を行うことによって合成音声が生成され、音声出力として出力される。
【０００７】
しかし、上述したような従来の方法では、順次、同一のデータ種別である複数個連続したテキストデータがある場合、すなわち行方向に連続して文字列が存在する場合には正確な読み上げを行うことができるものの、以下のような問題点も内在していた。
【０００８】
例えば、「＝＝＝＝＝おわり＝＝＝＝＝」というように、横書きのテキストデータではあるものの、横方向に５つ連続した記号データ「＝」がある場合、「＝」を「イコール」と変換するだけでは、５回連続して「イコール」と音声出力され、その後に本題である「おわり」と音声出力され、さらにその後５回連続して「イコール」と音声出力される。これでは、音声出力を聞く利用者にとっても非常に聞きづらく、内容によっては本題部分を聞き逃してしまうおそれもあった。
【０００９】
そこで、（特許文献１）では、記号データが連続している部分を切り出して、例えば「＝」を全て無音に変換して、「おわり」だけ読ませたり、あるいは「＝＝＝＝＝」を「＝」に変換して、「イコール、おわり、イコール」と読ませたり、「＝＝＝＝＝」をビープ音に変換して、ビープ音の後に「おわり」と読ませ、最後にビープ音を出力する等の処理を行うことによって、利用者にとっての利便性を確保している。
【００１０】
また、最近のようにインターネット環境を用いた電子メールが普及すると、メール文章の中に「(-v-)」等の顔文字を挿入することも多い。かかる場合に対応するために、例えば（特許文献２）、（特許文献３）においては、顔文字を感情表現用の記号として使用し、読み上げの方法等を変化させるトリガとしてのみ用いることで、読み上げの対象から外す方法が開示されている。また（特許文献４）では、顔文字の特徴を検出することによって、メール内容に含まれている顔文字が、単なる記号であるのか意味を有する顔文字であるのかを判断し、顔文字である場合には当該意味内容に応じた音声出力を行い、単なる記号である場合には音声出力の対象から外す方法が開示されている。
【００１１】
【特許文献１】
特開平９−１６１９６号公報
【００１２】
【特許文献２】
特開２００２−９１８９１号公報
【００１３】
【特許文献３】
特開２００２−２６８６６５号公報
【００１４】
【特許文献４】
特開２００１−３３７６８８号公報
【００１５】
【発明が解決しようとする課題】
しかし、上述したテキスト読み上げ方法においては、基本的に行方向におけるテキストデータの配列性向に基づいた制御を行っていることから、複数行にわたって多種多様な記号データを組み合わせた場合、例えば行方向のみならず列方向における配置をも考えて１つの大きな絵文字を形成する場合や、引用あるいは強調を示すために記号データでテキストデータを囲んでいるような場合については、以下のような問題点が生じていた。
【００１６】
例えば図２に示すように、テキストデータの前に、複数行にまたがった記号データを組み合わせて１つのクリスマスツリーの図形を表す記号として用いている場合については、１行目の星形記号（★）や、２行目のセミコロン（；）についても読み上げの対象になってしまうだけでなく、テキストデータ読み上げの途中において、すなわちテキストデータが改行している部分において、セミコロン等の記号データに対する読み上げが挿入されてしまうという問題点があった。また、たとえ当該記号データを無音データとした場合であっても、聞き手にとっては意味的に不自然な部分において無音区間が生じることから、出力される音声が聞き取りにくいという問題点もあった。
【００１７】
また、図３に示すように、テキストデータの周囲が、記載内容を強調するために記号データで囲んで表記されている場合についても、同様に各記号データについて記号ごとに読み上げてしまう。また、これらの記号データを無音データに変換した場合であっても、同様に意味的に不自然な部分において無音区間が生じてしまい、聞き手にとっては聞き難い音声出力となってしまうという問題点が残されていた。
【００１８】
本発明は、上記問題点を解決するために、記号データを含む複数行のテキストデータが入力された場合であっても、文字データで表記された内容を正確に読み上げることができるテキスト読み上げシステム及び方法を提供することを目的とする。
【００１９】
【課題を解決するための手段】
上記目的を達成するために本発明にかかるテキスト読み上げシステムは、複数行を有するテキストデータを入力するテキストデータ入力部と、入力されたテキストデータに関する読み上げデータを生成する読み上げデータ生成部と、読み上げデータを用いて音声出力する音声出力部とを含むテキスト読み上げシステムであって、読み上げデータ生成部において、入力されたテキストデータを解析して、データ種別を判別するテキストデータ解析部と、判別されたデータ種別ごとに、入力されたテキストデータにおける行方向及び列方向における相対的な位置に関する情報を生成する位置情報生成部と、生成された位置に関する情報を保存するデータ種別位置情報保存部、データ種別位置情報保存部に保存されている位置に関する情報に基づいて、音声出力の対象となるテキストデータの位置に関する情報を検出する音声出力対象検出部と、音声出力の対象となるテキストデータの位置に関する情報に基づいて、入力されたテキストデータを音声出力部において音声出力可能なデータ形式を有する読み上げデータへと変換する変換部を含むことを特徴とする。
【００２０】
かかる構成により、複数行を有するテキストデータが入力された場合であっても、行方向だけでなく列方向における連続した文字データや一連の形態を有する記号データ群等を検出することができ、聴取者に分かりやすく、かつ聞き取りやすい合成音声としてテキストデータを読み上げることが可能となる。
【００２１】
また、本発明にかかるテキスト読み上げシステムは、音声出力対象検出部において、行方向又は列方向に同一のデータ種別が連続している部分の位置に関する情報を検出することが好ましい。列方向に連続している文字データや記号データについても読み上げ対象として認識することができるからである。
【００２２】
また、本発明にかかるテキスト読み上げシステムは、データ種別に関する相対的な位置関係を定義する所定の位置情報パターンを、読み上げデータあるいは音データと対応付けて登録する位置情報パターン保存部をさらに含み、音声出力対象検出部において、位置情報パターン保存部を照合して、登録されている位置情報パターンと一致する部分の位置に関する情報を検出し、変換部において、検出された位置情報パターンを、位置情報パターン保存部において対応付けられている読み上げデータあるいは音データに変換することが好ましい。特定の位置情報パターンに合致する部分については、１つの意味を有する読み上げデータとして変換する方が、ユーザにとって聞き取りやすいからである。
【００２３】
また、本発明にかかるテキスト読み上げシステムは、変換部において、複数行にまたがって連続しているデータ種別が文字データであるテキストデータを、連続した読み上げデータに変換することが好ましい。
【００２４】
また、本発明にかかるテキスト読み上げシステムは、変換部において、複数行にまたがって連続しているデータ種別が文字データ以外であるテキストデータを削除することが好ましい。
【００２５】
また、本発明にかかるテキスト読み上げシステムは、音声出力対象検出部において、データ種別が文字データ以外である所定の個数以上のテキストデータで囲まれた文字データを、データ種別が文字データ以外のテキストデータであると認識することが好ましい。全体として１つの意味を有するデータ群として読み上げデータに変換した方がユーザにとって理解しやすいからである。
【００２６】
また、本発明にかかるテキスト読み上げシステムは、変換部において、位置情報パターンと一致する部分の位置に関する情報に基づいて、位置情報パターンと一致する部分の開始位置の前、あるいは終了位置の後において位置情報パターンと一致する部分を一組の音発生コマンド又は一組の読み上げデータに変換することが好ましい。位置情報パターン以外の部分における文字データの読み上げが不自然にならないようにできるからである。
【００２７】
また、本発明にかかるテキスト読み上げシステムは、読み上げデータの内容を指定できる読み上げデータ指定部と、指定された読み上げデータの内容を保存する読み上げデータ保存部とをさらに含むことが好ましい。ユーザの意向を確実に反映させて読み上げデータに変換することができるからである。
【００２８】
また、本発明は、上記のようなテキスト読み上げシステムの機能をコンピュータの処理ステップとして実行するソフトウェアを特徴とするものであり、具体的には、入力手段において複数行を有するテキストデータを入力する工程と、入力されたテキストデータに関する読み上げデータを生成する工程と、読み上げデータを用いて音声出力する工程とを含むテキスト読み上げ方法であって、読み上げデータを生成する工程において、入力されたテキストデータを解析して、データ種別を判別する工程と、判別されたデータ種別ごとに、入力されたテキストデータにおける行方向及び列方向における相対的な位置に関する情報を生成して記憶手段に保存する工程と、記憶手段に保存されている位置に関する情報に基づいて、音声出力の対象となるテキストデータの位置に関する情報を検出する工程と、音声出力の対象となるテキストデータの位置に関する情報に基づいて、入力手段において入力されたテキストデータを音声出力可能なデータ形式を有する読み上げデータへと変換する工程を含むテキスト読み上げ方法並びにそのような工程を具現化するコンピュータ実行可能なプログラムであることを特徴とする。
【００２９】
かかる構成により、コンピュータ上へ当該プログラムをロードさせ実行することで、複数行を有するテキストデータが入力された場合であっても、行方向だけでなく列方向における連続した文字データや一連の形態を有する記号データ群等を検出することができ、聴取者に分かりやすく、かつ聞き取りやすい合成音声としてテキストデータを読み上げることができるテキスト読み上げシステムを実現することが可能となる。
【００３０】
【発明の実施の形態】
以下、本発明の実施の形態にかかるテキスト読み上げシステムについて、図面を参照しながら説明する。図４は本発明の実施の形態にかかるテキスト読み上げシステムの構成図である。図４において、１１はテキストデータ入力部であり、一行のテキストデータだけでなく、複数行のテキストデータについても入力できるようになっている。
【００３１】
また、１２は入力されたテキストデータに関する読み上げデータを生成する読み上げデータ生成部を示しており、入力されたテキストデータの状況に応じて音声出力用の読み上げデータを生成する。
【００３２】
具体的には、まずテキストデータ解析部４１において、テキストデータ入力部１１において入力されたテキストデータを解析して、データの種別を判別する。判別するデータの種別としては、文字データとしての仮名／漢字データや英数字データ、それ以外のデータとして記号データ、空白（スペース）データ等が考えられる。もちろん、判別するデータ種別として、これに限定されるものではない。
【００３３】
本実施の形態においては、データ種別として、記号データ（種別：１）、空白データ（種別：２）、文字データ（種別：３）、Ｎｕｌｌデータ（種別：４）の４つに分類し、入力されたテキストデータがそれぞれどのデータ種別に相当するのか解析する。
【００３４】
データ種別を判別するためには、使用するコンピュータ上における表示コードを表示コード保存部４２へ保存しておき、入力されたテキストデータについて表示コード保存部４２に保存されている表示コードと照合することによってデータ種別を判断する。ここで、表示コードとは、ホストコンピュータにおけるＥＢＣＤＩＣコードや、パーソナルコンピュータにおけるＡＳＣＩＩコード等を意味している。
【００３５】
次に、位置情報生成部４３においては、テキストデータ解析部４１において判別されたデータ種別ごとに、入力されたテキストデータにおける画面上での各データに関する位置情報を生成する。位置情報としては、基準点を定め、当該基準点からの、行方向及び列方向における相対的な位置に関する情報を生成する。生成されたデータ種別ごとの位置情報はデータ種別位置情報保存部４４に保存される。
【００３６】
具体的には以下のようにして位置情報を求める。通常、表示装置には、一行に表示される文字数制限がある。したがって、かかる制限文字数と改行コードの存在を検出することによって、表示画面左上を基準点とした画面上の位置座標を決定することができる。
【００３７】
そして、かかる位置座標とデータ種別を対応させてデータ種別位置情報保存部４４に保存するために、本実施の形態においては位置情報に相当するｍ×ｎのマトリックスデータを用いることで、画面表示イメージそのままの形式で保存している。
【００３８】
例えば、図５（ａ）に示すような複数行のテキストデータが入力されてきた場合には、データ種別位置情報保存部４４には、図５（ｂ）のような形式でデータ種別ごとの位置情報が保存される。
【００３９】
例えば、図５（ａ）に示す複数行のテキストデータにおいては、１行目の最初の半角文字が「空白」であることから、図５（ｂ）のようにデータ種別‘２’を左上端に記録し、図５（ａ）に示すテキストデータの１行目の２つ目の半角文字「＃」が記号データであることから、図５（ｂ）の１行目の２番目にデータ種別‘１’を記録する。
【００４０】
以下同様に、画面上の表示位置に対応する位置にデータ種別を記録していく。なお、２バイト系のテキストデータについては、データ種別を区別する符号を２つ並べる。例えば図５（ａ）に示すテキストデータの２行目の最初の文字データ「こ」については、図５（ｂ）の２行目に示すように、データ種別‘３３’を２行目の対応する位置に記録する。
【００４１】
また、入力されるテキストデータによっては、半角文字、全角文字だけではなく、タブ等のように文字数により位置が制御される制御文字が混在している場合も考えられる。
【００４２】
例えば、図６（ａ）に示すような複数行のテキストデータが入力されてきた場合には、データ種別位置情報保存部４４には、図６（ｂ）のような形式でデータ種別ごとの位置情報が保存される。
【００４３】
すなわち、図６（ａ）に示す複数行のテキストデータにおいては、行の開始位置から何文字目にカーソルが移動するかを示すタブ「｜」が設定されている。例えば１行目の最後の文字データ「は」から記号データ「＃」までの間は、半角空白データとタブによる空白区間とが存在している。
【００４４】
この例では、当該タブによる文字数情報は全角８文字であることから、図６（ｂ）に示すようにデータ種別位置情報保存部４４には、文字データ「は」の直後の半角空白データと併せて、データ種別‘４’が１７（＝８×２＋１）個、文字データ「は」に対応するデータ種別‘３３’の直後から記録される。
【００４５】
次に、音声出力対象検出部４５では、データ種別位置情報保存部４４に保存されている位置に関する情報に基づいて、音声出力の対象となるテキストデータ部分に関する情報を検出する。音声出力の対象となるテキストデータ部分に関する情報を検出する方法としては、様々な方法が考えられる。
【００４６】
例えば、音声出力対象検出部４５において、データ種別位置情報保存部４４に保存されている位置に関する情報に基づいて、行方向及び列方向にデータ種別が同一であるテキストデータが連続していることを検出する方法が考えられる。
【００４７】
すなわち、データ種別位置情報保存部４４に保存されている位置に関する情報が、図６（ｂ）に示すようなｍ×ｎのマトリックスデータであった場合、音声出力の対象となる可能性があるのは、データ種別が記号データ‘１１’であるテキストデータが連続している部分、あるいはデータ種別が文字データ‘３３’であるテキストデータが連続している部分であると考えられる。
【００４８】
図６（ｂ）の例では、データ種別が文字データ‘３３’であるテキストデータが連続している部分は行方向及び列方向に連続している。したがって、かかる部分は横書きの文字列あるいは縦書きの文字列であるものとして音声出力の対象となるテキストデータ部分であるとして検出され、その位置に関する情報を抽出する。
【００４９】
一方、データ種別が記号データ‘１１’であるテキストデータが連続している部分は、縦方向にのみ５つ連続していることが検出される。かかる部分は、一体として何らかの意味を有していることも多く、後述する変換部４７において、適切な読み上げデータに変換することで、ユーザにとって聞き易く、意味のある音声出力を行うことができる。また、意味を有さない場合であっても、一体として変換部４７において無音データに変換し、かかる部分の開始位置あるいは終了位置に配置することによって、通常の文字データの読み上げ途上に意味のない無音区間が生じることを未然に回避することが可能となる。
【００５０】
また、音声出力対象検出部４５において、データ種別に関する相対的な位置関係を定義する所定の位置情報パターンを登録する位置情報パターン保存部４６を設けておき、位置情報パターン保存部４６を照合することによって、登録されている位置情報パターンと一致する部分の位置に関する情報を検出することも考えられる。
【００５１】
例えば、意味を有する図形等を作画する場合において、通常は長方形で閉じられた二次元空間内で作成する場合が多いことから、行方向に一定個数、列方向に一定個数分の一辺を有する長方形で閉じられた空間内に、記号データや空白データ、場合によっては文字データも含めた位置情報パターンを形成することが多い。したがって、かかる長方形で閉じられた空間内におけるデータ種別の位置情報パターンを位置情報パターン保存部４６に登録しておき、入力されたテキストデータに当該パターンが存在するか否かを照合する。そして、当該位置情報パターンに対応させた通常とは異なる読み上げデータや音を出力するための音データ等についても位置情報パターン保存部４６に登録しておくことによって、当該位置情報パターンが検出された部分についての後述する変換部４７における変換方法を指示することが可能となる。
【００５２】
この際、一定個数以上の記号もしくはスペースで囲まれた漢字、ひらがな、英数字等の文字データについても、一体となった意味を有する記号における構成要素の１つと判断するべく、データ種別を記号データ‘１’に変換することも考えられる。
【００５３】
例えば、図７に示すようなクリスマスツリーを意味する絵文字において、当該絵文字に用いられている文字データ「Ｐ」については、文字データとして読み上げの対象とする必要が無く、絵文字一体として何らかの意味を持たせる方が自然である。そこで、このような位置に存在する文字データについては、データ種別を文字データ‘３’から記号データ‘１’へと変換することによって、不要な文字読み上げを回避することが可能となる。
【００５４】
次に、変換部４７では、音声出力の対象となるテキストデータの位置に関する情報に基づいて、入力されたテキストデータを音声出力部１３において音声出力可能なデータ形式を有する読み上げデータへと変換する。また、行方向あるいは列方向に連続して存在する記号データについても、位置情報パターン保存部４６を照会することによって、一致する位置情報パターンに対応するビープ音のような他の音データ、さらには特別の意味を表す読み上げデータ、あるいは無音データへと変換する。
【００５５】
図８に、本発明の実施の形態にかかるテキスト読み上げシステムにおける変換部４７の構成図を示す。図８に示すように、変換部４７は、少なくとも変換開始終了位置確定部８１、及び読み上げデータ変換部８２を含んでいる。
【００５６】
まず変換開始終了位置確定部８１においては、音声出力対象検出部４５で検出された音声出力の対象となるテキストデータの開始位置及び終了位置を決定する。例えば、図９に示すようなテキストデータが入力されている場合、検出された音声出力の対象となるテキストデータとしては、「ここは本文１です。」、「次回の配信予定…一般の方」、「からのデザイン…応募ください。」、「締め切りは１２月１日です。」、及び「ここは本文２です。」の文字データに対応する部分と、記号データ「★」から開始されるクリスマスツリーの図形を表す記号データ部分となる。
【００５７】
したがって、各文字データについては、文字データの起点及び終点が、読み上げデータの開始位置及び終了位置となる。また、クリスマスツリーの図形を表す記号データ部分については位置情報パターンの始点及び終点が、読み上げデータの開始位置及び終了位置となる。
【００５８】
そして、読み上げデータ変換部８２において、確定した開始位置から終了位置までの間のテキストデータを指示されている読み上げデータへと変換する。例えば、文字データについては、そのまま連続して読み上げデータへと変換する。また、記号データについては位置情報パターン全体を１つのデータとして、ビープ音等のような他の音を発生する音データ、別の読みに相当する読み上げデータ、あるいは無音データへと変換し、テキストデータから削除する等の変換処理を行う。
【００５９】
例えば、図９の例においては、クリスマスツリーの図形を表す記号データ部分についてはテキストデータから削除されることから、読み上げデータは、「ここは本文１です。」、「次回の配信予定は、１２月のクリスマスの時期を予定しております。一般の方からのデザインも多数募集しておりますので、どしどしご応募ください。応募締切りは１２月１日です。」、「ここは本文２です。」となり、「次回の〜１２月１日です。」の間に、不要な無音区間が生じることがなく、聞き手にとっても聞きやすい読み上げデータとして出力することができる。
【００６０】
一般に、位置情報パターンで１つの意味を表すものと認識されている記号データ部分については、変換されたビープ音等のような他の音を発生する音データ、あるいは別の読みに相当する読み上げデータを、全体のテキストデータ読み上げ開始前あるいは読み上げ終了後に出力する。もちろん、記号データの内容によっては、連続するテキストデータの中途にビープ音等のような他の音を発生する音データ、あるいは別の読みに相当する読み上げデータを挿入するものであっても良い。
【００６１】
例えば、図９に示すように、横書きで書かれたテキストデータの左側に記号データの一群が存在し、これら一群の記号データを１まとまりとしてベルの音として音データを出力する場合、記号データ群全体を音データファイル“bell.wav”に変換して対応するテキストデータを削除し、文字データ「次回配信予定…１２月１日です。」の終了位置に、“bell.wav”を挿入することも可能である。この場合、「ここは本文１です。」、「次回配信予定…１２月１日です。」と読み上げられた後に、音データファイル“bell.wav”が再生され、最後に「ここは本文２です。」と読み上げられる。
【００６２】
そして、変換部４７で変換された読み上げデータが音声出力部１３に入力され、文字データに対応する読み上げデータについては言語処理を行った後に波形処理を行い、適切な合成音声として出力される。また、ビープ音等の音データが指定されている場合には、当該音データをそのまま出力する。
【００６３】
また、読み上げデータとしてどのようなデータに変換するのかをユーザが指定できるようにしても良い。この場合、図１０に示すように、変換部４７に対して、変換するべき読み上げデータの内容を指定することができる読み上げデータ指定部１０１と、指定された読み上げデータの内容を保存する読み上げデータ保存部１０２とをさらに設ける。
【００６４】
すなわち、読み上げデータ指定部１０１においては、音声出力対象検出部４５において検出された音声出力の対象となる部分に対応する文字データや記号データ等を変換する読み上げデータや音データ等を指定し、読み上げデータ指定部１０１で指定されたデータは読み上げデータ保存部１０２に保存される。
【００６５】
変換部４７では、あらかじめ位置情報パターン保存部４６等で保存されているテキストデータの位置情報パターンに対応した読み上げデータや音データ等と、読み上げデータ保存部１０２に保存されている指定された読み上げデータや音データ等を用い、重複する場合には読み上げデータ保存部１０２に保存されている指定された読み上げデータや音データ等を優先して用いる。このようにすることで、特殊なパターンを有し、かつ事前に位置情報パターン保存部４６に保存しておくことができなかった場合であっても、ユーザの意図に沿ったテキストデータの読み上げを行うことが可能となる。
【００６６】
さらに複雑な処理を行う場合として、図１１（ａ）に示すように、行方向に連続した文字列ではあるが、文字の修飾として、各文字の周囲を囲むように記号データが存在する場合も考えられる。この場合、音声出力対象検出部４５において、行方向にデータ種別が文字データ‘３３’と記号データ‘１１’が交互に表れている部分が検出できる。したがって、このような位置に関する情報を検出した場合には、交互に出現している文字データを一連のデータと解釈して、変換部４７において読み上げデータに変換する。かかる処理を行うことによって、「新」、「年」、「特」、「集」という独立した文字としてではなく、「新年特集」という１つの文字列として音声出力を行うことが可能となる。
【００６７】
また、意味のない文字の集合である場合も考えられることから、新たに言語処理部（図示せず）を設けて、形態素解析等を行い、品詞情報を確認した上で読み上げデータに変換することが好ましい。
【００６８】
例えば図１１（ｂ）に示すように、記号データの一部として文字データ「の」が用いられている行については、「のの」という文字列が言語処理部において形態素解析され、助詞「の」が連続していると解釈される。したがって、意味のある単語とは認識されないことから、変換部４７において読み上げデータに変換されることはない。
【００６９】
このような処理は、図１２に示すように列方向に連続した文字列が形成されている場合についても同様の処理となる。
【００７０】
次に、本発明の実施の形態にかかるテキスト読み上げシステムを実現するプログラムの処理の流れについて説明する。図１３に本発明の実施の形態にかかるテキスト読み上げシステムを実現するプログラムの処理の流れ図を示す。
【００７１】
図１３において、まず読み上げの対象となる複数行を有するテキストデータが入力されると（ステップＳ１３０１）、入力されたテキストデータについてデータ種別を解析する（ステップＳ１３０２）。
【００７２】
次に、テキストデータに含まれている文字データや記号データ、あるいは空白データ等のデータ種別ごとに、表示画面のどの位置において表示されているのかを位置に関する情報として生成して保存する（ステップＳ１３０３）。そして、当該位置に関する情報に基づいて、行方向及び列方向にデータ種別が文字データであるテキストデータが連続している部分を検出する（ステップＳ１３０４）。
【００７３】
また、データ種別に関する相対的な位置関係が定義された所定の位置情報パターンを照会し、事前に登録されている位置情報パターンと一致する部分の位置に関する情報を検出する（ステップＳ１３０５）。
【００７４】
そして、行方向及び列方向にデータ種別が文字データであるテキストデータが連続している部分については、音声出力可能なデータ形式を有する読み上げデータへと変換する（ステップＳ１３０６）。また、位置情報パターンと一致している部分については、指定されているビープ音のような他の音データ、さらには特別の意味を表す読み上げデータ、あるいは無音データへと変換する（ステップＳ１３０７）。
【００７５】
そして、変換された読み上げデータについては言語処理を行った後に波形処理を行い、適切な合成音声として出力される。また、ビープ音等の音データが指定されている場合には、当該音データをそのまま出力する（ステップＳ１３０８）。
【００７６】
以上のように本実施の形態によれば、複数行を有するテキストデータが入力された場合であっても、行方向だけでなく列方向における連続した文字データや一連の形態を有する記号データ群等を検出することができ、聴取者に分かりやすく、かつ聞き取りやすい合成音声としてテキストデータを読み上げることが可能となる。
【００７７】
本発明の実施の形態にかかるテキスト読み上げシステムを実現するプログラムは、図１４に示すように、ＣＤ−ＲＯＭ１４２−１やフレキシブルディスク１４２−２等の可搬型記録媒体１４２だけでなく、通信回線の先に備えられた他の記憶装置１４１や、コンピュータ１４３のハードディスクやＲＡＭ等の記録媒体１４４のいずれに記憶されるものであっても良く、プログラム実行時には、プログラムはローディングされ、主メモリ上で実行される。
【００７８】
また、本発明の実施の形態にかかるテキスト読み上げシステムにより生成されたデータ種別位置情報等についても、図１４に示すように、ＣＤ−ＲＯＭ１４２−１やフレキシブルディスク１４２−２等の可搬型記録媒体１４２だけでなく、通信回線の先に備えられた他の記憶装置１４１や、コンピュータ１４３のハードディスクやＲＡＭ等の記録媒体１４４のいずれに記憶されるものであっても良く、例えば本発明にかかるテキスト読み上げシステムを利用する際にコンピュータ１４３により読み取られる。
【００７９】
（付記１）複数行を有するテキストデータを入力するテキストデータ入力部と、
入力された前記テキストデータに関する読み上げデータを生成する読み上げデータ生成部と、
前記読み上げデータを用いて音声出力する音声出力部とを含むテキスト読み上げシステムであって、
前記読み上げデータ生成部は、
入力された前記テキストデータを解析して、データ種別を判別するテキストデータ解析部と、
判別された前記データ種別ごとに、入力された前記テキストデータにおける行方向及び列方向における相対的な位置に関する情報を生成する位置情報生成部と、
生成された位置に関する情報を保存するデータ種別位置情報保存部と、
前記データ種別位置情報保存部に保存されている位置に関する情報に基づいて、音声出力の対象となるテキストデータの前記位置に関する情報を検出する音声出力対象検出部と、
前記音声出力の対象となるテキストデータの前記位置に関する情報に基づいて、入力された前記テキストデータを前記音声出力部において音声出力可能なデータ形式を有する前記読み上げデータへと変換する変換部を含むことを特徴とするテキスト読み上げシステム。
【００８０】
（付記２）前記音声出力対象検出部において、行方向又は列方向に同一の前記データ種別が連続している部分の位置に関する情報を検出する付記１に記載のテキスト読み上げシステム。
【００８１】
（付記３）前記データ種別に関する相対的な位置関係を定義する所定の位置情報パターンを、読み上げデータあるいは音データと対応付けて登録する位置情報パターン保存部をさらに含み、
前記音声出力対象検出部において、前記位置情報パターン保存部を照合して、登録されている前記位置情報パターンと一致する部分の位置に関する情報を検出し、
前記変換部において、検出された前記位置情報パターンを、前記位置情報パターン保存部において対応付けられている前記読み上げデータあるいは音データに変換する付記１又は２に記載のテキスト読み上げシステム。
【００８２】
（付記４）前記変換部において、複数行にまたがって連続している前記データ種別が文字データであるテキストデータを、連続した前記読み上げデータに変換する付記１から３のいずれか一項に記載のテキスト読み上げシステム。
【００８３】
（付記５）前記変換部において、複数行にまたがって連続している前記データ種別が文字データ以外であるテキストデータを削除する付記１から３のいずれか一項に記載のテキスト読み上げシステム。
【００８４】
（付記６）前記音声出力対象検出部において、前記データ種別が文字データ以外である所定の個数以上のテキストデータで囲まれた文字データを、前記データ種別が文字データ以外のテキストデータであると認識する付記４又は５に記載のテキスト読み上げシステム。
【００８５】
（付記７）前記変換部において、前記位置情報パターンと一致する部分の位置に関する情報に基づいて、前記位置情報パターンと一致する部分の開始位置の前、あるいは終了位置の後において前記位置情報パターンと一致する部分を一組の音発生コマンド又は一組の読み上げデータに変換する付記３に記載のテキスト読み上げシステム。
【００８６】
（付記８）前記読み上げデータの内容を指定できる読み上げデータ指定部と、指定された前記読み上げデータの内容を保存する読み上げデータ保存部とをさらに含む付記１に記載のテキスト読み上げシステム。
【００８７】
（付記９）入力手段において複数行を有するテキストデータを入力する工程と、
入力された前記テキストデータに関する読み上げデータを生成する工程と、
前記読み上げデータを用いて音声出力する工程とを含むテキスト読み上げ方法であって、
前記読み上げデータを生成する工程が、
入力された前記テキストデータを解析して、データ種別を判別する工程と、
判別された前記データ種別ごとに、入力された前記テキストデータにおける行方向及び列方向における相対的な位置に関する情報を生成して記憶手段に保存する工程と、
前記記憶手段に保存されている位置に関する情報に基づいて、音声出力の対象となるテキストデータの前記位置に関する情報を検出する工程と、
前記音声出力の対象となるテキストデータの前記位置に関する情報に基づいて、前記入力手段において入力された前記テキストデータを音声出力可能なデータ形式を有する前記読み上げデータへと変換する工程を含むことを特徴とするテキスト読み上げ方法。
【００８８】
（付記１０）複数行を有するテキストデータを入力するステップと、
入力された前記テキストデータに関する読み上げデータを生成するステップと、
前記読み上げデータを用いて音声出力するステップとを含むテキスト読み上げ方法を具現化する、少なくとも入力手段、記憶手段、演算手段、出力手段を含むコンピュータで実行可能なプログラムであって、
前記読み上げデータを生成するステップが、
前記入力手段において入力された前記テキストデータを解析して、データ種別を判別するステップと、
判別された前記データ種別ごとに、入力された前記テキストデータにおける行方向及び列方向における相対的な位置に関する情報を生成して前記記憶手段に保存するステップと、
前記記憶手段に保存されている位置に関する情報に基づいて、音声出力の対象となるテキストデータの前記位置に関する情報を検出するステップと、
前記音声出力の対象となるテキストデータの前記位置に関する情報に基づいて、前記入力手段において入力された前記テキストデータを音声出力可能なデータ形式を有する前記読み上げデータへと変換するステップを含むことを特徴とする前記コンピュータで実行可能なプログラム。
【００８９】
【発明の効果】
以上のように本発明にかかるテキスト読み上げシステムによれば、複数行を有するテキストデータが入力された場合であっても、行方向だけでなく列方向における連続した文字データや一連の形態を有する記号データ群等を検出することができ、聴取者に分かりやすく、かつ聞き取りやすい合成音声としてテキストデータを読み上げることが可能となる。
【図面の簡単な説明】
【図１】従来のテキスト読み上げシステムの構成図
【図２】従来のテキスト読み上げシステムにおける読み上げ状態の説明図
【図３】従来のテキスト読み上げシステムにおける読み上げ状態の説明図
【図４】本発明の実施の形態にかかるテキスト読み上げシステムの構成図
【図５】本発明の実施の形態にかかるテキスト読み上げシステムにおける入力テキストデータ及びデータ種別位置情報保存部におけるデータ構成の例示図
【図６】本発明の実施の形態にかかるテキスト読み上げシステムにおける入力テキストデータ及びデータ種別位置情報保存部におけるデータ構成の例示図
【図７】本発明の実施の形態にかかるテキスト読み上げシステムにおける入力テキストデータの例示図
【図８】本発明の実施の形態にかかるテキスト読み上げシステムにおける変換部の構成例示図
【図９】本発明の実施の形態にかかるテキスト読み上げシステムにおける入力テキストデータ及び変換部でのデータ変換状況の説明の例示図
【図１０】本発明の実施の形態にかかるテキスト読み上げシステムの他の構成図
【図１１】本発明の実施の形態にかかるテキスト読み上げシステムにおける入力テキストデータの例示図
【図１２】本発明の実施の形態にかかるテキスト読み上げシステムにおける入力テキストデータの例示図
【図１３】本発明の実施の形態にかかるテキスト読み上げシステムにおける処理の流れ図
【図１４】コンピュータ環境の例示図
【符号の説明】
１、１１テキストデータ入力部
２、１２読み上げデータ生成部
３、１３音声出力部
４、４１テキストデータ解析部
５切出部
６、４７変換部
４２表示コード保存部
４３位置情報生成部
４４データ種別位置情報保存部
４５音声出力対象検出部
４６位置情報パターン保存部
８１変換開始終了位置確定部
８２読み上げデータ変換部
１０１読み上げデータ指定部
１０２読み上げデータ保存部
１４１回線先の記憶装置
１４２ＣＤ−ＲＯＭやフレキシブルディスク等の可搬型記録媒体
１４２−１ＣＤ−ＲＯＭ
１４２−２フレキシブルディスク
１４３コンピュータ
１４４コンピュータ上のＲＡＭ／ハードディスク等の記録媒体

Claims

複数行を有するテキストデータを入力するテキストデータ入力部と、
入力された前記テキストデータに関する読み上げデータを生成する読み上げデータ生成部と、
前記読み上げデータを用いて音声出力する音声出力部とを含むテキスト読み上げシステムであって、
前記読み上げデータ生成部は、
入力された前記テキストデータを解析して、データ種別を判別するテキストデータ解析部と、
判別された前記データ種別ごとに、入力された前記テキストデータにおける画面上での行方向及び列方向における相対的な位置に関する情報を生成する位置情報生成部と、
前記位置情報生成部によって生成された位置に関する情報に基づいて、前記テキストデータ解析部で判別されたデータ種別を表すコードをｍ×ｎのマトリックスデータとして保存するデータ種別位置情報保存部と、
前記データ種別位置情報保存部に保存されているマトリックスデータにおいて、行方向又は列方向に音声出力の対象となる同一のデータ種別を表すコードが連続している部分の位置に関する情報を検出する音声出力対象検出部と、
前記音声出力対象検出部により検出された位置に関する情報に基づいて、入力された前記テキストデータを前記音声出力部において音声出力可能なデータ形式を有する前記読み上げデータへと変換する変換部を含むことを特徴とするテキスト読み上げシステム。
前記データ種別に関する相対的な位置関係を定義する所定の位置情報パターンを、読み上げデータあるいは音データと対応付けて登録する位置情報パターン保存部をさらに含み、
前記音声出力対象検出部において、前記位置情報パターン保存部を照合して、登録されている前記位置情報パターンと一致する部分の位置に関する情報を検出し、
前記変換部において、検出された前記位置情報パターンを、前記位置情報パターン保存部において対応付けられている前記読み上げデータあるいは音データに変換する請求項１に記載のテキスト読み上げシステム。
前記変換部において、前記位置情報パターンと一致する部分の位置に関する情報に基づいて、前記位置情報パターンと一致する部分の開始位置の前、あるいは終了位置の後において前記位置情報パターンと一致する部分を一組の音発生コマンド又は一組の読み上げデータに変換する請求項２に記載のテキスト読み上げシステム。
前記音声出力対象検出部において、前記データ種別が文字データ以外である所定の個数以上のテキストデータで囲まれた文字データを、前記データ種別が文字データ以外のテキストデータであると認識する請求項１〜３のいずれか一項に記載のテキスト読み上げシステム。
入力手段において複数行を有するテキストデータを入力する工程と、
入力された前記テキストデータに関する読み上げデータを生成する工程と、
前記読み上げデータを用いて音声出力する工程とを含むテキスト読み上げ方法であって、
前記読み上げデータを生成する工程が、
入力された前記テキストデータを解析して、データ種別を判別する工程と、
判別された前記データ種別ごとに、入力された前記テキストデータにおける画面上での行方向及び列方向における相対的な位置に関する情報を生成し、生成された位置に関する情報に基づいて、前記データ種別を判別する工程で判別されたデータ種別を表すコードをｍ×ｎのマトリックスデータとして記憶手段に保存する工程と、
前記記憶手段に保存されているマトリックスデータにおいて、行方向又は列方向に音声出力の対象となる同一のデータ種別を表すコードが連続している部分の位置に関する情報を検出する工程と、
前記位置に関する情報を検出する工程により検出された位置に関する情報に基づいて、前記入力手段において入力された前記テキストデータを音声出力可能なデータ形式を有する前記読み上げデータへと変換する工程を含むことを特徴とするテキスト読み上げ方法。
複数行を有するテキストデータを入力するステップと、
入力された前記テキストデータに関する読み上げデータを生成するステップと、
前記読み上げデータを用いて音声出力するステップとを含むテキスト読み上げ方法を具現化する、少なくとも入力手段、記憶手段、演算手段、出力手段を含むコンピュータで実行可能なプログラムであって、
前記読み上げデータを生成するステップが、
前記入力手段において入力された前記テキストデータを解析して、データ種別を判別するステップと、
判別された前記データ種別ごとに、入力された前記テキストデータにおける画面上での行方向及び列方向における相対的な位置に関する情報を生成し、生成された位置に関する情報に基づいて、前記データ種別を判別するステップで判別されたデータ種別を表すコードをｍ×ｎのマトリックスデータとして記憶手段に保存するステップと、
前記記憶手段に保存されているマトリックスデータにおいて、行方向又は列方向に音声出力の対象となる同一のデータ種別を表すコードが連続している部分の位置に関する情報を検出するステップと、
前記位置に関する情報を検出するステップにより検出された位置に関する情報に基づいて、前記入力手段において入力された前記テキストデータを音声出力可能なデータ形式を有する前記読み上げデータへと変換するステップを含むことを特徴とする前記コンピュータで実行可能なプログラム。