JP4237860B2 - Data reading apparatus and recording medium - Google Patents

Data reading apparatus and recording medium Download PDF

Info

Publication number
JP4237860B2
JP4237860B2 JP06123199A JP6123199A JP4237860B2 JP 4237860 B2 JP4237860 B2 JP 4237860B2 JP 06123199 A JP06123199 A JP 06123199A JP 6123199 A JP6123199 A JP 6123199A JP 4237860 B2 JP4237860 B2 JP 4237860B2
Authority
JP
Japan
Prior art keywords
data
sentence
fixed
sentence example
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP06123199A
Other languages
Japanese (ja)
Other versions
JP2000259165A (en
Inventor
伸之 片江
晋太 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP06123199A priority Critical patent/JP4237860B2/en
Publication of JP2000259165A publication Critical patent/JP2000259165A/en
Application granted granted Critical
Publication of JP4237860B2 publication Critical patent/JP4237860B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、例えば、週間天気予報のデータのように、複数のデータから成る特定フォーマットを持つ定型データが複数ある場合に、複数の定型データを音声合成して読み上げるためのデータ読み上げ装置及び定型データを読み上げるコンピュータプログラムが記録されている記録媒体に関するものである。
【0002】
【従来の技術】
従来のデータ読み上げ装置は、定型データを読み上げる場合、定型データを特定の文例に埋め込み文章を作成し、それを読みやアクセントやイントネーションを表す中間表記に変換して音声を合成し、スピーカ等により出力するものであった。この場合、定型データを同じ文例に埋め込んで文章を作成するため、定型データが幾つもあると、データ部分のみが異なるだけで、単調な文章の繰り返しとなる。そのため、定型データが多いと、聴取者は、いらいらしたり、聞いてる途中でうんざりしてしまうことが多く、必要な情報を全部得るまでにかなり時間がかかることが多かった。
【0003】
【発明が解決しようとする課題】
近年、急速にコンピュータのCPUの高性能化やメモリの高集積化やそれらの低価格化が進み、小型・高性能で大容量メモリを持つコンピュータがますます小型化している。そのため、高性能のCPUや大容量のメモリを必要とする音声合成装置を組み込むことが可能となり、音声で情報を提供する様々な機器も急速に普及している。
【0004】
音声合成装置を組み込んだ機器の急速な普及に伴い、より多くの人々が音声合成された音声による情報の提供を受ける機会が増えてきている。しかし、音声情報は、情報をひとつづつ順番に音声で伝える必要があるため、視覚情報に比べ単位時間当たりに受け取れる情報量が非常に少ない。そのため、目で見ると、一瞥するだけで必要な情報が読み取れる場合でも、それを音声情報として受け取る場合は、音声で情報を順番に読み上げていくため、必要な情報を得るまでに時間がかなりかかる。
【0005】
それが最も顕著に現れる例は、定型データが幾つもある表などで表された情報である。表で表された情報は、目で見ると短時間で見られるし、必要な部分の情報のみを取得するのも容易であるが、音声情報に変換して聞き取る場合は、知りたい情報が表の最後の方にあると、必要のない情報も我慢して聞いていなくてはならないし、全ての情報が必要な場合でも、同じパターンの文章が何度も繰り返されるため、情報量が多いほど聞いている時間が長く、文章が単調なため、途中で聞いているのにウンザリしたりする。
【0006】
情報を音声により提供するサービスは、当初は音声出力装置しか持たない電話等の装置に限られていたが、最近は、例えば、カーナビゲーションのように、ディスプレイ等の表示画面を持っていても、運転中に画面を注視していると危険なため、画面に表示するだけでなく、音声でも情報を提供するような機器も増えて来ている。
【0007】
音声合成による音声情報を提供する機器の利用を一層普及させるためには、幾つもの定型データを短い時間で、飽きることなく音声で伝える技術手段が望まれている。
【0008】
【課題を解決するための手段】
本発明は、表で表せるような1つ以上のデータから成る特定フォーマットを持つ複数の定型データを、同じ文章を繰り返して読み上げるのではなく、文章に変化を持たせ、繰り返し部分に関しては、省略可能な部分を省略したり、データ順序を変えたりして、より短い時間で、飽きることなく音声で情報を読み上げることを可能にするものである。
【0009】
本発明にかかるデータ読み上げ装置は、1つ以上のデータから成る特定フォーマットを持つ定型データを基に文章を合成し、音声出力するデータ読み上げ装置において、前記定型データ中の各データを埋め込むための位置を含み、文章の固定文字部分の内容の異なる文例を複数格納する文例格納部と、前記定型データを読み込み、前記読み込んだ定型データ毎に埋め込む文例を所定の方法で変えて選択し、前記定型データ中の各データを所定位置に埋め込み、文章を合成する文章合成部をそれぞれ備えることを特徴とする。
【0010】
かかる構成により、従来のようにデータ部分を変えただけで、同じ文章を繰り返すのではなく、定型データ毎に異なる文章の音声出力で情報を聞けるため飽きることなく音声情報を聞ける。
【0011】
また、本発明にかかるデータ読み上げ装置は、1つ以上のデータから成る特定フォーマットを持つ定型データを基に文章を合成し、音声出力するデータ読み上げ装置において、 前記定型データを複数格納する定型データ格納部と、前記定型データ中の各データを埋め込むための位置を含み、文章の固定文字部分の内容の異なる文例を複数格納する文例格納部と、前記文例格納部から、前記読み込んだ定型データ毎に埋め込む文例を所定の方法で変えて選択する文例選択部と、前記定型データと前記選択された文例を基に、前記定型データ中の各データを前記選択された文例の所定位置に埋め込み、文書を合成する文章合成部と、前記合成された文書を解析して、音声を表現するための中間表記に変換する文章解析部と、前記中間表記を基に音声を合成して出力する音声合成部をそれぞれ備えることを特徴とする。
【0012】
かかる構成により、従来のようにデータ部分を変えただけで、同じ文章を繰り返すのではなく、定型データ毎に異なる文章で音声出力で情報を聞けるため飽きることなく音声情報を聞ける。
【0013】
また、本発明にかかるデータ読み上げ装置は、1つ以上のデータから成る特定フォーマットを持つ定型データを基に文章を合成し、音声出力するデータ読み上げ装置において、 前記定型データを複数格納する定型データ格納部と、前記定型データ中の各データを埋め込むための位置を含み、文章の固定文字部分の内容の異なる文例を、音声を表現するための中間表記の形式で複数格納する文例格納部と、前記文例格納部から、前記読み込んだ定型データ毎に埋め込む文例を所定の方法で変えて選択する文例選択部と、前記定型データ中の各データを中間表記に変換する定型データ変換部と、変換後の定型データ中の各データと前記選択された文例を基に、前記定型データ中の各データを前記選択された文例の所定位置に埋め込み、文書を合成する文章合成部と、合成された文章を基に音声を合成して出力する音声合成部をそれぞれ備えることを特徴とする。
【0014】
かかる構成により、文例が最初から中間表記となっているため、定型データを読み出す際に、定型データのみ中間表記に変換すればよく、構文解析が不要となり、中間表記へ変更することが容易になるため、処理速度を向上させることが出来る。
【0015】
また、本発明にかかるデータ読み上げ装置は、前記定型データの各データが、重複チェックを行うか否かを示す重複チェックフラグを具え、前記文例格納部が、定型データの重複部分をまとめて表現する文例を格納し、前記文例選択部が、前記重複チェックフラグに基づき、定型データの重複部分を検査し、該当する重複部分をまとめる文例を選択する機能を有することを特徴とする。
【0016】
かかる構成により、定型データ内に同種の同じデータがあった場合、それをひとまとめにして文章を作成出来るため、文章を短縮可能であると同時に、文章に変化を与えることが出来るため、飽きることなく、より短い時間で音声情報を聞ける。
【0017】
また、本発明にかかるデータ読み上げ装置は、前記定型データの各データが、定型データ中のまとめて読み上げるデータの集合を示すデータ集合フラグを具え、前記文例格納部が、データ集合単位に該データ集合のデータのみを含む文例を複数格納し、前文例選択部が、全ての定型データを一括して読み込み、指定されたデータ集合単位に、対応する文例を選択する機能を有することを特徴とする。
【0018】
かかる構成により、最初に複数の定型データ内で重要度の高いデータをまとめて音声出力し、後のデータはそれに続いて詳細データとして音声出力することが可能となるため、必要な情報だけ先に聞くことが出来、後の情報は必要がなければ聞き流すことが出来る。
【0019】
また、本発明にかかるコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体は、1つ以上のデータから成る特定フォーマットを持つ定型データを基に文章を合成するステップと、前記文章を音声出力するステップをコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体であって、前記定型データ中の各データを埋め込むための位置を含み、文章の固定文字部分の内容の異なる文例を複数記憶するステップと、前記定型データを読み込み、前記読み込んだ定型データ毎に埋め込む文例を所定の方法で変えて選択し、前記定型データ中の各データを所定位置に埋め込み、文章を合成するステップをコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体であることを特徴とする。
【0020】
かかる構成により、従来のようにデータ部分を変えただけで、同じ文章を繰り返すのではなく、定型データ毎に異なる文章で音声出力で情報を聞けるため飽きることなく音声情報を聞けるデータ読み上げ装置が実現出来る。
【0021】
また、本発明にかかるコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体は、1つ以上のデータから成る特定フォーマットを持つ定型データを基に文章を合成するステップと、前記文章を音声出力するステップをコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体であって、前記定型データを複数記憶するステップと、前記定型データ中の各データを埋め込むための位置を含み、文章の固定文字部分の内容の異なる文例を複数記憶するステップと、前記記憶されている文例から、前記読み込んだ定型データ毎に埋め込む文例を所定の方法で変えて選択するステップと、前記定型データと前記選択された文例を基に、前記定型データ中の各データを前記選択された文例の所定位置に埋め込み、文書を合成するステップと、前記合成された文書を解析して、音声を表現するための中間表記に変換するステップと、前記中間表記を基に音声を合成して出力するステップをコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体であることを特徴とする。
【0022】
かかる構成により、従来のようにデータ部分を変えただけで、同じ文章を繰り返すのではなく、定型データ毎に異なる文章で音声出力で情報を聞けるため飽きることなく音声情報を聞けるデータ読み上げ装置が実現出来る。
【0023】
【発明の実施の形態】
本発明の原理と基本的動作の流れを、図1の本発明の基本構成図と図2の基本的な処理の流れを表すフローチャートを用いて説明する。
【0024】
まず、文例選択部1が、定型データ格納部1−1から定型データを入力し(ステップS1)、定型データが終了でない場合(ステップS2:NO)は、事前に決められた所定の選定方法により文例を選択する(ステップS3)。定型データが終了の場合(ステップS2:YES)は、処理を終了する。
【0025】
定型データと文例は、通常、データの提供者が事前に作成するものなので、図1の基本構成図においては入力部を設けず、既に登録されていることを前提としているが、本構成に入力部を設けて行うようにしてもよい。定型データと文例の入力は、通常のエディタで行えばよい。このステップまでが、本発明の特徴となる部分であり、これにより、定型データをデータ部分だけ変えた同じ文章で繰り返すことなく、定型データ毎に異なる文例を用いて、異なる文章で読み上げることを可能にし、その結果、聴取者は飽きることなく、読み上げ情報を聞くことが出来る。
【0026】
これ以降のステップは、従来のテキストデータの音声読み上げ装置と同様であり、その一般的な例を取りあげるものであり、このパターンに限定されるものではなく、どのようなパターンのテキストデータ音声読み上げ装置の仕組みを用いてもよい。文章合成部2は、該定型データと該文例を受け取り、該定型データを該文例に組み込むことにより、文章を合成する(ステップS4)。文章解析部3は、該合成された文章を受け取ると、形態素辞書3−1を用いて文章の形態素解析・構文解析を行い、音声を表す中間表記の形式に変換する(ステップS5)。音声合成部4は、該中間表記を受け取り、音声素片辞書4−1を用いて音声を合成し、文章を音声で読み上げる(ステップS6)。
【0027】
ここで、中間表記とはどういうものか、一例をあげる。
【0028】
たとえば、合成された文章が、「神奈川県東部の7月13日の天気は晴れのち曇りでしょう。0時から6時までの雨の降る確率は20%でしょう。」という文章だとすると、中間表記は、「カナガワ’ケン_ト’ーブノ,シチガツ_ジューサ’ンニチノ_テ’ンキワ,ハレ’ノチ_クモリ’デショー.レ’ージカラ_ロク’ジマデノ_ア’メノ_カクリツワ,ニジッパーセ’ント_デショー.」というようになる。カタカナは、読みを表しており、「’」と「_」はアクセント情報を、「,」はそこでポーズをとることを示している。ここであげた中間表記はあくまで一例であり、ここで用いた表記とは異なる表記法を用いてもよい。
【0029】
【実施の形態1】
文章の内容の異なる文例を複数用意し、定型データ毎に文例を選択し、音声で読み上げる例について説明する。本実施の形態は、図1の基本構成図と同一なので、各機能部分の概要説明は省略して、文例選択部1の詳細機能について説明する。
【0030】
文例格納部1−2には、文例が、定型データの各データを全て埋め込み可能な状態で、文章の固定文字部分の内容の異なる形で複数格納されている。定型データの各データを文例のどこに埋め込むかを指定する方法は複数考えられるので、その例の幾つかを、定型データが地区名と月日と天気からなる天気のデータとして、あげる。
【0031】
まず、文例中のデータの指定方法の第1のパターンは、文例の内容を「≪1≫の≪2≫の天気は≪3≫でしょう。」のようにする。記号の≪と≫で挟まれている番号は定型データの何番目のデータを入れるかを示す。つまり、≪1≫は1番目のデータである地区名を、≪2≫は2番目のデータである月日を、≪3≫は3番目のデータである天気を表す。これにより、定型データの何番目のデータを文例のどの位置に入れればよいかわかり、データ順序はそのままで文例の固定文字部分を変えた文例だけでなく、データ順序を入れ換えた文例も作ることが可能になるため、読み上げる文書により多くの様々なバリエーションをつけることが可能となり、聴取者を飽きにくくすることが出来る。
【0032】
次に、文例中のデータの指定方法の第2のパターンとして、第1のパターンでは、数字で表されたデータがどのデータを指すか、後で修正したりする際にわかりにくいので、データを数字だけで表すのではなく、数字がどのデータを表すかを示すコメントを付加して、「≪1:地区名≫の≪2:月日≫の天気は≪3:天気≫でしょう。」のように書き、変数が何かを分かり安くしてもよい。これにより、第1のパターンの利点に加え、文例を追加・修正する際のメンテナンス性を容易にすることが出来る。
【0033】
次に、文例中のデータの指定方法の第3のパターンとして、定型データのデータの順に当てはめるデータ名を羅列したデータを用意しておき、「≪地区名≫,≪月日≫,≪天気≫」というように、定型データの各データをそれぞれどのような名称の変数に割り当てるかを示すようにしておいてもよい。変数を示す≪と≫の記号は、変数の区切りがわかれば省略してもよいので、「地区名,月日,天気」としてもよい。この定型データの各データに割り当てる変数名を指定するデータは、定型データ格納部1−1の1件目の定型データとして入れておいてもよいし、文例格納部1−2の1件目の文例データとして入れておいてもよいし、文例選択部1のプログラムのパラメタとして入力してもよい。これにより、どのデータをどこに埋め込めばいいかを、直接、データ名で文例中に指定出来るようになる。つまり、変数名を指定するデータを文例格納部1−2の1件目の文例データとして入れた場合、文例選択部1が文例の1件目にある変数名を指定するデータを読み込み、定型データの1番目のデータは地区名・2番目のデータは月日・3番目のデータは天気だと認識出来るようになるので、文例では、何番目のデータをいれるか示す数字を入れずに、「≪地区名≫の≪月日≫の天気は≪天気≫でしょう。」のように、文例の1件目で指定した変数名を用いる。これにより、文例の1件目で、定型データの各データにつける変数名さえ指定しておけば、文例を作る際に、定型データの何番目のデータか意識する必要がなく、文例がより、自然な形で追加・修正出来るようになる。
【0034】
この例では、変数名を文例の最初のデータとして入力したが、これは、読み上げデータがいろいろ変わる汎用的なデータ読み上げ装置として用いることを可能とするためであり、汎用的でなくてもよい特定の目的の定型データ読み上げ装置ならば、定型データ内で用いる変数名をプログラム中に定義して持っておくようにしてもよい。
【0035】
これらのいずれの文例のパターンを用いても、変数以外の部分を変えた様々な文例だけでなく、変数の順序そのものも任意となるため、読み上げる文書に様々なバリエーションをつけることが可能となり、聴取者を飽きにくくすることが出来る。
【0036】
その他、文例中のデータの指定方法の第4のパターンとしては、定型データの各データを前から順序通りに文例に埋め込む場合ようにして、「≪≫の≪≫の天気は≪≫でしょう。」のように、データを示す番号または変数名を省略して、データを挿入する位置を示す記号のみとしてもよい。但し、このパターンでは、データの順序を入れ換えた文例には対応出来ない。
【0037】
前述の第1・第2のパターンの場合は、文例選択部1は、1から順に番号をふったデータテーブル(不図示)を用意しておき、定型データを読み込み、各データを順番に格納する。第3のパターンの場合は、文例選択部1が、データ名とデータから成る2次元データテーブル(不図示)のデータ名の列に、定型データ格納部1−1又は文例格納部1−2の1件目のデータ名を羅列したデータを読み込むか、該データを表すパラメータを取り込んで、データ名を順番に格納し、定型データを読み込むと、各データを順番にデータテーブルの該当するデータ名の部分に格納する。第4のパターンの場合は、データテーブルの作成は不要である。文例選択部1から文章合成部2に渡される定型データは、第1から第3のパターンの場合は、データテーブルの形で渡され、第4のパターンの場合は、定型データそのままの形で渡される。
【0038】
次に、文例格納部1は、定型データ毎に、複数の文例の中から文例を選択するが、その方法は、幾つか考えられるので、以下にその方法の例をあげる。なお、本実施の形態では、文例格納部1−2は、最も丁寧な文例から順に、段々簡略化された文例を格納しているものとする。
【0039】
第1の方法は、最初の文例から最後の文例までを循環的に何度も繰り返して使用する方法である。この方法は、文例と定型データを最初から順に読んで、そのまま両方のデータを使用するものである。文例より定型データの数の方が多い場合は、最後の文例を読み終わると、文例の最初に戻って読み込む。このように、定型データがなくなるまで文例を循環しながら読み込む。これにより、同じ文例を続けて使用することを容易になくせる。
【0040】
第2の方法は、何番目の文例を用いるかを、文例数以下の正の整数の疑似乱数を発生させて求める方法である。この際、過去何回かの乱数を記憶しておき、記憶している乱数と同じ乱数が発生した際には、記憶されていない乱数が出るまで乱数を求め直すことにより、同じ文例を続けて使用したり、短い間隔で繰り返されることをなくしてもよい。前述の文例中のデータの指定方法の第3のパターンを用い、かつデータ名を羅列したデータを文例格納部1−2に格納する場合は、文例の1件目のデータは、データ名の羅列であり、文例ではないので、文例の数−1の正の整数の疑似乱数を発生させて、使用する文例は、該疑似乱数+1番目の文例を使用する。第1の方法では、一定間隔で同じ文例が繰り返されるため、何度も聞いていると次の文例が予測出来たり、最も簡略化した表現の文例の後に最も丁寧な文例が来たりするが、この方法によれば、次はどの文例が来るか予測出来ないものにすることが出来る。
【0041】
第3の方法は、所定の最初のいくつかの文例は、1度だけ使用し、それ以降の繰り返し部分の文例に関しては、第1の方法又は第2の方法を用いて読みあげる方法である。最初のいくつかの文例は、丁寧な表現を用いた文例を使用し、それ以降は、表現を簡略化した文例を格納しておく。丁寧な文例が最初の何件か、繰り返す簡略化された文例がどれかを示すには、事前に丁寧な文例が何件あるのかという情報を文例選択部1のプログラム内に設定しておいてもよいが、汎用的にするためには、各文例の先頭に繰り返す文例か否かのフラグを設けるとよい。文例の例を、図4の(a)に示す。この例では、第1・第2の文例は、最初1回使用されるだけで、第3・第4の文例が繰り返される。聴取者にとっては、聞く文章は、最初は丁寧で段々簡略化していくのが好ましい。しかし、第1の方法では、繰り返しの際に簡略化した表現から丁寧な表現に戻ることがあり、第2の方法では、いきなり簡略化された表現で始まる場合や簡略化した表現から丁寧な表現に戻る場合があったが、この方法により、そういう問題を回避することが出来る。
【0042】
文例中のデータの指定方法として第1のパターンを用い、文例の選択方法として疑似乱数を使用した第3のパターンを用い、図4の(a)のような文例がある場合の文章選択部1の処理の流れ(図2のステップS1〜S3の処理に相当)について、図3のフローチャートを用いて説明する。
【0043】
文例選択部1は、文例を読み込み(ステップS11)、その文例に繰り返し使用する文例であるかを示すフラグが設定されているかを判定(ステップS12)し、繰り返しフラグが設定されていない場合(ステップS12:NO)は、定型データを読み込み(ステップS13)、定型データが終了でない場合(ステップS14:NO)は、該文例と該定型データを文章合成部に渡す(ステップS15)。繰り返しフラグが設定されていない文例は、1回しか使用しないので、次の文例を読み込むために、ステップS11に戻る。定型データが終了の場合(ステップS14:YES)は、プログラムを終了する。
【0044】
文例の繰り返しフラグが設定されている場合(ステップS12:YES)は、文例をテーブルに格納し、文例の件数をカウント(ステップS16)する。そして、次の文例を読み込む(ステップS17)。繰り返しフラグが設定されている文例を全て読み込むために、文例が終了していない場合(ステップS18:NO)は、ステップS16に戻り、文例が終了するまで繰り返す。
【0045】
繰り返し使用する文例をテーブルに格納すると、定型データを読み込み(ステップS19)し、定型データが終了でない場合(ステップS20:NO)は、テーブルに格納した文例のカウント以下の正の整数の疑似乱数を発生させて、どの文例を使用するか選択する(ステップS21)。読み込んだ定型データと選択した文例を文章合成部2に渡し(ステップS22)、次の定型データを読み出すために、ステップS19に戻る。定型データが終了した場合(ステップS20:YES)は、プログラムを終了する。
【0046】
【実施の形態2】
次に、文例を中間表記の形で格納しておき、定型データのみを中間表記に変換することにより、文章解析する必要をなくした実施の形態について、図5を用いて説明する。図1と同一部分に関しては、適宜、説明を省略する。
【0047】
本実施の形態では、文例選択部1は、定型データを読み込んで、重複チェック等を行い、文例を選択した後、文例は中間表記になっているので、そのまま文章合成部2に、定型データは定型データ変換部5に渡す。定型データ変換部5は、定型データ用形態素辞書5−1を用いて、受け取った定型データの各データを中間表記に変換し、文章合成部2に渡す。文章合成部2は、受け取った中間表記の文例と定型データから、中間表記の文章を合成し、音声合成部4に渡し、音声情報として読み上げる。
【0048】
定型データ用形態素辞書は、形態素辞書3−1のサブセットであり、定型データに含まれる形態素のみの中間表記格納していればよい。但し、ハードディスクの容量に問題がなければ、形態素辞書3−1を用いても問題はない。
【0049】
文例中のデータ名に関しては、変数名であることを示す記号≪と≫は残した形で中間表記にしても構わないが、変数名を分かりやすくするためには、中間表記としない方が好ましい。
【0050】
本実施の形態によると、文例を中間表記で格納しておく必要があるため、文例を直接中間表記で作成しようとすると、通常の文章を入力することに比べると面倒である。その場合は、最初は通常の文章を入力しておき、実施の形態1であげた文章解析部3にあたる処理を実行して、中間表記の文例を事前に作成しておけばよい。また、定型データを最初から中間表記とすることも考えられるが、その場合も文例と同様にするとよい。その場合は、図5の定型データ変換部5は不要となる。
【0051】
本実施の形態における処理の流れについて、図6のフローチャートを用いて説明する。
【0052】
定型データ格納部1−1から定型データを入力(ステップS31)し、定型データが終了でない場合(ステップS32:NO)は、所定の方法により文例格納部1−2から文例を選択(ステップS33)する。定型データが終了の場合(ステップS32:YES)は、処理を終了する。定型データは、定型データ変換部5に渡され、中間表記に変換される(ステップS34)。文例と定型データは、どちらも中間表記の形式で文章合成部3に渡され、文章が合成される(ステップS35)。合成された文章を基に、音声合成部は、音声を合成し、文章を読み上げる(ステップS36)。
【0053】
以上のように、本実施の形態によれば、文例が最初から中間表記となっているため、定型データを読み出す際に、データのみ中間表記に変換すればよいため、定型データ読み上げ時には構文解析が不要で、文章解析のためのプログラムが不要になり、形態素辞書に定型データ用のデータのみ用意すればよいため、中間表記への変更が容易となり、メモリや記憶装置の容量も少なくて済み、処理速度を向上させることが出来る。
【0054】
【実施の形態3】
次に、定型データの重複する部分をまとめて読み上げる実施の形態について、構成図は実施の形態1と同一なので、図1を用いて説明する。重複する部分に関しては、適宜、説明を省略する。
【0055】
本実施の形態では、定型データにまとめて表現出来る重複データが存在することが前提となる。例えば、週間天気予報を例にとると、定型データは、地区名・月日・天気・降水確率1・降水確率2・降水確率3・降水確率4・予想最低気温・予想最高気温というデータから成り、降水確率1〜4は、それぞれ、0時から6時までの降水確率、6時から12時までの降水確率、12時から18時までの降水確率、18時から24時までの降水確率を表すものとする。このデータの場合、降水確率1〜4に関しては、同じ降水確率が連続すると、その部分をまとめて表現することが可能である。例えば、「≪1≫の≪2≫の天気は≪3≫、0時から6時までの降水確率は≪4≫、6時から12時までは≪5≫、12時から18時までは≪6≫、18時から24時までは≪7≫、予想最低気温は≪8≫、予想最高気温は≪9≫でしょう。」という文例があるすると、≪4≫〜≪7≫までの降水確率のデータの重複の仕方により、更に、以下の7つの文例が考えられるため、合計8つの文例を作成することが出来る。
▲1▼≪1≫の≪2≫の天気は≪3≫、0時から12時までの降水確率は≪4≫、12時から18時までは≪6≫、18時から24時までは≪7≫、
予想最低気温は≪8≫、予想最高気温は≪9≫でしょう。
▲2▼≪1≫の≪2≫の天気は≪3≫、0時から6時までの降水確率は≪4≫、6時から18時までは≪5≫、18時から24時までは≪7≫、
予想最低気温は≪8≫、予想最高気温は≪9≫でしょう。
▲3▼≪1≫の≪2≫の天気は≪3≫、0時から6時までの降水確率は≪4≫、6時から12時までは≪5≫、12時から24時までは≪6≫、
予想最低気温は≪8≫、予想最高気温は≪9≫でしょう。
▲4▼≪1≫の≪2≫の天気は≪3≫、0時から12時までの降水確率は≪4≫、12時から24時までは≪6≫、
予想最低気温は≪8≫、予想最高気温は≪9≫でしょう。
▲5▼≪1≫の≪2≫の天気は≪3≫、0時から18時までの降水確率は≪4≫、18時から24時までは≪7≫、
予想最低気温は≪8≫、予想最高気温は≪9≫でしょう。
▲6▼≪1≫の≪2≫の天気は≪3≫、0時から6時までの降水確率は≪4≫、6時から24時までは≪5≫、
予想最低気温は≪8≫、予想最高気温は≪9≫でしょう。
▲7▼≪1≫の≪2≫の天気は≪3≫、0時から24時までの降水確率は≪4≫、 予想最低気温は≪8≫、予想最高気温は≪9≫でしょう。
【0056】
1つの定型データ内だと、前記のようなデータの省略が可能であるが、データの重複チェックを1つの定型データ内に限定する必要はなく、複数の定型データに共通する部分を省略することも可能である。例えば、前述の週間天気予報の定型データの場合は、日曜日から土曜日までの定型データがある。この場合、地区名である≪1≫は、どの定型データにおいても同じで、最初に1回読み上げればいいので、2 回目以降の読み上げ時には省略してもよい。つまり、前記の8つの文例のパターンに地区名≪1≫が省略された、文例がそれぞれ追加されるため、合計16個の文例をつくることが出来る。この場合、複数の定型データにまたがって、データの重複をチェックしているため、読み込んだ定型データはメモリ等に記憶しておく必要がある。
【0057】
次に、重複しているデータのチェック方法について述べる。チェック方法で問題となるのは、どのデータとどのデータの重複をチェックすべきかどうかを、どうやって判断するかである。
【0058】
重複チェックするデータを判別する第1の方法としては、単純に定型データの各データが連続して同じかどうかを判断することにより、重複をチェックする方法である。この方法だと、どのデータとどのデータをチェックすればよいかを指示する必要がなく、単純に全てのデータについて、同じデータが連続しているか否かをチェックすればよい。この場合、同じデータが連続してたら、無条件にその重複するデータの1つを残して省略してよいということが前提でなければならない。つまり、異なる種類のデータなのに、データが同じ形式で重複する可能性があるデータが存在しないということが前提となる。
【0059】
前述した文例を例にとり、問題となるパターンのデータの例をあげる。18時から24時までの降水確率を10%、予想最低気温を10度とする。前述の文例では、%と度を文例中の固定文字としておらず、定型データのデータ内に含んでいるため、重複とはならないが、%と度を固定文字としていた場合、どちらもデータとしては10となり、重複データと見なしてしまう。これを回避する手段としては、文例データ中に最低予想気温を表す≪8≫が省略された文例がないことをチェックすることにより、省略不可能だと判定することが出来る。しかし、この場合は、この方法で回避出来るが、どのような場合でも必ず回避出来るとは限らないので、異なる種類のデータでもデータの形式が同じため、重複していると誤判断する可能性のあるデータの並びや文例にしないように、定型データや文例を作成する必要がある。
【0060】
その他の重複チェックするデータを判別する方法としては、重複チェックをするデータを指定する方法がある。具体的な指定方法としては、定型データ内の各データに重複チェックフラグを設ける方法と、重複チェック指示のための別ファイルを設けるか、文例格納部1のプログラムのパラメタとして、重複チェックするデータを指定しておく方法がある。チェックには、前述したように1つの定型データ内のデータの重複チェックと複数の定型データにわたるデータの重複チェックがあり、1つの定型データ内のチェックには、複数のチェックすべきデータ群が存在する可能性がある。そのため、それらの区別がつくように、データにフラグを設定する必要がある。
【0061】
定例データの各データにフラグを設定した例として、前述の文例で、降水確率の%と予想温度の度を文例中の固定文字として持ち、定型データ中では、データだけでは、降水確率と予想温度の区別がつかないようにした例をあげる。図7の(a)は、定例データの各データにフラグを設定した例である。地区名の前のフラグ「*」は、複数の定例データにまたがってデータが重複した場合、2 回目以降は省略することを示している。降水確率1〜4と予想最低気温・予想最高気温のデータは数字で、データの区別は指示しないと判断出来ない。降水確率1〜4のフラグは全て1が設定されており、1つの定例データ内で省略可能な同一のグループのデータを示している。1つの定例データ内に省略可能なグループが複数ある場合は、それぞれのグループ毎に異なる数字または文字を設定しておけばよい。フラグが空白の部分は、省略不可のデータである。
【0062】
定型データ内の各データに重複フラグを持たせず、重複チェックすべきデータの指示を、別ファイルに格納して指示する場合またはパラメタにより指示する場合は、「*,,,1,1,1,1,,」のような重複チェック指示を入力してどのような重複チェックすべき項目かを指定しておく。
【0063】
このように、重複チェックをするデータを指定すれば、どのデータとどのデータについてどのような重複チェックをすればよいか明確になり、重複チェックを間違えることをなく実行することが出来る。
【0064】
重複チェックが済んで、どのデータを省略するかが確定すると、それに対応する文例を選択する必要がある。選択する文例は、どのデータを省略するかで決まるが、対象となる文例が1つとは限らない。その場合は、対象となる文例から、実施の形態1で用いたような選択方法により使用する文例を決定する。以下に省略するデータが決定してから、対象となる文例を洗い出す方法について述べる。
【0065】
まず、対象となる文例を洗い出す第1の方法は、定型データを読む度に文例を全て読み込み、文例中に省略するデータ名を含まない文例を全て洗い出す方法である。これは、定型データを読み込む度に文例を全てチェックして対象となる文例を洗い出すため、最も単純な方法だが、最も非効率的な方法である。但し、全ての文例のチェックを最初の1回だけ行い、文例とその文例がどのデータを省略しているかというテーブルを作成するようにすると、2回目以降は、このテーブルを参照すれば、文例がどのデータを省略しているかを何度も判別する必要もなく、文例自体も既にテーブルに格納されているため、再度、文例格納部1−2から読み出す必要がないので、効率的に処理出来るようになる。
【0066】
次に、対象となる文例を洗い出す第2の方法は、文例に省略されるデータが何かを示すインデックスをつけた文例を格納しておき、定型データから省略するデータがわかると、どのデータを省略するかでインデックスを作り、それにより対象となる文例を検索する方法である。以下に例をあげる。
【0067】
例えば、1 番目のデータと6番目のデータが省略される場合、16というインデックスにするように、インデックスの求め方を事前に決めておく。対象となる文例は、複数ある可能性があるので、文例は重複キーを持つインデックス付きのファイルとする。重複キーを持つ文例が存在するため、まず、16という値で、文例の入っているファイルの対象となる文例の最初の文例に位置づけし、そこから、インデックスが16という値でなくなるまで順次読み込みをして、対象となる文例を全て洗い出す。インデックスは、省略されるデータ番号でなく、省略されない文例番号や省略されるデータ名等でもよいが、省略されるデータ番号による方が、インデックスは短くなるため、インデックスとしてより好ましい。
【0068】
1つの定型データ内でのみ重複チェックする場合は、定型データを1件づつ読み込んで処理をすればよいので、フローチャートは図2と同様になるが、複数の定型データにまたがるデータの重複をチェックする場合、チェックしやすいように定型データ全てを一括して読み込むようにすると、処理の流れが変わるため、図2のフローチャートは、次のように変わる。最初に、定例データを全て読み込むには、ステップS1で全ての定型データを読み込み、メモリ上に蓄え、定型データの読み込みが終了した時点で、ステップS3に移るようにする必要がある。そのため、ステップS2で定型データの読み込みが終了しない間は、ステップS2からステップS1に戻り、ステップS2で定型データの読み込みが終了した時点で、ステップS3に移る。ステップS4からステップS6は、読み込んだ全ての定型データについて一括処理する形になり、ステップS6の処理が終わった時点で全体の処理が終了となる。
【0069】
以上のように、本実施の形態によれば、固定文字を簡略化した文例を作成出来るだけでなく、重複したデータそのものを省略してまとめた表現の文例も作成することが出来、より読み上げ時間を短縮した定例データ読み上げ装置を実現出来る。
【0070】
【実施の形態4】
次に、定型データ単位に文章を読み上げるのではなく、定型データの内、早く知りたい情報や重要な情報等を最初にまとめて読み上げる実施の形態について、実施の形態1の構成図である図1を用いて説明する。実施の形態1と同一部分に関しては、適宜、説明を省略する。
【0071】
本実施の形態では、定型データ格納部1−1に格納された定型データの各データは、図7の(b)に示されるように、どのデータをデータ集合と見なすかのフラグが設けられている。この例は、定型データを2つのデータ集合に分けた例である。最初のデータ集合は、フラグとして「*」または「#」が指定されたデータの集合であり、もう1 つのデータ集合は、フラグを設定されていないデータの集合である。フラグ「*」が設定されているデータは、最初にのみ読み上げるデータ集合のデータを指す。フラグ「#」が設定されているデータは、最初に読み上げるデータ集合のデータの1つであるが、最初のデータ集合だけに属するのではなく、もう1つの集合データにも属することを示している。つまり、最初のデータ集合が読み上げられる時にも、もう1つのデータ集合が読み上げられる時にも、読み上げられる共通データであることを表す。
【0072】
文例格納部1−2に、図4の(b)のような文例が格納されているものとし、図7の(b)の定型データの最初の3件を読み上げると、
「神奈川県東部の2月1日の天気は、晴れ後曇り。2月2日は、晴れ。2月3日は、晴れ時々雨。
2月1日の降水確率、0時から6時までは0%、6時から12時までは10%、12時から18時までは30%、18時から24時までは30%、
予想最低気温は0度、予想最高気温は10度でしょう。
2月2日の降水確率、0時から6時までは0%、6時から12時までは0%、12時から18時までは0%、18時から24時までは0%、
予想最低気温は0度、予想最高気温は10度でしょう。
2月3日の降水確率、0時から6時までは10%、6時から12時までは10%、12時から18時までは60%、18時から24時までは60%、
予想最低気温は0度、予想最高気温は10度でしょう。」となる。
【0073】
この実施の形態では、定型データのどのデータをまとめるかを、各データにフラグを設けることにより行っているが、これを別ファイルに格納したり、文例選択部1のプログラムのパラメタにより指定してもよい。図7の(b)の定型データのフラグで指定するのをやめ、フラグのみを別ファイルかパラメタで指定する場合は、例えば、「*,#,*,,,,,,」のように指定する。これを短縮して「*,#,*」としてもよい。
【0074】
本実施の形態に実施の形態3の機能を組み合わせる場合は、データの集合を表すフラグと、重複チェックするデータを示すフラグが重なる場合があるので、各データ毎にフラグを分けて持つ必要があるため、定型データは、図7の(c)のようになる。図4の(b)の3件目の文例の降水確率の部分を、まとめて表現する文例を追加して、図7の(c)の最初の3件を読み上げると、以下のようになる。
「神奈川県東部の2月1日の天気は、晴れ後曇り。2月2日は、晴れ。2月3日は、晴れ時々雨。
2月1日の降水確率、0時から6時までは0%、6時から12時までは10%、12時から24時までは30%、予想最低気温は0度、予想最高気温は10度でしょう。
2月2日の降水確率、0時から24時までは0%、予想最低気温は0度、予想最高気温は10度でしょう。
2月3日の降水確率、0時から12時までは10%、12時から24時までは60%、予想最低気温は0度、予想最高気温は10度でしょう。」
このように、更に文章を短くすることが出来る。
【0075】
本実施の形態により、最初に複数の定型データ内で重要度の高いデータをまとめて音声出力し、後のデータはそれに続いて詳細データとして音声出力することが可能となるため、必要な情報だけ先に聞くことが出来、後の情報は必要がなければ聞き流すことが出来るようになる。
【0076】
それ以外の方法としては、定型データにフラグを持つのではなく、文例にフラグを持つ方法がある。この方法を用いて、図4の(a)に示すような、実施の形態1の文例の指定方法を組み合わせた場合、例えば、図4の(c)で示す文例のようになる。まず、最初のデータ集合を読み上げるために使用する文例に1というフラグを設定し、第2のデータ集合を読み上げるために使用する文例に2というフラグを設定する。フラグが1である文例は2件あり、1件目の文例は1回だけ使用し、2件目の文例は繰り返し使用するように、2件目のフラグの2バイト目には*を指定する。そして、各フラグ毎の文例を用いて,全ての定例データについて読み上げる。この方法を用いれば、データ毎にフラグを設定してグループ化しなくても、文例の中で使用しているデータをチェックすることにより、データのグループ化が可能となる。
【0077】
データにフラグをつけたり、別ファイルやパラメタでデータの集合を指定する方法では、複数のデータ集合間にまたがって使用するデータを指定するのは、全てのデータ集合に必須のデータでない限り、いくつものフラグを設けないと難しいが、文例でデータをグループ化する方法の場合、データの集合を指定しなくても、文例で使用されているデータでデータの集合が規定されることになるため、指定の仕方が極めて容易となる。
【0078】
【実施の形態5】
次に、定型データと文例を基にして、データを読み上げるだけでなく、表を作成して表示装置に表示することにより、耳で聞くだけでなく、見ることによっても情報を取得出来るようにした実施の形態について、車載情報サービス端末として用いられるカーナビゲーションを例にとり、図8の構成図を用いて説明する。
【0079】
本実施の形態では、定型データを週間天気予報のデータとし、定型データと文例の送信は、放送局からのFM放送で送られる文字放送の形で行われるものとする。また、いわゆるITSと呼ばれるシステムの一部として地域毎の道路交通情報や天気予報のデータを特別のサービスステーションから受信する場合も含まれるものとする。
【0080】
放送局は、データ送信部6により、放送局にある定型データ格納部6−1と文例格納部6−2を入力として、定型データと文例をFM電波で放送する。カーナビゲーションは、データ受信部7により該定型データと該文例を受信し、カーナビゲーション側にある定型データ格納部7−1と文例格納部7−2に格納する。表示データ作成部8は、定型データ格納部12−1と文例格納部12−2から、定型データと文例を取得して表データを作成し、ディスプレイ等の表示装置15に表示する。音声データ作成部9の構成は、前述した実施の形態の構成図において、定型データ格納部1−1が定型データ格納部7−1に、文例格納部1−2が文例格納部7−2に置き換わることと、音声を出力する部分をスピーカ等の音声出力装置11としていること以外は同じであるため、説明は省略する。
【0081】
表示データ作成部8がどのようにして表データを作成するのかについて、以下に例をあげて説明する。
【0082】
表データを生成する際には、もっとも丁寧な表現をしている1件目の文例を入力データとし、変数は番号ではなく、変数名で使用しているものとする。定型データは、図7の(c)とし、文例は、「≪地区名≫の≪月日≫の天気は≪天気≫でしょう。0時から6時までの降水確率は≪降水確率1≫%でしょう。6時から12時までの降水確率は≪降水確率2≫%でしょう。12時から18時までの降水確率は≪降水確率3≫%でしょう。18時から24時までの降水確率は≪降水確率4≫%でしょう。予想最低気温は≪予想最低気温≫度でしょう。予想最高気温は≪予想最高気温≫度でしょう。」とする。
【0083】
まず、メモリ上に表と同様の形式の2次元テーブルを設ける。表の上端には、何のデータかを示すための項目名を入れる必要があるため、前記2次元テーブルの表の上端に項目名を入れるために1行分空けておくことにする。次に、表の各列が何のデータであるかを示す変数名を、文例から項目名として取得する。前述の文例の場合、項目名は、地区名・月日・天気・降水確率1・降水確率2・降水確率3・降水確率4・予想最低気温・予想最高気温となる。あとは、定型データを読み込んで、順番にテーブルに格納するだけである。変数名を単純に各データを表す項目名として使用して作表する場合は、図9の(a)のような週間天気予報表になる。
【0084】
ここで、さらに見やすい表にするために、次に機能を追加する。図7の(a)の地区名は、複数の定型データにまたがる重複チェックを行うデータなので、1件目以降の地区名は省略する。月日に関しては、月と日に分解し、月の部分が同じだと「〜月」の部分を省略する。
【0085】
次に、定型データの内、降水確率1〜4は、図7の(c)に示すように定型データ内の重複チェックを行うデータであるということがわかる。つまり、重複チェックであるということは、同じ種類のデータであるということなので、文例の変数の直前の固定文字をチェックすると、降水確率1〜4の直前にある固定文字は、それぞれ、「0時から6時までの降水確率は」、「6時から12時までの降水確率は」、「12時から18時までの降水確率は」、「18時から24時までの降水確率は」である。それぞれの固定文字から助詞の「は」を除くと、「降水確率」という言葉とそれを修飾している語から成り立っていることが分かる。そのため、「降水確率」を、データである降水確率1〜4をまとめた語であると判断する。「降水確率」という項目名は、文例の変数名である降水確率1〜4から共通する部分である「降水確率」という言葉を取り出してもよい。
【0086】
降水確率1〜4を区別しているのは文例の中の変数名を修飾している部分なので、助詞を除くと、降水確率1〜4は、それぞれ、「0時から6時まで」、「6時から12時まで」、「12時から18時まで」、「18時から24時まで」となり、これを、降水確率1〜4を区別する語とみなす。このまま表の項目名として使用すると長いので、「から」と「まで」を「〜」に変換し、各項目の長さを合わせるために、2桁の数字を半角に変換する。降水確率1〜4は、1つの定型データ内での重複チェックするデータであるが、数字であり、表にする際に省略するのは好ましくないので、省略せずにそのまま残す。この場合、項目名を入れる領域は、テーブルの上2行となる。
【0087】
また、各データに関しては、定例データをそのまま表示するのではなく、文例中の変数名の直後の語をチェックし、変数名直後の語が「%」や「度」等の単位を表す語である場合は、表を分かりやすくするために、表中に取り込む。各データの桁数をいくらにするかに関しては、対応するデータの最大データ長と項目名の長さをチェックし、長い方とする。項目名は、桁数の真ん中になるよう、センタリングを行う。数字に関しては、右詰めとする。このようにして、項目名や定型データを編集したり、位置合わせを行って作表すると、図9の(b)のような週間天気予報表となる。
【0088】
更に、予想最低気温と予想最高気温に関しては、語分解し、変数単位に変数名の語尾の語と語頭の語が同じかどうかチェックし、語尾の語のみが同じか、語尾の語と語頭の語が同じ場合は、共通項目とみなし、共通項目名として取り出すことも可能である。例えば、語頭の語の「予想」と語尾の語の「気温」が同じなので、予想気温を共通語としてとりだし、各データの項目名はそれぞれ「最低」、「最高」とする。
【0089】
以上のようにして、表データを作成し、表示する際には、表データを罫線をつけて表示する。罫線は、罫線を表す文字である書式形式文字を使ってもよいし、グラフィックによる罫線を使用してもよい。書式形式文字を用いる場合、各データの上下や左右に書式形式文字を入れる領域を確保しておくことにより、項目名やデータをテーブルに埋め込む際に、適切な書式形式文字を埋め込むと、そのまま画面に表示することが出来る。
【0090】
本実施の形態により、定型データを音声だけでなく、表示装置に出力出来る場合は、必要な情報を音声で聞くことも出来るし、画面上で目で確認することも出来るようになり、目で確認出来る場合は、より早く、必要な情報を取得出来るようになる。例えば、カーナビゲーションの場合は、車で走行中は画面を注視すると危険なので音声で聞き、信号等で停止している時等は画面を見る事により、耳で聞くより早く情報を取得出来るようになる。
【0091】
【実施の形態6】
次に、表を含む文章を入力にして、表で表された定型データを読み上げる実施の形態について、図10を用いて説明する。
【0092】
文章中にある表のデータ部分を音声で読み上げる装置に関しては、「文書読み上げ装置(特開平5−46607)」で開示されている。該文書読み上げ装置においては、罫線を罫線素片(書式形式文字に相当)をチェックして表を検出し、罫線情報から表上のデータ位置を算出し、項目名とデータを取り出し、必要に応じて、利用者と対話して表読み上げ情報を指定することにより、必要な情報のみを読み上げることが出来る。読み上げ方は、項目名を銘柄、データをA社とすると、単純に「銘柄、A社」と読み上げるだけである。
【0093】
本実施の形態で表部分を判別する文章・表判別部12の機能は、書式形式文字を検出して表を判別することであるが、前記文書読み上げ装置の発明の文書と表の分類機能と同様なので、詳細な説明は省略する。表構造解析部13は、各データが表の何バイト目から何バイトにあるか解析し、項目名とデータを取り出す。ここまでは、前記文書読み上げ装置の機能と同様である。前記文書読み上げ装置では、例えば、図9の(a)のような表があると、「地区名、神奈川県東部。月日、2月1日。天気、晴れ後曇り。降水確率1、0。降水確率2、10。降水確率3、30。降水確率4、30。予想最低気温、0。予想最高気温、10。地区名、神奈川県東部。月日、2月2日。天気、晴れ。・・・・」のように読み上げる。前記文書読み上げ装置においては、表読み上げ情報を指定することにより、降水確率1〜4に%をつけたり、予想最低気温・予想最高気温に度をつけたり、必要な情報のみを読み上げることは可能である。しかし、データの重複をチェックして、読み上げ方を変えることは出来ない。また、図9の(b)のように項目名の欄が複数行にまたがっている場合や、詳細な項目をまとめる大きな項目がある場合や、地区名や月日のように、表を見やすくするためにデータが省略されている場合には対応出来ない。
【0094】
本実施の形態では、表構造解析部13は、さらに、図9の(b)のような表の項目名を取り出す機能や、データが省略されている部分を補う機能や、表の書き方から重複チェックの仕方や重複チェックすべき項目を洗い出し、自動的に、定型データと文例をつくり出す機能を持つ。
【0095】
まず、項目名の取り出しであるが、図9の(b)のような表があった場合、表の1番上の欄の内、最も大きい行数の欄をチェックする。ここでは、地区名・月日・天気が3行にまたがっているので、表の上3行分を項目名とみなす。地区名・月日・天気予想最低気温・予想最高気温に関しては、その欄の3行分のデータを連続する1つのデータとして取り出し、空白を前詰めにすることにより、項目名となる「地区名」・「月日」・「天気」・「天気予想最低気温」・「予想最高気温」を取り出す。項目名「天気」の間にも空白があるが、これは、中間表記に変換する際に問題となるので、詰めるようにする。
【0096】
「降水確率」の欄に関しては、「降水確率」が1つの欄で、その下に4つの欄が設けられていることから、「降水確率」は、下の4つの項目をまとめる言葉と判断出来、4つの項目は同類のデータであり、重複チェック可能だと判断する。これにより、重複チェックをまとめた文例を作成することと、重複チェックフラグをたてた定型データを生成することが可能となる。降水確率を表す4つの項目名に関しては、文例を作成する際には、「〜」を「から」に変換して文例の固定文字を生成するようにする。
【0097】
次に、定型データを見ていくと、地区名のデータに関しては、データをチェックすると2件目以降が省略されているので、地区名が定型データ間にまたがる重複チェックが可能とみなすことが出来る。月日のデータに関しては、2件目以降のデータの2月が省略されているが、月日等の項目は一般的によく使用されるので、表構造解析部13の内部に、省略されている「2月」を復元するような処理を、汎用的に組み込んでおくことが望ましい。
【0098】
また、降水確率や予想気温の%や度等の単位は、定型データのデータ量を減らすために、文例として外出しにするとよい。このようにして、データを復元・生成して、重複フラグを設定すると、図9の(b)の表は、図7の(a)のデータに変換することが可能である。
【0099】
このようにして、取り出した項目名や外出しにした単位をもとに、最小限の助詞等を補って文例を作成すると、「地区名は、≪地区名≫。月日は、≪月日≫。天気は、≪天気≫。降水確率、0時から6時は、≪0時〜6時≫%、6時から12時は、≪6時〜12時≫%、12時から18時は、≪12時〜18時≫%、18時から24時は、≪18時〜24時≫%。予想最低気温は、≪予想最低気温≫度。予想最高気温は、≪予想最高気温≫度。」を最も基本的な文例として、降水確率をまとめたり、地区名を省略したりして、16通りの文例を作成することが出来る。
【0100】
これ以降の工程については、文書の中の文章の部分が、文書・表判別部12から文章解析部3に渡されること以外は、実施の形態1と同様であるので説明を省略する。
【0101】
本実施の形態により、文書中に存在する表の部分も、表から文例や定型データを生成し、表データをいろいろな文章にして読み上げることが可能になるため、聴取者は、飽きることなく、表の情報を聞くことが出来ると同時に、情報を短縮して聞くことも可能となる。
【0102】
次に、本発明の実施の形態1乃至6にかかるデータ読み上げ装置を実現するプログラムを記載した記録媒体は、図11に示す記録媒体の例のように、CD−ROM15−1やフロッピーディスク15−2等の可搬型記録媒体15だけでなく、通信回線の先に蓄えられた他の記憶装置14や、コンピュータのハードディスクやRAM等の記録媒体17のいずれでも良く,本発明にかかる定型データ読み上げ装置を利用する際に、コンピュータ16により読み込まれる。
【0103】
【発明の効果】
本発明のデータ読み上げ装置によれば、表等で表された定型データを読み上げる際に、同じ形式の文章を繰り返し読み上げるのではなく、定型データ毎に異なる文章で読み上げることや、重複するデータをまとめて読み上げることや、必要な情報だけ先に聞くことが可能となるため、聴取者は、飽きることなく、短時間で、必要な情報を聞くことが出来る。従って、車載情報サービス端末装置等に適用して利用者への音声情報を提供すると、極めて有効である。
【図面の簡単な説明】
【図1】 本発明の基本構成図
【図2】 本発明の基本的な処理の流れを示すフローチャート
【図3】 本発明の実施の形態1にかかるデータ読み上げ装置の構成図
【図4】 文例のデータ内容
【図5】 本発明の実施の形態2にかかるデータ読み上げ装置の構成図
【図6】 本発明の実施の形態2の処理の流れを示すフローチャート
【図7】 定型データの例
【図8】 本発明の実施の形態5にかかるデータ読み上げ装置の構成図
【図9】 週間天気予報表
【図10】 本発明の実施の形態5にかかるデータ読み上げ装置の構成図
【図11】 記憶媒体の例示図
【符号の説明】
1 文例選択部
1−1 定型データ格納部
1−2 文例格納部
2 文章合成部
3 文章解析部
3−1 形態素辞書
4 音声合成部
4−1 音声素片辞書
5 定型データ変換部
5−1 定型データ用形態素辞書
6 データ送信部
6−1 放送局側の定型データ格納部
6−2 放送局側の文例格納部
7 データ受信部
7−1 カーナビゲーション側の定型データ格納部
7−2 カーナビゲーション側の文例格納部
8 表示データ作成部
9 音声データ作成部
10 ディスプレイ等の表示装置
11 スピーカ等の音声出力装置
12 文章・表判別部
12−1 文章格納部
13 表構造解析部
14 通信回線の先に蓄えられた他の記憶装置
15 CD−ROMやフロッピーディスク等の可搬型記憶媒体
15−1 CD−ROM
15−2 フロッピーディスク
16 コンピュータ
17 コンピュータ上のRAM/ハードディスク等の記憶媒体
[0001]
BACKGROUND OF THE INVENTION
The present invention provides, for example, a data reading apparatus and fixed data for speech synthesis of a plurality of fixed data when there are a plurality of fixed data having a specific format composed of a plurality of data such as weekly weather forecast data. The present invention relates to a recording medium on which a computer program is read.
[0002]
[Prior art]
The conventional data reader reads out standard data, creates a sentence by embedding the standard data in a specific sentence example, converts it into an intermediate notation that expresses reading, accent, and intonation, synthesizes speech, and outputs it through a speaker, etc. It was something to do. In this case, since the sentence is created by embedding the fixed form data in the same sentence example, if there are several fixed form data, only the data part is different and the monotonous sentence is repeated. For this reason, if there are a lot of standard data, the listener is often frustrated or tired while listening, and it often takes a long time to obtain all necessary information.
[0003]
[Problems to be solved by the invention]
In recent years, the performance of CPUs of computers, the higher integration of memories, and the lowering of their costs have progressed rapidly, and computers with small size, high performance, and large capacity have become increasingly smaller. Therefore, it is possible to incorporate a voice synthesizer that requires a high-performance CPU and a large-capacity memory, and various devices that provide information by voice are rapidly spreading.
[0004]
With the rapid spread of devices incorporating a speech synthesizer, more people have more opportunities to receive information provided by speech synthesized speech. However, since it is necessary to convey information by voice in order one by one, the amount of information that can be received per unit time is very small compared to visual information. Therefore, even if the required information can be read with a glance, if it is received as audio information, it will take a long time to obtain the required information because the information will be read out in order by voice. .
[0005]
An example in which it appears most prominently is information represented by a table having a lot of fixed data. The information shown in the table can be seen in a short time when viewed with the eye, and it is easy to obtain only the necessary part of the information. If you are at the end of, you must endure listening to unnecessary information, and even if you need all the information, the same pattern sentences will be repeated many times, so the more information you have The listening time is long and the text is monotonous, so I'm tired of listening to it on the way.
[0006]
Services that provide information by voice were initially limited to devices such as telephones that have only a voice output device, but recently, even if they have a display screen such as a display, such as car navigation, Since it is dangerous to watch the screen while driving, there are an increasing number of devices that provide information not only on the screen but also by voice.
[0007]
In order to further spread the use of devices that provide speech information by speech synthesis, there is a demand for technical means for transmitting a number of standard data in a short time and without getting tired.
[0008]
[Means for Solving the Problems]
In the present invention, a plurality of standard data having a specific format composed of one or more data that can be represented in a table is not read repeatedly by repeating the same sentence, but the sentence is changed, and repeated parts can be omitted. This makes it possible to read out information by voice without getting bored in a shorter time by omitting such parts or changing the data order.
[0009]
A data reading device according to the present invention is a position for embedding each data in the fixed data in the data reading device that synthesizes a sentence based on fixed data having a specific format composed of one or more data and outputs the sound. Including The content of the fixed character part of the text is different A sentence example storage unit for storing a plurality of sentence examples, and reading the fixed form data, Read Example sentences to be embedded for each fixed form data In the prescribed way Each of the data in the standard data is embedded in a predetermined position, and a text synthesizing unit is provided for synthesizing the text.
[0010]
With such a configuration, it is possible to listen to voice information without getting tired because information can be heard by voice output of different sentences for each fixed data, instead of repeating the same sentence only by changing the data portion as in the conventional case.
[0011]
Further, the data reading apparatus according to the present invention is a data reading apparatus for synthesizing sentences based on fixed data having a specific format composed of one or more data and outputting the sound, and a fixed data storage for storing a plurality of the fixed data Part and a position for embedding each data in the standard data The content of the fixed character part of the text is different From the sentence example storage unit for storing a plurality of sentence examples, and the sentence example storage unit, Read Example sentences to be embedded for each fixed form data In the prescribed way A sentence example selection unit that selects and, based on the fixed form data and the selected sentence example, embeds each data in the fixed form data at a predetermined position of the selected sentence example, and combines a document, A sentence analysis unit that analyzes the synthesized document and converts it into an intermediate notation for expressing speech, and a speech synthesis unit that synthesizes and outputs speech based on the intermediate notation, respectively. .
[0012]
With such a configuration, it is possible to listen to voice information without getting tired because information can be heard by voice output with different sentences for each fixed data, instead of repeating the same sentence only by changing the data part as in the prior art.
[0013]
Further, the data reading apparatus according to the present invention is a data reading apparatus for synthesizing sentences based on fixed data having a specific format composed of one or more data and outputting the sound, and a fixed data storage for storing a plurality of the fixed data Part and a position for embedding each data in the standard data The content of the fixed character part of the text is different A sentence example storage unit that stores a plurality of sentence examples in an intermediate notation format for expressing speech, and the sentence example storage unit, Read Example sentences to be embedded for each fixed form data In the prescribed way Based on the selected sentence example selection part, the fixed form data conversion part for converting each data in the fixed form data into an intermediate notation, each data in the converted fixed form data and the selected sentence example, the fixed form data Each of the data is embedded in a predetermined position of the selected sentence example, and a sentence synthesizing unit for synthesizing a document and a voice synthesizing unit for synthesizing and outputting speech based on the synthesized sentence are provided. .
[0014]
With this configuration, since the sentence example is in the intermediate notation from the beginning, when reading the fixed form data, it is only necessary to convert the fixed form data into the intermediate notation, which eliminates the need for parsing and makes it easy to change to the intermediate notation. Therefore, the processing speed can be improved.
[0015]
Also, the data reading apparatus according to the present invention includes a duplication check flag indicating whether or not each piece of the standard data performs a duplication check, and the sentence example storage unit collectively represents the duplication portion of the standard data. A sentence example is stored, and the sentence example selection unit has a function of checking a duplicate part of the fixed form data based on the duplication check flag and selecting a sentence example for collecting the corresponding duplicate parts.
[0016]
With this configuration, if there is the same data of the same type in the standard data, you can create a sentence by grouping them together, so you can shorten the sentence and at the same time change the sentence without getting bored. , Listen to audio information in a shorter time.
[0017]
Further, the data reading apparatus according to the present invention includes a data set flag in which each data of the fixed form data indicates a set of data to be read out together in the fixed form data, and the example storage unit stores the data set in a data set unit. A plurality of sentence examples including only the above data are stored, and the preceding sentence example selection unit has a function of reading all fixed form data at once and selecting a corresponding sentence example for a specified data set unit.
[0018]
With this configuration, it is possible to first output high-priority data in a plurality of fixed data in a voice and then output the subsequent data as detailed data. If you don't need it later, you can listen to it later.
[0019]
Further, a computer-readable recording medium recording a program to be executed by a computer according to the present invention includes a step of synthesizing a sentence based on fixed data having a specific format composed of one or more data, and outputting the sentence as a voice A computer-readable recording medium storing a program for causing a computer to execute the step of including a position for embedding each data in the standard data The content of the fixed character part of the text is different Storing a plurality of sentence examples; reading the fixed form data; Read Example sentences to be embedded for each fixed form data In the prescribed way It is a computer-readable recording medium on which a program for causing a computer to execute a step of selecting and changing, embedding each data in the fixed form data at a predetermined position, and synthesizing a sentence.
[0020]
This configuration realizes a data reading device that allows users to listen to voice information without getting bored because they can listen to information by voice output with different sentences for each standard data, instead of repeating the same sentence just by changing the data part as before. I can do it.
[0021]
Further, a computer-readable recording medium recording a program to be executed by a computer according to the present invention includes a step of synthesizing a sentence based on fixed data having a specific format composed of one or more data, and outputting the sentence as a voice A computer-readable recording medium storing a program for causing a computer to execute the step of storing, a step of storing a plurality of the fixed data, and a position for embedding each data in the fixed data The content of the fixed character part of the text is different From the step of storing a plurality of sentence examples and the stored sentence examples, Read Example sentences to be embedded for each fixed form data In the prescribed way A step of selecting, a step of embedding each data in the fixed form data in a predetermined position of the selected sentence example based on the fixed form data and the selected sentence example, and a step of combining the document A computer-readable recording medium having recorded thereon a program for causing a computer to analyze a document and convert it into an intermediate notation for expressing speech and to synthesize and output speech based on the intermediate notation It is characterized by being.
[0022]
This configuration realizes a data reading device that allows users to listen to voice information without getting bored because they can listen to information by voice output with different sentences for each standard data, instead of repeating the same sentence just by changing the data part as before. I can do it.
[0023]
DETAILED DESCRIPTION OF THE INVENTION
The principle and basic operation flow of the present invention will be described with reference to the basic configuration diagram of the present invention in FIG. 1 and the flowchart showing the basic processing flow in FIG.
[0024]
First, the sentence example selection unit 1 inputs fixed form data from the fixed form data storage unit 1-1 (step S1), and when the fixed form data is not finished (step S2: NO), the predetermined selection method determined in advance is used. A sentence example is selected (step S3). If the standard data is finished (step S2: YES), the process is finished.
[0025]
Standard data and sentence examples are usually created in advance by the data provider, so in the basic configuration diagram of FIG. 1, it is assumed that the input unit is not provided and is already registered. You may make it carry out by providing a part. Standard data and sentence examples can be entered using a normal editor. The steps up to this step are the feature of the present invention, and it is possible to read out different sentences using different sentence examples for each fixed data, without repeating the same data with the fixed data changing only the data part. As a result, the listener can listen to the reading information without getting bored.
[0026]
The subsequent steps are the same as those of the conventional text data speech-to-speech device, and the general example is taken. The present invention is not limited to this pattern. The mechanism may be used. The text synthesizing unit 2 receives the standard data and the text example, and synthesizes the text by incorporating the standard data into the text example (step S4). When the sentence analysis unit 3 receives the synthesized sentence, the sentence analysis unit 3 performs morpheme analysis / syntax analysis of the sentence using the morpheme dictionary 3-1, and converts the sentence into an intermediate notation representing speech (step S5). The speech synthesizer 4 receives the intermediate notation, synthesizes speech using the speech unit dictionary 4-1, and reads out the text as speech (step S6).
[0027]
Here is an example of what the intermediate notation is.
[0028]
For example, if the synthesized text is "The weather on July 13 in eastern Kanagawa will be sunny and cloudy. The probability of rain from 0:00 to 6:00 will be 20%.""Kanagawa Ken Ken Tobuno, Shigiga Juice Nichino Tenkiwa, Hare Nochi Kumori Desho. And so on. Katakana expresses readings, "'" and "_" indicate accent information, and "," indicates that a pose is taken. The intermediate notation given here is merely an example, and a notation different from the notation used here may be used.
[0029]
Embodiment 1
An example will be described in which a plurality of sentence examples having different sentence contents are prepared, a sentence example is selected for each fixed form data, and is read out by voice. Since the present embodiment is the same as the basic configuration diagram of FIG. 1, the detailed description of each function part will be omitted, and the detailed function of the sentence example selection unit 1 will be described.
[0030]
In the sentence example storage unit 1-2, a plurality of sentence examples are stored in a form in which the contents of the fixed character portion of the sentence are different in a state where all the data of the fixed form data can be embedded. There can be a plurality of methods for specifying where each data of the fixed form data is embedded in the sentence example. Some of the examples are given as weather data in which the fixed form data includes the district name, the date and the weather.
[0031]
First, in the first pattern of the data specifying method in the sentence example, the contents of the sentence example are set to “<< 1 >><< 2 >> weather will be << 3 >>." The number between the symbols << and >> indicates what number of standard data is to be inserted. That is, << 1 >> represents the district name as the first data, << 2 >> represents the date as the second data, and << 3 >> represents the weather as the third data. As a result, it is possible to know what position of the fixed form data should be put in which position in the sentence example, and not only a sentence example in which the fixed character part of the sentence example is changed while keeping the data order, but also a sentence example in which the data order is changed can be created. Because it becomes possible, it becomes possible to add many different variations to the document to be read, and it is possible to make the listener less tired.
[0032]
Next, as the second pattern of the data designation method in the sentence example, in the first pattern, it is difficult to know which data the numerical data indicates, and when it is corrected later, the data Add a comment that indicates what data the number represents rather than just a number, and say “<< 1: District Name >>'s<< 2: Monday & Sunday >> weather will be << 3: Weather >>." You can make it cheaper to understand what the variable is. Thereby, in addition to the advantage of a 1st pattern, the maintainability at the time of adding and correcting a sentence example can be made easy.
[0033]
Next, as a third pattern of the data specifying method in the sentence example, data in which data names to be applied in the order of the data of the fixed form data are prepared, and “<< district name >>, << month day >>, << weather >> In other words, it is possible to indicate what kind of variable each data of the standard data is assigned to. The symbols «and» indicating the variable may be omitted if the variable delimiter is known, and may be “district name, date, weather”. Data specifying the variable name to be assigned to each data of the fixed form data may be stored as the first fixed form data in the fixed form data storage unit 1-1 or the first case data in the sentence example storage part 1-2. It may be entered as sentence example data, or may be input as a parameter of the program of the sentence example selection unit 1. As a result, it is possible to directly specify in the sentence example by data name which data should be embedded. That is, when data specifying a variable name is entered as the first sentence example data in the sentence example storage unit 1-2, the sentence example selecting unit 1 reads the data specifying the variable name in the first case of the sentence example, and forms data The first data of can be recognized as the district name, the second data is the date of the month, and the third data is the weather, so in the example, without the number indicating the number of the data, Use the variable name specified in the first case of the sentence, such as “Weather will be the weather of“ Monday ”in“ Region Name ”. As a result, in the first case of the sentence example, if you specify only the variable name to be given to each data of the fixed form data, when making the sentence example, it is not necessary to be aware of what number of the fixed form data, the sentence example is more, You can add and modify in a natural way.
[0034]
In this example, the variable name is input as the first data of the sentence example, but this is to enable use as a general-purpose data reading device that changes the reading data. For example, the variable name used in the fixed data may be defined and held in the program.
[0035]
Using any of these sentence pattern patterns, not only the various sentence examples in which the parts other than the variables are changed, but also the order of the variables itself is arbitrary, so that it is possible to add various variations to the document to be read. Can make it harder to get bored.
[0036]
In addition, as the fourth pattern of the data specification method in the sentence example, the data of the standard data will be embedded in the sentence example in order from the front, and the weather of <<<<<< will be <<>>. The number or variable name indicating the data may be omitted and only the symbol indicating the position where the data is inserted may be used. However, this pattern cannot handle sentence examples in which the order of data is changed.
[0037]
In the case of the first and second patterns described above, the sentence example selection unit 1 prepares a data table (not shown) numbered in order from 1, reads the standard data, and stores each data in order. . In the case of the third pattern, the sentence example selection unit 1 adds the data name column of the two-dimensional data table (not shown) composed of the data name and data to the fixed data storage unit 1-1 or the example sentence storage unit 1-2. When the data that lists the first data name is read, or the parameters that represent the data are read, the data names are stored in order, and the standard data is read, each data is sequentially assigned to the corresponding data name in the data table. Store in part. In the case of the fourth pattern, it is not necessary to create a data table. The fixed form data passed from the sentence selection unit 1 to the sentence composition unit 2 is passed in the form of a data table in the case of the first to third patterns, and is passed in the form of the fixed form data in the case of the fourth pattern. It is.
[0038]
Next, the sentence example storage unit 1 selects a sentence example from among a plurality of sentence examples for each fixed form data, and there are several possible methods, and examples of the method are given below. In the present embodiment, it is assumed that the sentence example storage unit 1-2 stores sentence examples that are gradually simplified in order from the most polite sentence example.
[0039]
The first method is a method of using the first sentence example to the last sentence example repeatedly and repeatedly. This method reads sentence examples and standard data in order from the beginning, and uses both data as they are. If the number of fixed form data is larger than that of the sentence example, after reading the last sentence example, it returns to the beginning of the sentence example and reads it. In this way, the sample sentences are read while being cycled until there is no fixed data. This makes it easy to avoid using the same sentence example continuously.
[0040]
The second method is a method of obtaining the number of sentence examples to be used by generating a positive integer pseudo random number equal to or less than the number of sentence examples. At this time, the random number of past times is stored, and when the same random number as the stored random number is generated, the same sentence example is continued by recalculating the random number until an unstored random number appears. It may not be used or repeated at short intervals. When the third pattern of the data designation method in the above sentence example is used and data in which the data names are listed is stored in the sentence example storage unit 1-2, the first data in the sentence example is a list of data names. Since it is not a sentence example, the sentence example to be used by generating a positive integer pseudo-random number of the number -1 in the sentence example uses the pseudo-random number plus the first sentence example. In the first method, the same sentence example is repeated at regular intervals, so if you listen to it many times, you can predict the next sentence example, or the most polite sentence example comes after the most simplified sentence example, This method makes it impossible to predict which sentence will come next.
[0041]
The third method is a method in which a predetermined first few sentence examples are used only once, and subsequent repeated sentence examples are read out using the first method or the second method. The first few sentence examples use sentence examples using polite expressions, and thereafter, sentence examples with simplified expressions are stored. In order to indicate the number of polite sentence examples at the beginning and the simplified example sentences to be repeated, information on how many polite sentence examples are set in the program of the sentence example selection unit 1 in advance. However, in order to make it universal, it is preferable to provide a flag indicating whether or not the sentence example is repeated at the head of each sentence example. An example of a sentence example is shown in FIG. In this example, the first and second sentence examples are used only once, and the third and fourth sentence examples are repeated. For the listener, it is preferable that the sentence to be heard is initially polite and simplified gradually. However, the first method may return from a simplified expression to a polite expression when repeated, and the second method suddenly starts with a simplified expression or a polite expression from a simplified expression. However, such a problem can be avoided by this method.
[0042]
The sentence selection unit 1 in the case where there is a sentence example as shown in FIG. 4A, using the first pattern as the data designating method in the sentence example, using the third pattern using the pseudo-random number as the sentence selecting method. The process flow (corresponding to steps S1 to S3 in FIG. 2) will be described with reference to the flowchart in FIG.
[0043]
The sentence example selection unit 1 reads a sentence example (step S11), determines whether a flag indicating whether the sentence example is to be repeatedly used is set for the sentence example (step S12), and if the repetition flag is not set (step S12). S12: NO) reads the fixed form data (step S13), and if the fixed form data is not finished (step S14: NO), the sentence example and the fixed form data are transferred to the sentence composition unit (step S15). Since the sentence example in which the repetition flag is not set is used only once, the process returns to step S11 to read the next sentence example. If the standard data is finished (step S14: YES), the program is finished.
[0044]
When the repetition flag of the sentence example is set (step S12: YES), the sentence example is stored in the table, and the number of sentence examples is counted (step S16). Then, the next sentence example is read (step S17). In order to read all the sentence examples in which the repetition flag is set, when the sentence examples are not completed (step S18: NO), the process returns to step S16 and repeats until the sentence examples are completed.
[0045]
When the example sentence to be used repeatedly is stored in the table, the fixed form data is read (step S19). When the fixed form data is not finished (step S20: NO), a positive integer pseudo-random number equal to or less than the count of the example sentence stored in the table is stored. It is generated and a sentence example to be used is selected (step S21). The read fixed form data and the selected sentence example are passed to the text synthesis unit 2 (step S22), and the process returns to step S19 to read the next fixed form data. When the standard data is finished (step S20: YES), the program is finished.
[0046]
Embodiment 2
Next, an embodiment in which a sentence example is stored in the form of intermediate notation and only the fixed form data is converted into the intermediate notation to eliminate the need for sentence analysis will be described with reference to FIG. The description of the same parts as in FIG. 1 will be omitted as appropriate.
[0047]
In this embodiment, the sentence example selection unit 1 reads the fixed form data, performs duplication check, etc., and selects the sentence example, and then the sentence example is in an intermediate notation. The data is transferred to the fixed data conversion unit 5. The fixed data conversion unit 5 converts each data of the received fixed data into an intermediate notation by using the fixed data morpheme dictionary 5-1, and passes it to the text synthesis unit 2. The sentence synthesizing unit 2 synthesizes the intermediate notation sentence from the received intermediate notation sentence example and the fixed form data, passes it to the voice synthesizing unit 4 and reads it out as voice information.
[0048]
The morpheme dictionary for fixed data is a subset of the morpheme dictionary 3-1, and it is only necessary to store intermediate notation of only the morphemes included in the fixed data. However, if there is no problem in the capacity of the hard disk, there is no problem even if the morpheme dictionary 3-1 is used.
[0049]
Regarding the data names in the sentence examples, the symbols «and» indicating that they are variable names may be left in the intermediate notation, but in order to make the variable names easier to understand, it is preferable not to use the intermediate notation. .
[0050]
According to this embodiment, since it is necessary to store the sentence example in the intermediate notation, it is more troublesome to input the sentence example directly in the intermediate notation than to input a normal sentence. In that case, a normal sentence may be input first, the process corresponding to the sentence analysis unit 3 described in Embodiment 1 may be executed, and a sentence example of intermediate notation may be created in advance. In addition, it is conceivable that the fixed form data is set to an intermediate notation from the beginning. In that case, the fixed data converter 5 shown in FIG. 5 is not necessary.
[0051]
The flow of processing in the present embodiment will be described using the flowchart of FIG.
[0052]
When the fixed form data is input from the fixed form data storage unit 1-1 (step S31) and the fixed form data is not completed (step S32: NO), the sentence example is selected from the sentence example storage unit 1-2 by a predetermined method (step S33). To do. If the standard data is complete (step S32: YES), the process is terminated. The fixed form data is transferred to the fixed form data conversion unit 5 and converted into intermediate notation (step S34). Both the sentence example and the fixed form data are passed to the sentence synthesizing unit 3 in an intermediate notation format, and the sentence is synthesized (step S35). Based on the synthesized text, the speech synthesizer synthesizes speech and reads the text (step S36).
[0053]
As described above, according to the present embodiment, since the sentence example has an intermediate notation from the beginning, it is only necessary to convert the data to the intermediate notation when reading the fixed form data. This eliminates the need for a program for sentence analysis, and only requires data for standard data to be prepared in the morpheme dictionary. This makes it easy to change to intermediate notation, requiring less memory and storage capacity, and processing Speed can be improved.
[0054]
Embodiment 3
Next, an embodiment that reads out overlapping portions of the standard data collectively will be described with reference to FIG. 1 because the configuration diagram is the same as that of the first embodiment. Explanation of overlapping parts will be omitted as appropriate.
[0055]
In the present embodiment, it is premised that there is duplicate data that can be expressed together in fixed data. For example, taking the weekly weather forecast as an example, the typical data consists of the following data: district name, date, weather, precipitation probability 1, precipitation probability 2, precipitation probability 3, precipitation probability 4, predicted minimum temperature, predicted maximum temperature The precipitation probabilities 1 to 4 are the precipitation probabilities from 0 to 6 o'clock, precipitation probabilities from 6 o'clock to 12 o'clock, precipitation probabilities from 12 o'clock to 18 o'clock, and precipitation probabilities from 18 o'clock to 24 o'clock, respectively. It shall represent. In the case of this data, regarding the precipitation probabilities 1 to 4, if the same precipitation probabilities continue, the portions can be expressed together. For example, “The weather of << 1 >><< 2 >> is << 3 >>, the probability of precipitation from 0 o'clock to 6 o'clock is << 4 >>, from 6 o'clock to 12 o'clock is << 5 >>, from 12 o'clock to 18 o'clock is << 6 ”,« 7 »from 18:00 to 24:00, the expected minimum temperature is« 8 », and the predicted maximum temperature is« 9 »." The probability of precipitation from «4» to «7» Furthermore, since the following seven sentence examples can be considered according to the data duplication method, a total of eight sentence examples can be created.
▲ 1 ▼ The weather of << 1 >><< 2 >> is << 3 >>, the probability of precipitation from 0:00 to 12:00 is << 4 >>, from 12:00 to 18:00 << 6 >>, from 18:00 to 24:00 << 7 >>
The expected minimum temperature is «8» and the expected maximum temperature is «9».
▲ 2 ▼ The weather of << 1 >><< 2 >> is << 3 >>, the probability of precipitation from 0am to 6am is << 4 >>, from 6am to 6pm is << 5 >>, from 18:00 to 24:00 is << 7 >>
The expected minimum temperature is «8» and the expected maximum temperature is «9».
▲ 3 ▼ The weather of << 1 >><< 2 >> is << 3 >>, the probability of precipitation from 0:00 to 6:00 is «4», from 6:00 to 12:00 «5», from 12:00 to 24:00 « 6 >>
The expected minimum temperature is «8» and the expected maximum temperature is «9».
▲ 4 ▼ The weather of << 1 >><< 2 >> is << 3 >>, the precipitation probability from 0:00 to 12:00 is << 4 >>, from 12:00 to 24:00 is << 6 >>,
The expected minimum temperature is «8» and the expected maximum temperature is «9».
▲ 5 ▼ The weather of << 1 >><< 2 >> is << 3 >>, the precipitation probability from 0:00 to 18:00 is << 4 >>, from 18:00 to 24:00 is << 7 >>,
The expected minimum temperature is «8» and the expected maximum temperature is «9».
▲ 6 ▼ The weather of << 1 >><< 2 >> is << 3 >>, the probability of precipitation from 0 o'clock to 6 o'clock is << 4 >>, from 6 o'clock to 24 o'clock is << 5 >>,
The expected minimum temperature is «8» and the expected maximum temperature is «9».
▲ 7 ▼ The weather of << 1 >><< 2 >> is << 3 >>, the probability of precipitation from 0:00 to 24:00 is << 4 >>, the predicted minimum temperature is << 8 >>, and the predicted maximum temperature is << 9 >>.
[0056]
Although it is possible to omit the data as described above within one standard data, it is not necessary to limit the duplication check of data within one standard data, and a part common to a plurality of standard data is omitted. Is also possible. For example, in the case of the above-mentioned standard data for the weekly weather forecast, there is standard data from Sunday to Saturday. In this case, the district name << 1 >> is the same in any standard data, and it may be read out once at the beginning, and may be omitted at the second and subsequent readings. In other words, each sentence example in which the district name << 1 >> is omitted is added to the pattern of the above eight sentence examples, so that a total of 16 sentence examples can be created. In this case, since duplication of data is checked over a plurality of fixed data, the read fixed data must be stored in a memory or the like.
[0057]
Next, a method for checking duplicate data will be described. The problem with the checking method is how to determine which data and which data should be checked for duplication.
[0058]
As a first method for discriminating data to be checked for duplication, there is a method for checking duplication by simply determining whether or not each data of the fixed data is continuously the same. With this method, there is no need to instruct which data and which data should be checked, and it is only necessary to check whether or not the same data is continuous for all the data. In this case, if the same data continues, it must be premised that one of the duplicate data may be left unconditionally and omitted. That is, it is premised that there is no data that may be duplicated in the same format even though they are different types of data.
[0059]
Taking the example sentence described above as an example, an example of pattern data in question is given. The probability of precipitation from 18:00 to 24:00 is assumed to be 10% and the predicted minimum temperature is assumed to be 10 degrees. In the above sentence example,% and degree are not fixed characters in the sentence example and are included in the fixed form data, so it will not be duplicated. However, if% and degree are fixed characters, both are as data 10 and is regarded as duplicate data. As a means for avoiding this, it is possible to determine that omission is not possible by checking that there is no example sentence in which << 8 >> representing the lowest expected temperature is omitted in the example data. However, in this case, it can be avoided by this method, but it is not always possible to avoid in any case, so the data format of the different types of data is the same, so there is a possibility of misjudging that it is duplicated. It is necessary to create fixed data and sentence examples so that they are not arranged or arranged as examples.
[0060]
As another method for determining data to be checked for duplication, there is a method for designating data to be checked for duplication. As a specific designation method, there is a method of providing a duplication check flag for each data in the fixed form data, a separate file for duplication check instruction, or data for duplication check as a program parameter of the sentence example storage unit 1 There is a way to specify. As described above, the check includes the duplication check of data in one fixed data and the duplication check of data over a plurality of fixed data, and there are a plurality of data groups to be checked in the check in one fixed data. there's a possibility that. Therefore, it is necessary to set a flag in the data so that they can be distinguished.
[0061]
As an example of setting a flag for each data of regular data, in the above sentence example, the percentage of precipitation probability and the degree of expected temperature are fixed characters in the sentence example. Here is an example in which the distinction is not made. FIG. 7A shows an example in which a flag is set for each piece of regular data. The flag “*” in front of the district name indicates that if the data is duplicated across multiple regular data, it will be omitted for the second and subsequent times. The data of the precipitation probability 1 to 4 and the predicted minimum temperature and the predicted maximum temperature are numbers, and it cannot be determined unless the distinction of the data is instructed. The flags of the precipitation probabilities 1 to 4 are all set to 1, and indicate the same group of data that can be omitted in one regular data. When there are a plurality of groups that can be omitted in one regular data, different numbers or characters may be set for each group. The portion where the flag is blank is data that cannot be omitted.
[0062]
When not specifying the duplicate flag for each data in the fixed form data and specifying the data to be checked for duplication by storing it in a separate file or by specifying with a parameter, "* ,, 1, 1, 1" The duplication check instruction such as “, 1,...” Is input to specify what items should be checked for duplication.
[0063]
In this way, if data to be checked for duplication is specified, it becomes clear which duplication check should be performed for which data and which data, and duplication check can be executed without making a mistake.
[0064]
Once the duplication check has been completed and it is determined which data to omit, it is necessary to select a corresponding sentence example. The sentence example to be selected is determined by which data is omitted, but the target sentence example is not necessarily one. In that case, the sentence example to be used is determined from the sentence example to be used by the selection method used in the first embodiment. In the following, a method for identifying a sentence example after the data to be omitted is determined will be described.
[0065]
First, the first method for identifying a target sentence example is a method for reading all sentence examples every time the standard data is read, and for identifying all sentence examples not including a data name to be omitted in the sentence examples. This is the simplest method, but the most inefficient method, because it checks all the sentence examples every time the fixed form data is read and identifies the target sentence examples. However, if all the sentence examples are checked only once and a table is created that shows what data is omitted from the sentence example and the sentence example, the second and subsequent times will refer to this table. There is no need to repeatedly determine which data is omitted, and the sentence example itself is already stored in the table, so there is no need to read it from the sentence example storage unit 1-2 again, so that it can be processed efficiently. become.
[0066]
Next, the second method of identifying the target sentence example is to store an example sentence with an index indicating what data is omitted from the sentence example. This is a method of creating an index by omitting it and searching for an example sentence of interest. Here are some examples:
[0067]
For example, when the first data and the sixth data are omitted, the index calculation method is determined in advance so that the index is 16. Since there may be a plurality of target sentence examples, the sentence example is an indexed file having a duplicate key. Since there is a sentence example with a duplicate key, first, the value of 16 is positioned as the first sentence example of the target sentence example of the file containing the sentence example, and then reading is sequentially performed until the index is no longer the value of 16. Then, all the target sentence examples are identified. The index may not be an omitted data number, but may be a sentence number that is not omitted, an omitted data name, or the like, but the omitted data number is more preferable as an index because the index becomes shorter.
[0068]
When checking for duplication only within one standard data, it is only necessary to read the standard data one by one and process it, so the flowchart is the same as in FIG. 2, but checks for duplication of data across multiple standard data. In this case, if all the standard data is read at once so that it can be easily checked, the flow of processing changes, so the flowchart of FIG. 2 changes as follows. First, in order to read all the regular data, it is necessary to read all the standard data in step S1, store it in the memory, and move to step S3 when the standard data has been read. Therefore, while the reading of the standard data is not completed in step S2, the process returns from step S2 to step S1, and when the reading of the standard data is completed in step S2, the process proceeds to step S3. From step S4 to step S6, all the read standard data is collectively processed, and when the process of step S6 is completed, the entire process is completed.
[0069]
As described above, according to the present embodiment, not only a sentence example in which a fixed character is simplified can be created, but also a sentence example in which the duplicated data itself is omitted can be created. Can be realized.
[0070]
Embodiment 4
Next, FIG. 1 is a configuration diagram of the first embodiment regarding an embodiment in which information that is desired to be quickly obtained, important information, etc. are first read out collectively instead of reading out sentences in fixed data units. Will be described. Description of the same parts as those in Embodiment 1 is omitted as appropriate.
[0071]
In the present embodiment, each data of the fixed data stored in the fixed data storage unit 1-1 is provided with a flag indicating which data is regarded as a data set, as shown in FIG. 7B. Yes. In this example, the fixed form data is divided into two data sets. The first data set is a set of data in which “*” or “#” is specified as a flag, and the other data set is a set of data for which no flag is set. Data for which the flag “*” is set indicates data of a data set to be read out only at the first time. The data for which the flag “#” is set is one of the data of the data set to be read out first, but indicates that it belongs not only to the first data set but also to the other set data. . That is, it represents common data that is read out both when the first data set is read out and when another data set is read out.
[0072]
Assume that the sentence example as shown in FIG. 4B is stored in the sentence example storage unit 1-2, and when reading the first three cases of the standard data in FIG. 7B,
“The weather on February 1 in eastern Kanagawa Prefecture is cloudy after clear. It is sunny on February 2. It is sunny and rainy on February 3.
Precipitation probability on February 1, 0% from 0:00 to 6:00, 10% from 6:00 to 12:00, 30% from 12:00 to 18:00, 30% from 18:00 to 24:00,
The expected minimum temperature is 0 degrees and the expected maximum temperature is 10 degrees.
Precipitation probability on February 2, 0% from 0:00 to 6:00, 0% from 6:00 to 12:00, 0% from 12:00 to 18:00, 0% from 18:00 to 24:00,
The expected minimum temperature is 0 degrees and the expected maximum temperature is 10 degrees.
Precipitation probability on February 3, 10% from 0:00 to 6:00, 10% from 6:00 to 12:00, 60% from 12:00 to 18:00, 60% from 18:00 to 24:00,
The expected minimum temperature is 0 degrees and the expected maximum temperature is 10 degrees. "
[0073]
In this embodiment, which data of the standard data is collected is provided by providing a flag for each data, but this can be stored in a separate file or specified by a program parameter of the sentence selection unit 1 Also good. To stop specifying the standard data flag in (b) of Fig. 7 and specify only the flag in a separate file or parameter, for example, specify as "*, #, * ,,,,," To do. This may be shortened to “*, #, *”.
[0074]
When the functions of the third embodiment are combined with the present embodiment, a flag indicating a set of data may overlap with a flag indicating data to be checked for duplication, so it is necessary to have a separate flag for each data. Therefore, the standard data is as shown in FIG. When a sentence example that collectively expresses the precipitation probability portion of the third sentence example in FIG. 4B is added and the first three cases in FIG. 7C are read out, the result is as follows.
“The weather on February 1 in eastern Kanagawa Prefecture is cloudy after clear. It is sunny on February 2. It is sunny and rainy on February 3.
Precipitation probability on February 1, 0% from 0:00 to 6:00, 10% from 6:00 to 12:00, 30% from 12:00 to 24:00, the predicted minimum temperature is 0 degrees, and the predicted maximum temperature is 10 It will be degrees.
The probability of precipitation on February 2 is 0% from midnight to 24:00, the expected minimum temperature is 0 degrees, and the predicted maximum temperature is 10 degrees.
The probability of precipitation on February 3 is 10% from 0:00 to 12:00, 60% from 12:00 to 24:00, the expected minimum temperature is 0 degrees, and the predicted maximum temperature is 10 degrees. "
In this way, the sentence can be further shortened.
[0075]
According to this embodiment, it is possible to first output high-importance data in a plurality of fixed data in a voice and then output the subsequent data as detailed data, so that only necessary information can be output. You can listen first, and later information if you don't need it.
[0076]
As another method, there is a method of having a flag in a sentence example instead of having a flag in fixed form data. When this method is used to combine the sentence example designation method of the first embodiment as shown in FIG. 4A, for example, the sentence example shown in FIG. First, a flag of 1 is set in the sentence example used to read out the first data set, and a flag of 2 is set in the sentence example used to read out the second data set. Specify 2 in the second byte of the second flag so that there are 2 sentence examples with a flag of 1 and the first sentence example is used only once and the second sentence example is used repeatedly. . And it reads out about all the regular data using the sentence example for each flag. If this method is used, it is possible to group data by checking data used in a sentence example without setting a flag for each data and grouping.
[0077]
In the method of flagging data or specifying a set of data with separate files or parameters, the data to be used across multiple data sets must be specified as long as it is not essential data for all data sets. Although it is difficult to set a flag, in the case of a method of grouping data in a sentence example, it is specified because the data set is specified by the data used in the sentence example without specifying the data set. Is very easy.
[0078]
[Embodiment 5]
Next, based on the standard data and sentence examples, not only reading the data, but also creating a table and displaying it on the display device, so that information can be obtained not only by hearing but also by looking The embodiment will be described with reference to the configuration diagram of FIG. 8, taking a car navigation used as an in-vehicle information service terminal as an example.
[0079]
In the present embodiment, it is assumed that the standard data is the weekly weather forecast data, and the standard data and the sentence example are transmitted in the form of a character broadcast transmitted by FM broadcasting from the broadcasting station. In addition, a case where road traffic information and weather forecast data for each region are received from a special service station as part of a so-called ITS system is included.
[0080]
The broadcast station broadcasts the fixed form data and the sentence example by FM radio waves by using the data transmission part 6 as input to the fixed form data storage part 6-1 and the sentence example storage part 6-2 in the broadcast station. In car navigation, the standard data and the example sentence are received by the data receiving unit 7 and stored in the standard data storage unit 7-1 and the example sentence storage unit 7-2 on the car navigation side. The display data creation unit 8 obtains standard data and sentence examples from the standard data storage part 12-1 and the sentence example storage part 12-2, creates table data, and displays the table data on the display device 15 such as a display. The configuration of the voice data creation unit 9 is the same as the configuration diagram of the embodiment described above, in which the standard data storage unit 1-1 is in the standard data storage unit 7-1 and the sentence example storage unit 1-2 is in the sentence example storage unit 7-2. Since the replacement is the same as that except that the sound output unit 11 such as a speaker is used as a sound output part, the description is omitted.
[0081]
An example of how the display data creation unit 8 creates the table data will be described below.
[0082]
When generating table data, the first sentence example that expresses the most politely is used as input data, and variables are used not by numbers but by variable names. The typical data is (c) in Fig. 7, and the example sentence is "The weather of << Month day >> of << District name >> will be << Weather >>. Precipitation probability from 0:00 to 6:00 is << Precipitation probability 1 >>% Precipitation probability from 6 o'clock to 12 o'clock will be << precipitation probability 2 >>% Precipitation probability from 12 o'clock to 18 o'clock will be << precipitation probability 3 >>% Precipitation probability from 18 o'clock to 24 o'clock Will be «Precipitation probability 4». Expected minimum temperature will be «Expected minimum temperature» degrees. Expected maximum temperature will be «Expected maximum temperature» degrees. "
[0083]
First, a two-dimensional table having the same format as the table is provided on the memory. Since it is necessary to put an item name for indicating what data is at the top of the table, one line is left in order to put the item name at the top of the table of the two-dimensional table. Next, a variable name indicating what data each column of the table is is acquired as an item name from the sentence example. In the case of the above sentence example, the item name is the district name, month, day, weather, precipitation probability 1, precipitation probability 2, precipitation probability 3, precipitation probability 4, predicted minimum temperature, and predicted maximum temperature. All that remains is to read the standard data and store it in the table in order. When the variable name is simply used as an item name representing each data, the weekly weather forecast table as shown in FIG.
[0084]
Here, in order to make the table easier to see, functions are added next. Since the district name in FIG. 7A is data for performing a duplicate check across a plurality of fixed data, the district names after the first are omitted. As for the month and day, the month and day are disassembled.
[0085]
Next, it is understood that the precipitation probabilities 1 to 4 in the standard data are data for performing a duplication check in the standard data as shown in FIG. In other words, the duplication check means that the same type of data means that when the fixed character immediately before the variable in the sentence example is checked, the fixed character immediately before the precipitation probability 1 to 4 is “0 o'clock”. The probability of precipitation from 18:00 to 16:00 "," The probability of precipitation from 6:00 to 12:00 "," The probability of precipitation from 12:00 to 18:00 ", and" The probability of precipitation from 18:00 to 24:00 " . If you remove the particle “ha” from each fixed character, you can see that it consists of the word “probability of precipitation” and a word that modifies it. Therefore, it is determined that the “precipitation probability” is a word that summarizes the precipitation probabilities 1 to 4 as data. For the item name “Precipitation Probability”, the word “Precipitation Probability”, which is a common part, may be extracted from the precipitation probabilities 1 to 4 which are variable names in the sentence examples.
[0086]
Since it is the part that modifies the variable name in the sentence example that distinguishes the precipitation probabilities 1-4, the precipitation probabilities 1-4 are “from 0:00 to 6:00” and “6”, respectively, excluding the particle. "From 12:00 to 12:00", "12:00 to 18:00", and "18:00 to 24:00", which are regarded as words that distinguish the precipitation probabilities 1 to 4. If it is used as an item name in the table as it is, it is long, so “to” and “to” are converted to “to”, and in order to match the length of each item, a two-digit number is converted to half-width. The precipitation probabilities 1 to 4 are data to be checked for duplication within one standard data, but are numbers and are not preferable to omit when making a table. In this case, the area for entering the item name is the top two rows of the table.
[0087]
For each data, the regular data is not displayed as it is, but the word immediately after the variable name in the sentence example is checked, and the word immediately after the variable name is a word indicating a unit such as “%” or “degree”. In some cases, the table is included in the table for easy understanding. Regarding the number of digits of each data, the maximum data length of the corresponding data and the length of the item name are checked, and the longer one is selected. The item name is centered so that it is in the middle of the number of digits. For numbers, right justify. In this way, when the item name and fixed form data are edited or the table is formed by positioning, a weekly weather forecast table as shown in FIG. 9B is obtained.
[0088]
Furthermore, the predicted minimum temperature and the predicted maximum temperature are decomposed into words, and the variable name is checked to see if the word at the end of the variable name and the word at the beginning of the variable are the same. If the words are the same, they are regarded as common items and can be extracted as common item names. For example, since the first word “expected” and the last word “temperature” are the same, the predicted temperature is taken as a common word, and the item names of each data are “lowest” and “highest”, respectively.
[0089]
As described above, when creating and displaying table data, the table data is displayed with ruled lines. As the ruled line, a format-format character that is a character representing the ruled line may be used, or a graphic ruled line may be used. When using format format characters, secure areas for the format format characters at the top, bottom, left, and right of each data. Can be displayed.
[0090]
According to the present embodiment, when the standard data can be output not only to voice but also to the display device, necessary information can be heard by voice and can be confirmed visually on the screen. If it can be confirmed, necessary information can be acquired sooner. For example, in the case of car navigation, it is dangerous to watch the screen while driving in a car, so it is dangerous to listen to it by voice, and when you are stopped by a signal, etc. Become.
[0091]
Embodiment 6
Next, an embodiment in which a sentence including a table is input and the standard data represented in the table is read out will be described with reference to FIG.
[0092]
A device that reads out a data portion of a table in a sentence by voice is disclosed in "Document Reading Device (Japanese Patent Laid-Open No. 5-46607)". In the document reading apparatus, a ruled line is checked for a ruled line segment (corresponding to a format-format character), a table is detected, a data position on the table is calculated from the ruled line information, an item name and data are extracted, and if necessary Then, only necessary information can be read out by interacting with the user and specifying the table reading-out information. When the item name is the brand and the data is the company A, the reading method is simply to read “brand, company A”.
[0093]
The function of the text / table discriminating unit 12 for discriminating the table portion in the present embodiment is to discriminate the table by detecting the format-format characters. The document and table classification function of the invention of the document reading device Since it is the same, detailed description is omitted. The table structure analysis unit 13 analyzes from what byte to how many bytes of each table, and extracts item names and data. Up to this point, the function is the same as that of the document reading apparatus. In the document reading apparatus, for example, if there is a table as shown in FIG. 9 (a), “district name, eastern Kanagawa prefecture. Precipitation probability 2 and 10. Precipitation probability 3 and 30. Precipitation probability 4 and 30. Expected minimum temperature 0. Expected maximum temperature 10. District name, eastern Kanagawa Prefecture. Read out like "...". In the document reading apparatus, by specifying the table reading information, it is possible to give a percentage to the precipitation probability 1 to 4 or to measure the predicted minimum temperature / expected maximum temperature, or to read out only necessary information. However, you cannot change the way you read out by checking for duplication of data. In addition, when the item name column extends over a plurality of lines as shown in FIG. 9B, or when there is a large item for collecting detailed items, the table is easy to see, such as the district name and date. Therefore, it is not possible to cope with the case where data is omitted.
[0094]
In the present embodiment, the table structure analysis unit 13 further duplicates the function of extracting the table item name as shown in FIG. 9B, the function of supplementing the part where data is omitted, and the way of writing the table. It has a function to identify how to check and items to be checked for duplication, and to automatically create fixed data and sentence examples.
[0095]
First, regarding the extraction of the item name, when there is a table as shown in FIG. 9B, the column with the largest number of rows is checked in the top column of the table. Here, since the district name / month / day / weather spans three lines, the top three lines in the table are regarded as item names. For the district name, date, weather forecast minimum temperature, and forecast maximum temperature, the data for the three lines in the column is extracted as a single continuous data, and the item name is “ ”,“ Monday ”,“ Weather ”,“ Weather Expected Minimum Temperature ”, and“ Expected Maximum Temperature ”. There is also a space between the item names “weather”, but this is a problem when converted to the intermediate notation, so it is narrowed down.
[0096]
Regarding the “Precipitation Probability” column, “Precipitation Probability” is one column and there are four columns below it. The four items are similar data, and it is determined that duplication check is possible. As a result, it is possible to create a sentence example that summarizes the duplicate check and to generate fixed form data with a duplicate check flag. Regarding the four item names representing the probability of precipitation, when creating a sentence example, “˜” is converted from “to” to generate a fixed character of the sentence example.
[0097]
Next, looking at the standard data, regarding the data of the district name, if the data is checked, the second and subsequent items are omitted, so it can be considered that a duplicate check across the district data between the standard data is possible. . As for the date data, February of the second and subsequent data is omitted, but items such as date are generally used, so they are omitted in the table structure analysis unit 13. It is desirable to incorporate a process for restoring “February” in general.
[0098]
Also, units such as the probability of precipitation and the% and degree of predicted temperature should be taken out as a sentence example to reduce the amount of standard data. When the data is restored and generated in this way and the duplication flag is set, the table in FIG. 9B can be converted into the data in FIG.
[0099]
In this way, based on the extracted item name and the unit that was taken out, supplement the minimum particle, etc. to create a sentence example, “District name is« District name ”. ≫.The weather is «weather» .The probability of precipitation, from 0 to 6 o'clock, «0 o'clock to 6 o'clock»%, from 6 o'clock to 12 o'clock, «6 o'clock to 12 o'clock»%, from 12 o'clock to 18 o'clock , «12:00 to 18:00»%, 18:00 to 24:00, «18:00 to 24:00»%, the expected minimum temperature is the «expected minimum temperature» degree, the expected maximum temperature is the «expected maximum temperature» degree. ”As the most basic sentence examples, it is possible to create 16 kinds of sentence examples by summarizing the probability of precipitation or omitting the district name.
[0100]
The subsequent steps are the same as those in the first embodiment except that the sentence portion in the document is transferred from the document / table discriminating section 12 to the sentence analyzing section 3, and the description thereof will be omitted.
[0101]
According to the present embodiment, since the table portion existing in the document can also be generated from the table by generating sentence examples and fixed form data and reading the table data in various sentences, the listener is not bored. At the same time you can listen to the information on the table, you can also shorten the information.
[0102]
Next, a recording medium describing a program for realizing the data reading device according to the first to sixth embodiments of the present invention is a CD-ROM 15-1 or a floppy disk 15-, as in the example of the recording medium shown in FIG. Not only the portable recording medium 15 such as 2 but also any other storage device 14 stored at the end of the communication line, or a recording medium 17 such as a hard disk or RAM of a computer. Is read by the computer 16 when using.
[0103]
【The invention's effect】
According to the data reading device of the present invention, when reading the fixed form data represented by a table or the like, it does not read the same type of sentence repeatedly, but reads out different sentences for each fixed form data, and collects duplicate data. Therefore, the listener can listen to the necessary information in a short time without getting bored. Therefore, it is extremely effective to provide voice information to a user by applying it to an in-vehicle information service terminal device or the like.
[Brief description of the drawings]
FIG. 1 is a basic configuration diagram of the present invention.
FIG. 2 is a flowchart showing the basic processing flow of the present invention.
FIG. 3 is a configuration diagram of the data reading device according to the first embodiment of the present invention;
[Figure 4] Data content of sentence example
FIG. 5 is a configuration diagram of a data reading device according to the second embodiment of the present invention;
FIG. 6 is a flowchart showing a flow of processing according to the second embodiment of the present invention.
Fig. 7 Example of fixed data
FIG. 8 is a configuration diagram of a data reading device according to a fifth embodiment of the present invention;
[Figure 9] Weekly weather forecast table
FIG. 10 is a configuration diagram of a data reading device according to a fifth embodiment of the present invention;
FIG. 11 illustrates an example of a storage medium.
[Explanation of symbols]
1 sentence selection part
1-1 Standard data storage
1-2 Example sentence storage
2 Text composition part
3 sentence analysis department
3-1 Morphological Dictionary
4 Speech synthesis unit
4-1 Speech segment dictionary
5 Standard data converter
5-1 Morphological dictionary for fixed data
6 Data transmitter
6-1 Standard data storage on the broadcasting station side
6-2 Example sentence storage on the broadcasting station side
7 Data receiver
7-1 Standard data storage on the car navigation side
7-2 Example sentence storage on the car navigation side
8 Display data creation part
9 Voice data creation part
10 Display devices such as displays
11 Audio output devices such as speakers
12 Sentence / table discriminator
12-1 Text storage
13 Table Structure Analysis Department
14 Other storage devices stored at the end of the communication line
15 Portable storage media such as CD-ROM and floppy disk
15-1 CD-ROM
15-2 Floppy disk
16 computers
17 Storage media such as RAM / hard disk on computer

Claims (7)

1つ以上のデータから成る特定フォーマットを持つ定型データを基に文章を合成し、音声出力するデータ読み上げ装置において、
前記定型データ中の各データを埋め込むための位置を含み、文章の固定文字部分の内容の異なる文例を複数格納する文例格納部と、
前記定型データを読み込み、前読み込んだ定型データ毎に埋め込む文例を所定の方法で変えて選択し、前記定型データ中の各データを所定位置に埋め込み、文章を合成する文章合成部を有することを特徴とするデータ読み上げ装置。
In a data-to-speech device that synthesizes text based on fixed data with a specific format consisting of one or more data and outputs it as a voice,
Viewed including the position for embedding the data in the fixed data, a phrase storage unit that stores a plurality of different text example of the contents of the fixed character portion of the sentence,
The read routine data, a phrase embedded before each Symbol read type data selected by changing in a predetermined manner, embedding each data in the standard data in a predetermined position, to have a sentence synthesis unit for synthesizing sentences A featured data reading device.
1つ以上のデータから成る特定フォーマットを持つ定型データを基に文章を合成し、音声出力するデータ読み上げ装置において、
前記定型データを複数格納する定型データ格納部と、
前記定型データ中の各データを埋め込むための位置を含み、文章の固定文字部分の内容の異なる文例を複数格納する文例格納部と、
前記文例格納部から、前読み込んだ定型データ毎に埋め込む文例を所定の方法で変えて選択する文例選択部と、
前記定型データと前記選択された文例を基に、前記定型データ中の各データを前記選択された文例の所定位置に埋め込み、文書を合成する文章合成部と、
前記合成された文書を解析して、音声を表現するための中間表記に変換する文章解析部と、
前記中間表記を基に音声を合成して出力する音声合成部を有することを特徴とするデータ読み上げ装置。
In a data-to-speech device that synthesizes text based on fixed data with a specific format consisting of one or more data and outputs it as a voice,
A fixed data storage unit for storing a plurality of the fixed data;
Viewed including the position for embedding the data in the fixed data, a phrase storage unit that stores a plurality of different text example of the contents of the fixed character portion of the sentence,
A phrase selecting unit for selecting from said phrase storage unit, by changing the pre-SL read text example be embedded in every type data in a predetermined manner,
Based on the fixed form data and the selected sentence example, each data in the fixed form data is embedded in a predetermined position of the selected sentence example, and a sentence composition unit that synthesizes a document;
A sentence analysis unit that analyzes the synthesized document and converts it into an intermediate notation for expressing speech;
A data reading device comprising a speech synthesis unit that synthesizes and outputs speech based on the intermediate notation.
1つ以上のデータから成る特定フォーマットを持つ定型データを基に文章を合成し、音声出力するデータ読み上げ装置において、
前記定型データを複数格納する定型データ格納部と、
前記定型データ中の各データを埋め込むための位置を含み、文章の固定文字部分の内容の異なる文例を、音声を表現するための中間表記の形式で複数格納する文例格納部と、
前記文例格納部から、前記読み込んだ定型データ毎に埋め込む文例を所定の方法で変えて選択する文例選択部と、
前記定型データ中の各データを中間表記に変換する定型データ変換部と、
変換後の定型データ中の各データと前記選択された文例を基に、前記定型データ中の各データを前記選択された文例の所定位置に埋め込み、文書を合成する文章合成部と、
合成された文章を基に音声を合成して出力する音声合成部を有することを特徴とするデータ読み上げ装置。
In a data-to-speech device that synthesizes text based on fixed data with a specific format consisting of one or more data and outputs it as a voice,
A fixed data storage unit for storing a plurality of the fixed data;
Viewed including the position for embedding the data in the fixed data, the contents of different text example of fixed character part of a sentence, a phrase storage unit that stores plural in the form of intermediate representation for representing speech,
A sentence example selection unit that selects a sentence example to be embedded for each of the read fixed data from the sentence example storage unit by a predetermined method ;
A fixed data conversion unit that converts each data in the fixed data into an intermediate representation;
Based on each data in the fixed form data after conversion and the selected sentence example, each data in the fixed form data is embedded in a predetermined position of the selected sentence example, and a sentence synthesis unit that synthesizes a document;
A data reading device comprising a speech synthesis unit that synthesizes and outputs speech based on a synthesized sentence.
前記定型データの各データが、重複チェックを行うか否かを示す重複チェックフラグを具え、
前記文例格納部が、定型データの重複部分をまとめて表現する文例を格納し、
前記文例選択部が、前記重複チェックフラグに基づき、定型データの重複部分を検査し、該当する重複部分をまとめる文例を選択する機能を有することを特徴とする請求項2または3に記載のデータ読み上げ装置。
Each data of the standard data includes a duplication check flag indicating whether or not duplication check is performed,
The sentence example storage unit stores a sentence example that expresses overlapping portions of the fixed form data together,
The data reading unit according to claim 2 or 3, wherein the sentence example selection unit has a function of checking an overlapping portion of the fixed form data based on the duplication check flag and selecting a sentence example for collecting the corresponding overlapping portions. apparatus.
前記定型データの各データが、定型データ中のまとめて読み上げるデータの集合を示すデータ集合フラグを具え、
前記文例格納部が、データ集合単位に該データ集合のデータのみを含む文例を複数格納し、
前文例選択部が、全ての定型データを一括して読み込み、指定されたデータ集合単位に、対応する文例を選択する機能を有することを特徴とする請求項2乃至請求項4のいずれかに記載のデータ読み上げ装置。
Each data of the fixed form data includes a data set flag indicating a set of data to be read out collectively in the fixed form data,
The sentence example storage unit stores a plurality of sentence examples including only data of the data set in a data set unit,
5. The preceding sentence example selection unit has a function of reading all standard data at once and selecting a corresponding sentence example for a specified data set unit. Data reading device.
1つ以上のデータから成る特定フォーマットを持つ定型データを基に文章を合成するステップと、前記文章を音声出力するステップをコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体であって、
前記定型データ中の各データを埋め込むための位置を含み、文章の固定文字部分の内容 の異なる文例を複数記憶するステップと、
前記定型データを読み込み、前記読み込んだ定型データ毎に埋め込む文例を所定の方法で変えて選択し、前記定型データ中の各データを所定位置に埋め込み、文章を合成するステップとを、
コンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体。
A computer-readable recording medium recording a program for causing a computer to execute a step of synthesizing a sentence based on fixed data having a specific format composed of one or more data, and a step of outputting the sentence by voice,
A step of said saw including a position for embedding the data in the fixed data, stores a plurality of different text example of the contents of the fixed character portion of the sentence,
Reading the standard data, selecting a sentence example to be embedded for each of the read standard data in a predetermined method, embedding each data in the standard data in a predetermined position, and synthesizing a sentence,
A computer-readable recording medium storing a program to be executed by a computer.
1つ以上のデータから成る特定フォーマットを持つ定型データを基に文章を合成するステップと、前記文章を音声出力するステップをコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体であって、
前記定型データを複数記憶するステップと、
前記定型データ中の各データを埋め込むための位置を含み、文章の固定文字部分の内容の異なる文例を複数記憶するステップと、
前記記憶されている文例から、前記読み込んだ定型データ毎に埋め込む文例を所定の方法で変えて選択するステップと、
前記定型データと前記選択された文例を基に、前記定型データ中の各データを前記選択された文例の所定位置に埋め込み、文書を合成するステップと、
前記合成された文書を解析して、音声を表現するための中間表記に変換するステップと、
前記中間表記を基に音声を合成して出力するステップとを、
コンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体。
A computer-readable recording medium recording a program for causing a computer to execute a step of synthesizing a sentence based on fixed data having a specific format composed of one or more data, and a step of outputting the sentence by voice,
Storing a plurality of the fixed data;
A step of said saw including a position for embedding the data in the fixed data, stores a plurality of different text example of the contents of the fixed character portion of the sentence,
Selecting a sentence example to be embedded for each of the read fixed data from a stored sentence example by a predetermined method ; and
Embedding each data in the fixed form data at a predetermined position of the selected sentence example based on the fixed form data and the selected sentence example, and synthesizing a document;
Analyzing the synthesized document and converting it into an intermediate notation for expressing speech;
Synthesizing and outputting speech based on the intermediate notation,
A computer-readable recording medium storing a program to be executed by a computer.
JP06123199A 1999-03-09 1999-03-09 Data reading apparatus and recording medium Expired - Fee Related JP4237860B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP06123199A JP4237860B2 (en) 1999-03-09 1999-03-09 Data reading apparatus and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP06123199A JP4237860B2 (en) 1999-03-09 1999-03-09 Data reading apparatus and recording medium

Publications (2)

Publication Number Publication Date
JP2000259165A JP2000259165A (en) 2000-09-22
JP4237860B2 true JP4237860B2 (en) 2009-03-11

Family

ID=13165253

Family Applications (1)

Application Number Title Priority Date Filing Date
JP06123199A Expired - Fee Related JP4237860B2 (en) 1999-03-09 1999-03-09 Data reading apparatus and recording medium

Country Status (1)

Country Link
JP (1) JP4237860B2 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003036091A (en) * 2001-07-23 2003-02-07 Matsushita Electric Ind Co Ltd Electronic information equipment
JP2007257153A (en) * 2006-03-22 2007-10-04 Ntt Data Corp Document data reading apparatus and its computer program
JP4744338B2 (en) * 2006-03-31 2011-08-10 富士通株式会社 Synthetic speech generator
JP6417686B2 (en) * 2014-03-18 2018-11-07 富士通株式会社 Audio output sequence control program, audio output sequence control method, and audio output sequence control device
KR102483055B1 (en) * 2022-07-26 2022-12-30 주식회사 모두의연구소 Method for converting text of character to simple voice and appratus and system using the same

Also Published As

Publication number Publication date
JP2000259165A (en) 2000-09-22

Similar Documents

Publication Publication Date Title
CA2372544C (en) Information access method, information access system and program therefor
CN105653738B (en) Search result broadcasting method and device based on artificial intelligence
CN110738037B (en) Method, apparatus, device and storage medium for automatically generating electronic form
JP4463256B2 (en) System and method for providing automatically completed recommended words that link multiple languages
CN100583088C (en) Method for navigation by computation groups, related receiver
JP4977589B2 (en) Specific expression extraction device, specific expression extraction method, and program
CN101171624B (en) Speech synthesis device and speech synthesis method
US20080077869A1 (en) Conference supporting apparatus, method, and computer program product
JP2004226741A (en) Information providing device
CN102256049A (en) Automatic story production
CN100501738C (en) Searching method, system and apparatus for playing media file
CN1601514A (en) Electronic appliance having music database and method of forming such music database
JP5112479B2 (en) Sentence creation system and sentence creation program
CN1855223B (en) Audio font output device, font database, and language input front end processor
JP4237860B2 (en) Data reading apparatus and recording medium
CN108305622A (en) A kind of audio summary texts creation method and its creating device based on speech recognition
CN101206668A (en) Method for generating and analyzing website content components as well as apparatus
CN110096479A (en) Batch renaming method, apparatus, computer equipment and the storage medium of voice messaging
US7272659B2 (en) Information rewriting method, recording medium storing information rewriting program and information terminal device
Gottron Combining content extraction heuristics: the CombinE system
Ali Growth and Development of Islamic Banking: A Global Review
JPH09212513A (en) Book information display
JP6281513B2 (en) Audio data generation apparatus, audio data generation method, and program
JPH10228471A (en) Sound synthesis system, text generation system for sound and recording medium
Newman Treetables and other visualizations for email threads

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050630

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050705

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050727

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060704

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060731

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20060914

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20061117

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20070531

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20070606

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20080722

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081105

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081219

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111226

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111226

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121226

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121226

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131226

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees