JP2006153929A - 情報案内装置 - Google Patents

情報案内装置 Download PDF

Info

Publication number
JP2006153929A
JP2006153929A JP2004340239A JP2004340239A JP2006153929A JP 2006153929 A JP2006153929 A JP 2006153929A JP 2004340239 A JP2004340239 A JP 2004340239A JP 2004340239 A JP2004340239 A JP 2004340239A JP 2006153929 A JP2006153929 A JP 2006153929A
Authority
JP
Japan
Prior art keywords
information
reading
dictionary
content
language
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004340239A
Other languages
English (en)
Inventor
Hirofumi Nishimura
洋文 西村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2004340239A priority Critical patent/JP2006153929A/ja
Publication of JP2006153929A publication Critical patent/JP2006153929A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

【課題】同義語や省略語などの音声案内を短い時間で、かつ、理解しやすく行うことが可能な情報案内装置の提供。
【解決手段】コンテンツを収集するコンテンツ収集部106と、収集したコンテンツ情報に省略語辞書204に登録された言語が存在するかどうかを検索する検索部と、登録された言語が存在した場合、その言語に関しどの読みを最終的な読みとするかを決定する読み決定部106と、読み決定部106によって決定された読み情報を用いてコンテンツ情報の読み情報を生成する読み情報生成部と、生成された読み情報を音声合成する音声合成部102とを備え、コンテンツ収集部106で収集したコンテンツに省略語辞書204に登録された言語が存在した場合、その言語についてそれぞれ短い優先度の高い読みを最終的な読みと決定し、コンテンツ情報をより短い読みで案内することが可能になる。
【選択図】図1

Description

本発明は、テキスト情報として収集したコンテンツ情報を音声情報に変換し出力する情報案内装置に関するものである。
従来、情報案内装置として、テキスト情報を音声情報に変換し出力するテキスト情報音声合成装置が広く使用されている。このようなテキスト情報音声合成装置において、テキスト情報を単にそのまま音声情報に変換したのでは、テキスト情報に難易語や同音同義語などが含まれていた場合、音声変換された情報を聞いても理解し難いことがあることなどから、これらの言語に関し、それぞれその言語を平易な言語に変換し、テキスト情報を音声情報に変換するものが知られている(例えば、特許文献1参照)。
また、入力した言語、文章、数字などが本当に正しく入力されているかどうかを照合するために、入力した言語、文章、数字などをそれぞれ音声に変換して出力し、その音声を聞いて入力した元の言語、文章、数字などを入力に際して用いた文書を用いて比較し、読み合わせを行うものにおいて、入力した言語、文章、数字などにその直前のものと同じものがあった場合、その直後の言語、文章、数字などを省略し、前と「同じ」と出力したり、前と「同じ」と発音することにより、前と同じ言語、文章、数字などを入力したりするものも知られている(例えば、特許文献2参照)。
また、このようなテキスト情報音声合成装置において、テキスト情報からの読みを定義する言語辞書をネットワークを介して共通の共有辞書管理部で管理するものも知られている(例えば、特許文献3参照)。
特開平3−35296号公報 特開昭62−288895号公報 特開平10−254870号公報
しかしながら、特許文献1に記載されたものは、テキスト文章中にある難易語や同音異義語を平易な文章に変換して出力するというだけのものであり、難易語や同音異義語は平易な文章に変換され、分かりやすくなるが、その分、全体として長い文章を聴かせなければならなくなるという問題を有している。
また、特許文献2に記載されたものは、入力された文章や数字が正しく入力されたかどうかを読み合わせるために、入力された文章や数字を音声に変換して出力するものにおいて、入力された文章や数字に同じ文章や同じ数字が続いたとき、その文章や数字をそのまま音声に変換して読み上げるのを省略し、例えば、「同じ」と出力するというものであり、ニュースなどのように、所謂、同じ文章や数字がほとんどないものでは、ほとんど意味をなさないという問題を有している。
また、特許文献3に記載されたものは、複数の個別辞書と1つの共有辞書を用い、個別辞書の更新情報を共有辞書に反映させるというだけのものであり、文章をどのように省略し、解説して音声に変換するかを明確にしたものではない。
本発明は、このような従来の問題に鑑みてなされたものであり、最初は最も短い表記を用い、それで理解できない場合はユーザの指示によって、より長い表記で情報を音声合成
することができる情報案内装置を提供することを目的とするものである。
本発明の情報案内装置は、コンテンツを収集するコンテンツ収集手段と、コンテンツ収集手段で収集したコンテンツ情報に辞書に登録された言語が存在するかどうかを検索する検索手段と、コンテンツ情報に辞書に登録された言語が存在したとき、存在した言語に関する読みを決定する読み決定手段と、読み決定手段によって決定された読み情報を用いてコンテンツ情報の読み情報を生成する読み情報生成手段と、読み情報生成手段で生成された読み情報を基に音声合成する音声合成手段とを備えた構成を有する。
この構成により、収集したコンテンツ情報の中に辞書に登録された言語が存在した場合には、その言語についていかに表記し、音声合成するかを読み決定手段が自動的に決定することになり、読みの短い表記を優先度の高い表記と設定しておくことにより、より短い表記でコンテンツ情報を音声案内することができ、音声案内に長時間を費やすことを極力少なくすることができる。
また、本発明の情報案内装置は、辞書が、短い表記から長い表記までの複数の表記を有する同義語を登録する辞書であって、読み決定手段が前記辞書に登録された複数の表記の中からひとつを読みとして決定する構成を有する。
この構成により、複数の表記(読み)を持った同義語を、短い時間で音声案内することができる。
また、本発明の情報案内装置は、辞書が、省略語に関して省略した表記と省略しない表記をそれぞれ登録した省略語辞書であって、読み決定手段が省略語辞書に登録された表記の中からひとつを読みと決定する構成を有する。
この構成により、省略語を省略した表記で音声合成し、短い時間で省略語を音声案内することができる。
また、本発明の情報案内装置は、辞書に登録された表記には、それぞれ優先度が設定されており、読み決定手段が前記優先度にしたがって読みを決定する構成を有する。
この構成により、優先度の高いものが先に読み決定手段で最終的な読みとして決定されることになり、優先度の設定次第でその優先度に応じた順に最終的な読みを読み決定手段で決定することができる。
また、本発明の情報案内装置は、ユーザからの指示を入力するユーザ指示入力手段と、読み決定手段によって決定されるひとつの表記を、ユーザ指示入力手段からの指示により順次優先度の高い表記から低い優先度の表記に変更する対話制御手段とをさらに備えた構成を有する。
この構成により、読み決定手段で決定された読みではその内容が理解できない場合、ユーザ指示入力手段によってより分かりやすい読みになるように指示することによりその読みを更に次の読みに変更することができ、理解し難い読みでも分かりやすい読みに変更して音声案内することができる。
また、本発明の情報案内装置は、情報端末装置と、情報端末装置と通信可能な言語処理サーバとを備え、情報端末装置は、コンテンツを収集するためのコンテンツ収集手段と、コンテンツ収集手段で収集したコンテンツ情報を言語処理サーバに送信するとともに、言
語処理サーバから所定の辞書に登録された言語の読み情報を受信する情報端末側通信手段と、情報端末側通信手段を介して受信した言語の読み情報を基にして読みを決定する読み決定手段と、読み決定手段によって決定された読みを基に前記コンテンツ情報の読み情報を生成する読み情報生成手段と、読み情報生成手段で生成された読み情報を音声合成する音声合成手段とを有し、言語処理サーバは、情報端末装置よりコンテンツ情報を受信するとともに、所定の辞書に登録された言語の読みを情報端末装置に送信するサーバ側通信手段と、サーバ側通信手段を介して受信したコンテンツ情報に所定の辞書に登録された言語が存在するかどうかを検索する検索手段と、所定の辞書に登録された言語が存在したとき、存在した言語の読みをサーバ側通信手段に送出する言語処理部とを有した構成を有する。
この構成により、コンテンツ情報に所定の辞書に登録された言語があるかどうか、あれば、その言語の読みを送出する手段を言語処理サーバで行うことができ、情報端末装置としては、これらの手段を必要とせず、構成を簡単にすることができ、また、所定の辞書に登録する言語をサーバ側でまとめて更新することができるという作用を有する。
また、本発明の情報案内装置は、情報端末装置と、情報端末装置と通信可能な省略語辞書サーバとを備え、情報端末装置が、コンテンツを収集するためのコンテンツ収集手段と、コンテンツ収集手段で収集したコンテンツ情報に所定の辞書に登録された言語が存在するかどうかを検索する検索手段と、コンテンツ情報に前記所定の辞書に登録された言語が存在したとき、存在した言語に関する読みを決定する読み決定手段と、読み決定手段によって決定された読み情報を用いてコンテンツ情報の読み情報を生成する読み情報生成手段と、生成された読み情報を基に音声合成する音声合成手段と、省略語辞書サーバに設けられた省略語辞書の内容を基に所定の辞書の内容を更新する辞書管理手段とを備えた構成を有する。
この構成により、この構成により、情報端末装置で全ての動作を行わせることができ、辞書を更新したいときのみ、省略語辞書サーバに接続して省略語を更新すればよいという作用を有する。
また、本発明の情報案内装置は、省略語を省略しない表記に変換するための省略語辞書と、省略語以外の表記から読み情報を生成するための読み情報を格納した一般辞書と、省略語辞書と一般辞書を用いて省略語を用いた場合と省略語を省略しない表記に変換した場合の両方の読み情報を付与する言語処理手段と、省略語辞書のバージョンを管理する辞書管理手段と、ユーザからの指示を入力するユーザ指示入力手段と、読み情報から音声を合成する音声合成手段と、コンテンツを収集するためのコンテンツ収集手段と、コンテンツの収集および省略語辞書の更新を行うためのデータ更新手段と、読み情報の候補が複数ある場合に、複数ある読み情報候補のうちひとつを選択する読み決定手段と、ユーザ指示入力手段からの入力指示に従ってコンテンツ情報の読み情報解析要求と音声合成手段への音声合成要求とコンテンツ収集手段へコンテンツ収集要求を行う対話制御手段とを備えた構成を有する。
この構成により、コンテンツ情報に省略語が存在した場合、それを省略語のままで音声合成したり、省略しない状態で音声合成したりすることができ、省略語が理解できない場合には、容易に省略しない状態で音声合成し、音声案内することができる。
また、本発明の情報案内装置は、ユーザ指示入力手段が、マイクおよび音声認識手段を備えた構成を有する。
この構成により、音声によりユーザの指示を入力することができ、いちいちキーボード
などを操作しなくてもよいという作用を有する。
本発明の情報案内装置は、コンテンツを収集するコンテンツ収集手段と、コンテンツ収集手段で収集したコンテンツ情報に辞書に登録された言語が存在するかどうかを検索する検索手段と、コンテンツ情報に辞書に登録された言語が存在したとき、存在した言語に関する読みを決定する読み決定手段と、読み決定手段によって決定された読み情報を用いてコンテンツ情報の読み情報を生成する読み情報生成手段と、読み情報生成手段で生成された読み情報を基に音声合成する音声合成手段とを備えたものであり、コンテンツ収集手段によって収集したコンテンツ情報の中に辞書に登録された言語が存在した場合には、その言語についてそれを如何に表記し、音声合成するかを読み決定手段が自動的に決定することになり、読みの短い表記を優先度の高い表記と設定しておくことにより、より短い表記でコンテンツ情報を音声案内することができ、音声案内に長時間を費やすことを極力少なくすることができると言う効果を有する。
以下、本発明の実施の形態について、図面を参照しながら詳細に説明する。
(第1の実施の形態)
図1は、本発明の第1の実施の形態における情報案内装置の概略構成を示すブロック図である。
本発明の第1の実施の形態における情報案内装置は、図1に示すように、情報端末装置100と、この情報端末装置100と通信可能な言語処理サーバ200とを備えている。
情報端末装置100は、ユーザからの指示を入力するユーザ指示入力部101と、読み情報を基に音声を合成し、出力する音声合成部102と、言語処理サーバ200との間で通信を行う通信部103と、ユーザ指示入力部101によって入力されたユーザ指示を基にそれぞれ予め定めた処理を行ったり、音声合成部102に対して必要な読み情報を出力したりする対話制御部104と、同じ意味の表記に対し複数の読みがあったときに、それらを複数の読み候補とし、その中から1つを選択決定する読み決定部105と、テキスト情報としてコンテンツ情報を格納したコンテンツサーバ300にネットワーク301を介して接続し、コンテンツサーバ300からテキスト情報としてのコンテンツ情報を収集したり、CD、DVDといった情報記憶媒体からテキスト情報としてのコンテンツ情報を収集したりすることによって、それらを収集するコンテンツ収集部106とを備えている。
なお、ユーザ指示入力部101は、情報端末装置100が提示する選択肢に関して、ユーザがどの選択肢を選んだかを入力するためのものであり、例えば、タッチパネルのついた表示画面で構成したり、音声入力を可能にする音声認識装置を用いたり、ボタンスイッチなどを用いたりして構成されている。
また、音声合成部102は、対話制御部104より読みの情報を受け取り、それを音声信号に変換し出力するためのものである。対話制御部104は、ユーザとの対話制御を行うために、ユーザ指示入力部101によってユーザからの指示を入力するとともに、音声合成部102に指示を出すことによって収集した情報や対話制御の状況を音声で案内するための制御を行うものである。
読み決定部105は、先に説明したように、複数の読み候補があった場合に、その読み候補に対し、対話制御手段104の指示によりその候補の中から1つを選択決定するものであるが、ここで、対話制御部104から読み決定部105に対しなされる指示の中には
、少なくとも、複数の読み候補と、それらの読み候補の読み上げ内容が短いか、長いかのいずれであるかといった情報を含んでいる。この情報は、候補が2つの場合には単純に長い/短いというような2値で表現されるが、候補が複数あり、例えば、N個ある場合には1/N、2/N、・・・N/Nというように候補の数だけ選択肢を指定できるようにしている。
コンテンツ収集部106は、対話制御部104からコンテンツ収集命令を受信したときに通信部103を介してコンテンツ情報を収集するものである。コンテンツを収集するとき、対話制御部104からコンテンツ収集部106へは、コンテンツ収集命令とともに、どのようなコンテンツを収集するかの情報も送信するようにしている。例えば、「ニュース」、「昨日」というようなキーワードと共にコンテンツ収集部106にその情報を送り、コンテンツ収集部106において、一般のブラウザが検索するように、例えば、通信部103を通してネットワークに接続し、ネットワークに接続されたコンテンツサーバ300などから必要な情報を検索収集する。この時、ネットワーク上にあるサーチエンジンを用いて不特定多数の情報を集める様にしてもよいし、また、特別のコンテンツサーバを立ち上げて、そこからデータを引き出すようにしても良い。更に、情報端末装置100の中に一時的にコンテンツデータを格納しておき、その中から検索するようにしてもよい。
言語処理サーバ200は、情報端末装置100からのコンテンツ情報を受け、それを基に読み情報を生成したり、コンテンツ情報に省略した表記が含まれていたとき、その表記に併せて省略しない表記を取り出したりする言語処理部202と、省略した表記と省略しない表記とをそれぞれ対応して記憶した省略語辞書204と、各表記の読み、属性などを記憶した一般辞書205と、少なくとも省略語辞書204の内容をメンテナンス可能なメンテナンス部201と、無線通信やネットワーク301などを介して情報端末装置100と通信するための通信部203とを備えている。
なお、言語処理手段202は、省略語辞書204、一般辞書205のそれぞれに接続され、これらの辞書204、205を参照してコンテンツ情報の表記から読み情報を生成するように構成されている。ここで、省略語辞書204は、図2に示すように、省略した表記と省略しない表記とをそれぞれ対応して記録したデータベースであり、一般辞書205は、図3に示すように、表記と読みと属性とをそれぞれ対応して記録したデータベースである。
また、省略語辞書204および一般辞書205に関しては、それぞれその情報の検索を早くするために、例えば、省略した表記、一般的な表記に関し、それらを予め定めた順序でソートして記憶しておいたり、別に検索のためのインデックスをつけるなどしておいたりすることが望ましい。このようにしておけば、通常のデータベースと同様の方法を用いて省略した表記や一般的な表記をそれぞれ高速に素早く検索して読み情報を生成することができる。
また、メンテナンス部201は、省略語辞書204の情報、すなわち、図2で示す情報を追加したり、編集したり、削除したりするために用意しているが、一般辞書205の情報を追加したり、編集したり、削除したりできるようにしても良い。
次に、本実施の形態における情報案内装置について、その動作を詳細に説明する。図4は、本実施の形態における情報案内装置の動作を示す図である。なお、図4において、入出力部107は、図1に示すように、ユーザ指示入力部101と音声合成部102を共に含み、これらを総称するものである。
図4に示すように、装置を立ち上げると、先ず、対話制御手段104が、入出力部10
7に対し、情報検索のための選択肢を提示する(S401)。選択肢としては、例えば、「ニュース」、「天気予報」、「交通情報」などのジャンルを提示する。提示方法としては、ユーザ指示入力部101がタッチパネルを含む表示画面であれば、その表示画面にこれらのジャンルの文字を表示すればよいし、また、別に表示部を有する場合には、その表示部に表示すればよい。また、音声合成部201を使用して音声で案内してもよく、表示画面による表示と音声による案内をそれぞれ併用してもよい。
入出力部107に情報検索のための情報検索選択肢が提示されると、それを基にユーザがユーザ指示入力部101を用いて、その中から1つを選択する。また、情報検索のための入力を指示された場合は、その検索のためのキーワードをユーザ指示入力部101より入力する。選択され、或いは、入力された情報は、ユーザ指示入力部101から対話制御部104に送られる(S402)。例えば、ユーザ指示入力部101で「ニュース」を選択、あるいは入力した場合には、結果として「ニュース」というキーワードがユーザ指示入力部101から対話制御部104に送られる。
対話制御部104に「ニュース」というキーワードが入力されると、対話制御部104は、これをコンテンツ収集部106に伝送する(S403)。このとき、「ニュース」というキーワードに加えて、そのキーワードで収集するための情報収集指示情報も同時にコンテンツ収集部106に伝送される。
コンテンツ収集部106では、対話制御部104からの「ニュース」というキーワードと、その情報を収集しろという情報収集指示情報を受けて、通常のデータ検索と同様に、「ニュース」をキーワードとして、コンテンツサーバ300からそのキーワードに合ったコンテンツ情報を検索したり、既に蓄積されている情報からそのキーワードに合ったコンテンツ情報を検索したりし、抽出されたコンテンツ情報を対話制御部104に返送する(S404)。
例えば、「ニュース」をキーワードとして検索した結果、「ロボットがNYSEの取引開始のベルを鳴らす。」というコンテンツ情報を抽出したとすると、その抽出されたコンテンツ情報が対話制御部104に返送される。
対話制御部104は、コンテンツ収集部104で検索抽出したコンテンツ情報を通信部103、ネットワークを介して言語処理サーバ200に送信し、言語処理サーバ200は、その送信したコンテンツ情報を通信部203で受信し、そのコンテンツ情報の読み解析を言語処理部202に指示する(S405)。
言語処理部202で読み解析の指示を受けると、言語処理部202は、その指示に従って省略語辞書204、一般辞書205をそれぞれ参照し、読み解析を行い、その結果を通信部203、ネットワーク、通信部103を介して対話制御部104に返送する(S406)。
図5は、言語処理部202が具体的にどのように省略語辞書204、一般辞書205を参照し、読み解析を行うかを示した図である。
図5に示すように、キーワードを基にして検索抽出されたコンテンツ情報2020が言語処理部202に入力され、読み解析の指示がなされると、言語処理部202は、先ず、省略語抽出部2021を用いて、抽出された情報の中に省略語辞書204に記憶された省略語があるかどうかを検索する。図5に示す例では、抽出されたコンテンツ情報が「ロボットがNYSEの取引開始のベルを鳴らす。」という情報であるため、この情報の中に省略語辞書204に登録された省略語があるがどうかを検索する。この場合、情報の中に、
省略語辞書204に登録された省略語として「NYSE」という省略語が存在するため、省略語抽出部2021において、その省略語の省略された表記「NYSE」と、省略されない表記「ニューヨーク証券取引所」の両方がそれぞれ省略語辞書204より抽出される。そして、抽出された言語は、例えば、鍵括弧で区切り、かつ、抽出された言語において表記が複数ある場合は、それらの間に何らかの区切り(例えば、「|」など)を設け、全体として、これらの表記を組み合わせた情報2022として出力する。
図5に示す例で言えば、言語処理部202に入力されたコンテンツ情報が「ロボットがNYSEの取引開始のベルを鳴らす。」であり、その情報の中には、「NYSE」という諸略語が存在し、それが省略語辞書204に存在するため、その省略語の省略した表記「NYSE」と省略しない表示「ニューヨーク証券取引所」がそれぞれ鍵括弧で囲まれ、「|」で区切られて、「ロボットが[NYSE|ニューヨーク証券取引所]の取引開始のベルをならす。」という情報2022を出力する。
このようにして省略語辞書204から抽出された表記が鍵括弧で囲まれ、元の情報と組み合わされ出力されると、次に、それが読み解析部2023に供給され、ここで、一般辞書205を参照し、上記情報の読み情報を生成する。すなわち、「NYSE」は「エヌワイエスイ’ー」、「ニューヨーク証券取引所」は、「ニューヨ’ーク/ショウケントリヒキショ」というように、それぞれその読み情報を生成する。そして、これらの読み情報を複数の読み候補とする。なお、ここで「’」はアクセント格がある位置を示し、「/」はアクセント句の区切りを示している。
このようにして、複数の読み候補について読み情報が生成されると、これらに、更に、読み候補以外の部分の読み情報も同様に生成し、最終的に、これらを全て含んだ、所謂、コンテンツ情報全体の読み情報2024「ロボ’ットガ,[エヌワイエスイ’ーノ|ニューヨ’ーク/ショーケントリヒキショノ]/トリ’ヒキ/カイシノ/ベ’ルオ/ナラス。」が生成される。
なお、このとき、「NYSE」や「ニューヨーク証券取引所」という言語の後に、助詞である「の」が存在するため、一般に、ここでアクセント結合が起こり得るが、この様な処理も一般的な言語処理としてアクセント結合の処理を行い、アクセント句として区切れる位置で読み候補を選択できるようにし最終的な読み情報とする。
このようにしてコンテンツ情報の読み情報が生成されると、その情報が通信部203、ネットワーク、通信部103を介して、図4に示すように、情報端末装置100の対話制御部104に伝送される(S406)。
対話制御部104では、伝送された情報の中に、例えば、鍵括弧で囲まれた、所謂、複数の読み情報を有する場合、その複数の読み情報を読み決定部105に送信し、いずれの読み情報を最終的な読み情報とするか、その読みを決定するよう指示する(S407)。
読み決定部105は、対話制御部104より伝送された読み情報を基に、例えば、鍵括弧によって囲まれ、「|」で区切られた読み情報の内、いずれの読み情報を最終的な読み情報とするかを決定し、それを対話制御部104に返送する(S408)。
なお、ここで、読み決定部105がいずれの読み情報を最終的な読み情報とするかは、予めデフォルトとして、例えば、「|」で区切られた読み情報の内、先に出てくる読み情報と決定されており、ユーザ指示入力部101の入力指示によって、順次、後で出てくる読み情報に変更可能なように構成されている。
したがって、この例では、[エヌワイエスイ’−ノ|ニューヨ’ーク/ショウケントリヒキショノ]という情報が読み決定部105に送信され、読み決定部105で、最初に、「エヌワイエスイ’−ノ」という読み情報が最終的な読み情報として決定される。そして、決定された読み情報は、対話制御部104に返送され(S408)、対話制御部104では、他の読み情報と組み合わされて、「ロボ’ットガ,エヌワイエスイ’ーノ/トリ’ヒキ/カイシノ/ベ’ルオ/ナラス。」という読み情報を最終的に生成し、音声合成部102に出力する。音声合成部102では、入力した読み情報を基に音声信号を合成し、それをスピーカに出力する(S409)。スピーカは、音声合成部102からの音声信号を受け、それを音声に変換し、最終的に音声による情報案内を実施する。
なお、鍵括弧で囲まれ、「|」で仕切られた情報は、鍵括弧内で、先に出てきるほど短い情報、後に出てくるほど長い情報になるようにしている。すなわち、この例では、先に出てくる情報を省略語の省略した表記の情報、後で出てくる情報を省略しない表記の情報とし、先に出てくる情報をデフォルトとして最初に最終的な読み情報と決定するようにしている。したがって、デフォルトとして決定される読み情報は、いくつかある読み情報(読み方)の内、少なくとも短い読み情報(読み方)のものとなり、長いコンテンツ情報であっても限られた時間内に多くの内容を案内することが可能になる。
なお、本実施の形態では、ステップS409で、デフォルトとして設定され、先に出てくる読み情報を利用して情報案内を実施した場合でも、ユーザにおいて案内された省略語などが理解できない場合、ユーザ指示入力部101を用いて同じ案内を省略しない表示などの次の読み情報を利用して案内するよう指示可能なように構成している。
すなわち、先の情報案内では、省略語などが理解できない場合には、その省略語を次のレベルで聞くために、その旨を、ユーザ指示入力部101を用いて指示入力する。すると、その指示が再案内指示として、例えば、「NG[エヌワイエスイ’−]」という情報が、対話制御部104に伝送される(S410)。
対話制御部104は、この情報(指示)を受けると、その情報(指示)に基づいて、読み決定部105に対し、先に決定した読み情報と異なる次の読み候補を最終的な読み情報と決定するよう指示する(S411)。読み決定部105は、対話制御部104からの指示に基づき、先に決定した読み情報と異なる次の読み候補を最終的な読み情報と決定し、対話制御部104に返送する(S412)。対話制御部104は、読み決定部105の決定に従い、次のランクの読み情報を生成し、音声合成部102に出力する。すなわち、これにより、次のランクの読み情報で情報案内が再度実施されることになる(S413)。
この例では、読み決定部105において、「ニューヨ’ーク/ショウケントリヒキショ」を最終的な読み情報と決定し、対話制御部104が、この決定を受けて「ロボ’ットガ,ニューヨーク/ショウケントリヒキショノ/トリ’ヒキ/カイシノ/ベ’ルオ/ナラス。」という読み情報を生成する。そして、この読み情報を音声合成部102に出力し、その読み情報で情報案内を行う。したがって、この場合には、読み情報としては長くなるが、内容は著しく理解しやすくなる。
このように、本実施の形態によれば、省略語について、省略した表記、省略しない表記、その他、解説した表示など、短い表記から長い表記まで順に準備しておき、デフォルトでは短い表記を自動的に選択決定し、情報案内を聞いて理解できない場合には、ユーザ指示入力部101からの入力指示により、長い表記、理解しやすい表記に順次切替え案内できるように構成しており、デフォルトで理解できなくてもユーザの指示により、より理解しやすい案内を行わせることができ、省略語の分からないユーザでも、それを理解することができる。そして、本実施の形態では、省略語の管理を言語処理サーバ200側で行っ
ており、言語処理サーバ200側で時々刻々発生する省略語にそれぞれ対応するようにすれば、情報端末装置100側でいちいち省略語を入力したり、更新したりする必要がなく、時々刻々追加、更新される省略語にも充分対応することができるという効果を有する。
なお、本実施の形態では、読み情報として、省略した表記と、省略しない表記の2つを例に挙げて説明しているが、それらの表記を更に細かく3つ、4つと区別して用意しても良い。この場合、本実施の形態と同様、先頭から順に省略語に近い形の読み方を配置すればよい。
また、本実施の形態では、省略語であるのかどうかの判断を、ネットワークを介して接続される言語処理サーバ200で行うようにしているが、全てを情報端末装置100において行うことも可能である。
また、本実施の形態では、複数の読み候補を読みの短い順に並べるようにているが、読み決定部105で読みの字数を計数し、字数の少ないものから順に、それぞれの読み候補に優先順位を付与し、その優先順位を読み決定部104に記憶しておくようにしても良い。そして、記憶した優先順位を基に、最も優先順位が高い読み候補から順に読み決定部105でその読みを決定するようにしても良い。このようにすれば、必ずしも、複数の読み候補を予め読みの短い順に並べて出力しなくても良く、優先度に応じてその優先度の読み候補のみ出力することも可能である。
また、本実施の形態では、言語処理サーバ200とコンテンツサーバ300を別々の物として説明したが、コンテンツサーバ300毎に言語処理サーバ200を確保し、それぞれのコンテンツ毎にそのコンテンツにあった省略語を区別して管理するようにしても良い。このようにすれば、言語処理サーバ200をそれぞれのコンテンツ毎に用意すればよく、個々の言語処理サーバ200を容量の小さいものにすることができる。
(第2の実施の形態)
図6は、本発明の第2の実施の形態における情報案内装置の概略構成を示すブロック図である。図6において、図1と同じ符号を付したものは、図1と同じ機能を有するものを示しており、ここでは、これらのものについての詳細な説明は省略する。
本実施の形態では、図6に示すように、情報端末装置100に、辞書管理部108と、省略語辞書109と、一般辞書110と、言語処理部111とを付加し、情報端末装置100がネットワーク301を介して省略語辞書サーバ400と通信可能なように構成している。
省略語辞書サーバ400は、第1の実施の形態における言語処理サーバ200とは異なり、情報端末装置100が必要とする省略語辞書のみを提供するものである。すなわち、省略語辞書サーバ400は、メンテナンス部401と、サーバ側省略語辞書404と、通信部403と、辞書配信制御部402とを備えている。
辞書配信制御部402は、情報端末装置100より省略語辞書109の更新要求があった場合に省略語辞書の配信を行い、情報端末装置100に設けた省略語辞書109の内容を追加、更新するものである。省略語辞書の配信制御は、一般のデータ配信と同様に行えばよく、例えば、サーバ側省略語辞書404では、バージョンを記憶しておき、辞書配信制御部402でそのバージョン管理を行い、新しいバージョンの省略語を常に送信するように管理したり、省略語の追加、更新に際し、課金処理を行ったり、単純に省略語を配信したりするようにすればよい。
情報端末装置100に設けた辞書管理部108は、通信部103、ネットワーク301を介して省略語辞書サーバ400に対し省略語辞書109の更新要求を送信し、省略語辞書109の追加、更新を行うものである。ここで、更新要求は、定期的に行うようにしても良いし、また、不定期に行うようにしても良い。定期的に行う場合には、例えば、1週間に1回とか、1ヶ月に1回とかにそれぞれ更新要求するようにすればよく、不定期に行う場合には、例えば、コンテンツを収集する際に同時に更新要求するようにしたり、情報端末装置100に電源を投入したとき更新要求するようにしたり、任意に希望するときにユーザ指示入力部101より更新要求したい旨の入力を行ったときに更新要求するようにすればよい。そして、これらの場合、省略語辞書サーバ400にあるサーバ側省略語辞書404の一部をダウンロードしたり、全体をダウンロードしたりするのも、一般にデータをダウンロードするのと同じ方法で行えばよい。
このように構成することにより、第1の実施の形態で行った処理を、毎回サーバ側と通信して行わなくてもよく、情報端末装置100のみで同様の処理を実施することができる。動作フローについては、第1の実施の形態で説明したのと同じであり、図4における言語処理部202を言語処理部111に置き換えるだけでよい。省略語辞書109の更新に関する動作フローは、情報案内を行う対話制御とは独立して先に述べたように適宜実施すればよい。
尚、本実施の形態では、省略語辞書109の配信のみを例にして記載したが、一般辞書110も同様に省略語辞書サーバ400側でメンテナンスを行い、これを配信するようにしても良い。また、本実施の形態では、ネットワーク301を用いて省略語辞書サーバ400に接続し、省略語辞書サーバ400からの情報を基に、辞書の更新を行うように構成したが、CD、DVD、その他のリムーバブルなメディアを用いて辞書を更新するようにしてもよい。
(第3の実施の形態)
図7は、本発明の第3の実施の形態における情報案内装置の構成を示すブロック図である。図7において、図1、図6と同じ符号を付したものは、図1、図6に示したものと同じ機能を有するものであり、ここでも、その詳細な説明は省略する。
本実施の形態では、図7に示すように、ユーザ指示入力部101にマイク112と音声認識部113とを用いている。音声認識部113は、例えば、対話制御部104から候補となる単語などの文字列の候補群を送信すると、音声を分析し、どの文字列にもっとも近いかを選択する一般的な単語音声認識機能を持たせている。そして、音声認識機能の起動、停止は、対話制御部104で行い、音声合成部102によって音声案内を行っている間は、音声認識機能を起動し、音声認識部113が認識結果を対話制御部104に送信した段階で一旦音声認識機能を停止し、この動作を必要に応じて繰り返すようにしている。
また、対話制御部104は、読み決定部105が内部情報として管理している読み候補の情報を参照できるようにしており、複数ある読み候補のうちどの候補を音声案内したのかが分かるようにしてある。
次に、本実施の形態のける情報案内装置について、その動作を説明する。ユーザに情報を案内するまでのコンテンツの収集や辞書の更新などは、第1、第2の実施の形態と同じである。
本実施の形態において、第1、第2の実施の形態と同様に、情報案内を2回行った場合(図4におけるステップS409およびS413)、情報端末装置100では、ユーザに対して、「NYSE」という省略語について、「エヌワイエスイー」という読み方と、「
ニューヨークショウケントリヒキショ」という読み方の2つの読み方を案内したことになる。したがって、この段階で、ユーザは「ニューヨーク証券取引所」について、以降「エヌワイエスイー」という呼び方をする可能性がある。そこで、読み決定部105が前回と異なる読み候補を決定し、対話制御部104にその結果を返した段階で、対話制御部104がその読み候補のデータを読み決定部105の内部データから引き出し、その読みを音声認識部113の認識対象語彙に追加して音声認識部113を起動するようにする。
このようにすると、音声合成部102を用いて音声案内したのと同じ省略語を用いて音声入力することができるようになり、長い発声を必要としていた認識語彙に対しても、短い省略語を利用することができるようになり、音声入力、処理時間をより短くすることが可能になる。
本発明の情報案内装置は、コンテンツを収集するコンテンツ収集手段と、コンテンツ収集手段で収集したコンテンツ情報に辞書に登録された言語が存在するかどうかを検索する検索手段と、コンテンツ情報に辞書に登録された言語が存在したとき、存在した言語に関する読みを決定する読み決定手段と、読み決定手段によって決定された読み情報を用いてコンテンツ情報の読み情報を生成する読み情報生成手段と、読み情報生成手段で生成された読み情報を基に音声合成する音声合成手段とを備えたものであり、コンテンツ収集手段によって収集したコンテンツ情報の中に辞書に登録された言語が存在した場合には、その言語についてそれをいかに表記し、音声合成するかを読み決定手段が自動的に決定することになり、読みの短い表記を優先度の高い表記と設定しておくことにより、より短い表記でコンテンツ情報を音声案内することができ、音声案内装置として有用である。
本発明の第1の実施の形態における情報案内装置の構成を示すブロック図 本発明の第1の実施の形態における情報案内装置において使用する省略語辞書の概要を示す図 本発明の第1の実施の形態における情報案内装置において使用する一般辞書の概要を示す図 本発明の第1の実施の形態における情報案内装置の動作を示す図 本発明の第1の実施の形態における情報案内装置において使用する言語処理部の動作を具体的に示す図 本発明の第2の実施の形態における情報案内装置の構成を示すブロック図 本発明の第3の実施の形態における情報案内装置の構成を示すブロック図
符号の説明
100 情報端末装置
101 ユーザ指示入力部
102 音声合成部
103、203、403 通信部
104 対話制御部
105 読み決定部
106 コンテンツ収集部
107 入出力部
108 辞書管理部
109 省略語辞書
110、205 一般辞書
111、202 言語処理部
112 マイク
113 音声認識部
200 言語処理サーバ
201、401 メンテナンス部
204、404 サーバ側省略語辞書
300 コンテンツサーバ
301 ネットワーク
400 省略語辞書サーバ
402 辞書配信制御部

Claims (9)

  1. コンテンツを収集するコンテンツ収集手段と、前記コンテンツ収集手段で収集したコンテンツ情報に辞書に登録された言語が存在するかどうかを検索する検索手段と、前記コンテンツ情報に前記辞書に登録された言語が存在した場合、前記存在した言語に関する読みを決定する読み決定手段と、前記読み決定手段によって決定された読み情報を用いて前記コンテンツ情報の読み情報を生成する読み情報生成手段と、前記読み情報生成手段で生成された読み情報を基に音声合成する音声合成手段とを備えた情報案内装置。
  2. 前記辞書が、表記長の異なる複数の表記を有する同義語を登録する辞書であって、前記読み決定手段が前記辞書に登録された前記複数の表記の中からひとつを読みとして決定する請求項1記載の情報案内装置。
  3. 前記辞書が、省略語に関して省略した表記と省略しない表記をそれぞれ登録した省略語辞書であって、前記読み決定手段が前記省略語辞書に登録された前記表記の中からひとつを読みと決定する請求項1記載の情報案内装置。
  4. 前記辞書に登録された表記には、それぞれ優先度が設定されており、前記読み決定手段が前記優先度にしたがって読みを決定する請求項1または請求項2のいずれかに記載の情報案内装置。
  5. ユーザからの指示を入力するユーザ指示入力手段と、前記読み決定手段によって決定されるひとつの表記を、前記ユーザ指示入力手段からの指示により順次優先度の高い表記から低い優先度の表記に変更する対話制御手段とをさらに備えた請求項4記載の情報案内装置。
  6. 情報端末装置と、前記情報端末装置と通信可能な言語処理サーバとを備え、前記情報端末装置は、コンテンツを収集するためのコンテンツ収集手段と、前記コンテンツ収集手段で収集したコンテンツ情報を前記言語処理サーバに送信するとともに、前記言語処理サーバから所定の辞書に登録された言語の読み情報を受信する情報端末側通信手段と、前記情報端末側通信手段を介して受信した前記言語の読み情報を基にして読みを決定する読み決定手段と、前記読み決定手段によって決定された読みを基に前記コンテンツ情報の読み情報を生成する読み情報生成手段と、前記読み情報生成手段で生成された読み情報を音声合成する音声合成手段とを有し、前記言語処理サーバは、前記情報端末装置より前記コンテンツ情報を受信するとともに、前記所定の辞書に登録された言語の読みを前記情報端末装置に送信するサーバ側通信手段と、前記サーバ側通信手段を介して受信した前記コンテンツ情報に前記所定の辞書に登録された言語が存在するかどうかを検索する検索手段と、前記所定の辞書に登録された言語が存在した場合に、前記存在した言語の読みを前記サーバ側通信手段に送出する言語処理部とを有した情報案内装置。
  7. 情報端末装置と、前記情報端末装置と通信可能な省略語辞書サーバとを備え、前記情報端末装置が、コンテンツを収集するためのコンテンツ収集手段と、前記コンテンツ収集手段で収集したコンテンツ情報に所定の辞書に登録された言語が存在するかどうかを検索する検索手段と、前記コンテンツ情報に前記所定の辞書に登録された言語が存在した場合に、前記存在した言語に関する読みを決定する読み決定手段と、前記読み決定手段によって決定された読み情報を用いて前記コンテンツ情報の読み情報を生成する読み情報生成手段と、前記生成された読み情報を基に音声合成する音声合成手段と、前記省略語辞書サーバに設けられた省略語辞書の内容を基に前記所定の辞書の内容を更新する辞書管理手段とを備えた情報案内装置。
  8. 省略語を省略しない表記に変換するための省略語辞書と、省略語以外の表記から読み情報を生成するための読み情報を格納した一般辞書と、前記省略語辞書と前記一般辞書を用いて前記省略語を用いた場合と前記省略語を省略しない表記に変換した場合の両方の読み情報を付与する言語処理手段と、前記省略語辞書のバージョンを管理する辞書管理手段と、ユーザからの指示を入力するユーザ指示入力手段と、前記読み情報から音声を合成する音声合成手段と、コンテンツを収集するためのコンテンツ収集手段と、前記コンテンツの収集および前記省略語辞書の更新を行うためのデータ更新手段と、前記読み情報の候補が複数ある場合に、複数ある前記読み情報候補のうちひとつを選択する読み決定手段と、前記ユーザ指示入力手段からの入力指示に従ってコンテンツ情報の読み情報解析要求と前記音声合成手段への音声合成要求とコンテンツ収集手段へコンテンツ収集要求を行う対話制御手段とを備えた情報案内装置。
  9. 前記ユーザ指示入力手段が、マイクおよび音声認識手段を備える請求項1から請求項7のいずれかに記載の情報案内装置。

JP2004340239A 2004-11-25 2004-11-25 情報案内装置 Pending JP2006153929A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004340239A JP2006153929A (ja) 2004-11-25 2004-11-25 情報案内装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004340239A JP2006153929A (ja) 2004-11-25 2004-11-25 情報案内装置

Publications (1)

Publication Number Publication Date
JP2006153929A true JP2006153929A (ja) 2006-06-15

Family

ID=36632358

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004340239A Pending JP2006153929A (ja) 2004-11-25 2004-11-25 情報案内装置

Country Status (1)

Country Link
JP (1) JP2006153929A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008146019A (ja) * 2006-11-16 2008-06-26 Seiko Epson Corp 音声合成用辞書作成システム、半導体集積回路装置及び半導体集積回路装置の製造方法
JP2009086662A (ja) * 2007-09-25 2009-04-23 Honda Motor Co Ltd テキスト読み上げのためのテキスト前処理
JP2010512073A (ja) * 2006-12-05 2010-04-15 ノーテル・ネットワークス・リミテッド 装置同士の間で通信を行う方法及び装置
JP2010181562A (ja) * 2009-02-04 2010-08-19 Fujitsu Ltd 音声合成装置、音声合成方法及びコンピュータプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008146019A (ja) * 2006-11-16 2008-06-26 Seiko Epson Corp 音声合成用辞書作成システム、半導体集積回路装置及び半導体集積回路装置の製造方法
JP2010512073A (ja) * 2006-12-05 2010-04-15 ノーテル・ネットワークス・リミテッド 装置同士の間で通信を行う方法及び装置
JP2009086662A (ja) * 2007-09-25 2009-04-23 Honda Motor Co Ltd テキスト読み上げのためのテキスト前処理
JP2010181562A (ja) * 2009-02-04 2010-08-19 Fujitsu Ltd 音声合成装置、音声合成方法及びコンピュータプログラム

Similar Documents

Publication Publication Date Title
CN102549652B (zh) 信息检索装置
EP2008189B1 (en) Automatic language model update
EP1049072B1 (en) Graphical user interface and method for modifying pronunciations in text-to-speech and speech recognition systems
US6289301B1 (en) System and methods for frame-based augmentative communication using pre-defined lexical slots
EP1170724A2 (en) Synthesis-based pre-selection of suitable units for concatenative speech
US20060020576A1 (en) Search system reusing search condition and the related method
US20040128141A1 (en) System and program for reproducing information
JP6529761B2 (ja) 話題提供システム、及び会話制御端末装置
JP2000081892A (ja) 効果音付加装置および効果音付加方法
JP2005321730A (ja) 対話システム、対話システム実行方法、及びコンピュータプログラム
CN102096667A (zh) 一种信息检索方法及系统
CN1813285B (zh) 语音合成设备和方法
JP2015118222A (ja) 音声合成システム及び音声合成方法
JP2006153929A (ja) 情報案内装置
WO2010142422A1 (en) A method for inter-lingual electronic communication
JP2006030326A (ja) 音声合成装置
JPH10222187A (ja) 発話文書作成装置,発話文書作成方法および発話文書作成手順をコンピュータに実行させるプログラムを格納したコンピュータ読み取り可能な記録媒体
JP5870686B2 (ja) 合成音声修正装置,方法,及びプログラム
JP2005257954A (ja) 音声検索装置、音声検索方法および音声検索プログラム
JP2006018133A (ja) 分散型音声合成システム、端末装置及びコンピュータ・プログラム
JP5398202B2 (ja) 翻訳プログラム、翻訳システム、翻訳システムの製造方法及び対訳データ生成方法
JP4173404B2 (ja) 文セット自動生成装置、文セット自動生成プログラム、記憶媒体
JPH09128409A (ja) データ検索装置および方法、情報記憶媒体
JP2005158044A (ja) 情報検索プログラム、当該プログラムを格納するコンピュータ読み取り可能な記録媒体、情報検索方法、および情報検索装置
JPH11282772A (ja) 情報配信システム、情報送信装置、情報受信装置