WO2016042600A1

WO2016042600A1 - 情報提供システム

Info

Publication number: WO2016042600A1
Application number: PCT/JP2014/074412
Authority: WO
Inventors: 政信大沢; 匠武井; 友紀古本; 知宏成田; 辰彦斉藤
Original assignee: 三菱電機株式会社
Priority date: 2014-09-16
Filing date: 2014-09-16
Publication date: 2016-03-24
Also published as: US9978368B2; JP6022138B2; DE112014006957T5; US20170200448A1; JPWO2016042600A1; DE112014006957B4; CN106688036B; CN106688036A

Abstract

　この発明の情報提供システムによれば、複数の見出しの中から１つの見出しを選択するための認識対象語が重複しないようにしたので、ユーザの発話により、一意に見出しを選択し、選択した見出しに対応する情報（コンテンツ）を提示することができるようになり、ユーザにとっての利便性が向上する。

Description

情報提供システム

　この発明は、ユーザに対して音声や画面表示で情報を提示する情報提供システムに関するものである。

　従来より、ニュース等の見出しをディスプレイに表示したり、スピーカから音声出力したりして、ユーザが当該見出しに含まれるキーワードを発話することにより、そのキーワードを含む見出しに対するニュースの本文（コンテンツ）を読み上げたり表示したりする情報提供装置が知られている。

　例えば、特許文献１には、ＨＴＭＬ等で記述されたテキストを読み上げるものであって、リンク先の情報の内容を表すリンク文字列に含まれるキーワードを音声認識対象とし、当該キーワードが発話されると、対応するリンク先の情報（コンテンツ）を取得して読み上げる音声認識／合成装置が記載されている。

特開２００３－９９０８９号公報

　しかしながら、例えば特許文献１のような従来の技術では、複数のリンク文字列から抽出したキーワードが重複する場合、ユーザが重複するキーワードを発話すると、選択肢が複数ある旨を通知するだけであり、音声操作によって１つのリンク先の情報を容易に選択する方法は開示されておらず、ユーザが容易に所望のリンク先の情報（コンテンツ）を取得することができない、という課題があった。

　この発明は、上記のような課題を解決するためになされたものであり、ユーザの音声操作によって、複数の見出しから容易に所望の見出しを選択でき、当該選択した見出しに対応する情報（コンテンツ）を提示することができる情報提供システムを提供することを目的とする。

　上記目的を達成するため、この発明は、複数の見出しを提示して、当該複数の見出しの中の１つを選択し、選択された見出しに対応するコンテンツを提示する情報提供システムにおいて、前記複数の見出しを取得し、当該取得した各見出しから認識対象語候補を抽出する抽出部と、前記抽出部から、前記各見出しの認識対象語候補を取得し、当該取得した各見出しの認識対象語候補に基づいて前記各見出しの認識対象語を生成する対象語決定部と、音声による音声認識結果が前記対象語決定部により生成された認識対象語と一致した場合に、当該一致した音声認識結果を認識対象語とする見出しに対応するコンテンツを提示するよう指示を行う制御部とを備え、前記対象語決定部は、前記取得した各見出しの認識対象語候補の中に重複する認識対象語候補が存在する場合、前記各見出しの認識対象語が互いに異なるように前記各見出しの認識対象語を動的に生成することを特徴とする。

実施の形態１による情報提供システムの動作の概略を説明するための説明図である。実施の形態１における情報提供システムにより、ニュースの見出しがディスプレイに表示されている表示画面の一例を示す図である。実施の形態１における情報提供システムの主なハードウェア構成を示す概略構成図である。実施の形態１による情報提供システムの一例を示すブロック図である。解析部が取得した各見出しと、当該見出しに対応するコンテンツ（ニュース本文）の一例を示す表である。実施の形態１における抽出部が、図５に示す各見出しから認識対象語候補を抽出し、当該認識対象語候補を各見出しに対応付けた結果を示す表である。実施の形態１において、記憶部に格納された各見出しの認識対象語、各見出し、各見出しに対応するコンテンツ（ニュース本文）の一例を示す表である。実施の形態１の情報提供システムにおける音声認識辞書生成までの動作を示すフローチャートである。実施の形態１の情報提供システムにおける見出しの出力と記憶部へのコンテンツ等の格納の動作を示すフローチャートである。実施の形態１の情報提供システムにおけるコンテンツを提示する動作を示すフローチャートである。取得部が、ネットワークを介して取得したコンテンツ情報を示す図である。実施の形態２における情報提供システムにより、ニュースの見出しが絞り込まれた状態でディスプレイに表示されている表示画面の一例を示す図である。実施の形態２による情報提供システムの一例を示すブロック図である。実施の形態２における抽出部が、図５に示す各見出しから複数の認識対象語候補を抽出し、当該認識対象語候補を各見出しに対応付けた結果を示す表である。実施の形態２において、記憶部に格納された各見出しの認識対象語、各見出し、各見出しに対応するコンテンツ（ニュース本文）の一例を示す表である。実施の形態２において、認識対象語が再決定されて、記憶部に格納された各見出しの認識対象語、各見出し、各見出しに対応するコンテンツ（ニュース本文）の一例を示す表である。実施の形態２の情報提供システムにおける音声認識辞書生成までの動作を示すフローチャートである。実施の形態２の情報提供システムにおける記憶部へのコンテンツ等の格納・更新、および、コンテンツを提示する動作を示すフローチャートである。

　以下、この発明の実施の形態について、図面を参照しながら詳細に説明する。
　この発明の情報提供システムは、複数の見出しを提示して、当該複数の見出しの中から１つの見出しを選択し、選択された見出しに対応する情報（コンテンツ）を提示するものである。

実施の形態１．
　図１は、この発明の実施の形態１による情報提供システムの動作の概略を説明するための説明図である。情報提供システム１は、ネットワーク２を介して情報（コンテンツ情報）を取得し、取得したコンテンツ情報に含まれるコンテンツの見出しを表示または音声出力により提示するよう、ディスプレイ３またはスピーカ４（以下、「ディスプレイ等」と記載する。）に対して指示出力する。

　そして、情報提供システム１は、見出しに含まれる認識対象語がユーザにより発話されると、当該見出しを選択し、その選択された見出しに対応するコンテンツを提示（表示または音声出力）するよう、ディスプレイ等に対して指示出力する。

　この実施の形態１では、具体例として、情報提供システム１が、ネットワーク２を介してコンテンツ情報としてニュース情報を取得し、そのニュース情報（コンテンツ情報）に含まれるニュースの本文（コンテンツ）の見出しを提示するよう、ディスプレイ等に対して指示出力する場合を例に説明する。なお、ここでの見出しは、ニュースの内容を要約した要約文であるが、コンテンツの内容を表すものであれば、見出しはどのようなものであってもよい。

　図２は、この実施の形態１における情報提供システムにより、ニュースの見出しがディスプレイ３に表示されている表示画面の一例を示す図である。
　そして、情報提供システム１は、見出しに含まれる認識対象語がユーザにより発話されると、当該認識対象語を含む見出しを選択し、その選択した見出しに対応するニュース本文を提示するよう、ディスプレイ等に対して指示出力する。

　例えば、図２のようにニュースの見出しとして、「楽大日本シリーズ初進出」「ダルビがノーヒットノーラン逃す」「楽大の中田が大リーグへ移籍を希望」という３つの見出しがディスプレイ３に表示されている状況で、ユーザにより「だるび」と発話されると、見出し「ダルビがノーヒットノーラン逃す」に対応するニュース本文が、スピーカ４から音声出力されたり、ディスプレイ３に表示されたりする。

　なお、この実施の形態１では、コンテンツ情報に含まれる「コンテンツ」は、テキスト情報であるニュース本文であるものとして説明するが、これに限られるものではない。また、「コンテンツ」はテキスト情報に限らず、画像（静止画、動画、音声を含む動画など）であってもよく、最終的にユーザに提示する方法として、例えば、動画に含まれる音声のみを出力するものであってもよい。以下の実施の形態においても、同様である。

　また、この実施の形態１では、コンテンツの「見出し」は、テキスト情報であるニュース本文（コンテンツ）に対応する見出しであるものとして説明するが、これに限られるものではない。ただし、見出しについては、ユーザが発話する認識対象語を含むテキスト情報である。以下の実施の形態に置いても同様である。

　図３は、この実施の形態１における情報提供システム１の主なハードウェア構成を示す概略構成図である。バス１００には、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）１０１、ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）１０２、ＲＡＭ（Ｒａｎｄａｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）１０３、入力装置１０４、通信装置１０５、ＨＤＤ（Ｈａｒｄ　Ｄｉｓｋ　Ｄｒｉｖｅ）１０６、出力装置１０７が接続されている。

　ＣＰＵ１０１は、ＲＯＭ１０２やＨＤＤ１０６に記憶された各種プログラムを読み出して実行することにより、各ハードウェアと協働し、各種機能を実現する。
　ＲＡＭ１０３は、プログラム実行時に使用するメモリである。
　入力装置１０４は、ユーザ入力を受け付けるものであり、マイク、リモコン、タッチセンサ等である。

　ＨＤＤ１０６は、外部記憶装置の一例であり、外部記憶装置としては、ＨＤＤの他に、ＣＤ、ＤＶＤ、ＵＳＢメモリやＳＤカード等のフラッシュメモリを採用したストレージ等が含まれる。
　出力装置１０７は、スピーカ、液晶ディスプレイ、有機ＥＬ等を含む。

　図４は、この発明の実施の形態１による情報提供システム１の一例を示すブロック図である。この情報提供システム１は、取得部１０、解析部１１、抽出部１２、対象語決定部１３、辞書生成部１４、音声認識辞書１５、制御部１６、記憶部１７、音声認識部１８、音声合成部１９を備えている。なお、これらの構成要素は、ネットワーク上のサーバ、スマートフォン等の携帯端末、車載機器等に分散されていてもよい。

　取得部１０は、ネットワーク２を介してＨＴＭＬ（ＨｙｐｅｒＴｅｘｔ　Ｍａｒｋｕｐ　Ｌａｎｇｕａｇｅ）やＸＭＬ（ｅＸｔｅｎｓｉｂｌｅ　Ｍａｒｋｕｐ　Ｌａｎｇｕａｇｅ）形式で記述されたコンテンツ情報を取得する。ネットワーク２としては、例えば、インターネットや携帯電話等の公衆回線を使用することができる。

　解析部１１は、取得部１０により取得されたコンテンツ情報を解析し、コンテンツと当該コンテンツの見出しを取得する。複数のコンテンツが含まれている場合は、すべてのコンテンツと、それに対応する見出しとを取得する。

　例えば、コンテンツ情報として、テキストがＨＴＭＬ形式で記述されている場合、解析部１１は、「<A HREF=”news1.html”>楽大日本シリーズ初進出</A>」のように、<A>タグのhref属性で指定されているファイルを、取得部１０を介して取得し、当該取得したファイルに記載されている内容を、コンテンツとして取得する。

　また、</A>タグで指定されたアンカーテキストを、コンテンツの見出し（以下、「見出し」と記載する。）として取得する。</A>タグで指定された箇所が複数ある場合は、解析部１１は、すべてについて同様の処理を行う。
　図５は、解析部１１が取得した複数の見出しと、当該各見出しに対応するコンテンツ（ニュース本文）の一例を示す表である。

　図５に示すように、ここでは解析部１１が、取得部１０から取得したコンテンツ情報を解析し、見出し「楽大日本シリーズ初進出」とそれに対応するコンテンツ（ニュース本文）「楽大が今日の東部戦に１対０で勝利したため、初の日本シリーズ進出が決定しました。」、見出し「ダルビがノーヒットノーラン逃す」とそれに対応するコンテンツ（ニュース本文）「ダルビは９回ツーアウトの状況で４番マークにヒットを打たれノーヒットノーランを逃しました。」、見出し「楽大の中田が大リーグへ移籍を希望」とそれに対応するコンテンツ（ニュース本文）「楽大の中田が今日の午後、記者会見で大リーグへの移籍を希望していると発表しました。」を取得したものとする。

　抽出部１２は、解析部１１から、複数の見出しと、当該各見出しに対応するコンテンツとを取得する。そして、取得した各見出しから、音声認識対象語候補となる単語等の読み（以下、「認識対象語候補」と記載する。）を抽出する。

　そして、抽出した認識対象語候補を、抽出元の見出しと対応付ける。この際、抽出方法としてはどのような方法を用いてもよいが、例えば、見出しを形態素解析により単語に分割し、最も先頭にある単語または先頭から複数の単語を連結した単語列（以下、「単語等」と記載する。）の読みを、認識対象語候補として抽出すればよい。

　この実施の形態１では、このように見出しの最も先頭にある単語等を認識対象語候補として抽出するものとして説明するが、これは、一般的に人は、最初の単語（文字）を発話することが多いからである。
　なお、例えば、ユーザの発話履歴を用いて発話頻度が高い単語等の読みを抽出する等、他の抽出方法を用いてもよい。以下の実施の形態においても、同様である。

　図６は、抽出部１２が、図５に示す各見出しから認識対象語候補を抽出し、当該認識対象語候補を各見出しに対応付けた結果を示す表である。
　この図６に示すように、ここでは、見出し「楽大日本シリーズ初進出」の認識対象語候補は「らくだい」、見出し「ダルビがノーヒットノーラン逃す」の認識対象語候補は「だるび」、見出し「楽大の中田が大リーグへ移籍を希望」の認識対象語候補は「らくだい」というように、認識対象語候補が抽出されている。

　対象語決定部１３は、抽出部１２から、複数の見出しと、当該各見出しに対応するコンテンツと、当該各見出しの認識対象語候補とを取得する。そして、取得した各見出しの認識対象語候補の中に、重複する認識対象語候補が存在するか否かを判定するとともに、認識対象語候補に基づいて各見出しの認識対象語を動的に生成する。

　この実施の形態１では、取得した各見出しの認識対象語候補の中に重複する認識対象語候補が存在する場合、各見出しの認識対象語が互いに異なるように各見出しの認識対象語を動的に生成する。具体的には、重複する認識対象語候補のうち少なくとも１つの認識対象語候補を加工または置換することにより、お互いが異なる認識対象語候補となるようにする。

　図６に示す例では、一番目の見出しである「楽大日本シリーズ初進出」の認識対象語候補「らくだい」と、三番目の見出しである「楽大の中田が大リーグへ移籍を希望」の認識対象語候補「らくだい」が重複しているため、例えば、一番目の見出しの認識対象語候補を「いちばんめのらくだい」に加工し、三番目の見出しの認識対象語候補を「さんばんめのらくだい」に加工する。

　そして、対象語決定部１３は、加工後または置換後の認識対象語候補を、見出しに対応する音声認識対象語（以下、「認識対象語」と記載する。）に決定する。
　一方、重複する認識対象語候補が存在しない場合、対象語決定部１３は、抽出部１２から取得した認識対象語候補をそのまま、見出しに対応する認識対象語に決定する。

　なお、対象語決定部１３は、見出しの選択以外の操作に関する認識語彙のリスト（例えば、ナビゲーション装置や他の車載機器等を操作するための操作コマンド等のリスト）を有しており、当該リストに含まれる単語等と認識対象語が一致または類似しないように、認識対象語候補を加工等するとしてもよい。すなわち、対象語決定部１３は、機器の操作コマンドとは異なるものになるように、認識対象語を動的に生成するとしてもよい。

　具体的には、例えば、図５に示す見出しに加えて「楽大のエアコンの売れ行き好調」という見出しがあった場合、抽出部１２により「らくだい」が認識対象語候補として抽出されたとすると、他の認識対象語候補と重複するために、「エアコン」を認識対象語候補としてしまうと、車載機器であるエアコン装置に対する「エアコン」という操作コマンドと一致してしまうため、このような加工等は行わないようにする。

　辞書生成部１４は、対象語決定部１３により決定された認識対象語を認識語彙とする音声認識辞書１５を生成する。
　音声認識部１８は、マイク５により集音された音声を、音声認識辞書１５を参照して認識し、認識結果文字列を出力する。なお、音声認識部１８による音声認識の方法については、公知の技術を用いればよいため、説明を省略する。

　制御部１６は、対象語決定部１３から、見出しと、当該見出しに対応する認識対象語と、同じくその見出しに対応するコンテンツとを取得し、記憶部１７に格納する。
　図７は、実施の形態１において、記憶部１７に格納された各見出しの認識対象語、各見出し、各見出しに対応するコンテンツ（ニュース本文）の一例を示す表である。

　この図７は、前述のとおり、対象語決定部１３により一番目の見出しの認識対象語候補「らくだい」が「いちばんめのらくだい」に、三番目の見出しの認識対象語候補「らくだい」が「さんばんめのらくだい」に加工されて、認識対象語として決定されたものが、記憶部１７に記憶された状態を示している。

　また、制御部１６は、対象語決定部１３から取得した複数の見出しを提示するよう、ディスプレイ等に対して指示出力する。具体的には、対象語決定部１３から取得した見出しを表示するよう、ディスプレイ３へ指示出力する。または、当該見出しに対応する合成音声を生成するよう音声合成部１９に指示出力した後、音声合成部１９により生成された合成音声を出力するよう、スピーカ４へ指示出力する。

　なお、制御部１６から見出しを提示するよう指示出力する方法としては、表示出力、または、音声出力の少なくとも一方により行うとしてもよいし、表示と音声の両方により出力を行うようにしてもよい。
　また、音声合成部１９による音声合成の方法については、公知の技術を用いればよいため、説明を省略する。

　さらに、制御部１６は、音声認識部１８により出力された認識結果文字列を検索キーとして、記憶部１７を検索する。そして、検索キーと一致する認識対象語に対応する見出しを選択し、その見出しに対応するコンテンツを取得する。すなわち、制御部１６は、音声による音声認識結果が対象語決定部１３により生成された認識対象語と一致した場合に、当該一致した音声認識結果を認識対象語とする見出しを選択し、その選択された見出しに対応するコンテンツを取得する。

　そしてその後、取得したコンテンツを提示するよう、ディスプレイ等に対して指示を行う。この場合にも、具体的には、取得したコンテンツを表示するよう、ディスプレイ３へ指示出力する。または、取得したコンテンツを用いて合成音声を生成するよう音声合成部１９に指示出力し、音声合成部１９により生成された合成音声を出力するよう、スピーカ４へ指示出力する。

　なお、この場合にも、制御部１６からコンテンツを提示するよう指示出力する方法としては、表示出力、または、音声出力の少なくとも一方により行うとしてもよいし、表示と音声の両方により出力を行うようにしてもよい。

　ここで、対象語決定部１３による認識対象語候補の加工方法と置換方法について、詳細に説明する。
　まず、対象語決定部１３による認識対象語候補の加工方法について説明する。
　対象語決定部１３は、抽出部１２から取得した各見出しの認識対象語候補の中に重複する認識対象語候補が存在する場合、当該重複する認識対象語候補の少なくとも１つを加工して、加工後の認識対象語候補をその見出しに対応する認識対象語として決定することにより、各見出しの認識対象語が互いに異なるものになるように、認識対象語を動的に生成する。

　例えば、対象語決定部１３は、重複する認識対象語候補を含む見出しの提示位置または提示順序を特定し、当該特定した提示位置または提示順序に基づいて、認識対象語候補を加工する。すなわち、重複する認識対象語候補が抽出された各見出しが、ディスプレイ３に表示またはスピーカ４から音声出力された位置や順番を表す単語等を、各重複する認識対象語候補の前方に追加するような加工を行う。

　具体的には、例えば、解析部１１により取得された見出しが、「楽大日本シリーズ進出」「ダルビがノーヒットノーラン逃す」「楽大の中田が大リーグへの移籍を希望」であり、抽出部１２により抽出された各見出しに対応する認識対象語候補が「らくだい」「だるび」「らくだい」であるとする。そして、各見出しが、図２に示すようにディスプレイ３に表示されるものとする。

　この場合、対象語決定部１３は、一番目の見出しと三番目の見出しの認識対象語候補がいずれも「らくだい」で重複しているので、一番目の見出しである「楽大日本シリーズ進出」に対応する認識対象語候補「らくだい」を「いちばんめのらくだい」に加工し、三番目の見出しである「楽大の中田が大リーグへ移籍を希望」の認識対象語候補「らくだい」を「さんばんめのらくだい」に加工する。

　また、他の加工方法として、対象語決定部１３は、重複する認識対象語候補が抽出された見出し同士の相対的な提示位置や提示順序（相対的な表示位置または音声出力順）を表す単語等を、各重複する認識対象語候補の前方に追加するという加工を行うようにしてもよい。

　具体的には、上述の例の場合には、最初（一番目）の見出しである「楽大日本シリーズ進出」に対応する認識対象語候補「らくだい」を「いちばんめのらくだい」または「うえのらくだい」に加工し、最後（三番目、相対的には二番目）の見出しである「楽大の中田が大リーグへ移籍を希望」の認識対象語候補「らくだい」を「にばんめのらくだい」または「したのらくだい」に加工する。

　さらに、他の加工方法として、対象語決定部１３は、重複する認識対象語候補に他の単語等（単語または単語列）を追加することにより、認識対象語候補を加工する、としてもよい。例えば、重複する認識対象語候補に対して、見出し中において認識対象語候補と隣接する単語等を追加する、という加工を行うようにしてもよい。なお、隣接する単語等は、抽出部１２により解析された結果を用いればよい。

　具体的には、上述の例の場合には、一番目の見出しである「楽大日本シリーズ進出」に対応する認識対象語候補「らくだい」に、例えば、隣接する単語列「にほんしりーず」を追加して、「らくだいにほんしりーず」に加工し、三番目の見出しである「楽大の中田が大リーグへ移籍を希望」の認識対象語候補「らくだい」に、例えば、隣接単語列「のなかた」を追加して、「らくだいのなかた」に加工する。

　なお、ここでは、重複する認識対象語候補をいずれも加工するものとして説明したが、どちらか一方のみ加工してもよい。すなわち、重複する認識対象語候補をすべて加工する必要はなく、他の認識対象語候補との重複を解消できるのであれば、少なくとも１つの認識対象語候補を加工するとしてもよい。

　次に、対象語決定部１３による認識対象語候補の置換方法について説明する。
　対象語決定部１３は、抽出部１２から取得した各見出しの認識対象語候補の中に重複する認識対象語候補が存在する場合、当該重複する認識対象語候補のうち少なくとも１つを他の言い換え語（他の認識対象語候補）に置換して、置換後の認識対象語候補をその見出しに対応する認識対象語として決定することにより、各見出しの認識対象語が互いに異なるものになるように、認識対象語を動的に生成する。

　例えば、対象語決定部１３は、重複する認識対象語候補のうち少なくとも１つの認識対象語候補について、抽出部１２から、他の見出しに対応する認識対象語候補と重複しない他の認識対象語候補を取得し、当該取得した認識対象語候補に置換する。すなわち、対象語決定部１３は、重複する認識対象語候補を含む見出しに含まれる他の認識対象語候補に、認識対象語候補を置換する。

　具体的には、上述した例の場合には、一番目の見出しと三番目の見出しの認識対象語候補がいずれも「らくだい」で重複しているので、一番目の見出しである「楽大日本シリーズ進出」に対応する認識対象語候補として、抽出部１２から他の認識対象語候補であって他の見出しに対応する認識対象語候補と重複しない「にほんしりーず」を取得し、置換する。すなわち、認識対象語候補「らくだい」に換えて、「にほんしりーず」を認識対象語候補とし、これを認識対象語として決定する。

　なお、このようにいずれか一方のみの認識対象語候補を置換すれば、重複する認識対象語候補が存在しなくなるので問題ないが、例えば、三番目の見出しである「楽大の中田が大リーグへ移籍を希望」に対応する認識対象語候補として、抽出部１２から他の認識対象語候補であって他の見出しに対応する認識対象語候補と重複しない「なかた」を取得し、こちらも置換するようにしてもよい。

　また、他の置換方法として、公知の意図理解技術を用いて、重複する認識対象語候補が抽出された見出しを解析して、当該見出しが属するカテゴリを特定し、当該カテゴリを表す新たな単語等を生成するようにしてもよい。そして、重複する認識対象語候補を、当該生成した単語等に置換したものを、認識対象語として決定する。すなわち、対象語決定部１３は、重複する認識対象語候補を含む見出しの意味を解析し、当該意味に相当する用語を他の認識対象語候補として、重複する認識対象語候補の少なくとも１つを置換する。

　具体的には、上述した例とは異なる例で、例えば、解析部１１により取得された見出しが、「楽大から行楽シーズン到来のお知らせ」「ダルビがノーヒットノーラン逃す」「楽大の中田が大リーグへ移籍を希望」の３つであるとする。

　この場合、一番目の見出しと三番目の見出しの認識対象語候補がいずれも「らくだい」で重複しているが、公知の意図理解技術により、一番目の見出しである「楽大から行楽シーズン到来のお知らせ」が属するカテゴリは「旅行」と特定され、三番目の見出しである「楽大の中田が大リーグへ移籍を希望」が属するカテゴリは「野球」と特定される。

　そして、例えば、カテゴリ「旅行」に相当する「りょこうのほう」という単語列と、カテゴリ「野球」に相当する「やきゅうのほう」という単語列を生成する。そして、一番目の見出し「楽大から行楽シーズン到来のお知らせ」に対応する認識対象語候補「らくだい」を「りょこうのほう」という認識対象語候補に置換する。

　この場合にも、いずれか一方のみの認識対象語候補を置換すれば、重複する認識対象語候補が存在しなくなるので問題ないが、例えば、三番目の見出しである「楽大の中田が大リーグへ移籍を希望」に対応する認識対象語候補「らくだい」も「やきゅうのほう」という認識対象語候補に置換するようにしてもよい。
　なお、見出しが属するカテゴリに限らず、見出しの意図を表す単語等であれば、どのようなものであってもよい。

　次に、この実施の形態１における情報提供システム１の動作について、図８～図１０に示すフローチャートを参照しながら具体的に説明する。図８は、実施の形態１の情報提供システム１における音声認識辞書生成までの動作を示すフローチャートである。また、図９は、実施の形態１の情報提供システム１における見出しの出力と記憶部１７へのコンテンツ等の格納の動作を示すフローチャートである。また、図１０は、実施の形態１の情報提供システム１におけるコンテンツを提示する動作を示すフローチャートである。

　さらに、図１１は、取得部１０が、ネットワーク２を介して取得したコンテンツ情報を示す図である。ここでは、図１１に示すようなＨＴＭＬ形式で記述されたテキストが、情報提供システム１の処理対象であるものとして説明する。

　また、コンテンツであるニュース本文は、「news1.html」「news2.html」「news3.html」に記述されており、その内容は、図５に示すように「楽大が今日の東部戦に１対０で勝利したため、初の日本シリーズ進出が決定しました。」「ダルビは９回ツーアウトの状況で４番マークにヒットを打たれノーヒットノーランを逃しました。」「楽大の中田が今日の午後、記者会見で大リーグへの移籍を希望していると発表しました。」であるとする。

　さらに、この実施の形態１における情報提供システム１は、見出しをディスプレイに表示し、ユーザ発話により選択された見出しに対応するコンテンツを音声出力するものとして説明する。これは、例えば車両の運転中など、詳細なニュース本文をディスプレイに表示させても、ユーザが内容を読むことができない場合などを考慮したものである。

　なお、ディスプレイがかなり大画面である場合や、車両の運転など、ユーザが他に集中しなければならない状況にない場合には、ユーザ発話により選択された見出しに対応するコンテンツをディスプレイに表示するようにしてもよい。また、表示と音声出力の両方を行うものであってもよい。

　初めに、図８に示すフローチャートを用いて、音声認識辞書生成の動作について説明する。
　まず、取得部１０が、ネットワーク２を介してコンテンツ情報を取得する（ステップＳＴ０１）。ここでは、図１１に示すようなコンテンツ情報（テキスト情報からなるニュース情報）を取得するものとする。

　次に、解析部１１は、取得部１０により取得されたコンテンツ情報の内容を解析し、コンテンツと、当該コンテンツの見出しを取得する（ステップＳＴ０２）。
　具体的には、解析部１１は、取得部１０により取得されたコンテンツ情報（テキスト情報からなるニュース情報）の構造を解析し、</A>タグで指定された「<A HREF=”news1.html”>楽大日本シリーズ初進出</A>」から、このニュース（コンテンツ）の見出しとして「楽大日本シリーズ初進出」を取得する。

　また、「HREF」属性で指定されたＨＴＭＬファイルを、取得部１０を介して取得し、当該ファイルに記述されているニュース本文（コンテンツ）を取得する。見出しとニュース本文（コンテンツ）の処理をすべての<A>タグで指定された内容に対して行う。
　解析部１１により取得された、各見出しとコンテンツ（ニュース本文）の例は、図５に示すとおりである。

続いて、抽出部１２は、解析部１１により取得されたすべての見出しから、認識対象語候補を抽出する（ステップＳＴ０３）。抽出方法については、前述の抽出部１２についての説明の際に説明したとおり、どのような方法を用いてもよいが、ここでは、例えば、各見出しを形態素解析により単語に分割し、最も先頭にある単語の読みを、その見出しに対する認識対象語候補として抽出するものとして説明する。

　その結果、見出し「楽大日本シリーズ初進出」からは「らくだい」、見出し「ダルビがノーヒットノーラン逃す」からは「だるび」、見出し「楽大の中田が大リーグへ移籍を希望」からは「らくだい」が、それぞれ認識対象語候補として抽出される。
　このようにして、各見出しから認識対象語候補を抽出した結果は、図６に示すとおりである。

　そして、対象語決定部１３は、抽出部１２により抽出された認識対象語候補に、重複する認識対象語候補があるか否かを判定する（ステップＳＴ０４）。
　重複する認識対象語候補がある場合（ステップＳＴ０４の「ＹＥＳ」の場合）、重複する認識対象語候補のうち少なくとも１つの認識対象語候補を、前述した加工方法または置換方法により加工または置換し（ステップＳＴ０５）、加工後または置換後の認識対象語候補を音声認識対象語として決定する（ステップＳＴ０６）。

　一方、重複する認識対象語候補がない場合（ステップＳＴ０４の「ＮＯ」の場合）、抽出部１２により抽出された認識対象語候補をそのまま、音声認識対象語として決定する（ステップＳＴ０６）。

　ここでは、認識対象語候補「らくだい」が重複しているので、例えば、前述した加工方法のうち、各重複する認識対象語候補が抽出された見出し同士の相対的な表示位置または音声出力順を表す単語等を、各認識対象語候補の前方に追加するという方法を用いて、見出し「楽大日本シリーズ初進出」の認識対象語候補を「いちばんめのらくだい」、見出し「楽大の中田が大リーグへ移籍を希望」の認識対象語候補を「にばんめのらくだい」に加工し、それぞれを認識対象語として決定する。

　その後、辞書生成部１４は、対象語決定部１３により決定された認識対象語を認識語彙とする音声認識辞書１５を生成する（ステップＳＴ０７）。
　この場合には、「いちばんめのらくだい」「だるび」「にばんめのらくだい」を認識語彙とする音声認識辞書１５が生成される。

　なお、認識対象語候補が重複する場合の加工方法については、相対的な表示位置または音声出力順を表す単語を最初に追加する、というようなルールをあらかじめ決めておくようにすればよい。また、例えば、相対的な表示位置または音声出力順を表す単語を最初に追加するというルールにした場合には、音声により、例えば「いちばんめのらくだいですか。にばんめのらくだいですか。」と、案内してあげるようにしてもよい。これにより、ユーザにも「いちばんめのらくだい」「にばんめのらくだい」が認識対象語候補であるということを知らせることができる。

　また、このように、認識対象語候補が重複する場合に他の言い換え語等に置換する場合に、ユーザにどの単語が認識対象語候補であるかを提示するために、例えばその言い換え語である認識対象語候補を色替え表示したり強調表示するようにしてもよい。具体的には、見出し「楽大日本シリーズ初進出」の認識対象語候補を「にほんしりーず」、見出し「楽大の中田が大リーグへ移籍を希望」の認識対象語候補を「なかた」に置換した場合には、例えば図２に示すようにディスプレイ３に表示されている見出しの中の「日本シリーズ」という単語と「中田」という単語を色替え表示したり強調表示したりすればよい。

　次に、図９に示すフローチャートを用いて、見出しの出力と記憶部１７へのコンテンツ等の格納の動作について説明する。
　まず、制御部１６は、対象語決定部１３から、認識対象語と見出しとコンテンツを取得し（ステップＳＴ１１）、記憶部１７に格納する（ステップＳＴ１２）。
　このようにして記憶部１７に格納された、各見出しに対応する認識対象語と、各見出しと、各見出しに対応するコンテンツ（ニュース本文）は、図７に示すとおりである。

　次に、制御部１６は、対象語決定部１３から取得した見出しを表示（提示）するよう、ディスプレイ３に対して指示出力する（ステップＳＴ１３）。
　この結果、図２に示すように、ディスプレイ３に見出しが表示される。
　なお、ここでは、見出しを提示する際に表示により提示されるものとして説明するが、見出しが音声出力により提示されるものであってもよいし、表示と音声出力の両方により提示されるものであってもよい。

　最後に、図１０に示すフローチャートを用いて、コンテンツの出力の動作について説明する。
　まず、音声認識部１８は、マイク５により取得された音声を認識し、認識結果文字列を制御部１６に出力する（ステップＳＴ２１）。
　例えば、ユーザにより「いちばんめのらくだい」が発話されると、音声認識部１８は音声認識辞書１５を参照して認識処理を行い、認識結果として文字列「いちばんめのらくだい」を出力する。

　次に、制御部１６は、音声認識部１８により出力された認識結果文字列を取得し、当該取得した認識結果文字列に対応するコンテンツ情報を取得する（ステップＳＴ２２）。すなわち、取得した認識結果文字列を検索キーとして記憶部１７を検索する。そして、検索キーと一致する認識対象語に対応する見出しを選択し、当該見出しに対応するコンテンツを取得する。

　具体的には、制御部１６は、音声認識部１８により出力された「いちばんめのらくだい」という認識結果文字列に対応するコンテンツ（ニュース本文）の文字列「楽大が今日の東部戦に１対０で勝利したため、初の日本シリーズ進出が決定しました。」を記憶部１７から取得する。

　その後、制御部１６は、当該取得したコンテンツ（ニュース本文）の文字列を用いて合成音声を生成するよう、音声合成部１９に指示出力し（ステップＳＴ２３）、音声合成部１９により生成された合成音声を取得し、その合成音声によりコンテンツ（ニュース本文）を出力（提示）するよう、スピーカ４に対して指示出力する（ステップＳＴ２４）。

　その結果、「楽大が今日の東部戦に１対０で勝利したため、初の日本シリーズ進出が決定しました。」という合成音声が、スピーカ４から出力される。
　なお、前述のとおり、ここでは、ユーザが選択した見出しに対応するコンテンツ（ニュース本文）の文字列を音声出力するものとして説明したが、制御部１６がステップＳＴ２２において取得したコンテンツ情報に基づいて、当該取得したコンテンツ（ニュース本文）の文字列をディスプレイ３に表示させるようにしてもよい。また、表示と音声出力の両方を行うものであってもよい。

　このように、複数の見出しを提示して、当該複数の見出しの中から１つの見出しを選択し、選択された見出しに対応する情報（コンテンツ）を提示する情報提供システム１が、その見出しを選択するための認識対象語が重複しないように加工等を行って認識対象語を決定するようにしたので、ユーザは、発話により一意に見出しを選択し、選択した見出しに対応する情報（コンテンツ）を取得することができる。

　なお、この実施の形態１では、各見出しの最も先頭にある単語の読みを、その見出しに対する認識対象語候補として抽出するものとし、重複するものがあった場合に重複しないように加工等を行うものとして説明したが、これは、一般的に人は、最初の単語（文字）を発話することが多いからである。そして、最初の単語（文字）が同じだと認識対象語候補が重複してしまうことになるため、文字の追加、連結、言い換え、置き換えなどにより、重複しないように認識対象語を決定するようにしたものである。

　以上のように、この実施の形態１によれば、複数の見出しの中から１つの見出しを選択するための認識対象語が重複しないようにしたので、ユーザの発話により、一意に見出しを選択し、選択した見出しに対応する情報（コンテンツ）を提示することができるようになり、ユーザにとっての利便性が向上する。

実施の形態２．
　実施の形態１においては、見出しを選択するための認識対象語候補が重複する場合、あらかじめ各認識対象語候補が異なるように加工等したものを、見出しを選択するための新たな認識対象語とし、重複する認識対象語候補は、認識対象語ではないものとして扱われる。そのため、ユーザが当該重複する認識対象語候補を発話した場合、誤認識となってしまう。

　具体的には、実施の形態１において、「らくだい」という認識対象語候補が重複していたために、例えば図７に示すように、一番目の見出しの認識対象語を「いちばんめのらくだい」に加工し、三番目の見出しの認識対象語を「さんばんめのらくだい」とした場合に、ユーザが「らくだい」と発話しても、それは音声認識辞書１５には含まれていない文字列になるため、認識できずに終わってしまう。

　そこで、この発明の実施の形態２による情報提供システム２０は、まず初めに、複数の見出しに存在する認識対象語がユーザにより発話された場合、当該認識対象語を含む見出しと他の見出しとの表示態様が異なるように表示し、ユーザに対して、当該認識対象語を含む見出しに絞り込んだことを明示する。これにより、その認識対象語が重複しているということをユーザに知らせることができる。

　そして、情報提供システム２０は、絞り込まれた見出しに含まれる認識対象語であって、かつ、各見出し間で重複しない認識対象語がユーザにより発話されると、発話された認識対象語を含む見出しを選択する。その後、当該選択した見出しに対応するコンテンツを表示または音声出力により提示するよう、ディスプレイ等に対して指示出力する。

　例えば、図２のようにニュースの見出しとして、「楽大日本シリーズ初進出」「ダルビがノーヒットノーラン逃す」「楽大の中田が大リーグへ移籍を希望」という３つの見出しがディスプレイ３に表示されている状況で、ユーザにより「らくだい」と発話されると、「らくだい」を含まない見出し「ダルビがノーヒットノーラン逃す」をグレーアウトするよう、ディスプレイ３に対して指示出力する。

　その結果、図１２に示すように、二番目の見出し「ダルビがノーヒットノーラン逃す」がグレーアウトされて見にくくなり、一番目の見出し「楽大日本シリーズ初進出」と三番目の見出し「楽大の中田が大リーグへ移籍を希望」の２つはそのまま明るく見やすい状態で表示され、この２つの見出しに絞り込まれたことが明示される。

　図１２は、この実施の形態２における情報提供システムにより、ニュースの見出しが絞り込まれた状態でディスプレイに表示されている表示画面の一例を示す図である。
　この状態において、続いてユーザにより「なかた」と発話されると、見出し「楽大の中田が大リーグへ移籍を希望」に対応するニュース本文が、スピーカ４から音声出力されたり、ディスプレイ３に表示されたりする。

　図１３は、この発明の実施の形態２による情報提供システムの一例を示すブロック図である。なお、実施の形態１で説明したものと同様の構成には、同一の符号を付して重複した説明を省略する。

　この実施の形態２では、抽出部２２が、解析部１１から取得した各見出しについて、複数の認識対象語候補を抽出する。
　図１４は、抽出部２２が、図５に示す各見出しから複数の認識対象語候補を抽出し、当該認識対象語候補を各見出しに対応付けた結果を示す表である。

　ここでは、見出し「楽大日本シリーズ初進出」については、認識対象語第一候補として「らくだい」、認識対象語第二候補として「にほんしりーず」が対応付けられている。また、見出し「ダルビがノーヒットノーラン逃す」については、認識対象語第一候補として「だるび」、認識対象語第二候補として「のーひっと」が対応付けられている。また、見出し「楽大の中田が大リーグへ移籍を希望」については、認識対象語第一候補として「らくだい」、認識対象語第二候補として「なかた」が対応付けられている。

　なお、ここでは、見出しに含まれる単語等を認識対象語第二候補にすることとして説明したが、この他に、各見出しの位置や順番を表す単語等を認識対象語候補として、例えば、一番目の見出し「楽大日本シリーズ初進出」の認識対象語第二候補を「いちばんめ」「ひとつめ」「うえのほう」などとし、三番目の見出し「楽大の中田が大リーグへ移籍を希望」の認識対象語第二候補を「さんばんめ」「ふたつめ」「したのほう」などとしてもよい。

　また、実施の形態１においても説明したように、上述した例とは異なる例で、例えば、解析部１１により取得された見出しが、「楽大から行楽シーズン到来のお知らせ」「ダルビがノーヒットノーラン逃す」「楽大の中田が大リーグへ移籍を希望」の３つである場合には、一番目の見出しである「楽大から行楽シーズン到来のお知らせ」が属するカテゴリ「旅行」に相当する「りょこうのほう」をこれに対応する認識対象語第二候補とし、三番目の見出しである「楽大の中田が大リーグへ移籍を希望」が属するカテゴリ「野球」に相当する「やきゅうのほう」をこれに対応する認識対象語第二候補にしてもよい。
　なお、見出しが属するカテゴリに限らず、見出しの意図を表す単語等であれば、どのようなものであってもよい。

　さらに、第三候補、第四候補、・・・というように、候補となりそうな認識対象語をすべて認識対象語候補として抽出してもよい。
　なお、説明を簡単にするために、以降の説明においては、抽出部２２が抽出する認識対象語候補は２つとして説明するが、これに限られるものではない。

　対象語決定部２３は、抽出部２２から、複数の見出しと、当該各見出しに対応するコンテンツと、当該各見出しの認識対象語候補とを取得する。そして、取得した各見出しの認識対象語候補に基づいて各見出しの認識対象語を動的に生成する。
　この実施の形態２では、対象語決定部２３は、各見出しの認識対象語が異なるように各見出しの認識対象語を動的に生成する前において、抽出部２２から取得した各見出しの認識対象語候補の中に重複する認識対象語候補が存在するか否かにかかわらず、まず最初は、取得した認識対象語候補の第一候補を認識対象語として決定する。

　また、対象語決定部２３は、制御部２６から、制御部２６が指定した見出し（選択した見出し）に対応する認識対象語を再決定（再生成）する旨の指示を受けると、少なくとも１つの見出しについて、当該見出しに対応付けられている認識対象語第二候補を新たな認識対象語に決定する。すなわち、各見出しの認識対象語が互いに異なるように各見出しの認識対象語を動的に再生成する。

　なお、対象語決定部２３は、見出しの選択以外の操作に関する認識語彙のリスト（例えば、ナビゲーション装置や他の車載機器等を操作するための操作コマンド等のリスト）を有しており、当該リストに含まれる単語等と認識対象語が一致または類似しないように、新たな認識対象語を決定するとしてもよい。

　具体的には、例えば、図５に示す見出しに加えて「楽大のエアコンの売れ行き好調」という見出しがあった場合、抽出部２２により「らくだい」が認識対象語第一候補、「えあこん」が認識対象語第二候補として抽出されたとすると、対象語決定部２３が「えあこん」をこの見出しの認識対象語として決定すると、車載機器であるエアコン装置に対する「エアコン」という操作コマンドと一致してしまうため、このようなものは新たな認識対象語に決定しないようにする。

　辞書生成部１４は、対象語決定部２３により決定された認識対象語を認識語彙とする音声認識辞書１５を生成する。
　制御部２６は、対象語決定部２３から、見出しと、当該見出しに対応する認識対象語と、同じくその見出しに対応するコンテンツとを取得し、記憶部１７に格納する。
　図１５は、実施の形態２において、記憶部１７に格納された各見出しの認識対象語、各見出し、各見出しに対応するコンテンツ（ニュース本文）の一例を示す表である。

　この図１５は、前述のとおり、対象語決定部２３により、まずは各見出しの認識対象語第一候補が認識対象語として決定されて、制御部２６に出力され、記憶部１７に記憶された状態を示している。すなわち、見出し「楽大日本シリーズ初進出」の認識対象語は「らくだい」、見出し「ダルビがノーヒットノーラン逃す」の認識対象語は「だるび」、見出し「楽大の中田が大リーグへ移籍を希望」の認識対象語は「らくだい」となっている。

　また、制御部２６は、対象語決定部２３から取得した見出しを提示するよう、ディスプレイ等に対して指示出力する。具体的には、対象語決定部２３から取得した見出しを表示するよう、ディスプレイ３へ指示出力する。または、当該見出しに対応する合成音声を生成するよう音声合成部１９に指示出力した後、音声合成部１９により生成された合成音声を出力するよう、スピーカ４へ指示出力する。

　なお、制御部２６から見出しを提示するよう指示出力する方法としては、表示出力、または、音声出力の少なくとも一方により行うとしてもよいし、表示と音声の両方により出力を行うようにしてもよい。
　また、音声合成部１９による音声合成の方法については、公知の技術を用いればよいため、説明を省略する。

　さらに、制御部２６は、音声認識部１８により出力された認識結果文字列を検索キーとして、記憶部１７を検索する。そして、複数の認識対象語が検索キーと一致する場合、対象語決定部２３に対して、検索キーと一致する各認識対象語に対応する見出しについて、認識対象語を再決定するよう指示出力する。すなわち、制御部２６は、音声による音声認識結果が対象語決定部２３により生成された複数の認識対象語と一致した場合に、当該認識対象語が同一である２以上の見出しに絞り込み、当該絞り込んだ見出しについて、重複する認識対象語候補（認識対象語第一候補）とは異なる他の認識対象語候補（認識対象語第二候補）を認識対象語として再生成するよう、対象語決定部２３に対して指示を行う。

　具体的には、ユーザにより「らくだい」と発話された場合、音声認識部１８により「らくだい」が認識結果文字列として出力され、この「らくだい」を検索キーとして記憶部１７を検索、すなわち、図１５に示す表を検索すると、一番目の見出しの認識対象語と三番目の見出しの認識対象語が一致するため、制御部２６は、対象語決定部２３に対して、認識対象語を再決定するよう指示出力する。

　この結果、対象語決定部２３により認識対象語が再決定され、例えば、見出し「楽大日本シリーズ初進出」の認識対象語は第二候補であった「にほんしりーず」に、見出し「ダルビがノーヒットノーラン逃す」の認識対象語は「だるび」のまま、見出し「楽大の中田が大リーグへ移籍を希望」の認識対象語は第二候補であった「なかた」に再決定され、制御部２６および辞書生成部１４に出力される。

　そして、辞書生成部１４は再び、対象語決定部２３により決定された認識対象語を認識語彙とする音声認識辞書１５を生成する。
　また、制御部２６は、対象語決定部２３により再決定された認識対象語を取得し、記憶部１７に格納されている各見出しに対する認識対象語を、再決定された認識対象語に更新する。
　図１６は、実施の形態２において、認識対象語が再決定されて、記憶部１７に格納された各見出しの認識対象語、各見出し、各見出しに対応するコンテンツ（ニュース本文）の一例を示す表である。

　さらに、制御部２６は、検索キーと一致した認識対象語に対応する見出しと他の見出しとを異なる表示態様で表示するよう、ディスプレイ３に対して指示出力する。
　これにより、図１２に示すような、ニュースの見出しが絞り込まれた表示画面がディスプレイ３に表示される。

　また、制御部２６は、音声認識部１８により出力された認識結果文字列を検索キーとして記憶部１７を検索した結果、検索キーと一致する認識対象語が１つであった場合（複数存在しなかった場合）には、その検索キーと一致する認識対象語に対応する見出しを選択し、その見出しに対応するコンテンツを取得する。すなわち、制御部２６は、音声による音声認識結果が対象語決定部２３により生成された認識対象語と一致した場合に、当該一致した音声認識結果を認識対象語とする見出しを選択し、その選択された見出しに対応するコンテンツを取得する。

　そしてその後、取得したコンテンツを提示するよう、ディスプレイ等に対して指示出力する。具体的には、取得したコンテンツを表示するよう、ディスプレイ３へ指示出力する。または、取得したコンテンツを用いて合成音声を生成するよう音声合成部１９に指示出力し、音声合成部１９により生成された合成音声を出力するよう、スピーカ４へ指示出力する。

　なお、この場合にも、制御部２６からコンテンツを提示するよう指示出力する方法としては、表示出力、または、音声出力の少なくとも一方により行うとしてもよいし、表示と音声の両方により出力を行うようにしてもよい。

　次に、この実施の形態２における情報提供システム２０の動作について、図１７および図１８を参照しながら具体的に説明する。図１７は、実施の形態２の情報提供システム２０における音声認識辞書生成までの動作を示すフローチャートである。また、図１８は、実施の形態２の情報提供システム２０における記憶部１７へのコンテンツ等の格納・更新、および、コンテンツを提示する動作を示すフローチャートである。

　なお、この実施の形態２においても、図１１に示すようなＨＴＭＬ形式で記述されたテキストが、情報提供システム２０の処理対象であるものとして説明する。
　また、コンテンツであるニュース本文は、「news1.html」「news2.html」「news3.html」に記述されており、その内容は、図５に示すように「楽大が今日の東部戦に１対０で勝利したため、初の日本シリーズ進出が決定しました。」「ダルビは９回ツーアウトの状況で４番マークにヒットを打たれノーヒットノーランを逃しました。」「楽大の中田が今日の午後、記者会見で大リーグへの移籍を希望していると発表しました。」であるとする。

　さらに、この実施の形態２における情報提供システム２０は、見出しをディスプレイに表示し、ユーザ発話により選択された見出しに対応するコンテンツを音声出力するものとして説明する。これは、例えば車両の運転中など、詳細なニュース本文をディスプレイに表示させても、ユーザが内容を読むことができない場合などを考慮したものである。

　初めに、図１７に示すフローチャートを用いて、音声認識辞書生成の動作について説明する。
　まず、取得部１０が、ネットワーク２を介してコンテンツ情報を取得する（ステップＳＴ３１）。ここでは、図１１に示すようなコンテンツ情報（テキスト情報からなるニュース情報）を取得するものとする。

　次に、解析部１１は、取得部１０により取得されたコンテンツ情報の内容を解析し、コンテンツと、当該コンテンツの見出しを取得する（ステップＳＴ３２）。
　具体的には、解析部１１は、取得部１０により取得されたコンテンツ情報（テキスト情報からなるニュース情報）の構造を解析し、</A>タグで指定された「<A HREF=”news1.html”>楽大日本シリーズ初進出</A>」から、このニュース（コンテンツ）の見出しとして「楽大日本シリーズ初進出」を取得する。

　続いて、抽出部２２は、解析部１１により取得されたすべての見出しから、複数の認識対象語候補を抽出する（ステップＳＴ３３）。
　その結果、図１４に示すように、見出し「楽大日本シリーズ初進出」からは「らくだい」と「にほんしりーず」、見出し「ダルビがノーヒットノーラン逃す」からは「だるび」と「のーひっと」、見出し「楽大の中田が大リーグへ移籍を希望」からは「らくだい」と「なかた」が、それぞれ認識対象語候補として抽出される。

　次に、対象語決定部２３は、抽出部２２により抽出された複数の認識対象語候補と見出しとコンテンツを取得し、重複する認識対象語候補があるか否かにかかわらず、抽出部２２から取得した認識対象語候補のうち第一候補を音声認識対象語に決定する（ステップＳＴ３４）。

　その結果、図１５に示すように、見出し「楽大日本シリーズ初進出」に対しては「らくだい」、見出し「ダルビがノーヒットノーラン逃す」に対しては「だるび」、見出し「楽大の中田が大リーグへ移籍を希望」に対しては「らくだい」が、各見出しに対応する認識対象語として決定される。

　その後、辞書生成部１４は、対象語決定部２３により決定された認識対象語を認識語彙とする音声認識辞書１５を生成する（ステップＳＴ３５）。
　この場合には、「らくだい」と「だるび」を認識語彙とする音声認識辞書１５が生成される。

　見出しの出力と記憶部１７へのコンテンツ等の格納の動作については、実施の形態１における図９に示すフローチャートと同一であるため、説明を省略する。
　図９に示すフローチャートにしたがって処理が行われた結果、図１５に示すように、各見出しに対応する認識対象語と、各見出しと、各見出しに対応するコンテンツ（ニュース本文）が記憶部１７に格納される。

　最後に、図１８に示すフローチャートを用いて、記憶部１７へのコンテンツ等の格納・更新、および、コンテンツの出力の動作について説明する。
　まず、音声認識部１８は、マイク５により取得された音声を認識し、認識結果文字列を制御部２６に出力する（ステップＳＴ４１）。
　例えば、ユーザにより「らくだい」が発話されると、音声認識部１８は音声認識辞書１５を参照して認識処理を行い、認識結果として文字列「らくだい」を出力する。

　次に、制御部２６は、音声認識部１８により出力された認識結果文字列を取得し、当該取得した認識結果文字列と一致する認識対象語が記憶部１７に複数存在するか否かを判定する（ステップＳＴ４２）。すなわち、取得した認識結果文字列を検索キーとして記憶部１７を検索する。

　そして、検索キーと一致する認識対象語が複数存在する場合（ステップＳＴ４２の「ＹＥＳ」の場合）、各認識対象語に対応する見出しと他の見出しとの表示態様が異なるものとなるよう、ディスプレイ３に対して指示出力する（ステップＳＴ４３）。
　その結果、図１２に示すように、各見出しがディスプレイ３に表示される。

　続いて、制御部２６は、対象語決定部２３に対して、検索キーと一致する各認識対象語に対応する見出しについて、認識対象語を再決定するよう指示出力する。そして、対象語決定部２３は、制御部２６からの当該指示を受けて、各見出しに対応付けられている複数の認識対象語候補のうち第二候補を新たに認識対象語に決定する（ステップＳＴ４４）。

　その結果、図１６に示すように、見出し「楽大日本シリーズ初進出」に対しては「にほんしりーず」、見出し「楽大の中田が大リーグへ移籍を希望」に対しては「なかた」が、各見出しに対応する認識対象語として再決定される。

　そして、制御部２６は、対象語決定部２３により再決定された認識対象語を取得し、記憶部１７に格納されている各見出しに対する認識対象語を、再決定された認識対象語に更新する（ステップＳＴ４５）。
　その結果、記憶部１７に格納されていた情報は、図１５に示す内容から、図１６に示す内容へと、記憶部１７の内容が更新される。

　その後、辞書生成部１４は、対象語決定部２３により決定された認識対象語を認識語彙とする音声認識辞書１５を生成し（ステップＳＴ４６）、処理を終了する。
　その結果、「にほんしりーず」「だるび」「なかた」を認識語彙とする音声認識辞書１５が生成される。

　なお、この場合にも、例えば図１２に示すようにディスプレイ３に表示されている見出しの中の「日本シリーズ」という単語と「中田」という単語を色替え表示したり強調表示したりすることにより、一番目の見出しの認識対象語が「にほんしりーず」、三番目の見出しの認識対象語が「なかた」であることを、ユーザに知らせることができるようにしてもよい。

　一方、制御部２６は、検索キーと一致する認識対象語が複数存在しない場合（ステップＳＴ４２の「ＮＯ」の場合）、検索キーと一致する認識対象語に対応する見出しを選択し、当該見出しに対応するコンテンツを取得する。すなわち、音声認識部１８により出力された認識結果文字列に対応するコンテンツ情報を取得する（ステップＳＴ４７）。

　具体的には、例えば、ステップＳＴ４６の処理の後、ユーザにより「なかた」が発話されたとする。その場合、音声認識部１８は、音声認識辞書１５を参照して認識処理を行い、認識結果文字列「なかた」を出力する。そして、記憶部１７には、「なかた」と一致する認識対象語が複数存在しないので、制御部２６は、音声認識部１８により出力された「なかた」という認識結果文字列に対応するコンテンツ（ニュース本文）の文字列「楽大の中田が今日の午後、記者会見で大リーグへの移籍を希望していると発表しました。」を記憶部１７から取得する。

　その後、制御部２６は、当該取得したコンテンツ（ニュース本文）の文字列を用いて合成音声を生成するよう、音声合成部１９に指示出力し（ステップＳＴ４８）、音声合成部１９により生成された合成音声を取得し、その合成音声によりコンテンツ（ニュース本文）を出力（提示）するよう、スピーカ４に対して指示出力する（ステップＳＴ４９）。

　その結果、「楽大の中田が今日の午後、記者会見で大リーグへの移籍を希望していると発表しました。」という合成音声が、スピーカ４から出力される。
　なお、前述のとおり、ここでは、ユーザが選択した見出しに対応するコンテンツ（ニュース本文）の文字列を音声出力するものとして説明したが、制御部２６がステップＳＴ４７において取得したコンテンツ情報に基づいて、当該取得したコンテンツ（ニュース本文）の文字列をディスプレイ３に表示させるようにしてもよい。また、表示と音声出力の両方を行うものであってもよい。

　このように、複数の見出しを提示して、当該複数の見出しの中から１つの見出しを選択し、選択された見出しに対応する情報（コンテンツ）を提示する情報提供システム２０が、その見出しを選択するための認識対象語が重複する場合、ユーザによる当該認識対象語の発話を認識した後に、各見出し間で重複しない新たな認識対象語を決定するようにしたので、ユーザの誤認識を防止し、ユーザが選択した見出しに対応する情報（コンテンツ）を取得することができる。

　なお、この実施の形態２では、最初に複数の認識対象語候補をすべて抽出するものとして説明したが、最初は認識対象語の第一候補だけを抽出して認識対象語を決定し、制御部２６から再決定の指示があった場合に、次の候補（第二候補）を認識対象語として決定する、というようにしてもよい。

　また、この実施の形態２では、見出しの絞り込みが１回である場合を例に説明したが、これに限定されるものではなく、複数回の見出しの絞り込みを行った後において、各見出しに対する認識対象語が重複する場合に、各見出しの認識対象語が互いに異なるように各見出しの認識対象語を動的に生成することを含むとしてもよい。

　例えば、見出しが１０個あり、その中の５個の見出しに対応する認識対象語（ここでは「Ａ」とする。）が同一であるとする。そして、「Ａ」が発話された結果、当該「Ａ」を含む５個の見出しに絞り込まれ、対象語決定部２３に対して認識対象語を再生成するよう指示が行われたものとする。

　ここで、対象語決定部２３は、絞り込まれた５個の見出しに対応付けられている第二候補の認識対象語候補が重複しているか否かにかかわらず、各見出しの認識対象語第二候補を各見出しに対する認識対象語に決定する。その結果、さらに２個の見出しに対する認識対象語「Ｂ」が重複しているものとする。

　そして、「Ｂ」が発話されると、制御部２６は、認識対象語「Ｂ」を含む２個の見出しに絞り込み、対象語決定部２３に対して認識対象語を再生成するよう指示を行う。
　その後、当該指示を受けた対象語決定部２３は、絞り込まれた見出しに対応付けられている第二候補の認識対象語候補が重複しているもののみになったので、各見出しの認識対象語が互いに異なるように各見出しの認識対象語を動的に生成する。

　なお、対象語決定部２３は、認識対象語候補が重複している場合、かつ、重複しているもののみになった場合に、各見出しの認識対象語が互いに異なるように各見出しの認識対象語を動的に生成するとしたが、絞り込みがあらかじめ定められた回数以上行われた場合（制御部２６からの認識対象語再生成の指示があらかじめ定められた回数以上となった場合）において、認識対象語候補が重複する場合に、各見出しの認識対象語が互いに異なるように各見出しの認識対象語を動的に生成するとしてもよい。

　以上のように、この実施の形態２によれば、複数の見出しの中から１つの見出しを選択するための認識対象語が重複する場合、ユーザによる当該認識対象語の発話を認識した後に、各見出し間で重複しない新たな認識対象語を決定するようにしたので、ユーザの誤認識を防止し、ユーザにとっての利便性が向上する。

　なお、本願発明はその発明の範囲内において、各実施の形態の自由な組み合わせ、あるいは各実施の形態の任意の構成要素の変形、もしくは各実施の形態において任意の構成要素の省略が可能である。

　この発明の情報提供システムは、複数の見出しを提示して、当該複数の見出しの中から１つの見出しを選択し、選択された見出しに対応する情報（コンテンツ）を提示するものであれば、どのような装置や機器に適用してもよい。また、この情報提供システムの構成要素は、ネットワーク上のサーバ、スマートフォン等の携帯端末、車載機器等に分散されていてもよい。

　１，２０　情報提供システム、２　ネットワーク、３　ディスプレイ、４　スピーカ、５　マイク、１０　取得部、１１　解析部、１２，２２　抽出部、１３，２３　対象語決定部、１４　辞書生成部、１５　音声認識辞書、１６，２６　制御部、１７　記憶部、１８　音声認識部、１９　音声合成部、１００　バス、１０１　ＣＰＵ、１０２　ＲＯＭ、１０３　ＲＡＭ、１０４　入力装置、１０５　通信装置、１０６　ＨＤＤ、１０７　出力装置。

Claims

　複数の見出しを提示して、当該複数の見出しの中の１つを選択し、選択された見出しに対応するコンテンツを提示する情報提供システムにおいて、
　前記複数の見出しを取得し、当該取得した各見出しから認識対象語候補を抽出する抽出部と、
　前記抽出部から、前記各見出しの認識対象語候補を取得し、当該取得した各見出しの認識対象語候補に基づいて前記各見出しの認識対象語を生成する対象語決定部と、
　音声による音声認識結果が前記対象語決定部により生成された認識対象語と一致した場合に、当該一致した音声認識結果を認識対象語とする見出しに対応するコンテンツを提示するよう指示を行う制御部とを備え、
　前記対象語決定部は、前記取得した各見出しの認識対象語候補の中に重複する認識対象語候補が存在する場合、前記各見出しの認識対象語が互いに異なるように前記各見出しの認識対象語を動的に生成する
　ことを特徴とする情報提供システム。
　前記対象語決定部は、前記取得した各見出しの認識対象語候補の中に重複する認識対象語候補が存在する場合、当該重複する認識対象語候補の少なくとも１つを加工して、前記各見出しの認識対象語が互いに異なるものになるように認識対象語を動的に生成する
　ことを特徴とする請求項１記載の情報提供システム。
　前記対象語決定部は、前記重複する認識対象語候補を含む見出しの提示位置または提示順序を特定し、当該特定した提示位置または提示順序に基づいて前記認識対象語候補を加工する
　ことを特徴とする請求項２記載の情報提供システム。
　前記対象語決定部は、前記重複する認識対象語候補に他の単語または単語列を追加することにより、前記認識対象語候補を加工する
　ことを特徴とする請求項２記載の情報提供システム。
　前記対象語決定部は、前記取得した各見出しの認識対象語候補の中に重複する認識対象語候補が存在する場合、当該重複する認識対象語候補の少なくとも１つを他の認識対象語候補に置換する
　ことを特徴とする請求項１記載の情報提供システム。
　前記対象語決定部は、前記重複する認識対象語候補を含む見出しの意味を解析し、当該意味に相当する用語を他の認識対象語候補として、前記重複する認識対象語候補の少なくとも１つを置換する
　ことを特徴とする請求項５記載の情報提供システム。
　前記対象語決定部は、前記重複する認識対象語候補を含む見出しに含まれる他の認識対象語候補に、前記認識対象語候補を置換する
　ことを特徴とする請求項５記載の情報提供システム。
　前記対象語決定部は、前記各見出しの認識対象語が互いに異なるように前記各見出しの認識対象語を動的に生成する前において、前記取得した各見出しの認識対象語候補の中に重複する認識対象語候補が存在するか否かにかかわらず、当該認識対象語候補を前記各見出しの認識対象語として決定するとともに、
　前記制御部は、音声による音声認識結果が前記対象語決定部により決定された複数の認識対象語と一致した場合に、当該認識対象語が同一である２以上の見出しに絞り込み、当該絞り込んだ各見出しについて、前記重複する認識対象語候補とは異なる認識対象語候補を認識対象語として再生成するよう前記対象語決定部に対して指示を行う
　ことを特徴とする請求項１記載の情報提供システム。
　前記対象語決定部は、機器の操作コマンドとは異なるものになるように、前記認識対象語を動的に生成する
　ことを特徴とする請求項１記載の情報提供システム。