JP5042799B2

JP5042799B2 - 音声チャットシステム、情報処理装置およびプログラム

Info

Publication number: JP5042799B2
Application number: JP2007325275A
Authority: JP
Inventors: 宜典倉田; 浩明小川; 元樹中出; 等本田; 大介石塚
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2007-04-16
Filing date: 2007-12-17
Publication date: 2012-10-03
Anticipated expiration: 2027-12-17
Also published as: CN101309327B; CN101309327A; JP2008287697A

Description

本発明は、音声チャットシステム、情報処理装置およびプログラムに関する。

インターネット関連技術の発達により、パーソナルコンピュータ（ＰｅｒｓｏｎａｌＣｏｍｐｕｔｅｒ：ＰＣ）間で、音声によるチャット（以下、「音声チャット」ともいう。）を実現することが可能となった。

ＰＣにインストールされた音声チャットアプリケーション等で会話内容と関連する情報をＰＣの表示装置に表示等できれば、チャットを行っているユーザの利便性を向上できる。このような観点から、音声チャットの会話内容を音声認識し、キーワードを抽出してデータベースから関連する情報を検索して画面に表示するシステムが、既に報告されている（特許文献１参照。）。

他方、音声チャットとは関係なく、単純に２台のＰＣのブラウザで同じ画面を見ることが出来るように同期するシステムについても、既に発表されている。

特許第３５２６１０１号公報

しかしながら、特許文献１に記載のシステムでは、画面に表示されている情報を共有するために、ユーザが音声チャットの相手に対して、手動で画面に表示されている情報を送信しなくてはならず、コミュニケーションに不向きであるという問題があった。

また、ＰＣのブラウザで同じ画面を見ることが出来るように同期するシステムでは、会話とは無関係にシステムが構成されているため、会話の話題が変わる都度ユーザが手入力をして会話と関係のあるサイトを選択していく作業をする必要があり、会話内容や、話者全員の端末全てを自動的かつ効率的に同期させることが出来ないという問題があった。

そこで、本発明は、このような問題に鑑みてなされたもので、その目的は、音声チャットの会話内容と関連するキーワードを自動的かつ効率的に同期することが可能な、新規かつ改良された音声チャットシステム、情報処理装置およびプログラムを提供することにある。

さらに、本発明は、放送局から送信された放送情報中に含まれるキーワードを自動的かつ効率的に同期することが可能な、新規かつ改良された情報処理装置およびプログラムを提供する。

上記課題を解決するために、本発明のある観点によれば、音声チャットを行う複数の情報処理装置と、情報処理装置が、音声チャットの会話の中からキーワードを抽出する際に参照するキーワード抽出データベースと、情報処理装置が、抽出されたキーワードを用いて当該キーワードおよび当該キーワードに関連する記事を検索する検索エンジンと、を備え、少なくとも１つの情報処理装置は、会話より生成された音声データから、当該音声データを特徴付けるパラメータを抽出するパラメータ抽出部と、生成された音声データを認識し、パラメータおよびキーワード抽出データベースに基づいて音声データからキーワードを抽出するキーワード抽出部と、抽出したキーワードを検索エンジンによって検索し、キーワードの検索結果およびキーワードに関連する記事を取得する情報検索部と、キーワードの検索結果の所在情報と関連付けられた当該キーワードと、キーワードに関連する記事の所在情報と関連付けられた当該記事と、をそれぞれ表示する表示部と、抽出されたキーワードをチャットの相手である情報処理装置に送信し、当該チャットの相手である情報処理装置とのキーワードの同期を行うキーワード同期部と、を備える音声チャットシステムが提供される。

かかる構成によれば、音声チャットを行う情報処理装置のパラメータ抽出部は、音声チャットの会話を取り込んで生成された音声データから当該音声データを特徴付けるパラメータを抽出し、キーワード抽出部は、生成された音声データを認識してキーワード抽出データベースおよび上記パラメータに基づいて音声データからキーワードを抽出し、情報検索部は、抽出したキーワードを検索エンジンによって検索して、キーワードの検索結果およびキーワードに関連する記事を取得し、表示部は、キーワードおよびキーワードに関連する記事を、当該キーワードの検索結果の所在情報および当該記事の所在情報とそれぞれ関連づけて表示し、キーワード同期部は、抽出されたキーワードをチャット相手である情報処理装置に送信し、チャットの相手である情報処理装置とキーワードの同期を行う。本発明に係る音声チャットシステムは、音声チャットの会話内容を自動的に音声認識してキーワードを抽出し、キーワードを自動的に音声チャットのチャット相手に送信するため、音声チャットの利便性を高めることが可能である。

上記課題を解決するために、本発明の別の観点によれば、他の情報処理装置との間で音声チャットを行う情報処理装置であって、音声チャットでの会話より生成された音声データから、当該音声データを特徴付けるパラメータを抽出するパラメータ抽出部と、生成された音声データを認識し、キーワード抽出データベースおよび上記パラメータに基づいて音声データからキーワードを抽出するキーワード抽出部と、抽出したキーワードを検索エンジンによって検索し、キーワードの検索結果およびキーワードに関連する記事を取得する情報検索部と、検索結果および記事を当該検索結果の所在情報および当該記事の所在情報とそれぞれ関連付けて蓄積する検索情報蓄積部と、を備える情報処理装置が提供される。

かかる構成によれば、パラメータ抽出部は、音声チャットでの会話より生成された音声データから、当該音声データを特徴付けるパラメータを抽出し、キーワード抽出部は、生成された音声データを認識し、キーワード抽出データベースに基づいて音声データからキーワードを抽出し、情報検索部は、抽出したキーワードを検索エンジンによって検索し、キーワードの検索結果およびキーワードに関連する記事を取得し、検索情報蓄積部は、キーワードおよびキーワードに関連する記事を当該キーワードの検索結果の所在情報および当該記事の所在情報とそれぞれ関連付けて蓄積する。音声データの生成から検索情報の取得までの処理は、情報処理装置によって自動的に行われるために、情報処理装置のユーザは、特別な作業をする必要がなく、また、音声チャットの話題となりうる情報を自動的に取得することが可能となる。

上記の情報処理装置は、抽出したキーワードをチャットの相手である情報処理装置に送信し、当該チャットの相手である情報処理装置とのキーワードの同期を行うキーワード同期部を更に備えてもよい。かかる構成によれば、キーワード同期部は、抽出したキーワードをチャットの相手である情報処理装置に送信して、キーワードの同期処理を行う。抽出したキーワードをチャットの相手である情報処理装置に自動的に送信するので、音声チャットの相手同士は、特別な作業をすることなく、抽出したキーワードを共有することが可能となる。

上記の情報処理装置は、キーワード抽出データベースを記憶するデータベース記憶部を更に備えてもよい。かかる構成によれば、キーワード抽出データベースが、情報処理装置に設けられたデータベース記憶部に格納されることとなり、情報処理装置がキーワード抽出データベースにアクセスするために要する時間を短縮することができる。その結果、情報処理装置において、キーワード抽出に要する時間を短縮することができる。

上記の情報処理装置は、検索エンジンを当該情報処理装置内に備えてもよい。かかる構成によれば、検索エンジンが情報処理装置に配置されることとなる。その結果、情報処理装置が検索エンジンにアクセスするために要する時間を短縮することができる。その結果、キーワードに関連する情報検索に要する時間を短縮することができる。

上記の情報処理装置は、キーワードの検索結果の所在情報と関連付けられた当該キーワードと、キーワードに関連する記事の所在情報と関連付けられた当該記事とをそれぞれ表示する表示部を更に備えてもよい。かかる構成によれば、表示部には、キーワードおよびキーワードに関連する記事が、キーワードの検索結果の所在情報および記事の所在情報とそれぞれ関連づけられて表示される。キーワードだけでなくキーワードに関連する記事が併せて記載されるため、併せて表示された記事の中に興味のある情報がある場合には、興味のある情報に、容易に情報にアクセスすることができる。

上記の情報処理装置は、キーワードの参照履歴を記憶する参照履歴記憶部を更に備えてもよい。かかる構成によれば、情報処理装置に設けられた参照履歴記憶部には、キーワードの参照履歴が格納される。情報処理装置が音声データからキーワードを抽出する際に参照履歴記憶部を参照することで、効率の良いキーワード抽出を行うことができる。

上記の参照履歴記憶部は、参照したキーワードと個々のチャットに付与される識別子とを関連付けて記憶するとともに、参照したキーワードとチャット相手とを関連付けて記憶してもよい。かかる構成によれば、参照したキーワードに関する情報と、個々のチャットに付与される識別子およびチャット相手とが、関連づけられて参照履歴記憶部に記憶される。かかる参照履歴記憶部の記憶内容を用いることで、より効率的なキーワード抽出を行うことが可能となる。

上記のキーワード抽出部は、参照履歴の上位に位置するキーワードを優先的に抽出してもよく、検索エンジンの上位検索キーワードを優先的に抽出してもよい。かかる構成によれば、参照履歴の上位に位置するキーワードや検索エンジンの上位検索キーワードが、キーワード抽出部により優先的に抽出される。このようなキーワードは、音声チャットにおいて話題となりうるキーワードであるため、音声認識における認識精度を向上させることが可能となる。

上記課題を解決するために、本発明の更に別の観点によれば、音声チャットでの会話より生成された音声データから当該音声データを特徴付けるパラメータを抽出するパラメータ抽出部と、生成された音声データを認識し、キーワード抽出データベースおよび上記パラメータに基づいて音声データからキーワードを抽出するキーワード抽出部と、抽出したキーワードを検索エンジンによって検索し、キーワードの検索結果およびキーワードに関連する記事を取得する情報検索部と、キーワードおよび記事を当該キーワードの検索結果の所在情報および当該記事の所在情報とそれぞれ関連付けて蓄積する検索情報蓄積部と、を備える他の情報処理装置との間で音声チャットを行う情報処理装置であって、上記の他の情報処理装置から自動的に送信されたキーワードを受信し、当該他の情報処理装置とのキーワードの同期を行うキーワード同期部を備える情報処理装置が提供される。

かかる構成によれば、キーワード同期部は、パラメータ抽出部と、キーワード抽出部と、情報検索部と、検索情報蓄積部とを備える音声チャットの相手である他の情報処理装置からキーワードを受信して、他の情報処理装置とのキーワードの同期を行う。音声認識やキーワード抽出といった負荷のかかる処理を、音声チャットの相手である他の情報処理装置に実行してもらうことが可能となるため、情報処理装置に負荷をかけることなく音声チャットを行うことが可能となる。

上記課題を解決するために、本発明の更に別の観点によれば、コンピュータに、音声チャットでの会話より生成された音声データから、当該音声データを特徴付けるパラメータを抽出するパラメータ抽出機能と、生成された音声データを認識し、キーワード抽出データベースおよび上記パラメータに基づいて音声データからキーワードを抽出するキーワード抽出機能と、抽出したキーワードを検索エンジンによって検索し、キーワードの検索結果およびキーワードに関連する情報を取得する情報検索機能と、キーワードおよび記事を当該キーワードの検索結果の所在情報および当該記事の所在情報とそれぞれ関連付けて蓄積する検索情報蓄積機能と、を実現させるためのプログラムが提供される。

かかる構成によれば、コンピュータプログラムは、コンピュータが備える記憶部に格納され、コンピュータが備えるＣＰＵに読み込まれて実行されることにより、そのコンピュータを上記の情報処理装置として機能させる。また、コンピュータプログラムが記録された、コンピュータで読み取り可能な記録媒体も提供することができる。記録媒体は、例えば、磁気ディスク、光ディスク、光磁気ディスク、フラッシュメモリなどである。また、上記のコンピュータプログラムは、記録媒体を用いずに、例えばネットワークを介して配信してもよい。

上記課題を解決するために、本発明の更に別の観点によれば、コンピュータに、他の情報処理装置から送信されたキーワードを受信し、当該他の情報処理装置とのキーワードの同期を行うキーワード同期機能を実現させるためのプログラムが提供される。

上記課題を解決するために、本発明の更に別の観点によれば、放送局から送信された放送文字情報を受信する放送文字情報受信部と、キーワード抽出データベースに基づいて放送文字情報からキーワードを抽出するキーワード抽出部と、抽出したキーワードを検索エンジンによって検索し、キーワードの検索結果およびキーワードに関連する記事を取得する情報検索部と、外部表示装置との接続制御を行い、キーワード、キーワードの検索結果およびキーワードに関連する記事を外部表示装置へと出力する外部表示装置接続制御部と、を備える情報処理装置が提供される。

かかる構成によれば、放送文字情報受信部は、放送局から送信された放送文字情報を受信し、キーワード抽出部は、キーワード抽出データベースに基づいて放送文字情報からキーワードを抽出し、情報検索部は、抽出したキーワードを検索エンジンによって検索し、キーワードの検索結果およびキーワードに関連する記事を取得し、外部表示装置接続制御部は、外部表示装置との接続制御を行い、キーワード、キーワードの検索結果およびキーワードに関連する記事を外部表示装置へと出力する。放送文字情報の受信から検索情報の取得までの処理は、情報処理装置によって自動的に行われるために、情報処理装置のユーザは、特別な作業をする必要がなく、また、取得した検索情報を外部表示装置に自動的に表示させることが可能となる。

放送文字情報受信部は、情報処理装置に接続された外部表示装置から、当該外部表示装置が受信している放送チャンネルに関する受信チャンネル情報と、放送チャンネルに対応する放送文字情報と、を取得してもよい。また、放送文字情報受信部は、情報処理装置に接続された外部表示装置から当該外部表示装置が受信している放送チャンネルに関する受信チャンネル情報を取得するとともに、放送局から放送チャンネルに対応した放送文字情報を取得してもよい。

情報処理装置は、外部表示装置でのキーワードの参照履歴を記憶する参照履歴記憶部を更に備え、外部表示装置接続制御部は、外部表示装置で選択されたキーワードを、検索エンジンに通知してもよい。

情報処理装置は、抽出したキーワードを他の情報処理装置に送信し、当該他の情報処理装置とのキーワードの同期を行うキーワード同期部を更に備えてもよい。

上記課題を解決するために、本発明の更に別の観点によれば、放送局から送信された放送音声情報を受信する放送音声情報受信部と、放送音声情報に含まれる音声データから、当該音声データを特徴付けるパラメータを抽出するパラメータ抽出部と、音声データを認識し、キーワード抽出データベースおよびパラメータに基づいて音声データからキーワードを抽出するキーワード抽出部と、抽出したキーワードを検索エンジンによって検索し、キーワードの検索結果およびキーワードに関連する記事を取得する情報検索部と、外部表示装置との接続制御を行い、キーワード、キーワードの検索結果およびキーワードに関連する記事を外部表示装置へと出力する外部表示装置接続制御部と、を備える情報処理装置が提供される。

かかる構成によれば、放送音声情報受信部は、放送局から送信された放送音声信号を受信し、パラメータ抽出部は、放送音声情報に含まれる音声データから、当該音声データを特徴付けるパラメータを抽出し、キーワード抽出部は、音声データを認識し、キーワード抽出データベースおよびパラメータに基づいて音声データからキーワードを抽出し、情報検索部は、抽出したキーワードを検索エンジンによって検索し、キーワードの検索結果およびキーワードに関連する記事を取得し、外部表示装置接続制御部は、外部表示装置との接続制御を行い、キーワード、キーワードの検索結果およびキーワードに関連する記事を外部表示装置へと出力する。放送音声情報に含まれる音声データの受信から検索情報の取得までの処理は、情報処理装置によって自動的に行われるために、情報処理装置のユーザは、特別な作業をする必要がなく、また、取得した検索情報を外部表示装置に自動的に表示させることが可能となる。

放送音声情報受信部は、情報処理装置に接続された外部表示装置から、当該外部表示装置が受信している放送チャンネルに関する受信チャンネル情報と、放送チャンネルに対応する放送音声情報と、を取得してもよい。また、放送音声情報受信部は、情報処理装置に接続された外部表示装置から当該外部表示装置が受信している放送チャンネルに関する受信チャンネル情報を取得するとともに、放送局から放送チャンネルに対応した放送音声情報を取得してもよい。

上記課題を解決するために、本発明の更に別の観点によれば、放送局から放送された放送文字情報を受信する放送文字情報受信機能と、キーワード抽出データベースに基づいて放送文字情報からキーワードを抽出するキーワード抽出機能と、抽出したキーワードを検索エンジンによって検索し、キーワードの検索結果およびキーワードに関連する記事を取得する情報検索機能と、外部表示装置との接続制御を行い、キーワードの検索結果およびキーワードに関連する記事を外部表示装置へと出力する外部表示装置接続制御機能と、を実現させるためのプログラムが提供される。

上記課題を解決するために、本発明の更に別の観点によれば、コンピュータに、放送局から放送された放送音声情報を受信する放送音声情報受信機能と、放送音声情報に含まれる音声データから、当該音声データを特徴付けるパラメータを抽出するパラメータ抽出機能と、音声データを認識し、キーワード抽出データベースおよびパラメータに基づいて音声データからキーワードを抽出するキーワード抽出機能と、抽出したキーワードを検索エンジンによって検索し、キーワードの検索結果およびキーワードに関連する記事を取得する情報検索機能と、外部表示装置との接続制御を行い、キーワードの検索結果およびキーワードに関連する記事を外部表示装置へと出力する外部表示装置接続制御機能と、を実現させるためのプログラムが提供される。

本発明によれば、音声チャットの会話内容と関連するキーワードを自動的かつ効率的に同期することが可能である。また、本発明によれば、放送情報中に含まれるキーワードを自動的かつ効率的に同期することが可能である。

以下に添付図面を参照しながら、本発明の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。

（第１の実施形態）
以下に、本発明の第１の実施形態に係る音声チャットシステムについて、詳細に説明する。

図１は、本実施形態に係る音声チャットシステムを説明するための説明図である。音声チャットシステム１０は、例えば、通信網１２と、情報処理装置２０Ａ、２０Ｂと、キーワード抽出データベース３０と、検索エンジン４０と、を含む。

通信網１２は、情報処理装置２０、キーワード抽出データベース３０および検索エンジン４０を双方向通信または一方向通信可能に接続する通信回線網である。この通信網１２は、例えば、インターネット、電話回線網、衛星通信網、同報通信路等の公衆回線網や、ＷＡＮ（ＷｉｄｅＡｒｅａＮｅｔｗｏｒｋ）、ＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）、ＩＰ−ＶＰＮ（ＩｎｔｅｒｎｅｔＰｒｏｔｏｃｏｌ−ＶｉｒｔｕａｌＰｒｉｖａｔｅＮｅｔｗｏｒｋ）、Ｅｔｈｅｒｎｅｔ（登録商標）、ワイヤレスＬＡＮ等の専用回線網等で構成されており、有線／無線を問わない。

情報処理装置２０は、通信網１２を介して接続された他の情報処理装置２０と、音声によるチャット（音声チャット）を行う。また、情報処理装置２０は、通信網１２に接続されているキーワード抽出データベース３０および検索エンジン４０に対して、通信網１２を介してデータベースの参照を要求したり、情報の検索を要求したりすることができる。また、音声チャットを行う他の情報処理装置２０は、図示のように通信網１２を介して接続されていてもよく、また、通信網１２を介さずに、例えば、ＵＳＢ（ＵｎｉｖｅｒｓａｌＳｅｒｉａｌＢｕｓ）ポートや、ｉ．Ｌｉｎｋ等のＩＥＥＥ１３９４ポート、ＳＣＳＩ（ＳｍａｌｌＣｏｍｐｕｔｅｒＳｙｓｔｅｍＩｎｔｅｒｆａｃｅ）ポート、ＲＳ−２３２Ｃポート等により直接接続されていてもよい。

なお、図示の例では、情報処理装置２０として、デスクトップ型のＰＣを示しているが、本実施形態に係る情報処理装置２０は、デスクトップ型ＰＣ、ノート型ＰＣを問わない。また、本実施形態に係る情報処理装置２０は、かかる例に限定されず、ネットワークを介した通信機能を有する機器であれば、例えば、テレビジョン受像器や家庭用ゲーム機等の情報家電、携帯電話、ＰＤＡ（ＰｅｒｓｏｎａｌＤｉｇｉｔａｌＡｓｓｉｓｔａｎｔ）等で構成することもできる。また、情報処理装置２０は、契約者が持ち運びできるポータブルデバイス（ＰｏｒｔａｂａｌｅＤｅｖｉｃｅ）、例えば、携帯型ゲーム機、ＰＨＳ、携帯型映像／音声プレーヤなどであってもよい。

さらに、図１では、通信網１２に接続されている情報処理装置２０は、２つのみであるが、本実施形態は、上記の場合に限定されるわけではなく、情報処理装置２０は、通信網１２上に複数接続されていてもよい。

キーワード抽出データベース３０は、情報処理装置２０が音声データとなった音声チャットでの会話内容からキーワードを抽出する際に、情報処理装置２０が参照するデータベースである。このキーワード抽出データベース３０には、キーワードとなる単語についての発音、音韻、音節の連鎖関係を記述したモデルおよびキーワードのカテゴリ等の各種情報が記載されている。キーワード抽出データベース３０には、例えば、検索エンジンの上位検索キーワードや、ブログの話題となっている頻度の高い用語等がキーワードとして記載されている。また、このキーワード抽出データベース３０は、検索エンジン（検索サーバ）の上位検索キーワードやブログの話題となっている頻度の高い用語等の変化に応じて記載が随時更新される動的なデータベースであってもよく、静的なデータベースであってもよい。さらに、キーワード抽出データベース３０に記載されているキーワードは、例えばＰＬＳＡ（ＰｒｏｂａｂｉｌｉｓｔｉｃＬａｔｅｎｔＳｅｍａｎｔｉｃＡｎａｌｙｓｉｓ）モデル等で処理され、適切な話題ベクトルの形に変換されていてもよい。ここで、話題ベクトルとは、任意の話題をベクトル空間に表現して、話題の共通性等について判断するために利用されるものである。また、キーワード抽出データベース３０に記載されているキーワードには、後述する認識重み情報が付加されていてもよい。

ここで、上記のキーワードとなる単語についての発音、音韻、音節の連鎖関係とは、キーワードとしてキーワード抽出データベース３０に記載されている各単語が、発音、音韻、音節といった観点において、互いにどのように連鎖するか（接続するか）を表す関係であり、このような連鎖関係を記述する方法としては、例えば、統計的な単語連鎖確率（ｎ−ｇｒａｍやｃｌａｓｓｎ−ｇｒａｍ）、生成文法、有限状態オートマトン等がある。

検索エンジン４０は、インターネット等で公開されている情報や非公開となっている情報等についてキーワード等を使って検索できるＷｅｂサイト等のデータベースである。本実施形態に係る検索エンジン４０は、キーワードによって蓄えられている情報の全文検索を行う全文検索型であってもよく、カテゴリ別に分類されている情報を検索するディレクトリ型であってもよい。

（情報処理装置２０の構成）
次に、本実施形態に係る情報処理装置２０のハードウェア構成について、図２を参照しながら簡単に説明する。

なお、以下の説明において、単語とは、音声を認識する処理において、１つのまとまりとして扱った方がよい単位のことを言い、言語学的な単語とは必ずしも一致しない。例えば、「タロウ君」は、それ全体を１単語として扱ってもよいし、「タロウ」、「君」という２単語として扱ってもよい。さらに、もっと大きな単位である「こんにちはタロウ君」等を１単語として扱ってもよい。

また、音韻とは、音響的に１つの単位として扱った方が処理上都合のよいもののことを言い、音声学的な音韻や音素とは必ずしも一致しない。例えば、「東京」の「とう」の部分を“ｔ／ｏ／ｕ”という３個の音韻記号で表すことも可能であり、または“ｏ”の長音である“ｏ：”という記号を用意してもよい。さらに、“ｔ／ｏ／ｏ”と表してもよい。他にも、無音を表す記号を用意してもよく、さらに無音を表す記号を「発話前の無音」「発話に挟まれた短い無音区間」「「っ」」の部分の無音」のように細かく分類してもよい。

図２は、本実施形態にかかる情報処理装置２０のハードウェア構成を示した説明図である。情報処理装置２０は、主に、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）２０１と、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）２０３と、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）２０５と、ホストバス２０７と、ブリッジ２０９と、外部バス２１１と、インターフェース２１３と、入力装置２１５と、出力装置２１７と、ストレージ装置２１９と、ドライブ２２１と、通信装置２２３とを備える。

ＣＰＵ２０１は、演算処理装置および制御装置として機能し、ＲＯＭ２０３、ＲＡＭ２０５、ストレージ装置２１９、またはリムーバブル記録媒体１４に記録された各種プログラムに従って情報処理装置２０内の動作全般またはその一部を制御する。ＲＯＭ２０３は、ＣＰＵ２０１が使用するプログラムや演算パラメータ等を記憶する。ＲＡＭ２０５は、ＣＰＵ２０１の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を一次記憶する。これらはＣＰＵバス等の内部バスにより構成されるホストバス２０７により相互に接続されている。

ホストバス２０７は、ブリッジ２０９を介して、ＰＣＩ（ＰｅｒｉｐｈｅｒａｌＣｏｍｐｏｎｅｎｔＩｎｔｅｒｃｏｎｎｅｃｔ／Ｉｎｔｅｒｆａｃｅ）バスなどの外部バス２１１に接続されている。

入力装置２１５は、例えば、マウス、キーボード、タッチパネル、ボタン、スイッチおよびレバー等のユーザが操作する操作手段と、マイクロフォンやヘッドセット等の音声入力手段とを備える。また、入力装置２１５は、例えば、赤外線やその他の電波を利用したリモートコントロール手段（いわゆる、リモコン）であってもよいし、情報処理装置２０の操作に対応した携帯電話やＰＤＡ等の外部接続機器であってもよい。さらに、入力装置２１５は、例えば、上記の操作手段や音声入力手段を用いてユーザにより入力された情報に基づいて入力信号を生成し、ＣＰＵ２０１に出力する入力制御回路などから構成されている。情報処理装置２０のユーザは、この入力装置２１５を操作することにより、情報処理装置２０に対して各種のデータを入力したり処理動作を指示したりすることができる。

出力装置２１７は、例えば、ＣＲＴ（ＣａｔｈｏｄｅＲａｙＴｕｂｅ）ディスプレイ装置、液晶ディスプレイ（ＬｉｑｕｉｄＣｒｙｓｔａｌＤｉｓｐｌａｙ：ＬＣＤ）装置、プラズマディスプレイ（ＰｌａｓｍａＤｉｓｐｌａｙＰａｎｅｌ：ＰＤＰ）装置、ＥＬ（Ｅｌｅｃｔｒｏ−Ｌｕｍｉｎｅｓｃｅｎｃｅ）ディスプレイ装置およびランプなどの表示装置や、スピーカおよびヘッドホンなどの音声出力装置や、プリンタ装置、携帯電話、ファクシミリなど、取得した情報をユーザに対して視覚的または聴覚的に通知することが可能な装置で構成される。出力装置２１７は、例えば、検索エンジンを用いて検索した各種情報を出力する。具体的には、表示装置は、検索エンジンによる各種情報の検索結果をテキストまたはイメージで表示する。他方、音声出力装置は、再生された音声データ等を音声に変換して出力する。

ストレージ装置２１９は、本実施形態にかかる情報処理装置２０の記憶部の一例として構成されたデータ格納用の装置であり、例えば、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）等の磁気記憶部デバイス、半導体記憶デバイス、光記憶デバイス、または光磁気記憶デバイス等により構成される。このストレージ装置２１９は、ＣＰＵ２０１が実行するプログラムや各種データ、および外部から取得した各種データなどを格納する。

ドライブ２２１は、記憶媒体用リーダライタであり、情報処理装置２０に内蔵、あるいは外付けされる。ドライブ２２１は、装着されている磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリ等のリムーバブル記録媒体１４に記録されている情報を読み出して、ＲＡＭ２０５に出力する。また、ドライブ２２１は、装着されている磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリ等のリムーバブル記録媒体１４に記録を書き込むことも可能である。リムーバブル記録媒体１４は、例えば、ＤＶＤメディア、ＨＤ−ＤＶＤメディア、Ｂｌｕ−ｒａｙメディア、コンパクトフラッシュ（ＣｏｍｐａｃｔＦｌａｓｈ：ＣＦ）、メモリースティック、または、ＳＤメモリカード（ＳｅｃｕｒｅＤｉｇｉｔａｌｍｅｍｏｒｙｃａｒｄ）等である。また、リムーバブル記録媒体１４は、例えば、非接触型ＩＣチップを搭載したＩＣカード（ＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔｃａｒｄ）または電子機器等であってもよい。

通信装置２２３は、例えば、通信網１２に接続するための通信デバイス等で構成された通信インターフェースである。通信装置２２３は、例えば、有線または無線ＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）、Ｂｌｕｅｔｏｏｔｈ、またはＷＵＳＢ（ＷｉｒｅｌｅｓｓＵＳＢ）用の通信カード、光通信用のルータ、ＡＤＳＬ（ＡｓｙｍｍｅｔｒｉｃＤｉｇｉｔａｌＳｕｂｓｃｒｉｂｅｒＬｉｎｅ）用のルータ、または、各種通信用のモデム等である。この通信装置２２３は、他の情報処理装置２０との間で音声チャットに関する情報を送受信すると共に、例えば、インターネットや他の通信機器との間で各種の情報を送受信することができる。また、通信装置２２３に接続される通信網１２は、有線または無線によって接続されたネットワーク等により構成され、例えば、インターネット、家庭内ＬＡＮ、赤外線通信、または衛星通信等であってもよい。

以上説明した構成により、情報処理装置２０は、当該情報処理装置２０に直接接続された他の情報処理装置、または、通信網１２に接続された他の情報処理装置と音声チャットを行うことが可能になると同時に、通信網１２に接続されたキーワード抽出データベース３０や検索エンジン４０等から、各種の情報を取得することが可能となる。さらに、情報処理装置２０は、リムーバブル記録媒体１４を用いて、当該情報処理装置２０に蓄積されている情報を持ち出すことも可能である。

以上、本実施形態に係る情報処理装置２０の機能を実現可能なハードウェア構成の一例を示した。上記の各構成要素は、汎用的な部材を用いて構成されていてもよいし、各構成要素の機能に特化したハードウェアにより構成されていてもよい。従って、本実施形態を実施する時々の技術レベルに応じて、適宜、利用するハードウェア構成を変更することが可能である。また、上記のハードウェア構成は、あくまでも一例であり、これに限定されるものでないことは言うまでもない。また、利用形態によっては、ホストバス２０７や外部バス２１１、またはインターフェース２１３等を省略する構成も可能である。

続いて、本実施形態に係る情報処理装置２０の構成について詳細に説明を行うが、以下の説明においては、音声チャットを行う２つの情報処理装置２０について、便宜的に第１情報処理装置２０Ａおよび第２情報処理装置２０Ｂと称することとする。また、第１情報処理装置２０Ａおよび第２情報処理装置２０Ｂは、各情報処理装置のユーザの声を音声データ化し、音声チャットの会話相手である他の情報処理装置に対して、音声データを送信するものとする。図３は、本実施形態に係る情報処理装置２０Ａの構成を説明するためのブロック図である。

本実施形態に係る情報処理装置２０Ａは、例えば、音声入力部２３１と、音声認識部２３３と、音声会話制御部２３９と、音声出力部２４１と、情報検索部２４３と、キーワード同期部２４５と、表示部２４７と、通信部２４９と、記憶部２５１と、を備える。

音声入力部２３１は、第１情報処理装置２０Ａのユーザが発した音声である音声チャットでの会話を、第１情報処理装置２０Ａへと取り込むインターフェースであって、例えば、第１情報処理装置２０Ａに接続された入力装置であるマイクロフォンやヘッドセット等から構成される。マイクロフォンやヘッドセットに向かって発せられたユーザの会話は、自動的かつリアルタイムに第１情報処理装置２０Ａへと取り込まれ、ＡＤ（ＡｎａｌｏｇＤｉｇｉｔａｌ）変換によりアナログ信号をサンプリングおよび量子化し、ディジタル信号である音声データとして音声入力部２３１により音声認識部２３３へと伝送される。

音声認識部２３３は、例えば、ＣＰＵ、ＲＯＭ、ＲＡＭ等で構成され、音声入力部２３１から伝送された音声データに基づいてリアルタイム言語認識を行う。この音声認識部２３３は、例えば、パラメータ抽出部２３５と、キーワード抽出部２３７と、を更に備える。

パラメータ抽出部２３５は、生成された音声データについて、適当なフレーム毎（適当な時間間隔毎）に、例えば、メル周波数ケプストラム係数（ＭｅｌＦｒｅｑｕｅｎｃｙＣｅｐｓｔｒｕｍＣｏｅｆｆｉｃｉｅｎｔｓ：ＭＦＣＣ）とその時間差分パラメータや、音声データのスペクトル、パワー線形予測係数、ケプストラム係数、線スペクトル対等の特徴パラメータを抽出する。

パラメータ抽出部２３５は、抽出された特徴パラメータをキーワード抽出部２３７に伝送する。また、パラメータ抽出部２３５は、抽出した特徴パラメータを、例えば後述する記憶部２５１に格納してもよい。

キーワード抽出部２３７は、パラメータ抽出部２３５により生成・抽出された特徴パラメータと、キーワード抽出データベース３０とに基づいて、第１情報処理装置２０Ａのユーザが発した会話のディジタルデータである音声データから、キーワードを抽出する。キーワード抽出部２３７がキーワードを抽出する際には、キーワード抽出部２３７は、通信部２４９を介して、通信網１２に接続されているキーワード抽出データベース３０を参照することが可能である。

通常、ユーザが音声チャット時に発する会話の文章の中には、複数のキーワードが含まれているものであり、キーワード抽出部２３７は、会話の文章の中に存在する全てのキーワードを、自動的に抽出する。キーワード抽出部２３７は、抽出したキーワードを、後述する情報検索部２４３へと伝送する。また、キーワード抽出部２３７は、抽出したキーワードを、記憶部２５１に格納してもよい。

なお、音声認識部２３３が、音声入力部２３１から伝送された音声を認識し、キーワードを抽出する方法については、以下で改めて説明する。

音声会話制御部２３９は、例えば、ＣＰＵ、ＲＯＭ、ＲＡＭ等で構成され、通信網１２を介して接続されている第２情報処理装置２０Ｂとの間で行われる音声チャットを制御する。音声会話制御部２３９は、音声入力部２３１で生成された音声データの伝送を受け、通信部２４９を介して音声データを第２情報処理装置２０Ｂへと送信するとともに、第２情報処理装置２０Ｂから送信される音声データを、通信部２４９を介して受信し、音声出力部２４１へと伝送する。また、音声会話制御部２３９は、音声チャットが行われる毎に、音声チャットの行われた日時、音声チャット自体を識別する識別子および音声チャットの相手を表す識別子を関連付けて、記憶部２５１に記憶してもよい。

なお、音声会話制御部２３９は、音声会話制御に特化したハードウェアにより構成されていてもよく、音声チャットプログラム等のアプリケーションプログラムとして提供されてもよい。

音声出力部２４１は、第２情報処理装置２０Ｂのユーザが発した音声の音声データを受信し、第１情報処理装置２０Ａへと取り込むインターフェースであって、例えば、第１情報処理装置２０Ａに接続された出力装置であるスピーカやイヤフォン等から構成される。通信部２４９を介して受信された第２情報処理装置２０Ｂからの音声データは、音声出力部２４１を介して、第１情報処理装置２０Ａのユーザへと出力される。

情報検索部２４３は、キーワード抽出部２３７から伝送されたキーワードと、当該キーワードがキーワード抽出部２３７から伝送された時刻とを関連付けて、後述する記憶部２５１に格納する。また、情報検索部２４３は、キーワード抽出部２３７から伝送されたキーワードについて、キーワードの同期処理を行うか否かを判断し、キーワードの同期処理を行うと判断した場合には、キーワードをキーワード同期部２４５へ伝送して、キーワード同期処理の実行を要請する。さらに、情報検索部２４３は、通信部２４９を介して検索エンジン４０にアクセスし、キーワード抽出部２３７から伝送されたキーワードについて情報検索を行い、キーワードの検索結果およびキーワードに関連する記事を取得する。情報検索部２４３は、得られた検索結果を記憶部２５１の検索情報蓄積部２５３に格納するとともに、表示部２４７へと伝送する。ここで、情報検索部２４３が検索エンジン４０により取得する検索結果は、検索キーワードに関する検索エンジン４０中の情報の表題やＵＲＬや情報のジャンルといった、情報に関するメタデータ等である。

また、後述する表示部２４７から、ある特定のキーワードやキーワードに関する記事について更に詳細な情報を取得するように要請されると、情報検索部２４３は、通信部２４９を介して検索エンジン４０にアクセスし更に詳細な情報を取得するとともに、表示部２４７から通知された特定のキーワードを、記憶部２５１の参照履歴記憶部２５５に記憶する。

キーワード同期部２４５は、キーワード抽出部２３７により音声データから抽出されたキーワードについて、通信部２４９を介して第２情報処理装置２０Ｂに送信し、第２情報処理装置と同期させる。キーワードの同期処理は、第１情報処理装置２０Ａから第２情報処理装置２０Ｂに対して行うだけでなく、第２情報処理装置２０Ｂからのキーワードの同期処理に対して第１情報処理装置２０Ａが応答して、第２情報処理装置２０Ｂから送信されたキーワードを第１情報処理装置２０Ａが受信してもよい。

表示部２４７は、情報検索部２４３から伝送された情報検索結果を、例えばブラウザアプリケーション等を介して第１情報処理装置２０Ａに備えられたディスプレイ等の出力装置に表示する。情報検索部２４３が検索エンジン４０から取得する情報には、検索エンジン４０中における情報や記事のＵＲＬ等が含まれているため、第１情報処理装置２０Ａのユーザが、第１情報処理装置２０Ａに接続されているマウスやキーボード等の入力装置を介して表示されている情報を選択すると、表示部２４７は、情報検索部２４３に対して選択された情報の詳細を取得するように要請する。

通信部２４９は、例えば第１情報処理装置２０Ａに設けられた通信装置であって、第１情報処理装置２０Ａのキーワード抽出部２３７と、音声会話制御部２３９と、情報検索部２４３と、キーワード同期部２４５とが、通信網１２を介して第１情報処理装置２０Ａの外部の装置等である第２情報処理装置２０Ｂやキーワード抽出データベース３０や検索エンジン４０等と行う情報の送受信を、仲介する。また、通信部２４９は、通信網１２を介さずに、第１情報処理装置２０Ａに直接接続されているその他の情報処理装置等に対して、情報の送受信を行うことも可能である。

記憶部２５１は、例えば第１情報処理装置２０Ａに設けられたストレージ装置であって、キーワード抽出部２３７が抽出したキーワードや情報検索部２４３が取得した検索情報等のデータを記憶する。また、これらのデータ以外にも、音声入力部２３１が生成した音声データや各種のデータベース等を記憶することも可能である。更に、これらのデータ以外にも、第１情報処理装置２０Ａが、何らかの処理を行う際に保存する必要が生じた様々なパラメータや処理の途中経過等を、適宜記憶することが可能である。この記憶部２５１は、音声認識部２３３、音声会話制御部２３９、情報検索部２４３、キーワード同期部２４５等が、自由に読み書きを行うことが可能である。この記憶部２５１は、例えば、検索情報蓄積部２５３と、参照履歴記憶部２５５と、を更に備える。

検索情報蓄積部２５３は、情報検索部２４３が取得した検索情報を、情報を取得した日時等と関連付けて蓄積する。一度取得した検索情報について再度情報の表示が必要となった場合に、検索情報蓄積部２５３に蓄積されている情報を参照して再表示することが可能である。

参照履歴記憶部２５５は、第１情報処理装置２０Ａのユーザが、表示部２４７に表示されたキーワードや記事の中から更なる詳細情報を参照したキーワードを、参照履歴として記憶する。上記の参照履歴は、参照したキーワード、参照したキーワードの重み情報、キーワードを参照した音声チャット自体の識別子、および、音声チャットの相手等の情報を含むデータである。この参照履歴記憶部２５５に記憶された参照履歴は、例えばキーワード抽出部２３７がキーワードを抽出する際に利用されてもよい。

なお、上記の情報検索部２４３、キーワード同期部２４５および表示部２４７等は、それぞれの機能に特化したハードウェアにより構成されていてもよく、音声認識プログラム等のアプリケーションプログラムとして提供されてもよい。

また、第２情報処理装置２０Ｂの構成は、第１情報処理装置２０Ａの構成と実質的に同一であるので、説明を省略する。

以上、本実施形態に係る情報処理装置２０の機能の一例を示した。上記の各構成要素は、汎用的な部材や回路を用いて構成されていてもよいし、各構成要素の機能に特化したハードウェアにより構成されていてもよい。また、各構成要素の機能を、ＣＰＵ等が全て行ってもよい。従って、本実施形態を実施する時々の技術レベルに応じて、適宜、利用する構成を変更することが可能である。

（音声認識方法・キーワード抽出方法）
以下に、図４を参照しながら、音声認識部２３３が、音声を認識し、キーワードを抽出する方法について簡単に説明するが、本実施形態に係る音声認識部２３３が使用する音声認識方法およびキーワード抽出方法は、以下の例に限定されるわけではない。図４は、本実施形態に係る音声認識部２３３が使用する音声認識方法およびキーワード抽出方法の一例を説明するための流れ図である。

音声入力部２３１は、取り込んだ第１情報処理装置２０Ａのユーザの会話から、音声データを生成する。音声入力部２３１では、取り込んだユーザの会話を、ＡＤ（ＡｎａｌｏｇＤｉｇｉｔａｌ）変換してアナログ信号である会話をサンプリングおよび量子化し、ディジタル信号である音声データへと変換する（ステップＳ１０１）。音声データへの変換が終了すると、音声入力部２３１は、生成した音声データを音声認識部２３３および音声会話制御部２３９へと伝送する。

続いて、パラメータ抽出部２３５は、生成された音声データから、適当なフレーム毎（適当な時間間隔毎）に、例えば、メル周波数ケプストラム係数（ＭｅｌＦｒｅｑｕｅｎｃｙＣｅｐｓｔｒｕｍＣｏｅｆｆｉｃｉｅｎｔｓ：ＭＦＣＣ）とその時間差分パラメータや、音声データのスペクトル、パワー線形予測係数、ケプストラム係数、線スペクトル対等の特徴パラメータを抽出する（ステップＳ１０３）。

キーワード抽出部２３７は、パラメータ抽出部２３５からの特徴パラメータに基づき、例えば、キーワード抽出データベース３０および音響モデルや言語モデルが備える単語辞書と、音響モデルおよび言語モデルといったモデルとを参照しながら、音声入力部２３１に入力された音声（入力音声）に最も近い単語列を認識結果として求め、この認識結果の中からキーワードを抽出する。

上記の音響モデルは、音声認識する音声の個々の音韻や音節等といった音響的な特徴を表すモデルを記憶している。この音響モデルとしては、例えば隠れマルコフモデル（ＨｉｄｄｅｎＭａｒｋｏｖＭｏｄｅｌ：ＨＭＭ）を用いることが可能である。また、静かな環境用（静かな環境で高い認識率が出る音響モデル）と雑音環境用（騒がしい環境でもそれなりの認識率が出る音響モデル）との２種類を用意し、環境に応じてどちらかを参照するようにしてもよい。

上記の言語モデルは、単語辞書に登録されている単語がどのように連鎖するか（接続するか）を示す情報（連鎖情報）を記述しているモデルを記憶する。上記の言語モデルとしては、例えば、統計的な単語連鎖確率（ｎ−ｇｒａｍやｃｌａｓｓｎ−ｇｒａｍ）、生成文法、有限状態オートマトン（ＦｉｎｉｔｅＳｔａｔｅＡｕｔｏｍａｔｏｎ：ＦＳＡ）等がある。

また、言語モデルは、単語に関する連鎖情報だけでなく、単語のカテゴリに関する連鎖情報も記憶することが可能である。例えば、「人名を表す単語からなるカテゴリ」を“＿人名＿”というシンボルで表し、「食品を表す単語からなるカテゴリ」を“＿食品＿”というシンボルで表す場合、言語モデルは、“＿人名＿”、“＿食品＿”についての連鎖情報（すなわち、カテゴリ同士の連鎖、カテゴリと辞書に予め記憶されている単語との連鎖等）も記述している。

したがって、言語モデルに含まれない単語についても、連鎖情報を取得することができる。例えば、「イチロー」と「は（助詞）」の連鎖情報を取得する場合、言語モデルに「イチロー」についての連鎖情報が記述されていなくても、「イチロー」が“＿人名＿”というシンボルで表されるカテゴリに属していることがわかれば、代わりに“＿人名＿”と「は」との連鎖情報を取得することによって、「イチロー」と「は」の連鎖情報を取得することができる。

次に、キーワード抽出部２３７は、音声データが音声入力部２３１から伝送されると、音響モデルに基づいて、単語の発音や音韻を元に単語をいくつか連結し、単語列を生成する。キーワード抽出部２３７は、生成した単語列に対して、音響モデルに基づく音響スコアを計算する（ステップＳ１０５）。ここで、上記の音響スコアとは、音声認識の結果である単語列と入力音声とが、音として（音響的に）どれだけ近いかを表す数値である。キーワード抽出部２３７は、計算された音響スコアに基づいて、音響スコアの高い単語列を所定の個数だけ選択する。

なお、キーワード抽出部２３７は、例えば、ビームサーチに基づくビタビ（Ｖｉｔｅｒｂｉ）デコーダや、Ａ^＊探索に基づくスタックデコーダなどの手法を用いてマッチングを行なうことも可能であり、例えば、いわゆるキーワードスポッティング等の手法を用いてマッチングを行なうことも可能である。また、キーワード抽出部２３７が参照する各種の単語辞書に、「認識重み」情報が付加されている場合には、後述する言語スコアに重みをつけた上で認識結果の順位付けを行なうことも可能である。ここで、上記認識重み情報とは、言語スコアの算出の際に利用される補正係数（重み付け係数）である認識重みが記載されている情報であって、認識重みが大きい値であるほど言語スコアの補正値は大きな値となり、認識結果として採用されやすくなる。例えば、認識重みが１０であるキーワードは、認識重みが１であるキーワード（すなわち、重み付けがなされていないキーワード）よりも１０倍高い確率で音声認識される。

なお、認識重みの決定においては、例えば、検索エンジン４０から取得した検索キーワードリストでの順位情報や、音声認識結果の出力中に現れるキーワードの頻度等を利用することが可能である。検索キーワードリストは、検索エンジン４０における上位いくつかの検索キーワードであるため、例えば、一番検索されているキーワードから順に順位付けを行い、順位付けの上位のものから順に、所定の認識重みを決定することが可能である。具体的には、一番検索されているキーワードから順に所定の係数を付加し、付加した係数に正規化したキーワードの頻度を乗じることで、認識重みとすることが可能である。また、検索エンジン４０の代わりに、通信網１２を介して接続されている任意のサーバ等に記憶されているシソーラス、オントロジーデータベース、百科事典、国語辞書および形態素解析ツール等を利用してもよい。また、検索エンジン４０と、上記のシソーラス、オントロジーデータベース、百科事典、国語辞書、形態素解析ツール等とを併用してもよい。

また、認識重みの決定において、音声認識結果のキーワードに関して第１情報処理装置２０Ａのユーザが検索エンジン４０を用いて検索を行ったかどうかという情報や、第１情報処理装置２０Ａのユーザの嗜好等も利用することが可能である。

続いて、キーワード抽出部２３７は、選択した単語列の各言語スコアを言語モデルに基づき計算する（ステップＳ１０９）。ここで、上記の言語スコアとは、選択した単語列が言語モデルとして適切であるか否かを判断する数値であり、言語モデルとして生成文法や有限状態オートマトンを使用している場合は、単語列を言語モデルとして受理することができるか否かを示す数値となり、言語モデルとして統計的言語モデルを使用している場合には、単語列の生成確率が言語スコアとなる。すなわち、言語モデルとして生成文法や有限状態オートマトンを使用している場合は、単語列がその言語モデルで受理することができるとき、言語スコアは「１」であり、受理することができないとき、言語スコアは「０」となる。また、言語モデルとして、ｎ−ｇｒａｍやｃｌａｓｓｎ−ｇｒａｍのような統計言語モデルを使用している場合、その単語列の生成確率を言語スコアとする。この言語スコアを求める方法の詳細は、例えば、本出願人が先に提案した特願２００１−３８２５７９号に開示されている。

続いて、キーワード抽出部２３７は、計算した音響スコアと言語スコアとを統合して各単語列をスコア順に並び替えて選択を行い（ステップＳ１１１）、例えば、統合したスコアの一番大きな単語列を認識結果として決定する（ステップＳ１１３）。すなわち、キーワード抽出部２３７は、例えば、音響モデルから得られた音響スコアと言語モデルから得られた言語スコアとの積や、音響スコアの対数と言語スコアの対数との和等を最大とするような単語列を、認識結果として決定する。また、言語モデルで用いた各種の単語辞書に、単語の認識重み情報が付加されている場合には、認識重み情報を加味した言語スコアを利用してもよい。

このような方法により、音響モデル的にも言語モデル的にも最もふさわしい単語列を、認識結果として決定することができる。

続いて、キーワード抽出部２３７は、通信部２４９を介してキーワード抽出データベース３０にアクセスし、音声認識結果とキーワード抽出データベースに登録されているキーワードとを比較する（ステップＳ１１５）。音声認識結果中に、データベースに登録されている単語が含まれている場合には、キーワード抽出部２３７は、音声認識結果中の単語をキーワードと決定して抽出する（ステップＳ１１７）。

また、キーワード抽出部２３７は、キーワード抽出データベース３０にアクセスする前に、音声チャットの相手である第２情報処理装置２０Ｂにアクセスして、音声チャットの認識結果を交換してもよい。例えば話者の話し方の癖や音声情報等を交換することで、音声認識の精度を高めることが可能である。また、互いの情報処理装置が適切な音声認識をしたか否かを確認するために、音声認識結果の話題ベクトルを交換しても良い。

上記のような音声認識方法およびキーワード抽出方法を適用することで、音声チャットの会話内容を適切に認識することが可能となるだけでなく、音声認識結果の中から適切なキーワードを抽出することが可能となる。

（キーワードの同期方法）
続いて、図５を参照しながら、本実施形態に係る音声チャットシステムにおけるキーワードの同期方法を詳細に説明する。図５は、本実施形態に係る音声チャットシステムのキーワード同期方法を説明するための流れ図である。図５では、第１情報処理装置２０Ａのユーザが第２情報処理装置２０Ｂに対して声を発した場合を示している。

第１情報処理装置２０Ａのユーザが、音声入力部２３１である第１情報処理装置に接続されたマイクやヘッドセット等に向けて声を発すると、音声入力部２３１はユーザが発した声から音声データを生成する（ステップＳ２０１）。生成された音声データは、パラメータ抽出部２３５および音声会話制御部２３９へと伝送される。音声会話制御部２３９は、生成された音声データを通信部２４９を介して第２情報処理装置２０Ｂへと伝送し、第２情報処理装置２０Ｂとの間で音声会話がなされる（ステップＳ２０３）。

また、パラメータ抽出部２３５は、音声データおよび抽出した各種パラメータをキーワード抽出部２３７にも伝送し、キーワード抽出部２３７は、キーワード抽出のために、音声データを音声認識する。続いて、キーワード抽出部２３７は、通信部２４９を介して音声認識結果を第２情報処理装置２０Ｂと交換して（ステップＳ２０５）、音声認識結果の精度を高める。その後、キーワード抽出部２３７は、通信部２４９を介して、通信網１２に接続されているキーワード抽出データベース３０にアクセスする（ステップＳ２０７）。キーワード抽出データベース３０は、登録されているデータベースの参照許可を第１情報処理装置２０Ａに与え（ステップＳ２０９）、第１情報処理装置２０Ａのキーワード抽出部２３７は、キーワード抽出データベース３０を参照しながらキーワードを抽出する（ステップＳ２１１）。

なお、キーワードの抽出にあたっては、キーワード抽出部２３７は、検索エンジン４０等にアクセスし、検索エンジン４０の上位検索キーワードや、多くのブログで話題となっているキーワードを優先的に抽出するようにしてもよい。音声チャットにおいて話題となる事柄は、音声チャット実施時に流行している話題である場合が多く、このような話題に関連するキーワードは、検索エンジンにおける上位検索キーワードや、多くのブログで話題となっているキーワードである可能性が高いためであり、このようなキーワードを優先的に抽出することで、より効果的なキーワード抽出を行うことが可能だからである。

次に、キーワード抽出部２３７は、抽出したキーワードを情報検索部２４３に伝送し、情報検索部２４３は、伝送されたキーワードを、伝送された日時と関連づけて、記憶部２５１に保持する（ステップＳ２１３）。続いて、情報検索部２４３は、伝送されたキーワードが、現在行われている音声チャット中で、既に抽出されたものであるか否かを判断する（ステップＳ２１５）。伝送されたキーワードが抽出されたことがないものであれば、キーワード抽出部２３７は、キーワードを新規登録する（ステップＳ２１９）。

伝送されたキーワードが既に抽出されたものであれば、情報検索部２４３は、前回同一のキーワードが伝送された時刻を調べ、一定時間（例えば５分）が経過しているか否かを判断する（ステップＳ２１７）。なお、同一のキーワードが抽出されたか否かを判断する一定時間は上記の例に限定されず、任意の時間を設定することが可能である。前回同一のキーワードが伝送された時刻から一定時間経過していない場合には、情報検索部２４３は、伝送されたキーワードを棄却してキーワード抽出処理を終了する。また、同一のキーワードが伝送された時刻から一定時間が経過している場合には、情報検索部２４３は、当該キーワードが伝送された時刻を更新して、キーワードを新規登録する（ステップＳ２１９）。

キーワードが新規に登録されると、情報検索部２４３は、新規登録されたキーワードを、キーワード同期部２４５へと伝送する。キーワードが伝送されたキーワード同期部２４５は、伝送されたキーワードを、通信部２４９を介して第２情報処理装置２０Ｂへと伝送する（ステップＳ２２１）。この伝送処理が、第１情報処理装置２０Ａで抽出されたキーワードを音声チャットの相手である第２情報処理装置２０Ｂに同期させる同期処理となり、同期処理は、このキーワードを交換する点に限られる。従って、情報処理装置のメモリ上には、同期エリアは存在しなくてもよい。

また、新規キーワードが登録された第１情報処理装置２０Ａでは、情報検索部２４３が通信部２４９を介して通信網１２に接続された検索エンジン４０にアクセスし（ステップＳ２２３）、新規キーワードの検索結果およびキーワードに関連する記事のＵＲＬ等が記載されたメタデータを取得する（ステップＳ２２５）。その後、情報検索部２４３は、取得した情報を検索情報蓄積部２５３に格納するとともに、取得した情報を表示部２４７へと伝送する。続いて、表示部２４７は、伝送された情報を、ブラウザ等を介して、表示装置に表示する（ステップＳ２２７）。

キーワードが伝送された第２情報処理装置２０Ｂにおいても、第１情報処理装置とは独立に、キーワードが既出であるか、および、既出である場合には一定時間が経過しているか等の判定を行なう。キーワードが既出ではない場合または既出ではあるが一定時間を経過している場合には、第２情報処理装置２０Ｂは伝送されたキーワードを新規登録する。その後、第２情報処理装置２０Ｂは、検索エンジン４０に対してアクセスを行い（ステップＳ２２９）、伝送されたキーワードに関するＵＲＬ等が記載されたメタデータを取得する（ステップＳ２３１）。第２情報処理装置２０Ｂにおいても、第１情報処理装置２０Ａと同様に、取得した情報を検索情報蓄積部２５３に格納するとともに、取得した情報を表示部２４７へと伝送する。続いて、表示部２４７は、伝送された情報を、ブラウザ等を介して、表示装置に表示する（ステップＳ２３３）。

なお、音声チャットの会話内容を第１情報処理装置２０Ａに取り込む処理から、キーワードを同期して、キーワードに関連する情報の検索結果を表示するまでの各処理は、第１情報処理装置２０Ａによって自動的に行われるものであり、第１情報処理装置２０Ａのユーザは、音声認識、キーワード抽出およびキーワード同期処理のために特別な操作をする必要はなく、音声チャットに専念することができる。また、第２情報処理装置２０Ｂも、キーワードの同期処理や情報検索結果の表示処理を自動的に行うため、第２情報処理装置２０Ｂのユーザも、特別の操作をすることなく、音声チャットに専念することができる。

以上説明したように、第１情報処理装置２０Ａのユーザが発した声に起因して、第１情報処理装置２０Ａがキーワード抽出を行った上で第２情報処理装置２０Ｂに対してキーワードの同期処理を行う。その結果、キーワードの抽出を行った第１情報処理装置２０Ａと、キーワードの同期処理を受けた第２情報処理装置２０Ｂとは、互いに独立してキーワードを検索エンジン４０により検索し、検索結果を表示する。このような処理を行うことで、第１情報処理装置２０Ａおよび第２情報処理装置２０Ｂの表示装置には、同一のキーワードと当該キーワードに関連する記事が、通信時間程度のタイムラグが発生するのみで、ほぼ同期して表示されることとなる。また、キーワードに関連する情報を検索して表示するため、音声チャットにおける話題となりうる情報を自動的に提供することができ、音声チャットの内容に広がりを持たせることができる。

また、以上の説明では、第１情報処理装置２０Ａのユーザが会話を発した場合について説明したが、第２情報処理装置２０Ｂのユーザが会話を発した場合についても、上記と同様の処理がなされる。すなわち、第２情報処理装置２０Ｂにおいて音声データの生成およびキーワードの抽出が行われ、抽出され新規登録されたキーワードに関して、第１情報処理装置２０Ａに対して同期処理が行われる。その結果、上記の説明と同様に、第１情報処理装置２０Ａと第２情報処理装置２０Ｂとは、キーワード関連情報の検索および検索結果の表示が、互いに独立して並行に行われることとなる。このように、音声チャット中における会話の取り込み（音声データの生成）とキーワードの抽出は、それぞれの情報処理装置で並行して独立に処理される。

また、第１情報処理装置２０Ａと第２情報処理装置２０Ｂとの音声チャットが終了した場合には、双方の情報処理装置２０において、登録されたキーワードと当該キーワードの日時情報とが棄却され、次回利用時には、また新たにキーワードが登録される。

なお、上記の説明では、キーワード抽出データベース３０が、第１情報処理装置２０Ａが接続されている通信網１２に独立して接続されている場合について説明したが、キーワード抽出データベース３０は、第１情報処理装置２０Ａに併設されていてもよい。この場合には、キーワード抽出データベース３０は、例えば、第１情報処理装置２０Ａのデータベース記憶部に格納される。キーワード抽出データベース３０が第１情報処理装置２０Ａに設けられることにより、キーワード抽出の際の通信タイムラグがなくなり、より短時間にキーワード抽出を行うことが可能となる。なお、上記のデータベース記憶部は、第１情報処理装置２０Ａ内に独立して設けられていてもよく、第１情報処理装置２０Ａの記憶部２５１内に設けられていても良い。

また、上記の説明では、検索エンジン４０が、第１情報処理装置２０Ａが接続されている通信網１２に独立して接続されている場合について説明したが、第１情報処理装置２０Ａが検索エンジン４０を備えていても良い。検索エンジン４０が第１情報処理装置２０Ａに設けられることにより、情報検索の際の通信タイムラグがなくなり、より短時間に情報検索を行うことが可能となる。

（検索結果の表示画面）
続いて、図６を参照しながら、本実施形態に係る情報検索結果の表示画面の一例を、詳細に説明する。図６は、本実施形態に係る情報処理装置の検索情報表示例を説明するための説明図である。

検索結果表示画面５０は、音声チャット中に検出されたキーワードを、表示画面上に継続的に追加したものである。表示画面では、基本的に新しいキーワードが上に入り、既に表示されているキーワードは、下に下がっていくようになっている。また、一画面上に表示されるキーワードの最大値は、適宜設定することが可能であり、最大値を超えた場合には、一番下に表示されているキーワードから順に削除される。

図６の場合では、キーワードが登録された時間順に項目番号５０１が付されたキーワード５０３が、表示されており、新しいキーワード、つまり、項目番号５０１の大きなキーワード５０３程、上に表示されるようになっている。また、項目番号５０１とキーワード５０３の他に、キーワードを上に表示したままにしておくためのピン留め欄５０５と、検出されたキーワードを表示画面の再描画のタイミングで削除するための削除欄５０７とが、それぞれのキーワード５０３に対して設けられている。

このキーワード５０３に対しては、検索エンジン４０で当該キーワード５０３を検索した場合の検索結果表示画面が対応づけられており、キーワード５０３を例えばマウスポインタ等でクリックすると、検索エンジン４０におけるキーワードの検索結果表示画面にリンクするようになっている。

また、ピン留め欄５０５にマークすると、マークされたキーワードは、表示画面の一番上に来て固定され、新たにキーワードが追加表示された場合にも、繰り下がることがないようになっている。また、既にピン留めされているキーワードが存在する場合には、例えばピン留めされているキーワード同士で時系列に沿って表示されてもよい。

また、音声チャット中の会話から抽出され登録されたキーワードであっても、音声チャットを行っている情報処理装置のユーザにとっては不必要なキーワードである場合が生じうる。そのような場合には、削除欄５０７にマークすることで、新規登録されたキーワードを、例えば表示画面の再描画のタイミングに合わせて削除することができる。

また、１つのキーワード５０３に関して、当該キーワードに関する表示だけではなく、検索エンジン４０に記載されている当該キーワード５０３に関連する記事５０９も、キーワード５０３の下に例えばサムネイル状に複数表示される。このキーワードに関連する記事５０９についても、記事５０９を例えばマウスポインタ等でクリックすることで、検索エンジン４０に記載されている記事に直接リンクするようになっている。また、ピン留め欄５０５および削除欄５０７が、それぞれの記事５０９に対して１つずつ設けられる。なお、キーワード５０３に関連する記事５０９の表示個数は図中の個数に限定されず、任意の個数を設定することが可能である。また、検索結果表示画面５０には、検索エンジン４０において参照された件数の多い記事５０９であってもよい。

図６に示した表示画面５０の例では、音声チャットにおいて、「カシム」、「代表」、「イエメン」、「千葉」、「牧」というキーワードが順に抽出されている。また、「カシム」というキーワードに関しては、ピン留め欄がチェックされているため、一番古く登録されたにもかかわらず、表示画面５０の一番上に表示されている。また、「代表」というキーワードおよびキーワード「牧」に関連した情報である「新潟市牧支所ホームページ」という関連記事の削除欄にはそれぞれマークが付されており、次の画面再描画のタイミングでこれらのキーワードおよびキーワード関連情報は削除される。

なお、表示画面５０に表示されるキーワード５０３に関しては、情報処理装置２０に設けられているキーワード同期部２４５により、音声チャットの会話者それぞれの情報処理装置２０の画面に同一のものがほぼ同一のタイミングで新規に表示されることとなるが、上記のピン留め欄や削除欄へのマークは各会話者が独立して操作するため、音声チャットが進むにつれて、それぞれの情報処理装置２０における表示画面５０は異なるものとなっていく。

（検索情報の参照履歴データ）
続いて、図７を参照しながら、本実施形態に係るキーワードの抽出に際して、検索情報の参照履歴を利用する方法を説明する。図７は、本実施形態に係る検索情報の参照履歴データを説明する説明図である。

本実施形態に係る情報処理装置２０では、当該情報処理装置２０のユーザが検索結果表示画面５０から選択したキーワード５０３について、例えば図７に示す情報と関連づけて参照履歴データとし、参照履歴記憶部２５５に格納する。

参照履歴データは、例えば図７に示したように、ユーザが選択したキーワード６０１と、当該キーワードが何回選択されたかを示す重み情報６０３と、当該キーワード６０１が選択された音声チャットを識別する識別子であるセッションＩＤ情報６０５と、セッションＩＤが付与されたそれぞれの音声チャットにおける通話相手を示す通話相手情報６０７と、を含む。

重み情報６０３は、本実施形態に係る音声チャットシステム１０において、あるキーワード６０１が選択された延べ数を示す情報である。図７に示した参照履歴データでは、例えば、「ジャパンカップ」というキーワードが、延べ２回選択されており、「ザンブロック」および「牧」というキーワードが、それぞれ１回ずつ選択されたことを示している。

本実施形態に係る音声チャットシステム１０では、音声チャットが行われるごとに、音声チャットが行われた日付と、この日付中に行われた音声チャットの回数とからなるセッションＩＤ６０５が、各音声チャットのセッションに付与される。図７に示した参照履歴データでは、「ジャパンカップ」というキーワードは、セッションＩＤが「２００６０９１５０００１」という音声チャットと、セッションＩＤが「２００６０９１５０００２」という音声チャットの２回で選択されたことを示している。

通話相手情報６０７は、キーワード６０１が選択された音声チャットの通話相手を表すデータであって、図７に示した参照データでは、「ジャパンカップ」というキーワードが、「２００６０９１５０００１」というセッションＩＤが付与された「Ａ」との音声チャットと、「２００６０９１５０００２」というセッションＩＤが付与された「Ｂ」との音声チャットにおいて、それぞれ１回ずつ選択されたことを示している。

本実施形態に係る情報処理装置２０では、上記のような参照履歴データを、音声データからのキーワード抽出に際して利用することが可能である。この参照履歴データを利用することで、通話相手による話題の指向性や、単語間の関連性といった情報を得ることが可能であり、これらの情報を得ることで、音声認識やキーワード抽出をより効率的に行うことが可能である。以下に参照履歴データの利用方法について、簡単に説明する。

本実施形態に係るキーワード抽出部２３７は、音声認識を行う際に、上記の参照履歴データが記憶されている参照履歴記憶部２５５を参照して参照履歴データに含まれる各種情報を音声認識におけるパラメータ情報の一つとして利用することが可能である。例えば、キーワード抽出部２３７は、音声認識を行う際に参照履歴記憶部２５５を参照して、参照履歴データの重み情報６０３の数値が大きなキーワードについて、音声認識の優先順位を高め、音声認識を効果的に行うことが可能である。

また、キーワード抽出部２３７により認識されたキーワードが、上記の参照履歴データに登録されていた場合には、このキーワードが選択された時のセッションＩＤと同一のＩＤが付与されている他のキーワードについて、音声認識の優先順位を高めることが可能である。これは、同一のセッションＩＤが付与されているキーワードは、キーワード間の関連性が高いと推測されるからである。

また、キーワード抽出部２３７により認識されたキーワードが、上記の参照履歴データに登録されていた場合には、このキーワードが選択された時の通話相手となっている他のキーワードについて、音声認識の優先順位を高めることが可能である。これは、同一の通話相手における音声チャットで選択されたキーワードは、通話相手による話題の指向性が一致している可能性が高いと推測されるからである。

以上のように、本実施形態に係る情報処理装置２０では、参照履歴データを有効にフィードバックすることにより、より効率的な音声認識およびキーワード抽出を行うことが可能となる。

（情報処理装置の変形例）
続いて、図８Ａ〜図８Ｄを参照しながら、本実施形態に係る情報処理装置２０の変形例について、簡単に説明する。図８Ａは、本実施形態に係る情報処理装置の音声認識方法を説明するための簡略化されたブロック図である。図８Ｂ〜図８Ｄは、本実施形態に係る情報処理装置の音声認識方法の各変形例を説明するための簡略化されたブロック図である。なお、図８Ａ〜図８Ｄにおいては、本実施形態における情報処理装置２０の一部の処理部のみを記載しているが、図８Ａ〜図８Ｄに記載されている各情報処理装置では、図示されている処理部以外にも、例えば図３に示した処理部が設けられていることは言うまでもない。

前述の本実施形態に係る情報処理装置２０の説明では、図８Ａに示したように、音声チャットを行っている第１情報処理装置２０Ａおよび第２情報処理装置２０Ｂのそれぞれが、ユーザの発した声を取り込んで音声認識部２３３において音声認識し、キーワード同期部２４５によってキーワードの同期処理を行う場合について説明したが、本実施形態に係る情報処理装置では、以下のような変形例も実施可能である。

（第１変形例）
図８Ｂに示した第１変形例では、音声チャットを行っている情報処理装置２０Ａ，２０Ｂは、それぞれ情報処理装置のユーザが発した声はそのまま相手の情報処理装置へと伝送し、相手の情報処理装置のユーザが発した声を音声認識して出力する場合を示している。すなわち、例えば第１情報処理装置２０Ａのユーザが発した声は、そのまま音声会話制御部２３９および通信部２４９を介して第２情報処理装置２０Ｂに伝送され、第２情報処理装置２０Ｂにより音声認識されて出力される。同様に、第２情報処理装置２０Ｂのユーザが発した声は、そのまま音声会話制御部２３９および通信部２４９を介して第１情報処理装置２０Ａに伝送され、第１情報処理装置２０Ａにより音声認識されて出力される。本変形例においては、第１情報処理装置２０Ａおよび第２情報処理装置２０Ｂのそれぞれにおいて、音声認識およびキーワード抽出がなされ、キーワードに関する情報が検索される。

（第２変形例）
図８Ｃに示した第２変形例は、いずれか一方の情報処理装置が全ての音声認識を行い、他方の情報処理装置は、キーワードの同期および情報検索だけを行う場合について示している。この場合、例えば第１情報処理装置２０Ａが全ての音声認識を行い、第２情報処理装置２０Ｂは、キーワードの同期処理のみを行う。第１情報処理装置２０Ａのユーザが発した声は、音声認識部２３３により音声認識およびキーワード抽出が行われて第２情報処理装置２０Ｂに伝送され、第２情報処理装置２０Ｂでは、キーワードの同期処理やキーワードに関する情報の検索のみが行われる。また、第２情報処理装置２０Ｂのユーザが発した声は、そのまま第１情報処理装置２０Ａに伝送され、第１情報処理装置２０Ａの音声認識部２５７で音声認識およびキーワード抽出がなされる。

なお、図８Ｃにおいては、第１情報処理装置２０Ａが全ての音声認識を行う場合について図示したが、第２情報処理装置２０Ｂが全ての音声認識を行っても良い。また、図８Ｃでは、第１情報処理装置２０Ａに２つの独立した音声認識部が設けられる場合を示しているが、１つの音声認識部が上記の処理を行っても良い。以上説明したような本変形例は、例えば一方の情報処理装置の処理能力が他方の情報処理装置の処理能力に対して格段に優れている場合、または、格段に劣っている場合に利用することが可能である。

（第３変形例）
図８Ｄに示した第３変形例は、双方の情報処理装置は音声認識を全く行わずにキーワードの同期と情報検索のみを行い、それぞれの情報処理装置の接続を仲立ちしているサーバ１６が音声認識を行う場合について示している。この場合、第１情報処理装置２０Ａのユーザが発した声は、そのままサーバ１６へと伝送され、サーバ１６の音声認識部１６１において音声認識され、第２情報処理装置２０Ｂへと伝送される。また、第２情報処理装置２０Ｂのユーザが発した声は、そのままサーバ１６へと伝送され、サーバ１６の音声認識部１６３において音声認識され、第１情報処理装置２０Ａへと伝送される。なお、図８Ｄでは、サーバ１６に２つの独立した音声認識部が設けられる場合を示しているが、１つの音声認識部が上記の処理を行っても良い。

（第２の実施形態）
以下に、本発明の第２の実施形態に係るキーワード抽出システムについて、詳細に説明する。

図９は、本実施形態に係るキーワード抽出システムを説明するための説明図である。図９に示したように、本実施形態に係るキーワード抽出システム１１は、例えば、通信網１２と、情報処理装置２０Ａ、２０Ｂと、キーワード抽出データベース３０と、検索エンジン４０と、を含む。また、情報処理装置２０Ａは、ホームネットワーク１８内で、外部表示装置７０と接続されている。さらに、情報処理装置２０Ａ、２０Ｂと、外部表示装置７０とは、放送局８０から送信された放送情報を受信することが可能である。

ここで、通信網１２、キーワード抽出データベース３０および検索エンジン４０は、本発明の第１の実施形態に係る通信網１２、キーワード抽出データベース３０および検索エンジン４０と同様の構成を有し、ほぼ同一の効果を奏するため、詳細な説明は省略する。

情報処理装置２０は、通信網１２を介して接続された他の情報処理装置２０と、音声によるチャット（音声チャット）を行う。また、情報処理装置２０は、通信網１２に接続されているキーワード抽出データベース３０および検索エンジン４０に対して、通信網１２を介してデータベースの参照を要求したり、情報の検索を要求したりすることができる。また、音声チャットを行う他の情報処理装置２０は、図示のように通信網１２を介して接続されていてもよく、また、通信網１２を介さずに、例えば、ＵＳＢポートや、ｉ．Ｌｉｎｋ等のＩＥＥＥ１３９４ポート、ＳＣＳＩポート、ＲＳ−２３２Ｃポート等により直接接続されていてもよい。

また、情報処理装置２０は、ホームネットワーク１８内で、後述する外部表示装置７０に接続されており、情報処理装置２０と外部表示装置７０との間で各種データの送受信を行うことが可能である。情報処理装置２０と外部表示装置７０との接続は、例えば、ＨＤＭＩ（Ｈｉｇｈ−ＤｅｆｉｎｉｔｉｏｎＭｕｌｔｉｍｅｄｉａＩｎｔｅｒｆａｃｅ）−ＣＥＣ（ＣｏｎｓｕｍｅｒＥｌｅｃｔｒｏｎｉｃｓＣｏｎｔｒｏｌ）等の接続ポートを介して行われる。また、情報処理装置２０は、後述する放送局８０から送信された放送情報を含む放送電波を、内部に設けられた受信機能を用いて受信することも可能である。

なお、図示の例では、情報処理装置２０として、デスクトップ型のＰＣを示しているが、本実施形態に係る情報処理装置２０は、デスクトップ型ＰＣ、ノート型ＰＣを問わない。また、本実施形態に係る情報処理装置２０は、かかる例に限定されず、ネットワークを介した通信機能を有する機器であれば、例えば、テレビジョン受像器や家庭用ゲーム機等の情報家電、携帯電話、ＰＤＡ等で構成することもできる。また、情報処理装置２０は、契約者が持ち運びできるポータブルデバイス、例えば、携帯型ゲーム機、ＰＨＳ、携帯型映像／音声プレーヤなどであってもよい。

外部表示装置７０は、ＣＲＴディスプレイ装置、液晶ディスプレイ装置、プラズマディスプレイ装置、ＥＬディスプレイ装置等の表示装置であって、後述する放送局８０から送信された放送情報を含む放送電波を受信して、当該表示装置の表示領域に表示する。ここで、放送局から送信された放送情報とは、放送文字情報や放送音声情報や画像情報等のデータを意味しており、放送情報を含む放送電波とは、ワンセグ（ワンセグメント放送）や１２セグメントからなるディジタル放送（以下では、フルセグと略称する。）等のディジタル放送の電波を意味する。外部表示装置７０は、ＨＤＭＩ−ＣＥＣ等の接続ポートを介して、受信した放送情報を情報処理装置２０に送信することが可能である。また、外部表示装置７０は、情報処理装置２０から送信された各種データを受信して、当該データに対応した情報を表示することが可能である。

放送局８０は、放送文字情報や放送音声情報や画像情報等のデータから構成される放送情報を含む放送電波を送信する。外部表示装置７０は、放送局８０から送信された放送電波を受信し、放送電波に含まれる放送文字情報に基づいて字幕情報を表示したり、音声を出力したりする。また、情報処理装置２０は、放送局８０から送信された放送電波を受信して、各種の処理に利用することが可能である。

（情報処理装置２０の構成）
次に、本実施形態に係る情報処理装置２０の構成について、詳細に説明する。なお、本実施形態に係る情報処理装置２０のハードウェア構成は、本発明の第１の実施形態に係るハードウェア構成と実質的に同一であるため、詳細な説明は省略する。

図１０は、本実施形態に係る情報処理装置２０の構成を説明するためのブロック図である。本実施形態に係る情報処理装置２０は、例えば図１０に示したように、キーワード同期部２４５と、表示部２４７と、通信部２４９と、記憶部２５１と、放送文字情報受信部２６１と、キーワード抽出部２６３と、情報検索部２６５と、外部表示装置接続制御部２６７と、を主に備える。

キーワード同期部２４５は、後述するキーワード抽出部２６３により放送文字情報データから抽出されたキーワードについて、通信部２４９を介して他の情報処理装置２０に送信し、他の情報処理装置と同期させる。キーワードの同期処理は、情報処理装置２０から他の情報処理装置２０に対して行うだけでなく、他の情報処理装置２０から送信されたキーワードの同期処理に対してこの情報処理装置２０が応答して、他の情報処理装置２０から送信されたキーワードを情報処理装置２０が受信してもよい。

表示部２４７は、後述する情報検索部２６５から伝送された情報検索結果を、例えばブラウザアプリケーション等を介して情報処理装置２０に備えられたディスプレイ等の出力装置に表示する。情報検索部２６５が検索エンジン４０から取得する情報には、検索エンジン４０中における情報や記事のＵＲＬ等が含まれているため、情報処理装置２０のユーザが、情報処理装置２０に接続されているマウスやキーボード等の入力装置を介して表示されている情報を選択すると、表示部２４７は、情報検索部２６５に対して選択された情報の詳細を取得するように要請する。

通信部２４９は、例えば情報処理装置２０に設けられた通信装置であって、情報処理装置２０のキーワード同期部２４５と、キーワード抽出部２６３と、情報検索部２６５とが、通信網１２を介して情報処理装置２０の外部の装置等である他の情報処理装置２０やキーワード抽出データベース３０や検索エンジン４０等と行う情報の送受信を、仲介する。また、通信部２４９は、通信網１２を介さずに、情報処理装置２０Ａに直接接続されているその他の情報処理装置等に対して、情報の送受信を行うことも可能である。

記憶部２５１は、例えば情報処理装置２０に設けられたストレージ装置であって、キーワード抽出部２６３が抽出したキーワードや情報検索部２６５が取得した検索情報等のデータを記憶する。また、これらのデータ以外にも、各種のデータベース等を記憶することも可能である。更に、これらのデータ以外にも、情報処理装置２０が、何らかの処理を行う際に保存する必要が生じた様々なパラメータや処理の途中経過等を、適宜記憶することが可能である。この記憶部２５１は、キーワード同期部２４５、情報検索部２６５等が、自由に読み書きを行うことが可能である。この記憶部２５１は、例えば、検索情報蓄積部２５３と、参照履歴記憶部２５５と、を更に備える。

検索情報蓄積部２５３は、後述する情報検索部２６５が取得した検索情報を、情報を取得した日時等と関連付けて蓄積する。一度取得した検索情報について再度情報の表示が必要となった場合に、検索情報蓄積部２５３に蓄積されている情報を参照して再表示することが可能である。

参照履歴記憶部２５５は、情報処理装置２０のユーザが、表示部２４７に表示されたキーワードや記事の中から更なる詳細情報を参照したキーワードを、参照履歴として記憶する。上記の参照履歴は、参照したキーワード、参照したキーワードの重み情報、キーワードを参照した音声チャット自体の識別子、および、音声チャットの相手等の情報を含むデータである。この参照履歴記憶部２５５に記憶された参照履歴は、例えばキーワード抽出部２６３がキーワードを抽出する際に利用されてもよい。

なお、上記のキーワード同期部２４５、表示部２４７および情報検索部２６５等は、それぞれの機能に特化したハードウェアにより構成されていてもよく、音声認識プログラム等のアプリケーションプログラムとして提供されてもよい。

放送文字情報受信部２６１は、外部表示装置７０が現在受信している放送チャンネルに関する受信チャンネル情報を、外部表示装置７０から取得する。ここで、受信チャンネル情報とは、外部表示装置７０が現在受信している放送チャンネルが何チャンネルかを表す情報である。放送文字情報受信部２６１は、この受信チャンネル情報を外部表示装置７０から取得することにより、外部表示装置７０が受信している放送チャンネルと、放送文字情報受信部２６１が受信する放送チャンネルとを同期させることができる。

また、放送文字情報受信部２６１は、取得した受信チャンネル情報に基づいて、外部表示装置７０が受信している放送チャンネルに対応した放送電波を、放送局８０から直接受信する。この際、放送文字情報受信部２６１は、放送局８０が送信している放送電波のうちワンセグの電波を直接受信し、受信した電波の中から文字情報を取得してもよい。また、放送文字情報受信部２６１は、放送局８０が送信しているフルセグの放送電波を直接受信してもよい。

また、放送文字情報受信部２６１は、取得した受信チャンネル情報に基づいて、外部表示装置７０が受信し外部表示装置７０から情報処理装置２０に送信された放送文字情報を、受信してもよい。

放送文字情報受信部２６１が受信した放送文字情報は、後述するキーワード抽出部２６３へと出力される。また、放送文字情報受信部２６１は、受信した放送文字情報を記憶部２５１に記録してもよい。

キーワード抽出部２６３は、キーワード抽出データベース３０に基づいて、放送文字情報受信部２６１が受信した放送文字情報に含まれる文字列から、キーワードを抽出する。キーワード抽出部２６３がキーワードを抽出する際には、キーワード抽出部２６３は、通信部２４９を介して、通信網１２に接続されているキーワード抽出データベース３０を参照することが可能である。

通常、放送文字情報を表す文字列の中には、複数のキーワードが含まれているものであり、キーワード抽出部２６３は、文字列の中に存在する全てのキーワードを、自動的に抽出する。キーワード抽出部２６３は、抽出したキーワードを、後述する情報検索部２６５および外部表示装置制御部２６７へと伝送する。また、キーワード抽出部２６３は、抽出したキーワードを、記憶部２５１に格納してもよい。

情報検索部２６５は、キーワード抽出部２６３から伝送されたキーワードと、当該キーワードがキーワード抽出部２６３から伝送された時刻とを関連付けて、記憶部２５１に格納する。また、情報検索部２６５は、キーワード抽出部２６３から伝送されたキーワードについて、キーワードの同期処理を行うか否かを判断し、キーワードの同期処理を行うと判断した場合には、キーワードをキーワード同期部２４５へ伝送して、キーワード同期処理の実行を要請する。さらに、情報検索部２６５は、通信部２４９を介して検索エンジン４０にアクセスし、キーワード抽出部２６３から伝送されたキーワードについて情報検索を行い、キーワードの検索結果およびキーワードに関連する記事を取得する。情報検索部２６５は、得られた検索結果を記憶部２５１の検索情報蓄積部２５３に格納するとともに、表示部２４７および後述する外部表示装置接続制御部２６７へと伝送する。ここで、情報検索部２６５が検索エンジン４０により取得する検索結果は、検索キーワードに関する検索エンジン４０中の情報の表題やＵＲＬや情報のジャンルといった、情報に関するメタデータ等である。

また、表示部２４７または外部表示装置接続制御部２６７から、ある特定のキーワードやキーワードに関する記事について更に詳細な情報を取得するように要請されると、情報検索部２６５は、通信部２４９を介して検索エンジン４０にアクセスし更に詳細な情報を取得するとともに、表示部２４７または外部表示装置接続制御部２６７から通知された特定のキーワードを、記憶部２５１の参照履歴記憶部２５５に記録する。

外部表示装置接続制御部２６７は、情報処理装置２０に接続されている外部表示装置７０と情報処理装置２０との接続制御を行う。また、外部表示装置制御部２６７は、キーワード抽出部２６３により抽出されたキーワードと、情報検索部２６５が取得した当該キーワードに関する検索結果を、外部表示装置７０に送信する。また、外部表示装置７０からある特定のキーワードやキーワードに関する記事について更に詳細な情報を取得するように要請されると、外部表示装置接続制御部２６７は、取得した要請を、情報検索部２６５に伝送する。要請に応じて情報検索部２６５が詳細な情報を検索エンジン４０等から取得すると、外部表示装置接続制御部２６７は、情報検索部２６５が取得した詳細な情報を外部表示装置７０に出力する。なお、外部表示装置接続制御部２６７は、外部表示装置７０に各種情報に対応したデータを送信する際に、送信予定のデータのデータ形式を、外部表示装置７０が表示可能なデータ形式へと変換してもよい。

また、外部表示装置接続制御部２６７は、参照履歴記憶部２５５に記録されている内容に基づいて、選択されたキーワードに関する情報を、検索エンジン４０に送信してもよい。検索エンジン４０は、外部表示装置接続制御部２６７から送信された情報を、検索エンジン４０内で行われる各種の処理に利用することが可能である。

なお、本実施形態に係る情報処理装置２０は、本発明の第１の実施形態に係る情報処理装置２０が有する音声認識部や音声会話制御部を更に備えても良い。また、キーワード抽出データベース３０の内容を記憶するデータベース記憶部を更に備えてもよい。これにより、キーワード抽出データベース３０の内容が、情報処理装置２０に設けられたデータベース記憶部に格納されることとなり、情報処理装置２０がキーワード抽出データベース３０にアクセスするために要する時間を短縮することができる。その結果、情報処理装置２０において、キーワード抽出に要する時間を短縮することができる。また、データベース記憶部の内容を定期的に更新することで、キーワード抽出データベース３０に記録されている最新のデータベースの内容を取得することが可能となる。

（外部表示装置７０の構成）
続いて、図１１および図１２を参照しながら、本実施形態に係る外部表示装置７０の構成について、詳細に説明する。図１１は、本実施形態に係る外部表示装置の構成を説明するためのブロック図であり、図１２は、本実施形態に係る外部表示装置の情報表示画面について説明するための説明図である。

本実施形態に係る外部表示装置７０のハードウェアは、ＣＲＴや、液晶パネル、プラズマディスプレイパネル、ＥＬパネル等の表示素子と、ＣＰＵ、ＲＯＭ、ＲＡＭ等から構成され、これらの表示素子を駆動制御するために用いられる駆動制御回路等から構成される。

また、本実施形態に係る外部表示装置７０は、例えば図１１に示したように、放送受信部７０１と、接続ポート制御部７０３と、放送情報表示制御部７０５と、キーワード情報表示制御部７０７と、表示部７０９と、を主に備える。

放送受信部７０１は、放送局８０から送信された放送電波を受信し、放送電波中に含まれる放送文字情報や放送音声情報や画像情報等のデータを、後述する接続ポート制御部７０３と、放送情報表示制御部７０５に出力する。また、放送受信部７０１は、外部表示装置７０に備えられた記憶部（図示せず。）や、外部表示装置７０に接続された記憶部（図示せず。）等に、受信した情報を記録してもよい。

接続ポート制御部７０３は、情報処理装置２０とディジタル通信が可能なＨＤＭＩ−ＣＥＣ等の接続ポートを制御する。放送ポート制御部７０３は、放送受信部７０１が受信している放送チャンネルに関する放送チャンネル情報を、ＨＤＭＩ−ＣＥＣ等の接続ポートを介して情報処理装置２０に送信する。また、放送受信部７０１が受信した放送文字情報や放送音声情報や画像情報等のデータは、接続ポート制御部７０３を介して情報処理装置２０に出力されてもよい。また、情報処理装置２０から送信された各種データは、接続ポート制御部７０３を介して外部表示装置７０に入力される。情報処理装置２０から送信された各種データは、後述するキーワード情報表示制御部７０７に伝送される。

放送情報表示制御部７０５は、放送受信部７０１から伝送された放送文字情報、放送音声情報および画像情報を後述する表示部７０９に表示する際の表示制御を行う。

キーワード情報表示制御部７０７は、情報処理装置２０から送信されたキーワード情報を後述する表示部７０９に表示する際の表示制御を行う。ここで、情報処理装置２０から送信されたキーワード情報とは、情報処理装置２０により抽出されたキーワード、抽出されたキーワードの検索結果およびキーワードに関連する記事等の情報である。また、後述する表示部７０９に表示された情報を、外部表示装置７０のユーザがマウスやキーボードやリモコン等の入力装置を用いて選択した場合に、選択された情報の詳細を取得するように表示部７０９から要請がなされると、キーワード情報表示制御部７０７は、この詳細情報取得要求を、接続ポート制御部７０３を介して情報処理装置２０に送信する。

表示部７０９は、放送情報表示制御部７０５により表示制御される放送文字情報、放送音声情報および画像情報と、キーワード情報表示制御部７０７により表示制御されるキーワード情報とを、外部表示装置７０の情報表示画面に表示する。

外部表示装置７０の情報表示画面７５１は、通常は、放送文字情報、放送音声情報および画像情報等が表示される画像表示領域７５３が主に存在している。ここで、情報処理装置２０からキーワード情報が伝送されると、情報表示画面７５１は、表示領域が分割され、キーワード情報が表示されるキーワード情報表示領域７５５が生成される。この画像表示領域７５３は、例えば放送情報表示制御部７０５により制御され、キーワード情報表示領域７５５は、例えばキーワード情報表示制御部７０７により制御される。

なお、キーワード情報表示領域７５５の詳細については、本発明の第１の実施形態に係る情報処理装置における検索結果表示画面５０と実質的に同一であるため、詳細な説明は省略する。

以上、本実施形態に係る外部表示装置７０の機能の一例を示した。上記の各構成要素は、汎用的な部材や回路を用いて構成されていてもよいし、各構成要素の機能に特化したハードウェアにより構成されていてもよい。また、各構成要素の機能を、ＣＰＵ等が全て行ってもよい。従って、本実施形態を実施する時々の技術レベルに応じて、適宜、利用する構成を変更することが可能である。

（キーワード抽出方法）
続いて、図１３を参照しながら、本実施形態に係る情報処理装置２０で行われるキーワード抽出方法の一例について、詳細に説明する。図１３は、本実施形態に係るキーワード抽出方法について説明するための流れ図である。

まず、情報処理装置２０の放送文字情報受信部２６１は、外部表示装置７０から取得した受信チャンネル情報に基づいて、外部表示装置７０または放送局８０から放送文字情報を受信し、放送字幕の文字列を文字情報データとして取得する（ステップＳ３０１）。放送文字情報受信部２６１は、取得した文字情報データを、キーワード抽出部２６３に出力する。

次に、キーワード抽出部２６３は、伝送された文字情報データを形態素解析して文字列から単語を抽出し、情報処理装置２０のメモリ上に記録する（ステップＳ３０３）。

次に、キーワード抽出部２６３は、通信網１２に接続されているキーワード抽出データベース３０の情報、または、情報処理装置２０内に記憶しているキーワード抽出データベース３０の内容を利用して、抽出した単語を検索する（ステップＳ３０５）。

続いて、キーワード抽出部２６３は、キーワード抽出データベース３０の中に抽出単語が存在しているか否かを判定する（ステップＳ３０７）。抽出単語がデータベース３０の中に存在している場合には、キーワード抽出部２６３は、存在した抽出単語を、放送キーワードデータとしてメモリ上に記録する（ステップＳ３０９）。また、抽出単語がデータベース３０の中に存在していない場合には、キーワード抽出部２６３は、後述するステップＳ３１１を実行する。

次に、キーワード抽出部２６３は、キーワード抽出データベース３０を用いて検索していない抽出単語がメモリ上に存在するか否かを判定する（ステップＳ３１１）。メモリ上に未検索の単語が存在する場合には、ステップＳ３０５に戻って処理を実行する。また、メモリ上に未検索の単語が存在しない場合には、キーワード抽出部２６３は、メモリ上に存在する放送キーワードデータを、抽出キーワードとして出力する（ステップＳ３１３）。

以上説明したような方法で、本実施形態に係る情報処理装置２０は、受信した放送文字情報の中からキーワードを抽出することが可能となる。

なお、本実施形態に係る情報処理装置２０が実行するキーワードの同期方法は、本発明の第１の実施形態に係る情報処理装置２０が実行するキーワードの同期方法と実質的に同一であるため、説明は省略する。

以上、本実施形態に係る情報処理装置２０では、放送局が送信している放送文字情報の中から、キーワード抽出データベース３０に存在している単語（キーワード）を自動的に抽出することが可能となり、抽出したキーワードを外部表示装置７０に表示させることができる。かかる機能を用いることで、情報処理装置２０や外部表示装置７０でチャット等の双方向通信を実施しているユーザは、抽出されたキーワードをチャット等の話題として用いることが可能となる。

（本実施形態に係る情報処理装置の第１変形例）
続いて、図１４および図１５を参照しながら、本実施形態に係る情報処理装置２０の第１変形例について、詳細に説明する。図１４は、本変形例に係る情報処理装置２０の構成を説明するためのブロック図であり、図１５は、本変形例に係るキーワード抽出方法を説明するための流れ図である。なお、本変形例に係る情報処理装置２０のハードウェア構成は、本発明の第２の実施形態に係るハードウェア構成と実質的に同一であるため、詳細な説明は省略する。

本変形例に係る情報処理装置２０は、例えば図１４に示したように、キーワード同期部２４５と、表示部２４７と、通信部２４９と、記憶部２５１と、放送音声情報受信部２６９と、情報検索部２６５と、外部表示装置接続制御部２６７と、パラメータ抽出部２７１と、キーワード抽出部２７３と、を主に備える。

ここで、キーワード同期部２４５、表示部２４７、通信部２４９、記憶部２５１、情報検索部２６５、および、外部表示装置接続制御部２６７については、本発明の第２の実施形態に係るキーワード同期部２４５、表示部２４７、通信部２４９、記憶部２５１、情報検索部２６５、および、外部表示装置接続制御部２６７と実質的に同一であり、それぞれ同様の効果を奏するため、詳細な説明は省略する。

放送音声情報受信部２６９は、外部表示装置７０が現在受信している放送チャンネルに関する受信チャンネル情報を、外部表示装置７０から取得する。放送音声情報受信部２６９は、この受信チャンネル情報を外部表示装置７０から取得することにより、外部表示装置７０が受信している放送チャンネルと、放送音声情報受信部２６９が受信する放送チャンネルとを同期させることができる。

また、放送音声情報受信部２６９は、取得した受信チャンネル情報に基づいて、外部表示装置７０が受信している放送チャンネルに対応した放送電波を、放送局８０から直接受信する。この際、放送音声情報受信部２６９は、放送局８０が送信している放送電波のうちワンセグの電波を直接受信し、受信した電波の中から音声情報を取得してもよい。また、放送音声情報受信部２６９は、放送局８０が送信しているフルセグの放送電波を直接受信してもよい。

また、放送音声情報受信部２６９は、取得した受信チャンネル情報に基づいて、外部表示装置７０が受信し外部表示装置７０から情報処理装置２０に送信された放送音声情報を、受信してもよい。

放送音声情報受信部２６９が受信した放送音声情報は、後述するキーワード抽出部２７１へと出力される。また、放送音声情報受信部２６９は、受信した放送音声情報を記憶部２５１に記録してもよい。

パラメータ抽出部２７１と、キーワード抽出部２７３は、本変形例に係る情報処理装置２０の音声認識部２３３を構成する処理部である。パラメータ抽出部２７１は、放送音声情報に含まれる音声データについて、適当なフレーム毎（適当な時間間隔毎）に、例えば、メル周波数ケプストラム係数（ＭｅｌＦｒｅｑｕｅｎｃｙＣｅｐｓｔｒｕｍＣｏｅｆｆｉｃｉｅｎｔｓ：ＭＦＣＣ）とその時間差分パラメータや、音声データのスペクトル、パワー線形予測係数、ケプストラム係数、線スペクトル対等の特徴パラメータを抽出する。

パラメータ抽出部２７１は、抽出された特徴パラメータをキーワード抽出部２７３に伝送する。また、パラメータ抽出部２７１は、抽出した特徴パラメータを、記憶部２５１に格納してもよい。

キーワード抽出部２７３は、パラメータ抽出部２７１により生成・抽出された特徴パラメータと、キーワード抽出データベース３０とに基づいて、放送音声情報に含まれる音声データから、キーワードを抽出する。キーワード抽出部２７３がキーワードを抽出する際には、キーワード抽出部２７３は、通信部２４９を介して、通信網１２に接続されているキーワード抽出データベース３０を参照することが可能である。

通常、放送音声情報に含まれる音声データの中には、複数のキーワードが含まれているものであり、キーワード抽出部２７３は、音声データの中に存在する全てのキーワードを、自動的に抽出する。キーワード抽出部２７３は、抽出したキーワードを、情報検索部２６５へと伝送する。また、キーワード抽出部２７３は、抽出したキーワードを、記憶部２５１に格納してもよい。

以上、本変形例に係る情報処理装置２０の機能の一例を示した。上記の各構成要素は、汎用的な部材や回路を用いて構成されていてもよいし、各構成要素の機能に特化したハードウェアにより構成されていてもよい。また、各構成要素の機能を、ＣＰＵ等が全て行ってもよい。従って、本実施形態を実施する時々の技術レベルに応じて、適宜、利用する構成を変更することが可能である。

なお、本変形例に係る情報処理装置２０は、本発明の第１の実施形態に係る情報処理装置２０が有する音声会話制御部を更に備えても良い。また、キーワード抽出データベース３０の内容を記憶するデータベース記憶部を更に備えてもよい。これにより、キーワード抽出データベース３０の内容が、情報処理装置２０に設けられたデータベース記憶部に格納されることとなり、情報処理装置２０がキーワード抽出データベース３０にアクセスするために要する時間を短縮することができる。その結果、情報処理装置２０において、キーワード抽出に要する時間を短縮することができる。

（キーワード抽出方法）
続いて、図１５を参照しながら、本変形例に係る情報処理装置２０で行われるキーワード抽出方法の一例について、詳細に説明する。

まず、情報処理装置２０の放送音声情報受信部２６９は、外部表示装置７０から取得した受信チャンネル情報に基づいて、外部表示装置７０または放送局８０から放送音声情報を受信し、パラメータ抽出部２７１およびキーワード抽出部２７３は、音声データを音声認識し、音声認識結果を決定する（ステップＳ４０１）。

次に、キーワード抽出部２７３は、伝送された文字情報データを形態素解析して文字列から単語を抽出し、情報処理装置２０のメモリ上に記録する（ステップＳ４０３）。

次に、キーワード抽出部２７３は、通信網１２に接続されているキーワード抽出データベース３０の情報、または、情報処理装置２０内に記憶しているキーワード抽出データベース３０の内容を利用して、抽出した単語を検索する（ステップＳ４０５）。

続いて、キーワード抽出部２７３は、キーワード抽出データベース３０の中に抽出単語が存在しているか否かを判定する（ステップＳ４０７）。抽出単語がデータベース３０の中に存在している場合には、キーワード抽出部２７３は、存在した抽出単語を、放送キーワードデータとしてメモリ上に記録する（ステップＳ４０９）。また、抽出単語がデータベース３０の中に存在していない場合には、キーワード抽出部２７３は、後述するステップＳ４１１を実行する。

次に、キーワード抽出部２７３は、キーワード抽出データベース３０を用いて検索していない抽出単語がメモリ上に存在するか否かを判定する（ステップＳ４１１）。メモリ上に未検索の単語が存在する場合には、ステップＳ４０５に戻って処理を実行する。また、メモリ上に未検索の単語が存在しない場合には、キーワード抽出部２７３は、メモリ上に存在する放送キーワードデータを、抽出キーワードとして出力する（ステップＳ４１３）。

以上説明したような方法で、本変形例に係る情報処理装置２０は、受信した放送音声情報の中からキーワードを抽出することが可能となる。

なお、本変形例に係る情報処理装置２０が実行するキーワードの同期方法は、本発明の第１の実施形態に係る情報処理装置２０が実行するキーワードの同期方法と実質的に同一であるため、説明は省略する。

以上、本変形例に係る情報処理装置２０では、放送局が送信している放送音声情報の中から、キーワード抽出データベース３０に存在している単語（キーワード）を自動的に抽出することが可能となり、抽出したキーワードを外部表示装置７０に表示させることができる。かかる機能を用いることで、情報処理装置２０や外部表示装置７０でチャット等の双方向通信を実施しているユーザは、抽出されたキーワードをチャット等の話題として用いることが可能となる。

以上、添付図面を参照しながら本発明の好適な実施形態について説明したが、本発明はかかる例に限定されないことは言うまでもない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。

例えば、上述した実施形態においては、２つの情報処理装置が音声チャットを行う場合について説明したが、本実施形態に係る音声チャットシステムでは、複数の情報処理装置間で音声チャットを行い、それぞれの情報処理装置間でキーワードの同期を行うことも可能である。

本発明の第１の実施形態に係る音声チャットシステムを示す説明図である。同実施形態に係る情報処理装置のハードウェア構成を説明するためのブロック図である。同実施形態に係る情報処理装置の構成を説明するためのブロック図である。同実施形態に係る情報処理装置が使用する音声認識方法およびキーワード抽出方法の一例を説明するための流れ図である。同実施形態に係る音声チャットシステムのキーワード同期方法を説明するための流れ図である。同実施形態に係る情報処理装置の検索情報表示例を説明するための説明図である。同実施形態に係る検索情報の参照履歴データを説明する説明図である。同実施形態に係る情報処理装置の音声認識方法を説明するための簡略化されたブロック図である。同実施形態に係る情報処理装置の音声認識方法の第１変形例を説明するための簡略化されたブロック図である。同実施形態に係る情報処理装置の音声認識方法の第２変形例を説明するための簡略化されたブロック図である。同実施形態に係る情報処理装置の音声認識方法の第３変形例を説明するための簡略化されたブロック図である。本発明の第２の実施形態に係るキーワード抽出システムについて説明するための説明図である。同実施形態に係る情報処理装置の構成を説明するためのブロック図である。同実施形態に係る外部表示装置の構成を説明するためのブロック図である。同実施形態に係る外部表示装置の情報表示画面について説明するための説明図である。同実施形態に係るキーワード抽出方法について説明するための流れ図である。同実施形態に係る情報処理装置の第１変形例の構成を説明するためのブロック図である。同変形例に係るキーワード抽出方法について説明するための流れ図である。

符号の説明

１０音声チャットシステム
１１キーワード抽出システム
１２通信網
１４リムーバブル記録媒体
１６サーバ
２０情報処理装置
３０キーワード抽出データベース
４０検索エンジン
５０検索情報表示画面
７０外部表示装置
８０放送局
１６１，１６３音声認識部
２０１ＣＰＵ
２０３ＲＯＭ
２０５ＲＡＭ
２０７ホストバス
２０９ブリッジ
２１１外部バス
２１３インターフェース
２１５入力装置
２１７出力装置
２１９ストレージ装置
２２１ドライブ
２２３通信装置
２３１音声入力部
２３３音声認識部
２３５，２７１パラメータ抽出部
２３７，２６３，２７３キーワード抽出部
２３９音声会話制御部
２４１音声出力部
２４３，２６５情報検索部
２４５キーワード同期部
２４７表示部
２４９通信部
２５１記憶部
２５３検索情報蓄積部
２５５参照履歴記憶部
２６１放送文字情報受信部
２６７外部表示装置接続制御部
２６９放送音声情報受信部
７０１放送受信部
７０３接続ポート制御部
７０５放送情報表示制御部
７０７キーワード情報表示制御部
７０９表示部
７５１情報表示画面
７５３画像表示領域
７５５キーワード情報表示領域

Claims

音声チャットを行う複数の情報処理装置と、
前記情報処理装置が、前記音声チャットの会話の中からキーワードを抽出する際に参照するキーワード抽出データベースと、
前記情報処理装置が、抽出された前記キーワードを用いて当該キーワードおよび当該キーワードに関連する記事を検索する検索エンジンと、
を備え、
少なくとも１つの前記情報処理装置は、
前記会話より生成された音声データから、当該音声データを特徴付けるパラメータを抽出するパラメータ抽出部と、
前記生成された音声データを認識し、前記パラメータおよび前記キーワード抽出データベースに基づいて前記音声データから前記キーワードを抽出するキーワード抽出部と、
抽出した前記キーワードを検索エンジンによって検索し、前記キーワードの検索結果および前記キーワードに関連する記事を取得する情報検索部と、
前記キーワードの検索結果の所在情報と関連付けられた当該キーワードと、前記キーワードに関連する記事の所在情報と関連付けられた当該記事と、をそれぞれ表示する表示部と、
前記抽出されたキーワードをチャットの相手である情報処理装置に送信し、当該チャットの相手である情報処理装置とのキーワードの同期を行うキーワード同期部と、
前記キーワードの参照履歴を記憶する参照履歴記憶部と、
を備え、
前記参照履歴記憶部は、参照した前記キーワードと個々のチャットに付与される識別子とを関連付けて記憶し、
前記キーワード抽出部は、前記識別子を利用して前記キーワードを抽出する、
音声チャットシステム。
他の情報処理装置との間で音声チャットを行う情報処理装置であって、
音声チャットでの会話より生成された音声データから、当該音声データを特徴付けるパラメータを抽出するパラメータ抽出部と、
前記生成された音声データを認識し、キーワード抽出データベースおよび前記パラメータに基づいて前記音声データからキーワードを抽出するキーワード抽出部と、
抽出した前記キーワードを検索エンジンによって検索し、前記キーワードの検索結果および前記キーワードに関連する記事を取得する情報検索部と、
前記キーワードおよび前記記事を当該キーワードの検索結果の所在情報および当該記事の所在情報とそれぞれ関連付けて蓄積する検索情報蓄積部と、
前記キーワードの参照履歴を記憶する参照履歴記憶部と、
を備え、
前記参照履歴記憶部は、参照した前記キーワードと個々のチャットに付与される識別子とを関連付けて記憶し、
前記キーワード抽出部は、前記識別子を利用して前記キーワードを抽出する、
情報処理装置。
前記情報処理装置は、抽出した前記キーワードをチャットの相手である情報処理装置に送信し、当該チャットの相手である情報処理装置とのキーワードの同期を行うキーワード同期部を更に備える、請求項２に記載の情報処理装置。
前記情報処理装置は、前記キーワード抽出データベースを記憶するデータベース記憶部を更に備える、請求項２に記載の情報処理装置。
前記情報処理装置は、前記検索エンジンを当該情報処理装置内に備える、請求項２に記載の情報処理装置。
前記情報処理装置は、前記キーワードの検索結果の所在情報と関連付けられた当該キーワードと、前記キーワードに関連する記事の所在情報と関連付けられた当該記事とをそれぞれ表示する表示部を更に備える、請求項２に記載の情報処理装置。
前記参照履歴記憶部は、前記参照したキーワードとチャット相手とを関連付けて記憶する、請求項２に記載の情報処理装置。
前記キーワード抽出部は、前記参照履歴の上位に位置するキーワードを優先的に抽出する、請求項７に記載の情報処理装置。
前記キーワード抽出部は、前記検索エンジンの上位検索キーワードを優先的に抽出する、請求項２に記載の情報処理装置。
コンピュータに、
音声チャットでの会話より生成された音声データから、当該音声データを特徴付けるパラメータを抽出するパラメータ抽出機能と、
前記生成された音声データを認識し、キーワード抽出データベースおよび前記パラメータに基づいて前記音声データからキーワードを抽出するキーワード抽出機能と、
抽出した前記キーワードを検索エンジンによって検索し、前記キーワードの検索結果および前記キーワードに関連する記事を取得する情報検索機能と、
前記キーワードおよび前記記事を当該キーワードの検索結果の所在情報および当該記事の所在情報とそれぞれ関連付けて蓄積する検索情報蓄積機能と、
前記キーワードの参照履歴を記憶する参照履歴記憶機能と、
を実現させ、
前記キーワード抽出機能は、参照した前記キーワードと関連付けて記憶される個々のチャットに付与される識別子を利用して前記キーワードを抽出する、
ためのプログラム。
放送局から送信された放送文字情報を受信する放送文字情報受信部と、
キーワード抽出データベースに基づいて前記放送文字情報からキーワードを抽出するキーワード抽出部と、
抽出した前記キーワードを検索エンジンによって検索し、前記キーワードの検索結果および前記キーワードに関連する記事を取得する情報検索部と、
外部表示装置との接続制御を行い、前記キーワード、前記キーワードの検索結果および前記キーワードに関連する記事を前記外部表示装置へと出力する外部表示装置接続制御部と、
前記キーワードの参照履歴を記憶する参照履歴記憶部と、
を備え、
前記参照履歴記憶部は、参照した前記キーワードと個々のチャットに付与される識別子とを関連付けて記憶し、
前記キーワード抽出部は、前記識別子を利用して前記キーワードを抽出する、
情報処理装置。
前記放送文字情報受信部は、前記情報処理装置に接続された前記外部表示装置から、当該外部表示装置が受信している放送チャンネルに関する受信チャンネル情報と、前記放送チャンネルに対応する前記放送文字情報と、を取得する、請求項１１に記載の情報処理装置。
前記放送文字情報受信部は、前記情報処理装置に接続された前記外部表示装置から当該外部表示装置が受信している放送チャンネルに関する受信チャンネル情報を取得するとともに、前記放送局から前記放送チャンネルに対応した前記放送文字情報を取得する、請求項１１に記載の情報処理装置。
前記参照履歴記憶部は、前記外部表示装置での前記キーワードの参照履歴を記憶し、
前記外部表示装置接続制御部は、前記外部表示装置で選択されたキーワードを、前記検索エンジンに通知する、請求項１１に記載の情報処理装置。
前記情報処理装置は、抽出した前記キーワードを他の情報処理装置に送信し、当該他の情報処理装置とのキーワードの同期を行うキーワード同期部を更に備える、請求項１１に記載の情報処理装置。
放送局から送信された放送音声情報を受信する放送音声情報受信部と、
前記放送音声情報に含まれる音声データから、当該音声データを特徴付けるパラメータを抽出するパラメータ抽出部と、
前記音声データを認識し、キーワード抽出データベースおよび前記パラメータに基づいて前記音声データからキーワードを抽出するキーワード抽出部と、
抽出した前記キーワードを検索エンジンによって検索し、前記キーワードの検索結果および前記キーワードに関連する記事を取得する情報検索部と、
外部表示装置との接続制御を行い、前記キーワード、前記キーワードの検索結果および前記キーワードに関連する記事を前記外部表示装置へと出力する外部表示装置接続制御部と、
前記キーワードの参照履歴を記憶する参照履歴記憶部と、
を備え、
前記参照履歴記憶部は、参照した前記キーワードと個々のチャットに付与される識別子とを関連付けて記憶し、
前記キーワード抽出部は、前記識別子を利用して前記キーワードを抽出する、
情報処理装置。
前記放送音声情報受信部は、前記情報処理装置に接続された前記外部表示装置から、当該外部表示装置が受信している放送チャンネルに関する受信チャンネル情報と、前記放送チャンネルに対応する前記放送音声情報と、を取得する、請求項１６に記載の情報処理装置。
前記参照履歴記憶部は、前記外部表示装置での前記キーワードの参照履歴を記憶し、
前記外部表示装置接続制御部は、前記外部表示装置で選択されたキーワードを、前記検索エンジンに通知する、請求項１６に記載の情報処理装置。
前記情報処理装置は、抽出した前記キーワードを他の情報処理装置に送信し、当該他の情報処理装置とのキーワードの同期を行うキーワード同期部を更に備える、請求項１６に記載の情報処理装置。