JP2008257655A

JP2008257655A - 情報処理装置及び方法、並びにプログラム

Info

Publication number: JP2008257655A
Application number: JP2007102242A
Authority: JP
Inventors: Yuki Asai; 有希浅井
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2007-04-09
Filing date: 2007-04-09
Publication date: 2008-10-23
Also published as: US20080301126A1; US8209329B2

Abstract

【課題】ユーザがより関心を持っている事柄に関連するコンテンツをユーザに推薦する。
【解決手段】情報処理装置１では、キーワード抽出部３２は、ユーザにより作成されたテキストからキーワードを抽出し、キーワード情報取得部３３は、抽出されたキーワードの所定のキーワード情報を取得し、関心度演算部３４は、取得されたキーワード情報に基づいて、キーワードに対するユーザの関心の高さを表すポイントを求め、キーワード選択部３５は、ポイントに基づいて、抽出されたキーワードの中から所定のキーワードを選択し、コンテンツ決定部３６は、選択されたキーワードに基づいて、ユーザに推薦するコンテンツを決定する。本発明は、例えば、携帯電話やPC等のあらゆる情報処理装置に適用できる。
【選択図】図１

Description

本発明は、情報処理装置及び方法、並びにプログラムに関し、特に、ユーザがより関心を持っている事柄に関連するコンテンツをユーザに推薦することができるようにする情報処理装置及び方法、並びにプログラムに関する。

膨大なコンテンツの中からユーザに推薦するコンテンツを決定する方法の１つとして、ユーザの関心が高いキーワードを抽出し、そのキーワードに基づいて推薦するコンテンツを決定する方法が開発されている。

例えばユーザによるコンテンツの選択に関する履歴情報に基づいて、ユーザが興味を持っている興味キーワードを抽出し、その興味キーワードに基づいて推薦するコンテンツを決定する方法（例えば、特許文献１参照）がある。
特開２０００−２９８９２号公報

しかしながら、この従来の方法においては、コンテンツの決定に使用されるキーワードは、装置側が提示したリストからユーザの指示に基づいて選択されたり、視聴若しくは録画予約したコンテンツに付与されているSI(Service Information)情報やG−Guide（商標）情報等のテキストから抽出される。

すなわち従来の方法においては、コンテンツの決定に使用されるキーワードは、コンテンツの提供側が提供したテキストから抽出されるので、結局、ユーザに推薦されるコンテンツの範囲が、コンテンツ提供側が意図した範囲となり、その範囲が限られてしまう可能性がある。

本発明は、このような状況に鑑みてなされたものであり、ユーザがより関心を持っている事柄に関連するコンテンツをユーザに推薦することができるようにするものである。

本発明の一側面の情報処理装置は、ユーザにより作成されたテキストからキーワードを抽出するキーワード抽出手段と、前記キーワード抽出手段により抽出された前記キーワードの所定のキーワード情報を取得するキーワード情報取得手段と、前記キーワード情報に基づいて、前記キーワードに対する前記ユーザの関心の高さを表す関心度情報を求める関心度演算手段と、前記関心度情報に基づいて、前記キーワード抽出手段により抽出された前記キーワードの中から所定のキーワードを選択するキーワード選択手段と、前記キーワード選択手段により選択された前記キーワードに基づいて、前記ユーザに推薦するコンテンツを決定するコンテンツ決定手段とを備える。

前記テキストは、複数の項目から構成させ、本発明の一側面の情報処理装置には、前記テキストを構成する前記項目の中の所定の項目のテキストを取得するテキスト取得手段をさらに設け、前記キーワード抽出手段には、前記テキスト取得手段により取得された前記項目のテキストからキーワードを抽出させ、前記キーワード情報取得手段には、前記キーワード抽出手段によりキーワードが抽出された前記項目の種類を示す情報を、前記キーワード情報として取得させることができる。

本発明の一側面の情報処理方法または情報処理をコンピュータに実行させるプログラムは、ユーザにより作成されたテキストからキーワードを抽出するキーワード抽出ステップと、前記キーワード抽出ステップの処理により抽出された前記キーワードの所定のキーワード情報を取得するキーワード情報取得ステップと、前記キーワード情報に基づいて、前記キーワードに対する前記ユーザの関心の高さを表す関心度情報を求める関心度演算ステップと、前記関心度情報に基づいて、前記キーワード抽出ステップの処理により抽出された前記キーワードの中から所定のキーワードを選択するキーワード選択ステップと、前記キーワード選択ステップの処理により選択された前記キーワードに基づいて、前記ユーザに推薦するコンテンツを決定するコンテンツ決定ステップとを含む。

本発明の一側面においては、ユーザにより作成されたテキストからキーワードが抽出され、抽出された前記キーワードの所定のキーワード情報が取得され、前記キーワード情報に基づいて、前記キーワードに対する前記ユーザの関心の高さを表す関心度情報が求められ、前記関心度情報に基づいて、前記キーワード抽出手段により抽出された前記キーワードの中から所定のキーワードが選択され、選択された前記キーワードに基づいて、前記ユーザに推薦するコンテンツが決定される。

本発明の一側面によれば、例えばユーザがより関心を持っている事柄に関連するコンテンツをユーザに推薦することができる。

以下に本発明の実施の形態を説明するが、本発明の構成要件と、明細書又は図面に記載の実施の形態との対応関係を例示すると、次のようになる。この記載は、本発明をサポートする実施の形態が、明細書又は図面に記載されていることを確認するためのものである。従って、明細書又は図面中には記載されているが、本発明の構成要件に対応する実施の形態として、ここには記載されていない実施の形態があったとしても、そのことは、その実施の形態が、その構成要件に対応するものではないことを意味するものではない。逆に、実施の形態が構成要件に対応するものとしてここに記載されていたとしても、そのことは、その実施の形態が、その構成要件以外の構成要件には対応しないものであることを意味するものでもない。

本発明の一側面の情報処理装置は、
ユーザにより作成されたテキストからキーワードを抽出するキーワード抽出手段（例えば、図１のキーワード抽出部３２）と、
前記キーワード抽出手段により抽出された前記キーワードの所定のキーワード情報を取得するキーワード情報取得手段（例えば、図１のキーワード情報取得部３３）と、
前記キーワード情報に基づいて、前記キーワードに対する前記ユーザの関心の高さを表す関心度情報を求める関心度演算手段（例えば、図１の関心度演算部３４）と、
前記関心度情報に基づいて、前記キーワード抽出手段により抽出された前記キーワードの中から所定のキーワードを選択するキーワード選択手段（例えば、図１のキーワード選択部３５）と、
前記キーワード選択手段により選択された前記キーワードに基づいて、前記ユーザに推薦するコンテンツを決定するコンテンツ決定手段（例えば、図１のコンテンツ決定部３６）と
を備える。

前記テキストは、複数の項目から構成させ、
本発明の一側面の情報処理装置には、
前記テキストを構成する前記項目の中の所定の項目のテキストを取得するテキスト取得手段（例えば、図１の抽出対象テキスト取得部３１）をさらに設け、
前記キーワード抽出手段には、前記テキスト取得手段により取得された前記項目のテキストからキーワードを抽出させ、
前記キーワード情報取得手段には、前記キーワード抽出手段によりキーワードが抽出された前記項目の種類を示す情報を、前記キーワード情報として取得させることができる。

本発明の一側面の情報処理方法または情報処理をコンピュータに実行させるプログラムは、
ユーザにより作成されたテキストからキーワードを抽出するキーワード抽出ステップ（例えば、図２のステップＳ１２）と、
前記キーワード抽出ステップの処理により抽出された前記キーワードの所定のキーワード情報を取得するキーワード情報取得ステップ（例えば、図２のステップＳ１３）と、
前記キーワード情報に基づいて、前記キーワードに対する前記ユーザの関心の高さを表す関心度情報を求める関心度演算ステップ（例えば、図２のステップＳ１４）と、
前記関心度情報に基づいて、前記キーワード抽出ステップの処理により抽出された前記キーワードの中から所定のキーワードを選択するキーワード選択ステップ（例えば、図２のステップＳ１５）と、
前記キーワード選択ステップの処理により選択された前記キーワードに基づいて、前記ユーザに推薦するコンテンツを決定するコンテンツ決定ステップ（例えば、図２のステップＳ１６）と
を含む。

以下、図面を参照して本発明を適用した実施の形態について説明する。

図１は、本発明を適用した情報処理装置１の構成例を示すブロック図である。

情報処理装置１は、例えば情報処理装置１のユーザにより作成されたテキストに基づいて、ユーザに推薦するコンテンツを決定し、決定したコンテンツの情報をユーザに提示する。

情報処理装置１は、テキスト蓄積部１１、コンテンツ決定部１２、及び表示部１３から構成される。

例えば情報処理装置１が携帯電話やPC（Personal Computer）等であって、インターネットを介して他の端末と通信可能である場合、テキスト蓄積部１１は、情報処理装置１のユーザ宛のメール等のメッセージや情報処理装置１のユーザにより作成されたメッセージ等のテキストの情報（以下、テキスト情報という）を適宜取得して蓄積する。

コンテンツ決定部１２は、テキスト蓄積部１１に蓄積されたテキスト情報を読み出し、読み出したテキスト情報の所定のテキストから抽出されたキーワードの中から所定のキーワードを選択し、選択した所定のキーワードに基づいて、ユーザに推薦するコンテンツを決定するコンテンツ決定処理を行い、その結果得られるユーザに推薦するコンテンツの情報を、表示部１３に供給する。

表示部１３は、コンテンツ決定部１２から供給されるコンテンツの情報を表示する。例えば、表示部１３は、そのコンテンツがチャンネルAの番組B等である場合、「本日のお薦め番組：チャンネルAの番組B、・・・」と図示せぬ表示画面に表示する。

次に、コンテンツ決定部１２の構成例について説明する。コンテンツ決定部１２は、抽出対象テキスト取得部３１、キーワード抽出部３２、キーワード情報取得部３３、関心度演算部３４、キーワード選択部３５、及びコンテンツ決定部３６から構成される。

抽出対象テキスト取得部３１は、テキスト蓄積部１１に蓄積されているテキスト情報を読み出し、読み出したテキスト情報の所定のテキスト（例えば、メッセージのタイトルや本文等）を抽出対象テキストとして取得し、キーワード抽出部３２に供給する。また、抽出対象テキスト取得部３１は、適宜、キーワード情報の取得に用いる情報（例えば、メッセージの日付等）含む情報を取得して、抽出対象テキストに付随させる。

キーワード抽出部３２は、抽出対象テキスト取得部３１から供給される抽出対象テキストに対して、例えば、形態素解析を行うことにより、抽出対象テキストから所定の単語をキーワードとして抽出し、キーワード情報取得部３３に供給する。

キーワード情報取得部３３は、キーワード抽出部３２から供給されるキーワードの所定のキーワード情報を、例えば、そのキーワードが抽出された抽出対象テキストまたは抽出対象テキストに付随している情報等を解析することにより取得し、関心度演算部３４に供給する。

関心度演算部３４は、キーワード情報取得部３３から供給されるキーワード情報に基づいて、そのキーワード情報に対応するキーワードに対するユーザの関心の高さを表す関心度情報としてのポイントを求め、キーワード選択部３５に供給する。

キーワード選択部３５は、例えば、関心度演算部３４から供給されたポイントのうちの高い順で上位３個のポイントが得られたキーワード、つまり、ユーザの関心が高いキーワードを、所定のキーワードとして選択して、コンテンツ決定部１３に供給する。

コンテンツ決定部３６は、キーワード選択部３５から供給されるキーワードに基づいて、例えば、メタデータにそのキーワードを含む放送コンテンツ等をユーザに推薦するキーワードに決定し、決定したコンテンツのチャンネルや番組名等のコンテンツの情報を、表示部１３に供給する。

図２は、コンテンツ決定部１２によるコンテンツ決定処理を示すフローチャートである。

なおこのコンテンツ決定処理は、例えば、所定の時間ごとに、あるいは、テキスト蓄積部１１に所定の量のテキストが新たに蓄積されると開始される。

またテキスト蓄積部１１には、抽出対象テキストとなりうる所定のテキストを含むテキスト情報があらかじめ蓄積されているものとする。

ステップＳ１１において、抽出対象テキスト取得部３１で、テキスト蓄積部１１からテキスト情報が読み出され、読み出されたテキスト情報の所定のテキストが抽出対象テキストとして取得される。

ステップＳ１２において、キーワード抽出部３２で、取得された抽出対象テキストからキーワードが抽出される。

ステップＳ１３において、キーワード情報取得部３３で、抽出されたキーワードの所定のキーワード情報が取得される。

ステップＳ１４において、関心度演算部３４で、取得されたキーワード情報に基づいて、そのキーワード情報に対応するキーワードに対するユーザの関心の高さを表すポイントが求められる。

ステップＳ１５において、キーワード選択部３５で、求められたポイントに基づいて、抽出されたキーワードの中から、所定のキーワードが選択される。

ステップＳ１６において、コンテンツ決定部３６で、選択されたキーワードに基づいて、ユーザに推薦するコンテンツが決定され、決定されたコンテンツの情報が、表示部１３に供給される。このようにユーザに推薦するコンテンツが決定されると、コンテンツ決定処理は終了する。

次に、情報処理装置１のユーザを含む例えばメッセージ交換サイトの複数のメンバの間でやり取りされたメッセージをテキスト情報とする場合のコンテンツ決定処理の具体例を、図４乃至図８を参照して説明する。

なおこの例の場合、テキスト蓄積部１１には、図３に示すように、上述の複数のメンバ間でやり取りされたメッセージが蓄積されたメッセージDB(database)５１が設けられている。

はじめに図４の例を参照して、コンテンツ決定処理の具体例を説明する。

通常、ユーザの興味や関心は、時間の経過に伴って変化する。例えば１週間前に作成されてやり取りされたメッセージよりも１日前に作成されてやり取りされたメッセージの方が、ユーザがいま興味を持っている事柄を含んでいることが多い。すなわち現在時刻に時間的により近い時点で作成されたメッセージから抽出されたキーワードに対するユーザの関心は高いと考えられる。

そこで図４の例では、メッセージが作成された時刻に対応する、例えばメッセージの日付が現在時刻に時間的により近いメッセージから抽出されたキーワードにより大きい重みを与えるようにしている。

はじめに図４左に示すように、メッセージの中からタイトル部分のテキスト「レストラン予約」、「来週の食事会」、「沖縄に決定」、「海に行こうよ」、及び「夏休みの予定」が抽出対象テキストとして取得され、抽出対象テキストに、メッセージの日付及びメッセージの送信元（メンバ）の情報が付随される（ステップＳ１１）。

次に、図４右に示すように、抽出対象テキスト「レストラン予約」からは「レストラン」及び「予約」が、抽出対象テキスト「来週の食事会」からは「来週」及び「食事会」が、抽出対象テキスト「沖縄に決定」からは「沖縄」が、抽出対象テキスト「海に行こうよ」からは「海」が、そして抽出対象テキスト「夏休みの予定」からは「夏休み」及び「予定」が、それぞれキーワードとして抽出される（ステップＳ１２）。

次に、図４右に示すような、キーワード「レストラン」、「予約」、「来週」、「食事会」、「沖縄」、「海」、「夏休み」、「予定」のそれぞれが抽出された各メッセージの例えば日付（7/6，7/6，7/5，7/5，7/4，7/3，7/1，7/1）が、各キーワードのキーワード情報として取得される（ステップＳ１３）。

次に、日付が現在時刻に時間的により近いメッセージから抽出されたキーワードほど大きな重みが与えられ、各キーワードの重みが各キーワードに対するポイントとして求められる（ステップＳ１４）。

例えば、直近のメッセージから抽出されたキーワードの重みが5とされ、過去のメッセージに遡るごとに1づつ小さくなるように重みが与えられて、各キーワードのポイントが求められる。

図４の例では、例えば現在の日付が7/7であるとすると、図４右に示すように、日付が7/6の、直近のメッセージから抽出されたキーワード「レストラン」と「予約」の重みが5とされ、日付が7/5の、次に現在時刻に近いメッセージから抽出されたキーワード「来週」と「食事会」の重みが4とされ、日付が7/4の、次に現在時刻に近いメッセージから抽出されたキーワード「沖縄」の重みが3とされ、日付が7/3の、次に現在時刻に近いメッセージから抽出されたキーワード「海」の重みが2とされ、日付が7/1の、次に現在時刻に近いメッセージから抽出されたキーワード「夏休み」と「予定」の重みが1とされる。

そして、各キーワードの重みが、各キーワードに対するポイントとして求められる。

このように各キーワードのポイントが求められると、例えばポイントが高い順で上位３個のポイントが得られたキーワードが、ユーザの関心が高いキーワードとして選択され（ステップＳ１５）、選択されたキーワードに基づいて、ユーザに推薦するコンテンツが決定される（ステップＳ１６）。

このようにしてコンテンツ決定処理が行われ、ユーザに推薦するコンテンツが決定される。

すなわち図４の例では、ユーザの関心事が、夏休みの事柄から食事会の事柄に移行しているが、日付が現在時刻に時間的により近いメッセージから抽出されたキーワードの重みを大きくするようにしたので、ユーザがいま関心を持っている食事会に関するキーワード「レストラン」、「予約」、「来週」、「食事会」のポイントを、ユーザが以前に関心を持っていた夏休みに関するキーワード「沖縄」、「海」、「夏休み」、「予定」のポイントより大きくすることができる。その結果、ユーザがいま関心を持っている事柄に関連するキーワードに基づいて、ユーザに推薦するコンテンツを決定することができ、ユーザがより関心を持っている事柄に関連するコンテンツをユーザに推薦することができる。

次に図５の例を参照して、コンテンツ決定処理の他の具体例を説明する。

例えばやり取りされたメッセージに複数回出現しているキーワードに、ユーザは高い関心を持っている場合がある。

そこで図５の例では、複数回出現しているキーワードのポイントが大きくなるように重みが付与されている。

はじめに、図５左に示すように、メッセージの中から本文部分のテキスト「イタリアンのお店リストつくりました。」、「来週の食事会はイタリアンはどうでしょう。」、「沖縄がいいんじゃない？」、「夏休みは海がいいな。」、及び「夏休みの予定を決めましょう。」が抽出対象テキストとして取得され、抽出対象テキストに、メッセージの日付が付随される（ステップＳ１１）。

次に、図５右上に示すように、抽出対象テキスト「イタリアンのお店リストつくりました。」からは「イタリアン」及び「お店」が、抽出対象テキスト「来週の食事会はイタリアンはどうでしょう。」からは「食事会」及び「イタリアン」が、抽出対象テキスト「沖縄がいいんじゃない？」からは「沖縄」が、抽出対象テキスト「夏休みは海がいいな。」からは「夏休み」及び「海」が、抽出対象テキスト「夏休みの予定を決めましょう。」からは「夏休み」及び「予定」が、それぞれキーワードとして抽出される（ステップＳ１２）。

次に、図５右上に示すような、キーワード「イタリアン」、「お店」、「食事会」、「イタリアン」、「沖縄」、「夏休み」、「海」、「夏休み」、「予定」のそれぞれが抽出された各メッセージの例えば日付（7/6，7/6，7/5，7/5，7/4，7/3，7/3，7/1，7/1）が、各キーワードのキーワード情報として取得される（ステップＳ１３）。

次に、例えば、図４の例の場合と同様に、直近のメッセージから抽出されたキーワードの重みが5とされ、過去のメッセージに遡るごとに1づつ小さくなるように重みが与えられる。

図５の例では、現在の日付が7/7であるとすると、図５右上に示すように、日付が7/6の、直近のメッセージから抽出されたキーワード「イタリアン」と「お店」の重みが5とされ、日付が7/5の、次に現在時刻に時間的に近いメッセージから抽出されたキーワード「食事会」と「イタリアン」の重みが4とされ、日付が7/4の、次に現在時刻に時間的に近いメッセージから抽出されたキーワード「沖縄」の重みが3とされ、日付が7/3の、次に現在時刻に近いメッセージから抽出されたキーワード「夏休み」と「海」の重みが2とされ、日付が7/1の、次に現在時刻に近いメッセージから抽出されたキーワード「夏休み」と「予定」の重みが1とされる。

このように各キーワードの重みが与えられると、同じ単語ごと重みが集計されて、各キーワードのポイントが求められる（ステップＳ１４）。

図５の例では、図５右下に示すように、複数回出現するキーワード「イタリアン」及び「夏休み」の重みが同じ単語ごとにそれぞれ集計されて、キーワード「イタリアン」及び「夏休み」のポイント（9(=5＋4)，3(=2＋1)）が求められる。１回だけ出現するキーワード「お店」、「食事会」、「沖縄」、「海」、「予定」については、各キーワードの重みが、各キーワードに対するポイント（5，4，3，2，1）とされる。

このように各キーワードのポイントが求められると、例えばポイントが高い順で上位３個のポイントが得られるキーワードが、ユーザの関心が高いキーワードとして選択され（ステップＳ１５）、選択されたキーワードに基づいて、ユーザに推薦するコンテンツが決定される（ステップＳ１６）。

すなわち図５の例では、同じ単語のキーワードが複数回抽出されたとき、それぞれに重みを与え、その単語のキーワードについて集計した結果得られた重みを、その単語のキーワードのポイントとするようにしたので、例えば、２回出現しているキーワード「イタリアン」のポイントを、キーワード「イタリアン」が出現している抽出対象テキストに出現しているが１回だけ出現しているキーワード「お店」のポイントより大きくすることができる。その結果、ユーザがより関心を持っていると思われる事柄に関連するキーワードに基づいて、ユーザに推薦するコンテンツを決定することができ、ユーザがより関心を持っている事柄に関連するコンテンツをユーザに推薦することができる。

次に図６の例を参照して、コンテンツ決定処理の他の具体例を説明する。

上述したように、やり取りされたメッセージに複数回出現している単語に対して、ユーザは高い関心を持っていると考えられるが、図５の例のように、同じキーワードが異なる抽出対象テキストに複数回出現しているのではなく１つの抽出対象テキストに複数回出現している場合がある。そのとき図５の例のように複数回出現しているキーワードそれぞれに同じ重みを与えると、他のキーワードに比べポイントが大きくなり過ぎることがある。

そこで図６の例では、１つの抽出対象テキストにおける出現回数が所定回数以上のキーワードには所定の小さい重みを与えるようにしている。

はじめに図６左に示すようなメッセージの中から本文部分のテキスト「イタリアンのお店リストつくりました。」、「来週の食事会はイタリアンはどうでしょう。」、「沖縄がいいんじゃない？沖縄といえば、沖縄そば。」、「夏休みは海がいいな。」、及び「夏休みの予定を決めましょう。」が抽出対象テキストとして取得され、抽出対象テキストに、メッセージの日付が付随される（ステップＳ１１）。

次に、図６右上に示すように、抽出対象テキスト「イタリアンのお店リストつくりました。」からは「イタリアン」及び「お店」が、抽出対象テキスト「来週の食事会はイタリアンはどうでしょう。」からは「食事会」及び「イタリアン」が、抽出対象テキスト「沖縄がいいんじゃない？沖縄といえば、沖縄そば。」からは「沖縄」、「沖縄」、及び「沖縄」が、抽出対象テキスト「夏休みは海がいいな。」からは「夏休み」及び「海」が、抽出対象テキスト「夏休みの予定を決めましょう。」からは、「夏休み」及び「予定」が、それぞれキーワードとして抽出される（ステップＳ１２）。

次に、図６右上に示すような、キーワード「イタリアン」、「お店」、「食事会」、「イタリアン」、「沖縄」、「沖縄」、「沖縄」、「夏休み」、「海」、「夏休み」、「予定」のそれぞれの、１つの抽出対象テキストにおける出現回数（1，1，1，1，3，3，3，1，1，1，1）が、各キーワードのキーワード情報として取得される（ステップＳ１３）。

次に、例えば、１つの抽出対象テキストにおける出現回数が所定回数以上のキーワードに所定の小さな重みが与えられる。

図６の例では、図６右上に示すように、１つの抽出対象テキストにおける出現回数が１回のキーワードの重みは1とされ、１つの抽出対象テキストにおける出現回数が２回以上のキーワードの重みは0.5とされる。すなわち、キーワード「イタリアン」、「お店」、「食事会」、「イタリアン」、「沖縄」、「沖縄」、「沖縄」、「夏休み」、「海」、「夏休み」、「予定」のそれぞれの重みが、1、1、1、1、0.5、0.5、0.5、1、1、1、1とされる。

このように各キーワードの重みが与えられると、同じ単語ごとに重みが集計され、各キーワードのポイントが求められる（ステップＳ１４）。

図６の例では、図６右下に示すように、複数回出現するキーワード「イタリアン」、「沖縄」及び「夏休み」の重みが同じ単語ごとにそれぞれ集計されて、キーワード「イタリアン」、「沖縄」及び「夏休み」のポイント（2(=1×2)，1.5(=0.5×3)，2(=1×2)）が求められる。１回だけ出現するキーワード「お店」、「食事会」、「海」、「予定」については、各キーワードの重みが、各キーワードのポイント（1，1，1，1）とされる。

すなわち図６の例では、１つの抽出対象テキストに複数回出現しているキーワードに、１つの抽出対象テキストに１回だけ出現しているキーワードに比べてより小さい重みを与えるようにしたので、例えば、１つの抽出対象テキストに３回出現しているキーワード「沖縄」のポイントを、例えば異なる抽出対象テキストそれぞれに２回出現しているキーワード「イタリアン」及び「夏休み」のポイントより小さくし、１つの抽出対象テキストに複数回出現しているキーワードのポイントが大きくなり過ぎることを防止することができる。

また換言すれば、例えば異なる抽出対象テキストに繰り返し出現しているキーワード「イタリアン」及び「夏休み」は、同じ１つの抽出対象テキストに繰り返し出現しているキーワード「沖縄」に比べ、ユーザが継続的に関心を持っているキーワードであると考えられるので、このように重みを与えることにより、ユーザが継続的に関心を持っているキーワードのポイントを、同じ抽出対象テキストに繰り返し出現するキーワードのポイントより大きくすることができる。

その結果、ユーザがより関心を持っていると思われる事柄に関連するキーワードに基づいて、ユーザに推薦するコンテンツを決定することができ、ユーザがより関心を持っている事柄に関連するコンテンツをユーザに推薦することができる。

次に図７の例を参照して、コンテンツ決定処理の他の具体例を説明する。

抽出対象テキスト上の位置が先頭により近いキーワードに対するユーザの関心は高く、抽出対象テキスト上の位置が先頭からより遠いキーワードに対するユーザの関心は低いとも考えられる。

そこで図７の例では、抽出対象テキスト上の位置が先頭からより近い、つまり、抽出対象テキスト上の出現の順番が早い（小さい）キーワードにより大きい重みを与えるようにしている。

はじめに、図７上から１番目に示すように、メッセージの中から本文部分のテキスト「おいしいワインを見つけました。カリフォルニアワインだけど、なかなかおいしいです。ワインにはおいしいパンとチーズも必要ですね。パンはやっぱりバゲットがいいと思います。パンがあれば、それで十分。それくらい、パンがあるだけで楽しむことができるのです。」が抽出対象テキストとして取得される（ステップＳ１１）。

次に、図７上から２番目に示すように、この抽出対象テキストからは、「ワイン」、「カリフォルニア」、「ワイン」、「ワイン」、「パン」、「チーズ」、「パン」、「バケット」、「パン」、及び「パン」が、それぞれキーワードとして抽出される（ステップＳ１２）。

次に、図７上から２番目に示すように、キーワード「ワイン」、「カリフォルニア」、「ワイン」、「ワイン」、「パン」、「チーズ」、「パン」、「バケット」、「パン」、「パン」のそれぞれの抽出対象テキストにおける出現の順番（1，2，3，4，5，6，7，8，9，10）が、各キーワードのキーワード情報として取得される（ステップＳ１３）。

次に、例えば、抽出対象テキスト上の出現の順番がより小さいキーワードほどより大きい重みが与えられる。

例えば抽出対象テキスト上の出現の順番が最も早い（小さい）キーワードの重みが10とされ、出現の順番が遅く（大きく）なるごとに1づつ小さくなるように重みが与えられる。

すなわち図７の例では、図７の上から２番目に示すように、出現の順番が1のキーワード「ワイン」の重みが10とされ、出現の順番が2のキーワード「カリフォルニア」の重みが9とされる。同様に、出現の順番が3乃至10のキーワード「ワイン」、「ワイン」、「パン」、「チーズ」、「パン」、「バケット」、「パン」、「パン」それぞれの重みが、8、7、6、5、4、3、2、1とされる。

図７の例では、図７の上から3番目に示すように、複数回出現するキーワード「ワイン」及び「パン」の重みが同じ単語ごとにそれぞれ集計されて、キーワード「ワイン」及び「パン」のポイント（25(=10＋8＋7)，13(=6＋4＋2＋1)）が求められる。１回だけ出現するキーワード「カリフォルニア」、「チーズ」、「バケット」については、各キーワードの重みが、各キーワードに対するポイント（9，5，3）とされる。

すなわち図７の例では、抽出対象テキスト上の位置が先頭により近いキーワードにより大きい重みを与えるようにしたので、例えば抽出対象テキストの冒頭に出現するキーワード「ワイン」のポイントを、抽出対象テキストの後半部分に出現するキーワード「パン」のポイントより大きくすることができる。その結果、ユーザがより関心を持っていると思われる事柄に関連するキーワードに基づいて、ユーザに推薦するコンテンツを決定することができ、ユーザがより関心を持っている事柄に関連するコンテンツをユーザに推薦することができる。

次に図８の例を参照して、コンテンツ決定処理の他の具体例を説明する。

図４及び図５の例では、メッセージの日付、つまり、抽出対象テキストの日付を、図６の例では、１つの抽出対象テキストにおけるキーワードの出現回数を、図７の例では、キーワードの抽出対象テキスト上の位置を、それぞれキーワード情報とし、キーワード情報に基づいて各キーワードに重みを与えるようにしたが、これらの例を複数組み合わせることもできる。

図８は、図４及び図５の例と図７の例を組み合わせた例を示している。すなわち図８の例では、抽出対象テキストの日付（図４及び図５の例）と抽出対象テキスト上の位置（図７の例）とをキーワード情報とし、それらに基づいてキーワードに重みを与えるようにしている。

はじめに、図８上から１番目に示すように、メッセージの中から本文部分のテキスト「その映画見たよ。「ワイン畑でつかまえて」でしょ？最近の映画の中ではイチオシ。」、「そうそう。そのワイナリーで撮影した映画があるんだよね。見たことある？この映画？」、「そのワイン知ってる。映画監督のコッポラのワイナリーのワインだよね？」、及び「おいしいワインを見つけました。カリフォルニアワインだけど、なかなかいけるよ。チーズも見つけたいな」が抽出対象テキストとして取得され、抽出対象テキストに、メッセージの日付が付随される（ステップＳ１１）。

次に、図８上から１番目に示すように、抽出対象テキスト「その映画見たよ。「ワイン畑でつかまえて」でしょ？最近の映画の中ではイチオシ。」からは「映画」、「ワイン」、「畑」、「映画」が、抽出対象テキスト「そうそう。そのワイナリーで撮影した映画があるんだよね。見たことある？この映画？」からは、「ワイナリー」、「映画」、及び「映画」が、抽出対象テキスト「そのワイン知ってる。映画監督のコッポラのワイナリーのワインだよね？」からは、「ワイン」、「映画」、「監督」、「ワイナリー」、及び「ワイン」が、抽出対象テキスト「おいしいワインを見つけました。カリフォルニアワインだけど、なかなかいけるよ。チーズも見つけたいな」からは、「ワイン」、「カリフォルニア」、「ワイン」、及び「チーズ」が、それぞれキーワードとして抽出される（ステップＳ１２）。

次に、図８上から１番目に示すように、キーワード「映画」、「ワイン」、「畑」、「映画」、「ワイナリー」、「映画」、「映画」、「ワイン」、「映画」、「監督」、「ワイナリー」、「ワイン」、「ワイン」、「カリフォルニア」、「ワイン」、「チーズ」のそれぞれが抽出された各抽出対象テキストの日付（7/14，7/14，7/14，7/14，7/13，7/13，7/13，7/12，7/12，7/12，7/12，7/12，7/11，7/11，7/11，7/11）と、各抽出対象テキスト上の出現の順番（1，2，3，4，1，2，3，1，2，3，4，5，1，2，3，4）とが、キーワード情報として取得される（ステップＳ１３）。

次に、例えば、抽出対象テキストの日付が現在時刻により近いキーワードにより大きい重みが与えられるとともに、各抽出対象テキスト上の出現の順番がより小さいキーワードにより大きい重みが与えられる。

図８の例では、まず、図４及び図５の例の場合と同様に、直近のメッセージから抽出されたキーワードの重みが5とされ、過去のメッセージに遡るごとに1づつ小さくなるように日付による重みが与えられる。次に、図７の例の場合と同様に、例えば各抽出対象テキスト上の出現の順番が最も早い（小さい）キーワードの重みが10とされ、出現の順番が大きくなるごとに1づつ小さくなるように出現の順番による重みが与えられる。そして、各キーワードについて日付による重みと出現の順番による重みとが掛け算され、その結果がキーワードの（最終的な）重みとして与えられる。

例えば、現在の日付が7/13であり、日付が7/11から7/12までのメッセージの本文部分を抽出対象テキストとするとき、図８上から１番目に示すように、これらの抽出対象テキストから抽出されるキーワード「ワイン」、「映画」、「監督」、「ワイナリー」、「ワイン」、「ワイン」、「カリフォルニア」、「ワイン」、「チーズ」のそれぞれの日付による重みが、5、5、5、5、5、4、4、4、4とされ、出現の順番による重みが、10、9、8、7、6、10、9、8、7とされる。

そして、キーワード「ワイン」、「映画」、「監督」、「ワイナリー」、「ワイン」、「ワイン」、「カリフォルニア」、「ワイン」、「チーズ」それぞれの日付による重みと出現順番による重みが掛け算され、その結果、各キーワードの重みは、50(=5×10)、45(=5×9)、40(=5×8)、35(=5×7)、30(=5×6)、40(=4×10)、36(=4×9)、32(=4×8)、28(=4×7)とされる。

あるいは、例えば、現在の日付が7/15であり、日付が7/11から7/14までのメッセージの本文部分を抽出対象テキストとするとき、図８上から１番目に示すように、これらの抽出対象テキストから抽出されるキーワード「映画」、「ワイン」、「畑」、「映画」、「ワイナリー」、「映画」、「映画」、「ワイン」、「映画」、「監督」、「ワイナリー」、「ワイン」、「ワイン」、「カリフォルニア」、「ワイン」、「チーズ」のそれぞれの日付による重みが、5、5、5、5、4、4、4、3、3、3、3、3、2、2、2、2とされ、出現の順番による重みが、10、9、8、7、10、9、8、10、9、8、7、6、10、9、8、7とされる。

そして、キーワード「映画」、「ワイン」、「畑」、「映画」、「ワイナリー」、「映画」、「映画」、「ワイン」、「映画」、「監督」、「ワイナリー」、「ワイン」、「ワイン」、「カリフォルニア」、「ワイン」、「チーズ」それぞれの重みが、50(=5×10)、45(=5×9)、40(=5×8)、35(=5×7)、40(=4×10)、36(=4×9)、32(=4×8)、30(=3×10)、27(=3×9)、24(=3×8)、21(=3×7)、18(=3×6)、20(=2×10)、18(=2×9)、16(=2×8)、14(=2×7)とされる。

このように各キーワードの重みが与えられると、同じ単語ごとに重みが集計されて、各キーワードのポイントが求められる（ステップＳ１４）。

図８の例では、例えば、上述した現在の日付が7/13の場合、図８上から２番目に示すように、キーワード「ワイン」、「映画」、「監督」、「ワイナリー」、「カリフォルニア」、「チーズ」のそれぞれのポイント（152(=5×10+5×6+4×10+4×8)，45(=5×9)，40(=5×8)，35(=5×7)，36(=4×9)，28(=4×7)）が求められる。

あるいは、例えば、上述した現在の日付が7/15の場合、図８上から３番目に示すように、キーワード「映画」、「ワイン」、「畑」、「ワイナリー」、「監督」、「カリフォルニア」、「チーズ」のそれぞれのポイント（151(=5×10+5×7+4×9+4×8+3×9)，129(=5×9+3×10+3×6+2×10+2×8)，40(=5×8)，61(=4×10+3×7)，24(=3×8)，18 (=2×9)，14(=2×7)）が求められる。

すなわち図８の例では、日付が現在時刻に時間的に近いキーワード、または抽出対象テキスト上の位置が先頭により近いキーワードにより大きい重みを与えるようにしたので、例えば、ワインの話題が中心となっている7/11から7/12までの２日間では、キーワード「ワイン」のポイントを最も大きくすることができ、あるいは、話題の中心がワインから映画に移行している7/11から7/14までの４日間では、キーワード「映画」のポイントを最も大きくすることができる。その結果、ユーザがより関心を持っていると思われる事柄に関連するキーワードに基づいて、ユーザに推薦するコンテンツを決定することができ、ユーザがより関心を持っている事柄に関連するコンテンツをユーザに推薦することができる。

なお以上においては、メッセージのタイトル部分（図４）または本文部分（図５乃至図８）を抽出対象テキストとする場合について説明したが、その他、例えばメッセージが、「タイトル」、「コメント」、及び「メモ」の項目（以下、テキスト項目と称する）から構成され、これらのテキスト項目すべてを抽出対象テキストにするとともに、テキスト項目の種類をキーワード情報として、キーワード情報としてのテキスト項目の種類に応じてキーワードの重みを変えるようにしてもよい。

例えば、テキスト項目「タイトル」に記載されているキーワードが重要であるとも考えられるので、テキスト項目「タイトル」をユーザの関心が高いテキスト項目の種類とみなすこともできるし、テキスト項目「コメント」の文字数に制限が無いとすると、より詳細な記述ができるので、テキスト項目「コメント」をユーザの関心が高いテキスト項目の種類とみなすこともできる。そこで、ユーザの関心が高いと思われるテキスト項目の種類から抽出されたキーワードにより大きい重みが与えられるようにすることもできる。

また以上においては、抽出対象テキストは、メッセージに関連するテキストとしたが、その他、放送番組や番組情報等の放送コンテンツ、ウェブサイト上の画像データ若しくは音声データ等のネットワークコンテンツ、またはユーザが所有する画像データ若しくは音声データに付与される例えばそのコンテンツに対する情報処理装置１のユーザの感想、メモ等のユーザにより作成されたテキストとしてもよい。

かかる抽出対象テキストを扱う情報処理装置１では、図９に示すように、テキスト蓄積部１１には、メッセージが蓄積されるメッセージDB５１の他、パーソナルコンテンツが蓄積されるパーソナルコンテンツDB５２、ネットワークコンテンツが蓄積されるネットワークコンテンツDB５３、及び、放送コンテンツが蓄積される放送コンテンツDB５４が設けられる。各DBには、上述したようなユーザにより作成されたテキストが含まれるテキスト情報が各コンテンツに関連付けられて格納されている。

なお、パーソナルコンテンツDB５２に蓄積されるパーソナルコンテンツは、例えば、情報処理装置１に脱着可能な状態で接続された図示せぬメモリカード等から取得されて蓄積され、ネットワークコンテンツDB５３に蓄積されるネットワークコンテンツは、例えば、図示せぬウェブサイトのサーバからインターネットを介して取得されて蓄積され、放送コンテンツDB５４に蓄積される放送コンテンツは、例えば、図示せぬ放送局のサーバからインターネットあるいは放送波を介して取得されて蓄積される。

ところでコンテンツの種類には、大きく分けてユーザが生成または管理するもの、つまり、ユーザが著作権を持っているものとそうでないものとがあるが、ユーザが著作権を持っているコンテンツに対するユーザの関心は高いか、若しくは、関心の解析対象そのものと考えられる。すなわち、ユーザが著作権を持っている例えばパーソナルコンテンツ（例えばパーソナルコンテンツDB５２に格納されているコンテンツ）等に付与された抽出対象テキストから抽出されたキーワードに対するユーザの関心は高く、ユーザが著作権を持っていない例えば放送コンテンツ、ネットワークコンテンツ（例えば、ネットワークコンテンツDB５３や放送コンテンツDB５４に格納されているコンテンツ）等に付与された抽出対象テキストから抽出されたキーワードに対するユーザの関心は低いと考えることもできる。

そこで、キーワードが抽出される抽出対象テキストが関連付けられているコンテンツの種類がキーワード情報として取得され、ユーザの関心が高いコンテンツの種類のキーワードにより大きい重みが与えられるようにすることもできる。

以上のように、情報処理装置１は、ユーザにより作成されたテキストからキーワードを抽出し、抽出されたキーワードの所定のキーワード情報を取得し、キーワード情報に基づいて、キーワードに対するユーザの関心の高さを表すポイントを求め、ポイントに基づいて、抽出されたキーワードの中から所定のキーワードを選択し、選択されたキーワードに基づいて、ユーザに推薦するコンテンツを決定するようにしたので、すなわち、ユーザにより作成されたテキストに基づいて、ユーザに推薦するコンテンツを決定するようにしたので、ユーザの意向の範囲で、ユーザに推薦するコンテンツの範囲を、決定することができる。

なお、キーワード情報は、上述したものに限定されるものではなく、その他、例えば、キーワードが含まれる抽出対象テキストの数や、キーワードが抽出対象テキストに出現する期間等を用いてもよい。

また、抽出対象テキストで構成されるコンテンツは、メッセージに限定されるものではなく、その他、例えば、ウェブログに含まれるテキスト等であってもよい。

抽出対象テキストが付与されるコンテンツは、放送コンテンツ、ネットワークコンテンツ、パーソナルコンテンツに限定されるものではない。

上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、プログラム記録媒体からインストールされる。

図１０は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。

コンピュータにおいて、CPU（Central Processing Unit）７１，ROM（Read Only Memory）７２，RAM（Random Access Memory）７３は、バス７４により相互に接続されている。

バス７４には、さらに、入出力インタフェース７５が接続されている。入出力インタフェース７５には、キーボード、マウス、マイクロホンなどよりなる入力部７６、ディスプレイ、スピーカなどよりなる入力部７７、ハードディスクや不揮発性のメモリなどよりなる記憶部７８、ネットワークインタフェースなどよりなる通信部７９、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア８１を駆動するドライブ８０が接続されている。

以上のように構成されるコンピュータでは、CPU７１が、例えば、記憶部７８に記憶されているプログラムを、入出力インタフェース７５及びバス７４を介して、RAM７３にロードして実行することにより、上述した一連の処理が行われる。

コンピュータ（CPU７１）が実行するプログラムは、例えば、磁気ディスク（フレキシブルディスクを含む）、光ディスク（CD−ROM(Compact Disc−Read Only Memory),DVD(Digital Versatile Disc)等）、光磁気ディスク、もしくは半導体メモリなどよりなるパッケージメディアであるリムーバブルメディア８１に記録して、あるいは、ローカルエリアネットワーク、インターネット、ディジタル衛星放送といった、有線または無線の伝送媒体を介して提供される。

そして、プログラムは、リムーバブルメディア８１をドライブ８０に装着することにより、入出力インタフェース７５を介して、記憶部７８にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部７９で受信し、記憶部７８にインストールすることができる。その他、プログラムは、ROM７２や記憶部７８に、あらかじめインストールしておくことができる。

なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。

なお、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。

本発明を適用した情報処理装置の構成例を示すブロック図である。コンテンツ決定部１２におけるコンテンツ決定処理を説明するフローチャートである。本発明を適用した情報処理装置の他の構成例を示すブロック図である。コンテンツ決定処理の具体例を説明する図である。コンテンツ決定処理の具体例を説明する図である。コンテンツ決定処理の具体例を説明する図である。コンテンツ決定処理の具体例を説明する図である。コンテンツ決定処理の具体例を説明する図である。本発明を適用した情報処理装置の他の構成例を示すブロック図である。本発明を適用したコンピュータのハードウェアの構成例を示すブロック図である。

符号の説明

１情報処理装置，１１テキスト蓄積部，１２コンテンツ決定部，１３表示部，３１抽出対象テキスト取得部，３２キーワード抽出部，３３キーワード情報取得部，３４関心度演算部，３５キーワード選択部，３６コンテンツ決定部，５１メッセージDB，５２パーソナルコンテンツDB，５３ネットワークコンテンツDB，５４放送コンテンツDB，７１ＣＰＵ，７２ＲＯＭ，７３ＲＡＭ，７４バス，７５入出力インタフェース，７６入力部，７７入力部，７８記憶部，７９通信部，８０ドライブ，８１リムーバブルメディア

Claims

ユーザにより作成されたテキストからキーワードを抽出するキーワード抽出手段と、
前記キーワード抽出手段により抽出された前記キーワードの所定のキーワード情報を取得するキーワード情報取得手段と、
前記キーワード情報に基づいて、前記キーワードに対する前記ユーザの関心の高さを表す関心度情報を求める関心度演算手段と、
前記関心度情報に基づいて、前記キーワード抽出手段により抽出された前記キーワードの中から所定のキーワードを選択するキーワード選択手段と、
前記キーワード選択手段により選択された前記キーワードに基づいて、前記ユーザに推薦するコンテンツを決定するコンテンツ決定手段と
を備える情報処理装置。
前記キーワード情報は、
キーワードが抽出された前記テキストが作成された時刻に対応する時刻を示す情報、
前記テキスト上のキーワードの位置を示す情報、
前記テキストにおけるキーワードの出現回数を示す情報
である
請求項１に記載の情報処理装置。
前記テキストは、推薦されるコンテンツに関連付けられており、
前記キーワード情報は、前記テキストが関連付けられているコンテンツの種類を示す情報である
請求項１に記載の情報処理装置。
前記推薦されるコンテンツは、放送コンテンツ、ネットワークコンテンツ、またはパーソナルコンテンツである
請求項３に記載の情報処理装置。
前記テキストは、複数の項目から構成されており、
前記テキストを構成する前記項目の中の所定の項目のテキストを取得するテキスト取得手段をさらに備え、
前記キーワード抽出手段は、前記テキスト取得手段により取得された前記項目のテキストからキーワードを抽出し、
前記キーワード情報取得手段は、前記キーワード抽出手段によりキーワードが抽出された前記項目の種類を示す情報を、前記キーワード情報として取得する
請求項１に記載の情報処理装置。
ユーザにより作成されたテキストからキーワードを抽出するキーワード抽出ステップと、
前記キーワード抽出ステップの処理により抽出された前記キーワードの所定のキーワード情報を取得するキーワード情報取得ステップと、
前記キーワード情報に基づいて、前記キーワードに対する前記ユーザの関心の高さを表す関心度情報を求める関心度演算ステップと、
前記関心度情報に基づいて、前記キーワード抽出ステップの処理により抽出された前記キーワードの中から所定のキーワードを選択するキーワード選択ステップと、
前記キーワード選択ステップの処理により選択された前記キーワードに基づいて、前記ユーザに推薦するコンテンツを決定するコンテンツ決定ステップと
を含む情報処理方法。
ユーザにより作成されたテキストからキーワードを抽出するキーワード抽出ステップと、
前記キーワード抽出ステップの処理により抽出された前記キーワードの所定のキーワード情報を取得するキーワード情報取得ステップと、
前記キーワード情報に基づいて、前記キーワードに対する前記ユーザの関心の高さを表す関心度情報を求める関心度演算ステップと、
前記関心度情報に基づいて、前記キーワード抽出ステップの処理により抽出された前記キーワードの中から所定のキーワードを選択するキーワード選択ステップと、
前記キーワード選択ステップの処理により選択された前記キーワードに基づいて、前記ユーザに推薦するコンテンツを決定するコンテンツ決定ステップと
を含む情報処理をコンピュータに実行させるプログラム。