JP2008257655A - 情報処理装置及び方法、並びにプログラム - Google Patents

情報処理装置及び方法、並びにプログラム Download PDF

Info

Publication number
JP2008257655A
JP2008257655A JP2007102242A JP2007102242A JP2008257655A JP 2008257655 A JP2008257655 A JP 2008257655A JP 2007102242 A JP2007102242 A JP 2007102242A JP 2007102242 A JP2007102242 A JP 2007102242A JP 2008257655 A JP2008257655 A JP 2008257655A
Authority
JP
Japan
Prior art keywords
keyword
information
text
user
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007102242A
Other languages
English (en)
Inventor
Yuki Asai
有希 浅井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2007102242A priority Critical patent/JP2008257655A/ja
Priority to US12/098,554 priority patent/US8209329B2/en
Publication of JP2008257655A publication Critical patent/JP2008257655A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】ユーザがより関心を持っている事柄に関連するコンテンツをユーザに推薦する。
【解決手段】情報処理装置1では、キーワード抽出部32は、ユーザにより作成されたテキストからキーワードを抽出し、キーワード情報取得部33は、抽出されたキーワードの所定のキーワード情報を取得し、関心度演算部34は、取得されたキーワード情報に基づいて、キーワードに対するユーザの関心の高さを表すポイントを求め、キーワード選択部35は、ポイントに基づいて、抽出されたキーワードの中から所定のキーワードを選択し、コンテンツ決定部36は、選択されたキーワードに基づいて、ユーザに推薦するコンテンツを決定する。本発明は、例えば、携帯電話やPC等のあらゆる情報処理装置に適用できる。
【選択図】図1

Description

本発明は、情報処理装置及び方法、並びにプログラムに関し、特に、ユーザがより関心を持っている事柄に関連するコンテンツをユーザに推薦することができるようにする情報処理装置及び方法、並びにプログラムに関する。
膨大なコンテンツの中からユーザに推薦するコンテンツを決定する方法の1つとして、ユーザの関心が高いキーワードを抽出し、そのキーワードに基づいて推薦するコンテンツを決定する方法が開発されている。
例えばユーザによるコンテンツの選択に関する履歴情報に基づいて、ユーザが興味を持っている興味キーワードを抽出し、その興味キーワードに基づいて推薦するコンテンツを決定する方法(例えば、特許文献1参照)がある。
特開2000−29892号公報
しかしながら、この従来の方法においては、コンテンツの決定に使用されるキーワードは、装置側が提示したリストからユーザの指示に基づいて選択されたり、視聴若しくは録画予約したコンテンツに付与されているSI(Service Information)情報やG−Guide(商標)情報等のテキストから抽出される。
すなわち従来の方法においては、コンテンツの決定に使用されるキーワードは、コンテンツの提供側が提供したテキストから抽出されるので、結局、ユーザに推薦されるコンテンツの範囲が、コンテンツ提供側が意図した範囲となり、その範囲が限られてしまう可能性がある。
本発明は、このような状況に鑑みてなされたものであり、ユーザがより関心を持っている事柄に関連するコンテンツをユーザに推薦することができるようにするものである。
本発明の一側面の情報処理装置は、ユーザにより作成されたテキストからキーワードを抽出するキーワード抽出手段と、前記キーワード抽出手段により抽出された前記キーワードの所定のキーワード情報を取得するキーワード情報取得手段と、前記キーワード情報に基づいて、前記キーワードに対する前記ユーザの関心の高さを表す関心度情報を求める関心度演算手段と、前記関心度情報に基づいて、前記キーワード抽出手段により抽出された前記キーワードの中から所定のキーワードを選択するキーワード選択手段と、前記キーワード選択手段により選択された前記キーワードに基づいて、前記ユーザに推薦するコンテンツを決定するコンテンツ決定手段とを備える。
前記テキストは、複数の項目から構成させ、本発明の一側面の情報処理装置には、前記テキストを構成する前記項目の中の所定の項目のテキストを取得するテキスト取得手段をさらに設け、前記キーワード抽出手段には、前記テキスト取得手段により取得された前記項目のテキストからキーワードを抽出させ、前記キーワード情報取得手段には、前記キーワード抽出手段によりキーワードが抽出された前記項目の種類を示す情報を、前記キーワード情報として取得させることができる。
本発明の一側面の情報処理方法または情報処理をコンピュータに実行させるプログラムは、ユーザにより作成されたテキストからキーワードを抽出するキーワード抽出ステップと、前記キーワード抽出ステップの処理により抽出された前記キーワードの所定のキーワード情報を取得するキーワード情報取得ステップと、前記キーワード情報に基づいて、前記キーワードに対する前記ユーザの関心の高さを表す関心度情報を求める関心度演算ステップと、前記関心度情報に基づいて、前記キーワード抽出ステップの処理により抽出された前記キーワードの中から所定のキーワードを選択するキーワード選択ステップと、前記キーワード選択ステップの処理により選択された前記キーワードに基づいて、前記ユーザに推薦するコンテンツを決定するコンテンツ決定ステップとを含む。
本発明の一側面においては、ユーザにより作成されたテキストからキーワードが抽出され、抽出された前記キーワードの所定のキーワード情報が取得され、前記キーワード情報に基づいて、前記キーワードに対する前記ユーザの関心の高さを表す関心度情報が求められ、前記関心度情報に基づいて、前記キーワード抽出手段により抽出された前記キーワードの中から所定のキーワードが選択され、選択された前記キーワードに基づいて、前記ユーザに推薦するコンテンツが決定される。
本発明の一側面によれば、例えばユーザがより関心を持っている事柄に関連するコンテンツをユーザに推薦することができる。
以下に本発明の実施の形態を説明するが、本発明の構成要件と、明細書又は図面に記載の実施の形態との対応関係を例示すると、次のようになる。この記載は、本発明をサポートする実施の形態が、明細書又は図面に記載されていることを確認するためのものである。従って、明細書又は図面中には記載されているが、本発明の構成要件に対応する実施の形態として、ここには記載されていない実施の形態があったとしても、そのことは、その実施の形態が、その構成要件に対応するものではないことを意味するものではない。逆に、実施の形態が構成要件に対応するものとしてここに記載されていたとしても、そのことは、その実施の形態が、その構成要件以外の構成要件には対応しないものであることを意味するものでもない。
本発明の一側面の情報処理装置は、
ユーザにより作成されたテキストからキーワードを抽出するキーワード抽出手段(例えば、図1のキーワード抽出部32)と、
前記キーワード抽出手段により抽出された前記キーワードの所定のキーワード情報を取得するキーワード情報取得手段(例えば、図1のキーワード情報取得部33)と、
前記キーワード情報に基づいて、前記キーワードに対する前記ユーザの関心の高さを表す関心度情報を求める関心度演算手段(例えば、図1の関心度演算部34)と、
前記関心度情報に基づいて、前記キーワード抽出手段により抽出された前記キーワードの中から所定のキーワードを選択するキーワード選択手段(例えば、図1のキーワード選択部35)と、
前記キーワード選択手段により選択された前記キーワードに基づいて、前記ユーザに推薦するコンテンツを決定するコンテンツ決定手段(例えば、図1のコンテンツ決定部36)と
を備える。
前記テキストは、複数の項目から構成させ、
本発明の一側面の情報処理装置には、
前記テキストを構成する前記項目の中の所定の項目のテキストを取得するテキスト取得手段(例えば、図1の抽出対象テキスト取得部31)をさらに設け、
前記キーワード抽出手段には、前記テキスト取得手段により取得された前記項目のテキストからキーワードを抽出させ、
前記キーワード情報取得手段には、前記キーワード抽出手段によりキーワードが抽出された前記項目の種類を示す情報を、前記キーワード情報として取得させることができる。
本発明の一側面の情報処理方法または情報処理をコンピュータに実行させるプログラムは、
ユーザにより作成されたテキストからキーワードを抽出するキーワード抽出ステップ(例えば、図2のステップS12)と、
前記キーワード抽出ステップの処理により抽出された前記キーワードの所定のキーワード情報を取得するキーワード情報取得ステップ(例えば、図2のステップS13)と、
前記キーワード情報に基づいて、前記キーワードに対する前記ユーザの関心の高さを表す関心度情報を求める関心度演算ステップ(例えば、図2のステップS14)と、
前記関心度情報に基づいて、前記キーワード抽出ステップの処理により抽出された前記キーワードの中から所定のキーワードを選択するキーワード選択ステップ(例えば、図2のステップS15)と、
前記キーワード選択ステップの処理により選択された前記キーワードに基づいて、前記ユーザに推薦するコンテンツを決定するコンテンツ決定ステップ(例えば、図2のステップS16)と
を含む。
以下、図面を参照して本発明を適用した実施の形態について説明する。
図1は、本発明を適用した情報処理装置1の構成例を示すブロック図である。
情報処理装置1は、例えば情報処理装置1のユーザにより作成されたテキストに基づいて、ユーザに推薦するコンテンツを決定し、決定したコンテンツの情報をユーザに提示する。
情報処理装置1は、テキスト蓄積部11、コンテンツ決定部12、及び表示部13から構成される。
例えば情報処理装置1が携帯電話やPC(Personal Computer)等であって、インターネットを介して他の端末と通信可能である場合、テキスト蓄積部11は、情報処理装置1のユーザ宛のメール等のメッセージや情報処理装置1のユーザにより作成されたメッセージ等のテキストの情報(以下、テキスト情報という)を適宜取得して蓄積する。
コンテンツ決定部12は、テキスト蓄積部11に蓄積されたテキスト情報を読み出し、読み出したテキスト情報の所定のテキストから抽出されたキーワードの中から所定のキーワードを選択し、選択した所定のキーワードに基づいて、ユーザに推薦するコンテンツを決定するコンテンツ決定処理を行い、その結果得られるユーザに推薦するコンテンツの情報を、表示部13に供給する。
表示部13は、コンテンツ決定部12から供給されるコンテンツの情報を表示する。例えば、表示部13は、そのコンテンツがチャンネルAの番組B等である場合、「本日のお薦め番組:チャンネルAの番組B、・・・」と図示せぬ表示画面に表示する。
次に、コンテンツ決定部12の構成例について説明する。コンテンツ決定部12は、抽出対象テキスト取得部31、キーワード抽出部32、キーワード情報取得部33、関心度演算部34、キーワード選択部35、及びコンテンツ決定部36から構成される。
抽出対象テキスト取得部31は、テキスト蓄積部11に蓄積されているテキスト情報を読み出し、読み出したテキスト情報の所定のテキスト(例えば、メッセージのタイトルや本文等)を抽出対象テキストとして取得し、キーワード抽出部32に供給する。また、抽出対象テキスト取得部31は、適宜、キーワード情報の取得に用いる情報(例えば、メッセージの日付等)含む情報を取得して、抽出対象テキストに付随させる。
キーワード抽出部32は、抽出対象テキスト取得部31から供給される抽出対象テキストに対して、例えば、形態素解析を行うことにより、抽出対象テキストから所定の単語をキーワードとして抽出し、キーワード情報取得部33に供給する。
キーワード情報取得部33は、キーワード抽出部32から供給されるキーワードの所定のキーワード情報を、例えば、そのキーワードが抽出された抽出対象テキストまたは抽出対象テキストに付随している情報等を解析することにより取得し、関心度演算部34に供給する。
関心度演算部34は、キーワード情報取得部33から供給されるキーワード情報に基づいて、そのキーワード情報に対応するキーワードに対するユーザの関心の高さを表す関心度情報としてのポイントを求め、キーワード選択部35に供給する。
キーワード選択部35は、例えば、関心度演算部34から供給されたポイントのうちの高い順で上位3個のポイントが得られたキーワード、つまり、ユーザの関心が高いキーワードを、所定のキーワードとして選択して、コンテンツ決定部13に供給する。
コンテンツ決定部36は、キーワード選択部35から供給されるキーワードに基づいて、例えば、メタデータにそのキーワードを含む放送コンテンツ等をユーザに推薦するキーワードに決定し、決定したコンテンツのチャンネルや番組名等のコンテンツの情報を、表示部13に供給する。
図2は、コンテンツ決定部12によるコンテンツ決定処理を示すフローチャートである。
なおこのコンテンツ決定処理は、例えば、所定の時間ごとに、あるいは、テキスト蓄積部11に所定の量のテキストが新たに蓄積されると開始される。
またテキスト蓄積部11には、抽出対象テキストとなりうる所定のテキストを含むテキスト情報があらかじめ蓄積されているものとする。
ステップS11において、抽出対象テキスト取得部31で、テキスト蓄積部11からテキスト情報が読み出され、読み出されたテキスト情報の所定のテキストが抽出対象テキストとして取得される。
ステップS12において、キーワード抽出部32で、取得された抽出対象テキストからキーワードが抽出される。
ステップS13において、キーワード情報取得部33で、抽出されたキーワードの所定のキーワード情報が取得される。
ステップS14において、関心度演算部34で、取得されたキーワード情報に基づいて、そのキーワード情報に対応するキーワードに対するユーザの関心の高さを表すポイントが求められる。
ステップS15において、キーワード選択部35で、求められたポイントに基づいて、抽出されたキーワードの中から、所定のキーワードが選択される。
ステップS16において、コンテンツ決定部36で、選択されたキーワードに基づいて、ユーザに推薦するコンテンツが決定され、決定されたコンテンツの情報が、表示部13に供給される。このようにユーザに推薦するコンテンツが決定されると、コンテンツ決定処理は終了する。
次に、情報処理装置1のユーザを含む例えばメッセージ交換サイトの複数のメンバの間でやり取りされたメッセージをテキスト情報とする場合のコンテンツ決定処理の具体例を、図4乃至図8を参照して説明する。
なおこの例の場合、テキスト蓄積部11には、図3に示すように、上述の複数のメンバ間でやり取りされたメッセージが蓄積されたメッセージDB(database)51が設けられている。
はじめに図4の例を参照して、コンテンツ決定処理の具体例を説明する。
通常、ユーザの興味や関心は、時間の経過に伴って変化する。例えば1週間前に作成されてやり取りされたメッセージよりも1日前に作成されてやり取りされたメッセージの方が、ユーザがいま興味を持っている事柄を含んでいることが多い。すなわち現在時刻に時間的により近い時点で作成されたメッセージから抽出されたキーワードに対するユーザの関心は高いと考えられる。
そこで図4の例では、メッセージが作成された時刻に対応する、例えばメッセージの日付が現在時刻に時間的により近いメッセージから抽出されたキーワードにより大きい重みを与えるようにしている。
はじめに図4左に示すように、メッセージの中からタイトル部分のテキスト「レストラン予約」、「来週の食事会」、「沖縄に決定」、「海に行こうよ」、及び「夏休みの予定」が抽出対象テキストとして取得され、抽出対象テキストに、メッセージの日付及びメッセージの送信元(メンバ)の情報が付随される(ステップS11)。
次に、図4右に示すように、抽出対象テキスト「レストラン予約」からは「レストラン」及び「予約」が、抽出対象テキスト「来週の食事会」からは「来週」及び「食事会」が、抽出対象テキスト「沖縄に決定」からは「沖縄」が、抽出対象テキスト「海に行こうよ」からは「海」が、そして抽出対象テキスト「夏休みの予定」からは「夏休み」及び「予定」が、それぞれキーワードとして抽出される(ステップS12)。
次に、図4右に示すような、キーワード「レストラン」、「予約」、「来週」、「食事会」、「沖縄」、「海」、「夏休み」、「予定」のそれぞれが抽出された各メッセージの例えば日付(7/6,7/6,7/5,7/5,7/4,7/3,7/1,7/1)が、各キーワードのキーワード情報として取得される(ステップS13)。
次に、日付が現在時刻に時間的により近いメッセージから抽出されたキーワードほど大きな重みが与えられ、各キーワードの重みが各キーワードに対するポイントとして求められる(ステップS14)。
例えば、直近のメッセージから抽出されたキーワードの重みが5とされ、過去のメッセージに遡るごとに1づつ小さくなるように重みが与えられて、各キーワードのポイントが求められる。
図4の例では、例えば現在の日付が7/7であるとすると、図4右に示すように、日付が7/6の、直近のメッセージから抽出されたキーワード「レストラン」と「予約」の重みが5とされ、日付が7/5の、次に現在時刻に近いメッセージから抽出されたキーワード「来週」と「食事会」の重みが4とされ、日付が7/4の、次に現在時刻に近いメッセージから抽出されたキーワード「沖縄」の重みが3とされ、日付が7/3の、次に現在時刻に近いメッセージから抽出されたキーワード「海」の重みが2とされ、日付が7/1の、次に現在時刻に近いメッセージから抽出されたキーワード「夏休み」と「予定」の重みが1とされる。
そして、各キーワードの重みが、各キーワードに対するポイントとして求められる。
このように各キーワードのポイントが求められると、例えばポイントが高い順で上位3個のポイントが得られたキーワードが、ユーザの関心が高いキーワードとして選択され(ステップS15)、選択されたキーワードに基づいて、ユーザに推薦するコンテンツが決定される(ステップS16)。
このようにしてコンテンツ決定処理が行われ、ユーザに推薦するコンテンツが決定される。
すなわち図4の例では、ユーザの関心事が、夏休みの事柄から食事会の事柄に移行しているが、日付が現在時刻に時間的により近いメッセージから抽出されたキーワードの重みを大きくするようにしたので、ユーザがいま関心を持っている食事会に関するキーワード「レストラン」、「予約」、「来週」、「食事会」のポイントを、ユーザが以前に関心を持っていた夏休みに関するキーワード「沖縄」、「海」、「夏休み」、「予定」のポイントより大きくすることができる。その結果、ユーザがいま関心を持っている事柄に関連するキーワードに基づいて、ユーザに推薦するコンテンツを決定することができ、ユーザがより関心を持っている事柄に関連するコンテンツをユーザに推薦することができる。
次に図5の例を参照して、コンテンツ決定処理の他の具体例を説明する。
例えばやり取りされたメッセージに複数回出現しているキーワードに、ユーザは高い関心を持っている場合がある。
そこで図5の例では、複数回出現しているキーワードのポイントが大きくなるように重みが付与されている。
はじめに、図5左に示すように、メッセージの中から本文部分のテキスト「イタリアンのお店リストつくりました。」、「来週の食事会はイタリアンはどうでしょう。」、「沖縄がいいんじゃない?」、「夏休みは海がいいな。」、及び「夏休みの予定を決めましょう。」が抽出対象テキストとして取得され、抽出対象テキストに、メッセージの日付が付随される(ステップS11)。
次に、図5右上に示すように、抽出対象テキスト「イタリアンのお店リストつくりました。」からは「イタリアン」及び「お店」が、抽出対象テキスト「来週の食事会はイタリアンはどうでしょう。」からは「食事会」及び「イタリアン」が、抽出対象テキスト「沖縄がいいんじゃない?」からは「沖縄」が、抽出対象テキスト「夏休みは海がいいな。」からは「夏休み」及び「海」が、抽出対象テキスト「夏休みの予定を決めましょう。」からは「夏休み」及び「予定」が、それぞれキーワードとして抽出される(ステップS12)。
次に、図5右上に示すような、キーワード「イタリアン」、「お店」、「食事会」、「イタリアン」、「沖縄」、「夏休み」、「海」、「夏休み」、「予定」のそれぞれが抽出された各メッセージの例えば日付(7/6,7/6,7/5,7/5,7/4,7/3,7/3,7/1,7/1)が、各キーワードのキーワード情報として取得される(ステップS13)。
次に、例えば、図4の例の場合と同様に、直近のメッセージから抽出されたキーワードの重みが5とされ、過去のメッセージに遡るごとに1づつ小さくなるように重みが与えられる。
図5の例では、現在の日付が7/7であるとすると、図5右上に示すように、日付が7/6の、直近のメッセージから抽出されたキーワード「イタリアン」と「お店」の重みが5とされ、日付が7/5の、次に現在時刻に時間的に近いメッセージから抽出されたキーワード「食事会」と「イタリアン」の重みが4とされ、日付が7/4の、次に現在時刻に時間的に近いメッセージから抽出されたキーワード「沖縄」の重みが3とされ、日付が7/3の、次に現在時刻に近いメッセージから抽出されたキーワード「夏休み」と「海」の重みが2とされ、日付が7/1の、次に現在時刻に近いメッセージから抽出されたキーワード「夏休み」と「予定」の重みが1とされる。
このように各キーワードの重みが与えられると、同じ単語ごと重みが集計されて、各キーワードのポイントが求められる(ステップS14)。
図5の例では、図5右下に示すように、複数回出現するキーワード「イタリアン」及び「夏休み」の重みが同じ単語ごとにそれぞれ集計されて、キーワード「イタリアン」及び「夏休み」のポイント(9(=5+4),3(=2+1))が求められる。1回だけ出現するキーワード「お店」、「食事会」、「沖縄」、「海」、「予定」については、各キーワードの重みが、各キーワードに対するポイント(5,4,3,2,1)とされる。
このように各キーワードのポイントが求められると、例えばポイントが高い順で上位3個のポイントが得られるキーワードが、ユーザの関心が高いキーワードとして選択され(ステップS15)、選択されたキーワードに基づいて、ユーザに推薦するコンテンツが決定される(ステップS16)。
このようにしてコンテンツ決定処理が行われ、ユーザに推薦するコンテンツが決定される。
すなわち図5の例では、同じ単語のキーワードが複数回抽出されたとき、それぞれに重みを与え、その単語のキーワードについて集計した結果得られた重みを、その単語のキーワードのポイントとするようにしたので、例えば、2回出現しているキーワード「イタリアン」のポイントを、キーワード「イタリアン」が出現している抽出対象テキストに出現しているが1回だけ出現しているキーワード「お店」のポイントより大きくすることができる。その結果、ユーザがより関心を持っていると思われる事柄に関連するキーワードに基づいて、ユーザに推薦するコンテンツを決定することができ、ユーザがより関心を持っている事柄に関連するコンテンツをユーザに推薦することができる。
次に図6の例を参照して、コンテンツ決定処理の他の具体例を説明する。
上述したように、やり取りされたメッセージに複数回出現している単語に対して、ユーザは高い関心を持っていると考えられるが、図5の例のように、同じキーワードが異なる抽出対象テキストに複数回出現しているのではなく1つの抽出対象テキストに複数回出現している場合がある。そのとき図5の例のように複数回出現しているキーワードそれぞれに同じ重みを与えると、他のキーワードに比べポイントが大きくなり過ぎることがある。
そこで図6の例では、1つの抽出対象テキストにおける出現回数が所定回数以上のキーワードには所定の小さい重みを与えるようにしている。
はじめに図6左に示すようなメッセージの中から本文部分のテキスト「イタリアンのお店リストつくりました。」、「来週の食事会はイタリアンはどうでしょう。」、「沖縄がいいんじゃない?沖縄といえば、沖縄そば。」、「夏休みは海がいいな。」、及び「夏休みの予定を決めましょう。」が抽出対象テキストとして取得され、抽出対象テキストに、メッセージの日付が付随される(ステップS11)。
次に、図6右上に示すように、抽出対象テキスト「イタリアンのお店リストつくりました。」からは「イタリアン」及び「お店」が、抽出対象テキスト「来週の食事会はイタリアンはどうでしょう。」からは「食事会」及び「イタリアン」が、抽出対象テキスト「沖縄がいいんじゃない?沖縄といえば、沖縄そば。」からは「沖縄」、「沖縄」、及び「沖縄」が、抽出対象テキスト「夏休みは海がいいな。」からは「夏休み」及び「海」が、抽出対象テキスト「夏休みの予定を決めましょう。」からは、「夏休み」及び「予定」が、それぞれキーワードとして抽出される(ステップS12)。
次に、図6右上に示すような、キーワード「イタリアン」、「お店」、「食事会」、「イタリアン」、「沖縄」、「沖縄」、「沖縄」、「夏休み」、「海」、「夏休み」、「予定」のそれぞれの、1つの抽出対象テキストにおける出現回数(1,1,1,1,3,3,3,1,1,1,1)が、各キーワードのキーワード情報として取得される(ステップS13)。
次に、例えば、1つの抽出対象テキストにおける出現回数が所定回数以上のキーワードに所定の小さな重みが与えられる。
図6の例では、図6右上に示すように、1つの抽出対象テキストにおける出現回数が1回のキーワードの重みは1とされ、1つの抽出対象テキストにおける出現回数が2回以上のキーワードの重みは0.5とされる。すなわち、キーワード「イタリアン」、「お店」、「食事会」、「イタリアン」、「沖縄」、「沖縄」、「沖縄」、「夏休み」、「海」、「夏休み」、「予定」のそれぞれの重みが、1、1、1、1、0.5、0.5、0.5、1、1、1、1とされる。
このように各キーワードの重みが与えられると、同じ単語ごとに重みが集計され、各キーワードのポイントが求められる(ステップS14)。
図6の例では、図6右下に示すように、複数回出現するキーワード「イタリアン」、「沖縄」及び「夏休み」の重みが同じ単語ごとにそれぞれ集計されて、キーワード「イタリアン」、「沖縄」及び「夏休み」のポイント(2(=1×2),1.5(=0.5×3),2(=1×2))が求められる。1回だけ出現するキーワード「お店」、「食事会」、「海」、「予定」については、各キーワードの重みが、各キーワードのポイント(1,1,1,1)とされる。
このように各キーワードのポイントが求められると、例えばポイントが高い順で上位3個のポイントが得られるキーワードが、ユーザの関心が高いキーワードとして選択され(ステップS15)、選択されたキーワードに基づいて、ユーザに推薦するコンテンツが決定される(ステップS16)。
このようにしてコンテンツ決定処理が行われ、ユーザに推薦するコンテンツが決定される。
すなわち図6の例では、1つの抽出対象テキストに複数回出現しているキーワードに、1つの抽出対象テキストに1回だけ出現しているキーワードに比べてより小さい重みを与えるようにしたので、例えば、1つの抽出対象テキストに3回出現しているキーワード「沖縄」のポイントを、例えば異なる抽出対象テキストそれぞれに2回出現しているキーワード「イタリアン」及び「夏休み」のポイントより小さくし、1つの抽出対象テキストに複数回出現しているキーワードのポイントが大きくなり過ぎることを防止することができる。
また換言すれば、例えば異なる抽出対象テキストに繰り返し出現しているキーワード「イタリアン」及び「夏休み」は、同じ1つの抽出対象テキストに繰り返し出現しているキーワード「沖縄」に比べ、ユーザが継続的に関心を持っているキーワードであると考えられるので、このように重みを与えることにより、ユーザが継続的に関心を持っているキーワードのポイントを、同じ抽出対象テキストに繰り返し出現するキーワードのポイントより大きくすることができる。
その結果、ユーザがより関心を持っていると思われる事柄に関連するキーワードに基づいて、ユーザに推薦するコンテンツを決定することができ、ユーザがより関心を持っている事柄に関連するコンテンツをユーザに推薦することができる。
次に図7の例を参照して、コンテンツ決定処理の他の具体例を説明する。
抽出対象テキスト上の位置が先頭により近いキーワードに対するユーザの関心は高く、抽出対象テキスト上の位置が先頭からより遠いキーワードに対するユーザの関心は低いとも考えられる。
そこで図7の例では、抽出対象テキスト上の位置が先頭からより近い、つまり、抽出対象テキスト上の出現の順番が早い(小さい)キーワードにより大きい重みを与えるようにしている。
はじめに、図7上から1番目に示すように、メッセージの中から本文部分のテキスト「おいしいワインを見つけました。カリフォルニアワインだけど、なかなかおいしいです。ワインにはおいしいパンとチーズも必要ですね。パンはやっぱりバゲットがいいと思います。パンがあれば、それで十分。それくらい、パンがあるだけで楽しむことができるのです。」が抽出対象テキストとして取得される(ステップS11)。
次に、図7上から2番目に示すように、この抽出対象テキストからは、「ワイン」、「カリフォルニア」、「ワイン」、「ワイン」、「パン」、「チーズ」、「パン」、「バケット」、「パン」、及び「パン」が、それぞれキーワードとして抽出される(ステップS12)。
次に、図7上から2番目に示すように、キーワード「ワイン」、「カリフォルニア」、「ワイン」、「ワイン」、「パン」、「チーズ」、「パン」、「バケット」、「パン」、「パン」のそれぞれの抽出対象テキストにおける出現の順番(1,2,3,4,5,6,7,8,9,10)が、各キーワードのキーワード情報として取得される(ステップS13)。
次に、例えば、抽出対象テキスト上の出現の順番がより小さいキーワードほどより大きい重みが与えられる。
例えば抽出対象テキスト上の出現の順番が最も早い(小さい)キーワードの重みが10とされ、出現の順番が遅く(大きく)なるごとに1づつ小さくなるように重みが与えられる。
すなわち図7の例では、図7の上から2番目に示すように、出現の順番が1のキーワード「ワイン」の重みが10とされ、出現の順番が2のキーワード「カリフォルニア」の重みが9とされる。同様に、出現の順番が3乃至10のキーワード「ワイン」、「ワイン」、「パン」、「チーズ」、「パン」、「バケット」、「パン」、「パン」それぞれの重みが、8、7、6、5、4、3、2、1とされる。
このように各キーワードの重みが与えられると、同じ単語ごとに重みが集計され、各キーワードのポイントが求められる(ステップS14)。
図7の例では、図7の上から3番目に示すように、複数回出現するキーワード「ワイン」及び「パン」の重みが同じ単語ごとにそれぞれ集計されて、キーワード「ワイン」及び「パン」のポイント(25(=10+8+7),13(=6+4+2+1))が求められる。1回だけ出現するキーワード「カリフォルニア」、「チーズ」、「バケット」については、各キーワードの重みが、各キーワードに対するポイント(9,5,3)とされる。
このように各キーワードのポイントが求められると、例えばポイントが高い順で上位3個のポイントが得られるキーワードが、ユーザの関心が高いキーワードとして選択され(ステップS15)、選択されたキーワードに基づいて、ユーザに推薦するコンテンツが決定される(ステップS16)。
このようにしてコンテンツ決定処理が行われ、ユーザに推薦するコンテンツが決定される。
すなわち図7の例では、抽出対象テキスト上の位置が先頭により近いキーワードにより大きい重みを与えるようにしたので、例えば抽出対象テキストの冒頭に出現するキーワード「ワイン」のポイントを、抽出対象テキストの後半部分に出現するキーワード「パン」のポイントより大きくすることができる。その結果、ユーザがより関心を持っていると思われる事柄に関連するキーワードに基づいて、ユーザに推薦するコンテンツを決定することができ、ユーザがより関心を持っている事柄に関連するコンテンツをユーザに推薦することができる。
次に図8の例を参照して、コンテンツ決定処理の他の具体例を説明する。
図4及び図5の例では、メッセージの日付、つまり、抽出対象テキストの日付を、図6の例では、1つの抽出対象テキストにおけるキーワードの出現回数を、図7の例では、キーワードの抽出対象テキスト上の位置を、それぞれキーワード情報とし、キーワード情報に基づいて各キーワードに重みを与えるようにしたが、これらの例を複数組み合わせることもできる。
図8は、図4及び図5の例と図7の例を組み合わせた例を示している。すなわち図8の例では、抽出対象テキストの日付(図4及び図5の例)と抽出対象テキスト上の位置(図7の例)とをキーワード情報とし、それらに基づいてキーワードに重みを与えるようにしている。
はじめに、図8上から1番目に示すように、メッセージの中から本文部分のテキスト「その映画見たよ。「ワイン畑でつかまえて」でしょ?最近の映画の中ではイチオシ。」、「そうそう。そのワイナリーで撮影した映画があるんだよね。見たことある?この映画?」、「そのワイン知ってる。映画監督のコッポラのワイナリーのワインだよね?」、及び「おいしいワインを見つけました。カリフォルニアワインだけど、なかなかいけるよ。チーズも見つけたいな」が抽出対象テキストとして取得され、抽出対象テキストに、メッセージの日付が付随される(ステップS11)。
次に、図8上から1番目に示すように、抽出対象テキスト「その映画見たよ。「ワイン畑でつかまえて」でしょ?最近の映画の中ではイチオシ。」からは「映画」、「ワイン」、「畑」、「映画」が、抽出対象テキスト「そうそう。そのワイナリーで撮影した映画があるんだよね。見たことある?この映画?」からは、「ワイナリー」、「映画」、及び「映画」が、抽出対象テキスト「そのワイン知ってる。映画監督のコッポラのワイナリーのワインだよね?」からは、「ワイン」、「映画」、「監督」、「ワイナリー」、及び「ワイン」が、抽出対象テキスト「おいしいワインを見つけました。カリフォルニアワインだけど、なかなかいけるよ。チーズも見つけたいな」からは、「ワイン」、「カリフォルニア」、「ワイン」、及び「チーズ」が、それぞれキーワードとして抽出される(ステップS12)。
次に、図8上から1番目に示すように、キーワード「映画」、「ワイン」、「畑」、「映画」、「ワイナリー」、「映画」、「映画」、「ワイン」、「映画」、「監督」、「ワイナリー」、「ワイン」、「ワイン」、「カリフォルニア」、「ワイン」、「チーズ」のそれぞれが抽出された各抽出対象テキストの日付(7/14,7/14,7/14,7/14,7/13,7/13,7/13,7/12,7/12,7/12,7/12,7/12,7/11,7/11,7/11,7/11)と、各抽出対象テキスト上の出現の順番(1,2,3,4,1,2,3,1,2,3,4,5,1,2,3,4)とが、キーワード情報として取得される(ステップS13)。
次に、例えば、抽出対象テキストの日付が現在時刻により近いキーワードにより大きい重みが与えられるとともに、各抽出対象テキスト上の出現の順番がより小さいキーワードにより大きい重みが与えられる。
図8の例では、まず、図4及び図5の例の場合と同様に、直近のメッセージから抽出されたキーワードの重みが5とされ、過去のメッセージに遡るごとに1づつ小さくなるように日付による重みが与えられる。次に、図7の例の場合と同様に、例えば各抽出対象テキスト上の出現の順番が最も早い(小さい)キーワードの重みが10とされ、出現の順番が大きくなるごとに1づつ小さくなるように出現の順番による重みが与えられる。そして、各キーワードについて日付による重みと出現の順番による重みとが掛け算され、その結果がキーワードの(最終的な)重みとして与えられる。
例えば、現在の日付が7/13であり、日付が7/11から7/12までのメッセージの本文部分を抽出対象テキストとするとき、図8上から1番目に示すように、これらの抽出対象テキストから抽出されるキーワード「ワイン」、「映画」、「監督」、「ワイナリー」、「ワイン」、「ワイン」、「カリフォルニア」、「ワイン」、「チーズ」のそれぞれの日付による重みが、5、5、5、5、5、4、4、4、4とされ、出現の順番による重みが、10、9、8、7、6、10、9、8、7とされる。
そして、キーワード「ワイン」、「映画」、「監督」、「ワイナリー」、「ワイン」、「ワイン」、「カリフォルニア」、「ワイン」、「チーズ」それぞれの日付による重みと出現順番による重みが掛け算され、その結果、各キーワードの重みは、50(=5×10)、45(=5×9)、40(=5×8)、35(=5×7)、30(=5×6)、40(=4×10)、36(=4×9)、32(=4×8)、28(=4×7)とされる。
あるいは、例えば、現在の日付が7/15であり、日付が7/11から7/14までのメッセージの本文部分を抽出対象テキストとするとき、図8上から1番目に示すように、これらの抽出対象テキストから抽出されるキーワード「映画」、「ワイン」、「畑」、「映画」、「ワイナリー」、「映画」、「映画」、「ワイン」、「映画」、「監督」、「ワイナリー」、「ワイン」、「ワイン」、「カリフォルニア」、「ワイン」、「チーズ」のそれぞれの日付による重みが、5、5、5、5、4、4、4、3、3、3、3、3、2、2、2、2とされ、出現の順番による重みが、10、9、8、7、10、9、8、10、9、8、7、6、10、9、8、7とされる。
そして、キーワード「映画」、「ワイン」、「畑」、「映画」、「ワイナリー」、「映画」、「映画」、「ワイン」、「映画」、「監督」、「ワイナリー」、「ワイン」、「ワイン」、「カリフォルニア」、「ワイン」、「チーズ」それぞれの重みが、50(=5×10)、45(=5×9)、40(=5×8)、35(=5×7)、40(=4×10)、36(=4×9)、32(=4×8)、30(=3×10)、27(=3×9)、24(=3×8)、21(=3×7)、18(=3×6)、20(=2×10)、18(=2×9)、16(=2×8)、14(=2×7)とされる。
このように各キーワードの重みが与えられると、同じ単語ごとに重みが集計されて、各キーワードのポイントが求められる(ステップS14)。
図8の例では、例えば、上述した現在の日付が7/13の場合、図8上から2番目に示すように、キーワード「ワイン」、「映画」、「監督」、「ワイナリー」、「カリフォルニア」、「チーズ」のそれぞれのポイント(152(=5×10+5×6+4×10+4×8),45(=5×9),40(=5×8),35(=5×7),36(=4×9),28(=4×7))が求められる。
あるいは、例えば、上述した現在の日付が7/15の場合、図8上から3番目に示すように、キーワード「映画」、「ワイン」、「畑」、「ワイナリー」、「監督」、「カリフォルニア」、「チーズ」のそれぞれのポイント(151(=5×10+5×7+4×9+4×8+3×9),129(=5×9+3×10+3×6+2×10+2×8),40(=5×8),61(=4×10+3×7),24(=3×8),18 (=2×9),14(=2×7))が求められる。
このように各キーワードのポイントが求められると、例えばポイントが高い順で上位3個のポイントが得られるキーワードが、ユーザの関心が高いキーワードとして選択され(ステップS15)、選択されたキーワードに基づいて、ユーザに推薦するコンテンツが決定される(ステップS16)。
このようにしてコンテンツ決定処理が行われ、ユーザに推薦するコンテンツが決定される。
すなわち図8の例では、日付が現在時刻に時間的に近いキーワード、または抽出対象テキスト上の位置が先頭により近いキーワードにより大きい重みを与えるようにしたので、例えば、ワインの話題が中心となっている7/11から7/12までの2日間では、キーワード「ワイン」のポイントを最も大きくすることができ、あるいは、話題の中心がワインから映画に移行している7/11から7/14までの4日間では、キーワード「映画」のポイントを最も大きくすることができる。その結果、ユーザがより関心を持っていると思われる事柄に関連するキーワードに基づいて、ユーザに推薦するコンテンツを決定することができ、ユーザがより関心を持っている事柄に関連するコンテンツをユーザに推薦することができる。
なお以上においては、メッセージのタイトル部分(図4)または本文部分(図5乃至図8)を抽出対象テキストとする場合について説明したが、その他、例えばメッセージが、「タイトル」、「コメント」、及び「メモ」の項目(以下、テキスト項目と称する)から構成され、これらのテキスト項目すべてを抽出対象テキストにするとともに、テキスト項目の種類をキーワード情報として、キーワード情報としてのテキスト項目の種類に応じてキーワードの重みを変えるようにしてもよい。
例えば、テキスト項目「タイトル」に記載されているキーワードが重要であるとも考えられるので、テキスト項目「タイトル」をユーザの関心が高いテキスト項目の種類とみなすこともできるし、テキスト項目「コメント」の文字数に制限が無いとすると、より詳細な記述ができるので、テキスト項目「コメント」をユーザの関心が高いテキスト項目の種類とみなすこともできる。そこで、ユーザの関心が高いと思われるテキスト項目の種類から抽出されたキーワードにより大きい重みが与えられるようにすることもできる。
また以上においては、抽出対象テキストは、メッセージに関連するテキストとしたが、その他、放送番組や番組情報等の放送コンテンツ、ウェブサイト上の画像データ若しくは音声データ等のネットワークコンテンツ、またはユーザが所有する画像データ若しくは音声データに付与される例えばそのコンテンツに対する情報処理装置1のユーザの感想、メモ等のユーザにより作成されたテキストとしてもよい。
かかる抽出対象テキストを扱う情報処理装置1では、図9に示すように、テキスト蓄積部11には、メッセージが蓄積されるメッセージDB51の他、パーソナルコンテンツが蓄積されるパーソナルコンテンツDB52、ネットワークコンテンツが蓄積されるネットワークコンテンツDB53、及び、放送コンテンツが蓄積される放送コンテンツDB54が設けられる。各DBには、上述したようなユーザにより作成されたテキストが含まれるテキスト情報が各コンテンツに関連付けられて格納されている。
なお、パーソナルコンテンツDB52に蓄積されるパーソナルコンテンツは、例えば、情報処理装置1に脱着可能な状態で接続された図示せぬメモリカード等から取得されて蓄積され、ネットワークコンテンツDB53に蓄積されるネットワークコンテンツは、例えば、図示せぬウェブサイトのサーバからインターネットを介して取得されて蓄積され、放送コンテンツDB54に蓄積される放送コンテンツは、例えば、図示せぬ放送局のサーバからインターネットあるいは放送波を介して取得されて蓄積される。
ところでコンテンツの種類には、大きく分けてユーザが生成または管理するもの、つまり、ユーザが著作権を持っているものとそうでないものとがあるが、ユーザが著作権を持っているコンテンツに対するユーザの関心は高いか、若しくは、関心の解析対象そのものと考えられる。すなわち、ユーザが著作権を持っている例えばパーソナルコンテンツ(例えばパーソナルコンテンツDB52に格納されているコンテンツ)等に付与された抽出対象テキストから抽出されたキーワードに対するユーザの関心は高く、ユーザが著作権を持っていない例えば放送コンテンツ、ネットワークコンテンツ(例えば、ネットワークコンテンツDB53や放送コンテンツDB54に格納されているコンテンツ)等に付与された抽出対象テキストから抽出されたキーワードに対するユーザの関心は低いと考えることもできる。
そこで、キーワードが抽出される抽出対象テキストが関連付けられているコンテンツの種類がキーワード情報として取得され、ユーザの関心が高いコンテンツの種類のキーワードにより大きい重みが与えられるようにすることもできる。
以上のように、情報処理装置1は、ユーザにより作成されたテキストからキーワードを抽出し、抽出されたキーワードの所定のキーワード情報を取得し、キーワード情報に基づいて、キーワードに対するユーザの関心の高さを表すポイントを求め、ポイントに基づいて、抽出されたキーワードの中から所定のキーワードを選択し、選択されたキーワードに基づいて、ユーザに推薦するコンテンツを決定するようにしたので、すなわち、ユーザにより作成されたテキストに基づいて、ユーザに推薦するコンテンツを決定するようにしたので、ユーザの意向の範囲で、ユーザに推薦するコンテンツの範囲を、決定することができる。
なお、キーワード情報は、上述したものに限定されるものではなく、その他、例えば、キーワードが含まれる抽出対象テキストの数や、キーワードが抽出対象テキストに出現する期間等を用いてもよい。
また、抽出対象テキストで構成されるコンテンツは、メッセージに限定されるものではなく、その他、例えば、ウェブログに含まれるテキスト等であってもよい。
抽出対象テキストが付与されるコンテンツは、放送コンテンツ、ネットワークコンテンツ、パーソナルコンテンツに限定されるものではない。
上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、プログラム記録媒体からインストールされる。
図10は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。
コンピュータにおいて、CPU(Central Processing Unit)71,ROM(Read Only Memory)72,RAM(Random Access Memory)73は、バス74により相互に接続されている。
バス74には、さらに、入出力インタフェース75が接続されている。入出力インタフェース75には、キーボード、マウス、マイクロホンなどよりなる入力部76、ディスプレイ、スピーカなどよりなる入力部77、ハードディスクや不揮発性のメモリなどよりなる記憶部78、ネットワークインタフェースなどよりなる通信部79、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア81を駆動するドライブ80が接続されている。
以上のように構成されるコンピュータでは、CPU71が、例えば、記憶部78に記憶されているプログラムを、入出力インタフェース75及びバス74を介して、RAM73にロードして実行することにより、上述した一連の処理が行われる。
コンピュータ(CPU71)が実行するプログラムは、例えば、磁気ディスク(フレキシブルディスクを含む)、光ディスク(CD−ROM(Compact Disc−Read Only Memory),DVD(Digital Versatile Disc)等)、光磁気ディスク、もしくは半導体メモリなどよりなるパッケージメディアであるリムーバブルメディア81に記録して、あるいは、ローカルエリアネットワーク、インターネット、ディジタル衛星放送といった、有線または無線の伝送媒体を介して提供される。
そして、プログラムは、リムーバブルメディア81をドライブ80に装着することにより、入出力インタフェース75を介して、記憶部78にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部79で受信し、記憶部78にインストールすることができる。その他、プログラムは、ROM72や記憶部78に、あらかじめインストールしておくことができる。
なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
なお、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。
本発明を適用した情報処理装置の構成例を示すブロック図である。 コンテンツ決定部12におけるコンテンツ決定処理を説明するフローチャートである。 本発明を適用した情報処理装置の他の構成例を示すブロック図である。 コンテンツ決定処理の具体例を説明する図である。 コンテンツ決定処理の具体例を説明する図である。 コンテンツ決定処理の具体例を説明する図である。 コンテンツ決定処理の具体例を説明する図である。 コンテンツ決定処理の具体例を説明する図である。 本発明を適用した情報処理装置の他の構成例を示すブロック図である。 本発明を適用したコンピュータのハードウェアの構成例を示すブロック図である。
符号の説明
1 情報処理装置, 11 テキスト蓄積部, 12 コンテンツ決定部, 13 表示部, 31 抽出対象テキスト取得部, 32 キーワード抽出部, 33 キーワード情報取得部, 34 関心度演算部, 35 キーワード選択部, 36 コンテンツ決定部, 51 メッセージDB, 52 パーソナルコンテンツDB, 53 ネットワークコンテンツDB, 54 放送コンテンツDB, 71 CPU, 72 ROM, 73 RAM, 74 バス, 75 入出力インタフェース, 76 入力部, 77 入力部, 78 記憶部, 79 通信部, 80 ドライブ, 81 リムーバブルメディア

Claims (7)

  1. ユーザにより作成されたテキストからキーワードを抽出するキーワード抽出手段と、
    前記キーワード抽出手段により抽出された前記キーワードの所定のキーワード情報を取得するキーワード情報取得手段と、
    前記キーワード情報に基づいて、前記キーワードに対する前記ユーザの関心の高さを表す関心度情報を求める関心度演算手段と、
    前記関心度情報に基づいて、前記キーワード抽出手段により抽出された前記キーワードの中から所定のキーワードを選択するキーワード選択手段と、
    前記キーワード選択手段により選択された前記キーワードに基づいて、前記ユーザに推薦するコンテンツを決定するコンテンツ決定手段と
    を備える情報処理装置。
  2. 前記キーワード情報は、
    キーワードが抽出された前記テキストが作成された時刻に対応する時刻を示す情報、
    前記テキスト上のキーワードの位置を示す情報、
    前記テキストにおけるキーワードの出現回数を示す情報
    である
    請求項1に記載の情報処理装置。
  3. 前記テキストは、推薦されるコンテンツに関連付けられており、
    前記キーワード情報は、前記テキストが関連付けられているコンテンツの種類を示す情報である
    請求項1に記載の情報処理装置。
  4. 前記推薦されるコンテンツは、放送コンテンツ、ネットワークコンテンツ、またはパーソナルコンテンツである
    請求項3に記載の情報処理装置。
  5. 前記テキストは、複数の項目から構成されており、
    前記テキストを構成する前記項目の中の所定の項目のテキストを取得するテキスト取得手段をさらに備え、
    前記キーワード抽出手段は、前記テキスト取得手段により取得された前記項目のテキストからキーワードを抽出し、
    前記キーワード情報取得手段は、前記キーワード抽出手段によりキーワードが抽出された前記項目の種類を示す情報を、前記キーワード情報として取得する
    請求項1に記載の情報処理装置。
  6. ユーザにより作成されたテキストからキーワードを抽出するキーワード抽出ステップと、
    前記キーワード抽出ステップの処理により抽出された前記キーワードの所定のキーワード情報を取得するキーワード情報取得ステップと、
    前記キーワード情報に基づいて、前記キーワードに対する前記ユーザの関心の高さを表す関心度情報を求める関心度演算ステップと、
    前記関心度情報に基づいて、前記キーワード抽出ステップの処理により抽出された前記キーワードの中から所定のキーワードを選択するキーワード選択ステップと、
    前記キーワード選択ステップの処理により選択された前記キーワードに基づいて、前記ユーザに推薦するコンテンツを決定するコンテンツ決定ステップと
    を含む情報処理方法。
  7. ユーザにより作成されたテキストからキーワードを抽出するキーワード抽出ステップと、
    前記キーワード抽出ステップの処理により抽出された前記キーワードの所定のキーワード情報を取得するキーワード情報取得ステップと、
    前記キーワード情報に基づいて、前記キーワードに対する前記ユーザの関心の高さを表す関心度情報を求める関心度演算ステップと、
    前記関心度情報に基づいて、前記キーワード抽出ステップの処理により抽出された前記キーワードの中から所定のキーワードを選択するキーワード選択ステップと、
    前記キーワード選択ステップの処理により選択された前記キーワードに基づいて、前記ユーザに推薦するコンテンツを決定するコンテンツ決定ステップと
    を含む情報処理をコンピュータに実行させるプログラム。
JP2007102242A 2007-04-09 2007-04-09 情報処理装置及び方法、並びにプログラム Pending JP2008257655A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2007102242A JP2008257655A (ja) 2007-04-09 2007-04-09 情報処理装置及び方法、並びにプログラム
US12/098,554 US8209329B2 (en) 2007-04-09 2008-04-07 Apparatus, method, and program for information processing

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007102242A JP2008257655A (ja) 2007-04-09 2007-04-09 情報処理装置及び方法、並びにプログラム

Publications (1)

Publication Number Publication Date
JP2008257655A true JP2008257655A (ja) 2008-10-23

Family

ID=39981131

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007102242A Pending JP2008257655A (ja) 2007-04-09 2007-04-09 情報処理装置及び方法、並びにプログラム

Country Status (2)

Country Link
US (1) US8209329B2 (ja)
JP (1) JP2008257655A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010098178A1 (ja) * 2009-02-27 2010-09-02 株式会社 東芝 情報推薦装置、情報推薦方法および情報推薦プログラム
WO2013021696A1 (ja) * 2011-08-05 2013-02-14 インターナショナル・ビジネス・マシーンズ・コーポレーション 情報検索システム、方法、及びプログラム
WO2014069755A1 (ko) * 2012-10-30 2014-05-08 에스케이플래닛 주식회사 컨텐츠 추천 서비스 제공 시스템 및 방법
KR20140056635A (ko) * 2012-10-30 2014-05-12 에스케이플래닛 주식회사 컨텐츠 추천 서비스 제공 시스템 및 방법
JP2015005058A (ja) * 2013-06-19 2015-01-08 ヤフー株式会社 レコメンド装置、レコメンド方法及びレコメンドプログラム
JP2016015162A (ja) * 2015-09-18 2016-01-28 ヤフー株式会社 レコメンド装置、レコメンド方法及びレコメンドプログラム
WO2018061824A1 (ja) * 2016-09-29 2018-04-05 日本電気株式会社 情報処理装置、情報処理方法およびプログラム記録媒体

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5224868B2 (ja) * 2008-03-28 2013-07-03 株式会社東芝 情報推薦装置および情報推薦方法
JP5418051B2 (ja) * 2008-09-08 2014-02-19 株式会社リコー ワークフロー管理システム
US10360605B2 (en) * 2010-03-29 2019-07-23 Rakuten, Inc. Server apparatus, information providing method, information providing program, recording medium recording the information providing program, and information providing system
US8504671B1 (en) * 2010-09-02 2013-08-06 Symantec Corporation Systems and methods for rating a current instance of data based on preceding and succeeding instances of data
KR101712988B1 (ko) 2010-09-10 2017-03-07 삼성전자주식회사 이동통신 단말기에서 인터넷 서비스 제공 방법 및 장치
US9595298B2 (en) 2012-07-18 2017-03-14 Microsoft Technology Licensing, Llc Transforming data to create layouts
CN104090921B (zh) * 2014-06-19 2017-06-16 小米科技有限责任公司 多媒体文件播放方法、装置、终端及服务器
US10282069B2 (en) * 2014-09-30 2019-05-07 Microsoft Technology Licensing, Llc Dynamic presentation of suggested content
US9626768B2 (en) 2014-09-30 2017-04-18 Microsoft Technology Licensing, Llc Optimizing a visual perspective of media
US10380228B2 (en) 2017-02-10 2019-08-13 Microsoft Technology Licensing, Llc Output generation based on semantic expressions
US10768953B2 (en) * 2018-08-07 2020-09-08 Citrix Systems, Inc. Computing system providing suggested actions within a shared application platform and related methods

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5873107A (en) * 1996-03-29 1999-02-16 Apple Computer, Inc. System for automatically retrieving information relevant to text being authored
JPH1166081A (ja) 1997-08-12 1999-03-09 N T T Data:Kk プロファイル取得システム、情報提供システム、プロファイル取得方法及び媒体
JP2000029829A (ja) 1998-07-08 2000-01-28 Toshiba Corp 分散ネットワークコンピューティングシステム、情報交換装置、及び情報交換方法
US6571234B1 (en) * 1999-05-11 2003-05-27 Prophet Financial Systems, Inc. System and method for managing online message board
JP4605415B2 (ja) 2000-02-21 2011-01-05 ソニー株式会社 情報処理装置および方法、並びに記録媒体
US7007232B1 (en) * 2000-04-07 2006-02-28 Neoplasia Press, Inc. System and method for facilitating the pre-publication peer review process
US6845374B1 (en) * 2000-11-27 2005-01-18 Mailfrontier, Inc System and method for adaptive text recommendation
US20020194166A1 (en) * 2001-05-01 2002-12-19 Fowler Abraham Michael Mechanism to sift through search results using keywords from the results
JP2003242176A (ja) 2001-12-13 2003-08-29 Sony Corp 情報処理装置および方法、記録媒体、並びにプログラム
EP1492020A4 (en) * 2002-03-29 2005-09-21 Sony Corp INFORMATION SEARCH SYSTEM, INFORMATION PROCESSING DEVICE AND METHOD AND INFORMATION SEARCH AND METHOD
JP4253532B2 (ja) 2003-06-02 2009-04-15 シャープ株式会社 情報推薦装置、情報推薦プログラム及び記録媒体
US7203684B2 (en) * 2003-10-07 2007-04-10 Google, Inc Serving content-targeted ADS in e-mail, such as e-mail newsletters
JP2005115790A (ja) 2003-10-09 2005-04-28 Sony Corp 情報検索方法、情報表示装置及びプログラム
US7562069B1 (en) * 2004-07-01 2009-07-14 Aol Llc Query disambiguation
US20060074905A1 (en) * 2004-09-17 2006-04-06 Become, Inc. Systems and methods of retrieving topic specific information
JP2006119911A (ja) * 2004-10-21 2006-05-11 Ricoh Co Ltd 人材検索システム、人材登録装置、人材検索装置、人材登録方法、人材検索方法、プログラムおよび記録媒体
CN1609859A (zh) * 2004-11-26 2005-04-27 孙斌 搜索结果聚类的方法
JP2006228141A (ja) 2005-02-21 2006-08-31 Nec Corp 情報推薦システム、管理装置、情報推薦方法およびプログラム
US10740722B2 (en) * 2005-04-25 2020-08-11 Skyword Inc. User-driven media system in a computer network
US10510043B2 (en) * 2005-06-13 2019-12-17 Skyword Inc. Computer method and apparatus for targeting advertising
EP1758031A1 (en) * 2005-08-25 2007-02-28 Microsoft Corporation Selection and display of user-created documents
JP4923604B2 (ja) * 2006-02-13 2012-04-25 ソニー株式会社 情報処理装置および方法、並びにプログラム
US7904461B2 (en) * 2007-05-01 2011-03-08 Google Inc. Advertiser and user association
US20080294624A1 (en) * 2007-05-25 2008-11-27 Ontogenix, Inc. Recommendation systems and methods using interest correlation

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010204735A (ja) * 2009-02-27 2010-09-16 Toshiba Corp 情報推薦装置、情報推薦方法および情報推薦プログラム
WO2010098178A1 (ja) * 2009-02-27 2010-09-02 株式会社 東芝 情報推薦装置、情報推薦方法および情報推薦プログラム
JPWO2013021696A1 (ja) * 2011-08-05 2015-03-05 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 情報検索システム、方法、及びプログラム
WO2013021696A1 (ja) * 2011-08-05 2013-02-14 インターナショナル・ビジネス・マシーンズ・コーポレーション 情報検索システム、方法、及びプログラム
US9811584B2 (en) 2011-08-05 2017-11-07 International Business Machines Corporation Information retrieval system, method, and program
GB2508544A (en) * 2011-08-05 2014-06-04 Ibm Information search system, method and program
WO2014069755A1 (ko) * 2012-10-30 2014-05-08 에스케이플래닛 주식회사 컨텐츠 추천 서비스 제공 시스템 및 방법
KR20140056635A (ko) * 2012-10-30 2014-05-12 에스케이플래닛 주식회사 컨텐츠 추천 서비스 제공 시스템 및 방법
KR102012501B1 (ko) 2012-10-30 2019-08-20 에스케이플래닛 주식회사 컨텐츠 추천 서비스 제공 시스템 및 방법
US10878044B2 (en) 2012-10-30 2020-12-29 Sk Planet Co., Ltd. System and method for providing content recommendation service
JP2015005058A (ja) * 2013-06-19 2015-01-08 ヤフー株式会社 レコメンド装置、レコメンド方法及びレコメンドプログラム
JP2016015162A (ja) * 2015-09-18 2016-01-28 ヤフー株式会社 レコメンド装置、レコメンド方法及びレコメンドプログラム
WO2018061824A1 (ja) * 2016-09-29 2018-04-05 日本電気株式会社 情報処理装置、情報処理方法およびプログラム記録媒体
US10950235B2 (en) 2016-09-29 2021-03-16 Nec Corporation Information processing device, information processing method and program recording medium

Also Published As

Publication number Publication date
US20080301126A1 (en) 2008-12-04
US8209329B2 (en) 2012-06-26

Similar Documents

Publication Publication Date Title
JP2008257655A (ja) 情報処理装置及び方法、並びにプログラム
CN107104881B (zh) 一种信息处理方法和装置
EP3316586B1 (en) Method and device for extracting keywords from bullet screen information and pushing related information including a web link
US20210044640A1 (en) Livestreaming interactive content to a digital media platform
Reich Comparing news reporting across print, radio, television and online: Still distinct manufacturing houses
US20110093415A1 (en) Content recommendation apparatus and method
US20160219398A1 (en) Concepts for determining attributes of a population of mobile device users
US20120311465A1 (en) Accessing Web Content Based on Mobile Contextual Data
US20150046371A1 (en) System and method for determining sentiment from text content
US20140122590A1 (en) Systems, methods, and computer readable media for selecting a playhead in social media playback
Bødker et al. Time‐out/time‐in: The dynamics of everyday experiential computing devices
WO2013077983A1 (en) Adaptive media recommendation systems, methods, and computer readable media
CN111279709B (zh) 提供视频推荐
US20100228732A1 (en) Information offering apparatus and method
Almgren Undoing churnalism? Users sharing local news on Facebook
Wei et al. News on the move: Predictors of mobile news consumption and engagement among Chinese mobile phone users
US20210051122A1 (en) Systems and methods for pushing content
US9015607B2 (en) Virtual space providing apparatus and method
JP2015004756A (ja) 判定装置、判定方法及び判定プログラム
Royston Podcasts and new orality in the African mediascape
EP3258398B1 (en) Engaged micro-interactions on digital devices
US9066135B2 (en) System and method for generating a second screen experience using video subtitle data
US11308110B2 (en) Systems and methods for pushing content
US20150180818A1 (en) Interface for Product Reviews Identified in Online Reviewer Generated Content
US20170279749A1 (en) Modular Communications

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080724

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080724

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081204

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090130

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090224