JP2005157690A - 電子機器装置及び情報提供方法 - Google Patents
電子機器装置及び情報提供方法 Download PDFInfo
- Publication number
- JP2005157690A JP2005157690A JP2003394697A JP2003394697A JP2005157690A JP 2005157690 A JP2005157690 A JP 2005157690A JP 2003394697 A JP2003394697 A JP 2003394697A JP 2003394697 A JP2003394697 A JP 2003394697A JP 2005157690 A JP2005157690 A JP 2005157690A
- Authority
- JP
- Japan
- Prior art keywords
- information
- user
- content
- characteristic information
- user characteristic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】
ユーザが関心のある情報を的確に取得し、当該情報をユーザに対して提示すること。
【解決手段】
ユーザが閲覧中のWebページに対する操作履歴データを解析し、当該操作履歴に対応するWebページから抽出したテキストデータに含まれる単語に関する分析を行ってユーザ特性情報209を生成し、当該ユーザ特性情報を用いて、ユーザに対してコンテンツを推薦する。ユーザ特性情報209は、ユーザが興味のあるWebページに対する操作履歴を反映しているため、ユーザの興味のあるコンテンツを推薦することが可能となる。そしてユーザにとっても、上記処理が自動的に実行されるため、ユーザは複雑な操作を行う必要もなく、ネットワーク等に関する専門的な知識を持っていなくても、自らが興味の有るコンテンツの推薦を受けることができる。
【選択図】 図2
ユーザが関心のある情報を的確に取得し、当該情報をユーザに対して提示すること。
【解決手段】
ユーザが閲覧中のWebページに対する操作履歴データを解析し、当該操作履歴に対応するWebページから抽出したテキストデータに含まれる単語に関する分析を行ってユーザ特性情報209を生成し、当該ユーザ特性情報を用いて、ユーザに対してコンテンツを推薦する。ユーザ特性情報209は、ユーザが興味のあるWebページに対する操作履歴を反映しているため、ユーザの興味のあるコンテンツを推薦することが可能となる。そしてユーザにとっても、上記処理が自動的に実行されるため、ユーザは複雑な操作を行う必要もなく、ネットワーク等に関する専門的な知識を持っていなくても、自らが興味の有るコンテンツの推薦を受けることができる。
【選択図】 図2
Description
本発明は、ユーザの所望するコンテンツを提供することができる電子機器装置及び情報提供方法に関する。
従来から、例えばテレビ放送など逐次的に流れる情報からそれに関連する情報を検索する技術としては、テレビ放送の映像情報若しくは音声情報をテロップ認識又は音声認識により認識してそこから文字列を抽出し、単語辞書を参照して当該文字列からキーワードを生成し、当該キーワードを基にそれに関連する情報を検索し、当該情報をテレビ画面に表示するというものがある(例えば、特許文献1、特許文献2等参照)
特願平11−161661号公報
特願平11−250068号公報
しかしながら、上記キーワードは、必ずしもユーザの興味を反映したものではないため、当該キーワードを用いて情報を検索しても、ユーザの興味とは関連性の無い情報が検索されてしまい、ユーザの所望する情報を提供することができないため、利便性を損ねていた。
以上のような事情に鑑み、本発明の目的は、ユーザが関心のある情報を的確に取得し、当該情報をユーザに対して提示することができる利便性の高い電子機器装置及び情報提供方法を提供することにある。
上記目的を達成するため、本発明の主たる観点に係る電子機器装置は、第1のコンテンツを表示する表示手段と、前記表示された第1のコンテンツに対するユーザの操作情報を、当該第1のコンテンツと対応付けて記憶する操作情報記憶手段と、前記表示された第1のコンテンツから、当該第1のコンテンツに含まれる文字情報を抽出する文字情報抽出手段と、前記第1のコンテンツから抽出された前記文字情報から、前記操作情報に応じたユーザ特性情報を生成するユーザ特性情報生成手段とを具備することを特徴としている。
また、本発明の他の観点に係る情報提供方法は、(a)第1のコンテンツを表示するステップと、(b)前記表示された第1のコンテンツに対するユーザの操作情報を、当該第1のコンテンツと対応付けて記憶するステップと、(c)前記表示された第1のコンテンツから、当該第1のコンテンツに含まれる文字情報を抽出するステップと、(d)前記第1のコンテンツから抽出された前記文字情報から、前記操作情報に応じたユーザ特性情報を生成するステップとを具備することを特徴としている。
ここで第1のコンテンツとは、例えばインターネット上のWeb(World Wide Web)ページであり、ユーザ特性情報とは、例えば上記Webページに含まれる単語を抽出した情報である。これらの構成によれば、コンテンツを閲覧中のユーザの操作を反映したユーザ特性情報を生成することができるため、当該ユーザ特性情報を用いることにより、ユーザに対してユーザ固有の情報を提供することが可能となる。
上記電子機器装置は、前記文字情報に含まれる単語を、その含まれる割合に応じて数値化して、前記単語と当該数値とを対応付けて記憶する記憶手段を更に具備し、前記ユーザ特性情報は、前記操作情報と前記数値化された少なくとも一つの単語とを関連付けて生成されるようにしてもよい。
また、上記情報提供方法は、(e)前記文字情報に含まれる単語を、その含まれる割合に応じて数値化して、前記単語と当該数値とを対応付けて記憶するステップを更に具備し、前記ユーザ特性情報は、前記操作情報と前記数値化された少なくとも一つの単語とを関連付けて生成されるようにしてもよい。
これにより、上記コンテンツに含まれる単語の割合を数値化することで、上記ユーザの操作に応じた上記コンテンツをより正確に反映した上記ユーザ特性情報を生成することができる。
上記電子機器装置は、前記抽出されたユーザ特性情報を用いて、前記ユーザ特性情報に関連する関連情報を検索する第1の検索手段と、前記検索された情報を前記ユーザに提示する提示手段とを更に具備してもよい。
また、上記情報提供方法は、(f)前記抽出されたユーザ特性情報を用いて、前記ユーザ特性情報に関連する関連情報を検索するステップと、(g)前記検索された情報を前記ユーザに提示するステップとを更に具備してもよい。
これにより、コンテンツに対するユーザの操作を反映した上記ユーザ特性情報を用いることで、ユーザに対して、ユーザ固有の情報を検索して提示することができる。
上記電子機器装置において、前記第1の検索手段は、前記ユーザ特性情報に含まれる単語と同一の単語が含まれる情報を検索するものであり、前記ユーザ特性情報に含まれる前記同一の単語の割合と、前記検索された情報に含まれる前記同一の単語の割合とを比較して、前記割合の類似度を判断する判断手段を更に具備し、前記提示手段は、前記判断手段により前記割合が類似すると判断された情報を前記ユーザに提示するようにしてもよい。
また、上記情報提供方法において、前記ステップ(f)は、前記ユーザ特性情報に含まれる単語と同一の単語が含まれる情報を検索するものであり、(h)前記ユーザ特性情報に含まれる前記同一の単語の割合と、前記検索された情報に含まれる前記同一の単語の割合とを比較して、前記割合の類似度を判断するステップを更に具備し、前記ステップ(g)は、前記ステップ(h)により前記割合が類似すると判断された情報を前記ユーザに提示するようにしてもよい。
これにより、上記ユーザ特性情報に含まれる単語と同一の単語を含み、かつ含まれる単語の割合も類似する情報をユーザに提示することとしているため、ユーザの特性をより反映した情報を提示することができる。
上記電子機器装置において、前記操作情報記憶手段は、前記第1のコンテンツに対するユーザの第1の操作情報及び第2の操作情報を前記第1のコンテンツと対応付けて記憶し、前記ユーザ特性情報生成手段は、前記第1の操作情報に対応する文字情報に含まれる単語から、前記第1の操作情報に対応する文字情報及び前記第2の操作情報に対応する文字情報の両方に含まれる単語を削除した単語を基に前記ユーザ特性情報を生成するようにしてもよい。
また、上記情報提供方法において、前記ステップ(b)は、前記第1のコンテンツに対するユーザの第1の操作情報及び第2の操作情報を前記第1のコンテンツと対応付けて記憶し、前記ステップ(d)は、前記第1の操作情報に対応する文字情報に含まれる単語から、前記第1の操作情報に対応する文字情報及び前記第2の操作情報に対応する文字情報の両方に含まれる単語を削除した単語を基に前記ユーザ特性情報を生成するようにしてもよい。
これにより、第1のコンテンツに対するユーザの異なる操作をそれぞれ反映した情報を利用し、例えば一方の操作がユーザの興味を反映し、他方の操作がユーザの無関心を反映している場合に、無関心を反映した情報も用いることで、ユーザに対してユーザの興味を反映しない情報が提供されるのを抑制することができる。
上記電子機器装置において、前記表示手段は、前記第1のコンテンツとして少なくとも一以上のページを所定の時間間隔でページ送りして表示し、前記第1の操作情報は、前記ページ送りに対するユーザの一時停止操作であり、前記第2の操作情報は、前記ページ送りに対するユーザの早送り操作であってもよい。
また、上記情報提供方法において、前記ステップ(a)は、前記第1のコンテンツとして少なくとも一以上のページを所定の時間間隔でページ送りして表示し、前記第1の操作情報は、前記ページ送りに対するユーザの一時停止操作であり、前記第2の操作情報は、前記ページ送りに対するユーザの早送り操作であってもよい。
これにより、ユーザが上記一時停止操作をしたコンテンツはユーザの興味のあるコンテンツである可能性が高く、逆にユーザが上記早送り操作をしたコンテンツはユーザの興味のないコンテンツである可能性が高いため、両方の履歴情報を用いてユーザ特性情報を生成することにより、ユーザの興味を正確に反映した情報をユーザに対して提供することができる。
上記電子機器装置において、前記操作情報記憶手段は、前記第1のコンテンツに対するユーザの第1の操作情報及び第2の操作情報を前記第1のコンテンツと対応付けて記憶し、前記ユーザ特性情報生成手段は、前記第1の操作情報に対応する前記第1のコンテンツに含まれる文字情報から第1の特性情報を生成するとともに、前記第2の操作情報に対応する第1のコンテンツに含まれる文字情報から第2の特性情報を生成するものであり、前記ユーザ特性情報に含まれる前記同一の単語の割合と、前記検索された情報に含まれる前記同一の単語の割合とを比較して、前記割合の類似度を判断する判断手段を更に具備し、前記提示手段は、前記比較の結果、前記関連情報と前記第1の特性情報の両方に含まれる単語の割合が類似し、かつ前記関連情報と前記第2の特性情報の両方に含まれる単語の割合が類似しない場合に、当該関連情報を前記ユーザに提示するようにしてもよい。
また、上記情報提供方法において、前記ステップ(b)は、前記第1のコンテンツに対するユーザの第1の操作情報及び第2の操作情報を前記第1のコンテンツと対応付けて記憶し、前記ステップ(d)は、前記第1の操作情報に対応する前記第1のコンテンツに含まれる文字情報から第1の特性情報を生成するとともに、前記第2の操作情報に対応する第1のコンテンツに含まれる文字情報から第2の特性情報を生成し、(i)前記ユーザ特性情報に含まれる前記同一の単語の割合と、前記検索された情報に含まれる前記同一の単語の割合とを比較して、前記割合の類似度を判断するステップを更に具備し、前記ステップ(g)は、前記比較の結果、前記関連情報と前記第1の特性情報の両方に含まれる単語の割合が類似し、かつ前記関連情報と前記第2の特性情報の両方に含まれる単語の割合が類似しない場合に、当該関連情報を前記ユーザに提示するようにしてもよい。
これにより、例えばユーザの興味を反映したユーザ特性情報に類似し、かつユーザの無関心を反映したユーザ特性情報に類似しない情報をユーザに提示することとしたため、ユーザの興味をより正確に反映した情報を提供することが可能となる。
上記電子機器装置は、特定の時間帯に出力される第2のコンテンツに関連するキーワードを、当該第2のコンテンツ内容を前記特定の時間帯以前に予め説明した情報から収集する収集手段と、前記キーワードを基に、当該キーワードに関連する前記第1のコンテンツを検索する第2の検索手段とを更に具備し、前記表示手段は、前記第1のコンテンツを前記第2のコンテンツとともに表示するようにしてもよい。
また、上記情報提供方法は、(j)特定の時間帯に出力される第2のコンテンツに関連するキーワードを、当該第2のコンテンツ内容を前記特定の時間帯以前に予め説明した情報から収集するステップと、(k)前記キーワードを基に、当該キーワードに関連する前記第1のコンテンツを検索するステップとを更に具備し、前記ステップ(a)は、前記第1のコンテンツを前記第2のコンテンツとともに表示するようにしてもよい。
ここで第2のコンテンツとは例えばテレビ番組であり、第2のコンテンツ内容を前記特定の時間帯以前に予め説明した情報とは、例えばインターネット上の電子番組表である。
これにより、ユーザは例えばテレビ番組を視聴しながら当該テレビ番組に関連する第2のコンテンツを閲覧することができ、当該コンテンツを閲覧中の操作を基に上記ユーザ特性情報を生成することができる。
上記電子機器装置及び上記情報提供方法は、前記ユーザ特性情報生成後であって所定時間経過後に当該ユーザ特性情報を再度生成することにより、前記所定時間経過前のユーザ特性情報を更新するようにしてもよい。これにより、例えばユーザの興味が時間の経過により変化しても常にユーザの興味を反映したユーザ特性情報を生成することができる。
上記電子機器装置は、教育上不適切な内容を含むコンテンツに多く含まれる単語を予め記憶する不適切単語記憶手段と、前記不適切単語記憶手段により記憶された単語を基に、前記文字情報抽出手段が前記表示された第1のコンテンツから前記不適切単語を抽出することを規制する規制手段とを更に具備してもよい。
また、上記情報提供方法は、(m)教育上不適切な内容を含むコンテンツに多く含まれる単語を予め記憶するステップと、(n)前記ステップ(m)により記憶された単語を基に、前記ステップ(c)が前記表示された第1のコンテンツから前記不適切単語を抽出することを規制するステップとを更に具備してもよい。
これにより、ユーザに不適切な内容の情報が提示されることを防ぐことができ、いわゆるパレンタルロック機能を実現することができる。
上記電子機器装置において、前記操作情報記憶手段は、ユーザが複数存在する場合に当該ユーザ毎に当該ユーザの操作を前記第1のコンテンツと対応付けて記憶し、前記ユーザ特性情報生成手段は、前記複数のユーザ毎に前記ユーザ特性情報を生成するようにしてもよい。
また、上記情報提供方法において、前記ステップ(b)は、ユーザが複数存在する場合に当該ユーザ毎に当該ユーザの操作を前記第1のコンテンツと対応付けて記憶し、前記ステップ(d)は、前記複数のユーザ毎に前記ユーザ特性情報を生成するようにしてもよい。
これにより、ユーザが複数いる場合でも、当該複数のユーザ毎にユーザ特性情報を作成できるため、ユーザ毎に固有の情報を提供することができる。
上記電子機器装置において、前記文字情報抽出手段は、前記第1のコンテンツの表示レイアウトに関する文字情報を抽出し、前記ユーザ特性情報生成手段は、前記表示レイアウトに関する文字情報を基に前記ユーザ特性情報を生成するようにしてもよい。
また、上記情報提供方法において、前記ステップ(c)は、前記第1のコンテンツの表示レイアウトに関する文字情報を抽出し、前記ステップ(d)は、前記表示レイアウトに関する文字情報を基に前記ユーザ特性情報を生成するようにしてもよい。
これにより、ユーザの特定の単語に対する興味だけでなく、レイアウトに対する興味をも反映したユーザ特性情報を生成することができ、ユーザに対して多様な情報を提供することが可能となる。
上記電子機器装置及び上記情報提供方法において、前記ユーザ特性情報に含まれる割合が低い単語のデータを、当該割合が低い順に一定時間毎に削除するようにしてもよい。
これにより、上記ユーザ特性情報におけるユーザの特性の反映度は維持しながらも、上記ユーザ特性情報のデータ量が膨大になりすぎることを防ぐことができる。
本発明によれば、ユーザが関心のある情報を的確に取得し、ユーザに提示することができる。
以下、本発明をテレビジョンセットに適用した場合の実施の形態について図面に基づき説明する。
図1は、本実施形態におけるテレビジョンセットの電気的な構成を示す概略図である。同図に示すように、テレビジョンセット100は当該テレビジョンセット100のシステム全体を制御するCPU(Central Processing Unit)101を有し、当該CPU101にはその周辺機器を接続して制御するためのバス110が接続されている。
バス110には、ワークエリアとして用いられる例えばDRAM(Dynamic Random Access Memory)からなる一時記憶メモリ102、情報を保存して記憶しておく例えばフラッシュメモリからなる保存用メモリ103、一定の時間毎に指定した処理を開始したり、現在日時を取得するためのタイマー装置104、テレビ放送を受信するためのテレチューナー105、テレビ放送の音声を出力するための、例えばアンプとスピーカーからなる音声出力装置106、例えばCRT(Cathode Ray Tube)やLCD(Liquid Crystal Display)からなる表示装置107、本実施形態においてユーザが操作を行うための例えばプッシュボタンからなる操作装置108、インターネットに接続し、データを入出力する例えばイーサネット(登録商標)からなるネットワーク装置109が接続されている。上記テレビチューナー105には、電波を受信するためのアンテナ105aが接続されている。
図2は、本実施形態に係るシステムの全体図である。同図に示すように、本実施形態においては、Webアプリケーション201、テキスト抽出機構202、重み付け計算機構203、重み付けデータ抽出機構204、ユーザ特性情報生成機構205、Web巡回機構206、類似度計算機構207、コンテンツ推薦機構208の各ソフトウェアが処理を行っている。
Webアプリケーション201は、インターネットを通じてWebページを表示したり、当該Webページを閲覧中のユーザの操作履歴データをデータベース(1)に記憶したりしている。
テキスト抽出機構202は、Webアプリケーション201が表示したWebページからテキストデータを抽出し、当該抽出したテキストデータをデータベース(2)に記憶する。
重み付け計算機構203は、上記データベース(2)に記憶されたテキストデータに対して、当該テキストデータに含まれる単語の割合に応じて重み付け処理を行い、当該重み付け処理を行った結果である重み付けデータをデータベース(3)に記憶する。
重み付けデータ抽出機構204は、上記データベース(1)に記憶されているユーザの操作履歴データを参照して、上記データベース(3)に記憶された重み付けデータから特定のユーザ操作に関連する重み付けデータを抽出し、当該抽出したデータをデータベース(4)に記憶する。
ユーザ特性情報生成機構205は、上記データベース(4)に記憶された重み付けデータを基に、ユーザ操作を反映したユーザ特性情報209を生成する。
Web巡回機構206は、インターネット上の複数のWebページのURL(Uniform Resource Locator)を記載した巡回リスト210を有しており、当該巡回リスト210を参照してインターネットを介してWebページを取得する。
上記テキスト抽出機構202は、上記Web巡回機構206が取得したWebページからテキストデータを抽出し、当該抽出したテキストデータをデータベース(5)に記憶する。
上記重み付け計算機構203は、上記データベース(5)に記憶されたテキストデータに対して重み付け処理を行い、当該処理の結果である重み付けデータをデータベース(6)に記憶する。
類似度計算機構207は、データベース(6)に記憶された個々の重み付けデータと上記ユーザ特性情報209とを比較して両者の類似度を計算し、当該計算の結果の類似度データをデータベース(7)に記憶する。
コンテンツ推薦機構208は、上記データベース(7)に記憶されたデータを基に、ユーザに対してコンテンツを推薦する。
以下、上記各ソフトウェアの詳細について述べる。
まず、上記Webアプリケーション201について説明する。
図3は、Webアプリケーション201によって表示される表示画面の例を示す図である。同図に示すように、表示画面は、テレビ番組等を表示するテレビ番組表示領域301、表示中のテレビ番組に関連するキーワードを表示するキーワード表示領域302、上記キーワードを用いてWeb検索した結果のURLのリストを表示するURLリスト表示領域303及び上記URLリストを基にWebページを表示するWebページ表示領域304の各表示領域を有する。
これらの表示領域は、表示画面に全て表示される必要はなく、例えば図4に示すように、少なくともテレビ番組表示領域301とWebページ表示領域304で構成されていればよい。
なお、上記Webページ表示領域304には、上記URLリストに記載されたURL数分のWebページが例えば一定時間間隔で切り替わりながら繰り返し表示される。
次に、上記Webアプリケーション201の動作について説明する。
Webアプリケーション201は、テレビジョンセット100がテレビ放送を受信している最中に、当該受信しているテレビ放送の視聴チャンネルデータ及び現在時刻データを認識し、当該データを基に、ネットワーク装置を介してWeb上から上記テレビ番組に関する情報を取得する。
具体的には、例えばインターネット上の電子番組表(EPG、Electric Program Guide)を掲載したホームページへアクセスし、前記認識したデータと当該テレビ番組表とを照合し、当該テレビ番組のテーブルであるHTML(Hyper Text Markup Language)を解析することにより、番組名、番組の内容、出演者等の当該テレビ番組に関連する情報をダウンロードする。
そして、前記Webアプリケーション201は、前記ダウンロードした情報をテキスト形式に変換し、当該変換したテキストから、例えば形態素解析等の解析法を用いて放送局名、開始日時、終了日時、番組名、出演者、番組内容の情報を抽出し、例えば図5に示すようなEPGデータ501を作成する。Webアプリケーションは、当該EPGデータから例えば出演者名を取得し、当該出演者名をキーワードとしてWeb検索を行う。
図6は、Webアプリケーション201がテレビジョンセット100の表示画面にテレビ番組及びWebページ等を表示する動作を示すフローチャートである。
同図に示すように、Webアプリケーション201は、表示画面の上記テレビ番組表示領域301にテレビ番組を表示する(ステップ601)。そして、ユーザに選択されているチャンネルに関するチャンネルデータ及び現在時刻データを用いて、当該チャンネル及び時刻に該当する上記EPGデータ501を取得する(ステップ602)。次に、当該取得したEPGデータ501から例えば出演者名を取得し、当該出演者名を検索キーワードとして出力し(ステップ603)、当該検索キーワードを上記キーワード表示領域302に表示する(ステップ604)。そして、ネットワーク装置109を用いてインターネットにアクセスし、前記キーワードを用いてWeb検索を行う(ステップ605)。当該Web検索の結果、URLリストが取得され(ステップ606)、当該URLリストを上記URLリスト表示領域303に表示する(ステップ607)。次に、上記URLリストからWebページを取得するための変数Nに1を代入し(ステップ608)、URLリストの1番目に記載されたURLを取得して(ステップ609)そのWebページを上記Webページ表示領域304に表示する(ステップ610)。そして、当該Webページの表示から一定時間が経過したか否かを確認し(ステップ611)、経過していた場合(ステップ611のYES)には更にURLリストの最後に記載されたURLまで表示が終了したか否かを確認する(ステップ612)。一定時間が経過していない場合(ステップ611のNO)にはそのままWebページを表示する。当該一定時間は予め上記タイマー装置104に設定しておく。URLリストの最後に記載されたURLまで取得が終了していない場合(ステップ612のNO)には、上記変数NにN+1を代入し(ステップ613)、URLリストの次のURLを取得していき、URLリストの最後のURLまで取得及び表示を繰り返す。URLリストの最後に記載されたURLまで取得が終了した場合(ステップ612のYES)には、上記変数Nに1を代入して1番目のURLを取得して、上記処理を繰り返す(ステップ612のYES)。
以上の動作により、上記EPGデータから取得したキーワードを用いて検索した結果の複数のWebページが、一定時間毎に自動送りされてテレビ番組の表示中に繰り返し表示される。
ユーザは、例えば上記操作装置108を用いて、表示中の上記Webページに対して操作を行うことができる。図7は、本実施形態における操作装置108を示した図である。
同図に示すように、操作装置108は、テレビチャンネルを変更するためのチャンネルボタン701、直前に表示されたWebページを表示させるための前ボタン702、表示中のWebページの表示をスキップして次のWebページを表示させるための次ボタン703、Webページの一定時間ごとの自動送りを一時停止し、Webページを拡大表示させるための一時停止ボタン704、上記一時停止ボタンで拡大表示されたWebページを上下左右方向にスクロールさせるための十字ボタン705を有する。
なお、本発明をPC(Personal Computer)に適用した場合には、例えば上記表示装置107に操作装置108を模したGUI(Graphical User Interface)画面を表示して操作したり、キーボード等に上記ボタン701〜705の機能を割り当てたりしてもよい。
次に、上記各ボタンによりユーザが操作した場合の上記Webアプリケーション201の動作について説明する。
図8はチャンネルボタン701が押された場合の動作を示すフローチャートである。同図に示すように、Webアプリケーション201は、ユーザによってチャンネルボタンが押されると(ステップ801)、テレビ番組表示領域に表示されているテレビ番組のチャンネルを変更し(ステップ802)、上記図6におけるステップ601へ進む。
図9は、前ボタン702が押された場合の動作を示すフローチャートである。同図に示すように、Webアプリケーション201は、ユーザによって前ボタンが押されると(ステップ901)、その旨を記載した操作履歴データを作成し、当該データを上記データベース(1)に記憶する(ステップ902)。そして、上記変数NにN−1を代入し(ステップ903)、当該変数Nが0でないことを確認して(ステップ904)、0でない場合(ステップ904のNO)には上記図6におけるステップ609へ進む。0の場合(ステップ904のYES)には、上記図6におけるステップ608へ進む。
図10は、次ボタンが押された場合の動作を示すフローチャートである。同図に示すように、Webアプリケーション201は、ユーザによって次ボタンが押されると(ステップ1001)、その旨を記述した操作履歴データを作成し、当該データをデータベース(1)に記憶して(ステップ1002)、上記図6におけるステップ612へ進む。
図11は、一時停止ボタンが押下された場合の動作を示すフローチャートである。同図に示すように、Webアプリケーション201は、ユーザによって一時停止ボタンが押されると(ステップ1101)、その旨を記述した操作履歴データ作成し、当該データをデータベース(1)に記憶する(ステップ1102)。そして、上記Webページ表示領域304が拡大表示中か否かを確認する(ステップ1103)。拡大表示中の画面は、例えば図12に示すような画面である。拡大表示中である場合(ステップ1103のYES)には、表示を元に戻して(ステップ1104)、上記図6におけるステップ610へ進む。拡大表示中でない場合(ステップ1103のNO)には、拡大表示する(ステップ1105)。拡大表示中の画面は、例えば図12に示すような画面である。そして、拡大表示中にユーザによって十字ボタンが押されたか否かを確認する(ステップ1106)。押された場合には、その旨を記述した操作履歴データを作成し、当該データをデータベース(1)に記憶する(ステップ1107)。そして、ユーザによって十字ボタンが押された方向に画面をスクロールして(ステップ1108)、当該処理をユーザが十字ボタンを押す度に繰り返す。
図13は、上記データベース(1)に記憶されたデータを示す図である。同図に示すように、データベース(1)には、ユーザの上記各操作を識別するIDを記述するためのIDフィールド、当該各操作の種類を記述するための操作フィールド、当該各操作が行われた日付を記述するための日付フィールド、当該各操作が行われた時刻を記述するための時刻フィールド、当該書く操作が行われた時に表示していたWebページのURLを記述するためのURLフィールドを有する。各フィールドには、ユーザが操作を行う度に各データが関連付けられて記述され、蓄積される。
次に、上記操作履歴データ作成後、ユーザに対してコンテンツを推薦するまでの動作について説明する。図14は、当該動作を概略的に示したフローチャートである。
同図に示すように、まず、テキスト抽出機構202が、上記データベース(1)から操作履歴データを入力し、テキストデータを抽出してデータベース(2)に記憶する(ステップ1401)。そして、上記重み付け計算機構203が、データベース(2)に記憶されたテキストデータを入力して、当該テキストデータに対して重み付け計算を行い、計算結果の重み付けデータをデータベース(3)に記憶する(ステップ1402)。次に、重み付けデータ抽出機構204が、データベース(1)に記憶された操作履歴データを参照してデータベース(3)の中からユーザの特定の操作に関する重み付けデータを抽出して、データベース(4)に記憶する(ステップ1403)。そして、上記ユーザ特性情報生成機構205は、上記データベース(4)に記憶されたユーザの特定操作に関する重み付けデータからユーザ特性情報209を生成する(ステップ1404)。次に、Web巡回機構206が、上記巡回リスト210を用いてWeb巡回を行い、テキスト抽出機構202が当該巡回によって取得したWebページからテキストデータを抽出してデータベース(5)に記憶する(ステップ1405)。そして、重み付け計算機構203が、当該データベース(5)に記憶されたテキストデータに対して重み付け計算を行い、計算結果の重み付けデータをデータベース(6)に記憶する(ステップ1406)。次に、類似度計算機構207が、当該データベース(6)に記憶された重み付けデータと上記ユーザ特性情報とを比較して両者の類似度を計算し、当該計算の結果である類似度データをデータベース(7)に記憶する(ステップ1407)。そして、当該データベース(7)に記憶された類似度データを参照して、コンテンツ推薦機構208が、ユーザに推薦するコンテンツを決定し、ユーザに提示する(ステップ1408)。
以下、上記各ステップのそれぞれの処理について詳細に説明する。
図15は、テキスト抽出機構202が、データベース(1)に記憶された操作履歴データを参照してテキストデータを抽出する動作を示したフローチャートである。同図に示すように、テキスト抽出機構202はまず、データベース(1)に記憶された操作履歴データを入力する(ステップ1501)。次に、当該操作履歴データから各操作に対応するURLを取得し(ステップ1502)、当該URLを用いて、上記ネットワーク装置109を介してWebページを取得する(ステップ1503)。そして、当該Webページに対してテキスト抽出処理を行い、テキストデータを抽出し(ステップ1504)、当該テキストデータを、上記操作履歴データ中のIDと対応付けてデータベース(2)に記憶する(ステップ1505)。
上記テキストデータの抽出は、具体的には、図16のフローチャートに示すように、まず、WebページからHTML(Hyper Text Markup Language)形式のデータを入力し(ステップ1601)、上記HTML形式のデータからHTMLタグの部分を除去して(ステップ1602)、残ったデータをテキストデータとして出力する(ステップ1603)ことにより行う。
上記データベース(2)は、図17に示すように、上記操作履歴データ中のIDと対応付けられ、テキストデータを識別するためのIDフィールドと、当該IDに対応するテキストデータを記述するためのテキストフィールドからなる。
図18は、重み付け計算機構203が重み付けデータを作成する動作を示すフローチャートである。同図に示すように、重み付け計算機構203はまず、上記データベース(2)からテキストデータを入力し(ステップ1801)、当該テキストデータに対してテキスト解析処理を行い、重み付けデータを取得する(ステップ1802)。そして、当該重み付けデータを、上記操作履歴データ中のIDと対応付けてデータベース(3)に記憶する(ステップ1803)。
図19は、上記テキスト解析処理の詳細を示すフローチャートである。同図に示すように、重み付け計算機構203は、テキストデータを入力すると(ステップ1901)、当該テキストデータに対して形態素解析を行う(ステップ1902)。当該形態素解析は、予め単語を当該単語の品詞に関するデータと対応させて記憶してある単語辞書(図示せず)等を用いることにより、上記テキストデータを単語単位に区分し、当該区分された単語を品詞ごとに区分する。当該区分された形態素解析データは、例えば図20に示すように、入力されたテキストデータに含まれる単語を記述するための単語フィールドと、上記単語の品詞を記述するための品詞フィールドによって構成されるデータとして出力される。そして、当該形態素解析データに対して、例えば固有名詞のみ等、特定の品詞を含む形態素解析データを抽出する(ステップ1903)。次に、上記抽出した形態素解析データに対して、例えば上記テキストデータ中における単語の出現頻度等によって、各単語に対する重みを計算して数値化する(ステップ1904)。そして、当該計算結果から重み付けデータを生成し、出力する(ステップ1905)。当該重み付けデータは、例えば図21に示すように、上記形態素解析によって得られた単語を記述するための単語フィールドと、当該単語の重みを記述するための重みフィールドからなる。
上記データベース(3)は、図22に示すように、上記操作履歴データ中のIDと対応付けられ、上記重み付けデータを識別するためのIDフィールドと、当該IDに対応する重み付けデータを記述するための重み付けデータフィールドからなる。当該重み付けデータは上記図21に示したデータと同一のデータ構成である。
図23は、上記重み付けデータ抽出機構204が、特定のユーザ操作に対応する重み付けデータを抽出する動作を示すフローチャートである。同図に示すように、重み付けデータ抽出機構204は、まずデータベース(1)から操作履歴データを入力する(ステップ2301)。次に、特定のユーザ操作に関する操作履歴データを抽出するための変数Mに1を代入して(ステップ2302)、上記操作履歴データ中からIDがMであるデータを抽出する(ステップ2303)。そして、当該ID=Mのデータの操作フィールドが、一時停止ボタンの操作履歴データか否かを確認する(ステップ2304)。一時停止ボタンであれば(ステップ2304のYES)、上記IDを用いて、データベース(3)から当該IDに対応する重み付けデータを抽出して(ステップ2305)、当該データを上記IDとともにデータベース(4)に記憶する(ステップ2306)。従って、当該データベース(4)のデータ構造は、上記データベース(3)と同様のデータ構造となる。一時停止ボタンでなければ(ステップ2304のNO)次のデータを確認する(ステップ2307)。そして、上記処理を、上記データベース(1)に記憶された全ての操作履歴データについて繰り返して、最後の操作履歴データまで処理したか否かを確認する(ステップ2307)。最後であれば(ステップ2307のYES)終了し、最後でなければ(ステップ2307のNO)最後のデータまで処理を繰り返す(ステップ2308)。
なお、上記処理において一時停止ボタンの操作履歴データを抽出しているのは、ユーザがWebページを閲覧中に一時停止ボタンを押すということは、当該ページを注視して閲覧することを所望しているということであり、当該Webページにはユーザが興味を持っている単語が含まれている可能性が高いからである。
図24は、ユーザ特性情報生成機構205が、ユーザ特性情報209を生成する動作を示すフローチャートである。同図に示すように、ユーザ特性情報生成機構205は、まず、上記データベース(4)に記憶された重み付けデータを入力する(ステップ2401)。次に、当該重み付けデータの中から同一の単語を検索して抽出し、当該単語の重みを合計する(ステップ2402)。そして、当該重みを合計することにより生成したデータを、ユーザ特性情報209として出力する(ステップ2403)。
上記ユーザ特性情報209は、例えば図25に示すように、単語を記述するための単語フィールドと、当該単語の重みを合計するための重みフィールドからなり、例えば保存用メモリ103に記憶される。当該ユーザ特性情報209は、上述したようにユーザの特定の操作履歴に基づいて作成され、ユーザの興味を反映している可能性が高いデータであるため、当該ユーザ特性情報209を利用することにより、ユーザの興味のあるコンテンツを検索し、ユーザに提示することが可能となる。
図26は、上記Web巡回機構206がWebを巡回して取得したWebページから、テキスト抽出機構202がテキストデータを抽出する動作を示したフローチャートである。
同図に示すように、まずWeb巡回機構206が、予め記憶した巡回リスト210を入力する(ステップ2601)。当該巡回リスト210は例えば図27に示すように、URLを識別するためのIDを記述するためのIDフィールドと、巡回対象のURLを記述するためのURLフィールドからなる。当該URLは、例えば予めWeb巡回機構206がネットワーク装置109を介してインターネット上から任意に取得しておく。次にWeb巡回機構206は、巡回リスト210中のURLを取得するための変数Jに1を入力して(ステップ2602)、巡回リスト210中のJ行目のデータを取得し(ステップ2603)、当該データからURLデータを取得する(ステップ2604)。そして、当該URLで指定されたWebページを、ネットワーク装置109を介して取得し(ステップ2605)、当該Webページから、上記テキスト抽出機構202が、上述したテキストデータを抽出し(ステップ2606)、当該テキストデータをデータベース(5)に記憶する(ステップ2607)。当該処理を繰り返して、巡回リスト210中の最後のURLまで取得したか否かを確認する(ステップ2608)。最後まで取得したなら終了し(ステップ2608のYES)、最後まで取得していなければ(ステップ2608のNO)上記変数Jに1を加えて、巡回リスト210の次のデータに対して処理を行い(ステップ2609)、最後のデータまで繰り返す。
次に、上記重み付け計算機構203が、図28に示すように、上記データベース(5)に記憶されたテキストデータを入力し(ステップ2801)、当該テキストデータに対して、上記図19で説明したのと同様にしてテキスト解析処理を行い(ステップ2802)、当該処理によって得た重み付けデータを、当該重み付けデータを識別するためのIDとともにデータベース(6)に記憶する(ステップ2803)。当該IDは、上記巡回リスト210中のURLを識別するIDと対応している。
図29は、類似度計算機構207が上記データベース(6)に記憶された重み付けデータと上記ユーザ特性情報205との類似度を計算する動作を示したフローチャートである。
同図に示すように、まず類似度計算機構207は、保存用メモリ103から上記ユーザ特性情報209を入力し(ステップ2901)、上記データベース(6)から重み付けデータを抽出するための変数Kに1を代入する(ステップ2902)。そして、データベース(6)からID=Kである重み付けデータを抽出する(ステップ2903)。次に、抽出した上記重み付けデータと上記ユーザ特性情報209のベクトル化を行う(ステップ2904)。具体的には、例えば図30に示すように、上記ユーザ特性情報209と上記重み付けデータを比較し、両方に共通して含まれる単語が同じ順位になるように並べ替えを行う。なお、片方のみに含まれる単語については、もう片方のデータの対応する順位に0を適用する。そして、例えばベクトルの内積等の計算方法を用いて、ユーザ特性情報209と上記重み付けデータとの類似度を求めて(ステップ2905)、当該計算結果の類似度を、当該類似度を識別するためのIDとともにデータベース(7)に記憶する(ステップ2906)。当該IDは、上記巡回リスト210中のURLを識別するIDと対応している。そして当該処理を繰り返して、上記変数Kが上記重み付けデータの最後のIDと一致するか否かを確認し(ステップ2907)、一致したならば終了する(ステップ2908のYES)。一致しない場合には(ステップ2907のNO)、上記変数Kに1を加えて次のデータに対して処理を行い、上記重み付けデータの最後のデータまで処理を繰り返す。
上記データベース(7)は、例えば図31に示すように、上記類似度計算機構207が計算した類似度を識別するためのIDフィールドと、当該類似度を記述するための類似度フィールドからなる。
図32は、コンテンツ推薦機構208が、上記類似度データを基にユーザに対してコンテンツを推薦する動作を示すフローチャートである。同図に示すように、まずコンテンツ推薦機構208は、データベース(7)に記憶されているIDとそれに対応する類似度データを入力する(ステップ3201)。次に、当該類似度データを、類似度が大きい順に並び替える(ステップ3202)。そして、上記巡回リスト210を入力する(ステップ3203)。次に、上記類似度データからIDを取得するための変数Pに1を代入する(ステップ3204)。そして、類似度データ中、上記並び替えにより類似度がP番目に高い類似度データのID=Qを取得し(ステップ3205)、当該IDを用いて、上記巡回リスト210から、対応するID=QのデータのURLを取得する(ステップ3206)。次に、当該取得したURLで指定されるWebページを取得し(ステップ3207)、当該Webページのタイトルを取得する(ステップ3208)。そして、上記変数Pが3か否かを確認する(ステップ3209)。これは、ユーザに推薦するコンテンツの数を3つに設定しているためであるが、当該変数の設定を変更することにより、推薦するコンテンツの数を変更することも勿論可能である。P=3でない場合(ステップ3209のNO)には、Pに1を加えて(ステップ3210)、類似度が3番目に高いWebページを取得するまで処理を繰り返す。そして、3つのWebページのタイトルを取得したら(ステップ3209のYES)、当該タイトルの一覧を推薦コンテンツとして上記表示装置107に表示する(ステップ3211)。当該タイトル一覧は、例えば図33に示すように、ユーザが上記図3若しくは図4のようにテレビ番組とWebページを同時に閲覧中に、Webページの一部に表示される。
なお、上記推薦コンテンツの一覧ではなく、当該コンテンツ自体、すなわち当該Webページを直接表示するような態様であってもよい。この場合、例えば上記巡回リスト210を上記WEbアプリケーション201が生成するURLリストに置き換えることにより、当該URLリストの中から推薦するWebページを例えば類似度が高い順に選択してWebページ表示領域304に表示するようにすればよい。
以上説明したように、本実施形態においては、ユーザが閲覧中のWebページに対する操作履歴データを解析し、当該操作履歴に対応するWebページから抽出したテキストデータに含まれる単語に関する分析を行ってユーザ特性情報209を生成し、当該ユーザ特性情報を用いて、ユーザに対してコンテンツを推薦する。ユーザ特性情報209は、ユーザが興味のあるWebページに対する操作履歴を反映しているため、ユーザの興味のあるコンテンツを推薦することが可能となる。そしてユーザにとっても、上記処理が自動的に実行されるため、ユーザは複雑な操作を行う必要もなく、ネットワーク等に関する専門的な知識を持っていなくても、自らが興味の有るコンテンツの推薦を受けることができる。
なお、本発明は以上説明した実施の形態には限定されるものではなく、種々の変形が可能である。
上記実施形態においては、ユーザが興味を持っている可能性が高いWebページに着目して処理を行っていたが、逆にユーザが興味を持っていない可能性が高いWebページにも着目することにより、コンテンツ推薦の精度を向上させることも可能である。例えば、ユーザが興味を持っていない可能性が高いWebページに含まれ、高い重み付けをされている単語が、ユーザが興味を持っている可能性の高いWebページにも含まれており、同じく高い重み付けをされている可能性がある場合に、両方のデータを扱うことにより、実際にはユーザが興味を持っていないWebページが推薦されてしまうのを抑制することができる。以下、この場合の実施の形態について説明する。
図34は、本実施形態において上記重み付けデータ抽出機構204が、特定のユーザ操作に対応する重み付けデータを抽出する動作を示すフローチャートである。上記図23と同様の処理を行う部分については同一の符号を付し、説明を省略する。
同図に示すように、重み付けデータ抽出機構204は、一時停止ボタンの操作履歴データか否かを確認した(ステップ2304)後、ユーザの次ボタンの操作に関する操作履歴データか否かを確信する(ステップ3401)。そして、次ボタンであれば(ステップ3401のYES)、データベース(3)から、操作履歴データのID=Mに対応する重み付けデータを抽出して(ステップ3402)、当該データを上記IDとともにデータベース(8)に記憶する(ステップ3403)。従って、当該データベース(8)のデータ構造は、上記データベース(3)及び(4)と同様のデータ構造となる。
なお、上記処理において次ボタンの操作履歴データを抽出しているのは、ユーザがWebページ閲覧中に次ボタンを押すということは、当該ページをあまり注視せずに閲覧したということであり、当該Webページにはユーザが興味を持っていない単語が含まれている可能性が高いからである。
図35は、上記重み付けデータ抽出機構204が、上記次ボタンに関する重み付けデータを基にユーザ特性情報を生成する動作を示したフローチャートである。上述した図14と同一の処理を行う部分については同一の符号を付し、説明を省略する。同図に示すように、ユーザ特性情報生成機構205は、データベース(4)に記憶されたユーザの一時停止ボタンに関する重み付けデータを基に、「興味あり」ユーザ特性情報209aを生成し(ステップ1404a)、次ボタンに関する重み付けデータを基に、「興味なし」ユーザ特性情報209bを生成する(ステップ1404b)。そして、類似度計算機構207は、重み付け計算機構203がデータベース(6)に記憶した重み付けデータと、上記「興味あり」ユーザ特性情報209aとを比較して両者の類似度を計算し、当該計算の結果である類似度データベースをデータベース(7)に記憶する(ステップ1407a)。一方、データベース(6)に記憶した重み付けデータと、上記「興味なし」ユーザ特性情報209bとの類似度を計算し、当該計算の結果である類似度データベースをデータベース(9)に記憶する(ステップ1407b)。
そして、この処理により作成した2つのユーザ特性情報を用いて、コンテンツ推薦機構208がユーザにコンテンツを推薦する処理の前段階で、データベース(7)に対して操作を行う。具体的には、図36及び図37に説明するような操作を行うことが考えられる。
図36は、データベース(7)とデータベース(9)をそれぞれ類似度の大きい順位並び替え、データベース(7)中にデータベース(9)の上位にあるIDが含まれる場合に、当該IDに対応するデータを削除する方法を示している。
また、図37は、図36と同様に両データベースを類似度の大きい順に並び替えた後、データベース(7)の類似度をデータベース(9)の類似度で割った値で、データベース(7)を置き換える方法を示している。これは、同一のIDのデータで比較した場合に、データベース(7)の類似度が大きく、データベース(9)の類似度が小さいほどユーザが興味のあるコンテンツである可能性が高く、コンテンツの推薦に適しているからである。
以上のように、「興味あり」及び「興味なし」の2つのユーザ特性情報を用いることにより、ユーザの興味のあるコンテンツの推薦の精度を向上することができる。
また、上記実施形態においては、ユーザ特性情報209は一つしか生成していなかったが、上記実施形態におけるテレビジョンセット100を複数人で使用する状況も考えられる。そこで、ユーザ特性情報209を複数人分用意して、各ユーザに対応してユーザ特性情報209を切り替えるようにしてもよい。
具体的には、操作装置108にユーザ特性情報を切り替えるためのボタンを複数追加して、押されたボタンに応じて使用するユーザ特性情報209を切り替える方法や、キーボードを使用してユーザ毎にユーザ名やパスワードを入力させてユーザ特性情報209を切り替える方法、指紋認識や顔認識等のバイオメトリクスを用いてユーザ特性情報209を切り替える方法、各ユーザが使用するID付きの携帯機器をテレビジョンセット100に接続することによってユーザ特性情報を切り替える方法等、様々な方法が適用することができる。
また、必ずしも一人でWebページを閲覧するとは限らないので、状況に応じて上記複数のユーザ特性情報を融合させるようにしてもよい。具体的には、上述したユーザ認識方法によって複数人のユーザが認識された場合、予めユーザ毎に使用時間を記録しておき、ユーザ毎にユーザ特性情報209を作成した後、上記ユーザ毎の使用時間が最も長いユーザのユーザ特性情報を使用する方法が考えられる。また、図38に示すように、認識しているユーザ毎にユーザ特性情報1、2、3を作成した後、同図のWの計算式のように、ユーザ毎の使用時間に応じて配分を行った上で重みの値を合計して、新しいユーザ特性情報を生成するようにしてもよい。これにより、ユーザが複数人いる場合であっても、どのユーザにも興味のあるコンテンツを推薦することが可能となる。
また、上記実施形態においては、推薦するコンテンツとしてWebページを利用していたが、テキストデータに変換できるものであれば、推薦に利用できるコンテンツはWebページに限らない。例えば上記Web巡回機構206が取得するデータを上記EPGデータ501に置き換えれば、当該EPGデータ501から上記テキスト抽出機構202が抽出したテキストデータに、上記重み付け計算機構203が重み付け処理を行い、類似度計算機構207が上記ユーザ特性情報205との類似度を計算することにより、ユーザに対してテレビ番組の推薦を行うことも可能である。
また、上記実施形態においては、上記Webアプリケーション201が表示するWebページに対するユーザの操作履歴データからユーザ特性情報209を生成していたが、例えばユーザがテレビ番組を視聴中に、上記操作装置108のチャンネルボタン701に対する操作履歴データからユーザ特性情報209を生成するようにしてもよい。この場合、上記テキスト抽出機構202が上記Webページの替わりに上記EPGデータ501からテキストデータを抽出して、上記重み付け計算機構203が当該テキストデータに対して重み付け処理を行い、上記重み付けデータ抽出機構204が抽出した重み付けデータから、上記ユーザ特性情報生成機構205がユーザ特性情報209を生成する。
また、上記実施形態において、ユーザ特性情報209は、ユーザが興味を持っているキーワードのランキングになっていると考えられるため、上記Webアプリケーション201が上記EPGデータ501から取得していた検索キーワードの替わりに、当該ユーザ特性情報209から重みの大きい順に単語を取得して、当該単語を検索キーワードに適用してWebページを取得することも可能である。しかし、この場合ユーザ特性情報209は、その時にユーザが視聴しているテレビ番組とは直接の関連性は無いため、当該テレビ番組と関連性の無いキーワードが抽出されてしまう可能性がある。そこで、上記Webアプリケーション201が上記EPGデータ501から取得したキーワードを上記ユーザ特性情報209中の単語から検索して、一致する単語が検索された場合に当該単語をWeb検索のキーワードとして適用するようにすればよい。一致する単語が見つからない場合には、上記実施形態の通りにEPGデータ501から抽出した単語をそのまま検索キーワードとして適用すればよい。
また、上記実施形態においては、図16で説明したように、テキスト抽出機構202は、HTMLタグを除去していたが、例えばHTMLタグも除去せずにキーワードと見なして、上記重み付け計算機構203の重み付け計算に反映させることも可能である。この場合、例えばHTML文書中のFRAMEタグのように、レイアウトを決定付けるタグに対して高い重み付けを行ったたり、画像データを表示する場合に用いるIMGタグ等に高い重み付けを行ったりすることにより、結果的にレイアウト構造が似たWebページを推薦することが可能となる。
また、上記実施形態においては、重み付け計算機構203は、Webページから抽出したテキストデータ中の単語の出現頻度によって重み付け計算を行っていたが、図13に示した操作履歴データ中の「日付」及び「時刻」のデータを利用し、例えばユーザがWebページを閲覧していた時間に応じてWebページに含まれる単語の重みを高くすることも可能である。この場合は、文章が長いWebページ程閲覧に時間が掛かるおそれがあるが、Webページのデータ量等で閲覧時間を正規化する等して、文章の長短によって差が出ないような工夫をすればよい。
また、上記実施形態においては、どんなWebページでも無条件で推薦していたため、例えば過度に暴力的若しくは猥褻である等、教育上不適切な内容のWebページが推薦されてしまう可能性がある。そこで、例えば不適切な内容を含むWebページで頻繁に使用される単語を予め辞書に登録しておき、重み付け計算機構203による重み付け計算時に、上記辞書に含まれる単語の重みを0にすることにより、上記不適切な内容のWebページが推薦されるのを防ぐことができ、いわゆるパレンタルロックを行うことが可能となる。
また、上記実施形態においては、上記ユーザ特性情報209に蓄積される単語データが、時間が経過する毎に増大していき、データ量が大きくなってしまう可能性がある。そこで、例えば一定時間毎に、重みが小さいデータを小さい順に削除することにより、データ量を削減するようにしてもよい。
100…テレビジョンセット
101…CPU
102…一時記憶メモリ
103…保存用メモリ
104…タイマー装置
105…テレチューナー
105…テレビチューナー
105a…アンテナ
106…音声出力装置
107…表示装置
108…操作装置
109…ネットワーク装置
110…バス
201…Webアプリケーション
202…テキスト抽出機構
203…重み付け計算機構
204…重み付けデータ抽出機構
205…ユーザ特性情報生成機構
206…Web巡回機構
207…類似度計算機構
208…コンテンツ推薦機構
209…ユーザ特性情報
210…巡回リスト
101…CPU
102…一時記憶メモリ
103…保存用メモリ
104…タイマー装置
105…テレチューナー
105…テレビチューナー
105a…アンテナ
106…音声出力装置
107…表示装置
108…操作装置
109…ネットワーク装置
110…バス
201…Webアプリケーション
202…テキスト抽出機構
203…重み付け計算機構
204…重み付けデータ抽出機構
205…ユーザ特性情報生成機構
206…Web巡回機構
207…類似度計算機構
208…コンテンツ推薦機構
209…ユーザ特性情報
210…巡回リスト
Claims (26)
- 第1のコンテンツを表示する表示手段と、
前記表示された第1のコンテンツに対するユーザの操作情報を、当該第1のコンテンツと対応付けて記憶する操作情報記憶手段と、
前記表示された第1のコンテンツから、当該第1のコンテンツに含まれる文字情報を抽出する文字情報抽出手段と、
前記第1のコンテンツから抽出された前記文字情報から、前記操作情報に応じたユーザ特性情報を生成するユーザ特性情報生成手段と
を具備することを特徴とする電子機器装置。 - 請求項1に記載の電子機器装置において、
前記文字情報に含まれる単語を、その含まれる割合に応じて数値化して、前記単語と当該数値とを対応付けて記憶する記憶手段を更に具備し、
前記ユーザ特性情報は、前記操作情報と前記数値化された少なくとも一つの単語とを関連付けて生成されることを特徴とする電子機器装置。 - 請求項1に記載の電子機器装置において、
前記抽出されたユーザ特性情報を用いて、前記ユーザ特性情報に関連する関連情報を検索する第1の検索手段と、
前記検索された情報を前記ユーザに提示する提示手段と
を更に具備することを特徴とする電子機器装置。 - 請求項3に記載の電子機器装置において、
前記第1の検索手段は、前記ユーザ特性情報に含まれる単語と同一の単語が含まれる情報を検索するものであり、
前記ユーザ特性情報に含まれる前記同一の単語の割合と、前記検索された情報に含まれる前記同一の単語の割合とを比較して、前記割合の類似度を判断する判断手段を更に具備し、
前記提示手段は、前記判断手段により前記割合が類似すると判断された情報を前記ユーザに提示することを特徴とする電子機器装置。 - 請求項2に記載の電子機器装置において、
前記操作情報記憶手段は、前記第1のコンテンツに対するユーザの第1の操作情報及び第2の操作情報を前記第1のコンテンツと対応付けて記憶し、
前記ユーザ特性情報生成手段は、前記第1の操作情報に対応する文字情報に含まれる単語から、前記第1の操作情報に対応する文字情報及び前記第2の操作情報に対応する文字情報の両方に含まれる単語を削除した単語を基に前記ユーザ特性情報を生成することを特徴とする電子機器装置。 - 請求項5に記載の電子機器装置において、
前記表示手段は、前記第1のコンテンツとして少なくとも一以上のページを所定の時間間隔でページ送りして表示し、
前記第1の操作情報は、前記ページ送りに対するユーザの一時停止操作であり、
前記第2の操作情報は、前記ページ送りに対するユーザの早送り操作であることを特徴とする電子機器装置。 - 請求項3に記載の電子機器装置において、
前記操作情報記憶手段は、前記第1のコンテンツに対するユーザの第1の操作情報及び第2の操作情報を前記第1のコンテンツと対応付けて記憶し、
前記ユーザ特性情報生成手段は、前記第1の操作情報に対応する前記第1のコンテンツに含まれる文字情報から第1の特性情報を生成するとともに、前記第2の操作情報に対応する第1のコンテンツに含まれる文字情報から第2の特性情報を生成するものであり、
前記ユーザ特性情報に含まれる前記同一の単語の割合と、前記検索された情報に含まれる前記同一の単語の割合とを比較して、前記割合の類似度を判断する判断手段を更に具備し、
前記提示手段は、前記比較の結果、前記関連情報と前記第1の特性情報の両方に含まれる単語の割合が類似し、かつ前記関連情報と前記第2の特性情報の両方に含まれる単語の割合が類似しない場合に、当該関連情報を前記ユーザに提示することを特徴とする電子機器装置。 - 請求項1に記載の電子機器装置において、
特定の時間帯に出力される第2のコンテンツに関連するキーワードを、当該第2のコンテンツ内容を前記特定の時間帯以前に予め説明した情報から収集する収集手段と、
前記キーワードを基に、当該キーワードに関連する前記第1のコンテンツを検索する第2の検索手段とを更に具備し、
前記表示手段は、前記第1のコンテンツを前記第2のコンテンツとともに表示することを特徴とする電子機器装置。 - 請求項1に記載の電子機器装置において、
前記ユーザ特性情報生成手段は、前記ユーザ特性情報生成後であって所定時間経過後に当該ユーザ特性情報を再度生成することにより、前記所定時間経過前のユーザ特性情報を更新することを特徴とする電子機器装置。 - 請求項1に記載の電子機器装置において、
教育上不適切な内容を含むコンテンツに多く含まれる単語を予め記憶する不適切単語記憶手段と、
前記不適切単語記憶手段により記憶された単語を基に、前記文字情報抽出手段が前記表示された第1のコンテンツから前記不適切単語を抽出することを規制する規制手段とを更に具備することを特徴とする電子機器装置。 - 請求項1に記載の電子機器装置において、
前記操作情報記憶手段は、ユーザが複数存在する場合に当該ユーザ毎に当該ユーザの操作を前記第1のコンテンツと対応付けて記憶し、
前記ユーザ特性情報生成手段は、前記複数のユーザ毎に前記ユーザ特性情報を生成することを特徴とする電子機器装置。 - 請求項1に記載の電子機器装置において、
前記文字情報抽出手段は、前記第1のコンテンツの表示レイアウトに関する文字情報を抽出し、
前記ユーザ特性情報生成手段は、前記表示レイアウトに関する文字情報を基に前記ユーザ特性情報を生成することを特徴とする電子機器装置。 - 請求項1に記載の電子機器装置において、
前記ユーザ特性情報に含まれる割合が低い単語のデータを、当該割合が低い順に一定時間毎に削除することを特徴とする電子機器装置。 - (a)第1のコンテンツを表示するステップと、
(b)前記表示された第1のコンテンツに対するユーザの操作情報を、当該第1のコンテンツと対応付けて記憶するステップと、
(c)前記表示された第1のコンテンツから、当該第1のコンテンツに含まれる文字情報を抽出するステップと、
(d)前記第1のコンテンツから抽出された前記文字情報から、前記操作情報に応じたユーザ特性情報を生成するステップと
を具備することを特徴とする情報提供方法。 - 請求項14に記載の方法において、
(e)前記文字情報に含まれる単語を、その含まれる割合に応じて数値化して、前記単語と当該数値とを対応付けて記憶するステップを更に具備し、
前記ユーザ特性情報は、前記操作情報と前記数値化された少なくとも一つの単語とを関連付けて生成されることを特徴とする情報提供方法。 - 請求項14に記載の方法において、
(f)前記抽出されたユーザ特性情報を用いて、前記ユーザ特性情報に関連する関連情報を検索するステップと、
(g)前記検索された情報を前記ユーザに提示するステップと
を更に具備することを特徴とする情報提供方法。 - 請求項16に記載の方法において、
前記ステップ(f)は、前記ユーザ特性情報に含まれる単語と同一の単語が含まれる情報を検索するものであり、
(h)前記ユーザ特性情報に含まれる前記同一の単語の割合と、前記検索された情報に含まれる前記同一の単語の割合とを比較して、前記割合の類似度を判断するステップを更に具備し、
前記ステップ(g)は、前記ステップ(h)により前記割合が類似すると判断された情報を前記ユーザに提示することを特徴とする情報提供方法。 - 請求項15に記載の方法において、
前記ステップ(b)は、前記第1のコンテンツに対するユーザの第1の操作情報及び第2の操作情報を前記第1のコンテンツと対応付けて記憶し、
前記ステップ(d)は、前記第1の操作情報に対応する文字情報に含まれる単語から、前記第1の操作情報に対応する文字情報及び前記第2の操作情報に対応する文字情報の両方に含まれる単語を削除した単語を基に前記ユーザ特性情報を生成することを特徴とする情報提供方法。 - 請求項18に記載の方法において、
前記ステップ(a)は、前記第1のコンテンツとして少なくとも一以上のページを所定の時間間隔でページ送りして表示し、
前記第1の操作情報は、前記ページ送りに対するユーザの一時停止操作であり、
前記第2の操作情報は、前記ページ送りに対するユーザの早送り操作であることを特徴とする情報提供方法。 - 請求項16に記載の方法において、
前記ステップ(b)は、前記第1のコンテンツに対するユーザの第1の操作情報及び第2の操作情報を前記第1のコンテンツと対応付けて記憶し、
前記ステップ(d)は、前記第1の操作情報に対応する前記第1のコンテンツに含まれる文字情報から第1の特性情報を生成するとともに、前記第2の操作情報に対応する第1のコンテンツに含まれる文字情報から第2の特性情報を生成し、
(i)前記ユーザ特性情報に含まれる前記同一の単語の割合と、前記検索された情報に含まれる前記同一の単語の割合とを比較して、前記割合の類似度を判断するステップを更に具備し、
前記ステップ(g)は、前記比較の結果、前記関連情報と前記第1の特性情報の両方に含まれる単語の割合が類似し、かつ前記関連情報と前記第2の特性情報の両方に含まれる単語の割合が類似しない場合に、当該関連情報を前記ユーザに提示することを特徴とする情報提供方法。 - 請求項14に記載の方法において、
(j)特定の時間帯に出力される第2のコンテンツに関連するキーワードを、当該第2のコンテンツ内容を前記特定の時間帯以前に予め説明した情報から収集するステップと、
(k)前記キーワードを基に、当該キーワードに関連する前記第1のコンテンツを検索するステップとを更に具備し、
前記ステップ(a)は、前記第1のコンテンツを前記第2のコンテンツとともに表示することを特徴とする情報提供方法。 - 請求項14に記載の方法において、
(l)前記ユーザ特性情報生成後であって所定時間経過後に当該ユーザ特性情報を再度生成することにより、前記所定時間経過前のユーザ特性情報を更新するステップを更に具備することを特徴とする情報提供方法。 - 請求項14に記載の方法において、
(m)教育上不適切な内容を含むコンテンツに多く含まれる単語を予め記憶するステップと、
(n)前記ステップ(m)により記憶された単語を基に、前記ステップ(c)が前記表示された第1のコンテンツから前記不適切単語を抽出することを規制するステップとを更に具備することを特徴とする情報提供方法。 - 請求項14に記載の方法において、
前記ステップ(b)は、ユーザが複数存在する場合に当該ユーザ毎に当該ユーザの操作を前記第1のコンテンツと対応付けて記憶し、
前記ステップ(d)は、前記複数のユーザ毎に前記ユーザ特性情報を生成することを特徴とする情報提供方法。 - 請求項14に記載の方法において、
前記ステップ(c)は、前記第1のコンテンツの表示レイアウトに関する文字情報を抽出し、
前記ステップ(d)は、前記表示レイアウトに関する文字情報を基に前記ユーザ特性情報を生成することを特徴とする情報提供方法。 - 請求項14に記載の方法において、
前記ユーザ特性情報に含まれる割合が低い単語のデータを、当該割合が低い順に一定時間毎に削除することを特徴とする情報提供方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003394697A JP2005157690A (ja) | 2003-11-25 | 2003-11-25 | 電子機器装置及び情報提供方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003394697A JP2005157690A (ja) | 2003-11-25 | 2003-11-25 | 電子機器装置及び情報提供方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005157690A true JP2005157690A (ja) | 2005-06-16 |
Family
ID=34720693
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003394697A Pending JP2005157690A (ja) | 2003-11-25 | 2003-11-25 | 電子機器装置及び情報提供方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005157690A (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007055036A1 (ja) | 2005-11-10 | 2007-05-18 | Matsushita Electric Industrial Co., Ltd. | アクティブボタン |
JP2011060022A (ja) * | 2009-09-10 | 2011-03-24 | Yahoo Japan Corp | コンテンツデータ提供装置 |
CN104270429A (zh) * | 2014-09-19 | 2015-01-07 | 北京奇虎科技有限公司 | 一种推送应用到终端的方法和装置 |
JP2015210646A (ja) * | 2014-04-25 | 2015-11-24 | 大日本印刷株式会社 | 画像選択装置、画像選択方法、画像配信システム及びコンテンツ選択装置 |
CN107087017A (zh) * | 2017-03-09 | 2017-08-22 | 阿里巴巴集团控股有限公司 | 一种业务引流的方法和装置 |
-
2003
- 2003-11-25 JP JP2003394697A patent/JP2005157690A/ja active Pending
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007055036A1 (ja) | 2005-11-10 | 2007-05-18 | Matsushita Electric Industrial Co., Ltd. | アクティブボタン |
JP2011060022A (ja) * | 2009-09-10 | 2011-03-24 | Yahoo Japan Corp | コンテンツデータ提供装置 |
JP2015210646A (ja) * | 2014-04-25 | 2015-11-24 | 大日本印刷株式会社 | 画像選択装置、画像選択方法、画像配信システム及びコンテンツ選択装置 |
CN104270429A (zh) * | 2014-09-19 | 2015-01-07 | 北京奇虎科技有限公司 | 一种推送应用到终端的方法和装置 |
CN107087017A (zh) * | 2017-03-09 | 2017-08-22 | 阿里巴巴集团控股有限公司 | 一种业务引流的方法和装置 |
CN107087017B (zh) * | 2017-03-09 | 2020-02-21 | 阿里巴巴集团控股有限公司 | 一种业务引流的方法和装置 |
US10915925B2 (en) | 2017-03-09 | 2021-02-09 | Alibaba Group Holding Limited | Method and apparatus for guiding service flow |
US11062353B2 (en) | 2017-03-09 | 2021-07-13 | Advanced New Technologies Co., Ltd. | Method and apparatus for service diversion in connection with mobile payment transactions |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9202523B2 (en) | Method and apparatus for providing information related to broadcast programs | |
JP4328757B2 (ja) | 番組選択装置及び番組選択装置の制御方法 | |
JP5328212B2 (ja) | レコメンド情報評価装置およびレコメンド情報評価方法 | |
CN107562939B (zh) | 垂直领域新闻推荐方法、装置及可读储存介质 | |
JP5300068B2 (ja) | 動画推薦装置 | |
JP2010239571A (ja) | コンテンツ推薦装置、方法、及びプログラム | |
JP2009289202A (ja) | キーワード入力支援装置、キーワード入力支援方法及びプログラム | |
JP2003208434A (ja) | 情報検索システム及びそれに用いる情報検索方法 | |
JPH1069496A (ja) | インターネット検索装置 | |
JP4947709B2 (ja) | コンテンツ配信システム | |
US20050120114A1 (en) | Content synchronization system and method of similar web pages | |
JP6322629B2 (ja) | 情報表示方法およびプログラム | |
US20070136348A1 (en) | Screen-wise presentation of search results | |
KR100729184B1 (ko) | 연상 키워드를 이용한 관계 정보 검색 방법 및 장치 | |
WO2004079593A1 (ja) | 情報閲覧方法及び情報閲覧装置 | |
JP2006319456A (ja) | キーワード提供システム及びプログラム | |
JP2010146366A (ja) | 情報提供サーバ | |
JP5805134B2 (ja) | 端末装置および装置のプログラム | |
JP2010181966A (ja) | レコメンド情報評価装置およびレコメンド情報評価方法 | |
JP2017117021A (ja) | キーワード抽出装置、コンテンツ生成システム、キーワード抽出方法、およびプログラム | |
JP2011002982A (ja) | コンテンツ提供装置、コンテンツ提供方法およびコンテンツ提供プログラム | |
JP2005157690A (ja) | 電子機器装置及び情報提供方法 | |
WO2008032353A1 (en) | Information retrieval device | |
JP2008217228A (ja) | ウェブページ閲覧方法、ウェブページ閲覧装置、ウェブページ閲覧プログラム及びウェブページ閲覧プログラムを記録した記録媒体 | |
JP2004362121A (ja) | 情報検索装置、携帯情報端末装置、情報検索方法、情報検索プログラム及び記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20060424 |