JP2002073677A - 閲覧者の個人嗜好情報収集装置およびこれを利用した情報閲覧支援装置 - Google Patents

閲覧者の個人嗜好情報収集装置およびこれを利用した情報閲覧支援装置

Info

Publication number
JP2002073677A
JP2002073677A JP2000268096A JP2000268096A JP2002073677A JP 2002073677 A JP2002073677 A JP 2002073677A JP 2000268096 A JP2000268096 A JP 2000268096A JP 2000268096 A JP2000268096 A JP 2000268096A JP 2002073677 A JP2002073677 A JP 2002073677A
Authority
JP
Japan
Prior art keywords
information
browsing
genre
personal preference
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000268096A
Other languages
English (en)
Inventor
Hideaki Arita
秀昶 有田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zenrin Co Ltd
Original Assignee
Zenrin Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zenrin Co Ltd filed Critical Zenrin Co Ltd
Priority to JP2000268096A priority Critical patent/JP2002073677A/ja
Publication of JP2002073677A publication Critical patent/JP2002073677A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 キーワードを入力せずに嗜好に合ったWeb
ページを閲覧する。 【解決手段】 閲覧者Rが情報閲覧装置200を用い
て、インターネット100にアクセスし、クリック操作
によりリンクが張られた複数のWebページを閲覧する
作業を行っているときに、クリック操作の時刻および閲
覧内容を情報入力手段310によって入力する。単語・
ジャンル選択手段320は、各Webページの内容を代
表する単語およびそのジャンルを選択し、閲覧時間算出
手段330は、各Webページごとの閲覧時間を算出す
る。個人嗜好情報記録手段350は、各単語やジャンル
の選択頻度、閲覧時間積算値などを個人嗜好情報として
記録する。表示制御装置410は、この個人嗜好情報に
基づいて、特定の単語が閲覧画面210上で色別表示さ
れるようにし、検索制御装置420は、この個人嗜好情
報をキーワードとしてインターネット100内を自動検
索する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、閲覧者の個人嗜好
情報収集装置およびこれを利用した情報閲覧支援装置に
関し、特に、個々の閲覧者がインターネット上のWeb
ページを閲覧する作業を行った場合に、この閲覧者個人
の嗜好に関する情報を収集し、この嗜好情報を利用して
その後の閲覧作業を円滑に進めるような学習を行うこと
ができる装置に関する。
【0002】
【従来の技術】インターネットの急激な普及に伴い、個
人レベルでも大量の情報にアクセスする環境が整いつつ
ある。しかしながら、インターネットでアクセス可能な
情報は、あまりにも膨大であり、アクセス対象となる情
報の保存場所が多岐に渡るため、自分の探し求めている
特定の情報が大量の情報洪水の中に埋もれてしまい、所
望の情報を得ることが益々困難になってきていることも
事実である。そこで、個々の閲覧者が、インターネット
の中から容易に所望の情報を取り出すことができるよう
に、様々な検索手段が用意されている。たとえば、いわ
ゆるポータルサイトと呼ばれる種々の検索サイトを利用
すれば、所望の情報に関連したキーワードに基づく検索
を行うことが可能である。これらの検索サイトでは、様
々な検索エンジンが利用されており、与えられたキーワ
ードに関連したWebページが自動的に検索され閲覧者
に提示される。閲覧者は、アクセスしたい情報に最も適
したキーワードを選択し、これを検索エンジンに与える
ことにより、所望の情報に辿りつくことができる。
【0003】
【発明が解決しようとする課題】上述したように、現
在、インターネットを介して所望の情報にアクセスする
ためには、検索エンジンに対して所定のキーワード集合
を与えて検索を行うのが一般的である。しかしながら、
自分の興味の対象となる情報に対して、どのようなキー
ワード集合を与えた検索を行えば最も理想的な検索が行
えるか、という命題に対する答を出すことは必ずしも容
易ではない。また、個人の興味や趣向は、時とともに移
り変わってゆく可能性があり、この場合、その都度、新
しいキーワード集合を用意した検索を行わねばならな
い。
【0004】そこで本発明は、閲覧者自身がキーワード
集合の入力を行うことなしに、閲覧者の嗜好に応じた情
報閲覧を行うことができるようにする情報閲覧支援装置
を提供することを目的とし、更に、そのような情報閲覧
支援装置に利用可能な個人嗜好情報収集装置を提供する
ことを目的とする。
【0005】
【課題を解決するための手段】(1) 本発明の第1の態
様は、閲覧者の指示入力に基づいて当該指示入力に応じ
た新たな頁を閲覧画面上に表示させる機能をもった情報
閲覧装置を用いて、閲覧者が所望の情報を閲覧する作業
を行った場合に、当該閲覧者の個人的な嗜好に関する情
報を収集するための閲覧者の個人嗜好情報収集装置にお
いて、単語を複数のジャンルに分類し、個々の単語がそ
れぞれどのジャンルに所属するかを示す分類情報を格納
する分類情報格納手段と、情報閲覧装置から、閲覧者の
指示入力があった時刻に関する時刻情報と、当該指示入
力に応じて表示された新たな頁の内容を示す頁内容情報
と、を取り込む情報入力手段と、情報入力手段が取り込
んだ頁内容情報の中から所定のアルゴリズムに基づいて
当該頁の内容を表現する単語を選択するとともに、分類
情報格納手段内の分類情報に基づいて当該単語が所属す
るジャンルを選択する単語・ジャンル選択手段と、情報
入力手段が取り込んだ時刻情報を参照して、各頁ごとの
閲覧時間を算出する閲覧時間算出手段と、単語・ジャン
ル選択手段によって選択された単語およびジャンルにつ
いて、現在に至るまでの選択頻度、ならびに、当該単語
およびジャンルが選択された各頁についての閲覧時間の
積算値を、個人嗜好情報として記録する個人嗜好情報記
録手段と、を設けるようにしたものである。
【0006】(2) 本発明の第2の態様は、上述の第1
の態様に係る閲覧者の個人嗜好情報収集装置において、
個人嗜好情報記録手段が、選択されたジャンルについ
て、当該ジャンルの選択に用いられた単語の数を、個人
嗜好情報として記録する機能を更に付加したものであ
る。
【0007】(3) 本発明の第3の態様は、上述の第1
または第2の態様に係る閲覧者の個人嗜好情報収集装置
において、閲覧者が情報閲覧装置を用いて特定の情報に
アクセスするために、一連の閲覧作業を開始したとき
に、最初に表示された頁を閲覧開始頁と定義し、情報入
力手段に、閲覧開始頁を特定する入力を行う機能をもた
せ、個人嗜好情報記録手段に、選択されたジャンルにつ
いて、当該ジャンルが選択された頁が閲覧開始頁であっ
た回数を示す閲覧開始頁頻度を、個人嗜好情報として記
録する機能をもたせるようにしたものである。
【0008】(4) 本発明の第4の態様は、上述の第1
〜第3の態様に係る閲覧者の個人嗜好情報収集装置にお
いて、閲覧者の指示入力に基づいて、閲覧画面上の頁が
更新されたときに、個人嗜好情報記録手段が、特定のジ
ャンルの頁から特定のジャンルの頁へのジャンルの変遷
が生じた回数を示すために、個々のジャンル対について
の変遷頻度を、個人嗜好情報として記録する機能を更に
付加したものである。
【0009】(5) 本発明の第5の態様は、上述の第1
〜第3の態様に係る閲覧者の個人嗜好情報収集装置にお
いて、個人嗜好情報記録手段が、情報入力手段が取り込
んだ時刻情報を参照して、個人嗜好情報として記録して
いる個々の単語およびジャンルについて、最後の選択を
もたらした指示入力があった最終選択時刻を記録し、こ
の最終選択時刻を考慮して、特定の単語もしくはジャン
ルに関する個人嗜好情報を削除する忘却処理を行うよう
にしたものである。
【0010】(6) 本発明の第6の態様は、上述の第5
の態様に係る閲覧者の個人嗜好情報収集装置において、
最終選択時刻から現在時刻に至るまでの時間が所定の忘
却許容時間を越えており、選択頻度が所定の基準頻度未
満であり、かつ、閲覧時間の積算値が所定の基準積算値
未満である場合に、忘却処理を行うようにしたものであ
る。
【0011】(7) 本発明の第7の態様は、上述の第4
の態様に係る閲覧者の個人嗜好情報収集装置において、
個人嗜好情報記録手段が、情報入力手段が取り込んだ時
刻情報を参照して、個人嗜好情報として記録している個
々の変遷について、最後の変遷をもたらした指示入力が
あった最終変遷時刻を記録し、この最終変遷時刻を考慮
して、特定の変遷に関する個人嗜好情報を削除する忘却
処理を行うようにしたものである。
【0012】(8) 本発明の第8の態様は、上述の第1
〜第7の態様に係る閲覧者の個人嗜好情報収集装置にお
いて、情報入力手段が、閲覧者が閲覧画面上の特定箇所
をクリックもしくはダブルクリックする操作を行った時
点、または、当該操作に基づいて閲覧画面上に新たな頁
が表示された時点、の時刻を時刻情報として取り込むよ
うにしたものである。
【0013】(9) 本発明の第9の態様は、上述の第1
〜第8の態様に係る閲覧者の個人嗜好情報収集装置にお
いて、単語・ジャンル選択手段が、頁内容情報に含まれ
る当該頁のタイトルおよび本文を構成する文字列の中か
ら、出現頻度の高い単語を所定数だけ抽出し、これを選
択するようにしたものである。
【0014】(10) 本発明の第10の態様は、上述の第
1〜第9の態様に係る閲覧者の個人嗜好情報収集装置に
おいて、情報閲読装置として、インターネット上のWe
bページを閲覧する機能をもったWebブラウザソフト
ウエアを組み込んだ情報端末装置を用い、当該情報端末
装置を利用した閲覧者のWebページの閲覧に関する個
人嗜好情報を収集することができるようにしたものであ
る。
【0015】(11) 本発明の第11の態様は、上述の第
1〜第10の態様に係る閲覧者の個人嗜好情報収集装置
の構成要素のすべてに加えて、更に、個人嗜好情報記録
手段内に記録されている個人嗜好情報に基づいて、情報
閲覧装置の閲覧画面上に表示される文字列のうち、閲覧
者の嗜好に合致すると判断される単語を判別し、当該単
語が異なる表示態様で表示されるように制御する表示制
御装置を設けることにより、情報閲覧支援装置を構成す
るようにしたものである。
【0016】(12) 本発明の第12の態様は、上述の第
1〜第10の態様に係る閲覧者の個人嗜好情報収集装置
の構成要素のすべてに加えて、更に、個人嗜好情報記録
手段内に記録されている個人嗜好情報に基づいて、閲覧
者の嗜好に合致すると判断される単語およびジャンルを
示すキーワード集合を作成し、このキーワード集合を情
報閲覧装置に与えて、この情報閲覧装置にキーワード集
合に関連した頁を自動的に検索させ、その結果を閲覧者
に提示させる制御を行う検索制御装置を設けることによ
り、情報閲覧支援装置を構成するようにしたものであ
る。
【0017】(13) 本発明の第13の態様は、上述の第
12の態様に係る情報閲覧支援装置において、情報閲覧
装置が提示した検索結果を閲覧者が閲覧する作業を行う
際にも、個人嗜好情報収集装置を機能させて個人嗜好情
報の収集を行うことができるようにしたものである。
【0018】(14) 本発明の第14の態様は、上述の第
1〜第13の態様に係る情報収集装置または情報閲覧支
援装置としてコンピュータを動作させるためのプログラ
ムを、コンピュータ読み取り可能な記録媒体に記録する
ようにしたものである。
【0019】
【発明の実施の形態】以下、本発明を図示する実施形態
に基づいて説明する。
【0020】§1.本発明に係る個人嗜好情報収集装置
の基本構成 図1は、本発明の一実施形態に係る個人嗜好情報収集装
置の基本構成を示すブロック図である。このブロック図
には、インターネット100を介して情報閲覧を行う機
能をもった情報閲覧装置200が描かれているが、本発
明に係る閲覧者の個人嗜好情報収集装置300は、閲覧
者Rが、この情報閲覧装置200を用いて、所望の情報
を閲覧する作業を行った場合に、当該閲覧者Rの個人的
な嗜好に関する情報を収集する機能を有している。ここ
で、情報閲覧装置200は、閲覧者の指示入力に基づい
て当該指示入力に応じた新たな頁を閲覧画面210上に
表示させる機能をもった装置であり、実際には、インタ
ーネット上のWebページを閲覧する機能をもったWe
bブラウザソフトウエアを組み込んだ情報端末装置(た
とえば、パソコン、携帯情報端末、携帯電話など)によ
って構成される装置である。インターネット100上で
WWW(World Wide Web)を利用して検索されるWeb
ページは、通常、頁単位で作成されたHTML形式のデ
ータとして提供され、一般的なWebブラウザソフトウ
エアは、このHTML形式の頁単位の情報を閲覧画面2
10上に表示させることができる。1頁の情報すべてを
閲覧画面210上に一度に表示できない場合であって
も、通常、スクロール操作を行うことにより、すべての
情報を閲覧することができる。
【0021】WWWを利用した閲覧作業の特徴は、1つ
のWebページから別なWebページに、ハイパーリン
クを利用して移動できる点にある。図2は、このような
ハイパーリンクを利用したWebページ間の移動を示す
概念図である。たとえば、閲覧画面210上にWebペ
ージW1が表示されている状態で、閲覧者が、このWe
bページW1の特定箇所をマウスなどでクリックする
と、クリックされた特定箇所に対してリンクが張られて
いた別なWebページW2が閲覧画面210に表示され
るようになる。更に、このWebページW2の特定箇所
をマウスなどでクリックすると、クリックされた特定箇
所に対してリンクが張られていた別なWebページW3
が閲覧画面210に表示されるようになる。このよう
に、閲覧者が閲覧画面210上で任意の箇所(ハイパー
リンクが定義されている箇所)をクリックする指示入力
を与えると、この指示入力に応じた新たな頁が閲覧画面
210に表示されることになる。このようにして、リン
クを辿って様々なWebページを渡り歩く閲覧手法は、
インターネットによるWebページの閲覧形態としてご
く一般的に行われている手法である。
【0022】本願発明者は、閲覧者のこのような閲覧作
業の過程において、閲覧者自身が自分の興味や嗜好に関
する情報を無意識のうちに入力していることに着眼し、
この無意識のうちに入力した情報を個人嗜好情報として
収集し、この収集結果を、より円滑な情報閲覧に利用す
ることを考えたのである。すなわち、図2において、W
ebページW1からWebページW2へと閲覧頁が更新
され、更に、WebページW2からWebページW3へ
と閲覧頁が更新されたのは、いずれも閲覧者自身の指示
入力に基づくものであるから、少なくとも、閲覧者とし
ては、新たに表示されるWebページW2あるいはWe
bページW3には、自分の興味や趣向の対象となる情報
が掲載されているであろうとの期待のもとに、そのよう
な新たな頁を表示させる指示入力を与えたと考えること
ができる。そこで本発明では、閲覧画面210に新たな
頁が表示されるたびに、この新たな頁の内容を表現する
単語と、その単語のジャンルとを抽出し、これらを系統
的に記録することにより、個人嗜好情報を自動的に蓄積
できるようにしている。
【0023】図1に示す個人嗜好情報収集装置300
は、いわば情報閲覧装置200の陰で働いて、自動的に
閲覧者Rの個人嗜好情報を収集する機能をもった装置と
いうことができる。実際、閲覧者R自身は、この個人嗜
好情報収集装置300の存在を意識する必要はなく、情
報閲覧装置200を用いて、これまでどおりの方法でW
ebページの閲覧作業を行えばよい。個人嗜好情報収集
装置300は、この閲覧作業中に、情報閲覧装置200
から必要なデータを採取し、後述するような方法で、閲
覧者Rの個人嗜好情報を収集する処理を実行する。
【0024】個人嗜好情報収集装置300は、図示のと
おり、情報入力手段310、単語・ジャンル選択手段3
20、閲覧時間算出手段330、分類情報格納手段34
0、個人嗜好情報記録手段350によって構成されてい
る。もっとも、実際には、ハードウエアの観点からみれ
ば、情報閲覧装置200と個人嗜好情報収集装置300
とは、同一の装置によって実現されることになる。図1
において、情報閲覧装置200と個人嗜好情報収集装置
300とが別個独立したブロックで示されているのは、
これらをその機能に着目してソフトウエアの観点から区
別して記述したためである。前述したように、情報閲覧
装置200は、実際にはパソコンなどのインターネット
端末装置に、Webブラウザソフトウエアを組み込むこ
とによって構成される装置であり、本発明に係る個人嗜
好情報収集装置300も、この同一のインターネット端
末装置に専用のソフトウエアを組み込むことによって構
成される。具体的には、個人嗜好情報収集装置300と
して機能するソフトウエアは、Webブラウザソフトウ
エアに対する付加プログラム(たとえば、プラグインモ
ジュールの形式で提供することができるプログラム)と
して、このインターネット端末装置に組み込まれること
になる。
【0025】情報入力手段310は、情報閲覧装置20
0から、閲覧者Rの指示入力があった時刻に関する時刻
情報、当該指示入力に応じて表示された新たな頁の内容
を示す頁内容情報、閲覧者Rによる閲覧開始頁を特定す
るための閲覧開始頁情報、を取り込む機能を有してい
る。個人嗜好情報収集装置300は、これらの各情報に
基づいて、閲覧者Rについての個人嗜好情報を収集する
処理を行うことになる。なお、同一の情報閲覧装置20
0を複数の閲覧者が共同で利用するような環境にある場
合、閲覧者の識別コードなどの情報も併わせて情報入力
手段310に取り込ませるようにし、現在、どの閲覧者
が利用中なのかを特定できるようにしておく必要があ
る。この場合、以下に説明する個人嗜好情報の収集処理
は、個々の閲覧者ごとに別個独立して行われることにな
る。
【0026】情報入力手段310で取り込まれた各情報
は、単語・ジャンル選択手段320および閲覧時間算出
手段330に与えられる。単語・ジャンル選択手段32
0は、情報入力手段310が取り込んだ頁内容情報の中
から所定のアルゴリズムに基づいて当該頁の内容を表現
する単語を選択する処理(単語選択処理)とともに、分
類情報格納手段340内の分類情報に基づいて当該単語
が所属するジャンルを選択する処理(ジャンル選択処
理)を行う。以下、これらの処理を順に説明しよう。
【0027】§2.本発明に係る個人嗜好情報収集装置
の基本動作 本実施形態の場合、情報入力手段310によって取り込
まれる頁内容情報は、閲覧画面210内に表示されてい
るWebページのタイトルおよび本文を構成する文字列
である。一般に、Webページには、画像、動画、音声
なども含まれているが、本実施形態では、Webページ
上の文字列にのみ着目して個人嗜好情報の収集を行って
いる。HTML形式のファイルで提供されるWebペー
ジの場合、個々の文字列は、サイズ、フォント、書体な
どの付加情報をもっていることがあるが、情報入力手段
310に取り込む頁内容情報としては、テキストの情報
のみで足り、サイズ、フォント、書体などの付加情報は
不要である。こうして、頁内容情報として、Webペー
ジのタイトルおよび本文を構成する文字列がテキストデ
ータとして取り込まれたら、このテキストデータの中か
ら、当該Webページの内容を表現する単語を選択す
る。たとえば、タイトルおよび本文を構成するテキスト
データの中から、出現頻度の高い単語を所定数だけ抽出
し(たとえば、5つとか、予め抽出する数を決めておい
てもよいし、本文の長さに応じて抽出する数を可変にし
てもよい)、これを選択するようにすればよい。もっと
も、出現頻度だけに基づいて選択された単語は、必ずし
も当該Webページの内容を表現する単語として適格で
あるかどうか不明であるので、より精度の高い抽出を行
うためには、形態素解析などを利用した文章解析手法を
適用して、内容を表現するのにより相応しい単語を選択
できるようにするのが好ましい。このように、文章を構
成するテキストデータから、当該文章の要約や内容を示
す単語を抽出するアルゴリズムは、既にいくつもの方法
が公知であるため、ここでは詳細な説明は省略する。
【0028】さて、こうして、閲覧画面210に表示さ
れているWebページについて、1つもしくは複数の単
語が選択されたら、この単語についてジャンルを決定す
る。このジャンルの決定には、分類情報格納手段340
が用いられる。分類情報格納手段340は、多数の単語
を複数のジャンルに分類し、個々の単語がそれぞれどの
ジャンルに所属するかを示す分類情報を格納する機能を
有している。具体的には、この分類情報格納手段340
内には、図3に示すように、ジャンル分類辞書D1と単
語辞書D2とが格納されている。ジャンル分類辞書D1
は、多数の単語をジャンル別に分類する分類体系を定義
したときの個々のジャンル名とそのIDを示すものであ
る。一般に、言語的知識の総体をジャンルに分類する分
類体系としては、階層構造を採ったもの多い。たとえ
ば、多くの図書館で利用されている図書分類や、特許技
術の分類として採用されている国際特許分類などは、い
ずれも階層構造を採った分類手法を採用している。本発
明においても、もちろん、このような階層構造を採った
分類手法を利用することも可能であるが、ここで述べる
実施形態の場合、処理をできるだけ単純化するために、
階層構造を採らない並列的な分類を用いている。個々の
ジャンルの分類範囲をどの程度に設定するかは、収集し
た個人嗜好情報の利用のしかたなどを考慮して適宜定め
るようにすればよい。あまり大雑把な分類を採用する
と、情報収集精度が低下することになるが、あまり細か
な分類を採用しても、収集した情報が利用しずらいもの
となってしまう。
【0029】図3のジャンル分類辞書D1には、ジャン
ルによる分類の一例が示されている。たとえば、この例
では、「爬虫類」,「両生類」,「哺乳類」といったジ
ャンル名が示されている。もちろん、これらのジャンル
をひっくるめて「動物」といったジャンルにまとめてし
まうこともできし、逆に、「偶蹄目」,「翼手目」,
「食虫目」といった細分類のジャンルを用いることもで
きるが、一般的には、図3に示す程度の分類範囲を採用
するのが好ましい。このジャンル分類辞書D1には、各
ジャンルの名前が列挙されるとともに、個々のジャンル
について特定のジャンルIDが示されている。一方、単
語辞書D2には、多数の単語(Webページで用いられ
るであろうと思われる大多数の単語)のそれぞれについ
て、ジャンル分類辞書D1に列挙されているジャンルの
うちのどのジャンルに所属するかを示す情報が格納され
ている。たとえば、単語辞書D2の「ライオン」なる単
語は、「ID1003」なるジャンルIDで示されるジ
ャンルに所属することが示されており、ジャンル分類辞
書D1を参照すれば、「ID1003」なるジャンルI
Dが「哺乳類」なるジャンルを示すことがわかる。この
ように、単語辞書D2に掲載されている単語には、いず
れかのジャンルが対応づけられている。
【0030】単語・ジャンル選択手段320は、Web
ページの内容を示すいくつかの単語を選択したら、続い
て、分類情報格納手段340内に用意された辞書を参照
することにより、個々の単語についてのジャンルを認識
する処理を行う。もっとも、実際には、この時点では、
ジャンル名まで認識する必要はなく、各単語に対応する
ジャンルIDが認識できればよいので、単語辞書D2を
参照するだけの処理でよい。かくして、単語・ジャンル
選択手段320によって、閲覧画面210に表示されて
いるWebページについて、特定の単語とジャンルとが
選択されることになる。こうして選択された単語および
ジャンルは、当該Webページの内容に関連した単語お
よびジャンルということになり、閲覧者Rがこの選択さ
れた単語およびジャンルに対して何らかの興味を示して
いたことになる。
【0031】一方、閲覧時間算出手段330は、情報入
力手段310が取り込んだ時刻情報を参照して、各We
bページごとの閲覧時間を算出する処理を行う。既に述
べたように、情報入力手段310は、情報閲覧装置20
0から、閲覧者Rの指示入力があった時刻に関する時刻
情報を入力する機能を有する。具体的には、閲覧者Rが
閲覧画面210上の特定箇所をクリック(もしくはダブ
ルクリック)する操作を行った時点の時刻が時刻情報と
して入力されることになる。閲覧画面210上に表示さ
れるWebページは、閲覧者Rのクリック操作に起因し
て更新されることになるので、閲覧者Rのクリック操作
の時点は、閲覧者Rが次のWebページへの移行を意図
した時点ということができ、このWebページの切替時
点を認識することにより、個々のWebページをどの程
度の時間にわたって閲覧していたかを示す閲覧時間を算
出することが可能になる。
【0032】たとえば、図2に示すように、閲覧者Rが
WebページW1→W2→W3の順に閲覧した場合、各
Webページを表示させる際に、閲覧者Rはマウスクリ
ックなどの何らかの指示入力を行ったはずである。そこ
で、たとえば、WebページW1,W2,W3を表示さ
せるための指示入力のあった時刻を、それぞれt1,t
2,t3とすれば、時間(t2−t1)はWebページ
W1を閲覧していた時間を示し、時間(t3−t2)は
WebページW2を閲覧していた時間を示すことにな
る。WebページW3については、現在もまだ閲覧中で
あるので、閲覧時間はこの時点では確定できないが、更
に別なWebページW4へ移行するための入力指示ある
いは閲覧終了の入力指示が与えられた時点で、閲覧時間
が確定することになる。なお、時刻情報としては、必ず
しも閲覧者Rの指示入力があった時刻を採用する必要は
なく、たとえば、当該指示入力に基づいて閲覧画面21
0上に新たな頁が表示された時点、の時刻を時刻情報と
して用いることも可能である。すなわち、クリック操作
の時刻ではなく、閲覧画面210の表示が更新された時
点の時刻を、時刻情報として用いることができる。な
お、本明細書における「時刻」とは、いわゆる時計の時
刻だけを指すものではなく、カレンダー上の年月日の情
報と時計上の時刻の情報とを含めた概念で用いており、
情報入力手段310に入力される時刻情報は、たとえ
ば、「2000年8月20日16時54分33秒」のよ
うに、年月日時分秒の単位で示されるデータということ
になる。
【0033】結局、図2において、WebページW1が
表示されると、単語・ジャンル選択手段320によっ
て、このWebページW1の内容に関連した単語および
ジャンルが選択され、更に、WebページW1からW2
へと移行する入力指示(クリック操作)が与えられる
と、閲覧時間算出手段330によって、このWebペー
ジW1の閲覧時間(別言すれば、このWebページW1
に滞留していた滞留時間)が算出される。個人嗜好情報
記録手段350は、これらの情報に基づいて、個人嗜好
情報の記録を行う機能を有する。すなわち、個人嗜好情
報記録手段350は、単語・ジャンル選択手段320に
よって選択された単語およびジャンルについて、現在に
至るまでの選択頻度、ならびに、当該単語およびジャン
ルが選択された各頁についての閲覧時間の積算値などの
情報を、個人嗜好情報として記録する処理を行う。
【0034】この実施形態では、図示のとおり、単語テ
ーブルT1,ジャンルテーブルT2,変遷テーブルT3
なる3種類のテーブルの形式で、個人嗜好情報の記録が
行われる。これらの各テーブルT1,T2,T3に記録
される情報は、個々の閲覧者ごとの嗜好を示す個人的な
情報である。これらの各テーブルT1,T2,T3は、
当初は何らデータが記録されていない白紙状態のテーブ
ルであるが、閲覧者が情報閲覧装置200を用いて閲覧
作業を行う過程で、これらのテーブルに徐々にデータが
蓄積されてゆくことになる。以下、これら各テーブルの
具体的な記録内容を、図4〜図6を参照して説明する。
【0035】§3.本発明に係る装置で収集される個人
嗜好情報の実体 まず、単語テーブルT1は、図4に示すように、個々の
単語ごとに、「ジャンルID」、「選択頻度」、「閲覧
時間積算値」、「最終選択時刻」、を記録してなるテー
ブルである。「ジャンルID」は、分類情報格納手段3
40内の単語辞書D2を参照することにより得られる情
報であり、個々の単語がどのジャンルに所属するかを示
すものである。「ジャンルID」は、単語辞書D2を参
照すれば得られる情報であるため、必ずしも単語テーブ
ルT1内に記録しておく必要はないが、本実施形態で
は、この単語テーブルT1の利用の便宜を考慮して、個
々の単語について「ジャンルID」を記録するようにし
ている。
【0036】「選択頻度」は、当該単語が単語・ジャン
ル選択手段320によって現在までに選択された回数を
示す数値である。たとえば、図示の例では、「ライオ
ン」なる単語の選択頻度が「3」となっているが、これ
は、単語・ジャンル選択手段320によって、これまで
「ライオン」なる単語が選択されたことが合計3回ある
ことを示している。上述したように、単語・ジャンル選
択手段320は、個々のWebページが閲覧画面210
に表示されるごとに、当該Webページから所定の単語
を抽出し、これを当該Webページの内容を示す単語と
して選択する処理を行う機能を有している。したがっ
て、図4に示す例において、「ライオン」なる単語の選
択頻度が「3」となっているということは、「ライオ
ン」なる単語が選択されるようなWebページが、これ
までに3回表示された、ということを示している。
【0037】たとえば、図2に示す例において、Web
ページW1を表示させたときに、この頁から「ライオ
ン」なる単語が選択されたとすると、単語・ジャンル選
択手段320から個人嗜好情報記録手段350に対し
て、「ライオン」なる選択単語が伝達されることにな
る。個人嗜好情報記録手段350は、単語テーブルT1
を検索して、既に「ライオン」なる単語が登録されてい
るかどうかを調べる。もし、まだ「ライオン」なる単語
が登録されていなかったら、新たに「ライオン」なる単
語を登録し、ジャンルIDを「ID1003」に設定す
るとともに、選択頻度を初期値「1」に設定する。続い
て、WebページW2を表示させたときに、この頁から
も「ライオン」なる単語が選択されたとすると、既に、
単語テーブルT1には、「ライオン」なる単語が登録さ
れているので、選択頻度を1だけ増加させて「2」に更
新する処理が行われる。更に、WebページW3を表示
させたときに、この頁からも「ライオン」なる単語が選
択されたとすると、単語テーブルT1内の「ライオン」
についての選択頻度を更に1だけ増加させて「3」に更
新する処理が行われる。結局、この選択頻度の欄の数値
を見れば、当該単語に関連したWebページが、これま
でに何回表示されたかを知ることができることになる。
【0038】このように「選択頻度」が、各単語に関連
するWebページの表示回数の累積値を示すパラメータ
であるのに対し、「閲覧時間積算値」は、各単語に関連
するWebページの閲覧時間(滞留時間)の積算値を示
すパラメータとなる。既に述べたように、個々のWeb
ページの閲覧時間(閲覧画面210に表示されていた時
間)は、閲覧時間算出手段330によって算出されるの
で、「ライオン」なる単語が選択されたWebページに
ついての閲覧時間も閲覧時間算出手段330の算出結果
として得ることができる。単語テーブルT1の「閲覧時
間積算値」の欄には、このような閲覧時間の積算値が記
録されることになる。たとえば、「ライオン」なる単語
が、これまでに閲覧した3つのWebページW1,W
2,W3のそれぞれにおいて選択された場合、「選択頻
度」は「3」となり、「閲覧時間積算値」は3つのWe
bページW1,W2,W3の閲覧時間の合計値(図示の
例では、「543秒」)となる。
【0039】また、「最終選択時刻」の欄には、当該単
語についての最後の選択をもたらした指示入力があった
時刻が記録される。たとえば、「ライオン」なる単語
が、これまでに閲覧した3つのWebページW1,W
2,W3のそれぞれにおいて選択された場合、最後の選
択は、WebページW3において行われたことになるの
で、このWebページW3を表示するための指示入力が
あった時刻(図2の例では、時刻t2)が、「ライオ
ン」なる単語についての「最終選択時刻」ということに
なる。もちろん、新たに表示させたWebページにおい
て、「ライオン」なる単語が選択された場合、「最終選
択時刻」も新たなものに更新されることになる。
【0040】このように、図4の単語テーブルにおける
「選択頻度」,「閲覧時間積算値」,「最終選択時刻」
の各欄のデータは、新たなWebページから該当する単
語が選択されるたびに更新されることになる。
【0041】一方、ジャンルテーブルT2は、図5に示
すように、個々のジャンルごとに、「ジャンルID」、
「選択頻度」、「閲覧時間積算値」、「最終選択時
刻」、「単語数」、「閲覧開始頁頻度」を記録してなる
テーブルである。単語テーブルT1が、個々の単語を1
レコード(図示の表の場合、1行のデータ)として構成
されるテーブルであるのに対し、ジャンルテーブルT2
は、個々のジャンルを1レコードとして構成されるテー
ブルである。図5に示す例では、「ジャンル名」を直接
記録する代わりに、「ジャンルID」を記録するように
しているが、これはデータ処理を円滑にするための便宜
のためであり、実質的には、このテーブルにおける1行
が1つのジャンルに対応している。
【0042】「選択頻度」は、当該ジャンルが単語・ジ
ャンル選択手段320によって現在までに選択された回
数を示す数値である。たとえば、図示の例では、ジャン
ルID「ID1003」なるジャンル(「哺乳類」なる
ジャンル)の選択頻度が「8」となっているが、これ
は、単語・ジャンル選択手段320によって、これまで
「哺乳類」なるジャンルが選択されたことが合計8回あ
ることを示している。上述したように、単語・ジャンル
選択手段320は、個々のWebページが閲覧画面21
0に表示されるごとに、当該Webページから所定の単
語を抽出し、この単語が所属するジャンルを認識し、抽
出された単語および認識されたジャンルを、当該Web
ページの内容を示す単語およびジャンルとして選択する
処理を行う機能を有している。したがって、図5に示す
例において、「哺乳類」なるジャンルの選択頻度が
「8」となっているということは、「哺乳類」なるジャ
ンルが選択されるようなWebページが、これまでに8
回表示された、ということを示している。
【0043】たとえば、閲覧画面210に表示されたW
ebページから「ライオン」なる単語が選択されたとす
ると、この「ライオン」なる単語のジャンルとして「哺
乳類」なるジャンルが選択され、単語・ジャンル選択手
段320から個人嗜好情報記録手段350に対して、
「ライオン」なる選択単語とともに「哺乳類」なる選択
ジャンルが伝達されることになる。個人嗜好情報記録手
段350は、ジャンルテーブルT2を検索して、既に
「哺乳類」なるジャンルが登録されているかどうかを調
べる(具体的には、「ID1003」なるジャンルID
が既に登録されているかどうか調べる)。もし、まだ
「哺乳類」なるジャンルが登録されていなかったら、新
たに「哺乳類」なるジャンルを登録し、選択頻度を初期
値「1」に設定する。続いて、別なWebページから
「キリン」なる単語が選択され、このWebページにつ
いてやはり「哺乳類」なるジャンルが選択されたとする
と、既に、ジャンルテーブルT2には、「哺乳類」なる
ジャンルが登録されているので、選択頻度を1だけ増加
させて更新する処理が行われる。結局、この選択頻度の
欄の数値を見れば、当該ジャンルに関連したWebペー
ジが、これまでに何回表示されたかを知ることができる
ことになる。
【0044】このように「選択頻度」が、各ジャンルに
関連するWebページの表示回数の累積値を示すパラメ
ータであるのに対し、「閲覧時間積算値」は、各ジャン
ルに関連するWebページの閲覧時間(滞留時間)の積
算値を示すパラメータとなる。これは、単語テーブルT
1における「閲覧時間積算値」と同様である。すなわ
ち、単語テーブルT1における「閲覧時間積算値」が、
個々の単語に関連するWebページの閲覧時間の積算値
を示すのに対し、ジャンルテーブルT2における「閲覧
時間積算値」は、個々のジャンルに関連するWebペー
ジの閲覧時間の積算値を示すものになる。
【0045】1つのジャンルは複数の単語に対応してい
るので、たとえば、「ライオン」なる単語が選択された
Webページについては「哺乳類」なるジャンルが選択
されるが、「キリン」なる単語が選択されたWebペー
ジについても、やはり「哺乳類」なるジャンルが選択さ
れることになる。したがって、一般的には、単語テーブ
ルT1の選択頻度や閲覧時間積算値の数値に比べて、ジ
ャンルテーブルT2の選択頻度や閲覧時間積算値の数値
の方が大きくなる。
【0046】「最終選択時刻」の欄には、当該ジャンル
についての最後の選択をもたらした指示入力があった時
刻が記録される。たとえば、図2に示す3つのWebペ
ージW1,W2,W3において、それぞれ「ライオ
ン」,「餃子」,「キリン」なる単語が選択された場
合、これら3つの単語についてのジャンルは、それぞれ
「哺乳類」,「中華料理」,「哺乳類」となるので、こ
の時点におけるジャンルテーブルT2の「哺乳類」につ
いての最終選択時刻は時刻t3となり、「中華料理」に
ついての最終選択時刻は時刻t2となる。
【0047】「単語数」の欄には、当該ジャンルの選択
に用いられた単語の数が記録される。たとえば、「哺乳
類」というジャンルが選択されるためには、まず、「哺
乳類」に所属するいずれかの単語が選択されていなけれ
ばならない。具体的には、「ライオン」、「キリン」、
「馬」などの単語が選択された場合に、「哺乳類」とい
うジャンルが選択されることになる。「単語数」の欄の
数値は、これまでに、いくつの単語から「哺乳類」とい
うジャンルが選択されることになったか、を示す数値で
あり、たとえば、図5に示す例では、「哺乳類」のジャ
ンル(ジャンルID「ID1003」)についての単語
数が「7」となっているが、これは、これまでに7種類
の動物を示す単語が選択され、これらの単語に基づい
て、「哺乳類」というジャンルが選択されたことを示し
ている。
【0048】このような単語数に関する情報は、閲覧者
の各ジャンルに対する興味の偏りを示す情報として有用
である。たとえば、図5の例では、「哺乳類」のジャン
ル(ジャンルID「ID1003」)についての選択頻
度が「8」であるのに、単語数が「7」となっている
が、これは「哺乳類」なるジャンルのWebページが合
計8回アクセスされ、しかもそのうちの7回までが、異
なる動物についてのWebページであったことを示して
いる。別言すれば、この閲覧者は、「哺乳類」というジ
ャンルについて広く関心をもっているものと判断するこ
とができる。これに対して、図5の例における「イタリ
ア料理」のジャンル(ジャンルID「ID9003」)
についての選択頻度が「10」であるのに、単語数が
「1」となっているが、これは「イタリア料理」なるジ
ャンルのWebページが合計10回アクセスされてはい
るが、毎回、同一の単語についてのWebページであっ
たことを示している。別言すれば、この閲覧者は、「イ
タリア料理」というジャンルについて広く関心をもって
いるのではなく、「イタリア料理」というジャンルに所
属する特定の1つの単語についてだけ関心をもっている
ものと判断することができる。
【0049】「閲覧開始頁頻度」の欄に記録される閲覧
開始頁頻度とは、当該ジャンルが、閲覧開始頁に基づい
て選択されたジャンルであった回数を示す数値である。
ここで、閲覧開始頁とは、閲覧者Rが情報閲覧装置20
0を用いて特定の情報にアクセスするために、一連の閲
覧作業を開始したときに、最初に表示された頁をいう。
具体的には、閲覧者Rが、Webブラウザソフトウエア
を起動し、何らかの情報にアクセスする意図をもって与
えた最初の指示入力によって表示されたWebページが
閲覧開始頁ということになり、図2に示す例の場合、W
ebページW1が閲覧開始頁ということになる。このよ
うな閲覧開始頁のジャンルは、閲覧者が何らかの目的を
もって最初にアクセスしたWebページのジャンルであ
るという意味で、重要な意味をもっている。そこで、本
実施形態では、情報入力手段310に、閲覧開始頁を特
定する情報を入力する機能をもたせており、個人嗜好情
報記録手段350には、選択されたジャンルについて、
当該ジャンルが選択された頁が閲覧開始頁であった回数
を示す閲覧開始頁頻度を、個人嗜好情報として記録する
機能をもたせている。図5に示すジャンルテーブルT2
の最右欄には、この閲覧開始頁頻度が記録されている。
たとえば、この例では、ジャンルID「ID1003」
で示される「哺乳類」なるジャンルのWebページは、
これまでに8回アクセスされているが(選択頻度が
「8」)、このうち6回までが閲覧開始頁として、閲覧
開始時の最初のWebページとして閲覧されていること
が認識できる。
【0050】続いて、変遷テーブルT3について、図6
を参照しながら説明する。これまでに述べた単語テーブ
ルT1およびジャンルテーブルT2は、いずれも、閲覧
対象となったWebページに関連する単語およびジャン
ルについての種々のデータを記録したテーブルである
が、変遷テーブルT3は、閲覧者Rの指示入力に基づい
て、閲覧画面210上の頁が更新されたときに、特定の
ジャンルの頁から特定のジャンルの頁へのジャンルの変
遷が生じた回数を示すために、個々のジャンル対につい
ての変遷頻度を記録したテーブルである。たとえば、図
6の変遷テーブルT3の第1行目には、変遷前のジャン
ルIDとして「ID1003(哺乳類)」、変遷後のジ
ャンルIDとして「ID9003(イタリア料理)」が
掲載されているが、これは、この変遷テーブルT3の第
1行目には、「哺乳類→イタリア料理」なるジャンル対
に関するデータ(変遷頻度と最終変遷時刻)が記録され
ていることを示している。すなわち、「変遷頻度」は、
Webページの切替によって、そのような変遷が行われ
た回数を示しており、「最終変遷時刻」は、そのような
変遷が最後に行われた時刻(「哺乳類→イタリア料理」
のような特定のジャンル対に応じた変遷のうち、最後の
変遷をもたらした指示入力があった時刻)を示してい
る。
【0051】図3に示すジャンル分類辞書D1に定義さ
れたジャンルの総数がk個であったとすると、理論的に
は、ある1つのジャンルからもう1つのジャンルへの変
遷の組合わせは、同一ジャンル同士の変遷(「哺乳類→
哺乳類」のような変遷)も含めると(k×k)通り存在
することになる。もっとも、実際には、これらの変遷す
べてが生じるわけではないので、個人嗜好情報記録手段
350は、閲覧画面210に表示されたWebページが
更新されるごとに、更新前のWebページのジャンルか
ら更新後のWebページのジャンルへのジャンルの変遷
が生じたものとして、これを変遷テーブルT3に記録す
る処理を行う。たとえば、「哺乳類」なるジャンルのW
ebページから、「イタリア料理」なるジャンルのWe
bページへと更新された場合、個人嗜好情報記録手段3
50は、まず、変遷テーブルT3を検索し、「哺乳類→
イタリア料理」なるジャンル対が既に登録されているか
どうかを調べる。既に、登録されていた場合には、この
ジャンル対についての変遷頻度を1だけ増加し、最終変
遷時刻を、今回「イタリア料理」なるジャンルのWeb
ページへと更新するために与えられた指示入力の時刻
(あるいは、「イタリア料理」なるジャンルのWebペ
ージが実際に表示された時刻)に更新すればよい。まだ
登録されていない場合には、「哺乳類→イタリア料理」
なるジャンル対を、変遷頻度を1として新たに登録する
処理を行うようにする。
【0052】このようにして記録された変遷テーブルT
3は、個々のジャンルをノード、ジャンル間の遷移をリ
ンクと考えれば、あるノードから別なノードに遷移する
リンクの重みづけを示す情報を提示することになる。別
言すれば、この閲覧者が特定のジャンルのWebページ
を閲覧しているときに、次にどのようなジャンルのWe
bページへ移行する可能性が高いかを示す情報を提示す
ることになり、閲覧者の個人的な嗜好に基づくジャンル
間の遷移傾向を知る手掛かりを与えてくれる。
【0053】§4.忘却処理 以上、個人嗜好情報記録手段350によって、単語テー
ブルT1,ジャンルテーブルT2,変遷テーブルT3を
作成・更新してゆく処理を述べたが、本発明に係る個人
嗜好情報収集装置300では、閲覧者Rが情報閲覧装置
200を用いて閲覧作業を行えば行うほど、個人嗜好情
報記録手段350によって記録される個人嗜好情報(各
テーブルT1〜T3の内容)が増えてゆくことになる。
すなわち、単語テーブルT1は、1つの単語を1レコー
ドとするテーブルであり、ジャンルテーブルT2は、1
つのジャンルを1レコードとするテーブルであり、変遷
テーブルは1組のジャンル対を1レコードとするテーブ
ルであり、いずれのテーブルのレコード数も、閲覧者R
の閲覧作業によって徐々に増加してゆくことになる。し
かしながら、このように増加し続けるレコードをすべて
保存しておくことは、必ずしも好ましいことではない。
レコード数が増えれば増えるほど、必要な記憶領域も増
えることになり、余分なハードウエア資源を必要とする
ことになる。また、テーブル内のデータを検索する時間
も余分に必要になる。
【0054】通常、個人の興味や趣向は、時代とともに
移り変わる傾向にあり、1年前に興味をもっていた事柄
について、現在では、興味が薄れてしまっている、とい
うことも少なくない。そこで、本実施形態に係る装置で
は、個人嗜好情報記録手段350に「忘却処理」と呼ぶ
処理を行わせ、各テーブルT1,T2,T3内の不要な
レコードを削除する作業を行うようにしている。レコー
ドが不要か否かの基準としては、テーブルT1,T2に
ついては最終選択時刻を参考にするようにし、テーブル
T3については最終変遷時刻を参考にするようにしてい
る。既に述べたように、テーブルT1,T2にレコード
として登録されている単語やジャンルには、最後の選択
をもたらした指示入力があった最終選択時刻が記録され
ているので、この最終選択時刻を考慮して、特定の単語
もしくはジャンルに関する個人嗜好情報(レコード)を
削除する忘却処理を行うことができる。具体的には、予
め所定の忘却許容時間(どの程度の期間にわたって、単
語やジャンルの選択が行われなかったら、当該単語やジ
ャンルを忘却処理の対象としてよいかを示す目安)を定
めておき、最終選択時刻から現在時刻に至るまでの時間
が所定の忘却許容時間を越えていた場合には、忘却処理
の対象とするようにすればよい。たとえば、忘却許容時
間を6か月に設定した場合、6か月の間、1回も選択さ
れなかった単語やジャンルについては(別言すれば、そ
のような単語やジャンルのWebページが1回も閲覧さ
れなかった場合には)、そのような単語やジャンルをテ
ーブルT1やT2から削除する処理が行われることにな
る。
【0055】同様に、テーブルT3にレコードとして登
録されているジャンル対には、最後の変遷をもたらした
指示入力が与えられた最終変遷時刻が記録されているの
で、この最終変遷時刻を考慮して、特定のジャンル対に
関する個人嗜好情報(レコード)を削除する忘却処理を
行うことができる。こちらも、所定の忘却許容時間にわ
たって、そのような変遷が生じなかったジャンル対につ
いては削除する処理が行われることになる。
【0056】なお、本実施形態では、テーブルT1,T
2に対する忘却処理を、最終選択時刻だけでなく、選択
頻度および閲覧時間の積算値を考慮して行うようにして
いる。これは、最終選択が行われた後、所定の忘却許容
時間が経過したレコードであっても、選択頻度や閲覧時
間の積算値がかなり大きいレコードについては、削除す
べきではない、との考えに基づくものである。たとえ
ば、6か月もの間、1回も選択されなかった単語やジャ
ンルであっても、6か月前まではかなりの頻度で選択さ
れ、あるいは、かなり長い積算時間にわたって閲覧され
ていた場合には、削除対象とはせず、そのまま残すよう
な処理が行なわれることになる。このような手法を採る
場合には、最終選択時刻から現在時刻に至るまでの時間
が所定の忘却許容時間を越えており、選択頻度が所定の
基準頻度未満であり、かつ、閲覧時間の積算値が所定の
基準積算値未満である場合に限り、忘却処理を行うよう
にすればよい。
【0057】§5.収集した個人嗜好情報収集の利用形
以上、述べたように、個人嗜好情報収集装置300を用
いれば、閲覧者Rが情報閲覧装置200を用いて閲覧作
業を行うと、個人嗜好情報記録手段350内には、この
閲覧作業から閲覧者Rの興味や嗜好の対象となる情報が
自動的に抽出され、記録されてゆくことになる。すなわ
ち、嗜好の対象となる単語に関する情報は、単語テーブ
ルT1に記録され、嗜好の対象となるジャンルに関する
情報は、ジャンルテーブルT2に記録され、嗜好に関連
したジャンルの変遷に関する情報は、変遷テーブルT3
に記録される。しかも、上述した忘却処理を実行するこ
とにより、これらの情報は常に鮮度が維持され、常に、
閲覧者Rの現在の嗜好に重点をおいた記録がなされるこ
とになる。本発明を導入するメリットは、このような個
人嗜好情報を収集するのに、閲覧者R自身には、何ら負
担をかけずにすむという点にある。閲覧者Rが、これま
でどおりWebブラウザを用いてWebページを閲覧す
る作業を行うだけで、個人嗜好情報記録手段350内に
は、個人嗜好情報が自動的に収集されてゆくことにな
る。
【0058】このようにして収集された個人嗜好情報
は、個人の嗜好分析を行う上で役立つ有益な情報であ
り、本発明に係る閲覧者の個人嗜好情報収集装置は、産
業上利用可能な有益な装置である。たとえば、図7に、
収集された個人嗜好情報に基づいて作成された分析用情
報の一例を示す。ここに示す分析用情報は、いずれも何
らかのリストの形で提示することができる(リストの代
わりに、何らかのグラフの形で提示することもでき
る)。第1のリストは、選択頻度順に並べたジャンルリ
ストであり、図5に示すようなジャンルテーブルT2に
おける選択頻度欄の数値を降順にソートすることにより
得られる。このリストにより、当該閲覧者が、どのよう
なジャンルに所属するWebページをアクセスする頻度
が高いのかを認識することができる。第2のリストは、
閲覧時間積算値順に並べたジャンルリストであり、図5
に示すようなジャンルテーブルT2における閲覧時間積
算値欄の数値を降順にソートすることにより得られる。
このリストにより、当該閲覧者が、どのようなジャンル
に所属するWebページを時間をかけて閲覧しているの
かを認識することができる。
【0059】第3のリストは、選択頻度順に並べた単語
リストであり、図4に示すような単語テーブルT1にお
ける選択頻度欄の数値を降順にソートすることにより得
られる。このリストにより、当該閲覧者が、どのような
単語に関連したWebページをアクセスする頻度が高い
のかを認識することができる。第4のリストは、閲覧時
間積算値順に並べた単語リストであり、図4に示すよう
な単語テーブルT1における閲覧時間積算値欄の数値を
降順にソートすることにより得られる。このリストによ
り、当該閲覧者が、どのような単語に関連したWebペ
ージを時間をかけて閲覧しているのかを認識することが
できる。
【0060】第5のリストは、閲覧開始頁頻度順に並べ
たジャンルリストであり、図5に示すようなジャンルテ
ーブルT2における閲覧開始頁頻度欄の数値を降順にソ
ートすることにより得られる。このリストにより、当該
閲覧者が、どのようなジャンルに所属するWebページ
から閲覧を開始する傾向にあるのかを認識することがで
きる。第6のリストは、変遷頻度順に並べたジャンル対
リストであり、図6に示すような変遷テーブルT3にお
ける変遷頻度欄の数値を降順にソートすることにより得
られる。このリストにより、当該閲覧者が、どのような
ジャンルからどのようなジャンルに変遷するようなWe
bページの切替を行う傾向にあるのかを認識することが
でき、たとえば、ある特定のジャンルからある特定のジ
ャンルへと移る確率を求めることも可能になる。
【0061】§6.個人嗜好情報収集装置の動作手順 ここでは、これまで述べてきた個人嗜好情報収集装置3
00の動作の大まかな流れを、図8の流れ図を参照しな
がら簡単に説明する。まず、ステップS1において、閲
覧者からの指示入力(たとえば、閲覧画面210上の特
定箇所に対するクリック操作)が検出されると、ステッ
プS2において、当該指示入力が、新たなWebページ
を表示させるための指示入力であるのか、あるいは、閲
覧作業を終了するための指示入力であるのかが判断され
る。前者の場合には、ステップS3へと進み、情報入力
手段310による情報入力が行われる。すなわち、情報
閲覧装置200から情報入力手段310に対して、当該
指示入力の時刻を示す時刻情報、当該指示入力によって
表示された新たなWebページの内容を示す頁内容情
報、そしてこのWebページが、閲覧開始頁であるか否
かを示す閲覧開始頁情報、が与えられることになる。
【0062】続いて、ステップS4において、この新た
なWebページの内容を示すn個の単語が選択される。
すなわち、単語・ジャンル選択手段320によって、頁
内容情報を構成するテキストデータの構文解析が行わ
れ、このWebページの内容を示す代表的なキーワード
として相応しいn個の単語が選択されることになる。後
続するステップS5〜S8は、このn個の単語の1つ1
つについて実行されるステップである。まず、ステップ
S5において、パラメータi=1に設定され、第1番目
の単語についての処理が実行される。ステップS6で
は、第i番目の単語に着目し、この着目単語のジャンル
が選択され、続く、ステップS7において、第i番目の
単語とそのジャンルについて、各テーブルに対する必要
な更新もしくは新規登録が行われる。このような処理
が、ステップS8およびS9を介して、i=nになるま
で(ステップS4で選択された全n個の単語について完
了するまで)、繰り返し実行されることになる。
【0063】たとえば、ステップS4において、あるW
ebページの内容を示す単語として、「ラーメン」,
「牛」,「餃子」なる3つの単語が選択されたとしよう
(すなわち、n=3)。この場合、まず、パラメータi
=1として、「ラーメン」なる単語についての処理が実
行される。具体的には、ステップS6で「中華料理」な
るジャンルが選択され、ステップS7では、「ラーメ
ン」なる単語と「中華料理」なるジャンルについて、テ
ーブルの更新もしくは新規登録が行われる。次に、パラ
メータi=2として、「牛」なる単語についての処理が
実行される。具体的には、ステップS6で「哺乳類」な
るジャンルが選択され、ステップS7では、「牛」なる
単語と「哺乳類」なるジャンルについて、テーブルの更
新もしくは新規登録が行われる。更に、パラメータi=
3として、「餃子」なる単語についての処理が実行され
る。具体的には、ステップS6で「中華料理」なるジャ
ンルが選択され、ステップS7では、「餃子」なる単語
と「中華料理」なるジャンルについて、テーブルの更新
もしくは新規登録が行われる。結局、このWebページ
をアクセスしたことにより、「ラーメン」,「牛」,
「餃子」なる3つの単語については、その選択頻度が1
ずつ増加することになり、「哺乳類」なるジャンルの選
択頻度は1だけ増加し、「中華料理」なるジャンルの選
択頻度は2だけ増加することになる。また、1つ前のW
ebページのジャンルが、たとえば、「ゴルフ」および
「爬虫類」なる2つのジャンルであったとすると、変遷
テーブルT3には、「ゴルフ→中華料理」,「ゴルフ→
哺乳類」,「爬虫類→中華料理」,「爬虫類→哺乳類」
なる4通りの変遷についての記録が行われることにな
る。
【0064】以上の処理が終了したら、ステップS8か
らステップS1へと戻り、新たな指示入力が検出される
まで待機することになる。このようにして、新たな指示
入力が与えられるたびに、ステップS3以降の処理が再
び実行されることになる。なお、ステップS7における
更新処理のうち、閲覧時間積算値については、次の指示
入力が与えられるまでは確定しないので、実際には、1
つ前のWebページに関する閲覧時間積算値の更新処理
を、現在閲覧中のWebページに関する処理手順におい
て行うことになる。
【0065】この実施形態では、閲覧者が閲覧終了の指
示入力を行うと、ステップS2からステップS10へと
進み、ここで§4で述べた忘却処理を行うようにしてい
る。すなわち、各テーブルT1,T2,T3の個々のレ
コードについて、最終選択時刻もしくは最終変遷時刻を
参照して現在時刻との差を求め、この差が忘却許容時間
を越えており、その他の忘却条件を満たしているものに
ついては、レコードを削除する処理が行われる。もちろ
ん、忘却処理は、この例のように必ずしも閲覧終了時に
行う必要はなく、どの時点で忘却処理を実行するかは、
設計上適宜決められる事項である。
【0066】§7.本発明に係る情報閲覧支援装置の基
本構成 さて、前述した§5では、本発明に係る個人嗜好情報収
集装置300によって収集された個人嗜好情報の利用形
態をいくつか述べたが、ここでは、この個人嗜好情報を
利用して情報閲覧支援装置を構成する実施形態を述べ
る。図9は、このような情報閲覧支援装置400の基本
構成を示すブロック図である。図9のブロック図を図1
のブロック図と比較すればわかるとおり、図9に示す情
報閲覧支援装置400は、図1に示す個人嗜好情報収集
装置300の構成要素をすべて含んだ装置である。別言
すれば、図1に示す個人嗜好情報収集装置300に、更
に、表示制御装置410および検索制御装置420を付
加したものが、情報閲覧支援装置400となっている。
これは、情報閲覧支援装置400が、個人嗜好情報収集
装置300によって収集された個人嗜好情報(個人嗜好
情報記録手段350内の各テーブルT1,T2,T3に
格納された情報)を利用して、情報閲覧装置200によ
る閲覧作業がより円滑になるように支援する機能を備え
た装置であるためである。
【0067】実際、表示制御装置410および検索制御
装置420は、いずれもソフトウエアプログラムとして
提供される構成要素であり、実用上は、情報閲覧装置2
00を構成するパソコンなどのインターネット端末装置
のWebブラウザソフトウエアに対する付加プログラム
(たとえば、プラグイン形式)として提供される構成要
素である。表示制御装置410および検索制御装置42
0は、いずれも情報閲覧装置200による閲覧作業を支
援するための構成要素であり、以下、この支援機能につ
いて順に説明する。
【0068】まず、表示制御装置410は、個人嗜好情
報記録手段350内に記録されている個人嗜好情報に基
づいて、情報閲覧装置200の閲覧画面210上に表示
される文字列のうち、閲覧者の嗜好に合致すると判断さ
れる単語を判別し、当該単語が異なる表示態様で表示さ
れるように制御する機能を有している。たとえば、個人
嗜好情報記録手段350内の単語テーブルT1におい
て、ある特定の単語についての選択頻度や閲覧時間積算
値が所定のしきい値以上であった場合には、情報閲覧装
置200の閲覧画面210上に表示される文字列のうち
の当該特定の単語を、閲覧者の嗜好に合致する単語とし
て、特別な色で表示させるような制御を行うことができ
る。あるいは、個人嗜好情報記録手段350内のジャン
ルテーブルT2において、ある特定のジャンルについて
の選択頻度や閲覧時間積算値が所定のしきい値以上であ
った場合には、情報閲覧装置200の閲覧画面210上
に表示される文字列のうちの当該特定のジャンルに所属
する単語を、閲覧者の嗜好に合致する単語として、特別
な色で表示させるような制御を行うことも可能である。
【0069】このような表示制御を行えば、閲覧者が情
報閲覧装置200を用いて任意のWebページを閲覧す
ると、自分の嗜好に合致した単語が特別色で表示される
ので、自分の嗜好に合致した単語に即座に目を移すこと
ができ、これを見落とすことがなくなる。もちろん、選
択頻度や閲覧時間積算値の値に応じて、表示する特別色
の色を変えるようにしてもかまわない。たとえば、選択
頻度や閲覧時間積算値の値が第1のしきい値以上の単語
については黄色で表示し、より大きな第2のしきい値以
上の単語については赤色で表示する、というような実施
形態も可能である。また、嗜好に合致した単語は、必ず
しも色を変えて表示する必要はなく、たとえば、フォン
トを変えるとか、サイズを変えるといった方法で区別し
て提示するようにしてもかまわない。
【0070】一方、検索制御装置420は、個人嗜好情
報記録手段350内に記録されている個人嗜好情報に基
づいて、閲覧者の嗜好に合致すると判断される単語およ
びジャンルを示すキーワード集合を作成し、このキーワ
ード集合を情報閲覧装置200に与えて、この情報閲覧
装置200にこのキーワード集合に関連した頁を自動的
に検索させ、その結果を閲覧者に提示させる制御を行う
機能を有している。一般に、所定のキーワード集合を用
いて、インターネット上のWebページの検索を自動的
に行うソフトウエアは、自動検索ロボットとして知られ
ており、多くのポータルサイトで利用されている。本発
明に係る個人嗜好情報収集装置300を用いれば、個々
の閲覧者についての個人嗜好情報を自動的に収集するこ
とができ、この収集した個人嗜好情報からキーワード集
合を自動的に作成することができるので(たとえば、選
択頻度や閲覧時間積算値の値が所定以上の単語あるいは
ジャンルの名前からなる文字列集合を、そのままキーワ
ード集合として用いればよい)、検索制御装置420内
に上記自動検索ロボットのエンジンを入れておくように
すれば、閲覧者が何らキーワードを入力する操作を行う
ことなしに、当該閲覧者の嗜好に合致したキーワード集
合を用いた自動検索を行うことが可能になる。
【0071】このような自動検索は、たとえば、夜間な
ど、閲覧者が閲覧を行っていない時間帯に行うと効果的
である。あるいは、閲覧者がパソコンなどで別なソフト
ウエアを実行している間に、いわゆるバックグラウンド
で自動検索を行うようにしてもよい。自動検索の結果
を、情報閲覧装置200を介して閲覧者に提示するよう
にすれば、閲覧者は、検索されたWebページを情報閲
覧装置200を用いて閲覧することができる。しかも、
この検索結果を閲覧者が閲覧する作業を行う際にも、個
人嗜好情報収集装置300を機能させて個人嗜好情報の
収集を行うようにすれば、個人嗜好情報記録手段350
内に記録される個人嗜好情報の密度を更に高めることが
できる。すなわち、個人嗜好情報収集装置300を用い
て収集された個人嗜好情報に基づいて、検索制御装置4
20による自動検索を行い、この自動検索により検索さ
れたWebページの内容を情報閲覧装置200によって
閲覧する際の閲覧作業に基づいて、更に個人嗜好情報収
集装置300による個人嗜好情報の収集処理を行うよう
にし、こうして収集された個人嗜好情報に基づいて、再
び検索制御装置420による自動検索を行い、……とい
う手順を繰り返してゆくうちに、個人嗜好情報記録手段
350内に記録される個人嗜好情報の密度は加速度的に
高まることになる。
【0072】このように、本発明に係る情報閲覧支援装
置400を用いれば、閲覧者自身がキーワード集合の入
力を行うことなしに、閲覧者の嗜好に応じた情報閲覧が
可能になる。
【0073】§8.その他の変形例 以上、本発明を図示する実施形態に基づいて説明した
が、本発明はこれらの実施形態に限定されるものではな
く、この他にも種々の態様で実施可能である。以下、い
くつかの具体的な変形例を述べておく。
【0074】(1) 上述の実施形態では、表示されてい
るWebページ内の文字列のみに着目して、単語やジャ
ンルの選択を行っていたが、画像、動画、音声などに着
目して、単語やジャンルの選択を行うことも可能であ
る。たとえば、HTML形式のWebページの場合、画
像、動画、音声などは別ファイルとして提供されること
になるので、この別ファイルのファイル名を構成する文
字列に基づいて単語やジャンルの選択を行うことも可能
である。ただ、一般的には、画像、動画、音声ファイル
などのファイル名としては、意味のある文字列が用いら
れることは少なく、シリアル番号のような意味のない文
字列が用いられることが多い。そのような場合でも、た
とえば、ファイルフォーマットを示す拡張子(たとえ
ば、GIF,JPEGなど)の部分を単語として選択す
るようにすれば、少なくとも閲覧者の嗜好対象となる画
像のフォーマットに関する情報を収集することは可能に
なる。
【0075】(2) 上述の実施形態では、個人嗜好情報
記録手段350内の各テーブルT1,T2,T3のレコ
ードは、登録順に記録されるような説明を行っている
が、実際には、より検索に容易な方法で各レコードの格
納を行うようにするのが好ましい。たとえば、図4に示
す単語テーブルの場合、単語にハッシュ関数を作用さ
せ、得られるハッシュ値に応じたアドレスの付近に格納
するようにすれば、検索の便宜を考慮した格納が可能に
なる。
【0076】(3) 上述の例では、選択された単語に対
しては、必ず何らかのジャンルが定まるという前提で説
明を行っているが、単語辞書D2には、必ずしもすべて
の単語が網羅されているわけではないので、実際には、
選択された単語のジャンルが定まらない場合もありう
る。このような場合は、当該単語についてはジャンル不
明とする取り扱いを行えばよい。
【0077】(4) 個人嗜好情報記録手段350内の各
テーブルに記録される選択頻度や閲覧時間積算値は、常
に増加し続ける。そこで、実用上は、所定のタイミング
で、これらの値を規格化する処理を行うようにするとよ
い。たとえば、選択頻度の最大値が10000に達した
ような場合、最大値を1000にするような規格化を行
うことにより、各選択頻度の値をそれぞれ1/10に切
り下げることができ、値が増加し続けるの阻止すること
が可能になる。
【0078】(5) 個人嗜好情報記録手段350内の各
テーブルに記録すべき情報としては、この他にも種々の
情報を用いることが可能である。たとえば、図5に示す
ジャンルテーブルT2には、図4に示す単語テーブルT
1に対するリンク情報を付加することも可能である。具
体的には、ジャンルテーブルT2内のジャンルID「I
D1003」なるレコードに関しては、単語テーブルT
1内の単語「ライオン」,「キリン」,…が対応する旨
のリンク情報を付加しておくと、当該ジャンルがどの単
語に対応しているのかを認識することができる。このよ
うなリンク情報は、ジャンルテーブルT2内の「単語
数」欄の数値を更新するときにも役立つ。
【0079】
【発明の効果】以上のとおり、本発明によれば、閲覧者
自身がキーワード集合の入力を行うことなしに、閲覧者
の嗜好に応じた情報閲覧を行うことができるようにする
情報閲覧支援装置が実現できるようになり、そのような
情報閲覧支援装置に利用可能な個人嗜好情報収集装置を
実現できるようになる。
【図面の簡単な説明】
【図1】本発明の一実施形態に係る閲覧者の個人嗜好情
報収集装置300の基本構成を示すブロック図である。
【図2】インターネットにおけるWebページの閲覧操
作の一般的な概念を示す図である。
【図3】図1に示す個人嗜好情報収集装置300内の分
類情報格納手段340に格納される2通りの辞書の具体
例を示す図である。
【図4】図1に示す個人嗜好情報収集装置300内の個
人嗜好情報記録手段350に格納される単語テーブルT
1の具体例を示す図である。
【図5】図1に示す個人嗜好情報収集装置300内の個
人嗜好情報記録手段350に格納されるジャンルテーブ
ルT2の具体例を示す図である。
【図6】図1に示す個人嗜好情報収集装置300内の個
人嗜好情報記録手段350に格納される変遷テーブルT
3の具体例を示す図である。
【図7】図1に示す個人嗜好情報収集装置300内の個
人嗜好情報記録手段350に格納された個人嗜好情報の
利用形態を示す図である。
【図8】図1に示す個人嗜好情報収集装置300の動作
の大まかな流れを示す流れ図である。
【図9】本発明の一実施形態に係る情報閲覧支援装置4
00の基本構成を示すブロック図である。
【符号の説明】
100…インターネット 200…情報閲覧装置 210…閲覧画面 300…個人嗜好情報収集装置 310…情報入力手段 320…単語・ジャンル選択手段 330…閲覧時間算出手段 340…分類情報格納手段 350…個人嗜好情報記録手段 400…情報閲覧支援装置 410…表示制御装置 420…検索制御装置 D1…ジャンル分類辞書 D2…単語辞書 R…閲覧者 T1…単語テーブル T2…ジャンルテーブル T3…変遷テーブル W1,W2,W3…Webページ

Claims (14)

    【特許請求の範囲】
  1. 【請求項1】 閲覧者の指示入力に基づいて当該指示入
    力に応じた新たな頁を閲覧画面上に表示させる機能をも
    った情報閲覧装置を用いて、閲覧者が所望の情報を閲覧
    する作業を行った場合に、当該閲覧者の個人的な嗜好に
    関する情報を収集するための装置であって、 単語を複数のジャンルに分類し、個々の単語がそれぞれ
    どのジャンルに所属するかを示す分類情報を格納する分
    類情報格納手段と、 前記情報閲覧装置から、閲覧者の指示入力があった時刻
    に関する時刻情報と、当該指示入力に応じて表示された
    新たな頁の内容を示す頁内容情報と、を取り込む情報入
    力手段と、 前記情報入力手段が取り込んだ頁内容情報の中から所定
    のアルゴリズムに基づいて当該頁の内容を表現する単語
    を選択するとともに、前記分類情報格納手段内の分類情
    報に基づいて当該単語が所属するジャンルを選択する単
    語・ジャンル選択手段と、 前記情報入力手段が取り込んだ時刻情報を参照して、各
    頁ごとの閲覧時間を算出する閲覧時間算出手段と、 前記単語・ジャンル選択手段によって選択された単語お
    よびジャンルについて、現在に至るまでの選択頻度、な
    らびに、当該単語およびジャンルが選択された各頁につ
    いての閲覧時間の積算値を、個人嗜好情報として記録す
    る個人嗜好情報記録手段と、 を備えることを特徴とする閲覧者の個人嗜好情報収集装
    置。
  2. 【請求項2】 請求項1に記載の情報収集装置におい
    て、 個人嗜好情報記録手段が、選択されたジャンルについ
    て、当該ジャンルの選択に用いられた単語の数を、個人
    嗜好情報として記録する機能を更に有することを特徴と
    する閲覧者の個人嗜好情報収集装置。
  3. 【請求項3】 請求項1または2に記載の情報収集装置
    において、 閲覧者が情報閲覧装置を用いて特定の情報にアクセスす
    るために、一連の閲覧作業を開始したときに、最初に表
    示された頁を閲覧開始頁と定義し、 情報入力手段に、前記閲覧開始頁を特定する入力を行う
    機能をもたせ、 個人嗜好情報記録手段に、選択されたジャンルについ
    て、当該ジャンルが選択された頁が前記閲覧開始頁であ
    った回数を示す閲覧開始頁頻度を、個人嗜好情報として
    記録する機能をもたせたことを特徴とする閲覧者の個人
    嗜好情報収集装置。
  4. 【請求項4】 請求項1〜3のいずれかに記載の情報収
    集装置において、 閲覧者の指示入力に基づいて、閲覧画面上の頁が更新さ
    れたときに、個人嗜好情報記録手段が、特定のジャンル
    の頁から特定のジャンルの頁へのジャンルの変遷が生じ
    た回数を示すために、個々のジャンル対についての変遷
    頻度を、個人嗜好情報として記録する機能を更に有する
    ことを特徴とする閲覧者の個人嗜好情報収集装置。
  5. 【請求項5】 請求項1〜3のいずれかに記載の情報収
    集装置において、 個人嗜好情報記録手段が、情報入力手段が取り込んだ時
    刻情報を参照して、個人嗜好情報として記録している個
    々の単語およびジャンルについて、最後の選択をもたら
    した指示入力があった最終選択時刻を記録し、この最終
    選択時刻を考慮して、特定の単語もしくはジャンルに関
    する個人嗜好情報を削除する忘却処理を行う機能を更に
    有することを特徴とする閲覧者の個人嗜好情報収集装
    置。
  6. 【請求項6】 請求項5に記載の情報収集装置におい
    て、 最終選択時刻から現在時刻に至るまでの時間が所定の忘
    却許容時間を越えており、選択頻度が所定の基準頻度未
    満であり、かつ、閲覧時間の積算値が所定の基準積算値
    未満である場合に、忘却処理を行うことを特徴とする閲
    覧者の個人嗜好情報収集装置。
  7. 【請求項7】 請求項4に記載の情報収集装置におい
    て、 個人嗜好情報記録手段が、情報入力手段が取り込んだ時
    刻情報を参照して、個人嗜好情報として記録している個
    々の変遷について、最後の変遷をもたらした指示入力が
    あった最終変遷時刻を記録し、この最終変遷時刻を考慮
    して、特定の変遷に関する個人嗜好情報を削除する忘却
    処理を行う機能を更に有することを特徴とする閲覧者の
    個人嗜好情報収集装置。
  8. 【請求項8】 請求項1〜7のいずれかに記載の情報収
    集装置において、 情報入力手段が、閲覧者が閲覧画面上の特定箇所をクリ
    ックもしくはダブルクリックする操作を行った時点、ま
    たは、当該操作に基づいて閲覧画面上に新たな頁が表示
    された時点、の時刻を時刻情報として取り込む機能を有
    することを特徴とする閲覧者の個人嗜好情報収集装置。
  9. 【請求項9】 請求項1〜8のいずれかに記載の情報収
    集装置において、 単語・ジャンル選択手段が、頁内容情報に含まれる当該
    頁のタイトルおよび本文を構成する文字列の中から、出
    現頻度の高い単語を所定数だけ抽出し、これを選択する
    ことを特徴とする閲覧者の個人嗜好情報収集装置。
  10. 【請求項10】 請求項1〜9のいずれかに記載の情報
    収集装置において、 情報閲読装置が、インターネット上のWebページを閲
    覧する機能をもったWebブラウザソフトウエアを組み
    込んだ情報端末装置であり、当該情報端末装置を利用し
    た閲覧者のWebページの閲覧に関する個人嗜好情報を
    収集する機能をもった閲覧者の個人嗜好情報収集装置。
  11. 【請求項11】 請求項1〜10のいずれかに記載の情
    報収集装置を利用した情報閲覧支援装置であって、前記
    情報収集装置の構成要素をすべて含み、 個人嗜好情報記録手段内に記録されている個人嗜好情報
    に基づいて、情報閲覧装置の閲覧画面上に表示される文
    字列のうち、閲覧者の嗜好に合致すると判断される単語
    を判別し、当該単語が異なる表示態様で表示されるよう
    に制御する表示制御装置を更に設けてなることを特徴と
    する情報閲覧支援装置。
  12. 【請求項12】 請求項1〜10のいずれかに記載の情
    報収集装置を利用した情報閲覧支援装置であって、前記
    情報収集装置の構成要素をすべて含み、 個人嗜好情報記録手段内に記録されている個人嗜好情報
    に基づいて、閲覧者の嗜好に合致すると判断される単語
    およびジャンルを示すキーワード集合を作成し、このキ
    ーワード集合を情報閲覧装置に与えて、この情報閲覧装
    置に前記キーワード集合に関連した頁を自動的に検索さ
    せ、その結果を閲覧者に提示させる制御を行う検索制御
    装置を更に設けてなることを特徴とする情報閲覧支援装
    置。
  13. 【請求項13】 請求項12に記載の情報閲覧支援装置
    において、 情報閲覧装置が提示した検索結果を閲覧者が閲覧する作
    業を行う際にも、個人嗜好情報収集装置を機能させて個
    人嗜好情報の収集を行うことができるようにしたことを
    特徴とする情報閲覧支援装置。
  14. 【請求項14】 請求項1〜13のいずれかに記載の情
    報収集装置または情報閲覧支援装置としてコンピュータ
    を動作させるためのプログラムを記録したコンピュータ
    読み取り可能な記録媒体。
JP2000268096A 2000-09-05 2000-09-05 閲覧者の個人嗜好情報収集装置およびこれを利用した情報閲覧支援装置 Pending JP2002073677A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000268096A JP2002073677A (ja) 2000-09-05 2000-09-05 閲覧者の個人嗜好情報収集装置およびこれを利用した情報閲覧支援装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000268096A JP2002073677A (ja) 2000-09-05 2000-09-05 閲覧者の個人嗜好情報収集装置およびこれを利用した情報閲覧支援装置

Publications (1)

Publication Number Publication Date
JP2002073677A true JP2002073677A (ja) 2002-03-12

Family

ID=18754912

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000268096A Pending JP2002073677A (ja) 2000-09-05 2000-09-05 閲覧者の個人嗜好情報収集装置およびこれを利用した情報閲覧支援装置

Country Status (1)

Country Link
JP (1) JP2002073677A (ja)

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007047903A (ja) * 2005-08-08 2007-02-22 Nippon Telegr & Teleph Corp <Ntt> 興味情報生成装置、興味情報生成方法および興味情報生成プログラム
JP2008027142A (ja) * 2006-07-20 2008-02-07 Nippon Telegr & Teleph Corp <Ntt> 興味情報生成装置、興味情報生成方法および興味情報生成プログラム
JP2008027143A (ja) * 2006-07-20 2008-02-07 Nippon Telegr & Teleph Corp <Ntt> オントロジの近似度計測装置、オントロジの近似度計測方法およびオントロジの近似度計測プログラム
JP2009237676A (ja) * 2008-03-26 2009-10-15 Softbank Mobile Corp Webページ検索プログラム及びWebページ検索システム
JP2010009546A (ja) * 2008-06-30 2010-01-14 Equos Research Co Ltd 情報処理装置及び検索装置
JP2010039781A (ja) * 2008-08-05 2010-02-18 Yahoo Japan Corp クリック履歴を用いたWeb検索における検索処理をパーソナライズする検索処理システム、検索処理装置、端末装置及び検索処理方法。
JP2011113563A (ja) * 2009-11-23 2011-06-09 Palo Alto Research Center Inc ドキュメント使用クラスタリングによるユーザタスク表現を近似するための方法
JP2011175442A (ja) * 2010-02-24 2011-09-08 Nippon Telegr & Teleph Corp <Ntt> 関心度処理装置、関心度処理方法、および、関心度処理プログラム
JP2012073797A (ja) * 2010-09-28 2012-04-12 Yahoo Japan Corp 電子端末機及び方法
JP2014032675A (ja) * 2012-08-06 2014-02-20 Lee Fisher カレンダの情報表示方法
JP2014510329A (ja) * 2011-01-29 2014-04-24 エスデーエル トリディオン デヴェロプメント ラブ ベー ヴェ WebアプリケーションとWebサービスのアンビエント適応性を管理するためのシステム、方法および媒体
JP2014522004A (ja) * 2011-03-08 2014-08-28 アリババ・グループ・ホールディング・リミテッド 決定されたプリファレンス値に基づく製品情報の送信
JP2015146133A (ja) * 2014-02-03 2015-08-13 Necパーソナルコンピュータ株式会社 情報処理装置、プログラム及び方法
JP2015215794A (ja) * 2014-05-12 2015-12-03 日本放送協会 興味キーワード抽出装置及び興味キーワード抽出プログラム
US9430449B2 (en) 2012-03-30 2016-08-30 Sdl Plc Systems, methods, and media for managing editable previews of webpages
US9596188B2 (en) 2001-01-18 2017-03-14 Sdl Inc. Globalization management system and method therefor
US9773270B2 (en) 2012-05-11 2017-09-26 Fredhopper B.V. Method and system for recommending products based on a ranking cocktail
JP6401428B1 (ja) * 2017-04-27 2018-10-10 楽天株式会社 情報処理装置、情報処理方法、プログラム、記憶媒体
US10452740B2 (en) 2012-09-14 2019-10-22 Sdl Netherlands B.V. External content libraries
US10580015B2 (en) 2011-02-25 2020-03-03 Sdl Netherlands B.V. Systems, methods, and media for executing and optimizing online marketing initiatives
US10614167B2 (en) 2015-10-30 2020-04-07 Sdl Plc Translation review workflow systems and methods
US10657540B2 (en) 2011-01-29 2020-05-19 Sdl Netherlands B.V. Systems, methods, and media for web content management
US11308528B2 (en) 2012-09-14 2022-04-19 Sdl Netherlands B.V. Blueprinting of multimedia assets
US11386186B2 (en) 2012-09-14 2022-07-12 Sdl Netherlands B.V. External content library connector systems and methods

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09153063A (ja) * 1995-11-30 1997-06-10 Toshiba Corp 情報フィルタリング装置
JPH10228482A (ja) * 1997-02-14 1998-08-25 Nippon Telegr & Teleph Corp <Ntt> 嗜好推定方法、情報抽出方法および情報提供方法
JPH10247198A (ja) * 1997-03-05 1998-09-14 Nippon Telegr & Teleph Corp <Ntt> 嗜好分類方法および装置
JPH117453A (ja) * 1997-04-22 1999-01-12 Mitsubishi Electric Corp メディア情報推薦装置
JP2000035934A (ja) * 1998-07-17 2000-02-02 Nec Corp 自動ダウンロード装置
JP2000172710A (ja) * 1998-12-10 2000-06-23 Matsushita Electric Ind Co Ltd 情報取得装置及び情報取得プログラムを記録した記録媒体

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09153063A (ja) * 1995-11-30 1997-06-10 Toshiba Corp 情報フィルタリング装置
JPH10228482A (ja) * 1997-02-14 1998-08-25 Nippon Telegr & Teleph Corp <Ntt> 嗜好推定方法、情報抽出方法および情報提供方法
JPH10247198A (ja) * 1997-03-05 1998-09-14 Nippon Telegr & Teleph Corp <Ntt> 嗜好分類方法および装置
JPH117453A (ja) * 1997-04-22 1999-01-12 Mitsubishi Electric Corp メディア情報推薦装置
JP2000035934A (ja) * 1998-07-17 2000-02-02 Nec Corp 自動ダウンロード装置
JP2000172710A (ja) * 1998-12-10 2000-06-23 Matsushita Electric Ind Co Ltd 情報取得装置及び情報取得プログラムを記録した記録媒体

Cited By (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9954794B2 (en) 2001-01-18 2018-04-24 Sdl Inc. Globalization management system and method therefor
US9781050B2 (en) 2001-01-18 2017-10-03 Sdl Inc. Globalization management system and method therefor
US9596188B2 (en) 2001-01-18 2017-03-14 Sdl Inc. Globalization management system and method therefor
JP4728063B2 (ja) * 2005-08-08 2011-07-20 日本電信電話株式会社 興味情報生成装置、興味情報生成方法および興味情報生成プログラム
JP2007047903A (ja) * 2005-08-08 2007-02-22 Nippon Telegr & Teleph Corp <Ntt> 興味情報生成装置、興味情報生成方法および興味情報生成プログラム
JP4607830B2 (ja) * 2006-07-20 2011-01-05 日本電信電話株式会社 興味情報生成装置、興味情報生成方法および興味情報生成プログラム
JP2008027142A (ja) * 2006-07-20 2008-02-07 Nippon Telegr & Teleph Corp <Ntt> 興味情報生成装置、興味情報生成方法および興味情報生成プログラム
JP4607831B2 (ja) * 2006-07-20 2011-01-05 日本電信電話株式会社 オントロジの近似度計測装置、オントロジの近似度計測方法およびオントロジの近似度計測プログラム
JP2008027143A (ja) * 2006-07-20 2008-02-07 Nippon Telegr & Teleph Corp <Ntt> オントロジの近似度計測装置、オントロジの近似度計測方法およびオントロジの近似度計測プログラム
JP2009237676A (ja) * 2008-03-26 2009-10-15 Softbank Mobile Corp Webページ検索プログラム及びWebページ検索システム
JP2010009546A (ja) * 2008-06-30 2010-01-14 Equos Research Co Ltd 情報処理装置及び検索装置
JP2010039781A (ja) * 2008-08-05 2010-02-18 Yahoo Japan Corp クリック履歴を用いたWeb検索における検索処理をパーソナライズする検索処理システム、検索処理装置、端末装置及び検索処理方法。
JP2011113563A (ja) * 2009-11-23 2011-06-09 Palo Alto Research Center Inc ドキュメント使用クラスタリングによるユーザタスク表現を近似するための方法
JP2011175442A (ja) * 2010-02-24 2011-09-08 Nippon Telegr & Teleph Corp <Ntt> 関心度処理装置、関心度処理方法、および、関心度処理プログラム
JP2012073797A (ja) * 2010-09-28 2012-04-12 Yahoo Japan Corp 電子端末機及び方法
US12026727B2 (en) 2011-01-29 2024-07-02 Sdl Netherlands B.V. Systems and methods for managing and modifying web content
US11301874B2 (en) 2011-01-29 2022-04-12 Sdl Netherlands B.V. Systems and methods for managing web content and facilitating data exchange
US9547626B2 (en) 2011-01-29 2017-01-17 Sdl Plc Systems, methods, and media for managing ambient adaptability of web applications and web services
JP2014510329A (ja) * 2011-01-29 2014-04-24 エスデーエル トリディオン デヴェロプメント ラブ ベー ヴェ WebアプリケーションとWebサービスのアンビエント適応性を管理するためのシステム、方法および媒体
US11694215B2 (en) 2011-01-29 2023-07-04 Sdl Netherlands B.V. Systems and methods for managing web content
US10061749B2 (en) 2011-01-29 2018-08-28 Sdl Netherlands B.V. Systems and methods for contextual vocabularies and customer segmentation
US11044949B2 (en) 2011-01-29 2021-06-29 Sdl Netherlands B.V. Systems and methods for dynamic delivery of web content
US10990644B2 (en) 2011-01-29 2021-04-27 Sdl Netherlands B.V. Systems and methods for contextual vocabularies and customer segmentation
US10657540B2 (en) 2011-01-29 2020-05-19 Sdl Netherlands B.V. Systems, methods, and media for web content management
US10521492B2 (en) 2011-01-29 2019-12-31 Sdl Netherlands B.V. Systems and methods that utilize contextual vocabularies and customer segmentation to deliver web content
US10580015B2 (en) 2011-02-25 2020-03-03 Sdl Netherlands B.V. Systems, methods, and media for executing and optimizing online marketing initiatives
JP2014522004A (ja) * 2011-03-08 2014-08-28 アリババ・グループ・ホールディング・リミテッド 決定されたプリファレンス値に基づく製品情報の送信
US9430449B2 (en) 2012-03-30 2016-08-30 Sdl Plc Systems, methods, and media for managing editable previews of webpages
US9773270B2 (en) 2012-05-11 2017-09-26 Fredhopper B.V. Method and system for recommending products based on a ranking cocktail
US10572928B2 (en) 2012-05-11 2020-02-25 Fredhopper B.V. Method and system for recommending products based on a ranking cocktail
JP2014032675A (ja) * 2012-08-06 2014-02-20 Lee Fisher カレンダの情報表示方法
US10452740B2 (en) 2012-09-14 2019-10-22 Sdl Netherlands B.V. External content libraries
US11308528B2 (en) 2012-09-14 2022-04-19 Sdl Netherlands B.V. Blueprinting of multimedia assets
US11386186B2 (en) 2012-09-14 2022-07-12 Sdl Netherlands B.V. External content library connector systems and methods
JP2015146133A (ja) * 2014-02-03 2015-08-13 Necパーソナルコンピュータ株式会社 情報処理装置、プログラム及び方法
JP2015215794A (ja) * 2014-05-12 2015-12-03 日本放送協会 興味キーワード抽出装置及び興味キーワード抽出プログラム
US10614167B2 (en) 2015-10-30 2020-04-07 Sdl Plc Translation review workflow systems and methods
US11080493B2 (en) 2015-10-30 2021-08-03 Sdl Limited Translation review workflow systems and methods
WO2018198268A1 (ja) * 2017-04-27 2018-11-01 楽天株式会社 情報処理装置、情報処理方法、プログラム、記憶媒体
JP6401428B1 (ja) * 2017-04-27 2018-10-10 楽天株式会社 情報処理装置、情報処理方法、プログラム、記憶媒体

Similar Documents

Publication Publication Date Title
JP2002073677A (ja) 閲覧者の個人嗜好情報収集装置およびこれを利用した情報閲覧支援装置
JP6376569B2 (ja) 検索方法及び検索システム
KR101242369B1 (ko) 사용자 액티비티, 주의, 관심 측정을 활용하는 데이터감지, 저장, 인덱싱, 및 탐색
US9846744B2 (en) Media discovery and playlist generation
KR101659097B1 (ko) 복수의 저장된 디지털 이미지들을 탐색하기 위한 방법 및 장치
US8838567B1 (en) Customization of search results for search queries received from third party sites
US9026543B2 (en) System and method for generating a relationship network
KR101319628B1 (ko) 정보 검색 시스템에 사용하도록 문서들의 인덱스를 형성하는 방법 및 장치, 및 컴퓨터 프로그램
US20080005105A1 (en) Visual and multi-dimensional search
US20080005091A1 (en) Visual and multi-dimensional search
US20070006067A1 (en) Electronic apparatus with a Web page browsing function
US20120197890A1 (en) Discovering and scoring relationships extracted from human generated lists
US20070088690A1 (en) System and method for performing file searches and ranking results
US8161056B2 (en) Database constructing apparatus and method
JP2010055618A (ja) トピックを基にした検索を提供する方法及びシステム
US7693898B2 (en) Information registry
US20050114317A1 (en) Ordering of web search results
JP2009026249A (ja) 閲覧履歴編集端末及びプログラムおよびその方法
JPH11282875A (ja) 情報フィルタリング装置
JP4719921B2 (ja) データ表示装置およびデータ表示プログラム
JP2000231570A (ja) インターネット情報処理装置、インターネット情報処理方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
Cheng et al. Context-based page unit recommendation for web-based sensemaking tasks
Jatowt et al. Change summarization in web collections
KR100720993B1 (ko) 날짜 검색어를 이용한 인터넷 검색 방법
JP2005122683A (ja) 情報提供方法及びシステム及び情報提供プログラム