JP2009140173A - Webサイトを推奨するサーバ装置、Webサイトの推奨方法、及びWebサイト推奨プログラム - Google Patents

Webサイトを推奨するサーバ装置、Webサイトの推奨方法、及びWebサイト推奨プログラム Download PDF

Info

Publication number
JP2009140173A
JP2009140173A JP2007314978A JP2007314978A JP2009140173A JP 2009140173 A JP2009140173 A JP 2009140173A JP 2007314978 A JP2007314978 A JP 2007314978A JP 2007314978 A JP2007314978 A JP 2007314978A JP 2009140173 A JP2009140173 A JP 2009140173A
Authority
JP
Japan
Prior art keywords
website
user
importance
correlation
communication terminal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007314978A
Other languages
English (en)
Inventor
Takeshi Yoshimura
健 吉村
Jun Sasaki
純 佐々木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2007314978A priority Critical patent/JP2009140173A/ja
Publication of JP2009140173A publication Critical patent/JP2009140173A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】利用者自らがWebサイトに対する嗜好の推奨情報への反映度合いを制御することによって、利用者毎に柔軟にWebサイトを推奨することを可能とするサーバ装置、及びWebサイトの推奨方法を提供する。
【解決手段】サーバ装置10は、特定の通信端末のWebサイトの閲覧傾向データと、複数のWebサイトの相関関係と、利用者が送信する嗜好の反映度に関するパラメータとに基づいてWebサイトの重要度が重要度算出手段104によって算出される。そして、算出された重要度に基づいていて、推奨情報が生成され、移動通信端末3aに送信される。これにより、利用者が送信するパラメータによって利用者の閲覧傾向の推奨されるWebサイトの重要度に対する反映度を制御することが可能になり、利用者の嗜好に合わせたWebサイトを推奨することができる。
【選択図】 図1

Description

本発明は、利用者の嗜好に基づいてWebサイトを推奨するサーバ装置、Webサイトの推奨方法、及びWebサイト推奨プログラムに関する。
近年、携帯電話の普及に伴い携帯電話からインターネットへのアクセスが普及すると共に、インターネット上に多くのWebサイトが設置されている。インターネットの利用者は、この多くのWebサイトの中から、検索サイト等を用いて目的のWebサイトへアクセスしている。
ここで、上記検索サイトでは、利用者が検索語を入力し、検索語に一致するWebサイトが複数表示される。表示されるWebサイトの重要度は、例えば特許文献1に記載されているように、P=limAといった式で決定される。そして、決定された重要度と、検索語との一致度合いから各ページのスコア値が算出され、スコア値が高いページから検索結果として表示される。
また、特許文献2では、利用者のアクセスログに基づいて、推奨するWebサイトを決定する方法が開示されている。この方法では、アクセスログに基づいてWebサイト間の相関関係を求めており、例えばサイトi及びサイトjの両方にアクセスする利用者が多い場合には相関関係が高いとしている。そして、推奨対象者の閲覧したWebサイトを特定し、そのWebサイトと相関の高いWebサイトを推奨している。また、特許文献3には、ユーザの過去のコンテンツのダウンロード履歴に基づいて、ユーザに推薦すべきコンテンツアドレスリストを出力するサーバが開示されている。
米国特許公報第6285999号 特開2006−53616号公報 特開2003−141154号公報
しかしながら、上述した特許文献1,2,3に記載されたWebサイトの推奨方法は、サーバ装置によって一方的に推奨Webサイトが決定されるため、例えば利用者が閲覧したWebサイトに関する情報を推奨結果に反映させたくない場合であっても、画一的にサーバ装置によって相関が高いと判断されてしまう場合がある。そのため、利用者が柔軟にWebサイトの重要度を制御できないといった問題があった。
そこで、本発明は、かかる課題に鑑みて為されたものであり、利用者自らがWebサイトに対する嗜好の推奨情報への反映度合いを制御することによって、利用者毎に柔軟にWebサイトを推奨することを可能とするサーバ装置、Webサイトの推奨方法、及びWebサイト推奨プログラムを提供することを目的とする。
上記課題を解決するため、本発明のサーバ装置は、通信網を介して複数の通信端末の利用者の嗜好に応じたWebサイトを推奨するサーバ装置であって、複数の通信端末のうちの特定の通信端末がWebサイトにアクセスした履歴データに基づいて、特定の通信端末の利用者のWebサイトの閲覧傾向を求める特徴抽出手段と、複数の通信端末が複数のWebサイトにアクセスした履歴データに基づいて、複数の通信端末がアクセスした複数のWebサイト間の相関関係を抽出する相関関係抽出手段と、利用者の通信端末から、利用者の嗜好の反映度に関するパラメータを取得するパラメータ取得手段と、Webサイトの閲覧傾向、複数のWebサイト間の相関関係、及びパラメータに基づいて、Webサイトの重要度を算出する重要度算出手段と、重要度算出手段によって算出されたWebサイトの重要度に基づいて、Webサイトの推奨情報を生成する推奨情報生成手段と、推奨情報生成手段によって生成された推奨情報を通信端末へ送信する送信手段と、を備えることを特徴とする。
或いは、本発明のWebサイトの推奨方法は、通信網を介して複数の通信端末の利用者の嗜好に応じたWebサイトを推奨する推奨方法であって、サーバ装置が、複数の通信端末のうち特定の通信端末によるWebサイトへのアクセス履歴データに基づいて、特定の通信端末の利用者のWebサイトの閲覧傾向を求める特徴抽出ステップと、サーバ装置が、複数の通信端末による複数のWebサイトへのアクセス履歴データに基づいて、複数の通信端末がアクセスした複数のWebサイト間の相関関係を抽出する相関関係抽出ステップと、サーバ装置が、利用者の通信端末から、利用者の嗜好の反映度に関するパラメータを取得するパラメータ取得ステップと、サーバ装置が、利用者が閲覧したWebサイトの閲覧傾向、複数のWebサイト間の相関関係、及び利用者のパラメータに基づいて、Webサイトの重要度を算出する重要度算出ステップと、サーバ装置が、重要度算出手段によって算出されたWebサイトの重要度に基づいて、Webサイトの推奨情報を生成する推奨情報生成ステップと、サーバ装置が、推奨情報生成手段によって生成された推奨情報を通信端末へ送信する送信ステップと、を備えることを特徴とする。
或いは、本発明のWebサイト推奨プログラムは、通信網を介して複数の通信端末の利用者の嗜好に応じたWebサイトを推奨するWebサイト推奨プログラムであって、コンピュータを、複数の通信端末のうちの特定の通信端末がWebサイトにアクセスした履歴データに基づいて、特定の通信端末の利用者のWebサイトの閲覧傾向を求める特徴抽出手段、複数の通信端末が複数のWebサイトにアクセスした履歴データに基づいて、複数の通信端末がアクセスした複数のWebサイト間の相関関係を抽出する相関関係抽出手段、利用者の通信端末から、利用者の嗜好の反映度に関するパラメータを取得するパラメータ取得手段、Webサイトの閲覧傾向、複数のWebサイト間の相関関係、及びパラメータに基づいて、Webサイトの重要度を算出する重要度算出手段、重要度算出手段によって算出されたWebサイトの重要度に基づいて、Webサイトの推奨情報を生成する推奨情報生成手段、推奨情報生成手段によって生成された推奨情報を通信端末へ送信する送信手段、として機能させることを特徴とする。
このようなサーバ装置、Webサイトの推奨方法、及びWebサイト推奨プログラムによれば、特定の通信端末のWebサイトの閲覧傾向と、複数のWebサイトの相関関係と、利用者が送信する嗜好の反映度に関するパラメータとに基づいてWebサイトの重要度が重要度算出手段によって算出される。そして、算出された重要度に基づいていて、推奨情報が生成され、通信端末に送信される。これにより、利用者が送信するパラメータによって利用者の閲覧傾向の推奨されるWebサイトの重要度に対する反映度を制御することが可能になり、利用者の嗜好に合わせたWebサイトを推奨することができる。
また、特徴抽出手段は、利用者が閲覧するWebサイトの閲覧傾向をN次元のベクトルpとして算出し、相関関係抽出手段は、複数のWebサイト間の相関関係をN×Nの行列Cとして算出し、パラメータ取得手段は、パラメータを変数kとして取得し、重要度算出手段は、下記式(1);
I=Cp …(1)
によってWebサイトの重要度Iを算出することが好ましい。このような構成にすれば、閲覧傾向を示すベクトルp、Webサイト間の相関関係を示す行列C、及びパラメータkに基づいて重要度Iを算出し、パラメータkが小さいほど利用者の特徴pと相関の高いWebサイトの重要度を高くすることにより、利用者の嗜好に合わせたWebサイトを推奨することができる。
また、相関関係抽出手段は、特定の通信端末の利用者の属性情報、時刻情報、及び利用者の所在位置の少なくとも1つの環境情報に基づいて、複数のWebサイトの相関関係を抽出し、重要度算出手段は、特定の通信端末の利用者の環境情報に応じた複数のWebサイトの相関関係を算出し、算出した複数のWebサイトの相関関係、Webサイトの閲覧傾向、及びパラメータに基づいて、Webサイトの重要度を算出することが好ましい。このような構成にすれば、例えば利用者の年齢・性別等の属性情報を含む環境情報に応じてWebサイトの重要度を算出するこができ、利用者の嗜好に応じたWebサイトを好適に推奨するこができる。
また、特徴抽出手段は、時刻情報、及び利用者の所在位置の少なくとも1つの環境情報に基づいて、Webサイトの閲覧傾向を求め、重要度算出手段は、特定の通信端末の利用者の環境情報に応じたWebサイトの閲覧傾向を算出し、算出したWebサイトの閲覧傾向、複数のWebサイトの相関関係、及びパラメータに基づいて、Webサイトの重要度を算出することが好ましい。このような構成にすれば、環境情報に応じてWebサイトの重要度を算出することができ、利用者の嗜好に応じたWebサイトを好適に推奨するこができる。
また、利用者がWebサイトの検索に用いた検索語と、Webサイトとの一致度合いを算出する一致度算出手段と、重要度算出手段によって算出されたWebサイトの重要度と、一致度算出手段によって算出された一致度合いとに基づいていて、検索結果情報を生成する検索結果情報生成手段と、検索結果情報生成手段によって生成された検索結果情報を送信する送信手段と、を更に備えることが好ましい。このような構成にすれば、Webサイトの重要度と検索語との一致度合いによって検索結果を生成することができるので、検索結果に対する嗜好の反映度合いを制御することにより、利用者の嗜好に合わせたWebサイトを推奨することができる。
本発明によれば、利用者自らがWebサイトに対する嗜好の推奨情報への反映度合いを制御することによって、利用者毎に柔軟にWebサイトを推奨することを可能とする。
以下、図面と共に本発明によるWebサイトを推奨するサーバ装置の好適な実施形態について詳細に説明する。なお、図面の説明においては同一要素には同一符号を付し、重複する説明を省略する。
(第1の実施形態)
図1は、本発明の第1の実施形態に係るサーバ装置10を含むWebサイトを推奨するWebサイト推奨システム1の構成を示すブロック図である。本実施形態に係るWebサイト推奨システム1は、サーバ装置10及びアクセスログ収集装置2が移動通信体網を含む通信回線NWを介して移動通信端末3a〜3cとデータ通信が可能なように接続されており、移動通信端末3a〜3cの利用者の嗜好に応じて、推奨するWebサイトを提供するシステムである。また、サーバ装置10とアクセスログ収集装置2とは、例えばLAN等の通信回線によって互いにデータ通信可能に接続されている。
移動通信端末3a〜3cは、携帯電話機などのデータ通信機能を有する端末である。移動通信端末3a〜3cは、移動通信端末3a〜3cのユーザに対して、様々な情報を提示する機能を備えており、その1つの機能として、サーバ装置10から配信される情報を受信して、この情報をディスプレイ等の表示部に表示させる機能を備える。
アクセスログ収集装置2は、移動通信端末3a〜3cがネットワークNWを介してWebサイト等にアクセスした際に、例えばURL情報等のアクセス先情報を収集し格納する装置である。図2に、アクセルログの格納形態の一例を示す。図2に示すように、アクセスログは、ユーザIDとURLとで構成されている。例えば、ユーザID「0001」の利用者がWebサイトにアクセスすると、WebサイトのURL「http://www.aabb.co.jp」がIDと関連付けられて格納される。アクセスログは、プロキシサーバとして動作するアクセスログ収集装置2、或いはアクセルログは、ブラウザのツールバー等がアクセス先をアクセスログ収集装置2に通知することによって収集される。アクセスログ収集装置2は、移動通信端末3a〜3cのアクセス先情報を随時サーバ装置10に送信する。
サーバ装置10は、特徴抽出部(特徴抽出手段)101と、相関関係抽出部(相関関係抽出手段)102と、パラメータ取得部(パラメータ取得手段)103と、重要度算出部(重要度算出手段)104と、推奨情報生成部(推奨情報生成手段)105と、送信部(送信手段)106とを有するサーバ装置である。図3は、サーバ装置10のハードウェア構成図である。サーバ装置1は、物理的には、図3に示すように、CPU11、主記憶装置であるRAM12及びROM13、ハードディスク装置等の補助記憶装置14、入力デバイスであるキーボード、マウス等の入力装置15、ディスプレイ等の出力装置16、通信モジュール17等を含む装置として構成されている。図1において示した各機能は、図3に示すCPU11、RAM12等のハードウェア上に所定のソフトウェアを読み込ませることにより、CPU11の制御のもとで通信モジュール17、入力装置15、出力装置16と動作させるとともに、RAM12や補助記憶装置14におけるデータの読み出し及び読み込みを行うことで実現される。なお、サーバ装置10は、1台のサーバ装置により構成されてもよいし、複数のサーバ装置により構成されてもよい。
特徴抽出部101は、移動通信端末3a〜3dの利用者がWebサイトにアクセスした履歴であるアクセスログ収集装置2のアクセスログ(図2参照)に基づいて、利用者毎のWebサイトの閲覧傾向データを求める。例えば、特徴抽出部101は、ユーザID毎に、各Webサイトのアクセス回数をカウントし、Webサイト数をN次元のベクトルとして算出して格納する。図4に、特徴抽出部101におけるWebサイトの閲覧傾向データ算出の一例を示す。同図に示すように、特徴抽出部101は、例えばユーザID0001の利用者が各Webサイト(サイトA〜サイトG)にアクセスした回数カウントし、カウントされた各サイトの回数を7次元のベクトル{3,5,4,1,5,0,2}として表現する。そして、特徴抽出部101は、予め算出した閲覧傾向データのN次元のベクトルpを重要度算出部104に出力する。なお、ここでいうWebサイトとは、各URLに対応するWebページであっても良いし、例えば、“www.aabb.co.jp”等のドメインにある全URLを1つのサイトとして集約した単位であっても良い。
相関関係抽出部102は、複数の通信端末が複数のWebサイトにアクセスした履歴であるアクセスログ収集装置2のアクセスログに基づいて、複数の通信端末がアクセスした複数のWebサイト間の相関関係を抽出する。例えば、相関関係抽出部102は、利用者がアクセスしたサイトにおいて、例えばN回以上(Nは1以上の整数)アクセスしたサイトは相互に相関があるものとして、1点を加える。図4を例にとると、例えばNを3回としたとき、ユーザID0001の利用者の場合には、サイトA、サイトB、サイトC、サイトEに3回以上アクセスしている。そのため、Webサイトの組み合せ(A,B)、(A,C)、(A,E)、(B,C)、(B,E)、(C,E)に対応する相関値1点ずつ加える。同様に、ユーザID0002の利用者の場合には、Webサイトの組み合せ(B,C)、(B,D)、(B,E)、(B,G)、(C,D)、(C,E)、(C,G)、(D,E)、(D,G)、(E,G)に対応する相関値1点ずつ加える。このように、相関関係抽出部102は、複数の利用者のアクセスログからWebサイト間の対応関係を抽出することによって、複数のWebサイト間の相関関係を行列として算出する。
図5(a)は、複数のWebサイト間の相関関係を示す行列の一例を示す図である。図5(a)に示すように、相関関係抽出部102によって相関関係にある各Webサイト間の相関値に点数が加えられている。また、図5(b)は、各列相関値の合計値が1になるように正規化した行列を示す図である。相関関係抽出部102は、予め算出されたN×N行の行列Cを重要度算出部104に出力する。
パラメータ取得部103は、利用者の移動通信端末から、利用者の嗜好の反映度に関するパラメータkを取得する。また、パラメータ取得部103は、パラメータkと共に、Webサイトのレコメンデーション要求及びユーザIDを取得する。パラメータ取得部103は、取得したパラメータkを重要度算出部104に出力する。
重要度算出部104は、特徴抽出部101が抽出したWebサイトの閲覧傾向データを示すベクトルp、相関関係抽出部102が抽出した複数のWebサイト間の相関関係を示す行列C、及びパラメータ取得部103が取得したパラメータkに基づいて、Webサイトの重要度Iを算出する。重要度Iは、下記式(1);
I=Cp …(1)
によって求められる。
推奨情報生成部105は、重要度算出部104によって算出されたWebサイトのランキング(重要度の高い順番)に関する推奨情報を生成する。
送信部106は、推奨情報生成部105において生成された推奨情報を、移動通信端末3a〜3cに通信回線NWを介して送信する。
次に、図6を参照して、サーバ装置10の動作、すなわち本実施形態に係るWebサイトの推奨方法について詳しく説明する。図6は、Webサイトの推奨方法を示すシーケンス図であり、この推奨方法におけるステップをSと略記している。
サーバ装置10では、予め特徴抽出部101が閲覧傾向データのベクトルpを、相関関係抽出部102がWebサイト間の相関行列Cを算出している(算出ステップ、図示せず)。
最初に、移動通信端末3aにより、サーバ装置10へWebサイトのレコメンデーション情報要求と共に、ユーザID及びパラメータkが送信される(ステップS601)。サーバ装置10において、Webサイトのレコメンデーション要求と共に、ユーザID及びパラメータkをパラメータ取得部103が受け取ると(ステップS602)、重要度算出部104が、特徴抽出部101によって予め算出しておいたそのユーザIDに対応するWebサイトの閲覧傾向データのベクトルpを取得する(ステップS603)。
続いて、サーバ装置10の重要度算出部104が、相関関係抽出部102によって予め算出しておいたWebサイト間の相関行列Cを取得した後(ステップS604)、Webサイトの重要度Iを算出する(ステップS605)。具体的には、例えば図4けるユーザID“0005”の閲覧傾向データを示すベクトルpと、図5(b)に示す行列Cと、ユーザID0005の利用者から送信されたパラメータk=1とを式(1)に代入すると、下記式(2);
Figure 2009140173

…(2)
が導かれる。これにより、重要度算出部104は、ユーザID“0005”に対してサイトG(5.25点)、サイトB、C(1.85点)、サイトE(1.45点)、サイトD、F(0.8点)、サイトA(0点)の順でWebサイトの重要度を算出する。また、同様にユーザID“0003”の場合には、下記式(3);
Figure 2009140173

…(3)
が導かれる。これにより、重要度算出部104は、ユーザID“0003”に対してサイトC(4.15点)、サイトB(3.43点)、サイトG(2.71点)、サイトE(2.67点)、サイトA(2.17点)、サイトD(1.66点)の順でWebサイトの重要度を算出する。ここで、パラメータkが1から4に変更された場合には、ユーザID“0005”に対してサイトがB、C、E、F、A、D、Fの順に重要度が算出される。また、ユーザID“0003”に対しては、B、C、E、F、A、D、Fの順に重要度が算出される。
次に、サーバ装置10の推奨情報生成部105がレコメンデーション情報を生成し(ステップS606)、送信部106が移動通信端末3aにレコメンデーション情報を送信する(ステップS607)。レコメンデーション情報を受信した移動通信端末3aは、表示部によって情報を表示する。
以上説明した第1の実施形態に係るWebサイト推奨システム1によれば、移動通信端末3a〜3cの利用者からのパラメータkが大きくなるに従って、利用者の嗜好が強く反映されず、一般的に人気のあるWebサイトの重要度が高くなる。これにより、パラメータkによって利用者の嗜好を強く反映させるか、弱く反映させるかを制御することができる。その結果、利用者が送信するパラメータによって利用者の閲覧傾向データの推奨されるWebサイトの重要度に対する反映度を制御することが可能になり、利用者の嗜好に合わせたWebサイトを推奨することができる。
(第2の実施形態)
次に、図7を用いて本発明の第2の実施形態を説明する。図7は、本発明の第2の実施形態に係るサーバ装置10aを含むWebサイトを推奨するWebサイト推奨システム1aの構成を示すブロック図である。第2の実施形態は、サーバ装置10aがユーザ属性DB107を有する点で、第1の実施形態と異なっている。
アクセスログ収集装置2aは、移動通信端末3a〜3cがネットワークNWを介してWebサイト等にアクセスした際に、例えばURL情報等のアクセス先情報、アクセス時刻、及び所在位置を収集し格納する装置である。図8に、アクセルログの格納形態の一例を示す。図7に示すように、アクセスログは、ユーザID、アクセス時刻、所在位置、URLで構成されている。例えば、ユーザID「0001」の利用者がWebサイトにアクセスすると、アクセス時刻「10:45」、所在位置「東京」、及びWebサイトのURL「http://www.aabb.co.jp」がIDと関連付けられて格納される。アクセスログ収集装置2aは、移動通信端末3a〜3cのアクセス情報を随時サーバ装置10aに送信する。
サーバ装置10aは、特徴抽出部101aと、相関関係抽出部102aと、パラメータ取得部103aと、重要度算出部104aと、推奨情報生成部105aと、送信部106aと、ユーザ属性DB107とを有するサーバ装置である。
特徴抽出部101aは、移動通信端末3a〜3cの利用者がWebサイトにアクセスしたアクセスログ収集装置2のアクセスログに基づいて、利用者のWebサイトの閲覧傾向データを求める。特徴抽出部101aは、時刻情報及び利用者の所在位置におけるアクセスログを用いてWebサイトの閲覧傾向データを算出する。例えば、18時〜24時の時間帯において、東京からのアクセスにおける利用者の閲覧傾向データを求めるために、その利用者が18時〜24時に東京においてWebサイトにアクセスした履歴を示すアクセスログをアクセスログ収集装置2から抽出する。そして、特徴抽出部101と同様に、時間帯及び所在位置毎のWebサイトの閲覧傾向のデータのベクトルpを算出する。特徴抽出部101aは、予め算出した閲覧傾向データのN次元のベクトルpを重要度算出部104aに出力する。
相関関係抽出部102aは、複数の移動通信端末が複数のWebサイトにアクセスしたアクセスログ収集装置2aのアクセスログに基づいて、複数の移動通信端末がアクセスした複数のWebサイト間の相関関係を抽出する。相関関係抽出部102aは、移動通信端末3a〜3cの利用者の属性情報、レコメンデーション要求の受信時刻、及び利用者の所在位置に対応するアクセスログを用いて相関関係を算出する。例えば、30代の男性のレコメンデーション要求に対するサイト間の相関関係を算出する場合には、ユーザ属性DB107から30代男性のユーザIDを複数抽出し、そのユーザIDに対応するアクセルログのみをアクセスログ収集装置2aから抽出する。そして、抽出されたアクセスログに基づいて、Webサイト間の相関関係を示す行列Cを相関関係抽出部102と同様に算出する。相関関係抽出部102aは、予め算出されたN×N行の行列Cを重要度算出部104aに出力する。
パラメータ取得部103aは、利用者の移動通信端末3aから、利用者の嗜好の反映度に関するパラメータk、及びユーザIDを含むレコメンデーション要求を取得する。また、パラメータ取得部103aは、Webサイトのレコメンデーション要求を取得すると同時に、ユーザID、時刻情報、及び移動通信端末3aの所在位置を取得する。パラメータ取得部103aは、取得したパラメータk、ユーザID、時刻情報、及び所在位置を重要度算出部104aに出力する。
重要度算出部105aは、特徴抽出部101aが抽出したWebサイトの閲覧傾向データを示すベクトルp、相関関係抽出部102aが抽出した複数のWebサイト間の相関関係を示す行列C、及びパラメータ取得部103aが取得したパラメータkに基づいて、重要度算出部105と同様に重要度Iを求める。
ユーザ属性DB107は、年齢や性別といった属性情報をユーザIDと関連付けて格納している。ユーザ属性DB107は、特徴抽出部101a及び相関関係抽出部102aからの情報提供指示に応じて、格納されている属性情報を出力する。
図9を参照して、サーバ装置10aの動作、すなわち本実施形態に係るWebサイトの推奨方法について詳しく説明する。図9は、Webサイトの推奨方法を示すシーケンス図であり、この推奨方法におけるステップをSと略記している。
サーバ装置10aでは、予め特徴抽出部101aが閲覧傾向データのベクトルpを算出している(算出ステップ、図示せず)。
最初に、移動通信端末3aにより、サーバ装置10aへWebサイトのレコメンデーション情報要求と共に、ユーザID及びパラメータkが送信される(ステップS901)。Webサイトのレコメンデーション要求に、ユーザID及びパラメータkをパラメータ取得部103aが取得すると、重要度算出部104aが、レコメンデーション要求の受信時刻、ユーザの属性情報、及び移動通信端末3aの所在位置を取得する(ステップS902)。そして、特徴抽出部101aによって予め算出しておいたWebサイトの閲覧傾向データのベクトルpを取得する(ステップS903)。
続いて、サーバ装置10aの相関関係抽出部102aが、属性情報、時刻情報、所在位置に基づいてWebサイト間の相関関係を抽出し、相関行列Cを算出する(ステップS904)。サーバ装置10aの重要度算出部104aは、パラメータk、閲覧傾向データのベクトルp、及び相関行列Cに基づいて、重要度Iを算出する(ステップS905)。
次に、サーバ装置10aの推奨情報生成部105aがレコメンデーション情報を生成し(ステップS906)、送信部106aが移動通信端末3aにレコメンデーション情報を送信する(ステップS907)。レコメンデーション情報を受信した移動通信端末3aは、表示部によって情報を表示する。
以上説明した第2の実施形態に係るWebサイト推奨システム1aによれば、利用者の属性情報、時刻情報、及び所在位置といった環境情報に応じて相関行列Cを算出することで、それぞれの環境に即したレコメンデーション情報を提供することができる。
(第3の実施形態)
図10は、本発明の第3の実施形態に係るサーバ装置10bを含むWebサイトを検索するWebサイト検索システム1bの構成を示すブロック図である。
サーバ装置10bは、検索語一致度算出部108と、検索結果情報生成部109とを有する点で第1の実施形態と異なっている。
検索語一致度算出部108は、利用者によって移動通信端末3a〜3cに入力されたWebサイトを検索するための検索語と、Webサイトの一致度のスコアを算出する。検索語一致度算出部108は、例えばWebサイト内の検索語の出現回数や、対象のWebサイトにリンクしているページのHTML文書の中で、リンクが設定された文字列(アンカーテキスト)等を利用して、検索語との一致度スコアを算出する。
検索結果情報生成部109は、検索語一致度算出部108において算出された一致度スコアと重要度算出部104において算出された重要度Iとを乗算することで検索スコアを算出し、算出された検索スコアが高い順からWebサイトを出力し、検索結果情報を生成する。
送信部106bは、検索結果情報生成部109において生成された検索結果情報を、移動通信端末3a〜3cに送信する。
次に、図11を参照して、サーバ装置10bの動作、すなわち本実施形態に係るWebサイトの検索方法について詳しく説明する。図11は、Webサイトの検索方法を示すシーケンス図であり、ステップをSと略記している。
サーバ装置10bでは、予め特徴抽出部101bが閲覧傾向データのベクトルpを、相関関係抽出部102bがWebサイト間の相関行列Cを算出している(算出ステップ)。
最初に、移動通信端末3aにより、サーバ装置10bへWebサイトの検索要求と共に、検索語、ユーザID、パラメータkが送信される(ステップS1101)。サーバ装置10bは、Webサイトの検索要求と共に、検索語、ユーザID、及びパラメータkをパラメータ取得部103bが取得すると、重要度算出部104bが、特徴抽出部101bによって予め算出しておいたWebサイトの閲覧傾向データのベクトルpを取得する(ステップS112)。
続いて、サーバ装置10bの重要度算出部104bが、相関関係抽出部102bによって予め算出しておいたWebサイト間の相関行列Cを取得すると(ステップS1103)、Webサイトの重要度Iを算出する(ステップS1104)。
次に、サーバ装置10bの検索語一致度算出部108が、利用者が送信した検索語がWebサイトページ内に記載されている文字の中に何回出現しているかを示す一致度スコアを算出する(ステップS1105)。
次に、サーバ装置10bの検索結果情報生成部109が、一致度スコアと重要度Iとを乗算することによって検索スコアを算出し、検索スコアの高いWebサイトから出力することで検索結果情報を生成する(ステップS1106)。そして、送信部106bが移動通信端末3aに検索結果情報を送信する(ステップS1107)。検索結果情報を受信した移動通信端末3aは、表示部によって情報を表示する。
以上説明した第3の実施形態に係るWebサイト検索システム1bによれば、利用者のパラメータkによって、利用者の嗜好をWebサイトの重要度に反映させることができる。これにより、利用者のWebサイトに対する重要度を制御することができ、検索結果に影響を与えることができる。その結果、パラメータkを小さくすれば利用者の嗜好を強く反映した検索結果を得ることができ、パラメータkを大きくすれば一般的な検索結果を得ることができる。
以下、コンピュータをサーバ装置10として動作させるWebサイト推奨プログラムについて説明する。
本発明によるWebサイト推奨プログラムは、記録媒体に格納されて提供される。記録媒体としては、フロッピーディスク、CD−ROM、DVD、あるいはROM等の記録媒体、あるいは半導体メモリ等が例示される。
図12は、記録媒体に記録されたプログラムを実行するためのコンピュータのハードウェア構成を示す図であり、図13は、記録媒体に記憶されたプログラムを実行するためのコンピュータの斜視図である。コンピュータとして、CPUを具備しソフトウェアによる処理や制御を行なうDVDプレーヤ、セットトップボックス、携帯電話などを含む。
図12に示すように、コンピュータ530は、フロッピーディスクドライブ装置、CD−ROMドライブ装置、DVDドライブ装置等の読取装置512と、オペレーティングシステムを常駐させた作業用メモリ(RAM)514と、記録媒体510に記憶されたプログラムを記憶するメモリ516と、ディスプレイといった表示装置518と、入力装置であるマウス520及びキーボード522と、データ等の送受を行うための通信装置524と、プログラムの実行を制御するCPU526とを備えている。コンピュータ530は、記録媒体510が読取装置12に挿入されると、読取装置512から記録媒体510に格納されたWebサイト推奨プログラムにアクセス可能になり、当該Webサイト推奨プログラムによって、本発明によるサーバ装置として動作することが可能になる。
図13に示すように、Webサイト推奨プログラムは、搬送波に重畳されたコンピュータデータ信号540としてネットワークを介して提供されるものであってもよい。この場合、コンピュータ530は、通信装置524によって受信したWebサイト推奨プログラをメモリ516に格納し、Webサイト推奨プログラムを実行することができる。
以上、本発明をその実施形態に基づいて具体的に説明したが、本発明は上記実施形態に限定されるものではない。上記実施形態では、利用者の特徴を抽出する方法として、Webサイトにアクセスした回数がN回以上のWebサイトに対して、その回数に1点を加えているが、例えばN回以上アクセスしたWebサイトを1点とし、それ以外のサイトを0点としてもよい。
また、上記実施形態では、Webサイトの相関関係を、同一の利用者がWebサイトにN回以上アクセスしたサイトに相関関係があるものとしているが、例えばサイトA、B、C、A、B、Eと遷移しながらWebサイトを閲覧した場合には、CとEの間以外には遷移関係があるものとして、Webサイト間に相関関係があるとしてもよい。また、遷移方向も考慮し、サイトAからサイトBへの遷移の場合には、相関行列の(A,B)には1点を加えるが、(B,A)には点を加えないようにしてもよい。
また、上記実施形態では、利用者の属性情報や所在位置は、ユーザ属性DB107に格納されているものとしたが、レコメンデーション要求と共に、その都度度移動通信端末から送信されるものであってもよい。
また、上記実施形態では、相関関係抽出部102aが移動通信端末3a〜3cの利用者の属性情報、レコメンデーション要求の受信時刻、及び利用者の所在位置に対応するアクセスログを用いて求めた相関関係によって重要度Iを算出しているが、特徴抽出部101aがレコメンデーション要求の受信時刻、及び利用者の所在位置に対応するアクセスログを用いて求めた閲覧傾向データによって重要度Iを算出しても良い。以下に、図12を参照して、サーバ装置10aの動作、すなわち第2の実施形態のWebサイトの推奨方法の変形例について詳しく説明する。図12は、Webサイトの推奨方法の例を示すシーケンス図であり、この推奨方法におけるステップをSと略記している。
サーバ装置10aでは、予め相関関係抽出部102aがWebサイト間の相関行列Cを算出している(算出ステップ、図示せず)。
最初に、移動通信端末3aにより、サーバ装置10aへWebサイトのレコメンデーション情報要求と共に、ユーザID及びパラメータkが送信される(ステップS1201)。Webサイトのレコメンデーション要求、ユーザID及びパラメータkをパラメータ取得部103aが取得すると、重要度算出部104aが、レコメンデーション要求の受信時刻及び移動通信端末3aの所在位置を取得する(ステップS1202)。
続いて、サーバ装置10aの特徴抽出部101aが、時刻情報及び所在位置に基づいてWebサイトの閲覧傾向データを求め、ベクトルpを算出する(ステップS1203)。そして、重要度算出部104aは、予め算出しておいたWebサイト間の相関行列Cを取得し(ステップS1204)、その相関行列C、パラメータk、閲覧傾向データのベクトルpに基づいて、重要度Iを算出する(ステップS1205)。
次に、サーバ装置10aの推奨情報生成部105aがレコメンデーション情報を生成し(ステップS1206)、送信部106aが移動通信端末3aにレコメンデーション情報を送信する(ステップS1207)。レコメンデーション情報を受信した移動通信端末3aは、表示部によって情報を表示する。
以上説明した第2の実施形態の変形例に係るWebサイト推奨システム1aによれば、利用者の時刻情報及び所在位置といった環境情報に応じて利用者のWebサイトの閲覧傾向データを求めることにより、それぞれの環境に即したレコメンデーション情報を提供することができる。
また、上記実施形態では、移動通信端末3a〜3cを携帯電話機としたが、通信回線NWを介してWebサイトに接続されるものであればよい。例えば、パーソナルコンピュータ、携帯型情報端末(PDA)、簡易携帯電話(PHS)等でよい。
また、上記実施形態では、全てのWebサイトを対象にレコメンデーション情報を生成しているが、一定のスコア以上のWebサイト若しくはスコアが上位のWebサイトによってレコメンデーション情報が生成されてもよい。
第1の実施形態に係るサーバ装置を含むWebサイト推奨システムの全体構成を示す図である。 図1に示すサーバ装置のハードウェア構成を示す図である。 図1に示すアクセスログ収集装置に格納されているアクセスログのデータ構成を示す図である。 特徴抽出部におけるWebサイトの閲覧傾向データの一例を示す図である。 (a)相関関係抽出部におけるWebサイト間の相関関係の一例を示す図である。(b)(a)に示した図を正規化した相関関係を示す一例である。 第1の実施形態に係るサーバ装置を含むWebサイト推奨システムの処理を示すシーケンス図である。 第2の実施形態に係るサーバ装置を含むWebサイト推奨システムの全体構成を示す図である。 図7に示すアクセスログ収集装置に格納されているアクセスログのデータ構成を示す図である。 第2の実施形態に係るサーバ装置を含むWebサイト推奨システムの処理を示すシーケンス図である。 第3の実施形態に係るサーバ装置を含むWebサイト検索システムの全体構成を示す図である。 第3の実施形態に係るサーバ装置を含むWebサイト検索システムの処理を示すシーケンス図である。 記録媒体に記録されたプログラムを実行するためのコンピュータのハードウェア構成を示す図である。 記録媒体に記憶されたプログラムを実行するためのコンピュータの斜視図である。 第2の実施形態に係るサーバ装置を含むWebサイト推奨システムの変形例における処理を示すシーケンス図である。
符号の説明
3a〜3c…移動通信端末(通信端末)、10…サーバ装置、101…特徴抽出部(特徴抽出手段)、102…相関関係抽出部(相関関係抽出手段)、103…パラメータ取得部(パラメータ取得手段)、104…重要度算出部(重要度算出手段)、105…推奨情報生成部(推奨情報生成手段)、106…送信部(送信手段)、108…一致度算出手部(一致度算出手段)、109…検索結果情報生成部(検索結果情報生成手段)、NW…通信回線(通信網)。

Claims (7)

  1. 通信網を介して複数の通信端末の利用者の嗜好に応じたWebサイトを推奨するサーバ装置であって、
    前記複数の通信端末のうちの特定の通信端末がWebサイトにアクセスした履歴データに基づいて、前記特定の通信端末の利用者の前記Webサイトの閲覧傾向を求める特徴抽出手段と、
    前記複数の通信端末が複数のWebサイトにアクセスした履歴データに基づいて、前記複数の通信端末がアクセスした前記複数のWebサイト間の相関関係を抽出する相関関係抽出手段と、
    前記利用者の通信端末から、前記利用者の嗜好の反映度に関するパラメータを取得するパラメータ取得手段と、
    前記Webサイトの閲覧傾向、前記複数のWebサイト間の相関関係、及び前記パラメータに基づいて、前記Webサイトの重要度を算出する重要度算出手段と、
    前記重要度算出手段によって算出された前記Webサイトの重要度に基づいて、前記Webサイトの推奨情報を生成する推奨情報生成手段と、
    前記推奨情報生成手段によって生成された前記推奨情報を前記通信端末へ送信する送信手段と、
    を備えることを特徴とするサーバ装置。
  2. 前記特徴抽出手段は、前記利用者が閲覧する前記Webサイトの閲覧傾向をN次元のベクトルpとして算出し、
    前記相関関係抽出手段は、前記複数のWebサイト間の相関関係をN×Nの行列Cとして算出し、
    前記パラメータ取得手段は、前記パラメータを変数kとして取得し、
    前記重要度算出手段は、下記式(1);
    I=Cp …(1)
    によって前記Webサイトの重要度Iを算出することを特徴とする請求項1記載のサーバ装置。
  3. 前記相関関係抽出手段は、前記特定の通信端末の利用者の属性情報、時刻情報、及び前記利用者の所在位置の少なくとも1つの環境情報に基づいて、前記複数のWebサイトの相関関係を抽出し、
    前記重要度算出手段は、前記特定の通信端末の利用者の前記環境情報に応じた前記複数のWebサイトの相関関係を算出し、当該算出した前記複数のWebサイトの相関関係、前記Webサイトの閲覧傾向、及び前記パラメータに基づいて、前記Webサイトの重要度を算出することを特徴とする請求項1に記載のサーバ装置。
  4. 前記特徴抽出手段は、時刻情報、及び前記利用者の所在位置の少なくとも1つの環境情報に基づいて、前記Webサイトの閲覧傾向を求め、
    前記重要度算出手段は、前記特定の通信端末の利用者の前記環境情報に応じた前記Webサイトの閲覧傾向を算出し、当該算出した前記Webサイトの閲覧傾向、前記複数のWebサイトの相関関係、及び前記パラメータに基づいて、前記Webサイトの重要度を算出することを特徴とする請求項1に記載のサーバ装置。
  5. 前記利用者が前記Webサイトの検索に用いた検索語と、前記Webサイトとの一致度合いを算出する一致度算出手段と、
    前記重要度算出手段によって算出された前記Webサイトの重要度と、前記一致度算出手段によって算出された前記一致度合いとに基づいていて、検索結果情報を生成する検索結果情報生成手段と、
    前記検索結果情報生成手段によって生成された検索結果情報を送信する送信手段と、
    を更に備えることを特徴とする請求項1に記載のサーバ装置。
  6. 通信網を介して複数の通信端末の利用者の嗜好に応じたWebサイトを推奨する推奨方法であって、
    サーバ装置が、前記複数の通信端末のうち特定の通信端末によるWebサイトへのアクセス履歴データに基づいて、前記特定の通信端末の利用者の前記Webサイトの閲覧傾向を求める特徴抽出ステップと、
    サーバ装置が、前記複数の通信端末による複数のWebサイトへのアクセス履歴データに基づいて、前記複数の通信端末がアクセスした前記複数のWebサイト間の相関関係を抽出する相関関係抽出ステップと、
    サーバ装置が、前記利用者の通信端末から、前記利用者の嗜好の反映度に関するパラメータを取得するパラメータ取得ステップと、
    サーバ装置が、前記利用者が閲覧した前記Webサイトの閲覧傾向、前記複数のWebサイト間の相関関係、及び前記利用者のパラメータに基づいて、前記Webサイトの重要度を算出する重要度算出ステップと、
    サーバ装置が、前記重要度算出手段によって算出された前記Webサイトの重要度に基づいて、前記Webサイトの推奨情報を生成する推奨情報生成ステップと、
    サーバ装置が、前記推奨情報生成手段によって生成された前記推奨情報を前記通信端末へ送信する送信ステップと、
    を備えることを特徴とするWebサイトの推奨方法。
  7. 通信網を介して複数の通信端末の利用者の嗜好に応じたWebサイトを推奨するWebサイト推奨プログラムであって、
    コンピュータを、
    前記複数の通信端末のうちの特定の通信端末がWebサイトにアクセスした履歴データに基づいて、前記特定の通信端末の利用者の前記Webサイトの閲覧傾向を求める特徴抽出手段、
    前記複数の通信端末が複数のWebサイトにアクセスした履歴データに基づいて、前記複数の通信端末がアクセスした前記複数のWebサイト間の相関関係を抽出する相関関係抽出手段、
    前記利用者の通信端末から、前記利用者の嗜好の反映度に関するパラメータを取得するパラメータ取得手段、
    前記Webサイトの閲覧傾向、前記複数のWebサイト間の相関関係、及び前記パラメータに基づいて、前記Webサイトの重要度を算出する重要度算出手段、
    前記重要度算出手段によって算出された前記Webサイトの重要度に基づいて、前記Webサイトの推奨情報を生成する推奨情報生成手段、
    前記推奨情報生成手段によって生成された前記推奨情報を前記通信端末へ送信する送信手段、
    として機能させることを特徴とするWebサイト推奨プログラム。
JP2007314978A 2007-12-05 2007-12-05 Webサイトを推奨するサーバ装置、Webサイトの推奨方法、及びWebサイト推奨プログラム Pending JP2009140173A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007314978A JP2009140173A (ja) 2007-12-05 2007-12-05 Webサイトを推奨するサーバ装置、Webサイトの推奨方法、及びWebサイト推奨プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007314978A JP2009140173A (ja) 2007-12-05 2007-12-05 Webサイトを推奨するサーバ装置、Webサイトの推奨方法、及びWebサイト推奨プログラム

Publications (1)

Publication Number Publication Date
JP2009140173A true JP2009140173A (ja) 2009-06-25

Family

ID=40870729

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007314978A Pending JP2009140173A (ja) 2007-12-05 2007-12-05 Webサイトを推奨するサーバ装置、Webサイトの推奨方法、及びWebサイト推奨プログラム

Country Status (1)

Country Link
JP (1) JP2009140173A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103678312A (zh) * 2012-08-31 2014-03-26 腾讯科技(深圳)有限公司 一种推荐网址的方法与客户端
JP2017068767A (ja) * 2015-10-01 2017-04-06 東芝テック株式会社 情報提供装置、および情報提供プログラム
JP2020510910A (ja) * 2017-02-17 2020-04-09 キンダイ、インコーポレイテッドKyndi, Inc. ネットワーク節点においてソフトウェアエージェントを備えるネットワークを使用した後にネットワーク節点をランク付けする機械学習の方法及び装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103678312A (zh) * 2012-08-31 2014-03-26 腾讯科技(深圳)有限公司 一种推荐网址的方法与客户端
CN103678312B (zh) * 2012-08-31 2018-06-05 腾讯科技(深圳)有限公司 一种推荐网址的方法与客户端
JP2017068767A (ja) * 2015-10-01 2017-04-06 東芝テック株式会社 情報提供装置、および情報提供プログラム
JP2020510910A (ja) * 2017-02-17 2020-04-09 キンダイ、インコーポレイテッドKyndi, Inc. ネットワーク節点においてソフトウェアエージェントを備えるネットワークを使用した後にネットワーク節点をランク付けする機械学習の方法及び装置
JP7105789B2 (ja) 2017-02-17 2022-07-25 キンダイ、インコーポレイテッド ネットワーク節点においてソフトウェアエージェントを備えるネットワークを使用した後にネットワーク節点をランク付けする機械学習の方法及び装置
US11481456B2 (en) 2017-02-17 2022-10-25 Kyndi, Inc. Model and pattern structure online unital learning: mapsoul
US11782992B2 (en) 2017-02-17 2023-10-10 Kyndi, Inc. Method and apparatus of machine learning using a network with software agents at the network nodes and then ranking network nodes

Similar Documents

Publication Publication Date Title
US9355185B2 (en) Infinite browse
JP4638439B2 (ja) ウェブ検索の個人化
US11860962B1 (en) System and method for selecting information for display based on past user interactions
US20100257466A1 (en) Method and system for generating a mini-software application corresponding to a web site
US20080065617A1 (en) Search entry system with query log autocomplete
KR102454954B1 (ko) 검색 동작 출력 엘리먼트에 대한 액션 표시자
JP2007188352A (ja) ページリランキング装置、ページリランキングプログラム
US20200104427A1 (en) Personalized neural query auto-completion pipeline
US10558727B2 (en) System and method for operating a browsing application
US20190018884A1 (en) Multiple entity aware typeahead in searches
JP2018156473A (ja) 解析装置、解析方法、およびプログラム
JP2013250719A (ja) 特典付与システム、特典付与方法、特典付与装置、特典付与プログラム、特典関連情報表示プログラム及び特典関連情報表示方法
KR101123697B1 (ko) 공통 관심 사용자 검색장치 및 방법
JP2009265754A (ja) 情報提供装置、情報提供方法及び情報提供プログラム
JP2008176782A (ja) 関心事を反映して抽出した情報提供方法及びシステム
JP2009140173A (ja) Webサイトを推奨するサーバ装置、Webサイトの推奨方法、及びWebサイト推奨プログラム
JP5141144B2 (ja) 情報検索システム及び情報検索プログラム
US10242106B2 (en) Enhance search assist system's freshness by extracting phrases from news articles
KR20120076482A (ko) 통신 시스템에서 컨텐츠 검색 방법 및 장치
JP2007164530A (ja) 情報推薦装置
JP6851944B2 (ja) 検索システム、および検索方法
CN108287826B (zh) 一种基于医疗系统的病例读取方法
JP5084859B2 (ja) 情報処理装置、データ抽出方法、及びプログラム
JP2003178093A (ja) アクセスログ取得方法及び装置、推奨情報送信方法及び装置、コンピュータプログラム及び記録媒体
JP7309669B2 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム