JP3832154B2 - Webサイトの構成変更支援装置 - Google Patents

Webサイトの構成変更支援装置 Download PDF

Info

Publication number
JP3832154B2
JP3832154B2 JP22715199A JP22715199A JP3832154B2 JP 3832154 B2 JP3832154 B2 JP 3832154B2 JP 22715199 A JP22715199 A JP 22715199A JP 22715199 A JP22715199 A JP 22715199A JP 3832154 B2 JP3832154 B2 JP 3832154B2
Authority
JP
Japan
Prior art keywords
hypertext
distance
configuration change
designated
change support
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP22715199A
Other languages
English (en)
Other versions
JP2001051763A5 (ja
JP2001051763A (ja
Inventor
裕樹 加藤
雄大 中山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP22715199A priority Critical patent/JP3832154B2/ja
Publication of JP2001051763A publication Critical patent/JP2001051763A/ja
Publication of JP2001051763A5 publication Critical patent/JP2001051763A5/ja
Application granted granted Critical
Publication of JP3832154B2 publication Critical patent/JP3832154B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、インターネットでの情報提供を行うWebサイトにおいて、Webサイトで公開されているコンテンツ(ハイパーテキスト)に対するユーザのアクセス傾向とコンテンツの分布傾向との関連を可視化することにより、ユーザのアクセス傾向を発見してハイパーテキストのリンク構造の変更支援を行う技術に関する。
【0002】
【従来の技術】
近年、World Wide Web(以下、Webと略す)において情報提供を行う需要が増大している。企業においてもWebで情報提供を行うためのWebサイトを持ち、Webサイトで自社の製品の広告活動や、電子商取引などの手段による物品やサービスの売買が盛んに行われつつある。
このような中で、Webにアクセスしてきたユーザの動向を知り、ユーザ動向にあわせて提供すべき情報の構造を速やかに変更していくための技術の需要が高まっている。
【0003】
Webサイトで提供される情報はコンテンツと呼ばれハイパーテキスト(たとえば、HTML)によって表現される。個々のハイパーテキスト(以下、ノードと同義)はリンクによって結ばれ、Webサイトにアクセスしたいユーザは、リンクをたどることによってWebサイト中のノードにアクセスして様々なハイパーテキストから情報を入手することができる。
【0004】
Webサーバはサーバにアクセスしてきたユーザの振る舞いを記録することができ(記録された内容を以下ではログと呼ぶ)、例えば、ログにはハイパーテキストにアクセスしてきたコンピュータ(ユーザがWebサーバにアクセスするために使用しているコンピュータ、又はユーザの利用情報を中継しているコンピュータ)のIPアドレス、アクセスしてきた時刻、アクセスするためにWebサーバに送った命令が記録されている。なお、命令には、ユーザがアクセスしたノードのサーバー上での識別子(例えばURL)が含まれる。
【0005】
ここで、従来のアクセスログを利用したユーザ動向を知る技術では、コンテンツとユーザ動向の関連について評価を行っていないため、Webサイトの再構築を支援するところまでは至っていなかった。
そこで、本願出願人は、特願平10−345071号で、Webサイト中のノードに対してアクセスログによるクラスタリングとコンテンツによるクラスタリングを行い、2つのクラスタ間のずれからWebサイトの構成上の問題を指摘する手法を提案した。
しかしながら、この発明では、問題のあるノードを提示することは可能となったものの、問題のあるノードと、問題のあるページと予め定められたリンク関係にある他のノードとを表示し、これらノード間でのユーザの遷移数を提示する手法しか備えていないため、サイト分析を行うに際して、原因や問題点修正のための十分な情報を容易に得ることが出来なかった。
【0006】
なお、Webページの表示技術としては、リンク構造に基づいて木構造で表示することが一般的に行われている。また、ノードリンク構造を持つデータの表示技術として特開平8−110847号公報の「ノードリンク構造表示技術」が知られており、この技術では、リンクを辿ると指数関数的に表示すべきノード数が増えていくことにより生じる問題を軽減することを目的としている。
また、極座標を用いて対象間の関係を示す技術としては、特開平10−031652号公報の「ドメイン間距離の表現方法及びシステム」が知られており、この技術では、ドメイン間の情報の入手を極座標面上で表示することにより、ドメイン間の相対的な関係を視覚的に表示することを目的としている。
【0007】
【発明が解決しようとする課題】
本発明は上記従来に事情に鑑みなされたもので、ユーザのアクセス傾向とコンテンツ分布の関連を座標系を用いて画面表示することにより、Webサイトの構成上の問題点の発見やユーザのアクセス傾向の分析を支援することを目的とする。
【0008】
【課題を解決するための手段】
本発明は、Webサイト上のハイパーテキスト集合から、選択手段によりユーザの着目したいハイパーテキストを含む部分集合を選択し、選択された個々のハイパーテキストとユーザの着目したターゲットハイパーテキストとの間のリンク距離を距離算出手段で算出し、選択された個々のハイパーテキストとターゲットハイパーテキストとの間を種々なユーザが或るアクセスにおいてどの程度遷移(移動)したかを示す関連度を関連度算出手段で算出し、リンク距離と関連度を座標系の座標に対応づけることで視覚化表示することにより、ターゲットハイパーテキストと同時期にアクセスされる他のハイパーテキストとがリンク距離としてどの程度離隔しているかを視覚的に把握できるようにする。
【0009】
具体的には、選択手段が情報システムによって管理されたハイパーテキスト群に対して、指定されたハイパーテキスト(ターゲット)を含むハイパーテキスト集合を選択し、距離算出手段が選択手段によって選択されたハイパーテキスト集合の個々のハイパーテキストとターゲットハイパーテキストとの間のリンク距離を算出し、関連度算出手段が選択手段によって選択されたハイパーテキスト集合の個々のハイパーテキストとターゲットハイパーテキストとの間の遷移度合いを表す関連度を算出し、図形化表示手段が距離算出手段によって算出された値を半径に対応付けるとともに関連度算出手段によって算出された値を角度に対応付けて、前記選択された個々のハイパーテキストを図形化して極座標系上に表示する。
【0010】
また、選択手段が情報システムによって管理されたハイパーテキスト群に対して、ターゲットハイパーテキストを含むハイパーテキスト集合を選択し、距離算出手段が選択手段によって選択されたハイパーテキスト集合の個々のハイパーテキストとターゲットハイパーテキストとの間のリンク距離を算出し、関連度算出手段が選択手段によって選択されたハイパーテキスト集合の個々のハイパーテキストとターゲットハイパーテキストとの間の遷移度合いを表す関連度を算出し、図形化表示手段が距離算出手段によって算出された値を一方の軸に対応付けるとともに関連度算出手段によって算出された値をもう一方の軸に対応付けて、前記選択された個々のハイパーテキストを図形化して2次元直交座標系上に表示する。
【0011】
ここで、距離算出手段は、ターゲットハイパーテキストと選択手段により選択されたハイパーテキスト集合の個々のハイパーテキストとの間をリンクを遷移して移動するために経由するハイパーテキストの数の最小値を、当該指定されたハイパーテキストと当該選択されたハイパーテキスト集合の個々のハイパーテキストとの間のリンク距離として算出することも行う。
【0012】
また、距離算出手段は、ターゲットハイパーテキストと選択手段により選択されたハイパーテキスト集合の個々のハイパーテキストとの間をリンクの向きを考慮して同一方向のみにリンクを遷移して移動するために経由するハイパーテキストの数を、当該指定されたハイパーテキストと当該選択されたハイパーテキスト集合の個々のハイパーテキストとの間のリンク距離として算出し、算出されたリンク距離が予め定められた値を超える場合には予め定められた設定値を距離とすることも行う。
【0013】
また、距離算出手段は、ターゲットハイパーテキストから選択手段により選択されたハイパーテキスト集合の個々のハイパーテキストに至るまでに、個々のユーザが経由したハイパーテキストの数の平均値をリンク距離として算出することも行う。
【0014】
また、関連度算出手段は、ターゲットハイパーテキストを閲覧したユーザ集合中の、選択手段によって選択されたハイパーテキスト集合の個々のハイパーテキストを訪れたユーザの割合を個々のハイパーテキストの関連度とすることも行う。
【0015】
また、図形化表示手段は、距離算出手段により距離を算出する際に経由したハイパーテキストが選択手段によって選択されたハイパーテキスト集合に含まれていない場合には、当該ハイパーテキストを選択手段によって選択されたハイパーテキスト集合と区別可能な態様で画面に表示することも行う。
【0016】
また、図形化表示手段は、表示すべきハイパーテキスト集合を構成する個々のハイパーテキストを構成するタグとタグ中に含まれる要素の組み合わせを抽出して個々のハイパーテキストの特徴を抽出し、抽出された特徴についてのハイパーテキスト集合における重要度と個々のハイパーテキストにおける重要度から、各特徴の個々のハイパーテキストにおける他のハイパーテキストとの識別度を算出し、算出された識別度に基づいて各ハイパーテキストを表す図形を決定して表示することも行う。
【0017】
また、変更候補提示手段が、図形化したハイパーテキストの表示位置に応じて、予め定められた座標領域に存在するハイパーテキストについてハイパーテキスト構造に問題が有る可能性のある候補として提示することも行う。
【0018】
また、重なり判定手段が各ハイパーテキストを表す図形の座標系における重なりを判断し、図形化表示手段が重なりが判定された場合には、座標系に奥行き方向の軸を設定し、奥行き方向の座標をずらして3次元表示することも行う。
【0019】
また、ハイパーテキスト群に対するアクセス履歴に基づいて当該ハイパーテキスト群をクラスタリングしたログクラスタ集合と、ハイパーテキスト群を個々のハイパーテキスト間の内容の類似度に基づいてクラスタリングしたコンテンツクラスタ集合とを用意し、選択手段が、ログクラスタ集合から前記指定されたハイパーテキストを含むログクラスタを選出し、これらログクラスタに含まれるコンテンツクラスタをコンテンツクラスタ集合から選出し、当該選出されたコンテンツクラスタに対応するログクラスタに含まれるハイパーテキストを距離算出及び関連度算出の対象となるハイパーテキスト集合として選択することも行う。
【0020】
【発明の実施の形態】
本発明を実施例に基づいて具体的に説明する。
図1には、本発明の一実施例に係るWebサイトの構成変更支援装置の構成を示してある。
Webサーバ100はネットワーク上で情報を発信する手段であり、Webサーバ100にはユーザに提供したいコンテンツ群(ハイパーテキスト群)が貯えられている。Webサーバ100はネットワークからのユーザのアクセスにしたがってコンテンツ提供部101によりコンテンツを提供し、また、ログ記録部102によりユーザからアクセスがある毎に当該ユーザを識別するための識別子(IPアドレス)、当該アクセス時刻、当該ユーザがアクセスしたハイパーテキスト(ノード)のあるアドレス(URL)をログとして記録する。
【0021】
ここで、Webサーバ100側で記録されるIPアドレスは、実際にユーザが利用しているクライアントからのアクセスを代行するプロキシサーバーと呼ばれるコンピュータのアドレスであることもあり、この場合は複数のユーザが同一のIPアドレスを用いることになる。本実施例では、Webサーバ100にアクセスしたコンピュータのIPアドレスと日付によりユーザの識別を行っており、同じIPアドレスからのアクセスであってもアクセスした日付が異なる場合には異なるユーザとして区別する。
なお、本発明において用いるログは上記のものに限らず、特開平10−224349号公報に記載された発明のようにプロキシサーバーのログをあわせて用いることでユーザを識別したものでもよく、また、特開平10−207838号公報に記載された発明のようにJavaアプレット等のクライアント側にアクセス通知の機構をもつ仕組みによって記録されたログでもよく、要は、ユーザが識別でき、且つ、アクセスしたノードのリンク構造における場所が特定でき、且つ、アクセスした順序が判るものであればよい。
【0022】
ハイパーテキスト選択部110では、Webサイトの構造分析を行おうとする者から指定されたターゲットとなるノード(ハイパーテキスト)に基づいて、構造分析してその結果を画面に表示すべき対象となるノード集合(ハイパーテキスト集合)を選択する。
【0023】
ここで、本実施例では、入力される2つの異なるハイパーテキストクラスタ集合として特願平10−345071号にて本願出願人が提案したクラスタリング手法で生成されたコンテンツクラスタ集合とログクラスタ集合を用いる。この2つの異なるクラスタ集合とはログクラスタ集合とコンテンツクラスタ集合であり、ログクラスタ集合とはハイパーテキスト群に対するアクセス履歴に基づいて当該ハイパーテキスト群をクラスタリングしたものであり、また、コンテンツクラスタ集合とはハイパーテキスト群を個々のハイパーテキスト間の内容の類似度に基づいてクラスタリングしたものである。
【0024】
本実施例では、Webサイトのハイパーテキスト群構造は、図5に示すような各ハイパーテキストをノードとして、これらノード(サイトの入り口、プリンタ、コピー、機種A、機種B、・・・機種Aの機能A)をリンクでつないだ構造となっている。
そして、ログクラスタ集合は図3に示す構造となっており、本実施例では同図中のリーフになっているクラスタ6、クラスタ10、クラスタ11をログクラスタとして用い、コンテンツクラスタ集合としては図4に示す階層構造から生成されるすべてのクラスタ([機種A、機種Aの機能A]、[機種A、機種Aの機能A、機種B]、[機種C、機種D]、[機種A、機種Aの機能A、機種B、機種C、機種D])を用いる。
【0025】
図5には、Webサイトの構造分析を行おうとする者からターゲットとなるノード(ハイパーテキスト)が指定されたときに、当該ターゲットとの関係で構造分析して表示するノードをハイパーテキスト選択部110がの選択する処理手順を示してある。
まず、先程のログクラスタとコンテンツクラスタを読み込み(step2、3)、指定されたターゲットノード(本例では、機種A)の入力を受け付ける(step4)。次いで、ログクラスタ集合からターゲットノードを含むログクラスタを選出し、これら選出したログクラスタを集合とする(step5)。なお、以下では、対象を明確にするため、図示のようにクラスタ集合やクラスタに201〜205の符号を付して説明し、この選出したログクラスタ集合は集合(201)として説明する。
【0026】
次いで、次にログクラスタ集合(201)から1つのログクラスタ(202)を取り出し(step6、7)、当該ログクラスタ(202)に含まれるもっとも大きいコンテンツクラスタ(203)を選出する(step8)。例えば、図3に示したログクラスタ10であれば、図4に示すコンテンツクラスタ[機種Aの機能A、機種A]が選出される。
そして、このログクラスタ(202)コンテンツクラスタ(203)をペアにして集合(204)に加え(step9)、集合(201)に含まれる全てのログクラスタについて上記の処理を繰り返し行う。すなわち、このペア集合(204)に含まれるログクラスタ(202)はすべてターゲットノード(機種A)にアクセスした履歴に係るのもとなる。
【0027】
次いで、ペア集合(204)に対して、step10〜15の処理を行って、ターゲットノード(機種A)に係るログクラスタを1つ選択する。すなわち、本例では、ログクラスタ10が表示するノード集合として選択出力され、当該ログクラスタ10に含まれる個々のノードの情報が距離算出部130、関連度算出部140、図形化部150に渡される。
なお、ハイパーテキスト選択部110の処理手法は、本実施例に限らない。例えば、入力としてハイパーテキスト集合を分類したものが与えられれば、どのようなものでも良い。その際に単一のクラスタリング結果が与えられた場合には、ターゲットとされる要素を含むクラスタを選出し、クラスタが複数存在した場合には、予め定められた選択基準に従い選択するか、必要に応じてユーザに問い合わせることで選択を求め、表示するノード集合を選択する。
【0028】
次に、上記のように表示対象として選択された個々のノードが距離算出部130に入力されると、当該距離算出部130においてノード間のリンク距離を算出する。
本実施例では、リンクの向きを考慮しないでターゲットノードから個々のノード間を遷移する際に経由するノードの最小値を距離とする。例えば、図2において(機A)と(機種Aの機能A)とは距離1の関係にあり、(機種A)と(機種B)は距離2の関係にある。仮に、機種Aから機種Bへのリンクが存在した場合には、機種Aと機種Bの距離は1となる。本実施例では、(機種A)と残りの各ページ(ノード)との距離は、プリンタ:距離1、サイトの入り口:距離2となる。
【0029】
なお、距離算出部130においては、リンクの向きについて考慮して算出することも出来る。
この場合、例えば、ターゲットノードからリンクを戻り続けたときに経由するノード数の最小値とターゲットノードからリンクを先に進み続けたときに経由するノード数の最小値とで小さい方の値を距離とする。また、例えば、ターゲットノードから到達できない場合には、予め定められた値を距離とする。
また、双方向リンクが存在し、双方の値が一致した場合には、次の関連度算出部140において算出される関連度に従い2ヶ所に表示する。
【0030】
ここで、本実施例のサイト構造では、機種Aから機種Bへはリンクを一方向に辿って到達することは出来ないので、距離は予め定められた値となる。
また、本実施例では、生成されたログクラスタがリンクで到達可能なノードの組み合わせによって生成されているため、ターゲットノードと他のノードとの間のリンクを辿る間に選択されたノード集合に含まれないノードを経由しない。しかし、ノード選択の仕方によっては、選択されたノード集合中に含まれないノードを経由する場合があり、その場合には、選択されたノード集合に含まれないノードをハイパーテキスト追加部120によって追加する。
【0031】
次に、関連度算出部140において、ターゲットノードと個々のノード間の関連度を算出する。本実施例では関連度を下記の式(1)、式(2)で定義する。
【0032】
【数1】
Figure 0003832154
【0033】
【数2】
Figure 0003832154
【0034】
Angle(N)は、ターゲットノードとノードNとの間の関連度を表しており、Access(N)はノードNを訪れた(アクセスした)ユーザ集合を表し、|Access(N)|はノードNを訪れたユーザ数を表している。
ノードNをターゲットノードより後に訪れたユーザ集合については式(1)を適用し、ノードNをターゲットノードより前に訪れたユーザ集合については式(2)を用いる。すなわち、後述するように極座標表示する本実施例では、ターゲットノードから遷移してアクセスされたノードとの関連度は0〜πの範囲で表現され、アクセスされた後にターゲットノードへ遷移したノードとの関連度は0〜−πの範囲で表現される。
【0035】
このようにすると、一つのノードが2個所に表示されることになるが、アクセスログの形態やプロキシなどによってアクセス経路を特定できない場合には、距離を算出する際に用いられたターゲットノードとノードNとの間のリンク系列の中で最終的にターゲットに至るリンクが、ターゲットから出ているリンクの場合には式(1)を、ターゲットに入っているリンクの場合には式(2)を用いることとなる。
なお、本実施例では、Angle(サイトの入り口) =−πとし、Angle(プリンタ) =−πとし、Angle(機種Aの機能A)=1/4πとし、Angle(機種B) =−3/4πと算出されたとする。
【0036】
次に、図形化部150が個々のノードの座標軸上での表現を次のようにして決定する。
個々のノードが表すハイパーテキストをそのまま座標軸上で表示すると、一つのノードを表すために費やされる領域が大きくなるため、ノードの重なりが大きくなり位置関係の把握が困難になる。また、個々のノードをすべて同じ図形(○や×)などで表示した場合には、個々のノードがどのハイパーテキストに対応しているのか、一つ一つ実際のハイパーテキストを見て確認する手間が生じる。
そこで、本実施例では、各ノードを極座標上で識別可能な形で表示するために、図形化部150が各ハイパーテキストを特徴づける要素を選択し、選択された特徴によって各ハイパーテキストを表す。
【0037】
【数3】
Figure 0003832154
【0038】
本実施例の図形化部150では、特徴を各ハイパーテキストにおけるタグとタグ中の単語、画像の組とし、式(3)によって算出された識別度を用いて識別度をスコアづけし、スコアの高い特徴を各ハイパーテキストを表す図形として座標軸上に表示する。
式(3)においては、Cは表示するノード集合、|C|はノード集合Cに含まれるノードの数を表し、f(t,di)はノードdiにおける特徴tの重みを表す。重みについては語の出現頻度とタグごとの重み付けの積で表すことができ、例えば、ノード[サイトの入り口]において語が一度タグ<title></title>中に出現した場合には、ノード[サイトの入り口]における特徴“Welcome”の重みは、1×10=10となる。語“Products”が<H2></H2>タグと<H1></H1>に2度出現していれば、重みは1×5+1×3=8となる。識別度Scoreについては、“Welcome”が他のノード中で出現していなければその識別度は5となる。
【0039】
なお、図形化部150の処理手法は、上記方法に限らない。例えば、単純に各ノードの表すハイパーテキストのタイトルやURLや、それらの一部を表示することも考えられる。
本実施例では、それぞれノードを表す図形として図6に示されるものが選択されたとする。
【0040】
次に、同一の座標に表示されるノードを重なり検出部160で検出し、重なりが検出された場合には、極座標を奥行き方向に移動させた面で表示を行う。
図7にはその一例を示してあり、rを半径、θを角度としたとき、極座標(r、θ)=(1,π/2)の位置に二つのノードが重なったため、奥行き方向(z方向)にずらして表示することで、3次元表示を行う。このように3次元表示を行うことで、見る角度をずらしたり、或いはz軸による断面で見ることで、個々のノードを識別することが可能となる。
なお、重なり部分の検出は上記手法に限らず、各座標から予め定められた領域内に他のノードの座標が存在する場合に重なるとしてもよい。
【0041】
次に、表示部170によって、各ハイパーテキストを図形化した表現をその座標に基づいて極座標面上に配置して、図6に示すようにディスプレイ画面に表示する。表示部170においては、同図に示すように、含まれるクラスタによって図形を囲む枠の色を区別したり、ハイパーテキスト追加部120によって追加されたノードについて図形を囲む枠の色を変更したりすることで識別を可能にする。
本実施例ではコンテンツクラスタに含まれる要素を黒線で囲み、ログクラスタのみに含まれる要素を灰色線で囲んで表示している。
【0042】
次に、座標軸上で予め定められた位置に存在するノードについて、問題の可能性を提示する変更候補提示部180について説明する。なお、本実施例では、図8に示す極座標系中の領域1と領域2を予め定められた問題の可能性のある領域とする。
すなわち、表示部170によって極座標上に画面表示された各ノードに対して、変更候補提示部180は、これら予め設定した領域内にあるノードに対して他と識別可能な態様で表示する、これら予め設定した領域内にあるノードのみの表示に切り替える等して、構成変更すべき候補をユーザに対して提示する。
【0043】
領域1は、リンクの近い位置にユーザの多くが訪れていないノードが存在することを示しており、表示すべきノードを選択する際のクラスタがコンテンツの内容を考慮したものである場合には、内容類似度とユーザのアクセス頻度が一致していないことであり、サイト構築者の意図どおりユーザがアクセスできていない可能性が考えられる領域である。
領域2は、多くのユーザが多のノードから遷移してアクセスしているのにもかかわらずリンクを多く辿らねば到達できないというものである。つまり、ユーザに多くのクリック(リンクを辿ること)を要求しており、ユーザに不便をかけている可能性が考えられる領域である。
【0044】
なお、これらの領域は、領域選択の入力とするクラスタの生成手法によって異なり、前述の領域には限定されない。図6の例では、機種Aと機種Bの相関がとても高いことがわかる。また、機種Aの機能Aとは内容的に類似度が高いにも関わらず、機種Aとのユーザによるアクセスの相関が低いことが視覚的にわかる。従来では、機種Aの機能Aのノードに問題がある可能性が高いということが提示される程度であったが、本発明によると、これに加えてコンテンツの類似性のあるノードやユーザが一緒に訪れているノードとの関係を図示するが可能となった。本実施例では図示された関係から機種Bをみたユーザが多く機種Aを見に来ている事実を更に得ることができ、このような事実は機能Aのノードを改善する上で有効な情報になる。
【0045】
なお、上記の実施例では、算出されたノード間のリンク距離を半径とし、算出された関連度を角度として極座標表示したが、図9に示すようにリンク距離と関連度とをそれぞれ2次元直交座標系の軸に割り当てて、原点位置のターゲットノード(機種A)と各ノードとの関係を2次元座標系上に表示しても上記と同様な作用効果を得ることができる。
【0046】
【発明の効果】
以上説明したように本発明によると、Webサイトのハイパーテキストのリンク距離とユーザのアクセス傾向との関連を可視化提示することができるため、これによって、ユーザが移動する傾向が高いにもかかわらずリンク距離が遠いハイパーテキストの存在や、ユーザが移動する傾向が低いにもかかわらずリンク距離が近いハイパーテキストの存在を管理者に容易に把握させることができ、Webサイト構造において問題のある個所の分析を容易化することができる。
【図面の簡単な説明】
【図1】 本発明の一実施例にかかるWebサイトの構成変更支援装置の構成図である。
【図2】 Webサイトの構成の一例を示す図である。
【図3】 ログクラスタの一例を示す図である。
【図4】 コンテンツクラスタの一例を示す図である。
【図5】 ハイパーテキスト選択部の処理手順を示すフローチャートである。
【図6】 構造解析されたノードの表示例を示す図である。
【図7】 3次元表示を説明する図である。
【図8】 構造的に問題のある領域を説明する図である。
【図9】 本発明の他の表示例を示す図である。
【符号の説明】
100:Webサーバ、 101:コンテンツ提供部、
102:ログ記録部、 110:ハイパーテキスト選択部、
120:ハイパーテキスト追加部、 130:距離算出部、
140:関連度算出部、 150:図形化部、
160:重なり判定部、 170:表示部、
180:変更候補提示部、

Claims (14)

  1. 情報システムによって管理されたハイパーテキスト群に対して、指定されたハイパーテキストを含むハイパーテキスト集合を選択する選択手段と、
    選択手段によって選択されたハイパーテキスト集合の個々のハイパーテキストと前記指定されたハイパーテキストとの間のリンク距離を算出する距離算出手段と、
    選択手段によって選択されたハイパーテキスト集合の個々のハイパーテキストと前記指定されたハイパーテキストとの間の遷移度合いを表す関連度を算出する関連度算出手段と、
    距離算出手段によって算出された値を半径に対応付けるとともに関連度算出手段によって算出された値を角度に対応付けて、前記選択された個々のハイパーテキストを図形化して極座標系上に表示する図形化表示手段と、
    を備えたことを特徴とするWebサイトの構成変更支援装置。
  2. 情報システムによって管理されたハイパーテキスト群に対して、指定されたハイパーテキストを含むハイパーテキスト集合を選択する選択手段と、
    選択手段によって選択されたハイパーテキスト集合の個々のハイパーテキストと前記指定されたハイパーテキストとの間のリンク距離を算出する距離算出手段と、
    選択手段によって選択されたハイパーテキスト集合の個々のハイパーテキストと前記指定されたハイパーテキストとの間のアクセス遷移度合いを表す関連度を算出する関連度算出手段と、
    距離算出手段によって算出された値を一方の軸に対応付けるとともに関連度算出手段によって算出された値をもう一方の軸に対応付けて、前記選択された個々のハイパーテキストを図形化して2次元直交座標系上に表示する図形化表示手段と、
    を備えたことを特徴とするWebサイトの構成変更支援装置。
  3. 請求項1又は請求項2に記載のWebサイトの構成変更支援装置において、
    距離算出手段は、前記指定されたハイパーテキストと選択手段により選択されたハイパーテキスト集合の個々のハイパーテキストとの間をリンクを遷移して移動するために経由するハイパーテキストの数の最小値を、当該指定されたハイパーテキストと当該選択されたハイパーテキスト集合の個々のハイパーテキストとの間のリンク距離として算出することを特徴とするWebサイトの構成変更支援装置。
  4. 請求項1又は請求項2に記載のWebサイトの構成変更支援装置において、
    距離算出手段は、前記指定されたハイパーテキストと選択手段により選択されたハイパーテキスト集合の個々のハイパーテキストとの間をリンクの向きを考慮して同一方向のみにリンクを遷移して移動するために経由するハイパーテキストの数を、当該指定されたハイパーテキストと当該選択されたハイパーテキスト集合の個々のハイパーテキストとの間のリンク距離として算出し、算出されたリンク距離が予め定められた値を超える場合には予め定められた設定値を距離とすることを特徴とするWebサイトの構成変更支援装置。
  5. 請求項1又は請求項2に記載のWebサイトの構成変更支援装置において、
    距離算出手段は、前記指定されたハイパーテキストから選択手段により選択されたハイパーテキスト集合の個々のハイパーテキストに至るまでに、個々のユーザが経由したハイパーテキストの数の平均値をリンク距離として算出することを特徴とするWebサイトの構成変更支援装置。
  6. 請求項1又は請求項2に記載のWebサイトの構成変更支援装置において、
    関連度算出手段は、前記指定されたハイパーテキストを閲覧したユーザ集合中の、選択手段によって選択されたハイパーテキスト集合の個々のハイパーテキストを訪れたユーザの割合を個々のハイパーテキストの関連度とすることを特徴とするWebサイトの構成変更支援装置。
  7. 請求項1乃至請求項6のいずれか1項に記載のWebサイトの構成変更支援装置において、
    図形化表示手段は、距離算出手段により距離を算出する際に経由したハイパーテキストが選択手段によって選択されたハイパーテキスト集合に含まれていない場合には、当該ハイパーテキストを前記選択手段によって選択されたハイパーテキスト集合と区別可能な態様で画面に表示することを特徴とするWebサイトの構成変更支援装置。
  8. 請求項1乃至請求項7のいずれか1項に記載のWebサイトの構成変更支援装置において、
    図形化表示手段は、表示すべきハイパーテキスト集合を構成する個々のハイパーテキストを構成するタグとタグ中に含まれる要素の組み合わせを抽出して個々のハイパーテキストの特徴を抽出し、抽出された特徴についてのハイパーテキスト集合における重要度と個々のハイパーテキストにおける重要度から、各特徴の個々のハイパーテキストにおける他のハイパーテキストとの識別度を算出し、算出された識別度に基づいて各ハイパーテキストを表す図形を決定して表示することを特徴とするWebサイトの構成変更支援装置。
  9. 請求項1乃至請求項8のいずれか1項に記載のWebサイトの構成変更支援装置において、
    図形化したハイパーテキストの表示位置に応じて、予め定められた座標領域に存在するハイパーテキストについてハイパーテキスト構造に問題が有る可能性のある候補として提示する変更候補提示手段を有することを特徴とするWebサイトの構成変更支援装置。
  10. 請求項1乃至請求項9のいずれか1項に記載のWebサイトの構成変更支援装置において、
    各ハイパーテキストを表す図形の座標系における重なりを判断する重なり判定手段を有し、
    重なり判定手段が重なりを判定した場合には、図形化表示手段は座標系に奥行き方向の軸を設定し、奥行き方向の座標をずらして3次元表示することを特徴とするWebサイトの構成変更支援装置。
  11. 請求項1乃至請求項10のいずれか1項に記載のWebサイトの構成変更支援装置において、
    ハイパーテキスト群に対するアクセス履歴に基づいて当該ハイパーテキスト群をクラスタリングしたログクラスタ集合と、ハイパーテキスト群を個々のハイパーテキスト間の内容の類似度に基づいてクラスタリングしたコンテンツクラスタ集合とを用意し、
    選択手段は、ログクラスタ集合から前記指定されたハイパーテキストを含むログクラスタを選出し、これらログクラスタに含まれるコンテンツクラスタをコンテンツクラスタ集合から選出し、当該選出されたコンテンツクラスタに対応するログクラスタに含まれるハイパーテキストを距離算出及び関連度算出の対象となるハイパーテキスト集合として選択することを特徴とするWebサイトの構成変更支援装置。
  12. 情報システムによって管理されたハイパーテキスト群に対して、指定されたハイパーテキストを含むハイパーテキスト集合を選択する選択手段と、
    選択手段によって選択されたハイパーテキスト集合の個々のハイパーテキストと前記指定されたハイパーテキストとの間のリンク距離を算出する距離算出手段と、
    選択手段によって選択されたハイパーテキスト集合の個々のハイパーテキストと前記指定されたハイパーテキストとの間の遷移度合いを表す関連度を算出する関連度算出手段と、
    距離算出手段によって算出された値を半径に対応付けるとともに関連度算出手段によって算出された値を角度に対応付けて、前記選択された個々のハイパーテキストを図形化して極座標系上に表示する図形化表示手段と、
    をコンピュータにより実現するプログラムを読み取り可能に記憶した記憶媒体。
  13. 情報システムによって管理されたハイパーテキスト群に対して、指定されたハイパーテキストを含むハイパーテキスト集合を選択する選択手段と、
    選択手段によって選択されたハイパーテキスト集合の個々のハイパーテキストと前記指定されたハイパーテキストとの間のリンク距離を算出する距離算出手段と、
    選択手段によって選択されたハイパーテキスト集合の個々のハイパーテキストと前記指定されたハイパーテキストとの間のアクセス遷移度合いを表す関連度を算出する関連度算出手段と、
    距離算出手段によって算出された値を一方の軸に対応付けるとともに関連度算出手段によって算出された値をもう一方の軸に対応付けて、前記選択された個々のハイパーテキストを図形化して2次元直交座標系上に表示する図形化表示手段と、
    をコンピュータにより実現するプログラムを読み取り可能に記憶した記憶媒体。
  14. 支援装置に備えられた選択手段と、距離算出手段と、関係度算出手段と、図形化表示手段とにより行うWebサイトの構成変更支援方法であって、
    選択手段が、情報システムによって管理されたハイパーテキスト群に対して、指定されたハイパーテキストを含むハイパーテキスト集合を選択し、
    距離算出手段が、選択手段によって選択されたハイパーテキスト集合の個々のハイパーテキストと前記指定されたハイパーテキストとの間のリンク距離を算出し、
    関連度算出手段が、選択手段によって選択されたハイパーテキスト集合の個々のハイパーテキストと前記指定されたハイパーテキストとの間の遷移度合いを表す関連度を算出し、
    図形化表示手段が、距離算出手段によって算出された値を半径に対応付けるとともに関連度算出手段によって算出された値を角度に対応付けて、前記選択された個々のハイパーテキストを図形化して極座標系上に表示することを特徴とするWebサイトの構成変更支援方法。
JP22715199A 1999-08-11 1999-08-11 Webサイトの構成変更支援装置 Expired - Fee Related JP3832154B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP22715199A JP3832154B2 (ja) 1999-08-11 1999-08-11 Webサイトの構成変更支援装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP22715199A JP3832154B2 (ja) 1999-08-11 1999-08-11 Webサイトの構成変更支援装置

Publications (3)

Publication Number Publication Date
JP2001051763A JP2001051763A (ja) 2001-02-23
JP2001051763A5 JP2001051763A5 (ja) 2004-12-24
JP3832154B2 true JP3832154B2 (ja) 2006-10-11

Family

ID=16856305

Family Applications (1)

Application Number Title Priority Date Filing Date
JP22715199A Expired - Fee Related JP3832154B2 (ja) 1999-08-11 1999-08-11 Webサイトの構成変更支援装置

Country Status (1)

Country Link
JP (1) JP3832154B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3778270B2 (ja) * 2001-05-17 2006-05-24 克彦 近藤 選択履歴管理情報、選択履歴情報、情報記憶媒体、及びユーザーインターフェース補助システム
JP2003006224A (ja) * 2001-06-26 2003-01-10 Kawasaki Heavy Ind Ltd Wwwページの自動更新方法および自動更新装置
JP4892896B2 (ja) * 2005-09-05 2012-03-07 富士ゼロックス株式会社 コミュニケーション分析装置および方法
JP4826221B2 (ja) * 2005-11-09 2011-11-30 富士ゼロックス株式会社 アクセス分析システム
JP5545319B2 (ja) * 2012-05-01 2014-07-09 富士通株式会社 プログラム及び制御方法

Also Published As

Publication number Publication date
JP2001051763A (ja) 2001-02-23

Similar Documents

Publication Publication Date Title
JP3476185B2 (ja) 情報抽出システム、情報処理装置、情報収集装置、文字列抽出方法及び記憶媒体
US6169997B1 (en) Method and apparatus for forming subject (context) map and presenting Internet data according to the subject map
US10911554B2 (en) Method and system for tracking web link usage
JP6753186B2 (ja) トピック中心可視情報表示方法、プログラム、および計算処理デバイス
US11681860B2 (en) Methods and systems for guided information viewing and storage platforms
US6029180A (en) Information presentation apparatus and method
KR101201580B1 (ko) 웹 지도 상에서의 트래픽 시각화
US8290986B2 (en) Determining quality measures for web objects based on searcher behavior
CA2505317A1 (en) Method and system for calculating importance of a block within a display page
JP2002197376A (ja) ユーザに応じてカストマイズされた仮想世界を提供する方法および装置
JP2006524865A (ja) ウェブサイトクリックとウェブページ上のリンクとの関連付け
CN103270510A (zh) 用于在搜索结果页面上提供情境动作的系统和方法
CN108959595B (zh) 基于虚拟与现实的网站构建和体验方法及其装置
WO2001063376A2 (en) System for obtaining information based on communication of users
KR20130033418A (ko) 정보 제공 장치, 정보 제공 방법, 정보 표시 장치, 정보 표시 방법, 정보 검색 시스템, 및 기록 매체
JP3832154B2 (ja) Webサイトの構成変更支援装置
Dawis et al. Evaluation of the website ‘Aisyiyah Surakarta of University performance based on search engine optimization using automated software testing Gtmetrix
JP2004178263A (ja) Webサーバ、Javaサーブレットの機能を有するWebサーバ、およびコンピュータプログラム
WO2015140922A1 (ja) 情報処理システム、情報処理方法、および情報処理プログラム
JP3255264B2 (ja) 情報空間アクセス支援方法および装置
JP3931496B2 (ja) ハイパーテキスト解析装置
CN108021699A (zh) 单页web网站的响应优化方法和系统
KR100402642B1 (ko) 인터넷 검색엔진의 검색결과를 표시하는 방법
AU2015258314B2 (en) Method and system to provide a scroll map
JP2008299788A (ja) ウェブサーバ装置、ウェブサーバプログラムおよびウェブサーバ装置の管理方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040122

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040122

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060615

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060627

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060710

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100728

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110728

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110728

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120728

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130728

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees