JP2000172665A - ハイパーテキスト解析装置及び方法、ハイパーテキスト解析プログラムを記録した記憶媒体 - Google Patents

ハイパーテキスト解析装置及び方法、ハイパーテキスト解析プログラムを記録した記憶媒体

Info

Publication number
JP2000172665A
JP2000172665A JP10345759A JP34575998A JP2000172665A JP 2000172665 A JP2000172665 A JP 2000172665A JP 10345759 A JP10345759 A JP 10345759A JP 34575998 A JP34575998 A JP 34575998A JP 2000172665 A JP2000172665 A JP 2000172665A
Authority
JP
Japan
Prior art keywords
hyperlink
hypertext
access
cohesion
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10345759A
Other languages
English (en)
Other versions
JP3705331B2 (ja
Inventor
Takehiro Nakayama
雄大 中山
Hiroki Kato
裕樹 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP34575998A priority Critical patent/JP3705331B2/ja
Publication of JP2000172665A publication Critical patent/JP2000172665A/ja
Application granted granted Critical
Publication of JP3705331B2 publication Critical patent/JP3705331B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 アクセス履歴からユーザのアクセス傾向を認
識できるとともに、ハイパーテキストシステムの構成の
優劣を判断するような知識を得ることを支援するハイパ
ーテキスト解析装置を提供する。 【解決手段】 アクセス傾向解析部21は、Webサー
バ1上のノード群に対し、それぞれに対応するアクセス
履歴情報11を用いてクラスタリングの処理を行う。ハ
イパーリンク構成解析部22は、アクセス傾向解析部2
1で生成された各クラスタについて、クラスタを構成す
るノード間のハイパーリンク結束度を計算する。このハ
イパーリンク結束度は、アクセス履歴に基づいてクラス
タリングされた結果を用いているので、ユーザのアクセ
ス傾向を反映している。このハイパーリンク構成解析部
22で計算されたハイパーリンク結束度の値を、ハイパ
ーリンク結束度表示部23において利用しやすい形態で
表示する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ネットワーク上に
構成されるハイパーテキストシステムにおいて、その構
成の優劣を判断するための知識を発見するためにハイパ
ーリンク構造を解析するハイパーテキスト解析装置及び
ハイパーテキスト解析方法と、そのハイパーテキスト解
析装置または方法をコンピュータで実現するためのハイ
パーテキスト解析プログラムを記録した記録媒体に関す
るものである。
【0002】
【従来の技術】ネットワーク上に構成されるハイパーテ
キストシステム(例えば、WorldWide We
b:以降Webと略す)では、ハイパーテキストを格納
しているサーバにおいてユーザ(訪問者)のアクセス履
歴を記録することができる。このアクセス履歴には、一
般に、アクセスしてきたユーザが使用しているコンピュ
ータの識別子(インターネットを利用しているのであれ
ばIPアドレス)、アクセスしてきた時刻、アクセスし
たノードのサーバ上での識別子(WebではURL)が
含まれる。
【0003】アクセス履歴を解析して、個々のユーザが
遷移したハイパーリンクの経路を特定するには、基本的
には、各コンピュータ毎にアクセスしたノードを時刻順
に並べればよい。しかし、コンピュータのキャッシュ機
能等により完全な経路を特定することは困難であった。
【0004】これに対し、例えば、C.Shahab
i,A.M.Zarkesh,J.Adibi,and
V.Shah,“Knowledge Discov
eryfrom Users Web−Page Na
vigation”,inProc. of IEEE
RIDE, 1997.では、リモートエージェント
を使うことによりキャッシュへのアクセスを認識してい
る。これによって、より正確な経路を得ることができる
ようになった。ただし、ユーザのコンピュータ側でリモ
ートエージェントプログラムをロードするためのコスト
(時間とスペース)が犠牲となるという不具合がある。
【0005】アクセス履歴を利用して重要経路を発見す
る技術としては、例えば、J.Borges and
M.Levene,“Mining Associat
ion Rules in Hypertext Da
tabases”,in Proc. of KDD,
1998.に記載されている技術がある。この技術は、
まずアクセス履歴を収集して、ハイパーリンクのトラフ
ィック量を重みとする有向グラフでハイパー構造を表現
する。この有向グラフにおいて、ノードAからノードB
への遷移をA→Bと記し、これを結合規則と呼ぶ。結合
規則は、コンフィデンス値(=Aを起点とする遷移の総
数に対するA→Bの遷移の総数)とサポート値(=有向
グラフ中のすべてのアークの遷移数の平均値に対するA
→Bの遷移の総数)によって評価される。さらに、結合
規則を合成した合成結合規則(A→B)&(B→C)&
(C→D)&...を定義して3つ以上のノードの遷移
を評価している。
【0006】この手法では、コンピュータ識別子(IP
アドレス)の情報は利用していないので、合成結合規則
においては、単にトラフィック量が多いハイパーリンク
の組み合わせ経路を発見しているに過ぎない。例えば、
(A→B)&(B→C)という合成結合規則が、高いコ
ンフィデンス値とサポート値を持っていることがわかっ
たとしても、実際に、A→B→Cという経路を辿ったユ
ーザが多かったとは限らない。
【0007】このように従来技術によって、ユーザのア
クセス経路を特定したり、重要経路を発見することは可
能である。しかし、ハイパーテキストシステム(例え
ば、Webサイト)の構成の優劣を判断するような知識
を得ることはできなかった。
【0008】
【発明が解決しようとする課題】本発明は、上述した事
情に鑑みてなされたもので、アクセス履歴からユーザの
アクセス傾向を認識できるとともに、ハイパーテキスト
システムの構成の優劣を判断するような知識を得ること
を支援するハイパーテキスト解析装置及びハイパーテキ
スト解析方法を提供することを目的とするものである。
また、そのハイパーテキスト解析装置または方法をコン
ピュータで実現するためのハイパーテキスト解析プログ
ラムを記録した記録媒体を提供することを目的とするも
のである。
【0009】
【課題を解決するための手段】本発明は、ハイパーテキ
ストシステムへのアクセス履歴情報に基づいて該ハイパ
ーテキストシステムを構成するノードに対してクラスタ
リングを行い、得られた各クラスタについて該クラスタ
を構成するノード間のハイパーリンク結束度を計算し、
計算したハイパーリンク結束度を表示することを特徴と
するものである。表示されるハイパーリンク結束度は、
ユーザがアクセスした履歴に基づいた値であるから、ユ
ーザのアクセス傾向を示している。そのため、ハイパー
リンク結束度を得ることによって、例えばハイパーテキ
ストシステム(例えばWebサイト)のハイパーリンク
構成などとともに、ハイパーテキストシステムの構成の
優劣を判断することが可能となる。
【0010】
【発明の実施の形態】図1は、本発明の第1の実施の形
態を示す構成図、図2は、Webの一例の説明図であ
る。図中、1はWebサーバ、2はハイパーテキスト解
析装置、11はアクセス履歴情報、21はアクセス傾向
解析部、22はハイパーリンク構成解析部、23はハイ
パーリンク結束度表示部である。ネットワーク上に構成
されるハイパーテキストシステムのなかで代表的なもの
はWebである。以下、Webを例として説明する。
【0011】Webサーバ1は、ネットワーク上で情報
を発信する手段である。Webサーバ1には、図2に示
すように、ユーザに提供したい情報がノード(矩形で示
す)とハイパーリンク(矢線で示す)によるハイパー構
造で貯えられている。ユーザはWebサーバ1にアクセ
スすることでコンテンツを入手できる。このとき、We
bサーバ1では、一般に、ユーザのアクセスがある毎
に、ユーザのコンピュータを識別するためのコンピュー
タ識別子(IPアドレス)とアクセス時刻とユーザのア
クセスしたノードのあるアドレス(URL)をアクセス
履歴情報11として記録している。
【0012】ハイパーテキスト解析装置2は、アクセス
傾向解析部21,ハイパーリンク構成解析部22,ハイ
パーリンク結束度表示部23などを有している。アクセ
ス傾向解析部21は、Webサーバ1上のノード群に対
し、それぞれに対応するアクセス履歴情報11を用いて
クラスタリングの処理を施す。このクラスタリングの処
理には既存の技術を使用することができる。例えば、A
gglomerative Hierarchical
Clusteringによるクラスタリングの方法で
は、以下の1,2,3のステップを行う。 1.Webサーバ1上の各ノードをそれぞれ一つのクラ
スタとする。 2.各クラスタ間の類似度を計算し、最大類似度を持つ
クラスタ同士を一つのクラスタにマージする。 3.クラスタが一つになるまで2の処理を繰り返す。 この過程の途中で順次生成されるそれぞれのクラスタを
クラスタリングの処理結果として得る。例えば1.の処
理において生成される各ノードのみのクラスタ、そのク
ラスタをマージした各クラスタ、最後に生成された1つ
のクラスタなどがクラスタリング結果となる。なお、上
述のクラスタリングの方法は、例えば、E.M.Voo
rhees,“Implementing Agglo
merative Hierarchical Clu
stering Algorithms for Us
e in Document Retrieval”,
Information Processing&Ma
nagement,Vol.22,No.6,1986
等に記載されている。
【0013】アクセス傾向解析部21では、上述のクラ
スタリング処理の2.の処理における類似度計算におい
て、アクセス履歴情報11の重複度合いを利用する。具
体的には、例えば、アクセス履歴情報11の中のIPア
ドレスに注目して、クラスタ間で共有するIPアドレス
の数を類似度と定義する。または、クラスタ間で共有す
るIPアドレスの数を当該二つのクラスタが持つ全ての
IPアドレスの数で割った値を類似度と定義する。ここ
で、クラスタが持つIPアドレスとは、クラスタを構成
する各ノードへのアクセス履歴を全てマージして、その
中に出現するIPアドレスのことである。IPアドレス
の数は、このようなIPアドレスから重複を排除した異
なるIPアドレスを計数した値とすることができる。な
お、IPアドレスを用いる代わりに、例えばアクセス履
歴情報11中のアクセス時刻を用いてもよい。この場
合、秒や分単位ではなく日付や月の単位で取り扱うとよ
い。
【0014】あるいは、類似度計算として、各クラスタ
を該クラスタに対応するアクセス履歴情報11を項と
し、該アクセス履歴情報の出現頻度を該項の値とするよ
うなベクトルを生成して、ベクトル間の内積値の大小を
類似度として用いてもよい。
【0015】ハイパーリンク構成解析部22は、アクセ
ス傾向解析部21で生成された各クラスタについて、ク
ラスタを構成するノード間のハイパーリンク結束度(以
下、単に結束度と呼ぶ)を計算する。結束度は、例え
ば、ノード間に一つ以上のハイパーリンクが存在すれ
ば、そのノード間には結合があると定義したときに、ク
ラスタを構成するノード間結合の総数を、クラスタを構
成する全てのノードから二つを選ぶ組み合わせ数で割っ
た値とすることができる。すなわち、ノード間結合の総
数をL、ノード数をNとしたとき、 結束度=L/ で計算することができる。ハイパーリンク構成解析部2
2で計算した、各クラスタの結束度の値は、ハイパーリ
ンク結束度表示部23に渡される。
【0016】ハイパーリンク結束度表示部23は、ハイ
パーリンク構成解析部22で計算された結束度の値を、
利用しやすい形態で表示する。図3は、ハイパーリンク
結束度表示部による表示の一例の説明図である。例え
ば、結束度の値をいくつかのセグメントに分け、各セグ
メントに入るクラスタの数を棒グラフで表示することが
できる。図3では、クラスタ数の分布を縦軸とし、結束
度を横軸として、二つのWebサイト(WebサイトA
とWebサイトB)について並べて表示したものであ
る。前述のように、各クラスタはアクセス履歴情報を基
に構成されているので、各クラスタを構成するノード群
は、例えば、同一のユーザから前後してアクセスされる
傾向が強いものである。ノード群の結束度が高いと、ユ
ーザにとってはノード間遷移のための経路が多数提供さ
れることになるので効率よくブラウジングできることに
なる。一方、該ノード群の結束度が低いとブラウジング
効率は悪くなる。図3では、WebサイトAの方は結束
度が低いクラスタが多数あり、WebサイトBの方は結
束度が高いクラスタが多数あるということが一目でわか
る。この表示によって、WebサイトBの方がWebサ
イトAよりも優れた構成でハイパーテキストシステムが
構築されていると容易に判断できる。
【0017】ハイパーリンク結束度表示部23は、図3
に示す表示形態のほか、各種の表示形態により結束度を
表示することが可能である。図4は、ハイパーリンク結
束度表示部による表示の別の例の説明図である。図4に
示した例では、クラスタのサイズと結束度の値の関係を
表示している。図中の点は、それぞれがクラスタを示し
ている。クラスタのサイズとしては、例えば、クラスタ
を構成するノード数や、クラスタを構成する各ノードが
持つ単語の総数や、クラスタを構成する各ノードのファ
イルサイズの総計などを用いることができる。図4に示
した例では、クラスタのサイズとしてクラスタを構成す
るノード数を用いて表示した例を示している。このよう
な表示を行った場合、同じクラスタサイズであれば、結
束度が高いほど優れた構成であると判断することができ
る。また、このような表示によって、クラスタサイズに
注目しながら、各クラスタの構成の優劣を俯瞰すること
ができる。
【0018】図5は、ハイパーリンク結束度表示部によ
る表示の別の例においてクラスタを選択した場合の表示
例の説明図である。図4に示したような結束度の表示が
行われているとき、クラスタを表す点をマウス等のポイ
ンティングデバイスで選択すると、図5に示すように、
選択されたクラスタを構成するノードのURL(識別
子)を表示できるように構成することができる。あるい
は、URLではなく、ノードのタイトルを表示してもよ
い。さらに、図5に示すように表示されたノード(UR
Lで表示されている)をマウス等のポインティングデバ
イスで選択すると、ネットワークを通じて選択したノー
ドにアクセスして、そのノードのコンテンツを獲得し、
そのコンテンツを表示するようにしてもよい。このよう
な表示によって、Webサイトの管理者は、Webサイ
ト内の問題箇所にアクセスしてコンテンツを参照するこ
とができ、さらに編集することができるので、Webサ
イト内の構成を容易に改善して行くことができる。
【0019】図6は、ハイパーリンク結束度表示部によ
る表示の別の例においてクラスタを選択した場合の別の
表示例の説明図である。図5に示した例と同様に、図4
に示したような結束度の表示が行われているとき、クラ
スタを表す点をマウス等のポインティングデバイスで選
択することにより、図6に示すように選択したクラスタ
を構成するノードとそのノード間のハイパーリンクを表
示することもできる。ここで、ノードのラベル(図6中
では、N1,N2,…,N10)は、URLでもタイト
ルでもよい。このような表示を行うことによって、We
bサイトの管理者は、Webサイト内の問題箇所を容易
に発見することができる。例えば図6に示したクラスタ
内のハイパーリンクの表示例では、N1〜N7とN8〜
N10の間にハイパーリンクがないのでユーザは両グル
ープ間を容易に行き来できないことがわかる。
【0020】図7は、ハイパーリンク結束度表示部によ
る表示のさらに別の例の説明図である。この例では、ク
ラスタ内のノード間の類似度と結束度の値との関係を表
示した例を示している。クラスタ内のノード間の類似度
としては、例えばアクセス傾向解析部21においてクラ
スタ生成時に用いた類似度の値を用いることができる。
このような表示において、同じクラスタ内類似度であれ
ば、結束度が高いほど優れた構成であると判断すること
ができる。このような表示によって、クラスタ内のノー
ド間の類似度に注目しながら、各クラスタの構成の優劣
を俯瞰することができる。
【0021】なお、ハイパーリンク結束度表示部23で
は、上述の各例に示した表示形態によらず、任意の形態
で結束度を表示させることができる。
【0022】図8は、本発明の第2の実施の形態を示す
構成図である。図中、図1と同様の部分には同じ符号を
付して説明を省略する。24は識別子獲得部である。識
別子獲得部24は、アクセス履歴情報11の中からWe
bサーバ1上の各ノード毎に予め定めたある一定期間に
アクセスしてきたコンピュータの識別子(例えばIPア
ドレス)を獲得する。
【0023】アクセス傾向解析部21は、第1の実施の
形態と同様に、Webサーバ1上のノード群に対し、そ
れぞれに対応するアクセス履歴情報11を用いてクラス
タリングの処理を施す。このクラスタリングの処理にお
いて類似度を計算する際に、識別子獲得部24において
獲得したコンピュータの識別子の重複度合いを利用する
ことができる。
【0024】図9は、識別子獲得部における処理の一例
を示すフローチャートである。まず、S31において、
アクセス履歴情報11の中から、予め定められた期間内
のアクセスに関するものだけを抽出し、残りを破棄す
る。S32において、S31で抽出されたアクセス履歴
情報11に存在する全てのコンピュータ識別子(IPア
ドレス)のうちの異なる識別子の数(異なり数)Nを求
める。次にS33において、アクセス履歴情報11に存
在する全てのノードについて、各ノード毎に次元数Nの
ベクトルを生成する。ここで、ベクトルの各項は、アル
ファベットの昇順(あるいは降順)に並べた互いに異な
るコンピュータ識別子(IPアドレス)に対応する。各
項の初期値は0としておく。次にS34において、アク
セス履歴情報11の中から各ノードにアクセスしてきた
コンピュータのコンピュータ識別子(IPアドレス)を
取り出し、対応するベクトルの項に1を加える。この処
理を、アクセス履歴情報11すべてについて、順に行
う。
【0025】このようにして得られたN次元のベクトル
を用いて、アクセス傾向解析部21では、ベクトル間の
内積値の大小を類似度としてクラスタリングをすること
ができる。ここでクラスタとクラスタをマージする際
は、それぞれのベクトルの和を取れば、これがマージさ
れたクラスタのベクトルとなる。
【0026】以降の処理は上述の第1の実施の形態と同
様である。ハイパーリンク構成解析部22において結束
度を計算し、ハイパーリンク結束度表示部23において
結束度を表示する。このとき、上述のような各種の表示
形態あるいはそれ以外の各種の表示形態で結束度を表示
することができる。
【0027】図10は、本発明の第3の実施の形態を示
す構成図である。図中、図1と同様の部分には同じ符号
を付して説明を省略する。25はコンピュータ識別子整
形部である。コンピュータ識別子整形部25は、Web
サーバ1に対するアクセスのうち、ユーザ(=人間)に
よって操作されるコンピュータからのものではなく、W
ebを網羅的にアクセスして自動的に情報を収集してい
る情報収集ロボットのようなコンピュータによるアクセ
スを排除する。例えば、ある慣習に従って情報収集ロボ
ットがアクセスする特殊なノード(Webでは、例えば
ルート直下に置かれるrobots.txtという名の
ファイル)へのアクセスの有無によって、情報収集ロボ
ットからのアクセスであるか否かを判断することができ
る。あるいは、短期間に多数のノードを網羅的にアクセ
スするという情報収集ロボットに特徴的な振る舞いの有
無や、既知の情報収集ロボットのコンピュータ識別子で
あるか否かによっても、情報収集ロボットを識別するこ
とができる。情報収集ロボットからのアクセスであると
判断されたコンピュータについては、そのコンピュータ
識別子に関わるアクセス履歴情報11を、識別子獲得部
24において獲得しないようにすることができる。
【0028】これによって、情報収集ロボットのような
Webを網羅的にアクセスして自動的に情報を収集して
いるコンピュータによるアクセスを排除し、解析結果に
対するこれらの影響を除去することができ、ユーザのア
クセス動向を正しく反映した解析結果を得ることができ
る。
【0029】なお、この第3の実施の形態におけるその
他の構成および動作は、上述の第2の実施の形態と同様
である。
【0030】図11は、本発明の第4の実施の形態を示
す構成図である。図中、図1と同様の部分には同じ符号
を付して説明を省略する。26はハイパーリンク結束度
評価部である。ハイパーリンク結束度評価部26は、ハ
イパーリンク構成解析部22で得られた各クラスタの結
束度の値を予め定められた閾値と比較し、結束度が閾値
よりも小さなクラスタをハイパーリンク結束度表示部2
3に渡す。これによって、ハイパーリンク結束度表示部
23では結束度が小さい、すなわち構成が劣るクラスタ
とそのクラスタを構成するノードを容易に得ることがで
きる。
【0031】図12は、ハイパーリンク結束度表示部に
よる表示のさらに別の例の説明図である。図12に示し
た表示例では、結束度の値が小さい順にクラスタおよび
そのクラスタを構成するノードの識別子(URL)を表
示している。クラスタは「ID」の欄に示している。こ
こで「ID」は、クラスタを参照するためにユニークに
つけられた番号である。例えば、アクセス傾向解析部2
1におけるクラスタ生成時に、生成された順に番号を付
与すればよい。このような表示によって、構成上劣って
いる部分から表示されるので、ユーザが利用する上でネ
ックとなっている部分を容易に知ることができる。もち
ろん、この第4の実施の形態においても、第1の実施の
形態で示したような各種の表示形態あるいはその他の表
示形態で結束度を表示することが可能である。また、第
2,第3の実施の形態で説明した識別子獲得部24,コ
ンピュータ識別子政経部25などを設けてもよい。
【0032】上述の実施の形態は、コンピュータプログ
ラムによっても実現することが可能である。その場合、
そのプログラムおよびそのプログラムが用いるデータな
どは、コンピュータが読み取り可能な記憶媒体に記録し
ておくことも可能である。記憶媒体とは、コンピュータ
のハードウェア資源に備えられている読取装置に対し
て、プログラムの記述内容に応じて、磁気、光、電気等
のエネルギーの変化状態を引き起こして、それに対応す
る信号の形式で、読取装置にプログラムの記述内容を伝
達できるものである。例えば、磁気ディスク、光ディス
ク、CD−ROM、コンピュータに内蔵されるメモリ等
である。
【0033】
【発明の効果】以上の説明から明らかなように、本発明
によれば、ユーザのアクセス履歴情報に基づいて、ハイ
パーテキストシステムを構成するノードに対してクラス
タリングを行い、得られた各クラスタを構成するノード
間のハイパーリンク結束度を計算する。このハイパーリ
ンク結束度によって、ハイパーテキストシステムの構成
の優劣を容易に判断することが可能になる。例えばWe
bの管理者は、構成に問題がある部分に変更を加えて、
より良い構成のハイパーテキストシステムを構築するこ
とができるという効果がある。
【図面の簡単な説明】
【図1】 本発明の第1の実施の形態を示す構成図であ
る。
【図2】 Webの一例の説明図である。
【図3】 ハイパーリンク結束度表示部による表示の一
例の説明図である。
【図4】 ハイパーリンク結束度表示部による表示の別
の例の説明図である。
【図5】 ハイパーリンク結束度表示部による表示の別
の例においてクラスタを選択した場合の表示例の説明図
である。
【図6】 ハイパーリンク結束度表示部による表示の別
の例においてクラスタを選択した場合の別の表示例の説
明図である。
【図7】 ハイパーリンク結束度表示部による表示のさ
らに別の例の説明図である。
【図8】 本発明の第2の実施の形態を示す構成図であ
る。
【図9】 識別子獲得部における処理の一例を示すフロ
ーチャートである。
【図10】 本発明の第3の実施の形態を示す構成図で
ある。
【図11】 本発明の第4の実施の形態を示す構成図で
ある。
【図12】 ハイパーリンク結束度表示部による表示の
さらに別の例の説明図である。
【符号の説明】
1…Webサーバ、2…ハイパーテキスト解析装置、1
1…アクセス履歴情報、21…アクセス傾向解析部、2
2…ハイパーリンク構成解析部、23…ハイパーリンク
結束度表示部、24…識別子獲得部、25…コンピュー
タ識別子整形部、26…ハイパーリンク結束度評価部。
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5B075 ND20 NR12 PQ02 PQ14 PQ36 PR03 5B082 AA00 EA07 FA11 GC03 HA08 5B089 GA11 GB02 HA01 JA21 JA36 JB02 JB11 KA13 KA14 KB06 KC36 LB14

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 ハイパーテキストシステムへのアクセス
    履歴情報に基づいて該ハイパーテキストシステムを構成
    するノードに対してクラスタリングを行うアクセス傾向
    解析手段と、該アクセス傾向解析手段で得られた各クラ
    スタについて該クラスタを構成するノード間のハイパー
    リンク結束度を計算するハイパーリンク構成解析手段
    と、該ハイパーリンク構成解析手段で得られたハイパー
    リンク結束度を表示するハイパーリンク結束度表示手段
    を有することを特徴とするハイパーテキスト解析装置。
  2. 【請求項2】 前記ハイパーテキストシステムを構成す
    る各ノード毎に予め定めたある一定期間にアクセスして
    きたコンピュータの識別子を重複を許してリストとして
    保持する識別子獲得手段を有し、前記アクセス傾向解析
    手段は、該識別子獲得手段が保持しているリストから識
    別子の重複度合いを求めてクラスタリングを行うことを
    特徴とする請求項1に記載のハイパーテキスト解析装
    置。
  3. 【請求項3】 さらに、前記ハイパーテキストシステム
    を網羅的にアクセスして自動的に情報を収集しているコ
    ンピュータの識別子を特定し該識別子を前記識別子獲得
    手段が保持する前記リストから削除する識別子整形手段
    を有することを特徴とする請求項2に記載のハイパーテ
    キスト解析装置。
  4. 【請求項4】 前記ハイパーリンク結束度が予め定めた
    ある条件を満たすか否かを判定するハイパーリンク結束
    度評価手段を有し、前記ハイパーリンク結束度表示手段
    は、該ハイパーリンク結束度評価手段における判定結果
    に従ってハイパーリンク結束度を表示することを特徴と
    する請求項1ないし請求項3のいずれか1項に記載のハ
    イパーテキスト解析装置。
  5. 【請求項5】 ハイパーテキストシステムへのアクセス
    履歴情報に基づいて該ハイパーテキストシステムを構成
    するノードに対してクラスタリングを行い、得られた各
    クラスタについて該クラスタを構成するノード間のハイ
    パーリンク結束度を計算し、計算したハイパーリンク結
    束度を表示することを特徴とするハイパーテキスト解析
    方法。
  6. 【請求項6】 ハイパーテキストシステムへのアクセス
    履歴情報に基づいて該ハイパーテキストシステムを構成
    するノードに対してクラスタリングを行うアクセス傾向
    解析処理と、該アクセス傾向解析処理で得られた各クラ
    スタについて該クラスタを構成するノード間のハイパー
    リンク結束度を計算するハイパーリンク構成解析処理
    と、該ハイパーリンク構成解析処理で得られたハイパー
    リンク結束度を表示してユーザに該ハイパーテキストシ
    ステムの構成の優劣を示すハイパーリンク結束度表示処
    理をコンピュータに実行させるためのハイパーテキスト
    解析プログラムを記録した記憶媒体。
JP34575998A 1998-12-04 1998-12-04 ハイパーテキスト解析装置及び方法、ハイパーテキスト解析プログラムを記録した記憶媒体 Expired - Fee Related JP3705331B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP34575998A JP3705331B2 (ja) 1998-12-04 1998-12-04 ハイパーテキスト解析装置及び方法、ハイパーテキスト解析プログラムを記録した記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP34575998A JP3705331B2 (ja) 1998-12-04 1998-12-04 ハイパーテキスト解析装置及び方法、ハイパーテキスト解析プログラムを記録した記憶媒体

Publications (2)

Publication Number Publication Date
JP2000172665A true JP2000172665A (ja) 2000-06-23
JP3705331B2 JP3705331B2 (ja) 2005-10-12

Family

ID=18378788

Family Applications (1)

Application Number Title Priority Date Filing Date
JP34575998A Expired - Fee Related JP3705331B2 (ja) 1998-12-04 1998-12-04 ハイパーテキスト解析装置及び方法、ハイパーテキスト解析プログラムを記録した記憶媒体

Country Status (1)

Country Link
JP (1) JP3705331B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000172699A (ja) * 1998-12-04 2000-06-23 Fuji Xerox Co Ltd ハイパーテキスト構造変更支援装置および方法、ハイパーテキスト構造変更支援プログラムを記録した記憶媒体
JP2003030060A (ja) * 2001-07-19 2003-01-31 Hitachi Electronics Service Co Ltd Webサーバの性能監視サービスシステム
WO2005081116A1 (ja) * 2004-01-05 2005-09-01 Yasuo Nishizawa 統合インテリジェントseoトランザクションプラットフォーム
US7222171B2 (en) 2002-07-23 2007-05-22 Fujitsu Limited Site evaluation system and site evaluation program storage medium
JP2009032270A (ja) * 2002-07-26 2009-02-12 Arbitron Inc メディアデータの利用を測定し、レポートするシステム
JP2010129061A (ja) * 2008-12-01 2010-06-10 Ntt Docomo Inc インデックス生成システム、情報検索システム、及びインデックス生成方法
JP2010157151A (ja) * 2008-12-29 2010-07-15 Kan:Kk アクセス解析システム及びアクセス解析方法
JP2012027706A (ja) * 2010-07-23 2012-02-09 Ntt Docomo Inc ネットワーク評価支援装置およびネットワーク評価支援方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09198408A (ja) * 1996-01-16 1997-07-31 Nec Corp ブラウジング装置
JPH1069423A (ja) * 1996-08-28 1998-03-10 Nec Corp ハイパーメディアシステムおよびそのディレクトリデータ管理方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09198408A (ja) * 1996-01-16 1997-07-31 Nec Corp ブラウジング装置
JPH1069423A (ja) * 1996-08-28 1998-03-10 Nec Corp ハイパーメディアシステムおよびそのディレクトリデータ管理方法

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000172699A (ja) * 1998-12-04 2000-06-23 Fuji Xerox Co Ltd ハイパーテキスト構造変更支援装置および方法、ハイパーテキスト構造変更支援プログラムを記録した記憶媒体
JP2003030060A (ja) * 2001-07-19 2003-01-31 Hitachi Electronics Service Co Ltd Webサーバの性能監視サービスシステム
US7293089B2 (en) 2002-07-23 2007-11-06 Fujitsu Limited Site evaluation system and site evaluation program storage medium
US7222171B2 (en) 2002-07-23 2007-05-22 Fujitsu Limited Site evaluation system and site evaluation program storage medium
US7277939B2 (en) 2002-07-23 2007-10-02 Fujitsu Limited Site evaluation system and site evaluation program storage medium
US9426240B2 (en) 2002-07-26 2016-08-23 The Nielsen Company (Us), Llc Media data usage measurement and reporting systems and methods
JP2009032270A (ja) * 2002-07-26 2009-02-12 Arbitron Inc メディアデータの利用を測定し、レポートするシステム
US10103951B2 (en) 2002-07-26 2018-10-16 The Nielsen Company (Us), Llc Media data usage measurement and reporting systems and methods
US10848399B2 (en) 2002-07-26 2020-11-24 The Nielsen Company (Us), Llc Media data usage measurement and reporting systems and methods
US11159399B2 (en) 2002-07-26 2021-10-26 The Nielsen Company (Us), Llc Media data usage measurement and reporting systems and methods
WO2005081116A1 (ja) * 2004-01-05 2005-09-01 Yasuo Nishizawa 統合インテリジェントseoトランザクションプラットフォーム
JP2010129061A (ja) * 2008-12-01 2010-06-10 Ntt Docomo Inc インデックス生成システム、情報検索システム、及びインデックス生成方法
JP4633162B2 (ja) * 2008-12-01 2011-02-16 株式会社エヌ・ティ・ティ・ドコモ インデックス生成システム、情報検索システム、及びインデックス生成方法
US8285723B2 (en) 2008-12-01 2012-10-09 Ntt Docomo, Inc. System and method for indexing documents and retrieving similar document based on link transition count distance calculations
JP2010157151A (ja) * 2008-12-29 2010-07-15 Kan:Kk アクセス解析システム及びアクセス解析方法
JP2012027706A (ja) * 2010-07-23 2012-02-09 Ntt Docomo Inc ネットワーク評価支援装置およびネットワーク評価支援方法

Also Published As

Publication number Publication date
JP3705331B2 (ja) 2005-10-12

Similar Documents

Publication Publication Date Title
Eirinaki et al. Web mining for web personalization
KR101557294B1 (ko) 편집 거리 및 문서 정보를 이용한 검색 결과 랭킹
US9195372B2 (en) Methods, systems, and computer program products for grouping tabbed portion of a display object based on content relationships and user interaction levels
Brügger When the present web is later the past: Web historiography, digital history, and internet studies
US6115718A (en) Method and apparatus for predicting document access in a collection of linked documents featuring link proprabilities and spreading activation
US7614004B2 (en) Intelligent forward resource navigation
RU2382400C2 (ru) Построение и применение веб-каталогов для фокусированного поиска
US7779001B2 (en) Web page ranking with hierarchical considerations
Nithya et al. Novel pre-processing technique for web log mining by removing global noise and web robots
US20090083266A1 (en) Techniques for tokenizing urls
US8639560B2 (en) Brand analysis using interactions with search result items
TW201329890A (zh) 店鋪訪問資料處理方法及系統
CN102222098A (zh) 一种网页预取方法和系统
Bayir et al. Smart miner: a new framework for mining large scale web usage data
KR100987330B1 (ko) 사용자 웹 사용 정보에 기반한 멀티 컨셉 네트워크 생성시스템 및 방법
Dohare et al. Novel web usage mining for web mining techniques
JP3705331B2 (ja) ハイパーテキスト解析装置及び方法、ハイパーテキスト解析プログラムを記録した記憶媒体
Poornalatha et al. Web page prediction by clustering and integrated distance measure
JP5100855B2 (ja) 潜在クラス分析装置、潜在クラス分析方法及びプログラム
Singh et al. Web page recommendation system based on partially ordered sequential rules
JP3719342B2 (ja) ハイパーテキスト解析装置及び方法、ハイパーテキスト解析プログラムを記録した記憶媒体
Maheswari et al. Algorithm for Tracing Visitors' On-Line Behaviors for Effective Web Usage Mining
Pandian et al. A Unified Model for Preprocessing and Clustering Technique for Web Usage Mining.
Li et al. Session-based Recommendation via Memory Network and Dwell-time Attention
Zubi et al. Applying web mining application for user behavior understanding

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050223

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050418

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050706

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050719

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090805

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100805

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110805

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees