JP3736598B2 - ハイパーテキスト解析装置及び方法、ハイパーテキスト解析プログラムを記録した記憶媒体 - Google Patents

ハイパーテキスト解析装置及び方法、ハイパーテキスト解析プログラムを記録した記憶媒体 Download PDF

Info

Publication number
JP3736598B2
JP3736598B2 JP34802698A JP34802698A JP3736598B2 JP 3736598 B2 JP3736598 B2 JP 3736598B2 JP 34802698 A JP34802698 A JP 34802698A JP 34802698 A JP34802698 A JP 34802698A JP 3736598 B2 JP3736598 B2 JP 3736598B2
Authority
JP
Japan
Prior art keywords
hyperlink
cluster
hypertext
analysis
cohesion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP34802698A
Other languages
English (en)
Other versions
JP2000172707A (ja
Inventor
雄大 中山
裕樹 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP34802698A priority Critical patent/JP3736598B2/ja
Publication of JP2000172707A publication Critical patent/JP2000172707A/ja
Application granted granted Critical
Publication of JP3736598B2 publication Critical patent/JP3736598B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、ネットワーク上に構成されるハイパーテキストシステムにおいて、コンテンツ分布とハイパーリンク構造を解析するハイパーテキスト解析装置及び方法と、そのハイパーテキスト解析装置及び方法をコンピュータで実現するためのハイパーテキスト解析プログラムを記録した記憶媒体に関するものである。
【0002】
【従来の技術】
近年では、例えばWorld Wide Web(以降、Webと略す)のように、ネットワーク上に大規模なハイパーテキストシステムが構成されるようになった。また、それらのハイパーテキストを検索する検索サービス(例えば、ExciteやAltaVista)も多数提供されている。
【0003】
一般の文書集合に対して、コンテンツに基づくクラスタリングを施す技術は確立しており、主に検索結果のブラウジング支援に使われている。例えば、P.Willett,“RECENT TRENDS IN HIERARCHIC DOCUMENT CLUSTERING: A CRITICAL REVIEW”,Information Processing and Management,Vol.24,No.5,1988.等に記載されている。
【0004】
また、検索エンジンから返される検索結果リストに表示されるshort snippetsを入力として、文書間に共有される語句に焦点を当てながらクラスタリングをすることによって、大量の文書を効率よく処理する技術がある。例えば、O.Zamir and O.Etzioni,“Web Document Clustering”,1998 ACM SIGMOD Workshop on Research Issues in Data Mining and Knowledge Discovery,1998.などで報告されている。しかし、この技術は検索結果のブラウジングには有効であり得るが、ハイパーテキストシステムの構成を改善するためのものではない。
【0005】
また別のクラスタリングの技術として、例えばM.Perkowitz and O.Etzioni,“Adaptive Web Sites: Automatically Synthesizing Web Pages”,In Proc. of AAAI,1998.で提案されている技術がある。この技術は、アクセスの共起を基にして、Webサイト中のノード群にクラスタリングを施し、ハイパーリンクで繋がれていないものについて、インデクスを生成して、Webサイトの構成を改善するものである。
【0006】
しかし、この技術では、文書の内容に関わる情報が取り扱われないので、目的のないブラウジングや、複数の目的を持つ人によるブラウジングの履歴情報がノイズとなり、サイト構成の改善という点で精度の高いクラスタが得られるとは限らない。 また、ブラウジング活動自体が試行錯誤の活動であるともいえ、アクセスしたノード全てが有意なものであるとはいえない。特に、本発明において構成の劣ると判断されるサイトにおいては、この傾向が顕著になる。
【0007】
このように従来技術では、ハイパーテキストシステム上のコンテンツ分布の優劣を判断するような知識を得ることはできなかった。
【0008】
【発明が解決しようとする課題】
本発明は、上述した事情に鑑みてなされたもので、ハイパーテキストシステムの構成の優劣を判断するための知識を得ることを支援するハイパーテキスト解析装置およびハイパーテキスト解析方法を提供することを目的とするものである。また、そのハイパーテキスト解析装置または方法をコンピュータで実現するためのハイパーテキスト解析プログラムを記録した記録媒体を提供することを目的とするものである。
【0009】
【課題を解決するための手段】
本発明は、コンテンツの類似度に基づいて、ハイパーテキストシステムを構成するノードに対してクラスタリングを行い、クラスタリングによって得られた各クラスタについて、該クラスタを構成するノード間結合の総数を、該クラスタを構成する全てのノードから二つを選ぶ組み合わせ数で割った値を、そのクラスタを構成するノード間のハイパーリンク結束度として計算して表示することを特徴とするものである。表示されるハイパーリンク結束度は、コンテンツの類似度に基づいた値であるから、コンテンツの分布を示している。そのため、ハイパーリンク結束度を得ることによって、例えばハイパーテキストシステム(例えばWebサイト)のハイパーリンク構成などとともに、ハイパーテキストシステムの構成の優劣を判断することが可能となる。
【0010】
また本発明は、コンテンツの類似度に基づいて、ハイパーテキストシステムを構成するノードに対してクラスタリングを行い、クラスタリングによって得られた各クラスタについて、該クラスタを構成するノードとある特定のノード(起点ノード)間のハイパーリンク遷移数(最短遷移数)を計算し、各クラスタごとにハイパーリンク遷移数の分布を表示することを特徴とするものである。これによって、特定のノードからたどらなければならないハイパーリンク遷移数をもとに、類似したコンテンツのバラツキを知ることができ、ハイパーテキストシステムが意図した構成か否かを判断することが可能となる。
【0011】
【発明の実施の形態】
図1は、本発明の第1の実施の形態を示す構成図である。図中、1はハイパーテキストシステム、2はコンテンツ分布傾向解析部、3はハイパーリンク構成解析部、4はハイパーリンク結束度表示部である。ハイパーテキストシステム1は、複数のハイパーテキスト(以下ノードと呼ぶ)が、ノードとハイパーリンクによるハイパー構造で貯えられている。ハイパーテキストシステム1にアクセスすることでコンテンツを入手できる。ハイパーテキストシステム1として代表的なものにWebがある。
【0012】
コンテンツ分布傾向解析部2は、ハイパーテキスト1中のノード群に対し、それぞれのノードのコンテンツの内容、例えばテキスト情報を用いてクラスタリングの処理を施す。このクラスタリングの処理には、既存の技術を使用することができる。例えば、Agglomerative Hierarchical Clusteringによるクラスタリングの方法では、以下の1,2,3のステップを行う。
1.各ノードをそれぞれ一つのクラスタとする。
2.各クラスタ間の類似度を計算し、最大類似度を持つクラスタ同士を一つのクラスタにマージする。ここで、最大類似度が予め設定してある閾値よりも小さければ処理を終了する。
3.クラスタが一つになるまで2の処理を繰り返す。
この過程の途中で順次生成されるそれぞれのクラスタをクラスタリングの処理結果として得る。例えば1.の処理において生成される各ノードのみのクラスタ、そのクラスタをマージした各クラスタなどがクラスタリング結果となる。なお、上述のクラスタリングの方法は、例えば、E.M.Voorhees,“Implementing Agglomerative HierarchicalClustering Algorithms for Use in Document Retrieval”,Information Processing&Management,Vol.22,No.6,1986等に記載されている。
【0013】
ここで、上述の2.の類似度計算では、各クラスタにおける出現単語の重複度合いを利用することができる。あるいは、例えば特願平9−153387号に記載されている方法を用いて、各クラスタをそのクラスタに出現する重要単語を項とし、その重要単語の出現頻度をその項の値とするようなベクトルを生成して、ベクトル間の内積値の大小を類似度として用いてもよい。
【0014】
ハイパーリンク構成解析部3は、コンテンツ分布傾向解析部2で生成された各クラスタについて、そのクラスタを構成するノード間のハイパーリンク結束度(以下、単に結束度と呼ぶ)を計算する。結束度は、例えば、ノード間に1つ以上のハイパーリンクが存在すれば該ノード間には結合があると定義したときに、クラスタを構成するノード間結合の総数を、そのクラスタを構成する全てのノードから二つを選ぶ組み合わせ数で割った値とすることができる。すなわち、ノード間結合の総数をL、ノード数をNとしたとき、
結束度=L/
で計算することができる。ハイパーリンク構成解析部3で得られた各クラスタの結束度の値は、ハイパーリンク結束度表示部4に渡される。
【0015】
ハイパーリンク結束度表示部4は、ハイパーリンク構成解析部3で得られた結束度を表示する。例えば、クラスタのサイズと結束度の値の関係を表示することができる。クラスタのサイズには、例えば、クラスタを構成するノード数や、クラスタを構成する各ノードが持つ単語の総数や、クラスタを構成する各ノードのファイルサイズの総計などを用いることができる。
【0016】
図2は、本発明の第1の実施の形態においてハイパーリンク結束度表示部における表示例の説明図である。図2に示した表示例では、あるハイパーテキストシステム(ここではあるWebサイト)のハイパーリンク結束度を表示した例を示している。ここでは、クラスタのサイズとしてクラスタを構成するノード数を用い、結束度としてクラスタを構成するノード間結合の総数を前記のクラスタを構成する全てのノードから二つを選ぶ組み合わせ数で割った値を用いている。
【0017】
図2に示すような表示によって、クラスタサイズに注目しながら、各クラスタの構成の優劣を俯瞰することができ、さらに、該ハイパーテキストシステム全体の構成の優劣を判断することもできる。上述のように、各クラスタはノードに含まれるテキスト情報を基に構成されているので、各クラスタを構成するノード群は、類似したコンテンツの集合であるということができる。ノード群の結束度が高いと、ユーザにとってはノード間遷移のための経路が多数提供されることになるので、類似したコンテンツを効率よくブラウジングできることになる。一方、該ノード群の結束度が低いと類似したコンテンツが散在していることを示し、ブラウジング効率は悪くなる。図2において、同じノード数であれば結束度の高いクラスタが多いほど、ハイパーテキストシステム1全体として構成が優れていると判断することができる。逆に、結束度の低いクラスタが多い場合、構成を改善する余地があると判断できる。
【0018】
図3は、本発明の第1の実施の形態においてハイパーリンク結束度表示部における別の表示例の説明図である。ハイパーリンク結束度表示部4では、図2に示した表示例に限らず、例えば図3に示すように、クラスタ内のノード間の類似度と結束度の値の関係を表示することもできる。図3に示す表示例では、あるハイパーテキストシステム(ここではあるWebサイト)について、クラスタ内のノード間の類似度としてコンテンツ分布傾向解析部2においてクラスタ生成時に用いた類似度の値を用いている。また、結束度としてクラスタを構成するノード間結合の総数を前記のクラスタを構成する全てのノードから二つを選ぶ組み合わせ数で割った値を用いて表示した例を示している。
【0019】
図3において、クラスタ群Aは、クラスタ内のノード間類似度が大きくなるにつれて結束度も大きくなるという(直感的に自然な)傾向があり、クラスタ内には一般のコンテンツが含まれていると推測される。ここでは、横軸(=クラスタ内のノード間類似度)上のある点(の近傍)に注目して結束度が大きいクラスタは優れた構成によるもので、結束度が小さいクラスタは劣るものであると推測される。一方、クラスタ群Bは、クラスタ内のノード間類似度が小さいにもかかわらず結束度が大きいという特徴がある。これらは、ユーザをナビゲートするためのノード(例えば、インデックスのノード)を含むものであり、他の一般のコンテンツが含まれるノードと密にハイパーリンクで繋がれていると推測される。このように図3に示したような表示によって、クラスタ内のノード間の類似度に注目しながら、各クラスタの構成の優劣を俯瞰することができ、さらに、そのWebサイト全体の構成の優劣を判断することもできる。
【0020】
図4は、本発明の第1の実施の形態における変形例を示す構成図である。図中、図1と同様の部分には同じ符号を付して説明を省略する。5は解析領域指定部である。この変形例では、図1に示した構成に、解析領域指定部5を付加した例を示している。
【0021】
解析領域指定部5は、ハイパーテキストシステム1の中から特定のサーバ(コンピュータ)上のノードだけを解析の対象として選択し、コンテンツ分布傾向解析部2に渡す。あるいは、解析領域指定部5は、ある特定のノード(起点ノード)からハイパーリンクを遷移して到達可能なノードを解析の対象として、コンテンツ分布傾向解析部2に渡すようにしてもよい。このとき、最大遷移数を予め設定しておき、遷移数が最大遷移数を超えない範囲で到達可能なノードを解析の対象としてもよい。
【0022】
コンテンツ分布傾向解析部2は、解析領域指定部5で解析の対象として選択されたノードについて、クラスタリングの処理を行う。以降の処理は、上述の通りである。
【0023】
図5は、本発明の第1の実施の形態における別の変形例を示す構成図である。図中、図1と同様の部分には同じ符号を付して説明を省略する。6はハイパーリンク結束度評価部である。この変形例では、図1に示した構成に、ハイパーリンク結束度評価部6を付加した例を示している。
【0024】
ハイパーリンク結束度評価部6は、ハイパーリンク構成解析部3で得られた各クラスタの結束度の値を予め定められた閾値と比較し、結束度が閾値よりも小さなクラスタをハイパーリンク結束度表示部4に渡す。これによって、ハイパーリンク結束度表示部4では結束度が小さい、すなわち構成が劣るクラスタを提示することができる。
【0025】
なお、図1に示した構成に、上述の2つの変形例で示した解析領域指定部5およびハイパーリンク結束度評価部6をともに付加して構成してもよい。
【0026】
図6は、本発明の第2の実施の形態を示す構成図である。図中、11はコンテンツ分布傾向解析部、12はハイパーリンク経路解析部、13はクラスタ表示部である。なお、ハイパーテキストシステム1は上述の第1の実施の形態と同様である。
【0027】
コンテンツ分布傾向解析部11は、ハイパーテキストシステム1中のノード群に対し、それぞれが持つテキスト情報を用いてクラスタリングの処理を施す。クラスタリングの方法は、上述の第1の実施の形態と同様の方法を用いることができる。
【0028】
ハイパーリンク経路解析部12は、コンテンツ分布傾向解析部11で得られた各クラスタについて、該クラスタを構成するノードと予め与えられたノード(起点ノード)の間のハイパーリンク遷移数(例えば最小値)を求める。これは、起点ノードからハイパーリンクを幅優先で探索していくことによって求めることができる。ここで、処理効率を向上させるため、および、起点と繋がっていないノードへの対処のため、予め、ハイパーリンク遷移数の最大値Nmaxを与えておき、該最大値を超えるハイパーリンクは探索しないように探索範囲を限定してもよい。この場合、探索されなかったノードにはハイパーリンク遷移数として最大値Nmaxを付与すればよい。
【0029】
クラスタ表示部13は、コンテンツ分布傾向解析部11で得られた各クラスタを、ハイパーリンク経路解析部12で得られたハイパーリンク遷移数に基づいて表示する。例えば、ハイパーリンク遷移数を軸とする図の上に、コンテンツ分布傾向解析部11で得られた各クラスタを、前記ハイパーリンク経路解析部12で得られたハイパーリンク遷移数に従って表示することができる。
【0030】
図7は、本発明の第2の実施の形態においてクラスタ表示部における表示例の説明図である。図7において、半径方向がハイパーリンク遷移数を示しており、同じハイパーリンク遷移数を有するノードを同心円上に配置している。ここでは2つのクラスタ、クラスタAとクラスタBについて、各クラスタに含まれているノードを点として示している。上述のようにコンテンツの類似度に基づいてクラスタリングしていることから、各クラスタに含まれるノードはコンテンツが類似している。
【0031】
クラスタAを構成するノードは図7においてほぼ同心円状に表示されており、起点ノードからのハイパーリンク遷移数が2または3という狭い範囲に分布している。一方、クラスタBを構成するノードは、図7において半径方向に散在しており、起点ノードからのハイパーリンク遷移数が1から5という広い範囲に渡って分布していることがわかる。ハイパーテキストシステム1の管理者(例えばWebサイト管理者)は、このような表示と、これらのクラスタを構成するノードが配置された初期の方針とを照らし合わせ、ハイパーテキストシステム1(Webサイト)の構成の優劣を判断することができる。例えば、初期の方針が、ある話題をハイパーリンクを辿るごとに順に掘り下げて表現するというものであれば、図7に示したクラスタBは初期の方針にかなうものであり、クラスタAは方針にはそぐわないものであることがわかる。あるいは、初期の方針が、ある話題を起点ノードから近い範囲(ハイパーリンク遷移数が小さい範囲)に収まるように表現したいというものであれば、図7に示したクラスタAは初期の方針にかなうものであり、クラスタBは方針にはそぐわないものであることがわかる。
【0032】
図8は、本発明の第2の実施の形態における変形例を示す構成図である。図中、図6と同様の部分には同じ符号を付して説明を省略する。14は解析領域指定部である。この変形例では、図6に示した構成に、解析領域指定部14を付加した例を示している。
【0033】
解析領域指定部14は、ハイパーテキストシステム1の中から、特定のサーバ(コンピュータ)上のノードだけを解析の対象として選択し、コンテンツ分布傾向解析部11に渡す。あるいは、解析領域指定部14は、ある特定のノード(起点ノード)からハイパーリンクを(幅優先で)遷移して到達可能なノードを解析の対象としてコンテンツ分布傾向解析部11に渡すようにしてもよい。この場合、最大遷移数を予め設定しておき、遷移数が最大遷移数を超えない範囲で到達可能なものを解析の対象としてもよい。
【0034】
図9は、本発明の第2の実施の形態における別の変形例を示す構成図である。図中の符号は図8と同様である。この例では、解析領域指定部14においてハイパーリンクを遷移して解析の対象となるノードを指定する際に、ハイパーリンク経路解析部12によって、起点ノードからのハイパーリンク遷移数を求めるようにした例を示している。この構成では、解析領域指定部14における処理過程において、ハイパーリンク経路解析部12でハイパーリンク遷移数を求めるため、コンテンツ分布傾向解析部11による処理後に、改めてハイパーリンクを探索してハイパーリンク遷移数を求めなくてよい。そのため、処理効率を向上させることができる。
【0035】
上述の各実施の形態およびそれらの変形例は、コンピュータプログラムによっても実現することが可能である。その場合、そのプログラムおよびそのプログラムが用いるデータなどは、コンピュータが読み取り可能な記憶媒体に記録しておくことも可能である。記憶媒体とは、コンピュータのハードウェア資源に備えられている読取装置に対して、プログラムの記述内容に応じて、磁気、光、電気等のエネルギーの変化状態を引き起こして、それに対応する信号の形式で、読取装置にプログラムの記述内容を伝達できるものである。例えば、磁気ディスク、光ディスク、CD−ROM、コンピュータに内蔵されるメモリ等である。
【0036】
【発明の効果】
以上の説明から明らかなように、本発明によれば、コンテンツの類似度に基づいて、ハイパーテキストシステムを構成するノードに対してクラスタリングを行い、得られた各クラスタを構成するノード間のハイパーリンク結束度を計算し、表示する。あるいは、コンテンツの類似度に基づいて、ハイパーテキストシステムを構成するノードに対してクラスタリングを行い、得られた各クラスタを構成するノード間のハイパーリンク遷移数を計算し、表示する。これらのハイパーリンク結束度やハイパーリンク遷移数は、ハイパーテキストシステムの構成の優劣を示す指標となりうるものである。これらの値に基づく表示を参照することによって、ハイパーテキストシステムの構成の優劣を俯瞰することができ、構成に問題がある部分に変更を加えて、より良い構成のハイパーテキストシステムを構築することができるという効果がある。
【図面の簡単な説明】
【図1】 本発明の第1の実施の形態を示す構成図である。
【図2】 本発明の第1の実施の形態においてハイパーリンク結束度表示部における表示例の説明図である。
【図3】 本発明の第1の実施の形態においてハイパーリンク結束度表示部における別の表示例の説明図である。
【図4】 本発明の第1の実施の形態における変形例を示す構成図である。
【図5】 本発明の第1の実施の形態における別の変形例を示す構成図である。
【図6】 本発明の第2の実施の形態を示す構成図である。
【図7】 本発明の第2の実施の形態においてクラスタ表示部における表示例の説明図である。
【図8】 本発明の第2の実施の形態における変形例を示す構成図である。
【図9】 本発明の第2の実施の形態における別の変形例を示す構成図である。
【符号の説明】
1…ハイパーテキストシステム、2…コンテンツ分布傾向解析部、3…ハイパーリンク構成解析部、4…ハイパーリンク結束度表示部、5…解析領域指定部、6…ハイパーリンク結束度評価部、11…コンテンツ分布傾向解析部、12…ハイパーリンク経路解析部、13…クラスタ表示部、14…解析領域指定部。

Claims (5)

  1. コンテンツの類似度に基づいてハイパーテキストシステムを構成するノードに対してクラスタリングを行うコンテンツ分布傾向解析手段と、該コンテンツ分布傾向解析手段で得られた各クラスタについて、該クラスタを構成するノード間結合の総数を、該クラスタを構成する全てのノードから二つを選ぶ組み合わせ数で割った値を、該クラスタを構成するノード間ハイパーリンク結束度として計算するハイパーリンク構成解析手段と、該ハイパーリンク構成解析手段で得られたハイパーリンク結束度を表示するハイパーリンク結束度表示手段を有することを特徴とするハイパーテキスト解析装置。
  2. さらに、ハイパーリンク結束度が予め定めたある条件を満たすか否かを判定するハイパーリンク結束度評価手段を有し、前記ハイパーリンク結束度表示手段は、該ハイパーリンク結束度評価手段における判定結果に従ってハイパーリンク結束度を表示することを特徴とする請求項1に記載のハイパーテキスト解析装置。
  3. コンテンツの類似度に基づいてハイパーテキストシステムを構成するノードに対してクラスタリングを行うコンテンツ分布傾向解析手段と、該コンテンツ分布傾向解析手段で得られた各クラスタについて該クラスタを構成するノードとある特定のノード間のハイパーリンク遷移数を計算するハイパーリンク経路解析手段と、該コンテンツ分布傾向解析手段で得られた各クラスタごとに前記ハイパーリンク遷移数の分布を表示するクラスタ表示手段を有することを特徴とするハイパーテキスト解析装置。
  4. ハイパーテキスト解析装置によるハイパーテキスト解析方法であって、ハイパーテキスト解析装置が備えるコンテンツ分布傾向解析手段が、コンテンツの類似度に基づいてハイパーテキストシステムを構成するノードに対してクラスタリングを行い、ハイパーテキスト解析装置が備えるハイパーリンク構成解析手段が、得られた各クラスタについて、該クラスタを構成するノード間結合の総数を、該クラスタを構成する全てのノードから二つを選ぶ組み合わせ数で割った値を、該クラスタを構成するノード間ハイパーリンク結束度として計算し、ハイパーテキスト解析装置が備えるハイパーリンク結束度表示手段が、計算されたハイパーリンク結束度を表示することを特徴とするハイパーテキスト解析方法。
  5. コンテンツの類似度に基づいてハイパーテキストシステムを構成するノードに対してクラスタリングを行うコンテンツ分布傾向解析処理と、該コンテンツ分布傾向解析処理で得られた各クラスタについて、該クラスタを構成するノード間結合の総数を、該クラスタを構成する全てのノードから二つを選ぶ組み合わせ数で割った値を、該クラスタを構成するノード間ハイパーリンク結束度として計算するハイパーリンク構成解析処理と、該ハイパーリンク構成解析処理で得られたハイパーリンク結束度を表示してユーザに該ハイパーテキストシステムの構成の優劣を示すハイパーリンク結束度表示処理をコンピュータに実行させるためのハイパーテキスト解析プログラムを記録した記憶媒体。
JP34802698A 1998-12-08 1998-12-08 ハイパーテキスト解析装置及び方法、ハイパーテキスト解析プログラムを記録した記憶媒体 Expired - Fee Related JP3736598B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP34802698A JP3736598B2 (ja) 1998-12-08 1998-12-08 ハイパーテキスト解析装置及び方法、ハイパーテキスト解析プログラムを記録した記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP34802698A JP3736598B2 (ja) 1998-12-08 1998-12-08 ハイパーテキスト解析装置及び方法、ハイパーテキスト解析プログラムを記録した記憶媒体

Publications (2)

Publication Number Publication Date
JP2000172707A JP2000172707A (ja) 2000-06-23
JP3736598B2 true JP3736598B2 (ja) 2006-01-18

Family

ID=18394246

Family Applications (1)

Application Number Title Priority Date Filing Date
JP34802698A Expired - Fee Related JP3736598B2 (ja) 1998-12-08 1998-12-08 ハイパーテキスト解析装置及び方法、ハイパーテキスト解析プログラムを記録した記憶媒体

Country Status (1)

Country Link
JP (1) JP3736598B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006107020A (ja) 2004-10-04 2006-04-20 Sony Corp コンテンツ・マネジメント・システム及びコンテンツ・マネジメント方法、並びにコンピュータ・プログラム
JP5407169B2 (ja) * 2008-04-11 2014-02-05 富士通株式会社 クラスタリングプログラム、検索プログラム、クラスタリング方法、検索方法、クラスタリング装置および検索装置
KR101003240B1 (ko) 2008-06-11 2010-12-21 구글 인코포레이티드 문서 그룹 가치 평가 방법 및 그 시스템
JP7109764B2 (ja) * 2017-10-15 2022-08-01 データ・サイエンティスト株式会社 評価装置、及び評価方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09288556A (ja) * 1996-04-23 1997-11-04 Atsushi Matsushita ハイパーメディアの視覚化システム

Also Published As

Publication number Publication date
JP2000172707A (ja) 2000-06-23

Similar Documents

Publication Publication Date Title
Shepitsen et al. Personalized recommendation in social tagging systems using hierarchical clustering
US7630973B2 (en) Method for identifying related pages in a hyperlinked database
Carpineto et al. Exploiting the potential of concept lattices for information retrieval with CREDO.
JP3665480B2 (ja) 文書整理装置および方法
Chakrabarti et al. Focused crawling: a new approach to topic-specific Web resource discovery
US7171405B2 (en) Systems and methods for organizing data
US5895470A (en) System for categorizing documents in a linked collection of documents
US5835905A (en) System for predicting documents relevant to focus documents by spreading activation through network representations of a linked collection of documents
US8745039B2 (en) Method and system for user guided search navigation
US7599931B2 (en) Web forum crawler
US8037065B1 (en) Information extraction from a database
US7949648B2 (en) Compiling and accessing subject-specific information from a computer network
US8700600B2 (en) Web forum crawling using skeletal links
US20080134015A1 (en) Web Site Structure Analysis
KR20110009098A (ko) 편집 거리 및 문서 정보를 이용한 검색 결과 랭킹
Tajima et al. Discovery and Retrieval of Logical Information Units in Web.
Meng et al. Advanced metasearch engine technology
Zhu et al. Pagecluster: Mining conceptual link hierarchies from web log files for adaptive web site navigation
Tyagi et al. Web structure mining algorithms: A survey
JP2751793B2 (ja) 情報検索システム
JP2009003928A (ja) サーチ結果提示方法、サーチ結果を提示する機能を実現させるためのプログラム、サーチ結果提示システム
JP3736598B2 (ja) ハイパーテキスト解析装置及び方法、ハイパーテキスト解析プログラムを記録した記憶媒体
Liu et al. Visualizing document classification: A search aid for the digital library
KR20050070955A (ko) 과학기술 정보분석 방법 및 그 방법에 대한 컴퓨터프로그램을 저장한 기록매체
Candan et al. Reasoning for web document associations and its applications in site map construction

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050309

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050509

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050720

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050817

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20051005

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20051018

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees