JPH10124518A - 優先アクセスウェブブラウジング処理装置 - Google Patents

優先アクセスウェブブラウジング処理装置

Info

Publication number
JPH10124518A
JPH10124518A JP8274581A JP27458196A JPH10124518A JP H10124518 A JPH10124518 A JP H10124518A JP 8274581 A JP8274581 A JP 8274581A JP 27458196 A JP27458196 A JP 27458196A JP H10124518 A JPH10124518 A JP H10124518A
Authority
JP
Japan
Prior art keywords
web page
unit
html
web
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8274581A
Other languages
English (en)
Inventor
Yukihiko Yamamoto
幸彦 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP8274581A priority Critical patent/JPH10124518A/ja
Publication of JPH10124518A publication Critical patent/JPH10124518A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 肥大化したWebページ及び階層の深いWe
bページでもユーザにとって分かりやすく、かつ簡単な
方法で効率的にアクセスできるようにする。 【解決手段】 HTMLソースダウンロード部3では、
URL(uniformresource locat
or)を指定して、WWW(World Wide W
eb)サーバからWebページ(HTML(Hyper
Text Markup Language)ソー
ス)を効率的にダウンロードを行う。Webページリン
ク解析部5では、リンクの張られたWebページのみを
次々と自動的にアクセスする。そして、Webページ表
示部6は、Webページの階層構造をツリー構造に変換
して表示する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、相互にリンクの張
られたウェブ(Web)ページ間の構成を高速に探索す
るアクセス方式に関し、特に、Webページの階層構造
をツリー構造に変換する機能を有するWebブラウジン
グ処理装置に関する。
【0002】
【従来の技術】一般に、Webページ実現の手段とし
て、ハイパーテキストが用いられており、ハイパーテキ
ストを用いたブラウジング処理装置として、例えば、特
開平4−321144号公報に記載された「ハイパーテ
キストのブラウジング処理装置」が知られている。
【0003】このブラウジング処理装置では、必要な情
報を入力する入力部と、入力された情報に所定の処理を
施す入力処理部と、ハイパーテキスト作成に必要な編集
操作を行うハイパーテキスト作成編集部と、グラフィカ
ルに表示するために必要な処理を施すブラウジング処理
部と、ブラウザ情報を表示するための表示処理部と、ブ
ラウザの表示を行う表示部とを備えており、ハイパーテ
キスト相互間のリンク関係をネットワーク構造のものか
らツリー構造に変換して表示する機能を有している。
【0004】
【発明が解決しようとする課題】ところで、上述の「ハ
イパーテキストのブラウジング処理装置」等の従来のW
ebページブラウジング処理装置では、ユーザはWeb
ページ及びハイパーテキストを一つ一つマニュアル操作
でアクセスしなければならず、このため、Webページ
及びハイパーテキスト全体の構成を理解するためには、
上位の階層から一つ一つ順に下の階層に向けてアクセス
しなければならない。従って、Webページ及びハイパ
ーテキスト全体の構成を理解する際には、極めて手間の
かかる作業を行わなければならないという問題点があ
る。
【0005】さらに、Webページ及びハイパーテキス
トには様々な種類のファイルがリンクされており、現状
のWebプラウザ又はハイパーテキストブラウジング処
理装置を用いた際、ユーザは必要な情報を含むWebペ
ージ又はハイパーテキストのブラウジングを行う場合
に、ユーザが要求する情報以外のWebページ又はハイ
パーテキストであっても一通りアクセスしなければなら
ない。このため、階層の深いWebページに対してアク
セス時間がかかり、効率が悪いという問題点がある。
【0006】特に、Webページがネットワークを介し
て存在する場合に、ネットワークの帯域幅が狭いと、サ
イズの大きなWebページ及び階層の深い位置にあるW
ebページをアクセスすると、ネットワーク構造をツリ
ー構造に変換して表示する際に時間がかかってしまうと
いう問題点がある。
【0007】本発明の目的は、肥大化したWebページ
及び階層の深い位置にあるWebページをアクセスする
際にも効率的にアクセスすることのできる優先アクセス
Webブラウジング処理装置を提供することにある。
【0008】本発明の他の目的は、Webページ全体の
構成を容易に理解することのできるグラフィカルユーザ
インターフェースを実現可能な優先アクセスWebブラ
ウジング処理装置を提供することにある。
【0009】
【課題を解決するための手段】本発明による優先アクセ
スWebブラウジング処理装置は、URL(unifo
rm resource locator)を指定して
WWW(WorldWide Web)サーバからWe
bページ(HTML(Hyper TextMarku
p Language)ソース)を効率的にダウンロー
ドするHTMLソースダウンロード部と、リンクの張ら
れたWebページのみを次々と自動的にアクセスするW
ebページリンク解析部と、Webページの階層構造を
ツリー構造に変換して表示するWebページ表示部とを
備えることを特徴としている。そして、本発明では、ユ
ーザは肥大化したWebページ及び階層の深いWebペ
ージでも効率的にアクセスすることができる。
【0010】さらに、Webページの階層構造をツリー
構造に変換して表示しているから、Webページの全体
構成の理解が容易となり、ユーザはツリー構造で表示さ
れたノードを選択することによって、階層の深いWeb
ページでも自在にアクセスすることができる。
【0011】また、ツリー構造のノード内部には、その
Webページを特徴づける情報を表示すれば、Webペ
ージを全てアクセスしなくても、その表示情報に基づい
てWebページの内容を推測できる。
【0012】
【発明の実施の形態】以下本発明について図面を参照し
て説明する。
【0013】図1を参照して、図示の優先アクセスWe
bブラウジング処理装置は、URL{ユニフォームリソ
ースローケータ(Uniform Resource
Locator)}入力部1、アクセス属性入力部2、
HTMLソースダウンロード部3、HTMLソース{ハ
イパーテキストマークアップ言語(HyperText
MarkupLanguage:HTML)ソース}
解析部4、Webページリンク解析部5、Webページ
表示部6、及びノード選択部7を備えている。
【0014】URL入力部1では、アクセスしたいWe
bページ(HTMLソース)のURLを入力する。アク
セス属性入力部2ではアクセスしたいWebページの属
性を入力する。HTMLソースダウンロード部3は、ワ
ールドワイルドウェブ(World Wide We
b:WWW)サーバからHTMLソースをダウンロード
する。このダウンロードされたHTMLソースはHTM
Lソース解析部4によって解析される。Webページリ
ンク解析部5では、Webページ相互のリンク情報を解
析して、Webページ表示部6は、Webページの階層
構造をツリー構造に変換する。そして、ノード選択部7
はユーザのノードを選択に応じてノードに対応するWe
bページのアクセスを行う。
【0015】次に上述の各ブロックについて説明する。
まず、図2を参照して、URL入力部について説明す
る。
【0016】URL入力部1はWebページURL入力
部11、URL記録部12、及びURLデータベース1
3を備えており、WebページURL入力部11はユー
ザに対してURLの入力手段を提供する。つまり、ユー
ザーはWebページURL入力部11によってURLを
入力する。URL記録部12は、WebページURL入
力部11から入力されたURLを受けこの入力URLを
URLデータベース13に登録する。URLデータベー
ス13には複数のURLを登録することができ、URL
データベース13を参照して、ユーザの入力したURL
が取得される。
【0017】次に、図3を参照して、クセス属性入力部
2について説明する。
【0018】アクセス属性入力部2はHTMLソースア
クセス属性入力部21、アクセス属性データベース登録
部22、及びアクセス属性データベース23を備えてお
り、HTMLソースアクセス属性入力部21はユーザに
対してアクセスしたいHTMLソースの属性を入力する
手段を提供する。つまり、ユーザーはHTMLソースア
クセス属性入力部21を用いてアクセスしたいHTML
ソースの属性を入力することになる。
【0019】アクセス属性データベース登録部22はH
TMLソースアクセス属性入力部21から入力されたH
TMLソースのアクセス属性をアクセス属性データベー
ス23に登録する。このようにして、アクセス属性デー
タベース23には、アクセス属性が登録され、アクセス
属性データベース23を参照して、ユーザの入力したア
クセス属性が取得される。
【0020】図4を参照して、HTMLソースダウンロ
ード部3について説明する。
【0021】HTMLソースのダウンロード部3は、フ
ァイル名/パス名参照部31及びGETメソッド実行部
32を備えており、ファイル名/パス名参照部31には
URLデータベース13、ハイパーリンク情報データベ
ース45、及びツリー表示データベース56が接続され
ている。
【0022】ファイル名/パス名参照部31はダウンロ
ードするファイルの名前とパス名とを取得する。つま
り、ファイル名/パス名参照部31はURLデータベー
ス13を参照して、ユーザの入力したURLを取得す
る。ハイパーリンク情報データベース45及びツリー表
示データベース56は、2回目以降のHTMLソースの
ダウンロードの際に参照されるが、ハイパーリンク情報
データベース45及びツリー表示データベース56につ
いては後述する。
【0023】GETメソッド実行部32ではファイル名
/パス名参照部31で取得したファイルについてWWW
サーバに対してGETメソッドを実行してダウンロード
する。
【0024】図5を参照して、HTMLソース解析部4
について説明する。
【0025】HTMLソース解析部はHTML解析部4
1、代表テキスト情報抽出部42、代表テキスト情報デ
ータベース43、ハイパーリンク情報抽出部44、及び
ハイパーリンク情報データベース45を備えており、H
TML解析部41はHTMLソースの構文を解析して、
HTMLソースに含まれるタグ情報及びテキスト情報を
識別する。代表テキスト情報抽出部42はHTMLソー
スの中から代表とするテキスト情報を決定して、代表テ
キスト情報データベース43に登録する。
【0026】ハイパーリンク情報抽出部44はHTML
ソースの中からハイパーリンク情報を抽出して、ハイパ
ーリンク情報データベース45に登録する。
【0027】なお、代表テキスト情報データベース43
とハイパーリンク情報データベース45を参照して、そ
れぞれ代表テキスト情報、ハイパーリンク情報を取得す
ることができる。
【0028】図6を参照して、Webページリンク解析
部5について説明する。
【0029】Webページリンク解析部5は、ファイル
名/パス名参照部51、HEADメソッド実行部52、
ファイルヘッダ情報取得部53、ヘッダフィールド判定
部54、ツリー表示データベース登録部55、及びツリ
ー表示データベース56を備えており、ファイル名/パ
ス名参照部51にはハイパーリンク情報データベース4
5が接続されている。また、ファイルヘッダ情報取得部
53にはアクセス属性データベース23が接続されてい
る。
【0030】ファイル名/パス名参照部51では、ハイ
パーリンク情報データベース45を参照して、リンクの
張られたファイルの名前及びパス名を取得する。HEA
Dメソッド実行部52ではファイル名/パス名参照部5
1で取得したファイルのヘッダ情報を取得するため、W
WWサーバに対してHEADメソッドの実行を行う。
【0031】ファイルヘッダ情報取得部53はリンクの
張られたファイルのヘッダ情報を取得する。つまり、フ
ァイルヘッダ情報取得部53では、WWWサーバからダ
ウンロードしたヘッダ情報を取り込む。
【0032】ヘッダフィールド判定部54では上述のよ
うにして得られたヘッダ情報のContent−Typ
e(コンテントタイプ)の値が、アクセス属性データベ
ース23に登録されているか否かを判定する。もし、ヘ
ッダ情報のContent−Typeの値がアクセス属
性データベース23に含まれているのであれば、ツリー
表示データベース登録部55によって、ツリー表示デー
タベース56にファイル名及びパス名が登録される。ヘ
ッダ情報のContent−Typeの値がアクセス属
性データベース23に含まれていない場合には、ツリー
表示データベース56には登録されない。
【0033】図7を参照して、Webページ表示部につ
いて説明する。
【0034】Webページ表示部6はツリー表示データ
ベース参照部61、Webページ階層構造/ツリー構造
変換部62、ツリー構造表示部63を備えており、ツリ
ー表示データベース参照部61にはツリー表示データベ
ース56が接続されている。
【0035】ツリー表示データベース参照部61ではツ
リー表示データベース56を参照して、ファイル名及び
パス名を取得する。Webページ階層構造/ツリー構造
変換部62は、ツリー表示データベース参照部61で取
得したファイル名及びパス名の階層構造をツリー構造に
変換する。ツリー構造表示部63は、Webページをツ
リー構造のノードとして描画し、階層構造をパスとして
描画してツリー構造を表示する。
【0036】図8を参照して、ノード選択部について説
明する。
【0037】ノード選択部7はノード指定部71及びフ
ァイル名/パス名決定部72を備えており、ファイル名
/パス名決定部72にはツリー表示データベース56が
接続されている。
【0038】ノード指定部71では、ユーザにツリー構
造に含まれるノードの中から1つのノードを指定する手
段を提供する。つまり、ユーザはノード指定部71を用
いてツリー構造に含まれるNODEの中から一つのノー
ドを指定する。ファイル名/パス名決定部72は、上述
のようにして指定されたノードに対応するファイルの名
前とパス名とを決定する。つまり、ファイル名/パス名
決定部72では、ツリー表示データベース56を参照し
て、ノード指定部71で指定したノードに対応するファ
イル名とパス名の決定を行う。
【0039】次に、本発明による優先アクセスWebブ
ラウジング処理装置の動作について説明する。
【0040】図9に示すように、クライアントはパソコ
ン1aを用いてネットワークを介してWWWサーバ1b
にアクセスする。クライアントがWWWサーバ1bに対
して、HTMLソースの転送要求を行うと、WWWサー
バ1bからHTMLソースがダウンロードされることに
なる。
【0041】図10を参照して、ユーザはURL入力部
1を用いてアクセスしたいWebページを特定するUR
Lを入力するとともにアクセス属性入力部2を用いてア
クセスしたいWebページのアクセス属性を入力する
(ステップS1)。具体的には、図11に示すように、
まず、アクセスしたいWebページのURLを入力する
(ステップS11)。そして、入力したURLをURL
記録部12によって、URLデータベース13に登録す
る(ステップS12)。
【0042】次に、HTMLソースアクセス属性入力部
21によって、ダウンロードするHTMLソースのアク
セス属性を入力する(ステップS13)。そして、アク
セス属性をアクセス属性データベース23に登録する
(ステップS14)。
【0043】上述のようにして、ステップS1が終了す
ると、前述のように、HTMLソースダウンロード部3
によって、WWWサーバからHTMLソースをダウンロ
ードする(ステップS2)。具体的には、図12に示す
ように、URLデータベース13を参照して、ダウンロ
ードするファイルの名前とパス名を取得する(ステップ
S21)。次に、GETメソッド実行部32によってG
ETメソッドを実行して、HTMLソースのダウンロー
ドを行う(ステップS22)。
【0044】上述のようにして、ステップS2が終了す
ると、HTMLソース解析部4によって、HTMLソー
スの中から代表テキスト情報を抽出する(ステップS
3)。具体的には、図13に示すように、まず、HTM
L解析部41によって、HTMLソースを解析して、H
TMLソースに含まれるテキスト及びタグ情報を識別す
る(ステップS31)。
【0045】次に、WebページからTITLE(タイ
トル)タグを抽出する(ステップS32)。そしてTI
TLEタグが存在するか否かを判定する(ステップS3
3)。TITLEタグが存在する場合には、TITLE
タグの情報をそのWebページの代表テキスト情報に決
定して(ステップS34)。代表テキスト情報を代表テ
キスト情報データベース43に登録する(ステップS3
6)。
【0046】TITLEタグが存在しない場合には、そ
のWebページに含まれるテキスト情報の最初の一文を
代表テキスト情報に決定して(ステップS35)、代表
テキスト情報を代表テキスト情報データベース43に登
録する(ステップS36)。
【0047】上述のようにして、ステップS3が終了す
ると、HTMLソース解析部4によって、さらにハイパ
ーリンク情報が抽出される(ステップS4)。具体的に
は、図14に示すように、まず、HTML解析部41に
よって、HTMLソースを解析して(ステップS4
1)、Webページからタグ情報を抽出する(ステップ
S42)。次に、抽出したタグ情報がアンカータグ(ハ
イパーリンクを示すタグ)であるか否かを判定する(ス
テップS43)。
【0048】アンカータグであれば、タグ情報をハイパ
ーリンク情報データベース45に登録する(ステップS
44)。タグ情報がアンカータグでない場合は、ハイパ
ーリンク情報データベース45には登録は行わず、ステ
ップS42に戻る。
【0049】そして、ステップS42乃至S44を繰り
返して、そのHTMLソースに含まれる全てのアンカー
タグをハイパーリンク情報データベース45に登録す
る。
【0050】上述のようにして、ステップS4が終了す
ると、Webページリンク解析部5によって、HEAD
メソッドを実行してリンク先ファイルのヘッダフィール
ドを取得し、HTMLソースに含まれるファイルのリン
ク情報を解析する(ステップS5)。具体的には、図1
5に示すように、まず、ハイパーリンク情報データベー
ス45を参照して、リンクの張られたファイルの名前と
パス名を取得する(ステップS51)。
【0051】次に、HEADメソッド実行部52によっ
て、HEADメソッドを実行して、リンクの張られたフ
ァイルのヘッダ情報を取得する(ステップS52)。フ
ァイルヘッダ情報取得部53によって、取得したヘッダ
情報の中からContent−Typeの値を抽出する
(ステップS53)。
【0052】ヘッダフィールド判定部54によって、抽
出したContent−Typeの値がtext/ht
mlであるか、もしくはアクセス属性データベース23
に登録されているContent−Typeの値となっ
ているかどうかを判定する(ステップS54)。
【0053】Content−Typeの値が上記の条
件を満たせば、リンクの張られたファイルをツリー表示
するものと決定して、ツリー表示データベース56に登
録を行う(ステップS55)。Content−Typ
eの値が上記の条件を満たさなければ、ツリー表示デー
タベース56への登録は行わない。
【0054】なお、ツリー表示データベース56に登録
されたファイルは、前述のようにツリー構造のノードと
して表示される。
【0055】その後、そのWebページにハイパーリン
ク情報が含まれているか否かを判定して(ステップS5
6)、含まれていれば上述のステップS52乃至S55
を繰り返す。つまり、そのHTMLソースに含まれるリ
ンク先ファイルの全てのヘッダ情報を調べて、ツリー表
示のノードとして表示すべきファイルをツリー表示デー
タベータ56に登録する動作を繰り返す。
【0056】上述のようにして、ステップS5が終了す
ると、Webページの階層構造をツリー構造に変換して
Webページの表示を行う(ステップS6)。具体的に
は、図16に示すように、ツリー表示データベータ56
を参照して、ツリー表示するファイル名、パス名、ファ
イルの個数、及びアクセス属性を取得する(ステップS
61)。
【0057】ファイルの個数及びWebページの階層構
造に応じて、ツリー構造のノードとして表示する際のノ
ードの描画位置を決定する(ステップS62)。そし
て、ノードの描画を行い、代表テキスト情報データベー
ス43を参照して得られた代表テキスト情報をノード内
部に表示する(ステップS63)。
【0058】次に、それぞれのノードをパスで接続して
ツリー構造を作成して表示する(ステップS64)。ユ
ーザはツリー構造におけるノードを選択することによっ
て、そのノードに対応するWebページをブラウジング
することができる。
【0059】さらにHTMLソースをダウンロードする
か否かを判定して(ステップS7)、HTMLソース
(Webページ)をダウンロードする場合には、ステッ
プS2に戻る。そして、HTMLソース(Webペー
ジ)をダウンロードしない場合には、処理を終了する。
【0060】ここで、図17乃至図22を参照して、図
17乃至図22にはWebページ(HTML)のソース
の一例を示が示されており。ここでは、それぞれファイ
ル名をa.html、b.html、c.html、
d.html、e.html、f.htmlとして表
す。
【0061】図23も参照して、図23には優先アクセ
スWebブラウジング処理装置で表示されたツリー構造
の一例が示されている。なお、符号81乃至86で示す
長方形のブロックはツリー構造のノードを表しており、
各ノードはネットワーク上で相互にリンクされているW
ebページに対応している。前述のように、ユーザはノ
ードを選択することによって、そのノードに対応したW
ebページをブラウジングすることができる。
【0062】図示のツリー構造では、ノード81の下位
にノード82とノード86とが直接リンクで張られてお
り、ノード82の下位にはノード83とノード84とが
リンクされている。そして、ノード84の下位にはノー
ド85がリンクされている。なお、ノード83、ノード
85、及びノード86には、下位のリンクは存在しな
い。
【0063】各ノードの内部には代表テキスト情報が表
示される。代表テキスト情報はそのWebページの内容
を示すキーワードであり、ユーザはこのテキスト情報か
ら、そのWebページの内容をある程度推測することが
できる。従って、ユーザは効率的なWebページのアク
セスを行うことができる。
【0064】図17は、ノード81のWebページ
(a.html)の内容を示しており、このWebペー
ジにはTITLEタグが含まれている。従って、代表テ
キスト情報抽出部42によって、このWebページの代
表テキスト情報は「インデックス」となる。よって、ノ
ード81の内部には「インデックス」が表示される。
【0065】また、このWebページにはアンカタグが
存在し、アンカタグが表すファイル名はそれぞれb.h
tml f.htmlとなる。よって、ノード81の下
位にはb.htmlを表すノード82とf.htmlを
表すノード86がリンクされている。
【0066】図18は、ノード82のWebページ
(b.html)の内容を示しており、このWebペー
ジにはTITLEタグが含まれている。従って、このW
ebページの代表テキスト情報は「第2階層」となる。
よって、ノード82の内部には「第2階層」と表示され
る。
【0067】また、このWebページにはアンカタグが
存在し、アンカタグが表すファイル名はそれぞれc.h
tmlとd.htmlになる。よって、ノード82の下
位にはc.htmlを表すノード83とd.htmlを
表すノード84がリンクされている。
【0068】図19はノード83のWebページ(c.
html)の内容を示しており、このWebページには
TITLEタグが含まれていない。そこで、代表テキス
ト情報抽出部42によって、テキスト情報の最初の一文
を抽出する。これによって、このWebページの代表テ
キスト情報は「第3階層です。」となる。よって、ノー
ド83の内部には「第3階層です。」と表示される。な
お、このWebページにはハイパーリンク情報が存在し
ないので、ノード83から下位へ向かうパスは存在しな
い。
【0069】図20はノード84のWebページ(d.
html)の内容を示しており、このWebページには
TITLEタグが含まれている。代表テキスト情報抽出
部42によって、このWebページの代表テキスト情報
は「第3階層」となる。よって、ノード84の内部には
「第3階層」と表示される。
【0070】なお、このWebページにはアンカタグが
存在し、アンカタグが表すファイル名はe.htmlと
なる。よって、ノード84の下位にはe.htmlを表
すノード85がリンクされる。
【0071】図21は、ノード85のWebページ
(e.html)の内容を示しており、このWebペー
ジにはTITLEタグが含まれている。従って、代表テ
キスト情報抽出部42によって、このWebページの代
表テキスト情報は「第4階層」となる。よって、ノード
85の内部には「第4階層」と表示される。なお、この
Webページにはハイパーリンク情報が存在しないの
で、ノード83と同様に、下位へ向かうパスは存在しな
い。
【0072】図22はノード86のWebページ(f.
html)の内容を示しており、WebページにはTI
TLEタグが含まれていない。そこで、代表テキスト情
報抽出部42によって、このWebページの代表テキス
ト情報は「第2階層です。」となる。よって、ノード8
6の内部には「第2階層です。」と表示される。なお、
このWebページにはハイパーリンク情報が存在しない
ので、ノード83及びノード85と同様に、下位へ向か
うパスは存在しない。
【0073】このように、本発明の優先アクセスWeb
ブラウジング処理装置によって、ユーザは肥大化したW
ebページ及び階層の深いWebページでも、ツリー構
造を用いたユーザインターフェースとヘッダフィールド
を用いたリンク解析アルゴリズムによって、効率的なW
ebページのブラウジングを行うことができる。
【0074】さらに、ツリー構造を用いたユーザインタ
ーフェースによって、Webページ全体の構成の理解も
容易になる。
【0075】
【発明の効果】以上説明したように、本発明では、肥大
化したWebページ及び階層の深いWebページをブラ
ウジングする際にも、Webページ及び階層の深いWe
bページを効率的にアクセスすることができるという効
果がある。
【0076】さらに、本発明では、Webページの階層
構造をツリー構造に変換して表示するグラフィカルユー
ザインターフェースを用いているから、Webページの
全体構成の理解が容易となる。その結果、ユーザはツリ
ー構造で表示されたノードを選択するだけで、階層の深
いWebページでも自在にアクセスすることができると
いう効果がある。
【図面の簡単な説明】
【図1】本発明による優先アクセスWebブラウジング
処理装置の一例を示す図である。
【図2】図1に示すURL入力部を詳細に示すブロック
図である。
【図3】図1に示すアクセス属性入力部を詳細に示すブ
ロック図である。
【図4】図1に示すHTMLソースダウンロード部を詳
細に示すブロック図である。
【図5】図1に示すHTMLソース解析部を詳細に示す
ブロック図である。
【図6】図1に示すWebページリンク解析部を詳細に
示すブロック図である。
【図7】図1に示すWebページ表示部を詳細に示すブ
ロック図である。
【図8】図1に示すノード選択部を詳細に示すブロック
図である。
【図9】WWWサーバからHTMLソースをダウンロー
ドする際の動作を示す図である。
【図10】本発明による優先アクセスWebブラウジン
グ処理装置の動作を説明するための流れ図である。
【図11】URL及びアクセス属性を入力する際の動作
を説明するための流れ図である。
【図12】WWWサーバからHTMLソースをダウンロ
ードする際の動作を説明するための流れ図である。
【図13】代表テキスト情報を決定する際の動作を説明
するための流れ図である。
【図14】ハイパーリンク情報を抽出する際の動作を説
明するための流れ図である。
【図15】リンク先ファイルのヘッダフィールドを取得
してリンク情報を解析する際の動作を説明するための流
れ図である。
【図16】Webページの階層構造をツリー構造に変換
して表示する際の動作を説明するための流れ図である。
【図17】Webページソースの一例を表す図である。
【図18】Webページソースの一例を表す図である。
【図19】Webページソースの一例を表す図である。
【図20】Webページソースの一例を表す図である。
【図21】Webページソースの一例を表す図である。
【図22】Webページソースの一例を表す図である。
【図23】本発明による優先アクセスWebブラウジン
グ処理装置を用いて表示したツリー構造の一例を示す図
である。
【符号の説明】
1 URL入力部 2 アクセス属性入力部 3 HTMLソースダウンロード部 4 HTMLソース解析部 5 Webページリンク解析部 6 Webページ表示部 7 ノード選択部

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 ユニフォームリソースローケータ(UR
    L)を入力するためのURL入力部と、アクセスしたい
    ウェブ(Web)ページの属性を入力するアクセス属性
    入力部と、ワールドワイルドウェブ(WWW)サーバか
    らハイパーテキストマークアップ言語(HTML)ソー
    スのダウンロードを行うHTMLソースダウンロード部
    と、該ダウンロードしたHTMLソースの解析を行うH
    TMLソース解析部と、前記Webページのリンク情報
    の解析を行うリンク解析部と、前記Webページの階層
    構造をツリー構造に変換して表示するWebページ表示
    部と、前記ツリー構造からノードを選択して該選択され
    たノードに対応するWebページをアクセスするノード
    選択部とを有することを特徴とする優先アクセスウェブ
    ブラウジング処理装置。
  2. 【請求項2】 請求項1に記載された優先アクセスウェ
    ブブラウジング処理装置において、前記リンク解析部は
    前記WWWサーバからダウンロードしたヘッダ情報を取
    り込む機能を備えるヘッダ情報取得部を有することを特
    徴とする優先アクセスウェブブラウジング処理装置。
  3. 【請求項3】 請求項1に記載された優先アクセスウェ
    ブブラウジング処理装置において、前記HTMLソース
    解析部は前記HTMLソースの中から代表とするテキス
    ト情報を代表テキスト情報として決定する代表テキスト
    情報抽出部と、前記HTMLソースの中からハイパーリ
    ンク情報を抽出するハイパーリンク情報抽出部とを有す
    ることを特徴とする優先アクセスウェブブラウジング処
    理装置。
  4. 【請求項4】 請求項1に記載された優先アクセスウェ
    ブブラウジング処理装置において、前記Webページ表
    示部は前記Webページの階層構造をツリー構造に変換
    するWebページ階層構造/ツリー構造変換部を有する
    ことを特徴とする請求項1記載の優先アクセスウェブブ
    ラウジング処理装置。
  5. 【請求項5】 請求項1に記載された優先アクセスウェ
    ブブラウジング処理装置において、前記リンク解析部は
    前記Webページの属性のみを優先的にアクセスして前
    記Webページ相互のリンク情報を解析することを特徴
    とする優先アクセスウェブブラウジング処理装置。
  6. 【請求項6】 請求項1に記載された優先アクセスウェ
    ブブラウジング処理装置において、前記Webページ表
    示部は前記Webページの階層構造をツリー構造に変換
    して表示する際に、ノード内部に前記テキスト情報を表
    示するとともに前記Webページに含まれるタグ情報を
    用いてテキスト情報を抽出するようにしたこと特徴とす
    る優先アクセスウェブブラウジング処理装置。
JP8274581A 1996-10-17 1996-10-17 優先アクセスウェブブラウジング処理装置 Pending JPH10124518A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8274581A JPH10124518A (ja) 1996-10-17 1996-10-17 優先アクセスウェブブラウジング処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8274581A JPH10124518A (ja) 1996-10-17 1996-10-17 優先アクセスウェブブラウジング処理装置

Publications (1)

Publication Number Publication Date
JPH10124518A true JPH10124518A (ja) 1998-05-15

Family

ID=17543747

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8274581A Pending JPH10124518A (ja) 1996-10-17 1996-10-17 優先アクセスウェブブラウジング処理装置

Country Status (1)

Country Link
JP (1) JPH10124518A (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19990078876A (ko) * 1999-08-16 1999-11-05 노승환 일괄된 자원 위치기 입력을 통한 정보 검색 방법
EP0974916A2 (en) * 1998-07-21 2000-01-26 SAMSUNG ELECTRONICS Co. Ltd. System and method for displaying web documents
JP2000132481A (ja) * 1998-10-22 2000-05-12 Sharp Corp 情報取得装置および方法ならびに情報取得制御プログラムを記憶した媒体
US6539424B1 (en) 1999-11-12 2003-03-25 International Business Machines Corporation Restricting deep hyperlinking on the World Wide Web
US6654814B1 (en) 1999-01-26 2003-11-25 International Business Machines Corporation Systems, methods and computer program products for dynamic placement of web content tailoring
SG102570A1 (en) * 1999-04-16 2004-03-26 Ibm Web site browsing system
US6941368B1 (en) 2000-05-31 2005-09-06 International Business Machines Corporation Protecting resource URLs from being served without a base web page
JP2006107358A (ja) * 2004-10-08 2006-04-20 Fujitsu Ltd ウェブページ閲覧装置及びウェブページ閲覧プログラム
WO2008040046A1 (en) * 2006-10-04 2008-04-10 Thegofa Pty Ltd Method and apparatus relating to webpages and real estate information
JP2009223485A (ja) * 2008-03-14 2009-10-01 Brother Ind Ltd リンクツリー作成プログラム及び作成装置

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7032172B1 (en) 1998-07-21 2006-04-18 Samsung Electronics Co., Ltd. System and method for displaying scale-down picture
EP0974916A2 (en) * 1998-07-21 2000-01-26 SAMSUNG ELECTRONICS Co. Ltd. System and method for displaying web documents
EP0974916A3 (en) * 1998-07-21 2005-08-10 SAMSUNG ELECTRONICS Co. Ltd. System and method for displaying web documents
JP2000132481A (ja) * 1998-10-22 2000-05-12 Sharp Corp 情報取得装置および方法ならびに情報取得制御プログラムを記憶した媒体
US6654814B1 (en) 1999-01-26 2003-11-25 International Business Machines Corporation Systems, methods and computer program products for dynamic placement of web content tailoring
SG102570A1 (en) * 1999-04-16 2004-03-26 Ibm Web site browsing system
KR19990078876A (ko) * 1999-08-16 1999-11-05 노승환 일괄된 자원 위치기 입력을 통한 정보 검색 방법
US6539424B1 (en) 1999-11-12 2003-03-25 International Business Machines Corporation Restricting deep hyperlinking on the World Wide Web
US6941368B1 (en) 2000-05-31 2005-09-06 International Business Machines Corporation Protecting resource URLs from being served without a base web page
JP2006107358A (ja) * 2004-10-08 2006-04-20 Fujitsu Ltd ウェブページ閲覧装置及びウェブページ閲覧プログラム
JP4518388B2 (ja) * 2004-10-08 2010-08-04 富士通株式会社 ウェブページ閲覧装置
WO2008040046A1 (en) * 2006-10-04 2008-04-10 Thegofa Pty Ltd Method and apparatus relating to webpages and real estate information
JP2009223485A (ja) * 2008-03-14 2009-10-01 Brother Ind Ltd リンクツリー作成プログラム及び作成装置
US8788924B2 (en) 2008-03-14 2014-07-22 Brother Kogyo Kabushiki Kaisha Link tree creation device

Similar Documents

Publication Publication Date Title
US5793966A (en) Computer system and computer-implemented process for creation and maintenance of online services
JP3548098B2 (ja) ネイティブ言語照会サービスを提供する方法およびシステム
US8694680B2 (en) Methods and apparatus for enabling use of web content on various types of devices
KR100461019B1 (ko) 소형 화면 단말기를 위한 웹 컨텐츠 변환 시스템 및 방법
US20020016801A1 (en) Adaptive profile-based mobile document integration
US6442576B1 (en) Searching for documents with multiple element types
US20110185273A1 (en) System and method for extracting content elements from multiple Internet sources
US20090019386A1 (en) Extraction and reapplication of design information to existing websites
US20140052778A1 (en) Method and apparatus for mapping a site on a wide area network
JPH11502346A (ja) オンラインサービスの作成および保守用のコンピュータシステムおよびコンピュータ実行プロセス
JP2002537603A (ja) ウエブサイト用のハイパーメディアコンテンツの作成
JPH10124518A (ja) 優先アクセスウェブブラウジング処理装置
JP3590726B2 (ja) データベース検索システム,検索用サーバ装置,クライアント端末およびサーバ用プログラム記録媒体
JP2000132565A (ja) 検索支援装置及び方法並びにその装置での処理をコンピュータにて行なわせるためのプログラムを格納した記録媒体
JP2008134906A (ja) 業務プロセス定義生成方法、装置及びプログラム
JPH10222415A (ja) 更新情報を用いたWebブラウジング処理装置
US20130132820A1 (en) Web browsing tool delivering relevant content
EP2711838A1 (en) Documentation parser
JPH11212998A (ja) データ表示装置及び記録媒体
Cisco Creating Web Page Transformations
EP1840765A1 (en) Process for extracting data from a web site
JP2002169836A (ja) 情報の集約整理支援システム
JP2001022788A (ja) 情報検索装置および情報検索プログラムを記録した記録媒体
JP4438392B2 (ja) 木構造データ作成装置及びプログラム
JP2000222326A (ja) 学習支援方法及びシステム及び学習支援プログラムを格納した記憶媒体

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 19991208