JP2000285006A - 情報取得制御装置及び情報取得制御方法 - Google Patents

情報取得制御装置及び情報取得制御方法

Info

Publication number
JP2000285006A
JP2000285006A JP11093757A JP9375799A JP2000285006A JP 2000285006 A JP2000285006 A JP 2000285006A JP 11093757 A JP11093757 A JP 11093757A JP 9375799 A JP9375799 A JP 9375799A JP 2000285006 A JP2000285006 A JP 2000285006A
Authority
JP
Japan
Prior art keywords
data
acquisition
information
unit
web
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11093757A
Other languages
English (en)
Inventor
Tetsuo Muranaga
哲郎 村永
Hideki Yoshida
英樹 吉田
Seiji Ito
清司 伊藤
Tetsuo Kimura
哲郎 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP11093757A priority Critical patent/JP2000285006A/ja
Priority to EP00302729A priority patent/EP1041497B1/en
Priority to DE60017488T priority patent/DE60017488T2/de
Publication of JP2000285006A publication Critical patent/JP2000285006A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9577Optimising the visualization of content, e.g. distillation of HTML documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9574Browsing optimisation, e.g. caching or content distillation of access to content, e.g. by caching

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Computer And Data Communications (AREA)

Abstract

(57)【要約】 【課題】 低バンド幅の回線を有効に活用して必要な情
報が利用者に提示されるまでの待ち時間が短くなるよう
なデータ取得を行う情報取得制御装置を提供すること。 【解決手段】 利用者側からの要求に基づいてWebサ
ーバ側からHTML文書を取得する情報取得制御装置に
おいて、データ取得部11によりWebサーバ側からH
TML文書を取得し、データ解析部13によりHTML
文書を解析し、データ戦略決定部14により解析結果に
基づいて次の取得候補となるデータ、例えばリンク先の
HTML文書、インラインイメージ等のデータ型を予測
し、この予測結果に基づいて該次の取得候補となるデー
タについて全部分を取得するか、先頭フレーム等の一部
分を取得するか、取得しないかを決定し、データ取得部
11は、決定に従ってHTML文書やインラインイメー
ジ等を取得する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、サーバ側からの情
報をクライアント側に送信し、利用者に提示させるWW
Wシステムにおいてデータ取得戦略を決定する情報取得
制御装置及び情報取得制御方法に関する。
【0002】
【従来の技術】利用者がクライアント装置から情報を要
求し、それに対してデータサーバ装置が情報を提供する
情報アクセスシステムとして、広く使われているものに
WWW(World Wide Web)システムがあ
る。WWWでは、マルチメディア文書データが相互に関
連付けられており、利用者は文書間リンクを手繰りなが
ら情報にアクセスする。情報アクセスの際、利用者が使
うクライアントからWebサーバに対してデータを要求
する通信が行われ、これに対してWebサーバが返答す
ることでデータはクライアントに供給される(N.Ye
ager teal:Web Server Tech
nology,Morgan Kaufmann,邦
訳:Webサーバ完全技術解説、日経BP社)。
【0003】クライアントとWebサーバとはインター
ネットを介して接続するが、その間にプロキシサーバと
呼ばれる通信を中継するシステムを置くことがある。プ
ロキシサーバはクライアントに対してはWebサーバと
して働き、Webサーバに対してはクライアントとして
動作する。よくアクセスするWeb文書をプロキシサー
バにキャッシュすることにより、Webアクセスを高速
化することが一般に行われている。
【0004】
【発明が解決しようとする課題】上述したWWWシステ
ムでは、インターネットの接続回路のバンド幅が限定さ
れ、アクセスが速くない場合が多い。例えば、モバイル
ワーカや家庭のPC(計算機)利用者が使うのは公衆網
である。そのバンド幅は、9.6Kbpsから64Kb
psであり、10MbpsのLAN接続に比べると10
0〜1000倍遅い。また、オフィス内LANからイン
ターネット接続する場合に、インターネット側の回線の
バンド幅が限定される場合もある。例えば、オフィスか
らインターネットへの入り口に置いたプロキシサーバま
ではLAN接続であるが、プロキシサーバからインター
ネットへは専用線接続で64Kbpsから1.5Mbp
sというバンド幅であって、しかも多数のオフィスユー
ザで共有されるため、ここがWebアクセスのボトルネ
ックになる場合がある。
【0005】このように、低バンド幅の回線を経由して
Webアクセスすると、情報が利用者に表示されるまで
の待ち時間が長くなるという問題がある。また、このよ
うな低バンド幅の回線で、Webアクセスを高速化する
ために画像を送らないという設定をする方法があるが、
画像を全く送らないのでは利用者に情報が十分に伝わら
ないなどの問題がある。
【0006】本発明は、上記事情を考慮してなされたも
ので、低バンド幅の回線を有効に活用して、必要な情報
が利用者に提示されるまでの待ち時間が短くなるような
データ取得を行う情報取得制御装置及び情報取得制御方
法を提供することを目的とする。
【0007】
【課題を解決するための手段】本発明(請求項1)に係
る情報取得制御装置は、サーバ装置に対する取得要求を
送信して所望の構造化文書を取得する取得手段と、前記
取得手段により取得された前記構造化文書を解析する解
析手段と、前記解析手段の解析結果に基づいて次の取得
候補となるデータのデータ型を予測する予測手段と、前
記予測手段で予測されたデータ型に基づいて、次の取得
候補となる前記データの取得を行うか否かを決定する決
定手段とを具備したことを特徴とする。
【0008】サーバ装置は、例えば、Webサーバであ
る。構造化文書は、例えば、HTML(Hyper T
ext Markup Language)で記述され
るデータである。次の取得候補となるデータには、例え
ば、取得された構造化文書中おいて関連付けられている
リンク先の他の構造化文書、インラインイメージ等のイ
ンライン情報がある。構造化文書のプリフェッチを行う
場合には、リンク先の他の構造化文書をプリフェッチす
る。また、複数段のプリフェッチを行う場合には、プリ
フェッチしたリンク先の構造化文書をも上記解析対象と
して、上記解析・決定、そして取得を行う。また、構造
化文書のプリフェッチを行う際に、インライン情報はプ
リフェッチしない、あるいは最終段の構造化文書のプリ
フェッチを行う際には、タイトルのみをプリフェッチす
るなどの制御も可能である。
【0009】好ましくは、前記決定手段は、前記構造化
文書に含まれる、前記データの記述形式を示すタグ情
報、前記データの記録場所を示す場所情報、または前記
データに関連するコメント情報の少なくとも一つに基づ
いて前記データ型を予測するようにしてもよい。データ
型は、例えば、HTMLページ、動的に生成されるコン
テンツ、静止画像(例えば、gif画像)、音データ
(例えば、MPEG)、映像データ(例えば、MPE
G)、プログラム(例えば、Javaプログラム)、な
どである。また、例えば、背景画像、小さい画像、画像
が多いページ、広告画像など、何らかの評価を含んでも
よい。データの記述形式を示すタグ情報に基づいた予測
は例えば「APPLETタグならばJavaプログラム
である」等であり、データの記録場所を示す場所情報に
基づいた予測は例えば「URL/ファイル名の拡張子
が.htmならばHTMLページである」等)であり、
データに関連するコメント情報に基づいた予測は例えば
「周囲のコメント文より広告用と予測されるデータであ
るならば広告画像である」等である。
【0010】好ましくは、前記決定手段は、次の取得候
補となる前記データの取得を決定する際には、前記デー
タの取得形態を決定するするようにしてもよい。データ
の取得形態は、例えば、大きく分けて、そのデータを通
常通り全部取得する形態と、そのデータの一部のみを取
得する形態とがある。また、後者には、文字データのみ
取得する形態、コメント情報のみ取得する形態、そのデ
ータの前半部のみ取得する形態、動画像データの先頭フ
レームのみ取得する形態など、データ型に応じて様々な
方法が考えられる。
【0011】好ましくは、前記決定手段は、次の取得候
補となる前記データが、画像データ、音データまたは映
像データである場合には、前記データの一部のみを取得
することを決定するようにしてもよい。
【0012】好ましくは、所定のデータに関する所定の
取得形態を示す取得形態ルール群を記憶する第1の記憶
手段をさらに具備し、前記決定手段は、前記予測手段で
予測されたデータ型に基づいて、次の取得候補となる前
記データの取得を行うか否かを決定し、前記データを取
得する場合には、その取得形態を決定するようにしても
よい。上記のルールは、例えば、if…then…ルー
ルである。
【0013】好ましくは、所定のデータに関して、取得
の可否を示す取得可否ルール群を記憶する第2の記憶手
段をさらに具備し、前記決定手段は、前記予測手段で予
測されたデータ型と前記取得可否ルール群に基づいて、
次の取得候補となる前記データの取得を行うか否かを決
定し、前記データを取得する場合には、その取得形態を
決定するようにしてもよい。上記の取得可否ルール群
は、例えば、ブラウザ設定情報である。
【0014】好ましくは、前記サーバ装置から取得した
データをキャッシュするためのデータ記憶手段を更に備
えるようにしてもよい。
【0015】好ましくは、前記サーバから次の取得候補
となる前記データの取得を行う代りに、該データの代替
となるデータを生成して出力するデータ変換手段をさら
に具備するようにしてもよい。
【0016】また、本発明は、クライアント装置からの
要求に基づいてサーバ装置から構造化文書を取得すると
ともに、この取得された構造化文書内の記述により関連
付けられている他の構造化文書およびこの取得された構
造化文書内の記述により指定されているインライン情報
を所定の取得形態で取得する情報取得制御システムであ
って、クライアント装置からの要求に基づいてサーバ装
置から構造化文書を取得する手段と、取得された構造化
文書のうちから解析対象とされた構造化文書中おいて他
の構造化文書を関連付けている記述およびインライン情
報を指定している記述に関して解析を行う手段と、前記
記述に関する解析の結果に基づいて、次の取得候補とな
る他の構造化文書およびインライン情報の各々につい
て、取得するか否かおよび取得する場合における取得形
態を決定する手段と、前記決定に基づいて前記他の構造
化文書および前記インライン情報に関する取得を行う手
段とを備えたことを特徴とする。
【0017】なお、本発明は、上記の情報取得制御シス
テムに相当する機能を組み込んだブラウザとしても、上
記の情報取得制御システムに相当する機能を組み込んだ
プロキシサーバとしても成立する。例えば、上記したい
ずれかの情報取得制御システムと、利用者との対話を司
る入出力手段とを備え、利用者からの要求に基づいて取
得した構造化文書の次のデータの取得戦略を、前記情報
取得制御システムが決定するようにしたブラウザとして
も本発明は成立する。また、この場合に、利用者から指
定される設定情報を保持するブラウザ設定記憶手段を更
に備え、前記ブラウザ設定記憶手段に保持された既定の
動作属性に基づいて、次のデータの取得戦略を前記情報
取得制御システムが決定するようにしてもよい。また、
例えば、上記したいずれかの情報取得制御システムと、
上流のサーバおよび下流のサーバとの通信を行う通信手
段とを備え、クライアント装置とサーバ装置との間のデ
ータを中継し、取得した構造化文書の次のデータの取得
戦略を、前記情報取得制御システムが決定するようにし
たプロキシサーバとしても本発明は成立する。また、こ
の場合に、設定情報を保持するプロキシ設定記憶手段を
更に備え、前記プロキシ設定記憶手段に保持された既定
の動作属性に基づいて、次のデータの取得戦略を前記情
報取得制御システムが決定するようにしてもよい。
【0018】なお、装置/システムに係る本発明は方法
に係る発明としても成立する。
【0019】本発明(請求項8)に係る情報取得制御方
法は、サーバ装置に対する取得要求を送信して所望の構
造化文書を取得し、取得された前記構造化文書を解析
し、前記解析結果に基づいて次の取得候補となるデータ
のデータ型を予測し、前記予測されたデータ型に基づい
て、次の取得候補となる前記データの取得を行うか否か
を決定することを特徴とする。
【0020】また、装置または方法に係る本発明は、コ
ンピュータに当該発明に相当する手順を実行させるため
の(あるいはコンピュータを当該発明に相当する手段と
して機能させるための、あるいはコンピュータに当該発
明に相当する機能を実現させるための)プログラムを記
録したコンピュータ読取り可能な記録媒体としても成立
する。
【0021】本発明によれば、データ取得をデータ形式
に基づいてきめ細かく制御することができるので、利用
者が要求した構造化文書の概要が表示等されるまでの待
ち時間を減らすことができる(なお、内容や設定によっ
て構造化文書全体が表示されることもある)。また、概
要情報で内容が理解できなかったときに改めて全データ
を取得することができるため、利用者にとって不要なデ
ータで通信回線を浪費することがなく(通信トラフィッ
ク量を増やすことがなく)、限られた回線のバンド幅を
有効に活用することができる。また、効果的なプリフェ
ッチも可能とする。
【0022】
【発明の実施の形態】以下、図面を参照しながら発明の
実施の形態を説明する。
【0023】図1に、本発明の実施の形態に係る情報取
制御システムの基本的な構成例を示す。
【0024】本情報取得制御システム10は、Webサ
ーバから情報を取得するデータ取得部11、取得したデ
ータを記憶・保持するデータ記憶部12、取得したデー
タの構文解析を行うデータ解析部13、データ解析の結
果をもとにデータ取得戦略を決めるデータ取得戦略決定
部14、戦略決定に必要なルール(取得形態ルール群)
を記憶する戦略記憶部15を備えている。また、データ
解析部13の利用者の側に、取得されたデータに適宜変
換を施すデータ変換部をさらに備えることもある。
【0025】本情報取得制御システム10は、詳しくは
後述するように、利用者側から指定された情報(Web
ページのデータの全部、または一部(例えばインライン
データは取得しない設定がなされている場合におけるイ
ンラインデータを除いた部分)、からなる情報)がデー
タ記憶部12に存在しない場合に該情報を該当するWe
bサーバから取得して利用者側に出力する機能と、利用
者側から指定された情報がデータ記憶部12に存在する
場合に該データ記憶部12から読み出した該情報を利用
者側に出力する機能と、取得した情報に関連する関連情
報(例えば、取得したページのリンク先のページ、リン
ク先ページからリンクするページ、…、あるいは各ペー
ジのインラインイメージ、など)のうちの所定のものを
所定のデータ形態(例えば、全データそのまま、情報量
を削減した形態、など)で該当するWebサーバから取
得してデータ記憶部12に記憶・保持する機能を持ち、
特にどのような関連情報取得を行うかについての情報取
得戦略をユーザの指定やデータの属性を考慮しつつきめ
細かく決定する機能を有するものである。
【0026】また、本情報取得制御システム10は、取
得要求された情報をデータ解析部13を介して利用者側
に出力する際に、データ変換部によって該情報の一部を
変換したものとして出力することも可能である。例え
ば、WebページのデータのうちインラインデータはW
ebサーバから取得せずに、用意しておいたあるいは生
成した代替画像を該インラインデータとして出力するこ
とも可能である。
【0027】以下では、図1の情報取得制御システムを
Webブラウザに組み込んだ実施形態(図2)、該情報
取得制御システムをWebプロキシサーバに組み込んだ
実施形態(図18)、その他のバリエーションに(一つ
の計算機上に「既存のWebブラウザ」と「該情報取得
制御システムを組み込んだWebプロキシサーバ」とを
搭載する実施形態(図21)、該情報取得制御システム
を組み込んだWebプロキシサーバを多段に組み合わせ
て連携させる実施形態(図22)、該情報取得制御シス
テムを組み込んだWebブラウザと該情報取得制御シス
テムを組み込んだWebプロキシとを連携させる実施形
態(図23)、など)ついて説明する。
【0028】まず、図1の情報取得制御システムをWe
bブラウザに組み込んだ実施形態について説明する。
【0029】図2に、この場合のWebブラウザからW
ebサーバまでのネットワーク構成の一例を示す。図2
では、情報取得制御システム20がWebブラウザ21
に組み込まれた構成を示している。
【0030】Webブラウザ21の利用者は、例えば、
家庭のPCユーザやモーバイルワーカなどである。一般
に利用者は、インターネットサービスプロバイダ22に
公衆網経由でアクセスし、そこからインターネット23
にアクセスする。Webブラウザ21から情報を要求す
ることにより、インターネット23につながったWeb
サーバ24から、情報の提供を受ける。
【0031】Webブラウザ21とインターネットサー
ビスプロバイダ22との接続は電話網で、そのバンド幅
は9.6Kbpsから64Kbpsであり、これは10
MbpsのLAN接続に比べて100−1000倍遅
い。このような低バンド幅の回線を経由してWebアク
セスする際に、情報取得制御システム20がきめ細かく
データ取得を制御することで、必要な情報が利用者に提
示されるまでの待ち時間を短くする。
【0032】最初に、Webブラウザでの基本的なHT
MLの処理に関して説明する。
【0033】Webの情報はHTML(Hyper T
ext Markup Language)で記述され
る。
【0034】図3に、HTMLで記述された情報(構造
化文書)の一例を示す。
【0035】図4に、図3の情報の構造を示す。この構
造化文書には、2つのページへのリンク(<A HRE
F…>の部分)と、1つのインラインイメージの指定
(<IMG SRC…>の部分)とが記述されている。
【0036】図3の文書をWebサーバから取得して、
Webブラウザで表示すると、図5に示すようになる。
【0037】まず、図5の表示例において、「HTML
例」の表示文字列は図3の<TITLE>...</
TITLE>のタグで指定されたものであり、「リン
ク」と「インラインイメージ」の表示文字列は<H1
>...</H1>のタグで指定されたものである。
【0038】次に、リンクについて説明する。
【0039】図3の文書における<A HREF=“h
ttp://www.xxx.com/”>フレッシュ
アイ</A>という記述(タグ)は、別の文書へのリン
クとなっている。これは、図5に示すように、ブラウザ
での表示上、「フレッシュアイ」という文字列にアンダ
ーラインがついて、次の文書へのリンクであることが示
される。ここを利用者がマウスでクリックなどすること
により、Webブラウザが次の文書データを要求して取
得し、それを表示することになる。
【0040】このように利用者の指示に従って取得すべ
き次の情報を示す「リンク情報」を指定するタグ記述と
しては、 ・リンク<A HREF=“http://www.xxx.com/”>. ..</A> ・クリッカブルマップ(AREA HREF=“...”> ・フォーム<FORM ACTION=“.../cgi−bin/perl .pl” METHOD=“post”> などがある。
【0041】次に、インラインイメージについて説明す
る。
【0042】図3の文書における<IMG SRC=
“fujisan_th.jpg”WIDTH=...
>というタグは、その文書内に埋め込まれる画像、すな
わちインラインイメージを示している。Webブラウザ
は、HTML解析中にこのタグを見つけると、タグ中の
SRC属性に示された画像データを取得して、それを表
示する。前述の文書へのリンクとの相違は、利用者がク
リック等の選択操作をしなくても、Webブラウザがデ
ータの取得要求を出すところにある。
【0043】また、この<IMG SRC=“fuji
san_th.jpg” WIDTH=...ALT=
“富士山”>というタグには、ALT属性が指定されて
いる。このALT属性は、SRCで示された画像が取得
できなかった場合に、代りにこのALT属性で示された
文字列、この例では「富士山」という文字列、を表示せ
よという指定である。
【0044】また、ブラウザに画像を取得するかしない
かの設定が可能な場合に、ブラウザが「画像を取得しな
い」設定になっていた場合は、画像の取得要求を出さず
に代りに、ALT属性で示された文字列を表示する。図
6に、ALT属性で指定された文字列「富士山」が、イ
ンラインイメージの代りに表示されている例を示す。
【0045】このように、元のページ中で指定されたデ
ータを取得して、元のページの表示と同時に提示(表
示、再生等)される「インライン情報」を指定するタグ
記述としては、 ・インライン画像(イメージ)の指定 <IMG SRC=“fujisan_th.jpg” WIDTH=... ALT=“富士山”> ・背景画像の指定 <BODY BACKGROUND=“image.gif” BGCOLO R=...> <BODY STYLE=“backgound:url(image.gi f)”> ・インラインムービーなどの動画・映像情報の指定 <IMG DYNSRC=“movie.avi”> <OBJECT CLASSID=...><PARAM NAME=“SR C” VALUE=“movie.dcr”></OBJECT> <EMBED SRC=“movie.mov”> ・フレーム情報の指定 <FRAME SRC=“...”> <IFRAME SRC=“...”> ・音や音楽情報の指定 <BGSOUND SRC=“music.mid”> <OBJECT CLASSID=...><PARAM NAME=“SR C” VALUE=“music.ra”></OBJECT> <EMBED SRC=“music.au”> ・3次元画像情報の指定 <EMBED SRC=“3D.wrl”> ・プログラムの指定 <APPLET CODE=“java.class” CODEBASE= “http://...” ALT=...></APPLET> <OBJECT CLASSID=...NAME=“http://... ”></OBJECT> などがある。
【0046】次に、図2の情報取得制御システム20/
Webブラウザ21をより詳しく説明する。
【0047】図7に、図2の情報取得制御システム20
/Webブラウザ21の内部構成例を示す。
【0048】Webブラウザ21は、利用者との対話を
司る入出力部32を持ち、ここから利用者の情報取得要
求を入力、データ取得部33を介してWebサーバにデ
ータ取得要求を送信する。
【0049】データ取得部33が、Webサーバからの
データを受け取り、データ記憶部34に格納する。同時
にそのデータは、データ解析部35を経て入出力部32
に渡される。
【0050】入出力部32は、受け取ったHTMLデー
タを解析し、指定されたレイアウトにしたがって、利用
者にそのページを提示する。本実施形態では、データ解
析部35の結果如何では、受け取ったHTMLデータを
データ変換部36で変換してから、入出力部32に渡し
て表示するが、データ変換部36は必須ではない。
【0051】一方、データ解析部34での解析結果をも
とに、データ取得戦略決定部37は、次に要求すべきデ
ータの取得戦略を決定する。その際、戦略記憶部38に
格納されたルール(取得形態ルール群)を参照して取得
戦略を決定する。さらに、データ取得戦略決定部37
は、ブラウザの動作設定(取得可否ルール群)を格納す
るブラウザ設定記憶部39の設定情報を参照してデータ
取得戦略を決定する場合もある。
【0052】図8に、本情報取得制御システム/Web
ブラウザの動作フローの一例を示す。
【0053】Webブラウザ21は、まず、初期化を行
った後(ステップS1301)、利用者からの入力また
はWebサーバからの受信データを待つ状態に入る(ス
テップS1302)。
【0054】ここで利用者からの入力があると、それが
終了要求であるならば(ステップS1303)、終了処
理を行って終了する(ステップS1304)。利用者か
らの入力がブラウザの設定変更を支持するものであるな
らば(ステップS1305)、設定変更を行って(ステ
ップS1306)、再び入力・通信待ち状態に入る(ス
テップS1302)。
【0055】利用者からの入力がWebサーバへデータ
を要求するものであるならば(ステップS1307)、
Webサーバへのデータ取得要求をデータ取得部33か
ら該当するWebサーバへ送信して(ステップS130
8)、再び入力・通信待ち状態に入る(ステップS13
02)。
【0056】利用者からの要求に応じてデータ取得要求
を送信した結果、Webサーバからデータが来たなら
ば、データ取得部33はそれを受信し(ステップS13
09)、データ記憶部33へキャッシュする(ステップ
S1310)。そして、このデータをデータ解析部34
で解析する(ステップS1311)。
【0057】データ解析部34から上記データをブラウ
ザの入出力部32へ渡してデータを表示し(ステップS
1312)、Webブラウザ21は入力・通信待ち状態
に入る(ステップS1302)。また、データが表示さ
れるのと並行して、データ解析部34からデータ取得戦
略決定部37へデータ解析結果を渡し、データ取得戦略
決定部37は、データ解析結果に基づいて、次のデータ
取得に関する判断を行う(ステップS1313)。
【0058】なお、データ取得戦略決定部37により決
定されたデータ取得戦略(例えば、どのようなデータを
どのように取得するかを示す情報)はデータ取得部33
に渡され、データ取得部33は決定されたデータ取得戦
略に基づいてデータの取得を行う。また、どの程度のリ
ンク関係の階層までデータ取得戦略を及ぼすかによっ
て、データ取得戦略に基づいて取得されたデータがさら
に上記処理の対象になることもある。
【0059】図9に、利用者によって指定されるWeb
ブラウザの設定情報(取得可否ルール群)の例を示す。
【0060】LANと比べて遅い回線でWebアクセス
をする場合、データ量が大きくなりがちな画像、音、映
像、プログラムなどの情報についてはその転送に時間が
かかるので、例えばリンク先のページにデータ量の大き
な画像が含まれている場合には「リンクを示す文字列」
をクリックしてからそのページの表示が完了するまでに
かなりの時間を要することになる。
【0061】しかし、情報取得の目的等によっては、そ
れら情報を取得しないあるいはそれら情報をデータ量を
削減した形で取得することにより、表示速度の方を優先
させたいこともある。
【0062】本実施形態では、利用者は、データ量が大
きくなりがちな情報の種類毎に、「取得するか否か」、
また「取得するとしたら全部か一部分だけか」といった
設定を行うようにしている。また、利用者が表示ページ
を閲覧等している間に、次に利用者が閲覧すると予測さ
れるデータ、つまり表示ページに含まれるリンク先のペ
ージを「プリフェッチするかどうか」、プリフェッチす
るとしたら「何段分プリフェッチするか」を指定するよ
うにしている。これらの情報は入出力部32を介してブ
ラウザ設定記憶部39に保持される。
【0063】利用者はこれらの情報を対話操作時に随時
指定することができる。したがって、画像などの情報を
取得しなかった、あるいは取得しても一部だけであった
場合に、そのデータ概要が理解できなかったならば、全
データを取得する設定に戻して、もう一度情報を取得す
ることができる。あるいは、ある情報を取得しなかっ
た、あるいは取得しても一部だけであった場合に、該情
報についてのみ全データを取得して提示する機能を設け
るようにしてもよい。この場合、利用者はコマンド選択
等によりこの機能を指定することにより、Webブラウ
ザの設定情報を変更せずに、該情報の全データを取得さ
せて閲覧等することができる。
【0064】図10に、本情報取得制御システム/We
bブラウザが扱うデータ構造の一例を示す。このデータ
構造は、データ取得部33が取得したページを、データ
解析部35が解析した結果を示すものであり、データ取
得戦略決定部37はこのデータ構造を参照して処理を行
うことで、次のデータを取得すべきかどうかなどのデー
タ取得戦略を決定する。
【0065】図10(a)は、本情報取得制御システム
が処理中のページの集合を、リストの形で保持するもの
である。現在ブラウザで表示されているページがポイン
タで押さえられている。処理の最中に新たに取得された
ページは、このリストに付加される。一方、処理が終了
したページはこのリストから外される。
【0066】図10(b)は、処理中のページを表すデ
ータ構造であり、そのページの記述言語(この例ではペ
ージがHTMLで記述されていることを示している)、
そのページのタイトル、そのページに含まれるインライ
ン情報の数とインライン情報のリスト、そのページに含
まれるリンク情報の数とリンク情報のリストが保持され
る。
【0067】図10(c)は、処理中のページに含まれ
るインライン情報のリストである。各リストの要素に
は、インライン情報のURL(Universal R
esource Locater)またはファイル名、
その拡張子、拡張子から推定されるインライン情報のデ
ータ型(例えば、画像、音、映像等)、ALT属性とし
て指定されたインライン情報の代りに提示すべき文字列
(指定されていなければ空)、インライン情報の幅・高
さが保持される。
【0068】図10(d)は、処理中のページに含まれ
るリンク情報のリストである。各リストの要素は、図1
0(c)のインライン情報と同じ情報が保持される。た
だし、幅・高さが把握できなければそれらは空となる。
【0069】図10(e)は、データ取得戦略決定部3
7が現在処理を行っている情報へのポインタが保持され
る。すなわち、図10(c)のインライン情報や図10
(d)のリンク情報が指定される。
【0070】なお、図10のデータ構造例ではリストを
使って複数のデータを扱ったが、データの集合を扱える
ものであるならば、配列や表、キューなどのデータ構造
を用いても構わない。
【0071】図11に、データ解析部35の動作フロー
の一例を示す。この処理は図8の手順のうちのステップ
S1311を詳細化したものである。
【0072】現在解析している取得データが、HTML
ページであるかどうか判断し(ステップS1601)、
HTMLページでないならばそのデータをブラウザの入
出力部32へ転送し(ステップS1602)、提示す
る。HTMLページであるならば、これをデータ取得戦
略決定部37が処理すべきページとして、図10(a)
のリストに追加する(ステップS1603)。そして、
このページのデータをブラウザの入出力部32へ転送し
(ステップS1604)、表示する。それと並行して、
このページの構文解析を行い(ステップS1605)、
その結果構成された図10に示すような解析結果を、デ
ータ取得戦略決定部37へ転送する(ステップS160
6)。
【0073】なお、プリフェッチしたHTMLページの
うち解析対象としないもの(例えば、n段プリフェッチ
する場合のn段目のHTMLページ)はデータ記憶部3
4に格納されるだけでありデータ取得部33からデータ
解析部35に渡されないが、プリフェッチしたHTML
ページのうち解析対象とするもの(例えば、n段プリフ
ェッチする場合の2〜n−1段目のHTMLページ)は
データ解析部35に渡されるので、データ解析部35は
そのようなHTMLページを入出力部32へ転送せず
に、解析のみ行うようにする。
【0074】図12および図13に、データ取得戦略決
定部37の動作フローの一例を示す。この処理は図8の
手順のうちのステップS1313を詳細化したものであ
る。
【0075】データ取得戦略決定部37は、ブラウザ設
定情報を読む(ステップS1701)。そして、図10
(a)のリストを参照し、データ取得戦略を決めるべき
ページがあるかどうか判断する(ステップS170
2)。もしないならば、この処理は終了する。もしある
ならば、このページに含まれるインライン情報について
それぞれのデータ取得戦略を決定する(ステップS17
03)。
【0076】データ取得戦略決定部37は、戦略記憶部
38に格納されたルールと、図9に示すようなブラウザ
設定記憶部39に格納されたブラウザ設定情報を参照し
て、次のデータを取得すべきか否か、取得するのならど
ういう方策で取得するか、について戦略を決定する(ス
テップS1703)。
【0077】インライン情報のデータを取得すべきであ
るならば(ステップS1704)、データ取得戦略決定
部37が決めた取得方法にしたがって、データ取得部3
3がデータを取得し(ステップS1705)、得られた
データをブラウザの入出力部32へ転送し(ステップS
1706)、表示する。
【0078】インライン情報を取得しないと判断したら
なば(ステップS1704)、その代替となるデータを
生成するか判断する(ステップS1707)。もし代替
データを生成するならば、データ変換部36にて代替デ
ータを生成し(ステップS1708)、そのデータを入
出力部32に転送し(ステップS1709)、表示す
る。他に処理すべきインランイ情報があるならば(ステ
ップS1710)、そのすべてを処理し終わるまで繰り
返す。
【0079】インライン情報の処理が終了すると、次に
リンク情報の処理に移る。まず、ブラウザの設定がプリ
フェッチをする設定になっているか判定し(ステップS
1711)、ブリフェッチしないのであればリンク情報
の処理をせずに、次のページの処理に移り(ステップS
1702)、処理すべきページがなくなるまで繰り返
す。
【0080】ブリフェッチする設定になっていれば(ス
テップS1711)、戦略記憶部38に格納されたルー
ルを参照して、リンク情報で示される次のデータをプリ
フェッチすべきか判定する(ステップS1712)。プ
リフェッチすべきであるならば(ステップS171
3)、データ取得部33がプリフェッチを行い(V17
14)、取得したページをデータ記憶部34に格納する
と同時にそのページがプリフェッチの最終段でなければ
そのページを処理すべきページとして図10(a)のリ
ストに追加する(ステップS1715)。
【0081】そして、他のリンク情報についても同様に
処理を行い(ステップS1716)、なくなるまで繰り
返す。
【0082】すべてのリンク情報についての処理が終了
したら、このページを処理済として図10(a)のリス
トから外し(ステップS1717)、次のページの処理
へ移る(ステップS1702)。
【0083】ここでは、インライン情報の取得と、リン
ク情報のプリフェッチとを分離して処理しているが、同
様の扱いをすることも可能である。また、ページを全部
解析し終わってからデータ取得の戦略を決めるのではな
く、ページを解析すると同時に戦略を決定していくよう
な処理も可能である。
【0084】なお、上記処理において、あるページ中に
そのページ自身に対するリンクが存在したり、複数段の
プリフェッチを行うときに同じ内容のリンクが複数のペ
ージ中に存在するような場合には、無駄な解析やプリフ
ェッチを行わないように、解析対象となるリンクの数を
最小にするようにしてもよい。
【0085】図14〜図17に、戦略記憶部38に格納
されるルール(取得形態ルール群)の例を示す。図14
および図15は、次のデータ型(データ内容)を推測す
るルールの例で、図14(a)はHTMLページに関連
するもの、図14(b)は動的に生成されるコンテンツ
に関連するもの、図14(c)は背景に関連するもの、
図14(d)は画像の大小、多少に関連するもの、図1
4(e)は公告画像に関連するもの、図15はマルチメ
ディアデータのデータ型(種類)に関連するものであ
る。図16は、次のデータを取得するかどうかの判断ル
ールの例で、(a)はブラウザ設定に関連するもの、
(b)は動的コンテンツに関連するもの、図16(c)
はコンテンツの重要度に関連するものである。図17
は、データ取得方法を決定するルールの例である。
【0086】ここでは大きく、次のデータ型(データ内
容)を推測するルール群(図14(a)〜(e)および
図15)、次のデータを取得するかどうかを判断するル
ール群(図15)、次のデータを取得する場合の取得方
法を決定するルール群(図16)にわかれている。
【0087】データ取得戦略決定部37は、現在処理中
のページに対し、これらのルールを照合し、照合したル
ールに基づいてデータ型を推測し、データ型とルール群
および/またはブラウザ設定とをもとにしてデータを取
得するか否かおよび取得する場合における取得方法(取
得形態)を導き出す。データ型は、例えば、データの記
述形式を示すタグ情報(例えば、APPLETタグなら
ばJavaプログラムである、等)や、データの記録場
所を指定する記述(例えば、URL/ファイル名の拡張
子が.htmならばHTMLページである、等)、デー
タに関連するコメント部分の記述(例えば、周囲のコメ
ント文より広告用と予測されるデータであるならば広告
画像である、等)をもとに予測することができる。
【0088】例えば、データを指定する文字列に“gi
f”が含まれる場合、GIF画像であると判断し、また
その幅と高さが指定値より大きければ、大きいGIF画
像ということで、前半部分やコメント部分のみを取得す
るといった戦略を導き出す。
【0089】なお、ここではルールの優先度などを用い
ていないが、データの推測など正しくない場合もあるの
で、そのようなルールは照合しても適用する優先度を下
げるなどの機構を導入することも可能である。
【0090】また、上記の照合において、判断結果(t
henの部分)が同一でない複数のルールが一致したと
きには、例えば、ルールに付した優先順位により採用す
るルールを決定する、あるいはANDの数を多く含むル
ールを採用する、などの選択処理を行えばよい。
【0091】また、一致するルールがなかったときに
は、各判断の段階ごとに、扱い方を定めておけばよい。
例えば、次のデータ型(データ内容)を推測するルール
群または次のデータを取得するかどうかを判断するルー
ル群に一致するルールがなかったときには該データを取
得しないと決定し、次のデータを取得する場合の取得方
法を決定するルール群に一致するルールがなかったとき
にはブラウザ設定が「全部」となっていれば全部取得す
ると決定し、「一部」または「取得しない」となってい
る場合には取得しないと決定する、などである。
【0092】また、ブラウザ設定を考慮しないルールが
存在する場合に、ブラウザ設定が「全部」または「取得
しない」となっており、上記照合では「画像の前半部の
み取得する」というようなブラウザ設定と矛盾する結果
がでたときのために、ブラウザ設定を優先させるか、照
合結果を優先させるかを定めておくか、あるいは取得す
る情報量の少ない方を優先させるか、あるいは取得する
情報量の多い方を優先させるかを定めておいてもよい。
また、利用者がこの設定を行うようにしてもよい。
【0093】あるいは、全てのルールについてブラウザ
設定を考慮するようにしてもよい。例えば、全てのルー
ルについて、その条件部にブラウザ設定のパラメータを
使用するか、あるいはそのルールに到達するまでに、ブ
ラウザ設定のパラメータを使用した上位のルールを経由
させるなどすればよい。
【0094】また、ブラウザ設定で「全部」と設定され
ている場合には全部を取得すると決定し、ブラウザ設定
で「取得しない」と設定されている場合には取得しない
と決定し、ブラウザ設定で「一部」と設定されている場
合にのみルールを照合するようにしてもよい。
【0095】また、ブラウザ設定記憶部39を設けず
に、ルールの照合のみでデータ取得戦略を決定する構成
も考えられる。
【0096】もちろん、上記の例のようなルールベース
ではなく、手続き的プログラムなど、他の仕組みにより
決定するようにしてもよい。
【0097】次に、図1の情報取得制御システムをWe
bプロキシサーバに組み込んだ実施形態について説明す
る。
【0098】図18に、この場合のWebブラウザから
Webサーバまでのネットワーク構成の一例を示す。図
18では、情報取得制御システム40がWebプロキシ
サーバ41に組み込まれた構成を示している。
【0099】例えば、オフィスのイントラネット等に接
続されたPC上のWebブラウザ42から、Webプロ
キシサーバ41を経由してインターネット43にアクセ
スし、Webサーバ44から情報の提供を受ける場合
が、この例に該当する。
【0100】Webブラウザ42とWebプロキシサー
バ41との接続はLAN(10Mbps)であり、イン
ターネット43への接続は専用線であって64Kbps
から1.5Mbpsであるので、このイントラネット等
からインターネット43との接続の部分がWebアクセ
スのボトルネックになる可能性が高い。そこで、Web
プロキシサーバ41に組み込まれた情報取得制御システ
ム40が、遅い回線でのWebアクセスでのデータ取得
を制御することで、必要な情報がWebブラウザ42の
利用者に提示されるまでの待ち時間を短くする。
【0101】図19に、図18の情報取得制御システム
40を組み込んだWebプロキシサーバ41の内部構成
例を示す。
【0102】この情報取得制御/Webプロキシサーバ
は、基本的には図7と同様であるので、以下では相違す
る点を中心に説明する。
【0103】Webプロキシサーバ41は、本情報取得
制御システム40、上流システム(Webサーバもしく
は別のWebプロキシサーバ)と接続する上流通信部5
2、下流のシステム(Webブラウザもしくは別のWe
bプロキシサーバ)と接続する下流通信部53、Web
プロキシサーバの動作設定を格納するプロキシ設定記憶
部510から構成される。ここでは、よりおおもとのW
ebサーバに近い方を上流、Webブラウザに近い方を
下流としている。なお、プロキシ設定記憶部510は図
7のブラウザ設定記憶部39に対応するもので、前述と
同様、プロキシ設定記憶部510を設けない構成も可能
である。また、データ変換部57も必須ではない。
【0104】下流通信部53は、下流のシステムから情
報取得要求を受け取り、情報取得制御システム40のデ
ータ取得部54から上流通信部52を介して、上流のシ
ステムにデータ取得要求を送信する。データ取得部54
が、上流システムからのデータを受け取り、データ記憶
部55に格納する。同時にそのデータは、データ解析部
56を経て、下流通信部53を介して、受け取ったHT
MLデータを下流のシステムに送信する。
【0105】また、データ変換部57を備える場合、デ
ータ解析部56の結果如何では、受け取ったHTMLデ
ータをデータ変換部57で変換してから、下流システム
に送信する。
【0106】データ解析部56での解析結果をもとに、
データ取得戦略決定部58は、次に要求すべきデータの
取得戦略を決める。この際、戦略記憶部59に格納され
たルールを参照して、取得戦略は決められる。さらに、
データ取得戦略決定部58は、Webプロキシサーバの
動作設定を格納するプロキシ設定記憶部510の設定情
報を参照して、データ取得戦略を決める場合もある。な
お、Webプロキシサーバの動作設定は、システム管理
者が行うか、および/または下流のシステムから転送さ
れてきた情報に基づいて行う。
【0107】図20に、Webプロキシサーバ41の動
作フローの一例を示す。
【0108】Webプロキシサーバは、まず、初期化を
行った後(ステップS1901)、下流/上流からのデ
ータ通信待ち、およびシステム管理者からの入力待ちの
状態に入る(ステップS1902)。
【0109】管理者から終了要求がきた場合、終了処理
を行って終了する(ステップS1903,S190
4)。管理者からの入力がプロキシサーバの設定変更指
示の場合は、設定を変更して(ステップS1905)、
再び通信・入力待ち状態に入る(ステップS190
2)。
【0110】下流からのデータがある場合、それがプロ
キシの設定変更指示であれば(ステップS1906)、
プロキシサーバの設定を変更して(ステップS190
7)、通信・入力待ち状態に戻る(ステップS190
2)。そうでなければ、下流からのデータ取得要求を上
流へ転送する(ステップS1908)。
【0111】上流からのデータがある場合、応答データ
を受信し(ステップS1909)、データ記憶部55に
キャッシュする(ステップS1910)。そして、この
データをデータ解析部56で解析する(ステップS19
11)。データ解析部56はデータを下流へ送信すると
(ステップS1912)、再び送信・入力待ち状態に戻
る(ステップS1902)。下流へのデータ送信と並行
して、データ解析結果に基づいてデータ取得戦略決定部
58が、次のデータ取得に関して判断を行う(ステップ
S1913)。
【0112】なお、Webプロキシサーバが解析結果の
処理等で使用するためのデータ構造については先の実施
形態(図10参照)と同様である。また、データ解析部
56の動作フロー(図20の手順のうちのステップS1
911を詳細化したもの)は例えば図11と同様でよ
い。また、データ取得戦略決定部58の動作フロー(図
20の手順のうちのステップS1913を詳細化したも
の)は例えば図12/図13と同様でよい。また、戦略
決定記憶部59に保持されるルールの例は先の実施形態
(図14〜図17参照)と同様である。また、プロキシ
設定記憶部510に設定されるプロキシ設定情報の例も
図9と同様である。
【0113】なお、本実施形態では、通常、下流はマル
チクライアントであるが、下流クライアントごとに対応
する処理を行うこと、例えば、プロキシ設定を下流のW
ebブラウザもしくはWebプロキシサーバごとに記憶
し適用するなどの処理を行うことも可能である。
【0114】以上の例では、図1の情報取得制御システ
ムをWebブラウザに組み込んだ実施形態、および該情
報取得制御システムをWebプロキシサーバに組み込ん
だ実施形態について説明したが、図21に示すように、
一つの計算機上に「既存の(該情報取得制御システムを
組み込んでいない)Webブラウザ」と「該情報取得制
御システムを組み込んだWebプロキシサーバ」とを搭
載する構成も可能である。
【0115】なお、図21の情報取得制御システム60
/Webプロキシサーバ63は、図18〜図20で説明
したものと基本的には同様である(ただし、前者は下流
のシングルクライアントのみに対応すればよい)。
【0116】図21に示す構成によれば、本発明を適用
したWebプロキシサーバを導入するればよいので、既
存のWebブラウザに変更を加えないですむという利点
がある。
【0117】また、図22のように、情報取得制御シス
テム72,74を組み込んだWebプロキシサーバ7
3,75を多段に組み合わせて連携する構成もある。ま
た、図23のように、情報取得制御システム80を組み
込んだWebブラウザ81と、情報取得制御システム8
2を組み込んだWebプロキシ83とを連携させる構成
もある。なお、図22および図23の情報取得制御シス
テムを組み込んだWebプロキシサーバは図18〜図2
0で説明したものと基本的には同様であり、図23の情
報取得制御システムを組み込んだWebブラウザは図2
以降で説明したものと基本的には同様である。
【0118】なお、Webプロキシサーバとブラウザと
の違いは、ブラウザが個人利用のアプリケーションであ
るのに対し、プロキシサーバの場合は、そのクライアン
トとなるシステム(ブラウザ群あるいは下流のプロキシ
群)共通のサーバとなることである。したがって、プロ
キシサーバが上位より取得し、そのキャッシュに入るデ
ータには公用性もしくは共有性がある。戦略決定記憶部
に保持されるルールについても、そのプロキシサーバの
クライアントとなるシステムに共通に適用されるため、
ルールは下位システム共通のものである必要がある。
【0119】また、利用者毎の要求を、一時的にプロキ
シが有効化するようなことも考えられる。その場合、プ
ロキシサーバに持たせる共通の取得戦略はそのままに、
利用者の要求毎にデータの取得戦略を変更することがで
きる。
【0120】また、本情報取得制御システムを組み込ん
だブラウザと本情報取得制御システムを組み込んだプロ
キシの連携、本情報取得制御システムを組み込んだ組み
込んだプロキシどうしの連携という形態では、本情報取
得制御システム間の通信プロトコルを独自拡張すること
ができる。これにより、例えば利用者毎にデータの取得
戦略を変えるが取得した一部のデータをプロキシのキャ
ッシュには入れない、といった制御を効率的に行うこと
が可能となる。
【0121】さらに、これまでの各実施形態を組み合わ
せた構成も可能である。例えば、多段のWebプロキシ
サーバとWebブラウザのいずれにも情報取得制御シス
テムを組み込んで、それらを連携させる構成もある。ま
た、システム中に、情報取得制御システムを組み込んだ
Webブラウザと組み込んでいないWebブラウザが混
在したり、情報取得制御システムを組み込んだWebプ
ロキシサーバと組み込んでいないWebプロキシサーバ
が混在することも可能である。
【0122】なお、低バンド幅の回線でのデータ量を減
らすために差分情報を送信するあるいはデータを圧縮し
て送るなどの方法が提案されており、また利用者がブラ
ウザであるページを読んでいる間に次にアクセスすると
予測されるページのデータをプリフェッチしておくこと
でWebアクセスの応答時間を短くする方法も提案され
ている(例えば、Housel et al:Web
Express,Mobi Com96,pp.108
−116,Liljeberg et al:Mowg
li WWW Software,IEEE Glob
al Internet96,Fox et al:A
dapting to Networkand Cli
ent Variability via On−De
mand Dynamic Distillatio
n,ASPLOS−VII)が、本実施形態はこれらの
方法と併用可能である。
【0123】また、以上では、HTMLにより記述され
た構造化文書やWWWを例にとって説明したが、それ以
外の記述言語や情報配信システムにも適用可能である。
【0124】なお、以上の各機能は、ソフトウェアとし
ても実現可能である。
【0125】また、本実施形態は、コンピュータに所定
の手段を実行させるための(あるいはコンピュータを所
定の手段として機能させるための、あるいはコンピュー
タに所定の機能を実現させるための)プログラムを記録
したコンピュータ読取り可能な記録媒体としても実施す
ることもできる。
【0126】本発明は、上述した実施の形態に限定され
るものではなく、その技術的範囲において種々変形して
実施することができる。
【0127】
【発明の効果】本発明によれば、データ取得をデータ形
式に基づいてきめ細かく制御することができるので、利
用者が要求した構造化文書の概要が表示等されるまでの
待ち時間を減らすことができる。また、限られた回線の
バンド幅を有効に活用することができる。
【図面の簡単な説明】
【図1】本発明の一実施形態に係る情報取得制御システ
ムの構成例を示すブロック図
【図2】システム構成の一例を示す図
【図3】データの内容の一例を示す図
【図4】構造化文書について説明するための図
【図5】データ内容の表示例を示す図
【図6】データ内容の表示例を示す図
【図7】Webブラウザの構成例を示す図
【図8】Webブラウザの動作フローの一例を示すフロ
ーチャート
【図9】Webブラウザの設定情報の一例を示す図
【図10】データ解析内容を示すデータ構造図
【図11】データ解析の動作フローの一例を示すフロー
チャート
【図12】データ取得戦略決定解析の動作フローの一例
を示すフローチャート
【図13】データ取得戦略決定解析の動作フローの一例
を示すフローチャート
【図14】データ取得戦略ルールの一例を示す図
【図15】データ取得戦略ルールの一例を示す図
【図16】データ取得戦略ルールの一例を示す図
【図17】データ取得戦略ルールの一例を示す図
【図18】システム構成の一例を示す図
【図19】Webプロキシサーバの構成例を示す図
【図20】Webプロキシサーバの一例を示すフローチ
ャート
【図21】システム構成の一例を示す図
【図22】システム構成の一例を示す図
【図23】システム構成の一例を示す図
【符号の説明】
10,20,40,60,72,74,80,82…情
報取得制御システム 11,33,54…データ取得部 12,34,55…データ記憶部 13,35,56…データ解析部 14,37,58…データ取得戦略決定部 15,38,59…戦略記憶部 36,57…データ変換部 32…入出力部 39…ブラウザ設定記憶部 52…上流通信部 53…下流通信部 510…プロシキ設定記憶部 21,42,61,71,81,83…Webブラウザ 41,62,73,75,82…Webプロキシサーバ 24,44,65,73,85…Webサーバ 22,63…インターネットサービスプロバイダ 23,43,64,76,84…インターネット
───────────────────────────────────────────────────── フロントページの続き (72)発明者 伊藤 清司 神奈川県川崎市幸区小向東芝町1番地 株 式会社東芝研究開発センター内 (72)発明者 木村 哲郎 神奈川県川崎市幸区小向東芝町1番地 株 式会社東芝研究開発センター内 Fターム(参考) 5B082 FA03 FA12 GA08 GC02 GC04 HA05 5B089 GA11 GA21 GB04 HA01 JA22 JA24 JB02 JB03 JB04 JB05 KA05 KC48 KH00 LB14

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】サーバ装置に対する取得要求を送信して所
    望の構造化文書を取得する取得手段と、 前記取得手段により取得された前記構造化文書を解析す
    る解析手段と、 前記解析手段の解析結果に基づいて次の取得候補となる
    データのデータ型を予測する予測手段と、 前記予測手段で予測されたデータ型に基づいて、次の取
    得候補となる前記データの取得を行うか否かを決定する
    決定手段とを具備したことを特徴とする情報取得制御装
    置。
  2. 【請求項2】前記決定手段は、前記構造化文書に含まれ
    る、前記データの記述形式を示すタグ情報、前記データ
    の記録場所を示す場所情報、または前記データに関連す
    るコメント情報の少なくとも一つに基づいて前記データ
    型を予測することを特徴とする請求項1に記載の情報取
    得制御装置。
  3. 【請求項3】前記決定手段は、次の取得候補となる前記
    データの取得を決定する際には、前記データの取得形態
    を決定することを特徴とする請求項1または2に記載の
    情報取得制御装置。
  4. 【請求項4】前記決定手段は、次の取得候補となる前記
    データが、画像データ、音データまたは映像データであ
    る場合には、前記データの一部のみを取得することを決
    定することを特徴とする請求項1または2に記載の情報
    取得制御装置。
  5. 【請求項5】所定のデータに関する所定の取得形態を示
    す取得形態ルール群を記憶する第1の記憶手段をさらに
    具備し、 前記決定手段は、前記予測手段で予測されたデータ型に
    基づいて、次の取得候補となる前記データの取得を行う
    か否かを決定し、前記データを取得する場合には、その
    取得形態を決定することを特徴とする請求項1に記載の
    情報取得制御装置。
  6. 【請求項6】所定のデータに関して、取得の可否を示す
    取得可否ルール群を記憶する第2の記憶手段をさらに具
    備し、 前記決定手段は、前記予測手段で予測されたデータ型と
    前記取得可否ルール群に基づいて、次の取得候補となる
    前記データの取得を行うか否かを決定し、前記データを
    取得する場合には、その取得形態を決定することを特徴
    とする請求項5に記載の情報取得制御装置。
  7. 【請求項7】前記サーバから次の取得候補となる前記デ
    ータの取得を行う代りに、該データの代替となるデータ
    を生成して出力するデータ変換手段をさらに具備したこ
    とを特徴とする請求項1に記載の情報取得制御装置。
  8. 【請求項8】サーバ装置に対する取得要求を送信して所
    望の構造化文書を取得し、 取得された前記構造化文書を解析し、 前記解析結果に基づいて次の取得候補となるデータのデ
    ータ型を予測し、 前記予測されたデータ型に基づいて、次の取得候補とな
    る前記データの取得を行うか否かを決定することを特徴
    とする情報取得制御方法。
JP11093757A 1999-03-31 1999-03-31 情報取得制御装置及び情報取得制御方法 Pending JP2000285006A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP11093757A JP2000285006A (ja) 1999-03-31 1999-03-31 情報取得制御装置及び情報取得制御方法
EP00302729A EP1041497B1 (en) 1999-03-31 2000-03-31 Information fetching control scheme using data type dependent strategy for reducing user response time
DE60017488T DE60017488T2 (de) 1999-03-31 2000-03-31 Verfahren zum Steuern des Abrufs von Information mit einer vom Datentyp abhängigen Strategie um die Antwortzeit für die Verbraucher zu verringern

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11093757A JP2000285006A (ja) 1999-03-31 1999-03-31 情報取得制御装置及び情報取得制御方法

Publications (1)

Publication Number Publication Date
JP2000285006A true JP2000285006A (ja) 2000-10-13

Family

ID=14091315

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11093757A Pending JP2000285006A (ja) 1999-03-31 1999-03-31 情報取得制御装置及び情報取得制御方法

Country Status (3)

Country Link
EP (1) EP1041497B1 (ja)
JP (1) JP2000285006A (ja)
DE (1) DE60017488T2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002342206A (ja) * 2001-05-18 2002-11-29 Fujitsu Ltd 情報提供プログラム、情報提供方法、および記録媒体
JP2006107487A (ja) * 2004-09-29 2006-04-20 Internatl Business Mach Corp <Ibm> ネットワークを介してコンテンツを提供するための方法、システム及びプログラム
JP2006134236A (ja) * 2004-11-09 2006-05-25 Canon Inc プロファイル取得方法、装置、プログラム、および、記憶媒体
JP2007272742A (ja) * 2006-03-31 2007-10-18 Ntt Docomo Inc 通信端末及び通信方法
JP2012508915A (ja) * 2008-11-14 2012-04-12 北京捜狗科技▲発▼展有限公司 ウェブページ関連のリソースを提示する方法および装置
JP2013145565A (ja) * 2007-02-09 2013-07-25 Nokia Corp 情報コンテンツの一部分をクライアント装置に与える方法およびシステム
JP2015176215A (ja) * 2014-03-13 2015-10-05 富士通株式会社 ウェブページ表示システム及びウェブページ表示プログラム

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2851389B1 (fr) 2003-02-14 2005-04-29 Canon Kk Procede et dispositif de gestion de requetes dans une architecture du type client-serveur
US7370153B1 (en) * 2004-08-06 2008-05-06 Nvidia Corporation System and method of pre-fetching using an extended data structure including required data and a pre-fetch flag
US7526604B1 (en) 2004-08-09 2009-04-28 Nvidia Corporation Command queueing speculative write prefetch
CN100486170C (zh) * 2005-12-15 2009-05-06 国际商业机器公司 传送前摄http内容的方法和设备
US9158600B2 (en) 2006-09-15 2015-10-13 Jobdiva, Inc. System and method for automating the transfer of a data from a web interface to a database or another web interface
GB2469323B (en) * 2009-04-09 2014-01-01 F Secure Oyj Providing information to a security application
US8850075B2 (en) * 2011-07-06 2014-09-30 Microsoft Corporation Predictive, multi-layer caching architectures
CN103796081B (zh) * 2012-11-02 2018-05-29 华为终端(东莞)有限公司 一种显示图片的方法、控制设备及媒体播放器
US10387676B2 (en) 2015-09-14 2019-08-20 Viasat, Inc. Machine-driven crowd-disambiguation of data resources
EP4243381A3 (en) 2015-12-04 2023-11-15 ViaSat Inc. Accelerating connections to a host server

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0898754B1 (en) * 1996-05-20 2003-07-09 BRITISH TELECOMMUNICATIONS public limited company Information retrieval in cache database
US5918013A (en) * 1996-06-03 1999-06-29 Webtv Networks, Inc. Method of transcoding documents in a network environment using a proxy server
US6421733B1 (en) * 1997-03-25 2002-07-16 Intel Corporation System for dynamically transcoding data transmitted between computers

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002342206A (ja) * 2001-05-18 2002-11-29 Fujitsu Ltd 情報提供プログラム、情報提供方法、および記録媒体
JP2006107487A (ja) * 2004-09-29 2006-04-20 Internatl Business Mach Corp <Ibm> ネットワークを介してコンテンツを提供するための方法、システム及びプログラム
JP2006134236A (ja) * 2004-11-09 2006-05-25 Canon Inc プロファイル取得方法、装置、プログラム、および、記憶媒体
JP2007272742A (ja) * 2006-03-31 2007-10-18 Ntt Docomo Inc 通信端末及び通信方法
JP2013145565A (ja) * 2007-02-09 2013-07-25 Nokia Corp 情報コンテンツの一部分をクライアント装置に与える方法およびシステム
US9524353B2 (en) 2007-02-09 2016-12-20 Nokia Technologies Oy Method and system for providing portions of information content to a client device
JP2012508915A (ja) * 2008-11-14 2012-04-12 北京捜狗科技▲発▼展有限公司 ウェブページ関連のリソースを提示する方法および装置
JP2015176215A (ja) * 2014-03-13 2015-10-05 富士通株式会社 ウェブページ表示システム及びウェブページ表示プログラム

Also Published As

Publication number Publication date
DE60017488T2 (de) 2005-07-07
EP1041497B1 (en) 2005-01-19
EP1041497A3 (en) 2002-02-06
EP1041497A2 (en) 2000-10-04
DE60017488D1 (de) 2005-02-24

Similar Documents

Publication Publication Date Title
US9898542B2 (en) Narration of network content
JP3184802B2 (ja) カスタマイズされたインターネット・コンテンツを要求側クライアント装置に提供する方法およびシステム
US7194678B1 (en) Dynamic web page generation method and system
JP3461689B2 (ja) コンピュータ装置およびページ要求処理方法
US6222634B1 (en) Apparatus and method for printing related web pages
JP2000285006A (ja) 情報取得制御装置及び情報取得制御方法
CA2891472C (en) Delivery and display of page previews during page retrieval events
US6988135B2 (en) Method and system for specifying a cache policy for caching web pages which include dynamic content
US9232021B2 (en) Dynamically rehosting web content
US20070101061A1 (en) Customized content loading mechanism for portions of a web page in real time environments
US5826031A (en) Method and system for prioritized downloading of embedded web objects
JP4791452B2 (ja) ポートレットをクライアント側でプリフェッチし、キャッシングする方法、システム及びコンピュータ・プログラム
EP2788900B1 (en) Reducing redirects
US20070174420A1 (en) Caching of web service requests
JPH1097457A (ja) ウェブぺージにおいてオーディオファイル処理する方法およびコンピュータシステム
Britton et al. Transcoding: Extending e-business to new environments
US8019884B2 (en) Proxy content for submitting web service data in the user&#39;s security context
KR20000036327A (ko) 웹문서들의 프리브라우즈 방법
US9922006B1 (en) Conditional promotion through metadata-based priority hinting
US9734134B1 (en) Conditional promotion through frame reordering
US7447738B1 (en) Component download selection mechanism for web browsers
US9607322B1 (en) Conditional promotion in content delivery
TW201009698A (en) Method for improving the accessing efficiency of embedded web page
US9785969B1 (en) Conditional promotion in multi-stream content delivery
US9626344B1 (en) Conditional promotion through packet reordering

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050913

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051114

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051213

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060704