JP2006318138A - Webシステム、Webシステム用サーバコンピュータおよびコンピュータプログラム - Google Patents

Webシステム、Webシステム用サーバコンピュータおよびコンピュータプログラム Download PDF

Info

Publication number
JP2006318138A
JP2006318138A JP2005139006A JP2005139006A JP2006318138A JP 2006318138 A JP2006318138 A JP 2006318138A JP 2005139006 A JP2005139006 A JP 2005139006A JP 2005139006 A JP2005139006 A JP 2005139006A JP 2006318138 A JP2006318138 A JP 2006318138A
Authority
JP
Japan
Prior art keywords
information
web page
public information
new
url
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005139006A
Other languages
English (en)
Inventor
Keiko Yoshikawa
啓子 吉川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Embedded Products Ltd
Original Assignee
NEC Embedded Products Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Embedded Products Ltd filed Critical NEC Embedded Products Ltd
Priority to JP2005139006A priority Critical patent/JP2006318138A/ja
Publication of JP2006318138A publication Critical patent/JP2006318138A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】他のWebサイトの更新情報を提供する際に、他のWebサイトが公開する情報が更新されたときに、その更新を適切に検出し管理する。
【解決手段】記憶装置14と、ネットワークを介してWebサイトにアクセスする通信装置12と、WebサイトのWebページを示すURLに基づいて、前記URL先である巡回先Webページで公開される公開情報を取得し、前記公開情報を取得済情報として前記記憶装置14に格納する制御装置11とを具備するサーバを構成する。前記記憶装置14は前記Webサイトの名称もしくは前記巡回先WebページのURLを示す情報を保持し、前記制御装置11は前記巡回先Webページに接続し、現在の公開情報を前記巡回先Webページから抽出する。前記現在の公開情報と前記取得済情報とを比較して、前記取得済情報に含まれていない新たな公開情報を特定したときに、前記新たな公開情報を含む新たな取得済情報を生成する。
【選択図】図1

Description

本発明は、Webシステム、Webシステム用サーバコンピュータおよびコンピュータプログラムに関し、特にハイパーリンクで結合されるWebページで公開される情報の更新状況を適切に把握する技術に関する。
インターネットを介して情報を公開する技術として、WWW(World Wide Web)システムが知られている。WWWシステムでは、インターネットに接続されたWWWサーバにHTMLファイルを備えて構成されている。WWWで公開されている情報は、HTMLファイル形式で保持されており、閲覧者は、Webブラウザ(閲覧用ソフトウェア)を使用してHTMLファイルを読み込むことで、公開されている情報の閲覧をすることができる。
一般的に、インターネットで公開されるHTMLファイルは、閲覧者が使用するWebブラウザに1ページずつ表示される。情報を公開する側(以下、Webサイト管理者と呼ぶ)は、複数のページ(Webページ)を一つのまとまりとしたWebサイトを構築して情報を公開している。
公開されるWebサイトには、閲覧者がそのWebを特定できるようにURL(Uniform Resource Locator:)が付与されている。閲覧者はWebブラウザにURLを入力することで所望のWebサイトにアクセスすることができる。URLが入力されたWebブラウザは、そのURLに対応するWWWサーバを検索し、その検索に対する応答のあったWWWサーバに対して、閲覧希望のWebサイトのデータを要求する。WWWサーバは、要求されたWebサイトのデータをネットワークを介して要求元に送信する。Webブラウザは、送信されたデータに応答して、Webページを表示する。
閲覧者が、Webサイトにアクセスする方法として、上記のようにURLを直接入力する方法にほか、ハイパーリンク(または、リンク)と呼ばれる仕組みが用いられることが一般的である。Webサイトの管理者は、公開しているWebページで表示される文字列や表示画像に対してハイパーリンクを設定する。閲覧者に、その文字列や表示画像を選択(クリック)してもらうことで、リンク先の文書や画像、または、他のWebページに接続させることが可能となる。
ある特定のテーマに沿ってWebサイトを構築している場合、そのWebサイトに関連する他の複数のWebサイトとハイパーリンクによって情報を共有している場合がある。関連した情報を公開している他のWebサイトは、それぞれ独自に運営されている。そのため、他のWebサイトの更新時期は一定ではなく、リンク元の管理者は、手動でそれぞれのWebサイトを確認して更新状況を把握することで、自身が公開しているWebサイトに他のWebサイトの更新状況を開示している。
手動での更新状況の確認が困難な場合、自動的に更新状況を確認する技術が知られている(例えば、特許文献1〜3参照。)。
特許文献1(特許3586272号)には、インデックスページの更新日とリンク先のページを比較し、最新の更新日をインデックスページの更新日にする技術が開示されている。また、特許文献2(特開2003−099318号公報)には、サイトのリンク先の情報がすでにダウンロード済みか判断し、リンクをすでにダウンロード済みの情報に変更する技術が開示されている。また、特許文献3(特開2004−280203号公報)には、ページ巡回リストに従って複数のWebページを巡回し、巡回中のページの中からヘッドラインのテキスト列とヘッドラインのリンク先ページのURLを抜き出す。その中からキーワードを判別する。ヘッドラインのテキスト列、リンク先ページのソースおよびキーワードを用いてWeb対応電子機器装置向けに最適化したページとしてキーワード一覧ページ、ヘッドライン一覧ページ、詳細ページを再構築する技術が開示されている。
Webサイトにハイパーリンクを設定して他のWebサイトと結合することで他のWebサイトで提供される情報に接続できるようにした場合、他のWebサイトの更新状況を開示することが求められる場合がある。他のWebサイトの更新状況を手動で確認し、その情報を収集するには、収集作業の時間だけでなく内容の確認作業にも時間が必要となり、管理者に対する膨大な労力が要求される。また、人的に収集される情報には、見落としや偏りが発生し、提供する情報の正確性に問題が発生することがある。
また、上記特許文献1〜3に記載の技術のように、管理者の負担を低減させるために、他のWebサイトの更新日を利用し、更新日新しいWebサイトの情報を自動的に収集する方法が知られている。しかしながら、Webサイトには、そのWebサイトの更新日以外の日付情報が記載されている場合があり、実際の更新日を特定することが困難な場合がある。特に、Webページのファイルデータが作成/更新された日時を特定するには、Webサイトに含まれるWebページの全てを検索する必要がある。さらに、CGIやActiveServerPageなどを用いてWebサイトが構築されている場合、そのWebサイトにアクセスするコンピュータ端末からの要求に応答して動的にWebページが作成され、データの提供が行なわれる。このようなWebサイトでは、Webページが閲覧された日が更新日となってしまう。更新日に依存することなく、リンク先の更新状況を把握することができる技術が望まれる。
特許3586272号 特開2003−099318号公報 特開2004−280203号公報
本発明が解決しようとする課題は、自己のWebサイトで他のWebサイトの更新情報を提供する際に、他のWebサイトが公開する情報が更新されたときに、その更新を適切に検出し管理する技術を提供することにある。
以下に、[発明を実施するための最良の形態]で使用される番号を用いて、課題を解決するための手段を説明する。これらの番号は、[特許請求の範囲]の記載と[発明を実施するための最良の形態]との対応関係を明らかにするために付加されたものである。ただし、それらの番号を、[特許請求の範囲]に記載されている発明の技術的範囲の解釈に用いてはならない。
上記課題を解決するために、以下に述べるサーバコンピュータ(5)を構成し、Webシステムの管理に使用する。そのサーバコンピュータ(5)は、巡回先のWebサイトに関連する情報を保持する記憶装置(14)と、ネットワークを介して前記Webサイトにアクセスする通信装置(12)と、前記WebサイトのWebページを示すURLに基づいて、前記URL先である巡回先Webページで公開される公開情報を取得し、前記公開情報を取得済情報(42)として前記記憶装置(14)に格納する制御装置(11)とを具備する構成であることが好ましい。
ここで、前記記憶装置(14)は、前記Webサイトの名称もしくは前記WebページのURLを示す情報を保持する。また。前記制御装置(11)は、前記巡回先Webページに接続し、現在の公開情報を前記巡回先Webページから抽出する。そして、前記現在の公開情報と前記取得済情報(42)とを比較して、前記取得済情報(42)に含まれていない新たな公開情報(44)を特定したときに、前記新たな公開情報(44)を含む新たな取得済情報(42)を生成する。
そのサーバコンピュータ(5)において、
前記制御装置(11)は、前記巡回先Webページのデータである巡回先Webページ用データ(35)から、他のWebページへのリンクを実行させるためのリンク用タグを特定し、前記リンク用タグに基づいて前記巡回先Webページ用データ(35)から前記公開情報を抽出することが好ましい。また、前記制御装置(11)は、前記巡回先Webページ用データ(35)から、特定のタグを認識したときに、前記特定のタグで示される情報を無視してから前記現在の公開情報と前記取得済情報(42)とを比較するような装置であっても良い。
また、そのサーバコンピュータ(5)において、前記制御装置(11)は、前記巡回先Webページ用データ(35)から、前記公開情報に対応する文字列を抽出し、前記文字列が所定の文字数を超えるときに、前記現在の公開情報と前記取得済情報(42)とを比較するような制御装置(11)であることが好ましい。さらには、前記制御装置(11)は、前記巡回先Webページ用データ(35)から、前記巡回先Webページに表示される文字列が特定されないときに、前記取得済情報(42)の保存を継続するような命令を出力する構成であっても良い。
さらに、そのサーバコンピュータ(5)において、前記制御装置(11)は、前記公開情報のリンク先を示す公開情報URLに、前記公開情報を取得したWebページのURLを付加して前記公開情報URL情報の記述を、相対パスから絶対パスへ変換する機能または絶対パスから相対パスに変換する機能を有するものであることが好ましい。
上述してきたサーバコンピュータ(5)において、さらに、画面を出力するための表示部を具備する構成であっても良い。その場合において、前記制御部は、新たな公開情報(44)が特定されたとき、前記新たな取得済情報(42)に対応する前記新たな公開情報(44)を識別するためのフラグをたてるか、もしくは、前記新たな取得済情報(42)に対応する前記新たな公開情報(44)を示す公開情報リストを生成する。そして、前記フラグが付与された前記新たな取得済情報(42)または公開情報リストを、前記Webサイト管理者が新たな公開情報(44)の確認を実行する場合に使用される確認用表示画面を介して前記表示部に出力するような構成であることが好ましい。
また、そのサーバコンピュータ(5)において、前記記憶部は、前記Webサイトの名称もしくは前記WebページのURLの少なくとも一方を前記取得済情報(42)と関連付けて保持するような構成を有するものであることが好ましい。
また、以下のようなWebシステムを構築することでも上記課題を解決することが可能である。そのWebシステムは、自己のWebサイトのデータを閲覧可能な状態で保持するWWWサーバと、他のWebサイトが有するWebページを示すURLに基づいて、前記URL先である巡回先Webページで公開される公開情報を取得する管理サーバとを具備して構成されることが好ましい。ここで、前記管理サーバは、巡回先のWebサイトに関連する情報を保持する記憶装置(14)と、ネットワークを介して前記Webサイトにアクセスする通信装置(12)と、前記巡回先Webページで公開される公開情報を取得し、前記公開情報を取得済情報(42)として前記記憶装置(14)に格納する制御装置(11)とを具備する。
そして、前記記憶装置(14)は、前記Webサイトの名称もしくは前記WebページのURLを示す情報を保持する。また、前記制御装置(11)は、前記巡回先Webページに接続し、現在の公開情報を前記巡回先Webページから抽出し、前記現在の公開情報と前記取得済情報(42)とを比較して、前記取得済情報(42)に含まれていない新たな公開情報(44)を特定したときに、前記新たな公開情報(44)を含む新たな取得済情報(42)を生成する。
そのWebシステムにおいて、
前記制御装置(11)は、前記Webページのデータである巡回先Webページ用データ(35)から、他のWebページへのリンクを実行させるためのリンク用タグを特定し、前記リンク用タグに基づいて前記巡回先Webページ用データ(35)から前記公開情報を抽出するものであることが好ましい。また、前記制御装置(11)は、前記巡回先Webページ用データ(35)から、特定のタグを認識したときに、前記特定のタグで示される情報を無視してから前記現在の公開情報と前記取得済情報(42)とを比較するような構成であっても良い。
また、そのWebシステムにおいて、
前記制御装置(11)は、前記巡回先Webページ用データ(35)から、前記公開情報に対応する文字列を抽出し、前記文字列が所定の文字数を超えるときに、前記現在の公開情報と前記取得済情報(42)とを比較するものであることが好ましい。また、前記制御装置(11)は、前記巡回先Webページ用データ(35)から、前記巡回先Webページに表示される文字列が特定されないときに、前記取得済情報(42)の保存を継続するような構成であっても良い。
さらに、そのWebシステムにおいて、前記制御装置(11)は、前記公開情報のリンク先を示す公開情報URLに、前記公開情報を取得したWebページのURLを付加して前記公開情報URL情報の記述を、相対パスから絶対パスへ変換する機能または絶対パスから相対パスに変換する機能を有するものであることが好ましい。さらには、そのWebシステムにおいて、前記管理サーバは、さらに、表示装置
を具備すると良い。その場合において、前記制御部は、新たな公開情報(44)が特定されたとき、前記新たな取得済情報(42)に対応する前記新たな公開情報(44)を識別するためのフラグをたてるか、もしくは、前記新たな取得済情報(42)に対応する前記新たな公開情報(44)を示す公開情報リストを生成する。そして、前記フラグが付与された前記新たな取得済情報(42)または公開情報リストを、前記Webサイト管理者が新たな公開情報(44)の確認を実行する場合に使用される確認用表示画面を介して前記表示装置に出力する。
さらに、以下のコンピュータプログラムを構成し、コンピュータに実行させることで上記課題を解決することが可能になる。そのコンピュータプログラムは、
[a]ネットワークを介してWebサイトにアクセスするステップと、
[b]前記WebサイトのWebページを示すURLに基づいて、前記URL先である巡回先Webページで公開される公開情報を取得し、前記公開情報を取得済情報(42)として前記記憶装置(14)に格納するステップと、
[c]前記Webサイトの名称もしくは前記WebページのURLを示す情報を読み出すステップと
[d]前記巡回先Webページに接続し、現在の公開情報を前記巡回先Webページから抽出し、前記現在の公開情報と前記取得済情報(42)とを比較して、前記取得済情報(42)に含まれていない新たな公開情報(44)を特定したときに、前記新たな公開情報(44)を含む新たな取得済情報(42)を生成するステップ
を具備する方法をコンピュータで実行するためのプログラムである。
ここで、そのプログラムにおいて、前記[d]ステップは、さらに、
前記Webページのデータである巡回先Webページ用データ(35)から、他のWebページへのリンクを実行させるためのリンク用タグを特定するステップと、
前記リンク用タグに基づいて前記巡回先Webページ用データ(35)から前記公開情報を抽出するステップ
を具備するものであっても良い。また、そのプログラムにおいて、前記[d]ステップは、
前記巡回先Webページ用データ(35)から、特定のタグを認識したときに、前記特定のタグで示される情報を無視してから前記現在の公開情報と前記取得済情報(42)とを比較するステップ
をさらに具備する方法をコンピュータで実行するためのプログラムであってもかまわない。
また、そのプログラムにおいて、前記[d]ステップは、
前記巡回先Webページ用データ(35)から、前記公開情報に対応する文字列を抽出し、前記文字列が所定の文字数を超えるときに、前記現在の公開情報と前記取得済情報(42)とを比較するステップ
をさらに具備するものであっても良い。さらに、前記[d]ステップは、
前記巡回先Webページ用データ(35)から、前記巡回先Webページに表示される文字列が特定されないときに、前記取得済情報(42)の保存を継続するステップ
をさらに具備するものであることが好ましい。
さらには、そのプログラムにおいて、前記[d]ステップは、
前記公開情報のリンク先を示す公開情報URLに、前記公開情報を取得したWebページのURLを付加して前記公開情報URL情報の記述を、相対パスから絶対パスへ変換する機能または絶対パスから相対パスに変換を実行するステップ
を具備するものであることが好ましい。
また、そのプログラムにおいて、さらに、
[e] 新たな公開情報(44)が特定されたとき、前記新たな取得済情報(42)に対応する前記新たな公開情報(44)を識別するためのフラグをたてるか、もしくは、前記新たな取得済情報(42)に対応する前記新たな公開情報(44)を示す公開情報リストを生成し、
前記フラグが付与された前記新たな取得済情報(42)または公開情報リストを、前記Webサイト管理者が新たな公開情報(44)の確認を実行する場合に使用される確認用表示画面を介して前記表示装置に出力するステップ
を具備する方法をコンピュータで実行するためのプログラムを構成しても良い。
本発明によると、自己のWebサイトで他のWebサイトの更新情報を提供する際に、他のWebサイトが公開する情報が更新されたときに、その更新を適切に検出し管理する技術を提供することができる。
[実施の形態]
以下に、図面を参照して本発明の実施の形態について説明を行なう。図1は、本実施の形態のWWW(World Wide Web)システムの構成を例示するブロック図である。図1に示されているように、本実施の形態のWWWシステムは、配信側システム1と、巡回先WWWサーバ群2と、閲覧側システム3とを含んで構成され、それらはネットワーク4を介して接続されている。図1を参照すると、配信側システム1は、メンテナンスコンピュータ5と、メンテナンスコンピュータ側入力装置6と、メンテナンスコンピュータ側出力装置7と、WWWサーバ8と、WWWサーバ側入力装置9と、WWWサーバ側出力装置10とを含んで構成されている。メンテナンスコンピュータ5は、配信側1が公開するWebサイトが発信する情報のWebサイト用データの更新等の管理を行なう情報処理装置である。メンテナンスコンピュータ側入力装置6は、メンテナンスコンピュータ5に情報の入力を行なう機能を有するマンマシンインターフェースである。メンテナンスコンピュータ側出力装置7は、メンテナンスコンピュータ5から供給される情報を出力するマンマシンインターフェースである。以下の実施の形態の説明において、メンテナンスコンピュータ側入力装置6がキーボードやマウスなどの機器で構成され、メンテナンスコンピュータ側出力装置7が、CRTや液晶表示装置などの機器で構成されているものとして説明を行なっていく。
図1に示されているようにメンテナンスコンピュータ5は、制御部11と、通信部12と、出力部13と、記憶部14とを含んで構成されている。制御部11は、所定のコンピュータプログラムに対応して情報処理を実行する装置である。通信部12は、ネットワーク4を介して情報の送受信を行なう通信インターフェースである。出力部13は、制御部11からの命令に応答して表示用データをメンテナンスコンピュータ側出力装置7に供給するデータ出力インターフェースである。記憶部14は、メンテナンスコンピュータ5が実行する各種プログラム(図示されず)や、配信側システム1で公開しているWebサイトに関連する情報を保持する記憶装置である。図1に示されているように、記憶部14は、Webサイトに設定されているハイパーリンクに関連する情報をリンク情報16として保持している。
WWWサーバ8は、ネットワーク4を介して公開する情報を閲覧可能な状態で保持する情報処理装置である。WWWサーバ8に接続されているWWWサーバ側入力装置9は、WWWサーバ8へ情報を入力する機能を有するマンマシンインターフェースである。また、WWWサーバ側出力装置10は、WWWサーバ8から供給される情報を出力するマンマシンインターフェースである。WWWサーバ側入力装置9は、メンテナンスコンピュータ側入力装置6と同様にキーボードやマウスなどの機器で構成されることが好ましい。また、WWWサーバ側出力装置10は、メンテナンスコンピュータ側出力装置7と同様にCRTや液晶表示装置などの機器で構成されることが好ましい。
図1を参照すると、WWWサーバ8は、WWWサーバ制御部17と、WWWサーバ通信部18と、WWWサーバ記憶部19とを含んで構成され、それらはバス20を介して接続されている。WWWサーバ制御部17は、ネットワーク4を介して受信したWebサイトの閲覧要求に応答して、所定のWebページのデータを供給するための制御を行う演算処理装置である。WWWサーバ通信部18は、ネットワーク4を介してWebページの閲覧要求を受信し、その要求に応答してネットワーク4を介して所定のWebページを他のコンピュータに送信するための通信インターフェースである。WWWサーバ記憶部19は、ネットワーク4を介して公開する情報を保持する記憶装置である。図1に示されているように、WWWサーバ記憶部19はWebサイト用データ21を備えて構成されている。Webサイト用データ21は、HTMLなどのマークアップ言語で記述されたファイルで構成され、Webサイトの閲覧要求に応答して読み出される。
巡回先WWWサーバ群2を構成している巡回先WWWサーバ30は、ハイパーリンクによってWWWサーバ8が公開しているWebサイトに結合されるWebページのデータを保持している情報処理装置である。図1に示されているように、巡回先WWWサーバ30は巡回先WWWサーバ制御部31と、巡回先WWWサーバ通信部32と、巡回先WWWサーバ記憶部33とを含んで構成され、それらはバス34を介して接続されている。
巡回先WWWサーバ制御部31は、上述のWWWサーバ制御部17と同様の構成を有する演算処理装置である。巡回先WWWサーバ通信部32は、ネットワーク4を介してWebページのデータを配信する機能を有する通信インターフェースである。巡回先WWWサーバ記憶部33は、ネットワーク4を介して公開するWebサイトのデータを閲覧可能な状態で保持する記憶装置である。本実施の形態において、巡回先WWWサーバ記憶部33には巡回先Webページ用データ35が備えられている。巡回先Webページ用データ35は、巡回先WWWサーバ30によって公開されるWebサイトのトップページのデータと、そのトップページにハイパーリンクによって結合されるWebページのデータ(35−1〜35−n)で構成され、HTML形式に代表されるマークアップ言語を用いてファイルとして保持されている。
つまり、巡回先WWWサーバ30が公開しているWebサイトはトップページとトップページ(の例えばニュース欄のハイパーリンク)からリンクされ、公開する最新情報の更新や追加に対応して、書き換えられるWebページ(ここでは、仮に紹介ページとする)とで構成されている。紹介ページが更新や追加されるとトップページに紹介ページが更新や追加されたことが載り、トップページから紹介ページにリンクが貼られることになる。よって、本実施の形態のメンテナンスコンピュータ5は、巡回先WWWサーバ30の中のたくさんの数のWebページデータから直接この紹介ページ(の更新や追加)を検索することなく、トップページのリンクを調べます。そして、新たなリンクが見つかるとそのリンクをWWWサーバ8のWebサイト用データに加えることで、紹介ページの更新や追加を実行する。
閲覧側システム3は、WWWサーバ8が公開しているWebサイトの閲覧を行う利用者が使用する閲覧システムである。図1を参照すると、閲覧側システム3は、利用者端末22と、その利用者端末22に接続される利用者端末側入力装置23および利用者端末側出力装置24とを含んで構成されている。利用者端末22は、Webブラウザ(Webページ閲覧用アプリケーション)を備える情報処理装置である。利用者端末側入力装置23は、メンテナンスコンピュータ側入力装置6(または、WWWサーバ側入力装置9)と同様の構成を有するマンマシンインターフェースである。また、利用者端末側出力装置24は、メンテナンスコンピュータ側出力装置7(または、WWWサーバ側出力装置10)と同様の構成を有するマンマシンインターフェースである。図1に示されているように、利用者端末22は、利用者端末制御部25と、利用者端末通信部26と、利用者端末出力部27と、利用者端末記憶部28とを含んで構成され、それらはバス29を介して接続されている。利用者端末制御部25は、利用者端末側入力装置23を介して入力されたブラウザ起動命令に応答してWebブラウザを起動し、Webサイトの閲覧に関連する情報処理を実行する。利用者端末通信部26は、公開されているWebサイトのデータを、ネットワーク4を介して受信する通信インターフェースである。利用者端末出力部27は、受信したWebページのデータを利用者端末側出力装置24で表示可能な形式に変換して出力する機能を有するデータ出力装置である。また、利用者端末記憶部28は、利用者がWebサイトを閲覧するためのアプリケーション(例えば、Webブラウザなど)を保持し、そのアプリケーションは、利用者端末制御部25からの命令に応答して読み出される。
図2は、記憶部14に保持されるリンク情報16の構成を例示するテーブルである。図2に示されているように、リンク情報16は、巡回先URL41と、登録済み公開情報42と、登録日43とを関連付けて構成されている。巡回先URL41は、巡回先のWebサイトのトップページのURLを示している。登録済み公開情報42は、URL42−1と表示テキスト42−2とを含んで構成されている。表示テキスト42−2は、そのトップページに設定されているハイパーリンクに対応して公開される情報である。登録日43は、その登録済み公開情報42がリンク情報16に登録された日付である。本実施の形態のリンク情報16は、巡回先URL41に対応して登録済み公開情報42を保持している。登録済み公開情報は巡回先URL41に対して複数あることが一般的である。したがって、例えば、http://www.aaa.bbb.cc/が登録日2005/1/8にも別の公開情報を取得している事もある。そのような場合に、巡回先URL41毎に表を持つようなリンク情報16を構成することで対応することも可能である。
図3は、新たなリンク情報16−1の構成を例示するテーブルである。メンテナンスコンピュータ5は、ネットワークに接続されている巡回先WWWサーバを巡回し、その巡回によって得られたWebページデータから現在の公開情報を抽出する。メンテナンスコンピュータ5は、抽出した現在の公開情報をリストにした新たなリンク情報16−1を一時的に生成して記憶部14に格納する。メンテナンスコンピュータ5は、すでに保持しているリンク情報16と、一時的に生成した新たなリンク情報16−1との比較のみで、Webページが更新、追加されているかどうかを確認することができる。図3に示されているように、新たなリンク情報16−1は、巡回先URL41に関連付けられる新規取得公開情報44および取得日45を含んで構成されている。新規取得公開情報44は、今回のアクセスで取得した公開情報(URL42−1、表示テキスト42−2)を示している。また、取得日45は、その新規取得公開情報44を取得した日付である。
以下に、本実施の形態の動作について説明を行なう。図4は、本実施の形態の動作を例示するフローチャートである。図4に示されている動作は、制御部11がリンク先情報更新プログラム40を起動すると開始する。以下の動作において、制御部11は、起動したリンク先情報更新プログラム40に基づいて、各ステップに示されている処理を実行する。ステップS101において、制御部11は、巡回先の複数のWWWサーバのWebページのURLがリスト化された巡回リスト(図示されず)を読み出し、その巡回リストから巡回先URL41を抽出する。なお、本実施の形態において、巡回リストがメンテナンスコンピュータ5の記憶部14に保持されている場合を例示して説明を行なう。ステップS102において、制御部11は、巡回先URL41で示されているWebページのデータ(35)を巡回先WWWサーバ30から取得する。ステップS103において、制御部11は取得した巡回先Webページ用データ35を一時的に記憶部14に格納する。
ステップS104において、制御部11は、リンク情報16を構成している巡回先URL41で特定される全てのWebページの巡回が完了したかどうかの判断を行なう。その判断の結果、巡回していないWebページが存在する場合、処理はステップS102に戻る。巡回先URL41で特定されるWebページの巡回が全て終了している場合、処理はステップS105に進む。
ステップS105において、制御部11は、今回の巡回によって取得したWebページデータに基づいて、新たなリンク情報16−1を作成する。制御部11は、マークアップ言語のWebページデータからハイパーリンクのタグを見つけて、現在の公開情報を抽出し、巡回先のURLに関連づけて取得日とともにリスト化する。制御部11は、そのリスト化によって生成される新たなリンク情報16−1を、記憶部14に一時的に格納し、処理はステップS106に進む。ステップS106において、制御部11は、作成した新たなリンク情報16−1と記憶部14に保持されているリンク情報16とを比較する。ステップS107において、制御部11は、リンク情報16の登録済み公開情報42に含まれていないデータが、新たなリンク情報16−1の新規取得公開情報44に存在するかどうかの判断を実行する。その判断の結果、新たなデータが含まれていない場合には、処理は終了する。新たなデータが存在するときには、処理はステップS108に進む。
ステップS108において、新たなデータを登録済み公開情報42に追加登録し、そのデータ取得日45を登録日43としてリンク情報16を更新する。ステップS109において、新規取得公開情報44に含まれる新たなデータをWWWサーバのリンク情報として公開するために、制御部11は、新規取得公開情報44に含まれる新たなデータをWWWサーバのWWWサーバ記憶部に保持しているWebサイト用データ21に追加する旨をWWWサーバ8に通知する。WWWサーバ8は、その通知に応答して、WWWサーバ記憶部19のWebサイト用データ21のハイパーリンクの設定を更新する。
図5は、上述のフローチャートに示される動作に対応するデータの流れを例示するブロック図である。図5に示されているように、制御部11は、バス15を介して巡回リストを読み出す(矢印51)。制御部11は、読み出した巡回リストに基づいて、通信部12を介して巡回先WWWサーバ30の巡回先Webページ用データ35にアクセスする。メンテナンスコンピュータ5は、巡回先WWWサーバ30へのアクセスの完了に対応して、巡回先URL41で特定される巡回先Webページ用データ35の出力を要求する(矢印52)。
巡回先WWWサーバ30は、その要求に応答して巡回先Webページ用データ35を巡回先WWWサーバ通信部32を介してメンテナンスコンピュータ5に送信する(矢印53)。メンテナンスコンピュータ5の通信部12は、送信された巡回先Webページ用データ35をバス15を介して制御部11に供給する。制御部11は、供給された巡回先Webページ用データ35に基づいて新たなリンク情報16−1を作成する。制御部11は作成した新たなリンク情報16−1と、リンク情報16との比較に基づいて、Webサイトの更新をWWWサーバ8に指示する(矢印54)。WWWサーバ8のWWWサーバ制御部17は、制御部11からの指示に応答してWWWサーバ記憶部19のWebサイト用データ21を更新する。
このような構成、動作を実現することによって、自己のWebサイトで他のWebサイトの更新情報を公開する際に、他のWebサイトの更新状況を把握し、公開する情報が更新されたときに、その更新を検出して更新日に依存することなく適切にリンクを制御することが可能になる。
なお、上述してきた実施の形態において、Webページデータ(HTMLファイル)が閲覧可能な状態でWWWサーバに保持されることによって、Webサイトが公開される場合を例示してきたが、これは、本発明の構成を制限するものではない。例えば、フレームが使用されているWebサイトでは、本文が記述されているWebページのURLを登録する。または、フレームのタグである<FRAMESET>が記述されている場合には、フレーム先のWebページのURL(例:frame_page1.html)が記述されているタグ<FRAME SRC=" frame_page1.html ">のURLに対応するWebページのデータを取得することで、本願発明を実現することができる。
以下に公開情報のデータがどのように抽出、比較、新たなデータとして特定されるか詳細を説明する。以下の説明では、ハイパーリンクが設定されているWebページがHTMLを用いて記述されている場合を例示して説明を行なう。HTMLでは、リンクを構築する場合には、<A>で表示されるタグが用いられる。例えば、利用者端末側出力装置24で表示されているWebブラウザに「新PCのホームページを表示します」という文字列が表示され、その文字列にハイパーリンクが設定されている場合のタグは、
<A HREF="new_pc_url.htm">新PCのホームページを表示します</A>
と記述される。
この文字列を利用者端末側入力装置23を使用して指定すると(例えば、マウスポインタを重ねて、マウスをクリックすると)、Webブラウザには、「new_pc_url.htm」のURLで特定されるWebページのデータが閲覧可能な状態に変換されて表示される。
巡回先Webページ用データ35から公開情報を取得するには、 <A から /A> までの情報を取得することが求められる。ここで、上述したように本実施の形態のメンテナンスコンピュータ5は、記憶部14にリンク情報16を備え、リンク情報16は、登録済み公開情報42を含んでいる。したがって、<A HREF=" "> </A>内のURL(HREF=以降の" "で囲まれた情報)と、表示テキスト(<A></A>で囲まれた情報)を取得し、取得したURLと表示テキストが、登録済み公開情報42に記述されている文字列と一文字単位で同じかを比較することで、新規のデータかどうかの判断を行なうことができる。取得したデータから新たなリンク情報16−1を生成し、そのリンク情報16−1に含まれる新規取得公開情報44と登録済み公開情報42とを比較する。この場合に、新規取得公開情報44に含まれるURL42−1と表示テキスト42−2とのどちらか一方が、登録済み公開情報42含まれるURL42−1と表示テキスト42−2と相違するときは、そのURL42−1で特定されるWebページは、新しい情報を公開しているものと判断することができる。
さらに、<A HREF=" ">と</A>との間に、<>で囲まれたタグが存在する場合に、そのタグを比較に使用しないことで、新規データの取得の精度を向上させることができる。つまり、
<A HREF="new_pc_url.htm"><font size=3>新PCのホームページを表示します</font></A>
と記述されている場合に、<font size=3>と</font>とを無視するようにし、「新PCのホームページを表示します」という記述を比較対象とする。またこのとき、リンク情報16を更新する場合に、<font size=3>と</font>とを保存対象から除外する構成であっても良い。
また、文字列がない場合には、その新規取得公開情報を比較(または保存)しないことで、新規データの取得の精度を向上させることができる。つまり、
<a href=url><IMG SRC="画像ファイル名"></a>
と記述されている場合、この公開情報は画像タグ(<img...>)などである。画像、バナー、デザイン要素に関するリンクは、新たな情報を公開するためのリンクではない場合が多い。このようなリンクの、比較処理を行わないことで、比較精度を向上させることができる。
さらに、掲載文字列に字数などの条件を設けることで、新規データの取得精度を向上させることが可能である。文字数が極端に少ない場合、その公開情報は新規の情報を公開するリンクではないことが多い。したがって、予め
取得対象の掲載文字列条件=全角5文字以上
という条件を指定しておくことで、例えば、
<a href=url>次へ</a>
というような記述の情報を無視することが可能になる。
本願発明において、公開情報として比較、保存および表示されるURLが相対パスであるか絶対パスであるかの制限はない。上述してきた実施の形態では、例えば、
<A HREF="new_pc_url.htm">新PCのホームページを表示します</A>
という記述に示されるように、相対パスを用いてリンク情報16が構成されている場合を例示してきた。制御部11は、<A HREF="new_pc_url.htm">に示されるURLに http:// が付されていないことで、そのURLが相対パスであると判断する。ここで、巡回先WWWサーバ30に事前に登録されているURLが http://www.pc.co.jp である場合、その末尾に「/」を付加した後、絶対パスに変換する。また、事前に登録されているURLが http://www.pc.co.jp/ である場合には、「/」を付加することなく絶対パスへ変換する。制御部11が、その絶対パスを用いて公開情報の比較を行なうことで、上記の実施の形態と同様の効果を実現することができる。
さらに、上記の実施の形態において、Webサイトの管理者による確認を行った後に、ハイパーリンクを設定することで、公開する情報を適切に取捨選択することが可能となる。その場合、メンテナンスコンピュータ5の制御部11は、Webページの巡回を行なった後、リンク情報16の更新完了に応答して、つまり、公開情報(URLと表示テキスト)の新規データが見つかったら、確認用プログラムを起動する。確認用プログラムは、確認用表示画面60をメンテナンスコンピュータ側出力装置7に表示する。確認用プログラムはその確認用表示画面60を用いて、更新されたリンク情報16に基づく情報を出力する。
図6は、本実施の形態において、Webサイト管理者が新規データの確認を実行する場合に、メンテナンスコンピュータ側出力装置7の表示される確認用表示画面60の構成を例示する図である。図6を参照すると、確認用表示画面60は、巡回先会社名61と、巡回先URL62と、掲載内容63とを含んで構成されている。また、掲載内容63は、リンク情報16から読み出した登録済み公開情報42(=新規取得公開情報44)を掲載内容として表示させている。ここで、リンク情報16の登録済み公開情報42にあるものが全てWWWサーバで公開されない場合、例えば、新規データとして特定されるのを防ぐために、予め、除外するURLや表示テキストを登録済み公開情報42に登録させておく場合を考慮する。この場合、確認用表示画面の作成やWebサイト用データを更新するための一時的な新規データリストを生成しても良い。また、確認用表示画面の作成で登録済み公開情報42を使う場合は、今回新たに新規データとして特定されたもののみ表示する。
Webサイト管理者は、掲載内容63に示される情報を確認した後、掲載可または掲載不可のボタンを押すことで掲載の可否を決定する。また、Webサイト管理者は掲載内容63に支援される情報を修正してから掲載を決定する構成であっても良い。確認用プログラムは、掲載の可否が決定したリンク情報16をWWWサーバ8のWWWサーバ制御部17に通知する、WWWサーバ制御部17は、その通知に基づいて、WWWサーバ記憶部19のWebサイト用データ21を更新する。これによって、掲載すべきでない情報が公開されることを防止することができるようになる。また、確認用表示画面では、情報を取得した日(取得日、登録日)は、巡回したURLのWebページ上で記述されている日付が違う場合がある。その場合に対応するために、実際に公開する日を指定できる項目(掲載日)を設ける構成であっても良い。
上述してきた実施の形態において、巡回リストにはURL毎に巡回するかしないかの巡回設定情報のフラグがあってもよく、その場合、巡回する設定のフラグのURLに対して巡回することが好ましい。巡回先URL41として保持するURLは、巡回先WWWサーバ30が公開しているWebサイトのトップページを示していることが好ましい。Webサイトは新着情報がある旨をトップページに表示し、その新着情報がある旨を示す文字列にリンクが設定され、そのリンクをたどることで該当する新しい情報を閲覧することができる。このため、トップページにリンクされるURLを取得することで、新規のWebページのデータを取得することができる。サイト内の全てのページを巡回することなく所望の新規データを取得することができる。
また、トップページのURL以外に、各Webサイトのトップページ以降のページも登録する構成であっても良い。その場合、公開情報以外にバイナリ形式で保存されたWebページデータを用いることで、下層のページの更新状況を確認することができる。メンテナンスコンピュータ5の制御部11は、前回保存したWebページデータと今回巡回したときに取得したWebページデータとをバイナリ形式で比較することで更新状況を把握する。制御部11は、その確認の結果、更新されているWebページを特定したときに、確認用プログラムを起動し「更新あり」を示す情報を出力する。
下層ページの更新を確認することで、例えば、Webサイトが所定のジャンルごとに分かれたページで構成されている場合に、更新を確認しておきたいジャンルのWebページを登録しておくことで、トップページから得られる新着情報以外に、所望のWebページの新規な情報を得ることができる。また、このジャンルの下層にさらに小ジャンルを示すWebページが存在する場合、そのページのURLを登録して更新状況を確認する構成であっても良い。
また、上述の実施の形態における、メンテナンスコンピュータとWWWサーバは個別の装置で構成されることに限定されるものではない。つまり、メンテナンスコンピュータとWWWサーバとが単一の装置内に構成されても良い。また、各種リストやプログラムを保存する記憶部は1つでも複数でも良く、どの記憶部に各種リストやプログラムがあるかに限定されることはない。さらに、上述の実施の形態において、巡回リストが、リンク情報16と別のリストであることを前提に説明を行なってきたが、この巡回リストをリンク情報16の巡回先URL41から抽出する構成であっても良い。
図1は、本実施の形態のWebシステムの全体構成を例示するブロック図である。 図2は、メンテナンスコンピュータに保持されるリンク情報の構成を例示すテーブルである。 図3は、新たなリンク情報の構成を例示するテーブルである。 図4は、本実施の形態の動作を例示するフローチャートである。 図5は、本実施の形態におけるデータ移動を例示するブロック図である。 図6は、メンテナンスコンピュータの表示装置に表示される確認用画面の構成を例示する画面図である。
符号の説明
1…配信側システム
2…巡回先WWWサーバ群
3…閲覧側システム
4…ネットワーク
5…メンテナンスコンピュータ
6…メンテナンスコンピュータ側入力装置
7…メンテナンスコンピュータ側出力装置
8…WWWサーバ
9…WWWサーバ側入力装置
10…WWWサーバ側出力装置
11…制御部
12…通信部
13…出力部
14…記憶部
15…バス
16…リンク情報
16−1…新たなリンク情報
17…WWWサーバ制御部
18…WWWサーバ通信部
19…WWWサーバ記憶部
20…バス
21…Webサイト用データ
22…利用者端末
23…利用者端末側入力装置
24…利用者端末側出力装置
25…利用者端末側制御部
26…利用者端末側通信部
27…利用者端末側出力部
28…利用者端末側記憶部
29…バス
30…巡回先WWWサーバ
31…巡回先WWWサーバ制御部
32…巡回先WWWサーバ通信部
33…巡回先WWWサーバ記憶部
34…バス
35…巡回先Webページ用データ
40…リンク先情報更新プログラム
41…巡回先URL
42…登録済み公開情報
43…登録日
44…新規取得公開情報
45…取得日
51〜55…矢印
60…確認用表示画面
61…巡回先会社名
62…巡回先URL
63…掲載内容

Claims (22)

  1. 巡回先のWebサイトに関連する情報を保持する記憶装置と、
    ネットワークを介して前記Webサイトにアクセスする通信装置と、
    前記WebサイトのWebページを示すURLに基づいて、前記URL先である巡回先Webページで公開される公開情報を取得し、前記公開情報を取得済情報として前記記憶装置に格納する制御装置と
    を具備し、
    前記記憶装置は、
    前記Webサイトの名称もしくは前記WebページのURLを示す情報を保持し、
    前記制御装置は、
    前記巡回先Webページに接続し、現在の公開情報を前記巡回先Webページから抽出し、前記現在の公開情報と前記取得済情報とを比較して、前記取得済情報に含まれていない新たな公開情報を特定したときに、前記新たな公開情報を含む新たな取得済情報を生成する
    サーバコンピュータ。
  2. 請求項1に記載のサーバコンピュータにおいて、
    前記制御装置は、
    前記巡回先Webページのデータである巡回先Webページ用データから、他のWebページへのリンクを実行させるためのリンク用タグを特定し、
    前記リンク用タグに基づいて前記巡回先Webページ用データから前記公開情報を抽出する
    サーバコンピュータ。
  3. 請求項2に記載のサーバコンピュータにおいて、
    前記制御装置は、
    前記巡回先Webページ用データから、特定のタグを認識したときに、前記特定のタグで示される情報を無視してから前記現在の公開情報と前記取得済情報とを比較する
    サーバコンピュータ。
  4. 請求項2または3に記載のサーバコンピュータにおいて、
    前記制御装置は、
    前記巡回先Webページ用データから、前記公開情報に対応する文字列を抽出し、前記文字列が所定の文字数を超えるときに、前記現在の公開情報と前記取得済情報とを比較する
    サーバコンピュータ。
  5. 請求項2から4の何れか1項に記載のサーバコンピュータにおいて、
    前記制御装置は、
    前記巡回先Webページ用データから、前記巡回先Webページに表示される文字列が特定されないときに、前記取得済情報の保存を継続する
    サーバコンピュータ。
  6. 請求項2から5の何れか1項に記載のサーバコンピュータにおいて、
    前記制御装置は、
    前記公開情報のリンク先を示す公開情報URLに、前記公開情報を取得したWebページのURLを付加して前記公開情報URL情報の記述を、相対パスから絶対パスへ変換する機能または絶対パスから相対パスに変換する機能を有する
    サーバコンピュータ。
  7. 請求項2または6の何れか1項に記載のサーバコンピュータにおいて、
    さらに、表示部
    を具備し、
    前記制御部は、
    新たな公開情報が特定されたとき、前記新たな取得済情報に対応する前記新たな公開情報を識別するためのフラグをたてるか、もしくは、前記新たな取得済情報に対応する前記新たな公開情報を示す公開情報リストを生成し、
    前記フラグが付与された前記新たな取得済情報または公開情報リストを、前記Webサイト管理者が新たな公開情報の確認を実行する場合に使用される確認用表示画面を介して前記表示部に出力する
    サーバコンピュータ。
  8. 請求項2または7の何れか1項に記載のサーバコンピュータにおいて、
    前記記憶部は、
    前記Webサイトの名称もしくは前記WebページのURLの少なくとも一方を前記取得済情報と関連付けて保持する
    サーバコンピュータ。
  9. 自己のWebサイトのデータを閲覧可能な状態で保持するWWWサーバと、
    他のWebサイトが有するWebページを示すURLに基づいて、前記URL先である巡回先Webページで公開される公開情報を取得する管理サーバと
    を具備し、
    前記管理サーバは、
    巡回先のWebサイトに関連する情報を保持する記憶装置と、
    ネットワークを介して前記Webサイトにアクセスする通信装置と、
    前記巡回先Webページで公開される公開情報を取得し、前記公開情報を取得済情報として前記記憶装置に格納する制御装置と
    を具備し、
    前記記憶装置は、
    前記Webサイトの名称もしくは前記WebページのURLを示す情報を保持し、
    前記制御装置は、
    前記巡回先Webページに接続し、現在の公開情報を前記巡回先Webページから抽出し、前記現在の公開情報と前記取得済情報とを比較して、前記取得済情報に含まれていない新たな公開情報を特定したときに、前記新たな公開情報を含む新たな取得済情報を生成する
    Webシステム。
  10. 請求項9に記載のWebシステムにおいて、
    前記制御装置は、
    前記Webページのデータである巡回先Webページ用データから、他のWebページへのリンクを実行させるためのリンク用タグを特定し、
    前記リンク用タグに基づいて前記巡回先Webページ用データから前記公開情報を抽出する
    Webシステム。
  11. 請求項10に記載のWebシステムにおいて、
    前記制御装置は、
    前記巡回先Webページ用データから、特定のタグを認識したときに、前記特定のタグで示される情報を無視してから前記現在の公開情報と前記取得済情報とを比較する
    Webシステム。
  12. 請求項10または11に記載のWebシステムにおいて、
    前記制御装置は、
    前記制御装置は、
    前記巡回先Webページ用データから、前記公開情報に対応する文字列を抽出し、前記文字列が所定の文字数を超えるときに、前記現在の公開情報と前記取得済情報とを比較する
    Webシステム。
  13. 請求項10から12の何れか1項に記載のWebシステムにおいて、
    前記制御装置は、
    前記巡回先Webページ用データから、前記巡回先Webページに表示される文字列が特定されないときに、前記取得済情報の保存を継続する
    Webシステム。
  14. 請求項10から13の何れか1項に記載のWebシステムにおいて、
    前記制御装置は、
    前記公開情報のリンク先を示す公開情報URLに、前記公開情報を取得したWebページのURLを付加して前記公開情報URL情報の記述を、相対パスから絶対パスへ変換する機能または絶対パスから相対パスに変換する機能を有する
    Webシステム。
  15. 請求項10から14の何れか1項に記載のWebシステムにおいて、
    前記管理サーバは、さらに、表示装置
    を具備し、
    前記制御部は、
    新たな公開情報が特定されたとき、前記新たな取得済情報に対応する前記新たな公開情報を識別するためのフラグをたてるか、もしくは、前記新たな取得済情報に対応する前記新たな公開情報を示す公開情報リストを生成し、
    前記フラグが付与された前記新たな取得済情報または公開情報リストを、前記Webサイト管理者が新たな公開情報の確認を実行する場合に使用される確認用表示画面を介して前記表示装置に出力する
    Webシステム。
  16. (a)ネットワークを介してWebサイトにアクセスするステップと、
    (b)前記WebサイトのWebページを示すURLに基づいて、前記URL先である巡回先Webページで公開される公開情報を取得し、前記公開情報を取得済情報として前記記憶装置に格納するステップと、
    (c)前記Webサイトの名称もしくは前記WebページのURLを示す情報を読み出すステップと
    (d)前記巡回先Webページに接続し、現在の公開情報を前記巡回先Webページから抽出し、前記現在の公開情報と前記取得済情報とを比較して、前記取得済情報に含まれていない新たな公開情報を特定したときに、前記新たな公開情報を含む新たな取得済情報を生成するステップ
    を具備する方法をコンピュータで実行するためのプログラム。
  17. 請求項16に記載のプログラムにおいて、
    前記(d)ステップは、
    前記Webページのデータである巡回先Webページ用データから、他のWebページへのリンクを実行させるためのリンク用タグを特定するステップと、
    前記リンク用タグに基づいて前記巡回先Webページ用データから前記公開情報を抽出するステップ
    をさらに具備する方法をコンピュータで実行するためのプログラム。
  18. 請求項17に記載のプログラムにおいて、
    前記(d)ステップは、
    前記巡回先Webページ用データから、特定のタグを認識したときに、前記特定のタグで示される情報を無視してから前記現在の公開情報と前記取得済情報とを比較するステップ
    をさらに具備する方法をコンピュータで実行するためのプログラム。
  19. 請求項17または18に記載のプログラムにおいて、
    前記(d)ステップは、
    前記巡回先Webページ用データから、前記公開情報に対応する文字列を抽出し、前記文字列が所定の文字数を超えるときに、前記現在の公開情報と前記取得済情報とを比較するステップ
    をさらに具備する方法をコンピュータで実行するためのプログラム。
  20. 請求項17から19の何れか1項に記載のプログラムにおいて、
    前記(d)ステップは、
    前記巡回先Webページ用データから、前記巡回先Webページに表示される文字列が特定されないときに、前記取得済情報の保存を継続するステップ
    をさらに具備する方法をコンピュータで実行するためのプログラム。
  21. 請求項17から20の何れか1項に記載のプログラムにおいて、
    前記(d)ステップは、
    前記公開情報のリンク先を示す公開情報URLに、前記公開情報を取得したWebページのURLを付加して前記公開情報URL情報の記述を、相対パスから絶対パスへ変換する機能または絶対パスから相対パスに変換を実行するステップ
    をさらに具備する方法をコンピュータで実行するためのプログラム。
  22. 請求項17から21の何れか1項に記載のプログラムにおいて、さらに、
    (e)新たな公開情報が特定されたとき、前記新たな取得済情報に対応する前記新たな公開情報を識別するためのフラグをたてるか、もしくは、前記新たな取得済情報に対応する前記新たな公開情報を示す公開情報リストを生成し、
    前記フラグが付与された前記新たな取得済情報または公開情報リストを、前記Webサイト管理者が新たな公開情報の確認を実行する場合に使用される確認用表示画面を介して前記表示装置に出力するステップ
    を具備する方法をコンピュータで実行するためのプログラム。
JP2005139006A 2005-05-11 2005-05-11 Webシステム、Webシステム用サーバコンピュータおよびコンピュータプログラム Pending JP2006318138A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005139006A JP2006318138A (ja) 2005-05-11 2005-05-11 Webシステム、Webシステム用サーバコンピュータおよびコンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005139006A JP2006318138A (ja) 2005-05-11 2005-05-11 Webシステム、Webシステム用サーバコンピュータおよびコンピュータプログラム

Publications (1)

Publication Number Publication Date
JP2006318138A true JP2006318138A (ja) 2006-11-24

Family

ID=37538780

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005139006A Pending JP2006318138A (ja) 2005-05-11 2005-05-11 Webシステム、Webシステム用サーバコンピュータおよびコンピュータプログラム

Country Status (1)

Country Link
JP (1) JP2006318138A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009259208A (ja) * 2007-12-17 2009-11-05 Keezu Estate:Kk 商品情報収集システム及び商品情報収集プログラム
JPWO2016075829A1 (ja) * 2014-11-14 2017-08-17 富士通株式会社 データ取得プログラム、データ取得方法及びデータ取得装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009259208A (ja) * 2007-12-17 2009-11-05 Keezu Estate:Kk 商品情報収集システム及び商品情報収集プログラム
JPWO2016075829A1 (ja) * 2014-11-14 2017-08-17 富士通株式会社 データ取得プログラム、データ取得方法及びデータ取得装置

Similar Documents

Publication Publication Date Title
US7702811B2 (en) Method and apparatus for marking of web page portions for revisiting the marked portions
KR100843581B1 (ko) 플러그인 프레임워크를 사용하는 브라우저의 마크업 확장
JPH11242620A (ja) 情報処理装置、サーバ装置、情報提供システム、及び記録媒体
JP2012133515A (ja) 情報処理装置、情報処理方法、プログラム、情報処理システム
JP4520450B2 (ja) アノテーション管理プログラム、アノテーション管理装置、アノテーション管理方法及びアノテーション表示プログラム
JP2001249874A (ja) 情報収集装置
JP2006318138A (ja) Webシステム、Webシステム用サーバコンピュータおよびコンピュータプログラム
JP2000285052A (ja) Url変換方法および装置
WO2016011699A1 (zh) 一种用于配置浏览器的导航页的方法与装置
JP5134639B2 (ja) クライアント装置、表示方法、プログラム、情報処理装置、及び情報処理システム
JP5228529B2 (ja) データ検索プログラム、データ検索装置およびデータ検索方法
JP2002007404A (ja) 情報供給システムと情報供給サービス方法
JP2002082936A (ja) コンテンツデータ表示装置とコンテンツデータ表示システム
JP2007087241A (ja) 多言語複層サイト作成システムおよび多言語複層サイト作成プログラム
JP2007272444A (ja) コンテンツ管理装置、コンテンツ管理方法およびコンテンツ管理プログラム
JP2007025753A (ja) ウェブログサーバ及びウェブログサービス提供システム
JP5230717B2 (ja) 情報処理システム、情報処理方法、プログラム
JP2007279980A (ja) データ収集装置およびプログラム
JP5276903B2 (ja) 閲覧システム、プラグインプログラム、ならびに、紹介プログラム
US8782806B2 (en) Content usage managing apparatus, content usage managing method and program
JP2001084169A (ja) 文書データベースアクセス装置
JP2002132768A (ja) 文書処理システム
JP2006059295A (ja) コンテンツ管理システム、コンテンツ管理装置、コンテンツ管理方法、コンテンツ管理システム、およびプログラム
JP4449381B2 (ja) 検索装置および方法
JP2006004111A (ja) Web情報抽出方法及び装置とそのプログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20081222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090106

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090507