JP2003203032A - ウェブサーバ仲介装置、方法および対話型ウェブサーバ仲介ポータルサーバ - Google Patents

ウェブサーバ仲介装置、方法および対話型ウェブサーバ仲介ポータルサーバ

Info

Publication number
JP2003203032A
JP2003203032A JP2002001142A JP2002001142A JP2003203032A JP 2003203032 A JP2003203032 A JP 2003203032A JP 2002001142 A JP2002001142 A JP 2002001142A JP 2002001142 A JP2002001142 A JP 2002001142A JP 2003203032 A JP2003203032 A JP 2003203032A
Authority
JP
Japan
Prior art keywords
code system
web server
client
code
html file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002001142A
Other languages
English (en)
Inventor
Mariko Matsuyo
麻理子 松世
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2002001142A priority Critical patent/JP2003203032A/ja
Publication of JP2003203032A publication Critical patent/JP2003203032A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

(57)【要約】 【課題】 従来、クライアントからウェブサーバへのア
クセス要求を仲介するウェブサーバ仲介装置において、
サーバ画面HTMLファイルの使用コード系を識別する
のに効率が悪く、また、クライアントからの文字列入力
をウェブサーバ側のコード系に変換してウェブサーバに
返却することができない、という課題があった。 【解決手段】 コード系が既知であるHTMLファイル
の送信元URLとそのホスト名をコード系情報テーブル
に蓄積し、コード系が未知である受信HTMLファイル
の送信元URLのホスト名が前記コード系情報テーブル
でヒットすれば、ヒットしたタプルのコード系を当該H
TMLファイルのコード系と認識する文字コード識別部
をもち、また、前記識別されたウェブサーバのコード系
を記憶し、クライアントからの文字列入力を適するコー
ド系に変換してウェブサーバに返却する手段を有するウ
ェブサーバ仲介装置によって上記課題を解決する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、クライアントから
ウェブサーバへのアクセス要求を仲介して受け付け、同
要求をウェブサーバに改めて発行し、ウェブサーバから
受信したHTMLファイルをクライアントに返すウェブ
サーバ仲介の技術に関する。
【0002】
【従来の技術】従来のウェブサーバ仲介装置には、ウェ
ブサーバからのHTMLファイルを調べて使用コード系
を識別し、そのコード系を明示的にHTMLファイル中
に記録してクライアントに返すものがある。例えば、特
開2000−132449号公開公報(以下文献1と呼
ぶ)にはそのようなウェブサーバ仲介装置の技術が開示
されている。
【0003】文献1に従って従来のウェブサーバ仲介装
置の構成を図7に示す。図7によって従来のウェブサー
バ仲介装置の動作を説明する。従来のウェブサーバ仲介
装置9はアクセス中継部91、タグ解析部92、文字コード
識別部93をもつ。クライアント1からのアクセス要求を
アクセス中継部91で受け、ウェブサーバ3に伝え、ウェ
ブサーバ3から受信したHTMLファイルをタグ解析部
92に送る。タグ解析部92の明示識別手段921 はHTML
ファイルに明示的に使用コード系が記されているかをチ
ェックする。例えば、HTMLファイルが図5(b) の行
(b) 1に示すようにメタタグをもち、charaset属性値
(図の場合はutf-8 )を明記していると、明示識別手段
921 は当該HTMLファイルの使用コード系がutf-8
(ユニコード8ビット型)であると識別する。
【0004】このようなメタタグが存在せず明示識別手
段921 が識別失敗すると、文字コード識別部93を起動
し、非明示識別手段931 が公知の技術でコード系の識別
を行う。非明示識別手段931 で用いられる技術は、例え
ば特開平9−212334号公開公報(以下文献2と呼
ぶ)に示される文字出現確率による識別を行う。しか
し、この方法は全文の文字についてその出現確率を求め
るので、特にHTMLファイルが大きいと大変効率が悪
い識別方法である。
【0005】非明示識別手段931 によって識別されたコ
ード系情報を結果返却手段932 から受け取り、タグ解析
部92の結果埋込出力手段922 は当該HTMLファイルに
明示的に識別結果のコード系を記したメタタグを埋め込
み、これをアクセス中継部91を経由してクライアント1
へ返す。
【0006】
【発明が解決しようとする課題】上記のように、従来の
ウェブサーバ仲介装置9でウェブサーバ3からのHTM
Lファイルのコード系を識別するのに、非明示識別手段
931 は大変効率の悪い識別手段であるが、明示識別手段
921 で識別できない場合はすべて非明示識別手段931 に
よらなければコード系の識別ができなかった。
【0007】また、従来のウェブサーバ仲介装置9では
識別したコード系情報をHTMLファイルに明示的に埋
め込みクライアント1に返すだけなので、当該HTML
ファイルがクライアント1から文字列入力を要求するよ
うなFORMタグ書式を含むものであった場合、その文
字列は使用ブラウザの機能によって定まるコード系で従
来のウェブサーバ仲介装置9内の所定の返却先に返却さ
れ、従来のウェブサーバ仲介装置9はこれをウェブサー
バ3にそのコード系のまま返却する。通常のブラウザは
受信したHTMLファイルの使用コード系に合わせてク
ライアント入力文字列のコード系を変換して送出するの
で、ウェブサーバ3はこれを解読可能である。
【0008】他方、ウェブサーバ仲介装置の発展形とし
て、対話型ウェブサーバ仲介ポータルサーバが考えられ
る。これは、インターネット上のショッピングモールで
複数のサイバーショップのウェブサーバ3の中から希望
の商品名を指定して該当ショップを選ぶ電子商取引や、
複数の検索エンジンウェブサーバ3に一挙にアクセスし
て検索結果を得るような、複数の対話型ウェブサーバに
一挙にアクセスしてくれる仲介ポータルである。このよ
うな対話型ウェブサーバ仲介ポータルサーバはインター
ネットの普及とともに、今後ますます重要となると考え
られる。
【0009】しかし、従来のウェブサーバ仲介装置9で
は、単一の文字列入力によって類似カテゴリをもつ複数
ウェブサーバに一挙にアクセスして結果を得るような、
対話型ウェブサーバ仲介ポータルサーバとして使用する
ことはできない。なぜなら、従来のウェブサーバ仲介装
置9ではクライアントからの文字列入力を異なるコード
系を使用する複数ウェブサーバ側のコード系に変換して
ウェブサーバに返却する機能をもっていないからであ
る。
【0010】上記のように、従来のウェブサーバ仲介装
置ではHTMLファイルの使用コード系を識別するのに
効率が悪く、また、クライアントからの文字列入力をウ
ェブサーバ側のコード系に変換してウェブサーバに返却
することができない、という課題があった。本発明はよ
り効率よくHTMLファイルの使用コード系を識別し、
クライアントからの文字列入力をウェブサーバ側のコー
ド系に変換してウェブサーバに返却できるウェブサーバ
仲介装置を提供することを目的とする。また、本発明
は、単一の文字列入力によって類似カテゴリをもつ複数
ウェブサーバに一挙にアクセスして結果を得るような、
対話型ウェブサーバ仲介ポータルサーバを提供すること
を目的とする。
【0011】
【課題を解決するための手段】上記課題は、図1および
図6に示す如く、コード系が既知である受信HTMLフ
ァイルの送信元URLからホスト名を抽出し、該URL
と該ホスト名と該コード系を含むタプルt をコード系情
報テーブルc-tbl に蓄積するコード系情報蓄積手段24
と、コード系が未知である受信HTMLファイルの送信
元URLからホスト名を抽出し、該ホスト名によって前
記コード系情報テーブルc-tbl を検索するコード系検索
手段233 とを有し、前記検索によってヒットしたタプル
のコード系を当該HTMLファイルのコード系と認識す
る文字コード識別部23を有するウェブサーバ仲介装置2
によって解決される。
【0012】また、図1〜図2に示す如く、第1のコー
ド系caを使用し、クライアント1からの文字列入力を第
1の返却先a.cgi を指定して要求するFORMタグ書式
を含む第1のHTMLファイルHTML1=xxxpage.htmlを、
第2のコード系( 図ではutf-8)に変換し、前記クライア
ント1からの文字列入力の返却先a.cgi を第2の返却先
p.cgi に変更したFORMタグ書式とした第2のHTM
LファイルHTML2'=ppppage.html に変換するフォーム変
換手段222 と、前記第2のHTML2'=ppppage.html を受信
したクライアント1からの文字列入力( 図ではzzzz) を
前記第2の返却先p.cgi で受け、これを前記第1のコー
ド系caに変換して前記第1の返却先a.cgi に返却する文
字列/URL変換手段25とをさらに有するウェブサーバ仲介
装置2によって解決される。
【0013】また、図3に示す如く、クライアント1か
らの要求によって複数の対話型ウェブサーバ3a,3b,...
にアクセスし、当該クライアント1の入力を当該ウェブ
サーバ3a,3b,... に伝えてその結果画面を当該クライア
ント1に示す対話型ウェブサーバ仲介ポータルサーバで
あって、複数の対話型ウェブサーバ3a,3b,... の入力要
求画面を一画面に集約してクライアント1に送出する初
画面手段212 と、前記入力要求に対するクライアント1
の入力内容を前記複数の対話型ウェブサーバ3a,3b,...
に分配して返却するURL 分配手段211 と、前記返却した
入力内容に応じて前記複数の対話型ウェブサーバ3a,3
b,... から受信する結果画面を一画面に編集してクライ
アントに送出するHTML集約手段213 とを有する対話型ウ
ェブサーバ仲介ポータルサーバによって解決される。
【0014】すなわち、図1の本発明のウェブサーバ仲
介装置2を図7の従来のウェブサーバ仲介装置9と比較
すると、本発明では、明示識別手段221 が明示識別手段
921と同様に識別を行って識別できなかった場合、直ち
に非明示識別手段931 と同様の非効率な非明示識別手段
231 を起動するのではなく、コード系検索手段233 を起
動することにより、過去にコード系が判明しているホス
ト名をコード系情報テーブルc-tbl から検索すること
で、はるかに効率よくコード系識別が実行され、非効率
な非明示識別手段231 を起動するケースを低減してい
る。
【0015】また、従来のウェブサーバ仲介装置9の結
果埋込出力手段922 に換えて、本発明では、フォーム変
換手段222 と文字列/URL変換手段25とを新設し、これら
の連携によって、クライアント1にウェブサーバ仲介装
置2が定めるコード系( 図ではutf-8)に変換してHTM
Lファイルを送り、クライアント1からの文字列入力は
ウェブサーバ3が期待するコード系caに変換して返却す
ることが可能となっている。これによって本ウェブサー
バ仲介装置2は対話型ウェブサーバ仲介ポータルサーバ
としても活用することが可能となる。すなわち、図3の
ような対話型ウェブサーバ仲介ポータルサーバにおい
て、文字コード系が異なる複数のウェブサーバ3a,3
b,... に対して、これらコード系を記憶し、初画面手段
212 によってこれらウェブサーバ3a,3b,... からの入力
要求画面を一画面に集約してクライアント1に送出し、
URL 分配手段211 によって前記入力要求に対するクライ
アント1の入力内容を前記複数の対話型ウェブサーバ3
a,3b,... にコード系を合わせて分配して返却し、HTML
集約手段213 によって前記返却した入力内容に応じて前
記複数の対話型ウェブサーバ3a,3b,... から受信する結
果画面を一画面に編集してクライアントに送出すること
が可能となる。
【0016】
【発明の実施の形態】本発明のウェブサーバ仲介装置の
実施例を図1〜図7により説明する。なお、本発明にお
けるコンピュータ処理は、コンピュータプログラムによ
り当該コンピュータの主記憶装置上で実行されるが、こ
のコンピュータプログラムの提供形態は、当該コンピュ
ータに接続された補助記憶装置をはじめ、CD−ROM
等の可搬型記憶装置やネットワーク接続された他のコン
ピュータの主記憶装置及び補助記憶装置等の各記録媒体
に格納されて提供されるもので、このコンピュータプロ
グラムの実行に際しては、当該コンピュータの主記憶装
置上にローディングされ実行されるものである。
【0017】図1は本発明のウェブサーバ仲介装置の第
1の実施例の構成例である。図においてウェブサーバ仲
介装置2は先に述べた従来のウェブサーバ仲介装置9と
類似した構成でアクセス中継部21、タグ解析部22、文字
コード識別部23をもつが、そのほかにコード系情報蓄積
手段24、文字列/URL変換手段25、コード系情報テーブル
c-tbl といった新規手段を有する。また、タグ解析部22
の内部ではフォーム変換手段222 、コード系変換手段22
3 を新規に持ち、文字コード識別部23内部では非明示識
別手段231 を新規に持つ。
【0018】これらの手段の協調動作によって遂行され
る本第1の実施例のウェブサーバ仲介装置2の動作を図
2のフロー図によって説明する。この例では、図2に示
すように、ウェブサーバ仲介装置2はクライアント1に
対してプロキシサーバの役割となっており、クライアン
ト1のブラウザのプロキシ設定でウェブサーバ仲介装置
2のホスト名である www.ppp.comが設定されているもの
とする。
【0019】このような状態で、クライアント1はUR
L1= http://www.xxx.com/d1/d2のウェブサーバ3画
面を呼ぶべく、 http://www.xxx.com/d1/d2 を指定して
ブラウザを起動する。前記プロキシ設定により、ウェブ
サーバ仲介装置2にURL1文字列が到達する。ウェブ
サーバ仲介装置2のアクセス中継部21はこれを指定して
ウェブサーバ3にアクセス代行し、ウェブサーバ3から
HTML1=xxxpage.htmlなるHTMLファイルを受信する。
【0020】ウェブサーバ仲介装置2が代理受信した上
記HTML1=xxxpage.html画面は、図2に画面例☆1で示し
たように、xxx会員登録の画面で、nameと名付け
た入力ボックスと送信ボタンが配置され、入力ボックス
にカーソルがあり、文字列入力を待つ画面である。この
画面を発生させるHTMLファイルのソースの例を図5
(a) に示す。図5(a) において行(a) 2〜5のFORM
タグ書式によって図2画面例☆1の入力ボックスおよび
送信ボタンが形成されている。すなわち、行(a) 3によ
って入力ボックスが、行(a) 4によって送信ボタンが作
られ、行(a) 2によって入力文字列の返却先がa.cgi と
指定される。
【0021】アクセス中継部21からHTML1=xxxpage.html
ファイルを受けたタグ解析部22は明示識別手段221 を起
動し、図2の段階Aに示すように、まず、URL1= h
ttp://www.xxx.com/d1/d2 からホスト名 www.xxx.comを
抽出し、タプルt に書き込む。次いで、HTMLファイ
ル内のメタタグの存在を調べる。図5(a) の場合は行
(a) 1にメタタグがあり、コード系caを使用しているこ
とを宣言しているので、図2の段階Aでコード系をcaと
認識できた。caは日本語の場合、例えばiso-2022-jp,Sh
ift-Jis,euc-jp(それぞれJIS、シフトJIS、EU
Cコード)などのコード系表現用に規定された文字列を
意味している。そこで、タプルt として<ホスト名 ww
w.xxx.com|URL http://www.xxx.com/d1/d2 |コー
ド系ca>を生成し、コード系情報蓄積手段24に依頼して
このタプルt をコード系情報テーブルc-tbl に蓄積す
る。コード系情報蓄積手段24はデータベースマネージャ
として、タプルidを管理し、図5(c) に示すデータ構
造でコード系情報テーブルc-tblに当該タプルt を格納
する。
【0022】図2の段階Aにおいて、上記のように明示
識別手段221 がコード系識別できなかった場合、すなわ
ち、HTMLファイルに図5(a) の行(a) 1のようなメ
タタグがなかった場合、明示識別手段221 は文字コード
識別部23に識別を依頼し、その結果の返却によって図2
の段階Bに移行する。明示識別手段221 と文字コード識
別部23との上記連携動作による文字コード識別手順を図
6の動作フローで説明する。
【0023】図6において、ステップS601で明示識
別手段221 が識別成功の場合はステップS606に移行
し、コード系情報蓄積手段24にタプルt をわたし、これ
をコード系情報テーブルc-tbl に登録する。そしてステ
ップS607で結果返却手段232 は当該タプルt を結果
バッファに置きフォーム変換手段222 を起動する。ステ
ップS601で識別失敗の場合、文字コード識別部23は
ステップS602でコード系検索手段233 によってコー
ド系情報テーブルc-tbl を当該ホスト名で検索する。ス
テップS603で上記検索でヒットしたタプルt ' が存
在した場合はステップS606、ステップS607の既
に述べた処理に移行する。ステップS603でも失敗し
た場合のみ文字コード識別部23はステップS604で非
明示識別手段231 を起動する。非明示識別手段231 は前
述の文献2のような公知の手法でHTMLファイルの全
文を調べてコード系を推定する。ステップS605で上
記推定に成功すると既に述べたステップS606、ステ
ップS607に移行する。ステップS605でもコード
系が推定できなかった場合は、本実施例ではコード系情
報テーブルc-tbl に登録することなくステップS607
に移行する。この場合コード系は初期設定のデフォルト
値が採用される。他の実施例では、ここで『ホスト名 w
ww.xxx.comのコード系がわかりませんので処理を終了し
ます。』とエラーメッセージを出すこともできる。これ
らは用途に応じて適宜設計される。
【0024】次いで、図2の段階Bに示すフォーム変換
手段222 の動作を説明する。フォーム変換手段222 はHT
ML1=xxxpage.htmlのソース図5(a) の行(a) 2から行
(a) 5にFORMタグ書式が存在することを検出し、返
却先a.cgi を変換バッファに退避する。そして自ら用意
する返却先p.cgi にこれを置き換える。この結果は図5
(b) の行(b) 3のように反映される。次いで、行(a) 3
のinput nameのnaを同様に変換バッファに
退避し、自ら用意する名前npにこれを置き換える。こ
の結果は図5(b) の行(b) 4のように反映される。ま
た、図5(b) 行(b)5のようにもとのコード系caを返却
先p.cgi に伝えるメモを設定する。
【0025】次いで、図2の段階Cにおいて、フォーム
変換手段222 はコード系変換手段223 を起動し、上記変
更したHTMLファイルを自ら設定するコード系utf-8
に変換するよう依頼する。本例では、シフトJIS、J
IS、EUCなどの多くの日本語コード系の大多数の文
字に対応するコードをもつコード系の一例としてコード
系utf-8 をクライアント1に返すべきコード系として選
んだが、もちろん、他のコード系を選択することも可能
である。
【0026】この結果、クライアント1にわたすべきH
TMLファイルとしてHTML2'=ppppage.html (' はコー
ド系utf-8 であることを示すものとする。)なるHTM
Lファイルが生成され、アクセス中継部21はこれをクラ
イアント1に送信する。HTML2'=ppppage.html のソース
例は図5(b) に示し、これに対応する画面例は図2の画
面例☆2に示した。なお、図2の段階Bでは記述を省略
したが、図5(b) において行(b) 1はもとのHTML1=xxxp
age.htmlのメタタグがあればこれを変更し、また、なけ
ればフォーム変換手段222 が設定して挿入する。また行
(b) 2はppp仲介マークを画面に設定した例である。
これらは適宜フォーム変換手段222 が行う設計的事項で
ある。
【0027】クライアント1は図2画面例☆2のHTM
Lファイルを受け取り、入力ボックスに図のように『富
士太郎』と入力し、送信ボタンをクリックしたものとす
る。この文字列『富士太郎』はコード系utf-8 で返却先
p.cgi に送られる。コード系utf-8 で表した文字列『富
士太郎』を図2ではzzzzと示した。(ちなみに、実際の
文字列では%E5%AF%8C%E5%A3%AB%E5%A4%AA%E9%83%8Eであ
る。)また、行(b) 5の作用によりcode=ca のメモが付
加され、ウェブサーバ仲介装置2の返却先p.cgi は URL2'=http://www.ppp.com/p.cgi?np=zzzz&code=ca なる文字列を受け取る。
【0028】返却先p.cgi は図2の段階Dで、文字列/U
RL変換手段25を起動して受信した文字列zzzzを元のウェ
ブサーバ3のコード系に変換する。この際、文字列/URL
変換手段25は受信文字列&code=caによって変換すべきウ
ェブサーバ3のコード系がコード系caであったことを認
識できる。文字列/URL変換手段25はコード系変換手段22
3 を用いて文字列zzzzをコード系caに変換した文字列aa
aaとする。(ちなみにcaがeuc コードをあらわしている
場合、実際の文字列は%C9%D9%BB%CE%C2%C0%CF%BAとな
る。) 次いで、文字列/URL変換手段25は変換バッファから退避
しておいたname=na 、返却先a.cgi を復元し、ウェブサ
ーバ3に返却すべき文字列を含むURLとして URL3=http://www.xxx.com/a.cgi?na=aaaa を生成してアクセス中継部21にアクセスを依頼する。ア
クセス中継部21はこれをウェブサーバ3に伝え、ウェブ
サーバ3から次画面HTML3= answerpage.htmlを受信す
る。本画面は会員登録等のアプリケーション進行に伴う
画面である。このHTMLファイルは既にコード系caと
判明しているので、本実施例ではアクセス中継部21がこ
のHTMLファイルにコード系caを明示するメタタグを
挿入して HTML3+=answerpage.html としてクライアント
1に返すものとした(図2の段階E)。
【0029】以上述べたごとく、第1の実施例のウェブ
サーバ仲介装置2では、ウェブサーバ3からのHTML1=xx
xpage.htmlファイルにコード系を示す明示的なメタタグ
がなくても、直ちに効率の悪い非明示識別手段231 を起
動するのではなく、コード系検索手段233 によってコー
ド系情報テーブルc-tbl を検索し、同一ホスト名をもつ
既知URLの既知コード系を得ることにより、コード系
識別の効率を高めることができた。また、ウェブサーバ
3から受信したコード系caのHTML1=xxxpage.htmlをコー
ド系utf-8 に変換してクライアント1に送信し、クライ
アント1からの文字列入力zzzzをコード系caに戻してウ
ェブサーバ3に返却することができた。
【0030】次に、本発明の第2の実施例として、対話
型ウェブサーバ仲介ポータルサーバとして本ウェブサー
バ仲介装置2を適用した場合を図3〜4によって説明す
る。図3のウェブサーバ仲介装置は複数検索エンジン仲
介装置であって、クライアント1から検索キーワードの
文字列入力zzzzを受け取り、これを複数の検索エンジン
(図では検索エンジンAおよび検索エンジンB)に与え
て検索させ、その結果をクライアント1に返却するウェ
ブサーバ仲介装置である。
【0031】ここに検索エンジンAはコード系caを、検
索エンジンBはコード系cbを使用しそれぞれ www.aaa.c
om、 www.bbb.comのホスト名であるとする。図4の画面
例☆4a、4bはこれらの検索エンジンの初画面であ
る。本実施例ではクライアント1はブラウザで本複数検
索エンジン仲介装置のURLを指定してURL0=htt
p://www.ppp.comを送るものとする。
【0032】本複数検索エンジン仲介装置は図3に示す
如く、アクセス中継部21A に新たにURL 分配手段211 、
初画面手段212 、HTML集約手段213 を有しており、その
他の図1と同番号の構成手段は第1の実施例で説明した
機能を持っている。図3においてアクセス中継部21A は
クライアント1からのURL0=http://www.ppp.comに
反応して初画面手段212 を起動してクライアント1に初
画面HTML2'=q-page.htmlを送出する。本HTMLファイ
ルはコード系utf-8 で作られ、図4に画面例☆3で示す
画面をもつ。
【0033】クライアント1はこの画面で文字列入力ボ
ックスにキーワード『富士山』を入力し送信ボタンをク
リックする。文字列『富士山』のコード系utf-8 表示を
zzzzとすると URL2'〜=http://www.ppp.com/p.cgi?np=zzzz が複数検索エンジン仲介装置のアクセス中継部21A に返
却される。
【0034】図4の段階Aにおいて、URL 分配手段211
は予め保持する検索エンジンA、検索エンジンBの返却
先情報、コード系情報によって、上記で受け取った文字
列入力zzzzをコード系ca、コード系cbに変換した文字列
入力aaaa、文字列入力bbbbに変換して URL3=http://www.xxx.com/a.cgi?na=aaaa 、 URL3b=http://www.bbb.com/b.cgi?nb=bbbb を生成する。この過程で文字列/URL変換手段25、コード
系検索手段233 を使用することは既に第1の実施例で述
べたのと同様である。
【0035】かくして、URL 分配手段211 は検索エンジ
ンAに URL3a=http://www.aaa.com/a.cgi?na=aaaa を、検索エンジンBに URL3b=http://www.bbb.com/b.cgi?nb=bbbb を送信して、それぞれの検索エンジンに検索を実行させ
る。この段階によって、図4画面例☆4a、4b上でお
のおのの入力ボックスに文字列『富士山』を入力し送信
ボタンをそれぞれクリックしたのと同等の作用をさせて
いる。
【0036】それぞれのウェブサーバからHTML3a= ans-
a-page.html 、HTML3b= ans-b-page.html なる検索結果
のHTMLファイルを受信すると、図4の段階BでHTML
集約手段213 はこれら受信HTMLファイルをコード系
変換手段223 を用いて共通のコード系(例えばutf-8 )
に変換する。そして、段階CにおいてHTML集約手段213
はこれらHTMLファイルをひとつに編集したHTML3c'=
ans-c-page.htmlを作成する。この場合、画面設計上こ
れらのHTMLファイルから適宜要素を取捨選択し、HT
ML集約手段213 が見やすい画面のHTMLファイルを生
成するように設計する必要がある。
【0037】アクセス中継部21A は得られたHTML3c'= a
ns-c-page.htmlをクライアント1に返し、クライアント
1では検索エンジンA、検索エンジンBの検索結果を一
挙に得ることができる。 (付記1) コード系が既知である受信HTMLファイ
ルの送信元URLからホスト名を抽出し、該URLと該
ホスト名と該コード系を含むタプルをコード系情報テー
ブルに蓄積するコード系情報蓄積手段と、コード系が未
知である受信HTMLファイルの送信元URLからホス
ト名を抽出し、該ホスト名によって前記コード系情報テ
ーブルを検索するコード系検索手段と、を有し、前記検
索によってヒットしたタプルのコード系を当該HTML
ファイルのコード系と認識する文字コード識別部を有す
ることを特徴とするウェブサーバ仲介装置。 (付記2) 第1のコード系を使用し、クライアントか
らの文字列入力を第1の返却先を指定して要求するFO
RMタグ書式を含む第1のHTMLファイルを、第2の
コード系に変換し、クライアントからの前記文字列入力
の返却先を第2の返却先に変更したFORMタグ書式と
した第2のHTMLファイルに変換するフォーム変換手
段と、前記第2のHTMLファイルを受信したクライア
ントからの文字列入力を前記第2の返却先で受け、これ
を前記第1のコード系に変換して前記第1の返却先に返
却する文字列/URL変換手段と、を有することを特徴とす
るウェブサーバ仲介装置。
【0038】(付記3) クライアントからの要求によ
って複数の対話型ウェブサーバにアクセスし、当該クラ
イアントの入力を当該ウェブサーバに伝えてその結果画
面を当該クライアントに示す対話型ウェブサーバ仲介ポ
ータルサーバであって、複数の対話型ウェブサーバの入
力要求画面を一画面に集約してクライアントに送出する
初画面手段と、前記入力要求に対するクライアントの入
力内容を前記複数の対話型ウェブサーバに分配して返却
するURL 分配手段と、前記返却した入力内容に応じて前
記複数の対話型ウェブサーバから受信する結果画面を一
画面に編集してクライアントに送出するHTML集約手段
と、を有することを特徴とする対話型ウェブサーバ仲介
ポータルサーバ。 (付記4) 第1のコード系を使用し、クライアントか
らの文字列入力を第1の返却先を指定して要求するFO
RMタグ書式を含む第1のHTMLファイルを、第2の
コード系に変換し、クライアントからの前記文字列入力
の返却先を第2の返却先に変更したFORMタグ書式と
した第2のHTMLファイルに変換するフォーム変換手
段と、前記第2のHTMLファイルを受信したクライア
ントからの文字列入力を前記第2の返却先で受け、これ
を前記第1のコード系に変換して前記第1の返却先に返
却する文字列/URL変換手段と、を有することを特徴とす
る付記3記載の対話型ウェブサーバ仲介ポータルサー
バ。
【0039】(付記5) コード系が既知である受信H
TMLファイルの送信元URLからホスト名を抽出し、
該URLと該ホスト名と該コード系を含むタプルをコー
ド系情報テーブルに蓄積するコード系情報蓄積段階と、
コード系が未知である受信HTMLファイルの送信元U
RLからホスト名を抽出し、該ホスト名によって前記コ
ード系情報テーブルを検索するコード系検索段階と、前
記検索によってヒットしたタプルのコード系を当該HT
MLファイルのコード系と認識する文字コード識別段階
と、を有することを特徴とするウェブサーバ仲介方法。 (付記6) 第1のコード系を使用し、クライアントか
らの文字列入力を第1の返却先を指定して要求するFO
RMタグ書式を含む第1のHTMLファイルを、第2の
コード系に変換し、クライアントからの前記文字列入力
の返却先を第2の返却先に変更したFORMタグ書式と
した第2のHTMLファイルに変換するフォーム変換段
階と、前記第2のHTMLファイルを受信したクライア
ントからの文字列入力を前記第2の返却先で受け、これ
を前記第1のコード系に変換して前記第1の返却先に返
却する文字列/URL変換段階と、を有することを特徴とす
るウェブサーバ仲介方法。
【0040】(付記7) クライアントからの要求によ
って複数の対話型ウェブサーバにアクセスし、当該クラ
イアントの入力を当該ウェブサーバに伝えてその結果画
面を当該クライアントに示す対話型ウェブサーバ仲介の
方法であって、複数の対話型ウェブサーバの入力要求画
面を一画面に集約してクライアントに送出する初画面提
示段階と、前記入力要求に対するクライアントの入力内
容を前記複数の対話型ウェブサーバに分配して返却する
URL 分配段階と、前記返却した入力内容に応じて前記複
数の対話型ウェブサーバから受信する結果画面を一画面
に編集してクライアントに送出するHTML集約段階と、を
有することを特徴とする対話型ウェブサーバ仲介の方
法。
【0041】(付記8) コード系が既知である受信H
TMLファイルの送信元URLからホスト名を抽出し、
該URLと該ホスト名と該コード系を含むタプルをコー
ド系情報テーブルに蓄積するコード系情報蓄積段階と、
コード系が未知である受信HTMLファイルの送信元U
RLからホスト名を抽出し、該ホスト名によって前記コ
ード系情報テーブルを検索するコード系検索段階と、前
記検索によってヒットしたタプルのコード系を当該HT
MLファイルのコード系と認識する文字コード識別段階
と、をコンピュータに実行させることを特徴とするウェ
ブサーバ仲介プログラム。
【0042】(付記9) クライアントからの要求によ
って複数の対話型ウェブサーバにアクセスし、当該クラ
イアントの入力を当該ウェブサーバに伝えてその結果画
面を当該クライアントに示す対話型ウェブサーバ仲介情
報処理をコンピュータに実行させるプログラムであっ
て、複数の対話型ウェブサーバの入力要求画面を一画面
に集約してクライアントに送出する初画面提示段階と、
前記入力要求に対するクライアントの入力内容を前記複
数の対話型ウェブサーバに分配して返却するURL 分配段
階と、前記返却した入力内容に応じて前記複数の対話型
ウェブサーバから受信する結果画面を一画面に編集して
クライアントに送出するHTML集約段階と、をコンピュー
タに実行させることを特徴とする対話型ウェブサーバ仲
介プログラム。
【0043】
【発明の効果】以上の説明から明らかなように、本発明
によれば、クライアントからウェブサーバへのアクセス
要求を仲介して受け付け、同要求をウェブサーバに改め
て発行し、ウェブサーバから受信したHTMLファイル
をクライアントに返すウェブサーバ仲介装置において、
前記HTMLファイルの使用コード系を効率よく識別で
き、また、クライアントからの文字列入力をウェブサー
バ側のコード系に変換してウェブサーバに返却できるの
で、対話型ウェブサーバ仲介ポータルサーバを構築する
のに適したウェブサーバ仲介装置が提供できる、という
効果がある。
【図面の簡単な説明】
【図1】第1の実施例のウェブサーバ仲介装置の構成例
【図2】第1の実施例のウェブサーバ仲介装置の動作フ
ロー図
【図3】第2の実施例( 複数検索エンジン仲介装置) の
構成例
【図4】第2の実施例( 複数検索エンジン仲介装置) の
動作フロー図
【図5】HTMLファイルのソース例およびコード系情
報テーブルc-tbl 構造例
【図6】文字コード識別動作フロー例
【図7】従来のウェブサーバ仲介装置の構成例
【符号の説明】
1 クライアント 2 ウェブサーバ仲介装置 3 ウェブサーバ 9 従来のウェブサーバ仲介装置 21 21A 91 アクセス中継部 22 92 タグ解析部 23 93 文字コード識別部 24 コード系情報蓄積手段 25 文字列/URL変換手段 211 URL 分配手段 212 初画面手段 213 HTML集約手段 221 921 明示識別手段 222 フォーム変換手段 223 コード系変換手段 231 931 非明示識別手段 232 932 結果返却手段 233 コード系検索手段 922 結果埋込出力手段 t タプル c-tbl コード系情報テーブル

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 コード系が既知である受信HTMLファ
    イルの送信元URLからホスト名を抽出し、該URLと
    該ホスト名と該コード系を含むタプルをコード系情報テ
    ーブルに蓄積するコード系情報蓄積手段と、 コード系が未知である受信HTMLファイルの送信元U
    RLからホスト名を抽出し、該ホスト名によって前記コ
    ード系情報テーブルを検索するコード系検索手段と、を
    有し、前記検索によってヒットしたタプルのコード系を
    当該HTMLファイルのコード系と認識する文字コード
    識別部を有することを特徴とするウェブサーバ仲介装
    置。
  2. 【請求項2】 クライアントからの要求によって複
    数の対話型ウェブサーバにアクセスし、当該クライアン
    トの入力を当該ウェブサーバに伝えてその結果画面を当
    該クライアントに示す対話型ウェブサーバ仲介ポータル
    サーバであって、 複数の対話型ウェブサーバの入力要求画面を一画面に集
    約してクライアントに送出する初画面手段と、 前記入力要求に対するクライアントの入力内容を前記複
    数の対話型ウェブサーバに分配して返却するURL 分配手
    段と、 前記返却した入力内容に応じて前記複数の対話型ウェブ
    サーバから受信する結果画面を一画面に編集してクライ
    アントに送出するHTML集約手段と、を有することを特徴
    とする対話型ウェブサーバ仲介ポータルサーバ。
  3. 【請求項3】 コード系が既知である受信HTMLフ
    ァイルの送信元URLからホスト名を抽出し、該URL
    と該ホスト名と該コード系を含むタプルをコード系情報
    テーブルに蓄積するコード系情報蓄積段階と、 コード系が未知である受信HTMLファイルの送信元U
    RLからホスト名を抽出し、該ホスト名によって前記コ
    ード系情報テーブルを検索するコード系検索段階と、 前記検索によってヒットしたタプルのコード系を当該H
    TMLファイルのコード系と認識する文字コード識別段
    階と、を有することを特徴とするウェブサーバ仲介方
    法。
JP2002001142A 2002-01-08 2002-01-08 ウェブサーバ仲介装置、方法および対話型ウェブサーバ仲介ポータルサーバ Pending JP2003203032A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002001142A JP2003203032A (ja) 2002-01-08 2002-01-08 ウェブサーバ仲介装置、方法および対話型ウェブサーバ仲介ポータルサーバ

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002001142A JP2003203032A (ja) 2002-01-08 2002-01-08 ウェブサーバ仲介装置、方法および対話型ウェブサーバ仲介ポータルサーバ

Publications (1)

Publication Number Publication Date
JP2003203032A true JP2003203032A (ja) 2003-07-18

Family

ID=27641343

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002001142A Pending JP2003203032A (ja) 2002-01-08 2002-01-08 ウェブサーバ仲介装置、方法および対話型ウェブサーバ仲介ポータルサーバ

Country Status (1)

Country Link
JP (1) JP2003203032A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006099279A (ja) * 2004-09-28 2006-04-13 Newswatch Inc 検索装置及び検索プログラム
JP2009539176A (ja) * 2006-05-31 2009-11-12 サイトリックス システムズ, インコーポレイテッド ゲートウェイでのリクエスト提出復号用文字セット符号化決定のためのシステムおよび方法
KR101451851B1 (ko) 2007-01-03 2014-10-23 삼성전자주식회사 웹서버 및 그 웹 서비스 방법

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006099279A (ja) * 2004-09-28 2006-04-13 Newswatch Inc 検索装置及び検索プログラム
US7752217B2 (en) 2004-09-28 2010-07-06 Newswatch, Inc. Search device
JP4516815B2 (ja) * 2004-09-28 2010-08-04 株式会社ニューズウォッチ 検索装置
JP2009539176A (ja) * 2006-05-31 2009-11-12 サイトリックス システムズ, インコーポレイテッド ゲートウェイでのリクエスト提出復号用文字セット符号化決定のためのシステムおよび方法
JP4862079B2 (ja) * 2006-05-31 2012-01-25 サイトリックス システムズ, インコーポレイテッド ゲートウェイでのリクエスト提出復号用文字セット符号化決定のためのシステムおよび方法
KR101451851B1 (ko) 2007-01-03 2014-10-23 삼성전자주식회사 웹서버 및 그 웹 서비스 방법

Similar Documents

Publication Publication Date Title
US7809710B2 (en) System and method for extracting content for submission to a search engine
US7536445B2 (en) Enabling a web-crawling robot to collect information from web sites that tailor information content to the capabilities of accessing devices
US7290061B2 (en) System and method for internet content collaboration
US6212522B1 (en) Searching and conditionally serving bookmark sets based on keywords
US7103714B1 (en) System and method for serving one set of cached data for differing data requests
US7519592B2 (en) Method, apparatus and computer program for key word searching
US8078977B2 (en) Method and system for intelligent processing of electronic information
US20030088639A1 (en) Method and an apparatus for transforming content from one markup to another markup language non-intrusively using a server load balancer and a reverse proxy transcoding engine
US20020107847A1 (en) Method and system for visual internet search engine
US20060112141A1 (en) System for automatically creating a metadata repository for multimedia
US20070288477A1 (en) Information processing apparatus, information processing system, information processing method, and computer program
US7376650B1 (en) Method and system for redirecting a request using redirection patterns
US6928429B2 (en) Simplifying browser search requests
US20050171950A1 (en) Managing application status information for a computer application
US20110022563A1 (en) Document display system, related document display method, and program
US8458146B2 (en) Accessing data remotely
JP2000285052A (ja) Url変換方法および装置
JP2006113745A (ja) インターネット広告システム
JP2003203032A (ja) ウェブサーバ仲介装置、方法および対話型ウェブサーバ仲介ポータルサーバ
US20050060291A1 (en) Method and apparatus for searching universal resource identifiers
US20070288549A1 (en) Information Processing System, Server Device, Client Device, and Program
JP2000172680A (ja) 文書登録システム、文書登録方法、その方法を実行させるための記録媒体、文書閲覧システム、文書閲覧方法、その方法を実行させるための記録媒体および文書取出しシステム
KR100765784B1 (ko) 엔티티 검색 방법 및 장치
JP2001084169A (ja) 文書データベースアクセス装置
US7689552B2 (en) UDDI metadata query development

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20040610

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20040610

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040825

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060905

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061102

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061128

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070129

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070313