JP2004164435A - 接続要求中継装置、フィルタリングシステム、方法、及びプログラム - Google Patents
接続要求中継装置、フィルタリングシステム、方法、及びプログラム Download PDFInfo
- Publication number
- JP2004164435A JP2004164435A JP2002331309A JP2002331309A JP2004164435A JP 2004164435 A JP2004164435 A JP 2004164435A JP 2002331309 A JP2002331309 A JP 2002331309A JP 2002331309 A JP2002331309 A JP 2002331309A JP 2004164435 A JP2004164435 A JP 2004164435A
- Authority
- JP
- Japan
- Prior art keywords
- relay
- keyword
- request
- client
- content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
【課題】中継要求先のコンテンツを事前に調査する必要なく、爆発的に増加するURLにも対応してフィルタリングを行うことができるようにする。
【解決手段】クライアント2からプロキシ動作部11が受け取ったURLをURL解析部15にて区切り記号を使用して検索対象文字列を抽出する。キーワード照合部13は、その検索対象文字列とキーワード記憶部12に記憶されているキーワードとを照合する。キーワードが含まれている場合、キーワード照合部13はプロキシ動作部11に中継拒否を指示する。含まれない場合、URLのコンテンツの取得を指示する。プロキシ動作部11が受け取ったHTMLデータをMETAデータ解析部17にて解析し、検索対象文字列を抽出する。キーワードが含まれている場合、キーワード照合部13はプロキシ動作部11に中継拒否を指示する。含まれない場合、プロキシ動作部11は、クライアント2にそのURLの内容を送信する。
【選択図】 図1
【解決手段】クライアント2からプロキシ動作部11が受け取ったURLをURL解析部15にて区切り記号を使用して検索対象文字列を抽出する。キーワード照合部13は、その検索対象文字列とキーワード記憶部12に記憶されているキーワードとを照合する。キーワードが含まれている場合、キーワード照合部13はプロキシ動作部11に中継拒否を指示する。含まれない場合、URLのコンテンツの取得を指示する。プロキシ動作部11が受け取ったHTMLデータをMETAデータ解析部17にて解析し、検索対象文字列を抽出する。キーワードが含まれている場合、キーワード照合部13はプロキシ動作部11に中継拒否を指示する。含まれない場合、プロキシ動作部11は、クライアント2にそのURLの内容を送信する。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
本発明は、管理者の設定に基づいて、クライアントから不適切なコンテンツへのアクセス(接続)を拒否する接続要求中継装置、フィルタリングシステム、方法、及びプログラムに関する。
【0002】
【従来の技術】
従来より、フィルタリングシステムは、事前に調査されたURLにおけるHTMLデータを格納したデータベースをプロキシサーバマシン(接続要求中継装置)の内部あるいは外部に設置し、プロキシサーバマシンは、そのデータベースを参照することによりクライアントからのアクセスを中継するか、中継拒否するかを判断している。
【0003】
また、特開2000−47927号公報(特許文献1)に開示されているURLフィルタリングシステムは、ネットワークを介して取得したHTMLデータ、画像データ、取得したURL、及びキャッシュデータファイル名を記憶しているキャッシュログ記憶手段と、キーワードを記憶しているキーワード記憶手段とを備え、処理開始の信号を受けると、キャッシュログ記憶手段に記憶されているキャッシュデータを読み出し、キーワード記憶手段に記憶されているキーワードと比較し、キーワードが含まれるURLを抽出するものである。
【0004】
【特許文献1】
特開2000−47927号公報
【0005】
【発明が解決しようとする課題】
しかしながら、事前に調査されたデータベースを使用する上述した従来のフィルタリングシステムでは、爆発的に増加するURLに対して事前の調査が追いつかないために有効なフィルタリングが行えなくなるという問題がある。
【0006】
また、上記した特許文献1のURLフィルタリングシステムは、ネットワークに負担をかけることなくURLを抽出できる好適なものであるが、キーワードとの比較を行うキャッシュデータを上記したキャッシュログ記憶手段に予め記憶させておく必要がある。すなわち、爆発的に増加するURLへの対応まで考慮されたものではない。
【0007】
本発明はこのような状況に鑑みてなされたものであり、中継要求先の内容(コンテンツ)を事前に調査する必要なく、爆発的に増加するURLにも対応してフィルタリングを行うことができる接続要求中継装置、フィルタリングシステム、方法、及びプログラムを提供することを目的とする。
【0008】
【課題を解決するための手段】
上記課題を解決するために、本発明は以下の特徴を備える。
請求項1記載の発明は、クライアントと、サーバに格納されたコンテンツとの接続をクライアントからの中継要求により中継する接続要求中継装置であって、キーワードを記憶するキーワード記憶手段と、クライアントから送信された中継要求データとコンテンツのコメント部分とに、キーワードが含まれるか否かを用いてクライアントからの中継を管理する中継管理手段と、を備えたことを特徴とする。
【0009】
請求項2記載の発明は、クライアントと、サーバに格納されたコンテンツとの接続をクライアントからの中継要求により中継する接続要求中継装置であって、キーワードを記憶するキーワード記憶手段と、クライアントから送信された中継要求データを解析し、キーワード記憶手段に記憶されたキーワードが該中継要求データに含まれるか否かによりコンテンツの取得を管理し、コンテンツを取得すると当該コンテンツのコメント部分にキーワードが含まれるか否かを用いてクライアントからの中継を管理する中継管理手段と、を備えたことを特徴とする。
【0010】
請求項3記載の発明は、上記した中継管理手段が、キーワード記憶手段に記憶されたキーワードが中継要求データに含まれる場合に中継要求を拒否し、含まれない場合にコンテンツを取得し、該コンテンツのコメント部分にキーワードが含まれる場合に中継要求を拒否し、含まれない場合にクライアントへの中継処理を行うことを特徴とする。
【0011】
請求項4記載の発明は、上記した中継管理手段が、キーワード記憶手段に記憶されたキーワードが中継要求データに含まれる場合に中継要求を拒否し、含まれない場合にコンテンツを取得し、該コンテンツのコメント部分にキーワードが含まれる場合に中継要求を拒否し、含まれない場合に該コンテンツにリンクが含まれるか否かを解析し、該解析によりリンクが含まれる場合、該リンク先のアドレス情報を解析し、該アドレス情報にキーワードが含まれる場合に中継要求を拒否し、含まれない場合にリンク先からリンク先コンテンツを取得し、該リンク先コンテンツのコメント部分にキーワードが含まれる場合に中継要求を拒否し、含まれない場合にクライアントへの中継処理を行うことを特徴とする。
【0012】
請求項5記載の発明は、上記した中継要求データが、コンテンツを格納したサーバに送信する情報と、該サーバのアドレス情報とを含み、上記した中継管理手段は、サーバに送信する情報及びアドレス情報を解析の対象とすることを特徴とする。
【0013】
請求項6記載の発明は、上記した中継管理手段が、サーバに送信する情報及びアドレス情報を解析するアドレス情報解析部と、サーバに送信する情報及びアドレス情報における所定の少なくとも一部を解析する部分アドレス情報解析部と、コンテンツにおけるコメント部分を解析するコメント部分解析部と、クライアントとコンテンツを格納したサーバとの中継処理を行う中継部と、アドレス情報解析部又は部分アドレス情報解析部又はコメント部分解析部での解析により抽出された検索対象とキーワードとを照合し、含まれる場合に中継拒否を、含まれない場合に中継許可を、中継部に通知するキーワード照合部と、を備え、中継部は、キーワード照合部からの通知に基づいて中継処理を行うことを特徴とする。
【0014】
請求項7記載の発明は、区切り記号を記憶する区切り記号記憶手段を備え、中継管理手段による解析は、区切り記号記憶手段に記憶された区切り記号により当該解析の対象を分解して行うことを特徴とする。
【0015】
請求項8記載の発明は、クライアントと、コンテンツを格納したサーバと、クライアントからコンテンツへの接続を当該クライアントからの中継要求により中継する接続要求中継装置とを備えてなるフィルタリングシステムであって、接続要求中継装置は、キーワードを記憶するキーワード記憶手段と、クライアントから送信された中継要求データとコンテンツのコメント部分とに、キーワードが含まれるか否かを用いてクライアントからの中継を管理する中継管理手段と、を備えたことを特徴とする。
【0016】
請求項9記載の発明は、クライアントと、コンテンツを格納したサーバと、クライアントからコンテンツへの接続を当該クライアントからの中継要求により中継する接続要求中継装置とを備えてなるフィルタリングシステムであって、接続要求中継装置は、キーワードを記憶するキーワード記憶手段と、クライアントから送信された中継要求データを解析し、キーワード記憶手段に記憶されたキーワードが該中継要求データに含まれるか否かによりコンテンツの取得を管理し、コンテンツを取得すると当該コンテンツのコメント部分にキーワードが含まれるか否かを用いてクライアントからの中継を管理する中継管理手段と、を具備したことを特徴とする。
【0017】
請求項10記載の発明は、上記した中継管理手段が、キーワード記憶手段に記憶されたキーワードが中継要求データに含まれる場合に中継要求を拒否し、含まれない場合にコンテンツを取得し、該コンテンツのコメント部分にキーワードが含まれる場合に中継要求を拒否し、含まれない場合にクライアントへの中継処理を行うことを特徴とする請求項8又は9記載のフィルタリングシステム。
【0018】
請求項11記載の発明は、上記した中継管理手段が、キーワード記憶手段に記憶されたキーワードが中継要求データに含まれる場合に中継要求を拒否し、含まれない場合にコンテンツを取得し、該コンテンツのコメント部分にキーワードが含まれる場合に中継要求を拒否し、含まれない場合に該コンテンツにリンクが含まれるか否かを解析し、該解析によりリンクが含まれる場合、該リンク先のアドレス情報を解析し、該アドレス情報にキーワードが含まれる場合に中継要求を拒否し、含まれない場合にリンク先からリンク先コンテンツを取得し、該リンク先コンテンツのコメント部分にキーワードが含まれる場合に中継要求を拒否し、含まれない場合にクライアントへの中継処理を行うことを特徴とする。
【0019】
請求項12記載の発明は、上記した中継要求データが、コンテンツを格納したサーバに送信する情報と、該サーバのアドレス情報とを含み、中継管理手段は、サーバに送信する情報及びアドレス情報を解析の対象とすることを特徴とする。
【0020】
請求項13記載の発明は、上記した中継管理手段が、サーバに送信する情報及びアドレス情報を解析するアドレス情報解析部と、サーバに送信する情報及びアドレス情報における所定の少なくとも一部を解析する部分アドレス情報解析部と、コンテンツにおけるコメント部分を解析するコメント部分解析部と、クライアントとコンテンツを格納したサーバとの中継処理を行う中継部と、アドレス情報解析部又は部分アドレス情報解析部又はコメント部分解析部での解析により抽出された検索対象とキーワードとを照合し、含まれる場合に中継拒否を、含まれない場合に中継許可を、中継部に通知するキーワード照合部と、を備え、中継部は、キーワード照合部からの通知に基づいて中継処理を行うことを特徴とする。
【0021】
請求項14記載の発明は、区切り記号を記憶する区切り記号記憶手段を備え、中継管理手段による解析は、区切り記号記憶手段に記憶された区切り記号により当該解析の対象を分解して行うことを特徴とする。
【0022】
請求項15記載の発明は、クライアントと、コンテンツを格納したサーバと、クライアントからコンテンツへの接続を当該クライアントからの中継要求により中継する接続要求中継装置とを備えてなるシステムにおけるフィルタリング方法であって、キーワードを記憶するキーワード記憶工程と、クライアントから送信された中継要求データを解析する要求解析工程と、キーワード記憶工程で記憶されたキーワードが要求解析工程で解析された中継要求データに含まれるか否かに基づいてコンテンツを取得する取得管理工程と、を備えたことを特徴とする。
【0023】
請求項16記載の発明は、上記の取得管理工程によりサーバからコンテンツが取得されると、該コンテンツにおけるコメント部分を解析するコメント部分解析工程と、コメント部分解析工程で解析されたコメント部分にキーワードが含まれるか否かに基づいてクライアントからの中継を管理する中継管理工程と、を備えたことを特徴とする。
【0024】
請求項17記載の発明は、上記した取得管理工程では、キーワード記憶工程で記憶されたキーワードが要求解析工程で解析された中継要求データに含まれる場合にクライアントからの中継要求を拒否し、含まれない場合に取得処理を行い、上記した中継管理工程では、キーワード記憶工程で記憶されたキーワードがコメント部分解析工程で解析されたコメント部分に含まれる場合にクライアントからの中継要求を拒否し、含まれない場合に中継処理を行うことを特徴とする。
【0025】
請求項18記載の発明は、上記した取得管理工程では、キーワード記憶工程で記憶されたキーワードが要求解析工程で解析された中継要求データに含まれる場合にクライアントからの中継要求を拒否し、含まれない場合に取得処理を行い、上記した中継管理工程では、キーワード記憶工程で記憶されたキーワードがコメント部分解析工程で解析されたコメント部分に含まれる場合にクライアントからの中継要求を拒否し、含まれない場合、中継要求データにリンクが含まれるか否かを解析し、該解析によりリンクが含まれる場合、該リンク先のアドレス情報を解析し、該アドレス情報にキーワードが含まれる場合にクライアントからの中継要求を拒否し、含まれない場合に中継処理を行うことを特徴とする。
【0026】
請求項19記載の発明は、上記した中継要求データが、コンテンツを格納したサーバに送信する情報と、該サーバのアドレス情報とを含み、上記の要求解析工程では、サーバに送信する情報及びアドレス情報を解析の対象とすることを特徴とする。
【0027】
請求項20記載の発明は、上記した要求解析工程では、中継要求データがアドレス情報を含む場合、該アドレス情報及びサーバに送信する情報を解析し、中継要求データがアドレス情報における所定の少なくとも一部を含む場合、該少なくとも一部及びサーバに送信する情報を解析することを特徴とする。
【0028】
請求項21記載の発明は、区切り記号を記憶する区切り記号記憶工程を備え、要求解析工程及びコメント部分解析工程での解析は、区切り記号記憶工程に記憶された区切り記号により当該解析の対象を分解して行うことを特徴とする。
【0029】
請求項22記載の発明は、クライアントと、コンテンツを格納したサーバと、クライアントからコンテンツへの接続を当該クライアントからの中継要求により中継する接続要求中継装置とを備えてなるシステムのフィルタリングプログラムであって、接続要求中継装置に、キーワードを記憶するキーワード記憶処理と、クライアントから送信された中継要求データを解析する要求解析処理と、キーワード記憶処理で記憶されたキーワードが要求解析処理で解析された中継要求データに含まれるか否かに基づいてコンテンツを取得する取得管理処理と、を実行させることを特徴とする。
【0030】
請求項23記載の発明は、接続要求中継装置に、上記の取得管理処理によりサーバからコンテンツが取得されると、該コンテンツにおけるコメント部分を解析するコメント部分解析処理と、コメント部分解析処理で解析されたコメント部分にキーワードが含まれるか否かに基づいてクライアントからの中継を管理する中継管理処理と、を実行させることを特徴とする。
【0031】
請求項24記載の発明は、上記した取得管理処理では、キーワード記憶処理で記憶されたキーワードが要求解析処理で解析された中継要求データに含まれる場合にクライアントからの中継要求を拒否し、含まれない場合に取得処理を行い、上記した中継管理処理では、キーワード記憶処理で記憶されたキーワードがコメント部分解析処理で解析されたコメント部分に含まれる場合にクライアントからの中継要求を拒否し、含まれない場合に中継処理を行うことを特徴とする。
【0032】
請求項25記載の発明は、上記した取得管理処理では、キーワード記憶処理で記憶されたキーワードが要求解析処理で解析された中継要求データに含まれる場合にクライアントからの中継要求を拒否し、含まれない場合に取得処理を行い、上記した中継管理処理では、キーワード記憶処理で記憶されたキーワードがコメント部分解析処理で解析されたコメント部分に含まれる場合にクライアントからの中継要求を拒否し、含まれない場合、中継要求データにリンクが含まれるか否かを解析し、該解析によりリンクが含まれる場合、該リンク先のアドレス情報を解析し、該アドレス情報にキーワードが含まれる場合にクライアントからの中継要求を拒否し、含まれない場合に中継処理を行うことを特徴とする。
【0033】
請求項26記載の発明は、上記の中継要求データが、コンテンツを格納したサーバに送信する情報と、該サーバのアドレス情報とを含み、上記した要求解析処理では、サーバに送信する情報及びアドレス情報を解析の対象とすることを特徴とする。
【0034】
請求項27記載の発明は、上記した要求解析処理では、中継要求データがアドレス情報を含む場合、該アドレス情報及びサーバに送信する情報を解析し、中継要求データがアドレス情報における所定の少なくとも一部を含む場合、該少なくとも一部及びサーバに送信する情報を解析することを特徴とする。
【0035】
請求項28記載の発明は、接続要求中継装置に、区切り記号を記憶する区切り記号記憶処理を実行させ、上記した要求解析処理及びコメント部分解析処理での解析は、区切り記号記憶処理に記憶された区切り記号により当該解析の対象を分解して行うことを特徴とする。
【0036】
【発明の実施の形態】
次に、本発明に係る接続要求中継装置、フィルタリングシステム、方法、及びプログラムを図面を用いて詳細に説明する。
本発明は、URL文字列、POSTデータ、及び取得したHTMLデータのMETAタグを検索対象文字列として使用することにより、URLの内容を事前に調査することなく、リアルタイムにフィルタリングを行えるフィルタリングシステムを提供するものである。
【0037】
本発明の第1の実施形態としてのフィルタリングシステムは、図1に示すように、プロキシサーバ(接続要求中継装置)1と、クライアント2と、外部ネットワーク3と、サーバ4とを備えてなり、クライアント2がプロキシサーバ1に接続され、プロキシサーバ1が外部ネットワーク3を介してサーバ4に接続されて構成される。
【0038】
プロキシサーバ1は、制御手段(CPUなど)と、格納手段(HDDなど)と、入力手段(キーボードやマウスなど)とを備え、格納手段に格納されたプログラムにより制御手段が処理を行うことにより、以下に述べる機能や動作を実現する。
また、サーバ4はコンテンツを格納している。以下の説明では、クライアント2からの中継要求が、このサーバ4に格納されたコンテンツに対して行われる場合の例について述べる。
【0039】
プロキシサーバ1は、クライアント2からのHTTPアクセスをサーバ4に中継するプロキシ動作部(中継部)11と、不適切キーワードを保存するキーワード記憶部12と、キーワード記憶部12に記憶されているキーワードと検索対象文字列の照合を行うキーワード照合部13と、区切り記号を保存する区切り記号記憶部14と、URLを区切り記号で解析し検索対象文字列を抽出するURL解析部(アドレス情報解析部)15と、HTTP POSTデータから区切り記号で解析し検索対象文字列を抽出するPOSTデータ解析部(部分アドレス情報解析部)16と、サーバから取得したHTMLデータのMETAデータ部分(コンテンツのコメント部分)から検索対象文字列を抽出するMETAデータ解析部(コメント部分解析部)17と、を備えてなる。
【0040】
プロキシ動作部11は、クライアント2からのHTTPアクセスをサーバ4へ中継し、その結果(コンテンツ)をサーバ4からクライアント2へ中継する。中継の際にキーワード照合部13におけるキーワード照合結果によって中継するか中継拒否するかを判断する。
すなわち、プロキシ動作部11は、キーワード照合部13から中継許可の通知を受けると、コンテンツを取得(取得処理)、又は、中継要求先であるコンテンツをクライアント2に送信(中継処理)する。また、中継拒否の通知を受けると、クライアント2からの中継要求を拒否し、その旨をクライアント2に通知する。
【0041】
キーワード記憶部12は、完全一致キーワード記憶部と、部分一致キーワード記憶部を含む。完全一致キーワード記憶部は、検索対象文字列と完全に一致するかを判断するために使用するキーワードを記憶している。部分一致キーワード記憶部は、検索対象文字列に部分的に一致するかを判断するために使用するキーワードを記憶している。
このキーワードは、クライアント2からの接続要求を中継するのに不適切なコンテンツを判別するためのものであり、システムの管理者が、例えばプロキシサーバ1の入力手段(キーボードやマウスなど)により、上記キーワード記憶部12に記憶させたものである。
【0042】
キーワード照合部13は、完全一致キーワード記憶部に記憶されているキーワードと検索対象文字列が一致するかを検索し、その検索結果をプロキシ動作部11に通知する。また、部分一致キーワード記憶部に記憶されているキーワードと検索対象文字列が部分的に一致するかを検索し、その検索結果をプロキシ動作部11に通知する。
上記の検索結果としては、キーワードが検索対象文字列と完全一致又は部分一致した場合、すなわち、検索対象文字列にキーワードが含まれる場合、中継拒否の旨がプロキシ動作部11に通知され、検索対象文字列にキーワードが含まれない場合、中継許可の旨がプロキシ動作部11に通知される。
【0043】
区切り記号記憶部14は、URLにおいてホスト名、ディレクトリ名、パラメータなどの文字列間を結合する「区切り記号」に使用する、特別な記号を予め記憶している。区切り記号の例としては、“.”、“/”、“?”、“&”、“#”、“;”などがある。また、管理者の設定によって、上記の記号に限定されず、文字などを「区切り記号」として用いてもよく、使用する記号を限定してもよい。
【0044】
URL解析部15は、プロキシ動作部11がクライアント2から要求されたHTTPアクセスのURL(アドレス情報)とサーバ4に送信するデータとを解析し、区切り記号記憶部14に記憶されている区切り記号を使用して検索対象文字列を抽出する。
すなわち、クライアント2からの中継要求データが、サーバ4のアドレス情報とそのサーバ4に送信するデータとを有する場合、そのサーバ4のアドレス情報とそのサーバ4に送信するデータとを解析し、検索対象文字列を抽出する。
【0045】
POSTデータ解析部16は、HTTPアクセスのオブジェクトボディに含まれる“キー=値”を解析し、“値”の部分を検索対象文字列として抽出する。
すなわち、クライアント2からの中継要求データがPOSTデータとサーバ4に送信するデータとを有する場合に、そのPOSTデータと中継要求先に送信するデータとを解析し、区切り記号記憶部14に記憶されている区切り記号を使用して検索対象文字列を抽出する。
【0046】
METAデータ解析部17は、サーバ4からのHTMLデータ(コンテンツ)を解析し、HTMLデータに含まれるMETAタグよりMETAデータを検索対象文字列として抽出する。
【0047】
上述のように、プロキシサーバ1では、URL解析部15、POSTデータ解析部16、又はMETAデータ解析部17が解析を行い、その解析結果によりキーワード照合部13がキーワードとの照合を行い、解析結果(検索対象文字列)にキーワードが含まれる場合に中継拒否を、含まれない場合に中継許可を、プロキシ動作部11に通知し、プロキシ動作部11が中継許可の通知を受けた場合のみクライアント2からの中継要求先であるコンテンツをそのクライアント2に送信することにより、上記したURL解析部15と、POSTデータ解析部16と、METAデータ解析部17と、キーワード照合部13と、プロキシ動作部11とが、中継管理手段として機能する。
【0048】
次に、本発明に係るフィルタリングシステムの動作の概要について、図1、図2を参照して説明する。
【0049】
図1において、キーワード記憶部12は、システムの管理者により設定されたキーワード(不適切キーワード)を記憶している。
クライアント2からプロキシ動作部11が受け取ったURLをURL解析部15にて区切り記号、例えば、“/”を使用して検索対象文字列を抽出する。また、プロキシ動作部11が受け取った中継要求データがHTTP POSTデータの場合、POSTデータ解析部16にてPOSTデータを抽出する(ステップS1)。
こうしてURL解析部15、又はPOSTデータ解析部16にて抽出された検索対象文字列とキーワード記憶部12に記憶されているキーワードとを、キーワード照合部13が照合を行う(ステップS3)。検索対象文字列とキーワードが一致、もしくは部分文字列としてキーワードを含んでいる場合(ステップS3;Yes)、キーワード照合部13はプロキシ動作部11に中継拒否を指示する(ステップS4)。キーワードが不一致、かつ部分文字列としても含んでいない場合(ステップS3;No)、キーワード照合部13はプロキシ動作部11にURLの内容(コンテンツ)の取得を指示する(ステップS5)。
【0050】
取得されたURLの内容がHTMLデータの場合、プロキシ動作部11が受け取ったHTMLデータをMETAデータ解析部17にて解析し、検索対象文字列を抽出する(ステップS6)。METAデータ解析部17にて抽出された検索対象文字列とキーワード記憶部12に記憶されているキーワードとを、キーワード照合部13が照合を行う(ステップS7)。検索対象文字列とキーワードが一致、もしくは部分文字列としてキーワードを含んでいる場合(ステップS7;Yes)、キーワード照合部13はプロキシ動作部11に中継拒否を指示する(ステップS4)。キーワードが不一致、かつ部分文字列としても含んでいない場合(ステップS7;No)、プロキシ動作部11にURLの内容を送る(ステップS8)。
こうしてプロキシ動作部11にURLの内容が送信されることにより、プロキシ動作部11は、クライアント2にそのURLの内容を送信する。
【0051】
上述した動作で、ステップS5とS6とは、中継管理手段がクライアント2からの中継要求に応じてコンテンツを送信する中継管理工程となる。
また、ステップS7とS8とは、中継管理手段がクライアント2からの中継要求に応じてコンテンツを送信する中継管理工程となる。
上述した一連の動作により、URLの内容を事前に調査したデータが存在しない場合においても有効にフィルタリングを行うことが可能となる。
【0052】
次に、図1、図2を参照して本発明の実施形態としてのフィルタリングシステムの動作について詳細に説明する。
【0053】
まず、クライアント2からのHTTPアクセスが、プロキシサーバ1のプロキシ動作部11に送信される(ステップS1)。このHTTPアクセスを受け取ったプロキシ動作部11は、HTTPアクセスのURLをURL解析部15へ供給する。
URL解析部15は、HTTPアクセスのURLを解析し、区切り記号記憶部14に記憶している区切り記号を使用して“キー=値”に分解し、“値”の部分を検索対象文字列として抽出する。HTTPアクセスにPOSTデータが含まれている場合は、HTTPアクセスのオブジェクトボディをPOSTデータ解析部16に供給する。POSTデータ解析部16は、HTTPアクセスのオブジェクトボディに含まれる“キー=値”を解析し、“値”の部分を検索対象文字列として抽出する(ステップS2)。
【0054】
こうしてURL解析部15、及び/又はPOSTデータ解析部16にて抽出された検索対象文字列は、キーワード照合部13に供給される。キーワード照合部13は、キーワード記憶部12の完全一致キーワード記憶部に記憶されているキーワードと検索対象文字列が一致するかどうかを検索する。さらに、キーワード記憶部12の部分一致キーワード記憶部に記憶されているキーワードが検索対象文字列と部分的に一致するかどうかを検索する(ステップS3)。
完全一致キーワードに一致するか、部分一致キーワードに部分的に一致するかした場合(ステップS3;Yes)、キーワード照合部13は、プロキシ動作部11に中継拒否を通知する。中継拒否を通知されたプロキシ動作部11は、HTTPアクセスの中継を拒否した画面をクライアント2に送信する(ステップS4)。
キーワード照合部13にて、URL解析部15、及び/又はPOSTデータ解析部16にて抽出された検索対象文字列が完全一致キーワードに一致せず、かつ部分一致キーワードにも部分的に一致しない場合(ステップS3;No)、キーワード照合部13は、プロキシ動作部11にサーバ4からのHTMLデータ取得要求を行う(ステップS5)。
【0055】
サーバ4から取得されたHTMLデータ(コンテンツ)は、プロキシ動作部11を通して、METAデータ解析部17に供給される。METAデータ解析部17は、供給されたHTMLデータを解析し、HTMLデータに含まれるMETAタグのCONTENT属性を“,”で分解し、分解した文字列であるMETAデータを検索対象文字列として抽出する(ステップS6)。
【0056】
METAデータ解析部17にて抽出された検索対象文字列は、キーワード照合部13に供給される。キーワード照合部13は、キーワード記憶部12の完全一致キーワード記憶部12に記憶されているキーワードと検索対象文字列が一致するかどうかを検索する。さらに、キーワード記憶部12の部分一致キーワード記憶部12に記憶されているキーワードが検索対象文字列と部分的に一致するかどうかを検索する(ステップS7)。
完全一致キーワードに一致するか、部分一致キーワードに部分的に一致するかのどちらかの場合(ステップS7;Yes)、キーワード照合部13はプロキシ動作部11に中継拒否を通知する。中継拒否を通知されたプロキシ動作部11は、HTTPアクセスの中継を拒否した画面をクライアント2に送信する(ステップS4)。
キーワード照合部13での照合にて、METAデータ解析部17にて抽出された検索対象文字列が完全一致キーワードに一致せず、かつ部分一致キーワードにも部分的に一致しない場合(ステップS7;No)、キーワード照合部13はプロキシ動作部11にHTTPアクセスの中継を許可し、クライアント2にサーバ4から取得したHTMLデータを送信する(ステップS8)。
こうしてプロキシ動作部11にURLの内容(コンテンツ)が送信されることにより、プロキシ動作部11は、クライアント2にそのコンテンツを送信する。
【0057】
次に、具体例を用いて、本実施形態としてのフィルタリングシステムの動作を説明する。
図3は、クライアント2からのHTTPアクセスのURLをURL解析部15にて解析した結果を例示する図であり、図4は、POSTデータをPOSTデータ解析部16にて解析した結果を例示する図である。
【0058】
クライアント2からの中継要求に応じて、プロキシサーバ1は、URL、及びPOSTデータを、“/”、“:”、“?”、“&”などの区切り記号記憶部14に登録している区切り記号にて解析し、解析結果の検索対象文字列をキーワード照合部にて完全一致、及び部分一致するかどうかを検索する。
【0059】
例えば、図3に示す例で、検索対象文字列が“WWW2”の場合、照合するキーワードが“WWW2”の場合、完全一致と部分一致のどちらにおいても検索される。すなわち、キーワード照合部13は、完全一致と部分一致のどちらにおいてもキーワードが含まれていると判断する。
ここで、キーワードが“WWW”の場合、完全一致では検索されないが、部分一致では検索されることになる。すなわち、キーワード照合部13は、部分一致の照合によりキーワードが含まれていると判断する。
【0060】
図5は、サーバ4から取得したHTMLデータ(コンテンツ)の例であり、METAデータ解析部17で、“<META name=keywords”の行を解析する。解析の結果、content属性から抽出される検索対象文字列は、“meta”、“ng”、“ng_keyword”となる。キーワード照合部13における検索方法は、上述したURL解析、及びPOSTデータ解析の場合と同じである。
【0061】
また、管理者が、キーワード記憶部12に不適切キーワードとして、例えば“adult”、“nude”といったキーワードを登録しておくと、アダルト系のサイトへのアクセスを中継拒否することができる。また、この例の場合には、“アダルト系のサイトへのアクセスのため、アクセスできません”といったメッセージをクライアント2の表示手段に表示させてもよい。
【0062】
次に、本発明の第2の実施形態について、図面を参照して詳細に説明する。
この第2の実施形態は、図6を参照すると、プロキシ動作部11がサーバ4から取得したHTMLドキュメント(コンテンツ)を中継するか否かを、取得したHTMLドキュメントをHTMLデータ解析部51にて解析を行って抽出されたURLリンクに対してURL解析を行い、またURLリンクにHTTPアクセスした結果のHTMLデータに対してMETAデータ解析を行うことで、サーバ4から取得したHTMLドキュメントの中継を行うかどうかを判断する点が、上述した第1の実施形態と異なる。
HTMLデータ解析部51は、サーバ4から取得したHTMLドキュメントを解析を行い、記述されているURLリンクを抽出する。
また、この図6では、上述した第1の実施形態と共通するものについては同じ符号とし、説明を省略する。
【0063】
この第2の実施形態としてのフィルタリングシステムの動作を、図6から図8を参照して詳細に説明する。
図6において、クライアント2からのHTTPアクセスのURL、及びPOSTデータを解析してHTTPアクセスを中継するか中継拒否するかの判断は、上述した第1の実施形態での動作と同一のため省略する(ステップS11からS17)。
第1の実施形態ではサーバ4から取得したHTMLドキュメントのMETAタグ部分のみを解析していたが、本実施形態では、HTMLドキュメントにURLリンクが記述されているかをHTMLデータ解析部51にて解析し(ステップS18)、図8に示すとおり、Aタグのhref属性に記述されているURLを抽出する(ステップS19)。
抽出されたURLをURL解析部15にて解析し(ステップS20)、解析結果の検索対象文字列とキーワード記憶部12に記憶されているキーワードとをキーワード照合部13で上述のように検索し(ステップS21)、検索した結果によってリンク元のHTMLデータを中継するかどうかを判断する。すなわち、キーワード記憶部12に記憶されているキーワードがリンク先のURLに含まれている場合(ステップS21;Yes)、プロキシ動作部11はクライアント2からの中継要求を拒否し(ステップS14)、含まれていない場合(ステップS21;No)、プロキシ動作部11はHTMLデータから抽出されたURLにHTTPアクセスを行ってリンク先のHTMLデータ(リンク先コンテンツ)を取得する(ステップS22)。
【0064】
こうして、プロキシ動作部11は、リンク先のHTMLデータを取得し、リンク先のHTMLドキュメントに対してMETAデータ解析部17にて解析を行い(ステップS23)、解析結果の検索対象文字列とキーワード記憶部12に記憶されているキーワードとをキーワード照合部13が上述のように検索する(ステップS24)。
検索した結果によって、キーワード照合部13は、リンク元のHTMLデータを中継するかどうかを判断する。すなわち、キーワード記憶部12に記憶されているキーワードがリンク先のHTMLデータにおけるMETAタグデータ部に含まれている場合(ステップS24;Yes)、プロキシ動作部11はクライアント2からの中継要求を拒否し(ステップS14)、含まれていない場合(ステップS24;No)、キーワード照合部13は、リンク元である中継要求先のHTMLデータをプロキシ動作部11に送信する(ステップS25)。
こうしてプロキシ動作部11にクライアント2からの中継要求先であるURLの内容(コンテンツ)が送信されることにより、プロキシ動作部11は、クライアント2にそのコンテンツを送信する。
【0065】
上述した各実施形態としてのフィルタリングシステムによれば、事前の調査が行われていないURLのコンテンツに対しても、リアルタイムにフィルタリングを行うことができる。
すなわち、プロキシサーバは、クライアント2から中継要求データを受信すると、その中継要求データや取得したコンテンツのMETAデータ部分を解析して検索対象を抽出するため、事前に調査が行われていないコンテンツについても、リアルタイムに有効なフィルタリングを行うことができる。このため、爆発的に増加するURLにも対応していくことができる。
【0066】
また、従来のURLフィルタリングシステムは、サーバから取得したHTMLデータの文章を全文解析して抽出された検索対象文字列と、不適切キーワードとを照合する形態であり、HTMLのデータを全て解析対象とするため、リアルタイム性が損なわれる可能性があり、プロキシサーバマシンに不必要な負荷をかけるという問題があった。
上述した各実施形態としてのフィルタリングシステムによれば、上述のようにリアルタイムにフィルタリングする際に、サーバから取得したHTMLデータを全文解析した結果ではなく、METAデータ部分を利用してフィルタリングを行うため、プロキシサーバマシンに負荷をかけることなく、リアルタイム性を重視したフィルタリングを行うことが可能となる。
【0067】
なお、上述した各実施形態は、本発明の好適な実施形態であり、本発明の主旨を逸脱しない範囲内において、種々変形して実施することが可能である。
例えば、上述したPOSTデータは、HTTPプロトコルの例であり、その他のGET、PUTなどのメソッドによるものであってもよい。
また、HTMLデータを対象としているのは一例であり、その他のコンテンツデータが中継要求先であってもよい。すなわち、コンテンツのデータ形式は、HTMLデータに限定されない。
【0068】
また、プロトコルとしてHTTPプロトコルを対象としているのは一例であり、クライアント−サーバ間で使用可能なプロトコルであればどのようなプロトコルがシステムで用いられていてもよい。
また、上述した各実施形態では、コンテンツを格納したサーバ4を特定するアドレス情報をURLとして説明しているが、そのシステムにおけるプロトコルでのアドレス情報であればこのものに限定されない。
【0069】
また、事前に調査したコンテンツを、プロキシサーバ内又はプロキシサーバからアクセス可能な格納手段に格納し、クライアントからの中継要求先が格納されている場合、その格納されたコンテンツの全部又は一部を解析の対象として含める実施例としてもよい。
この実施例によれば、事前の調査を検索対象としてさらに加えることにより、より確実なフィルタリングを行うことができる。
【0070】
【発明の効果】
以上のように、本発明では、接続要求中継装置が、クライアントから送信された中継要求データとコンテンツのコメント部分とに、記憶されたキーワードが含まれるか否かを用いてクライアントからの中継を管理する。
このことにより、事前に調査が行われていないコンテンツに対しても、有効なフィルタリングを行うことができる。このため、爆発的に増加するコンテンツにも対応して有効なフィルタリングを行うことができる。
【0071】
また、接続要求中継装置が、クライアントから送信された中継要求データと、コンテンツのコメント部分と、リンク先のアドレス情報と、リンク先コンテンツのコメント部分とに、記憶されたキーワードが含まれるか否かを用いてクライアントからの中継を管理する。
このことにより、事前に調査が行われていないコンテンツに対しても、有効なフィルタリングを行うことができる。このため、爆発的に増加するコンテンツにも対応して有効なフィルタリングを行うことができる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態としてのフィルタリングシステムの構成の概要を例示するブロック図である。
【図2】本発明の第1の実施形態としてのフィルタリングシステムの動作の概要を例示するフローチャートである。
【図3】URLをURL解析部にて解析した結果を例示する図である。
【図4】POSTデータをPOSTデータ解析部16にて解析した結果を例示する図である。
【図5】サーバから取得したHTMLデータ(コンテンツ)を例示する図である。
【図6】本発明の第2の実施形態としてのフィルタリングシステムの構成の概要を例示するブロック図である。
【図7】本発明の第2の実施形態としてのフィルタリングシステムの動作の概要を例示するフローチャートである。
【図8】サーバから取得したリンクを含むHTMLデータ(コンテンツ)を例示する図である。
【符号の説明】
1 プロキシサーバ(接続要求中継装置)
11 プロキシ動作部(中継部)
12 キーワード記憶部
13 キーワード照合部
14 区切り記号記憶部
15 URL解析部(アドレス情報解析部)
16 POSTデータ解析部(部分アドレス情報解析部)
17 METAデータ解析部(コメント部分解析部)
2 クライアント
3 外部ネットワーク
4 サーバ(コンテンツを格納したサーバ)
【発明の属する技術分野】
本発明は、管理者の設定に基づいて、クライアントから不適切なコンテンツへのアクセス(接続)を拒否する接続要求中継装置、フィルタリングシステム、方法、及びプログラムに関する。
【0002】
【従来の技術】
従来より、フィルタリングシステムは、事前に調査されたURLにおけるHTMLデータを格納したデータベースをプロキシサーバマシン(接続要求中継装置)の内部あるいは外部に設置し、プロキシサーバマシンは、そのデータベースを参照することによりクライアントからのアクセスを中継するか、中継拒否するかを判断している。
【0003】
また、特開2000−47927号公報(特許文献1)に開示されているURLフィルタリングシステムは、ネットワークを介して取得したHTMLデータ、画像データ、取得したURL、及びキャッシュデータファイル名を記憶しているキャッシュログ記憶手段と、キーワードを記憶しているキーワード記憶手段とを備え、処理開始の信号を受けると、キャッシュログ記憶手段に記憶されているキャッシュデータを読み出し、キーワード記憶手段に記憶されているキーワードと比較し、キーワードが含まれるURLを抽出するものである。
【0004】
【特許文献1】
特開2000−47927号公報
【0005】
【発明が解決しようとする課題】
しかしながら、事前に調査されたデータベースを使用する上述した従来のフィルタリングシステムでは、爆発的に増加するURLに対して事前の調査が追いつかないために有効なフィルタリングが行えなくなるという問題がある。
【0006】
また、上記した特許文献1のURLフィルタリングシステムは、ネットワークに負担をかけることなくURLを抽出できる好適なものであるが、キーワードとの比較を行うキャッシュデータを上記したキャッシュログ記憶手段に予め記憶させておく必要がある。すなわち、爆発的に増加するURLへの対応まで考慮されたものではない。
【0007】
本発明はこのような状況に鑑みてなされたものであり、中継要求先の内容(コンテンツ)を事前に調査する必要なく、爆発的に増加するURLにも対応してフィルタリングを行うことができる接続要求中継装置、フィルタリングシステム、方法、及びプログラムを提供することを目的とする。
【0008】
【課題を解決するための手段】
上記課題を解決するために、本発明は以下の特徴を備える。
請求項1記載の発明は、クライアントと、サーバに格納されたコンテンツとの接続をクライアントからの中継要求により中継する接続要求中継装置であって、キーワードを記憶するキーワード記憶手段と、クライアントから送信された中継要求データとコンテンツのコメント部分とに、キーワードが含まれるか否かを用いてクライアントからの中継を管理する中継管理手段と、を備えたことを特徴とする。
【0009】
請求項2記載の発明は、クライアントと、サーバに格納されたコンテンツとの接続をクライアントからの中継要求により中継する接続要求中継装置であって、キーワードを記憶するキーワード記憶手段と、クライアントから送信された中継要求データを解析し、キーワード記憶手段に記憶されたキーワードが該中継要求データに含まれるか否かによりコンテンツの取得を管理し、コンテンツを取得すると当該コンテンツのコメント部分にキーワードが含まれるか否かを用いてクライアントからの中継を管理する中継管理手段と、を備えたことを特徴とする。
【0010】
請求項3記載の発明は、上記した中継管理手段が、キーワード記憶手段に記憶されたキーワードが中継要求データに含まれる場合に中継要求を拒否し、含まれない場合にコンテンツを取得し、該コンテンツのコメント部分にキーワードが含まれる場合に中継要求を拒否し、含まれない場合にクライアントへの中継処理を行うことを特徴とする。
【0011】
請求項4記載の発明は、上記した中継管理手段が、キーワード記憶手段に記憶されたキーワードが中継要求データに含まれる場合に中継要求を拒否し、含まれない場合にコンテンツを取得し、該コンテンツのコメント部分にキーワードが含まれる場合に中継要求を拒否し、含まれない場合に該コンテンツにリンクが含まれるか否かを解析し、該解析によりリンクが含まれる場合、該リンク先のアドレス情報を解析し、該アドレス情報にキーワードが含まれる場合に中継要求を拒否し、含まれない場合にリンク先からリンク先コンテンツを取得し、該リンク先コンテンツのコメント部分にキーワードが含まれる場合に中継要求を拒否し、含まれない場合にクライアントへの中継処理を行うことを特徴とする。
【0012】
請求項5記載の発明は、上記した中継要求データが、コンテンツを格納したサーバに送信する情報と、該サーバのアドレス情報とを含み、上記した中継管理手段は、サーバに送信する情報及びアドレス情報を解析の対象とすることを特徴とする。
【0013】
請求項6記載の発明は、上記した中継管理手段が、サーバに送信する情報及びアドレス情報を解析するアドレス情報解析部と、サーバに送信する情報及びアドレス情報における所定の少なくとも一部を解析する部分アドレス情報解析部と、コンテンツにおけるコメント部分を解析するコメント部分解析部と、クライアントとコンテンツを格納したサーバとの中継処理を行う中継部と、アドレス情報解析部又は部分アドレス情報解析部又はコメント部分解析部での解析により抽出された検索対象とキーワードとを照合し、含まれる場合に中継拒否を、含まれない場合に中継許可を、中継部に通知するキーワード照合部と、を備え、中継部は、キーワード照合部からの通知に基づいて中継処理を行うことを特徴とする。
【0014】
請求項7記載の発明は、区切り記号を記憶する区切り記号記憶手段を備え、中継管理手段による解析は、区切り記号記憶手段に記憶された区切り記号により当該解析の対象を分解して行うことを特徴とする。
【0015】
請求項8記載の発明は、クライアントと、コンテンツを格納したサーバと、クライアントからコンテンツへの接続を当該クライアントからの中継要求により中継する接続要求中継装置とを備えてなるフィルタリングシステムであって、接続要求中継装置は、キーワードを記憶するキーワード記憶手段と、クライアントから送信された中継要求データとコンテンツのコメント部分とに、キーワードが含まれるか否かを用いてクライアントからの中継を管理する中継管理手段と、を備えたことを特徴とする。
【0016】
請求項9記載の発明は、クライアントと、コンテンツを格納したサーバと、クライアントからコンテンツへの接続を当該クライアントからの中継要求により中継する接続要求中継装置とを備えてなるフィルタリングシステムであって、接続要求中継装置は、キーワードを記憶するキーワード記憶手段と、クライアントから送信された中継要求データを解析し、キーワード記憶手段に記憶されたキーワードが該中継要求データに含まれるか否かによりコンテンツの取得を管理し、コンテンツを取得すると当該コンテンツのコメント部分にキーワードが含まれるか否かを用いてクライアントからの中継を管理する中継管理手段と、を具備したことを特徴とする。
【0017】
請求項10記載の発明は、上記した中継管理手段が、キーワード記憶手段に記憶されたキーワードが中継要求データに含まれる場合に中継要求を拒否し、含まれない場合にコンテンツを取得し、該コンテンツのコメント部分にキーワードが含まれる場合に中継要求を拒否し、含まれない場合にクライアントへの中継処理を行うことを特徴とする請求項8又は9記載のフィルタリングシステム。
【0018】
請求項11記載の発明は、上記した中継管理手段が、キーワード記憶手段に記憶されたキーワードが中継要求データに含まれる場合に中継要求を拒否し、含まれない場合にコンテンツを取得し、該コンテンツのコメント部分にキーワードが含まれる場合に中継要求を拒否し、含まれない場合に該コンテンツにリンクが含まれるか否かを解析し、該解析によりリンクが含まれる場合、該リンク先のアドレス情報を解析し、該アドレス情報にキーワードが含まれる場合に中継要求を拒否し、含まれない場合にリンク先からリンク先コンテンツを取得し、該リンク先コンテンツのコメント部分にキーワードが含まれる場合に中継要求を拒否し、含まれない場合にクライアントへの中継処理を行うことを特徴とする。
【0019】
請求項12記載の発明は、上記した中継要求データが、コンテンツを格納したサーバに送信する情報と、該サーバのアドレス情報とを含み、中継管理手段は、サーバに送信する情報及びアドレス情報を解析の対象とすることを特徴とする。
【0020】
請求項13記載の発明は、上記した中継管理手段が、サーバに送信する情報及びアドレス情報を解析するアドレス情報解析部と、サーバに送信する情報及びアドレス情報における所定の少なくとも一部を解析する部分アドレス情報解析部と、コンテンツにおけるコメント部分を解析するコメント部分解析部と、クライアントとコンテンツを格納したサーバとの中継処理を行う中継部と、アドレス情報解析部又は部分アドレス情報解析部又はコメント部分解析部での解析により抽出された検索対象とキーワードとを照合し、含まれる場合に中継拒否を、含まれない場合に中継許可を、中継部に通知するキーワード照合部と、を備え、中継部は、キーワード照合部からの通知に基づいて中継処理を行うことを特徴とする。
【0021】
請求項14記載の発明は、区切り記号を記憶する区切り記号記憶手段を備え、中継管理手段による解析は、区切り記号記憶手段に記憶された区切り記号により当該解析の対象を分解して行うことを特徴とする。
【0022】
請求項15記載の発明は、クライアントと、コンテンツを格納したサーバと、クライアントからコンテンツへの接続を当該クライアントからの中継要求により中継する接続要求中継装置とを備えてなるシステムにおけるフィルタリング方法であって、キーワードを記憶するキーワード記憶工程と、クライアントから送信された中継要求データを解析する要求解析工程と、キーワード記憶工程で記憶されたキーワードが要求解析工程で解析された中継要求データに含まれるか否かに基づいてコンテンツを取得する取得管理工程と、を備えたことを特徴とする。
【0023】
請求項16記載の発明は、上記の取得管理工程によりサーバからコンテンツが取得されると、該コンテンツにおけるコメント部分を解析するコメント部分解析工程と、コメント部分解析工程で解析されたコメント部分にキーワードが含まれるか否かに基づいてクライアントからの中継を管理する中継管理工程と、を備えたことを特徴とする。
【0024】
請求項17記載の発明は、上記した取得管理工程では、キーワード記憶工程で記憶されたキーワードが要求解析工程で解析された中継要求データに含まれる場合にクライアントからの中継要求を拒否し、含まれない場合に取得処理を行い、上記した中継管理工程では、キーワード記憶工程で記憶されたキーワードがコメント部分解析工程で解析されたコメント部分に含まれる場合にクライアントからの中継要求を拒否し、含まれない場合に中継処理を行うことを特徴とする。
【0025】
請求項18記載の発明は、上記した取得管理工程では、キーワード記憶工程で記憶されたキーワードが要求解析工程で解析された中継要求データに含まれる場合にクライアントからの中継要求を拒否し、含まれない場合に取得処理を行い、上記した中継管理工程では、キーワード記憶工程で記憶されたキーワードがコメント部分解析工程で解析されたコメント部分に含まれる場合にクライアントからの中継要求を拒否し、含まれない場合、中継要求データにリンクが含まれるか否かを解析し、該解析によりリンクが含まれる場合、該リンク先のアドレス情報を解析し、該アドレス情報にキーワードが含まれる場合にクライアントからの中継要求を拒否し、含まれない場合に中継処理を行うことを特徴とする。
【0026】
請求項19記載の発明は、上記した中継要求データが、コンテンツを格納したサーバに送信する情報と、該サーバのアドレス情報とを含み、上記の要求解析工程では、サーバに送信する情報及びアドレス情報を解析の対象とすることを特徴とする。
【0027】
請求項20記載の発明は、上記した要求解析工程では、中継要求データがアドレス情報を含む場合、該アドレス情報及びサーバに送信する情報を解析し、中継要求データがアドレス情報における所定の少なくとも一部を含む場合、該少なくとも一部及びサーバに送信する情報を解析することを特徴とする。
【0028】
請求項21記載の発明は、区切り記号を記憶する区切り記号記憶工程を備え、要求解析工程及びコメント部分解析工程での解析は、区切り記号記憶工程に記憶された区切り記号により当該解析の対象を分解して行うことを特徴とする。
【0029】
請求項22記載の発明は、クライアントと、コンテンツを格納したサーバと、クライアントからコンテンツへの接続を当該クライアントからの中継要求により中継する接続要求中継装置とを備えてなるシステムのフィルタリングプログラムであって、接続要求中継装置に、キーワードを記憶するキーワード記憶処理と、クライアントから送信された中継要求データを解析する要求解析処理と、キーワード記憶処理で記憶されたキーワードが要求解析処理で解析された中継要求データに含まれるか否かに基づいてコンテンツを取得する取得管理処理と、を実行させることを特徴とする。
【0030】
請求項23記載の発明は、接続要求中継装置に、上記の取得管理処理によりサーバからコンテンツが取得されると、該コンテンツにおけるコメント部分を解析するコメント部分解析処理と、コメント部分解析処理で解析されたコメント部分にキーワードが含まれるか否かに基づいてクライアントからの中継を管理する中継管理処理と、を実行させることを特徴とする。
【0031】
請求項24記載の発明は、上記した取得管理処理では、キーワード記憶処理で記憶されたキーワードが要求解析処理で解析された中継要求データに含まれる場合にクライアントからの中継要求を拒否し、含まれない場合に取得処理を行い、上記した中継管理処理では、キーワード記憶処理で記憶されたキーワードがコメント部分解析処理で解析されたコメント部分に含まれる場合にクライアントからの中継要求を拒否し、含まれない場合に中継処理を行うことを特徴とする。
【0032】
請求項25記載の発明は、上記した取得管理処理では、キーワード記憶処理で記憶されたキーワードが要求解析処理で解析された中継要求データに含まれる場合にクライアントからの中継要求を拒否し、含まれない場合に取得処理を行い、上記した中継管理処理では、キーワード記憶処理で記憶されたキーワードがコメント部分解析処理で解析されたコメント部分に含まれる場合にクライアントからの中継要求を拒否し、含まれない場合、中継要求データにリンクが含まれるか否かを解析し、該解析によりリンクが含まれる場合、該リンク先のアドレス情報を解析し、該アドレス情報にキーワードが含まれる場合にクライアントからの中継要求を拒否し、含まれない場合に中継処理を行うことを特徴とする。
【0033】
請求項26記載の発明は、上記の中継要求データが、コンテンツを格納したサーバに送信する情報と、該サーバのアドレス情報とを含み、上記した要求解析処理では、サーバに送信する情報及びアドレス情報を解析の対象とすることを特徴とする。
【0034】
請求項27記載の発明は、上記した要求解析処理では、中継要求データがアドレス情報を含む場合、該アドレス情報及びサーバに送信する情報を解析し、中継要求データがアドレス情報における所定の少なくとも一部を含む場合、該少なくとも一部及びサーバに送信する情報を解析することを特徴とする。
【0035】
請求項28記載の発明は、接続要求中継装置に、区切り記号を記憶する区切り記号記憶処理を実行させ、上記した要求解析処理及びコメント部分解析処理での解析は、区切り記号記憶処理に記憶された区切り記号により当該解析の対象を分解して行うことを特徴とする。
【0036】
【発明の実施の形態】
次に、本発明に係る接続要求中継装置、フィルタリングシステム、方法、及びプログラムを図面を用いて詳細に説明する。
本発明は、URL文字列、POSTデータ、及び取得したHTMLデータのMETAタグを検索対象文字列として使用することにより、URLの内容を事前に調査することなく、リアルタイムにフィルタリングを行えるフィルタリングシステムを提供するものである。
【0037】
本発明の第1の実施形態としてのフィルタリングシステムは、図1に示すように、プロキシサーバ(接続要求中継装置)1と、クライアント2と、外部ネットワーク3と、サーバ4とを備えてなり、クライアント2がプロキシサーバ1に接続され、プロキシサーバ1が外部ネットワーク3を介してサーバ4に接続されて構成される。
【0038】
プロキシサーバ1は、制御手段(CPUなど)と、格納手段(HDDなど)と、入力手段(キーボードやマウスなど)とを備え、格納手段に格納されたプログラムにより制御手段が処理を行うことにより、以下に述べる機能や動作を実現する。
また、サーバ4はコンテンツを格納している。以下の説明では、クライアント2からの中継要求が、このサーバ4に格納されたコンテンツに対して行われる場合の例について述べる。
【0039】
プロキシサーバ1は、クライアント2からのHTTPアクセスをサーバ4に中継するプロキシ動作部(中継部)11と、不適切キーワードを保存するキーワード記憶部12と、キーワード記憶部12に記憶されているキーワードと検索対象文字列の照合を行うキーワード照合部13と、区切り記号を保存する区切り記号記憶部14と、URLを区切り記号で解析し検索対象文字列を抽出するURL解析部(アドレス情報解析部)15と、HTTP POSTデータから区切り記号で解析し検索対象文字列を抽出するPOSTデータ解析部(部分アドレス情報解析部)16と、サーバから取得したHTMLデータのMETAデータ部分(コンテンツのコメント部分)から検索対象文字列を抽出するMETAデータ解析部(コメント部分解析部)17と、を備えてなる。
【0040】
プロキシ動作部11は、クライアント2からのHTTPアクセスをサーバ4へ中継し、その結果(コンテンツ)をサーバ4からクライアント2へ中継する。中継の際にキーワード照合部13におけるキーワード照合結果によって中継するか中継拒否するかを判断する。
すなわち、プロキシ動作部11は、キーワード照合部13から中継許可の通知を受けると、コンテンツを取得(取得処理)、又は、中継要求先であるコンテンツをクライアント2に送信(中継処理)する。また、中継拒否の通知を受けると、クライアント2からの中継要求を拒否し、その旨をクライアント2に通知する。
【0041】
キーワード記憶部12は、完全一致キーワード記憶部と、部分一致キーワード記憶部を含む。完全一致キーワード記憶部は、検索対象文字列と完全に一致するかを判断するために使用するキーワードを記憶している。部分一致キーワード記憶部は、検索対象文字列に部分的に一致するかを判断するために使用するキーワードを記憶している。
このキーワードは、クライアント2からの接続要求を中継するのに不適切なコンテンツを判別するためのものであり、システムの管理者が、例えばプロキシサーバ1の入力手段(キーボードやマウスなど)により、上記キーワード記憶部12に記憶させたものである。
【0042】
キーワード照合部13は、完全一致キーワード記憶部に記憶されているキーワードと検索対象文字列が一致するかを検索し、その検索結果をプロキシ動作部11に通知する。また、部分一致キーワード記憶部に記憶されているキーワードと検索対象文字列が部分的に一致するかを検索し、その検索結果をプロキシ動作部11に通知する。
上記の検索結果としては、キーワードが検索対象文字列と完全一致又は部分一致した場合、すなわち、検索対象文字列にキーワードが含まれる場合、中継拒否の旨がプロキシ動作部11に通知され、検索対象文字列にキーワードが含まれない場合、中継許可の旨がプロキシ動作部11に通知される。
【0043】
区切り記号記憶部14は、URLにおいてホスト名、ディレクトリ名、パラメータなどの文字列間を結合する「区切り記号」に使用する、特別な記号を予め記憶している。区切り記号の例としては、“.”、“/”、“?”、“&”、“#”、“;”などがある。また、管理者の設定によって、上記の記号に限定されず、文字などを「区切り記号」として用いてもよく、使用する記号を限定してもよい。
【0044】
URL解析部15は、プロキシ動作部11がクライアント2から要求されたHTTPアクセスのURL(アドレス情報)とサーバ4に送信するデータとを解析し、区切り記号記憶部14に記憶されている区切り記号を使用して検索対象文字列を抽出する。
すなわち、クライアント2からの中継要求データが、サーバ4のアドレス情報とそのサーバ4に送信するデータとを有する場合、そのサーバ4のアドレス情報とそのサーバ4に送信するデータとを解析し、検索対象文字列を抽出する。
【0045】
POSTデータ解析部16は、HTTPアクセスのオブジェクトボディに含まれる“キー=値”を解析し、“値”の部分を検索対象文字列として抽出する。
すなわち、クライアント2からの中継要求データがPOSTデータとサーバ4に送信するデータとを有する場合に、そのPOSTデータと中継要求先に送信するデータとを解析し、区切り記号記憶部14に記憶されている区切り記号を使用して検索対象文字列を抽出する。
【0046】
METAデータ解析部17は、サーバ4からのHTMLデータ(コンテンツ)を解析し、HTMLデータに含まれるMETAタグよりMETAデータを検索対象文字列として抽出する。
【0047】
上述のように、プロキシサーバ1では、URL解析部15、POSTデータ解析部16、又はMETAデータ解析部17が解析を行い、その解析結果によりキーワード照合部13がキーワードとの照合を行い、解析結果(検索対象文字列)にキーワードが含まれる場合に中継拒否を、含まれない場合に中継許可を、プロキシ動作部11に通知し、プロキシ動作部11が中継許可の通知を受けた場合のみクライアント2からの中継要求先であるコンテンツをそのクライアント2に送信することにより、上記したURL解析部15と、POSTデータ解析部16と、METAデータ解析部17と、キーワード照合部13と、プロキシ動作部11とが、中継管理手段として機能する。
【0048】
次に、本発明に係るフィルタリングシステムの動作の概要について、図1、図2を参照して説明する。
【0049】
図1において、キーワード記憶部12は、システムの管理者により設定されたキーワード(不適切キーワード)を記憶している。
クライアント2からプロキシ動作部11が受け取ったURLをURL解析部15にて区切り記号、例えば、“/”を使用して検索対象文字列を抽出する。また、プロキシ動作部11が受け取った中継要求データがHTTP POSTデータの場合、POSTデータ解析部16にてPOSTデータを抽出する(ステップS1)。
こうしてURL解析部15、又はPOSTデータ解析部16にて抽出された検索対象文字列とキーワード記憶部12に記憶されているキーワードとを、キーワード照合部13が照合を行う(ステップS3)。検索対象文字列とキーワードが一致、もしくは部分文字列としてキーワードを含んでいる場合(ステップS3;Yes)、キーワード照合部13はプロキシ動作部11に中継拒否を指示する(ステップS4)。キーワードが不一致、かつ部分文字列としても含んでいない場合(ステップS3;No)、キーワード照合部13はプロキシ動作部11にURLの内容(コンテンツ)の取得を指示する(ステップS5)。
【0050】
取得されたURLの内容がHTMLデータの場合、プロキシ動作部11が受け取ったHTMLデータをMETAデータ解析部17にて解析し、検索対象文字列を抽出する(ステップS6)。METAデータ解析部17にて抽出された検索対象文字列とキーワード記憶部12に記憶されているキーワードとを、キーワード照合部13が照合を行う(ステップS7)。検索対象文字列とキーワードが一致、もしくは部分文字列としてキーワードを含んでいる場合(ステップS7;Yes)、キーワード照合部13はプロキシ動作部11に中継拒否を指示する(ステップS4)。キーワードが不一致、かつ部分文字列としても含んでいない場合(ステップS7;No)、プロキシ動作部11にURLの内容を送る(ステップS8)。
こうしてプロキシ動作部11にURLの内容が送信されることにより、プロキシ動作部11は、クライアント2にそのURLの内容を送信する。
【0051】
上述した動作で、ステップS5とS6とは、中継管理手段がクライアント2からの中継要求に応じてコンテンツを送信する中継管理工程となる。
また、ステップS7とS8とは、中継管理手段がクライアント2からの中継要求に応じてコンテンツを送信する中継管理工程となる。
上述した一連の動作により、URLの内容を事前に調査したデータが存在しない場合においても有効にフィルタリングを行うことが可能となる。
【0052】
次に、図1、図2を参照して本発明の実施形態としてのフィルタリングシステムの動作について詳細に説明する。
【0053】
まず、クライアント2からのHTTPアクセスが、プロキシサーバ1のプロキシ動作部11に送信される(ステップS1)。このHTTPアクセスを受け取ったプロキシ動作部11は、HTTPアクセスのURLをURL解析部15へ供給する。
URL解析部15は、HTTPアクセスのURLを解析し、区切り記号記憶部14に記憶している区切り記号を使用して“キー=値”に分解し、“値”の部分を検索対象文字列として抽出する。HTTPアクセスにPOSTデータが含まれている場合は、HTTPアクセスのオブジェクトボディをPOSTデータ解析部16に供給する。POSTデータ解析部16は、HTTPアクセスのオブジェクトボディに含まれる“キー=値”を解析し、“値”の部分を検索対象文字列として抽出する(ステップS2)。
【0054】
こうしてURL解析部15、及び/又はPOSTデータ解析部16にて抽出された検索対象文字列は、キーワード照合部13に供給される。キーワード照合部13は、キーワード記憶部12の完全一致キーワード記憶部に記憶されているキーワードと検索対象文字列が一致するかどうかを検索する。さらに、キーワード記憶部12の部分一致キーワード記憶部に記憶されているキーワードが検索対象文字列と部分的に一致するかどうかを検索する(ステップS3)。
完全一致キーワードに一致するか、部分一致キーワードに部分的に一致するかした場合(ステップS3;Yes)、キーワード照合部13は、プロキシ動作部11に中継拒否を通知する。中継拒否を通知されたプロキシ動作部11は、HTTPアクセスの中継を拒否した画面をクライアント2に送信する(ステップS4)。
キーワード照合部13にて、URL解析部15、及び/又はPOSTデータ解析部16にて抽出された検索対象文字列が完全一致キーワードに一致せず、かつ部分一致キーワードにも部分的に一致しない場合(ステップS3;No)、キーワード照合部13は、プロキシ動作部11にサーバ4からのHTMLデータ取得要求を行う(ステップS5)。
【0055】
サーバ4から取得されたHTMLデータ(コンテンツ)は、プロキシ動作部11を通して、METAデータ解析部17に供給される。METAデータ解析部17は、供給されたHTMLデータを解析し、HTMLデータに含まれるMETAタグのCONTENT属性を“,”で分解し、分解した文字列であるMETAデータを検索対象文字列として抽出する(ステップS6)。
【0056】
METAデータ解析部17にて抽出された検索対象文字列は、キーワード照合部13に供給される。キーワード照合部13は、キーワード記憶部12の完全一致キーワード記憶部12に記憶されているキーワードと検索対象文字列が一致するかどうかを検索する。さらに、キーワード記憶部12の部分一致キーワード記憶部12に記憶されているキーワードが検索対象文字列と部分的に一致するかどうかを検索する(ステップS7)。
完全一致キーワードに一致するか、部分一致キーワードに部分的に一致するかのどちらかの場合(ステップS7;Yes)、キーワード照合部13はプロキシ動作部11に中継拒否を通知する。中継拒否を通知されたプロキシ動作部11は、HTTPアクセスの中継を拒否した画面をクライアント2に送信する(ステップS4)。
キーワード照合部13での照合にて、METAデータ解析部17にて抽出された検索対象文字列が完全一致キーワードに一致せず、かつ部分一致キーワードにも部分的に一致しない場合(ステップS7;No)、キーワード照合部13はプロキシ動作部11にHTTPアクセスの中継を許可し、クライアント2にサーバ4から取得したHTMLデータを送信する(ステップS8)。
こうしてプロキシ動作部11にURLの内容(コンテンツ)が送信されることにより、プロキシ動作部11は、クライアント2にそのコンテンツを送信する。
【0057】
次に、具体例を用いて、本実施形態としてのフィルタリングシステムの動作を説明する。
図3は、クライアント2からのHTTPアクセスのURLをURL解析部15にて解析した結果を例示する図であり、図4は、POSTデータをPOSTデータ解析部16にて解析した結果を例示する図である。
【0058】
クライアント2からの中継要求に応じて、プロキシサーバ1は、URL、及びPOSTデータを、“/”、“:”、“?”、“&”などの区切り記号記憶部14に登録している区切り記号にて解析し、解析結果の検索対象文字列をキーワード照合部にて完全一致、及び部分一致するかどうかを検索する。
【0059】
例えば、図3に示す例で、検索対象文字列が“WWW2”の場合、照合するキーワードが“WWW2”の場合、完全一致と部分一致のどちらにおいても検索される。すなわち、キーワード照合部13は、完全一致と部分一致のどちらにおいてもキーワードが含まれていると判断する。
ここで、キーワードが“WWW”の場合、完全一致では検索されないが、部分一致では検索されることになる。すなわち、キーワード照合部13は、部分一致の照合によりキーワードが含まれていると判断する。
【0060】
図5は、サーバ4から取得したHTMLデータ(コンテンツ)の例であり、METAデータ解析部17で、“<META name=keywords”の行を解析する。解析の結果、content属性から抽出される検索対象文字列は、“meta”、“ng”、“ng_keyword”となる。キーワード照合部13における検索方法は、上述したURL解析、及びPOSTデータ解析の場合と同じである。
【0061】
また、管理者が、キーワード記憶部12に不適切キーワードとして、例えば“adult”、“nude”といったキーワードを登録しておくと、アダルト系のサイトへのアクセスを中継拒否することができる。また、この例の場合には、“アダルト系のサイトへのアクセスのため、アクセスできません”といったメッセージをクライアント2の表示手段に表示させてもよい。
【0062】
次に、本発明の第2の実施形態について、図面を参照して詳細に説明する。
この第2の実施形態は、図6を参照すると、プロキシ動作部11がサーバ4から取得したHTMLドキュメント(コンテンツ)を中継するか否かを、取得したHTMLドキュメントをHTMLデータ解析部51にて解析を行って抽出されたURLリンクに対してURL解析を行い、またURLリンクにHTTPアクセスした結果のHTMLデータに対してMETAデータ解析を行うことで、サーバ4から取得したHTMLドキュメントの中継を行うかどうかを判断する点が、上述した第1の実施形態と異なる。
HTMLデータ解析部51は、サーバ4から取得したHTMLドキュメントを解析を行い、記述されているURLリンクを抽出する。
また、この図6では、上述した第1の実施形態と共通するものについては同じ符号とし、説明を省略する。
【0063】
この第2の実施形態としてのフィルタリングシステムの動作を、図6から図8を参照して詳細に説明する。
図6において、クライアント2からのHTTPアクセスのURL、及びPOSTデータを解析してHTTPアクセスを中継するか中継拒否するかの判断は、上述した第1の実施形態での動作と同一のため省略する(ステップS11からS17)。
第1の実施形態ではサーバ4から取得したHTMLドキュメントのMETAタグ部分のみを解析していたが、本実施形態では、HTMLドキュメントにURLリンクが記述されているかをHTMLデータ解析部51にて解析し(ステップS18)、図8に示すとおり、Aタグのhref属性に記述されているURLを抽出する(ステップS19)。
抽出されたURLをURL解析部15にて解析し(ステップS20)、解析結果の検索対象文字列とキーワード記憶部12に記憶されているキーワードとをキーワード照合部13で上述のように検索し(ステップS21)、検索した結果によってリンク元のHTMLデータを中継するかどうかを判断する。すなわち、キーワード記憶部12に記憶されているキーワードがリンク先のURLに含まれている場合(ステップS21;Yes)、プロキシ動作部11はクライアント2からの中継要求を拒否し(ステップS14)、含まれていない場合(ステップS21;No)、プロキシ動作部11はHTMLデータから抽出されたURLにHTTPアクセスを行ってリンク先のHTMLデータ(リンク先コンテンツ)を取得する(ステップS22)。
【0064】
こうして、プロキシ動作部11は、リンク先のHTMLデータを取得し、リンク先のHTMLドキュメントに対してMETAデータ解析部17にて解析を行い(ステップS23)、解析結果の検索対象文字列とキーワード記憶部12に記憶されているキーワードとをキーワード照合部13が上述のように検索する(ステップS24)。
検索した結果によって、キーワード照合部13は、リンク元のHTMLデータを中継するかどうかを判断する。すなわち、キーワード記憶部12に記憶されているキーワードがリンク先のHTMLデータにおけるMETAタグデータ部に含まれている場合(ステップS24;Yes)、プロキシ動作部11はクライアント2からの中継要求を拒否し(ステップS14)、含まれていない場合(ステップS24;No)、キーワード照合部13は、リンク元である中継要求先のHTMLデータをプロキシ動作部11に送信する(ステップS25)。
こうしてプロキシ動作部11にクライアント2からの中継要求先であるURLの内容(コンテンツ)が送信されることにより、プロキシ動作部11は、クライアント2にそのコンテンツを送信する。
【0065】
上述した各実施形態としてのフィルタリングシステムによれば、事前の調査が行われていないURLのコンテンツに対しても、リアルタイムにフィルタリングを行うことができる。
すなわち、プロキシサーバは、クライアント2から中継要求データを受信すると、その中継要求データや取得したコンテンツのMETAデータ部分を解析して検索対象を抽出するため、事前に調査が行われていないコンテンツについても、リアルタイムに有効なフィルタリングを行うことができる。このため、爆発的に増加するURLにも対応していくことができる。
【0066】
また、従来のURLフィルタリングシステムは、サーバから取得したHTMLデータの文章を全文解析して抽出された検索対象文字列と、不適切キーワードとを照合する形態であり、HTMLのデータを全て解析対象とするため、リアルタイム性が損なわれる可能性があり、プロキシサーバマシンに不必要な負荷をかけるという問題があった。
上述した各実施形態としてのフィルタリングシステムによれば、上述のようにリアルタイムにフィルタリングする際に、サーバから取得したHTMLデータを全文解析した結果ではなく、METAデータ部分を利用してフィルタリングを行うため、プロキシサーバマシンに負荷をかけることなく、リアルタイム性を重視したフィルタリングを行うことが可能となる。
【0067】
なお、上述した各実施形態は、本発明の好適な実施形態であり、本発明の主旨を逸脱しない範囲内において、種々変形して実施することが可能である。
例えば、上述したPOSTデータは、HTTPプロトコルの例であり、その他のGET、PUTなどのメソッドによるものであってもよい。
また、HTMLデータを対象としているのは一例であり、その他のコンテンツデータが中継要求先であってもよい。すなわち、コンテンツのデータ形式は、HTMLデータに限定されない。
【0068】
また、プロトコルとしてHTTPプロトコルを対象としているのは一例であり、クライアント−サーバ間で使用可能なプロトコルであればどのようなプロトコルがシステムで用いられていてもよい。
また、上述した各実施形態では、コンテンツを格納したサーバ4を特定するアドレス情報をURLとして説明しているが、そのシステムにおけるプロトコルでのアドレス情報であればこのものに限定されない。
【0069】
また、事前に調査したコンテンツを、プロキシサーバ内又はプロキシサーバからアクセス可能な格納手段に格納し、クライアントからの中継要求先が格納されている場合、その格納されたコンテンツの全部又は一部を解析の対象として含める実施例としてもよい。
この実施例によれば、事前の調査を検索対象としてさらに加えることにより、より確実なフィルタリングを行うことができる。
【0070】
【発明の効果】
以上のように、本発明では、接続要求中継装置が、クライアントから送信された中継要求データとコンテンツのコメント部分とに、記憶されたキーワードが含まれるか否かを用いてクライアントからの中継を管理する。
このことにより、事前に調査が行われていないコンテンツに対しても、有効なフィルタリングを行うことができる。このため、爆発的に増加するコンテンツにも対応して有効なフィルタリングを行うことができる。
【0071】
また、接続要求中継装置が、クライアントから送信された中継要求データと、コンテンツのコメント部分と、リンク先のアドレス情報と、リンク先コンテンツのコメント部分とに、記憶されたキーワードが含まれるか否かを用いてクライアントからの中継を管理する。
このことにより、事前に調査が行われていないコンテンツに対しても、有効なフィルタリングを行うことができる。このため、爆発的に増加するコンテンツにも対応して有効なフィルタリングを行うことができる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態としてのフィルタリングシステムの構成の概要を例示するブロック図である。
【図2】本発明の第1の実施形態としてのフィルタリングシステムの動作の概要を例示するフローチャートである。
【図3】URLをURL解析部にて解析した結果を例示する図である。
【図4】POSTデータをPOSTデータ解析部16にて解析した結果を例示する図である。
【図5】サーバから取得したHTMLデータ(コンテンツ)を例示する図である。
【図6】本発明の第2の実施形態としてのフィルタリングシステムの構成の概要を例示するブロック図である。
【図7】本発明の第2の実施形態としてのフィルタリングシステムの動作の概要を例示するフローチャートである。
【図8】サーバから取得したリンクを含むHTMLデータ(コンテンツ)を例示する図である。
【符号の説明】
1 プロキシサーバ(接続要求中継装置)
11 プロキシ動作部(中継部)
12 キーワード記憶部
13 キーワード照合部
14 区切り記号記憶部
15 URL解析部(アドレス情報解析部)
16 POSTデータ解析部(部分アドレス情報解析部)
17 METAデータ解析部(コメント部分解析部)
2 クライアント
3 外部ネットワーク
4 サーバ(コンテンツを格納したサーバ)
Claims (28)
- クライアントと、サーバに格納されたコンテンツとの接続を前記クライアントからの中継要求により中継する接続要求中継装置であって、
キーワードを記憶するキーワード記憶手段と、
前記クライアントから送信された中継要求データと前記コンテンツのコメント部分とに、前記キーワードが含まれるか否かを用いて前記クライアントからの中継を管理する中継管理手段と、を備えたことを特徴とする接続要求中継装置。 - クライアントと、サーバに格納されたコンテンツとの接続を前記クライアントからの中継要求により中継する接続要求中継装置であって、
キーワードを記憶するキーワード記憶手段と、
前記クライアントから送信された中継要求データを解析し、前記キーワード記憶手段に記憶されたキーワードが該中継要求データに含まれるか否かにより前記コンテンツの取得を管理し、前記コンテンツを取得すると当該コンテンツのコメント部分に前記キーワードが含まれるか否かを用いて前記クライアントからの中継を管理する中継管理手段と、を備えたことを特徴とする接続要求中継装置。 - 前記中継管理手段は、前記キーワード記憶手段に記憶されたキーワードが前記中継要求データに含まれる場合に前記中継要求を拒否し、含まれない場合に前記コンテンツを取得し、該コンテンツのコメント部分に前記キーワードが含まれる場合に前記中継要求を拒否し、含まれない場合に前記クライアントへの中継処理を行うことを特徴とする請求項1又は2記載の接続要求中継装置。
- 前記中継管理手段は、前記キーワード記憶手段に記憶されたキーワードが前記中継要求データに含まれる場合に前記中継要求を拒否し、含まれない場合に前記コンテンツを取得し、該コンテンツのコメント部分に前記キーワードが含まれる場合に前記中継要求を拒否し、含まれない場合に該コンテンツにリンクが含まれるか否かを解析し、該解析によりリンクが含まれる場合、該リンク先のアドレス情報を解析し、該アドレス情報に前記キーワードが含まれる場合に前記中継要求を拒否し、含まれない場合に前記リンク先からリンク先コンテンツを取得し、該リンク先コンテンツのコメント部分に前記キーワードが含まれる場合に前記中継要求を拒否し、含まれない場合に前記クライアントへの中継処理を行うことを特徴とする請求項1又は2記載の接続要求中継装置。
- 前記中継要求データは、前記コンテンツを格納したサーバに送信する情報と、該サーバのアドレス情報とを含み、
前記中継管理手段は、前記サーバに送信する情報及び前記アドレス情報を解析の対象とすることを特徴とする請求項1から4の何れか1項に記載の接続要求中継装置。 - 前記中継管理手段は、
前記サーバに送信する情報及び前記アドレス情報を解析するアドレス情報解析部と、
前記サーバに送信する情報及び前記アドレス情報における所定の少なくとも一部を解析する部分アドレス情報解析部と、
コンテンツにおけるコメント部分を解析するコメント部分解析部と、
前記クライアントと前記コンテンツを格納したサーバとの中継処理を行う中継部と、
前記アドレス情報解析部又は前記部分アドレス情報解析部又は前記コメント部分解析部での解析により抽出された検索対象と前記キーワードとを照合し、含まれる場合に中継拒否を、含まれない場合に中継許可を、前記中継部に通知するキーワード照合部と、を備え、
前記中継部は、前記キーワード照合部からの前記通知に基づいて中継処理を行うことを特徴とする請求項5記載の接続要求中継装置。 - 区切り記号を記憶する区切り記号記憶手段を備え、
前記中継管理手段による解析は、前記区切り記号記憶手段に記憶された区切り記号により当該解析の対象を分解して行うことを特徴とする請求項1から6の何れか1項に記載の接続要求中継装置。 - クライアントと、コンテンツを格納したサーバと、前記クライアントから前記コンテンツへの接続を当該クライアントからの中継要求により中継する接続要求中継装置とを備えてなるフィルタリングシステムであって、
前記接続要求中継装置は、
キーワードを記憶するキーワード記憶手段と、
前記クライアントから送信された中継要求データと前記コンテンツのコメント部分とに、前記キーワードが含まれるか否かを用いて前記クライアントからの中継を管理する中継管理手段と、を備えたことを特徴とするフィルタリングシステム。 - クライアントと、コンテンツを格納したサーバと、前記クライアントから前記コンテンツへの接続を当該クライアントからの中継要求により中継する接続要求中継装置とを備えてなるフィルタリングシステムであって、
前記接続要求中継装置は、
キーワードを記憶するキーワード記憶手段と、
前記クライアントから送信された中継要求データを解析し、前記キーワード記憶手段に記憶されたキーワードが該中継要求データに含まれるか否かにより前記コンテンツの取得を管理し、前記コンテンツを取得すると当該コンテンツのコメント部分に前記キーワードが含まれるか否かを用いて前記クライアントからの中継を管理する中継管理手段と、を具備したことを特徴とするフィルタリングシステム。 - 前記中継管理手段は、前記キーワード記憶手段に記憶されたキーワードが前記中継要求データに含まれる場合に前記中継要求を拒否し、含まれない場合に前記コンテンツを取得し、該コンテンツのコメント部分に前記キーワードが含まれる場合に前記中継要求を拒否し、含まれない場合に前記クライアントへの中継処理を行うことを特徴とする請求項8又は9記載のフィルタリングシステム。
- 前記中継管理手段は、前記キーワード記憶手段に記憶されたキーワードが前記中継要求データに含まれる場合に前記中継要求を拒否し、含まれない場合に前記コンテンツを取得し、該コンテンツのコメント部分に前記キーワードが含まれる場合に前記中継要求を拒否し、含まれない場合に該コンテンツにリンクが含まれるか否かを解析し、該解析によりリンクが含まれる場合、該リンク先のアドレス情報を解析し、該アドレス情報に前記キーワードが含まれる場合に前記中継要求を拒否し、含まれない場合に前記リンク先からリンク先コンテンツを取得し、該リンク先コンテンツのコメント部分に前記キーワードが含まれる場合に前記中継要求を拒否し、含まれない場合に前記クライアントへの中継処理を行うことを特徴とする請求項8又は9記載のフィルタリングシステム。
- 前記中継要求データは、前記コンテンツを格納したサーバに送信する情報と、該サーバのアドレス情報とを含み、
前記中継管理手段は、前記サーバに送信する情報及び前記アドレス情報を解析の対象とすることを特徴とする請求項8から11の何れか1項に記載のフィルタリングシステム。 - 前記中継管理手段は、
前記サーバに送信する情報及び前記アドレス情報を解析するアドレス情報解析部と、
前記サーバに送信する情報及び前記アドレス情報における所定の少なくとも一部を解析する部分アドレス情報解析部と、
コンテンツにおけるコメント部分を解析するコメント部分解析部と、
前記クライアントと前記コンテンツを格納したサーバとの中継処理を行う中継部と、
前記アドレス情報解析部又は前記部分アドレス情報解析部又は前記コメント部分解析部での解析により抽出された検索対象と前記キーワードとを照合し、含まれる場合に中継拒否を、含まれない場合に中継許可を、前記中継部に通知するキーワード照合部と、を備え、
前記中継部は、前記キーワード照合部からの前記通知に基づいて中継処理を行うことを特徴とする請求項12記載のフィルタリングシステム。 - 区切り記号を記憶する区切り記号記憶手段を備え、
前記中継管理手段による解析は、前記区切り記号記憶手段に記憶された区切り記号により当該解析の対象を分解して行うことを特徴とする請求項8から13の何れか1項に記載のフィルタリングシステム。 - クライアントと、コンテンツを格納したサーバと、前記クライアントから前記コンテンツへの接続を当該クライアントからの中継要求により中継する接続要求中継装置とを備えてなるシステムにおけるフィルタリング方法であって、
キーワードを記憶するキーワード記憶工程と、
前記クライアントから送信された中継要求データを解析する要求解析工程と、
前記キーワード記憶工程で記憶されたキーワードが前記要求解析工程で解析された前記中継要求データに含まれるか否かに基づいてコンテンツを取得する取得管理工程と、を備えたことを特徴とするフィルタリング方法。 - 前記取得管理工程により前記サーバからコンテンツが取得されると、該コンテンツにおけるコメント部分を解析するコメント部分解析工程と、
前記コメント部分解析工程で解析された前記コメント部分に前記キーワードが含まれるか否かに基づいて前記クライアントからの中継を管理する中継管理工程と、を備えたことを特徴とする請求項15記載のフィルタリング方法。 - 前記取得管理工程では、前記キーワード記憶工程で記憶されたキーワードが前記要求解析工程で解析された前記中継要求データに含まれる場合に前記クライアントからの中継要求を拒否し、含まれない場合に取得処理を行い、
前記中継管理工程では、前記キーワード記憶工程で記憶されたキーワードが前記コメント部分解析工程で解析された前記コメント部分に含まれる場合に前記クライアントからの中継要求を拒否し、含まれない場合に中継処理を行うことを特徴とする請求項16記載のフィルタリング方法。 - 前記取得管理工程では、前記キーワード記憶工程で記憶されたキーワードが前記要求解析工程で解析された前記中継要求データに含まれる場合に前記クライアントからの中継要求を拒否し、含まれない場合に取得処理を行い、
前記中継管理工程では、前記キーワード記憶工程で記憶されたキーワードが前記コメント部分解析工程で解析された前記コメント部分に含まれる場合に前記クライアントからの中継要求を拒否し、含まれない場合、前記中継要求データにリンクが含まれるか否かを解析し、該解析によりリンクが含まれる場合、該リンク先のアドレス情報を解析し、該アドレス情報に前記キーワードが含まれる場合に前記クライアントからの中継要求を拒否し、含まれない場合に中継処理を行うことを特徴とする請求項16記載のフィルタリング方法。 - 前記中継要求データは、前記コンテンツを格納したサーバに送信する情報と、該サーバのアドレス情報とを含み、
前記要求解析工程では、前記サーバに送信する情報及び前記アドレス情報を解析の対象とすることを特徴とする請求項15から18の何れか1項に記載のフィルタリング方法。 - 前記要求解析工程では、
前記中継要求データが前記アドレス情報を含む場合、該アドレス情報及び前記サーバに送信する情報を解析し、
前記中継要求データが前記アドレス情報における所定の少なくとも一部を含む場合、該少なくとも一部及び前記サーバに送信する情報を解析することを特徴とする請求項19記載のフィルタリング方法。 - 区切り記号を記憶する区切り記号記憶工程を備え、
前記要求解析工程及び前記コメント部分解析工程での解析は、前記区切り記号記憶工程に記憶された区切り記号により当該解析の対象を分解して行うことを特徴とする請求項16から20の何れか1項に記載のフィルタリング方法。 - クライアントと、コンテンツを格納したサーバと、前記クライアントから前記コンテンツへの接続を当該クライアントからの中継要求により中継する接続要求中継装置とを備えてなるシステムのフィルタリングプログラムであって、
前記接続要求中継装置に、
キーワードを記憶するキーワード記憶処理と、
前記クライアントから送信された中継要求データを解析する要求解析処理と、
前記キーワード記憶処理で記憶されたキーワードが前記要求解析処理で解析された前記中継要求データに含まれるか否かに基づいてコンテンツを取得する取得管理処理と、を実行させることを特徴とするフィルタリングプログラム。 - 前記接続要求中継装置に、
前記取得管理処理により前記サーバからコンテンツが取得されると、該コンテンツにおけるコメント部分を解析するコメント部分解析処理と、
前記コメント部分解析処理で解析された前記コメント部分に前記キーワードが含まれるか否かに基づいて前記クライアントからの中継を管理する中継管理処理と、を実行させることを特徴とする請求項22記載のフィルタリングプログラム。 - 前記取得管理処理では、前記キーワード記憶処理で記憶されたキーワードが前記要求解析処理で解析された前記中継要求データに含まれる場合に前記クライアントからの中継要求を拒否し、含まれない場合に取得処理を行い、
前記中継管理処理では、前記キーワード記憶処理で記憶されたキーワードが前記コメント部分解析処理で解析された前記コメント部分に含まれる場合に前記クライアントからの中継要求を拒否し、含まれない場合に中継処理を行うことを特徴とする請求項23記載のフィルタリングプログラム。 - 前記取得管理処理では、前記キーワード記憶処理で記憶されたキーワードが前記要求解析処理で解析された前記中継要求データに含まれる場合に前記クライアントからの中継要求を拒否し、含まれない場合に取得処理を行い、
前記中継管理処理では、前記キーワード記憶処理で記憶されたキーワードが前記コメント部分解析処理で解析された前記コメント部分に含まれる場合に前記クライアントからの中継要求を拒否し、含まれない場合、前記中継要求データにリンクが含まれるか否かを解析し、該解析によりリンクが含まれる場合、該リンク先のアドレス情報を解析し、該アドレス情報に前記キーワードが含まれる場合に前記クライアントからの中継要求を拒否し、含まれない場合に中継処理を行うことを特徴とする請求項23記載のフィルタリングプログラム。 - 前記中継要求データは、前記コンテンツを格納したサーバに送信する情報と、該サーバのアドレス情報とを含み、
前記要求解析処理では、前記サーバに送信する情報及び前記アドレス情報を解析の対象とすることを特徴とする請求項22から25の何れか1項に記載のフィルタリングプログラム。 - 前記要求解析処理では、
前記中継要求データが前記アドレス情報を含む場合、該アドレス情報及び前記サーバに送信する情報を解析し、
前記中継要求データが前記アドレス情報における所定の少なくとも一部を含む場合、該少なくとも一部及び前記サーバに送信する情報を解析することを特徴とする請求項26記載のフィルタリングプログラム。 - 前記接続要求中継装置に、区切り記号を記憶する区切り記号記憶処理を実行させ、
前記要求解析処理及び前記コメント部分解析処理での解析は、前記区切り記号記憶処理に記憶された区切り記号により当該解析の対象を分解して行うことを特徴とする請求項23から27の何れか1項に記載のフィルタリングプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002331309A JP2004164435A (ja) | 2002-11-14 | 2002-11-14 | 接続要求中継装置、フィルタリングシステム、方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002331309A JP2004164435A (ja) | 2002-11-14 | 2002-11-14 | 接続要求中継装置、フィルタリングシステム、方法、及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004164435A true JP2004164435A (ja) | 2004-06-10 |
Family
ID=32808732
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002331309A Pending JP2004164435A (ja) | 2002-11-14 | 2002-11-14 | 接続要求中継装置、フィルタリングシステム、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004164435A (ja) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007116549A (ja) * | 2005-10-21 | 2007-05-10 | Mitsubishi Electric Corp | ネットワーク中継装置 |
JP2007537626A (ja) * | 2004-04-19 | 2007-12-20 | ザ・リージェンツ・オブ・ザ・ユニバーシティ・オブ・カリフォルニア | 深いパケットフィルタリングのためのプログラム可能なハードウエア |
JP2007334476A (ja) * | 2006-06-13 | 2007-12-27 | Yafoo Japan Corp | 動的rssチャネル変更装置 |
WO2009066343A1 (ja) * | 2007-11-19 | 2009-05-28 | Duaxes Corporation | 通信制御装置及び通信制御方法 |
JP2009141450A (ja) * | 2007-12-04 | 2009-06-25 | Nec Access Technica Ltd | 中継装置、プログラム及び中継方法 |
JP2009535905A (ja) * | 2006-04-28 | 2009-10-01 | アルカテル−ルーセント ユーエスエー インコーポレーテッド | リングバックトーンサービスからの不快なリングバックトーンの自動格付けおよび除去 |
US7865474B2 (en) | 2005-05-20 | 2011-01-04 | Duaxes Corporation | Data processing system |
JP2011048465A (ja) * | 2009-08-25 | 2011-03-10 | Nippon Telegr & Teleph Corp <Ntt> | データ処理装置、そのプログラム、そのプログラムを記憶した記憶媒体及びデータ処理方法 |
US8336092B2 (en) | 2005-02-18 | 2012-12-18 | Duaxes Corporation | Communication control device and communication control system |
JP7133674B1 (ja) | 2021-03-18 | 2022-09-08 | ヤフー株式会社 | 情報処理装置、情報処理方法および情報処理プログラム |
-
2002
- 2002-11-14 JP JP2002331309A patent/JP2004164435A/ja active Pending
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4755175B2 (ja) * | 2004-04-19 | 2011-08-24 | ザ・リージェンツ・オブ・ザ・ユニバーシティ・オブ・カリフォルニア | 深いパケットフィルタリングのためのプログラム可能なハードウエア |
JP2007537626A (ja) * | 2004-04-19 | 2007-12-20 | ザ・リージェンツ・オブ・ザ・ユニバーシティ・オブ・カリフォルニア | 深いパケットフィルタリングのためのプログラム可能なハードウエア |
US8336092B2 (en) | 2005-02-18 | 2012-12-18 | Duaxes Corporation | Communication control device and communication control system |
US7865474B2 (en) | 2005-05-20 | 2011-01-04 | Duaxes Corporation | Data processing system |
JP2007116549A (ja) * | 2005-10-21 | 2007-05-10 | Mitsubishi Electric Corp | ネットワーク中継装置 |
JP4627243B2 (ja) * | 2005-10-21 | 2011-02-09 | 三菱電機株式会社 | ネットワーク中継装置 |
JP2009535905A (ja) * | 2006-04-28 | 2009-10-01 | アルカテル−ルーセント ユーエスエー インコーポレーテッド | リングバックトーンサービスからの不快なリングバックトーンの自動格付けおよび除去 |
JP2007334476A (ja) * | 2006-06-13 | 2007-12-27 | Yafoo Japan Corp | 動的rssチャネル変更装置 |
WO2009066343A1 (ja) * | 2007-11-19 | 2009-05-28 | Duaxes Corporation | 通信制御装置及び通信制御方法 |
JPWO2009066343A1 (ja) * | 2007-11-19 | 2011-03-31 | デュアキシズ株式会社 | 通信制御装置及び通信制御方法 |
JP2009141450A (ja) * | 2007-12-04 | 2009-06-25 | Nec Access Technica Ltd | 中継装置、プログラム及び中継方法 |
JP2011048465A (ja) * | 2009-08-25 | 2011-03-10 | Nippon Telegr & Teleph Corp <Ntt> | データ処理装置、そのプログラム、そのプログラムを記憶した記憶媒体及びデータ処理方法 |
JP7133674B1 (ja) | 2021-03-18 | 2022-09-08 | ヤフー株式会社 | 情報処理装置、情報処理方法および情報処理プログラム |
JP2022144281A (ja) * | 2021-03-18 | 2022-10-03 | ヤフー株式会社 | 情報処理装置、情報処理方法および情報処理プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6981217B1 (en) | System and method of obfuscating data | |
US6654754B1 (en) | System and method of dynamically generating an electronic document based upon data analysis | |
US7346605B1 (en) | Method and system for searching and monitoring internet trademark usage | |
US7809710B2 (en) | System and method for extracting content for submission to a search engine | |
US7062707B1 (en) | System and method of providing multiple items of index information for a single data object | |
EP1182590A2 (en) | Method, system, and program for gathering indexable metadata on content at a data repository | |
US20080065611A1 (en) | Method and system for searching and monitoring internet trademark usage | |
US20080016147A1 (en) | Method of retrieving an appropriate search engine | |
JP4716778B2 (ja) | 代行処理システム及び代行処理方法 | |
CN110430188B (zh) | 一种快速url过滤方法及装置 | |
US20190377764A1 (en) | Illegal content search system and method thereof | |
CN107209831A (zh) | 用于识别网络攻击的系统和方法 | |
JP2004164435A (ja) | 接続要求中継装置、フィルタリングシステム、方法、及びプログラム | |
JP5286317B2 (ja) | リスク情報提供システム及びプログラム | |
JP2004112318A (ja) | コンテンツ不正利用探索システム | |
JP3961099B2 (ja) | ネットワークにおけるディジタルデータの著作権検査装置及び著作権検査プログラムを記録したコンピュータ読取可能な記録媒体 | |
JP2005092564A (ja) | フィルタリング装置 | |
CN113132340B (zh) | 一种基于视觉与主机特征的钓鱼网站识别方法及电子装置 | |
CN112202763B (zh) | 一种ids策略生成方法、装置、设备及介质 | |
JP2010176387A (ja) | 電子スクラップシステム、電子スクラップ方法、電子スクラップサーバ、および利用者端末 | |
KR101079802B1 (ko) | 웹사이트 검색 방법 및 시스템과 웹사이트 검색 장치 및이를 위한 기록매체 | |
JP2005128922A (ja) | スパムメールフィルタリングシステム,方法,およびプログラム | |
KR20020032906A (ko) | 인터넷상에서의 저작권 보호 및 침해방지 시스템 및 방법 | |
JP4855589B2 (ja) | データ端末装置 | |
US8082259B2 (en) | Information processing apparatus for extracting objects |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040416 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20061114 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070313 |