JP2004192279A - Url管理装置及びurl管理方法並びにurl管理プログラム - Google Patents

Url管理装置及びurl管理方法並びにurl管理プログラム Download PDF

Info

Publication number
JP2004192279A
JP2004192279A JP2002358656A JP2002358656A JP2004192279A JP 2004192279 A JP2004192279 A JP 2004192279A JP 2002358656 A JP2002358656 A JP 2002358656A JP 2002358656 A JP2002358656 A JP 2002358656A JP 2004192279 A JP2004192279 A JP 2004192279A
Authority
JP
Japan
Prior art keywords
character string
string data
list
url
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002358656A
Other languages
English (en)
Inventor
Fumiaki Kumegawa
史明 久米川
Yukiko Ito
由紀子 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2002358656A priority Critical patent/JP2004192279A/ja
Publication of JP2004192279A publication Critical patent/JP2004192279A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】URL記憶装置において、URLの文字列データを記憶する記憶領域の記憶容量の縮小を行うことができるURL記憶装置を提供する。
【解決手段】分割部107は、URLの文字列データと登録要求との通知を送受信制御部103から受けると、文字列データを先頭部分と後続部分とに分割する。判定部108は、URL情報記憶部101の共通文字列リスト201の文字列データに先頭部分が含まれるか否か判定し、含まれるときは一致しているか否かを判定する。一致するとき、後続部分が個別文字列リスト202の文字列データと一致するか否かを判定する。一致しないとき、分類部109は、後続部分を個別文字列リスト202に登録する。連結情報生成部110は、一致した共通文字列リスト201のリスト番号と登録した個別文字列リスト202のリスト番号とを記載した連結情報を生成し、連結情報リスト203に登録する。
【選択図】 図1

Description

【0001】
【発明の属する技術分野】
本発明は、ホームページのサイトを特定するURLの文字列データを管理するURL管理装置に関する。
【0002】
【従来の技術】
最近、WWW上のホームページの進化はめざましく、誰でも手軽にホームページにアクセスし、様々な情報を手に入れることが可能となっている。
ホームページにアクセスするには、ホームページのサイトを特定するURLを入力する必要があるが、予めURLと番号との変換を記憶しておき、番号の入力を受け、番号に対応するURLに変換し、対応するホームページを検索し、表示させるシステムもある(例えば、特許文献1参照)。
【0003】
ところが、ホームページには、有害なホームページが存在し、利用者は、そのようなホームページへのアクセスを望まない。
そこで、予め有害なホームページのサイトを特定するURLを登録しておき、ホームページへのアクセス時にフィルタリングにより、登録されたURLと照合し、有害なホームページへのアクセスを未然に防止するシステムを本願出願人は、特願2002−254366で提案している。
【0004】
【特許文献1】
特表2001−522073
【0005】
【発明が解決しようとする課題】
ところで、世界中には7000万〜8000万のWWW上のホームページのサイトがあり、そのうち、有害なホームページのサイト数も膨大である。
それらのURLを登録するためのメモリの記憶容量も大きくならざるを得ない。
【0006】
そこで本発明は、有害なホームページのURLをコンパクトに記憶するURL管理装置及びURL管理方法を提供することを目的とし、副次的に、ホームページへのアクセス時に高速にフィルタリングを可能にすることを目的とする。
【0007】
【課題を解決するための手段】
本発明は、上記課題を解決するため、URLを表す文字列データを2分割した先頭側の共通文字列データと、後側の個別文字列データと、両文字列データを識別子で連結した連結情報とを記憶する記憶手段と、URLを表す文字列データと登録要求とを受信する受信手段と、受信した文字列データを2分割する分割手段と、分割された各文字列データと、前記記憶手段に記憶された対応する部分の共通文字列データ又は個別文字列データとが一致するか否かを判定する判定手段と、一致しないと判定されたとき、各文字列データを前記共通文字列データ又は個別文字列データとして登録し、一致すると判定されたとき、前記共通文字列データ又は個別文字列データの登録に換えて、前記連結情報を登録する登録手段とを備えることとしている。
【0008】
また、本発明は、前記受信手段は、更にURLを表す文字列データと検索要求とを受信し、前記記憶手段に記憶されている共通文字列データが受信された文字列データに含まれるか、全部一致するか又は一致しないかを判定する第1判定手段と、含まれると判定されたとき、前記連結情報に示される個別文字列データを共通文字列データに連結した文字列データが受信された文字列データと一致するか否かを判定する第2判定手段と、前記第1判定手段で全部一致すると判定されたとき、又は前記第2判定手段で一致すると判定されたとき、当該URLで特定されるサイトが有害サイトである旨を検索要求の送信元に通知し、前記第1、第2判定手段で一致しないと判定されたとき、当該URLで特定されるサイトは有害サイトでない旨を検索要求の送信元に通知する通知手段とを更に備えることとしている。
【0009】
【発明の実施の形態】
以下、本発明に係るURL管理装置の実施の形態について図面を用いて説明する。
(一実施の形態)
図1は、本発明に係るURL管理装置の一実施の形態の構成図である。
【0010】
このURL管理装置は、外部の登録要求部111から有害なホームページのサイトのURLの登録要求を受け、URLを登録し、削除要求部112から一旦登録したURLの削除要求を受けて、登録していたURLを削除し、検索要求部113からURLが有害なサイトのものであるか否かの検索要求を受け、回答する。
【0011】
URL管理装置は、URL情報記憶部101と、外部の登録要求部111と削除要求部112と検索要求部113と接続される送受信部102と、送受信制御部103と、登録部104と、削除部105と、検索部106とを備えている。登録部104は、分割部107と、判定部108と、分類部109と、連結情報生成部110とからなる。
【0012】
URL情報記憶部101は、送受信部で受信されたURLの文字列データをURL情報として記憶する。
図2は、URL情報記憶部101に記憶されているURL情報の一例を示す図である。
URL情報は、共通文字列リスト201と個別文字列リスト202と、連結情報リスト203とからなる。
【0013】
共通文字列リスト201は、共通文字列データ204の一覧であり、各共通文字列データ204には、リスト番号205が付されている。
個別文字列リスト202は、個別文字列データ206の一覧であり、各個別文字列データ206には、リスト番号207が付されている。個別文字列リスト202のリスト番号「0」に対応してワイルドカード208が記憶されている。このワイルドカード208は、任意の文字列データを示すものであり、予め個別文字列リスト202に登録されている。
【0014】
連結情報リスト203は、連結情報209の一覧を示している。連結情報209は、前半4バイト210の個別文字列リスト201のリスト番号と、後半4バイト211の個別文字列リスト202のリスト番号207とから構成される。
例えば、連結情報リスト203の1行目の連結情報「00000001」は、共通文字列リスト201のリスト番号「0」の文字列データ204と個別文字列リスト202のリスト番号「1」の文字列データ206とを連結する連結線212の役割を果たしている。これによって、URLの文字列データ「132.182.6.210/main/01/index.html」が共通文字列リスト201と個別リスト202とから復元される。
【0015】
このように、URL情報記憶部101では、URLの文字列データの先頭部分の共通する部分を共通文字列リスト201に登録し、後続の共通しない部分を個別文字列リスト202に登録することにより、共通文字列データ及び個別文字列データの重複した登録を排除することにより、記憶領域の有効利用を図っている。
【0016】
送受信部102は、回線網114を介して、登録要求部111から有害サイトのURLの文字列データとその登録要求を受信すると、送受信制御部103に通知する。同様に、削除要求部112からURLの文字列データとその削除要求とを受信すると送受信制御部103に通知する。同様に、検索要求部113からURLの文字列データとその検索要求とを受信すると送受信制御部103に通知する。
【0017】
また、登録要求部111からURL情報記憶部101に記憶されている個別文字列リスト202の文字列データの統合指示を受信すると、その旨送受信制御部103に通知する。
送受信制御部103から削除要求されたURLの文字列データを削除できないとの通知を受けると、削除要求部112に削除不可を送信する。
【0018】
また、送受信制御部103から有害サイトである旨、又は有害サイトでない旨の通知を受けると、検索要求部113にその旨をそれぞれ送信する。
送受信制御部103は、送受信部102から登録要求とURLの文字列データとの通知を受けると、登録部104にその内容を通知する。また、統合指示を受けたときも、同様とする。
【0019】
また、送受信部102から削除要求とURLの文字列データとの通知を受けると、削除部105にその内容を通知する。削除部105から、削除すべきURLの文字列データの登録がない旨の通知を受けると、送受信部102に削除できないとの通知をする。
また、送受信部102から検索要求とURLの文字列データとの通知を受けると、検索部106にその内容を通知する。検索部106から有害サイトである旨又は有害サイトでない旨の通知を受けると、送受信部102にその旨通知する。
【0020】
登録部104は、送受信制御部103から登録要求とURLの文字列データとの通知を受ける。
分割部107は、予め、URLの文字列データの分割ルールを記憶している。分割ルールは、例えば、URLの文字列データをパス名迄とファイル名以降との2つの部分に分割することである。
【0021】
図3は、分割部107に通知されたURLの文字列データの一例である。URLは、例えば、ユーザ名301とパスワード302とホスト名303とポート304とパス名305とファイル名306とクエリー307とフラグメント308とから構成される。
分割部107は、パス名305迄とファイル名306以降の2つの部分、「user:pass@132.182.6.10:80/msr」と「/high.html?sess=1#a01_area」との先頭部分と後続部分とに分割し、判定部108に通知する。
【0022】
判定部108は、分割部107からURLの先頭部分と後続部分との2つに分割された文字列データを通知されると、先ず、URL情報記憶部101に記憶されている共通文字列リスト201の各文字列データ204と先頭部分の文字列データとを比較し、先頭部分の文字列データが文字列データ204にあるか否かを判定する。共通文字列リスト201にないとき、通知された先頭部分と後続部分との文字列データを分類部109に通知する。
【0023】
共通文字列リスト201の文字列データ204に先頭部分の文字列データがあるとき、文字列データ204に一致しない部分を含むか否かを判定する。一致しない部分を含まないとき、後続部分の文字列データが個別文字列リスト202のワイルドカード208を除く、各文字列データ206に一致するか否かを判定する。
【0024】
一致すると判定したとき、連結情報生成部110に先頭部分の文字列データの一致する共通文字列リスト201のリスト番号205と後続部分の文字列データの一致する個別文字列リスト202のリスト番号207と連結情報生成指示とを通知する。
判定部108は、共通文字列リスト201の文字列データ204に一致しない部分を含むと判定したとき、当該一致しない部分が個別文字列リスト202の文字列データ206にあるか否かを判定する。あると判定したとき、先頭部分の文字列データを含む共通文字列リスト201の文字列データ204のリスト番号205と、当該一致しない部分と、それと一致する個別文字列リスト202の文字列データ206のリスト番号207とを分類部109に通知する。
【0025】
判定部108は、一致しない部分が個別文字列リスト202の文字列データ206にないと判定したとき、分類部109に当該一致しない部分を含む共通文字リスト201のリスト番号と一致しない部分とを通知する。
判定部108は、また、分割部107で分割された後続部分の文字列データが個別文字列リスト202の文字列データ206にないと判定したとき、その先頭部分の文字列データの一致する共通文字列リスト201のリスト番号205と当該後続部分の文字列データとを分類部109に通知する。
【0026】
分類部109は、判定部108から先頭部分と後続部分との文字列データの通知を受けると、共通文字列リスト201にそのまま登録する。この際、文字列データに共通文字列リスト201のリスト番号を付与する。なお、共通文字列リスト201に削除された文字列データがあるときには、その領域に登録する。このとき、リスト番号は、既にその領域に対して付与されているので、登録した文字列データに対してリスト番号を付与する必要はない。
【0027】
判定部108から共通文字列リスト201の文字列データ204のリスト番号205と、一致しない部分と、それと一致する個別文字列リスト202の文字列データ206のリスト番号207との通知を受けると、共通文字列リスト201の当該リスト番号205の文字列データ204から一致しない部分を削除する。併せて、連結情報生成部110に共通文字列リスト201のリスト番号205と個別文字列リスト202のリスト番号207と連結情報の登録指示とを通知する。
【0028】
分類部109は、判定部108から一致しない部分の文字列データと、当該一致しない部分を含む共通文字列リスト201のリスト番号との通知を受けると、URL情報記憶部101のURL情報中の共通文字列リスト201の通知されたリスト番号の文字列データ204から一致しない部分を削除し、個別文字列リスト202に一致しない部分の文字列データを登録する。この際、登録した文字列データにリスト番号を付与する。分類部109は、連結情報生成部110に、共通文字列リスト201のリスト番号205と付与した個別文字列リスト202のリスト番号207と連結情報の登録指示とを通知する。
【0029】
分類部109は、判定部108から共通文字列リスト201のリスト番号205と後続部分の文字列データとの通知を受けると、URL情報記憶部101の個別文字列リスト202に通知された文字列データを登録し、リスト番号を付与する。併せて、共通文字列リスト201のリスト番号205と付与した個別文字列リスト202のリスト番号207と連結情報の登録指示とを連結情報生成部110に通知する。
【0030】
連結情報生成部110は、判定部108から共通文字列リスト201のリスト番号205と個別文字列リスト202のリスト番号207と連結情報生成指示との通知を受けると、両リスト番号を記載した連結情報を生成し、生成した連結情報がURL情報記憶部101の連結情報リスト203の連結情報209として既に登録されているか否かを判定する。登録されていなければ、連結情報リスト203に登録する。なお、登録されているときは、登録要求されたURLがすでに登録されているので、なにもしない。
【0031】
連結情報生成部110は、分類部109から共通文字列リスト201のリスト番号205と個別文字列リスト202のリスト番号207と連結情報の登録指示との通知を受けると、両リスト番号205、207とを記載した連結情報を生成し、URL情報記憶部101の連結情報リスト203に生成した連結情報を登録する。
【0032】
次に、URLのURL情報記憶部101への登録を図4、図5を用いて具体的に説明する。
図4に示すように、登録要求部111からURLの文字列データ「http://132.182.6.210/main/01/index.html」401と登録要求とが送受信部102に送信され、これを受けた、送受信制御部103によって登録部104に通知される。
【0033】
URL管理装置の初期状態では、URL情報記憶部101には、URL情報である共通文字列リスト402と個別文字列リスト403と連結情報リスト404との登録領域が設けられており、個別文字列リスト403のリスト番号「0」にワイルドカード405が予め登録されている。
文字列データ401は、分割部107で、先頭部分の「132.182.6.210/main/01」と後続部分の「/index.html」とに分割される。
【0034】
判定部108は、先頭部分の文字列データ「132.182.6.210/main/01」が共通文字列リスト402の文字列データに登録されているか否かを判定するが、初期状態でデータはないので、否と判定する。
分類部109は、通知された文字列データ401を共通文字列リスト402に文字列データ406としてそのまま登録する。この文字列データ406には、リスト番号「1」が付される。
【0035】
共通文字列リスト402と個別文字列リスト403との両文字列データ406,405とを連結する連結情報はないので、連結情報リスト404は、データなしの状態である。
次に、図5に示すように、URLの文字列データ「http://132.182.6.210/main/01/main.html」501の登録要求を受けると、分割部107は、先頭部分「132.182.6.210/main/01」と後続部分「/main.html」とに分割する。
【0036】
判定部108は、先頭部分の文字列データ「132.182.6.210/main/01」が共通文字列リスト402の文字列データ406に含まれていると判定し、また一致しない部分「/index.html」があると判定する。
分類部109は、共通文字列リスト402の文字列データから「/index.html」を削除した文字列データとして共通文字列リスト502に登録し、個別文字列リスト503のリスト番号「1」に「/index.html」を登録する。
【0037】
連結情報生成部110は、共通文字列リスト502と個別文字列リスト503のそれぞれリスト番号「0」と「1」とを連結する連結情報「00000001」を生成し、連結情報リスト504に登録する。
分割部107で分割された後続部分の文字列データ「/main.html」は、個別文字列リスト503に登録されていないと判定部108で判定され、分類部109でリスト番号「2」が付与されて個別文字列リスト503に登録される。
【0038】
連結情報生成部は、URLの文字列501を復元するための連結情報「00000002」を生成し、連結情報リスト504に登録する。
また、連結情報生成部110は、URL情報記憶部101に記憶されているURL情報の個別リスト202のリスト番号205が所定数、例えば、256、512、・・・に達したとき、又は、送受信制御部103から登録部104に統合指示の通知を受けたとき、カウンタiに共通文字列リスト201のリスト番号を設定する。まず、初期値「0」とする。次に、連結情報リスト203に共通文字列リスト201のリスト番号iの連結情報が複数あるか否かを判定し、あるときには、そのうち1つの連結情報の個別文字列リスト202のリスト番号207をワイルドカードを示す「0」に変換し、他の同一の共通文字列リスト201のリスト番号iの連結情報を削除する。これによって、個別文字列データだけが異なるURLの文字列データは、1つだけ登録されることになる。
【0039】
連結情報リスト203に未処理の連結情報があるときには、カウンタiを「1」ずつインクリメントして上記処理を繰り返す。連結情報リスト203に未処理の連結情報209がなくなると、連結情報リスト203の連結情報209に登録されている個別文字列リスト202のリスト番号以外の個別文字列データ206を個別文字列リスト202から削除する。これによって、個別文字列リスト203の登録内容が統合され記憶領域を有効化することができる。
【0040】
具体例として、図2に示した個別文字列リスト202を統合する。
連結情報生成部110は、共通文字列リスト201のリスト番号205が同一の連結情報が複数あるか否かを連結情報リスト203の前半2バイト210を調べて判定する。1行目〜3行目までの連結情報が共通文字列リスト201のリスト番号「0」を示し、5行目〜6行目がリスト番号「2」を示している。これらを個別文字列リスト202のリスト番号「0」のワイルドカードで統合する。これによって、連結情報リスト203は、図6の連結情報リスト601に更新される。連結情報リスト203の1行目〜3行目は連結情報602に、連結情報リスト203の4行目は、そのまま連結情報603に、連結情報リスト203の5行目〜6行目は連結情報604になる。
【0041】
連結情報生成部110は、連結情報リスト601の後半2バイト605に登録されているリスト番号の文字列データを個別文字列リスト606に残し、削除されたリスト番号に対応する文字列データを削除する。
これによって、個別文字列リスト606と連結情報リスト601との記憶領域が削減される。
【0042】
また、分類部109は、共通文字列リスト201のリスト番号が所定値R、例えば、256、512、・・・に達したとき、共通文字列リスト202の文字列データのパス名の一部まで一致する文字列データを共通文字列リスト202の文字列データに残し、パス名の残部の一致しない部分を部分文字列データとして部分文字列リストに新規に登録する。
【0043】
これに対応して、連結情報リストは、前半2バイトは、共通文字列リストのリスト番号で同様であるが、後半2バイトのうち上位1バイトが部分文字列リストのリスト番号に対応し、下位1バイトが個別文字列リストのリスト番号に対応するよう変更される。
具体例を図7を用いて説明する。
【0044】
URL情報記憶部101には、図7の上段に示した共通文字列リスト701、個別文字列リスト702と連結情報リスト703が記憶されている。
共通文字列リスト701のリスト番号「255」まで文字列データが登録されると、リスト番号「0」と「1」とで共通部分「132.182.210/main」があり、一致しない部分「/01」と「/02/pp」とを部分文字列リストに部分文字列データとして登録する。
【0045】
図7の下段には、このようにして更新されたURL情報が示されている。
共通文字列リスト704では、文字列データに共通する部分があったリスト番号「0」、「1」に共通文字列部分を残して、部分文字列リスト705にその一致しない部分が部分文字列データとして登録されている。
共通文字列リスト701では、リスト番号「0」〜「3」の領域を用いたのが共通文字列リスト704では、リスト番号「0」,「1」の領域を用いるだけで済む。ただし、部分文字列リスト705を新規に設けたけれども、記憶領域を全体として削減することができる。
【0046】
なお、個別文字列リスト702に変更はない。
また、連結情報リスト706では、各連結情報の上位2バイト707に共通文字列リスト704のリスト番号が、中位1バイト708に部分文字列リスト705のリスト番号が、下位1バイト709に個別文字列リスト702のリスト番号がそれぞれ記録されている。
【0047】
削除部105は、送受信制御部103から削除要求とURLの文字列データとの通知を受けると、URL情報記憶部101に記憶されているURL情報のうち、共通文字列リスト201を先ず参照し、共通文字列リスト201の最初のリスト番号の文字列データから順に、通知された文字列データと一致するか、通知された文字列データに含まれるかを判定する。一致する場合には、共通文字列リスト201から当該文字列データを削除する。通知された文字列データに含まれると判定したときは、当該文字列データに連結情報203で連結される個別文字列リスト202の文字列データを連結し、次知されたURLの文字列データと一致するか判定する。一致しないとき、連結情報が複数あるときは、各々について判定する。一致しないとき、また通知された文字列データに含まれないと判定したとき、削除要求部112に送受信制御部103、送受信部102を介して削除不可である旨を通知する。
【0048】
一致するときには、当該連結情報を連結情報リスト203から削除し、連結した共通文字列リスト201の文字列データと個別文字列リスト202の文字列データとが他の連結情報に利用されているか否かを判定し、利用されていなければ、文字列データを削除する。
検索部106は、送受信制御部103から検索要求とURLの文字列データとの通知を受けると、URL情報記憶部101に記憶されている共通文字列リスト201から順次文字列データを読み出し、通知された文字列データと一致するか、一致しないときは通知された文字列データに含まれるか否かを判定する。通知された文字列データと一致するときは、有害サイトである旨を送受信制御部103、送受信部102を介して、検索要求部113に通知する。読み出した文字列が通知された文字列データに含まれないときは、送受信制御部103を介して、有害サイトでない旨を検索要求部113に通知する。
【0049】
通知された文字列データに含まれるときは、連結情報に示される個別文字列リストの文字列データを連結して、通知された文字列データと一致するか否かを判定する。一致すれば、有害サイトである旨を通知し、一致しなければ有害サイトでない旨を通知する。
検索部106は、URLの文字列データが全てそのまま一覧リストとして登録されているよりも、共通文字列リスト201に分類部109で分類された文字列データが登録されている方が、検索対象の文字列データの数が少ないので、効率的に検索することができるので、検索の高速化を図ることができる。
【0050】
次に、本実施の形態の動作を図8から図14のフローチャートを用いて説明する。
先ず、図8、図9のフローチャートにより、URLの文字列データの登録処理を説明する。
送受信制御部103は、送受信部102からURLの文字列データの通知を受けると、登録要求か否かを判定し(S802)、登録要求でなければ、削除要求か否かを判定し(S804)、削除要求であれば、後述する削除処理に移り(S806)、削除要求でなければ、検索要求であるか否かを判定し(S808)、検索要求であれば検索処理に移り(S810)、検索要求でなければS802に戻る。登録要求であれば、登録部104にURLの文字列データと登録要求とを通知する(S812)。
【0051】
登録部104において、分割部107は、分割ルールに従い、通知されたURLの文字列データを先頭部分と後続部分とに分割する(S814)。
判定部108は、URL情報記憶部101に記憶されている共通文字列リスト201の文字列データ204中に先頭部分の文字列データを含むか否かを判定する(S816)。含まないとき、分類部109にURLの文字列データを通知する。分類部109は、共通文字列リストにURLの文字列データをそのまま登録し(S818)、S802に戻る。
【0052】
含むと判定したとき、共通文字列リスト201の文字列データ204中に一致しない部分を含むか否かを判定する(S820)。一致しない部分を含まないとき、即ち、同一文字列データがあるときには、S902に移る。
一致しない部分を含むとき、一致しない部分が個別文字列リスト202の文字列データ206中にあるか否かを判定する(S822)。
【0053】
分類部109は、ないと判定されたとき、一致しない部分を共通文字列リスト201の一致しない部分を含むとした文字列データから削除し(S824)、一致しない部分を個別文字列リスト202の文字列データとして登録し(S826)、S830に移る。あると判定されたとき、一致しない部分を同様に共通文字列リスト201の文字列データから削除する(S828)。
【0054】
連結情報生成部110は、連結情報を生成し、連結情報リスト203に登録する(S830)。
S902において、判定部108は、分割された後続部分の文字列データが個別文字列リスト202の文字列データ206中にあるか否かを判定する。
あるときには、連結情報生成部110は、連結情報を生成し(S904)、生成した連結情報が既に登録されている連結情報リスト203の連結情報209と一致するか否かを判定し(S906)、一致しなければ連結情報を連結情報リスト203に登録し(S908)、S802に戻る。一致するときは、既にURLの文字列データは登録されているのでS802に戻る。
【0055】
S902において、ないと判定されたとき、分類部109は、個別文字列リスト202に後続部分の文字列データを登録する(S910)。
続いて、連結情報生成部110は、連結情報を生成し、連結情報リスト203に登録し(S912)、S802に戻る。
次に、個別文字列リスト202の統合処理の動作を図10のフローチャートを用いて説明する。
【0056】
連結情報生成部110は、個別文字列リスト202のリスト番号が所定値になったか判定し(S1002)、所定値Rであれば共通文字列リスト201のリスト番号のカウンタiを初期値「0」にセットする(S1006)。所定値でないときには、登録要求部111から個別文字列リスト202の文字列データの統合指示が通知されたか否かを判定し(S1004)、統合指示があればS1006に移り、なければS1002に戻る。
【0057】
連結情報生成部110は、連結情報リスト203に共通文字列リスト201のリスト番号iの連結情報が複数あるか否かを判定する(S1008)。なければS1012に移る。
複数あるときは、その内一つの連結情報の個別文字列リスト202のリスト番号をワイルドカードのリスト番号「0」に変更し、その他の連結情報を削除する(S1010)。
【0058】
連結情報生成部110は、連結情報リスト203に未処理の連結情報があるか否かを判定し(S1012)、あるときには、カウンタiに「1」を加えて(S1014)、S1008に戻る。ないときには、連結情報リスト203に登録されている個別文字列リスト202のリスト番号以外の文字列データを個別文字列リストから削除して(S1016)、処理を終了する。
【0059】
このように個別文字列リスト202の文字列データを統合することによって、個別文字列リスト202の記憶領域の削減を図ることができる。
次に、共通文字リストの文字列データ中のパス名部分が一部一致するとき、一部一致する部分を共通文字列リストの文字列データに残し、一致しない部分を部分文字列データとして新たに部分文字列リストを生成する動作を図11、図12のフローチャートを用いて説明する。
【0060】
分類部109は、共通文字列リスト201のリスト番号が所定値Rに達するのを待ち(S1102)、共通文字列リスト201のリスト番号iを示すカウンタiを「0」に初期化する(S1104)。更に、共通文字列リスト201の文字列データに共通する部分のある文字列データの数を示すカウンタmを「0」に初期化し(S1106)、K(m)=0を設定し(S1108)、カウンタjにi+1を設定する(S1110)。
【0061】
次に、分類部109は、共通文字列リスト202のリスト番号iとリスト番号jとの文字列データに共通する部分があるか否かを判定し(S1112)、なければS1120に移る。あるときには、K(m)=jを記憶しておき(S1114)、mmax=K(m)とする(S1116)。次にカウンタmに「1」を加え(S1118)、S1120においてカウンタjに「1」を加える。
【0062】
分類部109は、j≧Rか否かを判定し(S1122)、否であればS1112に戻り、肯定であれば、K(m)≠0であるか否かを判定し(S1124)、否であればS1210に移り、肯定であれば共通文字列リスト202のリスト番号iの文字列データから共通しない部分を削除する(S1202)。
次に、分類部109は、共通文字列リスト201のリスト番号K(m),(m=0〜mmax)の文字列データを削除し(S1204)、共通文字列リスト202のリスト番号i,K(m),(m=0〜mmax)の文字列データの共通しない部分を部分文字列データとして新たな部分文字列リスト705に登録する。この際、部分文字列データにリスト番号を付与する(S1206)。
【0063】
連結情報生成部110は、連結情報の共通文字列リスト番号iと個別文字列リスト番号との間に、部分文字列のリスト番号を挿入して連結情報リストを更新する(S1208)。
S1210において、分類部109は、カウンタiに「1」を加え(S1210)、i≧Rか否かを判定し(S1212)、否であればS1106に戻り、肯定であれば処理を終了する。
【0064】
次に、登録されているURLの文字列データの削除処理の動作について図13のフローチャートを用いて説明する。
削除部105は、送受信制御部103から削除要求とURLの文字列データとの通知を受けると、共通文字列リスト201から文字列データを1つ読み出す(S1302)。
【0065】
通知された文字列データと一致するか否か判定し(S1304)、一致するときは、当該文字列データを共通文字列リスト201から削除して(S1306)、処理を終了する。
一致しないときは、通知されたURLの文字列データに読み出した文字列データが含まれるか否かを判定する(S1308)。否のときには、共通文字列リスト201に文字列データはまだあるか否かを判定する(S1310)。あるときには、S1302に戻る。ないときには、削除不可通知を送受信制御部103、送受信部102を介して削除要求部112に通知し(S1312)、処理を終了する。
【0066】
S1308において、含まれると判定したとき、当該文字列データと連結情報で示される個別文字列リストの文字列データを連結し(S1314)、通知されたURLの文字列と一致するか否かを判定する(S1316)。一致しないときは、当該文字列データの連結情報がまだあるか否かを判定する(S1318)。なければS1312に移り、あるときにはS1314に戻る。
【0067】
S1316において、一致すると判定したとき、連結情報を削除する(S1320)。
次に、削除部105は、他の連結情報に共通文字列リスト201又は個別文字列リスト202に削除した連結情報の文字列データが利用されているか否かを判定する(S1322)。肯定であれば処理を終了し、利用されていないときは、当該文字列データを共通文字列リスト201又は個別文字列リスト202から削除して(S1324)、処理を終了する。
【0068】
次に、検索処理の動作について図14のフローチャートを用いて説明する。
検索部106は、送受信制御部103からURLの文字列データと検索要求との通知を受けると、共通文字列リスト202から文字列データを1つ読み出し(S1402)、通知されたURLの文字列データと一致するか否かを判定する(S1404)。一致すると判定したときは、S1412に移り、一致しないと判定したときは、通知されたURLの文字列データに読み出した文字列データが含まれるか否かを判定する(S1406)。含まれると判定したときは、連結情報に示される個別文字列リスト202の文字列データを連結し(S1408)、通知されたURLの文字列と一致するか否かを判定する(S1410)。一致するときは、有害サイトである旨を検索要求部113に送受信部102等を介して通知し(S1412)、処理を終了する。
【0069】
一致しないときは、まだ連結情報があるか否かを判定し(S1414)、あるときはS1408に戻り、ないときはS1418に移る。
S1406において、含まれないときには、共通文字列リスト202に文字列データがまだあるか否かを判定し、(S1416)、あればS1402に戻り、ないときは、有害サイトでない旨を検索要求部113に送受信部102等を介して通知し(S1418)、処理を終了する。
【0070】
なお、上記実施の形態において、登録要求を受けたURLを表す文字列データの先頭部分の文字列データがURL情報記憶部101の共通文字列リスト201の各共通文字列データ204と一致しないとき、共通文字列リスト201の共通文字列データ204に、URLを表す文字列データをそのまま分類部109が登録するようにしたけれども、分割部107で分割された先頭部分の文字列データを共通文字列リスト201に、後続部分の文字列データを個別文字列リスト202にそれぞれ登録し、連結情報を生成して登録するようにしてもよい。
【0071】
図15は、本実施の形態の変形例によるURL情報記憶部のURL情報の一例を示している。
本変形例では、分割部107は、分割ルールとして、URLの文字列データを宛先ホストの文字列データとパス名の文字列データとファイル名の文字列データとの3部分に分割することを予め記憶している。
【0072】
通知されたURLの文字列データは、分割部107で分割され、判定部108でそれぞれ同一の文字列データが既に登録されているか判定され、同一の文字列データが登録されていないとき、分類部109で、宛先ホストリスト1501、パス名リスト1502、ファイル名リスト1503にそれぞれ登録される。
連結情報生成部110は、宛先ホストリスト1501、パス名リスト1502とファイル名リスト1503の各リスト番号を記載した連結情報1504を生成し、連結情報1504の一覧である連結情報リスト1505に登録する。連結情報1504の各リスト番号の文字列データを連結すると、通知されたURLの文字列データが復元できるようにする。
【0073】
連結情報1504の上位1バイト1506は、宛先ホストリスト1501のリスト番号を示し、中位1バイト1507はパス名リスト1502のリスト番号を示し、下位2バイト1508はファイル名リスト1503のリスト番号を示している。
なお、他の構成は、上記実施の形態と同様であるので説明を省略する。
【0074】
なお、上記各実施の形態では、URL管理装置は、有害サイトのURLを登録するものとして説明したけれども、これに限るものではなく、URLのアクセスログを記録するため等に用いられてもよいのは勿論である。
また、上記各実施の形態ではその構成を図1の構成図により示したけれども、各構成部分の機能をコンピュータに発揮させるプログラムにより実現することができる。
【0075】
【発明の効果】
以上説明したように、本発明は、URLを表す文字列データを2分割した先頭側の共通文字列データと、後側の個別文字列データと、両文字列データを識別子で連結した連結情報とを記憶する記憶手段と、URLを表す文字列データと登録要求とを受信する受信手段と、受信した文字列データを2分割する分割手段と、分割された各文字列データと、前記記憶手段に記憶された対応する部分の共通文字列データ又は個別文字列データとが一致するか否かを判定する判定手段と、一致しないと判定されたとき、各文字列データを前記共通文字列データ又は個別文字列データとして登録し、一致すると判定されたとき、前記共通文字列データ又は個別文字列データの登録に換えて、前記連結情報を登録する登録手段とを備えることとしている。このような構成によって、URLを表す文字列データを記憶するURL情報記憶手段の記憶容量を重複した文字列データの登録を省き、削減することができる。
【0076】
また、前記分割手段は、分割ルールを予め記憶しており、分割ルールは、URLを表す文字列データをパス名迄の先頭側の文字列データと、ファイル名以降の後側の文字列データとに分割することであることとしている。このような構成によって、URLの文字列データがリンク構造になっているという性質を利用して、共通文字列データと個別文字列データとの2つの部分に分割して記憶領域の有効利用を図っている。
【0077】
また、前記記憶手段には、共通文字列データとその識別子とを登録した共通文字列データの一覧リストと、個別文字列データとその識別子とを登録した個別文字列データの一覧リストと、連結情報を登録した連結情報の一覧リストとが記憶されており、前記判定手段は、前記先頭側の文字列データが共通文字列データの一覧リストに登録された共通文字列データに存在するか否かを判定する第1判定部と、存在すると判定されたとき、前記共通文字列データの一覧リストの当該共通文字列データに一致しない部分が存在するか否かを判定する不一致判定部と、不一致判定部で存在すると判定されたとき、一致しない部分が個別文字列データの一覧リストに登録されているか否かを判定する第2判定部と、前記第1判定部で存在すると判定されたとき、前記後側の文字列データが個別文字列データの一覧リストに登録された個別文字列データと一致するか否かを判定する第3判定部とを有し、前記登録手段は、前記第1判定部で否と判定されたとき、共通文字列データの一覧リストに当該URLを表す文字列データをそのまま登録する第1登録部と、前記不一致判定部で存在すると判定され、かつ前記第2判定部で登録されていると判定されたとき、登録されている共通文字列データから不一致部分を削除する削除部と、前記不一致判定部で存在すると判定され、かつ前記第2判定部で登録されていないと判定されたとき、共通文字列データの一覧リストに登録された当該共通文字列データから不一致部分を削除し、個別文字列データの一覧リストに当該不一致部分を個別文字列データとして登録する削除登録部と、前記第1判定部で存在すると判定され、前記第3判定部で否と判定されたとき、個別文字列データの一覧リストに当該後側の文字列データを登録する第2登録部とを有し、URL管理装置は、更に、前記削除部で不一致部分が削除されたとき、前記削除登録部で当該不一致部分が登録されたとき、前記第2登録部で当該後側の文字列データが登録されたとき、及び前記第1判定部で存在すると判定され、前記第3判定部で一致すると判定されたとき、連結情報を生成する連結情報生成手段を備え、前記登録手段は、同一の連結情報が連結情報の一覧リストに存在しないとき、生成された連結情報を連結情報の一覧リストに登録することとしている。このような構成によって、URLの文字列データの登録の際に、共通文字列データと個別文字列データとの重複した登録を完全に排除することができる。
【0078】
また、前記共通文字列データの識別子は、共通文字列データの一覧リストに付されたリスト番号であり、前記個別文字列データの識別子は、個別文字列データの一覧リストに付されたリスト番号であり、前記連結情報は、両リスト番号を併記することでURLを表す文字列データを復元できるようにしていることとしている。このような構成によって、登録されたURLを表す文字列データは、連結情報によって、共通文字列データと個別文字列データとを連結することで復元することができる。
【0079】
また、前記個別文字列データの一覧リストには、任意の文字列データを表すワイルドカードを含み、前記連結情報生成手段は、連結情報の一覧リスト中の連結情報に共通文字列データのリスト番号が同一で個別文字列データのリスト番号が異なる連結情報が複数ある場合、当該一の連結情報の個別文字列データのリスト番号をワイルドカードのリスト番号に変更し、当該他の連結情報を削除するワイルドカード発行部と、前記個別文字列データの当該異なるリスト番号の個別文字列データが他の共通文字列データのリスト番号とともに連結情報に併記されていないときには、当該個別文字列データを個別文字列データの一覧リストから削除する削除部とを有することとしている。このような構成によって、個別文字列データであるファイル名が異なっても同一の提供者のサイトであると看做される個別文字列データをワイルドカードで1つにまとめて、個別文字列データの記憶容量を減らすことができる。
【0080】
また、前記記憶手段に記憶されている共通文字列データの一覧リストに登録された各共通文字列データのパス名部分の途中まで一致する場合に、共通部分を共通文字列データの一覧リストに残し、一致しない部分を部分文字列データの一覧リストにリスト番号を付して生成する部分文字列データ生成手段と、生成された部分文字列データの一覧リストを前記記憶手段に登録するリスト登録手段と、前記連結情報の一覧リストに部分文字列データを特定できるよう前記リスト番号を追記して連結情報を更新する連結情報更新手段とを更に備えることとしている。このような構成によって、共通文字列データの記憶容量を更に減らすことができる。
【0081】
また、前記受信手段は、更にURLを表す文字列データと削除要求とを受信し、前記記憶手段に記憶されている共通文字列データが受信された文字列データに含まれるか、全部一致するか又は一致しないかを判定する第1判定手段と、含まれると判定されたとき、前記連結情報に示される個別文字列データを共通文字列データに連結した文字列データが受信された文字列データと一致するか否かを判定する第2判定手段と、前記第1判定手段で全部一致すると判定されたとき、当該共通文字列データを削除する第1削除手段と、前記第2判定手段で一致すると判定されたとき、当該連結情報を削除し、他の連結情報に当該共通文字列データ又は当該個別文字列データを示す識別子が記載されていないとき、当該共通文字列データ又は当該個別文字列データを削除する第2削除手段と、前記第1、第2判定手段で一致しないと判定されたとき、削除すべきURLを表す文字列データが登録されていない旨を削除要求の送信元に通知する通知手段とを更に備えることとしている。このような構成によって、一旦登録したURLの文字列データの登録が不要となったとき、削除要求により迅速に削除することができる。
【0082】
また、前記受信手段は、更にURLを表す文字列データと検索要求とを受信し、前記記憶手段に記憶されている共通文字列データが受信された文字列データに含まれるか、全部一致するか又は一致しないかを判定する第1判定手段と、含まれると判定されたとき、前記連結情報に示される個別文字列データを共通文字列データに連結した文字列データが受信された文字列データと一致するか否かを判定する第2判定手段と、前記第1判定手段で全部一致すると判定されたとき、又は前記第2判定手段で一致すると判定されたとき、当該URLで特定されるサイトが有害サイトである旨を検索要求の送信元に通知し、前記第1、第2判定手段で一致しないと判定されたとき、当該URLで特定されるサイトは有害サイトでない旨を検索要求の送信元に通知する通知手段とを更に備えることとしている。このような構成によって、URL管理装置に登録されている有害サイトのURLであるか否かを迅速に検索することが可能となる。
【0083】
また、URLを表す文字列データを3部分に分割した部分文字列データと各部分を識別子で連結する連結情報とを登録する記憶手段と、URLを表す文字列データと登録要求とを受信する受信手段と、受信した文字列データを3部分の部分文字列データに分割する分割手段と、分割された各部分文字列データと、前記記憶手段に記憶された対応する部分の部分文字列データとが一致するか否かを判定する判定手段と、一致しないと判定された分割された各部分文字列データを対応する部分の部分文字列データとして登録し、一致すると判定された当該部分文字列データを前記URL情報記憶手段に部分文字列データの登録に換えて、前記連結情報にのみ登録する登録手段とを備えることとしている。このような構成によって、URLの文字列データを3部分に分割して、重複した部分文字列データの登録を排除して、記憶容量の削減を図っている。
【0084】
また、URLを表す文字列データを2分割した先頭側の共通文字列データと、後側の個別文字列データと、両文字列データを識別子で連結した連結情報とを記憶する記憶領域を有し、URLを表す文字列データと登録要求とを受信する受信ステップと、受信した文字列データを2分割する分割ステップと、分割された各文字列データと、前記記憶領域に記憶された対応する部分の共通文字列データ又は個別文字列データとが一致するか否かを判定する判定ステップと、一致しないと判定されたとき、各文字列データを前記共通文字列データ又は個別文字列データとして登録し、一致すると判定されたとき、前記共通文字列データ又は個別文字列データの登録に換えて、前記連結情報を登録する登録ステップとを有することとしている。このような方法によって、URLを表す文字列データを重複して登録することをなくし、記憶領域の効率的利用を図っている。
【0085】
また、このようなURL管理プログラムを用いることによって、メモリ容量の膨大化を防止したURL管理装置を得ることができる。
【図面の簡単な説明】
【図1】本発明に係るURL管理装置の一実施の形態の構成図である。
【図2】上記実施の形態のURL情報記憶手段に記憶されているURL情報の一例を示す図である。
【図3】上記実施の形態の登録部に通知されるURLの文字列データの一例を示す図である。
【図4】上記実施の形態の初期状態でURLの登録要求によりURL情報記憶部に登録された内容を示す図である。
【図5】上記実施の形態で図4に示す状態で更にURLの登録要求によりURL情報記憶部の内容を示す図である。
【図6】上記実施の形態で、図3に示すURL情報の個別文字列データの統合を図ったとき、更新される個別文字列リストと連結情報リストとを示す図である。
【図7】上記実施の形態で、共通文字列リストで一致する文字列データの部分を残し、一致しない部分を部分文字列リストとして生成する様子を説明する図である。
【図8】上記実施の形態のURLの文字列データの登録動作を説明するフローチャート(その1)である。
【図9】上記実施の形態のURLの文字列データの登録動作を説明するフローチャート(その2)である。
【図10】上記実施の形態のURL情報記憶部に記憶されている個別文字列データの統合動作を説明するフローチャートである。
【図11】上記実施の形態のURL情報記憶部に記憶されている共通文字列リストから部分文字列リストを生成する動作を説明するフローチャート(その1)である。
【図12】上記実施の形態のURL情報記憶部に記憶されている共通文字列リストから部分文字列リストを生成する動作を説明するフローチャート(その2)である。
【図13】上記実施の形態のURL管理装置に登録されたURLの文字列データを削除要求により削除する動作を説明するフローチャートである。
【図14】上記実施の形態のURL管理装置に登録されたURLの文字列データと検索要求されたURLの文字列データとの検索動作を説明するフローチャートである。
【図15】上記実施の形態のURL管理装置の一実施の形態の変形例のURL情報記憶部の記憶内容の一例を示す図である。
【符号の説明】
101 URL情報記憶部
102 送受信部
103 送受信制御部
104 登録部
105 削除部
106 検索部
107 分割部
108 判定部
109 分類部
110 連結情報生成部
111 登録要求部
112 削除要求部
113 検索要求部
114 回線網

Claims (11)

  1. URLを表す文字列データを2分割した先頭側の共通文字列データと、後側の個別文字列データと、両文字列データを識別子で連結した連結情報とを記憶する記憶手段と、
    URLを表す文字列データと登録要求とを受信する受信手段と、
    受信した文字列データを2分割する分割手段と、
    分割された各文字列データと、前記記憶手段に記憶された対応する部分の共通文字列データ又は個別文字列データとが一致するか否かを判定する判定手段と、
    一致しないと判定されたとき、各文字列データを前記共通文字列データ又は個別文字列データとして登録し、一致すると判定されたとき、前記共通文字列データ又は個別文字列データの登録に換えて、前記連結情報を登録する登録手段とを備えることを特徴とするURL管理装置。
  2. 前記分割手段は、分割ルールを予め記憶しており、
    分割ルールは、URLを表す文字列データをパス名迄の先頭側の文字列データと、ファイル名以降の後側の文字列データとに分割することであることを特徴とする請求項1記載のURL管理装置。
  3. 前記記憶手段には、共通文字列データとその識別子とを登録した共通文字列データの一覧リストと、個別文字列データとその識別子とを登録した個別文字列データの一覧リストと、連結情報を登録した連結情報の一覧リストとが記憶されており、
    前記判定手段は、
    前記先頭側の文字列データが共通文字列データの一覧リストに登録された共通文字列データに存在するか否かを判定する第1判定部と、
    存在すると判定されたとき、前記共通文字列データの一覧リストの当該共通文字列データに一致しない部分が存在するか否かを判定する不一致判定部と、
    不一致判定部で存在すると判定されたとき、一致しない部分が個別文字列データの一覧リストに登録されているか否かを判定する第2判定部と、
    前記第1判定部で存在すると判定されたとき、前記後側の文字列データが個別文字列データの一覧リストに登録された個別文字列データと一致するか否かを判定する第3判定部とを有し、
    前記登録手段は、
    前記第1判定部で否と判定されたとき、共通文字列データの一覧リストに当該URLを表す文字列データをそのまま登録する第1登録部と、
    前記不一致判定部で存在すると判定され、かつ前記第2判定部で登録されていると判定されたとき、登録されている共通文字列データから不一致部分を削除する削除部と、
    前記不一致判定部で存在すると判定され、かつ前記第2判定部で登録されていないと判定されたとき、共通文字列データの一覧リストに登録された当該共通文字列データから不一致部分を削除し、個別文字列データの一覧リストに当該不一致部分を個別文字列データとして登録する削除登録部と、
    前記第1判定部で存在すると判定され、前記第3判定部で否と判定されたとき、個別文字列データの一覧リストに当該後側の文字列データを登録する第2登録部とを有し、
    URL管理装置は、更に、前記削除部で不一致部分が削除されたとき、前記削除登録部で当該不一致部分が登録されたとき、前記第2登録部で当該後側の文字列データが登録されたとき、及び前記第1判定部で存在すると判定され、前記第3判定部で一致すると判定されたとき、連結情報を生成する連結情報生成手段を備え、
    前記登録手段は、同一の連結情報が連結情報の一覧リストに存在しないとき、生成された連結情報を連結情報の一覧リストに登録することを特徴とする請求項2記載のURL管理装置。
  4. 前記共通文字列データの識別子は、共通文字列データの一覧リストに付されたリスト番号であり、前記個別文字列データの識別子は、個別文字列データの一覧リストに付されたリスト番号であり、
    前記連結情報は、両リスト番号を併記することでURLを表す文字列データを復元できるようにしていることを特徴とする請求項3記載のURL管理装置。
  5. 前記個別文字列データの一覧リストには、任意の文字列データを表すワイルドカードを含み、
    前記連結情報生成手段は、
    連結情報の一覧リスト中の連結情報に共通文字列データのリスト番号が同一で個別文字列データのリスト番号が異なる連結情報が複数ある場合、当該一の連結情報の個別文字列データのリスト番号をワイルドカードのリスト番号に変更し、当該他の連結情報を削除するワイルドカード発行部と、
    前記個別文字列データの当該異なるリスト番号の個別文字列データが他の共通文字列データのリスト番号とともに連結情報に併記されていないときには、当該個別文字列データを個別文字列データの一覧リストから削除する削除部とを有することを特徴とする請求項4記載のURL管理装置。
  6. 前記記憶手段に記憶されている共通文字列データの一覧リストに登録された各共通文字列データのパス名部分の途中まで一致する場合に、共通部分を共通文字列データの一覧リストに残し、一致しない部分を部分文字列データの一覧リストにリスト番号を付して生成する部分文字列データ生成手段と、
    生成された部分文字列データの一覧リストを前記記憶手段に登録するリスト登録手段と、
    前記連結情報の一覧リストに部分文字列データを特定できるよう前記リスト番号を追記して連結情報を更新する連結情報更新手段とを更に備えることを特徴とする請求項4記載のURL管理装置。
  7. 前記受信手段は、更にURLを表す文字列データと削除要求とを受信し、
    前記記憶手段に記憶されている共通文字列データが受信された文字列データに含まれるか、全部一致するか又は一致しないかを判定する第1判定手段と、
    含まれると判定されたとき、前記連結情報に示される個別文字列データを共通文字列データに連結した文字列データが受信された文字列データと一致するか否かを判定する第2判定手段と、
    前記第1判定手段で全部一致すると判定されたとき、当該共通文字列データを削除する第1削除手段と、
    前記第2判定手段で一致すると判定されたとき、当該連結情報を削除し、他の連結情報に当該共通文字列データ又は当該個別文字列データを示す識別子が記載されていないとき、当該共通文字列データ又は当該個別文字列データを削除する第2削除手段と、
    前記第1、第2判定手段で一致しないと判定されたとき、削除すべきURLを表す文字列データが登録されていない旨を削除要求の送信元に通知する通知手段とを更に備えることを特徴とする請求項1記載のURL管理装置。
  8. 前記受信手段は、更にURLを表す文字列データと検索要求とを受信し、
    前記記憶手段に記憶されている共通文字列データが受信された文字列データに含まれるか、全部一致するか又は一致しないかを判定する第1判定手段と、
    含まれると判定されたとき、前記連結情報に示される個別文字列データを共通文字列データに連結した文字列データが受信された文字列データと一致するか否かを判定する第2判定手段と、
    前記第1判定手段で全部一致すると判定されたとき、又は前記第2判定手段で一致すると判定されたとき、当該URLで特定されるサイトが有害サイトである旨を検索要求の送信元に通知し、前記第1、第2判定手段で一致しないと判定されたとき、当該URLで特定されるサイトは有害サイトでない旨を検索要求の送信元に通知する通知手段とを更に備えることを特徴とする請求項1記載のURL管理装置。
  9. URLを表す文字列データを3部分に分割した部分文字列データと各部分を識別子で連結する連結情報とを登録する記憶手段と、
    URLを表す文字列データと登録要求とを受信する受信手段と、
    受信した文字列データを3部分の部分文字列データに分割する分割手段と、
    分割された各部分文字列データと、前記記憶手段に記憶された対応する部分の部分文字列データとが一致するか否かを判定する判定手段と、
    一致しないと判定された分割された各部分文字列データを対応する部分の部分文字列データとして登録し、
    一致すると判定された当該部分文字列データを前記URL情報記憶手段に部分文字列データの登録に換えて、前記連結情報にのみ登録する登録手段とを備えることを特徴とするURL管理装置。
  10. URLを表す文字列データを2分割した先頭側の共通文字列データと、後側の個別文字列データと、両文字列データを識別子で連結した連結情報とを記憶する記憶領域を有し、
    URLを表す文字列データと登録要求とを受信する受信ステップと、
    受信した文字列データを2分割する分割ステップと、
    分割された各文字列データと、前記記憶領域に記憶された対応する部分の共通文字列データ又は個別文字列データとが一致するか否かを判定する判定ステップと、
    一致しないと判定されたとき、各文字列データを前記共通文字列データ又は個別文字列データとして登録し、一致すると判定されたとき、前記共通文字列データ又は個別文字列データの登録に換えて、前記連結情報を登録する登録ステップとを有することを特徴とするURL管理方法。
  11. 請求項10記載のURL管理方法の各ステップの手順をコンピュータに実行させるURL管理プログラム。
JP2002358656A 2002-12-10 2002-12-10 Url管理装置及びurl管理方法並びにurl管理プログラム Pending JP2004192279A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002358656A JP2004192279A (ja) 2002-12-10 2002-12-10 Url管理装置及びurl管理方法並びにurl管理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002358656A JP2004192279A (ja) 2002-12-10 2002-12-10 Url管理装置及びurl管理方法並びにurl管理プログラム

Publications (1)

Publication Number Publication Date
JP2004192279A true JP2004192279A (ja) 2004-07-08

Family

ID=32758317

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002358656A Pending JP2004192279A (ja) 2002-12-10 2002-12-10 Url管理装置及びurl管理方法並びにurl管理プログラム

Country Status (1)

Country Link
JP (1) JP2004192279A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006221294A (ja) * 2005-02-09 2006-08-24 Nec Engineering Ltd Url検索方法及び検索装置
JP2007537626A (ja) * 2004-04-19 2007-12-20 ザ・リージェンツ・オブ・ザ・ユニバーシティ・オブ・カリフォルニア 深いパケットフィルタリングのためのプログラム可能なハードウエア
JP2010086454A (ja) * 2008-10-02 2010-04-15 Brother Ind Ltd 通信プログラム、通信装置および通信システム
CN101931660A (zh) * 2009-06-24 2010-12-29 佳能株式会社 登记信息通知目的地的数据处理装置及其方法
JP4676530B2 (ja) * 2007-11-19 2011-04-27 デュアキシズ株式会社 通信制御装置
JP2014112403A (ja) * 2014-01-16 2014-06-19 Canon Inc データ処理装置及び方法、並びにプログラム
JPWO2018159361A1 (ja) * 2017-03-03 2019-06-27 日本電信電話株式会社 攻撃パターン抽出装置、攻撃パターン抽出方法および攻撃パターン抽出プログラム

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007537626A (ja) * 2004-04-19 2007-12-20 ザ・リージェンツ・オブ・ザ・ユニバーシティ・オブ・カリフォルニア 深いパケットフィルタリングのためのプログラム可能なハードウエア
JP4755175B2 (ja) * 2004-04-19 2011-08-24 ザ・リージェンツ・オブ・ザ・ユニバーシティ・オブ・カリフォルニア 深いパケットフィルタリングのためのプログラム可能なハードウエア
JP2006221294A (ja) * 2005-02-09 2006-08-24 Nec Engineering Ltd Url検索方法及び検索装置
JP4676530B2 (ja) * 2007-11-19 2011-04-27 デュアキシズ株式会社 通信制御装置
US8271496B2 (en) 2008-10-02 2012-09-18 Brother Kogyo Kabushiki Kaisha Computer-readable media, communication apparatus, and communication system
JP2010086454A (ja) * 2008-10-02 2010-04-15 Brother Ind Ltd 通信プログラム、通信装置および通信システム
JP4636157B2 (ja) * 2008-10-02 2011-02-23 ブラザー工業株式会社 通信プログラム、通信装置および通信システム
CN101931660A (zh) * 2009-06-24 2010-12-29 佳能株式会社 登记信息通知目的地的数据处理装置及其方法
US8527643B2 (en) 2009-06-24 2013-09-03 Canon Kabushiki Kaisha Data processing apparatus that registers information notification destination and method therefor, and storage medium
CN101931660B (zh) * 2009-06-24 2013-11-27 佳能株式会社 登记信息通知目的地的数据处理装置及其方法
JP2014112403A (ja) * 2014-01-16 2014-06-19 Canon Inc データ処理装置及び方法、並びにプログラム
JPWO2018159361A1 (ja) * 2017-03-03 2019-06-27 日本電信電話株式会社 攻撃パターン抽出装置、攻撃パターン抽出方法および攻撃パターン抽出プログラム
US11244048B2 (en) 2017-03-03 2022-02-08 Nippon Telegraph And Telephone Corporation Attack pattern extraction device, attack pattern extraction method, and attack pattern extraction program

Similar Documents

Publication Publication Date Title
JP5509596B2 (ja) データ管理装置
US8150823B2 (en) Private searching on a public search engine
WO2011004846A1 (ja) 情報検索システム、情報管理装置、情報検索方法、情報管理方法、及び、記録媒体
JP2000089988A (ja) 文書プロパティに基づく自己管理型文書の文書管理方法
JP2002099454A (ja) ファイル管理システムおよび方法
CN107590145A (zh) 一种页面静态资源的处理方法和装置
US20200142674A1 (en) Extracting web api endpoint data from source code
JP2003076715A (ja) ウェブページ検索方法、ウェブページ検索装置、プログラム、および記録媒体
CN106407442A (zh) 一种海量文本数据处理方法及装置
CN109947759A (zh) 一种数据索引建立方法、索引检索方法及装置
JP2003173280A (ja) データベース生成装置、データベース生成方法及びデータベース生成プログラム
CN104636368B (zh) 数据检索方法、装置及服务器
JP2004192279A (ja) Url管理装置及びurl管理方法並びにurl管理プログラム
JP3848209B2 (ja) データ転送装置、データ転送方法及びプログラム
US20080082516A1 (en) System for and method of searching distributed data base, and information management device
US20090248673A1 (en) Method of sorting web pages, search terminal and client terminal
JP2008204198A (ja) 情報提供システム、及び、情報提供プログラム
CN111797147A (zh) 一种数据处理方法及装置、电子设备
JP2002140218A (ja) データ処理方法、コンピュータ読み取り可能な記録媒体及びデータ処理装置
US9996621B2 (en) System and method for retrieving internet pages using page partitions
JP2636806B2 (ja) インデックス更新方式
Qinglin et al. A large-scale URL filtering algorithm in high-speed flow
JPH10207758A (ja) ホームページ分析表示システム
JPH11265402A (ja) データ処理システム及びデータ処理システムを制御するプログラムを記録した記録媒体
JPH02297282A (ja) 文書処理装置