JP2002132976A - Homepage management device and method, homepage evaluation device and recording medium - Google Patents
Homepage management device and method, homepage evaluation device and recording mediumInfo
- Publication number
- JP2002132976A JP2002132976A JP2000322631A JP2000322631A JP2002132976A JP 2002132976 A JP2002132976 A JP 2002132976A JP 2000322631 A JP2000322631 A JP 2000322631A JP 2000322631 A JP2000322631 A JP 2000322631A JP 2002132976 A JP2002132976 A JP 2002132976A
- Authority
- JP
- Japan
- Prior art keywords
- homepage
- url
- correlation
- text
- correlation value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 30
- 238000011156 evaluation Methods 0.000 title claims description 11
- 238000005259 measurement Methods 0.000 claims abstract description 17
- 238000001514 detection method Methods 0.000 claims abstract description 16
- 238000000605 extraction Methods 0.000 claims abstract description 16
- 239000000284 extract Substances 0.000 claims abstract description 5
- 238000007726 management method Methods 0.000 claims description 27
- 239000003086 colorant Substances 0.000 claims description 10
- 238000012544 monitoring process Methods 0.000 abstract description 15
- 238000012545 processing Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 238000005314 correlation function Methods 0.000 description 2
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 2
- 239000010931 gold Substances 0.000 description 2
- 229910052737 gold Inorganic materials 0.000 description 2
- 230000037308 hair color Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Transfer Between Computers (AREA)
Abstract
Description
【0001】[0001]
【発明の属する技術分野】この発明は、インターネット
において提供されるホームページの管理装置及び方法、
ホームページ評価装置及び当該方法を実施するためのプ
ログラムを記録した媒体に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an apparatus and a method for managing home pages provided on the Internet.
The present invention relates to a homepage evaluation device and a medium recording a program for implementing the method.
【0002】[0002]
【従来の技術】インターネットの普及に伴い、通常の社
会で発生するさまざまな現象や問題がインターネットの
中でも発生するようになってきている。多くの場合、利
用者がISP(Internet Service Provider)と契約し、そ
のホームページサーバを借りて自分のホームページを構
築する。ISPは利用者(制作者)の委託を受け、インタ
ーネットからの閲覧に供するための設備を設置し、これ
の維持保守を行っている。2. Description of the Related Art With the spread of the Internet, various phenomena and problems that occur in ordinary society have been occurring on the Internet. In many cases, users contract with an ISP (Internet Service Provider) and rent their homepage server to build their own homepage. ISPs are commissioned by users (producers) to install and maintain equipment for browsing from the Internet.
【0003】しかし、ISPは、表現の自由の問題と関連
して、その内容までは吟味することができない。そのた
め、公序良俗に反するページが多数公開されている状況
にある。もっとも、公開されているページを監視しよう
としても、そのページ数の多さのため、それらを取り締
まるために有効な手法がないという問題がある。一方、
利用者の良心に依存した相互監視を行い、有害だと思わ
れるページの公開中止を、公開を請け負っているISPに
転嫁しようとする問題もある。[0003] However, ISPs cannot examine their contents in connection with the problem of freedom of expression. As a result, many pages that are offensive to public order and morals are open to the public. However, even when trying to monitor published pages, there is a problem that there is no effective method to control them because of the large number of pages. on the other hand,
There is also a problem that mutual surveillance depends on the conscience of the user, and attempts to transfer the cancellation of the release of pages deemed to be harmful to the ISP that has contracted to release them.
【0004】[0004]
【発明が解決しようとする課題】この発明は、ISP自ら
が公開を請け負っているホームページを自律的に監視
し、公開することにより、問題がある(例えば公序良俗
に反する)と判断されるページを自発的に公開中止に誘
導することができるホームページの管理装置及び方法、
ホームページ評価装置及び当該方法を実施するためのプ
ログラムを記録した媒体を提供することを目的とする。SUMMARY OF THE INVENTION The present invention spontaneously monitors a homepage for which an ISP has been contracted to make it open to the public, and spontaneously generates a page determined to have a problem (for example, against public order and morals). Homepage management device and method that can lead to the suspension of publication
It is an object of the present invention to provide a medium on which a homepage evaluation device and a program for executing the method are recorded.
【0005】[0005]
【課題を解決するための手段】係る課題を解決するため
に、この発明に係るホームページ管理装置は、制作者が
作成したホームページを登録してインターネットからの
閲覧に供するホームページサーバと、該ホームページヘ
のインターネットからのアクセスをアクセス制限リスト
に基づき制御するアクセス制御部とを備えるインターネ
ット・サービス・システムを管理するためのホームペー
ジ管理装置であって、ホームページを指示するURL(Uni
form Resource Locator)毎にアクセス数を計測するア
クセス数計測部と、該アクセス数計測部の計測結果に基
づいて予め定められた数以上のアクセスが計測されたUR
Lリストを作成する人気URL抽出部と、該人気URL抽出部
により作成された前記URLリストに記載されたURLの内容
を照合用データベースと照合して相関値を算出する相関
検出部と、該相関検出部の出力する相関値リストのうち
予め定められた相関値を超えているURLを禁止アドレス
と定義し、該禁止アドレスを前記アクセス制限リストに
追加する禁止アドレス生成部とを備えるものである。[MEANS FOR SOLVING THE PROBLEMS] In order to solve the above problems, a homepage management apparatus according to the present invention includes a homepage server for registering a homepage created by a creator and providing the homepage for browsing from the Internet. A home page management device for managing an Internet service system comprising an access control unit for controlling access from the Internet based on an access restriction list, wherein the URL (Uni
form Resource Locator) and an UR in which the number of accesses equal to or greater than a predetermined number is measured based on the measurement result of the access number measurement unit.
A popular URL extracting unit that creates an L list; a correlation detecting unit that calculates a correlation value by comparing the contents of the URLs described in the URL list created by the popular URL extracting unit with a matching database; A URL that exceeds a predetermined correlation value in the correlation value list output by the detection unit is defined as a prohibited address, and a prohibited address generation unit that adds the prohibited address to the access restriction list.
【0006】好ましくは、前記相関検出部は、画像情報
からパターン抽出を行うパターン情報抽出部を備え、前
記相関検出部が前記ホームページサーバに登録されてい
るホームページを読み出す際に、前記パターン情報抽出
部を介して得られたパターン情報を前記照合用データベ
ースに含まれるパターン・データと照合して相関値を算
出する。Preferably, the correlation detecting section includes a pattern information extracting section for extracting a pattern from image information, and when the correlation detecting section reads a homepage registered in the homepage server, the pattern information extracting section The pattern information obtained through the above is collated with the pattern data included in the collation database to calculate a correlation value.
【0007】好ましくは、前記相関検出部は、画像情報
から文字情報を抽出する文字情報抽出部を備え、前記相
関検出部が前記ホームページサーバに登録されているホ
ームページを読み出す際に、前記文字情報抽出部を介し
て得られた文字列を前記照合用データベースに含まれる
テキスト・データと照合して相関値を算出する。Preferably, the correlation detecting section includes a character information extracting section for extracting character information from image information. When the correlation detecting section reads a homepage registered in the homepage server, the correlation detecting section extracts the character information. The character string obtained through the section is collated with text data included in the collation database to calculate a correlation value.
【0008】好ましくは、前記相関検出部は、テキスト
・データを抽出するテキスト抽出部を備え、前記相関検
出部が前記ホームページサーバに登録されているホーム
ページを読み出す際に、前記テキスト抽出部を介して得
られた文字列を前記照合用データベースに含まれるテキ
スト・データと照合して相関値を算出する。Preferably, the correlation detection unit includes a text extraction unit for extracting text data. When the correlation detection unit reads a homepage registered in the homepage server, the correlation detection unit transmits the text data via the text extraction unit. The obtained character string is collated with text data contained in the collation database to calculate a correlation value.
【0009】好ましくは、前記照合用データベースは、
画像を照合するための画像用パターン・データ及びテキ
ストを照合するためのテキスト用パターン・データを含
む。Preferably, the collation database comprises:
It includes image pattern data for matching images and text pattern data for matching text.
【0010】好ましくは、前記照合用データベースの前
記テキスト用パターン・データは、演奏者名、作詞・作
曲者名、曲名等の著作権に関わる情報を含む。[0010] Preferably, the text pattern data of the collation database includes information related to copyright, such as a player name, a lyric / composer name, and a song name.
【0011】好ましくは、前記照合用データベースの前
記テキスト用パターン・データは、公序良俗に反するよ
うな情報を含む。Preferably, the text pattern data of the collation database includes information that is against public order and morals.
【0012】好ましくは、前記照合用データベースの前
記画像用パターン・データは、CDジャケット、本の表紙
等の著作権に関する情報を含む。[0012] Preferably, the image pattern data of the collation database includes information on copyright such as a CD jacket and a book cover.
【0013】好ましくは、前記照合用データベースの前
記画像用パターン・データは、ひとつ又は複数の予め定
められた色彩及び当該色彩で表示される領域の大きさに
関する情報を含み、前記相関検出部は、前記URLの内容
に含まれる画像のうちで前記予め定められた色彩に一致
する領域を求め、その割合を相関値として出力し、前記
禁止アドレス生成部は、前記相関値が前記画像用パター
ン・データに含まれる領域の大きさを超えるときに前記
URLを禁止アドレスと定義する。Preferably, the image pattern data of the collation database includes one or a plurality of predetermined colors and information on a size of an area displayed by the colors, and the correlation detection unit includes: In the image included in the content of the URL, an area that matches the predetermined color is obtained, and the ratio is output as a correlation value. When the size of the area included in the
Define a URL as a prohibited address.
【0014】この発明に係るホームページ評価装置は、
画像を照合するための画像用パターン・データ及びテキ
ストを照合するためのテキスト用パターン・データを含
む照合用データベースと、ホームページを指示するURL
(Uniform Resource Locator)毎にその内容を前記照合
用データベースと照合して相関値を算出し、これをURL
の評価値として出力する相関検出部とを備えるものであ
る。[0014] The homepage evaluation device according to the present invention comprises:
A matching database containing image pattern data for matching images and text pattern data for matching text, and a URL pointing to a home page
For each (Uniform Resource Locator), the content is checked against the matching database to calculate a correlation value, and this is used as a URL.
And a correlation detection unit that outputs the evaluation value.
【0015】好ましくは、前記相関検出部は、画像情報
からパターン抽出を行うパターン情報抽出部を備え、前
記相関検出部が前記ホームページを読み出す際に、前記
パターン情報抽出部を介して得られたパターン情報を前
記照合用データベースに含まれるパターン・データと照
合して相関値を算出する。Preferably, the correlation detecting section includes a pattern information extracting section for extracting a pattern from image information, and when the correlation detecting section reads the homepage, a pattern obtained through the pattern information extracting section. The information is collated with the pattern data included in the collation database to calculate a correlation value.
【0016】好ましくは、前記相関検出部は、画像情報
から文字情報を抽出する文字情報抽出部を備え、前記相
関検出部が前記ホームページを読み出す際に、前記文字
情報抽出部を介して得られた文字列を前記照合用データ
ベースに含まれるテキスト・データと照合して相関値を
算出する。Preferably, the correlation detecting section includes a character information extracting section for extracting character information from image information, and when the correlation detecting section reads the home page, the correlation information is obtained through the character information extracting section. The character string is collated with text data included in the collation database to calculate a correlation value.
【0017】好ましくは、前記相関検出部は、テキスト
・データを抽出するテキスト抽出部を備え、前記相関検
出部が前記ホームページを読み出す際に、前記テキスト
抽出部を介して得られた文字列を前記照合用データベー
スに含まれるテキスト・データと照合して相関値を算出
する。Preferably, the correlation detecting section includes a text extracting section for extracting text data, and when the correlation detecting section reads the homepage, the correlation detecting section extracts a character string obtained through the text extracting section. The correlation value is calculated by collating with the text data included in the collation database.
【0018】この発明に係るホームページ管理方法は、
制作者が作成したホームページを登録してインターネッ
トからの閲覧に供するホームページサーバと、該ホーム
ページヘのインターネットからのアクセスをアクセス制
限リストに基づき制御するアクセス制御部と、画像を照
合するための画像用パターン・データ及びテキストを照
合するためのテキスト用パターン・データを含む前記照
合用データベースとを備えるインターネット・サービス
・システムを管理するためのホームページ管理方法であ
って、ホームページを指示するURL(Uniform Resource
Locator)毎にアクセス数を計測するアクセス数計測ス
テップと、該アクセス数計測ステップの計測結果に基づ
いて予め定められた数以上のアクセスが計測されたURL
リストを作成する人気URL抽出ステップと、該人気URL抽
出ステップにより作成された前記URLリストに記載され
たURLの内容を前記照合用データベースと照合して相関
値を算出する相関検出ステップと、該相関検出ステップ
により得られた相関値リストのうち予め定められた相関
値を超えているURLを禁止アドレスと定義し、該禁止ア
ドレスを前記アクセス制限リストに追加する禁止アドレ
ス生成ステップとを備えるものである。The homepage management method according to the present invention comprises:
A homepage server for registering a homepage created by the creator for browsing from the Internet, an access control unit for controlling access to the homepage from the Internet based on an access restriction list, and an image pattern for matching images A homepage management method for managing an Internet service system including the matching database including text pattern data for matching data and text, wherein a URL (Uniform Resource) indicating a homepage is provided.
Locator) The number of accesses that measures the number of accesses for each, and the URL where the number of accesses equal to or more than a predetermined number is measured based on the measurement result of the number of accesses measurement step
A popular URL extracting step of creating a list, a correlation detecting step of calculating a correlation value by comparing the content of the URL described in the URL list created by the popular URL extracting step with the matching database, A URL that exceeds a predetermined correlation value in the correlation value list obtained by the detection step is defined as a prohibited address, and a prohibited address generation step of adding the prohibited address to the access restriction list is provided. .
【0019】好ましくは、所定時間経過後に前記人気UR
L抽出ステップで用いる予め定められたアクセス数を減
少させるしきい値変更ステップを備え、前記しきい値変
更ステップの後に前記アクセス数計測ステップ乃至前記
禁止アドレス生成ステップを繰り返す。Preferably, after a predetermined time has passed, the popularity UR
The method further includes a threshold value changing step of reducing a predetermined number of accesses used in the L extraction step, and the access number measuring step to the prohibited address generating step are repeated after the threshold value changing step.
【0020】この発明に係る記録媒体は、制作者が作成
したホームページを登録してインターネットからの閲覧
に供するホームページサーバと、該ホームページヘのイ
ンターネットからのアクセスをアクセス制限リストに基
づき制御するアクセス制御部と、画像を照合するための
画像用パターン・データ及びテキストを照合するための
テキスト用パターン・データを含む前記照合用データベ
ースとを備えるインターネット・サービス・システムを
管理するためのホームページ管理方法をコンピュータに
実行させるためのプログラムを記録した媒体であって、
前記ホームページ管理方法は、ホームページを指示する
URL(Uniform Resource Locator)毎にアクセス数を計
測するアクセス数計測ステップと、該アクセス数計測ス
テップの計測結果に基づいて予め定められた数以上のア
クセスが計測されたURLリストを作成する人気URL抽出ス
テップと、該人気URL抽出ステップにより作成された前
記URLリストに記載されたURLの内容を前記照合用データ
ベースと照合して相関値を算出する相関検出ステップ
と、該相関検出ステップにより得られた相関値リストの
うち予め定められた相関値を超えているURLを禁止アド
レスと定義し、該禁止アドレスを前記アクセス制限リス
トに追加する禁止アドレス生成ステップとを備えること
を特徴とする。A recording medium according to the present invention includes a homepage server for registering a homepage created by a creator and providing the homepage for browsing from the Internet, and an access control unit for controlling access to the homepage from the Internet based on an access restriction list. A homepage management method for managing an Internet service system comprising: a computer; and a matching database including image pattern data for matching images and text pattern data for matching text. A medium storing a program to be executed,
The homepage management method specifies a homepage
An access number measurement step for measuring the number of accesses for each URL (Uniform Resource Locator), and a popular URL extraction for creating a URL list in which a predetermined number or more of accesses are measured based on the measurement result of the access number measurement step Step, a correlation detecting step of calculating a correlation value by comparing the contents of the URLs described in the URL list created in the popular URL extracting step with the matching database, and a correlation obtained by the correlation detecting step. A URL that exceeds a predetermined correlation value in the value list is defined as a prohibited address, and a prohibited address generating step of adding the prohibited address to the access restriction list is provided.
【0021】媒体には、例えば、フロッピー(登録商
標)ディスク、ハードディスク、磁気テープ、光磁気デ
ィスク、CD(CD−ROM、Video−CDを含
む)、DVD(DVD−Video、DVD−ROM、
DVD−RAMを含む)、ROMカートリッジ、バッテ
リバックアップ付きのRAMメモリカートリッジ、フラ
ッシュメモリカートリッジ、不揮発性RAMカートリッ
ジ等を含む。Examples of the medium include a floppy (registered trademark) disk, hard disk, magnetic tape, magneto-optical disk, CD (including CD-ROM and Video-CD), DVD (DVD-Video, DVD-ROM,
DVD-RAM), ROM cartridges, RAM memory cartridges with battery backup, flash memory cartridges, nonvolatile RAM cartridges, and the like.
【0022】また、電話回線等の有線通信媒体、マイク
ロ波回線等の無線通信媒体等の通信媒体を含む。インタ
ーネットもここでいう通信媒体に含まれる。The communication medium includes a communication medium such as a wired communication medium such as a telephone line and a wireless communication medium such as a microwave line. The Internet is also included in the communication medium mentioned here.
【0023】媒体とは、何等かの物理的手段により情報
(主にデジタルデータ、プログラム)が記録されている
ものであって、コンピュータ、専用プロセッサ等の処理
装置に所定の機能を行わせることができるものである。
要するに、何等かの手段でもってコンピュータにプログ
ラムをダウンロードし、所定の機能を実行させるもので
あればよい。A medium is a medium on which information (mainly digital data and programs) is recorded by some physical means, and which allows a processing device such as a computer or a dedicated processor to perform a predetermined function. You can do it.
In short, any method may be used as long as the program is downloaded to the computer by some means and a predetermined function is executed.
【0024】[0024]
【発明の実施の形態】この発明の実施の形態に係る装置
及び方法について図面を参照して説明する。図1は、こ
の発明の実施の形態に係るホームページ管理装置のブロ
ック図である。この装置は、インターネットサービスプ
ロバイダ(ISP)の設備に組み込まれている。ISPは、ホ
ームページサーバ1を提供することにより各制作者のホ
ームページをインターネット8上で閲覧できるようにし
ている。ホームページサーバ1とインターネット8の間
にはアクセス制御装置2が設けられ、インターネットの
利用者からのリクエストをサーバ1に伝えたり、サーバ
1のレスポンスをインターネット8に伝えたりする。ア
クセス制御装置2は、アクセス制限リスト(メモリ)2
aを備え、このリストに基づきインターネットを通じた
リクエストを制限する。例えば、アクセス制限リスト2
aにホームページサーバ1の多数のホームページのう
ち、これらの一部のホームページのURLが含まれてい
るとする。これらのURLに対してアクセスがあったと
き、アクセス制御装置2は当該アクセスを拒絶したり、
アクセスの回数を制限したりする。ISPの管理者はアク
セス制限リスト2aを管理することにより、ホームペー
ジサーバ1が提供するホームページのうちで公開に適さ
ないホームページへのアクセスを制限することができ
る。DESCRIPTION OF THE PREFERRED EMBODIMENTS An apparatus and a method according to an embodiment of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram of a homepage management device according to an embodiment of the present invention. This device is built into the facilities of an Internet service provider (ISP). The ISP provides a homepage server 1 so that the homepage of each creator can be browsed on the Internet 8. An access control device 2 is provided between the homepage server 1 and the Internet 8, and transmits a request from an Internet user to the server 1 and transmits a response from the server 1 to the Internet 8. The access control device 2 includes an access restriction list (memory) 2
a to restrict requests through the Internet based on this list. For example, access restriction list 2
It is assumed that a contains URLs of some of these homepages among many homepages of the homepage server 1. When an access is made to these URLs, the access control device 2 rejects the access,
Or limit the number of accesses. By managing the access restriction list 2a, the administrator of the ISP can restrict access to a homepage that is not suitable for disclosure among homepages provided by the homepage server 1.
【0025】符号3は、ホームページサーバ1内のホー
ムページを指示するURL(Uniform Resource Locator)
毎にアクセス数を計測するアクセス数計測部である。符
号4は、該アクセス数計測部の計測結果に基づいて予め
定められた数以上のアクセスが計測されたURLリストを
作成する人気URL抽出部である。Reference numeral 3 denotes a URL (Uniform Resource Locator) pointing to a home page in the home page server 1.
It is an access number measuring unit that measures the number of accesses for each. Reference numeral 4 denotes a popular URL extraction unit that creates a URL list in which the number of accesses equal to or greater than a predetermined number is measured based on the measurement result of the access number measurement unit.
【0026】符号5は、該人気URL抽出部により作成さ
れた前記URLリストに記載されたURLの内容を照合用デー
タベースと照合して相関値を算出する相関検出部であ
る。相関検出部5は、ホームページに含まれる画像に表
示されるパターン情報を抽出するパターン情報抽出部5
a、前記画像に表示される文字情報を抽出する文字情報
抽出部5b、ホームページに含まれるテキスト情報を抽
出するテキスト情報抽出部5cを備える。Reference numeral 5 denotes a correlation detecting unit that calculates the correlation value by comparing the content of the URL described in the URL list created by the popular URL extracting unit with a matching database. The correlation detecting unit 5 is a pattern information extracting unit 5 for extracting pattern information displayed on an image included in the homepage.
a, a character information extracting unit 5b for extracting character information displayed on the image, and a text information extracting unit 5c for extracting text information included in the homepage.
【0027】これら抽出部5a〜5cの出力は照合用デ
ータベース6の内容と照合され、相関値が求められる。
この相関値は、抽出された内容(データ)がデータベー
ス6の内容とどの程度一致しているかを示すものであ
る。The outputs of the extraction units 5a to 5c are collated with the contents of the collation database 6, and a correlation value is obtained.
This correlation value indicates how much the extracted content (data) matches the content of the database 6.
【0028】例えば、パターンに関してひとつあるいは
複数の色彩の配色と各色彩の面積の比に関して比較を行
い、配色と面積比が一致すれば相関値は高く、いずれか
一方が一致すれば相関値は中程度であり、両方の点で一
致しなければ相関値は低い。一例をあげると、人間の裸
体の画像では、肌色の領域が最も大きく、かつ、毛髪の
色(黒、金など)の領域が必ず含まれる。これら以外の
色彩(空の青、森林の緑など)は背景と考えられ、この
領域は肌色の領域よりも小さい。このような観点からパ
ターンデータは作成される。他の例として、商標、商
号、シンボルマーク、アニメのキャラクタをパターンデ
ータとしてもち、このパターンデータと抽出されたパタ
ーンが比較される。パターン同士の相関値の求め方とし
て公知の手法(例えば、相互相関関数を用いる手法)が
適用できる。For example, the color scheme of one or a plurality of colors is compared with the ratio of the area of each color to the pattern. If the color scheme and the area ratio match, the correlation value is high, and if any one of them matches, the correlation value is medium. If the two values do not match, the correlation value is low. As an example, in an image of a naked human body, a flesh color region is the largest, and a hair color (black, gold, etc.) region is always included. Other colors (blue in the sky, green in the forest, etc.) are considered background, and this area is smaller than the skin color area. Pattern data is created from such a viewpoint. As another example, a trademark, a trade name, a symbol mark, and an animation character are used as pattern data, and the pattern data is compared with the extracted pattern. A known method (for example, a method using a cross-correlation function) can be applied as a method of obtaining a correlation value between patterns.
【0029】他方、文字については、抽出された文字
(テキスト)がデータベースのテキストと比較される。
一致している文字数が多いほど相関値は高い。例えば、
抽出された文字とデータベースのテキストが完全一致す
れば相関値は100%とし、例えば10文字のうち5文
字が一致すれば相関値は50%とする。On the other hand, for characters, the extracted characters (text) are compared with the text in the database.
The greater the number of matching characters, the higher the correlation value. For example,
If the extracted characters and the text of the database completely match, the correlation value is 100%. For example, if 5 characters out of 10 characters match, the correlation value is 50%.
【0030】なお、文字情報抽出部5bが画像から文字
を抽出する処理として、公知の文字認識手法を適用でき
る。A known character recognition method can be applied to the process of extracting characters from an image by the character information extracting unit 5b.
【0031】符号7は、該相関検出部の出力する相関値
リストのうち予め定められた相関値を超えているURLを
禁止アドレスと定義し、該禁止アドレスを前記アクセス
制限リストに追加する禁止アドレス生成部である。Reference numeral 7 denotes a prohibited address for defining a URL exceeding a predetermined correlation value in the correlation value list output from the correlation detection unit as a prohibited address, and adding the prohibited address to the access restriction list. The generation unit.
【0032】照合用データベース6の例を図5に示す。
照合用データベース6は、画像を照合するための画像用
パターン・データ及びテキストを照合するためのテキス
ト用パターン・データを含む。前記テキスト用パターン
・データは、演奏者名、作詞・作曲者名、曲名等の著作
権に関わる情報を含み、前記テキスト用パターン・デー
タは、公序良俗に反するような情報を含み、前記画像用
パターン・データは、CDジャケット、本の表紙等の著作
権に関する情報を含む。これにより、相関検出部5は、
ホームページ制作者が他人の著作物を使用していること
や、公序良俗に反する単語を使用していることを検出で
きる。相関検出部5及び照合用データベース6により、
ホームページの評価を行うことができる。FIG. 5 shows an example of the collation database 6.
The matching database 6 includes image pattern data for matching images and text pattern data for matching text. The text pattern data includes information related to copyright such as a performer name, a lyric / composer name, and a song title.The text pattern data includes information that is against public order and morals. Data includes copyright information such as CD jackets and book covers. Thereby, the correlation detecting unit 5
It can detect that a website creator uses a copyrighted work of another person or uses words that are against public order and morals. By the correlation detection unit 5 and the collation database 6,
Homepage can be evaluated.
【0033】図2は、この発明の実施の形態の装置の処
理手順を示すフローチャートである。URLごとにアク
セス数を計測する(S1)。アクセス数がしきい値が超
えるかどうか判定し(S2)、超える場合には当該UR
Lを人気URLリストに追加する(S3)。S1〜S3
により、全てのURLのうちから一部のものを抽出する
のは、装置の監視負担を軽減するためである。ISPが
管理するサーバ内のホームページは莫大な数に及び、こ
れら全てを監視することは装置の処理能力の点から実用
的でない。そこで一部のURLを抽出し、抽出されたU
RLを監視対象としている。抽出の基準として、ここで
はアクセス数、つまり人気を用いている。万一、あるホ
ームページで問題のある内容を公開したとしても、アク
セス数が少なければその影響は限定的である。他方、ア
クセス数が多いホームページの場合、その影響を無視で
きない。このような観点からアクセス数を基準にURL
を抽出することが望ましい。他にも、アクセス数の監視
は技術的に容易であるという理由もある。なお、急激に
アクセス数が増加するような場合、何か特別の事象が発
生している可能性があるから、アクセス数の増加率も監
視するようにしてもよい。アクセス数の増加率が著しい
場合、重点的に監視するようにしてもよい。S1〜S3
の処理を全てのURLについて実行する(S4、S
5)。FIG. 2 is a flowchart showing a processing procedure of the apparatus according to the embodiment of the present invention. The number of accesses is measured for each URL (S1). It is determined whether or not the number of accesses exceeds the threshold (S2).
L is added to the popular URL list (S3). S1 to S3
The reason why some URLs are extracted from all the URLs is to reduce the monitoring load on the device. The number of homepages in the server managed by the ISP is enormous, and monitoring all of them is not practical in terms of the processing capacity of the device. Therefore, some URLs are extracted and the extracted U
RL is monitored. Here, the number of accesses, that is, popularity, is used as the extraction criterion. Even if you publish problematic content on a website, the impact is limited if the number of accesses is small. On the other hand, in the case of a homepage with a large number of accesses, its influence cannot be ignored. From such a viewpoint, the URL is determined based on the number of accesses.
It is desirable to extract Another reason is that monitoring the number of accesses is technically easy. When the number of accesses suddenly increases, there is a possibility that some special event has occurred. Therefore, the rate of increase in the number of accesses may be monitored. When the rate of increase in the number of accesses is remarkable, monitoring may be performed with emphasis. S1 to S3
Is executed for all the URLs (S4, S4
5).
【0034】次に、抽出されたURL(人気URL)に
ついて評価を行う。人気URLリストの内容を照合用デ
ータベースと照合して相関値を算出する(S6)。この
詳しい処理は後述する。相関値がしきい値を超えるかど
うか判定し(S7)、超える場合には当該URLを禁止
アドレスと定義してアクセス制限リストに追加する(S
8)。S6〜S8の処理を全てのURLについて実行す
る(S9、S10)。Next, the extracted URL (popular URL) is evaluated. The content of the popular URL list is collated with the collation database to calculate a correlation value (S6). This detailed processing will be described later. It is determined whether or not the correlation value exceeds the threshold value (S7), and if so, the URL is defined as a prohibited address and added to the access restriction list (S7).
8). The processing of S6 to S8 is executed for all URLs (S9, S10).
【0035】図3は相関値算出の手順のフローチャート
である。対象となるホームページを読み出し(S1
1)、これに含まれる内容であるテキストと画像を分離
する(S12)。テキストデータは直接テキスト用パタ
ーン・データとの照合が行われ、相関値が計算される
(S16)。画像データは画像として再生され(S1
3)、そこから画像に含まれる文字情報が抽出される
(S14)。S14の処理として公知の文字認識アルゴ
リズムを用いることができる。抽出された文字情報はテ
キスト用パターン・データとの照合が行われ、相関値が
計算される(S16)。FIG. 3 is a flowchart of the procedure for calculating the correlation value. Read the target homepage (S1
1) Separating a text and an image, which are contents contained therein, (S12). The text data is directly collated with the text pattern data, and the correlation value is calculated (S16). The image data is reproduced as an image (S1
3) Character information included in the image is extracted therefrom (S14). A known character recognition algorithm can be used as the process of S14. The extracted character information is collated with the text pattern data, and a correlation value is calculated (S16).
【0036】画像データからは、また、画像に含まれる
パターンが抽出される(S15)。S15の処理として
公知のパターン抽出アルゴリズムを用いることができ
る。例えば、画像に商標・商号・シンボルマーク・アニ
メのキャラクタが含まれているとき、S15でこれらが
抽出される。抽出されたマークなどが画像用パターン・
データと照合される(S17)。もし、これらが一致す
れば、当該ホームページで商標・商号・シンボルマーク
・キャラクタが使用されている可能性が高い。もし、無
断で使用されているならば商標法、著作権法に違反する
おそれがあり、ISPの管理者は当該ホームページに注
意を払うべきである。例えば、画像用パターン・データ
として、商標、商号、シンボルマーク、アニメのキャラ
クタをもち、このパターンデータと抽出されたパターン
が比較される。パターン同士の相関値の求め方として公
知の手法(例えば、相互相関関数を用いる手法)が適用
できる。A pattern contained in the image is extracted from the image data (S15). A known pattern extraction algorithm can be used as the processing of S15. For example, when the image includes characters of trademark, trade name, symbol mark, and animation, these are extracted in S15. The extracted marks etc. are
The data is collated with the data (S17). If these match, there is a high possibility that the trademark, trade name, symbol mark, and character are used on the homepage. If used without permission, it may violate trademark law and copyright law, and the ISP administrator should pay attention to the homepage. For example, the image data includes a trademark, a trade name, a symbol mark, and an animated character as image pattern data, and the pattern data is compared with the extracted pattern. A known method (for example, a method using a cross-correlation function) can be applied as a method of obtaining a correlation value between patterns.
【0037】S17における画像パターン・データの照
合手法として、前記照合用データベースの前記画像用パ
ターン・データにひとつ又は複数の予め定められた色彩
及び当該色彩で表示される領域の大きさに関する情報を
もたせ、URLの内容に含まれる画像のうちで前記予め定
められた色彩に一致する領域を求め、その割合を相関値
として出力するようにしてもよい。例えば、パターンに
関してひとつあるいは複数の色彩の配色と各色彩の面積
の比に関して比較を行い、配色と面積比が一致すれば相
関値は高く、いずれか一方が一致すれば相関値は中程度
であり、両方の点で一致しなければ相関値は低い。一例
をあげると、人間の裸体の画像では、肌色の領域が最も
大きく、かつ、毛髪の色(黒、金など)の領域が必ず含
まれる。これら以外の色彩(空の青、森林の緑など)は
背景と考えられ、この領域は肌色の領域よりも小さい。As a method of collating the image pattern data in S17, the image pattern data of the collation database is provided with information on one or a plurality of predetermined colors and the size of an area displayed by the colors. Alternatively, a region that matches the predetermined color may be obtained from among the images included in the contents of the URL, and the ratio may be output as a correlation value. For example, for a pattern, a comparison is made between the color scheme of one or more colors and the area ratio of each color.If the color scheme and the area ratio match, the correlation value is high, and if any one of them matches, the correlation value is moderate. If the two values do not match, the correlation value is low. As an example, in an image of a naked human body, a flesh color region is the largest, and a hair color (black, gold, etc.) region is always included. Other colors (blue in the sky, green in the forest, etc.) are considered background, and this area is smaller than the skin color area.
【0038】図2及び図3の処理を何度か繰り返しても
よい。この場合のフローチャートを図4に示す。アクセ
ス数のしきい値を設定し(S20)、相関値のしきい値
を設定し(S21)、図2及び図3の手順によりホーム
ページを評価し(S22)、問題のあるホームページを
抽出し(S23)、抽出されたホームページを監視対象
リストに追加する(S24)。図2においては、抽出さ
れたURLを禁止アドレスとして直ちにアクセス制限リ
スト2aに加えたが、図4においては監視対象リストに
追加する。抽出されたURLに対するアクセスを直ちに
禁止すれば外部のインターネット利用者に対して問題の
ある内容を閲覧させないという点で望ましいが、他方、
サーバ1の契約者の権利を損なうことになる。当該UR
Lの制作者から苦情がくることも考えられる。また、本
発明の実施の形態に係る装置・方法により抽出されたか
らといって、当該URLが本当に有害であるとは断定で
きない。そこで、当座は抽出されたURLを監視対象リ
ストに追加するにとどめ、当該URLを管理者自身が継
続して監視するとともに、当該URLに対する一般利用
者の意見を参照にしながら、ISPの管理者が最終的な
結論を出すことが望ましい。この結論を待って当該UR
Lをアクセス制限リストに加えるようにしてもよい。The processing of FIGS. 2 and 3 may be repeated several times. FIG. 4 shows a flowchart in this case. A threshold value of the number of accesses is set (S20), a threshold value of the correlation value is set (S21), and the homepage is evaluated according to the procedure of FIGS. 2 and 3 (S22), and a problematic homepage is extracted ( (S23), the extracted homepage is added to the monitoring target list (S24). In FIG. 2, the extracted URL is immediately added to the access restriction list 2a as a prohibited address, but in FIG. 4, it is added to the monitoring target list. Immediately prohibiting access to the extracted URL is desirable in that it will not allow external Internet users to browse problematic content, but on the other hand,
This impairs the rights of the contractor of the server 1. The UR
A complaint may come from the producer of L. Further, just because the URL is extracted by the device / method according to the embodiment of the present invention, it cannot be concluded that the URL is really harmful. Therefore, for the time being, only the extracted URL is added to the monitoring target list, and the administrator continuously monitors the URL, and the ISP administrator refers to the opinion of the general user with respect to the URL. It is desirable to make a final conclusion. Waiting for this conclusion, the UR
L may be added to the access restriction list.
【0039】このような観点から、図4においては、S
24の後に、問題のあるホームページに対する修正・削
除・廃止の勧告を行う処理(S26)、その後の監視
(S27)を設けている。S26の通知は電子メールで
行うことができる。S27の監視は、管理者自身が監視
するとともに、本発明の実施の形態の装置・方法により
監視することもできる。From such a viewpoint, FIG.
After 24, processing for making a recommendation for correction, deletion, or abolition of a problematic homepage (S26), and subsequent monitoring (S27) are provided. The notification in S26 can be made by e-mail. The monitoring in S27 can be performed not only by the administrator himself, but also by the apparatus and method according to the embodiment of the present invention.
【0040】一方、S24の処理の後、アクセス数のし
きい値を下げて(S25)、S20〜S24の処理を繰
り返すようにしてもよい。これはホームページは随時変
更されるために継続的な監視が必要であるという理由の
ほかに、監視負担を軽減するという理由もある。後者に
ついてさらに説明すると、多数のホームページを提供し
ているサーバについて、本発明の実施の形態の装置・方
法を最初に適用すると、場合によっては非常に多数の問
題あるホームページが抽出されるかもしれない。これで
は管理者の監視負担は過大なものとなる。そこで、初め
のうちは極めて人気の高いホームページのみを対象とす
る。このように対象を限定したとしても効果的であるこ
とは前述のとおりである。この処理を繰り返して人気の
高いホームページに問題がなくなれば、逐次、しきい値
を下げて対象を拡大する。そして前述の処理を繰り返
す。したがって、図4の処理によれば、管理者の監視負
担を抑制しつつ、監視対象を徐々に広げ、最終的に全て
のホームページを評価することができるのである。On the other hand, after the process of S24, the threshold value of the number of accesses may be lowered (S25), and the processes of S20 to S24 may be repeated. This is because the homepage changes from time to time and requires continuous monitoring, and it also reduces the monitoring burden. To further explain the latter, if the apparatus / method according to the embodiment of the present invention is first applied to a server providing a large number of homepages, a very large number of problematic homepages may be extracted in some cases. . In this case, the monitoring burden on the administrator becomes excessive. Therefore, at first, only extremely popular homepages are targeted. As described above, it is effective even if the target is limited in this way. If this process is repeated and there is no problem with the popular homepage, the threshold is sequentially reduced and the target is expanded. Then, the above processing is repeated. Therefore, according to the processing of FIG. 4, it is possible to gradually widen the monitoring target and finally evaluate all the homepages while suppressing the monitoring burden on the administrator.
【0041】なお、URLの評価結果をアクセス制限リ
ストに加えるばかりでなく、このアクセス制限リストを
外部に公表するようにしてもよい。一般利用者の立場か
ら抽出されたホームページの評価してもらい、ISPは
その結果を反映して管理することができる。リストを公
表することにより、当該ホームページの制作者が自発的
に内容を適正なものに修正することも期待できる。In addition to adding the URL evaluation result to the access restriction list, the access restriction list may be made public. The ISP can evaluate the homepage extracted from the viewpoint of a general user and manage it by reflecting the result. By publishing the list, it can be expected that the creator of the homepage will voluntarily correct the content to an appropriate one.
【0042】本発明は、以上の実施の形態に限定される
ことなく、特許請求の範囲に記載された発明の範囲内
で、種々の変更が可能であり、それらも本発明の範囲内
に包含されるものであることは言うまでもない。The present invention is not limited to the above-described embodiments, and various modifications can be made within the scope of the invention described in the appended claims, which are also included in the scope of the present invention. Needless to say, this is done.
【0043】また、本明細書において、手段とは必ずし
も物理的手段を意味するものではなく、各手段の機能
が、ソフトウェアによって実現される場合も包含する。
さらに、一つの手段の機能が、二つ以上の物理的手段に
より実現されても、若しくは、二つ以上の手段の機能
が、一つの物理的手段により実現されてもよい。In this specification, means does not necessarily mean physical means, but also includes a case where the function of each means is realized by software.
Further, the function of one unit may be realized by two or more physical units, or the function of two or more units may be realized by one physical unit.
【0044】[0044]
【発明の効果】この発明により、ISPが管理しているホ
ームページのうち、公開により公序良俗に反するページ
を自律的かつ自発的に抽出して、公開中止の措置をとる
ことができ、ISPのサービス品質を下げることなく、ホ
ームページを提供することができる。According to the present invention, it is possible to autonomously and spontaneously extract pages that are offensive to public order and morals from the homepages managed by the ISP, and take measures to stop the publication. Web sites can be provided without lowering prices.
【図1】 この発明の実施の形態に係るホームページ管
理装置のブロック図である。FIG. 1 is a block diagram of a homepage management device according to an embodiment of the present invention.
【図2】 この発明の実施の形態に係るホームページ管
理装置の動作フローチャートである。FIG. 2 is an operation flowchart of the homepage management device according to the embodiment of the present invention.
【図3】 この発明の実施の形態に係るホームページ管
理装置の照合フローチャートである。FIG. 3 is a collation flowchart of the homepage management device according to the embodiment of the present invention.
【図4】 この発明の実施の形態に係るホームページ管
理装置の他の動作フローチャートである。FIG. 4 is another operation flowchart of the homepage management apparatus according to the embodiment of the present invention.
【図5】 この発明の実施の形態に係るホームページ管
理装置の照合用データベースの説明図である。FIG. 5 is an explanatory diagram of a collation database of the homepage management device according to the embodiment of the present invention.
1 ホームページサーバ 2 アクセス制御装置 2a アクセス制限リスト 3 アクセス数計測部 4 人気URL抽出部 5 相関検出部 5a パターン情報抽出部 5b 文字情報抽出部 5c テキスト情報抽出部 6 照合用データベース 7 禁止アドレス生成部 8 インターネット REFERENCE SIGNS LIST 1 homepage server 2 access control device 2a access restriction list 3 access count measurement unit 4 popular URL extraction unit 5 correlation detection unit 5a pattern information extraction unit 5b character information extraction unit 5c text information extraction unit 6 collation database 7 prohibited address generation unit 8 the Internet
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G06F 17/30 110 G06F 17/30 110F 120 120B ──────────────────────────────────────────────────続 き Continued on the front page (51) Int.Cl. 7 Identification symbol FI Theme coat ゛ (Reference) G06F 17/30 110 G06F 17/30 110F 120 120B
Claims (16)
てインターネットからの閲覧に供するホームページサー
バと、該ホームページヘのインターネットからのアクセ
スをアクセス制限リストに基づき制御するアクセス制御
部とを備えるインターネット・サービス・システムを管
理するためのホームページ管理装置であって、 ホームページを指示するURL(Uniform Resource Locato
r)毎にアクセス数を計測するアクセス数計測部と、 該アクセス数計測部の計測結果に基づいて予め定められ
た数以上のアクセスが計測されたURLリストを作成する
人気URL抽出部と、 該人気URL抽出部により作成された前記URLリストに記載
されたURLの内容を照合用データベースと照合して相関
値を算出する相関検出部と、 該相関検出部の出力する相関値リストのうち予め定めら
れた相関値を超えているURLを禁止アドレスと定義し、
該禁止アドレスを前記アクセス制限リストに追加する禁
止アドレス生成部とを備えるホームページ管理装置。1. An Internet service comprising: a homepage server for registering a homepage created by a creator for browsing from the Internet; and an access control unit for controlling access to the homepage from the Internet based on an access restriction list. A homepage management device for managing the system, and a URL (Uniform Resource Locato
r) an access number measurement unit that measures the number of accesses for each of the following: a popular URL extraction unit that creates a URL list in which a predetermined number or more of accesses are measured based on the measurement result of the access number measurement unit; A correlation detection unit that calculates the correlation value by comparing the contents of the URLs described in the URL list created by the popular URL extraction unit with a comparison database; and a correlation value list output by the correlation detection unit, which is determined in advance. URL that exceeds the given correlation value is defined as a prohibited address,
A homepage management apparatus comprising: a prohibited address generation unit that adds the prohibited address to the access restriction list.
ン抽出を行うパターン情報抽出部を備え、前記相関検出
部が前記ホームページサーバに登録されているホームペ
ージを読み出す際に、前記パターン情報抽出部を介して
得られたパターン情報を前記照合用データベースに含ま
れるパターン・データと照合して相関値を算出すること
を特徴とする、請求項1記載のホームページ管理装置。2. The method according to claim 1, wherein the correlation detecting unit includes a pattern information extracting unit that extracts a pattern from the image information. When the correlation detecting unit reads a homepage registered in the homepage server, the correlation detecting unit detects the pattern information extracting unit. 2. The homepage management apparatus according to claim 1, wherein the correlation information is calculated by collating pattern information obtained via the collation with pattern data included in the collation database.
報を抽出する文字情報抽出部を備え、前記相関検出部が
前記ホームページサーバに登録されているホームページ
を読み出す際に、前記文字情報抽出部を介して得られた
文字列を前記照合用データベースに含まれるテキスト・
データと照合して相関値を算出することを特徴とする、
請求項1記載のホームページ管理装置。3. The correlation detecting section includes a character information extracting section for extracting character information from image information. When the correlation detecting section reads a home page registered in the home page server, the correlation information extracting section The character string obtained through
It is characterized by calculating a correlation value by comparing with data,
The homepage management device according to claim 1.
抽出するテキスト抽出部を備え、前記相関検出部が前記
ホームページサーバに登録されているホームページを読
み出す際に、前記テキスト抽出部を介して得られた文字
列を前記照合用データベースに含まれるテキスト・デー
タと照合して相関値を算出することを特徴とする、請求
項1記載のホームページ管理装置。4. The correlation detecting section includes a text extracting section for extracting text data. When the correlation detecting section reads a homepage registered in the homepage server, the correlation detecting section obtains the text via the text extracting section. 2. The homepage management apparatus according to claim 1, wherein the obtained character string is collated with text data included in the collation database to calculate a correlation value.
するための画像用パターン・データ及びテキストを照合
するためのテキスト用パターン・データを含むことを特
徴とする、請求項1記載のホームページ管理装置。5. The homepage management apparatus according to claim 1, wherein the collation database includes image pattern data for collating images and text pattern data for collating texts. .
用パターン・データは、演奏者名、作詞・作曲者名、曲
名等の著作権に関わる情報を含むことを特徴とする、請
求項5記載のホームページ管理装置。6. The homepage according to claim 5, wherein the text pattern data in the collation database includes information on a copyright such as a performer name, a lyric / composer name, and a song name. Management device.
用パターン・データは、公序良俗に反するような情報を
含むことを特徴とする、請求項5記載のホームページ管
理装置。7. The homepage management apparatus according to claim 5, wherein the text pattern data of the collation database includes information that is against public order and morals.
ターン・データは、CDジャケット、本の表紙等の著作権
に関する情報を含むことを特徴とする、請求項5記載の
ホームページ管理装置。8. The homepage management apparatus according to claim 5, wherein the image pattern data in the collation database includes information on copyright such as a CD jacket and a book cover.
ターン・データは、ひとつ又は複数の予め定められた色
彩及び当該色彩で表示される領域の大きさに関する情報
を含み、 前記相関検出部は、前記URLの内容に含まれる画像のう
ちで前記予め定められた色彩に一致する領域を求め、そ
の割合を相関値として出力し、 前記禁止アドレス生成部は、前記相関値が前記画像用パ
ターン・データに含まれる領域の大きさを超えるときに
前記URLを禁止アドレスと定義することを特徴とする、
請求項5記載のホームページ管理装置。9. The image pattern data of the collation database includes one or a plurality of predetermined colors and information on a size of a region displayed by the colors, and the correlation detection unit includes: In the image included in the content of the URL, an area that matches the predetermined color is obtained, and the ratio is output as a correlation value.The forbidden address generation unit sets the correlation value as the image pattern data. When the size of the included area is exceeded, the URL is defined as a prohibited address,
The homepage management device according to claim 5.
・データ及びテキストを照合するためのテキスト用パタ
ーン・データを含む照合用データベースと、ホームペー
ジを指示するURL(Uniform Resource Locator)毎にそ
の内容を前記照合用データベースと照合して相関値を算
出し、これをURLの評価値として出力する相関検出部と
を備えるホームページ評価装置。10. A collation database including image pattern data for collating images and text pattern data for collating texts, and the contents of each URL (Uniform Resource Locator) pointing to a homepage. A homepage evaluation device comprising: a correlation detection unit that calculates a correlation value by collating with the collation database and outputs the correlation value as a URL evaluation value.
ーン抽出を行うパターン情報抽出部を備え、前記相関検
出部が前記ホームページを読み出す際に、前記パターン
情報抽出部を介して得られたパターン情報を前記照合用
データベースに含まれるパターン・データと照合して相
関値を算出することを特徴とする、請求項10記載のホ
ームページ評価装置。11. The correlation detecting section includes a pattern information extracting section for extracting a pattern from image information, and when the correlation detecting section reads the homepage, pattern information obtained through the pattern information extracting section. The homepage evaluation device according to claim 10, wherein the correlation value is calculated by comparing the pattern data with pattern data included in the comparison database.
情報を抽出する文字情報抽出部を備え、前記相関検出部
が前記ホームページを読み出す際に、前記文字情報抽出
部を介して得られた文字列を前記照合用データベースに
含まれるテキスト・データと照合して相関値を算出する
ことを特徴とする、請求項10記載のホームページ評価
装置。12. The correlation detecting section includes a character information extracting section for extracting character information from image information, and when the correlation detecting section reads the homepage, a character obtained through the character information extracting section. 11. The homepage evaluation device according to claim 10, wherein a correlation value is calculated by collating a column with text data included in the collation database.
を抽出するテキスト抽出部を備え、前記相関検出部が前
記ホームページを読み出す際に、前記テキスト抽出部を
介して得られた文字列を前記照合用データベースに含ま
れるテキスト・データと照合して相関値を算出すること
を特徴とする、請求項10記載のホームページ評価装
置。13. The correlation detecting section includes a text extracting section for extracting text data, and when the correlation detecting section reads out the homepage, the character string obtained through the text extracting section is collated. 11. The homepage evaluation device according to claim 10, wherein the correlation value is calculated by collating with text data included in the database for use.
してインターネットからの閲覧に供するホームページサ
ーバと、該ホームページヘのインターネットからのアク
セスをアクセス制限リストに基づき制御するアクセス制
御部と、画像を照合するための画像用パターン・データ
及びテキストを照合するためのテキスト用パターン・デ
ータを含む前記照合用データベースとを備えるインター
ネット・サービス・システムを管理するためのホームペ
ージ管理方法であって、 ホームページを指示するURL(Uniform Resource Locato
r)毎にアクセス数を計測するアクセス数計測ステップ
と、 該アクセス数計測ステップの計測結果に基づいて予め定
められた数以上のアクセスが計測されたURLリストを作
成する人気URL抽出ステップと、 該人気URL抽出ステップにより作成された前記URLリスト
に記載されたURLの内容を前記照合用データベースと照
合して相関値を算出する相関検出ステップと、 該相関検出ステップにより得られた相関値リストのうち
予め定められた相関値を超えているURLを禁止アドレス
と定義し、該禁止アドレスを前記アクセス制限リストに
追加する禁止アドレス生成ステップとを備えるホームペ
ージ管理方法。14. A homepage server for registering a homepage created by a creator for browsing from the Internet, an access control unit for controlling access to the homepage from the Internet based on an access restriction list, and collating images. A homepage management method for managing an Internet service system comprising an image pattern data for image and a matching database including text pattern data for matching text, wherein the URL indicates a homepage. (Uniform Resource Locato
r) an access number measuring step of measuring the number of accesses for each of the following: a popular URL extracting step of creating a URL list in which a predetermined number or more of accesses are measured based on the measurement result of the access number measuring step; A correlation detecting step of comparing a content of the URL described in the URL list created by the popular URL extracting step with the matching database to calculate a correlation value; and a correlation value list obtained by the correlation detecting step. A URL that exceeds a predetermined correlation value is defined as a prohibited address, and a prohibited address generating step of adding the prohibited address to the access restriction list.
テップで用いる予め定められたアクセス数を減少させる
しきい値変更ステップを備え、 前記しきい値変更ステップの後に前記アクセス数計測ス
テップ乃至前記禁止アドレス生成ステップを繰り返すこ
とを特徴とする請求項14記載のホームページ管理方
法。15. A threshold changing step for reducing a predetermined number of accesses used in the popular URL extracting step after a predetermined time has elapsed, and the access number measuring step to the prohibited address after the threshold changing step. The method according to claim 14, wherein the generation step is repeated.
してインターネットからの閲覧に供するホームページサ
ーバと、該ホームページヘのインターネットからのアク
セスをアクセス制限リストに基づき制御するアクセス制
御部と、画像を照合するための画像用パターン・データ
及びテキストを照合するためのテキスト用パターン・デ
ータを含む前記照合用データベースとを備えるインター
ネット・サービス・システムを管理するためのホームペ
ージ管理方法をコンピュータに実行させるためのプログ
ラムを記録した媒体であって、 前記ホームページ管理方法は、 ホームページを指示するURL(Uniform Resource Locato
r)毎にアクセス数を計測するアクセス数計測ステップ
と、 該アクセス数計測ステップの計測結果に基づいて予め定
められた数以上のアクセスが計測されたURLリストを作
成する人気URL抽出ステップと、 該人気URL抽出ステップにより作成された前記URLリスト
に記載されたURLの内容を前記照合用データベースと照
合して相関値を算出する相関検出ステップと、 該相関検出ステップにより得られた相関値リストのうち
予め定められた相関値を超えているURLを禁止アドレス
と定義し、該禁止アドレスを前記アクセス制限リストに
追加する禁止アドレス生成ステップとを備えることを特
徴とする記録媒体。16. A homepage server for registering a homepage created by a creator for browsing from the Internet, an access control unit for controlling access to the homepage from the Internet based on an access restriction list, and collating images. A program for causing a computer to execute a homepage management method for managing an Internet service system having the pattern database for image and the matching database including the pattern data for text for matching text for The homepage management method, wherein the homepage management method includes a URL (Uniform Resource Locato) pointing to a homepage.
r) an access number measuring step of measuring the number of accesses for each of the following: a popular URL extracting step of creating a URL list in which a predetermined number or more of accesses are measured based on the measurement result of the access number measuring step; A correlation detecting step of comparing a content of the URL described in the URL list created by the popular URL extracting step with the matching database to calculate a correlation value; and a correlation value list obtained by the correlation detecting step. A recording medium, comprising: defining a URL exceeding a predetermined correlation value as a prohibited address, and adding the prohibited address to the access restriction list.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000322631A JP2002132976A (en) | 2000-10-23 | 2000-10-23 | Homepage management device and method, homepage evaluation device and recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000322631A JP2002132976A (en) | 2000-10-23 | 2000-10-23 | Homepage management device and method, homepage evaluation device and recording medium |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2002132976A true JP2002132976A (en) | 2002-05-10 |
Family
ID=18800476
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000322631A Pending JP2002132976A (en) | 2000-10-23 | 2000-10-23 | Homepage management device and method, homepage evaluation device and recording medium |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2002132976A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005091660A1 (en) * | 2004-03-19 | 2005-09-29 | Huawei Technologies Co., Ltd. | A method for implementing mobile network access limitation |
JP2008103069A (en) * | 2003-03-06 | 2008-05-01 | Lg Electron Inc | Method for processing connection request for disk player |
JP2009157911A (en) * | 2007-12-05 | 2009-07-16 | Nec Corp | Communication restriction system, communication restriction device, communication restriction method, and communication restriction program |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10275108A (en) * | 1997-03-26 | 1998-10-13 | Internatl Business Mach Corp <Ibm> | Method and device for data distribution and precaching method |
JPH11242639A (en) * | 1998-02-24 | 1999-09-07 | Nec Corp | Proxy server |
JP2000122939A (en) * | 1998-10-12 | 2000-04-28 | Toshiba Corp | Communication control method for application gateway |
JP2000137640A (en) * | 1998-10-30 | 2000-05-16 | Brother Ind Ltd | Automatic hypertext generating device and computer readable recording medium recorded with automatic hypertext generating program |
JP2000222323A (en) * | 1999-02-04 | 2000-08-11 | Japan Media System Kk | Web filtering system by internet |
-
2000
- 2000-10-23 JP JP2000322631A patent/JP2002132976A/en active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10275108A (en) * | 1997-03-26 | 1998-10-13 | Internatl Business Mach Corp <Ibm> | Method and device for data distribution and precaching method |
JPH11242639A (en) * | 1998-02-24 | 1999-09-07 | Nec Corp | Proxy server |
JP2000122939A (en) * | 1998-10-12 | 2000-04-28 | Toshiba Corp | Communication control method for application gateway |
JP2000137640A (en) * | 1998-10-30 | 2000-05-16 | Brother Ind Ltd | Automatic hypertext generating device and computer readable recording medium recorded with automatic hypertext generating program |
JP2000222323A (en) * | 1999-02-04 | 2000-08-11 | Japan Media System Kk | Web filtering system by internet |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008103069A (en) * | 2003-03-06 | 2008-05-01 | Lg Electron Inc | Method for processing connection request for disk player |
US8539537B2 (en) | 2003-03-06 | 2013-09-17 | Lg Electronics Inc. | Method for processing connection request of a disk player |
WO2005091660A1 (en) * | 2004-03-19 | 2005-09-29 | Huawei Technologies Co., Ltd. | A method for implementing mobile network access limitation |
US7920846B2 (en) | 2004-03-19 | 2011-04-05 | Huawei Technologies Co., Ltd. | Method for implementing access restriction of mobile networks |
JP2009157911A (en) * | 2007-12-05 | 2009-07-16 | Nec Corp | Communication restriction system, communication restriction device, communication restriction method, and communication restriction program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100878338B1 (en) | Watermark encoder and decoder enabled software and devices | |
KR101514864B1 (en) | Digital rights management of streaming captured content based on criteria regulating a sequence of elements | |
US20020120586A1 (en) | Copyrighted work managing method and apparatus thereof | |
JP3763393B2 (en) | COMMUNICATION SYSTEM, TERMINAL DEVICE, RECORDING MEDIUM RECORDING REPRODUCTION PROGRAM, SERVER DEVICE, AND RECORDING MEDIUM RECORDING SERVER PROGRAM | |
US8788495B2 (en) | Adding and processing tags with emotion data | |
US20050198061A1 (en) | Process and product for selectively processing data accesses | |
JP5567067B2 (en) | Privilege grant system, privilege grant method, privilege grant device, privilege grant program, privilege related information display program, and privilege related information display method | |
JP5181691B2 (en) | Information processing apparatus, information processing method, computer program, and recording medium | |
KR100986223B1 (en) | Apparatus and method providing retrieval of illegal movies | |
CN104021349B (en) | Network evidence security method and secure device in advance | |
EP1081574B1 (en) | Copyrighted data processing method and apparatus | |
JP2009009561A (en) | Copy prevention method and system thereof | |
CN105897671A (en) | Anti-hotlinking method and system | |
CN111104685B (en) | Dynamic updating method and device for two-dimension code | |
CA2267164A1 (en) | Marking of electronic documents in order to expose unauthorized publication | |
JP2008165632A (en) | Communication data monitoring device, communication data monitoring method, program and storage medium | |
JP2002132976A (en) | Homepage management device and method, homepage evaluation device and recording medium | |
CN114157568A (en) | Browser security access method, device, equipment and storage medium | |
JP2000215238A (en) | Method for detecting illegal literary work | |
KR101027502B1 (en) | System and Method for Managing of Contents | |
CN103839004A (en) | Method and equipment for detecting malicious files | |
Johnson-Laird | Looking Forward, Legislating Backward | |
KR101995535B1 (en) | Method and program for protecting copying webtoon | |
JP2002269276A (en) | Writings management method and apparatus | |
CN113821770A (en) | Directional anti-virus attack method for shared data protection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071017 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100129 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100216 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100713 |