JP4253209B2 - Filtering apparatus, system, method and program - Google Patents

Filtering apparatus, system, method and program Download PDF

Info

Publication number
JP4253209B2
JP4253209B2 JP2003103817A JP2003103817A JP4253209B2 JP 4253209 B2 JP4253209 B2 JP 4253209B2 JP 2003103817 A JP2003103817 A JP 2003103817A JP 2003103817 A JP2003103817 A JP 2003103817A JP 4253209 B2 JP4253209 B2 JP 4253209B2
Authority
JP
Japan
Prior art keywords
word
restriction
content
character string
filtering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003103817A
Other languages
Japanese (ja)
Other versions
JP2004310494A (en
Inventor
豊彦 岡田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2003103817A priority Critical patent/JP4253209B2/en
Publication of JP2004310494A publication Critical patent/JP2004310494A/en
Application granted granted Critical
Publication of JP4253209B2 publication Critical patent/JP4253209B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、精度の優れたワードフィルタリングの技術、すなわちフィルタリング装置、システム、方法及びプログラムに関する。
【0002】
【従来の技術】
近年、インターネット及びコンピュータの発達とともに、インターネット上で提供されるウェブページなどのコンテンツが爆発的に増大しつつある。一方、これに伴い、青少年に不適切なコンテンツが数多く提供され、青少年健全育成上の懸念が存在する。また、職場のコンピュータ設備を私的に利用し、いゆわるネットトレードやインターネットオークションなどによる株や物品の売買、個人の趣味や興味に関するものなど業務とは関係ない不適切なコンテンツを閲覧、入手する等の活動により仕事の業務効率が低下する不利益も指摘されている。また、図書館等公共施設利用の利便性を高めることを目的として提供されているコンピュータが、不特定多数が利用する匿名性等の背景から、不適切もしくは不正行為のために利用される問題もあり、これも目的外の不適切なコンテンツ利用の一態様である。
【0003】
これら不適切なコンテンツの閲覧を禁止したり制限する閲覧規制の従来技術として、ワードフィルタリングと呼ばれる次のような技術が知られている。すなわち、学校や会社内のLAN(Local Area Network)をインターネットに接続するにあたり、プロキシサーバなどとして実現されるフィルタリング装置を経由させ、不適切と考えられる例えば「18歳未満は利用できません。」のような短文や「淫乱」のような単語といった文字列を、ブラックワードなどと呼ばれる禁止語として、プロキシサーバへ予め登録しておく。そして、LAN上のコンピュータからアクセスしようとしているコンテンツに含まれる文章等の文字列を、そのようなプロキシサーバにおいてコンピュータ処理により分析することにより、ブラックワードを使用したコンテンツか否かを自動判定し、そのようなコンテンツは閲覧を禁止する。
【0004】
ところで、コンテンツ中に不適切な用語が1つ検出されただけで一律に閲覧を禁止すると、不適切なコンテンツばかりではなく、新聞記事、医療記事など、全体として見れば閲覧に支障のないコンテンツが閲覧できなくなる過剰規制が生じることがあり、このような不都合はミスフィルタリングやオーバーフィルタリングなどと呼ばれる。これに対し、報道用語、法律用語、医学用語等を有意義用語リストとして予め格納し、禁止語があったとしても同一コンテンツ内に有意義用語があれば閲覧を許可する技術も提案されている(特許文献1参照)。
【0005】
【特許文献1】
特開2001−282797
【0006】
【発明が解決しようとする課題】
しかしながら、日本語では、空白等の区切りが少なく文字が連続する特徴があり、一部の文字列を取り出せば禁止語だが、その前後の文字列との組み合わせによっては全く別の意味となる場合がある。特に、ひらがな、カタカナ表記の文章ではこの傾向が強い。このため、単に禁止語との文字列一致をもとに判断すると、差支えない単語の一部がたまたま禁止語と一致するため誤って閲覧規制の対象となる問題があった。
【0007】
例えば、漢字の「淫乱」の同義語としてカタカナの「インラン」を禁止語リストに登録しコンテンツの閲覧を禁止したとすると、「コインランドリー」を含むコンテンツも一部に「インラン」を含むため閲覧が禁止される過剰規制が発生する。このような問題が発生した場合、有意義用語リストを用いる上記の従来技術(特許文献1)を適用しても、法律や医療など特定分野のコンテンツについてしか問題が解決されない不利益があった。
【0008】
また、上記のようなフィルタリングで用いる禁止語リスト等のデータを作成・更新する従来技術としては、そのようなフィルタリングを行うプロキシサーバが接続されている同一LAN内のコンピュータから、そのプロキシサーバにアクセスして禁止語リストを操作するものがあった。しかし、このような従来技術では、日々インターネット上で発生する造語を含めた用語の登録・更新を行うには、プロキシサーバと同一LAN内のコンピュータの設置場所まで出向かねばならず利便性の問題があった。また、複数の拠点ごとにLANやプロキシサーバがあるような場合も、それら一括管理できない不便もあった。
【0009】
さらに、一律禁止のブラックワードとの判断が難しい要注意用語も存在し、そのような用語はブラックワードに含めれば過剰規制の問題があり、逆にブラックワードから外せば規制不十分になるジレンマもあった。
【0010】
本発明は、上記のような従来技術の問題点を解決するもので、その目的は、精度の優れたワードフィルタリングの技術、すなわちフィルタリング装置、システム、方法及びプログラムを提供することである。また、本発明の他の目的は、ワードフィルタリングに用いるデータの更新を容易にすることである。
【0011】
【課題を解決するための手段】
上記の目的を達成するため、請求項1の発明は、通信ネットワーク経由で閲覧されるコンテンツについて、予め指定した文字列に基いて閲覧規制を行うフィルタリング装置において、閲覧規制の対象となるコンテンツに含まれる文字列である各規制語の指定を予め受け付けるための第一の指定手段と、コンテンツは前記規制語を含んでも、その規制語を含む文字列全体としてはコンテンツを規制対象から除外する文字列である各ホワイトワードの指定を予め受け付けるための第二の指定手段と、前記ホワイトワードと一致する文字列を、前記規制語としての検索対象から除き、前記ホワイトワードと一致する文字列を除いた中から、前記規制語と一致する文字列を含むコンテンツについて、閲覧規制又はそのための評価判断を行う規制手段と、をコンピュータが実現することを特徴とする。
【0012】
請求項4の発明は、請求項1の発明を方法という見方から捉えたもので、通信ネットワーク経由で閲覧されるコンテンツについて、予め指定した文字列に基いて閲覧規制を行うフィルタリング方法において、閲覧規制の対象となるコンテンツに含まれる文字列である各規制語の指定を予め受け付けるための第一の指定処理と、コンテンツは前記規制語を含んでも、その規制語を含む文字列全体としてはコンテンツを規制対象から除外する文字列である各ホワイトワードの指定を予め受け付けるための第二の指定処理と、前記ホワイトワードと一致する文字列を、前記規制語としての検索対象から除き、前記ホワイトワードと一致する文字列を除いた中から、前記規制語と一致する文字列を含むコンテンツについて、閲覧規制又はそのための評価判断を行う規制処理と、をコンピュータが実現することを特徴とする。
【0013】
請求項7の発明は、請求項1,4の発明をコンピュータのプログラムという見方から捉えたもので、通信ネットワーク経由で閲覧されるコンテンツについて、コンピュータを制御することにより、予め指定した文字列に基いて閲覧規制を行うフィルタリングプログラムにおいて、そのプログラムは前記コンピュータに、閲覧規制の対象となるコンテンツに含まれる文字列である各規制語の指定を予め受け付けさせ、コンテンツは前記規制語を含んでも、その規制語を含む文字列全体としてはコンテンツを規制対象から除外する文字列である各ホワイトワードの指定を予め受け付けさせ、前記ホワイトワードと一致する文字列を、前記規制語としての検索対象から除き、前記ホワイトワードと一致する文字列を除いた中から、前記規制語と一致する文字列を含むコンテンツについて、閲覧規制又はそのための評価判断を行わせることを特徴とする。
【0014】
これらの態様では、日本語のように空白等の区切りが少なく文字の連続が多い特徴の言語においても、「インラン」のような規制語と同じ文字列を含むが「コインランドリー」のように全体としては規制対象から除外するホワイトワードを指定することにより、過剰規制が回避できる。なお、規制語やホワイトワードの指定の受付は、キーボードからの入力に限らずデータファイルの受入れによるものも含む。
【0015】
請求項2の発明は、請求項1記載のフィルタリング装置において、前記指定手段は前記規制語として、ブラックワードとグレーワードと、の二種類を指定できるように構成され、前記規制手段は、いずれの前記ホワイトワードにも含まれない前記ブラックワードを1ヶ所でも含むコンテンツは閲覧禁止とし、いずれの前記ホワイトワードにも含まれない前記グレーワードを含むコンテンツは、閲覧規制をするか否かについて所定の基準による評価判断の対象とするように構成されたことを特徴とする。
【0016】
請求項5の発明は、請求項2の発明を方法という見方から捉えたもので、請求項4記載のフィルタリング方法において、前記指定処理は前記規制語として、ブラックワードとグレーワードと、の二種類の指定を受け付け、前記規制処理は、いずれの前記ホワイトワードにも含まれない前記ブラックワードを1ヶ所でも含むコンテンツは閲覧禁止とし、いずれの前記ホワイトワードにも含まれない前記グレーワードを含むコンテンツは、閲覧規制をするか否かについて所定の基準による評価判断の対象とすることを特徴とする。
【0017】
請求項8の発明は、請求項2,5の発明をコンピュータのプログラムという見方から捉えたもので、請求項7記載のフィルタリングプログラムにおいて、前記プログラムは前記コンピュータに、前記規制語として、ブラックワードとグレーワードと、の二種類の指定を受け付けさせ、いずれの前記ホワイトワードにも含まれない前記ブラックワードを1ヶ所でも含むコンテンツは閲覧禁止とさせ、いずれの前記ホワイトワードにも含まれない前記グレーワードを含むコンテンツは、閲覧規制をするか否かについて所定の基準による評価判断の対象とさせることを特徴とする。
【0018】
これらの態様では、コンテンツの閲覧を一律禁止とするブラックワードとは別に、不適切と疑われるため要注意のグレーワードも指定できる。そして、グレーワードを含むコンテンツを閲覧禁止するかどうかの評価判断は、コンテンツ内に存在するグレーワードの種類や登場回数、それらに基く基準値など所定の基準によって行うので、用語ごとの有害度やその明白性に応じたきめ細かな閲覧規制が可能となり、過剰規制が回避できる。
【0019】
請求項3の発明は、請求項1又は2記載のフィルタリング装置を一又は二以上の拠点ごとに設けるとともに、制御用サーバと通信ネットワークで接続したフィルタリングシステムにおいて、前記制御用サーバにおいて、フィルタリング装置の規制語又はホワイトワードの少なくともいずれかについて、一又は二以上のフィルタリング装置を対象として、変更すべき内容の指定を受け付けるとともに更新用データとして格納する手段と、前記更新用データに基いて、前記制御用サーバから該当する前記フィルタリング装置へ、前記通信ネットワーク経由で規制語又はホワイトワードの更新を反映させる反映手段と、をコンピュータが実現することを特徴とする。
【0020】
請求項6の発明は、請求項3の発明を方法という見方から捉えたもので、請求項4又は5記載のフィルタリング方法を一又は二以上の拠点ごとに実行する各フィルタリング装置を、所定の制御用サーバと通信ネットワークで接続したフィルタリングシステムを用いたフィルタリング方法において、前記制御用サーバにおいて、フィルタリング装置の規制語又はホワイトワードの少なくともいずれかについて、一又は二以上のフィルタリング装置を対象として、変更すべき内容の指定を受け付けるとともに更新用データとして格納し、前記更新用データに基いて、前記制御用サーバから該当する前記フィルタリング装置へ、前記通信ネットワーク経由で規制語又はホワイトワードの更新を反映させることを特徴とする。
【0021】
これらの態様では、各拠点ごとの各フィルタリング装置で用いるブラックワード等の規制語やホワイトワードの新規追加、変更、削除といった更新内容を、拠点から離れた本部のサーバにおいて、複数の装置に共通もしくは個々の装置に関する更新内容としてデータ化し、どこからでも所望のタイミングで各拠点の各装置に反映させるリモート更新ができるので、インターネット上で次々と誕生する造語を含めた新用語に容易かつ迅速に対処可能となる。
【0022】
【発明の実施の形態】
次に、本発明の実施の形態(以下「実施形態」と呼ぶ)について図面を参照して具体的に説明する。本実施形態は、必要な周辺機器を備えたサーバシステム等のコンピュータをプログラムで制御することにより実現できるが、この場合のハードウェアやプログラムの実現態様は各種変更可能である。また、本発明は、装置、システム、方法及びプログラム、そのようなプログラムを記録したコンピュータ読取可能な記録媒体としても把握可能である。このように本実施形態の実現態様は各種考えられるので、以下の説明では、本発明及び本実施形態の各機能を実現する仮想的回路ブロックを用いる。
【0023】
〔1.構成〕
本実施形態は、図1の機能ブロック図に示すように、フィルタリング装置1を学校である複数の拠点すなわちA校〜D校ごとに設けるとともに、教育委員会等の組織管理拠点に設けた制御用サーバ2と、通信ネットワークであるインターネット3で接続したフィルタリングシステムである。各フィルタリング装置1は、インターネット3経由で閲覧されるウェブページ等のコンテンツについて、予め指定した文字列に基いて閲覧規制を行うもので、例えばプロキシサーバとして構成される。
【0024】
すなわち、各拠点ごとの校内LANには、クライアントシステムであるパーソナルコンピュータ(以下「PC」と呼ぶ)として生徒用PC15が複数接続され、各生徒用PC15からインターネット3上のウェブサーバ上のコンテンツへのアクセスは、全てフィルタリング装置1によるワードフィルタリングのうえISP(インターネット・サービス・プロバイダ)を介してインターネット3に仲介される。
【0025】
各校内LANには、各生徒用PC15とは別に、拠点管理者用PC16が接続され、フィルタリング装置1は、同じLAN上のクライアントシステムのうち、拠点管理者用PC16からのアクセスのみは、ワードフィルタリングを行わず素通しするように予め設定されている。
【0026】
フィルタリング装置1及び制御用サーバ2では、それぞれを制御するプログラムの作用により図1に示す各要素が実現され、それら各要素は以下のように作用する手段としての役割を果たす。
【0027】
〔2.作用〕
〔2−1.作用の概略〕
すなわち、フィルタリング装置1のローカル設定部4は、閲覧規制の対象となる文字列である各規制語を予め指定するための第一の指定手段であり、規制語について新規追加、変更、削除等の指定を受け付けて規制語データ5に反映させる。また、このローカル設定部4は、前記規制語を含んでも全体としては規制対象から除外する文字列である各ホワイトワードを予め指定するための第二の指定手段であり、ホワイトワードについて新規追加、変更、削除等の指定を受け付けてデータであるホワイトワードリスト6に反映させる。また、規制部7は、いずれの前記ホワイトワードにも含まれない前記規制語を含むコンテンツを対象として、閲覧規制又はそのための評価判断を行う規制手段である。
【0028】
また、ローカル設定部4は、規制語として、ブラックワードとグレーワードと、の二種類の指定を受け付け、それぞれの内容を規制語データ5を構成するブラックワードリスト51及びグレーワードリスト52に反映させる。また、規制部7は、いずれの前記ホワイトワードにも含まれない前記ブラックワードを1ヶ所でも含むコンテンツは閲覧禁止とし、いずれの前記ホワイトワードにも含まれない前記グレーワードを含むコンテンツは、閲覧規制をするか否かについて所定の基準による評価判断の対象とする。
【0029】
また、制御用サーバ2のリモート設定部8は、フィルタリング装置1の規制語及びホワイトワードについて、一又は二以上のフィルタリング装置1を対象として、変更すべき内容の指定を受け付けるとともに更新用データ9として格納する手段である。この機能を実現するため、制御用サーバ2は、管理者向けウェブサーバ兼データベースサーバとして構成され、管理者は所定の組織管理者用PC17から、同一LAN内で制御用サーバ2がCGI機能より提供する所定のウェブページへアクセスし、そのウェブページで入力欄、選択ボックス、チェックボックス、ラジオボタンなどのGUIパーツを用いて変更内容を指定すればそれが更新用データ9に反映される。
【0030】
また、制御用サーバ2のリモート更新部10及びフィルタリング装置1のリモート更新部11は、更新用データ9に基いて、制御用サーバ2から該当するフィルタリング装置1へ、インターネット3経由で規制語又はホワイトワードの更新を反映させる反映手段である。
【0031】
〔2−2.アクセス推奨及び禁止URLの取扱い〕
次に、本実施形態におけるワードフィルタリングの処理手順を図2のフローチャートに示すが、ワードフィルタリングに先立って、URLに基く次のようなフィルタリングを行ってもよい。すなわち、インターネット上のコンテンツを閲覧する場合は、そのコンテンツを提供するサイトのURL(Uniform Resource Locator)が指定される。フィルタリング装置1は、そのURLに基づきサイトへのアクセスを試みる前に、指定されたURLがアクセス推奨URLか否か、もしくはアクセス禁止URLであるか否かについて、それらを表す予め用意されたURLリストと比較することによりURLフィルタリング処理を行う。
【0032】
その結果、アクセスしようとしているURLがアクセス推奨URLの場合は、ワードフィルタリングは省略され、フィルタリング装置1は、インターネット3を介して該当URLへアクセスし、そのコンテンツを入手し、アクセス元の生徒用PC15へ転送する。一方、アクセスしようとしているURLがアクセス禁止URLであった場合は、アクセス禁止サイトへの閲覧行為のためにそのアクセスが禁止されたことを、アクセス元の生徒用PC15の画面にコンテンツに代えて表示する。
【0033】
アクセスしようとしているURLがアクセス推奨URL又はアクセス禁止URLのいずれでもない場合、フィルタリング装置1は、HTTP(HyperText Transfer Protocol )手順に基づいて、当該URLへのリクエストを一旦仮にアクセス先へ送出し、返信データをパケット単位に受信しながら、後述するようなワードフィルタリングの対象とする。この際、ウェブページ等のコンテンツ内容は、HTML(Hypertext Markup Language )で記述されているので、その記述法則に基づきコンテンツ内容から表示文字列の情報のみを抽出し、その文字列の先頭から下記のような処理を行う。
【0034】
〔2−3.ワードフィルタリングの手順〕
すなわち、図2に示すように、フィルタリング装置1の規制部7は、受信したパケットを、まずホワイトワードリスト6内の各ホワイトワードと照合し、完全に一致する文字列がパケット内に存在するか調べる(ステップ1)。このとき一致する文字列が存在する時は、コンテンツ内の該当する文字列部分をブラックワード及びグレーワードの検索対象外文字列として指定する(ステップ2)。この指定は、それら文字列部分を検索対象外文字列であることを意味する特殊文字に変換することによって行ってもよい。この部分はこれ以降のブラックワード及びグレーワードの検索対象から除外される。
【0035】
続くステップ3では、ブラックワードリスト51内のいずれかのブラックワードと一致する文字列が1つでもパケット内にあるかを検索する。このとき、パケット内に前記検索対象外を示す特殊文字が存在する場合はその文字列は無視する。パケット内にブラックワードリスト51内のブラックワードと一致する文字列が存在する場合は(ステップ3)、コンテンツを構成する以後のパケットを無視し、当該コンテンツの閲覧を禁止する(ステップ10)。具体的には、当該コンテンツの閲覧を禁止する旨を告げるウェブページをそのコンテンツの閲覧を要求した生徒用PC15に渡し、当該コンテンツに対する処理を終了する。
【0036】
パケット内にブラックワードと一致する文字列が存在しない場合は(ステップ3)、続いて、グレーワードリスト52中のいずれかのグレーワードと一致する文字列がパケット内にあるかを検索する(ステップ4)。このときも、パケット内の文字列に検索対象外であることを意味する前記特殊文字が存在する場合はその文字列は無視する。パケット内にグレーワードリスト52内のいずれかのグレーワードと一致する文字列が存在する場合は(ステップ4)、そのグレーワードをグレーワード判定基準テーブルに登録する(ステップ5)という処理の繰り返しにより(ステップ6)、パケット内で検出した全てのグレーワードを判定基準テーブルに登録する。
【0037】
続くステップ7では、コンテンツを構成する全てのパケットを調べたか否かチェックし、まだ終了していなければステップ1に戻るが、終了した場合はステップ8に進む。このステップ8では、グレーワード判定基準テーブルに登録された全てのグレーワードを種類別に分類すると同時にその露出回数すなわち登場回数をカウントする。そして、予め設定しておいたグレーワードの種類ごとの限度数、グレーワードの露出限度回数等の基準と比較し、その限界に達した場合は閲覧禁止の処理に進むが(ステップ10)、その限界に達していなければ当該コンテンツの閲覧を許可する(ステップ9)。具体的には、当該コンテンツは閲覧許可基準を満たしたと判定し、そのコンテンツの閲覧を要求した生徒用PC15にコンテンツ内容を構成する各パケットを順次送付し、当該コンテンツの処理を終了する。
【0038】
〔2−4.各リストの更新〕
以上説明した本実施形態におけるワードフィルタリングの精度を向上させるためには、各リストすなわちブラックワードリスト51、グレーワードリスト52、ホワイトワードリスト6(「各リスト」と総称する)の作成のみならず維持が重要である。すなわち、インターネットの各種コンテンツで日々誕生する造語を含め新用語を前述の各リストに迅速に吸収させるための手段が求められる。また、学校や企業等の拠点に設置されるフィルタリング装置1ごとに個別の管理者がこれらリストを直接管理するのでは、管理効率が悪い。つまり、例えば地域の教育委員会や企業の本社機構といった事業体組織で統一した管理方針に基く更新内容が、組織管理者や事業所管理者により、速やかに各拠点のこれらリストに反映できることが望まれると同時に、拠点単位でも拠点の方針に基づく管理が柔軟にできることが望まれる。
【0039】
そこで、本実施形態では(図1)、拠点である各校ごとに所望の更新内容をローカル設定部4から規制語データ5やホワイトワードリスト6へ反映させることに加え、それら拠点から離れた場所からであっても、適用分野に応じた本部が、所望の更新内容を所望の対象へ適用可能である。
【0040】
すなわち本実施形態のような教育分野では学校区にある全ての学校を管理する教育委員会、職場では複数の事業所を管理する本社の管理者等から、制御用サーバ2のリモート設定部8が、フィルタリング装置1の規制語又はホワイトワードの少なくともいずれかについて、一又は二以上のフィルタリング装置1を対象として、作成又は変更すべき内容の指定を受け付けるとともに更新用データ9として格納する。特定の拠点を指定し、その拠点向けの更新用データにより各リストを管理すれば、小規模な拠点で管理者を置かない場合へも対応可能である。
【0041】
そして、制御用サーバ2側のリモート更新部10とフィルタリング装置1側のリモート更新部11とがインターネット3経由で通信を行うことにより、更新用データ9に基いて、制御用サーバ2から該当するA〜D校のフィルタリング装置1へ、規制語又はホワイトワードの更新を反映させる。このような更新の反映は、フィルタリング装置1又は制御用サーバ2で設定する所定の時間間隔や深夜等の指定時刻に基づき定期的に行ってもよいし、または、組織管理者や拠点管理者の指示で未反映の更新を検出し反映させてもよい。
【0042】
なお、各校A〜Dの拠点管理者の用いるPC等のコンピュータからフィルタリング装置1のローカル設定部4へのアクセスや、組織管理者の用いるPC等のコンピュータから制御用サーバ2のリモート設定部8へのアクセスを、LAN内からだけでなくインターネットN経由で外部からも受け付けるようにすれば、いつでもどこからでも各リストに、その学校の方針や教育委員会全体の共通方針等に基き、必要な更新を加えることが可能となり非常に優れた利便性が提供できる。
【0043】
〔3.効果〕
以上のように、本実施形態では、日本語のように空白等の区切りが少なく文字の連続が多い特徴の言語においても、「インラン」のような規制語と同じ文字列を含むが「コインランドリー」のように全体としては規制対象から除外するホワイトワードを指定することにより、過剰規制が回避できる。
【0044】
また、本実施形態では、コンテンツの閲覧を一律禁止とするブラックワードとは別に、不適切と疑われるため要注意のグレーワードも指定できる。そして、グレーワードを含むコンテンツを閲覧禁止するかどうかの評価判断は、コンテンツ内に存在するグレーワードの種類や登場回数、それらに基く基準値など所定の基準によって行うので、用語ごとの有害度やその明白性に応じたきめ細かな閲覧規制が可能となり、過剰規制が回避できる。
【0045】
また、本実施形態では、各拠点ごとの各フィルタリング装置で用いるブラックワード等の規制語やホワイトワードの新規追加、変更、削除といった更新内容を、拠点から離れた本部のサーバにおいて、複数の装置に共通もしくは個々の装置に関する更新内容としてデータ化し、どこからでも所望のタイミングで各拠点の各装置に反映させるリモート更新ができるので、インターネット上で次々と誕生する造語を含めた新用語に容易かつ迅速に対処可能となる。
【0046】
〔4.他の実施形態〕
なお、本発明は上記実施形態に限定されるものではなく、次に例示するような他の実施形態も含むものである。例えば、本発明の適用対象となるコンテンツは、ウェブページには限定されず、ニュースグループの投稿、ストリーミング配信などその種類は自由である。また、適用対象言語も日本語には限定されず、中国語や韓国語などを対象としてもよい。
【0047】
また、本発明は、図1のようにPCと別体のプロキシサーバとはせず、家庭等において、ADSLモデムやルータ等に直接接続されたPC上に、アプリケーションプログラムをインストールすることで実現してもよい。そのように、本発明をクライアントシステムに常駐するアプリケーションプログラムとして実現する場合、HTMLファイル等のコンテンツについて、IPパケットとの分解と組立はOSI基本参照モデルにおけるアプリケーション層よりも下層で行えるので、上記実施形態とは異なり、ワードフィルタリング処理をパケット単位ではなくコンテンツ単位に行ってもよい。
【0048】
【発明の効果】
以上のように、この発明によれば、精度の優れたワードフィルタリングの技術、すなわちフィルタリング装置、システム、方法及びプログラムを提供することができる。
【図面の簡単な説明】
【図1】本発明の実施形態の構成を示す機能ブロック図。
【図2】本発明の実施形態におけるワードフィルタリングの処理手順を示すフローチャート。
【符号の説明】
1…フィルタリング装置
2…制御用サーバ
3…インターネット
4…ローカル設定部
5…規制語データ
51…ブラックワードリスト
52…グレーワードリスト
6…ホワイトワードリスト
7…規制部
8…リモート設定部
9…更新用データ
10…リモート更新部
11…リモート更新部
15,16,17…PC
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a highly accurate word filtering technique, that is, a filtering apparatus, system, method, and program.
[0002]
[Prior art]
In recent years, with the development of the Internet and computers, contents such as web pages provided on the Internet are increasing explosively. On the other hand, a lot of inappropriate content is provided to youth, and there are concerns about youth healthy development. In addition, privately use computer equipment in the workplace, and browse and obtain inappropriate content that is not related to work, such as buying and selling stocks and goods, etc. through personal Internet trade and Internet auctions, personal hobbies and interests It has been pointed out that there is a disadvantage that the work efficiency of work decreases due to activities such as doing. In addition, there is a problem that computers provided for the purpose of improving the convenience of using public facilities such as libraries are used inappropriately or illegally due to anonymity used by unspecified majority. This is also an aspect of inappropriate content usage that is not intended.
[0003]
The following technique called word filtering is known as a prior art of browsing regulation that prohibits or restricts browsing of inappropriate content. In other words, when connecting a LAN (Local Area Network) in a school or company to the Internet, it is considered inappropriate because it passes through a filtering device realized as a proxy server. A character string such as a short sentence or a word such as “Nasty” is registered in advance in the proxy server as a prohibited word called a black word or the like. Then, by analyzing a character string such as a sentence included in the content to be accessed from a computer on the LAN by computer processing in such a proxy server, it is automatically determined whether or not the content uses a black word, Such content is prohibited from browsing.
[0004]
By the way, if browsing is prohibited even if only one inappropriate term is detected in the content, not only inappropriate content but also contents such as newspaper articles and medical articles that do not hinder browsing as a whole are displayed. There are cases where over-regulation becomes impossible to browse, and such inconvenience is called mis-filtering or over-filtering. On the other hand, a technology has been proposed in which news terms, legal terms, medical terms, etc. are stored in advance as a meaningful term list, and even if there are prohibited words, browsing is allowed if there are meaningful terms in the same content (patents). Reference 1).
[0005]
[Patent Document 1]
JP 2001-282897
[0006]
[Problems to be solved by the invention]
However, in Japanese, there is a feature that characters are continuous with few spaces such as white space. If some character strings are extracted, they are prohibited words. However, depending on the combination with the preceding and following character strings, they may have completely different meanings. is there. This tendency is particularly strong in sentences written in hiragana and katakana. For this reason, when judging based on the character string match with the prohibited word, there is a problem that a part of an insignificant word coincides with the prohibited word, and is erroneously subject to browsing restriction.
[0007]
For example, if katakana's “inrun” is registered in the prohibited word list as a synonym for the kanji “nasty” and browsing of content is prohibited, content that includes “coin laundry” also includes “inrun” in part. Prohibited over-regulation. When such a problem occurs, there is a disadvantage that even if the above prior art (Patent Document 1) using a meaningful term list is applied, the problem can be solved only for contents in a specific field such as law and medical care.
[0008]
In addition, as a conventional technique for creating / updating data such as a prohibited word list used in filtering as described above, the proxy server is accessed from a computer in the same LAN to which the proxy server that performs such filtering is connected. And there was something that manipulated the forbidden word list. However, in such a conventional technology, in order to register and update terms including coined words that occur on the Internet every day, it is necessary to go to the installation location of the computer in the same LAN as the proxy server. was there. In addition, when there are LANs or proxy servers for each of the plurality of bases, there is an inconvenience that these cannot be managed collectively.
[0009]
In addition, there are some cautionary terms that are difficult to judge as black bans that are banned uniformly. there were.
[0010]
The present invention solves the problems of the prior art as described above, and an object thereof is to provide a word filtering technique with excellent accuracy, that is, a filtering apparatus, system, method and program. Another object of the present invention is to facilitate updating of data used for word filtering.
[0011]
[Means for Solving the Problems]
In order to achieve the above object, the invention of claim 1 is subject to browsing restriction in a filtering device that performs browsing restriction based on a character string designated in advance for content browsed via a communication network. Included in content First designation means for accepting designation of each restrictive word as a character string in advance; Content is Even including the restriction word , A string containing the regulated word Overall Content A second designation means for accepting in advance designation of each white word that is a character string to be excluded from the restriction target; About the content including the character string that matches the restriction word from the character string that matches the restriction word, except the character string that matches the restriction word and the character string that matches the white word. The computer realizes a restricting means for restricting browsing or performing evaluation judgment therefor.
[0012]
The invention of claim 4 captures the invention of claim 1 from the viewpoint of a method, and in a filtering method for restricting browsing based on a character string specified in advance for content browsed via a communication network, Subject to Included in content A first designation process for receiving in advance designation of each restriction word that is a character string; Content is Even including the restriction word , A string containing the regulated word Overall Content A second designation process for receiving in advance designation of each white word that is a character string to be excluded from the restriction target; About the content including the character string that matches the restriction word from the character string that matches the restriction word, except the character string that matches the restriction word and the character string that matches the white word. The computer realizes a browsing process or a regulation process for performing an evaluation judgment for the browsing.
[0013]
The invention of claim 7 captures the inventions of claims 1 and 4 from the viewpoint of a computer program. Based on a character string designated in advance by controlling the computer with respect to content browsed via a communication network. In a filtering program that regulates browsing, the program is subject to browsing restrictions on the computer. Included in content The specification of each restriction word that is a character string is accepted in advance, Content is Even including the restriction word , A string containing the regulated word Overall Content Each white word that is a character string to be excluded from the restriction is accepted in advance, About the content including the character string that matches the restriction word from the character string that matches the restriction word, except the character string that matches the restriction word and the character string that matches the white word. It is characterized by having browsing restrictions or evaluation judgments made for it.
[0014]
In these aspects, even in a language with a feature such as Japanese that has few spaces and many consecutive characters, the same character string as a restricted word such as “Inrun” is included, but as a whole, such as “Coin Laundry”. Can avoid over-regulation by specifying white words to be excluded from the restriction. In addition, reception of designation of restricted words and white words is not limited to input from the keyboard, but includes reception of data files.
[0015]
According to a second aspect of the present invention, in the filtering device according to the first aspect, the specifying unit is configured to be able to specify two types of black words and gray words as the restricting word, The content including at least one black word that is not included in the white word is prohibited from browsing, and the content including the gray word that is not included in any of the white words is predetermined as to whether or not to restrict browsing. It is configured to be a target of evaluation judgment based on a standard.
[0016]
The invention according to claim 5 captures the invention according to claim 2 from the viewpoint of a method. In the filtering method according to claim 4, the designation processing includes two types of black words and gray words as the restriction words. The content that includes the gray word that is not included in any of the white words is prohibited, and the restriction process prohibits browsing the content including the black word that is not included in any of the white words. Is characterized by being subject to evaluation judgment based on a predetermined standard as to whether or not to restrict browsing.
[0017]
The invention of claim 8 captures the inventions of claims 2 and 5 from the viewpoint of a computer program. In the filtering program of claim 7, the program sends the black word as the restriction word to the computer. Gray word and two types of designations are accepted, content including at least one black word that is not included in any of the white words is prohibited from browsing, and the gray word that is not included in any of the white words Content containing words is subject to evaluation judgment based on a predetermined standard as to whether or not to restrict browsing.
[0018]
In these aspects, apart from the black word that prohibits the browsing of content uniformly, it is suspected that the content is inappropriate, and a gray word requiring attention can also be designated. In addition, the evaluation of whether or not to prohibit browsing of content containing gray words is performed based on predetermined criteria such as the type and number of appearances of gray words existing in the content, and standard values based on them. Fine browsing restrictions according to the clarity are possible, and over-regulation can be avoided.
[0019]
According to a third aspect of the present invention, there is provided a filtering system in which the filtering device according to the first or second aspect is provided for each of one or more bases, and is connected to the control server through a communication network. For at least one of a restricted word and a white word, one or two or more filtering devices are subject to designation of contents to be changed and stored as update data, and the control based on the update data The computer realizes a reflecting means for reflecting the update of the restricted word or the white word from the server for the corresponding filtering device via the communication network.
[0020]
The invention of claim 6 captures the invention of claim 3 from the viewpoint of a method, and each filtering device that executes the filtering method of claim 4 or 5 for each of one or more bases is subjected to predetermined control. In the filtering method using the filtering system connected to the server for communication by the communication network, the control server changes at least one of the restricted word or the white word of the filtering device for one or more filtering devices. The specification of the content to be received is received and stored as update data, and based on the update data, the control server reflects the update of the restriction word or white word to the corresponding filtering device via the communication network. It is characterized by.
[0021]
In these aspects, the update contents such as new addition, change, and deletion of the restriction word such as black word and white word used in each filtering device at each base are shared by a plurality of devices in the server at the headquarters away from the base. Data can be updated as the contents of updates for individual devices, and can be remotely updated from anywhere to be reflected in each device at each desired location, so new terms including coined words that are born one after another can be dealt with easily and quickly. It becomes.
[0022]
DETAILED DESCRIPTION OF THE INVENTION
Next, an embodiment of the present invention (hereinafter referred to as “embodiment”) will be specifically described with reference to the drawings. The present embodiment can be realized by controlling a computer such as a server system provided with necessary peripheral devices by a program. In this case, various implementation modes of hardware and programs can be changed. Further, the present invention can be grasped as an apparatus, a system, a method and a program, and a computer-readable recording medium recording such a program. As described above, since various implementation modes of the present embodiment are conceivable, virtual circuit blocks that implement the functions of the present invention and the present embodiment are used in the following description.
[0023]
[1. Constitution〕
In the present embodiment, as shown in the functional block diagram of FIG. 1, the filtering device 1 is provided for each of a plurality of bases that are schools, that is, A school to D school, and for control provided in an organization management base such as a school board. The filtering system is connected to the server 2 via the Internet 3 which is a communication network. Each filtering device 1 regulates browsing of content such as web pages browsed via the Internet 3 based on a character string designated in advance, and is configured as a proxy server, for example.
[0024]
In other words, a plurality of student PCs 15 as personal computers (hereinafter referred to as “PCs”) as client systems are connected to the campus LAN for each base, and the content on the web server on the Internet 3 is transferred from each student PC 15. All accesses are mediated by the Internet 3 through ISP (Internet Service Provider) after word filtering by the filtering device 1.
[0025]
In addition to each student PC 15, a base administrator PC 16 is connected to each school LAN, and the filtering device 1 performs word filtering only for access from the base administrator PC 16 among client systems on the same LAN. It is set in advance to pass through without performing.
[0026]
In the filtering device 1 and the control server 2, each element shown in FIG. 1 is realized by the action of a program for controlling each of them, and each element plays a role as means for acting as follows.
[0027]
[2. Action)
[2-1. Outline of action)
That is, the local setting unit 4 of the filtering device 1 is a first designation means for preliminarily designating each restricted word that is a character string that is subject to browsing restriction. For example, a new addition, change, or deletion of the restricted word is performed. The designation is accepted and reflected in the restricted word data 5. Further, the local setting unit 4 is a second designation means for pre-designating each white word that is a character string to be excluded from the regulation target even if the regulation word is included. The designation of change, deletion, etc. is received and reflected in the white word list 6 as data. Moreover, the control part 7 is a control means which performs browsing restrictions or the evaluation judgment for the content including the said restricted word which is not contained in any of the said white words.
[0028]
In addition, the local setting unit 4 accepts two types of designations of black words and gray words as restriction words, and reflects the contents of each in the black word list 51 and the gray word list 52 constituting the restriction word data 5. . In addition, the restricting unit 7 prohibits browsing the content including the black word that is not included in any of the white words, and browsing the content including the gray word that is not included in any of the white words. Whether or not to regulate is subject to evaluation judgment based on a predetermined standard.
[0029]
Further, the remote setting unit 8 of the control server 2 accepts designation of contents to be changed for the restriction word and white word of the filtering device 1 for one or two or more filtering devices 1 and also serves as update data 9. Means for storing. In order to realize this function, the control server 2 is configured as a web server and database server for the administrator, and the administrator provides the control server 2 from the CGI function within the same LAN from the predetermined organization administrator PC 17. If a change content is specified using GUI parts such as an input field, a selection box, a check box, and a radio button on the web page, the update data 9 is reflected.
[0030]
Further, the remote update unit 10 of the control server 2 and the remote update unit 11 of the filtering device 1 are connected to the filtering device 1 from the control server 2 to the corresponding filtering device 1 based on the update data 9 via the Internet 3. This is a reflection means for reflecting the word update.
[0031]
[2-2. Access recommendations and handling of prohibited URLs]
Next, the processing procedure of the word filtering in the present embodiment is shown in the flowchart of FIG. 2, but the following filtering based on the URL may be performed prior to the word filtering. That is, when browsing content on the Internet, a URL (Uniform Resource Locator) of a site that provides the content is designated. Before attempting to access the site based on the URL, the filtering device 1 determines whether the specified URL is an access recommended URL or an access prohibited URL, and a URL list prepared in advance representing them. And URL filtering processing is performed.
[0032]
As a result, when the URL to be accessed is the recommended access URL, the word filtering is omitted, and the filtering device 1 accesses the URL through the Internet 3 to obtain the content, and the student PC 15 as the access source. Forward to. On the other hand, if the URL to be accessed is an access-prohibited URL, the fact that the access is prohibited due to the browsing action on the access-prohibited site is displayed instead of the content on the screen of the student PC 15 as the access source. To do.
[0033]
When the URL to be accessed is neither the recommended access URL nor the prohibited access URL, the filtering apparatus 1 temporarily sends a request for the URL to the access destination based on the HTTP (HyperText Transfer Protocol) procedure, and returns a reply. While receiving data in packet units, the data is subjected to word filtering as described later. At this time, since the content of the web page and the like is described in HTML (Hypertext Markup Language), only the information of the display character string is extracted from the content based on the description rule, and the following from the beginning of the character string: Perform the following process.
[0034]
[2-3. (Word filtering procedure)
That is, as shown in FIG. 2, the restriction unit 7 of the filtering device 1 first compares the received packet with each white word in the white word list 6, and whether a completely matching character string exists in the packet. Check (step 1). If there is a matching character string at this time, the corresponding character string portion in the content is designated as a non-searchable character string for black words and gray words (step 2). This designation may be performed by converting these character string portions into special characters that mean non-searchable character strings. This portion is excluded from the subsequent search target of black words and gray words.
[0035]
In the subsequent step 3, it is searched whether there is any character string that matches any black word in the black word list 51. At this time, if there is a special character in the packet indicating that it is not to be searched, the character string is ignored. When there is a character string that matches the black word in the black word list 51 in the packet (step 3), the subsequent packet constituting the content is ignored and browsing of the content is prohibited (step 10). Specifically, a web page that tells the user that browsing of the content is prohibited is passed to the student PC 15 that requested the browsing of the content, and the processing for the content is terminated.
[0036]
If there is no character string that matches the black word in the packet (step 3), then it is searched whether there is a character string that matches any gray word in the gray word list 52 (step 3). 4). Also at this time, if the character string in the packet includes the special character that means that it is not subject to search, the character string is ignored. When there is a character string that matches any gray word in the gray word list 52 in the packet (step 4), the gray word is registered in the gray word determination reference table (step 5) by repeating the process. (Step 6) All gray words detected in the packet are registered in the determination criterion table.
[0037]
In the following step 7, it is checked whether or not all the packets constituting the content have been examined. If not completed yet, the process returns to step 1, but if completed, the process proceeds to step 8. In this step 8, all the gray words registered in the gray word determination criterion table are classified by type, and at the same time, the number of exposures, that is, the number of appearances is counted. Then, comparison is made with a predetermined standard such as the limit number for each type of gray word, the number of exposure times of the gray word, etc., and when the limit is reached, the process proceeds to the prohibition of browsing (step 10). If the limit is not reached, browsing of the content is permitted (step 9). Specifically, it is determined that the content satisfies the browsing permission criteria, and each packet constituting the content is sequentially sent to the student PC 15 that has requested browsing of the content, and the processing of the content is terminated.
[0038]
[2-4. Update each list)
In order to improve the accuracy of word filtering in the present embodiment described above, not only the creation of each list, that is, the black word list 51, the gray word list 52, and the white word list 6 (collectively referred to as “each list”) is maintained. is important. That is, there is a need for means for promptly absorbing new terms, including coined words that are born every day in various contents of the Internet, in each of the aforementioned lists. Moreover, if each administrator directly manages these lists for each filtering device 1 installed at a base such as a school or a company, the management efficiency is poor. In other words, it is desirable that the updated content based on the management policy unified by the business organization, such as the local school board or the corporate headquarters organization, can be quickly reflected in these lists at each site by the organization manager or business site manager. At the same time, it is desirable to be able to flexibly manage the site based on the site policy.
[0039]
Therefore, in the present embodiment (FIG. 1), in addition to reflecting the desired update contents from the local setting unit 4 to the restricted word data 5 and the white word list 6 for each school that is a base, a place away from those bases Even from this, the headquarters corresponding to the application field can apply the desired update content to the desired object.
[0040]
That is, in the educational field as in this embodiment, the remote setting unit 8 of the control server 2 from the school board that manages all schools in the school district, the administrator of the head office that manages a plurality of offices in the workplace, etc. For at least one of the restricted word or the white word of the filtering device 1, the designation of the content to be created or changed is accepted and stored as the update data 9 for one or more filtering devices 1. If a specific base is specified and each list is managed by update data for the base, it is possible to cope with a case where a small base does not have an administrator.
[0041]
Then, the remote update unit 10 on the control server 2 side and the remote update unit 11 on the filtering device 1 side communicate with each other via the Internet 3, so that the corresponding A is received from the control server 2 based on the update data 9. The update of the regulation word or the white word is reflected on the filtering device 1 of the school D. Such an update may be reflected periodically based on a predetermined time interval set in the filtering device 1 or the control server 2 or a designated time such as midnight, or may be updated by an organization manager or a site manager. An update that has not been reflected in the instruction may be detected and reflected.
[0042]
Note that the local setting unit 4 of the filtering apparatus 1 is accessed from a computer such as a PC used by the site managers of the schools A to D, or the remote setting unit 8 of the control server 2 from the PC such as a PC used by the organization manager. As long as access to the network is accepted not only from within the LAN but also from the outside via the Internet N, the list is updated anytime and anywhere based on the policy of the school or the common policy of the entire school board, etc. Can be added, providing very good convenience.
[0043]
[3. effect〕
As described above, in the present embodiment, even in a language with a feature such as Japanese that has few spaces and many consecutive characters, it includes the same character string as a restricted word such as “inrun”, but “coin laundry” As a whole, over-regulation can be avoided by designating whitewords to be excluded from the restriction.
[0044]
In addition, in the present embodiment, apart from a black word that prohibits the browsing of content uniformly, a gray word requiring attention can be designated because it is suspected to be inappropriate. In addition, the evaluation of whether or not to prohibit browsing of content containing gray words is performed based on predetermined criteria such as the type and number of appearances of gray words existing in the content, and standard values based on them. Fine browsing restrictions according to the clarity are possible, and over-regulation can be avoided.
[0045]
Also, in this embodiment, update contents such as new addition, change, and deletion of restricted words such as black words and white words used in each filtering device at each site are transferred to a plurality of devices at the headquarters server away from the site. Since it is possible to remotely update the data to be updated as data related to common or individual devices and reflect them on each device at the desired timing from anywhere, new terms including coined words that are born one after another on the Internet can be easily and quickly It becomes possible to cope.
[0046]
[4. Other embodiments]
In addition, this invention is not limited to the said embodiment, Other embodiments which are illustrated next are included. For example, the content to which the present invention is applied is not limited to a web page, and the type of content such as newsgroup posting or streaming distribution is free. Further, the applicable language is not limited to Japanese, and may be Chinese, Korean, or the like.
[0047]
In addition, the present invention is realized by installing an application program on a PC directly connected to an ADSL modem, router, etc. at home, etc., instead of being a proxy server separate from the PC as shown in FIG. May be. As described above, when the present invention is realized as an application program resident in the client system, the content such as an HTML file can be decomposed and assembled with the IP packet in a layer lower than the application layer in the OSI basic reference model. Unlike the form, the word filtering process may be performed not on a packet basis but on a content basis.
[0048]
【The invention's effect】
As described above, according to the present invention, it is possible to provide a highly accurate word filtering technique, that is, a filtering device, a system, a method, and a program.
[Brief description of the drawings]
FIG. 1 is a functional block diagram showing a configuration of an embodiment of the present invention.
FIG. 2 is a flowchart showing a processing procedure of word filtering in the embodiment of the present invention.
[Explanation of symbols]
1 ... Filtering device
2 ... Control server
3 ... Internet
4 ... Local setting section
5 ... Regulated word data
51 ... Black word list
52 ... Gray word list
6 ... White Word List
7 ... Regulatory Department
8. Remote setting part
9 ... Update data
10. Remote update unit
11 ... Remote update part
15, 16, 17 ... PC

Claims (8)

通信ネットワーク経由で閲覧されるコンテンツについて、予め指定した文字列に基いて閲覧規制を行うフィルタリング装置において、
閲覧規制の対象となるコンテンツに含まれる文字列である各規制語の指定を予め受け付けるための第一の指定手段と、
コンテンツは前記規制語を含んでも、その規制語を含む文字列全体としてはコンテンツを規制対象から除外する文字列である各ホワイトワードの指定を予め受け付けるための第二の指定手段と、
前記ホワイトワードと一致する文字列を、前記規制語としての検索対象から除き、前記ホワイトワードと一致する文字列を除いた中から、前記規制語と一致する文字列を含むコンテンツについて、閲覧規制又はそのための評価判断を行う規制手段と、
をコンピュータが実現することを特徴とするフィルタリング装置。
For content that is browsed via a communication network, in a filtering device that regulates browsing based on a character string specified in advance,
First designation means for accepting in advance designation of each restricted word that is a character string included in the content subject to browsing restriction;
Even if the content includes the restriction word, as a whole character string including the restriction word, a second designation means for receiving in advance the designation of each white word that is a character string excluding the content from the restriction target;
The content including the character string that matches the restriction word from the character string that matches the restriction word is excluded from the search target as the restriction word and the character string that matches the restriction word is excluded from the search restriction or Regulatory means to make evaluation judgment for that,
Is realized by a computer.
前記指定手段は前記規制語として、ブラックワードとグレーワードと、の二種類を指定できるように構成され、
前記規制手段は、
いずれの前記ホワイトワードにも含まれない前記ブラックワードを1ヶ所でも含むコンテンツは閲覧禁止とし、
いずれの前記ホワイトワードにも含まれない前記グレーワードを含むコンテンツは、閲覧規制をするか否かについて所定の基準による評価判断の対象とするように構成されたことを特徴とする請求項1記載のフィルタリング装置。
The designation means is configured to be able to designate two types of black words and gray words as the restriction words,
The regulating means is
Any content that contains any of the black words that are not included in any of the white words is prohibited from browsing.
The content including the gray word that is not included in any of the white words is configured to be subject to evaluation judgment based on a predetermined criterion as to whether or not to restrict browsing. Filtering device.
請求項1又は2記載のフィルタリング装置を一又は二以上の拠点ごとに設けるとともに、制御用サーバと通信ネットワークで接続したフィルタリングシステムにおいて、
前記制御用サーバにおいて、フィルタリング装置の規制語又はホワイトワードの少なくともいずれかについて、一又は二以上のフィルタリング装置を対象として、変更すべき内容の指定を受け付けるとともに更新用データとして格納する手段と、
前記更新用データに基いて、前記制御用サーバから該当する前記フィルタリング装置へ、前記通信ネットワーク経由で規制語又はホワイトワードの更新を反映させる反映手段と、
をコンピュータが実現することを特徴とするフィルタリングシステム。
In the filtering system which provided the filtering device according to claim 1 or 2 for every one or two or more bases, and connected to the control server via a communication network,
In the control server, for at least one of the restriction word or white word of the filtering device, for one or two or more filtering devices, accepting designation of contents to be changed and storing as update data;
Reflecting means for reflecting the update of the restricted word or white word via the communication network from the control server to the corresponding filtering device based on the update data;
A filtering system characterized by realizing a computer.
通信ネットワーク経由で閲覧されるコンテンツについて、予め指定した文字列に基いて閲覧規制を行うフィルタリング方法において、
閲覧規制の対象となるコンテンツに含まれる文字列である各規制語の指定を予め受け付けるための第一の指定処理と、
コンテンツは前記規制語を含んでも、その規制語を含む文字列全体としてはコンテンツを規制対象から除外する文字列である各ホワイトワードの指定を予め受け付けるための第二の指定処理と、
前記ホワイトワードと一致する文字列を、前記規制語としての検索対象から除き、前記ホワイトワードと一致する文字列を除いた中から、前記規制語と一致する文字列を含むコンテンツについて、閲覧規制又はそのための評価判断を行う規制処理と、
をコンピュータが実現することを特徴とするフィルタリング方法。
In a filtering method for restricting browsing based on a character string specified in advance for content browsed via a communication network,
A first designation process for accepting in advance designation of each restriction word, which is a character string included in content subject to browsing restriction;
Even if the content includes the restriction word, as a whole character string including the restriction word, a second designation process for receiving in advance the designation of each white word that is a character string that excludes the content from the restriction target;
The content including the character string that matches the restriction word from the character string that matches the restriction word is excluded from the search target as the restriction word and the character string that matches the restriction word is excluded from the search restriction or Regulation processing to make evaluation judgment for that,
A filtering method characterized in that a computer is realized.
前記指定処理は前記規制語として、ブラックワードとグレーワードと、の二種類の指定を受け付け、
前記規制処理は、
いずれの前記ホワイトワードにも含まれない前記ブラックワードを1ヶ所でも含むコンテンツは閲覧禁止とし、
いずれの前記ホワイトワードにも含まれない前記グレーワードを含むコンテンツは、閲覧規制をするか否かについて所定の基準による評価判断の対象とすることを特徴とする請求項4記載のフィルタリング方法。
The designation process accepts two types of designations, black words and gray words, as the restriction words,
The regulation process is
Any content that contains any of the black words that are not included in any of the white words is prohibited from browsing.
5. The filtering method according to claim 4, wherein the content including the gray word that is not included in any of the white words is subjected to evaluation determination based on a predetermined criterion as to whether or not to restrict browsing.
請求項4又は5記載のフィルタリング方法を一又は二以上の拠点ごとに実行する各フィルタリング装置を、所定の制御用サーバと通信ネットワークで接続したフィルタリングシステムを用いたフィルタリング方法において、
前記制御用サーバにおいて、フィルタリング装置の規制語又はホワイトワードの少なくともいずれかについて、一又は二以上のフィルタリング装置を対象として、変更すべき内容の指定を受け付けるとともに更新用データとして格納し、
前記更新用データに基いて、前記制御用サーバから該当する前記フィルタリング装置へ、前記通信ネットワーク経由で規制語又はホワイトワードの更新を反映させることを特徴とするフィルタリング方法。
A filtering method using a filtering system in which each filtering device that executes the filtering method according to claim 4 or 5 for each of one or more bases is connected to a predetermined control server via a communication network.
In the control server, for at least one of the restriction word or white word of the filtering device, for one or two or more filtering devices, accepting designation of contents to be changed and storing it as update data,
A filtering method characterized in that, based on the update data, an update of a restricted word or a white word is reflected from the control server to the corresponding filtering device via the communication network.
通信ネットワーク経由で閲覧されるコンテンツについて、コンピュータを制御することにより、予め指定した文字列に基いて閲覧規制を行うフィルタリングプログラムにおいて、
そのプログラムは前記コンピュータに、
閲覧規制の対象となるコンテンツに含まれる文字列である各規制語の指定を予め受け付けさせ、
コンテンツは前記規制語を含んでも、その規制語を含む文字列全体としてはコンテンツを規制対象から除外する文字列である各ホワイトワードの指定を予め受け付けさせ、
前記ホワイトワードと一致する文字列を、前記規制語としての検索対象から除き、前記ホワイトワードと一致する文字列を除いた中から、前記規制語と一致する文字列を含むコンテンツについて、閲覧規制又はそのための評価判断を行わせることを特徴とするフィルタリングプログラム。
In a filtering program that controls browsing based on a character string specified in advance by controlling a computer for content browsed via a communication network,
The program is stored in the computer,
The specification of each restriction word that is a character string included in the content subject to browsing restrictions is accepted in advance,
Even if the content includes the restriction word, the entire character string including the restriction word is allowed to accept in advance the designation of each white word that is a character string that excludes the content from the restriction target,
The content that includes the character string that matches the restriction word from the character string that matches the restriction word is excluded from the search target as the restriction word and the character string that matches the restriction word is excluded from the search restriction or A filtering program characterized by making an evaluation judgment for this purpose.
前記プログラムは前記コンピュータに、
前記規制語として、ブラックワードとグレーワードと、の二種類の指定を受け付けさせ、
いずれの前記ホワイトワードにも含まれない前記ブラックワードを1ヶ所でも含むコンテンツは閲覧禁止とさせ、
いずれの前記ホワイトワードにも含まれない前記グレーワードを含むコンテンツは、閲覧規制をするか否かについて所定の基準による評価判断の対象とさせることを特徴とする請求項7記載のフィルタリングプログラム。
The program is stored in the computer.
As the restriction word, two types of designations, black word and gray word, are accepted,
Browsing any content that contains at least one black word that is not included in any of the white words,
The filtering program according to claim 7, wherein content including the gray word that is not included in any of the white words is subjected to evaluation determination based on a predetermined criterion as to whether or not to restrict browsing.
JP2003103817A 2003-04-08 2003-04-08 Filtering apparatus, system, method and program Expired - Fee Related JP4253209B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003103817A JP4253209B2 (en) 2003-04-08 2003-04-08 Filtering apparatus, system, method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003103817A JP4253209B2 (en) 2003-04-08 2003-04-08 Filtering apparatus, system, method and program

Publications (2)

Publication Number Publication Date
JP2004310494A JP2004310494A (en) 2004-11-04
JP4253209B2 true JP4253209B2 (en) 2009-04-08

Family

ID=33466812

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003103817A Expired - Fee Related JP4253209B2 (en) 2003-04-08 2003-04-08 Filtering apparatus, system, method and program

Country Status (1)

Country Link
JP (1) JP4253209B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4859779B2 (en) * 2007-08-01 2012-01-25 ヤフー株式会社 Hazardous content evaluation assigning apparatus, program and method
US20130035998A1 (en) * 2010-02-03 2013-02-07 Brightwise Associates, Inc. Device, method and program for managing feedback from viewers regarding distributed content

Also Published As

Publication number Publication date
JP2004310494A (en) 2004-11-04

Similar Documents

Publication Publication Date Title
US9535914B2 (en) Method, system, and computer program product for sharing information
US7636777B1 (en) Restricting access to requested resources
US6240455B1 (en) Internet server providing link destination deletion, alteration, and addition
US7464162B2 (en) Systems and methods for testing whether access to a resource is authorized based on access information
US6704797B1 (en) Method and system for distributing image-based content on the internet
US7200862B2 (en) Securing uniform resource identifier namespaces
JP2009048635A (en) User authentication system using ip address, and its method
JPH0926975A (en) System and method for database access control
JP2009110214A (en) Data access control system and method according to position information of mobile terminal
JP3662734B2 (en) Web page access control apparatus and method
JP2008083906A (en) Server and program
JP4240929B2 (en) Access control method in file management system
JP4416593B2 (en) Network connection control method and network connection control system
US20050044246A1 (en) Data management server, data management method and computer program
Wen et al. Internet and employee productivity
JP4400787B2 (en) Web access monitoring system and administrator client computer
JP4640776B2 (en) Information system setting device, information system setting method and program
JP2000172646A (en) Application function designating device and storage medium
JP4253209B2 (en) Filtering apparatus, system, method and program
JP2004110549A (en) Network system and program
JP2004013258A (en) Information filtering system
US20020083058A1 (en) Method, apparatus and article for reference material management
JP2005339008A (en) Access control method and program, and recording medium
JP2003044441A (en) Network access control management system
Ungureanu et al. A policy-based access control mechanism for the corporate web

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20060308

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060322

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20060308

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080820

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080826

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081027

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090120

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090123

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120130

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120130

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120130

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120130

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130130

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130130

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140130

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees