JP2009251655A

JP2009251655A - フィルタリング装置、フィルタリング方法、プログラムおよび記録媒体

Info

Publication number: JP2009251655A
Application number: JP2008095109A
Authority: JP
Inventors: Takayuki Akiyama; 隆之秋山
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2008-04-01
Filing date: 2008-04-01
Publication date: 2009-10-29

Abstract

【課題】利用者にとって好ましくない情報を遮断する効率が低いという問題を解決するフィルタリング装置を提供する。
【解決手段】マスク情報検索部１３は、通信部１が受信したデジタルコンテンツの画像情報から、その画像情報に含まれる文字列を抽出する。マスク情報検索部１３は、その抽出した文字列からマスク情報記録部１４に記録されたキーワードを検索する。コンテンツ変換部１５は、マスク情報検索部１３にてキーワードが見つかると、その画像情報を置換画像情報に置き換える。コンテンツ出力制御部１６ａは、コンテンツ変換部１５が置き換えたデジタルコンテンツを出力部３ａから出力する。
【選択図】図６

Description

本発明は、フィルタリング装置、フィルタリング方法、プログラムおよび記録媒体に関し、特には、ネットワーク上の利用者にとって好ましくない情報をフィルタリングするフィルタリング装置、フィルタリング方法、プログラムおよび記録媒体に関する。

近年、放送業界では、有害情報の自主規制が行われている。しかしながら、ネットワーク上では、有害情報の自主規制は十分には行われていない。このため、利用者がネットワーク上の情報（デジタルコンテンツ）を参照するとき、利用者の希望に反して有害情報が提供されることが多くなっている。このことは、社会的な問題にもなっている。

このような有害情報を遮断するためのフィルタリング技術としては、有害情報を含むデジタルコンテンツである有害コンテンツの提供をサーバが規制するものや、その有害コンテンツの出力を端末が規制するものがある。

このフィルタリング技術では、サーバの管理者や任意の情報提供者にて登録されたＵＲＬ（Uniform Resource Locator）のデジタルコンテンツが有害コンテンツとして遮断される。

有害情報が効率的に遮断されるためには、有害コンテンツのＵＲＬが、その有害コンテンツの発生後、即時に登録される必要がある。しかしながら、日々新たなデジタルコンテンツが大量に発生している現在の状況では、有害コンテンツの発生後に、その有害コンテンツのＵＲＬを即時に登録することは、非常に難しい。

また、デジタルコンテンツのＵＲＬを登録するためのシステムの運用が必要になる。このシステムの運用に対して、時間的あるいは金銭的なコストがかかると考えられる。

したがって、上記のようなデジタルコンテンツのＵＲＬを登録する方法では、有害情報を遮断する効率が悪かった。

また、一般的に有害情報と判断されるような情報に限らず、利用者にとって好ましくない情報であれば、遮断の対象とすることが望ましい。ここで、利用者にとって好ましくない情報とは、一般的に有害情報と判断されるような情報、利用者が見たくない情報、および、利用者が聞きたく情報などのことである。

このような利用者にとって好ましくない情報は利用者ごとに異なるので、上記のようなデジタルコンテンツのＵＲＬを登録する方法では、利用者にとって好ましくない情報を適切に遮断することは困難である。

特許文献１には、ＵＲＬが登録されなくてもデジタルコンテンツを遮断することが可能なフィルタリング装置が記載されている。このフィルタリング装置には、閲覧規制の対象となる文字列である規制語が保存される。フィルタリング装置は、その規制語を含むデジタルコンテンツを遮断する。

これにより、利用者にとって好ましくない情報を表す文字列（例えば、淫乱など）が規制語として保存されれば、ＵＲＬが登録されなくても、利用者にとって好ましくない情報を適切に遮断することが可能になる。新たなデジタルコンテンツが発生する度合に比べて、利用者にとって好ましくない情報を表す文字列が新たに発生する度合は少ないので、規制語を頻繁に登録しなくてもよくなる。よって、利用者にとって好ましくない情報を遮断する効率を向上させることが可能になる。

しかしながら、このようなデジタルコンテンツの全体を遮断する方法では、そのデジタルコンテンツの一部分だけに利用者にとって好ましくない情報を含み、その他の部分に利用者にとって有益な情報を含む場合に、その有益な情報も遮断される。したがって、ネットワーク上の情報を参照する際の利便性が損なわれる。

そこで、デジタルコンテンツ内の情報単位で利用者にとって好ましくないを遮断することが可能な技術が求められている。ここで、デジタルコンテンツ内の情報としては、テキスト情報や画像情報などがある。

特許文献２には、発明の目的は異なるが、情報単位で利用者にとって好ましくない情報を遮断することが可能なデータ処理装置が記載されている。このデータ処理装置では、デジタルコンテンツに、そのデジタルコンテンツの一部分をマスクするためのマスク特定情報が関連付けられている。マスク特定情報は、具体的には、デジタルコンテンツ内のマスクする部分を特定する情報であり、マスクを開始する開始位置情報と、マスクの大きさを示すマスク量とからなる。

データ処理装置は、マスク情報が特定する部分にマスクをつけたデジタルコンテンツを表示する。このため、マスク情報がデジタルコンテンツ内の有害情報を特定するように設定されれば、情報単位で利用者にとって好ましくない情報を遮断することが可能になる。
特開２００４−３１０４９４号公報特許２００３−６７３７２号公報

特許文献２に記載のデータ処理装置を用いて利用者にとって好ましくない情報を遮断するためには、マスク情報を、利用者にとって好ましくない情報を特定するように設定する必要がある。

特許文献２には、マスク情報の設定方法として、利用者にて設定された検索条件でデジタルコンテンツが検索され、その検索された部分を特定するマスク特定情報が設定される方法が記載されている。このため、検索条件を、利用者にとって好ましくない情報を表す文字列にすれば、マスク情報を、利用者にとって好ましくない情報を特定するように設定することが可能になる。

また、利用者にとって好ましくない情報は、テキスト情報である場合もあるが、画像情報である場合が非常に多い。このため、利用者にとって好ましくない情報であるテキスト情報が遮断されても、利用者にとって好ましくない情報である画像情報が遮断されない場合、利用者にとって好ましくない情報が多く提供されることとなり、利用者にとって好ましくない情報を遮断する効率が著しく低いという問題がある。

特許文献２に記載のデータ処理装置は、文章中の暗記したい単語をマスクするために考案されたものである。このため、特許文献２では、マスク情報を、画像情報を特定するように設定する記載はない。また、上記のように、検索条件を利用者にとって好ましくない情報を表す文字列にしても、画像情報は検索されないので、マスク情報を、画像情報を特定するように設定することができない。

したがって、特許文献２に記載のデータ処理装置では、画像情報が利用者にとって好ましくない情報である場合、その利用者にとって好ましくない情報を遮断することができないので、利用者にとって好ましくない情報を遮断する効率が著しく低いという問題を解決することはできない。

本発明の目的は、上記の課題である、利用者にとって好ましくない情報を遮断する効率が低いという問題を解決するフィルタリング装置、フィルタリング方法、プログラムおよび記録媒体を提供することである。

本発明によるフィルタリング装置は、出力手段と、出力を規制する情報を判別するための判別用文字列を記録する記録手段と、画像情報を有するデジタルコンテンツを受信する通信手段と、前記通信手段が受信したデジタルコンテンツの画像情報から、該画像情報に含まれる文字列を抽出し、該文字列から前記記録手段に記録された判別用文字列を検索する検索手段と、前記検索手段にて前記判別用文字列が見つかると、前記画像情報を置換情報に置き換える変換手段と、前記変換手段にて前記画像情報が前記置換情報に置き換えられたデジタルコンテンツを前記出力手段から出力する出力制御手段と、を含む。

本発明によるフィルタリング方法は、出力を規制する情報を判別するための判別用文字列を記録する記録手段を含むフィルタリング装置によるフィルタリング方法であって、
画像情報を有するデジタルコンテンツを受信し、前記受信されたデジタルコンテンツの画像情報から、該画像情報に含まれる文字列を抽出し、前記抽出された文字列から前記記録手段に記録された判別用文字列を検索し、前記判別用文字列が見つかると、前記画像情報を置換情報に置き換え、前記画像情報が前記置換情報に置き換えられたデジタルコンテンツを出力する。

本発明によるプログラムは、出力を規制する情報を判別するための判別用文字列を記録する記録手段に接続されたコンピュータに、画像情報を有するデジタルコンテンツを受信する手順と、前記受信されたデジタルコンテンツの画像情報から、該画像情報に含まれる文字列を抽出する手順と、前記抽出された文字列から前記記録手段に記録された判別用文字列を検索する手順と、前記判別用文字列が見つかると、前記画像情報を置換情報に置き換える手順と、前記画像情報が前記置換情報に置き換えられたデジタルコンテンツを出力する手順と、を実行させる。

本発明による記録媒体は、上記のプログラムを記録した、コンピュータにて読み取り可能な記録媒体である。

本発明によれば、利用者にとって好ましくない情報を遮断する効率が向上させることが可能になる。

以下、本発明の実施形態について図面を参照して説明する。なお、以下の説明では、同じ機能を有する構成には同じ符号を付け、その説明を省略する場合がある。

図１は、本発明の第一の実施形態のフィルタリング装置の構成を示したブロック図である。図１において、フィルタリング装置１００は、通信部１と、入力部２と、表示部３と、処理部４とを含む。また、フィルタリング装置１００は、デジタルコンテンツを格納するサーバ１０１とネットワークを経由して相互に接続可能である。

通信部１は、サーバ１０１から、デジタルコンテンツを受信する。デジタルコンテンツは、画像情報と、ＷＥＢページを示すＷＥＢ情報とを有する。画像情報は、静止画像情報でもよいし、動画像情報でもよし、その両方でもよい。また、ＷＥＢ情報は、構造化文書情報の一例であり、例えば、ＨＴＭＬやＸＭＬで記述される。なお、構造化文書情報とは、タグと呼ばれる構造識別子によって、文書構造（段落、書式および文字飾りの指定や、他のデジタルコンテンツへのリンク情報の埋め込みなど）を特定することが可能な情報である。

入力部２は、例えば、キーボードおよびマウスである。入力部２は、利用者から、出力を規制する情報を判別するためのマスク情報を受け付ける。マスク情報は、一つでもよいし、複数でもよい。マスク情報は、例えば、キーワードであり、判別用文字列の一例である。以下、マスク情報をキーワードと称することもある。

表示部３は、出力手段の一例である。表示部３は、ディスプレイなどの表示装置であり、種々の情報を表示する。

処理部４は、通信部１が受信したデジタルコンテンツを表示部３に表示する。このとき、処理部４は、そのデジタルコンテンツを必要に応じて加工する。

具体的には、処理部４は、マスク情報管理部１１と、コンテンツ受信部１２と、マスク情報検索部１３と、マスク情報記録部１４と、コンテンツ変換部１５と、コンテンツ表示制御部１６とを含み、各部が以下の処理を行う。なお、マスク情報検索部１３、マスク情報記録部１４およびコンテンツ変換部１５は、デジタルコンテンツ内の情報の出力を規制するマスク処理を実行するマスク処理部１７を構成する。

マスク情報管理部１１は、入力部２が受け付けたキーワードをマスク情報記録部１４に記録する。

コンテンツ受信部１２には、マスク処理を実行するマスク処理モードと、マスク処理を実行しない通常処理モードとにどちらか一方が設定される。

マスク情報検索部１３は、コンテンツ受信部１２にマスク処理モードが設定されていると、通信部１が受信したデジタルコンテンツからマスク情報記録部１４に記録されたキーワードを検索する。

具体的には、マスク情報検索部１３は、デジタルコンテンツの画像情報からその画像情報に含まれる文字列を抽出し、その文字列からキーワードを検索する。

文字列の抽出については、例えば、マスク情報検索部１３は、画像情報に対して文字認識を行い、その文字認識の結果を画像情報に含まれる文字列として抽出する。このとき、マスク情報検索部１３は、画像情報に対して、ソフトウェアによるＯＣＲ（Optical Character Reader）処理を行うことで、画像情報に対して文字認識を行うことが望ましい。また、マスク情報検索部１３は、画像情報に含まれるメタ情報を、画像情報に含まれる文字列として抽出してもよい。なお、メタ情報は、例えば、画像情報の名前であり、画像情報にテキスト情報として含まれる。

また、マスク情報検索部１３は、デジタルコンテンツのＷＥＢ情報からキーワードを検索する。

コンテンツ変換部１５は、マスク情報検索部１３の検索結果に応じたマスク処理を行うことで、デジタルコンテンツを加工する。

具体的には、マスク情報検索部１３が画像情報に含まれる文字列からキーワードを見つけると、コンテンツ変換部１５は、その画像情報を置換画像情報に置き換えることで、デジタルコンテンツを加工する。置換画像情報は、例えば、コンテンツ変換部１５が画像情報にモザイク処理や黒塗り処理などの画像処理を行うことで生成されてもよいし、コンテンツ変換部１５にて予め保持されていてもよい。なお、置換画像情報は、置換情報の一例である。

ここで、画像情報が動画像情報の場合、コンテンツ変換部１５は、キーワードを見つけると、動画像情報の全てを置換画像情報に置き換えてもよいし、キーワードが現れている間だけ動画像情報を置換画像情報に置き換えてもよい。

また、マスク情報検索部１３がＷＥＢ情報からキーワードを見つけると、コンテンツ変換部１５は、キーワードを置換文字情報に置き換えることで、デジタルコンテンツを加工する。

具体的には、コンテンツ変換部１５は、ＷＥＢ情報の構文解析を行い、キーワードが、所定のタグで定義された所定要素に含まれるか否かを判断する。所定のタグは、例えば、段落を定義する段落タグ「＜Ｐ＞および＜／Ｐ＞」や、他のデジタルコンテンツを呼び出すリンク情報を定義するリンクタグ「＜Ａ＞および＜／Ａ＞」である。また、所定要素は、その所定のタグで囲まれた情報である。

コンテンツ変換部１５は、キーワードが所定要素に含まれる場合、その所定要素内の文字列を置換文字列情報に置き換える。置換文字列情報は、例えば、コンテンツ変換部１５に予め伏せ字情報として保持されていてもよいし、コンテンツ変換部１５がその文字列に目隠し処理などを行うことで生成されてもよい。伏せ字情報は、例えば、Ｘや●などである。また、目隠し処理は、文字列を暗号化する処理ことである。また、置換文字列情報は、交換情報の一例である。

このとき、コンテンツ変換部１５は、所定のタグが予め定められた特定タグであると、その特定タグも削除する。特定タグは、例えば、リンクタグである。

コンテンツ表示制御部１６は、コンテンツ受信部１２に通常処理モードが設定されている場合、および、マスク情報検索部１３がキーワードを見つけられなかった場合、通信部１が受信したデジタルコンテンツを表示部３に表示する。

また、コンテンツ表示制御部１６は、マスク情報検索部１３がキーワードを見つけた場合、マスク情報検索部１３が加工したデジタルコンテンツを表示部３に表示する。

次に動作を説明する。図２は、フィルタリング装置１００の動作を説明するためのフローチャートである。

ステップＳ１では、利用者は、入力部２を操作して、フィルタリング装置に、デジタルコンテンツの取得要求をサーバ１０１に送信させる。

通信部１は、サーバ１０１からその取得要求に応じたデジタルコンテンツを受信すると、そのデジタルコンテンツをコンテンツ受信部１２に送信する。コンテンツ受信部１２は、デジタルコンテンツを受信すると、ステップＳ２を実行する。

ステップＳ２では、コンテンツ受信部１２は、マスク処理モードが設定されているか否かを判定する。

コンテンツ受信部１２は、マスク処理モードが設定されていないと、デジタルコンテンツをコンテンツ表示制御部１６に送信する。コンテンツ表示制御部１６は、デジタルコンテンツを受信すると、ステップＳ６を実行する。

一方、コンテンツ受信部１２は、マスク処理モードが設定されていると、デジタルコンテンツをマスク情報検索部１３に送信する。マスク情報検索部１３は、デジタルコンテンツを受信すると、ステップＳ３を実行する。

ステップＳ３では、マスク情報検索部１３は、マスク情報記録部１４からキーワードを取得する。

マスク情報検索部１３は、デジタルコンテンツの画像情報に対してソフトウェアによるＯＣＲ処理を行うことで、画像情報に対して文字認識を行う。マスク情報検索部１３は、文字認識の結果を画像情報に含まれる文字列として抽出する。マスク情報検索部１３は、その抽出した文字列をキーワードと照合していくことで、文字列からキーワードを検索する。

また、マスク情報検索部１３は、デジタルコンテンツのＷＥＢ情報をキーワードと照合していくことで、ＷＥＢ情報からキーワードを検索する。

マスク情報検索部１３は、画像情報およびＷＥＢ情報の検索が終了すると、ステップＳ４を実行する。

ステップＳ４では、マスク情報検索部１３は、画像情報からキーワードを見つけると、キーワードを見つけたことを示す発見情報をその画像に添付する。また、マスク情報検索部１３は、ＷＥＢ情報からキーワードを見つけると、ＷＥＢ情報内のキーワードに発見情報を添付する。なお、マスク情報検索部１３は、画像情報およびＷＥＢ情報のどちらからもキーワードを見つけられないと、発見情報の添付を行わない。

そして、マスク情報検索部１３は、そのデジタルコンテンツをコンテンツ変換部１５に送信する。コンテンツ変換部１５は、デジタルコンテンツを受信すると、そのデジタルコンテンツに発見情報があるか否かを判断する。

コンテンツ変換部１５は、発見情報がないと、デジタルコンテンツをコンテンツ表示制御部１６に送信する。コンテンツ表示制御部１６は、デジタルコンテンツを受信すると、ステップＳ６を実行する。

一方、コンテンツ変換部１５は、発見情報があると、ステップＳ５を実行する。

ステップＳ５では、コンテンツ変換部１５は、その発見情報が画像情報に添付されていると、その画像情報を置換画像情報に置き換えることで、デジタルコンテンツを加工する。

また、コンテンツ変換部１５は、その発見情報がＷＥＢ情報内のキーワードに添付されていると、ＷＥＢ情報の構文解析を行い、そのキーワードが所定要素に含まれているか否かを判断する。コンテンツ変換部１５は、キーワードが所定要素に含まれていると、その所定要素内の文字列を交換情報に置き換え、一方、キーワードが所定要素に含まれていないと、そのキーワードを交換情報に置き換えることで、デジタルコンテンツを加工する。

コンテンツ変換部１５は、その所定要素を定義するタグが特定タグであるか否かを判断する。コンテンツ変換部１５は、そのタグが特定タグであると、その特定タグを削除することで、デジタルコンテンツを加工する。なお、コンテンツ変換部１５は、そのタグが特定タグでないと、その特定タグの削除は行わない。

コンテンツ変換部１５は、その加工したデジタルコンテンツをコンテンツ表示制御部１６に送信する。コンテンツ表示制御部１６は、デジタルコンテンツを受信すると、ステップＳ６を実行する。

ステップＳ６では、コンテンツ表示制御部１６は、受信したデジタルコンテンツを表示部３に表示する。

次に、デジタルコンテンツの加工についてより詳細に説明する。

図３は、加工前のデジタルコンテンツの内容の一例を表した説明図であり、図４は、加工後のデジタルコンテンツの内容の一例を表した説明図である。

図３では、デジタルコンテンツ３００が有する、リンク情報３０１および３０２と、構文情報３０３と、画像情報３０４とが示されている。

リンク情報３０１および３０２と、構文情報３０３は、所定要素であるとする。また、リンク情報３０１および３０２を定義するリンクタグは、特定タグであるとする。さらに、マスク情報記録部１４は、キーワードとして「スポーツ」を記録しているものとする。

マスク情報検索部１３は、画像情報３０４に対してソフトウェアによるＯＣＲ処理を行うことで、画像情報３０４に対する文字認識を行う。マスク情報検索部１３は、その文字認識の結果「スポーツショップ」を画像情報３０４に含まれる文字列として抽出する。その文字列「スポーツショップ」にはキーワード「スポーツ」が含まれているので、マスク情報検索部１３は、その文字列「スポーツショップ」からキーワード「スポーツ」を見つける。そして、マスク情報検索部１３は、発見情報を画像情報３０４に添付する。

また、マスク情報検索部１３は、リンク情報３０１および３０２と、構文情報３０３とを含むＷＥＢ情報からキーワード「スポーツ」を検索する。マスク情報検索部１３は、リンク情報３０１および構文情報３０３内のそれぞれにキーワード「スポーツ」を見つけ、その見つけたキーワード「スポーツ」のそれぞれに発見情報を添付する。

コンテンツ変換部１５は、画像情報３０４に発見情報が添付されているので、画像情報３０４を置換画像情報に置き換える。図４では、コンテンツ変換部１５が画像情報３０４に黒塗り処理を行った画像を置換画像３１４として生成し、画像情報を置換画像３１４に置き換えている。

また、コンテンツ変換部１５は、デジタルコンテンツ３００の構文解析を行い、キーワード「スポーツ」が所定要素に含まれるか否かを判断する。コンテンツ変換部１５は、キーワード「スポーツ」が所定要素に含まれると、その所定要素内の文字列を置換●やＸなどの伏せ字情報に置き換える。図４では、リンク情報３０１に含まれる文字列「スポーツの結果」が伏せ字情報３１１に置き換えられ、構文情報３０３に含まれる文字列「スポーツの結果Ａ−ｔｅａｍ１０−Ｂ−ｔｅａｍ５」が伏せ字情報３１３に置き換えられている。

これにより、キーワードだけでなく、そのキーワードに関連する一連の情報に対してマスク処理を行うことが可能になる。

ここで、コンテンツ変換部１５は、置き換え後の文字（伏せ字）として、置き換え前の文字の種別（記号、英字、カナ文字、数字、全角文字または半角文字）やキーワードの種類などに応じて異なる文字を用いてもよい。また、コンテンツ変換部１５は、タグのレベル属性に応じて、置換文字列情報の大きさを調整してもよい。なお、レベル属性は、タグで定義される要素に含まれる文字列の大きさを指定する属性である。

この場合、利用者は、置き換え前の文字列が表す内容を推測する余地を残すことが可能になる。

また、リンク情報３０１を定義するリンクタグが特定タグであるので、コンテンツ変換部１５は、そのリンクタグを削除する。これにより、リンク情報３０１にて指定されるリンク先へのアクセスを規制することができる。なお、リンク情報３０２「天気予報」は、キーワードを含まないので、置換文字列情報への置き換えや、リンクタグの削除は行われない。このため、リンク情報３０２にて指定されるリンク先へのアクセスは可能である。

次に効果を説明する。

本実施形態では、マスク情報検索部１３は、通信部１が受信したデジタルコンテンツの画像情報から、その画像情報に含まれる文字列を抽出する。マスク情報検索部１３は、その抽出した文字列からマスク情報記録部１４に記録されたキーワードを検索する。コンテンツ変換部１５は、マスク情報検索部１３にてキーワードが見つかると、その画像情報を置換画像情報に置き換える。コンテンツ表示制御部１６は、コンテンツ変換部１５が置き換えたデジタルコンテンツを表示部３に表示する。

この場合、画像情報に含まれる文字列からキーワードが見つかると、その画像情報が置換画像情報に置き換わる。よって、キーワードが適宜設定されれば、利用者にとって好ましくない画像情報を遮断することが可能になる。したがって、利用者にとって好ましくない情報を遮断する効率を向上させることが可能になる。

また、マスク情報検索部１３は、画像情報に対して文字認識を行い、その文字認識の結果から文字列を抽出する。

この場合、利用者にとって好ましくない情報を遮断する効率をより向上させることが可能になる。

また、本実施形態では、マスク情報検索部１３は、通信部１が受信したデジタルコンテンツのＷＥＢ情報から、マスク情報記録部１４に記録されたキーワードを検索する。コンテンツ変換部１５は、マスク情報検索部１３にてＷＥＢ情報からキーワードが見つかると、そのキーワードが所定要素に含まれるか否かを判断する。コンテンツ変換部１５は、キーワードが所定要素に含まれる場合、その所定要素内の文字列を置換文字列情報に置き換える。

この場合、キーワードが所定要素に含まれると、その所定要素内の文字列が置換文字列情報に置き換わる。したがって、キーワードだけでなく、そのキーワードに関連する一連の情報を遮断することが可能になるので、利用者にとって好ましくない情報を遮断する効率をより向上させることが可能になる。

また、本実施形態では、コンテンツ変換部１５は、キーワードが所定要素に含まれる場合、その所定要素を定義するタグが特定タグであると、その特定タグを削除する。

この場合、特定タグに応じた機能を規制することが可能になるので、利用者にとって好ましくない情報を遮断する効率をより向上させることが可能になる。

また、本実施形態では、特定タグは、リンクタグである。

この場合、利用者にとって好ましくないデジタルコンテンツへのアクセスを規制することが可能になるので、利用者にとって好ましくない情報を遮断する効率をより向上させることが可能になる。

次に第二の実施形態について説明する。

図５は、本実施形態のフィルタリング装置を示したブロック図である。

図５において、フィルタリング装置１００は、図１で示したフィルタリング装置１００のマスク情報管理部１１の代わりに、マスク情報ダウンロード部１８を含む。また、フィルタリング装置１００は、マスク情報を格納するサーバ１０２と、ネットワークを経由して互いに接続可能である。

入力部２は、利用者から、マスク情報を取得する旨の取得要求を受け付ける。取得要求は、マスク情報の格納場所を示す場所情報（例えば、ＵＲＬ）を含む。以下では、場所情報にて示される格納場所は、サーバ１０２内にあるとする。

マスク情報ダウンロード部１８は、取得手段の一例である。マスク情報ダウンロード部１８は、入力部２が取得要求を受け付けると、その取得要求の場所情報にて指定される格納場所を有するサーバ１０２からマスク情報をダウンロードすることで、サーバ１０２からマスク情報を取得する。マスク情報ダウンロード部１８は、その取得したマスク情報をマスク情報記録部１４に記録する。

次に動作を説明する。

先ず、入力部２は、利用者から取得要求を受け付けると、その取得要求をマスク情報ダウンロード部１８に送信する。

続いて、マスク情報ダウンロード部１８は、取得要求を受信すると、その取得要求の場所情報にて指定される格納場所を有するサーバ１０２にアクセスし、その格納場所に記録されているマスク情報をダウンロードする。

そして、マスク情報ダウンロード部１８は、そのダウンロードしたマスク情報をマスク情報記録部１４に記録する。

次に、効果を説明する。

本実施形態では、マスク情報ダウンロード部１８は、入力部２が取得要求を受け付けると、サーバ１０２からマスク情報を取得する。マスク情報ダウンロード部１８は、そのダウンロードしたマスク情報をマスク情報記録部１４に記録する。

この場合、利用者がマスク情報を手動で入力しなくても、マスク情報を設定することが可能になる。したがって、容易にマスク情報を設定することが可能になる。また、利用者にとって好ましくない情報を表す一般的なキーワードを、複数のフィルタリング装置で共有することが可能になる。

次に、第三の実施形態について説明する。本実施形態では、本発明によるフィルタリング装置の最も簡単な構成について説明する。

図６は、本実施形態のフィルタリング装置の構成を示したブロック図である。図６において、フィルタリング装置１００は、通信部１と、出力部３ａと、処理部４とを含む。また、処理部４は、マスク情報検索部１３と、マスク情報記録部１４と、コンテンツ変換部１５と、コンテンツ出力制御部１６ａを含む。

通信部１は、画像情報を有するデジタルコンテンツを受信する。

出力部３ａは、ディスプレイなどの表示装置でもよいし、端末装置と通信可能な通信装置でもよい。なお、出力部３ａが通信装置の場合、フィルタリング装置１００をプロクシサーバなどに適用することが可能になる。また、この場合、出力部３ａは、通信部１と兼用されてもよい。

マスク情報記録部１４は、マスク情報を記録する。なお、マスク情報の登録方法は、第一の実施形態のように利用者にて手動で登録されるものでもよいし、第二の実施形態のようにサーバからのダウンロードにて登録されるものでもよし、さらには、予め登録されていてもよい。また、これらの登録方法が組み合わされてもよい。

マスク情報検索部１３は、通信部１が受信したデジタルコンテンツの画像情報から、その画像情報に含まれる文字列を抽出し、その文字列からキーワードを検索する。

マスク情報検索部１３が画像情報に含まれる文字列からキーワードを見つけると、コンテンツ変換部１５は、その画像情報を置換画像情報に置き換える。

コンテンツ出力制御部１６ａは、マスク情報検索部１３がキーワードを見つけた場合、マスク情報検索部１３が画像情報を置換画像情報に置き換えたデジタルコンテンツを出力部３ａから出力する。また、コンテンツ出力制御部１６ａは、マスク情報検索部１３がキーワードを見つけられなかった場合、通信部１が受信したデジタルコンテンツを出力部３ａから出力する。

次に動作を説明する。

先ず、通信部１は、デジタルコンテンツを受信すると、そのデジタルコンテンツをマスク情報検索部１３に送信する。マスク情報検索部１３は、デジタルコンテンツを受信すると、そのデジタルコンテンツの画像情報から、その画像情報に含まれる文字列を抽出し、その文字列からキーワードを検索する。

続いて、マスク情報検索部１３が画像情報に含まれる文字列からキーワードを見つけると、その画像情報に発見情報を添付し、その発見情報を添付したデジタルコンテンツをコンテンツ変換部１５に送信する。一方、マスク情報検索部１３が画像情報に含まれる文字列からキーワードを見つけられないと、受信したデジタルコンテンツをコンテンツ変換部１５に送信する。

コンテンツ変換部１５は、デジタルコンテンツを受信すると、そのデジタルコンテンツに発見情報があるか否かを判断する。

コンテンツ変換部１５は、デジタルコンテンツに発見情報があると、その発見情報が添付された画像情報を置換画像情報に置き換え、その置き換えたデジタルコンテンツをコンテンツ出力制御部１６ａに送信する。一方、コンテンツ変換部１５は、デジタルコンテンツに発見情報がないと、受信したデジタルコンテンツをコンテンツ出力制御部１６ａに送信する。

コンテンツ出力制御部１６は、デジタルコンテンツを受信すると、そのデジタルコンテンツを出力部３ａから出力する。

次に効果を説明する。

本実施形態では、マスク情報検索部１３は、通信部１が受信したデジタルコンテンツの画像情報から、その画像情報に含まれる文字列を抽出する。マスク情報検索部１３は、その抽出した文字列からマスク情報記録部１４に記録されたキーワードを検索する。コンテンツ変換部１５は、マスク情報検索部１３にてキーワードが見つかると、その画像情報を置換画像情報に置き換える。コンテンツ出力制御部１６ａは、コンテンツ変換部１５が置き換えたデジタルコンテンツを出力部３ａから出力する。

この場合、画像情報に含まれる文字列からキーワードが見つかると、その画像情報が置換画像情報に置き換わる。よって、本実施形態でも、キーワードが適宜設定されれば、利用者にとって好ましくない画像情報を遮断することが可能になる。したがって、利用者にとって好ましくない情報を遮断する効率を向上させることが可能になる。

なお、以上説明したフィルタリング装置１００の機能は、その機能を実現するためのプログラムを、コンピュータにて読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータに読み込ませ、実行するものであってもよい。コンピュータにて読み取り可能な記録媒体とは、フレキシブルディスク、光磁気ディスク、ＣＤ−ＲＯＭ等の記録媒体、コンピュータシステムに内蔵されるハードディスク装置等の記録装置を指す。さらに、コンピュータにて読み取り可能な記録媒体は、インターネットを介してプログラムを送信する場合のように、短時間、動的にプログラムを保持するもの（伝送媒体または伝送波）、その場合のサーバとなるコンピュータ内の揮発性メモリのように、一定期間プログラムを保持しているものを含む。

また、本発明は、プロクシサーバや、ＷＷＷブラウザのようなデジタルコンテンツを表示するアプリケーションプログラム、そして、放送の番組表を取得および表示するアプリケーションプログラムなどに適用できる。

以上説明した各実施形態において、図示した構成は単なる一例であって、本発明はその構成に限定されるものではない。

例えば、マスク情報検索部１３は、デジタルコンテンツが有する音声情報を音声認識し、その音声認識の結果からキーワードを検索してもよい。この場合、マスク情報検索部１３が音声認識の結果からキーワードを見つけると、コンテンツ変換部１５は、その音声情報を削除または置換音声情報に置き換える。

また、マスク情報記録部１４は、情報の種類に応じて異なるキーワードを記録してもよい。この場合、デジタルコンテンツ内のデータの種類に応じて、データの出力を規制することが可能になる。

さらに、マスク情報記録部１４のキーワードを、サーバへの書き込みやＷＥＢ検索サービスへの検索条件の入力など、フィルタリング装置からの送信データに対して適用することで、利用者にとって好ましくない情報などの送信や検索についても規制することが可能になる。

本発明の第一の実施形態のフィルタリング装置の構成を示したブロック図である。フィルタリング装置の動作を説明するためのフローチャートである。加工前のデジタルコンテンツの内容の一例を表した説明図である。加工後のデジタルコンテンツの内容の一例を表した説明図である。本発明の第二の実施形態のフィルタリング装置の構成を示したブロック図である。本発明の第三の実施形態のフィルタリング装置の構成を示したブロック図である。

符号の説明

１通信部
２入力部
３表示部
３ａ出力部
４処理部
１１マスク情報管理部
１２コンテンツ受信部
１３マスク情報検索部
１４マスク情報記録部
１５コンテンツ変換部
１６コンテンツ表示制御部
１６ａコンテンツ出力制御部
１７マスク処理部
１８マスク情報ダウンロード部

Claims

出力手段と、
出力を規制する情報を判別するための判別用文字列を記録する記録手段と、
画像情報を有するデジタルコンテンツを受信する通信手段と、
前記通信手段が受信したデジタルコンテンツの画像情報から、該画像情報に含まれる文字列を抽出し、該文字列から前記記録手段に記録された判別用文字列を検索する検索手段と、
前記検索手段にて前記判別用文字列が見つかると、前記画像情報を置換情報に置き換える変換手段と、
前記変換手段にて前記画像情報が前記置換情報に置き換えられたデジタルコンテンツを前記出力手段から出力する出力制御手段と、を含むフィルタリング装置。
請求項１に記載のフィルタリング装置において、
前記検索手段は、前記画像情報に対して文字認識を行い、該文字認識の結果を前記文字列として抽出する、フィルタリング装置。
請求項１または２に記載のフィルタリング装置において、
前記デジタルコンテンツは、構造化文書情報を有し、
前記検索手段は、前記デジタルコンテンツの構造化文書情報から前記記録手段に記録された判別用文字列を検索し、
前記変換手段は、前記検索手段にて前記構造化文書情報から前記判別用文字列が見つかると、前記判別用文字列が、所定のタグで定義された所定要素に含まれるか否かを判断し、該判別用文字列が前記所定要素に含まれる場合、該所定要素内の文字列を交換情報に置き換える、フィルタリング装置。
請求項３に記載のフィルタリング装置において、
前記変換手段は、前記判別用文字列が所定要素に含まれる場合、前記所定のタグが、予め定められた特定タグであると、該特定タグを削除する、フィルタリング装置。
請求項４に記載のフィルタリング装置において、
前記特定タグは、他のデジタルコンテンツを呼び出すリンク情報を定義するリンクタグである、フィルタリング装置。
請求項１ないし５のいずれか１項に記載のフィルタリング装置において、
利用者から、前記判別用文字列を取得する旨の取得要求を受け付ける入力手段と、
前記入力手段が前記取得要求を受け付けると、前記判別用文字列を格納しているサーバから、該判別用文字列を取得し、該判別用文字列を前記記録手段に記録する取得手段と、を含むフィルタリング装置。
出力を規制する情報を判別するための判別用文字列を記録する記録手段を含むフィルタリング装置によるフィルタリング方法であって、
画像情報を有するデジタルコンテンツを受信し、
前記受信されたデジタルコンテンツの画像情報から、該画像情報に含まれる文字列を抽出し、
前記抽出された文字列から前記記録手段に記録された判別用文字列を検索し、
前記判別用文字列が見つかると、前記画像情報を置換情報に置き換え、
前記画像情報が前記置換情報に置き換えられたデジタルコンテンツを出力する、フィルタリング方法。
請求項７に記載のフィルタリング方法において、
前記画像情報に対して文字認識を行い、該文字認識の結果を前記文字列として抽出する、フィルタリング方法。
請求項７または８に記載のフィルタリング方法において、
前記デジタルコンテンツは、構造化文書情報を有し、
前記デジタルコンテンツの構造化文書情報から前記記録手段に記録された判別用文字列を検索し、
前記構造化文書情報から前記判別用文字列が見つかると、前記判別用文字列が、所定のタグで定義された所定要素に含まれるか否かを判断し、
前記判別用文字列が前記所定要素に含まれる場合、該所定要素内の文字列を交換情報に置き換える、フィルタリング方法。
請求項９に記載のフィルタリング方法において、
前記判別用文字列が前記所定要素に含まれる場合、前記所定のタグが、予め定められた特定タグであると、該特定タグを削除する、フィルタリング方法。
請求項１０に記載のフィルタリング方法において、
前記特定タグは、他のデジタルコンテンツを呼び出すリンク情報を定義するリンクタグである、フィルタリング方法。
請求項７ないし１１のいずれか１項に記載のフィルタリング方法において、
利用者から、前記判別用文字列を取得する旨の取得要求を受け付け、
前記取得要求が受け付けられると、前記判別用文字列を格納しているサーバから、該判別用文字列を取得し、
前記取得した判別用文字列を前記記録手段に記録する、フィルタリング方法。
出力を規制する情報を判別するための判別用文字列を記録する記録手段に接続されたコンピュータに、
画像情報を有するデジタルコンテンツを受信する手順と、
前記受信されたデジタルコンテンツの画像情報から、該画像情報に含まれる文字列を抽出する手順と、
前記抽出された文字列から前記記録手段に記録された判別用文字列を検索する手順と、
前記判別用文字列が見つかると、前記画像情報を置換情報に置き換える手順と、
前記画像情報が前記置換情報に置き換えられたデジタルコンテンツを出力する手順と、を実行させるプログラム。
請求項１３に記載のプログラムにおいて、
前記画像情報に対して文字認識を行い、該文字認識の結果を前記文字列として抽出する手順を、前記コンピュータに実行させるプログラム。
請求項１３または１４に記載のプログラムを記録した、コンピュータにて読み取り可能な記録媒体。