JP2009251655A - フィルタリング装置、フィルタリング方法、プログラムおよび記録媒体 - Google Patents

フィルタリング装置、フィルタリング方法、プログラムおよび記録媒体 Download PDF

Info

Publication number
JP2009251655A
JP2009251655A JP2008095109A JP2008095109A JP2009251655A JP 2009251655 A JP2009251655 A JP 2009251655A JP 2008095109 A JP2008095109 A JP 2008095109A JP 2008095109 A JP2008095109 A JP 2008095109A JP 2009251655 A JP2009251655 A JP 2009251655A
Authority
JP
Japan
Prior art keywords
information
character string
image information
digital content
determination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008095109A
Other languages
English (en)
Inventor
Takayuki Akiyama
隆之 秋山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2008095109A priority Critical patent/JP2009251655A/ja
Publication of JP2009251655A publication Critical patent/JP2009251655A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Document Processing Apparatus (AREA)

Abstract

【課題】利用者にとって好ましくない情報を遮断する効率が低いという問題を解決するフィルタリング装置を提供する。
【解決手段】マスク情報検索部13は、通信部1が受信したデジタルコンテンツの画像情報から、その画像情報に含まれる文字列を抽出する。マスク情報検索部13は、その抽出した文字列からマスク情報記録部14に記録されたキーワードを検索する。コンテンツ変換部15は、マスク情報検索部13にてキーワードが見つかると、その画像情報を置換画像情報に置き換える。コンテンツ出力制御部16aは、コンテンツ変換部15が置き換えたデジタルコンテンツを出力部3aから出力する。
【選択図】図6

Description

本発明は、フィルタリング装置、フィルタリング方法、プログラムおよび記録媒体に関し、特には、ネットワーク上の利用者にとって好ましくない情報をフィルタリングするフィルタリング装置、フィルタリング方法、プログラムおよび記録媒体に関する。
近年、放送業界では、有害情報の自主規制が行われている。しかしながら、ネットワーク上では、有害情報の自主規制は十分には行われていない。このため、利用者がネットワーク上の情報(デジタルコンテンツ)を参照するとき、利用者の希望に反して有害情報が提供されることが多くなっている。このことは、社会的な問題にもなっている。
このような有害情報を遮断するためのフィルタリング技術としては、有害情報を含むデジタルコンテンツである有害コンテンツの提供をサーバが規制するものや、その有害コンテンツの出力を端末が規制するものがある。
このフィルタリング技術では、サーバの管理者や任意の情報提供者にて登録されたURL(Uniform Resource Locator)のデジタルコンテンツが有害コンテンツとして遮断される。
有害情報が効率的に遮断されるためには、有害コンテンツのURLが、その有害コンテンツの発生後、即時に登録される必要がある。しかしながら、日々新たなデジタルコンテンツが大量に発生している現在の状況では、有害コンテンツの発生後に、その有害コンテンツのURLを即時に登録することは、非常に難しい。
また、デジタルコンテンツのURLを登録するためのシステムの運用が必要になる。このシステムの運用に対して、時間的あるいは金銭的なコストがかかると考えられる。
したがって、上記のようなデジタルコンテンツのURLを登録する方法では、有害情報を遮断する効率が悪かった。
また、一般的に有害情報と判断されるような情報に限らず、利用者にとって好ましくない情報であれば、遮断の対象とすることが望ましい。ここで、利用者にとって好ましくない情報とは、一般的に有害情報と判断されるような情報、利用者が見たくない情報、および、利用者が聞きたく情報などのことである。
このような利用者にとって好ましくない情報は利用者ごとに異なるので、上記のようなデジタルコンテンツのURLを登録する方法では、利用者にとって好ましくない情報を適切に遮断することは困難である。
特許文献1には、URLが登録されなくてもデジタルコンテンツを遮断することが可能なフィルタリング装置が記載されている。このフィルタリング装置には、閲覧規制の対象となる文字列である規制語が保存される。フィルタリング装置は、その規制語を含むデジタルコンテンツを遮断する。
これにより、利用者にとって好ましくない情報を表す文字列(例えば、淫乱など)が規制語として保存されれば、URLが登録されなくても、利用者にとって好ましくない情報を適切に遮断することが可能になる。新たなデジタルコンテンツが発生する度合に比べて、利用者にとって好ましくない情報を表す文字列が新たに発生する度合は少ないので、規制語を頻繁に登録しなくてもよくなる。よって、利用者にとって好ましくない情報を遮断する効率を向上させることが可能になる。
しかしながら、このようなデジタルコンテンツの全体を遮断する方法では、そのデジタルコンテンツの一部分だけに利用者にとって好ましくない情報を含み、その他の部分に利用者にとって有益な情報を含む場合に、その有益な情報も遮断される。したがって、ネットワーク上の情報を参照する際の利便性が損なわれる。
そこで、デジタルコンテンツ内の情報単位で利用者にとって好ましくないを遮断することが可能な技術が求められている。ここで、デジタルコンテンツ内の情報としては、テキスト情報や画像情報などがある。
特許文献2には、発明の目的は異なるが、情報単位で利用者にとって好ましくない情報を遮断することが可能なデータ処理装置が記載されている。このデータ処理装置では、デジタルコンテンツに、そのデジタルコンテンツの一部分をマスクするためのマスク特定情報が関連付けられている。マスク特定情報は、具体的には、デジタルコンテンツ内のマスクする部分を特定する情報であり、マスクを開始する開始位置情報と、マスクの大きさを示すマスク量とからなる。
データ処理装置は、マスク情報が特定する部分にマスクをつけたデジタルコンテンツを表示する。このため、マスク情報がデジタルコンテンツ内の有害情報を特定するように設定されれば、情報単位で利用者にとって好ましくない情報を遮断することが可能になる。
特開2004−310494号公報 特許2003−67372号公報
特許文献2に記載のデータ処理装置を用いて利用者にとって好ましくない情報を遮断するためには、マスク情報を、利用者にとって好ましくない情報を特定するように設定する必要がある。
特許文献2には、マスク情報の設定方法として、利用者にて設定された検索条件でデジタルコンテンツが検索され、その検索された部分を特定するマスク特定情報が設定される方法が記載されている。このため、検索条件を、利用者にとって好ましくない情報を表す文字列にすれば、マスク情報を、利用者にとって好ましくない情報を特定するように設定することが可能になる。
また、利用者にとって好ましくない情報は、テキスト情報である場合もあるが、画像情報である場合が非常に多い。このため、利用者にとって好ましくない情報であるテキスト情報が遮断されても、利用者にとって好ましくない情報である画像情報が遮断されない場合、利用者にとって好ましくない情報が多く提供されることとなり、利用者にとって好ましくない情報を遮断する効率が著しく低いという問題がある。
特許文献2に記載のデータ処理装置は、文章中の暗記したい単語をマスクするために考案されたものである。このため、特許文献2では、マスク情報を、画像情報を特定するように設定する記載はない。また、上記のように、検索条件を利用者にとって好ましくない情報を表す文字列にしても、画像情報は検索されないので、マスク情報を、画像情報を特定するように設定することができない。
したがって、特許文献2に記載のデータ処理装置では、画像情報が利用者にとって好ましくない情報である場合、その利用者にとって好ましくない情報を遮断することができないので、利用者にとって好ましくない情報を遮断する効率が著しく低いという問題を解決することはできない。
本発明の目的は、上記の課題である、利用者にとって好ましくない情報を遮断する効率が低いという問題を解決するフィルタリング装置、フィルタリング方法、プログラムおよび記録媒体を提供することである。
本発明によるフィルタリング装置は、出力手段と、出力を規制する情報を判別するための判別用文字列を記録する記録手段と、画像情報を有するデジタルコンテンツを受信する通信手段と、前記通信手段が受信したデジタルコンテンツの画像情報から、該画像情報に含まれる文字列を抽出し、該文字列から前記記録手段に記録された判別用文字列を検索する検索手段と、前記検索手段にて前記判別用文字列が見つかると、前記画像情報を置換情報に置き換える変換手段と、前記変換手段にて前記画像情報が前記置換情報に置き換えられたデジタルコンテンツを前記出力手段から出力する出力制御手段と、を含む。
本発明によるフィルタリング方法は、出力を規制する情報を判別するための判別用文字列を記録する記録手段を含むフィルタリング装置によるフィルタリング方法であって、
画像情報を有するデジタルコンテンツを受信し、前記受信されたデジタルコンテンツの画像情報から、該画像情報に含まれる文字列を抽出し、前記抽出された文字列から前記記録手段に記録された判別用文字列を検索し、前記判別用文字列が見つかると、前記画像情報を置換情報に置き換え、前記画像情報が前記置換情報に置き換えられたデジタルコンテンツを出力する。
本発明によるプログラムは、出力を規制する情報を判別するための判別用文字列を記録する記録手段に接続されたコンピュータに、画像情報を有するデジタルコンテンツを受信する手順と、前記受信されたデジタルコンテンツの画像情報から、該画像情報に含まれる文字列を抽出する手順と、前記抽出された文字列から前記記録手段に記録された判別用文字列を検索する手順と、前記判別用文字列が見つかると、前記画像情報を置換情報に置き換える手順と、前記画像情報が前記置換情報に置き換えられたデジタルコンテンツを出力する手順と、を実行させる。
本発明による記録媒体は、上記のプログラムを記録した、コンピュータにて読み取り可能な記録媒体である。
本発明によれば、利用者にとって好ましくない情報を遮断する効率が向上させることが可能になる。
以下、本発明の実施形態について図面を参照して説明する。なお、以下の説明では、同じ機能を有する構成には同じ符号を付け、その説明を省略する場合がある。
図1は、本発明の第一の実施形態のフィルタリング装置の構成を示したブロック図である。図1において、フィルタリング装置100は、通信部1と、入力部2と、表示部3と、処理部4とを含む。また、フィルタリング装置100は、デジタルコンテンツを格納するサーバ101とネットワークを経由して相互に接続可能である。
通信部1は、サーバ101から、デジタルコンテンツを受信する。デジタルコンテンツは、画像情報と、WEBページを示すWEB情報とを有する。画像情報は、静止画像情報でもよいし、動画像情報でもよし、その両方でもよい。また、WEB情報は、構造化文書情報の一例であり、例えば、HTMLやXMLで記述される。なお、構造化文書情報とは、タグと呼ばれる構造識別子によって、文書構造(段落、書式および文字飾りの指定や、他のデジタルコンテンツへのリンク情報の埋め込みなど)を特定することが可能な情報である。
入力部2は、例えば、キーボードおよびマウスである。入力部2は、利用者から、出力を規制する情報を判別するためのマスク情報を受け付ける。マスク情報は、一つでもよいし、複数でもよい。マスク情報は、例えば、キーワードであり、判別用文字列の一例である。以下、マスク情報をキーワードと称することもある。
表示部3は、出力手段の一例である。表示部3は、ディスプレイなどの表示装置であり、種々の情報を表示する。
処理部4は、通信部1が受信したデジタルコンテンツを表示部3に表示する。このとき、処理部4は、そのデジタルコンテンツを必要に応じて加工する。
具体的には、処理部4は、マスク情報管理部11と、コンテンツ受信部12と、マスク情報検索部13と、マスク情報記録部14と、コンテンツ変換部15と、コンテンツ表示制御部16とを含み、各部が以下の処理を行う。なお、マスク情報検索部13、マスク情報記録部14およびコンテンツ変換部15は、デジタルコンテンツ内の情報の出力を規制するマスク処理を実行するマスク処理部17を構成する。
マスク情報管理部11は、入力部2が受け付けたキーワードをマスク情報記録部14に記録する。
コンテンツ受信部12には、マスク処理を実行するマスク処理モードと、マスク処理を実行しない通常処理モードとにどちらか一方が設定される。
マスク情報検索部13は、コンテンツ受信部12にマスク処理モードが設定されていると、通信部1が受信したデジタルコンテンツからマスク情報記録部14に記録されたキーワードを検索する。
具体的には、マスク情報検索部13は、デジタルコンテンツの画像情報からその画像情報に含まれる文字列を抽出し、その文字列からキーワードを検索する。
文字列の抽出については、例えば、マスク情報検索部13は、画像情報に対して文字認識を行い、その文字認識の結果を画像情報に含まれる文字列として抽出する。このとき、マスク情報検索部13は、画像情報に対して、ソフトウェアによるOCR(Optical Character Reader)処理を行うことで、画像情報に対して文字認識を行うことが望ましい。また、マスク情報検索部13は、画像情報に含まれるメタ情報を、画像情報に含まれる文字列として抽出してもよい。なお、メタ情報は、例えば、画像情報の名前であり、画像情報にテキスト情報として含まれる。
また、マスク情報検索部13は、デジタルコンテンツのWEB情報からキーワードを検索する。
コンテンツ変換部15は、マスク情報検索部13の検索結果に応じたマスク処理を行うことで、デジタルコンテンツを加工する。
具体的には、マスク情報検索部13が画像情報に含まれる文字列からキーワードを見つけると、コンテンツ変換部15は、その画像情報を置換画像情報に置き換えることで、デジタルコンテンツを加工する。置換画像情報は、例えば、コンテンツ変換部15が画像情報にモザイク処理や黒塗り処理などの画像処理を行うことで生成されてもよいし、コンテンツ変換部15にて予め保持されていてもよい。なお、置換画像情報は、置換情報の一例である。
ここで、画像情報が動画像情報の場合、コンテンツ変換部15は、キーワードを見つけると、動画像情報の全てを置換画像情報に置き換えてもよいし、キーワードが現れている間だけ動画像情報を置換画像情報に置き換えてもよい。
また、マスク情報検索部13がWEB情報からキーワードを見つけると、コンテンツ変換部15は、キーワードを置換文字情報に置き換えることで、デジタルコンテンツを加工する。
具体的には、コンテンツ変換部15は、WEB情報の構文解析を行い、キーワードが、所定のタグで定義された所定要素に含まれるか否かを判断する。所定のタグは、例えば、段落を定義する段落タグ「<P>および</P>」や、他のデジタルコンテンツを呼び出すリンク情報を定義するリンクタグ「<A>および</A>」である。また、所定要素は、その所定のタグで囲まれた情報である。
コンテンツ変換部15は、キーワードが所定要素に含まれる場合、その所定要素内の文字列を置換文字列情報に置き換える。置換文字列情報は、例えば、コンテンツ変換部15に予め伏せ字情報として保持されていてもよいし、コンテンツ変換部15がその文字列に目隠し処理などを行うことで生成されてもよい。伏せ字情報は、例えば、Xや●などである。また、目隠し処理は、文字列を暗号化する処理ことである。また、置換文字列情報は、交換情報の一例である。
このとき、コンテンツ変換部15は、所定のタグが予め定められた特定タグであると、その特定タグも削除する。特定タグは、例えば、リンクタグである。
コンテンツ表示制御部16は、コンテンツ受信部12に通常処理モードが設定されている場合、および、マスク情報検索部13がキーワードを見つけられなかった場合、通信部1が受信したデジタルコンテンツを表示部3に表示する。
また、コンテンツ表示制御部16は、マスク情報検索部13がキーワードを見つけた場合、マスク情報検索部13が加工したデジタルコンテンツを表示部3に表示する。
次に動作を説明する。図2は、フィルタリング装置100の動作を説明するためのフローチャートである。
ステップS1では、利用者は、入力部2を操作して、フィルタリング装置に、デジタルコンテンツの取得要求をサーバ101に送信させる。
通信部1は、サーバ101からその取得要求に応じたデジタルコンテンツを受信すると、そのデジタルコンテンツをコンテンツ受信部12に送信する。コンテンツ受信部12は、デジタルコンテンツを受信すると、ステップS2を実行する。
ステップS2では、コンテンツ受信部12は、マスク処理モードが設定されているか否かを判定する。
コンテンツ受信部12は、マスク処理モードが設定されていないと、デジタルコンテンツをコンテンツ表示制御部16に送信する。コンテンツ表示制御部16は、デジタルコンテンツを受信すると、ステップS6を実行する。
一方、コンテンツ受信部12は、マスク処理モードが設定されていると、デジタルコンテンツをマスク情報検索部13に送信する。マスク情報検索部13は、デジタルコンテンツを受信すると、ステップS3を実行する。
ステップS3では、マスク情報検索部13は、マスク情報記録部14からキーワードを取得する。
マスク情報検索部13は、デジタルコンテンツの画像情報に対してソフトウェアによるOCR処理を行うことで、画像情報に対して文字認識を行う。マスク情報検索部13は、文字認識の結果を画像情報に含まれる文字列として抽出する。マスク情報検索部13は、その抽出した文字列をキーワードと照合していくことで、文字列からキーワードを検索する。
また、マスク情報検索部13は、デジタルコンテンツのWEB情報をキーワードと照合していくことで、WEB情報からキーワードを検索する。
マスク情報検索部13は、画像情報およびWEB情報の検索が終了すると、ステップS4を実行する。
ステップS4では、マスク情報検索部13は、画像情報からキーワードを見つけると、キーワードを見つけたことを示す発見情報をその画像に添付する。また、マスク情報検索部13は、WEB情報からキーワードを見つけると、WEB情報内のキーワードに発見情報を添付する。なお、マスク情報検索部13は、画像情報およびWEB情報のどちらからもキーワードを見つけられないと、発見情報の添付を行わない。
そして、マスク情報検索部13は、そのデジタルコンテンツをコンテンツ変換部15に送信する。コンテンツ変換部15は、デジタルコンテンツを受信すると、そのデジタルコンテンツに発見情報があるか否かを判断する。
コンテンツ変換部15は、発見情報がないと、デジタルコンテンツをコンテンツ表示制御部16に送信する。コンテンツ表示制御部16は、デジタルコンテンツを受信すると、ステップS6を実行する。
一方、コンテンツ変換部15は、発見情報があると、ステップS5を実行する。
ステップS5では、コンテンツ変換部15は、その発見情報が画像情報に添付されていると、その画像情報を置換画像情報に置き換えることで、デジタルコンテンツを加工する。
また、コンテンツ変換部15は、その発見情報がWEB情報内のキーワードに添付されていると、WEB情報の構文解析を行い、そのキーワードが所定要素に含まれているか否かを判断する。コンテンツ変換部15は、キーワードが所定要素に含まれていると、その所定要素内の文字列を交換情報に置き換え、一方、キーワードが所定要素に含まれていないと、そのキーワードを交換情報に置き換えることで、デジタルコンテンツを加工する。
コンテンツ変換部15は、その所定要素を定義するタグが特定タグであるか否かを判断する。コンテンツ変換部15は、そのタグが特定タグであると、その特定タグを削除することで、デジタルコンテンツを加工する。なお、コンテンツ変換部15は、そのタグが特定タグでないと、その特定タグの削除は行わない。
コンテンツ変換部15は、その加工したデジタルコンテンツをコンテンツ表示制御部16に送信する。コンテンツ表示制御部16は、デジタルコンテンツを受信すると、ステップS6を実行する。
ステップS6では、コンテンツ表示制御部16は、受信したデジタルコンテンツを表示部3に表示する。
次に、デジタルコンテンツの加工についてより詳細に説明する。
図3は、加工前のデジタルコンテンツの内容の一例を表した説明図であり、図4は、加工後のデジタルコンテンツの内容の一例を表した説明図である。
図3では、デジタルコンテンツ300が有する、リンク情報301および302と、構文情報303と、画像情報304とが示されている。
リンク情報301および302と、構文情報303は、所定要素であるとする。また、リンク情報301および302を定義するリンクタグは、特定タグであるとする。さらに、マスク情報記録部14は、キーワードとして「スポーツ」を記録しているものとする。
マスク情報検索部13は、画像情報304に対してソフトウェアによるOCR処理を行うことで、画像情報304に対する文字認識を行う。マスク情報検索部13は、その文字認識の結果「スポーツショップ」を画像情報304に含まれる文字列として抽出する。その文字列「スポーツショップ」にはキーワード「スポーツ」が含まれているので、マスク情報検索部13は、その文字列「スポーツショップ」からキーワード「スポーツ」を見つける。そして、マスク情報検索部13は、発見情報を画像情報304に添付する。
また、マスク情報検索部13は、リンク情報301および302と、構文情報303とを含むWEB情報からキーワード「スポーツ」を検索する。マスク情報検索部13は、リンク情報301および構文情報303内のそれぞれにキーワード「スポーツ」を見つけ、その見つけたキーワード「スポーツ」のそれぞれに発見情報を添付する。
コンテンツ変換部15は、画像情報304に発見情報が添付されているので、画像情報304を置換画像情報に置き換える。図4では、コンテンツ変換部15が画像情報304に黒塗り処理を行った画像を置換画像314として生成し、画像情報を置換画像314に置き換えている。
また、コンテンツ変換部15は、デジタルコンテンツ300の構文解析を行い、キーワード「スポーツ」が所定要素に含まれるか否かを判断する。コンテンツ変換部15は、キーワード「スポーツ」が所定要素に含まれると、その所定要素内の文字列を置換●やXなどの伏せ字情報に置き換える。図4では、リンク情報301に含まれる文字列「スポーツの結果」が伏せ字情報311に置き換えられ、構文情報303に含まれる文字列「スポーツの結果A−team10−B−team5」が伏せ字情報313に置き換えられている。
これにより、キーワードだけでなく、そのキーワードに関連する一連の情報に対してマスク処理を行うことが可能になる。
ここで、コンテンツ変換部15は、置き換え後の文字(伏せ字)として、置き換え前の文字の種別(記号、英字、カナ文字、数字、全角文字または半角文字)やキーワードの種類などに応じて異なる文字を用いてもよい。また、コンテンツ変換部15は、タグのレベル属性に応じて、置換文字列情報の大きさを調整してもよい。なお、レベル属性は、タグで定義される要素に含まれる文字列の大きさを指定する属性である。
この場合、利用者は、置き換え前の文字列が表す内容を推測する余地を残すことが可能になる。
また、リンク情報301を定義するリンクタグが特定タグであるので、コンテンツ変換部15は、そのリンクタグを削除する。これにより、リンク情報301にて指定されるリンク先へのアクセスを規制することができる。なお、リンク情報302「天気予報」は、キーワードを含まないので、置換文字列情報への置き換えや、リンクタグの削除は行われない。このため、リンク情報302にて指定されるリンク先へのアクセスは可能である。
次に効果を説明する。
本実施形態では、マスク情報検索部13は、通信部1が受信したデジタルコンテンツの画像情報から、その画像情報に含まれる文字列を抽出する。マスク情報検索部13は、その抽出した文字列からマスク情報記録部14に記録されたキーワードを検索する。コンテンツ変換部15は、マスク情報検索部13にてキーワードが見つかると、その画像情報を置換画像情報に置き換える。コンテンツ表示制御部16は、コンテンツ変換部15が置き換えたデジタルコンテンツを表示部3に表示する。
この場合、画像情報に含まれる文字列からキーワードが見つかると、その画像情報が置換画像情報に置き換わる。よって、キーワードが適宜設定されれば、利用者にとって好ましくない画像情報を遮断することが可能になる。したがって、利用者にとって好ましくない情報を遮断する効率を向上させることが可能になる。
また、マスク情報検索部13は、画像情報に対して文字認識を行い、その文字認識の結果から文字列を抽出する。
この場合、利用者にとって好ましくない情報を遮断する効率をより向上させることが可能になる。
また、本実施形態では、マスク情報検索部13は、通信部1が受信したデジタルコンテンツのWEB情報から、マスク情報記録部14に記録されたキーワードを検索する。コンテンツ変換部15は、マスク情報検索部13にてWEB情報からキーワードが見つかると、そのキーワードが所定要素に含まれるか否かを判断する。コンテンツ変換部15は、キーワードが所定要素に含まれる場合、その所定要素内の文字列を置換文字列情報に置き換える。
この場合、キーワードが所定要素に含まれると、その所定要素内の文字列が置換文字列情報に置き換わる。したがって、キーワードだけでなく、そのキーワードに関連する一連の情報を遮断することが可能になるので、利用者にとって好ましくない情報を遮断する効率をより向上させることが可能になる。
また、本実施形態では、コンテンツ変換部15は、キーワードが所定要素に含まれる場合、その所定要素を定義するタグが特定タグであると、その特定タグを削除する。
この場合、特定タグに応じた機能を規制することが可能になるので、利用者にとって好ましくない情報を遮断する効率をより向上させることが可能になる。
また、本実施形態では、特定タグは、リンクタグである。
この場合、利用者にとって好ましくないデジタルコンテンツへのアクセスを規制することが可能になるので、利用者にとって好ましくない情報を遮断する効率をより向上させることが可能になる。
次に第二の実施形態について説明する。
図5は、本実施形態のフィルタリング装置を示したブロック図である。
図5において、フィルタリング装置100は、図1で示したフィルタリング装置100のマスク情報管理部11の代わりに、マスク情報ダウンロード部18を含む。また、フィルタリング装置100は、マスク情報を格納するサーバ102と、ネットワークを経由して互いに接続可能である。
入力部2は、利用者から、マスク情報を取得する旨の取得要求を受け付ける。取得要求は、マスク情報の格納場所を示す場所情報(例えば、URL)を含む。以下では、場所情報にて示される格納場所は、サーバ102内にあるとする。
マスク情報ダウンロード部18は、取得手段の一例である。マスク情報ダウンロード部18は、入力部2が取得要求を受け付けると、その取得要求の場所情報にて指定される格納場所を有するサーバ102からマスク情報をダウンロードすることで、サーバ102からマスク情報を取得する。マスク情報ダウンロード部18は、その取得したマスク情報をマスク情報記録部14に記録する。
次に動作を説明する。
先ず、入力部2は、利用者から取得要求を受け付けると、その取得要求をマスク情報ダウンロード部18に送信する。
続いて、マスク情報ダウンロード部18は、取得要求を受信すると、その取得要求の場所情報にて指定される格納場所を有するサーバ102にアクセスし、その格納場所に記録されているマスク情報をダウンロードする。
そして、マスク情報ダウンロード部18は、そのダウンロードしたマスク情報をマスク情報記録部14に記録する。
次に、効果を説明する。
本実施形態では、マスク情報ダウンロード部18は、入力部2が取得要求を受け付けると、サーバ102からマスク情報を取得する。マスク情報ダウンロード部18は、そのダウンロードしたマスク情報をマスク情報記録部14に記録する。
この場合、利用者がマスク情報を手動で入力しなくても、マスク情報を設定することが可能になる。したがって、容易にマスク情報を設定することが可能になる。また、利用者にとって好ましくない情報を表す一般的なキーワードを、複数のフィルタリング装置で共有することが可能になる。
次に、第三の実施形態について説明する。本実施形態では、本発明によるフィルタリング装置の最も簡単な構成について説明する。
図6は、本実施形態のフィルタリング装置の構成を示したブロック図である。図6において、フィルタリング装置100は、通信部1と、出力部3aと、処理部4とを含む。また、処理部4は、マスク情報検索部13と、マスク情報記録部14と、コンテンツ変換部15と、コンテンツ出力制御部16aを含む。
通信部1は、画像情報を有するデジタルコンテンツを受信する。
出力部3aは、ディスプレイなどの表示装置でもよいし、端末装置と通信可能な通信装置でもよい。なお、出力部3aが通信装置の場合、フィルタリング装置100をプロクシサーバなどに適用することが可能になる。また、この場合、出力部3aは、通信部1と兼用されてもよい。
マスク情報記録部14は、マスク情報を記録する。なお、マスク情報の登録方法は、第一の実施形態のように利用者にて手動で登録されるものでもよいし、第二の実施形態のようにサーバからのダウンロードにて登録されるものでもよし、さらには、予め登録されていてもよい。また、これらの登録方法が組み合わされてもよい。
マスク情報検索部13は、通信部1が受信したデジタルコンテンツの画像情報から、その画像情報に含まれる文字列を抽出し、その文字列からキーワードを検索する。
マスク情報検索部13が画像情報に含まれる文字列からキーワードを見つけると、コンテンツ変換部15は、その画像情報を置換画像情報に置き換える。
コンテンツ出力制御部16aは、マスク情報検索部13がキーワードを見つけた場合、マスク情報検索部13が画像情報を置換画像情報に置き換えたデジタルコンテンツを出力部3aから出力する。また、コンテンツ出力制御部16aは、マスク情報検索部13がキーワードを見つけられなかった場合、通信部1が受信したデジタルコンテンツを出力部3aから出力する。
次に動作を説明する。
先ず、通信部1は、デジタルコンテンツを受信すると、そのデジタルコンテンツをマスク情報検索部13に送信する。マスク情報検索部13は、デジタルコンテンツを受信すると、そのデジタルコンテンツの画像情報から、その画像情報に含まれる文字列を抽出し、その文字列からキーワードを検索する。
続いて、マスク情報検索部13が画像情報に含まれる文字列からキーワードを見つけると、その画像情報に発見情報を添付し、その発見情報を添付したデジタルコンテンツをコンテンツ変換部15に送信する。一方、マスク情報検索部13が画像情報に含まれる文字列からキーワードを見つけられないと、受信したデジタルコンテンツをコンテンツ変換部15に送信する。
コンテンツ変換部15は、デジタルコンテンツを受信すると、そのデジタルコンテンツに発見情報があるか否かを判断する。
コンテンツ変換部15は、デジタルコンテンツに発見情報があると、その発見情報が添付された画像情報を置換画像情報に置き換え、その置き換えたデジタルコンテンツをコンテンツ出力制御部16aに送信する。一方、コンテンツ変換部15は、デジタルコンテンツに発見情報がないと、受信したデジタルコンテンツをコンテンツ出力制御部16aに送信する。
コンテンツ出力制御部16は、デジタルコンテンツを受信すると、そのデジタルコンテンツを出力部3aから出力する。
次に効果を説明する。
本実施形態では、マスク情報検索部13は、通信部1が受信したデジタルコンテンツの画像情報から、その画像情報に含まれる文字列を抽出する。マスク情報検索部13は、その抽出した文字列からマスク情報記録部14に記録されたキーワードを検索する。コンテンツ変換部15は、マスク情報検索部13にてキーワードが見つかると、その画像情報を置換画像情報に置き換える。コンテンツ出力制御部16aは、コンテンツ変換部15が置き換えたデジタルコンテンツを出力部3aから出力する。
この場合、画像情報に含まれる文字列からキーワードが見つかると、その画像情報が置換画像情報に置き換わる。よって、本実施形態でも、キーワードが適宜設定されれば、利用者にとって好ましくない画像情報を遮断することが可能になる。したがって、利用者にとって好ましくない情報を遮断する効率を向上させることが可能になる。
なお、以上説明したフィルタリング装置100の機能は、その機能を実現するためのプログラムを、コンピュータにて読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータに読み込ませ、実行するものであってもよい。コンピュータにて読み取り可能な記録媒体とは、フレキシブルディスク、光磁気ディスク、CD−ROM等の記録媒体、コンピュータシステムに内蔵されるハードディスク装置等の記録装置を指す。さらに、コンピュータにて読み取り可能な記録媒体は、インターネットを介してプログラムを送信する場合のように、短時間、動的にプログラムを保持するもの(伝送媒体または伝送波)、その場合のサーバとなるコンピュータ内の揮発性メモリのように、一定期間プログラムを保持しているものを含む。
また、本発明は、プロクシサーバや、WWWブラウザのようなデジタルコンテンツを表示するアプリケーションプログラム、そして、放送の番組表を取得および表示するアプリケーションプログラムなどに適用できる。
以上説明した各実施形態において、図示した構成は単なる一例であって、本発明はその構成に限定されるものではない。
例えば、マスク情報検索部13は、デジタルコンテンツが有する音声情報を音声認識し、その音声認識の結果からキーワードを検索してもよい。この場合、マスク情報検索部13が音声認識の結果からキーワードを見つけると、コンテンツ変換部15は、その音声情報を削除または置換音声情報に置き換える。
また、マスク情報記録部14は、情報の種類に応じて異なるキーワードを記録してもよい。この場合、デジタルコンテンツ内のデータの種類に応じて、データの出力を規制することが可能になる。
さらに、マスク情報記録部14のキーワードを、サーバへの書き込みやWEB検索サービスへの検索条件の入力など、フィルタリング装置からの送信データに対して適用することで、利用者にとって好ましくない情報などの送信や検索についても規制することが可能になる。
本発明の第一の実施形態のフィルタリング装置の構成を示したブロック図である。 フィルタリング装置の動作を説明するためのフローチャートである。 加工前のデジタルコンテンツの内容の一例を表した説明図である。 加工後のデジタルコンテンツの内容の一例を表した説明図である。 本発明の第二の実施形態のフィルタリング装置の構成を示したブロック図である。 本発明の第三の実施形態のフィルタリング装置の構成を示したブロック図である。
符号の説明
1 通信部
2 入力部
3 表示部
3a 出力部
4 処理部
11 マスク情報管理部
12 コンテンツ受信部
13 マスク情報検索部
14 マスク情報記録部
15 コンテンツ変換部
16 コンテンツ表示制御部
16a コンテンツ出力制御部
17 マスク処理部
18 マスク情報ダウンロード部

Claims (15)

  1. 出力手段と、
    出力を規制する情報を判別するための判別用文字列を記録する記録手段と、
    画像情報を有するデジタルコンテンツを受信する通信手段と、
    前記通信手段が受信したデジタルコンテンツの画像情報から、該画像情報に含まれる文字列を抽出し、該文字列から前記記録手段に記録された判別用文字列を検索する検索手段と、
    前記検索手段にて前記判別用文字列が見つかると、前記画像情報を置換情報に置き換える変換手段と、
    前記変換手段にて前記画像情報が前記置換情報に置き換えられたデジタルコンテンツを前記出力手段から出力する出力制御手段と、を含むフィルタリング装置。
  2. 請求項1に記載のフィルタリング装置において、
    前記検索手段は、前記画像情報に対して文字認識を行い、該文字認識の結果を前記文字列として抽出する、フィルタリング装置。
  3. 請求項1または2に記載のフィルタリング装置において、
    前記デジタルコンテンツは、構造化文書情報を有し、
    前記検索手段は、前記デジタルコンテンツの構造化文書情報から前記記録手段に記録された判別用文字列を検索し、
    前記変換手段は、前記検索手段にて前記構造化文書情報から前記判別用文字列が見つかると、前記判別用文字列が、所定のタグで定義された所定要素に含まれるか否かを判断し、該判別用文字列が前記所定要素に含まれる場合、該所定要素内の文字列を交換情報に置き換える、フィルタリング装置。
  4. 請求項3に記載のフィルタリング装置において、
    前記変換手段は、前記判別用文字列が所定要素に含まれる場合、前記所定のタグが、予め定められた特定タグであると、該特定タグを削除する、フィルタリング装置。
  5. 請求項4に記載のフィルタリング装置において、
    前記特定タグは、他のデジタルコンテンツを呼び出すリンク情報を定義するリンクタグである、フィルタリング装置。
  6. 請求項1ないし5のいずれか1項に記載のフィルタリング装置において、
    利用者から、前記判別用文字列を取得する旨の取得要求を受け付ける入力手段と、
    前記入力手段が前記取得要求を受け付けると、前記判別用文字列を格納しているサーバから、該判別用文字列を取得し、該判別用文字列を前記記録手段に記録する取得手段と、を含むフィルタリング装置。
  7. 出力を規制する情報を判別するための判別用文字列を記録する記録手段を含むフィルタリング装置によるフィルタリング方法であって、
    画像情報を有するデジタルコンテンツを受信し、
    前記受信されたデジタルコンテンツの画像情報から、該画像情報に含まれる文字列を抽出し、
    前記抽出された文字列から前記記録手段に記録された判別用文字列を検索し、
    前記判別用文字列が見つかると、前記画像情報を置換情報に置き換え、
    前記画像情報が前記置換情報に置き換えられたデジタルコンテンツを出力する、フィルタリング方法。
  8. 請求項7に記載のフィルタリング方法において、
    前記画像情報に対して文字認識を行い、該文字認識の結果を前記文字列として抽出する、フィルタリング方法。
  9. 請求項7または8に記載のフィルタリング方法において、
    前記デジタルコンテンツは、構造化文書情報を有し、
    前記デジタルコンテンツの構造化文書情報から前記記録手段に記録された判別用文字列を検索し、
    前記構造化文書情報から前記判別用文字列が見つかると、前記判別用文字列が、所定のタグで定義された所定要素に含まれるか否かを判断し、
    前記判別用文字列が前記所定要素に含まれる場合、該所定要素内の文字列を交換情報に置き換える、フィルタリング方法。
  10. 請求項9に記載のフィルタリング方法において、
    前記判別用文字列が前記所定要素に含まれる場合、前記所定のタグが、予め定められた特定タグであると、該特定タグを削除する、フィルタリング方法。
  11. 請求項10に記載のフィルタリング方法において、
    前記特定タグは、他のデジタルコンテンツを呼び出すリンク情報を定義するリンクタグである、フィルタリング方法。
  12. 請求項7ないし11のいずれか1項に記載のフィルタリング方法において、
    利用者から、前記判別用文字列を取得する旨の取得要求を受け付け、
    前記取得要求が受け付けられると、前記判別用文字列を格納しているサーバから、該判別用文字列を取得し、
    前記取得した判別用文字列を前記記録手段に記録する、フィルタリング方法。
  13. 出力を規制する情報を判別するための判別用文字列を記録する記録手段に接続されたコンピュータに、
    画像情報を有するデジタルコンテンツを受信する手順と、
    前記受信されたデジタルコンテンツの画像情報から、該画像情報に含まれる文字列を抽出する手順と、
    前記抽出された文字列から前記記録手段に記録された判別用文字列を検索する手順と、
    前記判別用文字列が見つかると、前記画像情報を置換情報に置き換える手順と、
    前記画像情報が前記置換情報に置き換えられたデジタルコンテンツを出力する手順と、を実行させるプログラム。
  14. 請求項13に記載のプログラムにおいて、
    前記画像情報に対して文字認識を行い、該文字認識の結果を前記文字列として抽出する手順を、前記コンピュータに実行させるプログラム。
  15. 請求項13または14に記載のプログラムを記録した、コンピュータにて読み取り可能な記録媒体。
JP2008095109A 2008-04-01 2008-04-01 フィルタリング装置、フィルタリング方法、プログラムおよび記録媒体 Pending JP2009251655A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008095109A JP2009251655A (ja) 2008-04-01 2008-04-01 フィルタリング装置、フィルタリング方法、プログラムおよび記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008095109A JP2009251655A (ja) 2008-04-01 2008-04-01 フィルタリング装置、フィルタリング方法、プログラムおよび記録媒体

Publications (1)

Publication Number Publication Date
JP2009251655A true JP2009251655A (ja) 2009-10-29

Family

ID=41312352

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008095109A Pending JP2009251655A (ja) 2008-04-01 2008-04-01 フィルタリング装置、フィルタリング方法、プログラムおよび記録媒体

Country Status (1)

Country Link
JP (1) JP2009251655A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012093915A (ja) * 2010-10-26 2012-05-17 Nintendo Co Ltd 情報処理プログラム、情報処理装置、情報処理方法および情報処理システム
JP2014154022A (ja) * 2013-02-12 2014-08-25 Nippon Telegr & Teleph Corp <Ntt> ユーザ情報提示方法及びユーザ情報提示システム
US10970580B2 (en) 2017-10-03 2021-04-06 Canon Kabushiki Kaisha Information processing apparatus, information processing method, and storage medium

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012093915A (ja) * 2010-10-26 2012-05-17 Nintendo Co Ltd 情報処理プログラム、情報処理装置、情報処理方法および情報処理システム
JP2014154022A (ja) * 2013-02-12 2014-08-25 Nippon Telegr & Teleph Corp <Ntt> ユーザ情報提示方法及びユーザ情報提示システム
US10970580B2 (en) 2017-10-03 2021-04-06 Canon Kabushiki Kaisha Information processing apparatus, information processing method, and storage medium

Similar Documents

Publication Publication Date Title
KR101777392B1 (ko) 중앙 서버 및 이에 의한 사용자 음성 처리 방법
US6564254B1 (en) System and a process for specifying a location on a network
US7809710B2 (en) System and method for extracting content for submission to a search engine
US20080313659A1 (en) Page and device-optimized cascading style sheets
US20090094189A1 (en) Methods, systems, and computer program products for managing tags added by users engaged in social tagging of content
US8775474B2 (en) Exposing common metadata in digital images
US20100211905A1 (en) Presenting digitized content on a network using a cross-linked layer of electronic documents derived from a relational database
US8924251B2 (en) Systems and methods for providing one or more pages from an electronic document
US20120278300A1 (en) System, method, and user interface for a search engine based on multi-document summarization
JP2010073114A (ja) 画像情報検索装置、画像情報検索方法およびそのコンピュータプログラム
US20090313536A1 (en) Dynamically Providing Relevant Browser Content
US8195762B2 (en) Locating a portion of data on a computer network
CN102750081A (zh) 信息处理设备、信息处理方法和程序
WO2015000342A1 (en) Method and client device for accessing webpage
JP2008090404A (ja) 文書検索装置、文書検索方法および文書検索プログラム
JP2009251655A (ja) フィルタリング装置、フィルタリング方法、プログラムおよび記録媒体
JP2009075757A (ja) 情報処理装置、およびプログラム
JP2008099172A (ja) 記録装置および方法、並びにプログラム
JP2002334113A (ja) 文書データの表示制御方法および文書データ表示制御装置
JP5712496B2 (ja) アノテーション復元方法、アノテーション付与方法、アノテーション復元プログラム及びアノテーション復元装置
KR20020017966A (ko) 단어 기반 렌더 브라우저를 위한 데이터 처리 시스템에서웹 페이지를 대략 읽거나 속독하기 위한 방법 및 장치
US9639611B2 (en) System and method for providing suitable web addresses to a user device
JP4477931B2 (ja) 検索リクエスト装置、検索リクエスト方法、検索リクエストプログラムおよび検索リクエストプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH10134087A (ja) 文書要求装置および関連文書の先取り方法
US20150324333A1 (en) Systems and methods for automatically generating hyperlinks