JP2004112318A - コンテンツ不正利用探索システム - Google Patents
コンテンツ不正利用探索システム Download PDFInfo
- Publication number
- JP2004112318A JP2004112318A JP2002271958A JP2002271958A JP2004112318A JP 2004112318 A JP2004112318 A JP 2004112318A JP 2002271958 A JP2002271958 A JP 2002271958A JP 2002271958 A JP2002271958 A JP 2002271958A JP 2004112318 A JP2004112318 A JP 2004112318A
- Authority
- JP
- Japan
- Prior art keywords
- content
- search
- keyword
- unit
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Storage Device Security (AREA)
- Image Processing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Editing Of Facsimile Originals (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【課題】コンテンツの不正利用の探索において、コンテンツの収集や電子透かしの検出チェックに要する時間を短縮する。
【解決手段】コンテンツ不正利用探索システムは、キーワードと探索するコンテンツの最上位階層のアドレス情報とを入力する端末装置(1)と、キーワードと探索するコンテンツの最上位階層のアドレス情報とを記憶するリストデータベース(27)を備えたリストサーバ(20)と、端末装置(1)から入力されるキーワードとアドレス情報、あるいはリストサーバ(20)から提供されるキーワードとアドレス情報とを入力し、アドレス情報及びキーワードに基づいてコンテンツを収集し、収集したコンテンツ内に含まれる電子透かしを参照して当該コンテンツが不正利用されているものであるか否かを判定する探索ロボット(13a)を起動する探索サーバ(2)とを含む。
【選択図】 図1
【解決手段】コンテンツ不正利用探索システムは、キーワードと探索するコンテンツの最上位階層のアドレス情報とを入力する端末装置(1)と、キーワードと探索するコンテンツの最上位階層のアドレス情報とを記憶するリストデータベース(27)を備えたリストサーバ(20)と、端末装置(1)から入力されるキーワードとアドレス情報、あるいはリストサーバ(20)から提供されるキーワードとアドレス情報とを入力し、アドレス情報及びキーワードに基づいてコンテンツを収集し、収集したコンテンツ内に含まれる電子透かしを参照して当該コンテンツが不正利用されているものであるか否かを判定する探索ロボット(13a)を起動する探索サーバ(2)とを含む。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
本発明は、例えば著作権情報等の不正利用を防止するための情報が電子透かし情報として埋め込まれたコンテンツを探索し、埋め込まれた情報に基づいてコンテンツが不正利用されているものかどうかを判定するコンテンツ不正利用探索システムに関し、特に、コンテンツの収集や電子透かしの検出チェックに要する時間を短縮し、コンテンツを効率的に探索することを可能にする技術に係わる。
【0002】
【従来の技術】
近年、コンテンツの著作権を保護する目的として、コンテンツの著作権情報を電子透かし等でコンテンツに埋め込む技術が精力的に研究されており、様々な情報の埋め込み方式が現在までに提案されている。例えば、MPEG符号、とりわけDCT係数、動きベクトル、量子化特性を変更することによる、情報の埋め込み方式が提案されている(例えば、非特許文献1参照)。また、直接拡散方式に従って、PN系列で画像信号を拡散し、画像に署名情報を合成する方式が提案されている(例えば、非特許文献2参照)。
【0003】
このようなコンテンツへの情報の埋め込み方式に関する研究に伴い、最近では、コンテンツの不正利用を判定するための様々なシステムが提供されるようになっており、例えば、電子透かしを利用して購入者情報を予めコンテンツに埋め込んでおき、不正利用と思われるコンテンツに埋め込まれている情報を読み出してコンテンツが不正利用されているものかどうかを判定するシステムが提案されている。このようなシステムでは、不正利用と思われるコンテンツを探索、入手することが必要となるために、ウェブ上のコンテンツを収集するコンピュータプログラムである「ウェブロボット」を利用して収集したコンテンツの電子透かし情報のチェックを行う。このウェブロボットは、世界中のウェブサイトを常時巡回し、画像等のコンテンツが不正利用されていないかどうかを監視するものであり、監視の結果、コンテンツが不正利用されていると判断した場合には、ウェブロボットはコンテンツの不正利用を行っているウェブサイトに対し何らかの通告を行う。
【0004】
また、入力されたキーワード又はコンテンツの指定情報に応じて収集する調査対象パターンを決定し、決定した調査対象パターンに応じてネットワークを介して調査対象コンテンツを収集し、収集した調査対象コンテンツが不正利用であるかどうかを判定する技術が開示されている(例えば、特許文献1参照)。
【0005】
【特許文献1】特開平2001−76000号公報
【非特許文献1】日本電信電話株式会社,「DCTを用いたデジタル動画像における著作権情報埋め込み方式」,電子情報通信学会1997年暗号と情報セキュリティシンポジウム,SCIS ’97−31G
【非特許文献2】防衛大学校,「PN系列による画像への透かし署名法」,電子情報通信学会1997年暗号と情報セキュリティシンポジウム,SCIS ’97_26B
【0006】
【発明が解決しようとする課題】
しかしながら、上記のようなコンテンツの不正利用を判定するためのシステムでは、インターネット上の全てのコンテンツが調査対象となるために、コンテンツの収集や電子透かしのチェックが完了するまでに膨大な時間を要し、コンテンツを効率的に探索することができない。特に、インターネットのような開放系のネットワークは特定の団体により管理されるものではないために、悪意を持った人間が容易に管理者となり、コンテンツの内容やリンク構造を動的に差し替えることができることを考えると、このような状況は早急に解決すべきである。
【0007】
なお、特許文献1に開示さている技術は、条件に適合するコンテンツのみを探索することによりコンテンツの収集や電子透かしのチェックを行うまでに要する時間をある程度は短縮させることができるが、条件に適合するコンテンツを全て対等に扱って処理を行うために効率的な探索方法であるとは必ずしも言えない。
【0008】
本発明は、以上に述べた状況を鑑みて成されたものであり、コンテンツの収集や電子透かしの検出チェックに要する時間を短縮し、コンテンツを効率的に探索することを可能にする、コンテンツ不正利用探索システムを提供することにある。
【0009】
【課題を解決するための手段】
本発明によるコンテンツ不正利用探索システムは、電子ネットワーク(3)におけるコンテンツの不正利用を探索するコンテンツ不正利用探索システムであって、キーワードと探索するコンテンツの最上位階層のアドレス情報とを入力する端末装置(1)と、キーワードと探索するコンテンツの最上位階層のアドレス情報とを記憶するリストデータベース(27)を備えたリストサーバ(20)と、前記端末装置(1)から入力される前記キーワードと前記アドレス情報、あるいは前記リストサーバ(20)から提供される前記キーワードと前記アドレス情報とを入力部(14)から入力し、前記アドレス情報及び前記キーワードに基づいてコンテンツを収集し、収集したコンテンツ内に含まれる電子透かしを参照して当該コンテンツが不正利用されているものであるか否かを判定する探索ロボット(13a)を起動する探索サーバ(2)とを含む。そして、前記探索ロボット(13a)は、前記入力部 (14)から入力された前記アドレス情報により特定される階層に記述されているテキスト情報を収集し、収集した 当該テキスト情報内にリンクされているコンテンツ を収集する探索対象収集部(31)と、前記探索対象収集部(31)が収集した当該コンテンツに電子透かしによって埋め込まれた識別子を検出し、検出した識別子により当該コンテンツが不正利用されているか否かを判定する探索対象コンテンツチェック部(34)と、前記 探索対象収集部(31)が収集した前記テキスト情報に含まれる、 前記テキスト情報の階層から下位階層へ探索するためのリンク情報を解析するテキスト解析部 (32)と、 前記入力部(14)から入力された前記キーワードに基づいて、前記テキスト解析部 (32)が解析した前記 リンク情報に優先順位を設定する優先順位設定部(33)とを有し、前記優先順位設定部(33)は、前記キーワードに含まれる、前記優先順位を上げるプラスキーワードと前記優先順位を下げるマイナスキーワードのどちらか一方、もしくは両方に基づいて、前記下位階層へ探索するためのリンク情報に前記優先順位を設定し、前記探索対象収集部(31)は、前記優先順位設定部(33)により設定された前記優先順位に従って、前記リンク情報により特定される階層に記述されているテキスト情報を収集し、収集した 当該テキスト情報内にリンクされているコンテンツ を収集し、前記探索対象コンテンツチェック部(34)は、前記探索対象収集部(31)が収集した当該コンテンツに電子透かしによって埋め込まれた識別子を検出し、検出した識別子により当該コンテンツが不正利用されているか否かを判定することを特徴とする。
【0010】
このような構成によれば、電子ネットワーク上の全てのコンテンツを探索対象にするのではなく、端末装置あるいはリストサーバから入力されたキーワードに基づいて各リンク情報に探索の優先順位を付与し、この優先順位に基づいてコンテンツを探索する。このような構成によれば、注目するコンテンツを効率良く探索し、コンテンツの収集や電子透かしの検出チェックに要する時間を短縮することができる。
【0011】
また、前記リストサーバ(20)及び前記探索サーバ(2)は、それぞれ別の事業体(A,B)により運営され、前記リストサーバ(20)は、電子ネットワーク(3)を介して前記アドレス情報及び前記キーワードを前記探索サーバ(2)に提供するように構成されることを特徴とする。
【0012】
このような構成によれば、リストサーバ(20)と探索サーバ(2)とを独立して運営・管理できるので、探索の技術的メンテナンスを行う会社(技術管理会社B)と、探索サイトを監視するコンテンツサービス会社(コンテンツ管理会社A)を別々にすることもでき、効率よくコンテンツ不正利用探索システムを組むことができる。
【0013】
【発明の実施の形態】
以下、図1〜図8を参照しながら、本発明の実施の形態について説明する。
【0014】
尚、各図面を通じて同一もしくは同等の部位や構成要素には、同一もしくは同等の参照符号を付し、その説明を省略もしくは簡略化する。
【0015】
[第1の実施形態]
〔コンテンツ不正利用探索システムの構成〕
本発明の実施形態となるコンテンツ不正利用探索システムは、図1及び図2に示すように、ユーザが操作する少なくとも1台以上のユーザ端末1と、探索サーバ2とがインターネット3を介して接続され、さらに、探索サーバ2を運営するコンテンツ管理会社Aが運営するリストサーバ20が探索サーバ2に接続されて構成されている。
【0016】
ユーザ端末装置1は、例えば、携帯電話機、PDA(Personal Digital Assistant)、パーソナルコンピュータ、汎用コンピュータ等のコンピュータ装置により構成される。ユーザ端末装置1は、キーワードと探索するコンテンツの最上位階層のアドレス情報がユーザにより入力される。ユーザ端末装置1にて入力されたキーワードとアドレス情報は、インターネット3を介して探索サーバ2の入力I/F部14に送られる。あるいは、ユーザ端末装置1にて入力されたキーワードとアドレス情報は、探索サーバ2のプライベート入力部18に直接入力され、プライベート入力部18に入力されたキーワードとアドレス情報は、入力I/F部14に送られる。
【0017】
探索サーバ2及びリストサーバ20は、例えば、ワークステーション、パーソナルコンピュータ、汎用コンピュータ等のコンピュータ装置上にそれぞれ構成される。リストサーバ20は、キーワードと探索するコンテンツの最上位階層のアドレス情報とを、探索サーバ2に提供する。探索サーバ2は、ユーザ端末装置1から入力されるキーワードとアドレス情報、あるいはリストサーバ20から提供されるキーワードとアドレス情報とを入力する入力I/F部14を有しており、入力I/F部14が入力するアドレス情報及び前記キーワードに基づいてコンテンツを収集し、収集したコンテンツ内に含まれる電子透かしを参照して当該コンテンツが不正利用されているものであるか否かを判定する探索ロボット13aを起動する。
【0018】
〔探索サーバの構成〕
探索サーバ2は、図3に示すように、CPU11、RAM12、ROM13、入力I/F部14、通信制御部15、IDデータ/URLデータベース17、プライベート入力部18を備え、インターネット3に接続可能な構成となっている。
【0019】
CPU11は、ROM13内に記憶されたコンピュータプログラムに従って探索サーバ2の動作制御を行う。また、RAM12は、CPU11が実行する各種処理に関するコンピュータプログラムやデータを一時的に格納するワークエリアを提供する。
【0020】
ROM13は、探索ロボット13a等の各種コンピュータプログラムやプログラムの実行に必要なデータを記憶する。なお、ROM13は、磁気的、光学的記録媒体若しくは半導体メモリ等といった、CPU11が読み取り可能な記録媒体を含んだ構成となっている。また、この記録媒体に格納されるコンピュータプログラムやデータは、インターネット3を介してその一部若しくは全部を受信するような構成にしても良い。
【0021】
入力インタフェイス(I/F)部14は、後述する不正利用探索処理を実行する際に必要となる各種情報(キーワードと探索するコンテンツの最上位階層のアドレス情報等)を、インターネット3を介してユーザ端末装置1から入力する際の、あるいはリストサーバ20からキーワードとアドレス情報とを提供する際のインタフェイスの役割を担う。
【0022】
プライベート入力部18は、キーワードと探索するコンテンツの最上位階層のアドレス情報等を、ユーザ端末装置1から直接入力する際のインタフェイスの役割を担い、ここで入力されたキーワードとアドレス情報は入力I/F部14に送られる。
【0023】
通信制御部15は、例えばHTTP(Hyper Text Transfer Protocol)、TCP/IP(Transfer Control Protocol / Internet Protocol)等のデータ通信用プロトコル、例えばSMTP(Simple Mail Transfer Protocol)やPOP(Post Office Protocol)等の電子メイル通信用プロトコルを実装する。通信制御部15は、これらのプロトコルを使用して、インターネット3を介して、各種データを送信すると共に、受信した各種データをCPU11が処理可能な形式に変換する。
【0024】
IDデータ/URLデータベース17は、電子透かしによって管理対象のコンテンツに記録されているIDデータと、そのコンテンツの正当なURLアドレス情報及び正当な持ち主の連絡先となる電子メイルアドレスを格納する。
【0025】
探索ロボット13aは、図2に示すように、探索対象収集部31、テキスト解析部32と、優先順位設定部33、探索対象コンテンツチェック部34、不正使用判定部35、警告メイル送信部36を有する。
【0026】
探索対象収集部31は、入力I/F部14から入力されたアドレス情報により特定される階層に記述されているテキスト情報を収集し、収集した 当該テキスト情報内にリンクされているコンテンツ を収集する。
【0027】
探索対象コンテンツチェック部34は、探索対象収集部31が収集した当該コンテンツに電子透かしによって埋め込まれた識別子を検出し、検出した識別子により当該コンテンツが不正利用されているか否かを判定する。
【0028】
テキスト解析部 32は、 探索対象収集部31が収集したテキスト情報に含まれる、 テキスト情報の階層から下位階層へ探索するためのリンク情報を解析する。
【0029】
優先順位設定部33は、入力I/F部14から入力されたキーワードに基づいて、テキスト解析部32が解析した リンク情報に優先順位を設定する。
【0030】
そして、探索対象収集部31は、優先順位設定部33により設定された優先順位に従って、リンク情報により特定される下位階層に記述されているテキスト情報を収集し、収集した下位階層の 当該テキスト情報内にリンクされているコンテンツ を収集し、探索対象コンテンツチェック部34は、探索対象収集部31が収集した下位階層の 当該コンテンツに電子透かしによって埋め込まれた識別子を検出し、検出した識別子により当該コンテンツが不正利用されているか否かを判定する。
【0031】
また、上記キーワードは、優先順位を上げるプラスキーワードと優先順位を下げるマイナスキーワードのどちらか一方、もしくは両方を含み、優先順位設定部33は、プラスキーワードとマイナスキーワードのどちらか一方、もしくは両方を含むキーワードに基づいて、下位階層へ探索するためのリンク情報に前記優先順位を設定する。
【0032】
〔リストサーバの構成〕
リストサーバ20は、図4に示すように、CPU21、RAM22、ROM23、入力I/F部24、通信制御部25、リストデータベース27を備える。
【0033】
CPU21は、ROM23内に記憶されたコンピュータプログラムに従ってリストサーバ20の動作制御を行う。また、RAM22は、CPU21が実行する各種処理に関するコンピュータプログラムやデータを一時的に格納するワークエリアを提供する。
【0034】
ROM23は、リスト提供プログラム23a等の各種コンピュータプログラムやプログラムの実行に必要なデータを記憶する。なお、ROM23は、磁気的、光学的記録媒体若しくは半導体メモリ等といった、CPU21が読み取り可能な記録媒体を含んだ構成となっている。
【0035】
入力インタフェイス(I/F)部24は、インターネット3を介して各種データから入力する際のインタフェイスの役割を担う。
【0036】
通信制御部25は、例えばHTTP、TCP/IP等のデータ通信用プロトコル、例えばSMTPやPOP等の電子メイル通信用プロトコルを実装する。通信制御部25は、これらのプロトコルを使用して、インターネット3を介して、各種データを送信すると共に、受信した各種データをCPU21が処理可能な形式に変換する。
【0037】
リストデータベース27は、探索サーバ2に提供する、キーワードと探索するコンテンツの最上位階層のアドレス情報とが予め登録されており、リスト提供プログラム23aによってキーワードとアドレス情報とが探索サーバ2に提供される。
【0038】
〔コンテンツ不正利用探索システムの処理動作〕
次に、図5に示すフローチャートを参照して、コンテンツの不正利用を探索する際の、第1の実施形態によるコンテンツ不正利用探索システムの処理動作について説明する。
【0039】
ステップS1及びステップS2の処理において、ユーザが、ユーザ端末装置1からインターネット3を介して入力I/F部14より、あるいはユーザ端末装置1から直接プライベート入力部18より、最上位URL(Uniform Resource Locator)のアドレス情報と、探索するURLの優先度のもとになるキーワードを入力する。
【0040】
あるいは、ステップS21及びステップS22の処理において、探索サーバ2は、入力I/F部14を介してリストサーバ20のリストデータベース27から最上位URLのアドレス情報と、探索するURLの優先度のもとになるキーワードを入力する。
【0041】
アドレス情報とキーワードを入力した探索サーバ2は、探索ロボット13aを起動し、探索ロボット13aは以下の処理を実行する。
【0042】
なお、ここでは、例えば、「アイドル」、「歌手A子」、「グループB」、「歌手C子」、「歌手D子」、「CG」、「絵画」をプラスキーワードとして入力したのもとして、以下の処理を説明する。
【0043】
ステップS3の処理において、探索ロボット13aの探索対象収集部31は、通信制御部15を介して、入力された最上位URLのアドレス位置にあるホームページのHTML文章をRAM2内にダウンロードする。
【0044】
ステップS4の処理において、探索ロボット13aのテキスト解析部32は、探索対象収集部31がダウンロードしたHTML文章内に画像等のコンテンツがリンクされているか否かを判別する。そして、判別の結果、コンテンツがリンクされている場合、このステップS5の処理に進む。一方、ステップS4の判別の結果、探索対象収集部31がダウンロードしたHTML文章内にコンテンツがリンクされていない場合には、ステップS12の処理に進む。
【0045】
ステップS5の処理において、探索サーバ2の探索対象収集部31は、HTML文章にリンクされているコンテンツをRAM2にダウンロードする。
【0046】
ステップS6の処理では、探索サーバ2の探索対象コンテンツチェック部34は、RAM2にダウンロードされたコンテンツの中から電子透かしを検出し、検出した電子透かしにより記録されているIDデータを認識する。なお、この電子透かしの方法は様々な方法が想定されるが、例えば、コンテンツが画像データの場合、画素の輝度を表すビット列を操作して電子透かしを埋め込んだり、コンテンツが音楽データの場合は、波形を周波数成分に分解して、位相をずらすなどの処理を施して電子透かしを埋め込んだりする方法などがある。
【0047】
ステップS7〜S8の処理において、探索ロボット13aの不正使用判定部35は、IDデータ/URLデータベース17に格納されているIDデータを読み出して、電子透かしにより記録されているIDデータとを比較し、ダウンロードしたコンテンツが管理対象のコンテンツであるか否かを判別する。そして、判別の結果、管理対象となっている場合には、ステップS10の処理において、探索ロボット13aの不正使用判定部35は、IDデータ/URLデータベース17に格納されているURLアドレスと、検出されたURLアドレスとを比較して、コンテンツをダウンロードしたURLアドレスが正当なものであるか否かを判別する。そして、判別の結果、正当なURLアドレスである場合、ステップS12の処理に進む。一方、ステップS10の判別の結果、正当なURLアドレスでない場合には、ステップS10の処理に進む。
【0048】
ステップS10の処理において、探索ロボット13aの不正使用判定部35は、当該コンテンツは不正利用されているものと判断し、当該コンテンツの情報と送信先のメイルアドレス等を警告メイル送信部36へ送る。
【0049】
ステップS11の処理において、探索ロボット13aの警告メイル送信部36は、当該コンテンツの情報、コンテンツのURLアドレス情報、不正発見日時等を記載した警告メイルを作成し、通信制御部15を介して、IDデータ/URLデータベース17内の該当IDデータに対応した持ち主の電子メイルアドレス宛てに警告メイルを送信し、ステップS12の処理に進む。
【0050】
ステップS12の処理において、探索ロボット13aのテキスト解析部32は、ダウンロードしたHTML文章中の、図6に示すような画像ソースを示すテキスト部分『img src=』(下線部A)と、次の階層へのリンク先URLアドレスを示すテキスト部分『A HREF=』(下線部B)の近傍(例えば、前後1行の計3行のテキスト部分C)において、入力I/F部4を介して入力されたキーワード(「アイドル」、「歌手A子」、「グループB」、「歌手C子」、「歌手D子」、「CG」、「絵画」)が存在するか否かを解析するために、パターン検索を実行する。
【0051】
ステップS13の処理において、探索ロボット13aの優先順位設定部33は、入力されたキーワードが存在するテキスト部分が示す画像ソースやリンク先URLアドレスの探索優先順位を+1に設定する。ダウンロードしたHTML文章中のリンク先URLアドレスを示すテキスト部分に対して、探索優先順位を設定し終わったら、ステップS14の処理に進む。
【0052】
ステップS14の処理において、探索ロボット13aの優先順位設定部33は、設定した探索優先順位が所定の値(例えば1)以上であって、未処理の画像ソースやリンク先URLアドレスがあるか否か判別する。そして、判別の結果、探索優先順位が所定の値以上の未処理の画像ソースやリンク先URLアドレスがある場合、優先順位設定部33は、探索優先順位が所定の値以上の画像ソースやリンク先URLアドレス、若しくは、探索優先順にソートした画像ソースやリンク先URLアドレスの全部又は一部を探索対象収集部31に送り、ステップS15の処理に進む。一方、判別の結果、探索優先順位が所定の値以上の未処理の画像ソースやリンク先URLアドレスがない場合には、一連の探索処理は終了する。
【0053】
ステップS15の処理において、探索ロボット13aの探索対象収集部31は、送られたリンク先URLアドレスが示すHTML文章を、通信制御部5を介してRAM2内にダウンロードし、ステップS4の処理に戻る。
【0054】
そして、ステップS15の処理にてダウンロードしたHTML文章内に画像などのコンテンツがリンクされている場合、あるいはステップS14の処理において探索優先順位が所定の値以上の画像ソースがあった場合には、前述のステップS5〜ステップS11の処理にてコンテンツをダウンロードし、不正利用されているか否かを判別する。
【0055】
また、ステップS15の処理にてダウンロードしたHTML文章内にコンテンツがリンクされていない場合、且つステップS14の処理において探索優先順位が所定の値以上の画像ソースがなかった場合には、前述のステップS12以降の、さらに次の下位階層を探索するための処理を行う。
【0056】
なお、上記探索処理においては、優先的に探索するコンテンツを示すプラスキーワードを入力したものとして説明したが、探索の対象としないコンテンツを示すマイナスキーワードをプラスキーワードと共にもしくは単独で入力してもよい。この場合、探索ロボット13aは、図7のフローチャートに示すように、入力されたプラスキーワード及びマイナスキーワードに基づいてパターン検索を実行し(ステップS12A)、プラスキーワードが存在するテキスト部分が示す画像ソースやリンク先URLアドレスの探索優先順位を+1に設定し、マイナスキーワードが存在するテキスト部分が示す画像ソースやリンク先URLアドレスの探索優先順位を−1に設定する(ステップS13A,ステップS13B)。
【0057】
このような構成によれば、例えば、「アイドル」、「歌手A子」、「グループB」、「歌手C子」、「歌手D子」等をプラスキーワードとし、「CG」や「絵画」をマイナスキーワードとして入力すると、「CG」や「絵画」と関連する画像コンテンツは探索対象から除外することが可能となり、写真の画像のみを効率的に探索することを可能となる。なお、図7のフローチャートにおける、他の処理ステップは図5のフローチャートに示すそれと同じであるので、ここではその説明は省略する。
【0058】
[第2の実施形態]
第1の実施形態においては、探索サーバ2の探索ロボット13aは、ユーザ端末装置1によりインターネット3を介して入力された/あるいはインターネット3を介さず直接入力されたキーワードと最上位URLのアドレス情報に基づいて、あるいは探索サーバ2を運営するコンテンツ管理会社Aが運営するリストサーバ20から取得したキーワードと最上位URLのアドレス情報に基づいて、探索処理を実行する例を示した。
【0059】
第2の実施形態におけるコンテンツ不正利用探索システムは、図8に示すように、コンテンツ管理会社Aがリストサーバ20を運営し、コンテンツ管理会社Aとは別の、例えば、技術管理会社Bが探索サーバ2を運営する。
【0060】
技術管理会社Bは、探索サーバ2が起動する探索ロボット13aが効率良くコンテンツを収集するための広帯域回線を有し、探索サーバ2の管理調整を行う。ここで、管理調整とは、広帯域回線の維持、収集したコンテンツを記録する記録媒体の管理、あるいは、探索サーバ2が起動する探索ロボット13aの探索アルゴリズムの改良等をいう。
【0061】
一方、コンテンツ管理会社Aは、例えば、他のコンテンツ・プロバイダーなどから依頼された、チェックを行うインターネット3上の特定領域、例えば、コンテンツの不正使用が行われていると思われるインターネット掲示板等の最上位URLのアドレス情報と、不正使用されていると思われるコンテンツを特定するためのキーワードを、リストサーバ20のリストデータベース27に登録しておく。
【0062】
そして、探索サーバ2は、リストサーバ20のリストデータベース27からインターネット3を介して、最上位URLのアドレス情報とキーワードを取得し、探索サーバ2が起動する探索ロボット13aは、取得したアドレス情報とキーワードに基づいて不正利用の探索を行う。そして、不正利用の探索が終了すると、探索ロボット13aは、最上位URLから再度探索を実行する。
【0063】
なお、図8に示す例では、コンテンツ管理会社Aが1台のリストサーバ20を運営し、技術管理会社Bが1台の探索サーバ2を運営する例を示したが、これに限定されず、例えば、技術管理会社Bは複数台の探索サーバ2を運営しても良いし、コンテンツ管理会社Aは複数台のリストサーバ20を運営しても良い。さらに、同一の会社、技術管理会社Bあるいはコンテンツ管理会社Aが、1台もしくは複数台の探索サーバ2と、1台もしくは複数台のリストサーバ20とを運営しても良い。
【0064】
探索サーバ2及びリストサーバ20が複数台ある場合には、各探索サーバ2の処理能力に応じて、担当するリストサーバ20の台数を割り当るようにしても良い。また、各リストサーバ20が有する各アドレス情報を、さらにリストとして管理する親のリストサーバ20を設置しても良い。
【0065】
このような構成によれば、技術管理会社Bとコンテンツ管理会社Aが別の会社である場合でも、コンテンツの不正利用探索処理を効率良く実行することができる。また、自身が有する回線帯域では所定の時間内に探索を行うことが難しいと判断した場合であっても、コンテンツ管理会社Aは、広帯域回線を有する技術管理会社Bにコンテンツの探索を依頼し、所定の時間内にコンテンツの探索を行うことができる。また、この場合、コンテンツ管理会社Aは、リストサーバ20の管理のみを行えば良いので、管理業務に要する労力を大幅に軽減することができる。
【0066】
以上の説明から明らかなように、第1の実施形態におけるコンテンツ不正利用探索システムによれば、インターネット3上の全てのコンテンツを探索対象にするのではなく、入力されたキーワードに基づいて各リンク情報に探索の優先順位を付与し、この優先順位に基づいてコンテンツを探索するので、注目するコンテンツを効率良く探索し、コンテンツの収集や電子透かしの検出チェックに要する時間を短縮することができる。
【0067】
また、第2の実施形態におけるコンテンツ不正利用探索システムによれば、リストサーバ20と探索サーバ2とを独立して運営・管理できるので、探索の技術的メンテナンスを行う会社と、探索サイトを監視するコンテンツサービス会社を別々にすることもでき、効率よくコンテンツ不正利用探索システムを組むことができる。
【0068】
以上、本発明の実施の形態について詳細に説明したが、本発明は、その精神または主要な特徴から逸脱することなく、他の色々な形で実施することができる。そのため、前述の実施例はあらゆる点で単なる例示に過ぎず、限定的に解釈してはならない。本発明の範囲は、特許請求の範囲によって示すものであって、明細書本文には何ら拘束されない。さらに、特許請求の範囲の均等範囲に属する変形や変更は、全て本発明の範囲内のものである。
【0069】
【発明の効果】
本発明によれば、コンテンツの収集や電子透かしの検出チェックに要する時間を短縮し、コンテンツを効率的に探索することができる。
【図面の簡単な説明】
【図1】第1の実施形態によるコンテンツ不正利用探索システムの機器構成を例示するブロック図である。
【図2】図1に示すコンテンツ不正利用探索システムにおける、探索サーバの機能構成を例示するブロック図である。
【図3】図1に示すコンテンツ不正利用探索システムにおける、探索サーバのハードウェア構成を例示するブロック図である。
【図4】図1に示すコンテンツ不正利用探索システムにおける、リストサーバのハードウェア構成を例示するブロック図である。
【図5】図1に示すコンテンツ不正利用探索システムによるコンテンツ不正利用探索処理の流れを例示するフローチャートである。
【図6】図5に示すコンテンツ不正利用探索処理において、テキスト解析部により解析されるHTMLテキストを例示する図である。
【図7】図5に示すコンテンツ不正利用探索処理の応用例を示すフローチャートである。
【図8】第2の実施形態によるコンテンツ不正利用探索システムの機器構成を例示するブロック図である。
【符号の説明】
1…ユーザ端末装置
2…探索サーバ
3…インターネット
11…CPU
12…RAM
13…ROM
13a…探索ロボット
14…入力I/F部
15…通信制御部
17…IDデータ/URLデータベース
18…プライベート入力部
20…リストサーバ
21…CPU
22…RAM
23…ROM
23a…リスト提供プログラム
24…入力I/F部
25…通信制御部
27…リストデータベース
31…探索対象収集部
32…テキスト解析部
33…優先順位設定部
34…探索対象コンテンツチェック部
35…不正使用判定部
36…警告メイル送信部
A…コンテンツ管理会社
B…技術管理会社
【発明の属する技術分野】
本発明は、例えば著作権情報等の不正利用を防止するための情報が電子透かし情報として埋め込まれたコンテンツを探索し、埋め込まれた情報に基づいてコンテンツが不正利用されているものかどうかを判定するコンテンツ不正利用探索システムに関し、特に、コンテンツの収集や電子透かしの検出チェックに要する時間を短縮し、コンテンツを効率的に探索することを可能にする技術に係わる。
【0002】
【従来の技術】
近年、コンテンツの著作権を保護する目的として、コンテンツの著作権情報を電子透かし等でコンテンツに埋め込む技術が精力的に研究されており、様々な情報の埋め込み方式が現在までに提案されている。例えば、MPEG符号、とりわけDCT係数、動きベクトル、量子化特性を変更することによる、情報の埋め込み方式が提案されている(例えば、非特許文献1参照)。また、直接拡散方式に従って、PN系列で画像信号を拡散し、画像に署名情報を合成する方式が提案されている(例えば、非特許文献2参照)。
【0003】
このようなコンテンツへの情報の埋め込み方式に関する研究に伴い、最近では、コンテンツの不正利用を判定するための様々なシステムが提供されるようになっており、例えば、電子透かしを利用して購入者情報を予めコンテンツに埋め込んでおき、不正利用と思われるコンテンツに埋め込まれている情報を読み出してコンテンツが不正利用されているものかどうかを判定するシステムが提案されている。このようなシステムでは、不正利用と思われるコンテンツを探索、入手することが必要となるために、ウェブ上のコンテンツを収集するコンピュータプログラムである「ウェブロボット」を利用して収集したコンテンツの電子透かし情報のチェックを行う。このウェブロボットは、世界中のウェブサイトを常時巡回し、画像等のコンテンツが不正利用されていないかどうかを監視するものであり、監視の結果、コンテンツが不正利用されていると判断した場合には、ウェブロボットはコンテンツの不正利用を行っているウェブサイトに対し何らかの通告を行う。
【0004】
また、入力されたキーワード又はコンテンツの指定情報に応じて収集する調査対象パターンを決定し、決定した調査対象パターンに応じてネットワークを介して調査対象コンテンツを収集し、収集した調査対象コンテンツが不正利用であるかどうかを判定する技術が開示されている(例えば、特許文献1参照)。
【0005】
【特許文献1】特開平2001−76000号公報
【非特許文献1】日本電信電話株式会社,「DCTを用いたデジタル動画像における著作権情報埋め込み方式」,電子情報通信学会1997年暗号と情報セキュリティシンポジウム,SCIS ’97−31G
【非特許文献2】防衛大学校,「PN系列による画像への透かし署名法」,電子情報通信学会1997年暗号と情報セキュリティシンポジウム,SCIS ’97_26B
【0006】
【発明が解決しようとする課題】
しかしながら、上記のようなコンテンツの不正利用を判定するためのシステムでは、インターネット上の全てのコンテンツが調査対象となるために、コンテンツの収集や電子透かしのチェックが完了するまでに膨大な時間を要し、コンテンツを効率的に探索することができない。特に、インターネットのような開放系のネットワークは特定の団体により管理されるものではないために、悪意を持った人間が容易に管理者となり、コンテンツの内容やリンク構造を動的に差し替えることができることを考えると、このような状況は早急に解決すべきである。
【0007】
なお、特許文献1に開示さている技術は、条件に適合するコンテンツのみを探索することによりコンテンツの収集や電子透かしのチェックを行うまでに要する時間をある程度は短縮させることができるが、条件に適合するコンテンツを全て対等に扱って処理を行うために効率的な探索方法であるとは必ずしも言えない。
【0008】
本発明は、以上に述べた状況を鑑みて成されたものであり、コンテンツの収集や電子透かしの検出チェックに要する時間を短縮し、コンテンツを効率的に探索することを可能にする、コンテンツ不正利用探索システムを提供することにある。
【0009】
【課題を解決するための手段】
本発明によるコンテンツ不正利用探索システムは、電子ネットワーク(3)におけるコンテンツの不正利用を探索するコンテンツ不正利用探索システムであって、キーワードと探索するコンテンツの最上位階層のアドレス情報とを入力する端末装置(1)と、キーワードと探索するコンテンツの最上位階層のアドレス情報とを記憶するリストデータベース(27)を備えたリストサーバ(20)と、前記端末装置(1)から入力される前記キーワードと前記アドレス情報、あるいは前記リストサーバ(20)から提供される前記キーワードと前記アドレス情報とを入力部(14)から入力し、前記アドレス情報及び前記キーワードに基づいてコンテンツを収集し、収集したコンテンツ内に含まれる電子透かしを参照して当該コンテンツが不正利用されているものであるか否かを判定する探索ロボット(13a)を起動する探索サーバ(2)とを含む。そして、前記探索ロボット(13a)は、前記入力部 (14)から入力された前記アドレス情報により特定される階層に記述されているテキスト情報を収集し、収集した 当該テキスト情報内にリンクされているコンテンツ を収集する探索対象収集部(31)と、前記探索対象収集部(31)が収集した当該コンテンツに電子透かしによって埋め込まれた識別子を検出し、検出した識別子により当該コンテンツが不正利用されているか否かを判定する探索対象コンテンツチェック部(34)と、前記 探索対象収集部(31)が収集した前記テキスト情報に含まれる、 前記テキスト情報の階層から下位階層へ探索するためのリンク情報を解析するテキスト解析部 (32)と、 前記入力部(14)から入力された前記キーワードに基づいて、前記テキスト解析部 (32)が解析した前記 リンク情報に優先順位を設定する優先順位設定部(33)とを有し、前記優先順位設定部(33)は、前記キーワードに含まれる、前記優先順位を上げるプラスキーワードと前記優先順位を下げるマイナスキーワードのどちらか一方、もしくは両方に基づいて、前記下位階層へ探索するためのリンク情報に前記優先順位を設定し、前記探索対象収集部(31)は、前記優先順位設定部(33)により設定された前記優先順位に従って、前記リンク情報により特定される階層に記述されているテキスト情報を収集し、収集した 当該テキスト情報内にリンクされているコンテンツ を収集し、前記探索対象コンテンツチェック部(34)は、前記探索対象収集部(31)が収集した当該コンテンツに電子透かしによって埋め込まれた識別子を検出し、検出した識別子により当該コンテンツが不正利用されているか否かを判定することを特徴とする。
【0010】
このような構成によれば、電子ネットワーク上の全てのコンテンツを探索対象にするのではなく、端末装置あるいはリストサーバから入力されたキーワードに基づいて各リンク情報に探索の優先順位を付与し、この優先順位に基づいてコンテンツを探索する。このような構成によれば、注目するコンテンツを効率良く探索し、コンテンツの収集や電子透かしの検出チェックに要する時間を短縮することができる。
【0011】
また、前記リストサーバ(20)及び前記探索サーバ(2)は、それぞれ別の事業体(A,B)により運営され、前記リストサーバ(20)は、電子ネットワーク(3)を介して前記アドレス情報及び前記キーワードを前記探索サーバ(2)に提供するように構成されることを特徴とする。
【0012】
このような構成によれば、リストサーバ(20)と探索サーバ(2)とを独立して運営・管理できるので、探索の技術的メンテナンスを行う会社(技術管理会社B)と、探索サイトを監視するコンテンツサービス会社(コンテンツ管理会社A)を別々にすることもでき、効率よくコンテンツ不正利用探索システムを組むことができる。
【0013】
【発明の実施の形態】
以下、図1〜図8を参照しながら、本発明の実施の形態について説明する。
【0014】
尚、各図面を通じて同一もしくは同等の部位や構成要素には、同一もしくは同等の参照符号を付し、その説明を省略もしくは簡略化する。
【0015】
[第1の実施形態]
〔コンテンツ不正利用探索システムの構成〕
本発明の実施形態となるコンテンツ不正利用探索システムは、図1及び図2に示すように、ユーザが操作する少なくとも1台以上のユーザ端末1と、探索サーバ2とがインターネット3を介して接続され、さらに、探索サーバ2を運営するコンテンツ管理会社Aが運営するリストサーバ20が探索サーバ2に接続されて構成されている。
【0016】
ユーザ端末装置1は、例えば、携帯電話機、PDA(Personal Digital Assistant)、パーソナルコンピュータ、汎用コンピュータ等のコンピュータ装置により構成される。ユーザ端末装置1は、キーワードと探索するコンテンツの最上位階層のアドレス情報がユーザにより入力される。ユーザ端末装置1にて入力されたキーワードとアドレス情報は、インターネット3を介して探索サーバ2の入力I/F部14に送られる。あるいは、ユーザ端末装置1にて入力されたキーワードとアドレス情報は、探索サーバ2のプライベート入力部18に直接入力され、プライベート入力部18に入力されたキーワードとアドレス情報は、入力I/F部14に送られる。
【0017】
探索サーバ2及びリストサーバ20は、例えば、ワークステーション、パーソナルコンピュータ、汎用コンピュータ等のコンピュータ装置上にそれぞれ構成される。リストサーバ20は、キーワードと探索するコンテンツの最上位階層のアドレス情報とを、探索サーバ2に提供する。探索サーバ2は、ユーザ端末装置1から入力されるキーワードとアドレス情報、あるいはリストサーバ20から提供されるキーワードとアドレス情報とを入力する入力I/F部14を有しており、入力I/F部14が入力するアドレス情報及び前記キーワードに基づいてコンテンツを収集し、収集したコンテンツ内に含まれる電子透かしを参照して当該コンテンツが不正利用されているものであるか否かを判定する探索ロボット13aを起動する。
【0018】
〔探索サーバの構成〕
探索サーバ2は、図3に示すように、CPU11、RAM12、ROM13、入力I/F部14、通信制御部15、IDデータ/URLデータベース17、プライベート入力部18を備え、インターネット3に接続可能な構成となっている。
【0019】
CPU11は、ROM13内に記憶されたコンピュータプログラムに従って探索サーバ2の動作制御を行う。また、RAM12は、CPU11が実行する各種処理に関するコンピュータプログラムやデータを一時的に格納するワークエリアを提供する。
【0020】
ROM13は、探索ロボット13a等の各種コンピュータプログラムやプログラムの実行に必要なデータを記憶する。なお、ROM13は、磁気的、光学的記録媒体若しくは半導体メモリ等といった、CPU11が読み取り可能な記録媒体を含んだ構成となっている。また、この記録媒体に格納されるコンピュータプログラムやデータは、インターネット3を介してその一部若しくは全部を受信するような構成にしても良い。
【0021】
入力インタフェイス(I/F)部14は、後述する不正利用探索処理を実行する際に必要となる各種情報(キーワードと探索するコンテンツの最上位階層のアドレス情報等)を、インターネット3を介してユーザ端末装置1から入力する際の、あるいはリストサーバ20からキーワードとアドレス情報とを提供する際のインタフェイスの役割を担う。
【0022】
プライベート入力部18は、キーワードと探索するコンテンツの最上位階層のアドレス情報等を、ユーザ端末装置1から直接入力する際のインタフェイスの役割を担い、ここで入力されたキーワードとアドレス情報は入力I/F部14に送られる。
【0023】
通信制御部15は、例えばHTTP(Hyper Text Transfer Protocol)、TCP/IP(Transfer Control Protocol / Internet Protocol)等のデータ通信用プロトコル、例えばSMTP(Simple Mail Transfer Protocol)やPOP(Post Office Protocol)等の電子メイル通信用プロトコルを実装する。通信制御部15は、これらのプロトコルを使用して、インターネット3を介して、各種データを送信すると共に、受信した各種データをCPU11が処理可能な形式に変換する。
【0024】
IDデータ/URLデータベース17は、電子透かしによって管理対象のコンテンツに記録されているIDデータと、そのコンテンツの正当なURLアドレス情報及び正当な持ち主の連絡先となる電子メイルアドレスを格納する。
【0025】
探索ロボット13aは、図2に示すように、探索対象収集部31、テキスト解析部32と、優先順位設定部33、探索対象コンテンツチェック部34、不正使用判定部35、警告メイル送信部36を有する。
【0026】
探索対象収集部31は、入力I/F部14から入力されたアドレス情報により特定される階層に記述されているテキスト情報を収集し、収集した 当該テキスト情報内にリンクされているコンテンツ を収集する。
【0027】
探索対象コンテンツチェック部34は、探索対象収集部31が収集した当該コンテンツに電子透かしによって埋め込まれた識別子を検出し、検出した識別子により当該コンテンツが不正利用されているか否かを判定する。
【0028】
テキスト解析部 32は、 探索対象収集部31が収集したテキスト情報に含まれる、 テキスト情報の階層から下位階層へ探索するためのリンク情報を解析する。
【0029】
優先順位設定部33は、入力I/F部14から入力されたキーワードに基づいて、テキスト解析部32が解析した リンク情報に優先順位を設定する。
【0030】
そして、探索対象収集部31は、優先順位設定部33により設定された優先順位に従って、リンク情報により特定される下位階層に記述されているテキスト情報を収集し、収集した下位階層の 当該テキスト情報内にリンクされているコンテンツ を収集し、探索対象コンテンツチェック部34は、探索対象収集部31が収集した下位階層の 当該コンテンツに電子透かしによって埋め込まれた識別子を検出し、検出した識別子により当該コンテンツが不正利用されているか否かを判定する。
【0031】
また、上記キーワードは、優先順位を上げるプラスキーワードと優先順位を下げるマイナスキーワードのどちらか一方、もしくは両方を含み、優先順位設定部33は、プラスキーワードとマイナスキーワードのどちらか一方、もしくは両方を含むキーワードに基づいて、下位階層へ探索するためのリンク情報に前記優先順位を設定する。
【0032】
〔リストサーバの構成〕
リストサーバ20は、図4に示すように、CPU21、RAM22、ROM23、入力I/F部24、通信制御部25、リストデータベース27を備える。
【0033】
CPU21は、ROM23内に記憶されたコンピュータプログラムに従ってリストサーバ20の動作制御を行う。また、RAM22は、CPU21が実行する各種処理に関するコンピュータプログラムやデータを一時的に格納するワークエリアを提供する。
【0034】
ROM23は、リスト提供プログラム23a等の各種コンピュータプログラムやプログラムの実行に必要なデータを記憶する。なお、ROM23は、磁気的、光学的記録媒体若しくは半導体メモリ等といった、CPU21が読み取り可能な記録媒体を含んだ構成となっている。
【0035】
入力インタフェイス(I/F)部24は、インターネット3を介して各種データから入力する際のインタフェイスの役割を担う。
【0036】
通信制御部25は、例えばHTTP、TCP/IP等のデータ通信用プロトコル、例えばSMTPやPOP等の電子メイル通信用プロトコルを実装する。通信制御部25は、これらのプロトコルを使用して、インターネット3を介して、各種データを送信すると共に、受信した各種データをCPU21が処理可能な形式に変換する。
【0037】
リストデータベース27は、探索サーバ2に提供する、キーワードと探索するコンテンツの最上位階層のアドレス情報とが予め登録されており、リスト提供プログラム23aによってキーワードとアドレス情報とが探索サーバ2に提供される。
【0038】
〔コンテンツ不正利用探索システムの処理動作〕
次に、図5に示すフローチャートを参照して、コンテンツの不正利用を探索する際の、第1の実施形態によるコンテンツ不正利用探索システムの処理動作について説明する。
【0039】
ステップS1及びステップS2の処理において、ユーザが、ユーザ端末装置1からインターネット3を介して入力I/F部14より、あるいはユーザ端末装置1から直接プライベート入力部18より、最上位URL(Uniform Resource Locator)のアドレス情報と、探索するURLの優先度のもとになるキーワードを入力する。
【0040】
あるいは、ステップS21及びステップS22の処理において、探索サーバ2は、入力I/F部14を介してリストサーバ20のリストデータベース27から最上位URLのアドレス情報と、探索するURLの優先度のもとになるキーワードを入力する。
【0041】
アドレス情報とキーワードを入力した探索サーバ2は、探索ロボット13aを起動し、探索ロボット13aは以下の処理を実行する。
【0042】
なお、ここでは、例えば、「アイドル」、「歌手A子」、「グループB」、「歌手C子」、「歌手D子」、「CG」、「絵画」をプラスキーワードとして入力したのもとして、以下の処理を説明する。
【0043】
ステップS3の処理において、探索ロボット13aの探索対象収集部31は、通信制御部15を介して、入力された最上位URLのアドレス位置にあるホームページのHTML文章をRAM2内にダウンロードする。
【0044】
ステップS4の処理において、探索ロボット13aのテキスト解析部32は、探索対象収集部31がダウンロードしたHTML文章内に画像等のコンテンツがリンクされているか否かを判別する。そして、判別の結果、コンテンツがリンクされている場合、このステップS5の処理に進む。一方、ステップS4の判別の結果、探索対象収集部31がダウンロードしたHTML文章内にコンテンツがリンクされていない場合には、ステップS12の処理に進む。
【0045】
ステップS5の処理において、探索サーバ2の探索対象収集部31は、HTML文章にリンクされているコンテンツをRAM2にダウンロードする。
【0046】
ステップS6の処理では、探索サーバ2の探索対象コンテンツチェック部34は、RAM2にダウンロードされたコンテンツの中から電子透かしを検出し、検出した電子透かしにより記録されているIDデータを認識する。なお、この電子透かしの方法は様々な方法が想定されるが、例えば、コンテンツが画像データの場合、画素の輝度を表すビット列を操作して電子透かしを埋め込んだり、コンテンツが音楽データの場合は、波形を周波数成分に分解して、位相をずらすなどの処理を施して電子透かしを埋め込んだりする方法などがある。
【0047】
ステップS7〜S8の処理において、探索ロボット13aの不正使用判定部35は、IDデータ/URLデータベース17に格納されているIDデータを読み出して、電子透かしにより記録されているIDデータとを比較し、ダウンロードしたコンテンツが管理対象のコンテンツであるか否かを判別する。そして、判別の結果、管理対象となっている場合には、ステップS10の処理において、探索ロボット13aの不正使用判定部35は、IDデータ/URLデータベース17に格納されているURLアドレスと、検出されたURLアドレスとを比較して、コンテンツをダウンロードしたURLアドレスが正当なものであるか否かを判別する。そして、判別の結果、正当なURLアドレスである場合、ステップS12の処理に進む。一方、ステップS10の判別の結果、正当なURLアドレスでない場合には、ステップS10の処理に進む。
【0048】
ステップS10の処理において、探索ロボット13aの不正使用判定部35は、当該コンテンツは不正利用されているものと判断し、当該コンテンツの情報と送信先のメイルアドレス等を警告メイル送信部36へ送る。
【0049】
ステップS11の処理において、探索ロボット13aの警告メイル送信部36は、当該コンテンツの情報、コンテンツのURLアドレス情報、不正発見日時等を記載した警告メイルを作成し、通信制御部15を介して、IDデータ/URLデータベース17内の該当IDデータに対応した持ち主の電子メイルアドレス宛てに警告メイルを送信し、ステップS12の処理に進む。
【0050】
ステップS12の処理において、探索ロボット13aのテキスト解析部32は、ダウンロードしたHTML文章中の、図6に示すような画像ソースを示すテキスト部分『img src=』(下線部A)と、次の階層へのリンク先URLアドレスを示すテキスト部分『A HREF=』(下線部B)の近傍(例えば、前後1行の計3行のテキスト部分C)において、入力I/F部4を介して入力されたキーワード(「アイドル」、「歌手A子」、「グループB」、「歌手C子」、「歌手D子」、「CG」、「絵画」)が存在するか否かを解析するために、パターン検索を実行する。
【0051】
ステップS13の処理において、探索ロボット13aの優先順位設定部33は、入力されたキーワードが存在するテキスト部分が示す画像ソースやリンク先URLアドレスの探索優先順位を+1に設定する。ダウンロードしたHTML文章中のリンク先URLアドレスを示すテキスト部分に対して、探索優先順位を設定し終わったら、ステップS14の処理に進む。
【0052】
ステップS14の処理において、探索ロボット13aの優先順位設定部33は、設定した探索優先順位が所定の値(例えば1)以上であって、未処理の画像ソースやリンク先URLアドレスがあるか否か判別する。そして、判別の結果、探索優先順位が所定の値以上の未処理の画像ソースやリンク先URLアドレスがある場合、優先順位設定部33は、探索優先順位が所定の値以上の画像ソースやリンク先URLアドレス、若しくは、探索優先順にソートした画像ソースやリンク先URLアドレスの全部又は一部を探索対象収集部31に送り、ステップS15の処理に進む。一方、判別の結果、探索優先順位が所定の値以上の未処理の画像ソースやリンク先URLアドレスがない場合には、一連の探索処理は終了する。
【0053】
ステップS15の処理において、探索ロボット13aの探索対象収集部31は、送られたリンク先URLアドレスが示すHTML文章を、通信制御部5を介してRAM2内にダウンロードし、ステップS4の処理に戻る。
【0054】
そして、ステップS15の処理にてダウンロードしたHTML文章内に画像などのコンテンツがリンクされている場合、あるいはステップS14の処理において探索優先順位が所定の値以上の画像ソースがあった場合には、前述のステップS5〜ステップS11の処理にてコンテンツをダウンロードし、不正利用されているか否かを判別する。
【0055】
また、ステップS15の処理にてダウンロードしたHTML文章内にコンテンツがリンクされていない場合、且つステップS14の処理において探索優先順位が所定の値以上の画像ソースがなかった場合には、前述のステップS12以降の、さらに次の下位階層を探索するための処理を行う。
【0056】
なお、上記探索処理においては、優先的に探索するコンテンツを示すプラスキーワードを入力したものとして説明したが、探索の対象としないコンテンツを示すマイナスキーワードをプラスキーワードと共にもしくは単独で入力してもよい。この場合、探索ロボット13aは、図7のフローチャートに示すように、入力されたプラスキーワード及びマイナスキーワードに基づいてパターン検索を実行し(ステップS12A)、プラスキーワードが存在するテキスト部分が示す画像ソースやリンク先URLアドレスの探索優先順位を+1に設定し、マイナスキーワードが存在するテキスト部分が示す画像ソースやリンク先URLアドレスの探索優先順位を−1に設定する(ステップS13A,ステップS13B)。
【0057】
このような構成によれば、例えば、「アイドル」、「歌手A子」、「グループB」、「歌手C子」、「歌手D子」等をプラスキーワードとし、「CG」や「絵画」をマイナスキーワードとして入力すると、「CG」や「絵画」と関連する画像コンテンツは探索対象から除外することが可能となり、写真の画像のみを効率的に探索することを可能となる。なお、図7のフローチャートにおける、他の処理ステップは図5のフローチャートに示すそれと同じであるので、ここではその説明は省略する。
【0058】
[第2の実施形態]
第1の実施形態においては、探索サーバ2の探索ロボット13aは、ユーザ端末装置1によりインターネット3を介して入力された/あるいはインターネット3を介さず直接入力されたキーワードと最上位URLのアドレス情報に基づいて、あるいは探索サーバ2を運営するコンテンツ管理会社Aが運営するリストサーバ20から取得したキーワードと最上位URLのアドレス情報に基づいて、探索処理を実行する例を示した。
【0059】
第2の実施形態におけるコンテンツ不正利用探索システムは、図8に示すように、コンテンツ管理会社Aがリストサーバ20を運営し、コンテンツ管理会社Aとは別の、例えば、技術管理会社Bが探索サーバ2を運営する。
【0060】
技術管理会社Bは、探索サーバ2が起動する探索ロボット13aが効率良くコンテンツを収集するための広帯域回線を有し、探索サーバ2の管理調整を行う。ここで、管理調整とは、広帯域回線の維持、収集したコンテンツを記録する記録媒体の管理、あるいは、探索サーバ2が起動する探索ロボット13aの探索アルゴリズムの改良等をいう。
【0061】
一方、コンテンツ管理会社Aは、例えば、他のコンテンツ・プロバイダーなどから依頼された、チェックを行うインターネット3上の特定領域、例えば、コンテンツの不正使用が行われていると思われるインターネット掲示板等の最上位URLのアドレス情報と、不正使用されていると思われるコンテンツを特定するためのキーワードを、リストサーバ20のリストデータベース27に登録しておく。
【0062】
そして、探索サーバ2は、リストサーバ20のリストデータベース27からインターネット3を介して、最上位URLのアドレス情報とキーワードを取得し、探索サーバ2が起動する探索ロボット13aは、取得したアドレス情報とキーワードに基づいて不正利用の探索を行う。そして、不正利用の探索が終了すると、探索ロボット13aは、最上位URLから再度探索を実行する。
【0063】
なお、図8に示す例では、コンテンツ管理会社Aが1台のリストサーバ20を運営し、技術管理会社Bが1台の探索サーバ2を運営する例を示したが、これに限定されず、例えば、技術管理会社Bは複数台の探索サーバ2を運営しても良いし、コンテンツ管理会社Aは複数台のリストサーバ20を運営しても良い。さらに、同一の会社、技術管理会社Bあるいはコンテンツ管理会社Aが、1台もしくは複数台の探索サーバ2と、1台もしくは複数台のリストサーバ20とを運営しても良い。
【0064】
探索サーバ2及びリストサーバ20が複数台ある場合には、各探索サーバ2の処理能力に応じて、担当するリストサーバ20の台数を割り当るようにしても良い。また、各リストサーバ20が有する各アドレス情報を、さらにリストとして管理する親のリストサーバ20を設置しても良い。
【0065】
このような構成によれば、技術管理会社Bとコンテンツ管理会社Aが別の会社である場合でも、コンテンツの不正利用探索処理を効率良く実行することができる。また、自身が有する回線帯域では所定の時間内に探索を行うことが難しいと判断した場合であっても、コンテンツ管理会社Aは、広帯域回線を有する技術管理会社Bにコンテンツの探索を依頼し、所定の時間内にコンテンツの探索を行うことができる。また、この場合、コンテンツ管理会社Aは、リストサーバ20の管理のみを行えば良いので、管理業務に要する労力を大幅に軽減することができる。
【0066】
以上の説明から明らかなように、第1の実施形態におけるコンテンツ不正利用探索システムによれば、インターネット3上の全てのコンテンツを探索対象にするのではなく、入力されたキーワードに基づいて各リンク情報に探索の優先順位を付与し、この優先順位に基づいてコンテンツを探索するので、注目するコンテンツを効率良く探索し、コンテンツの収集や電子透かしの検出チェックに要する時間を短縮することができる。
【0067】
また、第2の実施形態におけるコンテンツ不正利用探索システムによれば、リストサーバ20と探索サーバ2とを独立して運営・管理できるので、探索の技術的メンテナンスを行う会社と、探索サイトを監視するコンテンツサービス会社を別々にすることもでき、効率よくコンテンツ不正利用探索システムを組むことができる。
【0068】
以上、本発明の実施の形態について詳細に説明したが、本発明は、その精神または主要な特徴から逸脱することなく、他の色々な形で実施することができる。そのため、前述の実施例はあらゆる点で単なる例示に過ぎず、限定的に解釈してはならない。本発明の範囲は、特許請求の範囲によって示すものであって、明細書本文には何ら拘束されない。さらに、特許請求の範囲の均等範囲に属する変形や変更は、全て本発明の範囲内のものである。
【0069】
【発明の効果】
本発明によれば、コンテンツの収集や電子透かしの検出チェックに要する時間を短縮し、コンテンツを効率的に探索することができる。
【図面の簡単な説明】
【図1】第1の実施形態によるコンテンツ不正利用探索システムの機器構成を例示するブロック図である。
【図2】図1に示すコンテンツ不正利用探索システムにおける、探索サーバの機能構成を例示するブロック図である。
【図3】図1に示すコンテンツ不正利用探索システムにおける、探索サーバのハードウェア構成を例示するブロック図である。
【図4】図1に示すコンテンツ不正利用探索システムにおける、リストサーバのハードウェア構成を例示するブロック図である。
【図5】図1に示すコンテンツ不正利用探索システムによるコンテンツ不正利用探索処理の流れを例示するフローチャートである。
【図6】図5に示すコンテンツ不正利用探索処理において、テキスト解析部により解析されるHTMLテキストを例示する図である。
【図7】図5に示すコンテンツ不正利用探索処理の応用例を示すフローチャートである。
【図8】第2の実施形態によるコンテンツ不正利用探索システムの機器構成を例示するブロック図である。
【符号の説明】
1…ユーザ端末装置
2…探索サーバ
3…インターネット
11…CPU
12…RAM
13…ROM
13a…探索ロボット
14…入力I/F部
15…通信制御部
17…IDデータ/URLデータベース
18…プライベート入力部
20…リストサーバ
21…CPU
22…RAM
23…ROM
23a…リスト提供プログラム
24…入力I/F部
25…通信制御部
27…リストデータベース
31…探索対象収集部
32…テキスト解析部
33…優先順位設定部
34…探索対象コンテンツチェック部
35…不正使用判定部
36…警告メイル送信部
A…コンテンツ管理会社
B…技術管理会社
Claims (2)
- 電子ネットワークにおけるコンテンツの不正利用を探索するコンテンツ不正利用探索システムであって、
キーワードと探索するコンテンツの最上位階層のアドレス情報とを入力する端末装置と、
キーワードと探索するコンテンツの最上位階層のアドレス情報とを記憶するリストデータベースを備えたリストサーバと、
前記端末装置から入力される前記キーワードと前記アドレス情報、あるいは前記リストサーバから提供される前記キーワードと前記アドレス情報とを入力部から入力し、入力した前記アドレス情報及び前記キーワードに基づいてコンテンツを収集し、収集したコンテンツ内に含まれる電子透かしを参照して当該コンテンツが不正利用されているものであるか否かを判定する探索ロボットを起動する探索サーバとを含み、
前記探索ロボットは、前記入力部から入力された前記アドレス情報により特定される階層に記述されているテキスト情報を収集し、収集した 当該テキスト情報内にリンクされているコンテンツ を収集する探索対象収集部と、前記探索対象収集部が収集した当該コンテンツに電子透かしによって埋め込まれた識別子を検出し、検出した識別子により当該コンテンツが不正利用されているか否かを判定する探索対象コンテンツチェック部と、前記 探索対象収集部が収集した前記テキスト情報に含まれる、 前記テキスト情報の階層から下位階層へ探索するためのリンク情報を解析するテキスト解析部と、 前記入力部から入力された前記キーワードに基づいて、前記テキスト解析部が解析した前記 リンク情報に優先順位を設定する優先順位設定部とを有し、
前記優先順位設定部は、前記キーワードに含まれる、前記優先順位を上げるプラスキーワードと前記優先順位を下げるマイナスキーワードのどちらか一方、もしくは両方に基づいて、前記下位階層へ探索するためのリンク情報に前記優先順位を設定し、
前記探索対象収集部は、前記優先順位設定部により設定された前記優先順位に従って、前記リンク情報により特定される階層に記述されているテキスト情報を収集し、収集した 当該テキスト情報内にリンクされているコンテンツ を収集し、
前記探索対象コンテンツチェック部は、前記探索対象収集部が収集した当該コンテンツに電子透かしによって埋め込まれた識別子を検出し、検出した識別子により当該コンテンツが不正利用されているか否かを判定することを特徴とするコンテンツ不正利用探索システム。 - 前記リストサーバ及び前記探索サーバは、それぞれ別の事業体により運営され、前記リストサーバは、電子ネットワークを介して前記アドレス情報及び前記キーワードを前記探索サーバに提供するように構成されること
を特徴とする請求項1に記載のコンテンツ不正利用探索システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002271958A JP2004112318A (ja) | 2002-09-18 | 2002-09-18 | コンテンツ不正利用探索システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002271958A JP2004112318A (ja) | 2002-09-18 | 2002-09-18 | コンテンツ不正利用探索システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004112318A true JP2004112318A (ja) | 2004-04-08 |
Family
ID=32269118
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002271958A Pending JP2004112318A (ja) | 2002-09-18 | 2002-09-18 | コンテンツ不正利用探索システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004112318A (ja) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100799558B1 (ko) | 2005-08-19 | 2008-01-31 | 한국전자통신연구원 | P2p 네트워크에서의 유해 파일 추적 장치 및 방법 |
JP2009217661A (ja) * | 2008-03-12 | 2009-09-24 | Kddi Corp | 違法コンテンツ判定支援システムおよび違法コンテンツ判定支援システムの制御プログラム |
WO2010073236A1 (en) | 2008-12-22 | 2010-07-01 | France Telecom | A method of and apparatus for authenticating data content |
EP2219107A1 (en) * | 2007-12-07 | 2010-08-18 | Hitachi Software Engineering Co., Ltd. | Printing management system, printing management method, and program |
JP2011034251A (ja) * | 2009-07-31 | 2011-02-17 | Dainippon Printing Co Ltd | コンテンツ不正流通対策システム |
JP2012049030A (ja) * | 2010-08-27 | 2012-03-08 | Denso Corp | 電池管理装置、電池管理システム、および電池管理方法 |
US10956430B2 (en) | 2019-04-16 | 2021-03-23 | International Business Machines Corporation | User-driven adaptation of rankings of navigation elements |
US11176134B2 (en) | 2019-04-16 | 2021-11-16 | International Business Machines Corporation | Navigation paths between content items |
US11210352B2 (en) | 2019-04-16 | 2021-12-28 | International Business Machines Corporation | Automatic check of search configuration changes |
US11244007B2 (en) | 2019-04-16 | 2022-02-08 | International Business Machines Corporation | Automatic adaption of a search configuration |
US11403354B2 (en) | 2019-04-16 | 2022-08-02 | International Business Machines Corporation | Managing search queries of a search service |
US11403356B2 (en) | 2019-04-16 | 2022-08-02 | International Business Machines Corporation | Personalizing a search of a search service |
US11436214B2 (en) | 2019-04-16 | 2022-09-06 | International Business Machines Corporation | Preventing search fraud |
-
2002
- 2002-09-18 JP JP2002271958A patent/JP2004112318A/ja active Pending
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100799558B1 (ko) | 2005-08-19 | 2008-01-31 | 한국전자통신연구원 | P2p 네트워크에서의 유해 파일 추적 장치 및 방법 |
US8284431B2 (en) | 2007-12-07 | 2012-10-09 | Hitachi Solutions, Ltd. | Printing management system, printing management method, and program |
EP2219107A1 (en) * | 2007-12-07 | 2010-08-18 | Hitachi Software Engineering Co., Ltd. | Printing management system, printing management method, and program |
EP2219107A4 (en) * | 2007-12-07 | 2010-12-01 | Hitachi Software Eng | PRINTING MANAGEMENT SYSTEM, PRINTING MANAGEMENT PROCESS AND CORRESPONDING PROGRAM |
JP2009217661A (ja) * | 2008-03-12 | 2009-09-24 | Kddi Corp | 違法コンテンツ判定支援システムおよび違法コンテンツ判定支援システムの制御プログラム |
WO2010073236A1 (en) | 2008-12-22 | 2010-07-01 | France Telecom | A method of and apparatus for authenticating data content |
JP2011034251A (ja) * | 2009-07-31 | 2011-02-17 | Dainippon Printing Co Ltd | コンテンツ不正流通対策システム |
JP2012049030A (ja) * | 2010-08-27 | 2012-03-08 | Denso Corp | 電池管理装置、電池管理システム、および電池管理方法 |
US10956430B2 (en) | 2019-04-16 | 2021-03-23 | International Business Machines Corporation | User-driven adaptation of rankings of navigation elements |
US11176134B2 (en) | 2019-04-16 | 2021-11-16 | International Business Machines Corporation | Navigation paths between content items |
US11210352B2 (en) | 2019-04-16 | 2021-12-28 | International Business Machines Corporation | Automatic check of search configuration changes |
US11244007B2 (en) | 2019-04-16 | 2022-02-08 | International Business Machines Corporation | Automatic adaption of a search configuration |
US11403354B2 (en) | 2019-04-16 | 2022-08-02 | International Business Machines Corporation | Managing search queries of a search service |
US11403356B2 (en) | 2019-04-16 | 2022-08-02 | International Business Machines Corporation | Personalizing a search of a search service |
US11436214B2 (en) | 2019-04-16 | 2022-09-06 | International Business Machines Corporation | Preventing search fraud |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10102372B2 (en) | Behavior profiling for malware detection | |
US8286248B1 (en) | System and method of web application discovery via capture and analysis of HTTP requests for external resources | |
US8359651B1 (en) | Discovering malicious locations in a public computer network | |
US11399288B2 (en) | Method for HTTP-based access point fingerprint and classification using machine learning | |
US20060239430A1 (en) | Systems and methods of providing online protection | |
Hong et al. | Phishing url detection with lexical features and blacklisted domains | |
US9888089B2 (en) | Client side cache management | |
US7644283B2 (en) | Media analysis method and system for locating and reporting the presence of steganographic activity | |
EP3125147A1 (en) | System and method for identifying a phishing website | |
CN100399750C (zh) | 便于在网络上识别计算机的系统与方法 | |
US20090064337A1 (en) | Method and apparatus for preventing web page attacks | |
US20140317754A1 (en) | Detecting Unauthorised Changes to Website Content | |
US20070006310A1 (en) | Systems and methods for identifying malware distribution sites | |
US20060179315A1 (en) | System and method for preventing fraud of certification information, and recording medium storing program for preventing fraud of certification information | |
CN101142782A (zh) | 消息保护系统中的两阶段散列值匹配技术 | |
US8584240B1 (en) | Community scan for web threat protection | |
CN102106114A (zh) | 分布式安全服务开通 | |
CN102801697A (zh) | 基于多url的恶意代码检测方法和系统 | |
US20100306184A1 (en) | Method and device for processing webpage data | |
JP2004112318A (ja) | コンテンツ不正利用探索システム | |
US11503072B2 (en) | Identifying, reporting and mitigating unauthorized use of web code | |
CN113408948A (zh) | 一种网络资产管理方法、装置、设备和介质 | |
US20180150877A1 (en) | 3rd party request-blocking bypass layer | |
CN108574686B (zh) | 一种在线预览文件的方法及装置 | |
JP5537428B2 (ja) | ワイヤレス通信ネットワークを通じた検索インデックス断片の標的設定した配信 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20041129 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060613 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060627 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20061024 |