JP2001282749A - ネットワーク上の情報検出方法 - Google Patents

ネットワーク上の情報検出方法

Info

Publication number
JP2001282749A
JP2001282749A JP2000092928A JP2000092928A JP2001282749A JP 2001282749 A JP2001282749 A JP 2001282749A JP 2000092928 A JP2000092928 A JP 2000092928A JP 2000092928 A JP2000092928 A JP 2000092928A JP 2001282749 A JP2001282749 A JP 2001282749A
Authority
JP
Japan
Prior art keywords
information
content
site
list
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000092928A
Other languages
English (en)
Inventor
Eiji Oishi
英司 大石
Hideyasu Akaha
秀康 赤羽
Ichiji Kaneto
一司 兼頭
Nobuo Saito
伸雄 斎藤
Sota Nagano
荘太 永野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toppan Inc
Original Assignee
Toppan Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toppan Printing Co Ltd filed Critical Toppan Printing Co Ltd
Priority to JP2000092928A priority Critical patent/JP2001282749A/ja
Publication of JP2001282749A publication Critical patent/JP2001282749A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Television Systems (AREA)

Abstract

(57)【要約】 【課題】 不正流出の検出を目的として電子透かし等を
用いたコンテンツ情報をネットワーク上で探索する際の
所要時間を短くすることのできる情報不正流出検出方法
を提供する。 【解決手段】 特定情報挿入手段81によって特定情報
91を予めコンテンツ情報93に挿入しておき、そのよ
うなコンテンツ情報93をネットワーク上で提供する。
また、連想情報リスト作成手段11は、当該コンテンツ
に関連するキーワード等を含む連想情報リスト21を作
成する。そして、検査対象サイトリスト作成手段は、ネ
ットワーク検索エンジンを用いて、連想情報リスト21
に基づいた検査対象サイトリスト22を作成する。探索
判定手段13は、この検査対象サイトリスト22を基
に、絞り込まれた範囲のみを探索し、その範囲内のコン
テンツについて特定情報が挿入されているか否かを判別
する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、ネットワーク上
で提供されているデジタルコンテンツ情報を検出するコ
ンテンツ情報の検出方法に関する。特に、有償で提供さ
れる画像データやや音声データ等のデジタルコンテンツ
情報の不正コピーのような流出を検出するのに好適であ
る。
【0002】
【従来の技術】インターネット等のネットワーク上で提
供されているデジタルコンテンツ情報を検出するための
有効な方法として、電子透かしの技術が用いられてい
る。この電子透かしは、画像コンテンツや音声コンテン
ツなどのデジタルコンテンツ情報のように、空間や時間
やデータ数値の次元の広がりを持ちながらある程度の冗
長性を有するデジタルデータに、この冗長性を利用し
て、その権利者名やデータの提供者名や取引条件などを
識別する特定情報を前記各次元の方向に分散させ、画像
や音声としては人に知覚されにくい方法で挿入する技術
である。電子透かしとして挿入された特定情報は所定の
手順によって抽出できるため、任意のデジタルコンテン
ツ情報の中から抽出された特定情報を参照することによ
って、特定の当該デジタルコンテンツ情報を検出するこ
とができる。
【0003】このような電子透かし技術を用いた検出方
法の代表的な利用例として、正当な許諾を得ることなく
不正にコピーされて流出してしまったデジタルコンテン
ツ情報の検出があげられる。図5は、このような不正流
出を検出する手順を示すシーケンス図である。図5にお
いて、符号91は特定情報であり、特定情報91として
は、コンテンツの権利者等を識別できる情報が用いられ
る。また92はコンテンツ原情報であり、コンテンツ原
情報92は、例えば写真などの画像情報や音楽などの音
声情報である。特定情報挿入手段81は、コンテンツ原
情報92に特定情報91を電子透かしとして挿入された
コンテンツ情報93を生成する。そして、このコンテン
ツ情報93は、アップロード手段82によって有償コン
テンツ流通サーバ83にアップロードされ、ネットワー
ク80を介してユーザに対して提供される。
【0004】ここで、あるユーザが、有償コンテンツ流
通サーバ83から取得したコンテンツ情報を不正にコピ
ーして、ネットワーク80上の他のサーバ又はサイトも
しくはホームページにアップロードしてコンテンツ情報
99として提供し公開した場合、このような不正コピー
されたコンテンツ情報99を放置することは、オリジナ
ルのコンテンツの財産的価値を減少させることにつなが
ってしまう。そこで、探索判定手段90を用いてネット
ワーク80上の不正コピーを検出するようにする。探索
判定手段90は、コンピュータ上で稼働するソフトウェ
アとして実現され、ネットワーク80に接続された全て
のサーバ又はサイトもしくはホームページを対象とし
て、そこにアップロードされたコンテンツ情報をコンテ
ンツ情報間のハイパーリンクを含めて自律的に探索する
エージェントの機能を有している。そして、探索判定手
段90は予め取得しておいた特定情報91に基づいて、
探索中に遭遇したコンテンツ情報内に当該特定情報が電
子透かしとして挿入されてないかどうかを逐一判定し、
当該特定情報が挿入されたコンテンツ情報を発見した場
合には、そのコンテンツに関する情報を出力する。この
ようにして、不正流出情報を検出することができる。
【0005】
【発明が解決しようとする課題】上記のような従来技術
を用いた場合の問題点は、探索判定手段がネットワーク
に接続された全てのサーバ又はサイトもしくはホームペ
ージを対象として探索するため、探索空間が広すぎて、
探索対象に対して1サイクルの探索を終えるまでの時間
がかかりすぎることである。現在、ネットワークに接続
された利用者やコンピュータの数は益々増加しつつあ
り、またそれに伴ってネットワークを通してアクセス可
能なコンテンツ情報の数も増加しつづけている。従っ
て、上記従来技術を用いて探索を行った場合、1サイク
ルの探索には数ヶ月〜数十ヶ月といったオーダの時間が
かかってしまう。コンテンツ情報の財産的価値は、その
種類にもよるが、情報の鮮度と密接に関係しているた
め、できる限り短い時間で不正コピーを検出できること
が望まれる。また、不正コピーされたコンテンツ情報は
比較的短い時間で削除されたり移動されたりする傾向が
あり、その点からも、できる限り短い時間での検出が望
まれる。
【0006】本発明は、上記のような事情を考慮してな
されたものであり、ネットワーク上に提供されているコ
ンテンツ情報の検出方法において、探索所要時間を飛躍
的に短くすることのできる情報検出方法を提供すること
を目的とする。
【0007】
【課題を解決するための手段】上記の課題を解決するた
めに、請求項1に記載の発明は、ネットワーク上で提供
されているコンテンツ情報であって当該コンテンツ情報
に関する特定情報が挿入されたコンテンツ情報を検出す
る方法であって、前記コンテンツ情報から連想される連
想情報が含まれる連想情報リストを基に、検査対象とな
るサイト情報が含まれる検査対象サイトリストを作成す
る第1のステップと、当該検査対象サイトリストを基
に、ネットワーク上を探索し当該サイトまたは当該サイ
トにリンクされたサイトに含まれるコンテンツ情報を検
査対象コンテンツとして検出する第2のステップと、当
該検査対象コンテンツに前記特定情報が挿入されている
かどうかを判別する第3のステップと、前記特定情報が
挿入されていると判別されたときは当該検査対象コンテ
ンツに関する情報を出力する第4のステップとを有する
ことを特徴とするものである。このような構成により、
前記第1のステップにおいては、連想情報を基にこれと
関連性を持つサイト情報が検査対象サイトとして抽出さ
れ、検査対象サイトリストが作成される。そして、前記
第2のステップでは、この検査対象サイトリストを基
に、ネットワーク上を探索して検査対象コンテンツを検
出する。前記第3のステップにおいては、このような検
査対象コンテンツに特定情報が挿入されているかどうか
を判別し、前記第4のステップにおいて例えばこのサイ
ト情報などのコンテンツに関する情報を出力する。ここ
で、検査対象となるのは上記検査対象サイトリストに含
まれているサイトに限定されることとなる。
【0008】また、請求項2に記載の発明にかかるネッ
トワーク上の情報検出方法は、上記検査対象サイトリス
トに含まれるサイト情報には、優先順位が設定され、当
該優先順位に基づいてネットワーク上を探索することを
特徴とするものである。このような構成により、優先順
位の高いサイトまたは当該サイトにリンクされたサイト
に含まれるコンテンツ情報が先に検査される。
【0009】また、請求項3に記載の発明にかかるネッ
トワーク上の情報検出方法は、前記連想情報リストは、
前記コンテンツ情報の名称を含むことを特徴とするもの
である。このような構成により、コンテンツ情報の名称
と関連するサイトが検査対象サイトリストの中に含まれ
ることとなり、不正流出の検出の可能性が高まる。
【0010】また、請求項4に記載の発明にかかるネッ
トワーク上の情報検出方法は、前記連想情報リストは、
前記コンテンツ情報に関する日時情報を含むことを特徴
とするものである。このような構成により、この日時情
報に応じて、検査対象サイトリストを作成することが可
能となる。
【0011】また、請求項5に記載の発明にかかるネッ
トワーク上の情報検出方法は、前記日時情報は、前記コ
ンテンツ情報が前記ネットワーク上でアクセス可能とな
った日時を基準に定められることを特徴とするものであ
る。このような構成により、対象とするコンテンツ情報
がネットワーク上でアクセス可能となった日時に応じ
て、検査対象サイトリストを作成することが可能とな
る。
【0012】また、請求項6に記載の発明にかかるネッ
トワーク上の情報検出方法は、前記第3のステップにお
いては、指定された深さレベル値の範囲内でリンクされ
ている検査対象コンテンツのみについて、前記特定情報
が挿入されているかどうかを判別することを特徴とする
ものである。このような構成により、指定された深さレ
ベル値の範囲内でリンクされているコンテンツのみを検
査対象とすることが可能となる。
【0013】また、請求項7に記載の発明にかかるネッ
トワーク上の情報検出方法は、予め、検査対象から除外
される検査除外サイトのサイト情報を設定しておき、前
記第2のステップにおいては、前記検査対象サイトリス
トから前記検査除外サイトのサイト情報を除外すること
を特徴とするものである。このような構成により、設定
された検査除外サイトを除外することが可能となる。
【0014】
【発明の実施の形態】以下に、図面を参照し本発明の一
実施形態について説明する。図1は、本発明を不正コピ
ーされたコンテンツ情報の探索に用いた実施形態であっ
て、同実施形態による検出手順を示す処理シーケンス図
である。図1において、符号11は連想情報リスト作成
手段、21は連想情報リスト作成手段11によって作成
される連想情報リスト、12は連想情報リスト11を基
にネットワーク検索により検査対象のサイト(サーバ又
はホームページということもある)をリストアップする
検査対象サイトリスト作成手段、22は検査対象サイト
リスト作成手段12によって作成される検査対象サイト
リスト、13は検査対象サイトリスト22を基に探索さ
れたネットワーク80上の有償コンテンツ情報に所望の
特定情報が挿入されているかどうか判別する探索判別手
段、14は探索判別手段13の判別結果を出力する出力
手段、23は出力手段14によって出力される不正コピ
ーされたコンテンツ情報がアップロードされたと思われ
る流出サイト情報である。
【0015】ここで、本実施形態においてネットワーク
とは、インターネットが代表的なものとしてあげられる
が、これに限定されるものではなく、携帯電話やPHS
等の電話網、ケーブルテレビやカーナビ、通信衛星等を
用いた通信網等の通信ネットワークも含まれる。
【0016】また、81は特定情報挿入手段、82はア
ップロード手段、83は有償コンテンツ流通サーバであ
り、92はコンテンツ原情報、91はコンテンツ原情報
92の権利者名や提供者名、取引条件など予め設定した
コンテンツに関連する情報を識別するための特定情報、
93はコンテンツ情報(有償情報)である。特定情報挿
入手段81は、コンテンツ原情報92に特定情報91を
電子透かしとして挿入しコンテンツ情報93を生成す
る。アップロード手段はこのコンテンツ情報93を有償
コンテンツ流通サーバ83にアップロードし、この有償
コンテンツ流通サーバ83からネットワーク80を介し
てユーザに対してコンテンツが提供される。有償コンテ
ンツ流通サーバ83上のコンテンツ情報は適宜更新され
ることがある。また、コンテンツ提供の対価に関して、
図示されてない手段によってユーザに対する課金処理が
行われる。
【0017】また、96はネットワーク80上の一般の
コンテンツ情報であり、図1上で各々のコンテンツ情報
96からのびている矢印線はコンテンツ間のハイパーリ
ンクを表している。また、98はネットワーク80上で
アクセス可能となっているコンテンツ情報でありコンテ
ンツ情報93の適正コピーである。このような適正コピ
ーによるコンテンツ情報98がネットワーク上に置かれ
るケースとしては、例えば、有償情報流通事業者と提携
した事業者が宣伝目的でサンプルコンテンツを公開する
ことなどが考えられる。そして99は不正にコピーされ
たコンテンツ情報である。なお、これらコンテンツ情報
98および99にも電子透かしとして特定情報91が挿
入されている。
【0018】不正流出したコンテンツ99を検出するこ
とを目的として、まず連想情報リスト作成手段11が連
想情報リスト21を作成する。本実施形態においては、
この連想情報リスト21は文字列からなるデータであ
り、例えば、 keyword:xxxxxxxxxxxx keyword:yyyyyyyyyyyy keyword:zzzzzzzzzzzz date-after:YYYY/MM/DD,hh:mm:ss といった形式となっている。この例において、「keywor
d:」に後続する部分にはコンテンツ情報から連想される
キーワードが書かれている。連想されるキーワードと
は、例えば、コンテンツ情報の名称や、コンテンツに出
演しているタレントやモデルの名前や、このタレント等
が出演している映画やビデオや演劇や写真集などのタイ
トル名や、このタレント等の所属会社名や、コンテンツ
の制作会社名や、制作関係者の名前などである。
【0019】また、上のデータ例において、「date-aft
er: 」に後続する部分には日時情報が指定されており、
当該日時以降に更新されたネットワーク上のサイトを検
査対象とすることを表す。また、この日時情報は、対象
とするコンテンツ情報がネットワーク上でアクセス可能
となった日時を基準に定められることが好ましい。この
ようにすれば、この日時以降に更新されたサイトのみを
検査対象サイトとすることにより、不正コピーしたコン
テンツ情報をアップロードすることは時系列的に不可能
であって当該コンテンツを載せてないと推定されるサイ
トを検査対象サイトリストから除外することができる。
【0020】なお、連想情報リスト21には上に例とし
て示したもの以外の形式のデータを含んでいても良い。
例えば、複数のキーワードを論理和あるいは論理積によ
り結びつける旨の指示データや、指定された日時以前の
コンテンツ情報を検査対象とする旨のデータなどを含ん
でいても良い。
【0021】次に、検査対象サイトリスト作成手段12
は、上記のような連想情報リスト21を読み込み、キー
ワードマッチング手法などを用いて上記のキーワードを
基に、これらのキーワードに該当する検査対象サイトの
サイト情報を複数含む検査対象サイトリスト22を作成
する。このとき、連想情報リスト21の中に例えば「da
te-after: 」による日時指定が存在する場合には、その
日時以降に更新されている検査対象サイトのみを抽出す
るようにする。なお、ここでキーワードのマッチング手
法としてはネットワーク検索エンジンのような公知技術
をても良い。また、「サイト情報」とはネットワーク上
のサイトにアクセスするための情報であり、例えば「ht
tp://www.aaaaaa.ne.jp/bbbbbb/ 」などの形式で表され
るURL(ユニフォームリソースロケータ)である。
【0022】次に、探索判別手段13は、検査対象サイ
トリスト22を読み込み、リスト中のサイト情報を基に
ネットワーク上のサイトにアクセスし、当該サイトに含
まれるコンテンツ96にアクセスする。また、当該サイ
ト又はコンテンツ96からハイパーリンクされているコ
ンテンツがある場合には、さらにそのハイパーリンクさ
れたコンテンツにもアクセスする。そして、電子透かし
が挿入されている可能性のあるコンテンツ(検査対象コ
ンテンツ)については、まず電子透かしの有無を確認
し、電子透かしが有る場合には、その電子透かし情報が
探索対象としている特定情報91と同一であるかどうか
を判別する。なお、適宜、静止画像コンテンツ、音声コ
ンテンツ、動画コンテンツ、音声付き動画コンテンツな
どといった特定タイプのコンテンツのみを検査対象コン
テンツとするようにしても良い。
【0023】探索判別手段13によって特定情報91が
挿入されていると判別されたコンテンツについての情報
は出力手段14に通知され、出力手段14はそのコンテ
ンツに関するサイト情報を不正サイト情報23として出
力する。
【0024】以上述べたように、従来技術においては電
子透かしが挿入されたコンテンツを発見するためにネッ
トワーク上に接続された全てのサイトを探索するといっ
たように広大な探索空間を総当たり的に探索し検査して
いたのに対して、本実施形態では、予め設定されたキー
ワードや日時情報などによって検査対象サイトの範囲を
限定しているために探索空間が絞り込まれ、情報の不正
流出を効率的に早く検出することができる。また、この
ように探索空間を絞り込むことにより、ネットワーク上
で無駄なトラフィックが発生するのを防止することがで
きる。
【0025】次に、不正流出したコンテンツの検出のた
めの探索の効率をさらに向上させる方法について説明す
る。図2は、探索判別手段13が探索するコンテンツ間
のリンクの関係とリンクの深さレベルを示す概念図であ
る。図2において、符号31は検査対象サイトリスト2
2内のサイト情報であり、コンテンツ情報96からのび
ている矢印線はコンテンツ情報間のハイパーリンクを表
している。また、図中のdは、サイト情報31によって
直接参照されている先頭のコンテンツ情報からの深さレ
ベル値である。探索空間を広くとれば、不正流出による
コピーを検出できる可能性は上がるが、そのための探索
に要する時間コストも上がってしまうといったトレード
オフの関係にあるが、あまり深いレベルまでリンクをた
どっていっても限られた時間の中では探索できる空間に
は限度があるため、探索判別手段が指定された深さレベ
ル値dの範囲内でリンクされている検査対象コンテンツ
のみについて特定情報の挿入の有無を判別することによ
り、深さ方向での探索空間の広がりを抑制し、探索の所
要時間を短縮することが可能となる。
【0026】また、図3は、検査対象サイトリスト作成
手段において、特定のサイトを除外して検査対象サイト
リストを作成するための手順を示す処理シーケンス図で
ある。図3において、符号122は検査対象サイトリス
ト作成手段内の検索手段、124は同じく除外手段であ
る。また、29は予め設定され検査対象から除外される
検査除外サイトに関する除外サイト情報であり、128
は検索手段122によって作成される仮リストである。
図3に示す例では、検索手段122は連想情報リスト2
1に基づいて検索を行い{A,B,C,D,E}という
5つのサイト情報を含む仮リスト128を出力する。一
方、除外サイト情報29には{B,D,F}という3つ
のサイト情報が設定されている。そして、除外手段12
4は、仮リスト128に含まれておりかつ除外サイト情
報29に含まれてないサイト情報のみを検査対象サイト
リスト22として出力する。本例では、{A,B,C,
D,E}から{B,D,F}に含まれる要素を除外し
て、{A,C,E}が検査対象サイトリスト22に含ま
れる。よって、検査対象サイトリスト作成手段12は、
検査対象サイトリストから検査除外サイトのサイト情報
を除外することになる。不正にコピーされたコンテンツ
情報を載せることはないという信頼を持てるサイトを、
上記のように予め除外サイト情報に設定しておくことに
より、たとえ連想情報と関連するサイトであっても検査
対象サイトリストの中から除外し、さらに探索空間を絞
り込むことができ、探索の所要時間を短縮することが可
能となる。
【0027】次に、情報不正流出検出のための1サイク
ルの探索所要時間を短縮することの効果について説明す
る。図4は、コンテンツ更新サイクルと1サイクルの探
索所要時間との関係を示すタイミングチャートである。
図4において、コンテンツ更新サイクルは、例えばネッ
トワーク上で流通されてる有償情報の更新のサイクルを
表す。ここでは、C1,C2,C3,・・・が更新のタ
イミングである。このような更新は、例えば、毎時、毎
日、毎週、2週間に1回、毎月などといった頻度で行わ
れる。
【0028】パターンAは、1サイクルの探索所要時間
が更新サイクルよりも長い場合を示している。またパタ
ーンBは、1サイクルの探索所要時間が更新サイクルよ
りもやや短い場合を示している。またパターンCは、1
サイクルの探索所要時間が更新サイクルよりもかなり短
い場合を示している。ここでは、コンテンツ情報が更新
されることにより、更新前のコンテンツの財産的価値が
大きく下落するものと仮定すると、パターンAにおける
探索(A110)によって不正流出を検出できたとして
もその効果は極めて限定的なものとなってしまう。それ
に対して、パターンBの場合は、探索(B110)の終
了後、次の更新までの時間(B111)に、例えば不正
利用者に対し不正利用を止めさせるようなアクションを
とることにより、オリジナルのコンテンツの価値を維持
することが可能となる。さらに、パターンCの場合は、
1サイクル目の探索(C110)の終了後に2サイクル
目、3サイクル目、といった探索(C120、C13
0)を行うことが可能であり、不正流出コンテンツが短
期間で削除されたりする場合にも対応できる可能性が高
まり、情報の鮮度が高いうちに不正流出に対する対策を
講じることが可能となり、より一層オリジナルコンテン
ツの価値を維持できる。
【0029】なお、上記実施形態では、特定情報を電子
透かしによってコンテンツ情報に挿入することとした
が、これ以外の方法で特定情報を挿入するようにしても
良く、検出時にコンテンツ情報から特定情報を取り出す
ことによってその特定情報を機械的に判別できればよ
い。
【0030】また、上記実施形態では、不正コピーされ
て流出してしまったコンテンツ情報の検出に用いた実施
形態を説明したが、これ以外に用いても良い。例えば、
特定情報が挿入されたコンテンツ情報がネットワーク上
のどのサイトで利用されているか、どの程度の数量アッ
プロードされているか等を検出することができるので、
特定のコンテンツ情報に関するユーザの嗜好や利用状況
等のマーケティング調査等にも利用することができる。
【0031】また、検査対象サイトリストにおいて、検
査対象となるサイトに優先順位を設定し、探索判別手段
がこの優先順位に応じて探索を行うようにしても良い。
優先順位の設定方法としては、例えば、特定のドメイン
に属する検査対象サイトの優先順位を高くあるいは低く
することや、連想情報リスト内のキーワードと検査対象
サイトとの相関度値を用いることや、サイトの最終更新
日が新しいほど優先順位を高くあるいは低くすること
や、これらを複合的に用いた評価関数により優先順位を
決定する方法などが考えられる。
【0032】また、上述の情報不正流出検出の方法を、
コンピュータシステムを用いて装置として実現しても良
い。この場合、連想情報リスト作成、検査対象サイトリ
スト作成、探索判別、出力などの各過程は、プログラム
の形式でコンピュータ読み取り可能な記録媒体に記憶さ
れており、このプログラムをコンピュータが読み出して
実行することによって、上記処理が行われる。ここでコ
ンピュータ読み取り可能な記録媒体とは、フロッピー
(登録商標)ディスク、光磁気ディスク、CD−RO
M、磁気ハードディスク、半導体メモリ等をいう。
【0033】
【発明の効果】以上説明したように、請求項1に記載の
発明によれば、第1のステップにおいては、連想情報を
基にこれと関連性を持つサイト情報が検査対象サイトと
して抽出され、検査対象サイトリストが作成される。そ
して、第2のステップでは、この検査対象サイトリスト
を基に、ネットワーク上を探索して検査対象コンテンツ
を検出する。第3のステップにおいては、このような検
査対象コンテンツに特定情報が挿入されているかどうか
を判別るため、従来の総当たり的に探索空間の探索を行
う場合に比べて探索時間が大幅に短縮される。また、検
査対象となるのは上記検査対象サイトリストに含まれて
いるサイトに限定されることとなるので、探索空間の広
がりを抑制することができるため、ネットワーク上での
無駄なトラフィックの発生を防止することが可能とな
る。
【0034】また、請求項2に記載の発明によれば、設
定に基づき、優先順位の高いサイトまたは当該サイトに
リンクされたサイトに含まれるコンテンツ情報が先に検
査されるため、そのようなサイト上の情報を早く検出す
ることが可能となる。
【0035】また、請求項3に記載の発明によれば、コ
ンテンツ情報の名称と関連するサイトが検査対象サイト
リストの中に含まれることとなり、検査対象サイトを絞
り込んでコンテンツ情報の検出の可能性を高めることが
可能となる。
【0036】また、請求項4に記載の発明によれば、連
想情報リスト内に含まれる日時情報に応じて、検査対象
サイトリストを作成することが可能となり、さらに検査
対象サイトを絞り込むことができるため、検出のための
探索時間をより短縮することが可能となる。
【0037】また、請求項5に記載の発明によれば、対
象とするコンテンツ情報がネットワーク上でアクセス可
能となった日時に応じて、検査対象サイトリストを作成
することが可能となる。よって、検出のための探索時間
をさらに短縮することが可能となる。
【0038】また、請求項6に記載の発明によれば、指
定された深さレベル値の範囲内でリンクされているコン
テンツのみを検査対象とするため、必要以上に探索空間
が広がることがなく、検出のための探索時間をさらに短
縮することが可能となる。
【0039】また、請求項7に記載の発明によれば、予
め検査除外サイトのサイト情報を設定しておき、そのよ
うな検査除外サイトを検査対象サイトリストから除外す
るため、探索空間をさらに絞り込むことができ、検索の
ための探索時間をより短縮することが可能となる。
【図面の簡単な説明】
【図1】 この発明の一実施形態による情報の不正流出
検出手順を示す処理シーケンス図である。
【図2】 同実施形態による探索判別手段が探索するコ
ンテンツ間のリンクの関係とリンクの深さレベルを示す
概念図である。
【図3】 同実施形態による検査対象サイトリスト作成
手段において、特定サイトを検査対象サイトリストから
除外する手順を示す処理シーケンス図である。
【図4】 コンテンツ更新サイクルと1サイクルの探索
所要時間との関係を示すタイミングチャートである。
【図5】 従来技術による不正流出情報の検出の方法を
示す図である。
【符号の説明】
11 連想情報リスト作成手段 12 検査対象サイトリスト作成手段 13 探索判定手段 14 出力手段 21 連想情報リスト 22 検査対象サイトリスト 23 不正流出サイト情報 29 除外サイト情報 31 サイト情報 80 ネットワーク 81 特定情報挿入手段 82 アップロード手段 83 有償コンテンツ流通サーバ 91 特定情報 92 コンテンツ原情報 93 コンテンツ情報(特定情報挿入済) 96 コンテンツ情報 98 コンテンツ情報(適正コピー) 99 コンテンツ情報(不正コピー) 122 検索手段 124 除外手段 128 仮リスト
───────────────────────────────────────────────────── フロントページの続き (72)発明者 兼頭 一司 東京都台東区台東1丁目5番1号 凸版印 刷株式会社内 (72)発明者 斎藤 伸雄 東京都台東区台東1丁目5番1号 凸版印 刷株式会社内 (72)発明者 永野 荘太 東京都台東区台東1丁目5番1号 凸版印 刷株式会社内 Fターム(参考) 5B075 ND36 5B085 AC08 AE00 5C063 AB03 AB09 CA29 CA36 CA40 DA13 DA20 5J104 AA14 9A001 BB03 CC05 FF03 JJ25 JJ27 KK56 LL03

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 ネットワーク上で提供されているコンテ
    ンツ情報であって当該コンテンツ情報に関する特定情報
    が挿入されたコンテンツ情報を検出する方法であって、 前記コンテンツ情報から連想される連想情報が含まれる
    連想情報リストを基に、検査対象となるサイト情報が含
    まれる検査対象サイトリストを作成する第1のステップ
    と、 当該検査対象サイトリストを基に、ネットワーク上を探
    索し当該サイトまたは当該サイトにリンクされたサイト
    に含まれるコンテンツ情報を検査対象コンテンツとして
    検出する第2のステップと、 当該検査対象コンテンツに前記特定情報が挿入されてい
    るかどうかを判別する第3のステップと、 前記特定情報が挿入されていると判別されたときは当該
    検査対象コンテンツに関する情報を出力する第4のステ
    ップと、 を有することを特徴とするネットワーク上の情報検出方
    法。
  2. 【請求項2】 上記検査対象サイトリストに含まれるサ
    イト情報には、優先順位が設定され、当該優先順位に基
    づいてネットワーク上を探索することを特徴とする請求
    項1に記載のネットワーク上の情報検出方法。
  3. 【請求項3】 前記連想情報リストは、前記コンテンツ
    情報の名称を含むことを特徴とする請求項1又は請求項
    2に記載のネットワーク上の情報検出方法。
  4. 【請求項4】 前記連想情報リストは、前記コンテンツ
    情報に関する日時情報を含むことを特徴とする請求項1
    〜3のいずれかに記載のネットワーク上の情報検出方
    法。
  5. 【請求項5】 前記日時情報は、前記コンテンツ情報が
    前記ネットワーク上でアクセス可能となった日時を基準
    に定められることを特徴とする請求項4に記載のネット
    ワーク上の情報検出方法。
  6. 【請求項6】 前記第2のステップにおいては、指定さ
    れた深さレベル値の範囲内でリンクされている検査対象
    コンテンツのみについて、前記特定情報が挿入されてい
    るかどうかを判別することを特徴とする請求項1〜5の
    いずれかに記載のネットワーク上の情報検出方法。
  7. 【請求項7】 予め、検査対象から除外される検査除外
    サイトのサイト情報を設定しておき、 前記第1のステップにおいては、前記検査対象サイトリ
    ストから前記検査除外サイトのサイト情報を除外するこ
    とを特徴とする請求項1〜6のいずれかに記載のネット
    ワーク上の情報検出方法。
JP2000092928A 2000-03-30 2000-03-30 ネットワーク上の情報検出方法 Pending JP2001282749A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000092928A JP2001282749A (ja) 2000-03-30 2000-03-30 ネットワーク上の情報検出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000092928A JP2001282749A (ja) 2000-03-30 2000-03-30 ネットワーク上の情報検出方法

Publications (1)

Publication Number Publication Date
JP2001282749A true JP2001282749A (ja) 2001-10-12

Family

ID=18608186

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000092928A Pending JP2001282749A (ja) 2000-03-30 2000-03-30 ネットワーク上の情報検出方法

Country Status (1)

Country Link
JP (1) JP2001282749A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007096608A (ja) * 2005-09-28 2007-04-12 Yafoo Japan Corp 不正画像検出装置、方法、プログラム
JP2010152730A (ja) * 2008-12-25 2010-07-08 Sony Corp コンテンツ利用管理装置、コンテンツ利用管理方法、およびプログラム
JP2012151535A (ja) * 2011-01-17 2012-08-09 Nippon Hoso Kyokai <Nhk> 電子透かし埋め込み装置、電子透かし埋め込みプログラム、電子透かし検出装置および電子透かし検出プログラム
KR101454754B1 (ko) * 2013-03-06 2014-10-27 주식회사 시큐아이 유해 사이트에 대한 접속 차단 목록 생성 방법 및 장치
JP2020126465A (ja) * 2019-02-05 2020-08-20 株式会社日立製作所 検出装置、検出方法、および検出プログラム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007096608A (ja) * 2005-09-28 2007-04-12 Yafoo Japan Corp 不正画像検出装置、方法、プログラム
JP2010152730A (ja) * 2008-12-25 2010-07-08 Sony Corp コンテンツ利用管理装置、コンテンツ利用管理方法、およびプログラム
US8782806B2 (en) 2008-12-25 2014-07-15 Sony Corporation Content usage managing apparatus, content usage managing method and program
JP2012151535A (ja) * 2011-01-17 2012-08-09 Nippon Hoso Kyokai <Nhk> 電子透かし埋め込み装置、電子透かし埋め込みプログラム、電子透かし検出装置および電子透かし検出プログラム
KR101454754B1 (ko) * 2013-03-06 2014-10-27 주식회사 시큐아이 유해 사이트에 대한 접속 차단 목록 생성 방법 및 장치
JP2020126465A (ja) * 2019-02-05 2020-08-20 株式会社日立製作所 検出装置、検出方法、および検出プログラム
JP7269747B2 (ja) 2019-02-05 2023-05-09 株式会社日立製作所 検出装置、検出方法、および検出プログラム

Similar Documents

Publication Publication Date Title
US7610382B1 (en) System and method for marking content
JP5069285B2 (ja) ウェブサイトのウェブページのような関連するウェブページの間での有用な情報の伝搬
Broder et al. Syntactic clustering of the web
KR100819739B1 (ko) 웹 컨텐츠를 확장하는 방법 및 시스템
US11475670B2 (en) Method of creating a template of original video content
US8296293B2 (en) Agent rank
US7363277B1 (en) Detecting copyright violation via streamed extraction and signature analysis in a method, system and program
US20100082653A1 (en) Event media search
US20090089278A1 (en) Techniques for keyword extraction from urls using statistical analysis
WO2010042199A1 (en) Indexing online advertisements
KR100930077B1 (ko) 디지털 저작권 관리를 위한 워터마크 추적 시스템
JP5259260B2 (ja) 検索結果提供方法及びシステム
US9697229B2 (en) Methods and systems for creating and storing metadata
Jones et al. Interoperability for accessing versions of web resources with the memento protocol
JP2001282749A (ja) ネットワーク上の情報検出方法
JP2007183954A (ja) ログコンテントに基づく洗練方法
US11409790B2 (en) Multi-image information retrieval system
JP3554529B2 (ja) コンテンツ管理方法、その装置およびそのプログラム記録媒体
JPH11242656A (ja) ネットワークにおけるディジタルデータの著作権検査装置及び著作権検査方法並びに著作権検査プログラムを記録した媒体
JP4299934B2 (ja) 電子情報公開証明方法及びシステム、並びに電子情報公開証明プログラムを格納した記憶媒体
CN114282097A (zh) 一种信息识别方法及其装置
Glassman et al. Syntactic clustering of the Web
SalahEldeen et al. Reading the correct history? Modeling temporal intention in resource sharing
Mani Tripathi et al. Multicriteria-Based Trustworthiness Testing of Web Sites
Sharma et al. An improved online plagiarism detection approach for semantic analysis using custom search engine

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20031222

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040120