JP2009199513A - 違法情報検出装置、違法情報検出方法、及び違法情報検出プログラム - Google Patents
違法情報検出装置、違法情報検出方法、及び違法情報検出プログラム Download PDFInfo
- Publication number
- JP2009199513A JP2009199513A JP2008042766A JP2008042766A JP2009199513A JP 2009199513 A JP2009199513 A JP 2009199513A JP 2008042766 A JP2008042766 A JP 2008042766A JP 2008042766 A JP2008042766 A JP 2008042766A JP 2009199513 A JP2009199513 A JP 2009199513A
- Authority
- JP
- Japan
- Prior art keywords
- search result
- result information
- information
- search
- illegal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims description 141
- 238000000605 extraction Methods 0.000 claims description 38
- 238000004364 calculation method Methods 0.000 claims description 28
- 239000013598 vector Substances 0.000 claims description 19
- 239000000284 extract Substances 0.000 claims description 17
- 238000000034 method Methods 0.000 description 41
- 230000008569 process Effects 0.000 description 28
- 238000010586 diagram Methods 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000007726 management method Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【解決手段】本発明にかかる違法情報検出装置1は、ネットワーク上に公開された情報について検索条件に基づき検索された検索結果情報の中から違法性の高い情報を検出するものである。違法情報検出装置1は、検索結果情報が格納される検索結果情報記憶部11と、検索結果情報記憶部11に格納された検索結果情報から特徴量を抽出し、当該特徴量と検索結果情報とを対応付けて特徴量記憶部13へ格納する特徴抽出手段12と、特徴量記憶部13に格納された複数の特徴量からそれぞれの検索結果情報の間の類似度を計算し、当該類似度に基づき検索結果情報の間が類似するか否かを判定する類似度計算手段14と、類似度計算手段14により類似すると判定された検索結果情報の数が所定値を超える場合、当該検索結果情報を違法性の高い情報として検出する違法性検出手段15と、を備える。
【選択図】図1
Description
井上昇、佐藤敦、"擬似マハラノビス相互距離法を用いた動画像顔照合"、情報科学技術フォーラム2002、LI-20、p.163-164
D(F1、F2) < Dthre ・・・(1)
そして、類似度D(F1、F2)が(1)式を満たす場合、類似度計算手段14は、特徴量記憶部13を参照し、F1、及びF2に対応するR1、及びR2を類似する検索結果情報として判定する。
本実施の形態にかかる違法情報検出装置の実施例1として、以下に検索サーバの例を説明する。図3は、本発明の実施例1にかかる違法情報検出システムの全体構成を示すブロック図である。図3に示す違法情報検出システムは、検索サーバ100と、クライアント400とを備える。検索サーバ100と、クライアント400とは、インターネット等のネットワークに接続されている。
続いて、本実施の形態にかかる違法情報検出装置の実施例2として、以下に検索サーバの例を説明する。本発明の実施例2では、実施例1に比べ、検索条件をさらに用いて違法情報の検出を行い、検出の精度を高めるものである。
尚、本実施例1、及び2では、違法性検出手段15により類似とされた検索結果情報の種類数が一定量を超えた場合にアラームを検出するとしたが、検索結果情報の種類数とその検索結果情報の出現頻度、すなわち、検索のヒット件数がともに一定量を超える場合にもアラームを検出するようにしてもよい。つまり、検索結果のバリエーションが多岐に渡る場合だけでなく、同じ検索結果が繰り返し得られる場合にもアラームを検出することで、より高精度な検出が可能となる。例えば、類似のコンテンツが3箇所で公開され、1コンテンツあたり10件の検索結果情報が得られている場合には、種類数は3となるが総検索結果の件数は、30となり、より検出しやすくなると言える。
1a 違法情報検出部
1b 違法情報検出部
11 検索結果情報記憶部
12 特徴抽出手段
12a 特徴抽出手段
13 特徴量記憶部
14 類似度計算手段
15 違法性検出手段
16 検索結果情報格納手段
17 検索条件格納手段
18 検索条件記憶部
100 検索サーバ
101 検索サーバ
2 検索エンジン部
21 入力受付手段
22 検索手段
23 出力手段
3 検索対象データベース
400 クライアント
Claims (21)
- ネットワーク上に公開された情報について検索条件に基づき検索された検索結果情報の中から違法性の高い情報を検出する違法情報検出装置であって、
前記検索結果情報が格納される検索結果情報記憶部と、
前記検索結果情報記憶部に格納された検索結果情報から特徴量を抽出し、当該特徴量と前記検索結果情報とを対応付けて特徴量記憶部へ格納する特徴抽出手段と、
前記特徴量記憶部に格納された複数の特徴量からそれぞれの前記検索結果情報の間の類似度を計算し、当該類似度に基づき前記検索結果情報の間が類似するか否かを判定する類似度計算手段と、
前記類似度計算手段により類似すると判定された検索結果情報の数が所定値を超える場合、当該検索結果情報を違法性の高い情報として検出する違法性検出手段と、を備える違法情報検出装置。 - 前記違法情報検出装置は、前記検索条件に基づき検索された検索結果情報を取得し、前記検索結果情報記憶部へ格納する検索結果情報格納手段をさらに備える、請求項1に記載の違法情報検出装置。
- 前記違法情報検出装置は、
前記検索条件が格納される検索条件記憶部と、
前記検索条件を取得し、前記検索条件記憶部へ格納する検索条件格納手段とをさらに備え、
前記特徴抽出手段は、前記検索条件記憶部に格納された検索条件と、当該検索条件に対応する前記検索結果情報記憶部に格納された検索結果情報とから特徴量を抽出する、請求項2に記載の違法情報検出装置。 - 前記検索結果情報記憶部は、前記検索結果情報の検索回数が前記検索結果情報と対応付けて格納され、
前記違法性検出手段は、前記類似度計算手段により類似すると判定された検索結果情報の内、前記検索回数が所定値を超える検索結果情報の数が所定値を超える場合、当該検索結果情報を違法性の高い情報として検出する、請求項2又は3に記載の違法情報検出装置。 - 前記検索結果情報記憶部は、前記検索結果情報の時刻情報が前記検索結果情報と対応付けて格納され、
前記特徴抽出手段は、前記検索結果情報記憶部に格納された所定の時刻情報の範囲の検索結果情報から特徴量を抽出する、請求項2乃至4のいずれか1項に記載の違法情報検出装置。 - 前記検索結果情報は、前記ネットワーク上に公開された情報であるコンテンツ、又は当該コンテンツに関する情報であることを特徴とする、請求項1乃至5のいずれか1項に記載の違法情報検出装置。
- 前記特徴抽出手段は、前記検索結果情報の特徴量として文字ベクトル、単語ベクトル、ケプストラム、又は形状情報の少なくとも一つ以上を抽出することを特徴とする、請求項1乃至6のいずれか1項に記載の違法情報検出装置。
- ネットワーク上に公開された情報について検索条件に基づき検索された検索結果情報の中から違法性の高い情報を検出する違法情報検出方法であって、
前記検索結果情報から特徴量を抽出する特徴量抽出ステップと、
前記特徴抽出ステップにより抽出された複数の特徴量からそれぞれの前記検索結果情報の間の類似度を計算し、当該類似度に基づき前記検索結果情報の間が類似するか否かを判定する類似度計算ステップと、
前記類似度計算ステップにより類似すると判定された検索結果情報の数が所定値を超える場合、当該検索結果情報を違法性の高い情報として検出する違法性検出ステップと、を備える違法情報検出方法。 - 前記検索条件に基づき検索された検索結果情報を取得し、検索結果情報記憶部へ格納する検索結果情報格納ステップをさらに備え、
前記特徴抽出ステップは、前記検索結果情報記憶部に格納された検索結果情報から特徴量を抽出する、請求項8に記載の違法情報検出方法。 - 前記検索条件を取得し、検索条件記憶部へ格納する検索条件格納ステップをさらに備え、
前記特徴抽出ステップは、前記検索条件記憶部に格納された検索条件と、当該検索条件に対応する前記検索結果情報記憶部に格納された検索結果情報から特徴量を抽出する、請求項9に記載の違法情報検出方法。 - 前記違法性検出ステップは、前記類似度計算ステップにより類似すると判定された検索結果情報の内、前記検索結果情報の検索回数が所定値を超える検索結果情報の数が所定値を超える場合、当該検索結果情報を違法性の高い情報として検出する、請求項9又は10に記載の違法情報検出方法。
- 前記特徴抽出ステップは、所定の時刻情報の範囲の前記検索結果情報から特徴量を抽出する、請求項9乃至11のいずれか1項に記載の違法情報検出方法。
- 前記検索結果情報は、前記ネットワーク上に公開された情報であるコンテンツ、又は当該コンテンツに関する情報であることを特徴とする、請求項8乃至12のいずれか1項に記載の違法情報検出方法。
- 前記特徴抽出ステップは、前記検索結果情報の特徴量として文字ベクトル、単語ベクトル、ケプストラム、又は形状情報の少なくとも一つ以上を抽出することを特徴とする、請求項8乃至13のいずれか1項に記載の違法情報検出方法。
- ネットワーク上に公開された情報について検索条件に基づき検索された検索結果情報の中から違法性の高い情報を検出する処理をコンピュータに実行させる違法情報検出プログラムであって、
前記検索結果情報が格納される検索結果情報記憶部と、
前記検索結果情報記憶部に格納された検索結果情報から特徴量を抽出し、当該特徴量と前記検索結果情報とを対応付けて特徴量記憶部へ格納する特徴抽出手段と、
前記特徴量記憶部に格納された複数の特徴量からそれぞれの前記検索結果情報の間の類似度を計算し、当該類似度に基づき前記検索結果情報の間が類似するか否かを判定する類似度計算手段と、
前記類似度計算手段により類似すると判定された検索結果情報の数が所定値を超える場合、当該検索結果情報を違法性の高い情報として検出する違法性検出手段と、を備える違法情報検出プログラム。 - 前記違法情報検出プログラムは、前記検索条件に基づき検索された検索結果情報を取得し、前記検索結果情報記憶部へ格納する検索結果情報格納手段をさらに備える、請求項15に記載の違法情報検出プログラム。
- 前記違法情報検出プログラムは、
前記検索条件が格納される検索条件記憶部と、
前記検索条件を取得し、前記検索条件記憶部へ格納する検索条件格納手段とをさらに備え、
前記特徴抽出手段は、前記検索条件記憶部に格納された検索条件と、当該検索条件に対応する前記検索結果情報記憶部に格納された検索結果情報から特徴量を抽出する、請求項16に記載の違法情報検出プログラム。 - 前記検索結果情報記憶部は、前記検索結果情報の検索回数が前記検索結果情報と対応付けて格納され、
前記違法性検出手段は、前記類似度計算手段により類似すると判定された検索結果情報の内、前記検索回数が所定値を超える検索結果情報の数が所定値を超える場合、当該検索結果情報を違法性の高い情報として検出する、請求項16又は17に記載の違法情報検出プログラム。 - 前記検索結果情報記憶部は、前記検索結果情報の時刻情報が前記検索結果情報と対応付けて格納され、
前記特徴抽出手段は、前記検索結果情報記憶部に格納された所定の時刻情報の範囲の検索結果情報から特徴量を抽出する、請求項16乃至18のいずれか1項に記載の違法情報検出プログラム。 - 前記検索結果情報は、前記ネットワーク上に公開された情報であるコンテンツ、又は当該コンテンツに関する情報であることを特徴とする、請求項15乃至19のいずれか1項に記載の違法情報検出プログラム。
- 前記特徴抽出手段は、前記検索結果情報の特徴量として文字ベクトル、単語ベクトル、ケプストラム、又は形状情報の少なくとも一つ以上を抽出することを特徴とする、請求項15乃至20のいずれか1項に記載の違法情報検出プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008042766A JP5082917B2 (ja) | 2008-02-25 | 2008-02-25 | 違法情報検出装置、違法情報検出方法、及び違法情報検出プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008042766A JP5082917B2 (ja) | 2008-02-25 | 2008-02-25 | 違法情報検出装置、違法情報検出方法、及び違法情報検出プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009199513A true JP2009199513A (ja) | 2009-09-03 |
JP5082917B2 JP5082917B2 (ja) | 2012-11-28 |
Family
ID=41142913
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008042766A Active JP5082917B2 (ja) | 2008-02-25 | 2008-02-25 | 違法情報検出装置、違法情報検出方法、及び違法情報検出プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5082917B2 (ja) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011052526A1 (ja) * | 2009-10-30 | 2011-05-05 | 楽天株式会社 | 特有コンテンツ判定プログラム、特有コンテンツ判定装置、特有コンテンツ判定方法、記録媒体、コンテンツ生成装置及び関連コンテンツ挿入装置 |
JP2011096073A (ja) * | 2009-10-30 | 2011-05-12 | Rakuten Inc | 特有コンテンツ判定装置、特有コンテンツ判定方法、特有コンテンツ判定プログラム及びコンテンツ生成装置 |
JP2011096078A (ja) * | 2009-10-30 | 2011-05-12 | Rakuten Inc | 特有コンテンツ判定装置、特有コンテンツ判定方法、特有コンテンツ判定プログラム及び関連コンテンツ挿入装置 |
JP2013156946A (ja) * | 2012-01-31 | 2013-08-15 | Toppan Printing Co Ltd | コミック画像データ検出装置、コミック画像データ検出プログラム及びコミック画像データ検出方法 |
JP2014238849A (ja) * | 2011-05-31 | 2014-12-18 | スティール、ロバート | 多数の著作権侵害を特定し、印税を収集するシステム |
US9280682B2 (en) | 2011-12-05 | 2016-03-08 | Globalfoundries Inc. | Automated management of private information |
CN105828189A (zh) * | 2015-01-05 | 2016-08-03 | 任子行网络技术股份有限公司 | 一种多维度检测违规音视频节目的方法 |
JP2017068862A (ja) * | 2016-12-06 | 2017-04-06 | 株式会社Jvcケンウッド | 情報処理装置、情報処理方法、及び情報処理プログラム |
US10614134B2 (en) | 2009-10-30 | 2020-04-07 | Rakuten, Inc. | Characteristic content determination device, characteristic content determination method, and recording medium |
CN115767144A (zh) * | 2022-10-26 | 2023-03-07 | 杭州迪普科技股份有限公司 | 目标视频的上传对象确定方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11345239A (ja) * | 1998-06-02 | 1999-12-14 | Nippon Telegr & Teleph Corp <Ntt> | 文書情報抽出方法及び装置及び文書情報抽出プログラムを格納した記憶媒体 |
JP2002334106A (ja) * | 2001-05-11 | 2002-11-22 | Fujitsu Ltd | 話題抽出装置、方法、プログラム及びそのプログラムを記録する記録媒体 |
JP2003030240A (ja) * | 2001-07-13 | 2003-01-31 | Ntt Data Corp | データ検索装置、データ検索方法、及びデータ検索プログラム |
-
2008
- 2008-02-25 JP JP2008042766A patent/JP5082917B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11345239A (ja) * | 1998-06-02 | 1999-12-14 | Nippon Telegr & Teleph Corp <Ntt> | 文書情報抽出方法及び装置及び文書情報抽出プログラムを格納した記憶媒体 |
JP2002334106A (ja) * | 2001-05-11 | 2002-11-22 | Fujitsu Ltd | 話題抽出装置、方法、プログラム及びそのプログラムを記録する記録媒体 |
JP2003030240A (ja) * | 2001-07-13 | 2003-01-31 | Ntt Data Corp | データ検索装置、データ検索方法、及びデータ検索プログラム |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011052526A1 (ja) * | 2009-10-30 | 2011-05-05 | 楽天株式会社 | 特有コンテンツ判定プログラム、特有コンテンツ判定装置、特有コンテンツ判定方法、記録媒体、コンテンツ生成装置及び関連コンテンツ挿入装置 |
JP2011096073A (ja) * | 2009-10-30 | 2011-05-12 | Rakuten Inc | 特有コンテンツ判定装置、特有コンテンツ判定方法、特有コンテンツ判定プログラム及びコンテンツ生成装置 |
JP2011096078A (ja) * | 2009-10-30 | 2011-05-12 | Rakuten Inc | 特有コンテンツ判定装置、特有コンテンツ判定方法、特有コンテンツ判定プログラム及び関連コンテンツ挿入装置 |
US10614134B2 (en) | 2009-10-30 | 2020-04-07 | Rakuten, Inc. | Characteristic content determination device, characteristic content determination method, and recording medium |
JP2014238849A (ja) * | 2011-05-31 | 2014-12-18 | スティール、ロバート | 多数の著作権侵害を特定し、印税を収集するシステム |
US9280682B2 (en) | 2011-12-05 | 2016-03-08 | Globalfoundries Inc. | Automated management of private information |
JP2013156946A (ja) * | 2012-01-31 | 2013-08-15 | Toppan Printing Co Ltd | コミック画像データ検出装置、コミック画像データ検出プログラム及びコミック画像データ検出方法 |
CN105828189A (zh) * | 2015-01-05 | 2016-08-03 | 任子行网络技术股份有限公司 | 一种多维度检测违规音视频节目的方法 |
CN105828189B (zh) * | 2015-01-05 | 2018-10-23 | 任子行网络技术股份有限公司 | 一种多维度检测违规音视频节目的方法 |
JP2017068862A (ja) * | 2016-12-06 | 2017-04-06 | 株式会社Jvcケンウッド | 情報処理装置、情報処理方法、及び情報処理プログラム |
CN115767144A (zh) * | 2022-10-26 | 2023-03-07 | 杭州迪普科技股份有限公司 | 目标视频的上传对象确定方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
JP5082917B2 (ja) | 2012-11-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5082917B2 (ja) | 違法情報検出装置、違法情報検出方法、及び違法情報検出プログラム | |
JP6833302B2 (ja) | 情報認証方法及びシステム | |
WO2021143497A1 (zh) | 一种基于存证区块链的侵权存证方法、装置及设备 | |
US7610382B1 (en) | System and method for marking content | |
Law et al. | Protecting digital data privacy in computer forensic examination | |
CN106101113B (zh) | 一种云计算数据安全标记管理方法及系统 | |
Panchenko et al. | Analysis of fingerprinting techniques for Tor hidden services | |
Taylor et al. | Securank: Starving permission-hungry apps using contextual permission analysis | |
Damshenas et al. | A survey on digital forensics trends | |
US20190377764A1 (en) | Illegal content search system and method thereof | |
US9805216B2 (en) | Privacy compliance event analysis system | |
WO2014103115A1 (ja) | 不正侵入検知装置、不正侵入検知方法、不正侵入検知プログラム及び記録媒体 | |
US20190317968A1 (en) | Method, system and computer program products for recognising, validating and correlating entities in a communications darknet | |
CN112019519B (zh) | 网络安全情报威胁度的检测方法、装置和电子装置 | |
WO2010024184A1 (ja) | 風評情報検出システム、風評情報検出方法及びプログラム | |
JP3762935B1 (ja) | 情報処理装置,ファイル管理システムおよびファイル管理プログラム | |
Nieto et al. | Privacy-aware digital forensics. | |
KR20080039324A (ko) | 디지털 저작권 관리를 위한 워터마크 추적 시스템 | |
Fu et al. | Data correlation‐based analysis methods for automatic memory forensic | |
WO2022221037A1 (en) | Predictive response-generation systems to facilitate timely compliance with information-disclosure laws | |
JP2014026651A5 (ja) | ||
CN111382394B (zh) | 一种图片的侵权监控方法及装置 | |
CN110020134A (zh) | 一种知识服务信息的推送方法、系统、存储介质和处理器 | |
JP4807364B2 (ja) | 情報管理装置 | |
Horsman | Web content management systems: An analysis of forensic investigatory challenges |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110107 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120719 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120807 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120820 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5082917 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150914 Year of fee payment: 3 |