JP2005070961A - Webパトロールシステム、Webパトロール方法、Webパトロール用プログラム、及び、Webパトロール用記録媒体 - Google Patents
Webパトロールシステム、Webパトロール方法、Webパトロール用プログラム、及び、Webパトロール用記録媒体 Download PDFInfo
- Publication number
- JP2005070961A JP2005070961A JP2003297607A JP2003297607A JP2005070961A JP 2005070961 A JP2005070961 A JP 2005070961A JP 2003297607 A JP2003297607 A JP 2003297607A JP 2003297607 A JP2003297607 A JP 2003297607A JP 2005070961 A JP2005070961 A JP 2005070961A
- Authority
- JP
- Japan
- Prior art keywords
- web page
- web
- damage expectation
- damage
- expectation degree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】視聴率サーバ3から取得した視聴率データの視聴数nと誹謗中傷表現が発見されずに放置されていた時間tとの積から成る被害期待度という概念を新たに定義し、この動的に変化する被害期待度を利用して、被害期待度の高いWebページから優先的に検査する。
【選択図】 図5
Description
eWatch, http://www.ewatch.com/ NET iScope, httρ://www.daj.co.jp/bs/iscope/index.htm BBWatcher:「電子掲示板監視システム」,特開2002−27904号公報 サイバーコップス:「電子掲示板システム」,特許第2951307号 google, http://www.goog1e.com/ 松本勉:「素朴な疑問」インターネットの「視聴率」って計れないの?,情報処理学会誌,Vol.40 No03,1999
(2)網羅性の高い検査
(3)精度の高い検査
次に、これら(1)から(3)について説明する。
(1)被害期待度の低い検査の説明
Webは、i)利用者数の多さ及びii)容易にアクセス、コピー、参照可能であるという利便性の高さの2つの特徴のために、情報伝達が非常に早い。そこで、不適切な表現がなされた場合には、これをすばやく発見し、被害を最小限にとどめることが重要である。被害の拡大度合いを測る指標が被害期待度である。この「被害期待度」は、本発明者達が定義した概念であって、〔数式1〕に示すように、不適切な表現がなされた時から、発見されるまでに放置された時間(t)とその間に同Webページを閲覧した視聴数(n)の積で定義される。
(被害期待度)=放置時間(t)×視聴数(n)
多くの人に情報が伝播することによって被害が拡大するため、被害期待度は低いほうが優れている。
「網羅性」とは、この分野の一般用語(技術用語)であって、〔数式2〕に示すように、発見したWebページが、どの程度、不適切な嫌疑を受けるWebページを網羅しているかを示す指標である。例えば、ハイパーリンク先を次々にアクセスしていくと、不適切な嫌疑を受けるWebページが増えていくため、網羅性が増える。
Nall:すべての誹謗中傷の嫌疑があるWebページ数
尚、Nallは、嫌疑があるWebページのすべてを示しており、実際には完全な値を導き出せるのは困難であるため、予測も含めた値である。
「精度」とは、この分野の一般用語(技術用語)であって、〔数式3〕に示すように、被害者(ユーザ)にレポートされたWebページの中で、不適切な嫌疑を受けるページを含んでいる率である。
尚、一般に多くのWebページを調査すれば網羅性は向上するが、それだけ処理時間(t)が掛かるため、被害期待度が低下する。つまり、被害期待度と網羅性は、トレードオフの関係になる。
前記Webパトロールシステムが、視聴数と不適切な表現が発見されずに放置されていた時間との積から成る被害期待度をWebページ毎に累積的に記憶可能な被害期待度累積記憶手段を有する状態において、
前記Webパトロールシステムは、
検査対象となる各Webページの一定期間における視聴数を示した視聴率データを取得する視聴率データ取得ステップと、前記視聴率データ取得ステップによって取得した視聴数と不適切な表現が発見されずに放置されていた時間との積から成る被害期待度を、Webページ毎に算出する被害期待度算出ステップと、前記被害期待度算出ステップによって算出した被害期待度を、Webページを特定するための特定情報と関連付けて前記被害期待度累積記憶手段へ累積的に記録する被害期待度記録ステップと、前記被害期待度累積記憶手段で記憶している被害期待度の累積値が最大となっているWebページに係る特定情報を選出する選出ステップと、前記選出ステップによって選出したWebページの特定情報に基づいて、当該Webページのデータを取得するWebページデータ取得ステップと、前記Webページデータ取得ステップによって取得したWebページデータ内の不適切な表現を検査する表現検査ステップと、前記表現検査ステップによって検査したWebページデータに係る被害期待度の累積値を零にする累積値零ステップと、前記累積値零ステップによって累積値を零にした後に、前記被害期待度記録ステップによって再び前記被害期待度累積記憶手段に累積的に記録するための被害期待度をWebページ毎に再び算出する被害期待度再算出ステップと、を実行可能であることを有することを特徴とするWebパトロール方法である。
また、視聴率データ取得モジュール21は、Web視聴率を調査する機関の視聴率サーバ3から通信ネットワーク等を介して、図2に示すような検査対象となる各Webページの一定期間(T)における視聴率を示した視聴率データを取得する機能を有し、後述のステップS1を実行する。
具体的には、両者の同じキーワードの重みの内積計算を行って、Webページ文書ベクトルが典型注意文書ベクトルに近いかを判断する。典型注意文書ベクトルが最大であるため、この最大値に近ければ誹謗中傷の度合いが高いということになる。
2 Web
3 視聴率サーバ
10 収集モジュール
11 Webページデータ収集モジュール
12 収集ルール記憶部
13 客体識別語辞書DB
14 キャッシュ
15 検査コントローラ
20 ランキングモジュール
21 視聴率データ取得モジュール
22 被害期待度累積記憶部
23 マッチングモジュール
24 (誹謗)中傷語辞書DB
30 GUI
Claims (4)
- 検査対象となるWebページ内の不適切な表現を検査することで、不適切な表現が掲載されたWebページの調査を行うWebパトロールシステムであって、
検査対象となる各Webページの一定期間における視聴数を示した視聴率データを取得する視聴率データ取得手段と、
前記視聴率データ取得手段によって取得した視聴数と不適切な表現が発見されずに放置されていた時間との積から成る被害期待度を、Webページ毎に算出する被害期待度算出手段と、
前記被害期待度算出手段によって算出した被害期待度をWebページ毎に累積的に記憶可能な被害期待度累積記憶手段と、
前記被害期待度算出手段によって算出した被害期待度を、Webページを特定するための特定情報と関連付けて前記被害期待度累積記憶手段へ累積的に記録する被害期待度記録手段と、
前記被害期待度累積記憶手段で記憶している被害期待度の累積値が最大となっているWebページに係る特定情報を選出する選出手段と、
前記選出手段によって選出したWebページの特定情報に基づいて、当該Webページのデータを取得するWebページデータ取得手段と、
前記Webページデータ取得手段によって取得したWebページデータ内の不適切な表現を検査する表現検査手段と、
前記表現検査手段によって検査したWebページデータに係る被害期待度の累積値を零にする累積値零手段と、
前記累積値零手段によって累積値を零にした後に、前記被害期待度記録手段によって再び前記被害期待度累積記憶手段に累積的に記録するための被害期待度をWebページ毎に再び算出する被害期待度再算出手段と、
を有することを特徴とするWebパトロールシステム。 - 検査対象となるWebページ内の不適切な表現を検査することで、不適切な表現が掲載されたWebページの調査を行うWebパトロールシステムを利用したWebパトロール方法であって、
前記Webパトロールシステムが、視聴数と不適切な表現が発見されずに放置されていた時間との積から成る被害期待度をWebページ毎に累積的に記憶可能な被害期待度累積記憶手段を有する状態において、
前記Webパトロールシステムは、
検査対象となる各Webページの一定期間における視聴数を示した視聴率データを取得する視聴率データ取得ステップと、
前記視聴率データ取得ステップによって取得した視聴数と不適切な表現が発見されずに放置されていた時間との積から成る被害期待度を、Webページ毎に算出する被害期待度算出ステップと、
前記被害期待度算出ステップによって算出した被害期待度を、Webページを特定するための特定情報と関連つけて前記被害期待度累積記憶手段へ累積的に記録する被害期待度記録ステップと、
前記被害期待度累積記憶手段で記憶している被害期待度の累積値が最大となっているWebページに係る特定情報を選出する選出ステップと、
前記選出ステップによって選出したWebページの特定情報に基づいて、当該Webページのデータを取得するWebページデータ取得ステップと、
前記Webページデータ取得ステップによって取得したWebページデータ内の不適切な表現を検査する表現検査ステップと、
前記表現検査ステップによって検査したWebページデータに係る被害期待度の累積値を零にする累積値零ステップと、
前記累積値零ステップによって累積値を零にした後に、前記被害期待度記録ステップによって再び前記被害期待度累積記憶手段に累積的に記録するための被害期待度をWebページ毎に再び算出する被害期待度再算出ステップと、
を実行可能であることを有することを特徴とするWebパトロール方法。 - 請求項2に記載のWebパトロールシステムに、前記被害期待度累積記憶手段を構築させると共に、上記各ステップを実行可能にすることを特徴としたWebパトロール用プログラム。
- 請求項3に記載のWebパトロール用プログラムを記録したことを特徴とした、コンピュータ読み取り可能な移動案内用記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003297607A JP2005070961A (ja) | 2003-08-21 | 2003-08-21 | Webパトロールシステム、Webパトロール方法、Webパトロール用プログラム、及び、Webパトロール用記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003297607A JP2005070961A (ja) | 2003-08-21 | 2003-08-21 | Webパトロールシステム、Webパトロール方法、Webパトロール用プログラム、及び、Webパトロール用記録媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005070961A true JP2005070961A (ja) | 2005-03-17 |
Family
ID=34403406
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003297607A Pending JP2005070961A (ja) | 2003-08-21 | 2003-08-21 | Webパトロールシステム、Webパトロール方法、Webパトロール用プログラム、及び、Webパトロール用記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005070961A (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011227884A (ja) * | 2010-03-31 | 2011-11-10 | Broadband Security Inc | ファイルのアップロード遮断システム及びファイルのアップロード遮断方法 |
JP2011248500A (ja) * | 2010-05-25 | 2011-12-08 | Kddi R & D Laboratories Inc | Webページ収集装置、方法及びプログラム |
JP5543679B1 (ja) * | 2014-02-03 | 2014-07-09 | 株式会社 ディー・エヌ・エー | ゲーム内図形認識システム及びゲーム内図形認識プログラム |
JP2015103210A (ja) * | 2013-11-28 | 2015-06-04 | 国立大学法人北見工業大学 | インターネット上の有害書き込み検出装置及び検出方法 |
WO2022219792A1 (ja) * | 2021-04-15 | 2022-10-20 | 日本電信電話株式会社 | 収集装置、収集方法、および、収集プログラム |
-
2003
- 2003-08-21 JP JP2003297607A patent/JP2005070961A/ja active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011227884A (ja) * | 2010-03-31 | 2011-11-10 | Broadband Security Inc | ファイルのアップロード遮断システム及びファイルのアップロード遮断方法 |
JP2011248500A (ja) * | 2010-05-25 | 2011-12-08 | Kddi R & D Laboratories Inc | Webページ収集装置、方法及びプログラム |
JP2015103210A (ja) * | 2013-11-28 | 2015-06-04 | 国立大学法人北見工業大学 | インターネット上の有害書き込み検出装置及び検出方法 |
JP5543679B1 (ja) * | 2014-02-03 | 2014-07-09 | 株式会社 ディー・エヌ・エー | ゲーム内図形認識システム及びゲーム内図形認識プログラム |
WO2022219792A1 (ja) * | 2021-04-15 | 2022-10-20 | 日本電信電話株式会社 | 収集装置、収集方法、および、収集プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11134094B2 (en) | Detection of potential security threats in machine data based on pattern detection | |
US9253268B2 (en) | Providing customized information to a user based on identifying a trend | |
JP6321681B2 (ja) | ウェブサイトユーザを識別する方法および装置 | |
US11748488B2 (en) | Information security risk management | |
JP2009528639A (ja) | ソーシャルメディアにおける会話を分析するためのソーシャル分析システムおよび方法 | |
US20180191765A1 (en) | Method and apparatus for calculating risk of cyber attack | |
JP6823265B2 (ja) | 分析装置、分析システム、分析方法および分析プログラム | |
US11671435B2 (en) | Process for automated investigation of flagged users based upon previously collected data and automated observation on a go-forward basis | |
US20230328080A1 (en) | Systems and methods of malware detection | |
US20120331128A1 (en) | Method and a system for analysing impact of changes to content of a website | |
KR101959213B1 (ko) | 침해 사고 예측 방법 및 그 장치 | |
JP2005070961A (ja) | Webパトロールシステム、Webパトロール方法、Webパトロール用プログラム、及び、Webパトロール用記録媒体 | |
JP2020072384A (ja) | サイバー攻撃評価プログラム、サイバー攻撃評価方法および情報処理装置 | |
KR101648349B1 (ko) | 웹사이트 위험도 산출 장치 및 그 방법 | |
US10050922B2 (en) | Server and method for processing email messages | |
JP4952309B2 (ja) | 負荷分析システム、方法、及び、プログラム | |
Simpson et al. | Scalable misinformation mitigation in social networks using reverse sampling | |
Mulholland et al. | A comparison of attribute-focused and harm-focused methods for assessing the risk of organized crime groups: Are they in agreement? | |
Arroyo-Machado et al. | Stranger things: the vanishing of the Altmetric Attention Score values in information and library science | |
JP2006079233A (ja) | 個人情報漏洩監視システム、個人情報漏洩監視方法、個人情報漏洩監視プログラムおよびそのプログラムを記録した記録媒体 | |
JP2012252586A (ja) | 文書データ管理装置、文書データ継承方法およびプログラム | |
Kooij | A Study on the Evolution of the Dutch Web | |
CN115733701A (zh) | 威胁情报源的采集方法、装置、电子设备及存储介质 | |
CN115801655A (zh) | 基于信誉评估的域间路由选择方法及相关设备 | |
JP2014002483A (ja) | アクセス履歴記憶及び検索装置及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050728 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070928 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071009 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071205 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080108 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080305 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080401 |