JP2011154557A - 有害文書判定方法及び装置 - Google Patents
有害文書判定方法及び装置 Download PDFInfo
- Publication number
- JP2011154557A JP2011154557A JP2010015961A JP2010015961A JP2011154557A JP 2011154557 A JP2011154557 A JP 2011154557A JP 2010015961 A JP2010015961 A JP 2010015961A JP 2010015961 A JP2010015961 A JP 2010015961A JP 2011154557 A JP2011154557 A JP 2011154557A
- Authority
- JP
- Japan
- Prior art keywords
- harmful
- document
- url
- determination
- registered
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 76
- 230000004044 response Effects 0.000 claims abstract description 12
- 231100001261 hazardous Toxicity 0.000 claims description 5
- 238000004891 communication Methods 0.000 description 8
- 238000001914 filtration Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000010923 batch production Methods 0.000 description 2
- 206010010144 Completed suicide Diseases 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Abstract
【解決手段】有害文書判定装置1は、文書を解析して文書が有害であるか否かを判定する文書有害判定手段13と、文書にURLが記載されている場合にURLが有害URLデータベースに登録されていることを条件に、文書有害判定手段13において有害ではないと判定した場合においても、文書が有害であると判定する有害URL判定手段15と、URLが登録されていないと判定したことに応じて判定したURLが示す文書について有害であるか否かをさらに判定し、URLが示す文書が有害である場合に文書が有害であると判定する総合判定手段18とを備える。
【選択図】図1
Description
[有害文書判定システム100の全体構成及び有害文書判定装置1の機能構成]
図1は、第1実施形態に係る有害文書判定システム100の全体構成及び有害文書判定装置1の機能構成を示す図である。図2は、第1実施形態に係るWebページ40及び電子メール本文45の例を示す図である。図3は、第1実施形態に係る有害URLDB31の例を示す図である。
次に、有害文書判定装置1での処理について説明する。図4は、第1実施形態に係る有害文書判定装置1のメイン処理のフローチャートである。
次に、本発明を適用した第2実施形態について説明する。第2実施形態は、オンライン処理とバッチ処理とに分けて、即時に行える簡易な判定をオンライン処理で行うことでユーザ端末に即時に結果を送信し、URLが示すWebページを取得して判定を行う処理をバッチ処理にて行うものである。なお、以下の説明及び図面において、上述した第1実施形態と同様の機能を果たす部分には、同一の符号又は末尾に同一の符号を付して、重複する説明を適宜省略する。
図5は、第2実施形態に係る有害文書判定システム200の全体構成及び有害文書判定装置201の機能構成を示す図である。
次に、有害文書判定装置201での処理について説明する。図6は、第2実施形態に係る有害文書判定装置201のオンライン処理のフローチャートである。図7は、第2実施形態に係る有害文書判定装置201のバッチ処理のフローチャートである。図8は、第2実施形態に係る有害文書判定装置201の他のバッチ処理のフローチャートである。
各実施形態は、有害文書判定システムとして、ユーザ端末から有害文書判定装置が直接データの送受信を行うものとして説明したが、これに限らない。例えば、ユーザ端末と有害文書判定装置との間に投稿サーバを設け、投稿サーバが、ユーザ端末と有害文書判定装置との間で処理を行ってもよい。
4 ユーザ端末
10,210 制御部
11 文書受付手段
13 文書有害判定手段
15 有害URL判定手段
17 再帰実行手段
18,218 有害判定手段
23,223 有害URL登録手段
27 判定結果出力手段
30,230 記憶部
31 有害URLDB
32 有害キーワードDB
100,200 有害文書判定システム
221 クロール先登録手段
222 クロール手段
233 クロール先リスト
Claims (8)
- コンピュータによって文書が有害であるか否かを判定する有害文書判定方法であって、
コンピュータが、前記文書を解析して前記文書が有害であるか否かを判定する文書有害判定ステップと、
コンピュータが、前記文書にURLが記載されている場合に、前記URLが有害URLデータベースに登録されていることを条件に、前記文書有害判定ステップにおいて有害ではないと判定した場合においても、前記文書が有害であると判定する有害URL判定ステップと、
コンピュータが、前記有害URL判定ステップにより前記URLが登録されていないと判定したことに応じて、判定した前記URLが示す文書について有害であるか否かをさらに判定し、前記URLが示す文書が有害である場合に、前記文書が有害であると判定する総合判定ステップと、
を含む、
有害文書判定方法。 - コンピュータによって文書が有害であるか否かを判定する有害文書判定方法であって、
文書有害判定ステップと、有害URL判定ステップと、再帰実行ステップと、総合判定ステップとを含み、
前記文書有害判定ステップにおいて、前記コンピュータが、前記文書を解析し、前記文書が有害であるか否かを判定し、
前記有害URL判定ステップにおいて、前記コンピュータが、前記文書にURLが記載されている場合に、前記URLが有害URLデータベースに登録されていることを条件に前記文書が有害であると判定し、
前記再帰実行ステップにおいて、前記コンピュータが、前記有害URL判定ステップにおいて前記文書が有害ではないと判定した場合に、前記有害URL判定ステップが判定した前記URLが示す文書を前記有害文書判定方法の処理対象の文書として、前記有害文書判定方法に含まれる全てのステップを再帰的に実行し、
前記総合判定ステップにおいて、前記コンピュータが、前記文書有害判定ステップ若しくは前記有害URL判定ステップ又は前記再帰実行ステップにおいて実行した前記総合判定ステップにおいて対象文書を有害であると判定した場合に、前記文書を有害であると判定する、
有害文書判定方法。 - 前記コンピュータが、前記総合判定ステップにおいて有害であると判定した前記URLが示す文書又は前記対象文書がWebページである場合に、そのWebページのURLを前記有害URLデータベースに登録する有害URL登録ステップを含む、
請求項1又は請求項2に記載の有害文書判定方法。 - 前記コンピュータが、判定の対象となる文書を受け付ける文書受付ステップと、
前記コンピュータが、前記総合判定ステップによる判定結果を出力する判定結果出力ステップと、
をさらに含む、
請求項1から請求項3までのいずれかに記載の有害文書判定方法。 - 前記総合判定ステップは、
前記有害URL判定ステップにより前記URLが登録されていないと判定したことに応じて、前記URLをクロール先リストに登録し、
登録された前記クロール先リストの前記URLを読み出して、読み出した前記URLが示す文書を取得し、
取得した前記文書がURLを含み、そのURLが前記有害URLデータベースに含まれておらず、かつ、前記URLが示す文書が有害か否かをさらに判定し、前記URLが示す文書が有害である場合に、取得した前記文書のURLを前記有害URLデータベースに登録する、
請求項1に記載の有害文書判定方法。 - 文書が有害であるか否かを判定する有害文書判定装置であって、
前記文書を解析して前記文書が有害であるか否かを判定する文書有害判定手段と、
前記文書にURLが記載されている場合に、前記URLが有害URLデータベースに登録されていることを条件に、前記文書有害判定手段において有害ではないと判定した場合においても、前記文書が有害であると判定する有害URL判定手段と、
前記有害URL判定手段により前記URLが登録されていないと判定したことに応じて、判定した前記URLが示す文書について有害であるか否かをさらに判定し、前記URLが示す文書が有害である場合に、前記文書が有害であると判定する総合判定手段と、
を備える、
有害文書判定装置。 - 文書が有害であるか否かを判定する有害文書判定装置であって、
文書有害判定手段と、有害URL判定手段と、再帰実行手段と、総合判定手段とを備え、
前記文書有害判定手段は、前記文書を解析し、前記文書が有害であるか否かを判定し、
前記有害URL判定手段は、前記文書にURLが記載されている場合に、前記URLが有害URLデータベースに登録されていることを条件に前記文書が有害であると判定し、
前記再帰実行手段は、前記有害URL判定手段により前記文書が有害ではないと判定した場合に、前記有害URL判定手段が判定した前記URLが示す文書を前記有害文書判定装置による処理対象の文書として、前記有害文書判定装置が備える全ての手段を再帰的に実行し、
前記総合判定手段は、前記文書有害判定手段若しくは前記有害URL判定手段又は前記再帰実行手段により実行した前記総合判定手段により対象文書を有害であると判定した場合に、前記文書を有害であると判定する、
有害文書判定装置。 - 前記総合判定手段は、
前記有害URL判定手段により前記URLが登録されていないと判定したことに応じて、前記URLをクロール先リストに登録するクロール先登録手段と、
前記クロール先登録手段により登録された前記クロール先リストの前記URLを読み出して、読み出した前記URLが示す文書を取得するクロール手段と、
前記クロール手段により取得した前記文書がURLを含み、そのURLが前記有害URLデータベースに含まれておらず、かつ、前記URLが示す文書が有害か否かをさらに判定し、前記URLが示す文書が有害である場合に、取得した前記文書のURLを前記有害URLデータベースに登録する有害URL登録手段と、
を有する、
請求項6に記載の有害文書判定装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010015961A JP5165704B2 (ja) | 2010-01-27 | 2010-01-27 | 有害文書判定方法、有害文書判定装置および有害文書判定プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010015961A JP5165704B2 (ja) | 2010-01-27 | 2010-01-27 | 有害文書判定方法、有害文書判定装置および有害文書判定プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011154557A true JP2011154557A (ja) | 2011-08-11 |
JP5165704B2 JP5165704B2 (ja) | 2013-03-21 |
Family
ID=44540464
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010015961A Active JP5165704B2 (ja) | 2010-01-27 | 2010-01-27 | 有害文書判定方法、有害文書判定装置および有害文書判定プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5165704B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014002447A (ja) * | 2012-06-15 | 2014-01-09 | Nippon Telegraph & Telephone West Corp | 通信装置及びurl評価システム |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002014991A (ja) * | 2000-06-28 | 2002-01-18 | Hitachi Ltd | ネットワーク上の情報フィルタリング装置 |
JP2005056048A (ja) * | 2003-08-01 | 2005-03-03 | Fact-Real:Kk | 電子メール監視システム、電子メール監視プログラム及び電子メール監視方法 |
JP2005327016A (ja) * | 2004-05-13 | 2005-11-24 | Matsushita Electric Ind Co Ltd | セキュリティ情報提供システム |
JP2008250597A (ja) * | 2007-03-30 | 2008-10-16 | Kddi Corp | コンピュータシステム |
JP2009289245A (ja) * | 2008-05-27 | 2009-12-10 | Yahoo Japan Corp | メッセージ判定装置、方法及びプログラム |
-
2010
- 2010-01-27 JP JP2010015961A patent/JP5165704B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002014991A (ja) * | 2000-06-28 | 2002-01-18 | Hitachi Ltd | ネットワーク上の情報フィルタリング装置 |
JP2005056048A (ja) * | 2003-08-01 | 2005-03-03 | Fact-Real:Kk | 電子メール監視システム、電子メール監視プログラム及び電子メール監視方法 |
JP2005327016A (ja) * | 2004-05-13 | 2005-11-24 | Matsushita Electric Ind Co Ltd | セキュリティ情報提供システム |
JP2008250597A (ja) * | 2007-03-30 | 2008-10-16 | Kddi Corp | コンピュータシステム |
JP2009289245A (ja) * | 2008-05-27 | 2009-12-10 | Yahoo Japan Corp | メッセージ判定装置、方法及びプログラム |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014002447A (ja) * | 2012-06-15 | 2014-01-09 | Nippon Telegraph & Telephone West Corp | 通信装置及びurl評価システム |
Also Published As
Publication number | Publication date |
---|---|
JP5165704B2 (ja) | 2013-03-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20080086555A1 (en) | System and Method for Search and Web Spam Filtering | |
WO2008062552A1 (fr) | Dispositif d'affichage d'informations, programme d'affichage d'informations, et système d'affichage d'informations | |
US10242033B2 (en) | Extrapolative search techniques | |
US20120254233A1 (en) | Information processing system, information processor, and computer program product | |
JP2008262506A (ja) | 情報抽出システム、情報抽出方法および情報抽出用プログラム | |
US20110072045A1 (en) | Creating Vertical Search Engines for Individual Search Queries | |
JP5179564B2 (ja) | クエリセグメント位置決定装置 | |
KR101377385B1 (ko) | 정보 처리 장치 | |
JP5165704B2 (ja) | 有害文書判定方法、有害文書判定装置および有害文書判定プログラム | |
JP2006243861A (ja) | 履歴作成装置、活動履歴作成方法、及び活動履歴作成プログラム | |
JP4885678B2 (ja) | コンテンツ作成装置及びコンテンツ作成方法 | |
CN110825976B (zh) | 网站页面的检测方法、装置、电子设备及介质 | |
JP2006155275A (ja) | 情報抽出方法及び情報抽出装置 | |
JP5084859B2 (ja) | 情報処理装置、データ抽出方法、及びプログラム | |
JP6749865B2 (ja) | 情報収集装置、および、情報収集方法 | |
JP2007241635A (ja) | 文書検索装置、情報処理装置、検索結果出力方法、検索結果表示方法およびプログラム | |
JP2008250893A (ja) | 情報検索装置、情報検索方法およびそのプログラム | |
JP2007148630A (ja) | 特許分析装置、特許分析システム、特許分析方法およびプログラム | |
JP2014089692A (ja) | 情報提供サーバ | |
US20160373554A1 (en) | Computer-readable recording medium, web access method, and web access device | |
JP5108707B2 (ja) | 検索サーバ装置、検索方法及びプログラム | |
JP2008171110A (ja) | サイト検索システム、検索サーバ、プログラム | |
JP5324500B2 (ja) | ファイル共有装置 | |
JP2011086273A (ja) | 情報伝播経路特定装置、情報伝播経路特定方法、情報伝播経路特定プログラム | |
JP2010086422A (ja) | 検索サーバ、方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20120312 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120816 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120821 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121022 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20121022 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121127 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121219 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151228 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5165704 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |