JP5165704B2 - 有害文書判定方法、有害文書判定装置および有害文書判定プログラム - Google Patents
有害文書判定方法、有害文書判定装置および有害文書判定プログラム Download PDFInfo
- Publication number
- JP5165704B2 JP5165704B2 JP2010015961A JP2010015961A JP5165704B2 JP 5165704 B2 JP5165704 B2 JP 5165704B2 JP 2010015961 A JP2010015961 A JP 2010015961A JP 2010015961 A JP2010015961 A JP 2010015961A JP 5165704 B2 JP5165704 B2 JP 5165704B2
- Authority
- JP
- Japan
- Prior art keywords
- harmful
- document
- url
- determination
- determined
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 72
- 231100001261 hazardous Toxicity 0.000 title description 2
- 230000004044 response Effects 0.000 claims description 10
- 230000002411 adverse Effects 0.000 claims description 2
- 238000004891 communication Methods 0.000 description 8
- 238000001914 filtration Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000010923 batch production Methods 0.000 description 2
- 206010010144 Completed suicide Diseases 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
[有害文書判定システム100の全体構成及び有害文書判定装置1の機能構成]
図1は、第1実施形態に係る有害文書判定システム100の全体構成及び有害文書判定装置1の機能構成を示す図である。図2は、第1実施形態に係るWebページ40及び電子メール本文45の例を示す図である。図3は、第1実施形態に係る有害URLDB31の例を示す図である。
次に、有害文書判定装置1での処理について説明する。図4は、第1実施形態に係る有害文書判定装置1のメイン処理のフローチャートである。
次に、本発明を適用した第2実施形態について説明する。第2実施形態は、オンライン処理とバッチ処理とに分けて、即時に行える簡易な判定をオンライン処理で行うことでユーザ端末に即時に結果を送信し、URLが示すWebページを取得して判定を行う処理をバッチ処理にて行うものである。なお、以下の説明及び図面において、上述した第1実施形態と同様の機能を果たす部分には、同一の符号又は末尾に同一の符号を付して、重複する説明を適宜省略する。
図5は、第2実施形態に係る有害文書判定システム200の全体構成及び有害文書判定装置201の機能構成を示す図である。
次に、有害文書判定装置201での処理について説明する。図6は、第2実施形態に係る有害文書判定装置201のオンライン処理のフローチャートである。図7は、第2実施形態に係る有害文書判定装置201のバッチ処理のフローチャートである。図8は、第2実施形態に係る有害文書判定装置201の他のバッチ処理のフローチャートである。
各実施形態は、有害文書判定システムとして、ユーザ端末から有害文書判定装置が直接データの送受信を行うものとして説明したが、これに限らない。例えば、ユーザ端末と有害文書判定装置との間に投稿サーバを設け、投稿サーバが、ユーザ端末と有害文書判定装置との間で処理を行ってもよい。
4 ユーザ端末
10,210 制御部
11 文書受付手段
13 文書有害判定手段
15 有害URL判定手段
17 再帰実行手段
18,218 有害判定手段
23,223 有害URL登録手段
27 判定結果出力手段
30,230 記憶部
31 有害URLDB
32 有害キーワードDB
100,200 有害文書判定システム
221 クロール先登録手段
222 クロール手段
233 クロール先リスト
Claims (6)
- コンピュータによって文書が有害であるか否かを判定する有害文書判定方法であって、
文書有害判定ステップと、有害URL判定ステップと、再帰実行ステップと、総合判定ステップとを含み、
前記文書有害判定ステップにおいて、前記コンピュータが、前記文書を解析し、前記文書が有害であるか否かを判定し、
前記有害URL判定ステップにおいて、前記コンピュータが、前記文書にURLが記載されている場合に、前記URLが有害URLデータベースに登録されていることを条件に前記文書が有害であると判定し、
前記再帰実行ステップにおいて、前記コンピュータが、前記有害URL判定ステップにおいて前記文書が有害ではないと判定した場合に、前記有害URL判定ステップが判定した前記URLが示す文書を前記有害文書判定方法の処理対象の文書として、前記有害文書判定方法に含まれる全てのステップを再帰的に実行し、
前記総合判定ステップにおいて、前記コンピュータが、前記文書有害判定ステップ若しくは前記有害URL判定ステップ又は前記再帰実行ステップにおいて実行した前記総合判定ステップにおいて対象文書を有害であると判定した場合に、前記文書を有害であると判定し、
前記コンピュータが、前記総合判定ステップにおいて有害であると判定した前記URLが示す文書又は前記対象文書がWebページである場合に、そのWebページのURLを前記有害URLデータベースに登録する有害URL登録ステップを含み、
この有害URL登録ステップは、前記再帰実行ステップにおける最後の再帰的な実行において、前記URLが示す文書又はWebページが有害であると判定された場合、この有害と判定された前記文書又はWebページを示すURLを前記有害URLデータベースに登録すると共に、前記最後の再帰的な実行において有害と判定するまでに既に有害であるか否かを判定した文書又はWebページを示すURLの全てを前記有害URLデータベースに登録する
ことを特徴とする有害文書判定方法。 - 前記コンピュータが、判定の対象となる文書を受け付ける文書受付ステップと、
前記コンピュータが、前記総合判定ステップによる判定結果を出力する判定結果出力ステップと、
をさらに含む、
請求項1記載の有害文書判定方法。 - 前記総合判定ステップは、
前記有害URL判定ステップにより前記URLが登録されていないと判定したことに応じて、前記URLをクロール先リストに登録し、
登録された前記クロール先リストの前記URLを読み出して、読み出した前記URLが示す文書を取得し、
取得した前記文書がURLを含み、そのURLが前記有害URLデータベースに含まれておらず、かつ、前記URLが示す文書が有害か否かをさらに判定し、前記URLが示す文書が有害である場合に、取得した前記文書のURLを前記有害URLデータベースに登録する、
請求項1に記載の有害文書判定方法。 - 文書が有害であるか否かを判定する有害文書判定装置であって、
文書有害判定手段と、有害URL判定手段と、再帰実行手段と、総合判定手段とを備え、
前記文書有害判定手段は、前記文書を解析し、前記文書が有害であるか否かを判定し、
前記有害URL判定手段は、前記文書にURLが記載されている場合に、前記URLが 有害URLデータベースに登録されていることを条件に前記文書が有害であると判定し、
前記再帰実行手段は、前記有害URL判定手段により前記文書が有害ではないと判定した場合に、前記有害URL判定手段が判定した前記URLが示す文書を前記有害文書判定装置による処理対象の文書として、前記有害文書判定装置が備える全ての手段を再帰的に実行し、
前記総合判定手段は、前記文書有害判定手段若しくは前記有害URL判定手段又は前記再帰実行手段により実行した前記総合判定手段により対象文書を有害であると判定した場合に、前記文書を有害であると判定し、
前記総合手段において有害であると判定した前記URLが示す文書又は前記対象文書がWebページである場合に、そのWebページのURLを前記有害URLデータベースに登録する有害URL登録手段をさらに含み、
この有害URL登録手段は、前記再帰実行手段における最後の再帰的な実行において、前記URLが示す文書又はWebページが有害であると判定された場合、この有害と判定された前記文書又はWebページを示すURLを前記有害URLデータベースに登録すると共に、前記最後の再帰的な実行において有害と判定するまでに既に有害であるか否かを判定した文書又はWebページを示すURLの全てを前記有害URLデータベースに登録する
ことを特徴とする有害文書判定装置。 - 前記総合判定手段は、
前記有害URL判定手段により前記URLが登録されていないと判定したことに応じて、前記URLをクロール先リストに登録するクロール先登録手段と、
前記クロール先登録手段により登録された前記クロール先リストの前記URLを読み出して、読み出した前記URLが示す文書を取得するクロール手段と、
前記クロール手段により取得した前記文書がURLを含み、そのURLが前記有害URLデータベースに含まれておらず、かつ、前記URLが示す文書が有害か否かをさらに判定し、前記URLが示す文書が有害である場合に、取得した前記文書のURLを前記有害URLデータベースに登録する有害URL登録手段と、
を有する、
請求項4に記載の有害文書判定装置。 - コンピュータを、文書有害判定手段と、有害URL判定手段と、再帰実行手段と、総合判定手段として機能させることにより、文書が有害であるか否かを判定する有害文書判定プログラムであって、
前記文書有害判定手段は、前記文書を解析し、前記文書が有害であるか否かを判定し、
前記有害URL判定手段は、前記文書にURLが記載されている場合に、前記URLが 有害URLデータベースに登録されていることを条件に前記文書が有害であると判定し、
前記再帰実行手段は、前記有害URL判定手段により前記文書が有害ではないと判定した場合に、前記有害URL判定手段が判定した前記URLが示す文書を前記有害文書判定装置による処理対象の文書として、前記有害文書判定装置が備える全ての手段を再帰的に実行し、
前記総合判定手段は、前記文書有害判定手段若しくは前記有害URL判定手段又は前記再帰実行手段により実行した前記総合判定手段により対象文書を有害であると判定した場合に、前記文書を有害であると判定し、
前記総合手段において有害であると判定した前記URLが示す文書又は前記対象文書がWebページである場合に、そのWebページのURLを前記有害URLデータベースに登録する有害URL登録手段をさらに含み、
この有害URL登録手段は、前記再帰実行手段における最後の再帰的な実行において、前記URLが示す文書又はWebページが有害であると判定された場合、この有害と判定された前記文書又はWebページを示すURLを前記有害URLデータベースに登録すると共に、前記最後の再帰的な実行において有害と判定するまでに既に有害であるか否かを判定した文書又はWebページを示すURLの全てを前記有害URLデータベースに登録する
ことを特徴とする有害文書判定プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010015961A JP5165704B2 (ja) | 2010-01-27 | 2010-01-27 | 有害文書判定方法、有害文書判定装置および有害文書判定プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010015961A JP5165704B2 (ja) | 2010-01-27 | 2010-01-27 | 有害文書判定方法、有害文書判定装置および有害文書判定プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011154557A JP2011154557A (ja) | 2011-08-11 |
JP5165704B2 true JP5165704B2 (ja) | 2013-03-21 |
Family
ID=44540464
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010015961A Expired - Fee Related JP5165704B2 (ja) | 2010-01-27 | 2010-01-27 | 有害文書判定方法、有害文書判定装置および有害文書判定プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5165704B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5865185B2 (ja) * | 2012-06-15 | 2016-02-17 | 西日本電信電話株式会社 | 通信装置及びurl評価システム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002014991A (ja) * | 2000-06-28 | 2002-01-18 | Hitachi Ltd | ネットワーク上の情報フィルタリング装置 |
JP2005056048A (ja) * | 2003-08-01 | 2005-03-03 | Fact-Real:Kk | 電子メール監視システム、電子メール監視プログラム及び電子メール監視方法 |
JP2005327016A (ja) * | 2004-05-13 | 2005-11-24 | Matsushita Electric Ind Co Ltd | セキュリティ情報提供システム |
JP2008250597A (ja) * | 2007-03-30 | 2008-10-16 | Kddi Corp | コンピュータシステム |
JP4979643B2 (ja) * | 2008-05-27 | 2012-07-18 | ヤフー株式会社 | メッセージ判定装置、方法及びプログラム |
-
2010
- 2010-01-27 JP JP2010015961A patent/JP5165704B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2011154557A (ja) | 2011-08-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8560964B2 (en) | Method and system for predictive browsing | |
WO2008062552A1 (fr) | Dispositif d'affichage d'informations, programme d'affichage d'informations, et système d'affichage d'informations | |
KR102454954B1 (ko) | 검색 동작 출력 엘리먼트에 대한 액션 표시자 | |
US7757158B2 (en) | Converting hypertext character strings to links by attaching anchors extracted from existing link destination | |
CN102930057A (zh) | 搜索实现方法和装置 | |
JP2007323394A (ja) | メタ検索システム及びメタ検索方法とこれに用いるユーザ端末及びプログラム | |
CN106919593B (zh) | 一种搜索的方法和装置 | |
JP5814089B2 (ja) | 情報表示制御装置、情報表示制御方法、及びプログラム | |
KR20120048627A (ko) | 정보 처리 장치 | |
JP2008262506A (ja) | 情報抽出システム、情報抽出方法および情報抽出用プログラム | |
JP5165704B2 (ja) | 有害文書判定方法、有害文書判定装置および有害文書判定プログラム | |
JP2010198350A (ja) | 検索装置及び検索方法 | |
CN110825976B (zh) | 网站页面的检测方法、装置、电子设备及介质 | |
JP5292139B2 (ja) | 広告提供装置 | |
JP4885678B2 (ja) | コンテンツ作成装置及びコンテンツ作成方法 | |
JP5084859B2 (ja) | 情報処理装置、データ抽出方法、及びプログラム | |
JP2007241635A (ja) | 文書検索装置、情報処理装置、検索結果出力方法、検索結果表示方法およびプログラム | |
JP2008250893A (ja) | 情報検索装置、情報検索方法およびそのプログラム | |
CN104376069A (zh) | 一种在浏览器的地址栏中搜索网页的方法及装置 | |
JP2018206189A (ja) | 情報収集装置、および、情報収集方法 | |
JP5108707B2 (ja) | 検索サーバ装置、検索方法及びプログラム | |
JP2008171110A (ja) | サイト検索システム、検索サーバ、プログラム | |
US20160373554A1 (en) | Computer-readable recording medium, web access method, and web access device | |
JP2014089692A (ja) | 情報提供サーバ | |
CN112784006B (zh) | 一种书籍推荐方法、装置、电子设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20120312 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120816 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120821 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121022 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20121022 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121127 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121219 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151228 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5165704 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees | ||
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |