JP2015103210A - インターネット上の有害書き込み検出装置及び検出方法 - Google Patents
インターネット上の有害書き込み検出装置及び検出方法 Download PDFInfo
- Publication number
- JP2015103210A JP2015103210A JP2013245813A JP2013245813A JP2015103210A JP 2015103210 A JP2015103210 A JP 2015103210A JP 2013245813 A JP2013245813 A JP 2013245813A JP 2013245813 A JP2013245813 A JP 2013245813A JP 2015103210 A JP2015103210 A JP 2015103210A
- Authority
- JP
- Japan
- Prior art keywords
- harmful
- word
- seed
- acquired
- internet
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 41
- 230000014509 gene expression Effects 0.000 claims abstract description 21
- 238000004364 calculation method Methods 0.000 claims abstract description 16
- 238000000034 method Methods 0.000 claims description 20
- 238000012545 processing Methods 0.000 description 12
- 238000007796 conventional method Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000003340 mental effect Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】インターネット上の有害書き込み検出装置は、予め有害表現の単語を種単語として複数のカテゴリに分類して構成される知識ベースと、インターネット上の所定のウェブサイトに書き込まれたテキストに対して知識ベースの種単語リストを照合してカテゴリ別で種単語を取得する種単語取得手段と、種単語取得手段によって取得した種単語を含む関連語句を取得する関連語句取得手段と、関連語句取得手段によって取得した関連語句と、関連語句に含まれる種単語の各カテゴリとの関連度を計算する関連度計算手段と、関連度計算手段によって得られた関連度の最大値を書き込まれたテキストの有害極性値とし、有害極性値が予め設定された閾値と比較し有害性を判断する判断手段とを備えている。
【選択図】図1
Description
PMI−IR(pi,wj) = log2 { hits(pi&wj)/hits(pi)hits(wj)} (1)
score = max(max(PMI-IR(pi,wj))) (2)
再現率=(システムが正しく有害と判定した書き込み数)/(全ての有害書き込み数) (4)
20 入力手段
30 記憶手段
31 制御用プログラム
32 知識ベース
40 制御手段
41 種単語取得手段
42 関連語句取得手段
43 関連度計算手段
44 判断手段
45 種単語頻度取得手段
46 関連語句頻度取得手段
47 共起頻度取得手段
50 送信手段
60 受信手段
100 インターネット上の有害書き込み検出装置
Claims (8)
- 予め有害表現の単語を種単語として複数のカテゴリに分類して構成される知識ベースと、
インターネット上の所定のウェブサイトに書き込まれたテキストに対して前記知識ベースの種単語リストを照合してカテゴリ別で種単語を取得する種単語取得手段と、
前記種単語取得手段によって取得した種単語を含む関連語句を取得する関連語句取得手段と、
前記関連語句取得手段によって取得した関連語句と、該関連語句に含まれる種単語の各カテゴリとの関連度を計算する関連度計算手段と、
前記関連度計算手段によって得られた関連度の最大値を書き込まれたテキストの有害極性値とし、該有害極性値が予め設定された閾値と比較し有害性を判断する判断手段とを備えていることを特徴とするインターネット上の有害書き込み検出装置。 - 前記種単語取得手段によって取得した種単語の頻度を取得する種単語頻度取得手段と、
前記関連語句取得手段によって取得した関連語句の頻度を取得する関連語句頻度取得手段とをさらに備えていることを特徴とする請求項1に記載のインターネット上の有害書き込み検出装置。 - 前記種単語取得手段によって取得した種単語と、前記関連語句取得手段によって取得した関連語句との共起頻度を取得する共起頻度取得手段をさらに備えていることを特徴とする請求項1又は2に記載のインターネット上の有害書き込み検出装置。
- 前記知識ベースに記録されている有害表現の単語は、範囲、種別、判断基準を備えたタグを付与されていることを特徴とする請求項1から3のいずれか1項に記載のインターネット上の有害書き込み検出装置。
- 予め有害表現の単語を種単語として複数のカテゴリに分類して知識ベースを構成する知識ベース作成ステップと、
インターネット上の所定のウェブサイトに書き込まれたテキストに対して前記知識ベースの種単語リストを照合してカテゴリ別で種単語を取得する種単語取得ステップと、
前記種単語取得ステップで取得した種単語を含む関連語句取得する関連語句取得ステップと、
前記関連語句取得ステップで取得した関連語句と、該関連語句に含まれる種単語の各カテゴリとの関連度を計算する関連度計算ステップと、
前記関連度計算ステップで得られた関連度の最大値を書き込まれたテキストの有害極性値とし、該有害極性値が予め設定された閾値と比較し有害性を判断する判断ステップとを備えていることを特徴とするインターネット上の有害書き込み検出方法。 - 前記種単語取得ステップで取得した種単語の頻度を取得する種単語頻度取得ステップと、
前記関連語句取得ステップで取得した関連語句の頻度を取得する関連語句頻度取得ステップとをさらに備えていることを特徴とする請求項5に記載のインターネット上の有害書き込み検出方法。 - 前記種単語取得ステップで取得した種単語と、前記関連語句取得ステップで取得した関連語句との共起頻度を取得する共起頻度取得ステップをさらに備えていることを特徴とする請求項5又は6に記載のインターネット上の有害書き込み検出方法。
- 前記知識ベースに記録されている有害表現の単語は、範囲、種別、判断基準を備えたタグを付与されていることを特徴とする請求項5から7のいずれか1項に記載のインターネット上の有害書き込み検出方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013245813A JP6301119B2 (ja) | 2013-11-28 | 2013-11-28 | インターネット上の有害書き込み検出装置及び検出方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013245813A JP6301119B2 (ja) | 2013-11-28 | 2013-11-28 | インターネット上の有害書き込み検出装置及び検出方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015103210A true JP2015103210A (ja) | 2015-06-04 |
JP6301119B2 JP6301119B2 (ja) | 2018-03-28 |
Family
ID=53378813
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013245813A Active JP6301119B2 (ja) | 2013-11-28 | 2013-11-28 | インターネット上の有害書き込み検出装置及び検出方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6301119B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017187828A (ja) * | 2016-04-01 | 2017-10-12 | 京セラドキュメントソリューションズ株式会社 | 情報処理装置及びプログラム |
KR101837003B1 (ko) * | 2016-01-22 | 2018-03-09 | 주식회사 와이즈넛 | 온라인 커뮤니티 모니터링 방법 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002109085A (ja) * | 2000-09-28 | 2002-04-12 | Uniden Corp | 掲載情報削除依頼代行システム及び方法 |
JP2002279047A (ja) * | 2001-01-09 | 2002-09-27 | Zuken:Kk | 電子掲示板監視システム |
JP2005070961A (ja) * | 2003-08-21 | 2005-03-17 | Nippon Telegr & Teleph Corp <Ntt> | Webパトロールシステム、Webパトロール方法、Webパトロール用プログラム、及び、Webパトロール用記録媒体 |
JP2011039575A (ja) * | 2009-08-06 | 2011-02-24 | Nippon Telegr & Teleph Corp <Ntt> | コンテンツ検出支援装置、コンテンツ検出支援方法およびコンテンツ検出支援プログラム |
-
2013
- 2013-11-28 JP JP2013245813A patent/JP6301119B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002109085A (ja) * | 2000-09-28 | 2002-04-12 | Uniden Corp | 掲載情報削除依頼代行システム及び方法 |
JP2002279047A (ja) * | 2001-01-09 | 2002-09-27 | Zuken:Kk | 電子掲示板監視システム |
JP2005070961A (ja) * | 2003-08-21 | 2005-03-17 | Nippon Telegr & Teleph Corp <Ntt> | Webパトロールシステム、Webパトロール方法、Webパトロール用プログラム、及び、Webパトロール用記録媒体 |
JP2011039575A (ja) * | 2009-08-06 | 2011-02-24 | Nippon Telegr & Teleph Corp <Ntt> | コンテンツ検出支援装置、コンテンツ検出支援方法およびコンテンツ検出支援プログラム |
Non-Patent Citations (2)
Title |
---|
松葉 達明: "学校非公式サイトにおける有害情報検出", 電子情報通信学会技術研究報告 VOL.109 NO.142, JPN6017044051, 15 July 2009 (2009-07-15), JP, pages 93 - 98, ISSN: 0003683747 * |
松葉 達明: "学校非公式サイトにおける有害情報検出を目的とした極性判定モデルに関する研究", 言語処理学会第17回年次大会 発表論文集 チュートリアル 本会議 ワークショップ [CD−ROM], JPN6017044053, 7 March 2011 (2011-03-07), JP, pages 388 - 391, ISSN: 0003683746 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101837003B1 (ko) * | 2016-01-22 | 2018-03-09 | 주식회사 와이즈넛 | 온라인 커뮤니티 모니터링 방법 |
JP2017187828A (ja) * | 2016-04-01 | 2017-10-12 | 京セラドキュメントソリューションズ株式会社 | 情報処理装置及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP6301119B2 (ja) | 2018-03-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CA3129745C (en) | Neural network system for text classification | |
CN109145216B (zh) | 网络舆情监控方法、装置及存储介质 | |
Wang et al. | A system for real-time twitter sentiment analysis of 2012 us presidential election cycle | |
Jiang et al. | Public-opinion sentiment analysis for large hydro projects | |
US20170372628A1 (en) | Adaptive Reading Level Assessment for Personalized Search | |
US20190370397A1 (en) | Artificial intelligence based-document processing | |
US9881059B2 (en) | Systems and methods for suggesting headlines | |
US9703860B2 (en) | Returning related previously answered questions based on question affinity | |
US20100262610A1 (en) | Identifying Subject Matter Experts | |
Aletras et al. | Labelling topics using unsupervised graph-based methods | |
US20180181544A1 (en) | Systems for Automatically Extracting Job Skills from an Electronic Document | |
US8965867B2 (en) | Measuring and altering topic influence on edited and unedited media | |
US20160098737A1 (en) | Corpus Management Based on Question Affinity | |
US9116979B2 (en) | Systems and methods for creating an interest profile for a user | |
US20200118022A1 (en) | Determining Comprehensiveness of Question Paper Given Syllabus | |
WO2020123689A1 (en) | Suggesting text in an electronic document | |
Rhyn et al. | A machine learning approach for classifying textual data in crowdsourcing | |
Ali | Questioning the impact of the impact factor. A brief review and future directions | |
US20150339786A1 (en) | Forensic system, forensic method, and forensic program | |
JP6301119B2 (ja) | インターネット上の有害書き込み検出装置及び検出方法 | |
Field et al. | Assessing the value of removing earthquake-hazard-related epistemic uncertainties, exemplified using average annual loss in California | |
TWI501183B (zh) | 個人化教科書推薦系統及其方法 | |
CN106575418A (zh) | 建议的关键词 | |
Rybak et al. | ExperTime: Tracking expertise over time | |
Wu et al. | Automatic evaluation of online learning interaction content using domain concepts |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20161125 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171121 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180112 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180220 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180228 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6301119 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |