JP2018180910A - 違法コンテンツ探索装置及び違法コンテンツ探索方法 - Google Patents
違法コンテンツ探索装置及び違法コンテンツ探索方法 Download PDFInfo
- Publication number
- JP2018180910A JP2018180910A JP2017079198A JP2017079198A JP2018180910A JP 2018180910 A JP2018180910 A JP 2018180910A JP 2017079198 A JP2017079198 A JP 2017079198A JP 2017079198 A JP2017079198 A JP 2017079198A JP 2018180910 A JP2018180910 A JP 2018180910A
- Authority
- JP
- Japan
- Prior art keywords
- content
- illegal
- phrase
- search query
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 44
- 238000004364 calculation method Methods 0.000 claims description 24
- 238000003860 storage Methods 0.000 description 12
- 238000012545 processing Methods 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 239000000284 extract Substances 0.000 description 6
- 241000110058 Candidatus Phytoplasma pini Species 0.000 description 5
- 238000009826 distribution Methods 0.000 description 5
- 230000008602 contraction Effects 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 240000000220 Panda oleosa Species 0.000 description 3
- 235000016496 Panda oleosa Nutrition 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000013179 statistical model Methods 0.000 description 3
- 238000012706 support-vector machine Methods 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000001364 causal effect Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000005295 random walk Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
11 違法語句モデル生成部
12 違法語句モデル記憶部
13 検索クエリ生成規則記憶部
14 検索クエリ生成部
15 照合候補取得部
16 プロフィール推定モデル生成部
17 プロフィール推定モデル記憶部
18 コンテンツプロフィール取得・推定部
19 例外コンテンツ除去部
20 照合優先度計算部
23 照合パラメータ設定部
24 コンテンツDL・照合部
25 違法語句モデル更新部
26 プロフィール推定モデル更新部
Claims (8)
- 非権利者により投稿された違法コンテンツを探索する違法コンテンツ探索装置であって、
前記違法コンテンツに用いられることが想定される違法語句を出力する違法語句モデルを、学習データに基づき生成する違法語句モデル生成部と、
照合元のコンテンツの正規タイトルに含まれる語句に対して、前記違法語句モデルを用いて出力された違法語句を含む検索クエリを生成する検索クエリ生成部と、を備えることを特徴とする違法コンテンツ探索装置。 - 請求項1に記載の違法コンテンツ探索装置において、
前記検索クエリ生成部は、検索クエリ生成規則を用いて、前記正規タイトルに含まれる語句と同一又は類似の意味内容を有する、前記語句とは異なる表記の語句を含む検索クエリを生成することを特徴とする違法コンテンツ探索装置。 - 請求項2に記載の違法コンテンツ探索装置において、
前記検索クエリ生成規則は、任意の語句と、前記語句を漢字変換した語句、前記語句を仮名変換した語句、前記語句をローマ字変換した語句および前記語句の表記ゆれを含む語句の少なくとも1つとの対応を示すことを特徴とする違法コンテンツ探索装置。 - 請求項1に記載の違法コンテンツ探索装置において、
前記検索クエリ生成部は、検索クエリ生成規則を用いて、前記照合元のコンテンツに付随するメタ情報を含む検索クエリを生成することを特徴とする違法コンテンツ探索装置。 - 請求項4に記載の違法コンテンツ探索装置において、
前記メタ情報は、前記照合元のコンテンツに登場するキャラクターの名称を含み、
前記検索クエリ生成部は、前記キャラクターの名称を含む前記検索クエリを生成することを特徴とする違法コンテンツ探索装置。 - 請求項1から5のいずれか一項に記載の違法コンテンツ探索装置において、
前記違法コンテンツとして探索されたコンテンツのタイトルに違法を示すラベルを付与して、前記学習データに追加する違法語句モデル更新部をさらに含むことを特徴とする違法コンテンツ探索装置。 - 請求項1から6のいずれか一項に記載の違法コンテンツ探索装置において、
前記検索クエリ生成部により生成された前記検索クエリに基づき前記ネットワーク上を検索して、前記検索により得られた候補コンテンツを一意に識別するための識別情報を取得し、前記候補コンテンツに付随するプロフィールを取得するコンテンツプロフィール取得・推定部と、
前記コンテンツプロフィール取得・推定部により推定されたプロフィールに基づき、前記候補コンテンツごとの優先度を計算する照合優先度計算部と、
前記照合優先度計算部により計算された優先度順に、前記識別情報で識別される前記候補コンテンツを取得し、該取得した候補コンテンツと前記照合元のコンテンツとを照合して、前記取得した候補コンテンツが前記違法コンテンツであるか否かを照合するコンテンツDL・照合部と、を備えることを特徴とする違法コンテンツ探索装置。 - 非権利者により投稿された違法コンテンツを探索する違法コンテンツ探索装置が実行する違法コンテンツ探索方法であって、
前記違法語句を出力する違法語句モデルを、学習データに基づき生成するステップと、
前記照合元のコンテンツの正規タイトルに含まれる語句に対して、前記違法語句モデルを用いて出力された違法語句を含む検索クエリを生成するステップと、を含むことを特徴とする違法コンテンツ探索方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017079198A JP6625087B2 (ja) | 2017-04-12 | 2017-04-12 | 違法コンテンツ探索装置及び違法コンテンツ探索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017079198A JP6625087B2 (ja) | 2017-04-12 | 2017-04-12 | 違法コンテンツ探索装置及び違法コンテンツ探索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018180910A true JP2018180910A (ja) | 2018-11-15 |
JP6625087B2 JP6625087B2 (ja) | 2019-12-25 |
Family
ID=64275476
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017079198A Active JP6625087B2 (ja) | 2017-04-12 | 2017-04-12 | 違法コンテンツ探索装置及び違法コンテンツ探索方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6625087B2 (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000331012A (ja) * | 1999-05-19 | 2000-11-30 | Oki Electric Ind Co Ltd | 電子化文書検索方法 |
JP2003050822A (ja) * | 2001-05-29 | 2003-02-21 | Nippon Telegraph & Telephone East Corp | コンテンツ探索装置、コンテンツ探索方法、コンテンツ探索プログラム、および当該プログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2009217661A (ja) * | 2008-03-12 | 2009-09-24 | Kddi Corp | 違法コンテンツ判定支援システムおよび違法コンテンツ判定支援システムの制御プログラム |
JP2015197905A (ja) * | 2014-03-31 | 2015-11-09 | 健一 横手 | コンテンツの配信方法及びシステム |
-
2017
- 2017-04-12 JP JP2017079198A patent/JP6625087B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000331012A (ja) * | 1999-05-19 | 2000-11-30 | Oki Electric Ind Co Ltd | 電子化文書検索方法 |
JP2003050822A (ja) * | 2001-05-29 | 2003-02-21 | Nippon Telegraph & Telephone East Corp | コンテンツ探索装置、コンテンツ探索方法、コンテンツ探索プログラム、および当該プログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2009217661A (ja) * | 2008-03-12 | 2009-09-24 | Kddi Corp | 違法コンテンツ判定支援システムおよび違法コンテンツ判定支援システムの制御プログラム |
JP2015197905A (ja) * | 2014-03-31 | 2015-11-09 | 健一 横手 | コンテンツの配信方法及びシステム |
Also Published As
Publication number | Publication date |
---|---|
JP6625087B2 (ja) | 2019-12-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2015196910A1 (zh) | 基于搜索引擎的摘要信息提取方法、装置以及搜索引擎 | |
US9830391B1 (en) | Query modification based on non-textual resource context | |
JP6429382B2 (ja) | コンテンツ推薦装置、及びプログラム | |
WO2015188719A1 (zh) | 结构化数据与图片的关联方法与关联装置 | |
JP5952711B2 (ja) | 予測対象コンテンツにおける将来的なコメント数を予測する予測サーバ、プログラム及び方法 | |
WO2019187842A1 (ja) | 違法コンテンツ探索装置、違法コンテンツ探索方法およびプログラム | |
JP6486165B2 (ja) | 候補キーワード評価装置及び候補キーワード評価プログラム | |
CN113407775B (zh) | 视频搜索方法、装置及电子设备 | |
US11947635B2 (en) | Illegal content search device, illegal content search method, and program | |
JP7395377B2 (ja) | コンテンツ検索方法、装置、機器、および記憶媒体 | |
JP6530002B2 (ja) | コンテンツ探索装置、コンテンツ探索方法、プログラム | |
JP6632564B2 (ja) | 違法コンテンツ探索装置、違法コンテンツ探索方法、及びプログラム | |
JP6830917B2 (ja) | 違法コンテンツ探索装置、違法コンテンツ探索方法およびプログラム | |
JP6762678B2 (ja) | 違法コンテンツ探索装置、違法コンテンツ探索方法およびプログラム | |
JP6621437B2 (ja) | 違法コンテンツ探索装置、違法コンテンツ探索方法、及びプログラム | |
JP6625087B2 (ja) | 違法コンテンツ探索装置及び違法コンテンツ探索方法 | |
JP2008102790A (ja) | 検索システム | |
Acker et al. | The Neil deGrasse Tyson Problem: Methods for Exploring Base Memes in Web Archives | |
Laclavik et al. | A search based approach to entity recognition: magnetic and IISAS team at ERD challenge | |
JP2008204007A (ja) | 画像辞書生成方法及び装置及びプログラム | |
CN117221669B (zh) | 一种弹幕生成方法及装置 | |
Hazimeh et al. | Social Networks Serving Web Feeds: An Approach for Web Feed Enrichment | |
US20240020476A1 (en) | Determining linked spam content | |
JP2010092334A (ja) | 同位語選出装置、同位語選出方法およびプログラム | |
KR20230119398A (ko) | 영상 편집 자동화 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180806 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190722 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190820 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191010 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191126 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191126 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6625087 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |