JP6625087B2 - 違法コンテンツ探索装置及び違法コンテンツ探索方法 - Google Patents
違法コンテンツ探索装置及び違法コンテンツ探索方法 Download PDFInfo
- Publication number
- JP6625087B2 JP6625087B2 JP2017079198A JP2017079198A JP6625087B2 JP 6625087 B2 JP6625087 B2 JP 6625087B2 JP 2017079198 A JP2017079198 A JP 2017079198A JP 2017079198 A JP2017079198 A JP 2017079198A JP 6625087 B2 JP6625087 B2 JP 6625087B2
- Authority
- JP
- Japan
- Prior art keywords
- content
- illegal
- profile
- title
- search query
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
前記違法コンテンツの前記タイトル又は投稿ユーザを含む学習データに基づいて生成された、投稿されたコンテンツが前記違法コンテンツである確度を前記タイトルごとに示すタイトル違法確度、又は前記投稿されたコンテンツが前記違法コンテンツである確度を前記投稿ユーザごとに示す投稿ユーザ違法確度を含むプロフィールを出力するプロフィール推定モデルと、を備え、前記コンテンツプロフィール取得・推定部は、プロフィール推定モデルを用いて、前記タイトル違法確度又は前記投稿ユーザ違法確度を含むプロフィールを取得し、前記照合優先度計算部は、タイトル違法確度、又は投稿ユーザ違法確度を含むプロフィールに基づいて、前記優先度を計算することを特徴とする。
11 違法語句モデル生成部
12 違法語句モデル記憶部
13 検索クエリ生成規則記憶部
14 検索クエリ生成部
15 照合候補取得部
16 プロフィール推定モデル生成部
17 プロフィール推定モデル記憶部
18 コンテンツプロフィール取得・推定部
19 例外コンテンツ除去部
20 照合優先度計算部
23 照合パラメータ設定部
24 コンテンツDL・照合部
25 違法語句モデル更新部
26 プロフィール推定モデル更新部
Claims (7)
- 非権利者により投稿された違法コンテンツを探索する違法コンテンツ探索装置であって、
前記違法コンテンツに用いられることが想定される違法語句を出力する違法語句モデルを、学習データに基づき生成する違法語句モデル生成部と、
照合元のコンテンツの正規タイトルに含まれる語句に対して、前記違法語句モデルを用いて出力された違法語句を含む検索クエリを生成する検索クエリ生成部と、
前記検索クエリ生成部により生成された前記検索クエリに基づきネットワーク上を検索して、前記検索により得られた候補コンテンツを一意に識別するための識別情報を取得し、前記候補コンテンツに付随するプロフィールを取得するコンテンツプロフィール取得・推定部と、
前記コンテンツプロフィール取得・推定部により推定されたプロフィールに基づき、前記候補コンテンツごとの優先度を計算する照合優先度計算部と、
前記照合優先度計算部により計算された優先度順に、前記識別情報で識別される前記候補コンテンツを取得し、該取得した候補コンテンツと前記照合元のコンテンツとを照合して、前記取得した候補コンテンツが前記違法コンテンツであるか否かを照合するコンテンツDL・照合部と、
前記コンテンツDL・照合部の照合によって前記照合元のコンテンツに合致した前記違法コンテンツのタイトルを新たな学習データとして前記違法語句モデルを更新する違法語句モデル更新部と、
前記違法コンテンツの前記タイトル又は投稿ユーザを含む学習データに基づいて生成された、投稿されたコンテンツが前記違法コンテンツである確度を前記タイトルごとに示すタイトル違法確度、又は前記投稿されたコンテンツが前記違法コンテンツである確度を前記投稿ユーザごとに示す投稿ユーザ違法確度を含むプロフィールを出力するプロフィール推定モデルと、
を備え、
前記コンテンツプロフィール取得・推定部は、プロフィール推定モデルを用いて、前記タイトル違法確度又は前記投稿ユーザ違法確度を含むプロフィールを取得し、
前記照合優先度計算部は、タイトル違法確度、又は投稿ユーザ違法確度を含むプロフィールに基づいて、前記優先度を計算することを特徴とする違法コンテンツ探索装置。 - 請求項1に記載の違法コンテンツ探索装置において、
前記検索クエリ生成部は、検索クエリ生成規則を用いて、前記正規タイトルに含まれる語句と同一又は類似の意味内容を有する、前記語句とは異なる表記の語句を含む検索クエリを生成することを特徴とする違法コンテンツ探索装置。 - 請求項2に記載の違法コンテンツ探索装置において、
前記検索クエリ生成規則は、任意の語句と、前記語句を漢字変換した語句、前記語句を仮名変換した語句、前記語句をローマ字変換した語句および前記語句の表記ゆれを含む語句の少なくとも1つとの対応を示すことを特徴とする違法コンテンツ探索装置。 - 請求項1に記載の違法コンテンツ探索装置において、
前記検索クエリ生成部は、検索クエリ生成規則を用いて、前記照合元のコンテンツに付随するメタ情報を含む検索クエリを生成することを特徴とする違法コンテンツ探索装置。 - 請求項4に記載の違法コンテンツ探索装置において、
前記メタ情報は、前記照合元のコンテンツに登場するキャラクターの名称を含み、
前記検索クエリ生成部は、前記キャラクターの名称を含む前記検索クエリを生成することを特徴とする違法コンテンツ探索装置。 - 請求項1から5のいずれか一項に記載の違法コンテンツ探索装置において、
前記違法コンテンツとして探索されたコンテンツのタイトルに違法を示すラベルを付与して、前記学習データに追加する違法語句モデル更新部をさらに含むことを特徴とする違法コンテンツ探索装置。 - 非権利者により投稿された違法コンテンツを探索する違法コンテンツ探索装置が実行する違法コンテンツ探索方法であって、
前記違法コンテンツに用いられることが想定される違法語句を出力する違法語句モデルを、学習データに基づき生成するステップと、
照合元のコンテンツの正規タイトルに含まれる語句に対して、前記違法語句モデルを用いて出力された違法語句を含む検索クエリを生成するステップと、
前記検索クエリに基づきネットワーク上を検索して、前記検索により得られた候補コンテンツを一意に識別するための識別情報を取得し、前記候補コンテンツに付随するプロフィールを取得するステップと、
前記取得されたプロフィールに基づき、前記候補コンテンツごとの優先度を計算するステップと、
前記優先度順に、前記識別情報で識別される前記候補コンテンツを取得し、該取得した候補コンテンツと前記照合元のコンテンツとを照合して、前記取得した候補コンテンツが前記違法コンテンツであるか否かを照合するステップと、
前記照合によって前記照合元のコンテンツに合致した前記違法コンテンツのタイトルを新たな学習データとして前記違法語句モデルを更新するステップと、を含み、
前記プロフィールを取得するステップは、前記違法コンテンツの前記タイトル又は投稿ユーザを含む学習データに基づいて生成された、投稿されたコンテンツが前記違法コンテンツである確度を前記タイトルごとに示すタイトル違法確度、又は前記投稿されたコンテンツが前記違法コンテンツである確度を前記投稿ユーザごとに示す投稿ユーザ違法確度を含むプロフィールを出力するプロフィール推定モデルを用いて、前記タイトル違法確度又は前記投稿ユーザ違法確度を含むプロフィールを取得するステップを含み
前記優先度を計算するステップは、タイトル違法確度、又は投稿ユーザ違法確度を含むプロフィールに基づいて、前記優先度を計算するステップを含むことを特徴とする違法コンテンツ探索方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017079198A JP6625087B2 (ja) | 2017-04-12 | 2017-04-12 | 違法コンテンツ探索装置及び違法コンテンツ探索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017079198A JP6625087B2 (ja) | 2017-04-12 | 2017-04-12 | 違法コンテンツ探索装置及び違法コンテンツ探索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018180910A JP2018180910A (ja) | 2018-11-15 |
JP6625087B2 true JP6625087B2 (ja) | 2019-12-25 |
Family
ID=64275476
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017079198A Active JP6625087B2 (ja) | 2017-04-12 | 2017-04-12 | 違法コンテンツ探索装置及び違法コンテンツ探索方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6625087B2 (ja) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000331012A (ja) * | 1999-05-19 | 2000-11-30 | Oki Electric Ind Co Ltd | 電子化文書検索方法 |
JP2003050822A (ja) * | 2001-05-29 | 2003-02-21 | Nippon Telegraph & Telephone East Corp | コンテンツ探索装置、コンテンツ探索方法、コンテンツ探索プログラム、および当該プログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP4990823B2 (ja) * | 2008-03-12 | 2012-08-01 | Kddi株式会社 | 違法コンテンツ判定支援システムおよび違法コンテンツ判定支援システムの制御プログラム |
JP5748084B1 (ja) * | 2014-03-31 | 2015-07-15 | 健一 横手 | コンテンツの配信方法及びシステム |
-
2017
- 2017-04-12 JP JP2017079198A patent/JP6625087B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018180910A (ja) | 2018-11-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20160098433A1 (en) | Method for facet searching and search suggestions | |
CN107180093B (zh) | 信息搜索方法及装置和时效性查询词识别方法及装置 | |
JP6429382B2 (ja) | コンテンツ推薦装置、及びプログラム | |
WO2015188719A1 (zh) | 结构化数据与图片的关联方法与关联装置 | |
WO2023108980A1 (zh) | 基于文本对抗样例的信息推送方法及装置 | |
KR20090087269A (ko) | 컨텍스트 기반 정보 처리 방법 및 장치, 그리고 컴퓨터기록 매체 | |
Yang et al. | Crowdsourced time-sync video tagging using semantic association graph | |
JP5952711B2 (ja) | 予測対象コンテンツにおける将来的なコメント数を予測する予測サーバ、プログラム及び方法 | |
JP7395377B2 (ja) | コンテンツ検索方法、装置、機器、および記憶媒体 | |
WO2019187842A1 (ja) | 違法コンテンツ探索装置、違法コンテンツ探索方法およびプログラム | |
US11947635B2 (en) | Illegal content search device, illegal content search method, and program | |
CN111737523B (zh) | 一种视频标签、搜索内容的生成方法及服务器 | |
KR100916310B1 (ko) | 오디오 신호처리 기반의 음악 및 동영상간의 교차 추천 시스템 및 방법 | |
JP6632564B2 (ja) | 違法コンテンツ探索装置、違法コンテンツ探索方法、及びプログラム | |
JP6530002B2 (ja) | コンテンツ探索装置、コンテンツ探索方法、プログラム | |
JP6830917B2 (ja) | 違法コンテンツ探索装置、違法コンテンツ探索方法およびプログラム | |
JP6762678B2 (ja) | 違法コンテンツ探索装置、違法コンテンツ探索方法およびプログラム | |
JP6625087B2 (ja) | 違法コンテンツ探索装置及び違法コンテンツ探索方法 | |
JP6621437B2 (ja) | 違法コンテンツ探索装置、違法コンテンツ探索方法、及びプログラム | |
JP6114980B2 (ja) | 楽曲処理装置および楽曲処理方法 | |
US20240020476A1 (en) | Determining linked spam content | |
JP6700987B2 (ja) | 関連文書処理装置及びプログラム | |
Misra et al. | Topic modeling for content based image retrieval | |
KR20230119398A (ko) | 영상 편집 자동화 시스템 | |
Ward | Tweet Collect: short text message collection using automatic query expansion and classification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180806 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190722 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190820 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191010 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191126 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191126 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6625087 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |