JP2014021757A - コンテンツ評価値予測装置、方法、及びプログラム - Google Patents
コンテンツ評価値予測装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP2014021757A JP2014021757A JP2012160439A JP2012160439A JP2014021757A JP 2014021757 A JP2014021757 A JP 2014021757A JP 2012160439 A JP2012160439 A JP 2012160439A JP 2012160439 A JP2012160439 A JP 2012160439A JP 2014021757 A JP2014021757 A JP 2014021757A
- Authority
- JP
- Japan
- Prior art keywords
- content
- evaluation value
- feature
- learning
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【解決手段】学習用特徴量生成部41が、特徴抽出部20で学習データから抽出された、対象コンテンツが含まれる要約コンテンツの構造、要約コンテンツに対するユーザの動作、及び複数の学習データに含まれる全要約コンテンツと対象コンテンツとの関係を示すソーシャル特徴と、要約コンテンツが有する文章情報から抽出される文章特徴とをまとめた学習用特徴ベクトルを生成し、パラメータ決定部42が、学習用特徴ベクトルを用いて、予測部30の回帰手法に応じた回帰パラメータを決定して、回帰パラメータ記憶部31に記憶する。予測評価値回帰部32で、テスト対象コンテンツについて抽出されたテスト特徴ベクトルと回帰パラメータとを用いて、テスト対象コンテンツの予測評価値を計算する。
【選択図】図2
Description
本実施の形態に係るコンテンツ評価値予測装置10は、CPU(Central Processing Unit)と、RAM(Random Access Memory)と、後述する学習処理及び予測処理を含むコンテンツ評価値予測処理ルーチンを実行するためのプログラムを記憶したROM(Read Only Memory)とを備えたコンピュータで構成されている。このコンピュータは、機能的には、図2に示すように、特徴抽出部20と、予測部30と、学習部40と、出力部50とを含んだ構成で表すことができる。
2.要約コンテンツSi内に含まれるソーシャルメディアコンテンツの投稿者・作成者数
3.要約コンテンツSi内に含まれる画像・動画像コンテンツの種類数(重複なしのコンテンツ数)
4.要約コンテンツSiが閲覧された回数
5.要約コンテンツSiがブックマーク機能に登録された回数
7.要約コンテンツ集合S内の全てのソーシャルメディアコンテンツのうち、画像コンテンツIjに言及している、あるいはハイパーリンクなどを持つソーシャルメディアコンテンツ数
タイトル文章集合:各要約コンテンツに対して編集者が付与するタイトル、説明文、タグなど、編集者が操作可能な文章のデータである。この文章は要約コンテンツSiの内容を端的に表していると考えられる。
概要コンテンツ文章集合:要約コンテンツSiに収録されている全てのソーシャルメディアコンテンツ内に存在する文章から、タイトル文章を除いたものである。つまり、編集者が操作できない文章である。
画像コンテンツ文章集合:概要コンテンツ文章の中から、画像コンテンツIjに言及している、あるいはハイパーリンクなどを持つソーシャルメディアの文章のみを抽出したものである。つまり、目的の画像に対する直接的な文章表現である。
2.概要コンテンツ文章集合のBoWベクトルと画像コンテンツ文章集合のBoWベクトルとのコサイン類似度
3.タイトル文章集合のBoWベクトルと画像コンテンツ文章集合のBoWベクトルとのコサイン類似度
4.タイトル文章集合の二値化したBoWベクトルと概要コンテンツ文章集合の二値化したBoWベクトルとのコサイン類似度
5.概要コンテンツ文章集合の二値化したBoWベクトルと画像コンテンツ文章集合の二値化したBoWベクトルとのコサイン類似度
6.タイトル文章集合の二値化したBoWベクトルと画像コンテンツ文章集合のBoWベクトルとのコサイン類似度
次に、本実施の形態に係るコンテンツ評価値予測装置10の作用について説明する。まず、予測部30で利用する回帰パラメータを決定する際には、コンテンツ評価値予測装置10に学習データが入力され、コンテンツ評価値予測装置10において、図3に示す学習処理ルーチンが実行される。
以下に実施例を示す。本実施例では、ソーシャルキュレーションサービスであるTogetter(登録商標)から収集したソーシャルキュレーションコンテンツを使用した。従って、評価値を予測する画像コンテンツはTwitter(登録商標)においてコメント等が付与された静止画像の投稿となる。また、予測する評価値は、画像コンテンツの閲覧数の自然対数値とした。
20 特徴抽出部
21 ソーシャル特徴抽出部
22 文章特徴抽出部
30 予測部
31 回帰パラメータ記憶部
32 予測評価値回帰部
40 学習部
41 学習用特徴量生成部
42 パラメータ決定部
50 出力部
Claims (7)
- 複数種類のコンテンツの少なくとも1種類のコンテンツを含み、ソーシャルメディアに投稿された複数のソーシャルメディアコンテンツが、特定のテーマに基づいて収集及び要約された要約コンテンツ、前記要約コンテンツに含まれ、かつ評価値の予測対象となるコンテンツの種類に該当する対象コンテンツ、及び該対象コンテンツに対する真の評価値からなる複数の学習データに含まれる前記対象コンテンツの各々について、前記対象コンテンツが含まれる要約コンテンツを表す特徴を抽出する特徴抽出手段と、
前記複数の学習データに含まれる前記対象コンテンツの各々について、前記特徴抽出手段により抽出された特徴と前記真の評価値との対応関係を用いて、評価値が未知のテスト対象コンテンツの評価値を予測するためのパラメータを学習する学習手段と、
を含むコンテンツ評価値予測装置。 - 前記特徴抽出手段は、前記要約コンテンツを表す特徴を、前記対象コンテンツが含まれる要約コンテンツの構造、該要約コンテンツに対するユーザの動作、及び前記複数の学習データに含まれる全要約コンテンツと前記対象コンテンツとの関係の少なくとも1つを示すソーシャル特徴、並びに前記対象コンテンツが含まれる要約コンテンツが有する文章情報から抽出される文章特徴の少なくとも一方とした請求項1記載のコンテンツ評価値予測装置。
- 前記特徴抽出手段は、要約コンテンツに含まれる前記テスト対象コンテンツについて、前記テスト対象コンテンツが含まれる要約コンテンツを表す特徴を抽出し、
前記特徴抽出手段により抽出された前記テスト対象コンテンツの特徴と前記学習手段により学習されたパラメータとを用いて、前記テスト対象コンテンツの評価値を予測する予測手段を含む
請求項1または請求項2記載のコンテンツ評価値予測装置。 - 特徴抽出手段と、学習手段とを含むコンテンツ評価値予測装置におけるコンテンツ評価値予測方法であって、
前記特徴抽出手段が、複数種類のコンテンツの少なくとも1種類のコンテンツを含み、ソーシャルメディアに投稿された複数のソーシャルメディアコンテンツが、特定のテーマに基づいて収集及び要約された要約コンテンツ、前記要約コンテンツに含まれ、かつ評価値の予測対象となるコンテンツの種類に該当する対象コンテンツ、及び該対象コンテンツに対する真の評価値からなる複数の学習データに含まれる前記対象コンテンツの各々について、前記対象コンテンツが含まれる要約コンテンツを表す特徴を抽出し、
前記学習手段が、前記複数の学習データに含まれる前記対象コンテンツの各々について、前記特徴抽出手段により抽出された特徴と前記真の評価値との対応関係を用いて、評価値が未知のテスト対象コンテンツの評価値を予測するためのパラメータを学習する
コンテンツ評価値予測方法。 - 前記特徴抽出手段は、前記要約コンテンツを表す特徴を、前記対象コンテンツが含まれる要約コンテンツの構造、該要約コンテンツに対するユーザの動作、及び前記複数の学習データに含まれる全要約コンテンツと前記対象コンテンツとの関係の少なくとも1つを示すソーシャル特徴、並びに前記対象コンテンツが含まれる要約コンテンツが有する文章情報から抽出される文章特徴の少なくとも一方とした請求項4記載のコンテンツ評価値予測方法。
- 予測手段をさらに含むコンテンツ評価値予測装置におけるコンテンツ評価値予測方法であって、
前記特徴抽出手段は、要約コンテンツに含まれる前記テスト対象コンテンツについて、前記テスト対象コンテンツが含まれる要約コンテンツを表す特徴を抽出し、
前記予測手段は、前記特徴抽出手段により抽出された前記テスト対象コンテンツの特徴と、前記学習手段により学習されたパラメータとを用いて、前記テスト対象コンテンツの評価値を予測する
請求項4または請求項5記載のコンテンツ評価値予測方法。 - コンピュータを、請求項1〜請求項3のいずれか1項記載のコンテンツ評価値予測装置を構成する各手段として機能させるためのコンテンツ評価値予測プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012160439A JP5771573B2 (ja) | 2012-07-19 | 2012-07-19 | コンテンツ評価値予測装置、方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012160439A JP5771573B2 (ja) | 2012-07-19 | 2012-07-19 | コンテンツ評価値予測装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014021757A true JP2014021757A (ja) | 2014-02-03 |
JP5771573B2 JP5771573B2 (ja) | 2015-09-02 |
Family
ID=50196555
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012160439A Active JP5771573B2 (ja) | 2012-07-19 | 2012-07-19 | コンテンツ評価値予測装置、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5771573B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017217242A1 (ja) * | 2016-06-15 | 2017-12-21 | ソニー株式会社 | 情報処理装置、情報処理方法、及び、プログラム |
KR101909267B1 (ko) * | 2017-05-17 | 2018-10-17 | 주식회사 카카오 | 열독률 제공 장치 및 방법 |
JP2020009114A (ja) * | 2018-07-06 | 2020-01-16 | キヤノン株式会社 | 画像評価装置、システム、画像評価装置の制御方法およびプログラム |
JP2020017054A (ja) * | 2018-07-25 | 2020-01-30 | 富士ゼロックス株式会社 | コンテンツ評価装置 |
CN112861001A (zh) * | 2021-02-18 | 2021-05-28 | 咪咕数字传媒有限公司 | 数字内容的推荐值生成方法、装置、电子设备及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008234431A (ja) * | 2007-03-22 | 2008-10-02 | Toshiba Corp | コメント蓄積装置、コメント作成閲覧装置、コメント閲覧システムおよびプログラム |
JP2011248831A (ja) * | 2010-05-31 | 2011-12-08 | Sony Corp | 情報処理装置および方法、並びに、プログラム |
-
2012
- 2012-07-19 JP JP2012160439A patent/JP5771573B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008234431A (ja) * | 2007-03-22 | 2008-10-02 | Toshiba Corp | コメント蓄積装置、コメント作成閲覧装置、コメント閲覧システムおよびプログラム |
JP2011248831A (ja) * | 2010-05-31 | 2011-12-08 | Sony Corp | 情報処理装置および方法、並びに、プログラム |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017217242A1 (ja) * | 2016-06-15 | 2017-12-21 | ソニー株式会社 | 情報処理装置、情報処理方法、及び、プログラム |
JPWO2017217242A1 (ja) * | 2016-06-15 | 2019-04-04 | ソニー株式会社 | 情報処理装置、情報処理方法、及び、プログラム |
KR101909267B1 (ko) * | 2017-05-17 | 2018-10-17 | 주식회사 카카오 | 열독률 제공 장치 및 방법 |
JP2020009114A (ja) * | 2018-07-06 | 2020-01-16 | キヤノン株式会社 | 画像評価装置、システム、画像評価装置の制御方法およびプログラム |
JP7171275B2 (ja) | 2018-07-06 | 2022-11-15 | キヤノン株式会社 | 画像評価装置、システム、画像評価装置の制御方法およびプログラム |
JP2020017054A (ja) * | 2018-07-25 | 2020-01-30 | 富士ゼロックス株式会社 | コンテンツ評価装置 |
JP7187865B2 (ja) | 2018-07-25 | 2022-12-13 | 富士フイルムビジネスイノベーション株式会社 | コンテンツ評価装置 |
CN112861001A (zh) * | 2021-02-18 | 2021-05-28 | 咪咕数字传媒有限公司 | 数字内容的推荐值生成方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP5771573B2 (ja) | 2015-09-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Boididou et al. | Detection and visualization of misleading content on Twitter | |
JP6526329B2 (ja) | ウェブページトレーニング方法及び装置、検索意図識別方法及び装置 | |
Qian et al. | Multi-modal event topic model for social event analysis | |
Kordopatis-Zilos et al. | Near-duplicate video retrieval by aggregating intermediate cnn layers | |
CN107463605B (zh) | 低质新闻资源的识别方法及装置、计算机设备及可读介质 | |
KR101754473B1 (ko) | 문서를 이미지 기반 컨텐츠로 요약하여 제공하는 방법 및 시스템 | |
Yang et al. | Discriminative tag learning on youtube videos with latent sub-tags | |
Bisandu et al. | Clustering news articles using efficient similarity measure and N-grams | |
JP5771573B2 (ja) | コンテンツ評価値予測装置、方法、及びプログラム | |
JP5012078B2 (ja) | カテゴリ作成方法、カテゴリ作成装置、およびプログラム | |
Dong et al. | The automated acquisition of suggestions from tweets | |
Chen et al. | Doctag2vec: An embedding based multi-label learning approach for document tagging | |
Fernandez-Beltran et al. | Incremental probabilistic latent semantic analysis for video retrieval | |
Shawon et al. | Website classification using word based multiple n-gram models and random search oriented feature parameters | |
Kumar et al. | Key-lectures: keyframes extraction in video lectures | |
ur Rehman et al. | Learning a semantic space for modeling images, tags and feelings in cross-media search | |
Viet et al. | Analyzing recent research trends of computer science from academic open-access digital library | |
Feng et al. | Multiple style exploration for story unit segmentation of broadcast news video | |
Magdy et al. | Bridging social media via distant supervision | |
CN111950265A (zh) | 一种领域词库构建方法和装置 | |
Pobar et al. | Multi-label poster classification into genres using different problem transformation methods | |
Omidvar et al. | A novel approach to determining the quality of news headlines | |
Fang et al. | Towards MSR-Bing challenge: Ensemble of diverse models for image retrieval | |
Zhang et al. | Large scale incremental web video categorization | |
McGuinness et al. | Insight Centre for Data Analytics (DCU) at TRECVid 2014: instance search and semantic indexing tasks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140723 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150225 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150303 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150422 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150602 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150629 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5771573 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |