JP6592574B1 - 記事解析装置、および、記事解析方法 - Google Patents
記事解析装置、および、記事解析方法 Download PDFInfo
- Publication number
- JP6592574B1 JP6592574B1 JP2018177743A JP2018177743A JP6592574B1 JP 6592574 B1 JP6592574 B1 JP 6592574B1 JP 2018177743 A JP2018177743 A JP 2018177743A JP 2018177743 A JP2018177743 A JP 2018177743A JP 6592574 B1 JP6592574 B1 JP 6592574B1
- Authority
- JP
- Japan
- Prior art keywords
- data
- article
- word
- character
- predicted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 36
- 238000011156 evaluation Methods 0.000 claims abstract description 24
- 238000010801 machine learning Methods 0.000 claims abstract description 23
- 230000006872 improvement Effects 0.000 claims abstract description 22
- 238000004364 calculation method Methods 0.000 claims abstract description 19
- 230000006870 function Effects 0.000 claims abstract description 8
- 230000000694 effects Effects 0.000 claims description 24
- 238000013528 artificial neural network Methods 0.000 claims description 18
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000000034 method Methods 0.000 description 20
- 230000008569 process Effects 0.000 description 20
- 238000013527 convolutional neural network Methods 0.000 description 9
- 238000012545 processing Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 6
- 239000000284 extract Substances 0.000 description 6
- 238000013473 artificial intelligence Methods 0.000 description 3
- 230000000877 morphologic effect Effects 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003631 expected effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
本発明は、過去記事データの文字データとして取得された各単語の出現頻度を集計した結果を、文字特徴データとして記憶部に記憶する機械学習部と、
入力された予測記事データの文字データとして取得された各単語について、前記文字特徴データの単語との類似度が高いほど、かつ、前記文字特徴データの出現頻度が高いほど高得点とする評価関数を計算することで、各単語のスコアを計算し、
前記予測記事データの各単語について、前記スコアが高い前記文字特徴データの単語を書き換え候補として、前記予測記事データの単語の書き換えを促す旨を提示する改善計算部と、を有することを特徴とする。
その他の手段は、後記する。
記事解析装置1は、過去記事データ11と、予測記事データ12と、特徴DB13とを記憶部に記憶する。記事解析装置1は、機械学習部21と、効果予想部22と、改善計算部23と、形態素解析部31と、スコア計算部32と、スコア合計部33とを処理部として有する。
記事解析装置1は、CPU(Central Processing Unit)と、メモリと、ハードディスクなどの記憶手段(記憶部)と、ネットワークインタフェースとを有するコンピュータとして構成される。
このコンピュータは、CPUが、メモリ上に読み込んだプログラム(アプリケーションや、その略のアプリとも呼ばれる)を実行することにより、各処理部により構成される制御部(制御手段)を動作させる。
過去記事データ11の評価点とは、公開された記事に対する読者からの評価(効果)を定量的に示すラベルである。この評価点は、例えば、ネットからのアクセスデータとして、記事へのアクセス数や、記事に対する読者からの反応数であるいいね数、リツイート数、リプライ数などである。なお、「いいね」とは、読者が好印象と判断した記事に対して、1クリック(1タッチ)で記事を評価する操作であり、アプリによっては「お気に入り」や「ファボ(Favorite)」とも呼ばれる。
または、評価点は、記事で紹介された商品に対する市場からの反応としての、売上げデータでもよい。
以下、図2を参照して、記事解析装置1のうちの過去記事データ11以外の構成要素を説明する。
機械学習部21は、過去記事データ11を教師データとして機械学習し、その結果である回帰(Regression)の予測モデルを作成する。予測モデルは、例えば、過去記事データ11の特徴を示す単語(キーワード)として、特徴DB13に格納される(S11)。
なお、予測モデルは、例えば、入力層、中間層、出力層を順に接続し、それぞれの層を情報伝達させるニューラルネットワークとして構成される。中間層が多階層(複数階層)であるときは、機械学習部21は、ディープラーニングにより予測モデルを作成する。
なお、記事解析装置1は、効果予想部22の評価点と、改善計算部23の改善案とを同時に表示することとしたが、いずれか片方の表示だけでもユーザにとって有益である。よって、効果予想部22および改善計算部23のいずれか1つだけを備えた記事解析装置1として構成してもよい。
機械学習部21は、過去記事データ11を構文解析することで、文字データ101および画像データ102を抽出する。文字データ101として、過去記事データ11に記載されたテキストデータを抽出してもよいし、過去記事データ11に添付された音声データや動画データからテキストデータを音声認識により機械抽出してもよい。画像データ102は、1枚ずつの画像ファイルから構成されていてもよいし、過去記事データ11の動画データから抽出した画像ファイルの集合として構成されていてもよい。
つまり、ニューラルネットワークの第1層(入力層)が文字データ101および画像データ102であり、第2層(中間層)が文字特徴データ(単語頻度データ111)および画像特徴データ(CNNデータ112)であり、第3層(出力層)が全結合層データ121である。
記事効果データ131とは、過去記事データ11に対応付けられている教師データのラベル(いいね数などの記事の評価点)である。機械学習部21は、このようにして生成したニューラルネットワークに対して、過去記事データ11を次々に入力(伝搬)させることで、ニューラルネットワークを学習させる。
効果予想部22は、入力された予測記事データ12を構文解析することで、文字データ201および画像データ202を抽出する。
効果予想部22は、抽出した文字データ201および画像データ202を図3で作成したニューラルネットワークに入力することで、予測記事データ12に対するラベル(いいね数などの記事の評価点)を予想する。具体的には、効果予想部22は、文字データ201および画像データ202を、それぞれのデータ形式に合った中間層に入力する。
また、改善計算部23は、非特許文献1に記載されているように、学習結果として特徴DB13に保存しておいたスタイル情報を画像データ202に適用した改善画像データ232を生成し、アドバイス画像としてユーザに提示する。
例えば、過去記事データ11からいいね数が多い記事から、明るい配色のスタイル情報が抽出されたとする。そして、予測記事データ12の画像データ202からは暗い配色のスタイル情報が抽出されたとき、改善計算部23は、明るい配色のスタイル情報を参照して、画像データ202をより明るくした改善画像データ232を生成する。
機械学習部21は、過去記事データ11から抽出した文字データ101をもとに、単語頻度データ111を抽出するように、形態素解析部31に指示する。形態素解析部31は、文字データ101から形態素解析により分割された各単語に対して、その出現回数(使用頻度)を集計して単語頻度データ111(詳細は図7)を作成し、その単語頻度データ111を過去記事データ11の集合から学習する特徴データとして、特徴DB13に登録する。
形態素解析部31は、図5の学習工程と同様に、予測記事データ12の文字データ201に対して形態素解析により単語の集合に分割する。
スコア計算部32は、図5の学習工程で得た単語頻度データ111と、形態素解析部31による予測記事データ12の単語の集合とをもとに、単語ごとにスコアリングする。このスコアとは、予測記事データ12に出現する各単語について、スコアが高いほど、別の単語に書き換えた方がよい度合いを示す。そして、改善文字データ233とは、書き換え先となる別の単語のリストである。
学習工程では、形態素解析部31は、過去記事データ11から単語頻度データ111を抽出する。単語頻度データ111は、「空前絶後が200回出現」、「浪漫が150回出現」、…などの単語ごとの出現頻度である。
適用工程では、まず、形態素解析部31は、予測記事データ12から単語の集合を抽出する。ここでは、前代未聞、ロマン、さっぱり、…などの単語が抽出されたとする。
(単語のスコア)=(予測記事データ12の単語)と(単語頻度データ111の単語)との類似度×(単語頻度データ111の使用頻度)
例えば、「前代未聞」と「空前絶後」との類似度が2.8なら、「前代未聞」のスコア=2.8×200=560となる。この単語ごとの集計スコアは、全結合層データ121に入力される。
例えば、今回試作した広告B案には、「前代未聞」という単語が記載されていた。しかし、人気の記事(過去記事データ11)には、「前代未聞」ではなく、意味が類似する「空前絶後」という単語が多く記載されていた。よって、改善計算部23は、「前代未聞」を高スコアの「空前絶後」や「画期的」などに書き換える旨の改善文字データ233をユーザに提示する。
これにより、広告B案を公開する前に「前代未聞」を「空前絶後」に書き換えさせることで、広告B案の趣旨を大きく変えることなく、広告B案の印象を改善できる。
さらに、改善計算部23が過去記事データ11から抽出した単語頻度データ111をもとに、予測記事データ12の単語を書き換える提案をすることで、予測記事データ12の内容に踏み込んだ改善をユーザに促すことができる。
また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。
また、各実施例の構成の一部について、他の構成の追加・削除・置換をすることが可能である。また、上記の各構成、機能、処理部、処理手段などは、それらの一部または全部を、例えば集積回路で設計するなどによりハードウェアで実現してもよい。
また、前記の各構成、機能などは、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。
また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際にはほとんど全ての構成が相互に接続されていると考えてもよい。
11 過去記事データ
12 予測記事データ
13 特徴DB
21 機械学習部
22 効果予想部
23 改善計算部
31 形態素解析部
32 スコア計算部
33 スコア合計部
101 文字データ
102 画像データ
111 単語頻度データ
112 CNNデータ
121 全結合層データ
131 記事効果データ
201 文字データ
202 画像データ
231 効果予想データ
232 改善画像データ
233 改善文字データ
Claims (4)
- 過去記事データの文字データとして取得された各単語の出現頻度を集計した結果を、文字特徴データとして記憶部に記憶する機械学習部と、
入力された予測記事データの文字データとして取得された各単語について、前記文字特徴データの単語との類似度が高いほど、かつ、前記文字特徴データの出現頻度が高いほど高得点とする評価関数を計算することで、各単語のスコアを計算し、
前記予測記事データの各単語について、前記スコアが高い前記文字特徴データの単語を書き換え候補として、前記予測記事データの単語の書き換えを促す旨を提示する改善計算部と、を有することを特徴とする
記事解析装置。 - 前記機械学習部は、前記過去記事データの前記文字特徴データに加えて、前記過去記事データの画像データから取得した画像特徴データも記憶部に記憶した上で、前記過去記事データの文字データおよび画像データの入力を受け付ける第1層と、前記文字特徴データおよび前記画像特徴データに対応する第2層と、前記第2層の前記文字特徴データおよび前記画像特徴データを結合し、前記過去記事データごとの評価点を出力する第3層と、を入力側から順に接続したニューラルネットワークを形成し、
前記記事解析装置は、さらに、前記予測記事データの文字データおよび画像データを前記ニューラルネットワークの前記第1層に入力することで、前記第3層から出力された前記予測記事データの評価点を前記予測記事データの効果の予想データとして提示する効果予想部を有することを特徴とする
請求項1に記載の記事解析装置。 - 前記機械学習部は、前記過去記事データごとの評価点として、社会的ネットワークサービスに投稿された前記過去記事データに対する読者からの反応数を用いることを特徴とする
請求項2に記載の記事解析装置。 - 記事解析装置は、機械学習部と、改善計算部と、を有しており、
前記機械学習部は、過去記事データの文字データとして取得された各単語の出現頻度を集計した結果を、文字特徴データとして記憶部に記憶し、
前記改善計算部は、
入力された予測記事データの文字データとして取得された各単語について、前記文字特徴データの単語との類似度が高いほど、かつ、前記文字特徴データの出現頻度が高いほど高得点とする評価関数を計算することで、各単語のスコアを計算し、
前記予測記事データの各単語について、前記スコアが高い前記文字特徴データの単語を書き換え候補として、前記予測記事データの単語の書き換えを促す旨を提示することを特徴とする
記事解析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018177743A JP6592574B1 (ja) | 2018-09-21 | 2018-09-21 | 記事解析装置、および、記事解析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018177743A JP6592574B1 (ja) | 2018-09-21 | 2018-09-21 | 記事解析装置、および、記事解析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6592574B1 true JP6592574B1 (ja) | 2019-10-16 |
JP2020047229A JP2020047229A (ja) | 2020-03-26 |
Family
ID=68234884
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018177743A Active JP6592574B1 (ja) | 2018-09-21 | 2018-09-21 | 記事解析装置、および、記事解析方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6592574B1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112529615A (zh) * | 2020-11-30 | 2021-03-19 | 北京百度网讯科技有限公司 | 自动生成广告的方法、装置、设备和计算机可读存储介质 |
JP7143483B1 (ja) * | 2021-06-18 | 2022-09-28 | ヤフー株式会社 | 情報処理装置、情報処理方法および情報処理プログラム |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08221439A (ja) * | 1995-02-15 | 1996-08-30 | Oki Electric Ind Co Ltd | テキストファイルの自動分類方法 |
JP2011090348A (ja) * | 2007-12-25 | 2011-05-06 | J Magic Kk | 広告管理システム、広告管理サーバ、広告管理方法、プログラム、および閲覧クライアント |
JP5366179B2 (ja) * | 2008-05-23 | 2013-12-11 | 独立行政法人情報通信研究機構 | 情報の重要度推定システム及び方法及びプログラム |
JP4999796B2 (ja) * | 2008-07-18 | 2012-08-15 | ヤフー株式会社 | 配信された広告に関する情報を蓄積するサーバ、方法及びプログラム |
JP5085584B2 (ja) * | 2009-02-20 | 2012-11-28 | ヤフー株式会社 | 記事特徴語抽出装置、記事特徴語抽出方法及びプログラム |
JP5506875B2 (ja) * | 2012-09-05 | 2014-05-28 | ヤフー株式会社 | 広告主向け参考情報提供装置 |
US20140258001A1 (en) * | 2013-03-08 | 2014-09-11 | DataPop, Inc. | Systems and Methods for Determining Net-New Keywords in Expanding Live Advertising Campaigns in Targeted Advertising Systems |
-
2018
- 2018-09-21 JP JP2018177743A patent/JP6592574B1/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2020047229A (ja) | 2020-03-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhang et al. | Predicting the helpfulness of online product reviews: A multilingual approach | |
JP7000341B2 (ja) | 機械学習に基づくウェブインタフェース生成及びテストシステム | |
Rodríguez-Ibánez et al. | A review on sentiment analysis from social media platforms | |
Huberty | Awaiting the second big data revolution: from digital noise to value creation | |
CN110363213B (zh) | 服装图像的认知分析和分类的方法和系统 | |
US9639846B2 (en) | System and method for providing targeted content | |
Samani et al. | Cross-platform and cross-interaction study of user personality based on images on Twitter and Flickr | |
US9798820B1 (en) | Classification of keywords | |
US20180253649A1 (en) | Method and system for finding a solution to a provided problem by selecting a winner in evolutionary optimization of a genetic algorithm | |
US20160085855A1 (en) | Perspective data analysis and management | |
Yan | Research dynamics: Measuring the continuity and popularity of research topics | |
CN105009117B (zh) | 在线社交网络中的模糊结构化搜索查询 | |
JP7280705B2 (ja) | 機械学習装置、プログラム及び機械学習方法 | |
Thilagavathy et al. | Artificial intelligence on digital marketing-An overview | |
Park et al. | Understanding the representation and representativeness of age in AI data sets | |
US20210097571A1 (en) | Cross-domain contextual targeting without any in-domain labelled data | |
JP6592574B1 (ja) | 記事解析装置、および、記事解析方法 | |
CN111612588A (zh) | 商品呈现方法及装置、计算设备、计算机可读存储介质 | |
She et al. | Which social media posts generate the most buzz? Evidence from WeChat | |
Jha et al. | Reputation systems: Evaluating reputation among all good sellers | |
EP3374879A1 (en) | Provide interactive content generation for document | |
Addepalli et al. | A proposed framework for measuring customer satisfaction and product recommendation for ecommerce | |
US20210312502A1 (en) | System and method for generating customized advertisement | |
US20210240737A1 (en) | Identifying anonymized resume corpus data pertaining to the same individual | |
JP7440477B2 (ja) | 自然言語処理およびレコメンデーション生成のためのマルチモデル手法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190314 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20190314 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20190424 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190710 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190910 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190920 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6592574 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |