JP2020047229A - Article analyzer and article analysis method - Google Patents
Article analyzer and article analysis method Download PDFInfo
- Publication number
- JP2020047229A JP2020047229A JP2018177743A JP2018177743A JP2020047229A JP 2020047229 A JP2020047229 A JP 2020047229A JP 2018177743 A JP2018177743 A JP 2018177743A JP 2018177743 A JP2018177743 A JP 2018177743A JP 2020047229 A JP2020047229 A JP 2020047229A
- Authority
- JP
- Japan
- Prior art keywords
- data
- article
- word
- character
- past
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
Description
本発明は、記事解析装置、および、記事解析方法に関する。 The present invention relates to an article analysis device and an article analysis method.
近年、深層学習(Deep Learning)を活用することによる、人工知能(AI:Artificial Intelligence)の発展が注目されている。ネットワーク技術の進歩により大量のデータを効率的に収集できるようになったため、そのデータから何らかの知見を機械学習させることで、人間と同等の作業をさせる計算モデルの構築に期待がかかる。 2. Description of the Related Art In recent years, attention has been paid to the development of artificial intelligence (AI) by utilizing deep learning. With the advancement of network technology, a large amount of data can be efficiently collected. Therefore, it is expected to construct a computation model that performs work equivalent to humans by machine learning some knowledge from the data.
人工知能の主要な適用分野として、画像データを入力データとして、その画像データをいずれかのカテゴリに分類する画像認識処理が挙げられる。例えば、非特許文献1には、人間がどのようにして芸術的な画像を視覚的に知覚するかを示す視覚モデルを、ディープニューラルネットワークとしてモデル化する試みが記載されている。ディープニューラルネットワークは、視覚情報を階層的に処理する小さな計算単位の層により構成される畳み込みニューラルネットワークである。 A main application field of artificial intelligence is image recognition processing in which image data is used as input data and the image data is classified into any category. For example, Non-Patent Document 1 describes an attempt to model a visual model showing how a human visually perceives an artistic image as a deep neural network. A deep neural network is a convolutional neural network composed of layers of small calculation units that hierarchically process visual information.
CM、看板、ポスターなどの広告記事についても、人間がどのようにして知覚するかを示す広告認識モデルを、機械的に作成したいニーズがある。そして、広告代理店などの広告提供側のユーザが広告認識モデルを用いることで、作成した広告を実際にCMなどで世の中に公表して評判を得る前の段階で、広告の効果を予想することが期待される。 There is also a need to mechanically create an advertisement recognition model indicating how a human perceives an advertisement article such as a CM, a signboard, and a poster. Then, by using an advertisement recognition model, a user on the advertisement providing side, such as an advertising agency, expects the effects of the advertisement before the advertisement created by the advertisement is actually published to the public in CM or the like and the reputation is obtained. There is expected.
非特許文献1などの従来の人工知能の研究では、類似する広告をグルーピングするなどの大まかな機械認識にとどまる。よって、広告提供側にとって、試作した広告案をどのように評価し、どのように改善するかという中身に踏み込んだ有益な提案をするシステムにまでは至っていなかった。 In the research of the conventional artificial intelligence such as Non-Patent Literature 1, general machine recognition such as grouping similar advertisements is limited. Therefore, there has not been a system for an advertisement provider to provide a useful proposal that goes into the content of how to evaluate a prototype advertisement proposal and how to improve it.
そこで、本発明は、過去の広告記事から得た知見をもとに、今回入力された広告案に対する有益な提案をすることを、主な課題とする。 Therefore, the main object of the present invention is to make a useful proposal for the currently input advertisement plan based on knowledge obtained from past advertisement articles.
前記課題を解決するために、本発明の記事解析装置は、以下の特徴を有する。
本発明は、過去記事データの文字データとして取得された各単語の出現頻度を集計した結果を、文字特徴データとして記憶部に記憶する機械学習部と、
入力された予測記事データの文字データとして取得された各単語について、前記文字特徴データの単語との類似度が高いほど、かつ、前記文字特徴データの出現頻度が高いほど高得点とする評価関数を計算することで、各単語のスコアを計算し、
前記予測記事データの各単語について、前記スコアが高い前記文字特徴データの単語を書き換え候補として、前記予測記事データの単語の書き換えを促す旨を提示する改善計算部と、を有することを特徴とする。
その他の手段は、後記する。
In order to solve the above-described problems, an article analysis device according to the present invention has the following features.
The present invention provides a machine learning unit that stores, in a storage unit, a result of counting the frequency of appearance of each word acquired as character data of past article data as character feature data,
For each word acquired as the character data of the input predicted article data, the higher the degree of similarity with the word of the character feature data, and the higher the score of the appearance function of the character feature data, the higher the evaluation function that is scored. By calculating, the score of each word is calculated,
An improvement calculation unit that presents a message that prompts rewriting of the word of the predicted article data, with the word of the character feature data having the higher score as a rewriting candidate for each word of the predicted article data. .
Other means will be described later.
本発明によれば、過去の広告記事から得た知見をもとに、今回入力された広告案に対する有益な提案をすることができる。 ADVANTAGE OF THE INVENTION According to this invention, a useful proposal with respect to the advertisement plan input this time can be made based on the knowledge obtained from the past advertisement articles.
以下、本発明の一実施形態について、図面を参照して詳細に説明する。 Hereinafter, an embodiment of the present invention will be described in detail with reference to the drawings.
図1は、記事解析装置1の構成図である。
記事解析装置1は、過去記事データ11と、予測記事データ12と、特徴DB13とを記憶部に記憶する。記事解析装置1は、機械学習部21と、効果予想部22と、改善計算部23と、形態素解析部31と、スコア計算部32と、スコア合計部33とを処理部として有する。
記事解析装置1は、CPU(Central Processing Unit)と、メモリと、ハードディスクなどの記憶手段(記憶部)と、ネットワークインタフェースとを有するコンピュータとして構成される。
このコンピュータは、CPUが、メモリ上に読み込んだプログラム(アプリケーションや、その略のアプリとも呼ばれる)を実行することにより、各処理部により構成される制御部(制御手段)を動作させる。
FIG. 1 is a configuration diagram of the article analysis device 1.
The article analysis device 1 stores past
The article analysis device 1 is configured as a computer having a CPU (Central Processing Unit), a memory, storage means (storage unit) such as a hard disk, and a network interface.
In this computer, a CPU executes a program (also called an application or an abbreviation for an application) read into a memory, thereby operating a control unit (control unit) including each processing unit.
過去記事データ11は、記事とその評価点とが対応付けられるデータであり、機械学習におけるラベル付きの教師データとして事前に入力される。過去記事データ11の記事とは、例えば、CM、看板、ポスターなどの広告を示す記事であり、社会的ネットワークサービス(SNS:social networking service)などのネットに公開されているものである。
過去記事データ11の評価点とは、公開された記事に対する読者からの評価(効果)を定量的に示すラベルである。この評価点は、例えば、ネットからのアクセスデータとして、記事へのアクセス数や、記事に対する読者からの反応数であるいいね数、リツイート数、リプライ数などである。なお、「いいね」とは、読者が好印象と判断した記事に対して、1クリック(1タッチ)で記事を評価する操作であり、アプリによっては「お気に入り」や「ファボ(Favorite)」とも呼ばれる。
または、評価点は、記事で紹介された商品に対する市場からの反応としての、売上げデータでもよい。
以下、図2を参照して、記事解析装置1のうちの過去記事データ11以外の構成要素を説明する。
The
The evaluation score of the
Alternatively, the evaluation point may be sales data as a response from the market to the product introduced in the article.
Hereinafter, with reference to FIG. 2, components other than the
図2は、記事解析装置1の処理を示すフローチャートである。
機械学習部21は、過去記事データ11を教師データとして機械学習し、その結果である回帰(Regression)の予測モデルを作成する。予測モデルは、例えば、過去記事データ11の特徴を示す単語(キーワード)として、特徴DB13に格納される(S11)。
なお、予測モデルは、例えば、入力層、中間層、出力層を順に接続し、それぞれの層を情報伝達させるニューラルネットワークとして構成される。中間層が多階層(複数階層)であるときは、機械学習部21は、ディープラーニングにより予測モデルを作成する。
FIG. 2 is a flowchart showing the processing of the article analysis device 1.
The
The prediction model is configured as, for example, a neural network that connects an input layer, an intermediate layer, and an output layer in order and transmits information to each layer. When the intermediate layer has multiple layers (multiple layers), the
記事解析装置1は、予測記事データ12の入力を受け付ける(S12)。入力される予測記事データ12は、未公開の試作段階などで評価点が未定のものであり、予測モデルを用いて予測する対象の記事である。なお、予測記事データ12は、これから宣伝で使用しようとしている広告A案、広告B案、広告C案など複数のデータを事前に用意しておくことが望ましい。
The article analysis device 1 receives an input of the predicted article data 12 (S12). The input predicted
効果予想部22は、特徴DB13から読み出した予測モデルを用いて、S12で入力されたそれぞれの予測記事データ12の評価点を予想する(S13)。なお、評価点の高い記事だけでなく、評価点の低い記事も過去記事データ11として活用することが望ましい。これにより、効果予想部22は、例えば、読者に不快な単語を含む予測記事データ12を、「評価点の低い」と適切に予想することができる。
The
改善計算部23は、過去記事データ11に記載される単語を特徴DB13から参照し、予測記事データ12の記事内容を改善する改善案を作成する(S14)。よって、今回入力された予測記事データ12を高評価の過去記事データ11に近づけるような改善案を作成するために、過去記事データ11として、過去にいいねを大量に獲得した記事など評価点の高い記事を事前に集めておくことが望ましい。
The
記事解析装置1は、S13で予想した予測記事データ12の広告効果(評価点)と、S14で作成した予測記事データ12に対する改善案とを表示する(S15)。この表示により、ユーザは、最高点の評価点となる広告B案を採用するなどの意志決定を行ったり、広告B案に記載される単語を過去の人気記事に類似するように書き換えるなどの改善案を採用したりできる。つまり、ユーザは、評価点および改善案をもとに、売上に貢献する予測記事データ12を知ることができる。
なお、記事解析装置1は、効果予想部22の評価点と、改善計算部23の改善案とを同時に表示することとしたが、いずれか片方の表示だけでもユーザにとって有益である。よって、効果予想部22および改善計算部23のいずれか1つだけを備えた記事解析装置1として構成してもよい。
The article analysis device 1 displays the advertisement effect (evaluation score) of the predicted
Note that the article analysis device 1 displays the evaluation points of the
図3は、過去記事データ11の文字データおよび画像データを対象とした、ニューラルネットワークの学習工程を示す説明図である。図3の学習工程は、図2ではS11の処理に該当する。
機械学習部21は、過去記事データ11を構文解析することで、文字データ101および画像データ102を抽出する。文字データ101として、過去記事データ11に記載されたテキストデータを抽出してもよいし、過去記事データ11に添付された音声データや動画データからテキストデータを音声認識により機械抽出してもよい。画像データ102は、1枚ずつの画像ファイルから構成されていてもよいし、過去記事データ11の動画データから抽出した画像ファイルの集合として構成されていてもよい。
FIG. 3 is an explanatory diagram showing a neural network learning process for character data and image data of the
The
機械学習部21は、画像データ102を入力として、畳み込みニューラルネットワーク(畳込層)であるCNN(Convolutional Neural Network)データ112を作成する。そして、機械学習部21は、非特許文献1に記載されているように、CNNデータ112からスタイル情報を抽出し、そのスタイル情報を特徴DB13に登録する。スタイル情報は、画像データ102の学習結果であり、アドバイス画像(図4の改善画像データ232)を生成するための画像の特徴情報である。
The
機械学習部21は、文字データ101から抽出した単語頻度データ111を、特徴DB13に登録する(詳細は図5)。機械学習部21は、単語頻度データ111と、CNNデータ112とを、全結合層データ121に結合させることで、ニューラルネットワークを作成する。機械学習部21は、全結合層データ121の出力先を記事効果データ131に対応付ける。
つまり、ニューラルネットワークの第1層(入力層)が文字データ101および画像データ102であり、第2層(中間層)が文字特徴データ(単語頻度データ111)および画像特徴データ(CNNデータ112)であり、第3層(出力層)が全結合層データ121である。
記事効果データ131とは、過去記事データ11に対応付けられている教師データのラベル(いいね数などの記事の評価点)である。機械学習部21は、このようにして生成したニューラルネットワークに対して、過去記事データ11を次々に入力(伝搬)させることで、ニューラルネットワークを学習させる。
The
That is, the first layer (input layer) of the neural network is
The
図4は、予測記事データ12の文字データおよび画像データを対象とした、ニューラルネットワークの推論工程を示す説明図である。図4の推論工程は、図2ではS13およびS14の処理に該当する。
効果予想部22は、入力された予測記事データ12を構文解析することで、文字データ201および画像データ202を抽出する。
効果予想部22は、抽出した文字データ201および画像データ202を図3で作成したニューラルネットワークに入力することで、予測記事データ12に対するラベル(いいね数などの記事の評価点)を予想する。具体的には、効果予想部22は、文字データ201および画像データ202を、それぞれのデータ形式に合った中間層に入力する。
FIG. 4 is an explanatory diagram showing the inference process of the neural network for the character data and the image data of the predicted
The
The
これにより、特徴DB13から読み出された単語頻度データ111の層と、特徴DB13からスタイル情報として読み出されたCNNデータ112の層から、それぞれ全結合層データ121への情報伝搬が発生し、その結果が記事効果データ131と同様の形式である効果予想データ231へと伝搬する。よって、ユーザは、予測記事データ12がどれだけいいね数を得られるかなどの予測を知ることができる。
As a result, information is propagated from the layer of the
さらに、改善計算部23は、図6で後述するとおり、学習結果として特徴DB13に保存しておいた別の単語を文字データ201に適用した改善文字データ233を生成し、ユーザに提示する。
また、改善計算部23は、非特許文献1に記載されているように、学習結果として特徴DB13に保存しておいたスタイル情報を画像データ202に適用した改善画像データ232を生成し、アドバイス画像としてユーザに提示する。
例えば、過去記事データ11からいいね数が多い記事から、明るい配色のスタイル情報が抽出されたとする。そして、予測記事データ12の画像データ202からは暗い配色のスタイル情報が抽出されたとき、改善計算部23は、明るい配色のスタイル情報を参照して、画像データ202をより明るくした改善画像データ232を生成する。
Further, as described later with reference to FIG. 6, the
Further, as described in Non-Patent Document 1, the
For example, it is assumed that bright color style information is extracted from an article having a large number of likes from the
以上、図3,図4を参照して、文字データおよび画像データを対象としたニューラルネットワークを用いた予測記事データ12の解析処理を説明した。非特許文献1では、画像データを対象としたニューラルネットワークだけが構築されていた。本実施形態では、この画像データのニューラルネットワークに対して、新たに文字データの層を組み込むことで、文字データも画像データも含む予測記事データ12の予測処理を精度よく行うことができる。
The analysis processing of the predicted
図5は、過去記事データ11の文字データを対象とした、特徴DB13の学習工程を示す説明図である。図5の学習工程は、図2ではS11の処理に該当する。
機械学習部21は、過去記事データ11から抽出した文字データ101をもとに、単語頻度データ111を抽出するように、形態素解析部31に指示する。形態素解析部31は、文字データ101から形態素解析により分割された各単語に対して、その出現回数(使用頻度)を集計して単語頻度データ111(詳細は図7)を作成し、その単語頻度データ111を過去記事データ11の集合から学習する特徴データとして、特徴DB13に登録する。
FIG. 5 is an explanatory diagram illustrating a learning process of the
The
図6は、予測記事データ12の文字データを対象とした、特徴DB13の適用工程を示す説明図である。図6の適用工程は、図2ではS13およびS14の処理に該当する。
形態素解析部31は、図5の学習工程と同様に、予測記事データ12の文字データ201に対して形態素解析により単語の集合に分割する。
スコア計算部32は、図5の学習工程で得た単語頻度データ111と、形態素解析部31による予測記事データ12の単語の集合とをもとに、単語ごとにスコアリングする。このスコアとは、予測記事データ12に出現する各単語について、スコアが高いほど、別の単語に書き換えた方がよい度合いを示す。そして、改善文字データ233とは、書き換え先となる別の単語のリストである。
FIG. 6 is an explanatory diagram showing a process of applying the
The
The
さらに、スコア合計部33は、スコアリングの結果を予測記事データ12ごと(記事のページごと)に合計し、その合計値を全結合層データ121への入力とする。図4で説明したように、効果予想部22は、全結合層データ121から効果予想データ231に対応付けることで、予測記事データ12ごとのいいね数などの記事の評価点を予想する。
Further, the
図7は、図5および図6の文字データに関する具体例である。
学習工程では、形態素解析部31は、過去記事データ11から単語頻度データ111を抽出する。単語頻度データ111は、「空前絶後が200回出現」、「浪漫が150回出現」、…などの単語ごとの出現頻度である。
適用工程では、まず、形態素解析部31は、予測記事データ12から単語の集合を抽出する。ここでは、前代未聞、ロマン、さっぱり、…などの単語が抽出されたとする。
FIG. 7 is a specific example of the character data of FIGS.
In the learning step, the
In the application step, first, the
次に、スコア合計部33は、スコア計算部32が以下の式で計算した単語ごとのスコアを、予測記事データ12ごとに合計した集計スコアを求める。
(単語のスコア)=(予測記事データ12の単語)と(単語頻度データ111の単語)との類似度×(単語頻度データ111の使用頻度)
例えば、「前代未聞」と「空前絶後」との類似度が2.8なら、「前代未聞」のスコア=2.8×200=560となる。この単語ごとの集計スコアは、全結合層データ121に入力される。
Next, the
(Score of word) = Similarity between (word of predicted article data 12) and (word of word frequency data 111) × (frequency of use of word frequency data 111)
For example, if the similarity between “unheard of before” and “after unprecedented” is 2.8, the score of “unheard of before” = 2.8 × 200 = 560. The total score for each word is input to the all
そして、改善計算部23は、予測記事データ12の単語ごとに、スコアが高い順に、単語頻度データ111の類似する単語のリスト(1位、2位、3位、…)を、改善文字データ233として抽出する。
例えば、今回試作した広告B案には、「前代未聞」という単語が記載されていた。しかし、人気の記事(過去記事データ11)には、「前代未聞」ではなく、意味が類似する「空前絶後」という単語が多く記載されていた。よって、改善計算部23は、「前代未聞」を高スコアの「空前絶後」や「画期的」などに書き換える旨の改善文字データ233をユーザに提示する。
これにより、広告B案を公開する前に「前代未聞」を「空前絶後」に書き換えさせることで、広告B案の趣旨を大きく変えることなく、広告B案の印象を改善できる。
Then, the
For example, the word "unprecedented" was described in the prototype of the advertisement B produced this time. However, in a popular article (past article data 11), not the word "unheard of" but a lot of words with similar meanings "unprecedented". Therefore, the
Thereby, by rewriting “unheard of before” to “after all” before releasing the advertisement B plan, the impression of the advertisement B plan can be improved without largely changing the purpose of the advertisement B plan.
以上説明した本実施形態では、効果予想部22が過去記事データ11からニューラルネットワークを機械学習することで、予測記事データ12の効果を予測できる。ここで、過去記事データ11の学習データとして、いいね数などのSNSの口コミ効果の情報を用いることで、市場の評判を示すデータを手軽に入手できる。
さらに、改善計算部23が過去記事データ11から抽出した単語頻度データ111をもとに、予測記事データ12の単語を書き換える提案をすることで、予測記事データ12の内容に踏み込んだ改善をユーザに促すことができる。
In the present embodiment described above, the effect of the predicted
Further, the
なお、本発明は前記した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、前記した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。
また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。
また、各実施例の構成の一部について、他の構成の追加・削除・置換をすることが可能である。また、上記の各構成、機能、処理部、処理手段などは、それらの一部または全部を、例えば集積回路で設計するなどによりハードウェアで実現してもよい。
また、前記の各構成、機能などは、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。
Note that the present invention is not limited to the above-described embodiment, and includes various modifications. For example, the above-described embodiment has been described in detail in order to explain the present invention in an easy-to-understand manner, and is not necessarily limited to one having all the described configurations.
Further, a part of the configuration of one embodiment can be replaced with the configuration of another embodiment, and the configuration of one embodiment can be added to the configuration of another embodiment.
Also, for a part of the configuration of each embodiment, it is possible to add, delete, or replace another configuration. In addition, each of the above-described configurations, functions, processing units, processing means, and the like may be partially or entirely realized by hardware by, for example, designing an integrated circuit.
In addition, the above-described configurations, functions, and the like may be implemented by software by a processor interpreting and executing a program that implements each function.
各機能を実現するプログラム、テーブル、ファイルなどの情報は、メモリや、ハードディスク、SSD(Solid State Drive)などの記録装置、または、IC(Integrated Circuit)カード、SDカード、DVD(Digital Versatile Disc)などの記録媒体に置くことができる。
また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際にはほとんど全ての構成が相互に接続されていると考えてもよい。
Information such as programs, tables, and files that realize each function is stored in a memory, hard disk, recording device such as SSD (Solid State Drive), IC (Integrated Circuit) card, SD card, DVD (Digital Versatile Disc), etc. Recording media.
In addition, control lines and information lines are shown as necessary for the description, and do not necessarily indicate all control lines and information lines on a product. In fact, almost all components may be considered to be interconnected.
1 記事解析装置
11 過去記事データ
12 予測記事データ
13 特徴DB
21 機械学習部
22 効果予想部
23 改善計算部
31 形態素解析部
32 スコア計算部
33 スコア合計部
101 文字データ
102 画像データ
111 単語頻度データ
112 CNNデータ
121 全結合層データ
131 記事効果データ
201 文字データ
202 画像データ
231 効果予想データ
232 改善画像データ
233 改善文字データ
DESCRIPTION OF SYMBOLS 1
Claims (4)
入力された予測記事データの文字データとして取得された各単語について、前記文字特徴データの単語との類似度が高いほど、かつ、前記文字特徴データの出現頻度が高いほど高得点とする評価関数を計算することで、各単語のスコアを計算し、
前記予測記事データの各単語について、前記スコアが高い前記文字特徴データの単語を書き換え候補として、前記予測記事データの単語の書き換えを促す旨を提示する改善計算部と、を有することを特徴とする
記事解析装置。 A machine learning unit that stores, in the storage unit, the result of counting the appearance frequencies of the words acquired as the character data of the past article data as character feature data,
For each word acquired as the character data of the input predicted article data, the higher the degree of similarity with the word of the character feature data, and the higher the score of the appearance function of the character feature data, the higher the evaluation function that is scored. By calculating, the score of each word is calculated,
An improvement calculation unit that presents a message that prompts rewriting of the word of the predicted article data, with the word of the character feature data having the higher score as a rewriting candidate for each word of the predicted article data. Article analysis device.
前記記事解析装置は、さらに、前記予測記事データの文字データおよび画像データを前記ニューラルネットワークの前記第1層に入力することで、前記第3層から出力された前記予測記事データの評価点を前記予測記事データの効果の予想データとして提示する効果予想部を有することを特徴とする
請求項1に記載の記事解析装置。 The machine learning unit stores, in addition to the character feature data of the past article data, image feature data acquired from the image data of the past article data in a storage unit, and stores the character data and the image of the past article data. A first layer for receiving data input, a second layer corresponding to the character feature data and the image feature data, and combining the character feature data and the image feature data of the second layer with the past article data; Form a neural network in which the third layer that outputs the evaluation points of is connected in order from the input side,
The article analysis device further inputs the character data and the image data of the predicted article data to the first layer of the neural network, so that the score of the predicted article data output from the third layer is calculated. The article analysis device according to claim 1, further comprising an effect prediction unit that presents the effect data of the prediction article data as prediction data.
請求項2に記載の記事解析装置。 The article analysis device according to claim 2, wherein the machine learning unit uses the number of responses from readers to the past article data posted to a social network service as an evaluation score for each piece of past article data. .
前記機械学習部は、過去記事データの文字データとして取得された各単語の出現頻度を集計した結果を、文字特徴データとして記憶部に記憶し、
前記改善計算部は、
入力された予測記事データの文字データとして取得された各単語について、前記文字特徴データの単語との類似度が高いほど、かつ、前記文字特徴データの出現頻度が高いほど高得点とする評価関数を計算することで、各単語のスコアを計算し、
前記予測記事データの各単語について、前記スコアが高い前記文字特徴データの単語を書き換え候補として、前記予測記事データの単語の書き換えを促す旨を提示することを特徴とする
記事解析方法。 The article analysis device has a machine learning unit and an improvement calculation unit,
The machine learning unit stores, in the storage unit, a result of counting the appearance frequency of each word acquired as character data of past article data as character feature data,
The improvement calculation unit includes:
For each word acquired as the character data of the input predicted article data, the higher the degree of similarity with the word of the character feature data, and the higher the score of the appearance function of the character feature data, the higher the evaluation function that is scored. By calculating, the score of each word is calculated,
An article analysis method, wherein for each word of the predicted article data, a word indicating that the word of the character feature data having a high score is a rewriting candidate is presented to encourage rewriting of the word of the predicted article data.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018177743A JP6592574B1 (en) | 2018-09-21 | 2018-09-21 | Article analysis apparatus and article analysis method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018177743A JP6592574B1 (en) | 2018-09-21 | 2018-09-21 | Article analysis apparatus and article analysis method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6592574B1 JP6592574B1 (en) | 2019-10-16 |
JP2020047229A true JP2020047229A (en) | 2020-03-26 |
Family
ID=68234884
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018177743A Active JP6592574B1 (en) | 2018-09-21 | 2018-09-21 | Article analysis apparatus and article analysis method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6592574B1 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022028881A (en) * | 2020-11-30 | 2022-02-16 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | Method of automatically generating advertisements, apparatus, device, and computer-readable storage medium |
JP2023000721A (en) * | 2021-06-18 | 2023-01-04 | ヤフー株式会社 | Information processing device, information processing method and information processing program |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08221439A (en) * | 1995-02-15 | 1996-08-30 | Oki Electric Ind Co Ltd | Automatic sorting method for text file |
WO2009081936A1 (en) * | 2007-12-25 | 2009-07-02 | J-Magic Inc. | Advertisement management system, advertisement management server, advertisement management method, program, and browse client |
JP2009282795A (en) * | 2008-05-23 | 2009-12-03 | National Institute Of Information & Communication Technology | System, method, and program for estimating level of importance of information |
JP2010026792A (en) * | 2008-07-18 | 2010-02-04 | Yahoo Japan Corp | Server, method and program for storing information about delivered advertising |
JP2010191851A (en) * | 2009-02-20 | 2010-09-02 | Yahoo Japan Corp | Article feature word extraction device, article feature word extraction method and program |
JP2014052740A (en) * | 2012-09-05 | 2014-03-20 | Yahoo Japan Corp | Reference information provision device for advertiser |
US20140258001A1 (en) * | 2013-03-08 | 2014-09-11 | DataPop, Inc. | Systems and Methods for Determining Net-New Keywords in Expanding Live Advertising Campaigns in Targeted Advertising Systems |
-
2018
- 2018-09-21 JP JP2018177743A patent/JP6592574B1/en active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08221439A (en) * | 1995-02-15 | 1996-08-30 | Oki Electric Ind Co Ltd | Automatic sorting method for text file |
WO2009081936A1 (en) * | 2007-12-25 | 2009-07-02 | J-Magic Inc. | Advertisement management system, advertisement management server, advertisement management method, program, and browse client |
JP2009282795A (en) * | 2008-05-23 | 2009-12-03 | National Institute Of Information & Communication Technology | System, method, and program for estimating level of importance of information |
JP2010026792A (en) * | 2008-07-18 | 2010-02-04 | Yahoo Japan Corp | Server, method and program for storing information about delivered advertising |
JP2010191851A (en) * | 2009-02-20 | 2010-09-02 | Yahoo Japan Corp | Article feature word extraction device, article feature word extraction method and program |
JP2014052740A (en) * | 2012-09-05 | 2014-03-20 | Yahoo Japan Corp | Reference information provision device for advertiser |
US20140258001A1 (en) * | 2013-03-08 | 2014-09-11 | DataPop, Inc. | Systems and Methods for Determining Net-New Keywords in Expanding Live Advertising Campaigns in Targeted Advertising Systems |
Non-Patent Citations (1)
Title |
---|
柳本 豪一: "ニューラルネットワークを用いた文書類似度の推定", 第27回全国大会論文集 [CD−ROM] 2013年度 人工知能学会全国大会(第27回)論文集, JPN6019034299, 24 June 2013 (2013-06-24), JP, pages 1 - 2, ISSN: 0004109451 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022028881A (en) * | 2020-11-30 | 2022-02-16 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | Method of automatically generating advertisements, apparatus, device, and computer-readable storage medium |
JP2023000721A (en) * | 2021-06-18 | 2023-01-04 | ヤフー株式会社 | Information processing device, information processing method and information processing program |
Also Published As
Publication number | Publication date |
---|---|
JP6592574B1 (en) | 2019-10-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Liang et al. | Advances, challenges and opportunities in creating data for trustworthy AI | |
JP7034184B2 (en) | Computer implementation methods, computer systems, and computer programs for adaptive evaluation of meta-relationships in semantic graphs. | |
Zhang et al. | Predicting the helpfulness of online product reviews: A multilingual approach | |
Guo et al. | RésuMatcher: A personalized résumé-job matching system | |
Cillo et al. | Niche tourism destinations’ online reputation management and competitiveness in big data era: Evidence from three Italian cases | |
Ghiassi et al. | Targeted twitter sentiment analysis for brands using supervised feature engineering and the dynamic architecture for artificial neural networks | |
CN110363213B (en) | Method and system for cognitive analysis and classification of garment images | |
Bell et al. | Data-driven agent-based exploration of customer behavior | |
Malik | Predicting users’ review helpfulness: the role of significant review and reviewer characteristics | |
Mitra et al. | Helpfulness of online consumer reviews: A multi-perspective approach | |
US10657543B2 (en) | Targeted e-commerce business strategies based on affiliation networks derived from predictive cognitive traits | |
Barbosa et al. | Evaluating hotels rating prediction based on sentiment analysis services | |
Wang et al. | Large-scale ensemble model for customer churn prediction in search ads | |
Bossetta et al. | Cross-platform emotions and audience engagement in social media political campaigning: Comparing candidates’ Facebook and Instagram images in the 2020 US election | |
Singh et al. | Applications of sentiment analysis and machine learning techniques in disease outbreak prediction–A review | |
Thilagavathy et al. | Artificial intelligence on digital marketing-an overview. | |
JP6592574B1 (en) | Article analysis apparatus and article analysis method | |
CN110069686A (en) | User behavior analysis method, apparatus, computer installation and storage medium | |
Yawised et al. | Travelling in the digital world: exploring the adoption of augmented reality (AR) through mobile application in hospitality business sector | |
Chern et al. | Introduction to the special issue on “Data analytics for marketing intelligence” | |
Kanber | Hands-on machine learning with JavaScript: solve complex computational web problems using machine learning | |
Dogan et al. | Turnover, ownership and productivity in Malaysian manufacturing | |
JP6178480B1 (en) | DATA ANALYSIS SYSTEM, ITS CONTROL METHOD, PROGRAM, AND RECORDING MEDIUM | |
Haripriya et al. | Detection of sarcasm from consumer sentiments on social media about luxury brands | |
Pinto et al. | Intelligent and fuzzy systems applied to language & knowledge engineering |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190314 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20190314 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20190424 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190710 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190910 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190920 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6592574 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |