JP2019040415A - 解析装置、解析方法、およびプログラム - Google Patents
解析装置、解析方法、およびプログラム Download PDFInfo
- Publication number
- JP2019040415A JP2019040415A JP2017162196A JP2017162196A JP2019040415A JP 2019040415 A JP2019040415 A JP 2019040415A JP 2017162196 A JP2017162196 A JP 2017162196A JP 2017162196 A JP2017162196 A JP 2017162196A JP 2019040415 A JP2019040415 A JP 2019040415A
- Authority
- JP
- Japan
- Prior art keywords
- analysis
- morphemes
- word
- user
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 106
- 230000000877 morphologic effect Effects 0.000 claims abstract description 15
- 238000006243 chemical reaction Methods 0.000 claims description 42
- 238000012545 processing Methods 0.000 claims description 24
- 230000009471 action Effects 0.000 claims description 12
- 230000006399 behavior Effects 0.000 claims 1
- 238000010801 machine learning Methods 0.000 abstract description 44
- 238000003860 storage Methods 0.000 description 29
- 238000004891 communication Methods 0.000 description 27
- 238000000034 method Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 14
- 230000008859 change Effects 0.000 description 9
- 230000008569 process Effects 0.000 description 8
- 230000001932 seasonal effect Effects 0.000 description 6
- 239000002245 particle Substances 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 235000014510 cooky Nutrition 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000003287 bathing Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000002537 cosmetic Substances 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
解析装置は、一以上のプロセッサによって実現される。解析装置は、コンテンツ画面に対してユーザによって入力された文字列を取得し、取得した文字列について形態素解析を行い、形態素解析の解析結果から得られた第1形態素の集合から、特定期間に集中して入力される特定ワードを除去する。そして、解析装置は、第1形態素の集合から特定ワードを除去した第2の形態素の集合を取得する。このような処理によって、機械学習の学習精度を向上させる学習データを生成することができ、更に、この学習データを用いて学習モデルを生成した場合、機械学習の学習精度を向上させることができる。
[全体構成]
図1は、第1実施形態における解析装置200を含む解析システム1の一例を示す図である。第1実施形態における解析システム1は、例えば、一以上の端末装置10と、サービス提供装置100と、解析装置200とを備える。これらの装置は、ネットワークNWを介して接続される。なお、サービス提供装置100に含まれる構成の一部または全部は、解析装置200に含まれていてもよい。
以下、サービス提供装置100および解析装置200の各構成について説明する。図2は、第1実施形態におけるサービス提供装置100の構成の一例を示す図である。図示のように、サービス提供装置100は、例えば、サービス提供側通信部102と、サービス提供側制御部110と、サービス提供側記憶部130とを備える。
図6は、第1実施形態における解析装置200の構成の一例を示す図である。図示のように、解析装置200は、例えば、解析側通信部202と、解析側制御部210と、解析側記憶部230とを備える。
以下、フローチャートに即して解析側制御部210の各構成要素について説明する。図7は、第1実施形態における解析側制御部210により実行される一連の処理の一例を示すフローチャートである。本フローチャートの処理は、例えば、所定の周期で繰り返し行われてよい。
図13は、第1実施形態における解析側制御部210により実行される一連の処理の他の例を示すフローチャートである。本フローチャートの処理は、例えば、学習モデルが生成された後に実行される。
以下、第2実施形態について説明する。第2実施形態では、学習モデルに従った学習結果に基づいて、検索クエリ等のメッセージを入力したユーザの中から、コンバージョンに関連した情報(以下、コンバージョン関連情報と称する)を提供する対象のユーザを決定する点で上述した第1実施形態と相違する。以下、第1実施形態との相違点を中心に説明し、第1実施形態と共通する点については説明を省略する。なお、第2実施形態の説明において、第1実施形態と同じ部分については同一符号を付して説明する。
以下、第3実施形態について説明する。第3実施形態では、バズワード辞書D4に登録されたワードと合致するワードに加えて、更にそのワードに共起する共起ワードもバズワードとして除去する点で上述した第1および第2実施形態と相違する。以下、第1および第2実施形態との相違点を中心に説明し、第1および第2実施形態と共通する点については説明を省略する。なお、第3実施形態の説明において、第1および第2実施形態と同じ部分については同一符号を付して説明する。
以下、第4実施形態について説明する。第4実施形態では、バズワード辞書D4に登録されたワードと合致しないワードに共起する共起ワードに基づいて、バズワードとして除去する予定のワードの中で、バズワードとしないワードを決定する点で上述した第1実施形態から第3実施形態と相違する。以下、第1実施形態から第3実施形態との相違点を中心に説明し、第1実施形態から第3実施形態と共通する点については説明を省略する。なお、第4実施形態の説明において、第1実施形態から第3実施形態と同じ部分については同一符号を付して説明する。
上述した実施形態の解析システム1に含まれる複数の装置のうち、サービス提供装置100および解析装置200は、例えば、図16に示すようなハードウェア構成により実現される。図16は、実施形態のサービス提供装置100および解析装置200のハードウェア構成の一例を示す図である。
Claims (15)
- コンテンツ画面に対してユーザによって入力された文字列を取得する第1取得部と、
前記第1取得部により取得された前記文字列について形態素解析を行う形態素解析部と、
前記形態素解析部の解析結果から得られた第1形態素の集合から、特定期間に集中して入力される特定ワードを除去する除去部と、
前記除去部より前記第1形態素の集合から前記特定ワードが除去された第2の形態素の集合を取得する第2取得部と、
を備える解析装置。 - 前記ユーザごとの所定の行動の成立の有無に関するコンバージョン情報を取得する第3取得部を更に備える、
請求項1に記載の解析装置。 - 前記第3取得部により取得された前記コンバージョン情報と、前記第2取得部により取得された前記第2の形態素の集合に含まれる形態素とを互いに関連付ける関連付部を更に備える、
請求項2に記載の解析装置。 - 前記第2取得部により取得された前記第2の形態素の集合に含まれる形態素を用いて学習し、形態素を入力データとした場合に分類結果を出力する学習モデルを生成する学習処理部を更に備える、
請求項1から3のうちいずれか1項に記載の解析装置。 - 前記学習処理部は、前記第2の形態素の集合に含まれる形態素と、前記関連付部により前記第2の形態素の集合に含まれる形態素のそれぞれに関連付けられた前記コンバージョン情報との関係に基づいて、前記学習モデルを生成する、
請求項4に記載の解析装置。 - 前記学習モデルは、前記コンテンツ画面に対して入力された文字列から得られた形態素を入力すると、前記文字列から得られた形態素に関連付けられたユーザを、前記所定の行動が成立するユーザか、前記所定の行動が成立しないユーザかのいずれかに分類するものである、
請求項4または5に記載の解析装置。 - 前記学習処理部は、前記生成した学習モデルの分類結果に基づいて、前記第1取得部の取得対象である前記文字列を入力したユーザの中から、情報提供の対象とするユーザを決定する、
請求項4から6のうちいずれか1項に記載の解析装置。 - 前記コンテンツ画面は、情報を検索するためのクエリを入力可能な検索画面であり、
前記第1取得部は、前記ユーザが前記検索画面に対して入力したクエリを、前記文字列として取得する、
請求項1から7のうちいずれか1項に記載の解析装置。 - 前記コンテンツ画面は、ソーシャルネットワークを利用する利用者が閲覧可能なメッセージを投稿するための投稿画面であり、
前記第1取得部は、前記ユーザが前記投稿画面に対して入力したメッセージを、前記文字列として取得する、
請求項1から8のうちいずれか1項に記載の解析装置。 - 前記除去部は、更に、前記特定ワードと共起する形態素を、前記第1形態素の集合から除去する、
請求項1から9のうちいずれか1項に記載の解析装置。 - 前記除去部は、更に、
前記第1形態素の集合の中で、前記特定ワードに合致しない形態素と共起する形態素を、前記特定ワードとして除去する予定の形態素から除外する、
請求項1から10のうちいずれか1項に記載の解析装置。 - 前記除去部は、更に、前記ユーザの利用者の属性に基づいて、前記第1形態素の集合から、前記特定ワードを除去する、
請求項1から11のうちいずれか1項に記載の解析装置。 - 前記除去部は、更に、前記ユーザの位置情報に基づいて、前記第1形態素の集合から、前記特定ワードを除去する、
請求項1から12のうちいずれか1項に記載の解析装置。 - コンピュータが、
コンテンツ画面に対してユーザによって入力された文字列を取得し、
前記取得した前記文字列について形態素解析を行い、
前記形態素解析の解析結果から得た第1形態素の集合から、特定期間に集中して入力される特定ワードを除去し、
前記第1形態素の集合から前記特定ワードを除去した第2の形態素の集合を取得する、
解析方法。 - コンピュータに、
コンテンツ画面に対してユーザによって入力された文字列を取得させ、
前記取得させた前記文字列について形態素解析を行わせ、
前記形態素解析の解析結果から得られた第1形態素の集合から、特定期間に集中して入力される特定ワードを除去させ、
前記第1形態素の集合から前記特定ワードを除去させた第2の形態素の集合を取得させる、
プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017162196A JP6964467B2 (ja) | 2017-08-25 | 2017-08-25 | 解析装置、解析方法、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017162196A JP6964467B2 (ja) | 2017-08-25 | 2017-08-25 | 解析装置、解析方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019040415A true JP2019040415A (ja) | 2019-03-14 |
JP6964467B2 JP6964467B2 (ja) | 2021-11-10 |
Family
ID=65726875
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017162196A Active JP6964467B2 (ja) | 2017-08-25 | 2017-08-25 | 解析装置、解析方法、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6964467B2 (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013033478A (ja) * | 2011-08-01 | 2013-02-14 | Nhn Corp | ブログを推薦するシステム及び方法 |
JP2013149140A (ja) * | 2012-01-20 | 2013-08-01 | Hitachi Consumer Electronics Co Ltd | 情報処理装置、及び、情報処理方法 |
US8768920B1 (en) * | 2008-06-27 | 2014-07-01 | Google Inc. | Posting questions from search queries |
JP2017021469A (ja) * | 2015-07-08 | 2017-01-26 | ヤフー株式会社 | 分類装置、分類方法、及び分類プログラム |
-
2017
- 2017-08-25 JP JP2017162196A patent/JP6964467B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8768920B1 (en) * | 2008-06-27 | 2014-07-01 | Google Inc. | Posting questions from search queries |
JP2013033478A (ja) * | 2011-08-01 | 2013-02-14 | Nhn Corp | ブログを推薦するシステム及び方法 |
JP2013149140A (ja) * | 2012-01-20 | 2013-08-01 | Hitachi Consumer Electronics Co Ltd | 情報処理装置、及び、情報処理方法 |
JP2017021469A (ja) * | 2015-07-08 | 2017-01-26 | ヤフー株式会社 | 分類装置、分類方法、及び分類プログラム |
Non-Patent Citations (2)
Title |
---|
岩田 麻佑、外3名: "変化点に着目したTwitterユーザの購買行動フェーズ推定手法", 第7回データ工学と情報マネジメントに関するフォーラム (第13回日本データベース学会年次大会), JPN6019003114, 4 March 2015 (2015-03-04), JP, pages 1 - 6, ISSN: 0004597774 * |
菊井 玄一郎、外2名: "検索ホットワードとブログ系テキストの関係を探る", 電子情報通信学会技術研究報告, vol. 第112巻,第196号, JPN6016022164, 23 August 2012 (2012-08-23), JP, pages 31 - 36, ISSN: 0004429549 * |
Also Published As
Publication number | Publication date |
---|---|
JP6964467B2 (ja) | 2021-11-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10832008B2 (en) | Computerized system and method for automatically transforming and providing domain specific chatbot responses | |
CN107315759B (zh) | 归类关键字的方法、装置和处理系统、分类模型生成方法 | |
US11087202B2 (en) | System and method for using deep learning to identify purchase stages from a microblog post | |
JP6906419B2 (ja) | 情報提供装置、情報提供方法、およびプログラム | |
US11455660B2 (en) | Extraction device, extraction method, and non-transitory computer readable storage medium | |
US20140335483A1 (en) | Language proficiency detection in social applications | |
JP6415619B2 (ja) | 解析装置、解析方法、およびプログラム | |
KR101816205B1 (ko) | 인터넷 콘텐츠 제공 서버 및 그 방법이 구현된 컴퓨터로 판독 가능한 기록매체 | |
WO2016162843A1 (en) | Processing a search query and retrieving targeted records from a networked database system | |
CN110765973A (zh) | 账号类型的识别方法和装置 | |
US20140337425A1 (en) | Modifying a social graph based on language preference | |
US20200394194A1 (en) | Multi-vertical entity-based search system | |
JP4743766B2 (ja) | 印象判定システム、広告記事生成システム、印象判定方法、広告記事生成方法、印象判定プログラムおよび広告記事生成プログラム | |
JP6719365B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP5492047B2 (ja) | 購買行動分析装置、購買行動分析方法、購買行動分析プログラム、購買行動分析システム及び制御方法 | |
JP6434954B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
KR101652433B1 (ko) | Sns 문서에서 추출된 토픽을 기반으로 파악된 감정에 따른 개인화 광고 제공 방법 | |
US20190347296A1 (en) | Method of recommending at least one skin care product to a user | |
KR20160130369A (ko) | 온라인 상에 게재된 웹 문서 기반 상권 분석 서비스 시스템 및 방법 | |
JP6684894B2 (ja) | 情報をプッシュ配信する方法及び装置 | |
JP6680663B2 (ja) | 情報処理装置、情報処理方法、予測モデルの生成装置、予測モデルの生成方法、およびプログラム | |
CN106708932A (zh) | 问答类网站的回复的摘要提取方法及装置 | |
JP6964467B2 (ja) | 解析装置、解析方法、およびプログラム | |
Zou et al. | Automatic product copywriting for e‐commerce | |
JP7074031B2 (ja) | 情報提供装置、情報提供方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20191101 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20191108 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200305 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201223 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210126 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210315 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210921 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211019 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6964467 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |