JP6384242B2 - 情報分析装置、情報分析方法、及び、プログラム - Google Patents

情報分析装置、情報分析方法、及び、プログラム Download PDF

Info

Publication number
JP6384242B2
JP6384242B2 JP2014199945A JP2014199945A JP6384242B2 JP 6384242 B2 JP6384242 B2 JP 6384242B2 JP 2014199945 A JP2014199945 A JP 2014199945A JP 2014199945 A JP2014199945 A JP 2014199945A JP 6384242 B2 JP6384242 B2 JP 6384242B2
Authority
JP
Japan
Prior art keywords
sentence
text data
execution
target word
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014199945A
Other languages
English (en)
Other versions
JP2016071596A (ja
Inventor
侑吾 西川
侑吾 西川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dai Nippon Printing Co Ltd
Original Assignee
Dai Nippon Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dai Nippon Printing Co Ltd filed Critical Dai Nippon Printing Co Ltd
Priority to JP2014199945A priority Critical patent/JP6384242B2/ja
Publication of JP2016071596A publication Critical patent/JP2016071596A/ja
Application granted granted Critical
Publication of JP6384242B2 publication Critical patent/JP6384242B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、情報分析装置に係り、更に詳しくは、インターネット等を介して投稿されるテキストデータを元に投稿者が興味を持ったことを実際に実行するかどうかを示す有言実行度の指標を求める情報分析装置等に関するものである。
近年、インターネット上に投稿されるブログ等に、さまざまなサービスや商品等に対する個人の意見が公開されている。このような意見を分析して、マーケティングや商品開発、プロモーション等の計画立案に利用するテキストマイニングツールが開発されている。
ブログやTwitter(登録商標)のような投稿テキストデータから、特定のキーワードを含む投稿テキストを抽出することは容易であり、キーワードの注目度合や大まかな意見等の情報を、キーワードの出現頻度や、キーワードの共起語や評価表現を元に提供することは既存手法で可能である。
しかしながら、例えば、投稿テキストでは、「○○のかき氷が食べたい」、「○○のかき氷がすごく美味しかった」のように、「○○のかき氷」を食べた人、食べない人が混在しており、個人の実際の意見を抽出するためには食べた人(特定の人)を言語処理技術等により抽出する必要がある。
また、投稿テキストには「この夏絶対に食べたいかき氷ベスト10http://www.・・・」のように他のテキスト等を参照するものも含まれ、キーワードが含まれる投稿テキスト数の多少から、売上等の影響の大きさを推測することは困難である。
すなわち、頻度によらない重要意見の抽出や、特定のユーザを対象とした意見分析を行いたい場合には、他のデータや言語処理技術が必要である。
従来、インターネット上のテキストを解析し、体験表現及び評価表現の有無を判定し、その情報を元にテキストが口コミ情報であるか否かを判定する手法が提案されている(例えば、特許文献1)。
特許第4293145号公報
しかしながら、特許文献1の方法は、体験可能な対象に関してのみ有効であり、発売前の商品など、体験不可能な対象物には適用できず、売上予測等のマーケティング・リサーチの用途には向かないという問題がある。
本発明は、前述した問題点に鑑みてなされたもので、その目的とするところは、インターネット上等のテキストの分析により、マーケティング予測、プロモーションの立案等に適用可能な情報を提供可能な情報分析装置等を提供することである。
前述した目的を達成するために、第1の発明は、日時情報を有する複数のテキストデータから、抽出対象となる対象語及び前記対象語が係る希望の表現からなる希望文を抽出する希望文抽出手段と、前記テキストデータから、前記対象語及び前記対象語が係る実行を表わす表現からなり、対応する希望文の日時情報より遅い日時情報が対応付けられた実行文を抽出する実行文抽出手段と、前記実行文を有するテキストデータの抽出数と前記希望文を有するテキストデータの抽出数に対する抽出割合からなる有言実行度を算出する有言実行度算出手段と、を具備することを特徴とする情報分析装置である。
ここでいう「対象語」とは、希望文に含まれる、係り受けにおいて希望を示す表現に係る名詞である。
前記テキストデータは、まとまり毎に関連付けされ、前記実行文抽出手段は、前記関連付けを参照して前記希望文に関連するテキストデータを判定し、前記希望文に関連するテキストデータから実行文を抽出する。
ここでいう「まとまり毎に関連付け」されたテキストデータとは、掲示板の同一スレッド内の投稿テキストデータや、ブログのある日記内の投稿テキストデータなど、特定の対象に対して投稿された関連のあるテキストデータである。
また、前記テキストデータは、識別情報を有し、前記希望文抽出手段及び前記実行文抽出手段は、前記識別情報が同一のテキストデータからそれぞれ抽出する。
前記識別情報は、ユーザ毎に固有の情報又は分類分けされた情報である。
前記希望文抽出手段は、希望を示す助動詞又は動詞が含まれる前記テキストデータを希望文として抽出する。
また、前記実行文抽出手段は、前記対象語が係る動詞、形容詞、形容動詞に、過去又は完了の助動詞が付随する前記テキストデータを実行文として抽出する。
また、前記テキストデータは、ウェブサーバを介して抽出されることが望ましい。
第1の発明は、インターネット上等に投稿された複数のテキストデータから、希望文抽出手段により希望の表現を含む希望文を抽出し、実行文抽出手段により、複数のテキストデータから、当該希望文の対象語が係る実行を表わす表現を含み、対応する希望文の日時情報より遅い日時情報が対応付けられた実行文を抽出し、有言実行度算出手段により、実行文の希望文に対する抽出割合からなる有言実行度を算出することが可能になる。
第1の発明により、ユーザ(識別情報)ごとに、希望文の対象語である興味を持った対象を実際に行ったかどうかを示す有言実行度の指標を求めることが可能になる。
第1の発明による有言実行度は、商品の売れ行き予測や、販促活動の検討、意見分析対象ユーザのフィルタリング等に用いることが可能である。
すなわち、特定の商品の名前を含む希望文を含む投稿テキストの件数と、それらの投稿テキストを投稿したユーザの有言実行度から、その商品の売れ行きを予測することができる。
また、特定の商品の名前を含む希望文を含む投稿テキストを投稿したユーザ全体の平均有言実行度と、当該特定の商品の名前を含む実行文を投稿したユーザの割合を比較することにより、例えば、平均有言実行度が高いのにもかかわらず、実際にその商品の名前を含む実行文を投稿したユーザの割合が低い場合には、販促活動が必要と判断することができる。
また、有言実行度の高いユーザを抽出して、そのユーザにヒアリングを行ったり、そのユーザの投稿テキストをその後も分析することにより、意見分析対象ユーザのフィルタリングをすることが可能になる。
以上のように、第1の発明によりインターネット上等に投稿されたテキストデータから有言実行度の指標を求めることを可能にすることにより、さまざまなマーケティング戦略に有効な情報を提供することが可能になる。
第2の発明は、コンピュータが、日時情報を有する複数のテキストデータから、抽出対象となる対象語及び前記対象語が係る希望の表現からなる希望文を抽出する希望文抽出ステップと、前記テキストデータから、前記対象語及び前記対象語が係る実行を表わす表現からなり、対応する希望文の日時情報より遅い日時情報が対応付けられた実行文を抽出する実行文抽出ステップと、前記実行文を有するテキストデータの抽出数と前記希望文を有するテキストデータの抽出数に対する抽出割合からなる有言実行度を算出する有言実行度算出ステップと、を含むことを特徴とする情報分析方法情報分析方法である。
第3の発明は、コンピュータを、日時情報を有する複数のテキストデータから、抽出対象となる対象語及び前記対象語が係る希望の表現からなる希望文を抽出する希望文抽出手段と、前記テキストデータから、前記対象語及び前記対象語が係る実行を表わす表現からなり、対応する希望文の日時情報より遅い日時情報が対応付けられた実行文を抽出する実行文抽出手段と、前記実行文を有するテキストデータの抽出数と前記希望文を有するテキストデータの抽出数に対する抽出割合からなる有言実行度を算出する有言実行度算出手段と、として機能させるためのプログラムである。
本発明により、インターネット上等のテキストの分析により、マーケティング予測、プロモーションの立案等に適用可能な情報を提供可能な情報分析装置等を提供することが可能になる。
本発明の実施形態に係る情報分析装置1の適用構成例の概要を示す図 情報分析装置1のハードウエア構成例を示すブロック図 情報分析装置1の処理の流れを示すフローチャート 投稿テキスト記憶部21の構成例を示す図 希望文及び実行文抽出の説明図 希望文データ記憶部23の構成例を示す図 実行文データ記憶部25の構成例を示す図 有言実行度記憶部27の構成例を示す図
以下、添付図面に基づいて、本発明に係る情報分析装置1の好適な実施形態について詳細に説明する。
図1は、情報分析装置1の適用例を示す構成図である。
情報分析装置1は、例えば、投稿サーバ3とネットワーク7を介して接続され、ネットワーク7を介して投稿サーバ3と接続されたユーザ端末5から投稿され、投稿サーバ3が管理する投稿テキストデータを分析する。
投稿サーバ3は、例えば、ブログ、Twitter(登録商標)等の投稿サービスを行うサーバであり、ブログ、Twitter(登録商標)等の投稿テキストの作成支援、管理を行う。
ユーザ端末5は、インターネット等のネットワーク7を介して投稿サーバ3に接続可能であり、投稿サーバ3にアカウントを持つユーザは、ユーザ端末5から、投稿サーバ3の支援によりブログ、Twitter(登録商標)を作成し投稿する。
情報分析装置1は、ネットワーク7を介して投稿サーバ3と接続される。
情報分析装置1は、投稿サーバ3が管理している投稿テキストから、予め指定したユーザの投稿テキストデータを取得し、投稿テキストデータを分析し、ユーザ・アカウント毎にユーザの有言実行度を算出する。
有言実行度、及び、有言実行度の算出方法については後述する。
図2は、情報分析装置1のハードウエア構成例を示すブロック図である。
情報分析装置1は、例えば、パーソナルコンピュータ等のコンピュータ装置で構成することが可能である。
情報分析装置1は、例えば、制御部11、記憶部12、メディア入出力部13、通信制御部14、入力部15、表示部16、周辺機器I/F(インタフェース)部17等がバス18で接続された構成である。
制御部11は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)等で構成される。
CPUは、ROM、記憶部12等に格納されるプログラムをRAM上のワークメモリ領域に呼び出して実行し、バス18を介して接続された各装置を駆動制御し、コンピュータが行う処理を実現する。
ROMは、不揮発性メモリであり、コンピュータのブートプログラムやBIOS等のプログラム、データ等を恒久的に保持している。
RAMは、揮発性メモリであり、記憶部12、ROM、記憶媒体等からロードしたプログラム、データ等を一時的に保持するとともに、制御部11が各種処理を行うために使用するワークエリアを備える。
記憶部12は、制御部11が実行するプログラム、プログラム実行に必要なデータ、OS(Operating System)等が格納される。プログラムは、本発明の実施形態に係る情報分析装置1の処理プログラム等である。
処理プログラムについては後述する。
プログラムのコードは、制御部11により必要に応じて読み出されてRAMに移され、CPUにより実行される。
メディア入出力部13(ドライブ装置)は、データの入出力を行い、例えば、CDドライブ(−ROM、−R、−RW等)、DVDドライブ(−ROM、−R、−RW等)等のメディア入出力装置を有する。
通信制御部14は、通信制御装置、通信ポート等を有し、ネットワーク7を介して、他の装置、例えば、投稿サーバ3との通信制御を行う。ネットワークは、有線、無線を問わない。
入力部15は、データの入力を行い、例えば、キーボード、マウス等のポインティングデバイス、テンキー等の入力装置を有する。
表示部16は、CRTモニタ、液晶パネル等のディスプレイ装置であり、表示部16には、情報分析装置1により分析された各ユーザの有言実行度等を表示することが可能である。
投稿サーバ3及びユーザ端末5のハードウエア構成は、図1に示した情報分析装置1のハードウエア構成と同様であるので、ここでは詳述しない。
次に、本実施の形態の情報分析装置1が算出する有言実行度について説明する。
ブログやTwitter(登録商標)への投稿テキストには、「○○が欲しい」、「○○したい」といった物事への興味や希望を示す文章(以下、希望文と呼ぶ)が含まれている。そして、この興味、希望を実現して、「○○を手に入れた」、「○○をやった」という実行を示す文章(実行文)も投稿される。
情報分析装置1は、投稿テキストデータを分析して、希望文を抽出し、希望文が抽出された投稿テキスト以降に投稿された投稿テキストデータから、希望文の対象となる物事の実行を示す実行文を抽出し、希望文数に対する実行文数の割合から各ユーザ(投稿者)の有言実行度を算出する。
次に、情報分析装置1による有言実行度の算出方法について説明する。
図3は、情報分析装置1の処理の流れを示すフローチャートである。
まず、情報分析装置1の制御部11は、通信制御部14を介してネットワーク7上の投稿サーバ3にアクセスし、予め指定された投稿者(ユーザ・アカウント)の所定の期間内の投稿テキストデータを取得し、記憶部12の投稿テキスト記憶部21に格納する(ステップ101)。
予め指定された投稿者(ユーザ・アカウント)とは、例えば、情報分析装置1による投稿テキストの分析を承諾した投稿者である(複数の者でもよい)。
図4は、投稿テキスト記憶部21の構成例を示す図である。
投稿テキスト記憶部21には、例えば、投稿日時、ユーザ・アカウント、及び、投稿テキストデータが格納される。
図4では、投稿日時順に投稿テキストデータが示されているが、例えば、ユーザ・アカウント毎に格納するようにしてもよい。
投稿テキスト記憶部21には、指定されたユーザ・アカウントの投稿テキストデータが、投稿日時とともに、すべて格納される。
図3に戻り、次に、情報分析装置1の制御部11は、投稿テキスト記憶部21に格納されている投稿テキストデータの構文解析を行い、希望文を含む投稿テキストを抽出し、その結果求まったデータを記憶部12の希望文データ記憶部23に格納する(ステップ102)。
図5は、希望文及び実行文の抽出を説明する図である。
ここでは、図5(a)の希望文及び対象語の抽出について説明する。
希望文とは、希望を示す表現と、その対象語を含む文である。
希望を示す表現とは、例えば、希望の助動詞である「〜たい」、「〜たがる」や、希望を示す動詞である「欲しい」、「欲する」等である。
また、対象語とは、希望文に含まれる、係り受けにおいて希望を示す表現に係る名詞である。
希望文抽出では、まず、投稿テキストデータの1文1文の構文解析を行う。
すなわち、形態素解析及び構文解析により1文を文節に分割するとともに係り受け関係を解析し、文節から希望を示す表現を探索し、探索できたら係り受けにおいて希望を示す表現に係る名詞を対象語として抽出する。希望を示す表現とその対象語が抽出できた文を希望文として抽出する。
図5(a)の例では、「いつの日か松坂牛を食べたい」という1文は、文節「いつの日か」、「松坂牛を」、「食べたい」に分割され、「食べたい」が希望の助動詞「〜たい」を含むので希望を示す表現として探索され、係り受けの関係から「松坂牛」が対象語として抽出される。希望を示す表現とその対象語が抽出できたので、「いつの日か松坂牛を食べたい」という文は希望文として抽出される。
図6は、希望文データ記憶部23の構成例を示す図である。
希望文データ記憶部23には、ユーザ・アカウント、投稿日時、希望文の対象語、希望文数w等が格納される。
図5(a)に示した方法により希望文及び対象語が抽出されると、希望文データ記憶部23に、ユーザ・アカウント毎に、希望文の対象語と、その希望文を含む投稿テキストの投稿日時、及び、抽出された希望文数wが格納される。
図6の例は、図4の投稿テキスト記憶部21に格納されている投稿テキストデータから希望文を抽出した結果を格納したものである。
ユーザ・アカウント「aa」の投稿テキストデータから、「◎◎アイス食べたい」、「△△のCD超欲しい」、「××に相談したいことがあるんだよね」、「いつか本物のオーロラ見てみたいな」が希望文として抽出され、各希望文の投稿日時及び対象語「◎◎アイス」、「△△のCD」、「××」、「オーロラ」と希望文数w=4が希望文データ記憶部23に格納されている。
また、ユーザ・アカウント「bb」の投稿テキストデータからは、「私も◎◎アイスたべてみたい」、「◎×のCD聞きたいな」、「□□と今度飲んでみたいなー」、「松坂牛が食べたいよ」が希望文として抽出され、各希望文の投稿日時及び対象語「◎◎アイス」、「◎×のCD」、「□□」、「松坂牛」と希望文数w=4が希望文データ記憶部23に格納されている。
以下、他のユーザ・アカウントについても同様に希望文が抽出され、希望文の対象語と投稿日時、希望文数wが希望文データ記憶部23に格納される。
図3に戻り、次に、情報分析装置1の制御部11は、ステップ102により抽出された希望文の対象語を実際に実現したことを示す実行文を抽出し、記憶部12の実行文データ記憶部25にユーザ・アカウント毎に実行文の投稿数eを格納する(ステップ103)。
すなわち、希望文データ記憶部23に格納された各希望文の対象語について、そのユーザ・アカウントのその投稿日時以降の投稿テキストデータを投稿テキスト記憶部21を検索して抽出し、当該希望文の対象語を探索し、希望文の対象語を含む投稿テキストを構文解析し、当該投稿テキストが実行文か否かを判別する。
図5(b)は、実行文抽出を説明する図である。
実行文とは、希望文の対象語とその実行を示す表現を含み、当該希望文の投稿日時以降の投稿日時の情報をもつ文である。
実行を示す表現とは、例えば、動詞、形容詞、形容動詞+過去又は過去完了の助動詞「た」である。
実行文抽出では、希望文の投稿日時以降の投稿テキストデータから抽出された希望文の対象語を含む投稿テキストデータの構文解析を行う。
すなわち、形態素解析及び構文解析により1文を文節に分割するとともに係り受け関係を解析し、文節から実行を示す表現を探索し、探索できたら係り受けにおいて希望文の対象語が実行を示す表現に係っているか判定する。係っているならばこの文を実行文とする。
図5(b)の例では、「ついに松坂牛を食べたよー!」という希望文の対象語「松坂牛」を含む投稿テキストが、文節「ついに」、「松坂牛を」、「食べたよー」に分割され、希望文の対象語「松坂牛」の係り受けとして実行を示す表現があるか否かが判定される。
この例では、「食べたよー」という動詞+過去の助動詞「た」が存在するので、この投稿テキストは実行文であると判定される。
図7は、実行文データ記憶部25の構成例を示す図である。
実行文データ記憶部25は、例えば、ユーザ・アカウント、及び、希望文の対象語に対応する実行文数eで構成される。
図7の例は、図4の投稿テキスト記憶部21に格納されている投稿テキストデータから図6に格納された希望文の対象語に対応する実行文を抽出した結果を格納したものである。
ユーザ・アカウント「aa」については、図6に格納された希望文の対象語「◎◎アイス」、「△△のCD」、「××」、「オーロラ」に対して、投稿テキスト記憶部21の投稿テキストデータから、「◎◎アイスおいしかった!」、「△△のCD買っちゃった」、「××といっぱい話せて良かった!」が実行文と判別され、実行文データ記憶部25には、実行文数e=3が格納される。
また、ユーザ・アカウント「bb」については、図6に格納された希望文の対象語「◎◎アイス」、「◎×のCD」、「□□」、「松坂牛」に対して、投稿テキスト記憶部21の投稿テキストデータから「◎×のCD買ったよー」が実行文と判別され、実行文データ記憶部25には、実行文数e=1が格納される。
以下、他のユーザ・アカウントについても同様に実行文が抽出され、ユーザ・アカウント毎に実行文数eが実行文データ記憶部25に格納される。
図3に戻り、次に、情報分析装置1の制御部11は、ステップ102で希望文データ記憶部23に格納されたユーザ・アカウント毎の希望文数wと、ステップ103で実行文データ記憶部25に格納されたユーザ・アカウント毎の実行文数eを元に、各ユーザ・アカウントの投稿者の有言実行度を算出し、記憶部12の有言実行度記憶部27に格納する(ステップ104)。
有言実行度は、希望文数wに対する実行文数eの割合(e/w)である。
図8は、有言実行度記憶部27の構成例を示す図である。
有言実行度記憶部27は、ユーザ・アカウント及び有言実行度で構成される。
図8の例では、ユーザ・アカウント「aa」の有言実行度(e/w)は、希望文数w=4、実行文数e=3から75%、ユーザ・アカウント「bb」の有言実行度(e/w)は、希望文数w=4、実行文数e=1から25%である。
以上のように、本実施の形態の情報分析装置1により、投稿サーバ3により管理されている投稿テキストの中の指定の投稿者(ユーザ・アカウント)の投稿テキストデータについて分析し、各投稿者の有言実行度を算出することが可能になる。
本実施の形態の情報分析装置1により算出された有言実行度は、マーケティング予測、プロモーションの立案等に有効に活用することが可能である。
例えば、情報分析装置1により算出された有言実行度は、商品発売前に売上予測をする場合に有効である。
商品発売前に商品の特徴や価格などの情報を公開しておくと、投稿者は投稿サーバ3を介して、その商品を買ってみたい、あるいは、試してみたいといった希望文を含む投稿テキストを投稿する。
所定の期間に投稿サーバ3に投稿された投稿テキストデータを情報分析装置1で分析し、その商品名を希望文の対象語とする希望文を含む投稿テキストを抽出し、それらの投稿テキストの投稿者全員の平均有言実行度が高ければ、その商品は高い売上が予測でき、また、平均有言実行度が低ければ、その商品はあまり売れないだろうと予測することができ、売上予測の精度を高めることが可能になる。
例えば、A社の商品◎◎の発売前に、商品◎◎の希望文を含む投稿の件数が12000件あり、その投稿者の平均有言実行度は58%であり、また、B社の商品○○の発売前の希望文を含む投稿の件数が18000件あり、その投稿者の平均有言実行度は24%だったとする。
投稿件数からはB社の商品○○の反響が大きく高い売上が予測されるが、有言実行度の情報を活用すると、投稿者の平均有言実行度はA社の商品◎◎の方が高く、A社の商品◎◎の高い売上を予測できる。
また、有言実行度はプロモーションの立案にも有効に活用することができる。
発売前の商品のプロモーションに対して、その商品を希望文の対象語として含む投稿テキストを投稿した投稿者の平均有言実行度と、発売後のその商品を対象語とする実行文を投稿した投稿者の割合を比較し、実行文を投稿した投稿者の割合が希望文を投稿した投稿者の平均有言実行度よりも低い場合は、予想より商品が売れていず、更にプロモーションが必要であると判断できる。
すなわち、売れ行きの好調/不調を定量化でき、プロモーションの必要性の有無を判断することが可能になる。
例えば、A社の商品◎◎に対する発売前の希望文を含む投稿12000件についての投稿者の平均有言実行度が58%であり、発売後にそのうちの18%しか商品◎◎に対する実行文を投稿していない場合、売れ行きが不調と見てプロモーションの必要性があると判断できる。また、発売後に65%の投稿者が実行文を投稿していれば、売れ行きは順調であると判断できる。
更に、有言実行度を意見分析のフィルタリングに活用することも可能である。
有言実行度が所定の値以上の投稿者にヒアリングやアンケートを実施したり、有言実行度が所定の値以上の投稿者のその後の投稿テキストを重点的に分析することにより、より有効な情報を得ることが可能になる。
なお、本実施形態は前述のものに限られず、その趣旨を逸脱しない範囲で変更可能である。
例えば、図3のステップ101において、予め指定された投稿者(ユーザ・アカウント)の投稿テキストデータを取得するとしたが、投稿テキストデータを取得する対象は、ユーザ・アカウントのみに限られない。
図1の投稿サーバ3が、投稿日時、ユーザ・アカウント、及び、投稿テキストデータの他に、例えば、年齢や、性別、居住エリア(都道府県や市町村)等の分類の情報を有していれば、情報分析装置1の制御部11は、所定の年齢層、所定の性別、所定の居住エリア等の、予め指定された分類を用いて、投稿サーバ3から、投稿テキストデータを取得してもよい。
また、情報分析装置1の制御部11は、所定の分類に属するユーザ・アカウントの投稿テキストデータを取得するようにしてもよい。
この際には、図4の投稿テキスト記憶部21、図6の希望文データ記憶部23、図7の実行文データ記憶部25、図8の有言実行度記憶部27は、ユーザ・アカウントごとではなく、分類毎、又は、分類に属するユーザ・アカウント毎に、記憶される。
こうすることにより、情報分析装置1の制御部11は、年齢や年齢層、性別、居住エリア等の分類毎の有言実行度を算出したり、このような分類に属するユーザ・アカウント毎に有言実行度を算出することができる。
さらに、例えば、A社の商品◎◎に対する年齢層別の投稿者の平均有言実行度の違いから、売上予測やプロモーションの計画立案をすることが可能である。
また、例えば、掲示板の同一スレッド内の投稿テキストデータや、ブログのある日記内の投稿テキストデータなど、特定の対象に対して投稿された関連のある投稿テキストデータが、まとまり毎に関連付けれらて、投稿サーバ3で管理されていることがある。
この場合には、図3のステップS103において、情報分析装置1の制御部11は、まとまり毎の関連付けを参照して、希望文に関連する投稿テキストデータを判定し、希望文に関連する投稿テキストデータから、実行文を抽出してもよい。
こうすることにより、情報分析装置1の制御部11は、まとまり毎の有言実行度を算出することができる。
以上、本発明の情報分析装置1の実施の形態について説明したが、本発明の情報分析装置1により投稿テキストの投稿者や分類毎の有言実行度を求めることが可能になり、有言実行度を適用することにより、マーケティング予測、プロモーションの計画立案、意見分析のフィルタリング等を精度よく容易に実行することが可能になる。
以上、添付図面を参照しながら、本発明に係る情報分析装置1の好適な実施形態について説明したが、本発明はかかる例に限定されない。当業者であれば、本願で開示した技術的思想の範疇内において、各種の変更例又は修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
1………情報分析装置
3………投稿サーバ
5………ユーザ端末
7………ネットワーク
21………投稿テキスト記憶部
23………希望文データ記憶部
25………実行文データ記憶部
27………有言実行度記憶部

Claims (9)

  1. 日時情報を有する複数のテキストデータから、抽出対象となる対象語及び前記対象語が係る希望の表現からなる希望文を抽出する希望文抽出手段と、
    前記テキストデータから、前記対象語及び前記対象語が係る実行を表わす表現からなり、対応する希望文の日時情報より遅い日時情報が対応付けられた実行文を抽出する実行文抽出手段と、
    前記実行文を有するテキストデータの抽出数と前記希望文を有するテキストデータの抽出数に対する抽出割合からなる有言実行度を算出する有言実行度算出手段と、
    を具備することを特徴とする情報分析装置。
  2. 前記テキストデータは、まとまり毎に関連付けされ、
    前記実行文抽出手段は、前記関連付けを参照して前記希望文に関連するテキストデータを判定し、前記希望文に関連するテキストデータから実行文を抽出することを特徴とする請求項1記載の情報分析装置。
  3. 前記テキストデータは、識別情報を有し、
    前記希望文抽出手段及び前記実行文抽出手段は、前記識別情報が同一のテキストデータからそれぞれ抽出することを特徴とする請求項1又は請求項2に記載の情報分析装置。
  4. 前記識別情報は、ユーザ毎に固有の情報又は分類分けされた情報であることを特徴とする請求項1から請求項3のいずれか1項に記載の情報分析装置。
  5. 前記希望文抽出手段は、希望を示す助動詞又は動詞が含まれる前記テキストデータを希望文として抽出することを特徴とする請求項1から請求項4のいずれか1項に記載の情報分析装置。
  6. 前記実行文抽出手段は、前記対象語が係る動詞、形容詞、形容動詞に過去又は完了の助動詞が付随する前記テキストデータを実行文として抽出することを特徴とする請求項1から請求項5のいずれか1項に記載の情報分析装置。
  7. 前記テキストデータは、ウェブサーバを介して抽出されることを特徴とする請求項1から請求項6のいずれか1項に記載の情報分析装置。
  8. コンピュータが、
    日時情報を有する複数のテキストデータから、抽出対象となる対象語及び前記対象語が係る希望の表現からなる希望文を抽出する希望文抽出ステップと、
    前記テキストデータから、前記対象語及び前記対象語が係る実行を表わす表現からなり、対応する希望文の日時情報より遅い日時情報が対応付けられた実行文を抽出する実行文抽出ステップと、
    前記実行文を有するテキストデータの抽出数と前記希望文を有するテキストデータの抽出数に対する抽出割合からなる有言実行度を算出する有言実行度算出ステップと、
    を含むことを特徴とする情報分析方法。
  9. コンピュータを、
    日時情報を有する複数のテキストデータから、抽出対象となる対象語及び前記対象語が係る希望の表現からなる希望文を抽出する希望文抽出手段と、
    前記テキストデータから、前記対象語及び前記対象語が係る実行を表わす表現からなり、対応する希望文の日時情報より遅い日時情報が対応付けられた実行文を抽出する実行文抽出手段と、
    前記実行文を有するテキストデータの抽出数と前記希望文を有するテキストデータの抽出数に対する抽出割合からなる有言実行度を算出する有言実行度算出手段と、
    として機能させるためのプログラム。
JP2014199945A 2014-09-30 2014-09-30 情報分析装置、情報分析方法、及び、プログラム Active JP6384242B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014199945A JP6384242B2 (ja) 2014-09-30 2014-09-30 情報分析装置、情報分析方法、及び、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014199945A JP6384242B2 (ja) 2014-09-30 2014-09-30 情報分析装置、情報分析方法、及び、プログラム

Publications (2)

Publication Number Publication Date
JP2016071596A JP2016071596A (ja) 2016-05-09
JP6384242B2 true JP6384242B2 (ja) 2018-09-05

Family

ID=55864711

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014199945A Active JP6384242B2 (ja) 2014-09-30 2014-09-30 情報分析装置、情報分析方法、及び、プログラム

Country Status (1)

Country Link
JP (1) JP6384242B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018136011A1 (en) * 2017-01-20 2018-07-26 Kobe Global Technologies Pte Ltd A system and method for matching influencers with an advertisement campaign
JP6821528B2 (ja) 2017-09-05 2021-01-27 本田技研工業株式会社 評価装置、評価方法、ノイズ除去装置、およびプログラム

Also Published As

Publication number Publication date
JP2016071596A (ja) 2016-05-09

Similar Documents

Publication Publication Date Title
US20220156643A1 (en) Using Machine Learning to Predict Outcomes for Documents
Zhao et al. Predicting overall customer satisfaction: Big data evidence from hotel online textual reviews
US10990631B2 (en) Linking documents using citations
US10748164B2 (en) Analyzing sentiment in product reviews
US11709875B2 (en) Prioritizing survey text responses
US20110258054A1 (en) Automatic Generation of Bid Phrases for Online Advertising
CN108491377A (zh) 一种基于多维度信息融合的电商产品综合评分方法
Lopez Barbosa et al. Evaluating hotels rating prediction based on sentiment analysis services
US11487838B2 (en) Systems and methods for determining credibility at scale
Wang et al. Customer-driven product design selection using web based user-generated content
US11055745B2 (en) Linguistic personalization of messages for targeted campaigns
CN107798622B (zh) 一种识别用户意图的方法和装置
US20220382794A1 (en) System and method for programmatic generation of attribute descriptors
Nam et al. Structuralizing biomedical abstracts with discriminative linguistic features
Ahmed et al. Thematic analysis on user reviews for depression and anxiety chatbot apps: machine learning approach
JP6384242B2 (ja) 情報分析装置、情報分析方法、及び、プログラム
Putri et al. Software feature extraction using infrequent feature extraction
Downer et al. All work and no play: A text analysis
Wilmink et al. On the ability of lightweight checks to detect ambiguity in requirements documentation
Wang et al. Word intuition agreement among Chinese speakers: a Mechanical Turk-based study
Tsai et al. Aspect-category-based sentiment classification with aspect-opinion relation
Vázquez et al. Multilingual website assessment for accessibility: A survey on current practices
Birari et al. Perception and Practices of EdTech Platform: A Sentiment Analysis
Dey et al. Applying Text Mining to Understand Customer Perception of Mobile Banking App
Read et al. Labeling emotions in suicide notes: Cost-sensitive learning with heterogeneous features

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170727

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180420

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180515

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180621

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180710

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180723

R150 Certificate of patent or registration of utility model

Ref document number: 6384242

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150