JP2018036756A - メッセージ分類システム、メッセージ分類方法及びプログラム - Google Patents

メッセージ分類システム、メッセージ分類方法及びプログラム Download PDF

Info

Publication number
JP2018036756A
JP2018036756A JP2016167781A JP2016167781A JP2018036756A JP 2018036756 A JP2018036756 A JP 2018036756A JP 2016167781 A JP2016167781 A JP 2016167781A JP 2016167781 A JP2016167781 A JP 2016167781A JP 2018036756 A JP2018036756 A JP 2018036756A
Authority
JP
Japan
Prior art keywords
data
message
category
messages
post
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016167781A
Other languages
English (en)
Other versions
JP6457986B2 (ja
Inventor
牧 劉
Mu Ryu
牧 劉
清水 隆範
Takanori Shimizu
隆範 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Interactive Entertainment LLC
Original Assignee
Sony Interactive Entertainment LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Interactive Entertainment LLC filed Critical Sony Interactive Entertainment LLC
Priority to JP2016167781A priority Critical patent/JP6457986B2/ja
Priority to US15/684,914 priority patent/US11134045B2/en
Publication of JP2018036756A publication Critical patent/JP2018036756A/ja
Application granted granted Critical
Publication of JP6457986B2 publication Critical patent/JP6457986B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/21Monitoring or handling of messages
    • H04L51/212Monitoring or handling of messages using filtering or selective blocking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/52User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail for supporting social networking services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】投稿されたメッセージを的確に分類できるメッセージ分類システム、メッセージ分類方法及びプログラムを提供する。【解決手段】ルールベースカテゴリ設定部40は、メッセージの投稿者、リプライ先、又は、内容についての規則に基づいて、投稿された複数のメッセージのうちの一部を抽出する。機械学習カテゴリ設定部42は、抽出されたメッセージを、機械学習分類器により分類する。【選択図】図7

Description

本発明は、メッセージ分類システム、メッセージ分類方法及びプログラムに関する。
例えばTwitter(登録商標)やFacebook(登録商標)などといったSNS(Social Networking Service)に投稿された、ある商品やサービスに関連するメッセージを分析することが行われている。またこのような分析の技術において、機械学習分類器によって、複数のカテゴリにメッセージを分類することが行われている。この場合に、カテゴリ毎にメッセージを分析するようにすると、メッセージを精度よく分析することができる。
分析対象となるメッセージのすべてを機械学習分類器によって分類した場合、メッセージの分類精度が充分なものとならないことがある。例えば、機械学習分類器によるメッセージの分類だけでは、投稿者の意見を表すメッセージではないメッセージが投稿者の意見を表すメッセージのカテゴリに分類されることがある。
本発明は上記実情に鑑みてなされたものであって、その目的の一つは、投稿されたメッセージを的確に分類できるメッセージ分類システム、メッセージ分類方法及びプログラムを提供することにある。
上記課題を解決するために、本発明に係るメッセージ分類システムは、メッセージの投稿者、リプライ先、又は、内容についての規則に基づいて、投稿された複数の前記メッセージのうちの一部を抽出する抽出部と、抽出された前記メッセージを、機械学習分類器により分類する分類部と、を含む。
本発明の一態様では、前記抽出部は、メッセージの投稿者、リプライ先、又は、内容についての規則に基づいて、投稿された複数の前記メッセージのうちから、投稿者の意見のメッセージではないと判定されるもの以外のメッセージを抽出し、前記分類部は、抽出された前記メッセージを、機械学習分類器により、投稿者の意見のメッセージとそれ以外のメッセージとに分類する。
また、本発明の一態様では、前記投稿者の意見を表すメッセージの内容、又は、投稿されたメッセージの総数に対する前記投稿者の意見のメッセージの数の割合を表示させる表示制御部、をさらに含む。
あるいは、前記投稿された複数のメッセージは、ある商品又はサービスに関するメッセージであり、投稿されたメッセージの総数に対する前記投稿者の意見を表すメッセージの数の割合に基づいて、前記商品又はサービスの成功の度合いを表す指標を算出する指標算出部と、前記指標を表示させる表示制御部と、をさらに含む。
また、本発明に係るメッセージ分類方法は、メッセージの投稿者、リプライ先、又は、内容についての規則に基づいて、投稿された複数の前記メッセージのうちの一部を抽出するステップと、抽出された前記メッセージを、機械学習分類器により分類するステップと、を含む。
また、本発明に係るプログラムは、メッセージの投稿者、リプライ先、又は、内容についての規則に基づいて、投稿された複数の前記メッセージのうちの一部を抽出する手順、抽出された前記メッセージを、機械学習分類器により分類する手順、をコンピュータに実行させる。
本発明の一実施形態に係るコンピュータネットワークの全体構成の一例を示す図である。 投稿データの一例を示す図である。 投稿データの一例を示す図である。 検索画面の一例を示す図である。 検索結果画面の一例を示す図である。 分析結果画面の一例を示す図である。 成功指標表示画面の一例を示す図である。 本発明の一実施形態に係る投稿分析システムで実装される機能の一例を示す機能ブロック図である。 オフィシャルアカウント設定画面の一例を示す図である。 本発明の一実施形態に係る投稿分析システムにおいて行われる処理の流れの一例を示すフロー図である。 本発明の一実施形態に係る投稿分析システムにおいて行われる処理の流れの一例を示すフロー図である。
以下、本発明の一実施形態について、図面を参照しながら説明する。
図1は、本発明の一実施形態に係るコンピュータネットワークの全体構成の一例を示す図である。図1に示すように、本実施形態に係る投稿分析システム10、及び、複数のSNS(Social Networking Service)システム12(12−1,12−2,・・・,12−n)は、例えばインターネットなどのコンピュータネットワーク14に接続されている。そして本実施形態に係る投稿分析システム10とSNSシステム12とはコンピュータネットワーク14を介して互いに通信可能となっている。
本実施形態に係るSNSシステム12は、例えば、Twitter(登録商標)やFacebook(登録商標)などといったSNSサービスを提供するコンピュータシステムである。
本実施形態に係る投稿分析システム10は、例えばパーソナルコンピュータなどといったコンピュータである。
図1に示すように、本実施形態に係る投稿分析システム10には、例えば、プロセッサ10a、記憶部10b、通信部10c、出力部10d、入力部10eが含まれる。プロセッサ10aは、例えば投稿分析システム10にインストールされるプログラムに従って動作するCPU等のプログラム制御デバイスである。記憶部10bは、例えばROMやRAM等の記憶素子やハードディスクドライブなどである。記憶部10bには、プロセッサ10aによって実行されるプログラムなどが記憶される。通信部10cは、例えばイーサネット(登録商標)モジュールや無線LANモジュールなどの通信インタフェースである。出力部10dは、例えばプロセッサ10aから入力される指示に従って情報を表示出力するディスプレイ等の表示部や音声出力するスピーカ等の音声出力部である。入力部10eは、例えばユーザが行った操作の内容をプロセッサ10aに出力するマウス、キーボード、タッチパッド、マイク等である。なお投稿分析システム10は、単一のコンピュータから構成されてもよいし、複数のコンピュータから構成されてもよい。
本実施形態に係る投稿分析システム10は、複数のSNSシステム12のそれぞれから、当該SNSシステム12に投稿されたメッセージを取得する。そして投稿分析システム10は、取得したメッセージに基づいて、当該メッセージに対応付けられる、図2Aに例示する投稿データを生成する。生成された投稿データは、投稿分析システム10に記憶される。
図2Aに示すように、投稿データには、投稿ID、作者データ、URLデータ、ソースデータ、タイトルデータ、メッセージデータ、投稿日時データ、カテゴリデータ、感情データが含まれる。
投稿データに含まれる投稿IDは、例えば投稿データの識別情報である。投稿データに含まれる作者データは、例えば当該投稿データに対応付けられるメッセージの投稿者のアカウント名を示すデータである。投稿データに含まれるURLデータは、例えば当該投稿データに対応付けられるメッセージが閲覧可能なURLを示すデータである。投稿データに含まれるソースデータは、例えば当該投稿データに対応付けられるメッセージが投稿されたSNSシステム12の識別情報である。投稿データに含まれるタイトルデータは、例えば当該投稿データに対応付けられるメッセージのタイトルを示すデータである。タイトルデータの値は空でも構わない。投稿データに含まれるメッセージデータは、例えば当該投稿データに対応付けられるメッセージの内容を示すデータである。投稿データに含まれる投稿日時データは、例えば当該投稿データに対応付けられるメッセージの投稿日時を示すデータである。
投稿データに含まれるカテゴリデータは、例えば当該投稿データに対応付けられるメッセージのカテゴリを示すデータである。カテゴリデータの値としては、例えば、VOC(Voice Of Customer)、Q&A(Questions and Answers)、PR(Public Relations)、ISU(Information Shared by User)、又は、Garbageのいずれかが設定される。本実施形態に係る投稿データは、これら5つのカテゴリのいずれかに分類される。
VOC(Voice Of Customer)のカテゴリは、投稿者の意見を表すメッセージとして特定される投稿データに設定される。Q&A(Questions and Answers)のカテゴリは、質問又は回答を表すメッセージとして特定される投稿データに設定される。PRのカテゴリは、広告を表すメッセージとして特定される投稿データに設定される。ISUのカテゴリは、ユーザによって共有されたメッセージとして特定される投稿データに設定される。Garbageのカテゴリは、例えば自動生成されたメッセージなどといった閲覧や分析の対象から除外すべきメッセージとして特定される投稿データに設定される。
投稿データに含まれる感情データは、例えば当該投稿データに対応付けられるメッセージが表す感情を示すデータである。感情データの値としては、例えば、肯定的な感情を表すPositive、又は、否定的な感情を表すNegative、のいずれかが設定される。なお本実施形態では、カテゴリデータの値がVOCである投稿データについてのみ感情データの値が設定されることとする。
本実施形態に係る投稿データは、生成された際の初期状態では、図2Aに示すように、カテゴリデータの値、及び、感情データの値が設定されない。そして本実施形態では、所定のタイミングで、図2Bに示すように、投稿データに含まれるカテゴリデータの値、及び、感情データの値が設定される。
なお、カテゴリデータの値及び感情データの値が設定されるタイミングは特に問わない。例えば、投稿データの生成に応じて、当該投稿データのカテゴリデータの値及び感情データの値が設定されてもよい。またカテゴリデータの値及び感情データの値が設定されていない複数の投稿データについてまとめて、カテゴリデータの値及び感情データの値が設定されてもよい。
そして本実施形態では、投稿分析システム10のディスプレイに表示される、図3に例示する検索画面20を介して、ユーザは、投稿分析システム10に蓄積された投稿データの検索を行えるようになっている。
図3に例示する検索画面20には、検索条件が入力可能な複数のフォーム(検索文字列入力フォームF1、カテゴリ選択フォームF2、感情選択フォームF3、ソース選択フォームF4、及び、投稿日時範囲設定フォームF5)と、検索ボタンB1が配置されている。
ユーザは、検索文字列入力フォームF1に、検索条件となる文字列を入力できるようになっている。またユーザは、カテゴリ選択フォームF2に、1又は複数のカテゴリデータの値を設定できるようになっている。またユーザは、感情選択フォームF3に、1又は複数の感情データの値を設定できるようになっている。またユーザは、ソース選択フォームF4に、1又は複数のソースデータの値を設定できるようになっている。またユーザは、投稿日時範囲設定フォームF5に、投稿日時データの値の範囲を設定できるようになっている。
ここで複数のフォームに検索条件を入力した上で、ユーザが検索ボタンB1をクリックすると、入力された検索条件を満足する投稿データが検索結果として特定される。ここでは例えば、以下の(1)〜(5)のいずれの条件も満足する投稿データが検索結果として特定される。(1)投稿データに含まれるメッセージデータが表す文字列の一部又は全部に検索文字列入力フォームF1に入力された文字列が含まれる。(2)投稿データに含まれるカテゴリデータの値がカテゴリ選択フォームF2に設定されたカテゴリデータの値のいずれかに一致する。(3)投稿データに含まれる感情データの値が感情選択フォームF3に設定された感情データの値のいずれかに一致する。(4)投稿データに含まれるソースデータにより識別されるSNSシステム12が、ソース選択フォームF4に設定されたSNSシステム12のいずれかに一致する。(5)投稿データに含まれる投稿日時データの値が投稿日時範囲設定フォームF5に設定された日時の範囲に含まれる。
そして検索結果が配置された、図4に例示する検索結果画面22がディスプレイに表示される。図4に例示する検索結果画面22には、検索結果として特定された投稿データのそれぞれに相当する検索結果画像24が配置されている。検索結果画像24には、検索結果である投稿データに含まれる作者データの値、ソースデータの値、投稿日時データの値、及び、メッセージデータの値にそれぞれに対応付けられる、文字列S1、文字列S2、文字列S3、及び、文字列S4が含まれる。
本実施形態では例えば、検索画面20の設定により、特定のカテゴリ(例えばVOCのカテゴリ)が設定された投稿データのメッセージの内容だけを選択的に表示させることができる。そのため、特定のカテゴリのメッセージとして特定されるメッセージを効率よく閲覧できることとなる。
また本実施形態では、所定の操作をユーザが行うと、図5に例示する分析結果画面26がディスプレイに表示される。分析結果画面26には、例えば、投稿分析システム10に蓄積されている投稿データに関連付けられているカテゴリの分布などといった、投稿データの分析結果を表す画像が配置される。図5には、各カテゴリについて、投稿されたメッセージの総数に対する当該カテゴリに関連付けられている投稿データの数の割合を示す画像が配置された分析結果画面26が示されている。分析結果画面26からは、例えば投稿されたメッセージの総数に対する、あるカテゴリのメッセージの数の割合を読み取ることができる。また、VOCのカテゴリに関連付けられた投稿データの数については、感情データの値がPositiveである投稿データの数、及び、感情データの値がNegativeである投稿データの数の、投稿されたメッセージの総数に対する割合も示されている。
例えば仮にPRの投稿データについて感情データの値の特定を行ったとしたら、ほぼすべてが感情データの値としてPositiveが特定されることとなる。そのためPRの投稿データも含めて感情データの値の比率を分析すると感情データの値がPositiveである投稿データの数が実態よりも多くなる。このように投稿データをカテゴリに分類せずにすべての投稿データに対して分析を行った際には分析結果に妥当性が欠けることがあった。本実施形態では、投稿データが5つのカテゴリに分類され、特定のカテゴリ(例えばVOCのカテゴリ)に分類された投稿データに絞った分析を行うことが可能となるので、メッセージの分析をより的確に捉えることができることとなる。
なお分析結果画面26に表示されるものは図5に示すものに限定されない。例えば、VOCのカテゴリに分類された投稿データについては、感情データの値がPositiveである投稿データの数とNegativeである投稿データの数との比が表示されてもよい。また各カテゴリについて、当該カテゴリに関連付けられている投稿データの数が表示されてもよい。
また本実施形態では例えば、所定の操作をユーザが行うと、図6に例示する成功指標表示画面28がディスプレイに表示される。成功指標表示画面28には、例えば、複数の商品又はサービスのそれぞれについて、当該商品又はサービスについての成功の度合いを表す指標である成功指標が示されている。成功指標の一例として、図6には、商品又はサービスについて投稿されたメッセージの総数に対する、当該商品又はサービスについて投稿されたVOCのメッセージの数の割合が示されている。また、図6に示すように、成功指標の一例として、商品又はサービスについての当該割合が所定値(例えば50%)以上である場合に、当該商品又はサービスについては成功であるということが示されてもよい。図6の例では、AAA gameと、CCC gameについては成功であるということが示されている。ここで例えば商品又はサービスの名称をメッセージデータの値として含む投稿データが、当該商品又はサービスについて投稿されたメッセージとして取り扱われるようにしてもよい。このようにすれば、投稿されたメッセージの総数に対するVOCのメッセージの数が占める割合に基づく成功の度合いの評価を複数の商品やサービスについて横断的に行うことができることとなる。
以上で説明したように、本実施形態に係る投稿分析システム10では、SNSシステム12に投稿されたメッセージの検索や分析を行うことができることとなる。以下、メッセージの検索や分析を中心に、本実施形態に係る投稿分析システム10の機能及び投稿分析システム10において行われる処理についてさらに説明する。
図7は、本実施形態に係る投稿分析システム10で実装される機能の一例を示す機能ブロック図である。なお、本実施形態に係る投稿分析システム10で、図7に示す機能のすべてが実装される必要はなく、また、図7に示す機能以外の機能が実装されていても構わない。
図7に示すように、本実施形態に係る投稿分析システム10は、機能的には例えば、メッセージ取得部30、投稿データ生成部32、投稿データ記憶部34、オフィシャルアカウント設定部36、オフィシャルアカウントデータ記憶部38、ルールベースカテゴリ設定部40、機械学習カテゴリ設定部42、感情データ値設定部44、PRライブラリデータ記憶部46、表示制御部48、検索条件受付部50、検索結果特定部52、指標算出部54、を含んでいる。
メッセージ取得部30は、通信部10cを主として実装される。投稿データ生成部32、ルールベースカテゴリ設定部40、機械学習カテゴリ設定部42、感情データ値設定部44、検索結果特定部52、指標算出部54は、プロセッサ10aを主として実装される。投稿データ記憶部34、オフィシャルアカウントデータ記憶部38、PRライブラリデータ記憶部46は、記憶部10bを主として実装される。表示制御部48は、プロセッサ10aと出力部10dを主として実装される。オフィシャルアカウント設定部36、検索条件受付部50は、プロセッサ10aと入力部10eを主として実装される。
以上の機能は、コンピュータである投稿分析システム10にインストールされた、以上の機能に対応する指令を含むプログラムをプロセッサ10aで実行することにより実装されてもよい。このプログラムは、例えば、光ディスク、磁気ディスク、磁気テープ、光磁気ディスク、フラッシュメモリ等のコンピュータ読み取り可能な情報記憶媒体を介して、あるいは、インターネットなどを介して投稿分析システム10に供給されてもよい。
メッセージ取得部30は、本実施形態では例えば、複数のSNSシステム12のそれぞれから、当該SNSシステム12に投稿されたメッセージのデータを取得する。
投稿データ生成部32は、本実施形態では例えば、メッセージ取得部30が取得したメッセージに基づいて、図2Aに例示する、カテゴリデータの値及び感情データの値が設定されていない投稿データを生成して、投稿データ記憶部34に記憶させる。
投稿データ記憶部34は、本実施形態では例えば、投稿データを記憶する。
オフィシャルアカウント設定部36は、本実施形態では例えば、PRのカテゴリが設定される投稿データの特定に用いられる、オフィシャルアカウントの値を設定する。本実施形態では、いずれかのオフィシャルアカウントの値を作者データの値として含む投稿データのカテゴリデータの値として、PRが設定されることとなる。
本実施形態では例えば、図8に例示するオフィシャルアカウント設定画面60を介して、ユーザは1又は複数のオフィシャルアカウントの値を設定できるようになっている。図8に例示するオフィシャルアカウント設定画面60では1又は複数のオフィシャルアカウントの値をフォームF6に設定できるようになっている。そしてユーザが登録ボタンB2をクリックすると、オフィシャルアカウント設定部36は、設定された1又は複数の値のそれぞれに対応付けられるオフィシャルアカウントデータを生成して、オフィシャルアカウントデータ記憶部38に記憶させる。ここで生成されるオフィシャルアカウントデータには、対応付けられるオフィシャルアカウントの値が含まれる。
オフィシャルアカウントデータ記憶部38は、本実施形態では例えば、オフィシャルアカウントの値を含むオフィシャルアカウントデータを記憶する。
PRライブラリデータ記憶部46は、本実施形態では例えば、PRのカテゴリが設定される投稿データの特定に用いられる、PRライブラリデータを記憶する。PRライブラリデータはメッセージデータに対応付けられる。PRライブラリデータの値としては、カテゴリデータの値としてPRが設定された投稿データに含まれるメッセージデータが表す文字列が設定される。
ルールベースカテゴリ設定部40は、本実施形態では例えば、メッセージの投稿者、リプライ先、又は、内容についての所与の規則に基づいて、投稿された複数のメッセージのうちの一部を抽出する。ここでルールベースカテゴリ設定部40は、例えば、メッセージの投稿者、リプライ先、又は、内容についての所与の規則に基づいて、投稿者の意見のメッセージではないと判定されるもの以外のメッセージが抽出されるようにしてもよい。すなわち、投稿者の意見のメッセージではないと判定されるメッセージが除外されるようにしてもよい。そして本実施形態ではルールベースカテゴリ設定部40は、除外されたメッセージに対応付けられる投稿データのカテゴリデータの値として、PR、Q&A、又は、ISUのカテゴリを設定する。
機械学習カテゴリ設定部42は、本実施形態では例えば、ルールベースカテゴリ設定部40によって抽出されたメッセージを、機械学習分類器により分類する。機械学習カテゴリ設定部42は、例えば、ルールベースカテゴリ設定部40によりカテゴリが設定されなかった残りのメッセージを、機械学習分類器により、投稿者の意見のメッセージとそれ以外のメッセージとに分類する。機械学習カテゴリ設定部42は、例えば、PR、Q&A、又は、ISUのいずれの値もカテゴリデータの値として設定されなかった投稿データを特定する。そして機械学習カテゴリ設定部42は、公知の機械学習分類器を用いることにより、これらの投稿データをGarbageのカテゴリが設定されるべき投稿データとVOCのカテゴリが設定されるべき投稿データとに分類する。そして機械学習カテゴリ設定部42は、Garbageのカテゴリが設定されるべき投稿データのカテゴリデータの値としてGarbageを設定する。また機械学習カテゴリ設定部42は、VOCのカテゴリが設定されるべき投稿データのカテゴリデータの値としてVOCを設定する。
感情データ値設定部44は、本実施形態では例えば、公知の自然言語処理技術を用いることで、投稿データに含まれる感情データの値を設定する。感情データ値設定部44は、カテゴリデータの値としてVOCが設定されている投稿データに限定して、感情データ値の値を設定してもよい。
表示制御部48は、図3に示す検索画面20、図4に示す検索結果画面22、図5に示す分析結果画面26、図6に示す成功指標表示画面28、図8に示すオフィシャルアカウント設定画面60、などといった各種画面を生成してディスプレイに表示させる。例えば表示制御部48は、投稿データ記憶部34が記憶する投稿データに基づいて、図5に示す分析結果画面26を生成して、ディスプレイに表示させてもよい。
検索条件受付部50は、本実施形態では例えば、ユーザにより設定される、投稿データの検索条件を受け付ける。
検索結果特定部52は、本実施形態では例えば、検索条件受付部50が受け付けた検索条件を満足する投稿データを特定する。ここで表示制御部48が、検索結果特定部52が特定した投稿データに基づいて図4に例示する検索結果画面22を生成して、ディスプレイに表示させてもよい。
指標算出部54は、本実施形態では例えば、上述の成功指標などといった、投稿データに関する指標を算出する。指標算出部54は、例えば、投稿データ記憶部34に記憶されているすべての投稿データに基づいて成功指標を算出してもよい。また例えば、指標算出部54は、ユーザが指定した条件を満足する投稿データに基づいて成功指標を算出してもよい。また例えば、指標算出部54は、商品又はサービス毎に成功指標を算出してもよい。具体的には例えば、指標算出部54は、商品又はサービスの名称をメッセージデータの値として含む投稿データを特定してもよい。そして指標算出部54は、これらの投稿データの総数に対する、カテゴリがVOCである投稿データの数の割合を、当該商品又はサービスの成功の度合いを表す成功指標として算出してもよい。ここで表示制御部48が、指標算出部54が算出した成功指標に基づいて図6に例示する成功指標表示画面28を生成して、ディスプレイに表示させてもよい。
以下、本実施形態に係る投稿分析システム10において行われる、カテゴリデータの値及び感情データの値の設定処理の流れの一例を、図9A及び図9Bに例示するフロー図を参照しながら説明する。
まず、ルールベースカテゴリ設定部40が、投稿データ記憶部34に記憶されている投稿データのうちから、カテゴリデータの値の設定対象となる投稿データを特定する(S101)。ここで例えば、カテゴリデータの値が設定されていない投稿データが特定されるようにしてもよい。以下、S101に示す処理で特定された投稿データをターゲット投稿データと呼ぶこととする。
そしてルールベースカテゴリ設定部40は、ターゲット投稿データのうち、投稿者のアカウント名がオフィシャルアカウントであり、かつ、リプライのメッセージではないものを特定する(S102)。ここで例えば、作者データの値がいずれかのオフィシャルアカウントの値と一致し、かつ、メッセージデータの値に「@」を含まない投稿データが特定されてもよい。ここで特定される投稿データは広告を表すメッセージの投稿データである可能性が高いと考えられる。
そしてルールベースカテゴリ設定部40は、S102に示す処理で特定された投稿データのカテゴリデータの値にPRを設定する(S103)。
そしてルールベースカテゴリ設定部40は、S102に示す処理で特定された投稿データに含まれるメッセージデータが表す文字列を値として含むPRライブラリデータを生成して、PRライブラリデータ記憶部46に記憶させる(S104)。
そしてルールベースカテゴリ設定部40は、S102に示す処理で特定された投稿データ以外のターゲット投稿データのうち、PRライブラリデータの値である文字列をリツイートしているものを特定する(S105)。ここで例えばメッセージデータが表す文字列の一部又は全部として、「RT」といずれかのPRライブラリデータの値である文字列との結合文字列を含む投稿データが特定されるようにしてもよい。ここで特定される投稿データも広告を表すメッセージの投稿データである可能性が高いと考えられる。
そしてルールベースカテゴリ設定部40は、S105に示す処理で特定された投稿データのカテゴリデータの値にPRを設定する(S106)。
ルールベースカテゴリ設定部40は、カテゴリデータの値が未設定であるターゲット投稿データのうち、投稿者のアカウント名がオフィシャルアカウントであるものを特定する(S107)。ここで例えば、作者データの値がいずれかのオフィシャルアカウントの値と一致する投稿データが特定されてもよい。ここで特定される投稿データは質問又は回答を表すメッセージの投稿データである可能性が高いと考えられる。
そしてルールベースカテゴリ設定部40は、S107に示す処理で特定された投稿データのカテゴリデータの値にQ&Aを設定する(S108)。
そしてルールベースカテゴリ設定部40は、カテゴリデータの値が未設定であるターゲット投稿データのうち、オフィシャルアカウントに対するリプライのメッセージである投稿データを特定する(S109)。ここで例えばメッセージデータが表す文字列の一部として、「@」といずれかのオフィシャルアカウントの値である文字列との結合文字列を含む投稿データが特定されるようにしてもよい。ここで特定される投稿データも質問又は回答を表すメッセージの投稿データである可能性が高いと考えられる。
そしてルールベースカテゴリ設定部40は、S107に示す処理で特定された投稿データのカテゴリデータの値にQ&Aを設定する(S110)。
そしてルールベースカテゴリ設定部40は、カテゴリデータの値が未設定であるターゲット投稿データのうち、メッセージデータが表す文字列にURLが含まれるものを特定する(S111)。ここで特定される投稿データはユーザによって共有されたメッセージの投稿データの候補となる。
そしてルールベースカテゴリ設定部40は、S111に示す処理で特定された投稿データのうちから、メッセージデータが表す文字列に含まれるURLのリンク先がTwitter画像であるものを除外する(S112)。ここで除外される投稿データはユーザによって共有されたメッセージの投稿データである可能性が低い。
そしてルールベースカテゴリ設定部40は、S111に示す処理で特定され、S112に示す処理で一部が除外された投稿データのうち、メッセージデータが表す文字列にダブルクォーテーション及び「RT」の両方を含むものを除外する(S113)。ここで除外される投稿データもユーザによって共有されたメッセージの投稿データである可能性が低い。
そしてルールベースカテゴリ設定部40は、S111に示す処理で特定され、S112及びS113に示す処理で一部が除外された投稿データのカテゴリデータの値にISUを設定する(S114)。
そして機械学習カテゴリ設定部42は、事前に学習された二分類機械学習モデルの機械学習分類器により、残りのターゲット投稿データを、Garbageの投稿データとVOCの投稿データとに分類する(S115)。S115に示す処理では、S114に示す処理まででカテゴリデータの値が設定されていないターゲット投稿データがGarbageの投稿データとVOCの投稿データとに分類されることとなる。
そして機械学習カテゴリ設定部42は、S115に示す処理でGarbageの投稿データとして分類された投稿データのカテゴリデータの値にGarbageを設定する(S116)。
そして機械学習カテゴリ設定部42は、S115に示す処理でVOCの投稿データとして分類された投稿データのカテゴリデータの値にVOCを設定する(S117)。
そして感情データ値設定部44は、S117に示す処理でカテゴリデータの値としてVOCが設定された投稿データの感情データの値を設定する(S118)。
なお、カテゴリデータの値及び感情データの値の設定処理は上述の処理例が示す処理に限定されない。
例えば、ルールベースカテゴリ設定部40は、カスタマーサービスのアカウントとして事前に登録されたものに対するリプライのメッセージの投稿データのカテゴリデータの値としてQ&Aを設定してもよい。またルールベースカテゴリ設定部40は例えば、カスタマーサービスのアカウント名を作者データの値として含むリプライのメッセージの投稿データのカテゴリデータの値としてQ&Aを設定してもよい。またこれらの投稿データのリツイートである投稿データのカテゴリデータの値としてQ&Aが設定されてもよい。
また例えば、ルールベースカテゴリ設定部40は、メッセージデータが表す文字列にショートURLを含む投稿データのカテゴリデータの値としてISUを設定してもよい。また例えば、ルールベースカテゴリ設定部40は、メッセージデータが表す文字列にショートURLを含む投稿データのリツイートである投稿データのカテゴリデータの値としてISUを設定してもよい。
以上で説明したように、本実施形態に係る投稿分析システム10では、メッセージの投稿者、リプライ先、又は、内容についての規則に基づいて、投稿されたメッセージの一部が事前に除外される。そして、除外されたもの以外の残りのメッセージが、機械学習分類器により、投稿者の意見のメッセージとそれ以外のメッセージとに分類される。そのため本実施形態に係る投稿分析システム10では、投稿されたメッセージのうちから投稿者の意見を表すメッセージが的確に絞り込まれることとなる。
なお、本発明は上述の実施形態に限定されるものではない。
また、上記の具体的な文字列や数値及び図面中の具体的な文字列や数値は例示であり、これらの文字列や数値には限定されない。
10 投稿分析システム、10a プロセッサ、10b 記憶部、10c 通信部、10d 出力部、10e 入力部、12 SNS(Social Networking Service)システム、14 コンピュータネットワーク、20 検索画面、22 検索結果画面、24 検索結果画像、26 分析結果画面、28 成功指標表示画面、30 メッセージ取得部、32 投稿データ生成部、34 投稿データ記憶部、36 オフィシャルアカウント設定部、38 オフィシャルアカウントデータ記憶部、40 ルールベースカテゴリ設定部、42 機械学習カテゴリ設定部、44 感情データ値設定部、46 PRライブラリデータ記憶部、48 表示制御部、50 検索条件受付部、52 検索結果特定部、54 指標算出部、60 オフィシャルアカウント設定画面。

Claims (6)

  1. メッセージの投稿者、リプライ先、又は、内容についての規則に基づいて、投稿された複数の前記メッセージのうちの一部を抽出する抽出部と、
    抽出された前記メッセージを、機械学習分類器により分類する分類部と、
    を含むことを特徴とするメッセージ分類システム。
  2. 前記抽出部は、メッセージの投稿者、リプライ先、又は、内容についての規則に基づいて、投稿された複数の前記メッセージのうちから、投稿者の意見のメッセージではないと判定されるもの以外のメッセージを抽出し、
    前記分類部は、抽出された前記メッセージを、機械学習分類器により、投稿者の意見のメッセージとそれ以外のメッセージとに分類する、
    ことを特徴とする請求項1に記載のメッセージ分類システム。
  3. 前記投稿者の意見を表すメッセージの内容、又は、投稿されたメッセージの総数に対する前記投稿者の意見のメッセージの数の割合を表示させる表示制御部、をさらに含む、
    ことを特徴とする請求項1又は2に記載のメッセージ分類システム。
  4. 前記投稿された複数のメッセージは、ある商品又はサービスに関するメッセージであり、
    投稿されたメッセージの総数に対する前記投稿者の意見を表すメッセージの数の割合に基づいて、前記商品又はサービスの成功の度合いを表す指標を算出する指標算出部と、
    前記指標を表示させる表示制御部と、をさらに含む、
    ことを特徴とする請求項1又は2に記載のメッセージ分類システム。
  5. メッセージの投稿者、リプライ先、又は、内容についての規則に基づいて、投稿された複数の前記メッセージのうちの一部を抽出するステップと、
    抽出された前記メッセージを、機械学習分類器により分類するステップと、
    を含むことを特徴とするメッセージ分類方法。
  6. メッセージの投稿者、リプライ先、又は、内容についての規則に基づいて、投稿された複数の前記メッセージのうちの一部を抽出する手順、
    抽出された前記メッセージを、機械学習分類器により分類する手順、
    をコンピュータに実行させることを特徴とするプログラム。
JP2016167781A 2016-08-30 2016-08-30 メッセージ分類システム、メッセージ分類方法及びプログラム Active JP6457986B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2016167781A JP6457986B2 (ja) 2016-08-30 2016-08-30 メッセージ分類システム、メッセージ分類方法及びプログラム
US15/684,914 US11134045B2 (en) 2016-08-30 2017-08-23 Message sorting system, message sorting method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016167781A JP6457986B2 (ja) 2016-08-30 2016-08-30 メッセージ分類システム、メッセージ分類方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2018036756A true JP2018036756A (ja) 2018-03-08
JP6457986B2 JP6457986B2 (ja) 2019-01-23

Family

ID=61240719

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016167781A Active JP6457986B2 (ja) 2016-08-30 2016-08-30 メッセージ分類システム、メッセージ分類方法及びプログラム

Country Status (2)

Country Link
US (1) US11134045B2 (ja)
JP (1) JP6457986B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110598784B (zh) * 2019-09-11 2020-06-02 北京建筑大学 基于机器学习的建筑垃圾分类方法及装置
US20230196188A1 (en) * 2021-12-22 2023-06-22 AMP Robotics Corporation Maintaining a data structure corresponding to a target object

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013131073A (ja) * 2011-12-21 2013-07-04 Nippon Telegr & Teleph Corp <Ntt> 分類モデル学習方法、装置、プログラム、及びレビュー文書分類方法
JP2014026614A (ja) * 2012-07-30 2014-02-06 Kadokawa Digix Inc 検索・情報表示システム
US20140046884A1 (en) * 2012-08-08 2014-02-13 Kddi Corporation Apparatus, method, and program for extracting content-related posts

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11348012B2 (en) * 2012-08-15 2022-05-31 Refinitiv Us Organization Llc System and method for forming predictions using event-based sentiment analysis
US10430420B2 (en) * 2013-08-16 2019-10-01 International Business Machines Corporation Weighting sentiment information
US9824321B2 (en) * 2013-09-20 2017-11-21 Infosys Limited System and method for categorization of social media conversation for response management
US20150142446A1 (en) * 2013-11-21 2015-05-21 Global Analytics, Inc. Credit Risk Decision Management System And Method Using Voice Analytics
US9727371B2 (en) * 2013-11-22 2017-08-08 Decooda International, Inc. Emotion processing systems and methods
US20160034562A1 (en) * 2014-07-30 2016-02-04 Anthony Malcolm-Dacosta Method and system for organizing messages and reporting statistics for messages in a social network
US20160080438A1 (en) * 2014-08-04 2016-03-17 Place Pixel Inc. Method and Apparatus for Tile-Based Geographic Social Interaction
US20190019094A1 (en) * 2014-11-07 2019-01-17 Google Inc. Determining suitability for presentation as a testimonial about an entity
US10467630B2 (en) * 2015-01-06 2019-11-05 Adobe Inc. Organizing and classifying social media conversations to improve customer service
US10374996B2 (en) * 2016-07-27 2019-08-06 Microsoft Technology Licensing, Llc Intelligent processing and contextual retrieval of short message data

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013131073A (ja) * 2011-12-21 2013-07-04 Nippon Telegr & Teleph Corp <Ntt> 分類モデル学習方法、装置、プログラム、及びレビュー文書分類方法
JP2014026614A (ja) * 2012-07-30 2014-02-06 Kadokawa Digix Inc 検索・情報表示システム
US20140046884A1 (en) * 2012-08-08 2014-02-13 Kddi Corporation Apparatus, method, and program for extracting content-related posts
JP2014035625A (ja) * 2012-08-08 2014-02-24 Kddi Corp コンテンツに関する投稿を抽出する装置、方法およびプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
倉橋 宏幸,他: ""マイクロブログからの映画評判情報の抽出"", 第4回データ工学と情報マネジメントに関するフォーラム論文集(第10回日本データベース学会年次大会), JPN6018023635, 13 July 2012 (2012-07-13), pages 8 - 6, ISSN: 0003823415 *

Also Published As

Publication number Publication date
US11134045B2 (en) 2021-09-28
JP6457986B2 (ja) 2019-01-23
US20180063056A1 (en) 2018-03-01

Similar Documents

Publication Publication Date Title
US20170308523A1 (en) A method and system for sentiment classification and emotion classification
US9785705B1 (en) Generating and applying data extraction templates
US11803872B2 (en) Creating meta-descriptors of marketing messages to facilitate in delivery performance analysis, delivery performance prediction and offer selection
JP2010211594A (ja) テキスト分析装置および方法、並びにプログラム
CN107491435A (zh) 基于计算机自动识别用户情感的方法及装置
JP6719399B2 (ja) 解析装置、解析方法、およびプログラム
Kumar et al. Analysis of various machine learning algorithms for enhanced opinion mining using twitter data streams
Okazaki et al. How to mine brand Tweets: Procedural guidelines and pretest
JP6341899B2 (ja) 広告システム及び広告配信方法
KR102185733B1 (ko) 프로필 자동생성서버 및 방법
JP6457986B2 (ja) メッセージ分類システム、メッセージ分類方法及びプログラム
US20150193529A1 (en) Opinion analyzing system and method
WO2018003100A1 (ja) 検索プログラム、検索方法および情報処理装置
JP2020057206A (ja) 情報処理装置
US20160125438A1 (en) System and method for fast and nuanced sentiment evaluation
Dacres et al. Topic and sentiment analysis on OSNs: a case study of advertising strategies on twitter
Kaur et al. A Review on Sentimental Analysis on Facebook Comments by using Data Mining Technique
JP2020129239A (ja) 投稿分析システム、投稿分析装置および投稿分析方法
JP2016162357A (ja) 商品に対するユーザの感情分析装置及びプログラム
JP5841108B2 (ja) 情報処理装置、記事情報生成方法およびプログラム
JP6306951B2 (ja) ソーシャルネットワークサービスにおけるノイズ投稿の分類方法およびシステム
Kumar et al. Potential Extensions and Updates in Social Media for Twitter Developers
JPWO2016063403A1 (ja) データ分析システム、データ分析方法、およびデータ分析プログラム
JP2016122252A (ja) 情報処理装置、方法及びプログラム
JP7061328B1 (ja) 情報処理装置、情報処理システムおよびプログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180607

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180626

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180727

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181204

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181221

R150 Certificate of patent or registration of utility model

Ref document number: 6457986

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250