JP6706493B2 - 分析装置、処理方法、プログラム - Google Patents

分析装置、処理方法、プログラム Download PDF

Info

Publication number
JP6706493B2
JP6706493B2 JP2015242327A JP2015242327A JP6706493B2 JP 6706493 B2 JP6706493 B2 JP 6706493B2 JP 2015242327 A JP2015242327 A JP 2015242327A JP 2015242327 A JP2015242327 A JP 2015242327A JP 6706493 B2 JP6706493 B2 JP 6706493B2
Authority
JP
Japan
Prior art keywords
users
user
keyword
information
user group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015242327A
Other languages
English (en)
Other versions
JP2017107490A (ja
Inventor
航 鈴木
航 鈴木
山本 浩道
浩道 山本
小野 仁意
仁意 小野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Heavy Industries Ltd
Original Assignee
Mitsubishi Heavy Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Heavy Industries Ltd filed Critical Mitsubishi Heavy Industries Ltd
Priority to JP2015242327A priority Critical patent/JP6706493B2/ja
Publication of JP2017107490A publication Critical patent/JP2017107490A/ja
Application granted granted Critical
Publication of JP6706493B2 publication Critical patent/JP6706493B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、分析装置、処理方法、プログラムに関する。
SNS(Social Networking Service)を利用してユーザが投稿した情報を用いて、マーケティングなどのための分析を行うことが現在行われつつある。なおSNSに投稿された情報を解析する技術が特許文献1に開示されている。
米国特許出願公開第2012/0209920号明細書
上述のような技術においてはSNSからユーザの属性を判定することができる。このようなユーザ属性を用いて、ユーザ属性を把握できないユーザを含むユーザ群においてキーワードに関心のあるユーザ数をより精度良く推定することが求められている。
そこでこの発明は、上述の課題を解決することのできる分析装置、処理方法、プログラムを提供することを目的としている。
本発明の第1の態様によれば、分析装置は、属性要素の判定できる第一ユーザ群に属するユーザの登録した第一投稿情報を検索対象としてシードキーワードに関連する複数の関連キーワードを用いて第一の検索を行いその検索結果に基づいて得られる前記関連キーワードに応じた第一登録度合を前記ユーザの属性要素ごとに取得する第一取得部と、属性要素の判定できない第二ユーザ群に属するユーザの登録した第二投稿情報を検索対象として前記複数の関連キーワードを用いて第二の検索を行いその検索結果に基づいて得られる前記関連キーワードに応じた第二登録度合を取得する第二取得部と、前記第一登録度合と前記第二登録度合とに基づいて前記シードキーワードに関心のある前記第二ユーザ群に属するユーザの前記属性要素ごとの数を推定する推定部と、を備える。
第1の態様の分析装置によれば、属性要素を判定できない第二ユーザ群に属するユーザの中から、シードキーワードに関心のあるユーザ数を、ユーザ属性の要素ごとに推定することができる。
また上述の分析装置において、前記第一投稿情報は、通信ネットワークに接続されたコンピュータのうち前記第一ユーザ群に対して特定サービスの情報を配信する第一コンピュータサーバに登録された情報であり、前記第二投稿情報は、前記通信ネットワークに接続された第二コンピュータであって不特定の前記第二ユーザ群に含まれるユーザによって登録された情報である。
上述の分析装置によれば、インターネット等を利用する不特定多数の第二ユーザ群に属するユーザの中から、シードキーワードに関心のあるユーザ数を、ユーザ属性の要素ごとに推定することができる。
また上述の分析装置において、前記第一投稿情報は、前記第一投稿情報は、通信ネットワークに接続され、ユーザに対して特定サービスの情報を配信する第一コンピュータサーバに投稿された情報のうち、属性要素の判定できる第一ユーザ群に属するユーザの登録した情報であり、前記第二投稿情報は、前記第一コンピュータサーバに投稿された情報のうち、属性要素の判定できない第二ユーザ群に属するユーザの登録した情報である。
上述の分析装置によれば、SNS等を利用する特定の第一ユーザ群に属するユーザのうち属性の判定できないユーザと属性の判定できるユーザの全てのユーザについて、シードキーワードに関心のあるユーザ数を、ユーザ属性の要素ごとに推定することができる。
また上述の分析装置において、前記推定部は、前記推定部は、前記第一ユーザ群に含まれるユーザの数に対する前記属性要素ごとのユーザによる前記第一登録度合の割合と、前記第二ユーザ群に含まれるユーザの数に対する前記属性要素ごとのユーザによる前記第二登録度合の割合との関係が線形であることに基づいて、前記シードキーワードに関心のある前記第二ユーザ群に属するユーザの前記属性要素ごとの数を推定する。
上述の分析装置によれば、属性要素ごとのユーザによる第一登録度合の割合と、属性要素ごとのユーザによる第二登録度合の割合との関係が線形であると推定した場合においての、シードキーワードに関心のあるユーザ数を、インターネットを利用する不特定多数の第二ユーザ群に属するユーザの中からユーザ属性の要素ごとに推定することができる。
また上述の分析装置において、前記推定部は、前記第一ユーザ群に含まれるユーザの数に対する前記属性要素ごとのユーザによる前記第一登録度合の割合と、前記第二ユーザ群に含まれるユーザの数に対する前記属性要素ごとのユーザによる前記第二登録度合の割合との関係が非線形であることに基づいて、前記シードキーワードに関心のある前記第二ユーザ群に属するユーザの前記属性要素ごとの数を推定する。
上述の分析装置によれば、属性要素ごとのユーザによる第一登録度合の割合と、属性要素ごとのユーザによる第二登録度合の割合との関係が非線形であると推定した場合においての、シードキーワードに関心のあるユーザ数を、インターネットを利用する不特定多数の第二ユーザ群に属するユーザの中からユーザ属性の要素ごとに推定することができる。
また上述の分析装置において、前記推定部は、前記関連キーワードを含む前記第一投稿情報を登録したユーザの割合を前記関連キーワードと前記属性要素の組み合わせごとに算出し、前記関連キーワードに応じた前記属性要素ごとの反応率を示す反応率ベクトルを生成し、前記反応率ベクトルを所定の数に分類し、それら分類した反応率ベクトルを一つの行列で表した反応率行列を生成し、前記反応率行列と、前記属性要素ごとの前記第一ユーザ群に含まれるユーザ数を示す行列と、前記関連キーワードに応じた前記第一投稿情報を登録した前記属性要素ごとのユーザの数を示す行列と、前記関連キーワードに応じた前記第二投稿情報を登録したユーザの数を示す行列と、を用いて前記シードキーワードに関心のある前記第二ユーザ群に属するユーザの前記属性要素ごとの数を推定する。
上述の分析装置によれば、属性要素ごとのユーザによる第一登録度合の割合と、属性要素ごとのユーザによる第二登録度合の割合との関係が線形であると推定した場合においての、シードキーワードに関心のあるユーザ数を、インターネットを利用する不特定多数の第二ユーザ群に属するユーザの中からユーザ属性の要素ごとに推定することができる。
また上述の分析装置において、前記推定部は、前記第一ユーザ群に含まれるユーザの数に対する前記属性要素ごとのユーザによる前記第一登録度合の割合を前記関連キーワードそれぞれについて算出し、その関連キーワードに応じた前記属性要素ごとのユーザによる前記第一登録度合の割合と、前記関連キーワードごとの第二登録度合の割合とを用いて、前記第二ユーザ群に属するユーザの前記属性要素ごとの数を前記関連キーワードについて算出し、その数を合計して前記シードキーワードに関心のある前記第二ユーザ群に属するユーザの数を推定する。
上述の分析装置によれば、属性要素を判定できない第二ユーザ群に属するユーザの中から、シードキーワードに関心のあるユーザ数を、ユーザ属性の要素ごとに推定することができる。
また上述の分析装置において前記関連キーワードの中から前記第一投稿情報において出現率の高いキーワードを再定義した関連キーワードとして抽出するキーワード抽出部と、を備え、前記第一取得部は、前記再定義した関連キーワードに応じた前記第一登録度合を前記ユーザの属性要素ごとに取得し、前記第二取得部は、前記再定義した関連キーワードに応じた前記第二登録度合を取得する。
上述の分析装置によれば、シードキーワードに関心のあるユーザ数を、ユーザ属性の要素ごとに推定する精度を高めることができる。
また上述の分析装置において、前記第一投稿情報を登録したユーザ数の前記第一ユーザ群に含まれるユーザの数に対する割合と、前記第二投稿情報を登録したユーザ数の前記第二ユーザ群に含まれるユーザの数に対する割合との時間に応じた変化に基づいて、前記第一ユーザ群に属するユーザから前記第二ユーザ群に属するユーザへと、前記シードキーワードに対する関心が波及する時間的な遅延度合を算出する遅延度合算出部と、を備える。
本発明の第2の態様によれば、分析装置の処理方法は、前記分析装置の第一取得部が、属性要素の判定できる第一ユーザ群に属するユーザの登録した第一投稿情報を検索対象としてシードキーワードに関連する複数の関連キーワードを用いて第一の検索を行いその検索結果に基づいて得られる前記関連キーワードに応じた第一登録度合を前記ユーザの属性要素ごとに取得し、前記分析装置の第二取得部が、属性要素の判定できない第二ユーザ群に属するユーザの登録した第二投稿情報を検索対象として前記複数の関連キーワードを用いて第二の検索を行いその検索結果に基づいて得られる前記関連キーワードに応じた第二登録度合を取得し、前記分析装置の推定部が、前記第一登録度合と前記第二登録度合とに基づいて前記シードキーワードに関心のある前記第二ユーザ群に属するユーザの前記属性要素ごとの数を推定する。
第2の態様の分析装置の処理方法によれば、属性要素を判定できない第二ユーザ群に属するユーザの中から、シードキーワードに関心のあるユーザ数を、ユーザ属性の要素ごとに推定することができる。
本発明の第3の態様によれば、プログラムは、分析装置のコンピュータに、属性要素の判定できる第一ユーザ群に属するユーザの登録した第一投稿情報を検索対象としてシードキーワードに関連する複数の関連キーワードを用いて第一の検索を行いその検索結果に基づいて得られる前記関連キーワードに応じた第一登録度合を前記ユーザの属性要素ごとに取得する第一取得手順、属性要素の判定できない第二ユーザ群に属するユーザの登録した第二投稿情報を検索対象として前記複数の関連キーワードを用いて第二の検索を行いその検索結果に基づいて得られる前記関連キーワードに応じた第二登録度合を取得する第二取得手順、前記第一登録度合と前記第二登録度合とに基づいて前記シードキーワードに関心のある前記第二ユーザ群に属するユーザの前記属性要素ごとの数を推定する推定手順、を実行させる。
第3の態様のプログラムによれば、属性要素を判定できない第二ユーザ群に属するユーザの中から、シードキーワードに関心のあるユーザ数を、ユーザ属性の要素ごとに推定する処理を行う分析装置としてコンピュータを機能させることができる。
本発明によれば、属性要素を判定できない第二ユーザ群に属するユーザの中から、シードキーワードに関心のあるユーザ数を、ユーザ属性の要素ごとに推定することができる。
第一の実施形態による分析システムを示す図である。 第一の実施形態による分析装置の処理フローを示す図である。 第四の実施形態による分析システムを示す図である。 第六の実施形態による分析システムを示す図である。
(第一の実施形態)
以下、本発明の一実施形態による分析装置を図面を参照して説明する。
図1は同実施形態による分析システムを示すブロック図である。
図1に示すように、本実施形態による分析システム100は、分析装置1、データベース2、情報蓄積装置5により構成されている。分析システム100にはSNSサーバ3、インターネットサーバ4が含まれて構成されるものと定義されてよい。分析装置1、情報蓄積装置5、SNSサーバ3(第一コンピュータサーバ)、インターネットサーバ4(第二コンピュータサーバ)はコンピュータ装置である。これらコンピュータ装置は、CPU(Central Processing Unit)などの演算部、及び、ROM(Read Only Memory)、RAM(Random Access Memory)、HDD(Hard Disk Drive)などの記憶部、及び、ネットワークインタフェースなどその他のハードウェアによって構成されている。分析装置1は通信ネットワークを介して情報蓄積装置5と接続されてよい。情報蓄積装置5はインターネット20を介して1つまたは複数のSNSサーバ3と接続されてよい。分析装置1は通信ネットワークまたは通信ケーブルを介してデータベース2と接続されている。
SNSサーバ3は、SNSのユーザ登録を行った第一ユーザ群に対してSNSとして定義される特定のサービスに関する情報を配信するコンピュータである。SNSサーバ3は、第一ユーザ群に属するユーザによって投稿された第一投稿情報を記憶部に保持する。投稿とはユーザがPCなどの端末を用いて情報をサーバ等にアップロードなどの登録を行う操作の態様を意味する。第一投稿情報には、その第一投稿情報を登録したユーザの識別情報(ID)や属性の要素が付与された文字列のテキスト情報などであってよい。第一投稿情報はその情報を登録したユーザの属性の要素を特定することのできる情報であり、第一投稿情報は少なくともユーザのIDが付与されているなどにより、ユーザを特定できる情報であればよい。分析装置1は、一例としては第一投稿情報に含まれるユーザIDを用いて、その第一投稿情報をSNSサーバ3に登録したユーザの属性の要素を判定することができる。例えば分析装置1はユーザIDに基づいて、そのユーザの属性の要素をSNSサーバ3に問い合わせる処理を行う。または分析装置1はSNSサーバ3に登録されている第一投稿情報やユーザの属性要素の情報を予めデータベース2に記憶している。第一コンピュータサーバであるSNSサーバ3はユーザ登録を行った第一ユーザ群に対して特定サービスの情報としてSNSの情報を配信するとしているが、ユーザの属性要素を把握できる情報であれば、それ以外のサービスの情報を配信するものであってもよい。
インターネットサーバ4は、第二ユーザ群と定義したユーザ群に含まれる不特定のユーザによって登録された第二投稿情報を保持するコンピュータである。第二投稿情報にはその情報を登録したユーザのIDや属性情報が付与されていない。第二投稿情報はユーザの属性やその要素の情報を特定することのできない情報として定義されてよい。第二投稿情報は、例えば記事、論文、コメントなどのテキスト情報であってよい。
SNSサーバ3とインターネットサーバ4は共にインターネットに接続されたコンピュータサーバであるが、SNSサーバ3がSNSを提供するコンピュータサーバである一方、インターネットサーバ4はそれ以外のコンピュータサーバとして定義するようにしてもよい。またはSNSサーバ3は登録したユーザの属性情報を特定できる投稿情報を保持するサーバであり、一方インターネットサーバ4はユーザの属性情報を特定できない投稿情報を保持するサーバとして定義するようにしてもよい。
SNSの提供を受けるためにユーザ登録を行った第一ユーザ群に属するユーザは、不特定多数の第二ユーザ群に属するユーザであってよい。第一ユーザ群に属するユーザはSNSに登録しているユーザ、第二ユーザ群に属するユーザはインターネットを利用するユーザであるため、第一ユーザ群に属するユーザの総数は第二ユーザ群に属するユーザの総数より少ないことは明らかである。
SNSサーバ3とインターネットサーバ4は説明の便宜上、図1において1つずつ表しているが、それぞれ複数がインターネット20を介して分析装置1と接続されてよい。
情報蓄積装置5はデータベースの機能を有しており、第一投稿情報や第二投稿情報、第一投稿情報をSNSサーバ3に登録したユーザ固有の情報(ユーザID、ユーザの属性要素など)を予め保持しているものとする。情報蓄積装置5はその情報をユーザの操作によって記憶媒体から読み取ってデータベースに蓄積してもよいし、SNSサーバ4やインターネットサーバ4から直接ネットワークを介して取得してもよい。なお分析システム100は情報蓄積装置5を有さなくともよい。その場合、分析装置1は、SNSサーバ3やインターネットサーバ4に対してインターネットを介して情報蓄積装置5を介さずに接続されていなくともよい。
分析装置1は演算部が記憶部に記録されている分析アプリケーションプログラムを実行することにより、第一取得部11、第二取得部12、推定部13の機能を有するコンピュータとなる。
第一取得部11は、SNSサーバ3に登録された第一投稿情報を検索対象として検索処理を行う。第一取得部11は、種となるシードキーワードに関連する複数の関連キーワードそれぞれを用いて第一投稿情報を検索し、その検索の結果に基づいて得られる関連キーワードに応じた第一登録度合を、第一ユーザ群に属するユーザの属性要素ごとに取得する。第一登録度合は、第一ユーザ群に属するユーザによって関連キーワードを含む第一投稿情報がSNSサーバ3に登録された量の指標を示す値である。
第二取得部12は、インターネットサーバ4に登録された第二投稿情報を検索対象として検索処理を行う。第二取得部12は、複数の関連キーワードそれぞれを用いて第二投稿情報を検索し、その検索の結果に基づいて得られる第二登録度合を取得する。第二登録度合は、第二ユーザ群に属するユーザによって関連キーワードを含む第二投稿情報がインターネットサーバ4に登録された量の指標を示す値である。
推定部13は、第一登録度合と第二登録度合とに基づいて、インターネットを利用する不特定多数の第二ユーザ群に属するユーザのうち、シードキーワードについて関心のあるユーザ数を、ユーザ属性の要素ごとに推定する。
これにより分析装置1は、インターネットを利用する不特定多数の第二ユーザ群に属するユーザの中から、シードキーワードに関心のあるユーザ数を、ユーザ属性の要素ごとに推定することができる。
図2は第一の実施形態による分析装置の処理フローを示す図である。
第一の実施形態による分析装置1の処理フローを説明する。
分析者はまずシードキーワードを決定する。シードキーワードは分析したい対象に関連する単語である。例えばある展示会について関心のある人数を分析したい場合には、その展示会の展示会タイトルなどをシードキーワードとして決定する。シードキーワードの数は1つを想定するが複数決定するようにしてもよい。分析者はシードキーワードを用いて関連キーワードを複数決定する。分析者は関連キーワードの数の総数を「m」とする。なお関連キーワードに代えて、関連キーワードを複数含むキーワードクラスタをm個決定するようにしてもよい。この場合、以下の説明における関連キーワードをキーワードクラスタと読み替えることとなる。また分析者は展示会に関心のある人についての属性の要素数を決定する。例えば展示会について興味のある性別ごとの数を分析したい場合には、ユーザ属性である「性」を構成する要素である「男」と「女」の2つの属性要素に基づいて、属性要素数を「2」と決定する。決定した属性要素数の総数を「n」とする。分析者は関連キーワードの数mが、人についての属性要素数nよりも大きい数となるようにそれらの数を決定する。分析者は決定した関連キーワードと、その関連キーワードの数mと、決定したユーザ属性の要素と、その属性要素の数nとを分析装置1に入力する。分析装置1はそれら入力した情報をメモリに記録する。
以降、関連キーワードm個のうち、任意の関連キーワードを示す際には添字i(1≦i≦m)を用いて表し、また、属性要素n個のうち、任意の属性要素を示す際には添字j(1≦j≦n)を用いて表す。
複数の関連キーワードは分析装置1が決定するようにしてもよい。この場合、分析装置1はシードキーワードを入力し、そのシードキーワードを用いてm個の関連キーワードを決定する。関連キーワードの決定方法は、意味内容的に関連の深いキーワードを必要な個数抽出できるものであれば、どのようなアルゴリズムによって決定するようにしてもよい。分析装置1はシードキーワードを用いて検索エンジンを利用して検索を行い、その結果得られた文書情報(HTML文書)に含まれる単語の中から出現頻度の高いキーワード複数を関連キーワードと特定するようにしてもよい。
分析者は分析装置1の記憶する分析アプリケーションプログラムの実行を指示する。分析装置1の演算部が分析者の操作に基づいて分析アプリケーションプログラムを実行する。この実行により分析装置1は第一取得部11、第二取得部12、推定部13の各機能を備えることとなる。
第一取得部11は、第一ユーザ群に属するユーザによってSNSサーバ3に投稿された情報(第一投稿情報)を情報蓄積装置5から読み取り、その情報の中から、複数の関連キーワードのうちの1つ目の関連キーワードkを含む情報を検索する。検索処理は情報蓄積装置5が行って、その結果を第一取得部が取得してもよい。この検索の結果、第一取得部11は、第一ユーザ群に属するユーザによる第一投稿情報のうち、関連キーワードkを含む検索結果となる投稿情報を取得する。第一取得部11は、検索結果である関連キーワードkを含む投稿情報に基づいて、その投稿情報の総数と、それら投稿情報を投稿した各ユーザの属性の要素を取得する。各ユーザの属性の要素は投稿情報に紐づけてSNSサーバ3または情報蓄積装置5が予め保持しているものとする。
第一取得部11は、関連キーワードkを含む第一投稿情報を登録した各ユーザのうち分析者によって決定された属性の要素をユーザ自身の属性の要素とするユーザを、情報蓄積装置5に記録されているSNSサーバ3の保持する情報から特定する。第一取得部11は、特定したユーザによって登録された第一投稿情報の数を、その特定したユーザの属性要素ごとにカウントする。第一取得部11は、関連キーワードkと、分析者が決定した属性要素zと、関連キーワードkを含む第一投稿情報を登録した各ユーザのうち属性要素zに一致するユーザがSNSサーバ3に登録した第一投稿情報の数とを、対応付けてデータベース2に記録する。第一取得部11は、全ての関連キーワードk,k・・・kについて同様に、関連キーワードkを含む第一投稿情報を登録した各ユーザのうち分析者によって決定された属性要素zに一致するユーザがSNSサーバ3に登録した第一投稿情報の数Sijを、その決定した属性要素zごとにカウントする(ステップS1)。これにより第一取得部11は、全ての関連キーワードk,k・・・kと分析者の決定したユーザ属性要素zの全ての組み合わせごとの検索結果の投稿情報の数Sij(第一登録度合)をデータベース2に登録する。なお本実施形態において第一取得部11は、関連キーワードkに応じた属性要素zごとの投稿情報の数Sijを取得している。しかし第一取得部11は、関連キーワードに応じた属性要素ごとの投稿(登録)の度合いを示す情報であれば他の値を取得して第一登録度合としてデータベース2に登録し、この投稿(登録)の度合(指標)を示す値を用いて以降の処理を進めるようにしてもよい。
次に第二取得部12は、第二ユーザ群に属するユーザによってインターネットサーバ4に投稿された情報(第二投稿情報)を情報蓄積装置5から読み取り、その情報の中から複数の関連キーワードのうちの1つ目のキーワードkを含む第二投稿情報を検索する。検索処理は情報蓄積装置5が行って、その結果を第二取得部が取得してもよい。この検索の結果、第二取得部12は、第二ユーザ群に属するユーザによってインターネットサーバ4に登録された第二投稿情報のうち、関連キーワードkを含む検索結果となる第二投稿情報を取得する。第二取得部12は、関連キーワードkを含む検索結果となる第二投稿情報に基づいて、その投稿情報の数を取得する。第二取得部12は、全ての関連キーワードk,k・・・kについて同様に、それら関連キーワードk,k・・・kを含む第二投稿情報の数をそれぞれ取得する。つまり第二取得部12は、全ての関連キーワードk,k・・・kごとに、検索結果の第二投稿情報の数t1,2,・・・(第二登録度合)をカウントする(ステップS2)。第二取得部12はカウントした第二投稿情報の数tをデータベース2に登録する。第二取得部12は全ての関連キーワードkについての検索処理を終了すると推定部13に処理の開始を指示する。本実施形態において第二取得部12は、関連キーワードに応じた投稿情報の数tを取得している。しかし第二取得部12は、関連キーワードに応じた投稿(登録)の度合いを示す情報であれば他の値を取得して第二登録度合としてデータベース2に登録し、この投稿(登録)の度合(指標)を示す値を用いて以降の処理を進めるようにしてもよい。
第一ユーザ群に属するユーザが関連キーワードを含む文章等の投稿情報を登録することは、第一ユーザ群に属するユーザがその関連キーワードについての事象に反応していることを示す。推定部13は各関連キーワードについて、この反応の度合いを示す反応率wijを第一取得部11の検索結果から求める。反応率wijのiは関連キーワードm個のうち、任意のものを指す識別子を示している。また反応率wijのjは属性の要素n個のうち、任意のものを指す識別子を示している。関連キーワードkを用いて第一投稿情報を検索した結果、関連キーワードkの第一投稿情報を属性要素zに一致したユーザの投稿数がxijであり、第一ユーザ群に属するユーザの総数がyであった場合、反応率wijはxij÷yにより算出することができる。推定部13はwij=xij÷yの式を用いて、第一ユーザ群に属するユーザのうち関連キーワードkについての事象に反応している属性要素zに一致するユーザの反応率wijを、関連キーワードkと属性要素zの組み合わせごとに算出する(ステップS3)。推定部13は、関連キーワードkに応じた属性要素zごとの反応率を示す反応率ベクトルw=[wi1,wi2,・・・,win]を生成する(ステップS4)。これにより推定部13は関連キーワードkに応じた属性要素zごとの反応率を示すm個の反応率ベクトルw,w,w,・・・,wを生成することができる。
次に推定部13は、生成した関連キーワードkに応じた属性要素zごとの反応率wijを示すm個の反応率ベクトルw,w,w,・・・,wそれぞれが示すベクトルの数列の偏り具合を判定する。推定部13はその偏り具合が大きい反応率ベクトルをn個抽出する。具体的には推定部13は、1つの反応率ベクトルwに含まれる反応率wijの値の偏り具合を、その反応率ベクトルwに含まれる要素(反応率wij)のジニ係数を算出し、その算出を全ての反応率ベクトルwに対して行う。推定部13はそのジニ係数が大きい反応率ベクトルwからそのジニ係数の大きい順にn個の反応率ベクトルwを抽出する(ステップS5)。推定部13はそれら抽出した反応率ベクトルwを順に、ω,ω,・・・,ωと見なす。推定部13はn行の各ベクトルω,ω,・・・,ωを用いてn×nの反応率を示す正方行列Wを生成する(ステップS6)。下記式(1)は転置行列により表している。
Figure 0006706493
この正方行列を反応率行列Wと呼ぶこととする。ジニ係数を用いる手法は反応率ベクトルwそれぞれにおける数列の偏り具合を判定するための一つの手法である。推定部13は、ジニ係数を用いる代わりに、標準偏差、ハーフィンダール指数(HHI)などを用いて反応率ベクトルwそれぞれが示すベクトルの数列の偏り具合を判定してもよい。
推定部13は、SNSサーバ3によって提供されるSNSにユーザ登録を行った第一ユーザ群の総ユーザについての属性要素を取得する。推定部13はそれら第一ユーザ群に属するユーザのうち、分析者が決定した属性要素に一致するユーザの数を算出する。この算出を行うために分析装置1はSNSサービスに登録しているユーザの各属性要素をSNSサーバ3から事前に取得していてよい。推定部13は分析者が決定した属性要素zごとのSNSサービスの登録ユーザ数を対角成分とする行列(SNS登録ユーザの属性行列A)を生成する(ステップS7)。
Figure 0006706493
この属性行列Aの対角成分をa,a,・・・,aとすると、aは属性要素zに一致するSNSサービスの登録ユーザ数を示し、aは属性要素zに一致するSNSサービスの登録ユーザ数を示し、aは属性要素zに一致するSNSサービスの登録ユーザ数を示す。
推定部13は、関連キーワードkを含む第一投稿情報を登録した各ユーザのうち分析者によって決定された属性要素zに一致するユーザによって登録された第一投稿情報の数Sijをデータベース2から取得する。また推定部13は関連キーワードkの中からn個の抽出関連キーワードを特定する。このn個の抽出関連キーワードの特定にあたり、推定部13は数Sijの中から0となっている数Sijの検索結果の検索に用いた関連キーワードkを除き、また数Sijの検索結果の検索時に用いた関連キーワードkを特定することによりn個の抽出関連キーワードk ,k ,・・・,k を特定する。推定部13は、n個の抽出関連キーワードを用いた検索結果の数Sijをそれぞれ抽出し、それら数Sijを成分とするn行n列のSNS検索結果行列Sを生成する(ステップS8)。
Figure 0006706493
数S11は抽出関連キーワードk を含む第一投稿情報を登録した各ユーザのうち分析者によって決定された属性要素zに一致するユーザによって登録された第一投稿情報の数である。数S33は抽出関連キーワードk を含む第一投稿情報を登録した各ユーザのうち分析者によって決定された属性要素zに一致するユーザによって登録された第一投稿情報の数である。数Snnは抽出関連キーワードk を含む第一投稿情報を登録した各ユーザのうち分析者によって決定された属性要素zに一致するユーザによって登録された第一投稿情報の数である。
推定部13はまた、m個の関連キーワードk,k,・・・,kから抽出したn個の抽出関連キーワードk ,k ,・・・,k を含む第二投稿情報を登録した各ユーザの数tをn個の抽出関連キーワードk ,k ,・・・,k ごとに情報蓄積装置5から取得する。推定部13はインターネットサーバ4に検索処理をさせて、その結果、抽出関連キーワードk を含む第二投稿情報を登録した各ユーザの数tをn個の抽出関連キーワードk ,k ,・・・,k ごとに取得するようにしてもよい。推定部13は抽出関連キーワードk ,k ,・・・,k ごとの数tを成分とするn行1列のインターネット検索結果行列tを生成する(ステップS9)。下記式(4)は転置行列により表している。
Figure 0006706493
インターネット検索結果行列tにおいて、例えば、tは抽出関連キーワードk を含む第二投稿情報を登録したユーザの数を示す。またtは抽出関連キーワードk を含む第二投稿情報を登録したユーザの数を示す。またtは抽出関連キーワードk を含む第二投稿情報を登録したユーザの数を示す。
本実施形態において推定部13はインターネットを利用する不特定多数の第二ユーザ群に属するユーザの中から、シードキーワードに関心のあるユーザ数を、ユーザ属性の要素ごとに推定する。よって推定部13はシードキーワードに関心のあるユーザ数をユーザ属性の要素ごとに推定するために、抽出関連キーワードk に関心のあるユーザ数をユーザ属性の要素ごとに推定する必要がる。ユーザ属性の要素ごとのシードキーワードに関心のあるユーザ数b,b,・・・,bを、
Figure 0006706493
と表すとする。下記式(5)は転置行列により表している。
上述のような式(1)〜(5)が与えられている状況において、
Figure 0006706493
Figure 0006706493
がそれぞれ成立する。そして式(7)により
Figure 0006706493
が得られる。よって式(6)と式(8)を用いて
Figure 0006706493
が成立する。式(9)を解くことにより、属性要素ごとのシードキーワードに関心のあるユーザ数を算出する(ステップS10)。上記の算出手法は、第一ユーザ群に含まれるユーザの数に対する属性要素ごとのユーザによる第一登録度合の割合を示す関係式と、第二ユーザ群に含まれるユーザの数に対する属性要素ごとのユーザによる第二登録度合の割合を示す関係式とを用いた連立方程式を、行列を用いて解く場合の例に相当する。ユーザ属性の要素ごとのシードキーワードに関心のあるユーザ数b,b,・・・,bの合計値Nは、インターネットを利用するユーザのうちシードキーワードに関心のあるユーザ数と言うことができる。
以上、第一の実施形態による分析装置1の処理について説明したが、上述の処理によれば、インターネットを利用するユーザのうちシードキーワードに関心のあるユーザ数を、ユーザ属性の要素ごとに推定することができる。
また属性要素ごとの反応率に基づいて、インターネットを利用するユーザのうちシードキーワードに関心のあるユーザ数をユーザ属性の要素ごとに推定するため、より正確性高く、インターネットを利用するユーザのうちシードキーワードに関心のあるユーザ数をユーザ属性の要素ごとに推定することが期待できる。
(第二の実施形態)
第二の実施形態による分析装置1は、第一の実施形態による反応率行列Wの生成方法とは異なる方法で、その反応率行列Wを生成する点で異なる。
具体的には、分析装置1の推定部13は、第一ユーザ群に属するユーザのうち関連キーワードkについての事象に反応している属性要素zのユーザの反応率wijを、関連キーワードkと属性要素zの組み合わせごとに算出する(ステップS3)。そして推定部13は、関連キーワードkに応じた属性要素zごとの反応率を示す反応率ベクトルw=[wi1,wi2,・・・,win]を生成する(ステップS4)。これにより推定部13は関連キーワードに応じた属性要素zごとの反応率を示す反応率ベクトルw,w,w,・・・,wのm個の反応率ベクトルを生成することができる。ここまでの処理は第一の実施形態と同様である。
次に推定部13は、クラスタ数を示すnの値を取得する。当該nの値は第一の実施形態のステップS5において抽出した反応率ベクトルwの数nと同一の値であり、予めメモリ等に記録されている。推定部13は、関連キーワードに応じた属性要素ごとの反応率を示す反応率ベクトルw,w,w,・・・,wを、クラスタ数nを用いてクラスタリングする。このクラスタリングの手法はk−means法などの公知のクラスタリング技術を利用する。これにより、関連キーワードに応じた属性要素ごとの反応率を示す反応率ベクトルw,w,w,・・・,wがn個のクラスタCに分類される。クラスタCの各クラスタ内に含まれる反応率ベクトルをwとして表す。例えばn=2、m=7であった場合、反応率ベクトルw,w,w,w,w,w,wの7つの反応率ベクトルが、クラスタCとクラスタCとに分類される。
推定部13は各クラスタCに含まれる各反応率ベクトルwを用いて、属性要素ごとの検索数を示す検索数ベクトルh=[hm1,hm2,・・・,hmn]を算出する。式(2)により、属性の要素zごとのSNSサービスの登録ユーザ数を対角成分とする行列(SNS登録ユーザの属性行列A)が与えられているため、関連キーワードに応じた属性要素ごとの検索数を示す検索数ベクトルhは、下記の式(10)を用いて算出することができる。
Figure 0006706493
推定部13は、クラスタCに含まれる反応率ベクトルwを用いて、1つ又は複数の関連キーワードのまとまりに応じた属性要素ごとの平均の反応率を示す反応率ベクトルuを各クラスタC,C,C,・・,Cに基づいて算出する。つまりクラスタCについて反応率ベクトルuを算出し、Cについて反応率ベクトルuを算出し、Cについて反応率ベクトルuを算出し、Cについて反応率ベクトルuを算出する。反応率ベクトルuは、式(10)を用いて、以下の式(11)により算出することが出来る。式(11)においてqは、クラスタCに含まれる反応率ベクトルの個数を示す。
Figure 0006706493
推定部13は、反応率ベクトルu,u,・・,uを用いて、n×nの反応率を示す反応率行列Wを生成する(ステップS6)。下記式(12)は転置行列により表している。
Figure 0006706493
以降の処理は第一の実施形態と同様である。
(第三の実施形態)
第三の実施形態による分析装置1は、第一の実施形態や第二の実施形態の分析装置1における反応率を示す反応率行列Wの生成方法とは異なる方法で、その反応率行列Wを生成する点で異なる。
具体的には、分析装置1の推定部13は、第一ユーザ群に属するユーザのうち関連キーワードkについての事象に反応している属性の要素zのユーザの反応率wijを、関連キーワードと属性の要素の組み合わせごとに算出する(ステップS3)。そして推定部13は、関連キーワードkに応じた属性要素zごとの反応率を示す反応率ベクトルw=[wi1,wi2,・・・,win]を生成する(ステップS4)。これにより推定部13は関連キーワードに応じた属性要素ごとの反応率を示す反応率ベクトルw,w,w,・・・,wのm個の反応率ベクトルを生成することができる。ここまでの処理は第一の実施形態と同様である。
次に推定部13は、m個の反応率ベクトルwのうち任意の2つの反応率ベクトルwを選択して、その選択した2つのベクトルのコサイン類似度を算出する。推定部13は算出したコサイン類似度と閾値th1との関係に基づいて、関連キーワードに応じた属性要素ごとの反応率を示す反応率ベクトルwをクラスタリングする。このクラスタリングの処理において推定部13は、コサイン類似度と閾値th1とに基づいて閾値th1以上の類似度を算出した2つの反応率ベクトルwの組み合わせを特定する。推定部13はある反応率ベクトルの組み合わせと、他の反応率ベクトルの組み合わせとを比較して同じ反応率ベクトルが含まれる各組み合わせに含まれる全ての反応率ベクトルを1つのクラスタと設定する。これにより推定部13は閾値th1以上の類似度と判定した各反応率ベクトルwの組み合わせにおいて1つまたは複数のクラスタを特定し、それ以外の反応率ベクトルwの1つずつを1つの反応率ベクトルwを含むクラスタと特定する。推定部13は、閾値th1を、閾値th1=1から値を徐々に下げていった場合のクラスタ数をカウントして、所定のクラスタ数nに分類されるまで上記クラスタの特定の処理を行う。これにより推定部13は関連キーワードに応じた属性要素ごとの反応率を示すm個の反応率ベクトルw,w,w,・・・,wをn個のクラスタCに分類する。
以降の処理は第二実施形態と同様であり、推定部13は関連キーワードに応じた属性要素ごとの反応率を示す反応率ベクトルw=[wi1,wi2,・・・,win]を用いて、関連キーワードに応じた属性要素ごとの検索数を示す検索数ベクトルh=[hm1,hm2,・・・,hmn]を算出する。式(2)により、属性の要素zごとのSNSサービスの登録ユーザ数を対角成分とする行列(SNS登録ユーザの属性行列A)が与えられているため、関連キーワードに応じた属性要素ごとの検索数を示す検索数ベクトルhは、上記の式(10)と同様に算出することができる。
推定部13は、クラスタCに含まれる1つ又は複数の関連キーワードのまとまりに応じた属性要素ごとの平均の反応率を示す反応率ベクトルu,u,u,・・・,uを算出する。このクラスタCに含まれる1つ又は複数の関連キーワードのまとまりに応じた属性要素ごとの平均の反応率を示す反応率ベクトルuは、式(10)を用いて、上記式(11)により算出することが出来る。式(11)においてqは、クラスタCに含まれる反応率ベクトルwの数を示す。
推定部13は、クラスタCに含まれる1つ又は複数の関連キーワードのまとまりに応じた属性要素ごとの平均の反応率を示す反応率ベクトルu,u,・・・,uを用いて、n×nの反応率を示す反応率行列Wを生成する。以降の処理は第一の実施形態と同様である。
上述の第二の実施形態と第三の実施形態を要約して説明すると、推定部13は、関連キーワードを含む第一投稿情報を登録したユーザの割合を関連キーワードと属性要素の組み合わせごとに算出し、関連キーワードに応じた属性要素ごとの反応率を示す反応率ベクトルwを生成する。また推定部13は、反応率ベクトルwを所定の数に分類し、それら分類した反応率ベクトルwを一つの行列で表した反応率行列Wを生成する。そして推定部13は、反応率行列Wと、属性要素ごとの第一ユーザ群に含まれるユーザ数を示す行列Aと、関連キーワードに応じた第一投稿情報を登録した属性要素ごとのユーザの数を示す行列Sと、関連キーワードに応じた第二投稿情報を登録したユーザの数を示す行列tと、を用いてシードキーワードに関心のある第二ユーザ群に属するユーザの属性要素ごとの数を推定している。
(第四の実施形態)
第四の実施形態による分析装置1は関連キーワードの抽出により有意な結果が得られないかった場合に関連キーワードを再定義する処理を行う。
図3は第四の実施形態による分析システムを示す図である。図3に示す分析装置1はさらにキーワード抽出部14を備える。当該キーワード抽出部14も、分析装置1の演算部が分析アプリケーションプログラムを実行することにより分析装置1のコンピュータに備わる機能である。
キーワード抽出部14は、関連キーワードを用いた第一取得部11の検索結果が示す属性要素に応じた第一投稿情報の数Sijや、それら関連キーワードを用いた第二取得部12の検索結果が示す属性要素に応じた第二投稿情報tを比較する。キーワード抽出部14は、比較した属性要素に応じた第一投稿情報の数Sijと第二投稿情報tとの差に有意な差が無い場合には、有意な結果が得られないと推定される場合であると判定して、以下の手法により関連キーワードの再抽出を行う。またはキーワード抽出部14はユーザによって分析装置1に入力された先の処理結果の良し悪しの情報に基づいて、先の処理結果が悪いことを示す情報を入力した場合には、有意な結果が得られないと推定される場合であると判定して、以下の手法により関連キーワードの再抽出を行ってもよい。
キーワード抽出部14は、属性要素zに応じた第一投稿情報の数Sijと第二投稿情報tとの差に有意な差が無い場合、事前にSNSサーバ3から取得して情報蓄積装置5に格納された第一投稿情報を解析する。この解析においてキーワード抽出部14は、第一投稿情報が示す文章情報を形態素解析する。キーワード抽出部14は、ある属性要素zのユーザが投稿した第一投稿情報に含まれる単語の出現率を、単語ごとに算出する。キーワード抽出部14は全ての属性要素zに応じた単語ごとの出現率を算出する。出現率の算出方法は以下の式(13)で示す。
Figure 0006706493
キーワード抽出部14は式(13)を用いた算出結果、シードキーワードの関連キーワードが示す単語の中から、出現率の高い単語を属性要素zごとに抽出して、合計でm個の関連キーワードを抽出する。この場合、属性要素zそれぞれについて抽出した関連キーワードが重ならないように、それぞれの属性要素zに応じた単語を合計でm個抽出する。そして推定部13は、キーワード抽出部14の抽出した関連キーワードを用いて第一〜第三の実施形態で示した処理を行う。
上記処理により、分析装置1は、関連キーワードの抽出により有意な結果が得られないかった場合に関連キーワードを再定義して、シードキーワードに関心のあるユーザ数を、ユーザ属性の要素ごとに推定する精度をさらに高めることができる。
(第五の実施形態)
第一〜第三の実施形態における処理は、インターネットを利用するユーザ総数に対して関連キーワードをインターネットサーバ4に登録したユーザ数の割合と、SNSのユーザ総数に対してSNSにおいて関連キーワードを投稿したユーザ数の割合との関係が線形であると推定した場合の処理である。つまり第一〜第三の実施形態における処理は、第一ユーザ群に含まれるユーザの総数に対する属性要素ごとの第一登録度合の割合と、第二ユーザ群に含まれるユーザの総数に対する属性要素ごとの第二登録度合の割合との関係が線形である場合についての処理である。
一方で、インターネットを利用するユーザのうちシードキーワードに関心を持つユーザ層におけるユーザ総数Nを対象として、関連キーワードをインターネットサーバ4に登録したユーザ数の割合と、SNSのユーザ総数に対してSNSにおいて関連キーワードを投稿したユーザ数の割合との関係が非線形であると推定して処理を行ってインターネットを利用するユーザのうちシードキーワードに関心のあるユーザ数を推定してもよい。つまり推定部13は、第一ユーザ群に含まれるユーザの総数Nに対する属性要素ごとの第一登録度合の割合と、第二ユーザ群に含まれるユーザの総数Nに対する属性要素ごとの第二登録度合の割合との関係が非線形であることに基づいて、インターネットを利用するユーザのうち関連キーワードに関心のある属性要素ごとのユーザ数を推定するようにしてもよい。
なお上述したうように、第一登録度合は関連キーワードを含む投稿情報がSNSサーバ3に登録された数を示す。また第二登録度合は関連キーワードを含む投稿情報がインターネットサーバ4に登録された数を示す。
インターネットを利用するユーザのうちシードキーワードに関心を持つユーザ層におけるユーザ総数Nを対象として、関連キーワードの含む第二投稿情報をインターネットサーバ4に登録したユーザ数をr、SNSのユーザ総数Nに対してSNSにおいて関連キーワードを含む第一投稿情報を登録したユーザ数Rとする。するとユーザ数rとユーザ数Rとを用いて非線形関数をR=f(r)と表すことができる。この非線形モデルとして仮にロジットモデルを利用した場合、推定部13は、
Figure 0006706493
とする非線形モデルを用いて、インターネットを利用するユーザのうち関連キーワードに関心のある属性要素ごとのユーザ数を推定する。ただしユーザ総数Nの推定は難しい為、複数の母集団に対する検索結果を予めデータベース2に保持しておくこととする。上述の式(14)においてαij,βijの2つのパラメータ、eは自然対数の底を示す。式(14)に示すようにαij,βijの2つのパラメータが必要である。また上述したようにiは関連キーワードkを示す識別子、jは属性要素を示す識別子である。パラメータαij,βijは、非線形な、インターネットを利用するユーザ総数に対して関連キーワードをインターネットサーバ4に登録したユーザ数の割合と、SNSのユーザ総数に対してSNSにおいて関連キーワードを投稿したユーザ数の割合との関係を特定するためのパラメータである。インターネットを利用するユーザ総数に対して関連キーワードをインターネットサーバ4に登録したユーザ数の割合と、SNSのユーザ総数に対してSNSにおいて関連キーワードを投稿したユーザ数の割合との非線形な関係は、例えばイノベータ理論による普及線と同様の曲線の関係と類似している。その非線形な関係を示す曲線は、ユーザ総数が少ない場合にはユーザ数が増加するに従って増加率が増加する状態で関連キーワードに関する情報の登録が増加する曲線を示し、ユーザ総数が多くなると逆にユーザ数が増加するに従って増加率が減少する状態で関連キーワードに関する情報の登録が徐々に増加する曲線を示す。
第五の実施形態の分析装置1によれば、属性要素ごとのユーザによる第一登録度合の割合と、属性要素ごとのユーザによる第二登録度合の割合との関係が非線形であると推定した場合においての、シードキーワードに関心のあるユーザ数を、インターネットを利用する不特定多数の第二ユーザ群に属するユーザの中からユーザ属性の要素ごとに推定することができる。
(第六の実施形態)
第六の実施形態による分析装置1はさらに遅延度合算出部15を備える。
図4は第六の実施形態による分析システムを示す図である。遅延度合算出部15は、分析装置1の演算部が分析アプリケーションプログラムを実行することにより分析装置1のコンピュータに備わる機能である。
第六の実施形態による分析装置1は上述の処理を所定の時間おきに繰り返しておこなう。これにより、分析装置1はインターネットを利用するユーザのうちシードキーワードに関心を持つユーザ層におけるユーザ数Nに対する、関連キーワードを含む第二投稿情報をインターネットサーバ4に登録したユーザ数rの割合と、SNSのユーザ総数Nに対してする、SNSにおいて関連キーワードを含む第一投稿情報を登録したユーザ数Rの割合とを、所定の時間おきに取得する。分析装置1の遅延度合算出部15は、SNSのユーザ総数Nに対する、SNSにおいて関連キーワードを投稿したユーザ数Rの割合が、例えば10%になるまでの期間T1と、インターネットにおけるシードキーワードに関心を持つユーザ数Nに対する、関連キーワードをインターネットサーバ4に登録したユーザ数をrの割合が、同じく10%になるまでの期間T2とを比較する。そして遅延度合算出部15は、期間T2と期間T1を比較することにより、SNSのユーザから、インターネットのユーザに関連キーワードについての興味が波及する時間的な遅延度合を算出する。この遅延は関連キーワードごとに算出されるため、全ての関連キーワードについての遅延度合を集計することにより、SNSのユーザから、インターネットのユーザにシードキーワードについての興味が波及する時間的な遅延度合を算出するようにしてもよい。
(第七の実施形態)
第七の実施形態において、第一投稿情報は、SNSサーバ3に投稿された情報のうち、属性要素の判定できる各ユーザを含む第一ユーザ群に属するユーザの登録した情報であるとする。また第七の実施形態において、第二投稿情報は、SNSサーバ3に投稿された情報のうち、属性要素の判定できない各ユーザを含む第二ユーザ群に属するユーザの登録した情報であるとする。
そして、第七の実施形態において第一取得部は、属性要素の判定できる第一ユーザ群に属するユーザがSNSサーバ3に登録した第一投稿情報を検索対象としてシードキーワードに関連する複数の関連キーワードを用いて第一の検索を行う。そして第一取得部は、その検索結果に基づいて得られる関連キーワードに応じた第一登録度合を属性要素ごとに取得する。
また第七の実施形態において第二取得部は、属性要素の判定できない第二ユーザ群に属するユーザがSNSサーバ3に登録した第二投稿情報を検索対象として複数の関連キーワードを用いて第二の検索を行う。そして第二取得部は、その検索結果に基づいて得られる関連キーワードに応じた第二登録度合を取得する。
また第七の実施形態において推定部は、第一登録度合と第二登録度合とに基づいて、SNSに登録したユーザ全体のうち、シードキーワードに関心のある第一ユーザ群または第二ユーザ群またはその両方のユーザ群に属するユーザの属性要素ごとの数を推定する。
次に第七の実施形態による分析装置1の処理フローを説明する。
第一実施形態と同様に分析者はシードキーワードを決定する。シードキーワードは分析したい対象に関連する単語である。例えばある展示会について関心のある人数を分析したい場合には、その展示会の展示会タイトルなどをシードキーワードとして決定する。シードキーワードの数は1つを想定するが複数決定するようにしてもよい。分析者はシードキーワードを用いて関連キーワードを複数決定する。分析者は関連キーワードの数の総数を「m」とする。なお関連キーワードに代えて、関連キーワードを複数含むキーワードクラスタをm個決定するようにしてもよい。この場合、以下の説明における関連キーワードをキーワードクラスタと読み替えることとなる。また分析者は展示会に関心のある人についての属性の要素数を決定する。例えば展示会について興味のある性別ごとの数を分析したい場合には、ユーザ属性である「性」を構成する要素である「男」と「女」の2つの属性要素に基づいて、属性要素数を「2」と決定する。決定した属性要素数の総数を「n」とする。分析者は関連キーワードの数mが、人についての属性要素数nよりも大きい数となるようにそれらの数を決定する。分析者は決定した関連キーワードと、その関連キーワードの数mと、決定したユーザ属性の要素と、その属性要素の数nとを分析装置1に入力する。分析装置1はそれら入力した情報をメモリに記録する。
複数の関連キーワードは分析装置1が決定するようにしてもよい。この場合、分析装置1はシードキーワードを入力し、そのシードキーワードを用いてm個の関連キーワードを決定する。関連キーワードの決定方法は公知の技術であればどのようなアルゴリズムによって決定するようにしてもよい。
分析者は分析装置1の記憶する分析アプリケーションプログラムの実行を指示する。分析装置1の演算部が分析者の操作に基づいて分析アプリケーションプログラムを実行する。この実行により分析装置1は第一取得部11、第二取得部12、推定部13の各機能を備えることとなる。
第一取得部11は、属性要素の判定できる各ユーザを含む第一ユーザ群に属するユーザによってSNSサーバ3に投稿された情報(第一投稿情報)を情報蓄積装置から読み取る。第一取得部11は読み取った情報の中から、複数の関連キーワードのうちの1つ目の関連キーワードkを含む情報を検索する。検索処理は情報蓄積装置5が行って、その結果を第一取得部が取得してもよい。この検索の結果、第一取得部11は、第一ユーザ群に属するユーザによる第一投稿情報のうち、関連キーワードkを含む検索結果となる投稿情報を取得する。第一取得部11は、検索結果である関連キーワードkを含む投稿情報に基づいて、その投稿情報の総数と、それら投稿情報を投稿した各ユーザの属性の要素を取得する。各ユーザの属性の要素は投稿情報に紐づけてSNSサーバ3または情報蓄積装置5が予め保持しているものとする。
第一取得部11は、関連キーワードkを含む第一投稿情報を登録した各ユーザのうち分析者によって決定された属性の要素をユーザ自身の属性の要素とするユーザを、情報蓄積装置5に記録されているSNSサーバ3の保持する情報から特定する。第一取得部11は、特定したユーザによって登録された第一投稿情報の数を、その特定したユーザの属性要素ごとにカウントする。第一取得部11は、関連キーワードkと、分析者が決定した属性要素zと、関連キーワードkを含む第一投稿情報を登録した各ユーザのうち属性要素zに一致するユーザがSNSサーバ3に登録した第一投稿情報の数とを、対応付けてデータベース2に記録する。第一取得部11は、全ての関連キーワードk,k・・・kについて同様に、関連キーワードkを含む第一投稿情報を登録した各ユーザのうち分析者によって決定された属性要素zに一致するユーザがSNSサーバ3に登録した第一投稿情報の数Sijを、その決定した属性要素zごとにカウントする(ステップS1)。これにより第一取得部11は、全ての関連キーワードk,k・・・kと分析者の決定したユーザ属性要素zの全ての組み合わせごとの検索結果の投稿情報の数Sij(第一登録度合)をデータベース2に登録する。なお本実施形態において第一取得部11は、関連キーワードkに応じた属性要素zごとの投稿情報の数Sijを取得している。しかし第一取得部11は、関連キーワードに応じた属性要素ごとの投稿(登録)の度合いを示す情報であれば他の値を取得して第一登録度合としてデータベース2に登録し、この投稿(登録)の度合(指標)を示す値を用いて以降の処理を進めるようにしてもよい。
次に第二取得部12は、属性要素の判定できない各ユーザを含む第二ユーザ群に属するユーザによってSNSサーバ3に投稿された情報(第二投稿情報)を情報蓄積装置5から読み取る。第二取得部12は読み取った情報の中から複数の関連キーワードのうちの1つ目のキーワードkを含む第二投稿情報を検索する。検索処理は情報蓄積装置5が行って、その結果を第二取得部が取得してもよい。この検索の結果、第二取得部12は、第二ユーザ群に属するユーザによってSNSサーバ3に登録された第二投稿情報のうち、関連キーワードkを含む検索結果となる第二投稿情報を取得する。第二取得部12は、関連キーワードkを含む検索結果となる第二投稿情報に基づいて、その投稿情報の数を取得する。第二取得部12は、全ての関連キーワードk,k・・・kについて同様に、それら関連キーワードk,k・・・kを含む第二投稿情報の数をそれぞれ取得する。つまり第二取得部12は、全ての関連キーワードk,k・・・kごとに、検索結果の第二投稿情報の数t,t,・・・t(第二登録度合)をカウントする(ステップS2)。第二取得部12はカウントした第二投稿情報の数tをデータベース2に登録する。第二取得部12は全ての関連キーワードkについての検索処理を終了すると推定部13に処理の開始を指示する。本実施形態において第二取得部12は、関連キーワードに応じた投稿情報の数tを取得している。しかし第二取得部12は、関連キーワードに応じた投稿(登録)の度合いを示す情報であれば他の値を取得して第二登録度合としてデータベース2に登録し、この投稿(登録)の度合(指標)を示す値を用いて以降の処理を進めるようにしてもよい。
第一ユーザ群に属するユーザが関連キーワードを含む文章等の投稿情報を登録することは、第一ユーザ群に属するユーザがその関連キーワードについての事象に反応していることを示す。推定部13は各関連キーワードについて、この反応の度合いを示す反応率wijを第一取得部11の検索結果から求める。反応率wijのiは関連キーワードm個のうち、任意のものを指す識別子を示している。また反応率wijのjは属性の要素n個のうち、任意のものを指す識別子を示している。関連キーワードkを用いて第一投稿情報を検索した結果、関連キーワードkの第一投稿情報を属性要素zに一致したユーザの投稿数がxijであり、第一ユーザ群に属するユーザの総数がyであった場合、反応率wijはxij÷yにより算出することができる。推定部13はwij=xij÷yの式を用いて、第一ユーザ群に属するユーザのうち関連キーワードkについての事象に反応している属性要素zに一致するユーザの反応率wijを、関連キーワードkと属性要素zの組み合わせごとに算出する(ステップS3)。推定部13は、関連キーワードkに応じた属性要素zごとの反応率を示す反応率ベクトルw=[wi1,wi2,・・・,win]を生成する(ステップS4)。これにより推定部13は関連キーワードkに応じた属性要素zごとの反応率を示すm個の反応率ベクトルw,w,w,・・・,wを生成することができる。
次に推定部13は、生成した関連キーワードkに応じた属性要素zごとの反応率wijを示すm個の反応率ベクトルw,w,w,・・・,wそれぞれが示すベクトルの数列の偏り具合を判定する。推定部13はその偏り具合が大きい反応率ベクトルをn個抽出する。具体的には推定部13は、1つの反応率ベクトルwに含まれる反応率wijの値の偏り具合を、その反応率ベクトルwに含まれる要素(反応率wij)のジニ係数を算出し、その算出を全ての反応率ベクトルwに対して行う。推定部13はそのジニ係数が大きい反応率ベクトルwからそのジニ係数の大きい順にn個の反応率ベクトルwを抽出する(ステップS5)。推定部13はそれら抽出した反応率ベクトルwを順に、ω,ω,・・・,ωと見なす。推定部13はn行の各ベクトルω,ω,・・・,ωを用いてn×nの反応率を示す正方行列W(上記式(1)と同様)を生成する(ステップS6)。
この正方行列を反応率行列Wと呼ぶこととする。ジニ係数を用いる手法は反応率ベクトルwそれぞれにおける数列の偏り具合を判定するための一つの手法である。推定部13は、ジニ係数を用いる代わりに、標準偏差、ハーフィンダール指数(HHI)などを用いて反応率ベクトルwそれぞれが示すベクトルの数列の偏り具合を判定してもよい。
推定部13は、SNSサーバ3によって提供されるSNSにユーザ登録を行った第一ユーザ群の総ユーザについての属性要素を取得する。推定部13はそれら第一ユーザ群に属するユーザのうち、分析者が決定した属性要素に一致するユーザの数を算出する。この算出を行うために分析装置1はSNSサービスに登録しているユーザの各属性要素をSNSサーバ3から事前に取得していてよい。推定部13は分析者が決定した属性要素zごとのSNSサービスの登録ユーザ数を対角成分とする上記式(2)で示される行列(SNS登録ユーザの属性行列A)を生成する(ステップS7)。
この属性行列Aの対角成分をa,a,・・・,aとすると、aは属性要素zに一致するSNSサービスの登録ユーザ数を示し、aは属性要素zに一致するSNSサービスの登録ユーザ数を示し、aは属性要素zに一致するSNSサービスの登録ユーザ数を示す。
推定部13は、関連キーワードkを含む第一投稿情報を登録した各ユーザのうち分析者によって決定された属性要素zに一致するユーザによって登録された第一投稿情報の数Sijをデータベース2から取得する。また推定部13は関連キーワードkの中からn個の抽出関連キーワードを特定する。このn個の抽出関連キーワードの特定にあたり、推定部13は数Sijの中から0となっている数Sijの検索結果の検索に用いた関連キーワードkを除き、また数Sijの検索結果の検索時に用いた関連キーワードkを特定することによりn個の抽出関連キーワードk ,k ,・・・,k を特定する。推定部13は、n個の抽出関連キーワードを用いた検索結果の数Sijをそれぞれ抽出し、それら数Sijを成分とするn行n列の上記式(3)で示される第一検索結果行列Sを生成する(ステップS8)。
数S11は抽出関連キーワードk を含む第一投稿情報を登録した各ユーザのうち分析者によって決定された属性要素zに一致するユーザによって登録された第一投稿情報の数である。数S33は抽出関連キーワードk を含む第一投稿情報を登録した各ユーザのうち分析者によって決定された属性要素zに一致するユーザによって登録された第一投稿情報の数である。数Snnは抽出関連キーワードk を含む第一投稿情報を登録した各ユーザのうち分析者によって決定された属性要素zに一致するユーザによって登録された第一投稿情報の数である。
推定部13はまた、m個の関連キーワードk,k,・・・,kから抽出したn個の抽出関連キーワードk ,k ,・・・,k を含む第二投稿情報を登録した各ユーザの数tをn個の抽出関連キーワードk ,k ,・・・,k ごとに情報蓄積装置5から取得する。推定部13は抽出関連キーワードk ,k ,・・・,k ごとの数tを成分とするn行1列の上記式(4)で示す第二検索結果行列tを生成する(ステップS9)。
第二検索結果行列tにおいて、例えば、tは抽出関連キーワードk を含む第二投稿情報を登録したユーザの数を示す。またtは抽出関連キーワードk を含む第二投稿情報を登録したユーザの数を示す。またtは抽出関連キーワードk を含む第二投稿情報を登録したユーザの数を示す。
本実施形態において推定部13はSNSに登録したユーザのうち属性要素の判定できない各ユーザを含む第二ユーザ群に属するユーザの中から、シードキーワードに関心のあるユーザ数を、ユーザ属性の要素ごとに推定する。よって推定部13はシードキーワードに関心のあるユーザ数をユーザ属性の要素ごとに推定するために、抽出関連キーワードk に関心のあるユーザ数をユーザ属性の要素ごとに推定する必要がる。ユーザ属性の要素ごとのシードキーワードに関心のあるユーザ数b,b,・・・,bを、上記式(5)と同様にと表すとする。
このように式(1)〜(5)が与えられている状況において、上記式(6)、式(7)がそれぞれ成立する。そして式(7)により上記式(8)が得られる。よって式(6)と式(8)を用いて上記式(9)が第一実施形態と同様に成立する。式(9)を解くことにより、属性要素ごとのシードキーワードに関心のあるユーザ数を算出する(ステップS10)。この算出手法は、第一ユーザ群に含まれるユーザの数に対する属性要素ごとのユーザによる第一登録度合の割合を示す関係式と、第二ユーザ群に含まれるユーザの数に対する属性要素ごとのユーザによる第二登録度合の割合を示す関係式とを用いた連立方程式を、行列を用いて解く場合の例に相当する。ユーザ属性の要素ごとのシードキーワードに関心のあるユーザ数b,b,・・・,bの合計値Nは、SNSに登録したユーザのうち属性要素の判定できない各ユーザを含む第二ユーザ群に属するユーザのうち、シードキーワードに関心のあるユーザ数と言うことができる。
なおSNSに登録したユーザのうち属性要素の判定できる各ユーザを含む第一ユーザ群に属するユーザのうち、シードキーワードに関心のあるユーザ数は、第一投稿情報に含まれるID等によって特定した各ユーザの属性と、第一投稿情報に含まれるキーワードを解析すれば把握することができる。したがって、これらの数と、SNSに登録したユーザのうち属性要素の判定できない各ユーザを含む第二ユーザ群に属するユーザのうち、シードキーワードに関心のあるユーザ数とを合計すれば、SNSに登録したユーザのうち、シードキーワードに関心のあるユーザ数を属性要素ごとに算出することができる。
以上、第七の実施形態による分析装置1の処理について説明したが、上述の処理によれば、SNSに登録したユーザ全体のうち、シードキーワードに関心のある第一ユーザ群または第二ユーザ群またはその両方のユーザ群に属するユーザの属性要素ごとの数を推定することができる。
なお第七の実施形態で示した反応率行列Wの生成方法の代わりに、第二の実施形態で示した反応率行列Wの生成方法や、第三の実施形態で示した反応率行列Wの生成方法を利用してもよい。
また第七の実施形態で示す分析装置1の処理に、上記第四〜第六の実施形態で示した分析装置1の処理の何れか一つまたは複数を適用してもよい。
上述の分析装置は内部に、コンピュータシステムを有している。そして、上述した各処理の過程は、プログラムの形式でコンピュータ読み取り可能な記録媒体に記憶されており、このプログラムをコンピュータが読み出して実行することによって、上記処理が行われる。ここでコンピュータ読み取り可能な記録媒体とは、磁気ディスク、光磁気ディスク、CD−ROM、DVD−ROM、半導体メモリ等をいう。また、このコンピュータプログラムを通信回線によってコンピュータに配信し、この配信を受けたコンピュータが当該プログラムを実行するようにしても良い。
また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
1・・・分析装置
2・・・データベース
3・・・SNSサーバ
4・・・インターネットサーバ
11・・・第一取得部
12・・・第二取得部
13・・・推定部
14・・・キーワード抽出部
15・・・遅延度合算出部

Claims (11)

  1. 属性要素の判定できる第一ユーザ群に属するユーザの登録した第一投稿情報を検索対象としてシードキーワードに関連する複数の関連キーワードを用いて第一の検索を行いその検索結果に基づいて得られる前記関連キーワードに応じた第一登録度合を前記ユーザの属性要素ごとに取得する第一取得部と、
    属性要素の判定できない第二ユーザ群に属するユーザの登録した第二投稿情報を検索対象として前記複数の関連キーワードを用いて第二の検索を行いその検索結果に基づいて得られる前記関連キーワードに応じた第二登録度合を取得する第二取得部と、
    前記第一登録度合と前記第二登録度合とに基づいて前記シードキーワードに関心のある前記第二ユーザ群に属するユーザの前記属性要素ごとの数を推定する推定部と、
    を備えることを特徴とする分析装置。
  2. 前記第一投稿情報は、通信ネットワークに接続されたコンピュータのうち前記第一ユーザ群に対して特定サービスの情報を配信する第一コンピュータサーバに登録された情報であり、
    前記第二投稿情報は、前記通信ネットワークに接続された第二コンピュータであって不特定の前記第二ユーザ群に含まれるユーザによって登録された情報である
    ことを特徴とする請求項1に記載の分析装置。
  3. 前記第一投稿情報は、通信ネットワークに接続され、ユーザに対して特定サービスの情報を配信する第一コンピュータサーバに投稿された情報のうち、属性要素の判定できる第一ユーザ群に属するユーザの登録した情報であり、
    前記第二投稿情報は、前記第一コンピュータサーバに投稿された情報のうち、属性要素の判定できない第二ユーザ群に属するユーザの登録した情報である
    ことを特徴とする請求項1に記載の分析装置。
  4. 前記推定部は、前記第一ユーザ群に含まれるユーザの数に対する前記属性要素ごとのユーザによる前記第一登録度合の割合と、前記第二ユーザ群に含まれるユーザの数に対する前記属性要素ごとのユーザによる前記第二登録度合の割合との関係が線形であることに基づいて、前記シードキーワードに関心のある前記第二ユーザ群に属するユーザの前記属性要素ごとの数を推定する
    請求項1から請求項3の何れか一項に記載の分析装置。
  5. 前記推定部は、前記第一ユーザ群に含まれるユーザの数に対する前記属性要素ごとのユーザによる前記第一登録度合の割合と、前記第二ユーザ群に含まれるユーザの数に対する前記属性要素ごとのユーザによる前記第二登録度合の割合との関係が非線形であることに基づいて、前記シードキーワードに関心のある前記第二ユーザ群に属するユーザの前記属性要素ごとの数を推定する
    請求項1から請求項3の何れか一項に記載の分析装置。
  6. 前記推定部は、前記関連キーワードを含む前記第一投稿情報を登録したユーザの割合を前記関連キーワードと前記属性要素の組み合わせごとに算出し、前記関連キーワードに応じた前記属性要素ごとの反応率を示す反応率ベクトルを生成し、
    前記反応率ベクトルを所定の数に分類し、それら分類した反応率ベクトルを一つの行列で表した反応率行列を生成し、
    前記反応率行列と、前記属性要素ごとの前記第一ユーザ群に含まれるユーザ数を示す行列と、前記関連キーワードに応じた前記第一投稿情報を登録した前記属性要素ごとのユーザの数を示す行列と、前記関連キーワードに応じた前記第二投稿情報を登録したユーザの数を示す行列と、を用いて前記シードキーワードに関心のある前記第二ユーザ群に属するユーザの前記属性要素ごとの数を推定する
    ことを特徴とする請求項1から請求項5の何れか一項に記載の分析装置。
  7. 前記推定部は、前記第一ユーザ群に含まれるユーザの数に対する前記属性要素ごとのユーザによる前記第一登録度合の割合を前記関連キーワードそれぞれについて算出し、その関連キーワードに応じた前記属性要素ごとのユーザによる前記第一登録度合の割合と、前記関連キーワードごとの第二登録度合の割合とを用いて、前記第二ユーザ群に属するユーザの前記属性要素ごとの数を前記関連キーワードについて算出し、その数を合計して前記シードキーワードに関心のある前記第二ユーザ群に属するユーザの数を推定する
    ことを特徴とする請求項1から請求項5の何れか一項に記載の分析装置。
  8. 前記関連キーワードの中から前記第一投稿情報において出現率の高いキーワードを再定義した関連キーワードとして抽出するキーワード抽出部と、
    を備え、
    前記第一取得部は、前記再定義した関連キーワードに応じた前記第一登録度合を前記ユーザの属性要素ごとに取得し、
    前記第二取得部は、前記再定義した関連キーワードに応じた前記第二登録度合を取得する
    請求項1から請求項7の何れか一項に記載の分析装置。
  9. 前記第一投稿情報を登録したユーザ数の前記第一ユーザ群に含まれるユーザの数に対する割合と、前記第二投稿情報を登録したユーザ数の前記第二ユーザ群に含まれるユーザの数に対する割合との時間に応じた変化に基づいて、前記第一ユーザ群に属するユーザから前記第二ユーザ群に属するユーザへと、前記シードキーワードに対する関心が波及する時間的な遅延度合を算出する遅延度合算出部と、
    を備えることを特徴とする請求項1から請求項8の何れか一項に記載の分析装置。
  10. 分析装置の処理方法であって、
    前記分析装置の第一取得部が、属性要素の判定できる第一ユーザ群に属するユーザの登録した第一投稿情報を検索対象としてシードキーワードに関連する複数の関連キーワードを用いて第一の検索を行いその検索結果に基づいて得られる前記関連キーワードに応じた第一登録度合を前記ユーザの属性要素ごとに取得し、
    前記分析装置の第二取得部が、属性要素の判定できない第二ユーザ群に属するユーザの登録した第二投稿情報を検索対象として前記複数の関連キーワードを用いて第二の検索を行いその検索結果に基づいて得られる前記関連キーワードに応じた第二登録度合を取得し、
    前記分析装置の推定部が、前記第一登録度合と前記第二登録度合とに基づいて前記シードキーワードに関心のある前記第二ユーザ群に属するユーザの前記属性要素ごとの数を推定する
    ことを特徴とする処理方法。
  11. 分析装置のコンピュータに、
    属性要素の判定できる第一ユーザ群に属するユーザの登録した第一投稿情報を検索対象としてシードキーワードに関連する複数の関連キーワードを用いて第一の検索を行いその検索結果に基づいて得られる前記関連キーワードに応じた第一登録度合を前記ユーザの属性要素ごとに取得する第一取得手順、
    属性要素の判定できない第二ユーザ群に属するユーザの登録した第二投稿情報を検索対象として前記複数の関連キーワードを用いて第二の検索を行いその検索結果に基づいて得られる前記関連キーワードに応じた第二登録度合を取得する第二取得手順、
    前記第一登録度合と前記第二登録度合とに基づいて前記シードキーワードに関心のある前記第二ユーザ群に属するユーザの前記属性要素ごとの数を推定する推定手順、
    を実行させるプログラム。
JP2015242327A 2015-12-11 2015-12-11 分析装置、処理方法、プログラム Active JP6706493B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015242327A JP6706493B2 (ja) 2015-12-11 2015-12-11 分析装置、処理方法、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015242327A JP6706493B2 (ja) 2015-12-11 2015-12-11 分析装置、処理方法、プログラム

Publications (2)

Publication Number Publication Date
JP2017107490A JP2017107490A (ja) 2017-06-15
JP6706493B2 true JP6706493B2 (ja) 2020-06-10

Family

ID=59059983

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015242327A Active JP6706493B2 (ja) 2015-12-11 2015-12-11 分析装置、処理方法、プログラム

Country Status (1)

Country Link
JP (1) JP6706493B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6979308B2 (ja) * 2017-08-31 2021-12-08 ヤフー株式会社 抽出装置、抽出方法及び抽出プログラム
CN116089732B (zh) * 2023-04-11 2023-07-04 江西时刻互动科技股份有限公司 基于广告点击数据的用户偏好识别方法及系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008158792A (ja) * 2006-12-22 2008-07-10 Ntt Docomo Inc ネットワークサーバ及び制御方法
JP2010102385A (ja) * 2008-10-21 2010-05-06 Kddi Corp ユーザ分類装置、広告配信装置、ユーザ分類方法、広告配信方法、およびプログラム
JP2010113542A (ja) * 2008-11-06 2010-05-20 Kaiin Chin 情報提供システム、情報処理装置及びそのプログラム
JP5800391B2 (ja) * 2012-03-09 2015-10-28 Kddi株式会社 放送プログラム選別方法、装置およびシステム

Also Published As

Publication number Publication date
JP2017107490A (ja) 2017-06-15

Similar Documents

Publication Publication Date Title
Kosinski et al. Mining big data to extract patterns and predict real-life outcomes.
CN106600052B (zh) 一种基于时空轨迹的用户属性与社会网络检测系统
TW202007178A (zh) 用戶特徵的生成方法、裝置、設備及儲存介質
CN106599226A (zh) 一种内容推荐方法及内容推荐系统
CN106951571B (zh) 一种给应用标注标签的方法和装置
CN108804577B (zh) 一种资讯标签兴趣度的预估方法
US10460174B2 (en) System and methods for analysis of user-associated images to generate non-user generated labels and utilization of the generated labels
CN110633421B (zh) 特征提取、推荐以及预测方法、装置、介质和设备
CN110880006B (zh) 用户分类方法、装置、计算机设备和存储介质
EP3188111A1 (en) A method for extracting latent context patterns from sensors
CN106599194A (zh) 标签确定方法及装置
CN109145224B (zh) 社交网络事件时序关系分析方法
JP7375861B2 (ja) 関連スコア算出システム、方法およびプログラム
Zhou et al. Relevance feature mapping for content-based multimedia information retrieval
CN110968802B (zh) 一种用户特征的分析方法、分析装置及可读存储介质
JP6264946B2 (ja) データ収集方法、及びデータ収集装置
JP6706493B2 (ja) 分析装置、処理方法、プログラム
JP7092194B2 (ja) 情報処理装置、判定方法、及びプログラム
CN108153818B (zh) 一种基于大数据的聚类方法
CN109615018B (zh) 用户个性化行为评价方法、装置、计算机设备和存储介质
CN103678709A (zh) 一种基于时序数据的推荐系统攻击检测算法
CN111144424A (zh) 一种基于聚类算法的人员特征检分析方法
JP2014115911A (ja) 情報推薦装置、情報推薦方法、及び情報推薦プログラム
Zhao et al. Exploiting homophily-based implicit social network to improve recommendation performance
JP5421842B2 (ja) 影響力解析装置、影響力解析方法、およびプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20151214

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181102

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20181109

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20191008

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191112

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200107

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200421

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200518

R150 Certificate of patent or registration of utility model

Ref document number: 6706493

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150