JP5882243B2 - ユーザ属性推定器構築方法、ユーザ属性推定方法、装置、及びプログラム - Google Patents
ユーザ属性推定器構築方法、ユーザ属性推定方法、装置、及びプログラム Download PDFInfo
- Publication number
- JP5882243B2 JP5882243B2 JP2013023488A JP2013023488A JP5882243B2 JP 5882243 B2 JP5882243 B2 JP 5882243B2 JP 2013023488 A JP2013023488 A JP 2013023488A JP 2013023488 A JP2013023488 A JP 2013023488A JP 5882243 B2 JP5882243 B2 JP 5882243B2
- Authority
- JP
- Japan
- Prior art keywords
- user
- document
- microblog
- attribute
- estimation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000010276 construction Methods 0.000 title claims description 125
- 238000000034 method Methods 0.000 title claims description 46
- 239000000284 extract Substances 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 235000008694 Humulus lupulus Nutrition 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
また、マイクロブログのユーザのユーザ属性情報を精度よく推定することができるユーザ属性推定方法、装置、及びプログラムを提供することを目的とする。
まず、本発明の実施の形態の概要について説明する。
図1は、本発明の実施の形態に係るマイクロブログユーザ属性推定器構築装置10を示すブロック図である。このマイクロブログユーザ属性推定器構築装置10は、CPUと、RAMと、後述するユーザ属性推定器構築処理ルーチンを実行するためのプログラムを記憶したROMとを備えたコンピュータで構成され、機能的には次に示すように構成されている。
マイクロブログ文書集合は、ユーザ毎に入力され、当該ユーザのマイクロブログ文書集合は、マイクロブログサイトから得られる、当該ユーザによって作成されたプロフィール文書及び投稿文書を含むマイクロブログ文書集合と、当該ユーザの近隣ユーザによって作成されたマイクロブログ文書集合とを含む。当該ユーザのマイクロブログ文書集合には、当該ユーザの属性を示す教師ラベルが予め付与されている。教師ラベルとは、例えば性別における男性、女性など、その属性の、当該ユーザが属するクラスを示す情報である。なお、本実施の形態では、近隣ユーザとして、ユーザと1hopの関係にあるユーザのみ利用する。当該近隣ユーザの特定については、ユーザの投稿文書から近隣ユーザのユーザID(例えば、会話の相手ユーザのユーザID)を抽出して特定する。
図3は、本発明の実施の形態に係るマイクロブログユーザ属性推定装置100を示すブロック図である。このマイクロブログユーザ属性推定装置100は、CPUと、RAMと、後述するマイクロブログユーザ属性推定処理ルーチンを実行するためのプログラムを記憶したROMとを備えたコンピュータで構成され、機能的には次に示すように構成されている。
具体的には、マイクロブログユーザ属性推定部62は、推定対象の属性の種類に対し、情報量調整部61によって選択された推定対象ユーザのプロフィール文書から得られた、プロフィール文書に対する特徴量の各々のカウント、情報量調整部61によって選択された推定対象ユーザの投稿文書から得られた、投稿文書に対する特徴量の各々のカウント、情報量調整部61によって選択された近隣ユーザのプロフィール文書から得られた、プロフィール文書に対する特徴量の各々のカウント、又は情報量調整部61によって選択された近隣ユーザの投稿文書から得られた、投稿文書に対する特徴量の各々のカウントと、上記マイクロブログユーザ属性推定器構築装置10によって構築され、マイクロブログユーザ属性推定器記憶部5に記憶されているマイクロブログユーザ属性推定器とを用いて、ユーザ属性の推定を行う。マイクロブログユーザ属性推定器による推定結果は推定するユーザ属性の種類のクラスごとに確率値として出力される。例えば、ユーザ属性の種類が性別である場合には、クラスごとに男性0.60、女性0.40と出力される。
次に、本実施の形態に係るマイクロブログユーザ属性推定器構築装置10の作用について説明する。まず、複数のマイクロブログユーザ毎のマイクロブログ文書の集合であるマイクロブログ文書集合及び当該ユーザの近隣ユーザのマイクロブログ文書集合が、当該ユーザの属性を示す教師ラベルと共にマイクロブログユーザ属性推定器構築装置10に入力されると、マイクロブログユーザ属性推定器構築装置10によって、入力されたマイクロブログ文書集合が、教師ラベルと共に、教師ラベル付与済マイクロブログ文書データベース20へ格納される。そして、パラメータ設定情報がマイクロブログユーザ属性推定器構築装置10に入力されると、マイクロブログユーザ属性推定器構築装置10によって、図4及び図5に示すユーザ属性推定器構築処理ルーチンが、推定対象の属性の種類毎に繰り返し実行される。
次に、本実施の形態に係るマイクロブログユーザ属性推定装置100の作用について説明する。まず、マイクロブログユーザ属性推定器構築装置10のマイクロブログユーザ属性推定器記憶部3に記憶されているマイクロブログユーザ属性推定器が、マイクロブログユーザ属性推定装置100に入力されると、マイクロブログユーザ属性推定器がマイクロブログユーザ属性推定器記憶部5に格納される。そして、推定したいユーザのマイクロブログユーザIDと、パラメータ設定情報とがマイクロブログユーザ属性推定装置100に入力されると、マイクロブログユーザ属性推定装置100によって、図6及び図7に示すユーザ属性推定処理ルーチンが実行される。なお、ユーザ属性推定処理ルーチンは、推定対象の属性の種類毎に繰り返し実行される。
2 構築用演算部
3、5 マイクロブログユーザ属性推定器記憶部
4 入力部
6 演算部
10 マイクロブログユーザ属性推定器構築装置
20 教師ラベル付与済マイクロブログ文書データベース
21 構築用情報量調整部
22 マイクロブログユーザ属性推定器構築部
60 マイクロブログ文書収集部
61 情報量調整部
62 マイクロブログユーザ属性推定部
100 マイクロブログユーザ属性推定装置
Claims (7)
- マイクロブログサイトの複数のユーザの各々について、前記マイクロブログサイトから得られる前記ユーザによって作成されたユーザプロフィール文書及びマイクロブログ投稿文書を含むユーザマイクロブログ文書集合と、前記ユーザと直接または間接的に関係がある近隣ユーザによって作成された前記ユーザマイクロブログ文書集合とを、前記ユーザの属性を示す教師ラベルと対応付けて記憶した記憶手段、構築用情報量調整手段、及びユーザ属性推定器構築手段を含むユーザ属性推定器構築装置におけるユーザ属性推定器構築方法であって、
前記構築用情報量調整手段によって、前記複数のユーザの各々について、推定対象の属性の種類に応じて予め定められた、前記ユーザによって作成された前記ユーザプロフィール文書及び前記マイクロブログ投稿文書、前記近隣ユーザによって作成された前記ユーザプロフィール文書及び前記マイクロブログ投稿文書の各々の利用有無に応じて、前記記憶手段によって記憶された前記ユーザの前記ユーザマイクロブログ文書集合及び前記ユーザの前記近隣ユーザの前記ユーザマイクロブログ文書集合から、前記ユーザプロフィール文書又は前記マイクロブログ投稿文書を選択するステップと、
前記ユーザ属性推定器構築手段によって、前記複数のユーザの各々について、前記構築用情報量調整手段によって選択された前記ユーザプロフィール文書又は前記マイクロブログ投稿文書から抽出される特徴量と、前記ユーザの属性を示す前記教師ラベルとに基づいて、前記ユーザマイクロブログ文書集合を作成したユーザの前記推定対象の属性を推定するためのユーザ属性推定器を構築するステップと、
を含むユーザ属性推定器構築方法。 - 特徴量選択手段によって、前記構築用情報量調整手段によって選択された前記ユーザプロフィール文書の集合に基づいて、前記ユーザプロフィール文書に対する特徴量を選択し、前記構築用情報量調整手段によって選択された前記マイクロブログ投稿文書の集合に基づいて、前記マイクロブログ投稿文書に対する特徴量を選択するステップを更に含み、
前記ユーザ属性推定器構築手段によって構築するステップは、前記複数のユーザの各々について、前記構築用情報量調整手段によって選択された前記ユーザプロフィール文書から抽出される、前記選択された前記ユーザプロフィール文書に対する特徴量、又は前記構築用情報量調整手段によって選択された前記マイクロブログ投稿文書から抽出される、前記選択された前記マイクロブログ投稿文書に対する特徴量と、前記ユーザの属性を示す前記教師ラベルとに基づいて、前記ユーザ属性推定器を構築する請求項1記載のユーザ属性推定器構築方法。 - マイクロブログ文書収集手段、情報量調整手段及びユーザ属性推定手段を含むユーザ属性推定装置におけるユーザ属性推定方法であって、
前記マイクロブログ文書収集手段によって、マイクロブログサイトから得られる、推定対象のユーザによって作成されたユーザプロフィール文書及びマイクロブログ投稿文書を含むユーザマイクロブログ文書集合を収集すると共に、前記推定対象のユーザと直接または間接的に関係がある近隣ユーザによって作成された前記ユーザマイクロブログ文書集合を収集するステップと、
前記情報量調整手段によって、推定対象の属性の種類に応じて予め定められた、前記推定対象のユーザによって作成された前記ユーザプロフィール文書及び前記マイクロブログ投稿文書、前記近隣ユーザによって作成された前記ユーザプロフィール文書及び前記マイクロブログ投稿文書の各々の利用有無に応じて、前記マイクロブログ文書収集手段によって収集された前記ユーザマイクロブログ文書集合から、前記ユーザプロフィール文書又は前記マイクロブログ投稿文書を選択するステップと、
前記ユーザ属性推定手段によって、前記推定対象の属性を推定するための予め構築されたユーザ属性推定器と、前記情報量調整手段によって選択された前記ユーザプロフィール文書又は前記マイクロブログ投稿文書から抽出される特徴量とに基づいて、前記推定対象のユーザの属性を推定するステップと、
を含むユーザ属性推定方法。 - マイクロブログサイトの複数のユーザの各々について、前記マイクロブログサイトから得られる前記ユーザによって作成されたユーザプロフィール文書及びマイクロブログ投稿文書を含むユーザマイクロブログ文書集合と、前記ユーザと直接または間接的に関係がある近隣ユーザによって作成された前記ユーザマイクロブログ文書集合とを、前記ユーザの属性を示す教師ラベルと対応付けて記憶した記憶手段と、
前記複数のユーザの各々について、推定対象の属性の種類に応じて予め定められた、前記ユーザによって作成された前記ユーザプロフィール文書及び前記マイクロブログ投稿文書、前記近隣ユーザによって作成された前記ユーザプロフィール文書及び前記マイクロブログ投稿文書の各々の利用有無に応じて、前記記憶手段によって記憶された前記ユーザの前記ユーザマイクロブログ文書集合及び前記ユーザの前記近隣ユーザの前記ユーザマイクロブログ文書集合から、前記ユーザプロフィール文書又は前記マイクロブログ投稿文書を選択する構築用情報量調整手段と、
前記複数のユーザの各々について、前記構築用情報量調整手段によって選択された前記ユーザプロフィール文書又は前記マイクロブログ投稿文書から抽出される特徴量と、前記ユーザの属性を示す前記教師ラベルとに基づいて、前記ユーザマイクロブログ文書集合を作成したユーザの前記推定対象の属性を推定するためのユーザ属性推定器を構築するユーザ属性推定器構築手段と、
を含むユーザ属性推定器構築装置。 - 前記構築用情報量調整手段によって選択された前記ユーザプロフィール文書の集合に基づいて、前記ユーザプロフィール文書に対する特徴量を選択し、前記構築用情報量調整手段によって選択された前記マイクロブログ投稿文書の集合に基づいて、前記マイクロブログ投稿文書に対する特徴量を選択する特徴量選択手段を更に含み、
前記ユーザ属性推定器構築手段は、前記複数のユーザの各々について、前記構築用情報量調整手段によって選択された前記ユーザプロフィール文書から抽出される、前記選択された前記ユーザプロフィール文書に対する特徴量、又は前記構築用情報量調整手段によって選択された前記マイクロブログ投稿文書から抽出される、前記選択された前記マイクロブログ投稿文書に対する特徴量と、前記ユーザの属性を示す前記教師ラベルとに基づいて、前記ユーザ属性推定器を構築する請求項4記載のユーザ属性推定器構築装置。 - マイクロブログサイトから得られる、推定対象のユーザによって作成されたユーザプロフィール文書及びマイクロブログ投稿文書を含むユーザマイクロブログ文書集合を収集すると共に、前記推定対象のユーザと直接または間接的に関係がある近隣ユーザによって作成された前記ユーザマイクロブログ文書集合を収集するマイクロブログ文書収集手段と、
推定対象の属性の種類に応じて予め定められた、前記推定対象のユーザによって作成された前記ユーザプロフィール文書及び前記マイクロブログ投稿文書、前記近隣ユーザによって作成された前記ユーザプロフィール文書及び前記マイクロブログ投稿文書の各々の利用有無に応じて、前記マイクロブログ文書収集手段によって収集された前記ユーザマイクロブログ文書集合から、前記ユーザプロフィール文書又は前記マイクロブログ投稿文書を選択する情報量調整手段と、
前記推定対象の属性を推定するための予め構築されたユーザ属性推定器と、前記情報量調整手段によって選択された前記ユーザプロフィール文書又は前記マイクロブログ投稿文書から抽出される特徴量とに基づいて、前記推定対象のユーザの属性を推定するユーザ属性推定手段と、
を含むユーザ属性推定装置。 - 請求項1又は2記載のユーザ属性推定器構築方法、あるいは請求項3記載のユーザ属性推定方法を構成する各ステップをコンピュータに実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013023488A JP5882243B2 (ja) | 2013-02-08 | 2013-02-08 | ユーザ属性推定器構築方法、ユーザ属性推定方法、装置、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013023488A JP5882243B2 (ja) | 2013-02-08 | 2013-02-08 | ユーザ属性推定器構築方法、ユーザ属性推定方法、装置、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014153934A JP2014153934A (ja) | 2014-08-25 |
JP5882243B2 true JP5882243B2 (ja) | 2016-03-09 |
Family
ID=51575744
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013023488A Expired - Fee Related JP5882243B2 (ja) | 2013-02-08 | 2013-02-08 | ユーザ属性推定器構築方法、ユーザ属性推定方法、装置、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5882243B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6368264B2 (ja) * | 2015-03-23 | 2018-08-01 | Kddi株式会社 | 投稿文から投稿者のプロフィール項目を分析する投稿者分析装置、プログラム及び方法 |
KR102117528B1 (ko) * | 2018-12-21 | 2020-06-01 | 아주대학교산학협력단 | 온라인 데이터에 기반한 사용자 특성 예측 장치 및 방법 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8364708B1 (en) * | 2009-12-08 | 2013-01-29 | Amdocs Software Systems Limited | System, method, and computer program for augmenting user profiles |
JP5892839B2 (ja) * | 2011-04-06 | 2016-03-23 | 日本放送協会 | プロファイル生成装置及びプログラム |
US8838688B2 (en) * | 2011-05-31 | 2014-09-16 | International Business Machines Corporation | Inferring user interests using social network correlation and attribute correlation |
-
2013
- 2013-02-08 JP JP2013023488A patent/JP5882243B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2014153934A (ja) | 2014-08-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6828204B2 (ja) | サーバ、プログラム及び情報処理方法 | |
US9934286B2 (en) | Generating contact suggestions | |
US10949771B2 (en) | Systems and methods for churn prediction | |
US20180165582A1 (en) | Systems and methods for determining sentiments in conversations in a chat application | |
EP3070661A1 (en) | System and method for providing context driven hyper-personalized recommendation | |
US20190065606A1 (en) | Systems and methods for automated page category recommendation | |
US10630632B2 (en) | Systems and methods for ranking comments | |
CN102223393A (zh) | 用于来自用户社交网络的关系表征和利用的方法和系统 | |
CA2832722A1 (en) | Data mining method for social network of terminal user and related methods, apparatuses and systems | |
JP2016045504A (ja) | 曖昧性を解消する教師データの生成方法、生成システム、及び生成プログラム | |
US10528985B2 (en) | Determining a personalized advertisement channel | |
US11050884B2 (en) | Intent-driven contact center | |
US20110218931A1 (en) | Notifications in a Social Network Service | |
KR101450453B1 (ko) | 컨텐츠 추천 방법 및 장치 | |
US20170169029A1 (en) | Systems and methods for ranking comments based on information associated with comments | |
US11138265B2 (en) | Computerized system and method for display of modified machine-generated messages | |
JP5882243B2 (ja) | ユーザ属性推定器構築方法、ユーザ属性推定方法、装置、及びプログラム | |
WO2012079147A1 (en) | Method, system and apparatus for managing contact data | |
JP2018515843A (ja) | 電話番号検索に対する乱用検出 | |
US10120838B2 (en) | Systems and methods for weighted sampling | |
KR20150145383A (ko) | 소셜 네트워크 서비스 및 컨텐츠 제공 방법 | |
US10853820B2 (en) | Method and apparatus for recommending topic-cohesive and interactive implicit communities in social customer relationship management | |
JP5324824B2 (ja) | ネットワーク・ノードを分類する情報処理装置、情報処理システム、情報処理方法およびプログラム | |
US20200112618A1 (en) | Systems and methods for providing information regarding future content | |
US9571605B1 (en) | System, method, and computer program for identifying a social network user identifier based on a user message |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150205 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20151208 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160105 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160203 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5882243 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |