JP2017021469A - 分類装置、分類方法、及び分類プログラム - Google Patents
分類装置、分類方法、及び分類プログラム Download PDFInfo
- Publication number
- JP2017021469A JP2017021469A JP2015136902A JP2015136902A JP2017021469A JP 2017021469 A JP2017021469 A JP 2017021469A JP 2015136902 A JP2015136902 A JP 2015136902A JP 2015136902 A JP2015136902 A JP 2015136902A JP 2017021469 A JP2017021469 A JP 2017021469A
- Authority
- JP
- Japan
- Prior art keywords
- classification
- user
- cluster
- information
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 34
- 230000008569 process Effects 0.000 claims description 14
- 230000006399 behavior Effects 0.000 description 75
- 239000000284 extract Substances 0.000 description 15
- 230000009471 action Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 14
- 239000013598 vector Substances 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 6
- 230000010365 information processing Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- WABPQHHGFIMREM-UHFFFAOYSA-N lead(0) Chemical compound [Pb] WABPQHHGFIMREM-UHFFFAOYSA-N 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
〔1.分類処理〕
まず、図1を用いて、実施形態に係る分類処理の一例について説明する。図1は、実施形態に係る分類処理の一例を示す図である。図1に示す例では、分類装置100(図2参照)が分類A(安全性CT11−1)や分類B(居住性CT12−1)等のそれぞれのクラスタ毎に関連付けられた特徴情報に基づいてユーザ分類を行う場合を説明する。以下では、特徴情報が複数の特徴語(以下、「キーワードリスト」とする場合がある)である場合を示す。また、クラスタ毎に関連付けられたキーワードリストに基づいて分類されるコンテンツが、ウェブページである場合を例に説明する。以下では、キーワードが関連付けられるクラスタとウェブページやユーザが分類されるクラスタが同様である場合を例に説明する。図1に示す例においては、分類装置100は、分類A(安全性CT11−*)や分類B(居住性CT12−*)等のキーワードリストと同様のクラスタに、ウェブページやユーザを分類する場合を示す。なお、以下に示す例において、ウェブページAWP11〜ウェブページEWP15等のウェブページの各々は、いわゆるウェブサイトと称される所定のウェブページ群であってもよい。例えば、ウェブページAWP11〜ウェブページEWP15等は、特定のドメイン名の下にある複数のウェブページの集まりであってもよい。
図2に示すように、分類システム1は、端末装置10と、分類装置100と、配信装置50とが含まれる。端末装置10と、分類装置100と、配信装置50とは所定のネットワークNを介して、有線または無線により通信可能に接続される。なお、図2に示した分類システム1には、複数台の端末装置10や、複数台の分類装置100や、複数台の配信装置50が含まれてもよい。
次に、図3を用いて、実施形態に係る分類装置100の構成について説明する。図3は、実施形態に係る分類装置100の構成例を示す図である。図3に示すように、分類装置100は、通信部110と、記憶部120と、制御部130とを有する。なお、分類装置100は、分類装置100の管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示するための表示部(例えば、液晶ディスプレイ等)を有してもよい。
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。実施形態に係る記憶部120は、図3に示すように、特徴情報記憶部121と、コンテンツ情報記憶部122と、第1ユーザ情報記憶部123と、第2ユーザ情報記憶部124と、ユーザ分類情報記憶部125とを有する。
実施形態に係る特徴情報記憶部121は、特徴情報に関する情報を記憶する。図4には、特徴情報記憶部121に記憶される特徴情報に関する情報の一例を示す。図4に示す例においては、特徴情報としてキーワードリストが記憶される場合を示す。図4に示すように、特徴情報記憶部121は、特徴情報に関する情報として、「分類ID」、「分類」、「名称」、「特徴情報」、「テキスト」といった項目が含まれる。
実施形態に係るコンテンツ情報記憶部122は、コンテンツに関する情報を記憶する。図5には、コンテンツ情報記憶部122に記憶されるコンテンツに関する情報の一例を示す。図5に示す例においては、コンテンツがウェブページである場合を示す。図5に示すように、コンテンツ情報記憶部122は、コンテンツに関する情報として、「コンテンツID」、「コンテンツ」、「分類」、「URL」、「スコア」といった項目が含まれる。
実施形態に係る第1ユーザ情報記憶部123は、第1ユーザに関する情報を記憶する。図6には、第1ユーザ情報記憶部123に記憶される第1ユーザに関する情報の一例を示す。図6に示すように、第1ユーザ情報記憶部123は、ユーザに関する情報として、「ユーザID」、「分類」、「嗜好」、「アクセス情報」、「行動情報」といった項目が含まれる。
実施形態に係る第2ユーザ情報記憶部124は、第2ユーザに関する情報を記憶する。図7には、第2ユーザ情報記憶部124に記憶される第2ユーザに関する情報の一例を示す。図7に示すように、第2ユーザ情報記憶部124は、ユーザに関する情報として、「ユーザID」、「分類」、「嗜好」、「行動情報」といった項目が含まれる。
実施形態に係るユーザ分類情報記憶部125は、ユーザ分類に関する情報を記憶する。図8には、ユーザ分類情報記憶部125に記憶されるユーザ分類に関する情報の一例を示す。図8に示す例においては、ユーザ分類に関する情報として各ユーザ分類(クラスタ)に対応するユーザモデルの特徴量等が記憶される場合を示す。図8に示すように、ユーザ分類情報記憶部125は、ユーザ分類に関する情報として、「分類ID」、「ユーザ分類」、「名称」、「特徴量」といった項目が含まれる。
図3の説明に戻って、制御部130は、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、分類装置100内部の記憶装置に記憶されている各種プログラム(配信プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部130は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
受付部131は、各クラスタに関連付けられた特徴情報を受け付ける。例えば、受付部131は、心理的属性に関するクラスタに関連付けられた特徴情報を受け付ける。例えば、受付部131は、心理的属性として価値基準に関するクラスタに関連付けられた特徴情報を受け付ける。例えば、受付部131は、特徴情報として各クラスタに関連付けられたブログやメーカサイトなどの記事を受け付けてもよい。図1に示す例において、受付部131は、分類装置100の管理者等から安全性CT11−1や居住性CT12−1等のクラスタ毎に関連付けられたキーワードリスト群FI11を受け付ける。
第1分類部132は、受付部131により受け付けられた特徴情報に基づいて、コンテンツを分類する。例えば、第1分類部132は、コンテンツに含まれる情報に基づいて、コンテンツを各クラスタのいずれかに分類する。例えば、第1分類部132は、心理的属性に関するクラスタに属するコンテンツを分類する。例えば、第1分類部132は、価値基準に関するクラスタに属するコンテンツを分類する。
第2分類部133は、第1分類部132により分類されたコンテンツに対するユーザのアクセス情報に基づいて、ユーザを分類する。例えば、第2分類部133は、ユーザのアクセス情報に基づいて、ユーザを各クラスタのいずれかに分類する。例えば、第2分類部133は、心理的属性に関するクラスタに属するコンテンツに対するユーザのアクセス情報に基づいて、心理的属性に関するクラスタに属するユーザを分類する。例えば、第2分類部133は、価値基準に関するクラスタに属するコンテンツに対するユーザのアクセス情報に基づいて、価値基準に関するクラスタに属するユーザを分類する。
生成部134は、第2分類部133により分類されたユーザの行動情報に基づいてユーザモデルを生成する。生成部134は、第1ユーザの行動情報に基づいて、クラスタ毎のユーザモデルを生成する。例えば、生成部134は、特徴量の抽出等のユーザモデルの生成処理を、非特許文献1に記載されたLDA(Latent Dirichlet Allocation)の技術等の種々の技術を適宜用いて行ってもよい。
判定部135は、ユーザが属するクラスタを判定する。例えば、判定部135は、第2分類部133により分類されたユーザの行動情報と類似する行動情報が受け付けられた他のユーザをそのユーザと同じクラスタに属するユーザと判定する。例えば、判定部135は、生成部134により生成されたユーザモデルに基づいて、行動情報に対応するユーザが属するクラスタを判定する。
送信部136は、外部の情報処理装置に種々の情報を送信する。例えば、送信部136は、配信装置50にユーザの分類に関する情報を送信する。例えば、送信部136は、受付部131により配信装置50から配信要求が受け付けられた場合、配信装置50にユーザの分類に関する情報を送信する。また、送信部136は、受付部131により配信装置50から特定のユーザに関する分類情報の要求が受け付けられた場合、配信装置50に特定のユーザの分類に関する情報を送信してもよい。
次に、図9を用いて、実施形態に係る分類システム1による分類処理の結果を用いた配信処理について説明する。図9は、実施形態に係るユーザ分類に基づく配信処理の一例を示すシーケンス図である。
上述してきたように、実施形態に係る分類装置100は、受付部131と、第1分類部132と、第2分類部133とを有する。受付部131は、各クラスタに関連付けられた特徴情報を受け付ける。第1分類部132は、受付部131により受け付けられた特徴情報に基づいて、コンテンツ(実施形態においては「ウェブページ」。以下同じ)を分類する。第2分類部133は、第1分類部132により分類されたコンテンツに対するユーザ(実施形態においては「第1ユーザ」。以下同じ)のアクセス情報に基づいて、ユーザを分類する。
上述してきた実施形態に係る分類装置100は、例えば図10に示すような構成のコンピュータ1000によって実現される。図10は、分類装置100の機能を実現するコンピュータ1000の一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
100 分類装置
121 特徴情報記憶部
122 コンテンツ情報記憶部
123 第1ユーザ情報記憶部
124 第2ユーザ情報記憶部
125 ユーザ分類情報記憶部
130 制御部
131 受付部
132 第1分類部
133 第2分類部
134 生成部
135 判定部
136 送信部
10 端末装置
50 配信装置
Claims (8)
- 各クラスタに関連付けられた特徴情報を受け付ける受付部と、
前記受付部により受け付けられた前記特徴情報に基づいて、コンテンツを分類する第1分類部と、
前記第1分類部により分類された前記コンテンツに対するユーザのアクセス情報に基づいて、前記ユーザを分類する第2分類部と、
を備えたことを特徴とする分類装置。 - 前記第1分類部は、
前記コンテンツに含まれる情報に基づいて、前記コンテンツを前記各クラスタのいずれかに分類する、
ことを特徴とする請求項1に記載の分類装置。 - 前記第2分類部は、
前記ユーザのアクセス情報に基づいて、前記ユーザを前記各クラスタのいずれかに分類する、
ことを特徴とする請求項1または請求項2に記載の分類装置。 - ユーザが属するクラスタを判定する判定部、
をさらに備え、
前記受付部は、
インターネットにおけるユーザの行動情報を受け付け、
前記判定部は、
前記第2分類部により分類されたユーザの行動情報と類似する行動情報が受け付けられた他のユーザを前記ユーザと同じクラスタに属するユーザと判定する、
ことを特徴とする請求項1〜3のいずれか1項に記載の分類装置。 - 前記受付部は、
心理的属性に関するクラスタに関連付けられた特徴情報を受け付け、
前記第1分類部は、
前記心理的属性に関するクラスタに属するコンテンツを分類し、
前記第2分類部は、
前記心理的属性に関するクラスタに属するコンテンツに対するユーザのアクセス情報に基づいて、前記心理的属性に関するクラスタに属するユーザを分類する、
ことを特徴とする請求項1〜4のいずれか1項に記載の分類装置。 - 前記受付部は、
前記心理的属性として価値基準に関するクラスタに関連付けられた特徴情報を受け付け、
前記第1分類部は、
前記価値基準に関するクラスタに属するコンテンツを分類し、
前記第2分類部は、
前記価値基準に関するクラスタに属するコンテンツに対するユーザのアクセス情報に基づいて、前記価値基準に関するクラスタに属するユーザを分類する、
ことを特徴とする請求項5に記載の分類装置。 - コンピュータが実行する分類方法であって、
各クラスタに関連付けられた特徴情報を受け付ける受付工程と、
前記受付工程により受け付けられた前記特徴情報に基づいて、コンテンツを分類する第1分類工程と、
前記第1分類工程により分類された前記コンテンツに対するユーザのアクセス情報に基づいて、前記ユーザを分類する第2分類工程と、
を含むことを特徴とする分類方法。 - 各クラスタに関連付けられた特徴情報を受け付ける受付手順と、
前記受付手順により受け付けられた前記特徴情報に基づいて、コンテンツを分類する第1分類手順と、
前記第1分類手順により分類された前記コンテンツに対するユーザのアクセス情報に基づいて、前記ユーザを分類する第2分類手順と、
をコンピュータに実行させることを特徴とする分類プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015136902A JP6043840B1 (ja) | 2015-07-08 | 2015-07-08 | 分類装置、分類方法、及び分類プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015136902A JP6043840B1 (ja) | 2015-07-08 | 2015-07-08 | 分類装置、分類方法、及び分類プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6043840B1 JP6043840B1 (ja) | 2016-12-14 |
JP2017021469A true JP2017021469A (ja) | 2017-01-26 |
Family
ID=57543940
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015136902A Active JP6043840B1 (ja) | 2015-07-08 | 2015-07-08 | 分類装置、分類方法、及び分類プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6043840B1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019040415A (ja) * | 2017-08-25 | 2019-03-14 | ヤフー株式会社 | 解析装置、解析方法、およびプログラム |
JPWO2021145400A1 (ja) * | 2020-01-16 | 2021-07-22 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000353174A (ja) * | 1999-06-14 | 2000-12-19 | Matsushita Electric Ind Co Ltd | 情報取得装置、情報取得方法およびその方法を実行するための記録媒体 |
JP5100855B2 (ja) * | 2011-02-09 | 2012-12-19 | 株式会社エヌ・ティ・ティ・ドコモ | 潜在クラス分析装置、潜在クラス分析方法及びプログラム |
EP2688264B1 (en) * | 2012-07-16 | 2016-08-24 | Alcatel Lucent | Method and apparatus for privacy protected clustering of user interest profiles |
JP5856598B2 (ja) * | 2013-10-18 | 2016-02-10 | ヤフー株式会社 | 情報提供装置、情報提供方法、およびプログラム |
-
2015
- 2015-07-08 JP JP2015136902A patent/JP6043840B1/ja active Active
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019040415A (ja) * | 2017-08-25 | 2019-03-14 | ヤフー株式会社 | 解析装置、解析方法、およびプログラム |
JPWO2021145400A1 (ja) * | 2020-01-16 | 2021-07-22 | ||
JP7011367B2 (ja) | 2020-01-16 | 2022-01-26 | 株式会社ウェブジョブズ | 情報処理装置、情報処理方法、プログラム、情報処理システム、及び端末 |
Also Published As
Publication number | Publication date |
---|---|
JP6043840B1 (ja) | 2016-12-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Nam et al. | Harvesting brand information from social tags | |
US10599731B2 (en) | Method and system of determining categories associated with keywords using a trained model | |
Kosinski et al. | Manifestations of user personality in website choice and behaviour on online social networks | |
US20120066073A1 (en) | User interest analysis systems and methods | |
JP6023129B2 (ja) | 抽出装置、抽出方法及び抽出プログラム | |
US20180107645A1 (en) | Book analysis and recommendation | |
Beel | Towards effective research-paper recommender systems and user modeling based on mind maps | |
Bhaskaran et al. | Enhanced personalized recommendation system for machine learning public datasets: generalized modeling, simulation, significant results and analysis | |
Melucci | Contextual search: A computational framework | |
US20150058417A1 (en) | Systems and methods of presenting personalized personas in online social networks | |
US20130035996A1 (en) | Social advertising technology (so-ad-tec) system and method for advertising for and in documents, and other systems and methods for accessing, structuring, and evaluating documents | |
US11373210B2 (en) | Content interest from interaction information | |
US9058328B2 (en) | Search device, search method, search program, and computer-readable memory medium for recording search program | |
Menaria et al. | Tweet sentiment classification by semantic and frequency base features using hybrid classifier | |
JP6043840B1 (ja) | 分類装置、分類方法、及び分類プログラム | |
Trilling et al. | 15. Computational Communication Science in a Digital Society | |
Balakrishnan et al. | Improving retrieval relevance using users’ explicit feedback | |
Ibrahim et al. | Extracting behavioural features from smartphone notifications | |
Mishra et al. | Leveraging semantic annotations to link wikipedia and news archives | |
US20160125061A1 (en) | System and method for content selection | |
JP2020154464A (ja) | 推定装置、推定方法及び推定プログラム | |
JP7073557B2 (ja) | 生成装置、生成方法、及び生成プログラム | |
Wen | Development of personalized online systems for web search, recommendations, and e-commerce | |
Li et al. | Social context analysis for topic-specific expert finding in online learning communities | |
Koidl et al. | Towards cross site personalisation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161101 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161114 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6043840 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |