JP2017021469A

JP2017021469A - 分類装置、分類方法、及び分類プログラム

Info

Publication number: JP2017021469A
Application number: JP2015136902A
Authority: JP
Inventors: 江森　正; Tadashi Emori; 正江森; 千絵子勝野; Chieko Katsuno
Original assignee: Yahoo Japan Corp
Current assignee: Yahoo Japan Corp
Priority date: 2015-07-08
Filing date: 2015-07-08
Publication date: 2017-01-26
Anticipated expiration: 2035-07-08
Also published as: JP6043840B1

Abstract

【課題】柔軟にユーザ分類を行うこと。
【解決手段】本願に係る分類装置は、受付部と、第１分類部と、第２分類部とを有する。受付部は、各クラスタに関連付けられた特徴情報を受け付ける。第１分類部は、受付部により受け付けられた特徴情報に基づいて、コンテンツを分類する。第２分類部は、第１分類部により分類されたコンテンツに対するユーザのアクセス情報に基づいて、ユーザを分類する。例えば、第１分類部は、コンテンツに含まれる情報に基づいて、コンテンツを各クラスタのいずれかに分類する。また、例えば、第２分類部は、ユーザのアクセス情報に基づいて、ユーザを各クラスタのいずれかに分類する。
【選択図】図３

Description

本発明は、分類装置、分類方法、及び分類プログラムに関する。

従来、アンケートによりユーザから取得した情報に基づいてユーザを分類する技術が提案されている。

特開２００９−２８９０６８号公報

Blei et al, "Latent Dirichlet Allocation", Journal of Machine Learning Research, Vol. 3, pp. 993-1022, 2003.

しかしながら、上記の従来技術では柔軟にユーザ分類を行うことが難しい。例えば、アンケートを実施するにはコストを要するため、所望のユーザ分類を行う度にアンケートを実施することは難しい。

本願は、上記に鑑みてなされたものであって、柔軟にユーザ分類を行う分類装置、分類方法、及び分類プログラムを提供することを目的とする。

本願に係る分類装置は、各クラスタに関連付けられた特徴情報を受け付ける受付部と、前記受付部により受け付けられた前記特徴情報に基づいて、コンテンツを分類する第１分類部と、前記第１分類部により分類された前記コンテンツに対するユーザのアクセス情報に基づいて、前記ユーザを分類する第２分類部と、を備えたことを特徴とする。

実施形態の一態様によれば、柔軟にユーザ分類を行うことができるという効果を奏する。

図１は、実施形態に係る分類処理の一例を示す図である。図２は、実施形態に係る分類システムの構成例を示す図である。図３は、実施形態に係る分類装置の構成例を示す図である。図４は、実施形態に係る特徴情報記憶部の一例を示す図である。図５は、実施形態に係るコンテンツ情報記憶部の一例を示す図である。図６は、実施形態に係る第１ユーザ情報記憶部の一例を示す図である。図７は、実施形態に係る第２ユーザ情報記憶部の一例を示す図である。図８は、実施形態に係るユーザ分類情報記憶部の一例を示す図である。図９は、実施形態に係るユーザ分類に基づく配信処理の一例を示すシーケンス図である。図１０は、分類装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。

以下に、本願に係る分類装置、分類方法、及び分類プログラムを実施するための形態（以下、「実施形態」と呼ぶ）について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る分類装置、分類方法、及び分類プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。

（実施形態）
〔１．分類処理〕
まず、図１を用いて、実施形態に係る分類処理の一例について説明する。図１は、実施形態に係る分類処理の一例を示す図である。図１に示す例では、分類装置１００（図２参照）が分類Ａ（安全性ＣＴ１１−１）や分類Ｂ（居住性ＣＴ１２−１）等のそれぞれのクラスタ毎に関連付けられた特徴情報に基づいてユーザ分類を行う場合を説明する。以下では、特徴情報が複数の特徴語（以下、「キーワードリスト」とする場合がある）である場合を示す。また、クラスタ毎に関連付けられたキーワードリストに基づいて分類されるコンテンツが、ウェブページである場合を例に説明する。以下では、キーワードが関連付けられるクラスタとウェブページやユーザが分類されるクラスタが同様である場合を例に説明する。図１に示す例においては、分類装置１００は、分類Ａ（安全性ＣＴ１１−＊）や分類Ｂ（居住性ＣＴ１２−＊）等のキーワードリストと同様のクラスタに、ウェブページやユーザを分類する場合を示す。なお、以下に示す例において、ウェブページＡＷＰ１１〜ウェブページＥＷＰ１５等のウェブページの各々は、いわゆるウェブサイトと称される所定のウェブページ群であってもよい。例えば、ウェブページＡＷＰ１１〜ウェブページＥＷＰ１５等は、特定のドメイン名の下にある複数のウェブページの集まりであってもよい。

図１に示す例において、分類装置１００は、安全性ＣＴ１１−１や居住性ＣＴ１２−１等のクラスタ毎に関連付けられたキーワードリスト群ＦＩ１１を用いる。例えば、安全性ＣＴ１１−１には、「子供」や「ブレーキ」等の特徴語を含むキーワードリストＦＷ１１が関連付けられる。また、例えば、居住性ＣＴ１２−１には、「ゆったり」や「解放感」等の特徴語を含むキーワードリストＦＷ１２が関連付けられる。例えば、分類装置１００は、分類装置１００の管理者等から安全性ＣＴ１１−１や居住性ＣＴ１２−１等のクラスタ毎に関連付けられたキーワードリスト群ＦＩ１１を受け付ける。なお、分類装置１００は、安全性ＣＴ１１−１や居住性ＣＴ１２−１等のクラスタ毎に関連付けられた文章を受け付けて、その文章から特徴語を抽出して、キーワードリスト群ＦＩ１１を生成してもよい。

そして、分類装置１００は、キーワードリスト群ＦＩ１１を用いてコンテンツであるウェブページを分類する（ステップＳ１１）。例えば、分類装置１００は、ウェブページに含まれる情報に基づいて、ウェブページを各クラスタのいずれかに分類する。図１に示す例において、分類装置１００は、キーワードリスト群ＦＩ１１を用いて、ウェブページＡＷＰ１１〜ウェブページＥＷＰ１５等を含むウェブページ群ＷＧ１１を分類する。分類装置１００は、キーワードリスト群ＦＩ１１における各クラスタに関連付けられた特徴語と、各ウェブページに含まれる特徴語とに基づいてウェブページ群ＷＧ１１を分類するが、詳細は後述する。

図１に示す例においては、分類装置１００は、ウェブページＡＷＰ１１やウェブページＣＷＰ１３等を安全性ＣＴ１１−２のクラスタに分類し、ウェブページＢＷＰ１２やウェブページＥＷＰ１５等を居住性ＣＴ１２−２のクラスタに分類する。分類装置１００は、ウェブページ群ＷＧ１１に含まれるウェブページＡＷＰ１１〜ウェブページＥＷＰ１５等を安全性ＣＴ１１−２や居住性ＣＴ１２−２のクラスタからなる分類ウェブページ群ＣＷ１１に分類する。

そして、分類装置１００は、分類されたウェブページＡＷＰ１１〜ウェブページＥＷＰ１５等に対するユーザのアクセス情報に基づいてユーザを分類する（ステップＳ１２）。例えば、分類装置１００は、ユーザのアクセス情報に基づいて、ユーザを各クラスタのいずれかに分類する。以下では、分類されたウェブページＡＷＰ１１〜ウェブページＥＷＰ１５等に対するアクセス情報に基づいて分類されるユーザを「第１ユーザ」とする場合がある。例えば、分類装置１００は、分類されたウェブページＡＷＰ１１〜ウェブページＥＷＰ１５等に対するアクセスを所定の閾値以上行ったユーザを第１ユーザとしてもよい。なお、分類装置１００は、分類装置１００の管理者等が指定したユーザを第１ユーザとしてもよい。なお、アクセス情報の詳細については後述する。

図１に示す例において、分類されたウェブページＡＷＰ１１〜ウェブページＥＷＰ１５等に対するアクセス情報に基づくユーザ分類の対象となる第１ユーザ群ＵＧ１１には、第１ユーザＵ１〜Ｕ４等が含まれる。すなわち、図１に示す例において、分類装置１００は、分類されたウェブページＡＷＰ１１〜ウェブページＥＷＰ１５等に対する第１ユーザＵ１〜Ｕ４等のアクセス情報ＡＩ１１に基づいて第１ユーザＵ１〜Ｕ４等を分類する。

例えば、分類装置１００は、安全性ＣＴ１１−２のクラスタに分類されるウェブページＡＷＰ１１やウェブページＣＷＰ１３等へのアクセスが所定の閾値以上である第１ユーザを、安全性ＣＴ１１−３のクラスタに分類する。図１に示す例においては、ウェブページＡＷＰ１１やウェブページＣＷＰ１３等へのアクセスが所定の閾値以上である第１ユーザＵ１、Ｕ３等が安全性ＣＴ１１−３のクラスタに分類される。

また、例えば、分類装置１００は、居住性ＣＴ１２−２のクラスタに分類されるウェブページＢＷＰ１２やウェブページＥＷＰ１５等へのアクセスが所定の閾値以上である第１ユーザを、居住性ＣＴ１２−３のクラスタに分類する。図１に示す例においては、ウェブページＢＷＰ１２やウェブページＥＷＰ１５等へのアクセスが所定の閾値以上である第１ユーザＵ２、Ｕ４等が居住性ＣＴ１２−３のクラスタに分類される。

このように、分類装置１００は、第１ユーザ群ＵＧ１１に含まれる第１ユーザＵ１〜Ｕ４等を安全性ＣＴ１１−３や居住性ＣＴ１２−３のクラスタからなる分類ユーザ群ＣＵ１１に分類する。

そして、分類装置１００は、分類ユーザ群ＣＵ１１のクラスタ毎のユーザモデルを生成する（ステップＳ１３）。例えば、分類装置１００は、第１ユーザのインターネットにおける行動情報を用いて、分類ユーザ群ＣＵ１１のクラスタ毎のユーザモデルを生成する。なお、ここでいうユーザモデルは、例えば未分類のユーザがどのクラスタに属するかを判定するために用いる情報である。図１に示す例において、分類装置１００は、第１ユーザＵ１の行動情報ＢＩ１１、第１ユーザＵ２の行動情報ＢＩ１２、第１ユーザＵ３の行動情報ＢＩ１３、第１ユーザＵ４の行動情報ＢＩ１４等を含むユーザ行動情報群ＢＧ１１を用いて、分類ユーザ群ＣＵ１１のクラスタ毎のユーザモデルを生成する。なお、行動情報の詳細については後述する。

例えば、分類装置１００は、安全性ＣＴ１１−３のクラスタに属するＵ１、Ｕ３等の行動情報ＢＩ１１や行動情報ＢＩ１３等を用いて、安全性ＣＴ１１−３のクラスタに属するユーザのユーザモデルを生成する。図１に示す例において、分類装置１００は、Ｕ１、Ｕ３等の行動情報ＢＩ１１や行動情報ＢＩ１３等を用いて、安全性ＣＴ１１−３のクラスタである分類ＡのユーザモデルＵＭ１１を生成する。

また、例えば、分類装置１００は、居住性ＣＴ１２−３のクラスタに属するＵ２、Ｕ４等の行動情報ＢＩ１２や行動情報ＢＩ１４等を用いて、居住性ＣＴ１２−３のクラスタに属するユーザのユーザモデルを生成する。図１に示す例において、分類装置１００は、Ｕ２、Ｕ４等の行動情報ＢＩ１２や行動情報ＢＩ１４等を用いて、居住性ＣＴ１２−３のクラスタである分類ＢのユーザモデルＵＭ１２を生成する。

このように、分類装置１００は、分類ユーザ群ＣＵ１１に含まれる安全性ＣＴ１１−３や居住性ＣＴ１２−３のクラスタ毎のユーザモデル等を含むユーザモデル群ＭＧ１１を生成する。

そして、分類装置１００は、ステップＳ１３において生成したユーザモデル群ＭＧ１１を用いて、第１ユーザに含まれないユーザ（以下、「第２ユーザ」とする場合がある）を分類する。図１に示す例において、分類装置１００は、ユーザモデル群ＭＧ１１を用いて、第２ユーザ群ＵＧ１２に含まれる第２ユーザＵＸを分類する（ステップＳ１４）。

分類装置１００は、ユーザモデル群ＭＧ１１と第２ユーザＵＸの行動情報ＢＩＸとを用いて、第２ユーザＵＸを分類する。分類装置１００は、分類された第１ユーザの行動情報と類似する行動情報に対応する第２ユーザを、その第１ユーザと同じクラスタに属するユーザと判定する。例えば、分類装置１００は、分類ユーザ群ＣＵ１１に含まれる安全性ＣＴ１１−３や居住性ＣＴ１２−３等のクラスタのいずれかに第２ユーザＵＸを分類する。図１に示す例において、分類装置１００は、第２ユーザＵＸを安全性ＣＴ１１−３のクラスタに分類する。

上述したように、分類装置１００は、分類Ａ（安全性ＣＴ１１−１）や分類Ｂ（居住性ＣＴ１２−１）等のそれぞれのクラスタ毎に関連付けられたキーワードリストを用いることにより、ウェブページをキーワードリストに対応するクラスタに分類する。そして、分類装置１００は、分類したウェブページに対するアクセス情報に基づいて第１ユーザを、ウェブページに対応するクラスタに分類する。そして、分類装置１００は、分類した第１ユーザの行動情報に基づいて、ユーザを分類するクラスタ毎のユーザモデルを生成する。

このように、分類装置１００は、任意に与えられたクラスタに基づいて、コンテンツであるウェブページを適切に分類することができる。つまり、分類装置１００は、各クラスタに関連付けられた特徴情報が与えられれば、自動的にウェブページを適切に分類することができる。例えば、分類装置１００は、人手によりウェブページに分類を示すタグを付与する場合等と比較して、多数のウェブページに対するアクセス情報に基づいて第１ユーザを分類することができるため、第１ユーザの分類の精度を高めることができる。これにより、分類装置１００は、第２ユーザの分類の精度を高めることができる。

また、分類装置１００は、任意に与えられたクラスタに基づいて、ユーザモデルを生成することができる。そして、分類装置１００は、生成したユーザモデルにより、ユーザを分類することができる。つまり、分類装置１００は、各クラスタに関連付けられた特徴情報が与えられれば、ユーザを分類することができる。例えば、アンケート等のコストを要する作業を行うことなく、クラスタ毎に関連付けられた特徴情報を用いることにより、適切にユーザモデルを生成し、生成したユーザモデルにより未分類のユーザである第２ユーザを適切に分類することができる。したがって、分類装置１００は、柔軟にユーザ分類を行うことができる。

例えば、事前にアンケートをとる方法は、製品・サービスに合うような設問を設計することによりユーザを分類できるが、アンケートをとること自体にコストがかかる。そのため、アンケートをとる方法でユーザを分類する場合、ユーザ数が制限される。また、事前にアンケートをとる方法では、一度アンケートを実施してしまうと、再びアンケートをとるコストが大きい。一方、分類装置１００は、低コストで、任意に与えられたクラスタに基づいて、ユーザモデルを生成することができる。そして、分類装置１００は、生成したユーザモデルにより、ユーザを分類することができる。

なお、上記例においては、クラスタ毎に関連付けられた特徴情報としてキーワードリストを用いる場合を示したが、特徴情報には目的に応じて種々の情報が用いられてもよい。例えば、特徴情報にはメーカなどのサイトに記載されているテキストやＣＭのクローズドキャプション（ナレーション）やマーケティング担当者のインタビュー記事等から抽出された特徴語が用いられてもよい。また、例えば、特徴情報には画像情報等が用いられてもよい。また、分類装置１００は、特徴情報が関連付けられたクラスタと同様のクラスタにコンテンツやユーザを分類したが、コンテンツやユーザを分類するクラスタは、目的に応じて種々選択されてもよい。例えば、分類装置１００は、コンテンツを特徴情報が関連付けられたクラスタと同様のクラスタに分類し、ユーザを特徴情報が関連付けられたクラスタとは異なるクラスタに分類してもよい。また、分類装置１００は、宣伝したい製品・サービスに基づくユーザの分類を行ってもよい。例えば、所定の配信装置５０は、分類装置１００に分類されたユーザの端末装置１０に、分類装置１００によるユーザの分類を示す情報に基づく広告を配信することにより、広告効果を高めることも可能となる。例えば、分類装置１００は、ユーザの分類を示す情報に基づいて広告を配信する配信装置であってもよい。

〔２．分類システムの構成〕
図２に示すように、分類システム１は、端末装置１０と、分類装置１００と、配信装置５０とが含まれる。端末装置１０と、分類装置１００と、配信装置５０とは所定のネットワークＮを介して、有線または無線により通信可能に接続される。なお、図２に示した分類システム１には、複数台の端末装置１０や、複数台の分類装置１００や、複数台の配信装置５０が含まれてもよい。

端末装置１０は、ユーザによって利用される情報処理装置である。端末装置１０は、ユーザによる操作に従って、ブラウザを起動しウェブページを表示したりする。なお、以下では、端末装置１０をユーザと表記する場合がある。すなわち、以下では、ユーザを端末装置１０と読み替えることもできる。なお、上述した端末装置１０は、例えば、スマートフォンや、タブレット型端末や、ノート型ＰＣ（Personal Computer）や、デスクトップＰＣや、携帯電話機や、ＰＤＡ（Personal Digital Assistant）等により実現される。

分類装置１００は、各クラスタに関連付けられた特徴情報に基づいて、コンテンツを分類する情報処理装置である。また、分類装置１００は、コンテンツに対する第１ユーザのアクセス情報に基づいて、第１ユーザを分類する。また、分類装置１００は、分類された第１ユーザの行動情報と類似する行動情報に対応する第２ユーザを、その第１ユーザと同じクラスタに属するユーザと判定する。

配信装置５０は、端末装置１０からの要求に基づいてコンテンツを提供する情報処理装置である。例えば、配信装置５０は、端末装置１０からの要求に基づいて端末装置１０へ広告を配信する。また、例えば、配信装置５０は、端末装置１０を利用するユーザのユーザ分類に基づく広告を端末装置１０へ配信する。

〔３．分類装置の構成〕
次に、図３を用いて、実施形態に係る分類装置１００の構成について説明する。図３は、実施形態に係る分類装置１００の構成例を示す図である。図３に示すように、分類装置１００は、通信部１１０と、記憶部１２０と、制御部１３０とを有する。なお、分類装置１００は、分類装置１００の管理者等から各種操作を受け付ける入力部（例えば、キーボードやマウス等）や、各種情報を表示するための表示部（例えば、液晶ディスプレイ等）を有してもよい。

通信部１１０は、例えば、ＮＩＣ等によって実現される。そして、通信部１１０は、ネットワークと有線または無線で接続され、配信装置５０や端末装置１０との間で情報の送受信を行う。

（記憶部１２０）
記憶部１２０は、例えば、ＲＡＭ（Random Access Memory）、フラッシュメモリ（Flash Memory）等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。実施形態に係る記憶部１２０は、図３に示すように、特徴情報記憶部１２１と、コンテンツ情報記憶部１２２と、第１ユーザ情報記憶部１２３と、第２ユーザ情報記憶部１２４と、ユーザ分類情報記憶部１２５とを有する。

（特徴情報記憶部１２１）
実施形態に係る特徴情報記憶部１２１は、特徴情報に関する情報を記憶する。図４には、特徴情報記憶部１２１に記憶される特徴情報に関する情報の一例を示す。図４に示す例においては、特徴情報としてキーワードリストが記憶される場合を示す。図４に示すように、特徴情報記憶部１２１は、特徴情報に関する情報として、「分類ＩＤ」、「分類」、「名称」、「特徴情報」、「テキスト」といった項目が含まれる。

「分類ＩＤ」は、特徴情報が関連付けられたクラスタ（分類）を識別するための識別情報を示す。「分類」は、分類ＩＤにより識別される分類を示す。「名称」は、分類ＩＤにより識別される分類の名称を示す。「特徴情報」は、分類ＩＤにより識別される分類に関連付けられた特徴情報であるキーワードリストを示す。「テキスト」は、特徴語を抽出するために用いた文章を示す。

図４に示す例において、例えば、分類ＩＤ「ＣＴ１１−１」により識別される分類「分類Ａ」の名称は「安全性」であることを示す。また、図４に示す例において、分類Ａに関連付けられた特徴語は、特徴語１「子供」や特徴語２「ブレーキ」等であることを示す。また、図４に示す例において、分類Ａに関連付けられた特徴語の抽出に用いた文章は、テキスト「車に子供を乗せる…」であることを示す。

なお、特徴情報記憶部１２１は、上記は特徴情報に関する情報の一例であって、特徴情報に関する情報であれば目的に応じて種々の情報を記憶してもよい。例えば、特徴情報記憶部１２１は、各特徴語の重要度（重み）に関する情報などを記憶してもよい。なお、特徴情報記憶部１２１は、分類装置１００がキーワードリストを受け付ける場合、「テキスト」の項目を有さなくてもよい。また、特徴情報が静止画像や動画像等の情報である場合、「特徴情報」には、その静止画像や動画像、または、これらの格納場所を示すファイルパス名などが格納されてもよい。

（コンテンツ情報記憶部１２２）
実施形態に係るコンテンツ情報記憶部１２２は、コンテンツに関する情報を記憶する。図５には、コンテンツ情報記憶部１２２に記憶されるコンテンツに関する情報の一例を示す。図５に示す例においては、コンテンツがウェブページである場合を示す。図５に示すように、コンテンツ情報記憶部１２２は、コンテンツに関する情報として、「コンテンツＩＤ」、「コンテンツ」、「分類」、「ＵＲＬ」、「スコア」といった項目が含まれる。

「コンテンツＩＤ」は、コンテンツであるウェブページを識別するための識別情報を示す。「コンテンツ」は、ウェブページの内容等を示す。例えば、「コンテンツ」には、対応するウェブページに記載された記事や、ＳＮＳ（Social Networking Service）などの書き込みテキスト、ＥＣ（Electronic Commerce）サイトのレビュー記事や書き込み、質問サイトの質問内容や回答などのテキスト情報であってもよい。また、「分類」は、対応するウェブページが分類されるクラスタを識別するための識別情報を示す。「ＵＲＬ」は、対応するウェブページのＵＲＬ（Uniform Resource Locator）を示す。「スコア」は、分類毎に算出されたスコアを示す。

図４に示す例において、例えば、コンテンツＩＤ「ＷＰ１１」により識別されるコンテンツ「ウェブページＡ」は、分類「ＣＴ１１−２」のクラスタに分類されるコンテンツであることを示す。また、コンテンツＩＤ「ＷＰ１１」により識別されるコンテンツ「ウェブページＡ」は、ＵＲＬが「ｗｗｗ．ｗｐ１１．．．．」であることを示す。また、コンテンツＩＤ「ＷＰ１１」により識別されるコンテンツ「ウェブページＡ」は、分類「ＣＴ１１−２」のスコアが０．６であり、分類「ＣＴ１１−２」のスコアが０．３であることを示す。すなわち、コンテンツＩＤ「ＷＰ１１」により識別されるコンテンツ「ウェブページＡ」は、全分類のスコアのうち分類「ＣＴ１１−２」のスコアが最も高いため、分類「ＣＴ１１−２」のクラスタに分類される。

なお、コンテンツ情報記憶部１２２は、上記は特徴情報に関する情報の一例であって、特徴情報に関する情報であれば目的に応じて種々の情報を記憶してもよい。図５では「コンテンツ」には、静止画像や動画像やテキストデータやＵＲＬ、または、これらの格納場所を示すファイルパス名などが格納されてもよい。この場合、コンテンツ情報記憶部１２２は、「ＵＲＬ」の項目を有さなくてもよい。

（第１ユーザ情報記憶部１２３）
実施形態に係る第１ユーザ情報記憶部１２３は、第１ユーザに関する情報を記憶する。図６には、第１ユーザ情報記憶部１２３に記憶される第１ユーザに関する情報の一例を示す。図６に示すように、第１ユーザ情報記憶部１２３は、ユーザに関する情報として、「ユーザＩＤ」、「分類」、「嗜好」、「アクセス情報」、「行動情報」といった項目が含まれる。

「ユーザＩＤ」は、第１ユーザを識別するための識別情報を示す。例えば、ユーザＩＤ「Ｕ１」により識別されるユーザは、図１の例に示した第１ユーザＵ１に対応する。「分類」は、対応する第１ユーザが分類されるクラスタを識別するための識別情報を示す。「嗜好」は、対応する第１ユーザが分類されるクラスタに基づき推定されるユーザの嗜好を示す。ここでいう、「嗜好」とは、そのクラスタに分類されたユーザが特に好む性質や価値、すなわち価値基準に関する情報を示す。「アクセス情報」は、対応する第１ユーザのアクセス情報を示す。例えば、「アクセス情報」は、コンテンツに対する第１ユーザのアクセス情報を示す。「行動情報」は、第１ユーザの行動情報を示す。例えば、「行動情報」は、インターネットにおける第１ユーザの行動情報を示す。なお、「行動情報」には、目的に応じて種々の行動が含まれてもよい。例えば、「行動Ａ」は、自動車関連広告をクリックであり、「行動Ｂ」は、旅行関連の検索であってもよい。

図６に示す例において、例えば、ユーザＩＤ「Ｕ１」により識別される第１ユーザは、分類「ＣＴ１１−３」のクラスタに分類されるコンテンツであることを示す。また、ユーザＩＤ「Ｕ１」により識別される第１ユーザは、嗜好「安全性」であるユーザであることを示す。すなわち、ユーザＩＤ「Ｕ１」により識別される第１ユーザは、安全性に関する感度が高く、安全性の価値を他の要素よりも高く判断するユーザであることを示す。また、ユーザＩＤ「Ｕ１」により識別される第１ユーザは、アクセス情報である「ウェブページＡ」のアクセス回数が５回であり、「ウェブページＢ」のアクセス回数が０回であることを示す。また、ユーザＩＤ「Ｕ１」により識別される第１ユーザは、行動情報である行動１「行動Ａ」を行い、行動２「行動Ｂ」を行ったことを示す。

なお、第１ユーザ情報記憶部１２３は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、第１ユーザ情報記憶部１２３は、「アクセス情報」として各ウェブページを表示させた時間に関する情報を記憶してもよい。また、例えば、第１ユーザ情報記憶部１２３は、「行動情報」として各行動を行った日時に関する情報を記憶してもよい。

（第２ユーザ情報記憶部１２４）
実施形態に係る第２ユーザ情報記憶部１２４は、第２ユーザに関する情報を記憶する。図７には、第２ユーザ情報記憶部１２４に記憶される第２ユーザに関する情報の一例を示す。図７に示すように、第２ユーザ情報記憶部１２４は、ユーザに関する情報として、「ユーザＩＤ」、「分類」、「嗜好」、「行動情報」といった項目が含まれる。

「ユーザＩＤ」は、第２ユーザを識別するための識別情報を示す。例えば、ユーザＩＤ「ＵＸ」により識別されるユーザは、図１の例に示したユーザＵＸに対応する。「分類」は、対応する第２ユーザが分類されるクラスタを識別するための識別情報を示す。「嗜好」は、対応する第２ユーザが分類されるクラスタに基づき推定されるユーザの嗜好を示す。「行動情報」は、第２ユーザの行動情報を示す。例えば、「行動情報」は、インターネットにおける第２ユーザの行動情報を示す。

図７に示す例において、例えば、ユーザＩＤ「ＵＸ」により識別される第２ユーザは、分類「ＣＴ１１−３」のクラスタに分類されるコンテンツであることを示す。また、ユーザＩＤ「ＵＸ」により識別される第２ユーザは、嗜好「安全性」であるユーザであることを示す。すなわち、ユーザＩＤ「ＵＸ」により識別される第２ユーザは、安全性に関する感度が高く、安全性の価値を他の要素よりも高く判断するユーザであることを示す。また、ユーザＩＤ「ＵＸ」により識別される第２ユーザは、行動情報である行動１「行動Ｅ」を行い、行動２「行動Ａ」を行ったことを示す。

なお、第２ユーザ情報記憶部１２４は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、第２ユーザ情報記憶部１２４は、「行動情報」として各行動を行った日時に関する情報を記憶してもよい。

（ユーザ分類情報記憶部１２５）
実施形態に係るユーザ分類情報記憶部１２５は、ユーザ分類に関する情報を記憶する。図８には、ユーザ分類情報記憶部１２５に記憶されるユーザ分類に関する情報の一例を示す。図８に示す例においては、ユーザ分類に関する情報として各ユーザ分類（クラスタ）に対応するユーザモデルの特徴量等が記憶される場合を示す。図８に示すように、ユーザ分類情報記憶部１２５は、ユーザ分類に関する情報として、「分類ＩＤ」、「ユーザ分類」、「名称」、「特徴量」といった項目が含まれる。

「分類ＩＤ」は、各ユーザ分類を識別するための識別情報を示す。「ユーザ分類」は、分類ＩＤにより識別される分類を示す。「名称」は、分類ＩＤにより識別される分類の名称を示す。「特徴量」は、各特徴量の重みを示す。なお、「特徴量」には、目的に応じて種々の特徴量が含まれてもよい。例えば、「特徴量１」は、図７に示す「行動Ａ」であってもよく、「特徴量２」は、図７に示す「行動Ｇ」であってもよい。また、「特徴量」は、ユーザモデル生成時に自動的に選択されてもよい。

図８に示す例において、例えば、分類ＩＤ「ＣＴ１１−３」により識別されるユーザ分類「分類Ａ」の名称は「安全性」であることを示す。また、図８に示す例において、分類Ａにおける特徴量１の重みは「０．８」であり、特徴量２の重みは「０．１」であることを示す。

なお、ユーザ分類情報記憶部１２５は、上記はユーザ分類に関する情報の一例であって、ユーザ分類に関する情報であれば目的に応じて種々の情報を記憶してもよい。

（制御部１３０）
図３の説明に戻って、制御部１３０は、例えば、ＣＰＵ（Central Processing Unit）やＭＰＵ（Micro Processing Unit）等によって、分類装置１００内部の記憶装置に記憶されている各種プログラム（配信プログラムの一例に相当）がＲＡＭを作業領域として実行されることにより実現される。また、制御部１３０は、例えば、ＡＳＩＣ（Application Specific Integrated Circuit）やＦＰＧＡ（Field Programmable Gate Array）等の集積回路により実現される。

図３に示すように、制御部１３０は、受付部１３１と、第１分類部１３２と、第２分類部１３３と、生成部１３４と、判定部１３５と、送信部１３６とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部１３０の内部構成は、図３に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、制御部１３０が有する各処理部の接続関係は、図３に示した接続関係に限られず、他の接続関係であってもよい。

（受付部１３１）
受付部１３１は、各クラスタに関連付けられた特徴情報を受け付ける。例えば、受付部１３１は、心理的属性に関するクラスタに関連付けられた特徴情報を受け付ける。例えば、受付部１３１は、心理的属性として価値基準に関するクラスタに関連付けられた特徴情報を受け付ける。例えば、受付部１３１は、特徴情報として各クラスタに関連付けられたブログやメーカサイトなどの記事を受け付けてもよい。図１に示す例において、受付部１３１は、分類装置１００の管理者等から安全性ＣＴ１１−１や居住性ＣＴ１２−１等のクラスタ毎に関連付けられたキーワードリスト群ＦＩ１１を受け付ける。

また、受付部１３１は、インターネットにおけるユーザの行動情報を受け付ける。例えば、受付部１３１は、インターネットにおける第１ユーザの行動情報を受け付ける。図１に示す例において、受付部１３１は、第１ユーザＵ１の行動情報ＢＩ１１、第１ユーザＵ２の行動情報ＢＩ１２、第１ユーザＵ３の行動情報ＢＩ１３、第１ユーザＵ４の行動情報ＢＩ１４等を含むユーザ行動情報群ＢＧ１１を受け付ける。

また、例えば、受付部１３１は、インターネットにおける第２ユーザの行動情報を受け付ける。図１に示す例において、受付部１３１は、第２ユーザＵＸの行動情報ＢＩＸを受け付ける。

（第１分類部１３２）
第１分類部１３２は、受付部１３１により受け付けられた特徴情報に基づいて、コンテンツを分類する。例えば、第１分類部１３２は、コンテンツに含まれる情報に基づいて、コンテンツを各クラスタのいずれかに分類する。例えば、第１分類部１３２は、心理的属性に関するクラスタに属するコンテンツを分類する。例えば、第１分類部１３２は、価値基準に関するクラスタに属するコンテンツを分類する。

また、第１分類部１３２は、受付部１３１により受け付けられた特徴情報が文章である場合、文章から特徴語を抽出してもよい。例えば、第１分類部１３２は、各クラスタに関連付けられた文章から、クラスタ毎に特徴語を抽出してもよい。図１に示す例において、第１分類部１３２は、安全性ＣＴ１１−１のクラスタに関する特徴語として、「ブレーキ」や「クラッシャブル構造」や「子供」などの特徴語を抽出する。なお、第１分類部１３２が抽出する安全性ＣＴ１１−１のクラスタに関する特徴語には、「安全性」が含まれてもよい。

また、図１に示す例において、第１分類部１３２は、居住性ＣＴ１２−１のクラスタの特徴語として、「解放感」や「ゆったり」などの特徴語を抽出する。なお、第１分類部１３２は、受付部１３１により受け付けられたブログやメーカサイトなどの記事から関連する文書を抽出し、抽出した文章中からキーワードを抽出してもよい。なお、第１分類部１３２は、種々の従来技術を適宜用いて、文章中から特徴語（キーワード）を抽出する。

また、第１分類部１３２は、各クラスタに関連付けられた特徴情報と各コンテンツに含まれる特徴情報とに基づいて、各コンテンツのクラスタ毎のスコアを算出する。例えば、第１分類部１３２は、各クラスタに関連付けられた特徴語（キーワード）とコンテンツであるウェブページごとのキーワードとに基づいてスコアを算出する。例えば、第１分類部１３２は、文書間距離として用いられるコサイン距離などによりスコアを算出してもよい。この場合、第１分類部１３２は、コサイン距離を、例えば各次元を単語毎の頻度としたベクトル同士の正規化された内積として算出する。例えば、第１分類部１３２は、「安全性」を第１成分、「居住性」を第２成分として、ベクトルを定義する。そして、第１分類部１３２は、あるクラスタに関連付けられた特徴情報であるキーワードリストにおける「安全性」の出現頻度が１回であり、「居住性」の出現頻度が０回であれば、あるクラスタのベクトルをｘ＝（１，０）とする。また、第１分類部１３２は、ウェブページ中の文章における「安全性」の出現頻度が１回であり、「居住性」の出現頻度が０回であれば、ウェブページのベクトルをｗ＝（１，０）とする。また、第１分類部１３２は、ウェブページ中の文章における「安全性」の出現頻度が０回であり、「居住性」の出現頻度が１回であれば、ウェブページのベクトルをｗ＝（０，１）とする。コサイン距離ＣＤは、以下の式（１）により算出する。

ＣＤ＝ｘ・ｗ／（｜ｘ｜｜ｗ｜）・・・（１）

上記の式（１）において、「・」は内積を表し、「||」はベクトルのノルムを表す。例えば、「|ｘ|」は、ベクトルｘのノルムを表し、「|ｗ|」は、ベクトルｗのノルムを表す。例えば、上記の例において、ｗ＝（１，０）の場合、コサイン距離ＣＤは１となる。一方、ｗ＝（０，１）の場合、コサイン距離は０となる。すなわち、コサイン距離ＣＤの値が大きいほど、クラスタの特徴情報とウェブページとの類似度が大きいといえる。たとえば、第１分類部１３２は、各ウェブページについてクラスタ毎のスコアを算出する。

例えば、第１分類部１３２は、図５に示すように、コンテンツＩＤ「ＷＰ１１」により識別されるウェブページＡについて、安全性ＣＴ１１−２のスコアを０．６と算出し、居住性ＣＴ１２−２のスコアを０．３と算出する。そして、第１分類部１３２は、コンテンツＩＤ「ＷＰ１１」により識別されるウェブページＡを、安全性ＣＴ１１−２のクラスタに分類する。また、例えば、第１分類部１３２は、図５に示すように、コンテンツＩＤ「ＷＰ１２」により識別されるウェブページＢについて、安全性ＣＴ１１−２のスコアを０．１と算出し、居住性ＣＴ１２−２のスコアを０．８と算出する。そして、第１分類部１３２は、コンテンツＩＤ「ＷＰ１２」により識別されるウェブページＢを、居住性ＣＴ１２−２のクラスタに分類する。

このように、第１分類部１３２は、各ウェブページを算出したクラスタ毎のスコアに基づいて分類する。なお、第１分類部１３２は、予め決められた数のウェブページを算出したクラスタ毎のスコアに基づいて分類してもよい。また、第１分類部１３２は、所定の閾値よりも大きいスコアが算出されたウェブページのみを分類してもよい。例えば、第１分類部１３２は、クラスタ毎のスコアが全て０．５以下であるウェブページを分類しなくてもよい。

（第２分類部１３３）
第２分類部１３３は、第１分類部１３２により分類されたコンテンツに対するユーザのアクセス情報に基づいて、ユーザを分類する。例えば、第２分類部１３３は、ユーザのアクセス情報に基づいて、ユーザを各クラスタのいずれかに分類する。例えば、第２分類部１３３は、心理的属性に関するクラスタに属するコンテンツに対するユーザのアクセス情報に基づいて、心理的属性に関するクラスタに属するユーザを分類する。例えば、第２分類部１３３は、価値基準に関するクラスタに属するコンテンツに対するユーザのアクセス情報に基づいて、価値基準に関するクラスタに属するユーザを分類する。

例えば、第２分類部１３３は、受付部１３１により受け付けられた第１ユーザの行動情報に基づいて、第１ユーザを分類する。また、例えば、第２分類部１３３は、第１ユーザの行動情報において、クラスタ毎のウェブページへのアクセス数のうち、安全性ＣＴ１１−２のクラスタに分類されたウェブページへのアクセス数が最も大きい場合、その第１ユーザを安全性ＣＴ１１−３のクラスタに分類してもよい。

また、第２分類部１３３は、第１ユーザの行動情報に「安全性」に分類されたウェブページに所定の閾値以上の回数だけアクセスしていた場合、その第１ユーザを安全性ＣＴ１１−３のクラスタに分類してもよい。この場合、第２分類部１３３は、第１ユーザの行動情報に「居住性」に分類されたウェブページに所定の閾値以上の回数だけアクセスしていた場合、その第１ユーザを安全性ＣＴ１１−３と居住性ＣＴ１２−２との両方のクラスタに属するユーザとしてもよい。

また、第２分類部１３３は、第１ユーザがウェブページにアクセスした回数とそのウェブページが分類されたクラスタのスコアを乗算して算出した値に基づいて、第１ユーザを分類してもよい。例えば、第２分類部１３３は、ある第１ユーザ（以下、「第１ユーザＡ」とする）がウェブページＡにアクセスした回数が「５」回とした場合、安全性ＣＴ１１−３の値を３（＝５×０．６）とする。ここで、「０．６」は、図５に示す例におけるウェブページＡの安全性ＣＴ１１−２のスコア「０．６」に対応する。また、第２分類部１３３は、第１ユーザＡがウェブページＢにアクセスした回数が「４」回とした場合、居住性ＣＴ１２−３の値を３．２（＝４×０．８）とする。ここで、「０．８」は、図５に示す例におけるウェブページＢの安全性ＣＴ１２−２のスコア「０．８」に対応する。この場合、第２分類部１３３は、第１ユーザＡをより値の大きい居住性ＣＴ１２−３のクラスタに分類する。なお、第２分類部１３３は、アクセス回数の多寡によりユーザの分類を行った場合、第１ユーザＡをよりアクセス数の大きい安全性ＣＴ１１−３のクラスタに分類する。

また、第２分類部１３３は、ウェブページに滞在した時間、すなわちウェブページを閲覧（表示）した時間に基づいて、第１ユーザを分類してもよい。例えば、第２分類部１３３は、ウェブページに滞在した時間が所定の時間を超える場合、そのウェブページが分類されたクラスタに基づいて第１ユーザを分類してもよい。また、第２分類部１３３は、ウェブページに滞在した時間に基づいて算出される値が所定の閾値を超えた場合に、そのウェブページが分類されたクラスタに基づいて第１ユーザを分類してもよい。例えば、第２分類部１３３は、ウェブページに滞在した時間に所定の重みを乗算して算出した値に基づいて、第１ユーザを分類してもよい。なお、ここでいう所定の重みは、例えば、上述したクラスタのスコア等のようにウェブページとクラスタとの関係に基づく重みであり、目的に応じて適宜設定される。

また、例えば、第２分類部１３３は、ウェブページに滞在した時間に所定の重みを乗算して算出した値と、第１ユーザがウェブページにアクセスした回数とを加算した値に基づいて、第１ユーザを分類してもよい。また、例えば、第２分類部１３３は、ウェブページに滞在した時間に所定の重みを乗算して算出した値と、第１ユーザがウェブページにアクセスした回数とそのウェブページが分類されたクラスタのスコアを乗算して算出した値とを加算した値に基づいて、第１ユーザを分類してもよい。なお、上記の第１ユーザの分類は一例であり、第２分類部１３３は、上記に限らず目的に応じて種々の要素に基づいて、第１ユーザを分類してもよい。

第２分類部１３３は、予め決められたユーザを第１ユーザとしてもよい。例えば、第２分類部１３３は、予め決められた所定数のユーザを第１ユーザとしてもよい。また、第２分類部１３３は、第１分類部１３２により分類されたウェブページに所定数以上のアクセスを行ったユーザを第１ユーザとしてもよい。また、第２分類部１３３は、スコアに基づいて算出した値が所定の閾値を超えたユーザを、第１ユーザとしてもよい。

（生成部１３４）
生成部１３４は、第２分類部１３３により分類されたユーザの行動情報に基づいてユーザモデルを生成する。生成部１３４は、第１ユーザの行動情報に基づいて、クラスタ毎のユーザモデルを生成する。例えば、生成部１３４は、特徴量の抽出等のユーザモデルの生成処理を、非特許文献１に記載されたＬＤＡ（Latent Dirichlet Allocation）の技術等の種々の技術を適宜用いて行ってもよい。

例えば、生成部１３４は、第１ユーザの行動情報に基づいて、安全性ＣＴ１１−３のクラスタに関するユーザモデルや居住性ＣＴ１２−３のクラスタに関するユーザモデル等を生成する。例えば、生成部１３４は、第１ユーザの行動情報に基づいて、図７に示すような特徴量ごとの重みを算出する。なお、生成部１３４は、第１ユーザの行動情報から特徴量を抽出し、抽出した特徴量ごとの重みを算出してもよい。

また、生成部１３４は、第１ユーザの行動情報に含まれる各行動を特徴量として重みを算出してもよい。例えば、生成部１３４は、第１ユーザの行動情報に含まれる各行動Ａ〜行動Ｋ等を特徴量として、特徴量ごとの重みを算出してもよい。例えば、図１に示す例において、生成部１３４は、安全性ＣＴ１１−３のクラスタに分類される第１ユーザＵ１や第１ユーザＵ３の行動情報から特徴量を抽出し、抽出した特徴量ごとの重みを算出することにより、安全性ＣＴ１１−３のクラスタに関するユーザモデルを生成してもよい。また、例えば、図１に示す例において、生成部１３４は、居住性ＣＴ１２−３のクラスタに分類される第１ユーザＵ２や第１ユーザＵ４の行動情報から特徴量を抽出し、抽出した特徴量ごとの重みを算出することにより、居住性ＣＴ１２−３のクラスタに関するユーザモデルを生成してもよい。

（判定部１３５）
判定部１３５は、ユーザが属するクラスタを判定する。例えば、判定部１３５は、第２分類部１３３により分類されたユーザの行動情報と類似する行動情報が受け付けられた他のユーザをそのユーザと同じクラスタに属するユーザと判定する。例えば、判定部１３５は、生成部１３４により生成されたユーザモデルに基づいて、行動情報に対応するユーザが属するクラスタを判定する。

例えば、判定部１３５は、クラスタ毎のユーザモデルと第２ユーザの行動情報とに基づいて、第２ユーザが属するクラスタを判定する。図１に示す例において、判定部１３５は、ユーザモデル群ＭＧ１１と第２ユーザＵＸの行動情報ＢＩＸとを用いて、第２ユーザＵＸが属するクラスタを判定する。例えば、判定部１３５は、第２ユーザＵＸが分類ユーザ群ＣＵ１１に含まれる安全性ＣＴ１１−３や居住性ＣＴ１２−３等のクラスタに属するユーザかを判定する。図１に示す例において、判定部１３５は、第２ユーザＵＸを安全性ＣＴ１１−３のクラスタに属すると判定する。

また、判定部１３５は、第２ユーザを複数のクラスタに属すると判定してもよい。例えば、判定部１３５は、クラスタ毎のユーザモデルと第２ユーザの行動情報とに基づいて算出される判定値が所定の閾値を超える場合、その第２ユーザを所定に閾値を超えた判定値に対応するクラスタに属すると判定する。例えば、判定部１３５は、ある第２ユーザにおける安全性ＣＴ１１−３の判定値と居住性ＣＴ１２−３の判定値とが所定の閾値を超えた場合、その第２ユーザを安全性ＣＴ１１−３のクラスタと居住性ＣＴ１２−３のクラスタの両方に属するユーザと判定してもよい。

（送信部１３６）
送信部１３６は、外部の情報処理装置に種々の情報を送信する。例えば、送信部１３６は、配信装置５０にユーザの分類に関する情報を送信する。例えば、送信部１３６は、受付部１３１により配信装置５０から配信要求が受け付けられた場合、配信装置５０にユーザの分類に関する情報を送信する。また、送信部１３６は、受付部１３１により配信装置５０から特定のユーザに関する分類情報の要求が受け付けられた場合、配信装置５０に特定のユーザの分類に関する情報を送信してもよい。

〔４．配信処理のフロー〕
次に、図９を用いて、実施形態に係る分類システム１による分類処理の結果を用いた配信処理について説明する。図９は、実施形態に係るユーザ分類に基づく配信処理の一例を示すシーケンス図である。

図９に示すように、分類装置１００は、分類モデルを生成する（ステップＳ１０１）。例えば、分類装置１００は、クラスタに関連付けられた特徴情報や第１ユーザのアクセス情報に基づいて、ユーザモデルを生成する。

その後、分類装置１００は、第２ユーザの利用する端末装置１０から行動情報を受け付ける（ステップＳ１０２）。分類装置１００は、行動情報に基づいて第２ユーザの分類を判定する（ステップＳ１０３）。

その後、端末装置１０は、配信装置５０へ配信要求を送信する（ステップＳ１０４）。例えば、端末装置１０は、配信装置５０へ広告を要求する。

端末装置１０から配信要求を受信した配信装置５０は、分類装置１００へ分類情報を要求する（ステップＳ１０５）。例えば、配信装置５０は、分類装置１００へ端末装置１０を利用する第２ユーザの分類を示す情報を要求する。なお、配信装置５０が分類装置１００に分類情報を要求するタイミングは、上記に限らず、配信装置５０は、例えば１時間や１日等の所定の間隔で分類装置１００に分類情報を要求してもよい。

配信装置５０から分類情報要求を受信した分類装置１００は、配信装置５０へ分類情報を送信する（ステップＳ１０６）。例えば、分類装置１００は、配信装置５０へ端末装置１０を利用する第２ユーザの分類を示す情報を送信する。

分類装置１００から分類情報を受信した配信装置５０は、受信した分類情報に基づいて、コンテンツを抽出する（ステップＳ１０７）。例えば、配信装置５０は、受信した分類情報に基づいて、端末装置１０を利用する第２ユーザの嗜好に合う広告を抽出する。その後、配信装置５０は、抽出したコンテンツを端末装置１０へ配信する（ステップＳ１０８）。

なお、配信装置５０は、端末装置１０へ配信したコンテンツに対する端末装置１０を利用するユーザの反応を分類装置１００へフィードバックしてもよい。配信装置５０からフィードバックを受け付けた分類装置１００は、フィードバックに関する情報に基づいて、ユーザモデルを新たに生成してもよい。例えば、配信装置５０が、安全性ＣＴ１１−２のクラスタに属する第１ユーザ（以下、「第１ユーザＢ」とする）に、安全性に関連する広告を送信したが、例えば広告のクリックなど所望の広告効果を得られなかった場合、その情報を分類装置１００へフィードバックしてもよい。

配信装置５０からフィードバックを受け付けた分類装置１００は、第１ユーザＢを第１ユーザから除外してもよい。そして、分類装置１００は、第１ユーザＢを第１ユーザから除外した状態において、ユーザモデルを生成しなおしてもよい。すなわち、分類装置１００は、フィードバックに関する情報に基づいて、第１ユーザの除外、またはユーザの第１ユーザへの追加、または第１ユーザのクラスタ間の移動などを行うことにより、ユーザモデルを生成しなおしてもよい。これにより、分類装置１００は、より適切なユーザモデルを生成することが可能となり、第２ユーザが属するクラスタを判定する精度を高めることができる。そして、精度が高められたユーザ分類に関する情報に基づいて広告を配信することにより、配信装置５０は、広告効果を向上させることができる。なお、上述したように、分類装置１００がユーザの分類を示す情報に基づいて広告を配信する場合、分類装置１００は自身の広告配信におけるユーザの反応に基づいて、上述のフィードバックに関する情報に基づいた処理を行う。

〔５．効果〕
上述してきたように、実施形態に係る分類装置１００は、受付部１３１と、第１分類部１３２と、第２分類部１３３とを有する。受付部１３１は、各クラスタに関連付けられた特徴情報を受け付ける。第１分類部１３２は、受付部１３１により受け付けられた特徴情報に基づいて、コンテンツ（実施形態においては「ウェブページ」。以下同じ）を分類する。第２分類部１３３は、第１分類部１３２により分類されたコンテンツに対するユーザ（実施形態においては「第１ユーザ」。以下同じ）のアクセス情報に基づいて、ユーザを分類する。

これにより、実施形態に係る分類装置１００は、分類装置１００は、任意に与えられたクラスタに基づいて、コンテンツであるウェブページを適切に分類することができる。つまり、分類装置１００は、各クラスタに関連付けられた特徴情報が与えられれば、自動的にウェブページを適切に分類することができる。また、分類装置１００は、分類されたウェブページへのアクセス情報に基づいてユーザを適切に分類することができる。そして、分類装置１００は、任意に与えられたクラスタに基づいて、ユーザモデルを生成することができる。そして、分類装置１００は、生成したユーザモデルにより、ユーザを分類することができる。例えば、分類装置１００は人手によりウェブページに分類を示すタグを付与する場合等と比較して、多数のウェブページに対するアクセス情報に基づいて第１ユーザを分類することができるため、第１ユーザの分類の精度を高めることができる。つまり、分類装置１００は、各クラスタに関連付けられた特徴情報が与えられれば、ユーザを分類することができる。例えば、アンケート等のコストを要する作業を行うことなく、クラスタ毎に関連付けられた特徴情報を用いることにより、適切にユーザモデルを生成し、生成したユーザモデルにより未分類のユーザである第２ユーザを適切に分類することができる。したがって、分類装置１００は、柔軟にユーザ分類を行うことができる。

また、実施形態に係る分類装置１００において第１分類部１３２は、コンテンツに含まれる情報に基づいて、コンテンツを各クラスタのいずれかに分類する。

これにより、実施形態に係る分類装置１００は、特徴情報が関連付けられた各クラスタのいずれかにコンテンツを分類することができるため、任意に与えられたクラスタにコンテンツを分類することができる。したがって、分類装置１００は、柔軟にコンテンツを分類することができる。

また、実施形態に係る分類装置１００において第２分類部１３３は、ユーザのアクセス情報に基づいて、ユーザを各クラスタのいずれかに分類する。

これにより、実施形態に係る分類装置１００は、特徴情報が関連付けられた各クラスタのいずれかにユーザを分類することができるため、任意に与えられたクラスタにユーザを分類することができる。したがって、分類装置１００は、柔軟にユーザを分類することができる。

また、実施形態に係る分類装置１００は、判定部１３５を有する。判定部１３５は、ユーザが属するクラスタを判定する。受付部１３１は、インターネットにおけるユーザの行動情報を受け付ける。判定部１３５は、第２分類部１３３により分類されたユーザの行動情報と類似する行動情報が受け付けられた他のユーザ（実施形態においては「第２ユーザ」）をユーザと同じクラスタに属するユーザと判定する。

これにより、実施形態に係る分類装置１００は、分類済のユーザのインターネットにおける行動情報と類似するインターネットにおける行動情報に対応する未分類のユーザを、類似するインターネットにおける行動情報に対応する分類済のユーザが属するクラスタに分類する。すなわち、分類装置１００は、インターネットにおけるユーザの行動情報の類似度に基づいて、未分類のユーザが属するクラスタを適切に判定することができる。

また、実施形態に係る分類装置１００において受付部１３１は、心理的属性に関するクラスタに関連付けられた特徴情報を受け付ける。第１分類部１３２は、心理的属性に関するクラスタに属するコンテンツを分類する。第２分類部１３３は、心理的属性に関するクラスタに属するコンテンツに対するユーザのアクセス情報に基づいて、心理的属性に関するクラスタに属するユーザを分類する。

これにより、実施形態に係る分類装置１００は、心理的属性に関するクラスタに基づいて、コンテンツであるウェブページを適切に分類することができる。つまり、分類装置１００は、各クラスタに関連付けられた心理的属性に関する特徴情報が与えられれば、自動的にウェブページを適切に分類することができる。また、分類装置１００は、分類されたウェブページへのアクセス情報に基づいてユーザを心理的属性に関するクラスタに適切に分類することができる。そして、例えば、アンケート等のコストを要する作業を行うことなく、クラスタ毎に関連付けられた心理的属性に関する特徴情報を用いることにより、適切に心理的属性に関するユーザモデルを生成し、生成したユーザモデルにより未分類のユーザである第２ユーザを適切に分類することができる。したがって、分類装置１００は、柔軟にユーザ分類を行うことができる。

また、実施形態に係る分類装置１００において受付部１３１は、心理的属性として価値基準に関するクラスタに関連付けられた特徴情報を受け付ける。第１分類部１３２は、価値基準に関するクラスタに属するコンテンツを分類する。第２分類部１３３は、価値基準に関するクラスタに属するコンテンツに対するユーザのアクセス情報に基づいて、価値基準に関するクラスタに属するユーザを分類する。

これにより、実施形態に係る分類装置１００は、価値基準に関するクラスタに基づいて、コンテンツであるウェブページを適切に分類することができる。つまり、分類装置１００は、各クラスタに関連付けられた価値基準に関する特徴情報が与えられれば、自動的にウェブページを適切に分類することができる。また、分類装置１００は、分類されたウェブページへのアクセス情報に基づいてユーザを価値基準に関するクラスタに適切に分類することができる。そして、例えば、アンケート等のコストを要する作業を行うことなく、クラスタ毎に関連付けられた価値基準に関する特徴情報を用いることにより、適切に価値基準に関するユーザモデルを生成し、生成したユーザモデルにより未分類のユーザである第２ユーザを適切に分類することができる。したがって、分類装置１００は、柔軟にユーザ分類を行うことができる。

〔６．ハードウェア構成〕
上述してきた実施形態に係る分類装置１００は、例えば図１０に示すような構成のコンピュータ１０００によって実現される。図１０は、分類装置１００の機能を実現するコンピュータ１０００の一例を示すハードウェア構成図である。コンピュータ１０００は、ＣＰＵ１１００、ＲＡＭ１２００、ＲＯＭ１３００、ＨＤＤ１４００、通信インターフェイス（Ｉ／Ｆ）１５００、入出力インターフェイス（Ｉ／Ｆ）１６００、及びメディアインターフェイス（Ｉ／Ｆ）１７００を有する。

ＣＰＵ１１００は、ＲＯＭ１３００またはＨＤＤ１４００に格納されたプログラムに基づいて動作し、各部の制御を行う。ＲＯＭ１３００は、コンピュータ１０００の起動時にＣＰＵ１１００によって実行されるブートプログラムや、コンピュータ１０００のハードウェアに依存するプログラム等を格納する。

ＨＤＤ１４００は、ＣＰＵ１１００によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を格納する。通信インターフェイス１５００は、ネットワークＮを介して他の機器からデータを受信してＣＰＵ１１００へ送り、ＣＰＵ１１００が生成したデータをネットワークＮを介して他の機器へ送信する。

ＣＰＵ１１００は、入出力インターフェイス１６００を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。ＣＰＵ１１００は、入出力インターフェイス１６００を介して、入力装置からデータを取得する。また、ＣＰＵ１１００は、生成したデータを入出力インターフェイス１６００を介して出力装置へ出力する。

メディアインターフェイス１７００は、記録媒体１８００に格納されたプログラムまたはデータを読み取り、ＲＡＭ１２００を介してＣＰＵ１１００に提供する。ＣＰＵ１１００は、かかるプログラムを、メディアインターフェイス１７００を介して記録媒体１８００からＲＡＭ１２００上にロードし、ロードしたプログラムを実行する。記録媒体１８００は、例えばＤＶＤ（Digital Versatile Disc）、ＰＤ（Phase change rewritable Disk）等の光学記録媒体、ＭＯ（Magneto-Optical disk）等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。

例えば、コンピュータ１０００が実施形態に係る分類装置１００として機能する場合、コンピュータ１０００のＣＰＵ１１００は、ＲＡＭ１２００上にロードされたプログラムを実行することにより、制御部１３０の機能を実現する。コンピュータ１０００のＣＰＵ１１００は、これらのプログラムを記録媒体１８００から読み取って実行するが、他の例として、他の装置からネットワークＮを介してこれらのプログラムを取得してもよい。

以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の行に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。

〔７．その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。

また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。

また、上述してきた実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。

また、上述してきた「部（section、module、unit）」は、「手段」や「回路」などに読み替えることができる。例えば、取得部は、取得手段や取得回路に読み替えることができる。

１分類システム
１００分類装置
１２１特徴情報記憶部
１２２コンテンツ情報記憶部
１２３第１ユーザ情報記憶部
１２４第２ユーザ情報記憶部
１２５ユーザ分類情報記憶部
１３０制御部
１３１受付部
１３２第１分類部
１３３第２分類部
１３４生成部
１３５判定部
１３６送信部
１０端末装置
５０配信装置

Claims

各クラスタに関連付けられた特徴情報を受け付ける受付部と、
前記受付部により受け付けられた前記特徴情報に基づいて、コンテンツを分類する第１分類部と、
前記第１分類部により分類された前記コンテンツに対するユーザのアクセス情報に基づいて、前記ユーザを分類する第２分類部と、
を備えたことを特徴とする分類装置。
前記第１分類部は、
前記コンテンツに含まれる情報に基づいて、前記コンテンツを前記各クラスタのいずれかに分類する、
ことを特徴とする請求項１に記載の分類装置。
前記第２分類部は、
前記ユーザのアクセス情報に基づいて、前記ユーザを前記各クラスタのいずれかに分類する、
ことを特徴とする請求項１または請求項２に記載の分類装置。
ユーザが属するクラスタを判定する判定部、
をさらに備え、
前記受付部は、
インターネットにおけるユーザの行動情報を受け付け、
前記判定部は、
前記第２分類部により分類されたユーザの行動情報と類似する行動情報が受け付けられた他のユーザを前記ユーザと同じクラスタに属するユーザと判定する、
ことを特徴とする請求項１〜３のいずれか１項に記載の分類装置。
前記受付部は、
心理的属性に関するクラスタに関連付けられた特徴情報を受け付け、
前記第１分類部は、
前記心理的属性に関するクラスタに属するコンテンツを分類し、
前記第２分類部は、
前記心理的属性に関するクラスタに属するコンテンツに対するユーザのアクセス情報に基づいて、前記心理的属性に関するクラスタに属するユーザを分類する、
ことを特徴とする請求項１〜４のいずれか１項に記載の分類装置。
前記受付部は、
前記心理的属性として価値基準に関するクラスタに関連付けられた特徴情報を受け付け、
前記第１分類部は、
前記価値基準に関するクラスタに属するコンテンツを分類し、
前記第２分類部は、
前記価値基準に関するクラスタに属するコンテンツに対するユーザのアクセス情報に基づいて、前記価値基準に関するクラスタに属するユーザを分類する、
ことを特徴とする請求項５に記載の分類装置。
コンピュータが実行する分類方法であって、
各クラスタに関連付けられた特徴情報を受け付ける受付工程と、
前記受付工程により受け付けられた前記特徴情報に基づいて、コンテンツを分類する第１分類工程と、
前記第１分類工程により分類された前記コンテンツに対するユーザのアクセス情報に基づいて、前記ユーザを分類する第２分類工程と、
を含むことを特徴とする分類方法。
各クラスタに関連付けられた特徴情報を受け付ける受付手順と、
前記受付手順により受け付けられた前記特徴情報に基づいて、コンテンツを分類する第１分類手順と、
前記第１分類手順により分類された前記コンテンツに対するユーザのアクセス情報に基づいて、前記ユーザを分類する第２分類手順と、
をコンピュータに実行させることを特徴とする分類プログラム。