JP2001331516A - Data analyzing method, information retrieving method, and information recommending method - Google Patents

Data analyzing method, information retrieving method, and information recommending method

Info

Publication number
JP2001331516A
JP2001331516A JP2000150963A JP2000150963A JP2001331516A JP 2001331516 A JP2001331516 A JP 2001331516A JP 2000150963 A JP2000150963 A JP 2000150963A JP 2000150963 A JP2000150963 A JP 2000150963A JP 2001331516 A JP2001331516 A JP 2001331516A
Authority
JP
Japan
Prior art keywords
content
distance
user
feature space
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000150963A
Other languages
Japanese (ja)
Inventor
Shoichi Araki
昭一 荒木
Eiichi Naito
栄一 内藤
Hiroshi Kutsumi
洋 九津見
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2000150963A priority Critical patent/JP2001331516A/en
Publication of JP2001331516A publication Critical patent/JP2001331516A/en
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To solve the problem that arrangement representing latent features of data well can not be obtained as samples and categories become more since all samples and categories are arranged in one space of small dimensions for conventional analysis by class-3 quantification. SOLUTION: While samples having similar trends of interest in categories are grouped into several feature spaces of small dimensions, samples and categories having high relativity are arranged in the respective feature spaces closely in euclidean distance.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、個人の趣味、嗜
好、購買行動などに関するデータの分析方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a method for analyzing data relating to personal hobbies, preferences, purchasing behavior, and the like.

【0002】[0002]

【従来の技術】従来、アンケートなどを通じて得られる
個人の趣味、嗜好、購買行動に関するデータの分析方法
としては、数量化3類(例えば、啓学出版、多変量解析
入門、第8章)が知られている。数量化3類では、例え
ば、どのような人がどのような購買行動をとるかを分析
するためには、個人の様々な購買行動に関するカテゴリ
(例えば、「場所」はスーパーか専門店か、「商品知
識」は豊富か乏しいか、「ブランド」指向か否かなど)
への反応パターンを取得し、個人(サンプル)とカテゴ
リの相関を最大化するように多次元空間に個人やカテゴ
リを配置して、その位置関係から「商品知識が豊富でブ
ランド指向の人は専門店を好む」などの分析を行うもの
である。
2. Description of the Related Art Conventionally, as a method of analyzing data on personal hobbies, preferences, and purchasing behavior obtained through a questionnaire or the like, three types of quantification (eg, Keigaku Publishing, Introduction to Multivariate Analysis, Chapter 8) are known. Have been. In quantification type 3, for example, in order to analyze what kind of person performs what kind of purchasing behavior, a category related to various purchasing behaviors of an individual (for example, “place” is a supermarket or a specialty store, Product knowledge ”is rich or poor,“ brand ”oriented or not)
Response patterns, and place individuals and categories in a multidimensional space so as to maximize the correlation between individuals (samples) and categories. Preference for stores. "

【0003】[0003]

【発明が解決しようとする課題】しかしながら、数量化
3類では、配置されたサンプルやカテゴリの分析は、ま
ず、最大固有値に対応する固有ベクトルで表される第1
軸によって行い、次に第2軸によって分析するという手
順になる。すなわち、多次元空間におけるサンプルやカ
テゴリの近さがユークリッド距離として表されていない
ため、その関係を直感的に理解することが困難である。
さらに、サンプルやカテゴリの数が増加すると、それら
の配置決定に必要な行列の固有値計算の実行が困難にな
るだけでなく、すべてのサンプルとカテゴリを1つの多
次元空間に配置するので、データの潜在的な特徴をよく
表す配置が得られない場合があるという課題があった。
However, in quantification class 3, the analysis of the arranged samples and categories is performed by first using the first eigenvector corresponding to the maximum eigenvalue.
The analysis is performed by the axis, and then the analysis is performed by the second axis. That is, since the proximity of a sample or category in a multidimensional space is not represented as a Euclidean distance, it is difficult to intuitively understand the relationship.
In addition, as the number of samples and categories increases, it becomes difficult not only to perform eigenvalue calculations for the matrices needed to determine their placement, but also to place all samples and categories in one multidimensional space, There has been a problem that an arrangement that well represents a latent feature may not be obtained.

【0004】本発明は、かかる点に鑑み、関連の高いサ
ンプルとカテゴリをユークリッド距離の意味で近くに配
置すると同時にサンプルやカテゴリを複数のグループに
クラスタリングすることにより、サンプルとカテゴリの
潜在的な特徴をよく表し、かつその親近性の直感的な理
解を容易にする複数の多次元空間を得ることを可能とす
るデータ分析方法を提供することを目的とする。
[0004] In view of the above, the present invention arranges highly relevant samples and categories in the sense of the Euclidean distance, and at the same time, clusters the samples and categories into a plurality of groups. It is an object of the present invention to provide a data analysis method which can express a plurality of multidimensional spaces, which can express intuitively and facilitate intuitive understanding of closeness.

【0005】[0005]

【課題を解決するための手段】請求項1の本発明は、サ
ンプルのカテゴリに対する反応(サンプル・カテゴリ反
応パターン)を記憶する個体・カテゴリ反応パターン記
憶手段と,前記サンプルと前記カテゴリ間の距離(サン
プル・カテゴリ間距離)を記憶するサンプル・カテゴリ間
距離記憶手段と,前記サンプル間の距離(サンプル間距
離)を記憶するサンプル間距離記憶手段と,前記カテゴ
リ間の距離(カテゴリ間距離)を記憶するカテゴリ間距
離記憶手段と,前記サンプルと前記カテゴリの相関関係
を表す特徴空間への前記サンプルまたは前記カテゴリの
帰属度を記憶する特徴空間帰属度記憶手段と,前記サン
プルおよび前記カテゴリの前記特徴空間内での座標を記
憶する特徴空間内座標記憶手段と,前記サンプル・カテ
ゴリ反応パターンと前記サンプルカテゴリ間距離と前記
サンプル間距離と前記カテゴリ間距離に基づき前記サン
プルまたはカテゴリの前記特徴空間への帰属度を学習す
る特徴空間帰属度学習手段と,前記サンプル・カテゴリ
反応パターンと前記サンプルカテゴリ間距離と前記サン
プル間距離と前記カテゴリ間距離に基づき前記サンプル
およびカテゴリの前記特徴空間内での座標を学習する特
徴空間内座標学習手段と,前記特徴空間帰属度学習手段
および前記特徴空間内座標学習手段の動作開始・終了を
制御する学習制御手段からなることを特徴とするデータ
分析方法である。
According to a first aspect of the present invention, there is provided an individual / category response pattern storage means for storing a response to a category of a sample (sample / category response pattern), and a distance between the sample and the category. A sample-to-category distance storage means for storing a sample-to-category distance, a sample-to-sample distance storage means for storing the distance between the samples (inter-sample distance), and a distance between the categories (inter-category distance). Inter-category distance storage means, feature space membership degree storage means for storing the degree of membership of the sample or the category in a feature space representing the correlation between the sample and the category, and the feature space of the sample and the category Means for storing coordinates in a feature space for storing coordinates in the sample space; Learning means for learning the degree of belonging of the sample or category to the feature space based on the distance between the sample categories, the distance between the samples, and the distance between the categories; a sample / category reaction pattern; A feature space coordinate learning means for learning coordinates of the sample and the category in the feature space based on the inter-category distance, the inter-sample distance, and the inter-category distance; A data analysis method comprising learning control means for controlling the start and end of the operation of the coordinate learning means.

【0006】請求項2の本発明は、ユーザ属性とユーザ
の利用したコンテンツ関連情報を対応づけて管理するユ
ーザ属性対応コンテンツ情報管理手段と、コンテンツ
(サンプル)のユーザ属性(カテゴリ)への反応パター
ン(コンテンツ・ユーザ反応パターン)を記憶するサン
プル・カテゴリ反応パターン記憶手段と,前記コンテン
ツと前記ユーザ属性間の距離(コンテンツ・ユーザ属性
間距離)を記憶するサンプル・カテゴリ間距離記憶手段
と,前記コンテンツ間の距離(コンテンツ間距離)を記
憶するサンプル間距離記憶手段と,前記ユーザ属性間の
距離(ユーザ属性間距離)を記憶するカテゴリ間距離記
憶手段と,前記コンテンツと前記ユーザ属性の相関関係
を表す特徴空間への前記コンテンツまたは前記ユーザ属
性の帰属度を記憶する特徴空間帰属度記憶手段と,前記
コンテンツおよび前記ユーザ属性の前記特徴空間内での
座標を記憶する特徴空間内座標記憶手段と,前記コンテ
ンツ・ユーザ反応パターンと前記コンテンツ・ユーザ属性
間距離と前記コンテンツ間距離と前記ユーザ属性間距離
に基づき前記コンテンツまたはユーザ属性の前記特徴空
間への帰属度を学習する特徴空間帰属度学習手段と,前
記コンテンツ・ユーザ反応パターンと前記コンテンツ・ユ
ーザ属性間距離と前記コンテンツ間距離と前記ユーザ属
性間距離に基づき前記コンテンツおよびユーザ属性の前
記特徴空間内での座標を学習する特徴空間内座標学習手
段と,前記特徴空間帰属度学習手段および前記特徴空間
内座標学習手段の動作開始・終了を制御する学習制御手
段と,前記特徴空間帰属度記憶手段に記憶されているコ
ンテンツまたはユーザ属性の帰属度および前記特徴空間
内座標記憶手段に記憶されているコンテンツおよびユー
ザ属性の座標値を参照して前記コンテンツと前記ユーザ
属性の相関関係を表示して前記コンテンツをその要求者
に探索させるユーザ属性・コンテンツ相関関係表示型情
報探索インタフェース提供手段を備えたことを特徴とす
る情報探索方法である。
According to the present invention, there is provided a user attribute-corresponding content information managing means for managing a user attribute and content related information used by a user in association with each other, and a response pattern of the content (sample) to the user attribute (category). Sample / category reaction pattern storage means for storing (content / user reaction pattern); sample / category distance storage means for storing a distance between the content and the user attribute (content / user attribute distance); An inter-sample distance storage means for storing a distance between contents (inter-content distance), an inter-category distance storage means for storing a distance between the user attributes (distance between user attributes), and a correlation between the content and the user attributes. Storing the degree of belonging of the content or the user attribute to the feature space to be represented Feature space belonging degree storage means, feature space coordinate storage means for storing coordinates of the content and the user attribute in the feature space, the content / user response pattern, the content / user attribute distance, and the content A feature space belonging degree learning means for learning the degree of belonging of the content or the user attribute to the feature space based on the inter-user distance and the inter-user attribute distance, the content / user response pattern, the content / user attribute distance, A feature space coordinate learning unit for learning coordinates of the content and the user attribute in the feature space based on the content distance and the user attribute distance, the feature space belonging degree learning unit, and the feature space coordinate learning unit Learning control means for controlling the start and end of the operation of the feature space; The correlation between the content and the user attribute is displayed by referring to the content or user attribute belonging degree stored in the coordinate space of the content and the user attribute stored in the feature space coordinate storage unit, and displaying the correlation between the content and the user attribute. An information search method characterized by comprising a user attribute / content correlation display type information search interface providing means for causing a requester to search for content.

【0007】請求項3の本発明は、ユーザ毎に利用した
コンテンツ関連情報を対応づけて管理するユーザ別利用
コンテンツ情報管理手段と、ユーザ(サンプル)のコン
テンツ(カテゴリ)への反応パターン(ユーザ・コンテ
ンツ反応パターン)を記憶するサンプル・カテゴリ反応
パターン記憶手段と,前記ユーザと前記コンテンツ属性
間の距離(ユーザ・コンテンツ間距離)を記憶するサン
プル・カテゴリ間距離記憶手段と,前記ユーザ間の距離
(ユーザ間距離)を記憶するサンプル間距離記憶手段
と,前記コンテンツ間の距離(コンテンツ間距離)を記
憶するカテゴリ間距離記憶手段と,前記ユーザと前記コ
ンテンツの相関関係を表す特徴空間への前記ユーザまた
は前記コンテンツ属性の帰属度を記憶する特徴空間帰属
度記憶手段と,前記ユーザおよび前記コンテンツ属性の
前記特徴空間内での座標を記憶する特徴空間内座標記憶
手段と,前記ユーザ・コンテンツ反応パターンと前記ユ
ーザ・コンテンツ属性間距離と前記ユーザ間距離と前記
コンテンツ間距離に基づき前記ユーザまたはコンテンツ
の前記特徴空間への帰属度を学習する特徴空間帰属度学
習手段と,前記ユーザ・コンテンツ反応パターンと前記
ユーザ・コンテンツ間距離と前記ユーザ間距離と前記コ
ンテンツ間距離に基づき前記ユーザおよびコンテンツの
前記特徴空間内での座標を学習する特徴空間内座標学習
手段と,前記特徴空間帰属度学習手段および前記特徴空
間内座標学習手段の動作開始・終了を制御する学習制御
手段と,前記特徴空間帰属度記憶手段に記憶されている
ユーザまたはコンテンツの帰属度および前記特徴空間内
座標記憶手段に記憶されているユーザおよびコンテンツ
属性の座標値を参照して,特徴空間内で互いに所定の距
離範囲内に配置されている前記ユーザを選択する利用コ
ンテンツ類似ユーザ選択手段と,前記利用コンテンツ類
似ユーザ選択されたユーザ相互に互いの利用コンテンツ
を推薦する推薦情報選択提供手段を備えたことを特徴と
する情報推薦方法である。
According to the present invention, there is provided a user-specific use content information managing means for managing content-related information used for each user in association with each other, and a reaction pattern (user / user) for a user (sample) to content (category). Sample / category reaction pattern storage means for storing a content reaction pattern), sample / category distance storage means for storing a distance between the user and the content attribute (distance between user and content), and a distance between the users ( Inter-sample distance storage means for storing the distance between the users (inter-user distance), inter-category distance storage means for storing the distance between the contents (inter-content distance), and the user to a feature space representing the correlation between the user and the content. Or a feature space belonging degree storage means for storing the belonging degree of the content attribute; A coordinate storage unit in a feature space for storing coordinates of the user and the content attribute in the feature space; and a user content response pattern, the user-content attribute distance, the user distance, and the content distance. Feature space belonging degree learning means for learning the degree of belonging of the user or the content to the feature space based on the user / content response pattern, the user / content distance, the user distance, and the content distance. Learning means for learning coordinates in a feature space of a user and content in the feature space, learning control means for controlling start / end of the operation of the feature space belonging degree learning means and the coordinate learning means in the feature space, The user or content belonging degree stored in the feature space belonging degree storage means and Use content similar user selection means for selecting the users located within a predetermined distance range from each other in the feature space with reference to the coordinate values of the user and the content attribute stored in the feature space coordinate storage means And a recommendation information selection providing means for recommending each other's use contents to the users whose use contents are similar to each other.

【0008】[0008]

【発明の実施の形態】以下、本発明の実施の形態につい
て図面を参照しながら説明する。
Embodiments of the present invention will be described below with reference to the drawings.

【0009】(実施の形態1)図1は、第1の実施の形
態を示す情報推薦装置の構成図である。図1において、
101はサンプルのカテゴリに対する反応(サンプル・
カテゴリ反応パターン)を記憶する個体・カテゴリ反応
パターン記憶手段,102は前記サンプルと前記カテゴ
リ間の距離(サンプル・カテゴリ間距離)を記憶するサ
ンプル・カテゴリ間距離記憶手段,103は前記サンプ
ル間の距離(サンプル間距離)を記憶するサンプル間距
離記憶手段,104は前記カテゴリ間の距離(カテゴリ
間距離)を記憶するカテゴリ間距離記憶手段,105は
前記サンプルと前記カテゴリの相関関係を表す特徴空間
への前記サンプルまたは前記カテゴリの帰属度を記憶す
る特徴空間帰属度記憶手段,106は前記サンプルおよ
び前記カテゴリの前記特徴空間内での座標を記憶する特
徴空間内座標記憶手段,107は前記サンプル・カテゴ
リ反応パターンと前記サンプルカテゴリ間距離と前記サ
ンプル間距離と前記カテゴリ間距離に基づき前記サンプ
ルまたはカテゴリの前記特徴空間への帰属度を学習する
特徴空間帰属度学習手段,108は前記サンプル・カテ
ゴリ反応パターンと前記サンプルカテゴリ間距離と前記
サンプル間距離と前記カテゴリ間距離に基づき前記サン
プルおよびカテゴリの前記特徴空間内での座標を学習す
る特徴空間内座標学習手段,109は特徴空間帰属度学
習手段107および特徴空間内座標学習手段108の動
作開始・終了を制御する学習制御手段である。
(Embodiment 1) FIG. 1 is a configuration diagram of an information recommendation apparatus showing a first embodiment. In FIG.
101 is a response to a sample category (sample
An individual / category response pattern storage means for storing a category reaction pattern), a sample / category distance storage means for storing a distance between the sample and the category (a sample / category distance), and 103 a distance between the samples. (Inter-sample distance) storing means, inter-sample distance storing means for storing the inter-category distance (inter-category distance), and 105 to a feature space representing a correlation between the sample and the category. Is a feature space belonging degree storing means for storing the degree of belonging of the sample or the category, 106 is a feature space coordinate storing means for storing coordinates of the sample and the category in the feature space, and 107 is the sample category. Reaction pattern, distance between sample categories, distance between samples, and The feature space belonging degree learning means 108 for learning the degree of belonging of the sample or category to the feature space based on the distance between categories, the sample / category reaction pattern, the distance between sample categories, the distance between samples, and the category A feature space coordinate learning unit 109 for learning the coordinates of the sample and the category in the feature space based on the distance controls the operation start / end of the feature space belonging degree learning unit 107 and the feature space coordinate learning unit 108. This is learning control means.

【0010】以上のように構成された情報推薦装置が実
行される本実施の形態のハードウェア構成を図2に示
す.図2は基本的に汎用の計算機システムの構成と同じ
である.図2において,1002はプログラムを記憶す
る揮発性メモリからなる主記憶装置,1003はプログ
ラムやデータを記憶する不揮発性メモリからなる補助記
憶装置,1001は主記憶装置1002に記憶されてい
るプログラムを実行するCPUである.1004はサン
プル・カテゴリ反応パターン等の分析データを入力する
インタフェースであり,モニタ,キーボード,マウスな
どからなる.補助記憶装置1003に記憶されているプ
ログラムは,主記憶装置1002にロードされた後CP
U1001により実行される。
FIG. 2 shows a hardware configuration of the present embodiment in which the information recommendation device configured as described above is executed. FIG. 2 is basically the same as the configuration of a general-purpose computer system. In FIG. 2, reference numeral 1002 denotes a main storage device composed of a volatile memory for storing programs, 1003 denotes an auxiliary storage device composed of a nonvolatile memory for storing programs and data, and 1001 executes a program stored in the main storage device 1002. CPU Reference numeral 1004 denotes an interface for inputting analysis data such as a sample / category reaction pattern, which includes a monitor, a keyboard, a mouse, and the like. After the program stored in the auxiliary storage device 1003 is loaded into the main storage device 1002,
This is executed by U1001.

【0011】以上のように構成された第1の実施の形態
の動作を説明する.第1の実施の形態の動作をより分か
りやすく説明するために,ここでは図3に示すサンプル
・カテゴリ反応パターンから,どのようなユーザがどの
ようなホームページを好むかを分析する例で説明する.
この例では,サンプルはI人のユーザ(ユーザ1〜ユー
ザI)であり,カテゴリはJ個のホームページ(HP1〜HP
J)である.図3中の数値は,例えば,各ユーザの各ホ
ームページに対する興味の度合いを点数化したものや各
ホームページに対する閲覧回数である.この場合,本発
明による分析は,図3に示したユーザとホームページに
関する多次元データに対して,図4に示すように,ホー
ムページに対する興味の傾向が似ているユーザをいくつ
かの低次元特徴空間(例えば2次元や3次元)にグルー
プ分けすると同時に,各特徴空間内において,興味のあ
るホームページとユーザ,ホームページに対する興味の
傾向が似ているユーザ同士,およびユーザの反応が似て
いるホームページ同士をユークリッド距離の意味で近く
に配置することであり,その結果,どのようなユーザが
どのようなホームページをどのような観点で好むかを解
釈することが可能となる。
The operation of the first embodiment configured as described above will be described. In order to explain the operation of the first embodiment more clearly, here, an example of analyzing what kind of user likes what kind of homepage from the sample category reaction pattern shown in FIG. 3 will be described.
In this example, the sample is I users (user 1 to user I), and the category is J homepages (HP1 to HP
J). The numerical values in FIG. 3 are, for example, a score of the degree of interest of each user on each homepage and the number of times of browsing each homepage. In this case, in the analysis according to the present invention, as shown in FIG. 4, users having similar interests in the homepage are compared with the multidimensional data relating to the user and the homepage shown in FIG. (E.g., two-dimensional or three-dimensional), and at the same time, in each feature space, the homepages of interest and users, users with similar interests in homepages, and homepages with similar user reactions are identified. This is to arrange the objects closer to each other in the sense of the Euclidean distance, and as a result, it is possible to interpret what kind of user likes what kind of homepage from what viewpoint.

【0012】以下,第1の実施の形態であるデータ分析
方法の動作を図5のフローチャートを用いて説明する。
本発明によるサンプル・カテゴリ反応パターンを用いた
サンプルおよびカテゴリのC個のK次元特徴空間への配置
は,以下の(数1)の評価関数Qを最小化することによ
り実現される。
The operation of the data analysis method according to the first embodiment will be described below with reference to the flowchart of FIG.
The arrangement of the samples and categories in the K-dimensional feature space using the sample / category reaction pattern according to the present invention is realized by minimizing the following evaluation function Q of (Equation 1).

【0013】[0013]

【数1】 (Equation 1)

【0014】ここで,xijはサンプルiのカテゴリjへの
反応度数,vcjはサンプルのクラスタcのクラスタ中心ベ
クトル, uciはサンプルiのクラスタcへの帰属度, dijは
サンプルiとカテゴリjの距離, pcikはクラスタcに帰属
するサンプルiの特徴空間内の座標, qcjkはクラスタcに
帰属するサンプルjの特徴空間内の座標, pdisはサンプ
ルiとサンプルsの距離, qdjtはカテゴリjとカテゴリtの
距離を表している。Q1は特徴空間内でサンプルiとカテ
ゴリjの距離をサンプル・クラスタ間距離dijに近づける
ための評価関数、Q2は特徴空間内でサンプルiとsの距離
をンプル間距離pdisに近づけるための評価関数、Q3は特
徴空間内でカテゴリjとtの距離をカテゴリ間距離qdjtに
近づけるための評価関数である。
Here, xij is the degree of reaction of sample i to category j, vcj is the cluster center vector of sample cluster c, uci is the degree of membership of sample i to cluster c, and dij is the distance between sample i and category j. , pcik is the coordinates in the feature space of sample i belonging to cluster c, qcjk is the coordinates in the feature space of sample j belonging to cluster c, pdis is the distance between sample i and sample s, qdjt is category j and category t Represents the distance. Q1 is an evaluation function to make the distance between sample i and category j closer to the sample-cluster distance dij in the feature space, and Q2 is an evaluation function to make the distance between sample i and s closer to the inter-sample distance pdis in the feature space. , Q3 are evaluation functions for bringing the distance between categories j and t closer to the inter-category distance qdjt in the feature space.

【0015】以下の手順によりQを勾配法に基づき最小
化することで,C個のK次元特徴空間内でのサンプルおよ
びカテゴリの座標Pcikおよびqcjkが得られる。
By minimizing Q based on the gradient method by the following procedure, the coordinates Pcik and qcjk of the sample and the category in the C K-dimensional feature spaces can be obtained.

【0016】[STEP1a] 初期化 学習制御手段109により、C,K,pcik,qcjk,uci,vcjを
初期化する。cはサンプルをグループ化したい数を指定
する。Kは特徴空間の次元でありこれも指定する。図4
の場合はK=3である。pcikおよびqcjkは[0,1]の乱数によ
り初期化し、特徴空間内座標記憶手段106に記憶す
る。uciは、すべてのiについて1/Cとする。vcjはxijのu
ciによる重み付き平均Σuci・xij/Σuciとする。これ
らは特徴空間帰属度記憶手段106に記憶する。
[STEP 1a] Initialization C, K, pcik, qcjk, uci, vcj are initialized by the learning control means 109. c specifies the number of samples you want to group. K is the dimension of the feature space and is also specified. FIG.
In the case of, K = 3. pcik and qcjk are initialized by a random number of [0, 1] and stored in the feature space coordinate storage means 106. uci is 1 / C for all i. vcj is xij u
The weighted average by ci is Σuci · xij / Σuci. These are stored in the feature space membership degree storage means 106.

【0017】[STEP2a] 特徴空間帰属度uciの更新 特徴空間帰属度学習手段107により特徴空間帰属度uc
iを更新する。ここで、最急降下法による学習の場合uci
が負になることがあるので、アフィン変換を用いる内点
法によりuciを更新する。このuciの値によりサンプルが
どの特徴空間にどの程度帰属するかということが決ま
る。
[STEP 2a] Update of feature space belonging degree uci The feature space belonging degree learning unit 107 updates the feature space belonging degree uc.
Update i. Here, in the case of learning by the steepest descent method, uci
Since u may be negative, uci is updated by the interior point method using affine transformation. The value of uci determines to what extent the sample belongs to which feature space.

【0018】[STEP3a] 特徴空間内座標pcik,qcjkの更新 特徴空間内座標学習手段108によりpcik,qcjkを(数
2)で更新する。更新した座標は特徴空間内座標記憶手
段106に記憶する。
[STEP 3a] Update of coordinates pcik, qcjk in feature space pcik, qcjk is updated by (Equation 2) by the feature space coordinate learning means 108. The updated coordinates are stored in the feature space coordinate storage unit 106.

【0019】[0019]

【数2】 (Equation 2)

【0020】[STEP4a] クラスタ中心vcjの更新 学習制御手段109により、∂Q/∂vcj=0の解であるxij
のuciによる重み付き平均Σuci・xij/Σuciによりvcj
を更新する。
[STEP 4a] Update of the cluster center vcj The learning control means 109 executes xij which is a solution of ∂Q / ∂vcj = 0.
Vcj by uci weighted average iuci · xij / Σuci
To update.

【0021】[STEP5a] 学習終了判定 学習制御手段109により、max|uci(new)-uci(old)|<
εを満たせば学習終了。その他はSTEP2aに戻る。
[STEP 5a] Learning end determination The learning control means 109 determines that max | uci (new) -uci (old) | <
Learning is completed if ε is satisfied. Others return to STEP2a.

【0022】以上の手順によりQを勾配法に基づき最小
化することで,C個のK次元特徴空間内でのサンプルおよ
びカテゴリの座標Pcikおよびqcjkが得られる.以上、第
1の実施の形態では,カテゴリに対する興味の傾向が似
ているサンプルをいくつかの低次元特徴空間にグループ
分けすると同時に,各特徴空間内において,関連の高い
サンプルとカテゴリをユークリッド距離の意味で近くに
配置するので、サンプルとカテゴリの関係をより直感的
な把握を容易にすることが可能となる。
By minimizing Q based on the gradient method according to the above procedure, the coordinates Pcik and qcjk of the sample and the category in the C K-dimensional feature spaces are obtained. As described above, in the first embodiment, samples having a similar tendency of interest in a category are grouped into several low-dimensional feature spaces. Since the arrangement is close to the meaning, it is possible to more easily intuitively grasp the relationship between the sample and the category.

【0023】なお,ここでは,サンプルを複数の特徴空
間にグループ化したが、サンプル・カテゴリ反応パター
ンを転置することにより、カテゴリをグループ化して分
析できることは言うまでもない。
Here, the samples are grouped into a plurality of feature spaces, but it goes without saying that the categories can be grouped and analyzed by transposing the sample / category reaction pattern.

【0024】(実施の形態2)次に本発明の情報推薦方
法に係る第2の実施の形態について説明する。第1の実
施の形態では、カテゴリ(ホームページ)に対する興味
の傾向が似ているサンプル(ユーザ)をいくつかの低次
元特徴空間にグループ分けすると同時に,各特徴空間内
において,関連の高いユーザとホームページをユークリ
ッド距離の意味で近くに配置することにより、それらの
関係をより直感的に把握できるようにする分析方法を説
明したが,第2の実施の形態は、ユーザの属性とコンテ
ンツ間の低次元特徴空間における相関関係を情報探索者
に表示することにより,情報探索者は,特徴空間内の自
分に関連する属性をランドマークとして自分に良く似た
人がよく利用しているコンテンツを容易に探せるように
考慮したものである。
(Embodiment 2) Next, a second embodiment according to the information recommendation method of the present invention will be described. In the first embodiment, samples (users) having similar interests in a category (homepage) are grouped into several low-dimensional feature spaces, and at the same time, in each feature space, a highly related user and a homepage are grouped. In the second embodiment, the analysis method is described in which the relations are arranged closer to each other in the sense of the Euclidean distance so that their relations can be grasped more intuitively. By displaying the correlation in the feature space to the information searcher, the information searcher can easily search for the content that is used by a person who is very similar to himself as a landmark using the attribute related to oneself in the feature space. It is considered as follows.

【0025】図6は第2の実施の形態である情報推薦装
置の構成図であり、図1に示した第1の実施の形態と同
じ構成手段分には同一番号を付して詳細な説明は省略す
る。第2の実施の形態と第1の実施の形態との相違点
は、ユーザ属性とユーザの利用したコンテンツ関連情報
を対応づけて管理するユーザ属性対応コンテンツ情報管
理手段201および前記コンテンツと前記ユーザ属性の
相関関係を表示して前記コンテンツをその要求者に探索
させるユーザ属性・コンテンツ相関関係表示型情報探索
インタフェース提供手段202を付加したことである.
すなわち,第2の実施の形態は,図6に示すように,例
えばネットワークを会してユーザが自分の属性にあった
情報(例えばホームページ)を探索するためのインタフ
ェースとそのシステムである。
FIG. 6 is a block diagram of the information recommendation apparatus according to the second embodiment. The same components as those in the first embodiment shown in FIG. Is omitted. The difference between the second embodiment and the first embodiment is that a user attribute corresponding content information management means 201 for managing a user attribute and content related information used by a user in association with each other and the content and the user attribute And a user attribute / content correlation display type information search interface providing means 202 for displaying the correlation of the information and allowing the requester to search for the content.
That is, the second embodiment is, as shown in FIG. 6, an interface and a system for allowing a user to search for information (for example, a homepage) that meets a user's own attribute by joining a network, for example.

【0026】以上のように構成された第2の実施の形態
の動作を図7のフローチャートを用いて説明する.ただ
し、第1の実施の形態のデータ分析方法の動作を表す図
5のフローチャートの[STEP1a]〜[STEP5a]は図7のフロ
ーチャートの[STEP4b]〜[STEP8b]と同様であるので,そ
の相違点である[STEP1b]〜[STEP2b]および[STEP9b]につ
いてのみ説明する。本発明の動作をよりわかりやすく説
明するため,ここでは,ユーザはユーザ端末2001に
搭載されているWebブラウザを用いてWebサーバに
アクセスし,情報を探索する例で説明する.通常,ユー
ザはYahooやMSNなどにあるホームページのディ
レクトリやおすすめリンクを閲覧して情報を欲しい探索
するが,本実施の形態では,自分の属性をキーとして情
報を探索させる。
The operation of the second embodiment configured as described above will be described with reference to the flowchart of FIG. However, [STEP1a] to [STEP5a] of the flowchart of FIG. 5 representing the operation of the data analysis method of the first embodiment are the same as [STEP4b] to [STEP8b] of the flowchart of FIG. Only [STEP1b] to [STEP2b] and [STEP9b] will be described. In order to explain the operation of the present invention more clearly, here, an example will be described in which a user accesses a Web server using a Web browser mounted on the user terminal 2001 and searches for information. Usually, a user browses a directory or a recommended link of a homepage in Yahoo or MSN and searches for desired information. In the present embodiment, the user is caused to search for information using his / her attribute as a key.

【0027】[STEP1b]ユーザ属性対応コンテンツ利用履
歴蓄積 ユーザ属性対応コンテンツ情報管理手段201により,
図6に示すようにネットワークを会して接続されている
ユーザ端末を通じて,例えば図8に示すような形式で,
ユーザの属性とこれまでに閲覧したホームページの情報
(例えば閲覧回数)を収集し蓄積する.例えば,ユーザ
の属性に関しては,本実施の形態のシステムでの情報探
索サービス利用に際してのユーザ登録時に入力するよう
にすればよい.ユーザ(ブラウザ)の特定はcookie等を
用いればよい.情報閲覧回数の検出は情報提供者側でcg
iやJavaScript等で実現すればよい.ユーザ属性対応コ
ンテンツ情報管理手段201は,この情報蓄積を所定の
時間の間行う。
[STEP 1b] Storage of user attribute-compatible content usage history
As shown in FIG. 6, through a user terminal connected over a network, for example, in a format as shown in FIG.
It collects and accumulates user attributes and information on the homepages that have been viewed (for example, the number of times viewed). For example, the user attribute may be input at the time of user registration when using the information search service in the system according to the present embodiment. The user (browser) can be specified using cookies or the like. The information provider detects cg in the information provider
It can be realized by i or JavaScript. The user attribute corresponding content information management means 201 stores this information for a predetermined time.

【0028】[STEP2b]所定時間経過判定 ユーザ属性対応コンテンツ情報管理手段201はSTEP1
の時間管理を行う。
[STEP 2b] Determination of Elapse of Predetermined Time The user attribute corresponding content information management means 201
Time management.

【0029】STEP1bによる情報収集から所定の時間が経
過すればSTEP3bへ.それ以外はSTEP1bによる情報収集を
継続する。
If a predetermined time has passed since the information was collected by STEP 1b, the process proceeds to STEP 3b. Otherwise, the information collection by STEP1b is continued.

【0030】[STEP3b]関連距離算出 ユーザ属性対応コンテンツ情報管理手段201により,
図8に示すようなユーザ属性とコンテンツの対応表か
ら,分析対象とするユーザ属性についてデータをまと
め,まず,コンテンツ・ユーザ属性反応パターンを作成
する.これば,例えば職業というユーザ属性で分析する
場合には,その属性内に含まれている数値をコンテンツ
毎に合計することにより行う.このコンテンツ・ユーザ
属性反応パターンに基づき,コンテンツ・ユーザ属性間
距離,コンテンツ間距離およびユーザ属性間距離を算出
する.これらはユークリッド距離として算出する。
[STEP 3b] Related Distance Calculation The user attribute corresponding content information management means 201
From the correspondence table between user attributes and contents as shown in FIG. 8, data on the user attributes to be analyzed is summarized, and first, a content / user attribute reaction pattern is created. In this case, for example, when analyzing by the user attribute of occupation, it is performed by summing the numerical values included in the attribute for each content. Based on this content / user attribute response pattern, the distance between content / user attributes, the distance between contents, and the distance between user attributes are calculated. These are calculated as Euclidean distances.

【0031】[STEP9b]情報探索インタフェース更新 STEP2bで管理される所定時間間隔で,特徴空間帰属度学
習手段107および特徴空間内座標学習手段108で更
新されるコンテンツとユーザ属性の特徴空間内のマッピ
ングを表示する.これは例えばWebサーバ内におくホー
ムページとして実現する.特徴空間が2次元の場合はチ
ャート形式,3次元の場合はVRML等で実現する.ユ
ーザは端末2001に搭載されているブラウザを通じ
て,コンテンツとユーザ属性のマップを閲覧することが
でき,情報の探索は,自分の属性をキーとして,属性の
近傍のコンテンツを参照することで自分にあった情報を
探索できる。
[STEP 9b] Updating of information search interface At predetermined time intervals managed in STEP 2b, mapping of contents and user attributes in the feature space updated by the feature space belonging degree learning means 107 and the feature space coordinate learning means 108 is performed. indicate. This is realized, for example, as a home page stored in a Web server. If the feature space is two-dimensional, it is realized in a chart format, and if it is three-dimensional, it is realized in VRML or the like. The user can browse the map of the content and the user attribute through a browser mounted on the terminal 2001, and searches for information by using the user's own attribute as a key and referring to the content near the attribute. Information that can be searched.

【0032】以上、第2の実施の形態では,多くのユー
ザから得たユーザ属性とコンテンツ情報の対応データを
分析し,コンテンツとユーザ属性の相関関係を低次元空
間にマッピングして情報探索者に提示するので,情報探
索者は,自分の属性をキーとして,その近傍に配置され
ているコンテンツを選択するだけで,その人にとって有
用な情報を簡単に得ることができる。
As described above, in the second embodiment, the correspondence data between the user attribute and the content information obtained from many users is analyzed, and the correlation between the content and the user attribute is mapped to the low-dimensional space to provide the information searcher with the information. Since the information searcher presents the information, the information searcher can easily obtain useful information for the person only by selecting the contents arranged in the vicinity using his / her attribute as a key.

【0033】なお,ここでは年齢,性別,職業などある
程度個人が特定されないようなユーザ属性をキーとした
が,例えば,匿名を使って直接ユーザを空間内に配置し
てもよい.この場合,○○さんの情報は自分の好みによ
くあっているなどというより直接的で,きめ細かい情報
探索が可能となる。
Here, the user attributes such as age, gender, occupation, etc., which do not identify individuals to some extent, are used as keys. However, for example, users may be directly arranged in the space using anonymity. In this case, the information of Mr. XX can be searched more directly and more finely, rather than being well suited to his or her preference.

【0034】また,ここでは,ユーザ属性とコンテンツ
の相関を表すマップを閲覧するには,更なるデータ収集
のため登録制の場合について述べたが,特に閲覧だけさ
せるサービスにしてもよい。
Also, here, the case of browsing the map showing the correlation between the user attribute and the content has been described in connection with the registration system for further data collection.

【0035】(実施の形態3)次に本発明の情報推薦方
法に係る第3の実施の形態について説明する。第2の実
施の形態では、ユーザ属性と利用コンテンツの相互関係
を低次元のマップとしてユーザに提示することにより,
属性をキーとして情報探索を容易にする例で説明した
が,第3の実施の形態は、ユーザ毎に利用コンテンツ情
報を管理し,得られた特徴空間で利用コンテンツが類似
するユーザ相互に利用情報を配信するようにし,自分で
情報を探索しなくとも,自分にあった情報が自動で入手
できるよう考慮したものである。
(Embodiment 3) Next, a third embodiment according to the information recommendation method of the present invention will be described. In the second embodiment, the interrelationship between the user attribute and the used content is presented to the user as a low-dimensional map,
Although the description has been given of the example in which the information search is facilitated by using the attribute as a key, the third embodiment manages the usage content information for each user, and uses the usage information between users having similar usage content in the obtained feature space. Is distributed so that the information suitable for oneself can be automatically obtained without having to search for the information by oneself.

【0036】図9は第3の実施の形態である情報推薦装
置の構成図であり、図6に示した第2の実施の形態と同
じ構成手段分には同一番号を付して詳細な説明は省略す
る。第3の実施の形態と第2の実施の形態との相違点
は、さらに,ユーザ毎に利用したコンテンツ関連情報を
対応づけて管理するユーザ別利用コンテンツ情報管理手
段301と、特徴空間帰属度記憶手段107に記憶され
ているユーザまたはコンテンツの帰属度および特徴空間
内座標記憶手段108に記憶されているユーザおよびコ
ンテンツ属性の座標値を参照して,特徴空間内で互いに
所定の距離範囲内に配置されている前記ユーザを選択す
る利用コンテンツ類似ユーザ選択手段302と,利用コ
ンテンツ類似ユーザ選択手段302により選択されたユ
ーザ相互に互いの利用コンテンツを推薦する推薦情報選
択提供手段303を備えたことである.すなわち,第3
の実施の形態は,図9に示すように,例えばネットワー
クを会してユーザにあった情報(例えばホームページ)
を自動的に配信するためのシステムである。
FIG. 9 is a diagram showing the configuration of an information recommendation apparatus according to a third embodiment. The same components as those in the second embodiment shown in FIG. Is omitted. The difference between the third embodiment and the second embodiment is that a user-specific usage content information management unit 301 that manages content-related information used for each user in association with each other, and a feature space membership degree storage. With reference to the degree of belonging of the user or the content stored in the means 107 and the coordinate values of the user and the content attribute stored in the coordinate storage means 108 in the feature space, they are arranged within a predetermined distance range from each other in the feature space. And a recommendation information selection providing unit 303 for mutually recommending each other the users selected by the used content similar user selecting unit 302. . That is, the third
In the embodiment, as shown in FIG. 9, for example, information (for example, a homepage) that meets a user through a network
Is a system for automatically distributing.

【0037】以上のように構成された第3の実施の形態
の動作を図10のフローチャートを用いて説明する.た
だし、第2の実施の形態の情報探索方法の動作を表す図
7のフローチャートの[STEP2b],[STEP4b]〜[STEP8b]
は,図10のフローチャートの[STEP2c],[STEP4c]〜[S
TEP8c]と同様であるので,その相違点である[STEP1c]〜
[STEP3c],[STEP9b]および[STEP10c]についてのみ説明
する。本発明の動作をよりわかりやすく説明するため,
ここでは,ユーザがユーザ端末2001に搭載されてい
るWebブラウザを用いてWebサーバにアクセスした
際に,所定のホームページにその人におすすめの情報が
リンクされている例で説明する。
The operation of the third embodiment configured as described above will be described with reference to the flowchart of FIG. However, [STEP2b], [STEP4b] to [STEP8b] in the flowchart of FIG. 7 showing the operation of the information search method according to the second embodiment.
Are [STEP2c], [STEP4c] to [SEP2] in the flowchart of FIG.
TEP8c], so the differences are [STEP1c] ~
Only [STEP3c], [STEP9b] and [STEP10c] will be described. To better explain the operation of the present invention,
Here, an example will be described in which when a user accesses a Web server using a Web browser mounted on the user terminal 2001, information recommended to the person is linked to a predetermined homepage.

【0038】[STEP1c]ユーザ別利用コンテンツ情報蓄積 ユーザ別利用コンテンツ情報管理手段301により,図
3に示すようにな形式でユーザ毎にコンテンツの利用履
歴を収集管理する.収集する情報は単なる閲覧回数だけ
でなく,ユーザがそのコンテンツを評価した点数を記憶
してもよい.収集管理の仕方は基本的に第2の実施の形
態と同様である。
[STEP 1c] Storage of usage content information for each user The usage content information management means 301 for each user collects and manages the usage history of content for each user in a format as shown in FIG. The information to be collected may store not only the number of times of browsing but also the score of the content evaluated by the user. The collection management method is basically the same as in the second embodiment.

【0039】[STEP3c]関連距離算出 ユーザ別利用コンテンツ情報管理手段301により,図
3に示すユーザ・コンテンツ反応パターンに基づき,ユ
ーザ・コンテンツ間距離,ユーザ間距離およびコンテン
ツ間距離を算出する.これらはユークリッド距離として
算出する。
[STEP 3c] Calculation of Related Distance The user-specific used content information management means 301 calculates the user-content distance, the user distance, and the content distance based on the user-content reaction pattern shown in FIG. These are calculated as Euclidean distances.

【0040】[STEP9c]利用コンテンツ類似ユーザ選択 利用コンテンツ類似ユーザ選択手段302により,STEP
2bで管理される所定時間間隔で,特徴空間帰属度学習手
段107および特徴空間内座標学習手段108で更新さ
れるコンテンツとユーザ属性の特徴空間内のマッピング
において,相互に所定距離範囲にあるユーザを,利用コ
ンテンツが類似しているユーザとして選択する。
[STEP 9c] Use Content Similar User Selection
In the mapping of the content and the user attribute in the feature space updated by the feature space belonging degree learning means 107 and the feature space coordinate learning means 108 at predetermined time intervals managed in 2b, users within a predetermined distance range from each other are identified. , A user whose usage content is similar is selected.

【0041】[STEP10c]類似ユーザ相互情報推薦 推薦情報選択提供手段303により,類似ユーザ間で相
互に利用コンテンツを交換する.この推薦コンテンツ
は,例えば,ユーザがユーザ端末2001に搭載されて
いるWebブラウザを用いてアクセス可能な所定のホー
ムページにリンクする形で提供すればよい.また,UR
Lのみを電子メール等で送信してもよい。
[STEP 10c] Mutual information recommendation of similar users The recommended information selection and provision means 303 mutually exchanges contents to be used between similar users. This recommended content may be provided, for example, in a form in which the user links to a predetermined homepage that can be accessed using a Web browser mounted on the user terminal 2001. Also, UR
Only L may be transmitted by e-mail or the like.

【0042】以上、第3の実施の形態では,ユーザ毎に
利用コンテンツ情報を管理し,得られた特徴空間で利用
コンテンツが類似するユーザを特定して相互に利用情報
を配信するようにし,自分で情報を探索しなくとも,自
分にあった情報が自動で入手できる。
As described above, in the third embodiment, the usage content information is managed for each user, the users whose usage content is similar in the obtained feature space are specified, and the usage information is mutually distributed. You can automatically obtain information that suits you without having to search for the information.

【0043】なお,本発明では,ユーザ間距離およびコ
ンテンツ間距離は,ユーザ・コンテンツ反応パターンか
ら算出したが,必ずしもその必要はなく,コンテンツが
ホームページのようなテキスト情報を含む場合,ベクト
ル空間モデルでの文書類似度等を距離変換して用いても
よい.ユーザ間距離も,年齢,職業,性別などの一致度
を距離変換してもよい。
In the present invention, the distance between users and the distance between contents are calculated from the user / content reaction pattern. However, this is not always necessary. When the content includes text information such as a homepage, a vector space model is used. The document similarity of may be converted to distance before use. As for the distance between users, the degree of coincidence such as age, occupation, and gender may be converted.

【0044】[0044]

【発明の効果】第1の実施の形態によれば,関連の高い
サンプルとカテゴリをユークリッド距離の意味で近くに
配置すると同時にサンプルやカテゴリを複数の特徴空間
にグループ化するので、数量化3類のように全サンプル
およびカテゴリを同一の特徴空間に配置する場合に比
べ、サンプルとカテゴリの潜在的な特徴をよく表すこと
ができ、かつその親近性の直感的な理解を容易にするこ
とができる。
According to the first embodiment, since highly related samples and categories are arranged close in the sense of the Euclidean distance and at the same time, the samples and categories are grouped into a plurality of feature spaces. Than in the case where all samples and categories are arranged in the same feature space as in the above, the potential features of the samples and categories can be well represented, and the intuitive understanding of the closeness can be facilitated. .

【0045】第2の実施の形態によれば,多くのユーザ
から得たユーザ属性とコンテンツ情報の対応データを分
析し,コンテンツとユーザ属性の相関関係を低次元空間
にマッピングして情報探索者に提示するので,情報探索
者は,自分の属性をキーとして,その近傍に配置されて
いるコンテンツを選択するだけで,その人にとって有用
な情報を簡単に得ることができる。
According to the second embodiment, the correspondence data between the user attribute and the content information obtained from many users is analyzed, and the correlation between the content and the user attribute is mapped to the low-dimensional space to provide the information searcher with the information. Since the information searcher presents the information, the information searcher can easily obtain useful information for the person only by selecting the contents arranged in the vicinity using his / her attribute as a key.

【0046】第3の実施の形態によれば,コンテンツと
ユーザ属性の特徴空間内のマッピングにおいて,相互に
所定距離範囲にあるユーザを利用コンテンツが類似して
いるユーザとして選択し相互に情報を配信することによ
り,自分で情報を探索しなくとも,自分にあった情報が
自動で入手できる。
According to the third embodiment, in mapping of contents and user attributes in the feature space, users located within a predetermined distance from each other are selected as users whose usage contents are similar and information is mutually distributed. By doing so, it is possible to automatically obtain information suitable for oneself without having to search for information by oneself.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明第1の実施の形態のデータ分析方法の構
成図
FIG. 1 is a configuration diagram of a data analysis method according to a first embodiment of the present invention.

【図2】本発明第1の実施の形態のハードウェア構成図FIG. 2 is a hardware configuration diagram according to the first embodiment of this invention;

【図3】サンプル・カテゴリ反応パターンの一例を示す
FIG. 3 shows an example of a sample category reaction pattern.

【図4】本発明第1の実施の形態によるデータ分析結果
の一例を示す図
FIG. 4 is a diagram showing an example of a data analysis result according to the first embodiment of the present invention;

【図5】本発明第1の実施の形態のデータ分析方法の動
作手順を示すフローチャート
FIG. 5 is a flowchart showing an operation procedure of the data analysis method according to the first embodiment of the present invention.

【図6】本発明第2の実施の形態の情報探索方法の構成
FIG. 6 is a configuration diagram of an information search method according to a second embodiment of the present invention.

【図7】本発明第2の実施の形態の情報探索方法の動作
手順を示すフローチャート
FIG. 7 is a flowchart showing an operation procedure of the information search method according to the second embodiment of the present invention;

【図8】ユーザ属性とコンテンツ対応表の一例を示す図FIG. 8 is a diagram showing an example of a user attribute / content correspondence table.

【図9】本発明第3の実施の形態の情報推薦方法の構成
FIG. 9 is a configuration diagram of an information recommendation method according to a third embodiment of the present invention.

【図10】本発明第3の実施の形態の情報推薦方法の動
作手順を示すフローチャート
FIG. 10 is a flowchart illustrating an operation procedure of the information recommendation method according to the third embodiment of this invention;

【符号の説明】[Explanation of symbols]

101 サンプル・カテゴリ反応パターン記憶手段 102 サンプル・カテゴリ間距離記憶手段 103 サンプル間距離記憶手段 104 カテゴリ間距離記憶手段 105 特徴空間帰属度記憶手段 106 特徴空間内座標記憶手段 107 特徴空間帰属度学習手段 108 特徴空間内座標学習手段 109 学習制御手段 201 ユーザ属性対応コンテンツ情報管理手段 202 ユーザ属性・コンテンツ相関関係表示型情報探
索インタフェース提供手段 301 ユーザ別利用コンテンツ情報管理手段 302 利用コンテンツ類似ユーザ選択手段 303 推薦情報選択提供手段 1001 CPU 1002 主記憶装置 1003 補助記憶装置 1004 インタフェース 2001 ユーザ端末 2002 情報提供サーバ 3001 情報配信サーバ
Reference Signs List 101 sample / category reaction pattern storage means 102 sample / category distance storage means 103 sample-to-sample distance storage means 104 inter-category distance storage means 105 feature space belonging degree storage means 106 feature space coordinate storage means 107 feature space belonging degree learning means 108 Feature space coordinate learning means 109 Learning control means 201 User attribute corresponding content information management means 202 User attribute / content correlation display type information search interface providing means 301 User-specific usage content information management means 302 User content similar user selection means 303 Recommendation information Selection providing means 1001 CPU 1002 Main storage device 1003 Auxiliary storage device 1004 Interface 2001 User terminal 2002 Information providing server 3001 Information distribution server

───────────────────────────────────────────────────── フロントページの続き (72)発明者 九津見 洋 大阪府門真市大字門真1006番地 松下電器 産業株式会社内 Fターム(参考) 5B075 NK46 NR12 PP02 PP03 PQ02 PQ13 PR06 QM05  ──────────────────────────────────────────────────続 き Continuing on the front page (72) Inventor Hiroshi Kutsumi 1006 Kazuma Kadoma, Kadoma-shi, Osaka Matsushita Electric Industrial Co., Ltd. F-term (reference)

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】 サンプルのカテゴリに対する反応(以
下、サンプル・カテゴリ反応パターンと称す)を記憶す
るサンプル・カテゴリ反応パターン記憶手段と,前記サ
ンプルと前記カテゴリ間の距離(以下、サンプル・カテ
ゴリ間距離と称す)を記憶するサンプル・カテゴリ間距
離記憶手段と,前記サンプルどうしの間の距離(以下、
サンプル間距離と称す)を記憶するサンプル間距離記憶
手段と,前記カテゴリどうしの間の距離(以下、カテゴ
リ間距離と称す)を記憶するカテゴリ間距離記憶手段
と,前記サンプルと前記カテゴリの相関関係を表す特徴
空間への前記サンプルまたは前記カテゴリの帰属度を記
憶する特徴空間帰属度記憶手段と,前記サンプルおよび
前記カテゴリの前記特徴空間内での座標を記憶する特徴
空間内座標記憶手段と,前記サンプル・カテゴリ反応パ
ターンと前記サンプルカテゴリ間距離と前記サンプル間
距離と前記カテゴリ間距離に基づき前記サンプルまたは
カテゴリの前記特徴空間への帰属度を学習する特徴空間
帰属度学習手段と,前記サンプル・カテゴリ反応パター
ンと前記サンプルカテゴリ間距離と前記サンプル間距離
と前記カテゴリ間距離に基づき前記サンプルおよびカテ
ゴリの前記特徴空間内での座標を学習する特徴空間内座
標学習手段と,前記特徴空間帰属度学習手段および前記
特徴空間内座標学習手段の動作開始・終了を制御する学
習制御手段を備えたことを特徴とするデータ分析方法。
1. A sample / category reaction pattern storage means for storing a reaction of a sample to a category (hereinafter, referred to as a sample / category reaction pattern), and a distance between the sample and the category (hereinafter referred to as a sample / category distance). ), And a distance between the samples (hereinafter, referred to as “sample / category distance storage means”).
Inter-sample distance storage means for storing the inter-sample distance), inter-category distance storage means for storing the distance between the categories (hereinafter, referred to as the inter-category distance), and the correlation between the sample and the category A feature space belonging degree storing means for storing the degree of belonging of the sample or the category to the feature space representing the; a feature space coordinate storing means for storing coordinates of the sample and the category in the feature space; Feature space belonging degree learning means for learning the degree of belonging of the sample or category to the feature space based on a sample / category reaction pattern, the distance between sample categories, the distance between samples, and the distance between categories; Reaction pattern, distance between sample categories, distance between samples, and distance between categories Learning means for learning the coordinates of the sample and the category in the feature space based on the information, learning control for controlling the operation start / end of the feature space belonging degree learning means and the coordinate learning means in the feature space A data analysis method characterized by comprising means.
【請求項2】 ユーザ属性とユーザの利用したコンテン
ツ関連情報を対応づけて管理するユーザ属性対応コンテ
ンツ情報管理手段と、コンテンツのユーザ属性への反応
パターン(以下、コンテンツ・ユーザ反応パターンと称
す)を記憶するサンプル・カテゴリ反応パターン記憶手
段と,前記コンテンツと前記ユーザ属性間の距離(以
下、コンテンツ・ユーザ属性間距離と称す)を記憶する
サンプル・カテゴリ間距離記憶手段と,前記コンテンツ
どうし間の距離(以下、コンテンツ間距離と称す)を記
憶するサンプル間距離記憶手段と,前記ユーザ属性どう
し間の距離(以下、ユーザ属性間距離と称す)を記憶す
るカテゴリ間距離記憶手段と,前記コンテンツと前記ユ
ーザ属性の相関関係を表す特徴空間への前記コンテンツ
または前記ユーザ属性の帰属度を記憶する特徴空間帰属
度記憶手段と,前記コンテンツおよび前記ユーザ属性の
前記特徴空間内での座標を記憶する特徴空間内座標記憶
手段と,前記コンテンツ・ユーザ反応パターンと前記コ
ンテンツ・ユーザ属性間距離と前記コンテンツ間距離と
前記ユーザ属性間距離に基づき前記コンテンツまたはユ
ーザ属性の前記特徴空間への帰属度を学習する特徴空間
帰属度学習手段と,前記コンテンツ・ユーザ反応パター
ンと前記コンテンツ・ユーザ属性間距離と前記コンテン
ツ間距離と前記ユーザ属性間距離に基づき前記コンテン
ツおよびユーザ属性の前記特徴空間内での座標を学習す
る特徴空間内座標学習手段と,前記特徴空間帰属度学習
手段および前記特徴空間内座標学習手段の動作開始・終
了を制御する学習制御手段と,前記特徴空間帰属度記憶
手段に記憶されているコンテンツまたはユーザ属性の帰
属度および前記特徴空間内座標記憶手段に記憶されてい
るコンテンツおよびユーザ属性の座標値を参照して前記
コンテンツと前記ユーザ属性の相関関係を表示して前記
コンテンツをその要求者に探索させるユーザ属性・コン
テンツ相関関係表示型情報探索インタフェース提供手段
を備えたことを特徴とする情報探索方法。
2. A user attribute-corresponding content information managing means for managing a user attribute in association with content-related information used by a user, and a response pattern to a user attribute of the content (hereinafter referred to as a content / user response pattern). A sample / category reaction pattern storage means for storing; a sample / category distance storage means for storing a distance between the content and the user attribute (hereinafter referred to as a content / user attribute distance); and a distance between the contents. (Hereinafter, referred to as inter-content distance), inter-sample distance storage means, which stores a distance between the user attributes (hereinafter, referred to as user inter-attribute distance), The content or the user attribute into a feature space representing a correlation of user attributes Characteristic space belonging degree storage means for storing the degree of belonging of the content, coordinate storage means in the characteristic space for storing the coordinates of the content and the user attribute in the characteristic space, the content / user reaction pattern and the content user Feature space belonging degree learning means for learning the degree of belonging of the content or the user attribute to the feature space based on the attribute distance, the content distance, and the user attribute distance, and the content / user response pattern and the content / user response pattern. A feature space coordinate learning unit for learning coordinates of the content and the user attribute in the feature space based on the user attribute distance, the content distance, and the user attribute distance; Learning control means for controlling operation start / end of the coordinate learning means in the feature space; The correlation between the content and the user attribute with reference to the content or user attribute belonging degree stored in the inter-attribution degree storage means and the content and user attribute coordinate values stored in the feature space coordinate storage means. An information search method characterized by comprising a user attribute / content correlation display type information search interface providing means for displaying a user attribute and a content search by the requester.
【請求項3】 ユーザ毎に利用したコンテンツ関連情報
を対応づけて管理するユーザ別利用コンテンツ情報管理
手段と、ユーザのコンテンツへの反応パターン(以下、
ユーザ・コンテンツ反応パターンと称す)を記憶するサ
ンプル・カテゴリ反応パターン記憶手段と,前記ユーザ
と前記コンテンツ属性どうし間の距離(以下、ユーザ・
コンテンツ間距離と称す)を記憶するサンプル・カテゴ
リ間距離記憶手段と,前記ユーザどうし間の距離(以
下、ユーザ間距離と称す)を記憶するサンプル間距離記
憶手段と,前記コンテンツどうし間の距離(以下、コン
テンツ間距離と称す)を記憶するカテゴリ間距離記憶手
段と,前記ユーザと前記コンテンツの相関関係を表す特
徴空間への前記ユーザまたは前記コンテンツ属性の帰属
度を記憶する特徴空間帰属度記憶手段と,前記ユーザお
よび前記コンテンツ属性の前記特徴空間内での座標を記
憶する特徴空間内座標記憶手段と,前記ユーザ・コンテ
ンツ反応パターンと前記ユーザ・コンテンツ属性間距離
と前記ユーザ間距離と前記コンテンツ間距離に基づき前
記ユーザまたはコンテンツの前記特徴空間への帰属度を
学習する特徴空間帰属度学習手段と,前記ユーザ・コン
テンツ反応パターンと前記ユーザ・コンテンツ間距離と
前記ユーザ間距離と前記コンテンツ間距離に基づき前記
ユーザおよびコンテンツの前記特徴空間内での座標を学
習する特徴空間内座標学習手段と,前記特徴空間帰属度
学習手段および前記特徴空間内座標学習手段の動作開始
・終了を制御する学習制御手段と,前記特徴空間帰属度
記憶手段に記憶されているユーザまたはコンテンツの帰
属度および前記特徴空間内座標記憶手段に記憶されてい
るユーザおよびコンテンツ属性の座標値を参照して,特
徴空間内で互いに所定の距離範囲内に配置されている前
記ユーザを選択する利用コンテンツ類似ユーザ選択手段
と,前記利用コンテンツ類似ユーザ選択されたユーザ相
互に互いの利用コンテンツを推薦する推薦情報選択提供
手段を備えたことを特徴とする情報推薦方法。
3. A user-specific use content information management means for managing content-related information used for each user in association with each other, and a response pattern to a user's content (hereinafter, referred to as a content response pattern).
Sample / category response pattern storage means for storing user / content response patterns, and a distance between the user and the content attributes (hereinafter, user / content response pattern).
Sample-category distance storage means for storing a distance between contents (hereinafter referred to as content-to-content distance); inter-sample distance storage means for storing the distance between the users (hereinafter referred to as a user-to-user distance); (Hereinafter referred to as an inter-content distance), and an inter-category distance storage means for storing the degree of belonging of the user or the content attribute to a feature space representing a correlation between the user and the content. A feature space coordinate storage unit for storing coordinates of the user and the content attribute in the feature space; a user content response pattern, the user-content attribute distance, the user distance, and the content Feature space return for learning the degree of belonging of the user or content to the feature space based on distance Degree learning means for learning coordinates in the feature space of the user and the content based on the user-content response pattern, the user-content distance, the user distance, and the content distance. Means, learning control means for controlling the operation start / end of the feature space belonging degree learning means and the coordinate learning means in the feature space, and the degree of belonging of the user or the content stored in the feature space belonging degree storage means. Use content similar user selection means for selecting the users located within a predetermined distance range from each other in the feature space with reference to the coordinate values of the user and the content attribute stored in the feature space coordinate storage means And recommending each other's usage contents to the selected users similar to the usage contents Information recommendation method characterized by comprising Como information selection providing means.
JP2000150963A 2000-05-23 2000-05-23 Data analyzing method, information retrieving method, and information recommending method Pending JP2001331516A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000150963A JP2001331516A (en) 2000-05-23 2000-05-23 Data analyzing method, information retrieving method, and information recommending method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000150963A JP2001331516A (en) 2000-05-23 2000-05-23 Data analyzing method, information retrieving method, and information recommending method

Publications (1)

Publication Number Publication Date
JP2001331516A true JP2001331516A (en) 2001-11-30

Family

ID=18656591

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000150963A Pending JP2001331516A (en) 2000-05-23 2000-05-23 Data analyzing method, information retrieving method, and information recommending method

Country Status (1)

Country Link
JP (1) JP2001331516A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7747684B2 (en) 2004-04-14 2010-06-29 Fujitsu Limited Information processing technique relating to relation between users and documents
WO2011001584A1 (en) * 2009-06-29 2011-01-06 日本電気株式会社 Information classification device, information classification method, and information classification program
WO2024053727A1 (en) * 2022-09-09 2024-03-14 味の素株式会社 Preference inference method, preference inference device, preference inference program, display method, model generation method, and preference information prediction method

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7747684B2 (en) 2004-04-14 2010-06-29 Fujitsu Limited Information processing technique relating to relation between users and documents
WO2011001584A1 (en) * 2009-06-29 2011-01-06 日本電気株式会社 Information classification device, information classification method, and information classification program
JPWO2011001584A1 (en) * 2009-06-29 2012-12-10 日本電気株式会社 Information classification apparatus, information classification method, and information classification program
WO2024053727A1 (en) * 2022-09-09 2024-03-14 味の素株式会社 Preference inference method, preference inference device, preference inference program, display method, model generation method, and preference information prediction method

Similar Documents

Publication Publication Date Title
Chu et al. A hybrid recommendation system considering visual information for predicting favorite restaurants
JP2005317018A (en) Method and system for calculating importance of block in display page
JP2009157500A (en) Distribution server and distribution method
Abid et al. A survey on search results diversification techniques
CN111310046A (en) Object recommendation method and device
CN113032668A (en) Product recommendation method, device and equipment based on user portrait and storage medium
JP5223865B2 (en) Knowledge discovery support system, method, and program
JP4939637B2 (en) Information providing apparatus, information providing method, program, and information recording medium
KR100372225B1 (en) An apparatus for creating homepage, a method for automatically converting the homepage and method for discriminating to view the homepage
KR20030058660A (en) The method of Collaborative Filtering using content references of users in Personalization System
CN117216396A (en) Intelligent recommendation method, device, equipment and storage medium based on big data analysis
JP5262434B2 (en) Information search system, information search method, program, and recording medium
Palanisamy Evaluation of search engines: a conceptual model and research issues
JP5841323B2 (en) Recommended item search server and recommended item search program
Pallis et al. Validation and interpretation of Web users’ sessions clusters
JP2007148476A (en) Information retrieval support system, information retrieval support method, retrieval support module program and information retrieval support program
JP2005196540A (en) Metadata relevant information management system, method, management server, metadata reference terminal, and computer program
JP2001331516A (en) Data analyzing method, information retrieving method, and information recommending method
Kim Weighted order-dependent clustering and visualization of web navigation patterns
JP3547338B2 (en) Information retrieval method and device
Braynov Personalization and customization technologies
Ziesemer et al. How to know what do you want? a survey of recommender systems and the next generation
JP4870903B2 (en) Content classification processing apparatus, directory listing method and processing program therefor
Ji et al. Garment customization big data–processing and analysis in optimization design
JP6945680B1 (en) Information processing equipment, information processing methods, and information processing programs