JP2008146610A - Method of recommendation to user on network, recommendation server, and program - Google Patents
Method of recommendation to user on network, recommendation server, and program Download PDFInfo
- Publication number
- JP2008146610A JP2008146610A JP2006336428A JP2006336428A JP2008146610A JP 2008146610 A JP2008146610 A JP 2008146610A JP 2006336428 A JP2006336428 A JP 2006336428A JP 2006336428 A JP2006336428 A JP 2006336428A JP 2008146610 A JP2008146610 A JP 2008146610A
- Authority
- JP
- Japan
- Prior art keywords
- user
- users
- server
- calculated
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 238000004891 communication Methods 0.000 claims abstract description 26
- 238000009826 distribution Methods 0.000 claims description 26
- 241000254032 Acrididae Species 0.000 claims description 16
- 238000013507 mapping Methods 0.000 claims description 6
- 230000001105 regulatory effect Effects 0.000 abstract 1
- 230000000694 effects Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 230000003287 optical effect Effects 0.000 description 8
- 230000006399 behavior Effects 0.000 description 4
- 238000005315 distribution function Methods 0.000 description 3
- 230000000875 corresponding effect Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 206010063659 Aversion Diseases 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 210000000707 wrist Anatomy 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
本発明は、ネットワーク上のユーザに対するレコメンデーションの方法、レコメンデーションサーバ及びプログラムに関する。 The present invention relates to a recommendation method, a recommendation server, and a program for users on a network.
近年、インターネットの社会への普及に伴い、Webその他のネットワーク環境において、ユーザはWebブラウザその他の技術的手段により情報を単に閲覧するだけではなく、商品を購入したり、属性の近いもの同士で情報を送受信してコミュニティを作ったり、といった現実社会における活動と同様の活動をするようになってきた。 In recent years, with the spread of the Internet to the society, in the Web and other network environments, users not only browse information by Web browsers or other technical means, but also purchase products or share information between those with similar attributes. It has come to perform activities similar to those in the real world, such as creating communities by sending and receiving.
ところで、当該Webその他のネットワーク環境においては、ユーザの情報閲覧、商品購入、コミュニティにおける情報の送受信等の活動を記録することは比較的容易である。具体的には、例えば、Web上でユーザの会員登録等を受け付けることによって、サーバが当該ユーザの基本属性を記憶したり、当該会員登録等を行ったユーザのWeb上での情報閲覧、商品購入等の活動を、サーバがログ(活動記録)として自動的に収集、記憶したり、といったことが可能である。 In the Web and other network environments, it is relatively easy to record activities such as user information browsing, product purchase, and information transmission / reception in the community. Specifically, for example, by accepting a user's member registration on the Web, the server stores the basic attributes of the user, information browsing on the Web of the user who performed the member registration, etc., product purchase The server can automatically collect and store the activity as a log (activity record).
そこで、当該Webその他のネットワーク環境において、登録された基本属性やログ(活動記録)等に基づいてユーザに興味があると考えられる商品やサービスを推薦したり(レコメンデーション)、広告を送信したり、属性が近いと思われるユーザを紹介したり(ソーシャル・ネットワーキング・サービス;SNS)、といったサービスが行われている。 Therefore, in the Web and other network environments, recommend products and services that are considered to be of interest to users based on registered basic attributes, logs (activity records), etc., and send advertisements. Introducing users who seem to have similar attributes (social networking service; SNS).
例えば、特許文献1に記載の技術によれば、Webサーバは、ユーザの購買記録に基づいて当該ユーザの興味を分析し、その分析結果に基づいて、商品推薦(レコメンデーション)を行うことができる。
For example, according to the technique described in
より具体的には、Webサーバが、全てのユーザの過去の購買記録に基づいて、人気商品を特定し、その人気商品を購入したユーザが購入した別の商品の購入頻度を集計し、これらの人気商品とその他の商品との間の購入に関する相関を分析し、以ってそれぞれの人気商品について購入頻度において相関の強いその他の商品をその特定商品を購入したユーザに推薦する。 More specifically, the Web server identifies popular products based on the past purchase records of all users, aggregates the purchase frequency of other products purchased by the user who purchased the popular products, The correlation regarding the purchase between the popular product and the other product is analyzed, and therefore, the other product having a strong correlation in the purchase frequency for each popular product is recommended to the user who has purchased the specific product.
また、例えば、非特許文献1の技術によれば、Webサーバは、ユーザの購買記録や商品の評価記録(レイティング)に基づいて、商品推薦を行うことができる。
Further, for example, according to the technique of Non-Patent
より具体的には、Webサーバは、類似商品テーブルを生成し、人気商品を購入したユーザをサンプリングして当該ユーザの購買記録や商品の評価記録(レイティング)に基づいて、当該人気商品を購入したユーザが購入或いはレイティングを行った商品に類似した商品を相関の強い商品として推薦する。
しかしながら、特許文献1及び非特許文献1に記載された発明において、レコメンデーションを行うに当たって、ユーザではなく、まず商品に着目するアプローチを採っていること、及び、人気商品を購入したユーザがあわせて購入した商品との「相関」を用いることに関していくつか課題が存在する。
However, in the inventions described in
第1の課題は、一般に相関は−1から1の間の値を取り得ると考えられているが、実際にはより限られた範囲の値しか取らない分布が多々存在している。具体的には例えば、−0.2から+0.6の値しか取らないことも考えられる。このような状況においては、例えば、「相関が+0.7の場合にユーザの属性が近いと判断する」等とした場合、相関を用いてもユーザの属性の重複度合いを判断することができない。 The first problem is generally considered that the correlation can take a value between -1 and 1, but there are many distributions that actually take a value in a more limited range. Specifically, for example, it can be considered that only a value of -0.2 to +0.6 is taken. In such a situation, for example, when “correlation is +0.7, it is determined that the user attribute is close” or the like, the degree of duplication of the user attribute cannot be determined even if the correlation is used.
第2の課題は、相関を用いる分析において、あるユーザ同士の相関が負の値を持つ場合、その値は一般には破棄されてしまうが、仮にあるユーザ同士の相関が負の大きな値を持つ場合、そのユーザ同士は明らかに依存性を持っているといえるため、相関により依存性を捉えることには限界があるといえる。 The second problem is that in the analysis using correlation, if the correlation between certain users has a negative value, that value is generally discarded, but if the correlation between certain users has a large negative value Since it can be said that the users clearly have dependencies, it can be said that there is a limit to capturing the dependencies by correlation.
第3の課題は、相関はユーザの属性を表す確率分布に関するグローバルな情報を含んでいないということである。具体的には、あるユーザ同士の属性の重複度合いが比較的大きい場合においても、相関はそれを察知できるとは限らない。即ち、あるユーザの属性の重複度合いが全く無い場合は相関はゼロであるので正しい判断を下すことができるが、逆に相関がゼロであっても属性の重なり度合いが比較的大きい場合も存在し、無相関=無関係として誤った判断を下すことになるのである。特に、相関は2次のモーメントにしか依存しないため、複数のユーザの行動特性の確率分布が与えられたとき、テールに関する情報は相関を用いた分析結果に現れないことである。例として、A及びB2人のユーザがある商品を購入する頻度を示す確率分布が当該商品の価格に対して例えばAがパワー型、Bがガウス型のテールを持つ場合、このテールの部分には決定的な違いがある。即ち、Bは高額の商品を薦めても購入する見込みは無いが、Aは商品が気に入れば購入する可能性がある。しかしながら、高次のモーメントに依存しないため、相関はこのような差異を判断する情報を与えることができない。 A third problem is that the correlation does not include global information regarding the probability distribution representing the user's attributes. Specifically, even when the degree of overlapping of attributes between certain users is relatively large, the correlation cannot always be detected. In other words, if there is no degree of attribute duplication for a user, the correlation is zero so that a correct judgment can be made, but conversely, even if the correlation is zero, the degree of attribute duplication may be relatively large. Therefore, a wrong judgment is made as uncorrelated = irrelevant. In particular, since the correlation depends only on the second-order moment, when a probability distribution of behavior characteristics of a plurality of users is given, information on the tail does not appear in the analysis result using the correlation. As an example, if the probability distribution indicating the frequency with which A and B users purchase a certain product has a tail with a power type and B with a Gauss type for the price of the product, for example, There is a decisive difference. That is, even if B recommends an expensive product, there is no prospect of purchasing it, but A may purchase if he likes the product. However, since it does not depend on higher-order moments, correlation cannot provide information for determining such differences.
第4の課題は、相関は線形の関係を表現することができるが、非線形の関係を表現することができないことである。具体的には、2つの確率変数XとYがY=aX+bの関係(線形の関係)を有している場合には、相関を用いた分析は有意義な情報を与えることができるが、これら2つの確率変数が例えばY=Sin(X)の関係(周期的に依存する関係)を有している場合(例えば、ネットワークへのアクセス数Yと時間Xとの関係がこれに当たる)、相関を用いた分析はこのような周期的に依存する関係について有意義な情報を与えることができない(つまり、XとYの依存性は高いが、相関はゼロとなる)。 The fourth problem is that the correlation can express a linear relationship but cannot express a non-linear relationship. Specifically, when two random variables X and Y have a relationship of Y = aX + b (linear relationship), analysis using correlation can provide meaningful information. For example, if two random variables have a relationship of Y = Sin (X) (a periodically dependent relationship) (for example, the relationship between the number of accesses to the network Y and the time X corresponds to this), the correlation is used. The analysis that has been performed cannot give meaningful information about such periodically dependent relationships (ie, the dependence of X and Y is high, but the correlation is zero).
さらに、相関を用いる、用いないにかかわらず、次のような課題も存在する。即ち、第5の課題は、相関を用いる、用いないにかかわらず、従来のレコメンデーションは商品基準(商品重視)となっていることがあげられる。例えば中年の男性がたまたま5歳の娘に絵本を購入したからといって、5歳向けの絵本ばかりレコメンデーションしてもその効用は小さい。むしろ、興味の似通った人の購入したものを推薦したほうが望ましい。 Furthermore, the following problems exist regardless of whether or not correlation is used. That is, the fifth problem is that, regardless of whether or not the correlation is used, the conventional recommendation is a product standard (product-oriented). For example, just because a middle-aged man happens to purchase a picture book for a five-year-old daughter, even if only a picture book for five-year-olds is recommended, the utility is small. Rather, it is better to recommend items purchased by people with similar interests.
そこで、商品重視ではなく、ユーザ重視であり、また、相関を用いることなくネットワーク上のユーザに対してレコメンデーションを行う範囲を当該ユーザ毎に調整する方法を提供することが望まれている。 Therefore, it is desired to provide a method that adjusts the range of recommendation for users on the network for each user without using correlation and using user correlation, without using correlation.
そこで、本発明は、ネットワーク上のユーザに対してレコメンデーションを行う範囲をユーザ毎に調整する方法、レコメンデーションサーバ及びプログラムを提供することを目的とする。 Then, an object of this invention is to provide the method, the recommendation server, and program which adjust the range which performs recommendation with respect to the user on a network for every user.
上述の目的を達成するために、本発明者らは研究を重ね、本発明を完成するに至った。具体的には、本発明は以下のようなものを提供する。 In order to achieve the above-mentioned object, the present inventors have conducted research and have completed the present invention. Specifically, the present invention provides the following.
(1) 通信ネットワーク(通信ネットワーク30)を介して接続可能な端末(端末20)のユーザに対してサーバ(サーバ10)がレコメンデーションを行う方法であって、
複数の前記ユーザの端末から、複数の前記ユーザの基本属性データ又はログデータを少なくとも含んで構成するユーザ特性データを、前記通信ネットワークを介して受信するステップと、
受信した前記ユーザ特性データに基づいて、複数の前記ユーザの特性を確率空間にマッピングするステップと、
マッピングした前記確率空間においてそれぞれの前記ユーザの間の球面距離を計算するステップと、
計算した前記球面距離に基づいて、複数の前記ユーザのうち、特定のユーザとその他のユーザとの間の属性の重複度合いを表す属性重複指数データを計算するステップと、
計算した前記属性重複指数データについて、前記ユーザのリスク回避度を表すパラメータに依存した非線形平均を計算することによって、前記特定のユーザに対してレコメンデーションを行うためのレコメンデーションリストを生成するステップと、
生成した前記レコメンデーションリストに基づいて、前記特定のユーザの端末にレコメンデーションを行うためのデータを送信するステップと、を含む方法。
(1) A method in which a server (server 10) makes a recommendation to a user of a terminal (terminal 20) connectable via a communication network (communication network 30),
Receiving, via the communication network, user characteristic data comprising at least a plurality of basic attribute data or log data of the plurality of users from a plurality of terminals of the users;
Mapping a plurality of user characteristics to a probability space based on the received user characteristic data;
Calculating a spherical distance between each of the users in the mapped probability space;
Calculating attribute duplication index data representing a degree of duplication of attributes between a specific user and other users among the plurality of users based on the calculated spherical distance;
Generating a recommendation list for recommending the specific user by calculating a non-linear average depending on a parameter representing the risk avoidance degree of the user for the calculated attribute duplication index data; ,
Transmitting data for making a recommendation to the terminal of the specific user based on the generated recommendation list.
本発明のこのような構成によれば、前記サーバは、複数の前記ユーザの端末から、複数の前記ユーザの基本属性データ又はログデータを少なくとも含んで構成するユーザ特性データを、前記通信ネットワークを介して受信し、受信した前記ユーザ特性データに基づいて、複数の前記ユーザの特性を確率空間にマッピングし、マッピングした前記確率空間においてそれぞれの前記ユーザの間の球面距離を計算し、計算した前記球面距離に基づいて、複数の前記ユーザのうち、特定のユーザとその他のユーザとの間の属性の重複度合いを表す属性重複指数データを計算し、計算した前記属性重複指数データについて、前記ユーザのリスク回避度を表すパラメータに依存した非線形平均を計算することによって、前記特定のユーザに対してレコメンデーションを行うためのレコメンデーションリストを生成し、生成した前記レコメンデーションリストに基づいて、前記特定のユーザの端末にレコメンデーションを行うためのデータを送信することができる、という作用を有する。 According to such a configuration of the present invention, the server transmits user characteristic data including at least a plurality of basic attribute data or log data of the plurality of users from the plurality of user terminals via the communication network. And, based on the received user characteristic data, map a plurality of user characteristics to a probability space, calculate a spherical distance between each user in the mapped probability space, and calculate the spherical surface Based on the distance, attribute duplication index data representing the degree of duplication of attributes between a specific user and other users among the plurality of users is calculated, and the risk of the user is calculated for the calculated attribute duplication index data. Recommends the specific user by calculating a non-linear average depending on the parameter representing the degree of avoidance. Generates a recommendation list for performing Shon, generated based on the recommendation list, it is possible to transmit the data for recommendation to a terminal of said particular user, such an action.
このことにより、前記サーバは、計算した前記球面距離に基づいて、前記特定のユーザとその他のユーザとの間の属性の重複度合いを表す属性重複指数データを計算し、計算した前記属性重複指数データに基づいて、前記特定の複数のユーザに対するレコメンデーションリストを生成してレコメンデーションを行うためのデータを前記特定のユーザの端末に送信することができる。 Accordingly, the server calculates attribute duplication index data representing the degree of duplication of attributes between the specific user and other users based on the calculated spherical distance, and calculates the attribute duplication index data. Based on the above, it is possible to generate a recommendation list for the specific plurality of users and transmit data for performing the recommendation to the terminal of the specific user.
その結果、前記サーバは、前記属性重複指数データを計算することによって、レコメンデーションを行うユーザ毎にパーソナライズされたレコメンデーションを行うことができる。 As a result, the server can perform the recommendation that is personalized for each user who performs the recommendation by calculating the attribute duplication index data.
ここで用いる球面距離は、ユーザの属性を表す分布に関してその重複度が大きければ大きいほど限りなくゼロに近づき、また小さければ小さいほどその最大値であるπ/2に近づく。即ち、球面距離は、0〜π/2の値を取り得、ユーザの属性の分布によって、「相関」のように、その取り得る範囲がそれ以下の範囲に限定されることがない。このように本発明の原理によれば、第1の課題を解決することができる。 As for the spherical distance used here, the greater the degree of overlap with respect to the distribution representing the attribute of the user, the closer to zero, and the smaller the distance, the closer to the maximum value of π / 2. That is, the spherical distance can take a value of 0 to π / 2, and the possible range is not limited to a range less than that, as in “correlation”, depending on the distribution of user attributes. Thus, according to the principle of the present invention, the first problem can be solved.
なお、当該球面距離の値は、インプットであるユーザ特性データの全てを反映した値であり、「相関」のように負の値が廃棄されることがない。このように本発明の原理によれば、第2の課題を解決することができる。 Note that the value of the spherical distance reflects all of the user characteristic data as input, and negative values are not discarded as in “correlation”. Thus, according to the principle of the present invention, the second problem can be solved.
また、当該球面距離は、グローバルなレベルでユーザの属性の重複度合いを表しているので、基本的にグローバルな全てのモーメントが関与しており、包括的な情報を含んでいるといえる。従って、当該球面距離は、上述の例のように、A及びB2人のユーザがある商品を購入する頻度を示す確率分布が当該商品の価格に対して例えばAがパワー型、Bがガウス型のテールを持つ場合において、「相関」が当該テールの違いを十分に表すことができないのと対照的である。このように本発明の原理によれば、第3の課題を解決することができる。 In addition, since the spherical distance represents the degree of duplication of user attributes at a global level, it can be said that basically all global moments are involved and comprehensive information is included. Therefore, as in the above example, the spherical distance is calculated based on the probability distribution indicating the frequency with which A and B two users purchase a certain product, for example, A is a power type and B is a Gaussian type. In contrast to having a tail, “correlation” cannot contrast the tails well. Thus, according to the principle of the present invention, the third problem can be solved.
更に、距離の概念においては、異なるユーザの利用特性を表す確率変数の依存性には無関係に距離が定まる。このため、依存性が線形であるか否かに関わらず、球面距離はユーザの属性の重複度合いを表現することができる。従って、当該球面距離は、「相関」のように線形の依存関係しか十分に表現することができない、という制約から解放されている。このように本発明の原理によれば、第4の課題を解決することができる。 Further, in the concept of distance, the distance is determined regardless of the dependence of random variables representing the usage characteristics of different users. For this reason, the spherical distance can express the overlapping degree of the user's attributes regardless of whether the dependency is linear or not. Therefore, the spherical distance is freed from the restriction that only a linear dependency can be expressed sufficiently as in “correlation”. Thus, according to the principle of the present invention, the fourth problem can be solved.
また、ユーザが購入や検索をした商品を用いて当該ユーザ間の距離を定めるのであるが、このような距離が一旦定まったならば、レコメンデーションに関しては(商品重視ではなく)ユーザ観点に基づいて決定するため、このような本発明の原理によれば、第5の課題を解決することができる。 In addition, the distance between the users is determined using the products purchased or searched by the user. Once such a distance is determined, the recommendation is based on the viewpoint of the user (not on the product focus). Therefore, according to such a principle of the present invention, the fifth problem can be solved.
(2)前記サーバが、前記ユーザのリスク回避度を表すパラメータの設定入力を受け付けるステップを更に含む(1)に記載の方法。 (2) The method according to (1), further including a step in which the server receives a setting input of a parameter representing the risk avoidance degree of the user.
本発明のこのような構成によれば、前記サーバが、前記ユーザのリスク回避度を表すパラメータの設定入力を受け付けることができる、という作用を有する。 According to such a configuration of the present invention, the server can receive a setting input of a parameter representing the risk avoidance degree of the user.
このことにより、前記サーバは、前記サーバは、前記前記パラメータが表すリスク回避度に応じた属性重複指数データの非線形平均を計算することによって、レコメンデーションを行うユーザ毎にパーソナライズされたレコメンデーションを行うことができる。 Accordingly, the server performs a personalized recommendation for each user who performs the recommendation by calculating a nonlinear average of the attribute duplication index data according to the risk avoidance degree represented by the parameter. be able to.
その結果、前記サーバは、特定のユーザにレコメンデーションを行う際に、前記特定のユーザとその他のユーザとの間の属性の重なり度合いを表すスケール上でレコメンデーションを行う範囲を調整することができる。 As a result, when the recommendation is made to a specific user, the server can adjust the range in which the recommendation is performed on a scale representing the degree of overlapping of attributes between the specific user and other users. .
(3) 前記球面距離を計算するステップにおいて、前記サーバは、前記球面距離としてバッタチャヤの球面距離を計算する(1)又は(2)に記載の方法。 (3) The method according to (1) or (2), wherein in the step of calculating the spherical distance, the server calculates a spherical distance of a grasshopper as the spherical distance.
本発明のこのような構成によれば、前記サーバは、前記球面距離としてバッタチャヤの球面距離を計算することができる、という作用を有する。
(4) 前記サーバは、前記バッタチャヤの球面距離を
(4) The server calculates the spherical distance of the grasshopper.
本発明のこのような構成によれば、前記サーバは、前記バッタチャヤの球面距離を
(5) 前記属性重複指数データを計算するステップにおいて、前記サーバは、前記バッタチャヤの球面距離を前記属性重複指数データとして計算する(4)に記載の方法。 (5) The method according to (4), wherein in the step of calculating the attribute duplication index data, the server calculates the spherical distance of the grasshopper as the attribute duplication index data.
本発明のこのような構成によれば、前記サーバは、前記バッタチャヤの球面距離を前記属性重複指数データとして計算することができる、という作用を有する。 According to this configuration of the present invention, the server has an effect that the spherical distance of the grasshopper can be calculated as the attribute duplication index data.
(6) 前記属性重複指数データを計算するステップにおいて、前記サーバは、前記ユーザ特性データに基づいて前記その他のユーザの行動を示す確率分布を計算し、更に前記バッタチャヤの球面距離に基づいて計算するウエイトを掛けたものを前記属性重複指数データとして計算する(4)に記載の方法。 (6) In the step of calculating the attribute duplication index data, the server calculates a probability distribution indicating the behavior of the other user based on the user characteristic data, and further calculates based on the spherical distance of the grasshopper. The method according to (4), wherein the weighted product is calculated as the attribute duplication index data.
本発明のこのような構成によれば、前記サーバは、前記ユーザ特性データに基づいて前記その他のユーザの行動を示す確率分布を計算し、更に前記バッタチャヤの球面距離に基づいて計算するウエイトを掛けたものを前記属性重複指数データとして計算することができる、という作用を有する。 According to such a configuration of the present invention, the server calculates a probability distribution indicating the behavior of the other user based on the user characteristic data, and further multiplies a weight to be calculated based on the spherical distance of the grasshopper. The data can be calculated as the attribute duplication index data.
このことにより、前記サーバは、前記特定のユーザに対してレコメンデーションを行う際に、前記その他のユーザの行動を示す確率分布に前記バッタチャヤの球面距離に基づいて計算するウエイトを掛けたものを前記属性重複指数データとして計算し、前記属性重複指数データが示す前記特定のユーザと前記その他のユーザとの間の属性の重なり度合いを表すスケール上でレコメンデーションを行う範囲を調整することができる。
(7) 前記サーバは、前記ウエイトを
前記属性重複指数データを
(7) The server receives the weight.
The attribute duplication index data
本発明のこのような構成によれば、前記サーバは、前記ウエイトを
前記属性重複指数データを
The attribute duplication index data
(8) 前記サーバが、計算した前記バッタチャヤの球面距離に基づいて、それぞれの前記ユーザを中心として、その他の全ての前記ユーザとの相対距離を計算するステップと、
計算した前記相対距離に基づいて、前記複数のユーザを前記相対距離の近い複数のグループに分類するステップと、を更に含み、
前記属性重複指数データを計算するステップにおいて、前記サーバは、前記特定のユーザと同じグループに分類された前記その他のユーザについて前記属性重複指数データを計算する(3)から(7)のいずれかに記載の方法。
(8) The server calculates relative distances from all the other users around the respective users based on the calculated spherical distance of the grasshopper;
Further classifying the plurality of users into a plurality of groups having close relative distances based on the calculated relative distances;
In the step of calculating the attribute duplication index data, the server calculates the attribute duplication index data for the other users classified into the same group as the specific user. The method described.
本発明のこのような構成によれば、前記サーバが、計算した前記バッタチャヤの球面距離に基づいて、それぞれの前記ユーザを中心として、その他の全ての前記ユーザとの相対距離を計算し、計算した前記相対距離に基づいて、前記複数のユーザを前記相対距離の近い複数のグループに分類し、前記属性重複指数データを計算するステップにおいて、前記サーバは、前記特定のユーザと同じグループに分類された前記その他のユーザについて前記属性重複指数データを計算することができる、という作用を有する。 According to such a configuration of the present invention, the server calculates and calculates relative distances from all the other users around the respective users based on the calculated spherical distance of the grasshopper. Based on the relative distance, the server is classified into the same group as the specific user in the step of classifying the plurality of users into a plurality of groups close to the relative distance and calculating the attribute duplication index data. The attribute duplication index data can be calculated for the other users.
このことにより、前記サーバは、前記特定のユーザと同じグループに分類された前記その他のユーザについて前記属性重複指数データを計算し、レコメンデーションリストを生成して前記特定のユーザの端末にレコメンデーションを行うためのデータを送信することができる。 Thus, the server calculates the attribute duplication index data for the other users classified into the same group as the specific user, generates a recommendation list, and recommends the recommendation to the terminal of the specific user. Data to do can be sent.
ここで、ユーザの特性を表す確率空間において、前記相対距離は、それぞれの前記ユーザを中心として個々に計算されるので、当該中心となるユーザにとってのそれぞれの前記その他のユーザとの間の属性の重複度合いを表現することができる。 Here, in the probability space representing the characteristics of the user, the relative distance is calculated individually around each of the users. Therefore, the attribute of the attribute between the other users for the user at the center is calculated. The degree of overlap can be expressed.
従って、前記サーバは、前記属性重複指数データを計算する際に、前記特定のユーザと同じグループに分類された、より属性の重複度合いの高い前記その他のユーザに絞って計算し、前記レコメンデーションリストを生成して前記特定のユーザの端末にレコメンデーションを行うためのデータを送信することができる。 Therefore, when calculating the attribute duplication index data, the server calculates only the other users classified into the same group as the specific user and having a higher degree of duplication of attributes, and the recommendation list. Can be transmitted to the terminal of the specific user for recommendation.
その結果、前記サーバは、前記レコメンデーションリストの精度をより高めることができる可能性がある。 As a result, the server may be able to further improve the accuracy of the recommendation list.
(9) 前記サーバは、前記相対距離を
本発明のこのような構成によれば、前記サーバは、前記相対距離を
このことにより、前記サーバは、前記特定のユーザと同じグループに分類された前記その他のユーザについて前記属性重複指数データを計算し、レコメンデーションリストを生成してレコメンデーションを行うためのデータを前記特定のユーザの端末に送信することができる。 Accordingly, the server calculates the attribute duplication index data for the other users classified into the same group as the specific user, generates a recommendation list, and specifies the data for performing the recommendation. To the user terminal.
その結果、前記サーバは、前記特定のユーザと同じグループに分類された前記その他のユーザのみに基づいてレコメンデーションを行うことができる。 As a result, the server can make recommendations based only on the other users classified into the same group as the specific user.
(10) 通信ネットワークを介して接続可能な端末のユーザに対してレコメンデーションを行うサーバであって、前記サーバは、
複数の前記ユーザの端末から、複数の前記ユーザの基本属性データ又はログデータを少なくとも含んで構成するユーザ特性データを、前記通信ネットワークを介して受信する手段と、
受信した前記ユーザ特性データに基づいて、複数の前記ユーザの特性を確率空間にマッピングする手段と、
マッピングした前記確率空間においてそれぞれの前記ユーザの間の球面距離を計算する手段と、
計算した前記球面距離に基づいて、複数の前記ユーザのうち、特定のユーザとその他のユーザとの間の属性の重複度合いを表す属性重複指数データを計算する手段と、
計算した前記属性重複指数データについて、前記ユーザのリスク回避度を表すパラメータに依存した非線形平均を計算することによって、前記特定のユーザに対してレコメンデーションを行うためのレコメンデーションリストを生成する手段と、
生成した前記レコメンデーションリストに基づいて、前記特定のユーザの端末にレコメンデーションを行うためのデータを送信する手段と、を含むサーバ。
(10) A server that makes recommendations to a user of a terminal that can be connected via a communication network,
Means for receiving, from the plurality of user terminals, user characteristic data including at least a plurality of basic attribute data or log data of the plurality of users via the communication network;
Means for mapping a plurality of user characteristics to a probability space based on the received user characteristic data;
Means for calculating a spherical distance between each of the users in the mapped probability space;
Means for calculating attribute duplication index data representing the degree of duplication of attributes between a specific user and other users among the plurality of users based on the calculated spherical distance;
A means for generating a recommendation list for making a recommendation for the specific user by calculating a non-linear average depending on a parameter representing the risk avoidance degree of the user for the calculated attribute duplication index data; ,
Means for transmitting data for making a recommendation to the terminal of the specific user based on the generated recommendation list.
本発明のこのような構成によれば、前記サーバは、複数の前記ユーザの端末から、複数の前記ユーザの基本属性データ又はログデータを少なくとも含んで構成するユーザ特性データを、前記通信ネットワークを介して受信し、受信した前記ユーザ特性データに基づいて、複数の前記ユーザの特性を確率空間にマッピングし、マッピングした前記確率空間においてそれぞれの前記ユーザの間の球面距離を計算し、計算した前記球面距離に基づいて、複数の前記ユーザのうち、特定のユーザとその他のユーザとの間の属性の重複度合いを表す属性重複指数データを計算し、計算した前記属性重複指数データについて、前記ユーザのリスク回避度を表すパラメータに依存した非線形平均を計算することによって、前記特定のユーザに対してレコメンデーションを行うためのレコメンデーションリストを生成し、生成した前記レコメンデーションリストに基づいて、前記特定のユーザの端末にレコメンデーションを行うためのデータを送信することができる、という作用を有する。 According to such a configuration of the present invention, the server transmits user characteristic data including at least a plurality of basic attribute data or log data of the plurality of users from the plurality of user terminals via the communication network. And, based on the received user characteristic data, map a plurality of user characteristics to a probability space, calculate a spherical distance between each user in the mapped probability space, and calculate the spherical surface Based on the distance, attribute duplication index data representing the degree of duplication of attributes between a specific user and other users among the plurality of users is calculated, and the risk of the user is calculated for the calculated attribute duplication index data. Recommends the specific user by calculating a non-linear average depending on the parameter representing the degree of avoidance. Generates a recommendation list for performing Shon, generated based on the recommendation list, it is possible to transmit the data for recommendation to a terminal of said particular user, such an action.
このことにより、前記サーバを運用することにより、(1)と同様の作用が期待できる。 Thus, the same operation as (1) can be expected by operating the server.
(11)通信ネットワークを介して接続可能な端末のユーザに対してサーバにレコメンデーションを行わせるプログラムであって、前記サーバに、
複数の前記ユーザの端末から、複数の前記ユーザの基本属性データ又はログデータを少なくとも含んで構成するユーザ特性データを、前記通信ネットワークを介して受信させるステップと、
受信した前記ユーザ特性データに基づいて、複数の前記ユーザの特性を確率空間にマッピングさせるステップと、
マッピングした前記確率空間においてそれぞれの前記ユーザの間の球面距離を計算させるステップと、
計算した前記球面距離に基づいて、複数の前記ユーザのうち、特定のユーザとその他のユーザとの間の属性の重複度合いを表す属性重複指数データを計算させるステップと、
計算した前記属性重複指数データについて、前記ユーザのリスク回避度を表すパラメータに依存した非線形平均を計算することによって、前記特定のユーザに対してレコメンデーションを行うためのレコメンデーションリストを生成させるステップと、
生成した前記レコメンデーションリストに基づいて、前記特定のユーザの端末にレコメンデーションを行うためのデータを送信させるステップと、を含むプログラム。
(11) A program for causing a server user to make a recommendation to a terminal user connectable via a communication network,
Receiving, from the plurality of user terminals, user characteristic data including at least a plurality of basic attribute data or log data of the plurality of users via the communication network;
Mapping a plurality of user characteristics to a probability space based on the received user characteristic data;
Calculating a spherical distance between each of the users in the mapped probability space;
Calculating attribute duplication index data representing a degree of duplication of attributes between a specific user and other users among the plurality of users based on the calculated spherical distance;
Generating a recommendation list for recommending the specific user by calculating a non-linear average depending on a parameter representing the risk avoidance degree of the user for the calculated attribute duplication index data; ,
And a step of transmitting data for making a recommendation to the terminal of the specific user based on the generated recommendation list.
本発明のこのような構成によれば、前記サーバは、
複数の前記ユーザの端末から、複数の前記ユーザの基本属性データ又はログデータを少なくとも含んで構成するユーザ特性データを、前記通信ネットワークを介して受信し、受信した前記ユーザ特性データに基づいて、複数の前記ユーザの特性を確率空間にマッピングし、マッピングした前記確率空間においてそれぞれの前記ユーザの間の球面距離を計算し、計算した前記球面距離に基づいて、複数の前記ユーザのうち、特定のユーザとその他のユーザとの間の属性の重複度合いを表す属性重複指数データを計算し、計算した前記属性重複指数データについて、前記ユーザのリスク回避度を表すパラメータに依存した非線形平均を計算することによって、前記特定のユーザに対してレコメンデーションを行うためのレコメンデーションリストを生成し、生成した前記レコメンデーションリストに基づいて、前記特定のユーザの端末にレコメンデーションを行うためのデータを送信することができる、という作用を有する。
According to such a configuration of the present invention, the server is
User characteristic data including at least the basic attribute data or log data of the plurality of users is received from the plurality of user terminals via the communication network, and a plurality of user characteristic data is received based on the received user characteristic data. The characteristics of the user are mapped to a probability space, a spherical distance between the users is calculated in the mapped probability space, and a specific user among the plurality of users is calculated based on the calculated spherical distance. By calculating attribute duplication index data representing the degree of attribute duplication between the user and other users, and calculating a non-linear average depending on a parameter representing the degree of risk aversion of the user for the calculated attribute duplication index data Recommendation list for making recommendations to the specific user Generated, generated based on the recommendation list, it is possible to transmit the data for recommendation to a terminal of said particular user, such an action.
このことにより、前記サーバを運用することにより、(1)と同様の作用が期待できる。 Thus, the same operation as (1) can be expected by operating the server.
本発明によれば、前記サーバは、前記属性重複指数データを計算することによって、レコメンデーションを行うユーザ毎にパーソナライズされたレコメンデーションリストを生成することができる。従って、前記サーバは、特定のユーザにレコメンデーションを行う際に、前記特定のユーザとその他のユーザとの間の属性の重なり度合いを表すスケール上でレコメンデーションを行う範囲を調整することができる。 According to the present invention, the server can generate a personalized recommendation list for each user who makes a recommendation by calculating the attribute duplication index data. Therefore, when making recommendations to a specific user, the server can adjust the range in which the recommendation is performed on a scale representing the degree of overlapping of attributes between the specific user and other users.
以下、本発明の実施形態について図面を参照して説明する。 Embodiments of the present invention will be described below with reference to the drawings.
図1は、本発明の好適な実施形態の一例に係るシステム1の全体構成を示す図である。図2は、本発明の好適な実施形態の一例に係るサーバ10及び端末20の構成を示す図である。図3は、本発明の好適な実施形態の一例に係るサーバ10によるレコメンデーション処理を示すフローチャートである。図4は本発明の好適な実施形態の一例に係るサーバ10による3つのガウス分布の平均操作について説明するために元のガウス分布を示す図である。図5は、本発明の好適な実施形態の一例に係るサーバ10による図4の3つのガウス分布に対するαの値が非常に大きい場合(悲観的)の平均と非常に小さい場合の平均(楽観的)と比較する図である。図6は、本発明の好適な実施形態の一例に係るサーバ10によるユーザ(利用者)a1から他のユーザ(利用者)までの距離の(非線形)平均を一般のαの関数として示した図である。図7は、本発明の好適な実施形態の一例に係るサーバ10によるユーザ(利用者)a3の球面距離の非線形平均Θ3(α)及び(Θ31,Θ32,Θ34)を比較して示す図である。
FIG. 1 is a diagram showing an overall configuration of a
[システムの全体構成] [System overall configuration]
図1は、本発明の好適な実施形態の一例に係るシステム1の全体構成を示す図である。
FIG. 1 is a diagram showing an overall configuration of a
サーバ10は、通信ネットワーク30を介して、ユーザの端末20と接続可能である。
The
サーバ10と端末20の接続の形態としては、有線でも無線でもよい。
The connection form between the
[サーバ10のハードウェア構成] [Hardware Configuration of Server 10]
図2は、図1で説明した本発明の好適な実施形態の一例に係るサーバ10のハードウェア構成の一例を示す図である。サーバ10は、制御部101を構成するCPU(Central Processing Unit)1010(マルチプロセッサ構成ではCPU1012等複数のCPUが追加されてもよい)、バスライン1005、通信I/F1040、メインメモリ1050、BIOS(Basic Input Output System)1060、USBポート1090、I/Oコントローラ1070、並びにキーボード及びマウス1100等の入力手段や表示装置1022を備える。
FIG. 2 is a diagram illustrating an example of a hardware configuration of the
I/Oコントローラ1070には、テープドライブ1072、ハードディスク1074、光ディスクドライブ1076、半導体メモリ1078、等の記憶手段を接続することができる。
Storage means such as a
BIOS1060は、サーバ10の起動時にCPU1010が実行するブートプログラムや、サーバ10のハードウェアに依存するプログラム等を格納する。
The
記憶部107を構成するハードディスク1074は、サーバ10がサーバとして機能するための各種プログラム及び本発明の機能を実行するプログラムを記憶しており、更に必要に応じて各種データベースを構成可能である。
The
光ディスクドライブ1076としては、例えば、DVD−ROMドライブ、CD−ROMドライブ、DVD−RAMドライブ、CD−RAMドライブを使用することができる。この場合は各ドライブに対応した光ディスク1077を使用する。光ディスク1077から光ディスクドライブ1076によりプログラム又はデータを読み取り、I/Oコントローラ1070を介してメインメモリ1050又はハードディスク1074に提供することもできる。また、同様にテープドライブ1072に対応したテープメディア1071を主としてバックアップのために使用することもできる。
As the
サーバ10に提供されるプログラムは、ハードディスク1074、光ディスク1077、又はメモリーカード等の記録媒体に格納されて提供される。このプログラムは、I/Oコントローラ1070を介して、記録媒体から読み出され、又は通信I/F1040を介してダウンロードされることによって、サーバ10にインストールされ実行されてもよい。
The program provided to the
前述のプログラムは、内部又は外部の記憶媒体に格納されてもよい。ここで、記憶部107を構成する記憶媒体としては、ハードディスク1074、光ディスク1077、又はメモリーカードの他に、MD等の光磁気記録媒体、テープ媒体を用いることができる。また、専用通信回線やインターネットに接続されたサーバシステムに設けたハードディスク1074又は光ディスクライブラリー等の記憶装置を記録媒体として使用し、通信回線を介してプログラムをサーバ10に提供してもよい。
The aforementioned program may be stored in an internal or external storage medium. Here, as a storage medium constituting the
ここで、表示装置1022は、ユーザにデータの入力を受け付ける画面を表示したり、サーバ10による演算処理結果の画面を表示したりするものであり、ブラウン管表示装置(CRT)、液晶表示装置(LCD)等のディスプレイ装置を含む。
Here, the
ここで、入力手段は、ユーザによる入力の受け付けを行うものであり、キーボード及びマウス1100等により構成してよい。
Here, the input means accepts input by the user, and may be configured by a keyboard, a
また、通信I/F1040は、サーバ10を専用ネットワーク又は公共ネットワークを介して端末と接続できるようにするためのネットワーク・アダプタである。通信I/F1040は、モデム、ケーブル・モデム及びイーサネット(登録商標)・アダプタを含んでよい。
The communication I /
以上の例は、サーバ10について主に説明したが、コンピュータに、プログラムをインストールして、そのコンピュータをサーバ装置として動作させることにより上記で説明した機能を実現することもできる。したがって、本発明において一実施形態として説明したサーバにより実現される機能は、上述の方法を当該コンピュータにより実行することにより、或いは、上述のプログラムを当該コンピュータに導入して実行することによっても実現可能である。
[ユーザの端末20のハードウェア構成]
In the above example, the
[Hardware Configuration of User's Terminal 20]
ここでユーザの端末20は、上述のサーバ10と同様の構成を備えてよい。
[レコメンデーション処理]
Here, the
[Recommendation process]
サーバ10は、図3に示すようにレコメンデーション処理を行う。
The
まず、制御部101は、通信ネットワーク30を介して複数のユーザの端末20から前記複数のユーザの基本属性データ又はログデータを少なくとも含んで構成するユーザ特性データを受信して記憶する(ステップS101)。
First, the
具体的には、例えば、前記ユーザの性別、年齢、職業、興味のある分野等を含む基本属性データ又は、商品・サービスの購入履歴、商品・サービスに対する評価記録(レイティング)等のデータを受け付ける。 Specifically, for example, basic attribute data including the user's gender, age, occupation, field of interest, or the like, data such as purchase history of products / services, evaluation records (ratings) for the products / services, and the like are received.
次に、制御部101は、受信した前記ユーザ特性データに基づいて、複数の前記ユーザの特性を確率空間にマッピングする(ステップS102)。
Next, the
次に、制御部101は、受信した前記ユーザ特性データに基づいて、前記複数のユーザの特性を含む確率空間においてそれぞれの前記ユーザ間のバッタチャヤの球面距離を計算する(ステップS103)。
Next, based on the received user characteristic data, the
次に、制御部101は、複数の前記ユーザのうち、特定のユーザとその他のユーザとの間の属性の重複度合いを表す属性重複指数データを計算する(ステップS104)。
Next, the
次に、制御部101は、計算した前記属性重複指数データについて、非線形平均を計算する(ステップS105)。
Next, the
次に、制御部101は、計算した前記属性重複指数データの非線形平均に基づいて、前記特定のユーザに対してレコメンデーションを行うためのレコメンデーションリストを生成する(ステップS106)。
Next, the
ここで、非線形平均(α混合平均)について説明する。 Here, the nonlinear average (α mixed average) will be described.
α混合平均を用いて確率分布の非線形平均をとることに関して、変数αが極端に大きい、又は小さい値をとることによる効果を把握するために次の例を考える。ここでは3つのガウス分布に対する平均操作を行う。具体的に元となる分布が図4のように与えられていたとする。そこでこれら3つの分布の線形平均(図の実線)を、αの値が非常に大きい場合(悲観的=図の点線)の平均と非常に小さい場合の平均(楽観的=図の一点鎖線)と比較すると図5が得られる。 The following example is considered in order to grasp the effect of taking the value of the variable α being extremely large or small with respect to taking the nonlinear average of the probability distribution using the α mixed average. Here, an average operation is performed on three Gaussian distributions. Assume that the original distribution is given as shown in FIG. Therefore, the linear average of these three distributions (solid line in the figure) is the average when the value of α is very large (pessimistic = dotted line in the figure) and the average when it is very small (optimistic = dashed line in the figure). In comparison, FIG. 5 is obtained.
そこで次の状況を考えてみる。仮に、これら3分布の平均が全てのxに対して所与の臨界値を超えない場合にのみ何かの商品(又は薬剤)の推薦を行うとした状況である。仮にこの臨界値が0.24であった(図の二点鎖線)場合、この例においては、αの値が非常に大きい、つまりリスク回避度がとても大きい値をとる場合、xの値が区間[0,1]の周辺値をとるときに、確率値が臨界値0.24を超過しているため、推薦する可能性が却下されることが伺える。逆にリスク回避度(つまりαの値)がさほど大きくなければ全てのxに対して確率値が臨界値0.24を超過しないため、推薦(レコメンド)する可能性が採用されることとなる。 Therefore, consider the following situation. Temporarily, a product (or drug) is recommended only when the average of these three distributions does not exceed a given critical value for all x. If this critical value is 0.24 (two-dot chain line in the figure), in this example, if the value of α is very large, that is, the risk avoidance level is very large, the value of x is the interval. When taking the peripheral value of [0, 1], the probability value exceeds the critical value 0.24, so it can be seen that the possibility of recommendation is rejected. On the other hand, if the risk avoidance degree (that is, the value of α) is not so large, the probability value does not exceed the critical value 0.24 for all x, so the possibility of recommendation (recommendation) is adopted.
次に、制御部101は、生成した前記レコメンデーションリストに基づいて、前記特定のユーザの端末にレコメンデーションを行うためのデータを送信する(ステップS107)。
Next, based on the generated recommendation list, the
ここで、上述のレコメンデーション処理を具体的な例を用いて説明する。
[実施例1]
バッタチャヤの球面距離Θの非線形平均に基づいたレコメンデーションの例
Here, the above-described recommendation process will be described using a specific example.
[Example 1]
Example of a recommendation based on a non-linear average of the Battachaya spherical distance Θ
ここでは、ユーザ間の距離Θの非線形平均操作に基づいたユーザに対するレコメンデーションリスト(推薦リスト)を作成する例を考える。 Here, consider an example of creating a recommendation list (recommendation list) for users based on a nonlinear average operation of the distance Θ between users.
そこで顧客数も分類数も共に4であった場合を想定する。そしてユーザ属性を表す分布関数ρn(k)が以下のように与えられたとする。
そこでΘの非線形平均Θn(α)は
そこでユーザ(利用者)a3に着目してΘ3(α)を求め、これを(Θ31,Θ32,Θ34)と比較したものを図7に示す。図7において、Θ3(α)は実線、Θ31は一点鎖線、Θ32は点線、Θ34は二点鎖線で示す。 FIG. 7 shows the result of obtaining Θ 3 (α) by paying attention to the user (user) a 3 and comparing it with (Θ 31 , Θ 32 , Θ 34 ). In FIG. 7, Θ 3 (α) is indicated by a solid line, Θ 31 is indicated by a one-dot chain line, Θ 32 is indicated by a dotted line, and Θ 34 is indicated by a two-dot chain line.
この例ではリスク回避度合を表す変数αをアルゴリズムの利用者(例えば、レコメンデーションサービス提供業者)が適当に選ぶ必要がある。仮に比較的非保守的な値α=−5が選ばれた場合、
[実施例2]
球面距離の非線形平均に基づいてユーザ(利用者)が自らレコメンデーションリスト(推薦リスト)の類似性度合いを調整して推薦を受ける例
In this example, it is necessary for an algorithm user (for example, a recommendation service provider) to appropriately select a variable α representing the degree of risk avoidance. If a relatively non-conservative value α = −5 is chosen,
[Example 2]
An example in which a user (user) receives a recommendation by adjusting the degree of similarity of a recommendation list (recommendation list) based on a nonlinear average of spherical distances
非線形平均(α混合平均)の考えを用いて、ユーザ(利用者)が自らレコメンデーションリスト(推薦リスト)の類似性度合いを調整して推薦を受けるシステムに対する応用を考える。つまり、非常に保守的なユーザ(利用者)は、スライドパラメータの値を0にとることによって最も属性(趣味)の重複度が大きい他のユーザ(利用者)が購入した商品のレコメンデーション(推薦)を受け、或いはチャレンジ意欲の大きいユーザ(利用者)はスライドパラメータの値を1に近くとることによって、かなり属性(興味)の異なるユーザ(利用者)のリストよりレコメンデーション(推薦)を受けるというシステムを考える。 Using the idea of nonlinear average (α-mixed average), consider an application to a system in which a user (user) adjusts the similarity degree of a recommendation list (recommendation list) and receives a recommendation. In other words, highly conservative users (users) recommend (recommend) products purchased by other users (users) who have the highest degree of duplication of attributes (hobbies) by setting the slide parameter value to 0. ) Or a user (user) who has a strong willingness to take a challenge, recommends a recommendation (recommendation) from a list of users (users) with significantly different attributes (interests) by setting the slide parameter value close to 1. Think of a system.
具体的に各ユーザ(利用者)は0から1の間の値をとる変数tを指定する。この変数に基づいて、非線形平均(α混合平均)のパラメータαの値を
ここで、ユーザ(利用者)間の属性(興味)の重複度に関しては、一般的な商品やサービスに関しての購入数又は検索数によって得られた各ユーザ(利用者)のヒストグラムに基づいて得られる確率分布に対する重複度(=球面距離)Θmnによって与える。 Here, the degree of duplication of attributes (interests) between users (users) is obtained based on the histogram of each user (user) obtained by the number of purchases or searches for general products and services. The degree of overlap (= spherical distance) for the probability distribution is given by Θmn.
そこでn番目のユーザ(利用者)が何らかのtnを選んだとき、このユーザ(利用者)に対するαnが上述の式によって定まる。このαnに基づいて、
次に、上述の概念を理解するための具体例としてユーザ(利用者)が全体で8名であった場合を想定する。そしてユーザ(利用者)a1に注目し、このユーザ(利用者)から測った他のユーザ(利用者)までの距離が
図6にはユーザ(利用者)a1から他のユーザ(利用者)までの距離の値もそれぞれ示し(a2〜a8)、またその線形平均値も示した。ところで、ユーザ(利用者)a1はt=0.3と選んだので、この選択に従って得られる距離の平均値(つまりa1さんにとっての臨界値)を求めると、これは約0.77と与えられる。このため、この臨界値に最も近い利用者とはa3に他ならない。 FIG. 6 also shows values of distances from the user (user) a 1 to other users (users) (a 2 to a 8 ), and their linear average values. By the way, since the user (user) a 1 has selected t = 0.3, the average value of distances obtained according to this selection (that is, the critical value for Mr. a 1 ) is about 0.77. Given. Therefore, nothing but a a 3 is the closest user to this critical value.
具体的なレコメンデーションリスト(推薦リスト)は、以下の二通りに従って製作可能となる。
(1)臨界値以内のユーザ(利用者)のリストを用いる。臨界値を超えない範囲内の利用者はa2及びa3であるので、これら二名のリストにおいてa1がまだ購入を行っていない商品を、a2及びa3を合わせた頻度に従ってレコメンド(推薦)する。
(2)臨界値に最も近いユーザ(利用者)のリストを用いる。既に述べた通り、臨界値に最も近いユーザ(利用者)とはa3であるため、a1がまだ購入を行っていない商品をa3の商品リストより、その頻度に従ってレコメンド(推薦)する。
[実施例3]
バッタチャヤの球面距離Θを用いた非線形平均に基づいたレコメンデーションの例
A specific recommendation list (recommendation list) can be produced according to the following two methods.
(1) A list of users (users) within a critical value is used. Since the users within the range not exceeding the critical value are a 2 and a 3 , the products that a 1 has not yet purchased in the list of these two persons are recommended (recommended according to the frequency of a 2 and a 3 combined) )
(2) Use a list of users (users) closest to the critical value. As already mentioned, for the nearest user to the critical value (user) is a 3, from the commodity list of the products that a 1 has not yet made a purchase a3, the recommendation (recommendation) in accordance with the frequency.
[Example 3]
Example of recommendation based on nonlinear average using Battachaya's spherical distance Θ
ここでは、ユーザ間の距離Θを用いた非線形平均操作を加えることによってユーザに対するレコメンデーションリスト(推薦リスト)を作成する例を、「本のレコメンデーション」という具体的を用いて示す。 Here, an example of creating a recommendation list (recommendation list) for users by adding a non-linear average operation using the distance Θ between users will be described using a specific “book recommendation”.
まずは、この例における入力項目を設定する。本の総数はLによって与える。現実の書籍数は非常に多いので、ポピュラー小説、医学専門書、歴史もの、等といった具合に種類(カテゴリー)別に分類する必要がある。この分類項目数をMとおく。これらの分類項目にi=1からi=Mまで、番号をつける。そしてi番目の分類はbiと呼称をつける。さて、顧客(ユーザ)の数は全てでN人いたとする。これらに関しても
次に顧客(ユーザ)an氏が購入したbk類の書籍の数は、Cn(k)によって与える。同様に顧客(ユーザ)an氏が検索したbk類の書籍の数をDn(k)によって与える。更に顧客(ユーザ)an氏が購入した書籍の総数を
次に購入項目と検索項目に対する「相対比」をζ:1−ζによって与える。変数
以上の定義が与えられたとき、顧客(ユーザ)an氏に対する、異なる分野の書籍に関する確率分布を以下の式によって与える。
顧客(ユーザ)an及びam間の球面距離は上述の通り
更に重み関数μn(m)をまた上述のように
そして、顧客(ユーザ)anを中心とした観点から、趣味の重複が大きい順に本の分類の分布に関する情報を、α混合平均を用いて統合する。具体的にこれは
最適であると思われる推薦リストとは、何かしらの選ばれたαに対して、Pn α(k)なる確率に従って推薦する本の分類を選ぶことである(顧客(ユーザ)anが既に購入した書籍はそこから排除することは明らかであろう)。 The recommendation list that seems to be optimal, against α was some sort of chosen, is to choose a book classification of that recommendation in accordance with the P n α (k) becomes the probability (the customer (user) a n is already purchase It will be obvious that the book will be excluded from it).
そこで顧客数も商品分類数も共に4であった場合を想定する。そしてユーザ属性を表す分布関数ρn(k)が(実施例1と同様に)以下のように与えられたとする。
同様に比重を与える関数μn(m)を計算すると以下のような結果となる。
これらを用いて、顧客(ユーザ)a3に対する推薦リストを作成するのに必要な分布P3 21(k)を、αの値を21として求めた結果
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限るものではない。また、本発明の実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本発明の実施例に記載されたものに限定されるものではない。 As mentioned above, although embodiment of this invention was described, this invention is not restricted to embodiment mentioned above. The effects described in the embodiments of the present invention are only the most preferable effects resulting from the present invention, and the effects of the present invention are limited to those described in the embodiments of the present invention. is not.
1 システム
10 サーバ
20 端末
30 通信ネットワーク
1
Claims (11)
複数の前記ユーザの端末から、複数の前記ユーザの基本属性データ又はログデータを少なくとも含んで構成するユーザ特性データを、前記通信ネットワークを介して受信するステップと、
受信した前記ユーザ特性データに基づいて、複数の前記ユーザの特性を確率空間にマッピングするステップと、
マッピングした前記確率空間においてそれぞれの前記ユーザの間の球面距離を計算するステップと、
計算した前記球面距離に基づいて、複数の前記ユーザのうち、特定のユーザとその他のユーザとの間の属性の重複度合いを表す属性重複指数データを計算するステップと、
計算した前記属性重複指数データについて、前記ユーザのリスク回避度を表すパラメータに依存した非線形平均を計算することによって、前記特定のユーザに対してレコメンデーションを行うためのレコメンデーションリストを生成するステップと、
生成した前記レコメンデーションリストに基づいて、前記特定のユーザの端末にレコメンデーションを行うためのデータを送信するステップと、を含む方法。 A method in which a server makes recommendations to a user of a terminal that can be connected via a communication network,
Receiving, via the communication network, user characteristic data comprising at least a plurality of basic attribute data or log data of the plurality of users from a plurality of terminals of the users;
Mapping a plurality of user characteristics to a probability space based on the received user characteristic data;
Calculating a spherical distance between each of the users in the mapped probability space;
Calculating attribute duplication index data representing a degree of duplication of attributes between a specific user and other users among the plurality of users based on the calculated spherical distance;
Generating a recommendation list for recommending the specific user by calculating a non-linear average depending on a parameter representing the risk avoidance degree of the user for the calculated attribute duplication index data; ,
Transmitting data for making a recommendation to the terminal of the specific user based on the generated recommendation list.
前記属性重複指数データを
The attribute duplication index data
計算した前記相対距離に基づいて、前記複数のユーザを前記相対距離の近い複数のグループに分類するステップと、を更に含み、
前記属性重複指数データを計算するステップにおいて、前記サーバは、前記特定のユーザと同じグループに分類された前記その他のユーザについて前記属性重複指数データを計算する請求項3から請求項7のいずれかに記載の方法。 The server calculates a relative distance from all the other users centered on each of the users based on the calculated spherical distance of the grasshopper;
Further classifying the plurality of users into a plurality of groups having close relative distances based on the calculated relative distances;
The said server calculates the attribute duplication index data about the said other user classified into the same group as the said specific user in the step which calculates the said attribute duplication index data. The method described.
複数の前記ユーザの端末から、複数の前記ユーザの基本属性データ又はログデータを少なくとも含んで構成するユーザ特性データを、前記通信ネットワークを介して受信する手段と、
受信した前記ユーザ特性データに基づいて、複数の前記ユーザの特性を確率空間にマッピングする手段と、
マッピングした前記確率空間においてそれぞれの前記ユーザの間の球面距離を計算する手段と、
計算した前記球面距離に基づいて、複数の前記ユーザのうち、特定のユーザとその他のユーザとの間の属性の重複度合いを表す属性重複指数データを計算する手段と、
計算した前記属性重複指数データについて、前記ユーザのリスク回避度を表すパラメータに依存した非線形平均を計算することによって、前記特定のユーザに対してレコメンデーションを行うためのレコメンデーションリストを生成する手段と、
生成した前記レコメンデーションリストに基づいて、前記特定のユーザの端末にレコメンデーションを行うためのデータを送信する手段と、を含むサーバ。 A server that makes recommendations to a user of a terminal that can be connected via a communication network, the server comprising:
Means for receiving, from the plurality of user terminals, user characteristic data including at least a plurality of basic attribute data or log data of the plurality of users via the communication network;
Means for mapping a plurality of user characteristics to a probability space based on the received user characteristic data;
Means for calculating a spherical distance between each of the users in the mapped probability space;
Means for calculating attribute duplication index data representing the degree of duplication of attributes between a specific user and other users among the plurality of users based on the calculated spherical distance;
A means for generating a recommendation list for making a recommendation for the specific user by calculating a non-linear average depending on a parameter representing the risk avoidance degree of the user for the calculated attribute duplication index data; ,
Means for transmitting data for making a recommendation to the terminal of the specific user based on the generated recommendation list.
複数の前記ユーザの端末から、複数の前記ユーザの基本属性データ又はログデータを少なくとも含んで構成するユーザ特性データを、前記通信ネットワークを介して受信させるステップと、
受信した前記ユーザ特性データに基づいて、複数の前記ユーザの特性を確率空間にマッピングさせるステップと、
マッピングした前記確率空間においてそれぞれの前記ユーザの間の球面距離を計算させるステップと、
計算した前記球面距離に基づいて、複数の前記ユーザのうち、特定のユーザとその他のユーザとの間の属性の重複度合いを表す属性重複指数データを計算させるステップと、
計算した前記属性重複指数データについて、前記ユーザのリスク回避度を表すパラメータに依存した非線形平均を計算することによって、前記特定のユーザに対してレコメンデーションを行うためのレコメンデーションリストを生成させるステップと、
生成した前記レコメンデーションリストに基づいて、前記特定のユーザの端末にレコメンデーションを行うためのデータを送信させるステップと、を含むプログラム。
A program that allows a server user to make a recommendation to a user of a terminal that can be connected via a communication network,
Receiving, from the plurality of user terminals, user characteristic data including at least a plurality of basic attribute data or log data of the plurality of users via the communication network;
Mapping a plurality of user characteristics to a probability space based on the received user characteristic data;
Calculating a spherical distance between each of the users in the mapped probability space;
Calculating attribute duplication index data representing a degree of duplication of attributes between a specific user and other users among the plurality of users based on the calculated spherical distance;
Generating a recommendation list for recommending the specific user by calculating a non-linear average depending on a parameter representing the risk avoidance degree of the user for the calculated attribute duplication index data; ,
And a step of transmitting data for making a recommendation to the terminal of the specific user based on the generated recommendation list.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006336428A JP4962950B2 (en) | 2006-12-13 | 2006-12-13 | Recommendation method, recommendation server and program for users on network |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006336428A JP4962950B2 (en) | 2006-12-13 | 2006-12-13 | Recommendation method, recommendation server and program for users on network |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008146610A true JP2008146610A (en) | 2008-06-26 |
JP4962950B2 JP4962950B2 (en) | 2012-06-27 |
Family
ID=39606668
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006336428A Active JP4962950B2 (en) | 2006-12-13 | 2006-12-13 | Recommendation method, recommendation server and program for users on network |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4962950B2 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009123192A (en) * | 2007-10-22 | 2009-06-04 | Yahoo Japan Corp | System and method for user recommendation, system and method for outputting merchandise information, and program |
JP2011232836A (en) * | 2010-04-26 | 2011-11-17 | Yahoo Japan Corp | Device, method, and program for sns merchandise recommendation |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11061937B2 (en) * | 2018-09-27 | 2021-07-13 | Salesforce.Com, Inc. | Method and system for classifying user identifiers into similar segments |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004303149A (en) * | 2003-04-01 | 2004-10-28 | National Institute Of Information & Communication Technology | Recommendation device and recommendation program |
JP2004326227A (en) * | 2003-04-22 | 2004-11-18 | Matsushita Electric Ind Co Ltd | Information providing method, information providing system, its program, and program storage medium |
JP2006302097A (en) * | 2005-04-22 | 2006-11-02 | Matsushita Electric Ind Co Ltd | Cooperative filter device |
-
2006
- 2006-12-13 JP JP2006336428A patent/JP4962950B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004303149A (en) * | 2003-04-01 | 2004-10-28 | National Institute Of Information & Communication Technology | Recommendation device and recommendation program |
JP2004326227A (en) * | 2003-04-22 | 2004-11-18 | Matsushita Electric Ind Co Ltd | Information providing method, information providing system, its program, and program storage medium |
JP2006302097A (en) * | 2005-04-22 | 2006-11-02 | Matsushita Electric Ind Co Ltd | Cooperative filter device |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009123192A (en) * | 2007-10-22 | 2009-06-04 | Yahoo Japan Corp | System and method for user recommendation, system and method for outputting merchandise information, and program |
JP2011232836A (en) * | 2010-04-26 | 2011-11-17 | Yahoo Japan Corp | Device, method, and program for sns merchandise recommendation |
Also Published As
Publication number | Publication date |
---|---|
JP4962950B2 (en) | 2012-06-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220292220A1 (en) | System & Method for Recommending Alternative Service Providers | |
US10769702B2 (en) | Recommendations based upon explicit user similarity | |
Jannach et al. | Leveraging multi-criteria customer feedback for satisfaction analysis and improved recommendations | |
Brengman et al. | Segmenting Internet shoppers based on their Web-usage-related lifestyle: a cross-cultural validation | |
US8972275B2 (en) | Optimization of social media engagement | |
US8250008B1 (en) | Decision tree refinement | |
US11568334B2 (en) | Adaptive workflow definition of crowd sourced tasks and quality control mechanisms for multiple business applications | |
TWI549079B (en) | System and method for directing content to users of a social networking engine | |
US8732015B1 (en) | Social media pricing engine | |
CN109417644B (en) | Revenue optimization for cross-screen advertising | |
CN107808314B (en) | User recommendation method and device | |
Sukrat et al. | An architectural framework for developing a recommendation system to enhance vendors’ capability in C2C social commerce | |
CN107808346B (en) | Evaluation method and evaluation device for potential target object | |
JP2017054214A (en) | Determination device, learning device, information distribution device, determination method, and determination program | |
Pranata et al. | Are the most popular users always trustworthy? The case of Yelp | |
US20170255997A1 (en) | Social Investing Software Platform | |
Hsieh | SoLoMo technology: exploring the most critical determinants of SoLoMo technology in the contemporary mobile communication technology era | |
Bulchand-Gidumal et al. | Fighting fake reviews with blockchain-enabled consumer-generated reviews | |
JP6917348B2 (en) | Providing equipment, providing method, and providing program | |
Chouaki et al. | Exploring the online micro-targeting practices of small, medium, and large businesses | |
Xinchang et al. | Movie recommendation algorithm using social network analysis to alleviate cold-start problem | |
JP4962950B2 (en) | Recommendation method, recommendation server and program for users on network | |
Müllner et al. | Towards employing recommender systems for supporting data and algorithm sharing | |
CN113158032B (en) | Information pushing method and device | |
JP6664580B2 (en) | Calculation device, calculation method and calculation program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20091208 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120306 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20120312 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120319 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4962950 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150406 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |