JP6100677B2 - Information recommendation device, information recommendation method, and information recommendation program - Google Patents

Information recommendation device, information recommendation method, and information recommendation program Download PDF

Info

Publication number
JP6100677B2
JP6100677B2 JP2013238557A JP2013238557A JP6100677B2 JP 6100677 B2 JP6100677 B2 JP 6100677B2 JP 2013238557 A JP2013238557 A JP 2013238557A JP 2013238557 A JP2013238557 A JP 2013238557A JP 6100677 B2 JP6100677 B2 JP 6100677B2
Authority
JP
Japan
Prior art keywords
domain
transition
information recommendation
access history
combination weight
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013238557A
Other languages
Japanese (ja)
Other versions
JP2015099463A (en
Inventor
佳林 前橋
佳林 前橋
恭太 堤田
恭太 堤田
浩之 戸田
浩之 戸田
丈二 中山
丈二 中山
知之 兼清
知之 兼清
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2013238557A priority Critical patent/JP6100677B2/en
Publication of JP2015099463A publication Critical patent/JP2015099463A/en
Application granted granted Critical
Publication of JP6100677B2 publication Critical patent/JP6100677B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、情報推薦において、複数のサービス、ジャンル、ドメイン(以下、「ドメイン」)のコンテンツやアイテム(以下、「アイテム」)を推薦する情報推薦装置、情報推薦方法、および情報推薦プログラムに関する。   The present invention relates to an information recommendation device, an information recommendation method, and an information recommendation program for recommending contents and items (hereinafter referred to as “items”) of a plurality of services, genres, and domains (hereinafter referred to as “domains”) in information recommendation.

異なるサービスのカテゴリなど、複数のドメインを対象としてアイテムの推薦を可能にするために、ユーザ、Webページなどのアイテム、アイテムの属性を表すメタデータをノードとするグラフを構築し、グラフマイニングの手法を適用する事により、特にユーザのアイテム利用履歴が存在しない状況や少量で推薦精度が低下しやすい状況において、より高精度な情報推薦を実現する方法がある(例えば、特許文献1参照)。また、同様の方法で、ポータルサイトの利用履歴等、複数のサービスドメインに共通するユーザの利用履歴を用いる方法もある(例えば、非特許文献1参照)。   Graph mining method by constructing a graph with metadata representing the item and item attributes such as users and web pages as nodes in order to make it possible to recommend items for multiple domains such as different service categories In particular, there is a method for realizing highly accurate information recommendation in a situation where the item usage history of the user does not exist or in a situation where the recommendation accuracy is likely to decrease with a small amount (see, for example, Patent Document 1). Also, there is a method of using a user usage history common to a plurality of service domains, such as a portal site usage history, in a similar manner (see, for example, Non-Patent Document 1).

特開2012-150561号公報JP 2012-150561 A

堤田恭太、中辻真、内山俊郎、戸田浩之、内山匡、「アクセスログを用いたクロスドメイン環境における情報推薦」、第154回DBS・第107回IFAT合同研究発表会、2012年8月Junta Tsutsuda, Makoto Nakatsuji, Toshiro Uchiyama, Hiroyuki Toda, Kei Uchiyama, “Recommendation of Information in a Cross-Domain Environment Using Access Logs”, 154th DBS / 107th IFAT Joint Research Presentation, August 2012

上記文献で、グラフマイニングとして利用されている手法は、Random Walk with Restarts (Personalized PageRankとも呼ばれる、以下「RWR」) という計算手法である。これは、ノード間の関連度の計算手法として注目を集めているもののひとつである。RWRは、今までグラフ理論でよく用いられてきたノード間の最短距離などと異なり、グラフ全体の構造的な特徴に基づいて関連度が計算できる。   In the above document, the method used for graph mining is a calculation method called Random Walk with Restarts (also called “Personalized PageRank”, hereinafter “RWR”). This is one of the methods that are attracting attention as a method for calculating the degree of association between nodes. Unlike the shortest distance between nodes, which has been often used in graph theory, RWR can calculate relevance based on the structural features of the entire graph.

RWRでは、グラフ上の各ノードを遷移するwalkerを仮定し、最終的にwalkerがどのノードに存在しやすいかを表す存在確率を算出し、それを関連度スコアとして利用する。初期状態として、関連度を測る基準とするユーザやアイテムに対応するノードにwalkerが存在すると考える。そして、そのwalkerが、ノードとノードを結ぶエッジ重みに比例した確率でノード間を移動し、移動後一定の確率でエッジによらないランダムな移動を行うと考え、定常状態においてwalkerが各ノードに存在する確率(存在確率)を計算する。この計算の結果、得られた存在確率を、基準とするノードに対応するユーザやアイテムとの関連度として利用する。   In RWR, a walker that transitions each node on the graph is assumed, and finally, an existence probability representing which node the walker is likely to exist in is calculated and used as a relevance score. As an initial state, it is assumed that a walker exists in a node corresponding to a user or item as a reference for measuring the degree of association. Then, the walker moves between nodes with a probability proportional to the edge weight connecting the nodes, and after that, the walker moves to each node in a steady state. Calculate the probability of existence (existence probability). As a result of this calculation, the obtained existence probability is used as the degree of association with the user or item corresponding to the reference node.

具体的な計算式は、起点ノードaからの各ノードへの到達確率(関連度)を表す1×Nの列ベクトルp、N×Nの遷移行列A、被推薦ユーザを表す起点ノードのみが1である1×Nの列ベクトルq、αは0<α<1を満たす定数とすると、式1のように表される。ここでの繰り返し計算の回数は例えば30回とするが、この回数はこれに限定されず、十分に大きな値であればよい。

Figure 0006100677
A specific calculation formula is that a 1 × N column vector p representing the arrival probability (relevance) from the origin node a to each node, an N × N transition matrix A, and only the origin node representing the recommended user is 1 Assuming that 1 × N column vectors q and α are constants satisfying 0 <α <1, the following expression 1 is obtained. The number of repeated calculations here is, for example, 30. However, this number is not limited to this, and may be a sufficiently large value.
Figure 0006100677

特許文献1および非特許文献1では、起点ノードから各ノードへ遷移する確率を算出する際に、各ノードの属するドメイン(例えば、異なるサービスのカテゴリなど)が何であるかを考慮していない。しかしながら、実際の利用シーンにおいては、あるドメインAから別のドメインBに遷移するとき、遷移先ドメインの選択は、遷移元のドメインAに影響されている、すなわち、コンテキストの効果があり、ランダムではない場合もあると考えられる。例えばWebページ等を閲覧している時、ユーザは何かについて調べているなど、ある特定のトピックへの興味が高まっている状態にあると推測され、それに関連するトピックになら遷移しやすいが、無関係と思われるトピックには興味を持ちにくいと考えられるからである。しかし、特許文献1では、あるユーザの一定期間の履歴において、仮に「健康」ドメインのページをm回、「車」ドメインのページをm回と同一回数閲覧していた場合、ユーザが「ダイエット」ドメインのページを訪れた時、「健康」ドメインのページが推薦される確率も、「車」ドメインのページが推薦される確率も同等となる。   In Patent Literature 1 and Non-Patent Literature 1, when calculating the probability of transition from a starting node to each node, what domain (for example, different service category, etc.) each node belongs to is not considered. However, in the actual usage scene, when transitioning from one domain A to another domain B, the selection of the transition destination domain is affected by the transition source domain A, that is, there is a context effect, It may not be possible. For example, when browsing a web page, it is assumed that the user is interested in a certain topic, such as checking something, and it is easy to transition to a related topic, This is because it seems difficult to be interested in topics that seem unrelated. However, in Patent Document 1, in a history of a certain user for a certain period of time, if the page of the “health” domain is viewed m times and the page of the “car” domain is viewed the same number of times as m times, the user “diet” When visiting a domain page, the probability that a “healthy” domain page is recommended is equal to the probability that a “car” domain page is recommended.

上述のようにコンテキストが考慮されるべきであれば、「ダイエット」ドメインのページを閲覧している際には、「車」ドメインのページよりも、「健康」ドメインのページを提示した方が効果的であると期待される。しかしながら、特許文献1などの従来技術では、RWRの計算に用いる遷移行列の構築過程において履歴上の回数のみを用い、遷移元/遷移先ドメインの組合せ(方向)については考慮されていない。   If the context should be considered as described above, it is more effective to present the “health” domain page than the “car” domain page when browsing the “diet” domain page. Expected to be However, in the conventional technology such as Patent Document 1, only the number of times in the history is used in the process of constructing the transition matrix used for RWR calculation, and the combination (direction) of the transition source / transition destination domain is not considered.

本発明は、上記の事情に鑑みなされたもので、本発明の目的は、遷移元/遷移先ドメインの組合せを考慮し、より効果的な情報推薦を行う情報推薦装置、情報推薦方法、および情報推薦プログラムを提供することにある。   The present invention has been made in view of the above circumstances, and an object of the present invention is to provide an information recommendation device, an information recommendation method, and information for performing more effective information recommendation in consideration of a combination of transition source / transition destination domains. To provide a recommendation program.

上記の課題を解決するため、請求項1記載の本発明は、情報推薦装置であって、ユーザがアイテムにアクセスしたアクセス履歴データを格納したアクセス履歴データベースと、前記アクセス履歴データベースを用いて、ユーザとアイテムのアクセス関係を示す遷移行列を作成する遷移行列作成部と、前記アクセス履歴データベースを用いてドメイン間の遷移数を算出し、当該遷移数に基づいて前記遷移行列中のドメイン組合せ毎の部分行列に乗算するドメイン組合せ重みを算出するドメイン組合せ重み算出部と、前記ドメイン組合せ重みを用いて前記部分行列に重みづけを行う部分行列重みづけ計算部と、を有する。   In order to solve the above-mentioned problem, the present invention according to claim 1 is an information recommendation device, wherein an access history database storing access history data of access to an item by a user, and a user using the access history database A transition matrix creating unit that creates a transition matrix indicating the access relationship between items and the access history database, and calculating the number of transitions between domains based on the number of transitions, and a portion for each domain combination in the transition matrix A domain combination weight calculating unit that calculates a domain combination weight for multiplying the matrix; and a partial matrix weight calculating unit that performs weighting on the partial matrix using the domain combination weight.

請求項2記載の本発明は、前記情報推薦装置において、前記ドメイン組合せ重み算出部は、全アイテムの利用回数と遷移先ドメインのアイテムの利用回数との比を用いてドメイン組合せ重みを補正する。   According to a second aspect of the present invention, in the information recommendation device, the domain combination weight calculation unit corrects the domain combination weight using a ratio between the number of times of use of all items and the number of times of use of items in the transition destination domain.

請求項3記載の本発明は、前記情報推薦装置において、前記ドメイン組合せ重み算出部は、同一ドメイン内での遷移については、所定の係数を乗算し、異なるドメイン間での遷移より過少評価するように、ドメイン組合せ重みを補正する。   According to a third aspect of the present invention, in the information recommendation device, the domain combination weight calculation unit may multiply a transition within the same domain by a predetermined coefficient to underestimate the transition between different domains. Next, the domain combination weight is corrected.

請求項4記載の本発明は、前記情報推薦装置において、前記ドメイン組合せ重み算出部は、アクセス履歴データに含まれるHTTPリファラを用いて遷移元アイテムを特定し、当該遷移元アイテムのドメインを特定することにより、ドメイン間の遷移数を推定する。   The invention according to claim 4 is the information recommendation device, wherein the domain combination weight calculation unit specifies a transition source item using an HTTP referrer included in access history data, and specifies a domain of the transition source item. Thus, the number of transitions between domains is estimated.

請求項5記載の本発明は、前記情報推薦装置において、前記ドメイン組合せ重み算出部は、アイテム同士のリンクの有無の情報を利用して、アクセス履歴から共通のリンク元を持つ複数アイテムがあり、該当のリンク元へのアクセス履歴もある場合に、当該リンク元から複数アイテムへの遷移があると推定し、ドメイン間の遷移数を推定する。   The present invention according to claim 5 is the information recommendation device, wherein the domain combination weight calculating unit uses a plurality of items having a common link source from an access history using information on the presence / absence of a link between items, When there is also an access history to the corresponding link source, it is estimated that there is a transition from the link source to a plurality of items, and the number of transitions between domains is estimated.

請求項6記載の本発明は、情報推薦装置が行う情報推薦方法であって、前記情報推薦装置は、ユーザがアイテムにアクセスしたアクセス履歴データを格納したアクセス履歴データベースを備え、前記アクセス履歴データベースを用いて、ユーザとアイテムのアクセス関係を示す遷移行列を作成する遷移行列作成ステップと、前記アクセス履歴データベースを用いてドメイン間の遷移数を算出し、当該遷移数に基づいて前記遷移行列中のドメイン組合せ毎の部分行列に乗算するドメイン組合せ重みを算出するドメイン組合せ重み算出ステップと、前記ドメイン組合せ重みを用いて前記部分行列に重みづけを行う部分行列重みづけ計算ステップと、を行う。   The present invention according to claim 6 is an information recommendation method performed by an information recommendation device, wherein the information recommendation device includes an access history database storing access history data when a user accesses an item, and the access history database is stored in the information recommendation device. A transition matrix creating step for creating a transition matrix indicating an access relationship between a user and an item, and calculating the number of transitions between domains using the access history database, and a domain in the transition matrix based on the number of transitions A domain combination weight calculating step for calculating a domain combination weight for multiplying a partial matrix for each combination, and a submatrix weight calculating step for weighting the partial matrix using the domain combination weight are performed.

請求項7記載の本発明は、前記情報推薦方法において、前記ドメイン組合せ重み算出ステップは、全アイテムの利用回数と遷移先ドメインのアイテムの利用回数との比を用いてドメイン組合せ重みを補正する。   According to a seventh aspect of the present invention, in the information recommendation method, the domain combination weight calculating step corrects the domain combination weight using a ratio between the number of times of use of all items and the number of times of use of items in the transition destination domain.

請求項8記載の本発明は、前記情報推薦方法において、前記ドメイン組合せ重み算出ステップは、同一ドメイン内での遷移については、所定の係数を乗算し、異なるドメイン間での遷移より過少評価するように、ドメイン組合せ重みを補正する。   In the information recommendation method according to the eighth aspect of the present invention, in the information recommendation method, the domain combination weight calculating step may multiply a transition within the same domain by a predetermined coefficient to underestimate the transition between different domains. Next, the domain combination weight is corrected.

請求項9記載の本発明は、前記情報推薦方法において、前記ドメイン組合せ重み算出ステップは、アクセス履歴データに含まれるHTTPリファラを用いて遷移元アイテムを特定し、当該遷移元アイテムのドメインを特定することにより、ドメイン間の遷移数を推定する。   The present invention according to claim 9 is the information recommendation method, wherein the domain combination weight calculating step specifies a transition source item using an HTTP referrer included in access history data, and specifies a domain of the transition source item. Thus, the number of transitions between domains is estimated.

請求項10記載の本発明は、前記情報推薦方法において、前記ドメイン組合せ重み算出ステップは、アイテム同士のリンクの有無の情報を利用して、アクセス履歴から共通のリンク元を持つ複数アイテムがあり、該当のリンク元へのアクセス履歴もある場合に、当該リンク元から複数アイテムへの遷移があると推定し、ドメイン間の遷移数を推定する。   In the information recommendation method according to claim 10, in the domain combination weight calculation step, there is a plurality of items having a common link source from an access history using information on the presence / absence of a link between items, When there is also an access history to the corresponding link source, it is estimated that there is a transition from the link source to a plurality of items, and the number of transitions between domains is estimated.

請求項11記載の本発明は、上記情報推薦装置として、コンピュータを機能させるための情報推薦プログラムである。
The present invention according to claim 11 is an information recommendation program for causing a computer to function as the information recommendation device.

本発明によれば、遷移元/遷移先ドメインの組合せを考慮し、より効果的な情報推薦を行う情報推薦装置、情報推薦方法、および情報推薦プログラムを提供することができる。   According to the present invention, it is possible to provide an information recommendation device, an information recommendation method, and an information recommendation program that perform more effective information recommendation in consideration of a combination of transition source / transition destination domains.

本発明の一実施の形態における情報推薦装置の構成図である。It is a block diagram of the information recommendation apparatus in one embodiment of this invention. アクセス履歴データベースに構成されるテーブルの一例である。It is an example of the table comprised by the access history database. 情報推薦装置の全体の処理のフローチャートである。It is a flowchart of the whole process of an information recommendation apparatus. 遷移行列作成処理のフローチャートである。It is a flowchart of a transition matrix creation process. 重みづけ演算前のUI行列のイメージ図である。It is an image figure of UI matrix before weighting calculation. 重みづけ演算後のUI行列のイメージ図である。It is an image figure of UI matrix after weighting calculation. 重みづけ演算後のUI行列のイメージ図である。It is an image figure of UI matrix after weighting calculation. 被推薦ユーザIDデータのイメージである。It is an image of recommended user ID data. 推薦計算部の出力のイメージである。It is an image of the output of a recommendation calculation part. ドメイン組合せ重み算出部の処理のフローチャートである。It is a flowchart of a process of a domain combination weight calculation part. ドメイン間遷移のイメージ図である。It is an image figure of the transition between domains. ドメイン間遷移の出現数のイメージ図である。It is an image figure of the appearance number of the transition between domains. ドメイン間遷移の起点ドメイン内で占める割合を示すイメージ図である。It is an image figure which shows the ratio which occupies in the origin domain of the transition between domains.

以下、本発明の実施の形態を、図面を用いて説明する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings.

図1は、本発明の一実施の形態における情報推薦装置の構成を示す。同図に示す情報推薦装置は、アクセス履歴データベース200と、計算依頼部100と、遷移行列作成部101と、ドメイン組合せ重み算出部102と、遷移行列格納部103と、部分行列重みづけ計算部104と、推薦条件設定部105と、推薦計算部106とを備える。   FIG. 1 shows a configuration of an information recommendation device according to an embodiment of the present invention. The information recommendation apparatus shown in FIG. 1 includes an access history database 200, a calculation request unit 100, a transition matrix creation unit 101, a domain combination weight calculation unit 102, a transition matrix storage unit 103, and a submatrix weight calculation unit 104. And a recommendation condition setting unit 105 and a recommendation calculation unit 106.

アクセス履歴データベース200は、外部システムであるアクセスログ収集システム10と接続され、アクセスログ収集システム10から定期的に供給されるアクセス履歴(アクセスログ)のデータが格納される。   The access history database 200 is connected to the access log collection system 10 which is an external system, and stores access history (access log) data periodically supplied from the access log collection system 10.

計算依頼部100は、遷移行列作成部101に遷移行列を作成するよう命令を送出する。遷移行列作成部101は、アクセス履歴データベース200を用いて、ユーザとアイテムのアクセス関係を示す遷移行列を作成し、遷移行列格納部103に格納する。ドメイン組合せ重み算出部102は、アクセス履歴データベース200を用いて、ドメイン間の遷移数を算出し、当該遷移数を用いて遷移行列中のドメイン組合せ毎の部分行列に乗算するドメイン組合せ重みを決定する。   The calculation request unit 100 sends an instruction to the transition matrix creation unit 101 to create a transition matrix. The transition matrix creation unit 101 creates a transition matrix indicating the access relationship between the user and the item using the access history database 200 and stores it in the transition matrix storage unit 103. The domain combination weight calculation unit 102 uses the access history database 200 to calculate the number of transitions between domains, and uses the number of transitions to determine a domain combination weight that is multiplied by a submatrix for each domain combination in the transition matrix. .

部分行列重みづけ計算部104は、ドメイン組合せ重みを用いて部分行列に重みづけを行う。推薦条件設定部105には、外部のアクセスログ収集システム10から供給される、被推薦ユーザIDデータ201が入力される。推薦計算部106は、部分行列重みづけ計算部104が重みづけた遷移行列を用いて推薦計算を行い、推薦結果を出力する。推薦計算部106の出力は、推薦対象ユーザへの推薦アイテムのリストであり、当該リストは後段の推薦結果提示システム20に送出され、最終的にはユーザ等の端末(不図示)に表示される。   The submatrix weight calculation unit 104 weights the submatrix using domain combination weights. The recommended condition setting unit 105 receives the recommended user ID data 201 supplied from the external access log collection system 10. The recommendation calculator 106 performs a recommendation calculation using the transition matrix weighted by the submatrix weight calculator 104 and outputs a recommendation result. The output of the recommendation calculation unit 106 is a list of recommended items for the recommendation target user, and the list is sent to the recommendation result presentation system 20 in the subsequent stage and finally displayed on a terminal (not shown) such as a user. .

また、情報推薦装置は、アイテム構造データベース30に接続されていてもよい。アイテム構造データベース30には、各アイテムにどのアイテムからのリンクがあるか、という情報が格納されている。   Further, the information recommendation device may be connected to the item structure database 30. The item structure database 30 stores information as to which item each item has a link from.

なお、本実施形態では、推薦計算に用いる利用履歴に、ユーザがWebサイトのアイテムにアクセスしたアクセス履歴(アクセス履歴データベース200)を用いるものとして以下に説明するが、推薦計算に用いる利用履歴はこれに限定されるものではない。   In the present embodiment, it will be described below that an access history (access history database 200) by which a user accesses an item on a website is used as a usage history used for recommendation calculation. It is not limited to.

図2は、本実施の形態におけるアクセス履歴データベース200のテーブルのイメージ図である。図示するアクセス履歴データベース200は、ユーザIDと、アクセス時刻と、アイテムIDと、アイテムの所属するドメインのドメインIDと、アイテムのメタデータとを含むアクセス履歴データ(レコード)が記憶されるデータベースである。アクセス履歴データベース200は、図2に示すように、1つのテーブルのみで実現する場合に限定されず、適当な大きさに分割し、複数のテーブルまたはファイルから構成されていても良く、また、複数のテーブルまたはファイルは異なる計算機上にあってもよい。   FIG. 2 is an image diagram of a table of the access history database 200 in the present embodiment. The access history database 200 shown in the figure is a database in which access history data (record) including a user ID, access time, item ID, domain ID of the domain to which the item belongs, and item metadata is stored. . As shown in FIG. 2, the access history database 200 is not limited to a case where the access history database 200 is realized by only one table, and may be divided into an appropriate size and configured from a plurality of tables or files. The tables or files may be on different computers.

上記説明した情報推薦装置は、例えば、CPUと、メモリと、HDD等の外部記憶装置などを備えた汎用的なコンピュータシステムを用いることができる。このコンピュータシステムにおいて、CPUがメモリ上にロードされた情報推薦装置のプログラムを実行することにより、情報推薦装置の各機能が実現される。また、情報推薦装置用のプログラムは、ハードディスク、フレキシブルディスク、CD−ROM、MO、DVD−ROMなどのコンピュータ読取り可能な記録媒体に記憶することも、ネットワークを介して配信することもできる。なお、情報推薦装置は、複数のコンピュータから構成される情報推薦システムであってもよい。   As the information recommendation device described above, for example, a general-purpose computer system including a CPU, a memory, and an external storage device such as an HDD can be used. In this computer system, each function of the information recommendation device is realized by the CPU executing the program of the information recommendation device loaded on the memory. The program for the information recommendation apparatus can be stored in a computer-readable recording medium such as a hard disk, a flexible disk, a CD-ROM, an MO, a DVD-ROM, or can be distributed via a network. Note that the information recommendation apparatus may be an information recommendation system including a plurality of computers.

次に、本実施形態の処理について説明する。   Next, the processing of this embodiment will be described.

図3は、情報推薦装置の全体の処理の一例を示すフローチャートである。   FIG. 3 is a flowchart illustrating an example of overall processing of the information recommendation apparatus.

ステップ310)計算依頼部100が、遷移行列作成部101に、遷移行列を作成するよう命令を送出する。計算依頼部100は、例えば定刻になるとスクリプトを走らせるようなモジュールであってもよい。   Step 310) The calculation requesting unit 100 sends an instruction to the transition matrix creating unit 101 to create a transition matrix. The calculation requesting unit 100 may be a module that runs a script on time, for example.

ステップ320)遷移行列作成部101は、前記命令を受け付けると、アクセス履歴データベース200からユーザID、アイテムID、アイテムのドメインID等を含むアクセス履歴データを取得する。アクセス履歴データベース200に蓄積されたデータのイメージは、図2に示すとおりである。アクセス履歴データベース200には、時系列にどのユーザが何のアイテムにアクセスしたかが、アイテムの所属ドメイン、メタデータといった付加情報とともに蓄積されている。   Step 320) Upon receiving the command, the transition matrix creation unit 101 acquires access history data including a user ID, an item ID, an item domain ID, and the like from the access history database 200. An image of data stored in the access history database 200 is as shown in FIG. In the access history database 200, which user accessed what item in time series is stored together with additional information such as the domain of the item and metadata.

遷移行列作成部101は、アクセス履歴データベース200に蓄積されたデータを用いて、後述する推薦計算で必要となる遷移行列A’ を作成する。遷移行列A’の作成方法は、非特許文献1に記載された方法を用いるものとする。ただし、本実施形態では、部分行列ごとにドメイン組合せを考慮した重みづけ処理を行うため、非特許文献1に記載される処理のうち、部分行列ごとの正規化までを実施するものとし、全体の正規化は、部分行列の重み演算が終了した後に実施する。非特許文献1に記載される処理のうち、本実施形態の遷移行列作成部101で行われる処理の概要を、図4のフローチャートに示す。   The transition matrix creation unit 101 creates a transition matrix A ′ necessary for recommendation calculation described later, using data stored in the access history database 200. The method described in Non-Patent Document 1 is used as a method for creating the transition matrix A ′. However, in this embodiment, since the weighting process considering the domain combination is performed for each submatrix, out of the processes described in Non-Patent Document 1, the normalization for each submatrix is performed. The normalization is performed after the weight calculation of the submatrix is completed. Among the processes described in Non-Patent Document 1, the outline of the process performed by the transition matrix creating unit 101 of this embodiment is shown in the flowchart of FIG.

図4は、遷移行列作成部101が行う処理を示すフローチャートである。   FIG. 4 is a flowchart showing processing performed by the transition matrix creation unit 101.

ステップ410)遷移行列作成部101は、アクセス履歴データベース200から取得したデータの、ユーザ、アイテム、メタデータの任意の2つの組合せについて、それぞれの部分行列を作成する。例えば、ユーザ−アイテム部分行列、ユーザ−メタデータ部分行列、アイテム−メタデータ部分行列等である。ここで、本実施形態の遷移元/遷移先のドメイン組合せの重みづけが用いられるのは、主にユーザ−アイテム部分行列(以下、UI行列)と推定されるため、以後、UI行列を例にとって論じることとする。   Step 410) The transition matrix creation unit 101 creates respective partial matrices for any two combinations of user, item, and metadata of the data acquired from the access history database 200. For example, a user-item submatrix, a user-metadata submatrix, an item-metadata submatrix, etc. Here, since the weight of the domain combination of the transition source / transition destination of this embodiment is mainly used as a user-item submatrix (hereinafter referred to as a UI matrix), the UI matrix is taken as an example hereinafter. I will discuss it.

UI行列は、あるユーザujのアイテムikへのアクセス履歴データ(レコード)がアクセス履歴データベース200に存在する場合、行列中の該当要素UI(j,k)を1とし、存在しない場合は0とすることにより作成される。ただし、値は1ではなく、別の固定値にしてもよい。また、ユーザujからアイテムikへのアクセス履歴データが複数ある場合には、1または固定値をそのアクセス履歴データの数だけ加算した値(頻度)としてもよい。全てのユーザとアイテムの組合せについて、この処理を繰り返す。 In the UI matrix, when access history data (record) to an item i k of a certain user u j exists in the access history database 200, the corresponding element UI (j, k) in the matrix is set to 1, and 0 does not exist. Is created. However, the value is not 1 and may be another fixed value. Further, in the case where a plurality of access history data from the user u j to item i k may be 1 or a fixed value value obtained by adding the number of the access history data (frequency). This process is repeated for all combinations of users and items.

UI行列以外の部分行列についても、同様に作成する。ただし、UI行列とIU行列のような対になる行列の場合、IU行列は単にUI行列の行と列を入れ替えることで行列を作成してよい。   Sub-matrices other than the UI matrix are created in the same way. However, in the case of a paired matrix such as a UI matrix and an IU matrix, the IU matrix may be created by simply exchanging the rows and columns of the UI matrix.

ステップ420)遷移行列作成部101は、ドメインごとに列の値の和が1になるように、ドメインごとの正規化処理を行う。ドメインの例としては、ユーザの場合、サービスAのユーザ、サービスBのユーザといった加入サービスによるまとまりであったり、アイテムの場合、上述の「ダイエット」や「車」などのコンテンツのカテゴリであったりといった、サービスに依存し、構成要素数が大きく違う場合があるものが想定されている。また、このドメインの数は、例えばユーザは1つしかないのに対し、アイテムはv個あるなど、異なっていてもよい。   Step 420) The transition matrix creation unit 101 performs normalization processing for each domain so that the sum of column values becomes 1 for each domain. Examples of domains include a group of subscription services such as users of service A and users of service B in the case of users, and categories of content such as “diet” and “car” described above in the case of items. Depending on the service, it is assumed that the number of components may vary greatly. Also, the number of domains may be different, for example, there is only one user, but there are v items.

例えばUI行列の場合は、下記式2によって表される処理を行う。ここで、x,yは、それぞれユーザ、アイテムの属するドメインのドメインIDを表し、j,kはそれぞれ行列中の任意の行番号、列番号を表す。すなわち、UI(x,y,j,k)は、(正規化前の)ユーザのドメインIDがx、アイテムのドメインIDがyのUI行列のj行k列目の要素を表すものとする。なお、ドメインIDがyのアイテム集合をI'(y)と表す。   For example, in the case of a UI matrix, the processing represented by the following equation 2 is performed. Here, x and y respectively represent domain IDs of domains to which the user and item belong, and j and k respectively represent arbitrary row numbers and column numbers in the matrix. That is, UI (x, y, j, k) represents an element in the j-th row and the k-th column of the UI matrix in which the domain ID of the user (before normalization) is x and the domain ID of the item is y. An item set with a domain ID y is represented as I ′ (y).

x,y 以外のUI行列、アイテム、メタデータを含む行列についても同様に正規化を行う。

Figure 0006100677
Normalization is performed in the same manner for matrices containing UI matrices, items, and metadata other than x and y.
Figure 0006100677

遷移行列作成部101は、ステップ420で作成した行列を遷移行列格納部103に保存する。以下、再び図3の処理を説明する。   The transition matrix creation unit 101 stores the matrix created in step 420 in the transition matrix storage unit 103. Hereinafter, the process of FIG. 3 will be described again.

ステップ330)ドメイン組合せ重み算出部102は、アクセス履歴データベース200から得られるユーザIDごとのアクセス履歴を用いて、ドメイン組合せ重みwを算出する。ドメイン組合せ重みwとは、遷移元ドメインと遷移先ドメインの組合せによって決まる、対応する部分行列に掛ける重みである。例えばユーザuj が「ダイエット」ドメインのアイテムを閲覧した場合に、次に「健康」ドメインに遷移した場合、遷移元ドメインは「ダイエット」、遷移先ドメインは「健康」となる。アイテムのドメインが v種類あったとすると、「ダイエット」から「健康」と、「健康」から「ダイエット」の遷移とを区別し、「ダイエット」から「ダイエット」といった同一ドメイン内の遷移も考慮するとして、遷移元ドメインと遷移先ドメインの組合せはv2 通りとなり、すなわち重み wもv2 通りを算出することになる。この重みwの算出工程については、図10を用いて後述する。 Step 330) The domain combination weight calculator 102 calculates the domain combination weight w using the access history for each user ID obtained from the access history database 200. The domain combination weight w is a weight to be applied to the corresponding submatrix determined by the combination of the transition source domain and the transition destination domain. For example, when the user u j browses an item in the “Diet” domain and then transitions to the “Health” domain, the transition source domain is “Diet” and the transition destination domain is “Health”. If there are v types of item domains, the transition from “diet” to “health” and the transition from “health” to “diet” is considered, and transitions within the same domain such as “diet” to “diet” are also considered. The combination of the transition source domain and the transition destination domain is v 2 , that is, the weight w is also calculated as v 2 . The process of calculating the weight w will be described later with reference to FIG.

ステップ340)部分行列重みづけ計算部104は、遷移行列格納部103から、ステップ320で作成済の遷移行列を読み出す。次に、遷移行列のうち、ドメイン組合せ重みwを適用する部分(ここではUI行列のみとする)については、アイテムのドメインの種類数(v種類)分、行列を複製する。これは、推薦対象となるユーザが推薦時にどのドメインのアイテムを閲覧しているか(遷移元ドメイン)により、ステップ330で求めた異なるドメイン組合せ重みwを適用した、異なる遷移行列を適用するためである。   Step 340) The partial matrix weight calculation unit 104 reads the transition matrix created in step 320 from the transition matrix storage unit 103. Next, in the transition matrix, for the part to which the domain combination weight w is applied (here, only the UI matrix is used), the matrix is duplicated for the number of types of domain (v types) of the item. This is to apply different transition matrices to which different domain combination weights w obtained in step 330 are applied depending on which domain item is being viewed by the user to be recommended at the time of recommendation (transition source domain). .

そして、式3に示されるように、ステップ330で算出した重みwを、それぞれ対応する行列に掛ける。ただし、ユーザは単一ドメイン(例えば、全員サービスAの登録ユーザである等)であり、アイテムはv種類のドメインに分かれているものとする。このとき、式3の D(a,b)は、ドメインA(IDがa)のアイテムを閲覧するユーザについての行列であり、ドメインB(IDがb)のアイテムへと遷移した場合のUI行列である。w(a,b)はドメインAからBへ遷移する場合のドメイン組合せ重みであり、ui(a,b,j,k)はドメインAからBへ遷移した場合のUI行列のj行k列目の要素を表す。また、ユーザ数をu、アイテム数をmとする。

Figure 0006100677
Then, as shown in Expression 3, the weight w calculated in step 330 is multiplied by the corresponding matrix. However, the user is a single domain (for example, all users are registered users of service A), and the items are divided into v types of domains. In this case, D (a, b) in Equation 3 is a matrix for a user who browses an item in domain A (ID is a), and a UI matrix when transitioning to an item in domain B (ID is b) It is. w (a, b) is the domain combination weight when transitioning from domain A to B, and ui (a, b, j, k) is the jth row and kth column of the UI matrix when transitioning from domain A to B Represents an element. The number of users is u, and the number of items is m.
Figure 0006100677

ここで、図5から図7を用いて、ステップ340の重みづけ演算において、遷移元ドメインが違う場合に、重みづけ後の行列の値が変わる例を示す。図5は、重みづけ演算前のUI行列を表す。行番号/列番号として記載されたuiは、i番目のユーザを表し、ii a は、ドメインA(IDがa)のi番目のアイテムを表す。また、ユーザ数をn, ドメインA のアイテム数をm、ドメインB のアイテム数をgとする。 Here, FIG. 5 to FIG. 7 are used to illustrate an example in which the weighted matrix value changes when the transition source domain is different in the weighting calculation in step 340. FIG. 5 shows a UI matrix before weighting calculation. U i written as a row number / column number represents the i-th user, and i i a represents the i-th item of the domain A (ID is a). The number of users is n, the number of items in domain A is m, and the number of items in domain B is g.

図6および図7は、重みづけ演算後のUI行列であるが、ドメイン組合せが異なる場合を示している。図6は、遷移元はドメインAで、遷移先もドメインAである場合のドメイン組合せ重みw(a,a)が3、遷移先はドメインBである場合の重みw(a,b)が1/2であるものとする。なお、ui aは、i番目のユーザで、ドメインA(ドメインIDがa)のアイテムを閲覧している場合を表す。一方、遷移元がドメインZで、遷移先がドメインaである場合のドメイン組合せ重みw(z,a)が3/2、遷移先はドメインBである場合の重みw(z,b)が1のとき、図7に示すようになる。 FIG. 6 and FIG. 7 show UI matrices after weighting calculations, but show different domain combinations. In FIG. 6, the domain combination weight w (a, a) when the transition source is domain A and the transition destination is domain A is 3, and the weight w (a, b) when the transition destination is domain B is 1. It shall be / 2. Note that u i a represents a case where the i-th user is browsing an item in domain A (domain ID is a). On the other hand, when the transition source is domain Z and the transition destination is domain a, the domain combination weight w (z, a) is 3/2, and when the transition destination is domain B, the weight w (z, b) is 1. At this time, it becomes as shown in FIG.

このように、作成される複数の遷移行列は、推薦対象ユーザの閲覧しているドメインの違いによって、使い分けられる。すなわち、推薦結果(式1のp)はユーザの閲覧しているアイテムのドメインの違いにより異なる結果となる。   In this way, the plurality of transition matrices that are created are selectively used depending on the difference in the domain that the recommended user browses. That is, the recommendation result (p in Formula 1) is different depending on the domain of the item being browsed by the user.

次に、重みづけ演算を行った行列を結合し、式4のように、遷移元ドメインがA(IDがa)の場合の遷移行列A’ のUI行列A’(a, UI)を作成する。D(a,b)は、ドメイン組合せがドメインAからBの場合の、重みづけ後のUI行列の意である。式3の行列Dと同様である。このようにして、全てのアイテムを含むUI行列を結合する。   Next, the weighted matrix is combined to create a UI matrix A ′ (a, UI) of the transition matrix A ′ when the transition source domain is A (ID is a) as shown in Equation 4. . D (a, b) is a weighted UI matrix when the domain combination is domain A to B. This is the same as the matrix D in Equation 3. In this way, the UI matrix including all items is combined.

さらに、式4のように、遷移行列格納部103に格納された、アイテム、メタデータを含む他の行列とも結合する。式4において、Uはユーザ、Iはアイテム、Mはメタデータを表し、例えばIMはアイテム−メタデータ行列である。このようにして、全ての要素を含む遷移行列A’を作成する。

Figure 0006100677
Further, as shown in Expression 4, the matrix is combined with other matrices including items and metadata stored in the transition matrix storage unit 103. In Equation 4, U represents a user, I represents an item, and M represents metadata. For example, IM is an item-metadata matrix. In this way, a transition matrix A ′ including all elements is created.
Figure 0006100677

次に、非特許文献1と同様に、式5に示される遷移行列A’の全体の正規化を行い、最終的な遷移行列Aを作成する。ただし、A(a) は正規化済の遷移行列であるが、ユーザがドメインA (IDがa) を閲覧している場合の遷移行列であることを表す。A’(a, j, k) は、遷移元ドメインがAである遷移行列A’のj行k列目の要素を表す。

Figure 0006100677
Next, as in Non-Patent Document 1, the entire transition matrix A ′ shown in Expression 5 is normalized to create a final transition matrix A. However, although A (a) is a normalized transition matrix, it represents a transition matrix when the user is browsing the domain A (ID is a). A ′ (a, j, k) represents the element in the j-th row and the k-th column of the transition matrix A ′ whose transition source domain is A.
Figure 0006100677

ステップ350)ステップ340を、遷移元ドメインの種類の数だけ繰り返し、全ての遷移元ドメインの場合の遷移行列、A(a)からA(z)を作成する。   Step 350) Step 340 is repeated by the number of types of transition source domains to create transition matrices A (a) to A (z) for all transition source domains.

ステップ360)推薦条件設定部105は、後の推薦計算に必要となる、推薦条件を外部システムから取得し、該当推薦条件を設定する。まず、推薦条件設定部105は、外部システムから取得した被推薦ユーザIDデータ201から、被推薦ユーザIDを読み出す。   Step 360) The recommendation condition setting unit 105 acquires a recommendation condition necessary for the subsequent recommendation calculation from the external system, and sets the corresponding recommendation condition. First, the recommendation condition setting unit 105 reads out a recommended user ID from the recommended user ID data 201 acquired from the external system.

図8に、被推薦ユーザIDデータ201のイメージを示す。図示するように、被推薦ユーザIDデータには、推薦対象となるユーザのIDが格納されている。推薦対象ユーザは、ユーザが推薦サービスを受けることに同意しているなどのサービス上の要件、契約内容、条件などから任意に設定できるものとする。   FIG. 8 shows an image of the recommended user ID data 201. As shown in the figure, the recommended user ID data stores the ID of the user to be recommended. The recommended user can be arbitrarily set based on service requirements such as the user agreeing to receive the recommended service, contract details, conditions, and the like.

ステップ370)推薦計算部106は、ステップ340で作成した遷移行列A(a)からA(z)に対して、ステップ360で取得した推薦条件を設定し、推薦計算を行う。この推薦計算の方法は、ユーザの遷移元ドメインが仮定されている以外は、非特許文献1の方法と同様に、式1を計算することになる。   Step 370) The recommendation calculation unit 106 sets the recommendation condition acquired in Step 360 for the transition matrices A (a) to A (z) created in Step 340, and performs the recommendation calculation. In this recommendation calculation method, Equation 1 is calculated in the same manner as in the method of Non-Patent Document 1 except that the transition source domain of the user is assumed.

最終的に図9に示すような、推薦対象ユーザごとの、ユーザの遷移元ドメイン(被推薦時に閲覧中のアイテムのドメイン)、推薦するアイテムID、そのドメインID、評価値の組合せが、外部システムである推薦結果提示システム20に送出される。   Finally, as shown in FIG. 9, the combination of the user transition source domain (the domain of the item being viewed at the time of recommendation), the recommended item ID, the domain ID, and the evaluation value for each recommended user is an external system. Is sent to the recommendation result presentation system 20.

なお、推薦結果提示システム20は、被推薦ユーザの閲覧中のアイテムのドメインを識別し、それに合致する遷移元ドメインが設定されている該当ユーザの推薦計算結果を検索し、推薦アイテムを選択する機能を有する。   The recommendation result presentation system 20 identifies the domain of the item being browsed by the recommended user, searches the recommendation calculation result of the corresponding user in which the transition source domain that matches the domain is selected, and selects the recommended item Have

次に、上記ステップ330のドメイン組合せ重みwを算出する処理について、より詳しく説明する。図10は、ステップ330のフローチャートである。   Next, the process of calculating the domain combination weight w in step 330 will be described in more detail. FIG. 10 is a flowchart of step 330.

ステップ610)ドメイン組合せ重み算出部102は、アクセス履歴データベース200からユーザID、アクセス時刻、アイテムのドメインIDの組合せを含むデータを取得する。   Step 610) The domain combination weight calculation unit 102 acquires data including a combination of a user ID, an access time, and an item domain ID from the access history database 200.

ステップ620)ドメイン組合せ重み算出部102は、ステップ610で取得したデータを、ユーザIDを1次キー、アクセス時刻を2次キーとして昇順にソートする。その上で、同一ユーザ内で、どのドメインからどのドメインへ遷移したかをカウントする。ただし、ここで例示するアクセス履歴データからは、明確な遷移元がわからないために、ここではアクセス時刻が隣接する2つのデータ(レコード)のドメインを遷移元と遷移先と仮定し、ドメイン間の遷移とみなす。   Step 620) The domain combination weight calculation unit 102 sorts the data acquired in Step 610 in ascending order using the user ID as the primary key and the access time as the secondary key. Then, it is counted from which domain to which domain in the same user. However, since the clear transition source is not known from the access history data illustrated here, it is assumed here that the domains of two data (records) whose access times are adjacent are the transition source and the transition destination, and the transition between the domains. It is considered.

例えば、ユーザu1のソート後のデータが、「musicのドメインID」、「movieのドメインID」、「movieのドメインID」の順番に並んでいた場合「musicからmovie」および「movieからmovie」 という遷移があったとみなす。また、隣接するデータ間のアクセス時刻の差に閾値を設け、アクセス時刻の差が閾値以内に収まっている場合だけを、「ドメイン間の遷移」としてこの処理の対象としてもよいし、あるいは、途中のデータを省略し、最も古いアクセス時刻のアイテムのドメインから、最も新しいアクセス時刻のアイテムのドメインへ遷移したとしてもよい。 For example, when the sorted data of the user u 1 is arranged in the order of “music domain ID”, “movie domain ID”, “movie domain ID”, “music to movie” and “movie to movie” It is considered that there was a transition. In addition, a threshold may be provided for the difference in access time between adjacent data, and only when the difference in access time is within the threshold may be subject to this processing as “transition between domains”, or in the middle May be omitted, and the domain of the item with the oldest access time may transition to the domain of the item with the newest access time.

また、ドメイン組合せ重み算出部102は、アイテムのリンク構造が収められた外部システムであるアイテム構造データベース30と接続し、リンク構造を遷移元の推定に用いてもよい。リンク構造とはここでは、例えば、アイテムiにはアイテムik,ig,ixへのリンクがあり、アイテムikにはアイテムim,ipへのリンクがあり、アイテムigにはアイテムip,irへのリンクがある、といった情報を指す。一定時間内のアクセス履歴において、共通のリンク元(上記の例では、アイテムi、アイテムig)をもつ複数のアイテムがあり、かつ共通のリンク元へのアクセス履歴もあれば、共通のリンク元があるアイテムを、当該リンク元からの遷移と見なしてもよい。 Further, the domain combination weight calculation unit 102 may be connected to the item structure database 30 that is an external system in which the link structure of items is stored, and the link structure may be used for estimating the transition source. Here, for example, item i j has links to items i k , i g , and i x , item i k has links to items i m and i p , and item i g has Indicates information that there is a link to items i p and i r . If there is a plurality of items having a common link source (item i j , item i g in the above example) in the access history within a certain period of time, and there is an access history to the common link source, a common link An item with a source may be regarded as a transition from the link source.

具体的には、ユーザujが、一定時間内に、アクセス時刻の古い順にアイテムi、アイテムik 、アイテムigへのアクセス履歴を持っているとする。この時、アイテム構造データベース30で各アイテムのリンク構造を取得し、共通のリンク元を解析すると、アイテムik 、アイテムigにはアイテムiからのリンク(共通のリンク元)があり、かつユーザuj はアイテムiへのアクセス履歴もあるので、遷移はアイテムiからアイテムik およびアイテムiからアイテムigであると推定してもよい。 Specifically, the user u j is, within a certain period of time, the item to the old order of access time i j, item i k, and have a history of access to the item i g. At this time, when the link structure of each item is acquired in the item structure database 30 and the common link source is analyzed, the item i k and the item i g have a link (common link source) from the item i j , and since the user u j is also access history for the item i j, the transition may be estimated to be the item i g items i k and items i j from the item i j.

あるいは、遷移元が明確にわかるアクセス履歴データを取得可能な場合は、その情報を用いてもよい。例えば、HTTPリファラの情報が使える場合には、遷移元アドレスがいずれかのドメインに該当するかを解析し、該当する場合にはドメイン名を取得し、当該ドメインから、現在のドメインへと遷移したとみなしてもよい。   Alternatively, when access history data that clearly indicates the transition source can be acquired, the information may be used. For example, when HTTP referrer information can be used, it is analyzed whether the transition source address corresponds to any domain, and if it is applicable, the domain name is acquired, and the current domain is transitioned from the domain. May be considered.

そして、図11に示すように、例えば「movieからmusic」などのドメイン間遷移を抽出する。   Then, as shown in FIG. 11, for example, an inter-domain transition such as “movie to music” is extracted.

ステップ630)起点となる各ドメインに占める、あるドメインの組合せの割合を補正したものを、そのドメイン組合せの重みとする。以下、具体的に説明する。アクセス履歴データベース200が対象とするサービスのドメインがv種類あったとすると、v2通りの組合せ(同一ドメイン内の遷移も含む、遷移の方向も考慮する)について、それぞれ何件遷移があったと見なせるか、全ユーザに渡って集計する。そのイメージを図12に示す。この表では、music、cookingといった起点となるドメインごとに、各遷移が何回起こっていたか全ユーザに渡って集計したものである。 Step 630) The weight of the domain combination is obtained by correcting the ratio of the combination of certain domains in each starting domain. This will be specifically described below. If there are v types of service domains that the access history database 200 targets, how many transitions can be considered for each of the two combinations (including transitions in the same domain, including transition directions)? , Aggregate across all users. The image is shown in FIG. In this table, for each domain as a starting point such as music and cooking, the number of times each transition has occurred is tabulated over all users.

さらに、各遷移が、その起点ドメイン内で占める割合を算出する。そのイメージを図13に示す。ここで求めた割合を、aを遷移元のドメインID、bを遷移先のドメインIDとすると、R(a,b)と表すこととする。本実施形態では、R(a,b)に以下の補正を加え、ドメイン組合せ重みw(a,b)を求めることとするが、補正を行うことなくR(a,b)をドメイン組合せ重みw(a,b)としてもよい。また、以下の第1の補正と第2の補正の両方の補正を行ってもよく、あるいは、いずれか1つの補正のみを行うこととしてもよい。   Furthermore, the ratio that each transition occupies in the origin domain is calculated. The image is shown in FIG. The ratio obtained here is represented as R (a, b), where a is the domain ID of the transition source and b is the domain ID of the transition destination. In this embodiment, the following correction is applied to R (a, b) to obtain the domain combination weight w (a, b), but R (a, b) is converted to the domain combination weight w without correction. It may be (a, b). Further, both the following first correction and second correction may be performed, or only one of the corrections may be performed.

<第1の補正:遷移先ドメインのアイテムの多さによる補正>
ここで、各ドメインに所属するアイテムの総利用回数は、ドメインによって異なるので、ドメインによっては、コンテキストに限らず、単純にアイテムが利用される回数が多いために遷移されやすい、というものもあるだろう。この影響を小さくするため、全アイテムの利用回数と遷移先ドメインのアイテムの利用回数との比を用いてドメイン組合せ重みを補正する。すなわち、式6に示すように、R(a,b)を、遷移先ドメインbのアイテムの利用回数の全アイテム利用回数に占める割合で補正する。ここで、アイテムの利用回数の多さは、UI行列のうち、アイテムの該当ドメインの範囲の要素の和により算出できる。値が0でない(アクセス履歴があった)要素だけの和としてもよい。式6において、mbはUI行列のアイテムのドメインIDがbの要素の和を、MはUI行列の全ドメインの要素の和を表している。これにより、ドメインbの全アイテムに占める割合が小さいほど、R(a,b)は大きく評価される。

Figure 0006100677
<First correction: correction based on the number of items in the destination domain>
Here, the total usage count of items belonging to each domain differs depending on the domain, so depending on the domain, there are things that are easy to transition because there are not only context but simply the number of times the item is used Let's go. In order to reduce this influence, the domain combination weight is corrected using the ratio between the number of times of use of all items and the number of times of use of items in the transition destination domain. That is, as shown in Expression 6, R (a, b) is corrected by the ratio of the number of times of use of the item in the transition destination domain b to the total number of times of item use. Here, the number of times the item is used can be calculated by the sum of elements in the range of the corresponding domain of the item in the UI matrix. It may be the sum of only elements whose value is not 0 (has an access history). In Equation 6, m b represents the sum of elements whose domain ID of the UI matrix item is b, and M represents the sum of elements of all domains of the UI matrix. As a result, R (a, b) is highly evaluated as the proportion of all items in domain b is small.
Figure 0006100677

<第2の補正:ドメイン内遷移の抑制>
さらに、R(a,b)の傾向としては、Webページ閲覧履歴のような性質のデータであれば、あるサイトを複数ページに渡って読む状況に代表されるように、遷移元のドメインと同じドメイン(以下、自ドメイン)に遷移するものが多くなるはずである。一方、特許文献1および非特許文献1に記載されるように、これらの技術は複数ドメインにまたがった推薦を可能にし、ユーザのWebサイト等での回遊を促進するためのものである。そこで、この各遷移の占める割合をそのままドメイン組合せに対応する重みをして用いれば、自ドメインへの回帰を促進してしまい、本来の推薦の意図に反してしまうので、適さない。そこで、本実施形態では、自ドメインへ回帰する場合の重みづけを抑制するために、同一ドメイン内での遷移については、所定の係数(ここでは、自己ループ抑制重み 1−γ)を乗算し、異なるドメイン間での遷移より過少評価するように、ドメイン組合せ重みを補正する。
<Second correction: suppression of intra-domain transition>
Furthermore, the trend of R (a, b) is the same as the domain of the transition source as represented by the situation where a certain site is read across multiple pages if the data has a property such as a web page browsing history. There should be many things that transition to the domain (hereinafter, the self domain). On the other hand, as described in Patent Document 1 and Non-Patent Document 1, these technologies are for enabling recommendation across a plurality of domains and for promoting migration on a user's Web site or the like. Therefore, if the proportion of each transition occupies the weight corresponding to the domain combination as it is, the return to the own domain is promoted and it is contrary to the original recommendation intention, so it is not suitable. Therefore, in this embodiment, in order to suppress weighting when returning to the own domain, a transition within the same domain is multiplied by a predetermined coefficient (here, self-loop suppression weight 1-γ), The domain combination weight is corrected so as to underestimate the transition between different domains.

具体的には、式7に示すように、ドメインAからドメインBに遷移するときの重みw(a,b)は、0<γ<1である任意のγについて、遷移元ドメインと遷移先ドメインが異なる場合にはγ、同じである場合には自己ループ抑制重み1−γを前ステップで得た重みR(a,b)に乗算することで、重みの相対的な大きさを調整する。例えば、γ=0.8などとすると、同じドメイン内の遷移の重みは、異なるドメイン間での遷移の場合に比べて小さくすることができる。

Figure 0006100677
Specifically, as shown in Equation 7, the weight w (a, b) when transitioning from domain A to domain B is the transition source domain and the transition destination domain for any γ where 0 <γ <1 If the two are different, the relative weight is adjusted by multiplying the weight R (a, b) obtained in the previous step by the self-loop suppression weight 1-γ if they are the same. For example, when γ = 0.8 or the like, the weight of transition in the same domain can be made smaller than in the case of transition between different domains.
Figure 0006100677

なお、本実施形態では、ドメイン組合せ重みwは計算依頼部100が処理を始めるたびに新たに計算される構成になっているが、ドメイン組合せ重みwについては推薦計算よりも長いスパンに1回求め、図示しない記憶部に保存して利用することとしてもよい。   In the present embodiment, the domain combination weight w is newly calculated every time the calculation request unit 100 starts processing, but the domain combination weight w is obtained once in a span longer than the recommendation calculation. The data may be stored in a storage unit (not shown) and used.

以上説明した本実施形態では、アクセス履歴データベース200を用いてドメイン間の遷移数を算出し、当該遷移数に基づいて遷移行列中のドメイン組合せ毎の部分行列に乗算するドメイン組合せ重みwを算出し、ドメイン組合せ重みを用いて前記部分行列に重みづけを行う。   In the present embodiment described above, the number of transitions between domains is calculated using the access history database 200, and the domain combination weight w for multiplying the submatrix for each domain combination in the transition matrix is calculated based on the number of transitions. The partial matrix is weighted using domain combination weights.

これにより、本実施形態では、遷移元/遷移先ドメインの組み合わせによる重みを遷移行列に反映させることができ、ユーザの情報閲覧行動のコンテキストに合った、より効果的な推薦結果を得ることができる。すなわち、遷移行列のうち、遷移元/遷移先ドメインの組合せで規定される部分行列に対して、対応する組合せに応じた重みづけを行うことで、遷移元/遷移先ドメインの組合せを考慮した、より効果的な情報推薦を実現することができる。例えば、「ダイエット」ドメインから「車」ドメインよりも、「ダイエット」ドメインから「健康」ドメインの方へより大きな重みを乗算するなど、遷移元/遷移先ドメインの組合せ(方向)を考慮した遷移行列を構築することができる。   Thereby, in this embodiment, the weight by the combination of a transition origin / transition destination domain can be reflected in a transition matrix, and the more effective recommendation result suitable for the context of a user's information browsing action can be obtained. . That is, in the transition matrix, the combination of the transition source / transition destination domain is considered by weighting the partial matrix defined by the combination of the transition source / transition destination domain according to the corresponding combination. More effective information recommendation can be realized. For example, a transition matrix that takes into account the combination (direction) of the transition source / destination domain, such as multiplying the “diet” domain to the “health” domain by a greater weight than the “diet” domain to the “car” domain. Can be built.

したがって、本実施形態では、遷移元/遷移先ドメインの組合せで規定される部分行列への重みを算出する技術、当該重みを用いて遷移行列を作成する技術を備えた推薦計算の仕組みを提供することができる。   Therefore, the present embodiment provides a recommendation calculation mechanism including a technique for calculating a weight for a submatrix defined by a combination of a transition source / transition destination domain and a technique for creating a transition matrix using the weight. be able to.

なお、本発明は上記実施形態に限定されるものではなく、特許請求の範囲内において、種々変更・応用が可能である。   In addition, this invention is not limited to the said embodiment, A various change and application are possible within a claim.

10 :アクセスログ収集システム
20 :推薦結果提示システム
30 :アイテム構造データベース
100 :計算依頼部
101 :遷移行列作成部
102 :ドメイン組合せ重み算出部
103 :遷移行列格納部
104 :部分行列重みづけ計算部
105 :推薦条件設定部
106 :推薦計算部
200 :アクセス履歴データベース
10: Access log collection system
20: Recommendation result presentation system
30: Item structure database
100: Calculation request department
101: Transition matrix generator
102: Domain combination weight calculator
103: Transition matrix storage
104: Submatrix weighting calculator
105: Recommendation condition setting section
106: Recommendation calculator
200: Access history database

Claims (11)

情報推薦装置であって、
ユーザがアイテムにアクセスしたアクセス履歴データを格納したアクセス履歴データベースと、
前記アクセス履歴データベースを用いて、ユーザとアイテムのアクセス関係を示す遷移行列を作成する遷移行列作成部と、
前記アクセス履歴データベースを用いてドメイン間の遷移数を算出し、当該遷移数に基づいて前記遷移行列中のドメイン組合せ毎の部分行列に乗算するドメイン組合せ重みを算出するドメイン組合せ重み算出部と、
前記ドメイン組合せ重みを用いて前記部分行列に重みづけを行う部分行列重みづけ計算部と、を有すること
を特徴とする情報推薦装置。
An information recommendation device,
An access history database that stores access history data of items accessed by users;
Using the access history database, a transition matrix creating unit that creates a transition matrix indicating an access relationship between a user and an item
A domain combination weight calculating unit that calculates the number of transitions between domains using the access history database, and calculates a domain combination weight for multiplying a partial matrix for each domain combination in the transition matrix based on the number of transitions;
An information recommendation device comprising: a partial matrix weighting calculation unit that weights the partial matrix using the domain combination weight.
請求項1記載の情報推薦装置であって、
前記ドメイン組合せ重み算出部は、全アイテムの利用回数と遷移先ドメインのアイテムの利用回数との比を用いてドメイン組合せ重みを補正すること
を特徴とする情報推薦装置。
The information recommendation device according to claim 1,
The domain combination weight calculation unit corrects the domain combination weight by using a ratio between the number of times of use of all items and the number of times of use of items in the transition destination domain.
請求項1または2記載の情報推薦装置であって、
前記ドメイン組合せ重み算出部は、同一ドメイン内での遷移については、所定の係数を乗算し、異なるドメイン間での遷移より過少評価するように、ドメイン組合せ重みを補正すること
を特徴とする情報推薦装置。
The information recommendation device according to claim 1 or 2,
The domain combination weight calculation unit corrects the domain combination weight so that the transition within the same domain is multiplied by a predetermined coefficient and is underestimated than the transition between different domains. apparatus.
請求項1から3のいずれか一項に記載の情報推薦装置であって、
前記ドメイン組合せ重み算出部は、アクセス履歴データに含まれるHTTPリファラを用いて遷移元アイテムを特定し、当該遷移元アイテムのドメインを特定することにより、ドメイン間の遷移数を推定すること
を特徴とする情報推薦装置。
The information recommendation device according to any one of claims 1 to 3,
The domain combination weight calculation unit specifies a transition source item using an HTTP referrer included in access history data, and estimates the number of transitions between domains by specifying a domain of the transition source item. Information recommendation device.
請求項1から3のいずれか一項に記載の情報推薦装置であって、
前記ドメイン組合せ重み算出部は、アイテム同士のリンクの有無の情報を利用して、アクセス履歴から共通のリンク元を持つ複数アイテムがあり、該当のリンク元へのアクセス履歴もある場合に、当該リンク元から複数アイテムへの遷移があると推定し、ドメイン間の遷移数を推定すること
を特徴とする情報推薦装置。
The information recommendation device according to any one of claims 1 to 3,
The domain combination weight calculation unit uses the information on the presence / absence of a link between items, and when there are a plurality of items having a common link source from the access history and there is also an access history to the corresponding link source, the link An information recommendation device that estimates that there are transitions from the original to multiple items and estimates the number of transitions between domains.
情報推薦装置が行う情報推薦方法であって、
前記情報推薦装置は、ユーザがアイテムにアクセスしたアクセス履歴データを格納したアクセス履歴データベースを備え、
前記アクセス履歴データベースを用いて、ユーザとアイテムのアクセス関係を示す遷移行列を作成する遷移行列作成ステップと、
前記アクセス履歴データベースを用いてドメイン間の遷移数を算出し、当該遷移数に基づいて前記遷移行列中のドメイン組合せ毎の部分行列に乗算するドメイン組合せ重みを算出するドメイン組合せ重み算出ステップと、
前記ドメイン組合せ重みを用いて前記部分行列に重みづけを行う部分行列重みづけ計算ステップと、を行うこと
を特徴とする情報推薦方法。
An information recommendation method performed by an information recommendation device,
The information recommendation device includes an access history database that stores access history data in which a user accesses an item,
Using the access history database, a transition matrix creating step for creating a transition matrix indicating an access relationship between a user and an item
A domain combination weight calculating step of calculating the number of transitions between domains using the access history database and calculating a domain combination weight for multiplying a partial matrix for each domain combination in the transition matrix based on the number of transitions;
A submatrix weighting calculation step of weighting the submatrix using the domain combination weights.
請求項6記載の情報推薦方法であって、
前記ドメイン組合せ重み算出ステップは、全アイテムの利用回数と遷移先ドメインのアイテムの利用回数との比を用いてドメイン組合せ重みを補正すること
を特徴とする情報推薦方法。
An information recommendation method according to claim 6,
The domain combination weight calculating step corrects the domain combination weight using a ratio of the number of times of use of all items and the number of times of use of items in the transition destination domain.
請求項6または7記載の情報推薦方法であって、
前記ドメイン組合せ重み算出ステップは、同一ドメイン内での遷移については、所定の係数を乗算し、異なるドメイン間での遷移より過少評価するように、ドメイン組合せ重みを補正すること
を特徴とする情報推薦方法。
The information recommendation method according to claim 6 or 7,
The domain combination weight calculation step corrects the domain combination weight so that a transition within the same domain is multiplied by a predetermined coefficient and is underestimated than a transition between different domains. Method.
請求項6から8のいずれか一項に記載の情報推薦方法であって、
前記ドメイン組合せ重み算出ステップは、アクセス履歴データに含まれるHTTPリファラを用いて遷移元アイテムを特定し、当該遷移元アイテムのドメインを特定することにより、ドメイン間の遷移数を推定すること
を特徴とする情報推薦方法。
The information recommendation method according to any one of claims 6 to 8,
The domain combination weight calculating step specifies a transition source item using an HTTP referrer included in access history data, and estimates the number of transitions between domains by specifying a domain of the transition source item. How to recommend information.
請求項6から8のいずれか一項に記載の情報推薦方法であって、
前記ドメイン組合せ重み算出ステップは、アイテム同士のリンクの有無の情報を利用して、アクセス履歴から共通のリンク元を持つ複数アイテムがあり、該当のリンク元へのアクセス履歴もある場合に、当該リンク元から複数アイテムへの遷移があると推定し、ドメイン間の遷移数を推定すること
を特徴とする情報推薦方法。
The information recommendation method according to any one of claims 6 to 8,
The domain combination weight calculating step uses information on the presence / absence of a link between items, and when there are a plurality of items having a common link source from the access history and there is also an access history to the corresponding link source, the link An information recommendation method characterized by estimating the number of transitions from the original to multiple items and estimating the number of transitions between domains.
請求項1から5のいずれか一項に記載の情報推薦装置として、コンピュータを機能させるための情報推薦プログラム。 An information recommendation program for causing a computer to function as the information recommendation device according to any one of claims 1 to 5.
JP2013238557A 2013-11-19 2013-11-19 Information recommendation device, information recommendation method, and information recommendation program Active JP6100677B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013238557A JP6100677B2 (en) 2013-11-19 2013-11-19 Information recommendation device, information recommendation method, and information recommendation program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013238557A JP6100677B2 (en) 2013-11-19 2013-11-19 Information recommendation device, information recommendation method, and information recommendation program

Publications (2)

Publication Number Publication Date
JP2015099463A JP2015099463A (en) 2015-05-28
JP6100677B2 true JP6100677B2 (en) 2017-03-22

Family

ID=53376047

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013238557A Active JP6100677B2 (en) 2013-11-19 2013-11-19 Information recommendation device, information recommendation method, and information recommendation program

Country Status (1)

Country Link
JP (1) JP6100677B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020125704A1 (en) * 2018-12-20 2020-06-25 海信视像科技股份有限公司 Broadcast signal receiving apparatus and broadcast signal receiving method, and viewer attribute determination system and viewer attribute determination method

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10339538B2 (en) * 2004-02-26 2019-07-02 Oath Inc. Method and system for generating recommendations
WO2009057103A2 (en) * 2007-10-31 2009-05-07 Musicgenome.Com Inc. Content-based recommendations across domains
JP2011233041A (en) * 2010-04-28 2011-11-17 Nippon Telegr & Teleph Corp <Ntt> Preference prediction system and preference prediction method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020125704A1 (en) * 2018-12-20 2020-06-25 海信视像科技股份有限公司 Broadcast signal receiving apparatus and broadcast signal receiving method, and viewer attribute determination system and viewer attribute determination method

Also Published As

Publication number Publication date
JP2015099463A (en) 2015-05-28

Similar Documents

Publication Publication Date Title
AU2019275615B2 (en) Classifying user behavior as anomalous
Senanayake et al. The pagerank-index: Going beyond citation counts in quantifying scientific impact of researchers
JP6167493B2 (en) Method, computer program, storage medium and system for managing information
US20120191714A1 (en) Scalable user clustering based on set similarity
JP5916959B2 (en) Dynamic data acquisition method and system
US20080288491A1 (en) User segment suggestion for online advertising
Dai et al. Conditional entropy for incomplete decision systems and its application in data mining
US20160055252A1 (en) Methods and systems for personalizing aggregated search results
Waltman et al. PageRank-related methods for analyzing citation networks
EP2817740A1 (en) Determining search result rankings based on trust level values associated with sellers
JP5662299B2 (en) Information recommendation apparatus, method, apparatus, and program
Xie et al. Tst: Threshold based similarity transitivity method in collaborative filtering with cloud computing
Yeniterzi et al. Constructing effective and efficient topic-specific authority networks for expert finding in social media
JP6077984B2 (en) Item recommendation device, item recommendation method, and item recommendation program
CN105243149A (en) Semantic-based query recommendation method and system
TWI499290B (en) Information recommendation method and system
Chamandy et al. Teaching statistics at Google-scale
JP2019109782A (en) Query generating program, query generating method and query generating device
JP6100677B2 (en) Information recommendation device, information recommendation method, and information recommendation program
JP6831719B2 (en) Information processing systems, information processing methods, and programs
JP5938006B2 (en) Item recommendation device, item recommendation method, and item recommendation program
Zhang et al. Estimating online review helpfulness with probabilistic distribution and confidence
US20150169507A1 (en) Method and an apparatus to provide a personlized page
RU2721159C1 (en) Method and server for generating meta-attribute for ranging documents
KR101098870B1 (en) Posts Search Method and Apparatus Based on User Rank Similarity

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160222

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161202

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170110

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170209

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170221

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170223

R150 Certificate of patent or registration of utility model

Ref document number: 6100677

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150