JP2017162237A - Generation device, generation method, and generation program - Google Patents

Generation device, generation method, and generation program Download PDF

Info

Publication number
JP2017162237A
JP2017162237A JP2016046694A JP2016046694A JP2017162237A JP 2017162237 A JP2017162237 A JP 2017162237A JP 2016046694 A JP2016046694 A JP 2016046694A JP 2016046694 A JP2016046694 A JP 2016046694A JP 2017162237 A JP2017162237 A JP 2017162237A
Authority
JP
Japan
Prior art keywords
node
graph
attribute information
category
nodes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016046694A
Other languages
Japanese (ja)
Other versions
JP6462611B2 (en
Inventor
朋哉 山崎
Tomoya Yamazaki
朋哉 山崎
伸幸 清水
Nobuyuki Shimizu
伸幸 清水
隼人 小林
Hayato Kobayashi
隼人 小林
智 山内
Satoshi Yamauchi
智 山内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2016046694A priority Critical patent/JP6462611B2/en
Publication of JP2017162237A publication Critical patent/JP2017162237A/en
Priority to JP2018245789A priority patent/JP6917972B2/en
Application granted granted Critical
Publication of JP6462611B2 publication Critical patent/JP6462611B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

PROBLEM TO BE SOLVED: To enable appropriate generation of a graph that connects entities on a network in accordance with a desired association.SOLUTION: A generation device of the present invention includes an acquisition unit and a generation unit. The acquisition unit acquires a first graph comprising a plurality of nodes corresponding to respective entities on a network, and edges connecting the nodes having a desired association. The generation unit generates a second graph having a modified edge between first and second nodes of the plurality of nodes of the first graph acquired by the acquisition unit, the edge being modified in accordance with association of the first and second nodes with the third node.SELECTED DRAWING: Figure 3

Description

本発明は、生成装置、生成方法、及び生成プログラムに関する。   The present invention relates to a generation device, a generation method, and a generation program.

従来、グラフにおけるノード間のエッジ(連結)の有無に基づいて、クラスタリングを行う技術が提供されている。例えば、グラフ中のあるノードおよびそのノードに接続したノードの集合に基づいて、クラスタ構造を抽出する技術が提供されている。例えば、グラフ中のあるノードに接続したノードの集合と他のノードに接続したノードの集合とにおいて共通するノードの数に基づいて、局所的にクラスタリングを行う技術が提供されている。   Conventionally, a technique for performing clustering based on the presence or absence of an edge (connection) between nodes in a graph has been provided. For example, a technique for extracting a cluster structure based on a node in a graph and a set of nodes connected to the node is provided. For example, a technique for performing clustering locally based on the number of nodes common to a set of nodes connected to a certain node in the graph and a set of nodes connected to other nodes is provided.

特開2015−156163号公報JP2015-156163A

T. Uno et al. Micro-clustering,“Finding small clusters in large diversity.”CoRR, 2015.T. Uno et al. Micro-clustering, “Finding small clusters in large diversity.” CoRR, 2015.

しかしながら、上記の従来技術では、ネットワーク上における主体(例えば、ユーザ)を所望の関係性に基づいて連結するグラフを適切に生成できるとは限らない。例えば、あるノードに接続したノードの集合と他のノードに接続したノードの集合とにおいて共通するノードの数に基づいて、クラスタリングを行う場合、共通するノードの数によりクラスタリングを行うかを決定することとなる。このような場合、各ノードを所望の関係性に基づいて連結するグラフを適切に生成することは難しい。   However, in the above-described conventional technology, it is not always possible to appropriately generate a graph that connects subjects (for example, users) on a network based on a desired relationship. For example, when clustering is performed based on the number of nodes common to a set of nodes connected to a certain node and a set of nodes connected to another node, it is determined whether to perform clustering based on the number of common nodes. It becomes. In such a case, it is difficult to appropriately generate a graph that connects each node based on a desired relationship.

本願は、上記に鑑みてなされたものであって、ネットワーク上における主体を所望の関係性に基づいて連結するグラフを適切に生成する生成装置、生成方法、及び生成プログラムを提供することを目的とする。   The present application has been made in view of the above, and an object thereof is to provide a generation device, a generation method, and a generation program that appropriately generate a graph that connects entities on a network based on a desired relationship. To do.

本願に係る生成装置は、ネットワーク上における主体の各々に対応する複数のノードと、所定の対応関係を有するノード間を連結するエッジとを含む第1グラフを取得する取得部と、前記取得部により取得された前記第1グラフにおける前記複数のノードのうち、第1ノード及び第2ノードと第3ノードとの関係性に基づいて、前記第1ノードと前記第2ノードとの間のエッジを変更した第2グラフを生成する生成部と、を備えたことを特徴とする。   The generating apparatus according to the present application includes a acquiring unit that acquires a first graph including a plurality of nodes corresponding to each of the main bodies on the network and an edge that connects nodes having a predetermined correspondence relationship, and the acquiring unit The edge between the first node and the second node is changed based on the relationship between the first node, the second node, and the third node among the plurality of nodes in the acquired first graph. And a generating unit for generating the second graph.

実施形態の一態様によれば、ネットワーク上における主体を所望の関係性に基づいて連結するグラフを適切に生成することができるという効果を奏する。   According to one aspect of the embodiment, there is an effect that it is possible to appropriately generate a graph that connects the subjects on the network based on a desired relationship.

図1は、実施形態に係る生成処理の一例を示す図である。FIG. 1 is a diagram illustrating an example of a generation process according to the embodiment. 図2は、実施形態に係る生成処理の一例を示す図である。FIG. 2 is a diagram illustrating an example of a generation process according to the embodiment. 図3は、実施形態に係る生成装置の構成例を示す図である。FIG. 3 is a diagram illustrating a configuration example of the generation apparatus according to the embodiment. 図4は、実施形態に係る取引情報記憶部の一例を示す図である。FIG. 4 is a diagram illustrating an example of a transaction information storage unit according to the embodiment. 図5は、実施形態に係る第1グラフ情報記憶部の一例を示す図である。FIG. 5 is a diagram illustrating an example of the first graph information storage unit according to the embodiment. 図6は、実施形態に係るカテゴリ情報記憶部の一例を示す図である。FIG. 6 is a diagram illustrating an example of the category information storage unit according to the embodiment. 図7は、実施形態に係る属性情報記憶部の一例を示す図である。FIG. 7 is a diagram illustrating an example of the attribute information storage unit according to the embodiment. 図8は、実施形態に係るスコア情報記憶部の一例を示す図である。FIG. 8 is a diagram illustrating an example of the score information storage unit according to the embodiment. 図9は、実施形態に係る第2グラフ情報記憶部の一例を示す図である。FIG. 9 is a diagram illustrating an example of the second graph information storage unit according to the embodiment. 図10は、実施形態に係る生成処理手順を示すフローチャートである。FIG. 10 is a flowchart illustrating a generation processing procedure according to the embodiment. 図11は、変形例に係る生成装置の構成例を示す図である。FIG. 11 is a diagram illustrating a configuration example of a generation apparatus according to a modification. 図12は、変形例に係る属性情報記憶部の一例を示す図である。FIG. 12 is a diagram illustrating an example of the attribute information storage unit according to the modification. 図13は、カテゴリの統合の一例を示す図である。FIG. 13 is a diagram illustrating an example of category integration. 図14は、カテゴリの分割の一例を示す図である。FIG. 14 is a diagram illustrating an example of category division. 図15は、複数の第2グラフを統合した第2グラフの生成の一例を示す図である。FIG. 15 is a diagram illustrating an example of generation of a second graph obtained by integrating a plurality of second graphs. 図16は、生成装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。FIG. 16 is a hardware configuration diagram illustrating an example of a computer that realizes the function of the generation device.

以下に、本願に係る生成装置、生成方法、及び生成プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る生成装置、生成方法、及び生成プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。   Hereinafter, a generation apparatus, a generation method, and a mode for executing a generation program (hereinafter referred to as “embodiment”) according to the present application will be described in detail with reference to the drawings. Note that the generation device, the generation method, and the generation program according to the present application are not limited by this embodiment. In the following embodiments, the same portions are denoted by the same reference numerals, and redundant description is omitted.

(実施形態)
〔1−1.生成処理(第1グラフ)〕
図1及び図2では、電子商取引(例えば、インターネットショッピング)における買主(ユーザ)をノードとし、買主(ノード)間をエッジで連結したグラフを生成する場合を示す。図1では、生成装置100(図3参照)が、買主が商品を購入した売主の共通性に基づいて、買主間をエッジで連結したグラフ(以下、「第1グラフ」ともいう)を生成する場合を示す。また、図2では、生成装置100が、第1グラフに含まれるノード間のエッジを変更したグラフ(以下、「第2グラフ」ともいう)を生成する場合を示す。
(Embodiment)
[1-1. Generation process (first graph)]
FIGS. 1 and 2 show a case where a graph in which buyers (users) in electronic commerce (for example, Internet shopping) are nodes and the buyers (nodes) are connected by edges is generated. In FIG. 1, the generation device 100 (see FIG. 3) generates a graph (hereinafter also referred to as “first graph”) in which buyers are connected by an edge based on the commonality of sellers who have purchased goods. Show the case. FIG. 2 shows a case where the generation apparatus 100 generates a graph in which edges between nodes included in the first graph are changed (hereinafter also referred to as “second graph”).

まず、図1を用いて、実施形態に係る生成処理の一例について説明する。図1は、実施形態に係る生成処理の一例を示す図である。具体的には、図1は、第1グラフの生成処理の一例を示す図である。   First, an example of the generation process according to the embodiment will be described with reference to FIG. FIG. 1 is a diagram illustrating an example of a generation process according to the embodiment. Specifically, FIG. 1 is a diagram illustrating an example of a first graph generation process.

図1に示す例においては、生成装置100は、取引一覧表TL11に示すような電子商取引における買主と売主(ユーザ)との対応に基づいて第1グラフG11を生成する(ステップS1)。なお、各ユーザは、買主と売主との一方に含まれてもよいし、両方に含まれてもよい。例えば、取引一覧表TL11は、図4に示す取引情報記憶部121に記憶された取引情報に基づいて導出される。取引一覧表TL11に示すように、買主(ノード)は、買主ID(ノードID)「N11」〜「N14」や「N21」〜「N24」等により識別される買主(ノード)が含まれる。以下では、買主ID「N11」により識別されるノードをノードN11と記載する。他の買主IDにより識別されるノードも同様に記載する。例えば、買主ID「N21」により識別されるノードをノードN21と記載する。なお、図1に示す例において、説明のために取引一覧表TL11中の8個のノードN11〜N14、N21〜N24のみを図示するが、取引一覧表TL11には、電子商取引における買主の数、例えば100万のノードが含まれてもよい。   In the example shown in FIG. 1, the generation device 100 generates the first graph G11 based on the correspondence between the buyer and the seller (user) in the electronic commerce as shown in the transaction list TL11 (step S1). Each user may be included in one or both of the buyer and the seller. For example, the transaction list TL11 is derived based on the transaction information stored in the transaction information storage unit 121 illustrated in FIG. As shown in the transaction list TL11, buyers (nodes) include buyers (nodes) identified by buyer IDs (node IDs) “N11” to “N14”, “N21” to “N24”, and the like. Hereinafter, the node identified by the buyer ID “N11” is referred to as a node N11. Nodes identified by other buyer IDs are also described in the same manner. For example, a node identified by the buyer ID “N21” is described as a node N21. In the example shown in FIG. 1, only eight nodes N11 to N14 and N21 to N24 in the transaction list TL11 are illustrated for explanation, but the transaction list TL11 includes the number of buyers in electronic commerce, For example, one million nodes may be included.

また、取引一覧表TL11に示すように、売主は、売主ID「SR11」〜「SR14」や「SR21」〜「SR24」等により識別される売主が含まれる。以下では、売主ID「SR11」により識別される売主を売主SR11と記載する。他の売主IDにより識別される売主も同様に記載する。例えば、売主ID「SR21」により識別される売主を売主SR21と記載する。   Further, as shown in the transaction list TL11, the seller includes sellers identified by seller IDs “SR11” to “SR14”, “SR21” to “SR24”, and the like. Hereinafter, the seller identified by the seller ID “SR11” is referred to as seller SR11. The seller identified by other seller ID is described similarly. For example, the seller identified by the seller ID “SR21” is described as the seller SR21.

取引一覧表TL11において、縦の行に示すノードN11〜N14、N21〜N24等と、横の列に示す売主SR11〜SR14、SR21〜SR24との各々が交差するマス目の数値は、対応する買主と売主とが商取引を行った回数を示す。例えば、ノードN11と売主SR11とが交差するマス目(左上のマス目)の数値「5」は、ノードN11に対応する買主と、売主SR11に対応する売主とが5回取引を行ったことを示す。また、例えば、ノードN22と売主SR22とが交差するマス目の数値「10」は、ノードN22に対応する買主と、売主SR22に対応する売主とが10回取引を行ったことを示す。   In the transaction list TL11, the numerical values of the grids where the nodes N11 to N14, N21 to N24, etc. shown in the vertical rows intersect with the sellers SR11 to SR14, SR21 to SR24 shown in the horizontal columns are the corresponding buyers. And the number of times the seller has made a business transaction. For example, the numerical value “5” of the square (the upper left square) where the node N11 and the seller SR11 intersect indicates that the buyer corresponding to the node N11 and the seller corresponding to the seller SR11 have made a transaction five times. Show. Further, for example, the numerical value “10” of the grid where the node N22 and the seller SR22 intersect indicates that the buyer corresponding to the node N22 and the seller corresponding to the seller SR22 have made 10 transactions.

ここで、生成装置100は、第1の主体である買主に対応するノードのうち、所定の回数以上の取引を行った第2の主体である売主の集合間の類似度が所定の閾値以上となるノード間をエッジで連結した第1グラフを生成する。図1では、生成装置100は、買主に対応するノードのうち、5回以上の取引を行った売主の集合間のジャッカード係数が0.2以上となるノード間をエッジで連結した第1グラフG11を生成する。すなわち、図1では、所定の閾値を5回とし、売主の集合間の類似度を示す指標値としてジャッカード係数を用いた場合を示す。   Here, the generation apparatus 100 has a similarity between a set of sellers that are second entities that have made transactions a predetermined number of times or more among nodes corresponding to the buyer that is the first entity and a predetermined threshold value or more. A first graph in which the nodes are connected by an edge is generated. In FIG. 1, the generation apparatus 100 includes a first graph in which nodes having a Jackard coefficient of 0.2 or more between a set of sellers who have made a transaction five or more times are connected by edges among nodes corresponding to buyers. G11 is generated. That is, FIG. 1 shows a case where the predetermined threshold is set to 5 times and the Jackard coefficient is used as an index value indicating the similarity between the sets of sellers.

図1に示す第1グラフG11には、8個のノードN11〜N14、N21〜N24を図示する。各ノードN11〜N14、N21〜N24は、取引一覧表TL11中に含まれる買主に対応する。例えば、第1グラフG11中のノードN11は、取引一覧表TL11中の買主ID「N11」により識別されるノード(買主)に対応する。なお、図1に示す例において、説明のために第1グラフG11中の8個のノードN11〜N14、N21〜N24のみを図示するが、第1グラフG11には、取引一覧表TL11に含まれる買主の数、例えば100万のノードが含まれてもよい。   The first graph G11 illustrated in FIG. 1 illustrates eight nodes N11 to N14 and N21 to N24. Each of the nodes N11 to N14 and N21 to N24 corresponds to a buyer included in the transaction list TL11. For example, the node N11 in the first graph G11 corresponds to a node (buyer) identified by the buyer ID “N11” in the transaction list TL11. In the example shown in FIG. 1, only eight nodes N11 to N14 and N21 to N24 in the first graph G11 are illustrated for explanation, but the first graph G11 is included in the transaction list TL11. The number of buyers, for example 1 million nodes, may be included.

図1の例では、取引一覧表TL11に示すように、ノードN11に対応する買主は、売主SR11に対応する売主から商品を購入した回数(以下、「取引数」ともいう)が5回である。すなわち、ノードN11に対応する買主は、売主SR11に対応する売主から商品を購入した回数(取引数)が所定の閾値以上となる買主である。また、ノードN11に対応する買主は、売主SR13に対応する売主から商品を購入した回数が7回である。すなわち、ノードN11に対応する買主は、売主SR13に対応する売主から商品を購入した回数が所定の閾値以上となる買主である。すなわち、ノードN11に対応する買主について、取引数が所定の閾値以上の売主の集合(以下、「ノードN11の売主集合」ともいう)には、売主SR11や売主SR13等が含まれる。また、取引一覧表TL11に示すように、ノードN13に対応する買主は、売主SR11に対応する売主から商品を購入した回数が6回である。すなわち、ノードN13に対応する買主は、売主SR11に対応する売主から商品を購入した回数が所定の閾値以上となる買主である。また、ノードN13に対応する買主は、売主SR14に対応する売主から商品を購入した回数が7回である。すなわち、ノードN13に対応する買主は、売主SR14に対応する売主から商品を購入した回数が所定の閾値以上となる買主である。すなわち、ノードN13に対応する買主について、取引数が所定の閾値以上の売主の集合(以下、「ノードN13の売主集合」ともいう)には、売主SR11や売主SR14等が含まれる。ここで、生成装置100は、ノードN11の売主集合とノードN13の売主集合とのジャッカード係数が0.2以上となる場合、ノードN11とノードN13との間をエッジで連結する。ここで、上述の例において、ノードN11の売主集合に含まれる売主を売主SR11、売主SR13とし、ノードN13の売主集合に含まれる売主を売主SR11、売主SR14とした場合を例に説明する。この場合、ノードN11とノードN13との売主集合間のジャッカード係数(sim)は、「sim=(ノードN11の売主集合とノードN13の売主集合との積集合)/(ノードN11の売主集合とノードN13の売主集合との和集合)」により算出される。すなわち、ノードN11とノードN13との売主集合間のジャッカード係数(sim)は、「sim=1/3(0.33・・・)」となる。具体的には、ノードN11とノードN13との売主集合間のジャッカード係数(sim)の分母は、ノードN11の売主集合とノードN13の売主集合との和集合の要素数、すなわち売主SR11、SR13、SR14の「3」となる。また、ノードN11とノードN13との売主集合間のジャッカード係数(sim)の分子は、ノードN11の売主集合とノードN13の売主集合との積集合の要素数、すなわち売主SR11の「1」となる。このように、ノードN11の売主集合とノードN13の売主集合との間のジャッカード係数(sim)は、「0.33・・・」となり、閾値「0.2」以上となるため、生成装置100は、ノードN11とノードN13とをエッジで連結した第1グラフG11を生成する。なお、ジャッカード係数(sim)の算出を例示するために、上記のノードN11の売主集合やノードN13の売主集合は、2つの要素のみを含む場合を例示したが、ノードN11の売主集合やノードN13の売主集合は、多数の要素が含まれてもよい。   In the example of FIG. 1, as shown in the transaction list TL11, the buyer corresponding to the node N11 has purchased the product from the seller corresponding to the seller SR11 (hereinafter also referred to as “number of transactions”) five times. . That is, the buyer corresponding to the node N11 is a buyer whose number of purchases (number of transactions) from the seller corresponding to the seller SR11 is equal to or greater than a predetermined threshold. Further, the buyer corresponding to the node N11 has purchased the product seven times from the seller corresponding to the seller SR13. That is, the buyer corresponding to the node N11 is a buyer whose number of purchases of goods from the seller corresponding to the seller SR13 is equal to or greater than a predetermined threshold. That is, with respect to the buyer corresponding to the node N11, the set of sellers whose number of transactions is equal to or greater than a predetermined threshold (hereinafter also referred to as “seller set of the node N11”) includes the seller SR11, the seller SR13, and the like. Further, as shown in the transaction list TL11, the buyer corresponding to the node N13 has purchased the product six times from the seller corresponding to the seller SR11. That is, the buyer corresponding to the node N13 is a buyer whose number of purchases of goods from the seller corresponding to the seller SR11 is equal to or greater than a predetermined threshold. Further, the buyer corresponding to the node N13 has purchased the product seven times from the seller corresponding to the seller SR14. That is, the buyer corresponding to the node N13 is a buyer whose number of purchases of goods from the seller corresponding to the seller SR14 is equal to or greater than a predetermined threshold. That is, for the buyer corresponding to the node N13, the set of sellers whose number of transactions is equal to or greater than a predetermined threshold (hereinafter, also referred to as “seller set of the node N13”) includes the seller SR11, the seller SR14, and the like. Here, when the Jackard coefficient of the seller set of the node N11 and the seller set of the node N13 is 0.2 or more, the generating apparatus 100 connects the node N11 and the node N13 with an edge. Here, in the above example, a case where the seller included in the seller set of the node N11 is the seller SR11 and the seller SR13, and the seller included in the seller set of the node N13 is the seller SR11 and the seller SR14 is described as an example. In this case, the Jackard coefficient (sim) between the seller sets of the node N11 and the node N13 is “sim = (the product set of the seller set of the node N11 and the seller set of the node N13) / (the seller set of the node N11 and The sum set with the seller set of the node N13) ”. That is, the Jackard coefficient (sim) between the seller sets of the node N11 and the node N13 is “sim = 1/3 (0.33...)”. Specifically, the denominator of the Jackard coefficient (sim) between the seller sets of the node N11 and the node N13 is the number of elements of the union of the seller set of the node N11 and the seller set of the node N13, that is, the sellers SR11 and SR13. , SR14 is “3”. Further, the numerator of the Jackard coefficient (sim) between the seller sets of the node N11 and the node N13 is the number of elements of the product set of the seller set of the node N11 and the seller set of the node N13, that is, “1” of the seller SR11. Become. Thus, the Jackard coefficient (sim) between the seller set of the node N11 and the seller set of the node N13 is “0.33...”, Which is equal to or greater than the threshold value “0.2”. 100 generates a first graph G11 in which the node N11 and the node N13 are connected by an edge. In order to illustrate the calculation of the Jackard coefficient (sim), the seller set of the node N11 and the seller set of the node N13 described above include only two elements, but the seller set and node of the node N11 are illustrated. The seller set of N13 may include a number of elements.

また、図1の例では、取引一覧表TL11に示すように、ノードN21に対応する買主は、売主SR22に対応する売主から商品を購入した回数が6回である。そのため、ノードN21に対応する買主について、取引数が所定の閾値以上の売主の集合(以下、「ノードN21の売主集合」ともいう)には、売主SR22等が含まれる。また、取引一覧表TL11に示すように、ノードN22に対応する買主は、売主SR22に対応する売主から商品を購入した回数が10回である。そのため、ノードN21に対応する買主について、取引数が所定の閾値以上の売主の集合(以下、「ノードN22の売主集合」ともいう)には、売主SR22等が含まれる。また、取引一覧表TL11に示すように、ノードN24に対応する買主は、売主SR22に対応する売主から商品を購入した回数が8回である。そのため、ノードN21に対応する買主について、取引数が所定の閾値以上の売主の集合(以下、「ノードN24の売主集合」ともいう)には、売主SR22等が含まれる。また、図1の例では、ノードN21の売主集合とノードN22の売主集合との間のジャッカード係数(sim)は、0.2以上であるものとする。また、ノードN21の売主集合とノードN24の売主集合との間のジャッカード係数(sim)は、0.2以上であるものとする。また、ノードN22の売主集合とノードN24の売主集合との間のジャッカード係数(sim)は、0.2以上であるものとする。これにより、生成装置100は、ノードN21とノードN22とノードN24との各々をエッジで連結した第1グラフG11を生成する。このように、生成装置100は、図1に示すような第1グラフG11を生成する。なお、生成装置100は、ジャッカード係数に限らず、種々の指標に基づいて第1グラフを生成してもよい。例えば、生成装置100は、買主に対応するノードのうち、所定の回数以上の取引を行った売主の集合の積集合に含まれる売主の数が所定の閾値(例えば「2」等)以上となるノード間をエッジで連結した第1グラフを生成してもよい。   In the example of FIG. 1, as shown in the transaction list TL11, the buyer corresponding to the node N21 has purchased the product from the seller corresponding to the seller SR22 six times. Therefore, for the buyer corresponding to the node N21, the set of sellers whose number of transactions is equal to or greater than a predetermined threshold (hereinafter also referred to as “seller set of the node N21”) includes the seller SR22 and the like. Further, as shown in the transaction list TL11, the buyer corresponding to the node N22 has purchased the product 10 times from the seller corresponding to the seller SR22. Therefore, for the buyer corresponding to the node N21, the set of sellers whose number of transactions is equal to or greater than a predetermined threshold (hereinafter also referred to as “the seller set of the node N22”) includes the seller SR22 and the like. Further, as shown in the transaction list TL11, the buyer corresponding to the node N24 has purchased the product eight times from the seller corresponding to the seller SR22. Therefore, for the buyer corresponding to the node N21, the set of sellers whose number of transactions is equal to or greater than a predetermined threshold (hereinafter, also referred to as “seller set of the node N24”) includes the seller SR22 and the like. Further, in the example of FIG. 1, it is assumed that the Jackard coefficient (sim) between the seller set of the node N21 and the seller set of the node N22 is 0.2 or more. Further, it is assumed that the Jackard coefficient (sim) between the seller set of the node N21 and the seller set of the node N24 is 0.2 or more. Further, it is assumed that the Jackard coefficient (sim) between the seller set of the node N22 and the seller set of the node N24 is 0.2 or more. Thereby, the generation device 100 generates the first graph G11 in which each of the node N21, the node N22, and the node N24 is connected by an edge. In this way, the generation device 100 generates the first graph G11 as shown in FIG. Note that the generation device 100 may generate the first graph based on various indexes without being limited to the Jackard coefficient. For example, in the generation device 100, among nodes corresponding to the buyer, the number of sellers included in the intersection set of sellers who have made a transaction a predetermined number of times or more becomes a predetermined threshold (for example, “2” or the like). A first graph in which nodes are connected by edges may be generated.

〔1−2.生成処理(第2グラフ)〕
次に、図2を用いて、実施形態に係る生成処理の一例について説明する。図2は、実施形態に係る生成処理の一例を示す図である。具体的には、図2は、第2グラフの生成処理の一例を示す図である。なお、図2では、生成装置100が図1に示す第1グラフの生成処理により第1グラフを生成するか、外部装置から第1グラフを取得済みである場合を例に説明する。なお、図2に示す例では、ノードの属性情報として、各ノードに対応する買主(ユーザ)が購入した商品のカテゴリ情報が用いられた場合を示す。
[1-2. Generation process (second graph)]
Next, an example of the generation process according to the embodiment will be described with reference to FIG. FIG. 2 is a diagram illustrating an example of a generation process according to the embodiment. Specifically, FIG. 2 is a diagram illustrating an example of a second graph generation process. 2 illustrates an example in which the generation device 100 generates the first graph by the first graph generation processing illustrated in FIG. 1 or the first graph has already been acquired from the external device. In the example shown in FIG. 2, the category information of the product purchased by the buyer (user) corresponding to each node is used as the node attribute information.

また、図2に示す例では、商品のカテゴリ情報として、図6に示すカテゴリ情報記憶部123に示すカテゴリのうち第2階層が用いられた場合を示す。すなわち、図2に示す例では、生成装置100は、属性情報記憶部124に示すような各ノードN11〜N14、N21〜N24が購入した商品のカテゴリ情報を属性情報として用いる。具体的には、属性情報記憶部124に示す横の列のカテゴリC11は、第1階層である「本、雑誌」のカテゴリC1の下位の第2階層である「文芸」(図6参照)に対応する。すなわち、図2に示す例では、ノードN11に対応する買主は、「文芸」のカテゴリC11に属する商品を5回購入したことを示す。また、具体的には、属性情報記憶部124に示す横の列のカテゴリC21は、第1階層である「ファッション」のカテゴリC2の下位の第2階層である「レディース」(図6参照)に対応する。すなわち、図2に示す例では、ノードN22に対応する買主は、「レディース」のカテゴリC21に属する商品を7回購入したことを示す。例えば、各ノードN11〜N14、N21〜N24が購入した商品のカテゴリ情報は、横の列がk列、すなわちk次元のベクトルで表現される。この場合、各ノードN11〜N14、N21〜N24の属性情報は、横の列がk列、すなわちk次元のベクトルで表現される。   Further, the example shown in FIG. 2 shows a case where the second hierarchy is used among the categories shown in the category information storage unit 123 shown in FIG. That is, in the example illustrated in FIG. 2, the generation apparatus 100 uses the category information of the products purchased by the nodes N11 to N14 and N21 to N24 as illustrated in the attribute information storage unit 124 as the attribute information. Specifically, the category C11 in the horizontal column shown in the attribute information storage unit 124 is “literature” (see FIG. 6), which is the second hierarchy lower than the category C1 of “book, magazine”, which is the first hierarchy. Correspond. That is, in the example illustrated in FIG. 2, the buyer corresponding to the node N11 indicates that the product belonging to the “literary” category C11 has been purchased five times. Specifically, the category C21 in the horizontal row shown in the attribute information storage unit 124 is “Ladies” (see FIG. 6), which is the second layer below the category C2 of “Fashion” that is the first layer. Correspond. That is, in the example illustrated in FIG. 2, the buyer corresponding to the node N22 indicates that the product belonging to the category “Claim C21” is purchased seven times. For example, the category information of products purchased by each of the nodes N11 to N14 and N21 to N24 is represented by k columns, that is, k-dimensional vectors. In this case, the attribute information of each of the nodes N11 to N14 and N21 to N24 is represented by k columns, that is, k-dimensional vectors.

図2では、生成装置100は、第1グラフG11から第2グラフG12を生成する(ステップS2)。ここで、生成装置100は、第1グラフG11における一のノード(以下、「第1ノード」ともいう)と他のノード(以下、「第2ノード」ともいう)との間をエッジで連結するかの基準となるスコアを算出する。以下、スコアを算出する対象とする第1ノード及び第2ノード以外のノードを第3ノードとする場合がある。例えば、生成装置100は、第1グラフG11において第1ノードに連結された第3ノードと第1ノードとの類似度や、第1グラフG11において第2ノードに連結された第3ノードと第2ノードとの類似度に基づいて、スコアを算出する。例えば、生成装置100は、以下のような式(1)を用いて、第1ノードと第2ノードとの組み合わせにおけるスコアを算出する。   In FIG. 2, the production | generation apparatus 100 produces | generates the 2nd graph G12 from the 1st graph G11 (step S2). Here, the generation apparatus 100 connects an edge between one node (hereinafter also referred to as “first node”) and another node (hereinafter also referred to as “second node”) in the first graph G11. A standard score is calculated. Hereinafter, a node other than the first node and the second node for which a score is to be calculated may be a third node. For example, the generation apparatus 100 may determine the similarity between the third node connected to the first node and the first node in the first graph G11, and the second node connected to the second node in the first graph G11 and the second node. A score is calculated based on the similarity with the node. For example, the generating apparatus 100 calculates a score in the combination of the first node and the second node using the following equation (1).

Figure 2017162237
Figure 2017162237

上記式(1)中の左辺に示すf(u,v)は、ノードuとノードvとの組み合わせにおけるスコアを示す。また、上記式(1)中の右辺に示すJ(U,na)は、ノードuと第3ノード(例えばノードn)との属性情報の類似度を示す。すなわち、上記式(1)中の「U」は、ノードuの属性情報のベクトル(例えば、k次元のベクトル)を示す。また、上記式(1)中の「na」は、ノードnの属性情報のベクトル(例えば、k次元のベクトル)を示す。また、上記式(1)中の右辺に示すJ(V,na)は、ノードvと第3ノード(例えばノードn)との属性情報の類似度を示す。すなわち、上記式(1)中の「V」は、ノードvの属性情報のベクトル(例えば、k次元のベクトル)を示す。ここで、関数Jは、例えばジャッカード類似度に対応する。例えば、関数Jの値は、以下の式(2)のように算出される。   F (u, v) shown on the left side in the above formula (1) indicates a score in a combination of the node u and the node v. Further, J (U, na) shown on the right side in the above formula (1) indicates the similarity of the attribute information between the node u and the third node (for example, node n). That is, “U” in the above equation (1) indicates a vector of attribute information of the node u (for example, a k-dimensional vector). In addition, “na” in the above formula (1) indicates a vector of attribute information of the node n (for example, a k-dimensional vector). Further, J (V, na) shown on the right side in the above formula (1) indicates the similarity of the attribute information between the node v and the third node (for example, node n). That is, “V” in the above equation (1) indicates a vector of attribute information of the node v (for example, a k-dimensional vector). Here, the function J corresponds to, for example, the Jackard similarity. For example, the value of the function J is calculated as in the following formula (2).

Figure 2017162237
Figure 2017162237

上記の式(2)では、説明のために、J(U,V)とし、ノードuとノードvとの属性情報の類似度を示す。すなわち、上記式(2)中の「U」は、ノードuの属性情報のベクトル(例えば、k次元のベクトル)を示し、「V」は、ノードvの属性情報のベクトル(例えば、k次元のベクトル)を示す。例えば、上記式(2)中の右辺に示すu(以下、「第1指数」ともいう)は、ノードuの属性情報のi次元の要素に対応する値を示す。例えば、uは、属性情報記憶部124に示す情報中において、ノードuの属性情報のi次元の要素に対応する商品の購入回数が所定の基準値以上である場合に「1」であり、所定の基準値未満である場合に「0」であるような値となる。また、例えば、上記式(2)中の右辺に示すv(以下、「第2指数」ともいう)は、ノードvの属性情報のi次元の要素に対応する値を示す。 In the above formula (2), for the sake of explanation, J (U, V) is used, and the similarity of the attribute information between the node u and the node v is indicated. That is, “U” in the above equation (2) indicates a vector of attribute information of the node u (eg, a k-dimensional vector), and “V” is a vector of attribute information of the node v (eg, a k-dimensional vector). Vector). For example, u i (hereinafter also referred to as “first index”) on the right side in the above equation (2) indicates a value corresponding to an i-dimensional element of the attribute information of the node u. For example, u i is “1” when the number of purchases of the product corresponding to the i-dimensional element of the attribute information of the node u is greater than or equal to a predetermined reference value in the information shown in the attribute information storage unit 124. When the value is less than the predetermined reference value, the value is “0”. Further, for example, v i (hereinafter also referred to as “second index”) on the right side in the above equation (2) indicates a value corresponding to an i-dimensional element of the attribute information of the node v.

例えば、ノードuがノードN11であり、iが1である場合、uは、ノードN11の属性情報の1次元の要素、例えばカテゴリC11に対応する値を示す。例えば、ノードuがノードN11であり、iが1であり、所定の基準値を3とした場合、uは、属性情報記憶部124に示す情報中において、ノードuの属性情報の1次元の要素、例えばカテゴリC11に対応する商品の購入回数が5であり、所定の基準値以上であるため、「1」となる。上記式(2)中の右辺における分母は、属性情報の各次元(例えば、1〜k次元)における第1指数uと第2指数vとのうち最大値の合計を示す。また、上記式(2)中の右辺における分子は、属性情報の各次元(例えば、1〜k次元)における第1指数uと第2指数vとのうち最小値の合計を示す。例えば、上記の式(2)のJ(U,V)は、0〜1の値となる。なお、第1指数uや第2指数vには、対応するノードuやノードvの属性情報における商品の購入回数の値が用いられてもよい。 For example, a node u is the node N11, when i is 1, u 1 shows one-dimensional element of the attribute information of the node N11, for example, a value corresponding to the category C11. For example, when the node u is the node N11, i is 1, and the predetermined reference value is 3, u 1 is the one-dimensional attribute information of the node u in the information shown in the attribute information storage unit 124. The number of purchases of the product corresponding to the element, for example, the category C11 is 5, which is equal to or greater than a predetermined reference value, so “1”. The denominator on the right side in the equation (2) indicates the sum of the maximum values of the first index u i and the second index v i in each dimension (for example, 1 to k dimensions) of the attribute information. In addition, the numerator on the right side in the above formula (2) indicates the sum of the minimum values of the first index u i and the second index v i in each dimension (for example, 1 to k dimensions) of the attribute information. For example, J (U, V) in the above equation (2) is a value between 0 and 1. Note that the value of the number of purchases of the product in the attribute information of the corresponding node u or node v may be used for the first index u i or the second index v i .

ここから、上記式(1)に戻って説明する。上記式(1)中のN(u)は、ノードuに連結する第3ノードの集合を示す。なお、ここでいう、ノードuに連結する第3ノードには、ノードuに直接エッジにより連結されるノードに限らず、他の第3ノードを経由して間接的にノードuに連結されるノードも含まれるものとする。なお、どの範囲までのノードをN(u)に含めるかは、目的等に応じて適宜設定されてもよい。例えば、上記式(1)中のN(u)には、ノードuにエッジで連結されたノードに連結されるノードまでを含めてもよい。上記式(1)中のN(v)は、ノードvに連結する第3ノードの集合を示す。なお、どの範囲までのノードをN(v)に含めるかは、上述したN(u)と同様に目的等に応じて適宜設定されてもよい。   From here, it returns to the said Formula (1) and demonstrates. N (u) in the above equation (1) indicates a set of third nodes connected to the node u. Here, the third node connected to the node u is not limited to a node directly connected to the node u by an edge, but is a node indirectly connected to the node u via another third node. Is also included. It should be noted that up to which range nodes are included in N (u) may be appropriately set according to the purpose or the like. For example, N (u) in the above equation (1) may include a node connected to a node connected to the node u by an edge. N (v) in the above formula (1) indicates a set of third nodes connected to the node v. It should be noted that the range of nodes to be included in N (v) may be appropriately set according to the purpose or the like, as in the case of N (u) described above.

上記式(1)中の右辺における分母は、ノードuに連結する第3ノードとノードvに連結する第3ノードとの和集合における、各第3ノードとノードuとの属性類似度と、各第3ノードとノードvとの属性類似度とのうち値が最大の属性類似度の値の合計を示す。上記式(1)中の右辺における分子は、ノードuに連結する第3ノードとノードvに連結する第3ノードとの積集合における、各第3ノードとノードuとの属性類似度と、各第3ノードとノードvとの属性類似度とのうち値が最小の属性類似度の値の合計を示す。例えば、上記の式(1)のf(u,v)は、0〜1の値となる。   The denominator on the right side in the above equation (1) is the attribute similarity between each third node and node u in the union of the third node connected to node u and the third node connected to node v, and The sum of the attribute similarity values having the maximum value among the attribute similarity values of the third node and the node v is shown. The numerator on the right side in the above formula (1) is the attribute similarity between each third node and node u in the product set of the third node connected to node u and the third node connected to node v. The sum of the attribute similarity values having the smallest value among the attribute similarity values of the third node and the node v is shown. For example, f (u, v) in the above formula (1) has a value of 0 to 1.

生成装置100は、上記式(1)により算出されたスコアと、所定の閾値とに基づいて、第1ノードと第2ノードとの間のエッジを変更した第2グラフG12を生成する。例えば、生成装置100は、上記式(1)により算出されたスコアと、所定の閾値とに基づいて、第1グラフG11においてノード間を連結したエッジを解除したり、ノード間を新たなエッジにより連結したりすることにより、第2グラフG12を生成する。   The generation device 100 generates the second graph G12 in which the edge between the first node and the second node is changed based on the score calculated by the above formula (1) and a predetermined threshold value. For example, the generating apparatus 100 cancels an edge connecting nodes in the first graph G11 based on the score calculated by the above formula (1) and a predetermined threshold, or uses a new edge between nodes. The second graph G12 is generated by connecting them.

例えば、所定の閾値を0.5とするものとする。この場合、生成装置100は、例えば、上記式(1)により算出されたスコアが0.5以上である場合、スコアに対応する第1ノードと第2ノードとの間をエッジで連結する。例えば、生成装置100は、第1グラフG11においてエッジで連結された第1ノードと第2ノードのスコアが0.5以上である場合、スコアに対応する第1ノードと第2ノードとの間を連結するエッジを維持する。また、例えば、生成装置100は、第1グラフG11においてエッジで連結されていない第1ノードと第2ノードのスコアが0.5以上である場合、スコアに対応する第1ノードと第2ノードとの間をエッジで連結する。また、例えば、生成装置100は、第1グラフG11においてエッジで連結された第1ノードと第2ノードのスコアが0.5未満である場合、スコアに対応する第1ノードと第2ノードとの間を連結するエッジを解除する。   For example, assume that the predetermined threshold is 0.5. In this case, for example, when the score calculated by the above formula (1) is 0.5 or more, the generation device 100 connects the first node and the second node corresponding to the score with an edge. For example, when the score of the first node and the second node connected by the edge in the first graph G11 is 0.5 or more, the generation apparatus 100 determines whether the first node corresponding to the score is between the first node and the second node. Maintain connecting edges. In addition, for example, when the score of the first node and the second node that are not connected by the edge in the first graph G11 is 0.5 or more, the generation device 100 includes the first node and the second node corresponding to the score, Connect between the edges. Further, for example, when the score of the first node and the second node connected by the edge in the first graph G11 is less than 0.5, the generation device 100 calculates the first node and the second node corresponding to the score. Release the edge that connects them.

図2の例では、生成装置100は、第1グラフG11においてエッジで連結されていないノードN11とノードN12のスコアが0.8であり閾値以上であるため、第2グラフG12において、ノードN11とノードN12との間をエッジで連結する。また、図2の例では、生成装置100は、第1グラフG11においてエッジで連結されたノードN11とノードN13のスコアが0.7であり閾値以上であるため、第2グラフG12においても、ノードN11とノードN13との間を連結するエッジを維持する。また、図2の例では、生成装置100は、第1グラフG11においてエッジで連結されたノードN21とノードN22のスコアが0.2であり閾値未満であるため、第2グラフG12において、ノードN21とノードN22との間を連結するエッジを解除する。   In the example of FIG. 2, the generation device 100 has a node N11 and a node N12 that are not connected by an edge in the first graph G11, and the score is equal to or greater than the threshold value. Therefore, in the second graph G12, The node N12 is connected by an edge. In the example of FIG. 2, the generation device 100 has a node N11 and a node N13 connected by edges in the first graph G11 having a score of 0.7, which is equal to or higher than the threshold value. An edge connecting N11 and node N13 is maintained. In the example of FIG. 2, the generation device 100 has a node N21 and a node N22 connected by edges in the first graph G11 with a score of 0.2, which is less than the threshold value. And the edge connecting the node N22 is released.

このように、生成装置100は、第1グラフG11における複数のノードのうち、第1ノードの属性情報及び第2ノードの属性情報と第3ノードの属性情報との関係性に基づいて、第1ノードと第2ノードとの間のエッジを変更した第2グラフG12を生成する。これにより、生成装置100は、ネットワーク上における主体を所望の関係性に基づいて連結するグラフを適切に生成することができる。   As described above, the generation apparatus 100 selects the first node based on the first node attribute information and the relationship between the second node attribute information and the third node attribute information among the plurality of nodes in the first graph G11. A second graph G12 in which the edge between the node and the second node is changed is generated. Thereby, the production | generation apparatus 100 can produce | generate the graph which connects the main body on a network based on desired relationship appropriately.

また、例えば、生成装置100は、第2グラフG12に含まれるクリーク(極大クリーク)等に基づいて、ノードをクラスタリングしてもよい。例えば、ここでいうクリークとは、そのクリークに含まれる各ノード間が全て連結されたノード群を意味する。なお、生成装置100は、マイクロクラスタリング等の従来手法を適宜用いてノードをクラスタリングしてもよい。例えば、生成装置100は、非特許文献1に記載されたクリーク計算処理を用いて、ノードをクラスタリングしてもよい。また、例えば、生成装置100は、グラフのクリーク・極大クリークを抽出する処理(プログラム)、例えばMACE(MAximal Clique Enumerater)を用いてもよい。なお、上記は一例であり、生成装置100は、どのような手段によりノードをクラスタリングしてもよい。   Further, for example, the generation apparatus 100 may cluster nodes based on a clique (maximum clique) included in the second graph G12. For example, the clique here means a node group in which all nodes included in the clique are all connected. Note that the generation apparatus 100 may cluster nodes using a conventional method such as microclustering as appropriate. For example, the generation apparatus 100 may cluster nodes using the clique calculation process described in Non-Patent Document 1. Further, for example, the generation apparatus 100 may use processing (program) for extracting a clique / maximum clique of a graph, for example, MACE (MAximal Clique Enumerater). Note that the above is an example, and the generation apparatus 100 may cluster nodes by any means.

例えば、生成装置100は、第2グラフG12において各ノード間がエッジで連結されたノード群を1つのクラスタとしてクラスタリングしてもよい。例えば、生成装置100は、第2グラフG12に含まれるノードN11とノードN12とノードN13とは、全てのノードがエッジで連結されたクリークである。例えば、生成装置100は、第2グラフG12に含まれるノードN11とノードN12とノードN13とを1つのクラスタとしてクラスタリングしてもよい。また、例えば、生成装置100は、第2グラフG12に含まれるノードN11とノードN12とノードN14とを1つのクラスタとしてクラスタリングしてもよい。また、第2グラフG12において、ノードN13とノードN14とがエッジで連結される場合、生成装置100は、ノードN11とノードN12とノードN13とノードN14とを1つのクラスタとしてクラスタリングしてもよい。   For example, the generating apparatus 100 may cluster a node group in which nodes are connected by an edge in the second graph G12 as one cluster. For example, in the generation device 100, the node N11, the node N12, and the node N13 included in the second graph G12 are cliques in which all nodes are connected by edges. For example, the generation device 100 may cluster the node N11, the node N12, and the node N13 included in the second graph G12 as one cluster. For example, the generation device 100 may cluster the node N11, the node N12, and the node N14 included in the second graph G12 as one cluster. In the second graph G12, when the node N13 and the node N14 are connected by an edge, the generation device 100 may cluster the node N11, the node N12, the node N13, and the node N14 as one cluster.

なお上述した例では、買主に対応するノード間をエッジで連結した第1グラフを用いる場合を示したが、生成装置100は、買主に限らず種々の主体に対応するノード間をエッジで連結した第1グラフを用いてもよい。例えば、生成装置100は、所定のSNS(Social Networking Service)における主体(ユーザ)に対応するノード間をエッジで連結した第1グラフを用いてもよい。例えば、生成装置100は、ネットワーク(Web)上におけるユーザ(人間)の相関関係を示すソーシャルグラフを第1グラフとしても用いてもよい。すなわち、生成装置100は、ネットワーク上におけるユーザの相関関係を示すグラフを第1グラフとして用いてもよい。なお、ノードには、ソーシャルグラフに含まれる主体(ユーザ)全体が含まれてもよいし、所定の条件を満たす一部の主体(ユーザ)が含まれてもよい。また、例えば、ノードには実空間上に対象物(主体)であれば、ユーザに限らず、種々の対象物に対応付けられてもよい。例えば、いわゆるIoT(Internet of Things)等に関する種々の技術により電子機器同士が相互に通信可能な場合、例えばウェアラブル端末等の各電子機器を1つの主体として、各電子機器をノードに対応付けてもよい。この場合、主体(ユーザ)に対応する概念には、ユーザが使用する電子機器やユーザに操作に依らず自律的に動作する電子機器等、人間以外の種々の行動主体が含まれてもよい。上述のように、生成装置100は、ユーザに限らず、種々の対象物(主体)に対応づけられたノード間をエッジで連結した第1グラフを用いて、第2グラフを生成してもよい。すなわち、生成装置100は、ユーザや電子機器が混在した第1グラフを用いて、第2グラフを生成してもよい。例えば、生成装置100は、ユーザに対応するノードと電子機器に対応するノードとがエッジで連結された第1グラフを用いて、第2グラフを生成してもよい。このように、生成装置100は、どのような主体に対応するノード間をエッジで連結した第1グラフを用いてもよい。すなわち、生成装置100は、どのような第1グラフを用いて、第2グラフを生成してもよい。   In the above-described example, the case where the first graph in which nodes corresponding to the buyer are connected by the edge is used is shown. However, the generation apparatus 100 connects the nodes corresponding to various subjects by the edge without being limited to the buyer. The first graph may be used. For example, the generating apparatus 100 may use a first graph in which nodes corresponding to a subject (user) in a predetermined SNS (Social Networking Service) are connected by an edge. For example, the generation apparatus 100 may use a social graph indicating the correlation of the user (human) on the network (Web) as the first graph. That is, the generating apparatus 100 may use a graph indicating the correlation between users on the network as the first graph. Note that the node may include the entire subject (user) included in the social graph, or may include some subject (user) satisfying a predetermined condition. Further, for example, a node may be associated with various objects as well as a user as long as it is an object (subject) in real space. For example, when electronic devices can communicate with each other by various technologies related to so-called IoT (Internet of Things) or the like, for example, each electronic device such as a wearable terminal may be used as one entity, and each electronic device may be associated with a node. Good. In this case, the concept corresponding to the subject (user) may include various action subjects other than humans such as an electronic device used by the user and an electronic device that operates autonomously regardless of an operation by the user. As described above, the generation apparatus 100 may generate the second graph using the first graph in which nodes associated with various objects (subjects) are connected by edges, not limited to the user. . That is, the generating apparatus 100 may generate the second graph using the first graph in which users and electronic devices are mixed. For example, the generating apparatus 100 may generate the second graph using a first graph in which a node corresponding to the user and a node corresponding to the electronic device are connected by an edge. Thus, the generation apparatus 100 may use a first graph in which nodes corresponding to any subject are connected by an edge. That is, the generating apparatus 100 may generate the second graph using any first graph.

〔2.生成装置の構成〕
次に、図3を用いて、実施形態に係る生成装置100の構成について説明する。図3は、実施形態に係る生成装置の構成例を示す図である。生成装置100は、第1グラフに基づいて、第2グラフを生成する情報処理装置である。図3に示すように、生成装置100は、通信部110と、記憶部120と、制御部130とを有する。なお、生成装置100は、各種の情報を表示する表示部や、各種の情報を入力する入力部を有してもよい。
[2. Configuration of the generator
Next, the configuration of the generation apparatus 100 according to the embodiment will be described with reference to FIG. FIG. 3 is a diagram illustrating a configuration example of the generation apparatus according to the embodiment. The generation device 100 is an information processing device that generates a second graph based on the first graph. As illustrated in FIG. 3, the generation device 100 includes a communication unit 110, a storage unit 120, and a control unit 130. Note that the generation apparatus 100 may include a display unit that displays various types of information and an input unit that inputs various types of information.

(通信部110)
通信部110は、例えば、NIC等によって実現される。そして、通信部110は、所定のネットワークと有線または無線で接続され、外部の情報処理装置との間で情報の送受信を行う。
(Communication unit 110)
The communication unit 110 is realized by a NIC or the like, for example. The communication unit 110 is connected to a predetermined network by wire or wireless, and transmits / receives information to / from an external information processing apparatus.

(記憶部120)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。実施形態に係る記憶部120は、図3に示すように、取引情報記憶部121と、第1グラフ情報記憶部122と、カテゴリ情報記憶部123と、属性情報記憶部124と、スコア情報記憶部125と、第2グラフ情報記憶部126とを有する。
(Storage unit 120)
The storage unit 120 is realized by, for example, a semiconductor memory device such as a RAM (Random Access Memory) or a flash memory, or a storage device such as a hard disk or an optical disk. As shown in FIG. 3, the storage unit 120 according to the embodiment includes a transaction information storage unit 121, a first graph information storage unit 122, a category information storage unit 123, an attribute information storage unit 124, and a score information storage unit. 125 and a second graph information storage unit 126.

(取引情報記憶部121)
実施形態に係る取引情報記憶部121は、取引情報を記憶する。図4は、実施形態に係る取引情報記憶部の一例を示す図である。図4に示す例においては、取引情報として、電子商取引における取引のログ情報が記憶される。例えば、取引情報記憶部121に記憶された取引情報は、第1グラフの生成に用いられる。図4に示すように、取引情報記憶部121は、取引情報として、「取引ID」、「買主ID(ノードID)」、「売主ID」、「商品ID」、「日時」等の項目を有する。なお、項目は上記に限らず、取引情報記憶部121は、取引された商品が属するカテゴリに関する項目や取引金額等に関する項目など、目的に応じて種々の項目を有してもよい。
(Transaction information storage unit 121)
The transaction information storage unit 121 according to the embodiment stores transaction information. FIG. 4 is a diagram illustrating an example of a transaction information storage unit according to the embodiment. In the example shown in FIG. 4, transaction log information in electronic commerce is stored as transaction information. For example, the transaction information stored in the transaction information storage unit 121 is used for generating the first graph. As shown in FIG. 4, the transaction information storage unit 121 includes items such as “transaction ID”, “buyer ID (node ID)”, “seller ID”, “product ID”, and “date / time” as transaction information. . Note that the items are not limited to the above, and the transaction information storage unit 121 may have various items depending on the purpose, such as items related to a category to which a traded product belongs and items related to a transaction amount.

「取引ID」は、電子商取引における各取引を識別するための識別情報を示す。「買主ID(ノードID)」は、対応する取引IDにより識別される取引における買主である主体(ユーザ)を識別するための識別情報を示す。また、「売主ID」は、対応する取引IDにより識別される取引における売主である主体(ユーザ)を識別するための識別情報を示す。なお、図4に示す例においては、買主IDとして、ノードIDを用いた場合を示すが、ノードIDと対応付けられたユーザIDやショップIDを用いてもよい。また、ノードIDは、図1に示す各ノードの符号に対応する。例えば、ノードID「N11」により識別される買主は、図1に示すノードN11に対応する。すなわち、ノードID「N11」により識別されるノードと、図1中のノードN11とは同じノードを示し、図1に示す他のノードについても同様である。また、「商品ID」は、対応する取引IDにより識別される取引において売買された商品を識別するための識別情報を示す。また、「日時」は、対応する取引IDにより識別される取引が成立した日時を示す。   “Transaction ID” indicates identification information for identifying each transaction in the electronic commerce. The “buyer ID (node ID)” indicates identification information for identifying the subject (user) who is the buyer in the transaction identified by the corresponding transaction ID. “Seller ID” indicates identification information for identifying a subject (user) who is a seller in the transaction identified by the corresponding transaction ID. In the example illustrated in FIG. 4, a node ID is used as the buyer ID, but a user ID or shop ID associated with the node ID may be used. The node ID corresponds to the code of each node shown in FIG. For example, the buyer identified by the node ID “N11” corresponds to the node N11 illustrated in FIG. That is, the node identified by the node ID “N11” and the node N11 in FIG. 1 indicate the same node, and the same applies to the other nodes illustrated in FIG. The “product ID” indicates identification information for identifying a product sold and sold in the transaction identified by the corresponding transaction ID. The “date and time” indicates the date and time when the transaction identified by the corresponding transaction ID is established.

例えば、図4に示す例において、取引ID「T11」により識別される取引は、買主ID(ノードID)「N11」により識別されるノードに対応する買主が、売主ID「SR11」により識別される売主から、商品ID「G11」により識別される商品を、日時「2016/2/22 13:05」に購入したことを示す。   For example, in the example shown in FIG. 4, in the transaction identified by the transaction ID “T11”, the buyer corresponding to the node identified by the buyer ID (node ID) “N11” is identified by the seller ID “SR11”. This indicates that the merchandise identified by the merchandise ID “G11” is purchased from the seller on the date “2016/2/22 13:05”.

(第1グラフ情報記憶部122)
実施形態に係る第1グラフ情報記憶部122は、第1グラフに関する情報(以下、「第1グラフ情報」や単に「第1グラフ」ともいう)を記憶する。図5は、実施形態に係る第1グラフ情報記憶部の一例を示す図である。図5に示すように、第1グラフ情報記憶部122は、第1グラフ情報として、ノードID(買主ID)により識別される買主に対応するノード間を連結するエッジの有無を記憶する。例えば、ノード間を連結するエッジが有る場合は「1」を記憶し、ノード間を連結するエッジが無い場合は「0」を記憶する。
(First graph information storage unit 122)
The first graph information storage unit 122 according to the embodiment stores information related to the first graph (hereinafter also referred to as “first graph information” or simply “first graph”). FIG. 5 is a diagram illustrating an example of the first graph information storage unit according to the embodiment. As illustrated in FIG. 5, the first graph information storage unit 122 stores, as first graph information, the presence / absence of an edge connecting nodes corresponding to buyers identified by node IDs (buyer IDs). For example, “1” is stored when there is an edge connecting nodes, and “0” is stored when there is no edge connecting nodes.

例えば、図5に示す例において、ノードID「N11」の行とノードID「N12」の列とが交差する領域には、ノードID「N11」により識別される買主に対応するノードとノードID「N12」により識別される買主に対応するノードとの間におけるエッジの有無が記憶される。図5に示す例においては、ノードID「N11」の行とノードID「N12」の列とが交差する領域には、「0」が記憶される。つまり、ノードID「N11」により識別される買主に対応するノードとノードID「N12」により識別される買主に対応するノードとの間にはエッジが連結されていないことを示す。また、図5に示す例においては、ノードID「N11」の行とノードID「N13」の列とが交差する領域には、「1」が記憶される。つまり、ノードID「N11」により識別される買主に対応するノードとノードID「N13」により識別される買主に対応するノードとの間にはエッジが連結されていることを示す。このように、第1グラフ情報記憶部122において「1」が記憶された領域に対応するノード間にはエッジが連結されていることを示す。   For example, in the example illustrated in FIG. 5, in a region where the row of the node ID “N11” and the column of the node ID “N12” intersect, the node corresponding to the buyer identified by the node ID “N11” and the node ID “ The presence or absence of an edge with the node corresponding to the buyer identified by “N12” is stored. In the example illustrated in FIG. 5, “0” is stored in an area where the row of the node ID “N11” and the column of the node ID “N12” intersect. That is, the edge is not connected between the node corresponding to the buyer identified by the node ID “N11” and the node corresponding to the buyer identified by the node ID “N12”. In the example illustrated in FIG. 5, “1” is stored in an area where the row of the node ID “N11” and the column of the node ID “N13” intersect. That is, the edge is connected between the node corresponding to the buyer identified by the node ID “N11” and the node corresponding to the buyer identified by the node ID “N13”. In this way, the first graph information storage unit 122 indicates that an edge is connected between the nodes corresponding to the area where “1” is stored.

また、図5に示す例において、ノードID「N12」の行とノードID「N11」の列とが交差する領域には、ノードID「N11」の行とノードID「N12」の列とが交差する領域と同様の情報が記憶される。なお、生成装置100は、ノードID「N11」の行とノードID「N12」の列とが交差する領域かノードID「N12」の行とノードID「N11」の列とが交差する領域かのいずれか一方のみを記憶してもよい。なお、ノードID「N11」の行とノードID「N11」の列とが交差する領域には、「0」を記憶してもよい。他のノードID「N12」等についても同様である。また、図5に示す例においては、ノードIDとノードIDとの行列(マトリクス)の形状で記憶される場合を一例として図示したが、第1グラフ情報を記憶できれば、どのように記憶されてもよい。例えば、第1グラフ情報は、各ノードIDに対してエッジが張られているノードID、すなわち各ノードIDと連結されているノードIDのリストを保存する辞書の形状で記憶されてもよい。   In the example illustrated in FIG. 5, the row of the node ID “N11” and the column of the node ID “N12” intersect in the region where the row of the node ID “N12” and the column of the node ID “N11” intersect. The same information as the area to be stored is stored. The generation apparatus 100 determines whether the row of the node ID “N11” and the column of the node ID “N12” intersects or the region of the node ID “N12” and the column of the node ID “N11” intersect. Only one of them may be stored. Note that “0” may be stored in an area where the row of the node ID “N11” and the column of the node ID “N11” intersect. The same applies to other node IDs “N12” and the like. In the example shown in FIG. 5, the case of storing in the form of a matrix of node IDs and node IDs is illustrated as an example. However, as long as the first graph information can be stored, it can be stored in any way. Good. For example, the first graph information may be stored in the form of a dictionary that stores a node ID having an edge with respect to each node ID, that is, a list of node IDs linked to each node ID.

(カテゴリ情報記憶部123)
実施形態に係るカテゴリ情報記憶部123は、カテゴリに関する情報(以下、「カテゴリ情報」ともいう)を記憶する。図6は、実施形態に係るカテゴリ情報記憶部の一例を示す図である。図6に示す例においては、取引される商品を分類するカテゴリに関する情報が記憶される。図6に示すように、カテゴリ情報記憶部123は、カテゴリ情報として、「第1階層」、「第2階層」、「第3階層」の項目を有する。なお、項目は上記に限らず、カテゴリ情報記憶部123は、カテゴリの階層構造に応じて「第4階層」や「第5階層」等の項目を有してもよい。
(Category information storage unit 123)
The category information storage unit 123 according to the embodiment stores information related to categories (hereinafter also referred to as “category information”). FIG. 6 is a diagram illustrating an example of the category information storage unit according to the embodiment. In the example shown in FIG. 6, information related to a category for classifying a traded product is stored. As illustrated in FIG. 6, the category information storage unit 123 includes items of “first hierarchy”, “second hierarchy”, and “third hierarchy” as category information. The items are not limited to the above, and the category information storage unit 123 may include items such as “fourth hierarchy” and “fifth hierarchy” in accordance with the hierarchical structure of categories.

「第1階層」には、「本、雑誌」のカテゴリC1や「ファッション」のカテゴリC2等が含まれる。また、第1階層である「本、雑誌」のカテゴリC1の下位の「第2階層」には、「文芸」のカテゴリC11や「子ども」のカテゴリC12等が含まれる。また、第2階層である「文芸」のカテゴリC11の下位の「第3階層」には、「ファンタジー」のカテゴリC111や「ノンフィクション」のカテゴリC112や「歴史」のカテゴリC113等が含まれる。なお、上記のカテゴリ階層は一例であり、目的に応じて種々のカテゴリ階層が構成されてもよい。また、カテゴリ情報記憶部123に記憶されるカテゴリ情報は、適宜変更されてもよい。この点については後述する。   The “first hierarchy” includes a “book, magazine” category C1, a “fashion” category C2, and the like. Further, the “second hierarchy” below the “book, magazine” category C1, which is the first hierarchy, includes the “literary” category C11, the “children” category C12, and the like. Further, the “third hierarchy” below the “literary” category C11 which is the second hierarchy includes a “fantasy” category C111, a “non-fiction” category C112, a “history” category C113, and the like. The above category hierarchy is an example, and various category hierarchies may be configured according to the purpose. The category information stored in the category information storage unit 123 may be changed as appropriate. This point will be described later.

(属性情報記憶部124)
実施形態に係る属性情報記憶部124は、買主(ユーザ)の属性に関する情報(以下、「属性情報」ともいう)を記憶する。図7は、実施形態に係る属性情報記憶部の一例を示す図である。図7に示す例においては、属性情報記憶部124には、買主(ユーザ)が購入した商品のカテゴリ情報が属性情報として記憶される。図7に示すように、属性情報記憶部124は、属性情報として、ノードID(買主ID)により識別される買主が購入した商品のカテゴリごとにその購入回数を記憶する。
(Attribute information storage unit 124)
The attribute information storage unit 124 according to the embodiment stores information related to buyer (user) attributes (hereinafter also referred to as “attribute information”). FIG. 7 is a diagram illustrating an example of the attribute information storage unit according to the embodiment. In the example illustrated in FIG. 7, the attribute information storage unit 124 stores, as attribute information, category information of a product purchased by the buyer (user). As shown in FIG. 7, the attribute information storage unit 124 stores the number of times of purchase for each category of the product purchased by the buyer identified by the node ID (buyer ID) as attribute information.

例えば、図7に示す例においては、ノードN11に対応する買主は、「文芸」のカテゴリC11に属する商品を5回購入し、「子ども」のカテゴリC12に属する商品を購入したことがないことを示す。また、例えば、図7に示す例においては、ノードN12に対応する買主は、「文芸」のカテゴリC11に属する商品を4回購入し、「子ども」のカテゴリC12に属する商品を1回購入したことを示す。   For example, in the example shown in FIG. 7, the buyer corresponding to the node N11 has purchased a product belonging to the category “C11” of “literary arts” five times and has never purchased a product belonging to the category “C12” of “children”. Show. Further, for example, in the example illustrated in FIG. 7, the buyer corresponding to the node N12 has purchased a product belonging to the “literary” category C11 four times and purchased a product belonging to the “children” category C12 once. Indicates.

(スコア情報記憶部125)
実施形態に係るスコア情報記憶部125は、各ノードの組み合わせにおけるスコアに関する情報(以下、「スコア情報」ともいう)を記憶する。図8は、実施形態に係るスコア情報記憶部の一例を示す図である。図8に示す例においては、第1ノードと第2ノードとの組み合わせごとに算出されたスコアが記憶される。図8に示すように、スコア情報記憶部125は、スコア情報として、「買主ID(ノードID)」、「スコア」の項目を有する。また、「買主ID(ノードID)」には、「第1ノード」、「第2ノード」の項目が含まれる。なお、項目は上記に限らず、スコア情報記憶部125は、目的に応じて種々の項目を有してもよい。
(Score information storage unit 125)
The score information storage unit 125 according to the embodiment stores information related to the score in each node combination (hereinafter also referred to as “score information”). FIG. 8 is a diagram illustrating an example of the score information storage unit according to the embodiment. In the example illustrated in FIG. 8, the score calculated for each combination of the first node and the second node is stored. As shown in FIG. 8, the score information storage unit 125 includes items of “buyer ID (node ID)” and “score” as score information. The “buyer ID (node ID)” includes items of “first node” and “second node”. Note that the items are not limited to the above, and the score information storage unit 125 may have various items according to the purpose.

「第1ノード」及び「第2ノード」は、対応するスコアを算出する対象となった一組のノードを示す。「スコア」は、対応する一組のノードについて算出されたスコアを示す。   “First node” and “second node” indicate a set of nodes for which the corresponding score is calculated. “Score” indicates a score calculated for a corresponding set of nodes.

例えば、図8に示す例においては、ノードN11とノードN12との一組のノードについて算出されたスコアが「0.8」であることを示す。また、例えば、図8に示す例においては、ノードN11とノードN13との一組のノードについて算出されたスコアが「0.7」であることを示す。また、例えば、図8に示す例においては、ノードN21とノードN22との一組のノードについて算出されたスコアが「0.2」であることを示す。   For example, the example shown in FIG. 8 indicates that the score calculated for a set of nodes N11 and N12 is “0.8”. Further, for example, in the example illustrated in FIG. 8, the score calculated for a set of nodes of the node N11 and the node N13 is “0.7”. For example, in the example illustrated in FIG. 8, the score calculated for a pair of nodes of the node N21 and the node N22 is “0.2”.

(第2グラフ情報記憶部126)
実施形態に係る第2グラフ情報記憶部126は、第2グラフに関する情報(以下、「第2グラフ情報」や単に「第2グラフ」ともいう)を記憶する。図9は、実施形態に係る第2グラフ情報記憶部の一例を示す図である。図9に示すように、第2グラフ情報記憶部126は、第2グラフ情報として、ノードID(買主ID)により識別される買主に対応するノード間を連結するエッジの有無を記憶する。具体的には、第2グラフ情報記憶部126は、第1グラフ情報記憶部122に記憶された第1グラフ情報に基づいて生成された第2グラフ情報を記憶する。例えば、ノード間を連結するエッジが有る場合は「1」を記憶し、ノード間を連結するエッジが無い場合は「0」を記憶する。
(Second graph information storage unit 126)
The second graph information storage unit 126 according to the embodiment stores information related to the second graph (hereinafter also referred to as “second graph information” or simply “second graph”). FIG. 9 is a diagram illustrating an example of the second graph information storage unit according to the embodiment. As illustrated in FIG. 9, the second graph information storage unit 126 stores, as second graph information, the presence / absence of an edge that connects nodes corresponding to the buyer identified by the node ID (buyer ID). Specifically, the second graph information storage unit 126 stores second graph information generated based on the first graph information stored in the first graph information storage unit 122. For example, “1” is stored when there is an edge connecting nodes, and “0” is stored when there is no edge connecting nodes.

例えば、図9に示す例において、ノードID「N11」の行とノードID「N12」の列とが交差する領域には、ノードID「N11」により識別される買主に対応するノードとノードID「N12」により識別される買主に対応するノードとの間におけるエッジの有無が記憶される。図9に示す例においては、ノードID「N11」の行とノードID「N12」の列とが交差する領域には、「1」が記憶される。つまり、ノードID「N11」により識別される買主に対応するノードとノードID「N12」により識別される買主に対応するノードとの間にはエッジが連結されていることを示す。このように、第2グラフ情報記憶部126に記憶された第2グラフ情報には、第1グラフ情報記憶部122に記憶された第1グラフ情報においてエッジが連結されていなかったノードN11とノードN12との間にエッジが連結されたことを示す。   For example, in the example illustrated in FIG. 9, in a region where the row of the node ID “N11” and the column of the node ID “N12” intersect, the node corresponding to the buyer identified by the node ID “N11” and the node ID “ The presence or absence of an edge with the node corresponding to the buyer identified by “N12” is stored. In the example illustrated in FIG. 9, “1” is stored in an area where the row of the node ID “N11” and the column of the node ID “N12” intersect. That is, the edge is connected between the node corresponding to the buyer identified by the node ID “N11” and the node corresponding to the buyer identified by the node ID “N12”. As described above, the second graph information stored in the second graph information storage unit 126 includes the nodes N11 and N12 whose edges are not connected in the first graph information stored in the first graph information storage unit 122. Indicates that an edge is connected between

例えば、図9に示す例において、ノードID「N21」の行とノードID「N22」の列とが交差する領域には、ノードID「N21」により識別される買主に対応するノードとノードID「N22」により識別される買主に対応するノードとの間におけるエッジの有無が記憶される。図9に示す例においては、ノードID「N21」の行とノードID「N22」の列とが交差する領域には、「0」が記憶される。つまり、ノードID「N21」により識別される買主に対応するノードとノードID「N22」により識別される買主に対応するノードとの間にはエッジが連結されていないことを示す。このように、第2グラフ情報記憶部126に記憶された第2グラフ情報には、第1グラフ情報記憶部122に記憶された第1グラフ情報においてエッジが連結されていたノードN21とノードN22との間のエッジが解除されたことを示す。   For example, in the example illustrated in FIG. 9, in a region where the row of the node ID “N21” and the column of the node ID “N22” intersect, the node identified by the node ID “N21” and the node ID “ The presence or absence of an edge with the node corresponding to the buyer identified by “N22” is stored. In the example illustrated in FIG. 9, “0” is stored in an area where the row of the node ID “N21” and the column of the node ID “N22” intersect. That is, the edge is not connected between the node corresponding to the buyer identified by the node ID “N21” and the node corresponding to the buyer identified by the node ID “N22”. As described above, the second graph information stored in the second graph information storage unit 126 includes the nodes N21 and N22 whose edges are connected in the first graph information stored in the first graph information storage unit 122. Indicates that the edge between has been released.

また、図9に示す例において、ノードID「N12」の行とノードID「N11」の列とが交差する領域には、ノードID「N11」の行とノードID「N12」の列とが交差する領域と同様の情報が記憶される。なお、生成装置100は、ノードID「N11」の行とノードID「N12」の列とが交差する領域かノードID「N12」の行とノードID「N11」の列とが交差する領域かのいずれか一方のみを記憶してもよい。なお、ノードID「N11」の行とノードID「N11」の列とが交差する領域には、「0」を記憶してもよい。他のノードID「N12」等についても同様である。また、図9に示す例においては、ノードIDとノードIDとの行列(マトリクス)の形状で記憶される場合を一例として図示したが、第2グラフ情報を記憶できれば、どのように記憶されてもよい。例えば、第2グラフ情報は、各ノードIDに対してエッジが張られているノードID、すなわち各ノードIDと連結されているノードIDのリストを保存する辞書の形状で記憶されてもよい。   In the example illustrated in FIG. 9, the row of the node ID “N11” and the column of the node ID “N12” intersect in the region where the row of the node ID “N12” and the column of the node ID “N11” intersect. The same information as the area to be stored is stored. The generation apparatus 100 determines whether the row of the node ID “N11” and the column of the node ID “N12” intersects or the region of the node ID “N12” and the column of the node ID “N11” intersect. Only one of them may be stored. Note that “0” may be stored in an area where the row of the node ID “N11” and the column of the node ID “N11” intersect. The same applies to other node IDs “N12” and the like. In the example shown in FIG. 9, the case where the shape is stored in the form of a matrix of node IDs and node IDs is illustrated as an example. However, as long as the second graph information can be stored, it can be stored in any way. Good. For example, the second graph information may be stored in the form of a dictionary that stores a node ID having an edge with respect to each node ID, that is, a list of node IDs linked to each node ID.

(制御部130)
図3の説明に戻って、制御部130は、例えば、コントローラ(Controller)であり、CPUやMPU等によって、生成装置100内部の記憶装置に記憶されている各種プログラム(生成プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部130は、例えば、コントローラ(Controller)であり、ASICやFPGA等の集積回路により実現される。
(Control unit 130)
Returning to the description of FIG. 3, the control unit 130 is, for example, a controller, and various programs (corresponding to an example of a generation program) stored in a storage device inside the generation device 100 by a CPU, an MPU, or the like. Is implemented by using the RAM as a work area. The control unit 130 is, for example, a controller, and is realized by an integrated circuit such as an ASIC or FPGA.

図3に示すように、制御部130は、取得部131と、第1生成部132と、第2生成部133と、送信部134とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部130の内部構成は、図3に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、制御部130が有する各処理部の接続関係は、図3に示した接続関係に限られず、他の接続関係であってもよい。   As shown in FIG. 3, the control unit 130 includes an acquisition unit 131, a first generation unit 132, a second generation unit 133, and a transmission unit 134, and functions and functions of information processing described below. Realize or execute. Note that the internal configuration of the control unit 130 is not limited to the configuration illustrated in FIG. 3, and may be another configuration as long as the information processing described below is performed. Further, the connection relationship between the processing units included in the control unit 130 is not limited to the connection relationship illustrated in FIG. 3, and may be another connection relationship.

(取得部131)
取得部131は、各種情報を取得する。取得部131は、取引情報や第1グラフ情報等を取得する。例えば、取得部131は、電子商取引のサービスを提供する外部装置から取引情報を取得してもよい。また、取得部131は、電子商取引のサービスを提供する外部装置から取得した取引情報を取引情報記憶部121に格納する。また、例えば、取得部131は、属性情報記憶部124から属性情報を取得する。
(Acquisition part 131)
The acquisition unit 131 acquires various types of information. The acquisition unit 131 acquires transaction information, first graph information, and the like. For example, the acquisition unit 131 may acquire transaction information from an external device that provides an electronic commerce service. The acquisition unit 131 stores transaction information acquired from an external device that provides an electronic commerce service in the transaction information storage unit 121. For example, the acquisition unit 131 acquires attribute information from the attribute information storage unit 124.

また、取得部131は、第1グラフ情報等を取得する。例えば、取得部131は、各第1の主体と所定の関係を有する第2の主体が所定の条件を満たす第1の主体に対応するノード間をエッジで連結した第1グラフを取得する。例えば、取得部131は、各買主と所定の関係を有する売主の集合が所定の条件を満たす買主に対応するノード間をエッジで連結した第1グラフを取得する。例えば、取得部131は、買主に対応するノードのうち、所定の回数以上の取引を行った売主の集合間の類似度が所定の閾値以上となるノード間をエッジで連結した第1グラフを取得する。例えば、取得部131は、買主に対応するノードのうち、5回以上の取引を行った売主の集合間のジャッカード係数が0.2以上となるノード間をエッジで連結した第1グラフを取得する。例えば、取得部131は、各ノードに属性情報が対応付けられた第1グラフを取得する。例えば、取得部131は、属性情報として各ノードに対応するユーザと所定の関係を有する商品のカテゴリ情報が各ノードに対応付けられた第1グラフを取得する。例えば、取得部131は、属性情報として各ノードに対応するユーザが購入した商品のカテゴリ情報が各ノードに対応付けられた第1グラフを取得する。例えば、取得部131は、第1グラフ情報記憶部122から第1グラフ情報を取得する。また、例えば、取得部131は、外部装置から第1グラフ情報を取得してもよい。また、取得部131は外部装置から取得した第1グラフ情報を第1グラフ情報記憶部122に格納してもよい。また、取得部131は、属性情報として各ノードに対応するユーザの属性情報が各ノードに対応付けられた第1グラフを取得してもよい。取得部131は、各ノードに第1カテゴリの属性情報と第2カテゴリの属性情報とが対応付けられた第1グラフを取得する。なお、これらの点については後述する。   The acquisition unit 131 acquires first graph information and the like. For example, the acquisition unit 131 acquires a first graph in which nodes corresponding to a first entity satisfying a predetermined condition by a second entity having a predetermined relationship with each first entity are connected by an edge. For example, the acquisition unit 131 acquires a first graph in which nodes corresponding to buyers satisfying a predetermined condition with a set of sellers having a predetermined relationship with each buyer are connected by an edge. For example, the acquisition unit 131 acquires a first graph in which nodes having a similarity equal to or greater than a predetermined threshold among nodes corresponding to the buyer are connected by an edge. To do. For example, the acquisition unit 131 acquires a first graph in which nodes having a Jackard coefficient of 0.2 or more between a set of sellers who have made a transaction five times or more are connected by an edge among nodes corresponding to the buyer. To do. For example, the acquisition unit 131 acquires a first graph in which attribute information is associated with each node. For example, the acquisition unit 131 acquires a first graph in which category information of a product having a predetermined relationship with a user corresponding to each node is associated with each node as attribute information. For example, the acquisition unit 131 acquires a first graph in which category information of a product purchased by a user corresponding to each node is associated with each node as attribute information. For example, the acquisition unit 131 acquires first graph information from the first graph information storage unit 122. For example, the acquisition unit 131 may acquire first graph information from an external device. The acquisition unit 131 may store the first graph information acquired from the external device in the first graph information storage unit 122. Moreover, the acquisition part 131 may acquire the 1st graph with which the attribute information of the user corresponding to each node was matched with each node as attribute information. The acquisition unit 131 acquires a first graph in which attribute information of the first category and attribute information of the second category are associated with each node. These points will be described later.

(第1生成部132)
第1生成部132は、取引情報に基づいて第1グラフを生成する。例えば、第1生成部132は、各買主と所定の関係を有する売主の集合が所定の条件を満たす買主に対応するノード間をエッジで連結した第1グラフを生成する。例えば、第1生成部132は、取引情報記憶部121に記憶された取引情報に基づいて、第1グラフを生成する。図1では、第1生成部132は、取引一覧表TL11に示すような電子商取引における買主と売主(ユーザ)との対応に基づいて第1グラフG11を生成する。例えば、第1生成部132は、買主に対応するノードのうち、所定の回数以上の取引を行った売主の集合間の類似度が所定の閾値以上となるノード間をエッジで連結した第1グラフを生成する。図1では、第1生成部132は、買主に対応するノードのうち、5回以上の取引を行った売主の集合間のジャッカード係数が0.2以上となるノード間をエッジで連結した第1グラフG11を生成する。例えば、第1生成部132は、ノードN11とノードN13とをエッジで連結した第1グラフG11を生成する。例えば、第1生成部132は、ノードN21とノードN22とノードN24との各々をエッジで連結した第1グラフG11を生成する。
(First generation unit 132)
The 1st production | generation part 132 produces | generates a 1st graph based on transaction information. For example, the first generation unit 132 generates a first graph in which a set of sellers having a predetermined relationship with each buyer connects nodes corresponding to buyers satisfying a predetermined condition with edges. For example, the first generation unit 132 generates the first graph based on the transaction information stored in the transaction information storage unit 121. In FIG. 1, the 1st production | generation part 132 produces | generates the 1st graph G11 based on a response | compatibility with the buyer and seller (user) in electronic commerce as shown in transaction list TL11. For example, the first generation unit 132 includes, among the nodes corresponding to the buyer, a first graph in which nodes having a similarity between a set of sellers who have made a transaction a predetermined number of times or more are connected by edges. Is generated. In FIG. 1, the 1st production | generation part 132 connected between the nodes from which the Jackard coefficient between the sets of the seller who performed the transaction 5 times or more among the nodes corresponding to a buyer became 0.2 or more with an edge. One graph G11 is generated. For example, the first generation unit 132 generates a first graph G11 in which the node N11 and the node N13 are connected by an edge. For example, the first generation unit 132 generates a first graph G11 in which each of the node N21, the node N22, and the node N24 is connected by an edge.

なお、生成装置100は、外部装置から第1グラフ情報を取得する場合、第1生成部132を有しなくてもよい。   Note that the generation device 100 may not include the first generation unit 132 when acquiring the first graph information from the external device.

(第2生成部133)
第2生成部133は、第1グラフに基づいて第2グラフを生成する生成部である。例えば、第2生成部133は、取得部131により取得された第1グラフにおける複数のノードのうち、第1ノード及び第2ノードと第3ノードとの関係性に基づいて、第1ノードと第2ノードとの間のエッジを変更した第2グラフを生成する。
(Second generation unit 133)
The second generation unit 133 is a generation unit that generates a second graph based on the first graph. For example, the second generation unit 133 selects the first node and the second node based on the relationship between the first node, the second node, and the third node among the plurality of nodes in the first graph acquired by the acquisition unit 131. A second graph in which an edge between two nodes is changed is generated.

また、第2生成部133は、第1ノード及び第2ノードとの間がエッジで連結された第3ノードとの関係性に基づいて、第2グラフを生成する。例えば、第2生成部133は、第1ノードと第3ノードとの類似度と、第2ノードと第3ノードとの類似度とに基づいて、第2グラフを生成する。例えば、第2生成部133は、第1ノード及び第2ノードとの間がエッジで連結された第3ノードの数に基づいて、第2グラフを生成する。   The second generation unit 133 generates the second graph based on the relationship with the third node in which the first node and the second node are connected by an edge. For example, the second generation unit 133 generates the second graph based on the similarity between the first node and the third node and the similarity between the second node and the third node. For example, the second generation unit 133 generates the second graph based on the number of third nodes in which the first node and the second node are connected by an edge.

また、第2生成部133は、第1ノードの属性情報及び第2ノードの属性情報と第3ノードの属性情報との関係性に基づいて、第2グラフを生成する。また、例えば、第2生成部133は、属性情報として各ノードに対応するユーザが購入した商品のカテゴリ情報が各ノードに対応付けられた第1グラフに基づいて、第2グラフを生成する。   The second generation unit 133 generates the second graph based on the attribute information of the first node and the relationship between the attribute information of the second node and the attribute information of the third node. For example, the 2nd generation part 133 generates the 2nd graph based on the 1st graph where the category information of the goods which the user corresponding to each node purchased as attribute information was matched with each node.

図2では、第2生成部133は、第1グラフG11から第2グラフG12を生成する。例えば、第2生成部133は、第1グラフG11において第1ノードに連結された第3ノードと第1ノードとの類似度や、第1グラフG11において第2ノードに連結された第3ノードと第2ノードとの類似度に基づいて、スコアを算出する。例えば、第2生成部133は、上記式(1)を用いて、第1ノードと第2ノードとの組み合わせにおけるスコアを算出する。   In FIG. 2, the second generation unit 133 generates a second graph G12 from the first graph G11. For example, the second generation unit 133 includes a similarity between the first node and the third node connected to the first node in the first graph G11, and the third node connected to the second node in the first graph G11. A score is calculated based on the similarity with the second node. For example, the second generation unit 133 calculates a score in the combination of the first node and the second node using the above formula (1).

例えば、第2生成部133は、上記式(1)により算出されたスコアと、所定の閾値とに基づいて、第1ノードと第2ノードとの間のエッジを変更した第2グラフG12を生成する。例えば、第2生成部133は、上記式(1)により算出されたスコアと、所定の閾値とに基づいて、第1グラフG11においてノード間を連結したエッジを解除したり、ノード間を新たなエッジにより連結したりすることにより、第2グラフG12を生成する。   For example, the second generation unit 133 generates the second graph G12 in which the edge between the first node and the second node is changed based on the score calculated by the above formula (1) and a predetermined threshold value. To do. For example, the second generation unit 133 cancels an edge connecting nodes in the first graph G11 based on the score calculated by the above formula (1) and a predetermined threshold, or creates a new node between nodes. The second graph G12 is generated by connecting the edges.

例えば、図2の例では、第2生成部133は、上記式(1)により算出されたスコアが0.5以上である場合、スコアに対応する第1ノードと第2ノードとの間をエッジで連結する。例えば、第2生成部133は、第1グラフG11においてエッジで連結された第1ノードと第2ノードのスコアが0.5以上である場合、スコアに対応する第1ノードと第2ノードとの間を連結するエッジを維持する。また、例えば、第2生成部133は、第1グラフG11においてエッジで連結されていない第1ノードと第2ノードのスコアが0.5以上である場合、スコアに対応する第1ノードと第2ノードとの間をエッジで連結する。また、例えば、第2生成部133は、第1グラフG11においてエッジで連結された第1ノードと第2ノードのスコアが0.5未満である場合、スコアに対応する第1ノードと第2ノードとの間を連結するエッジを解除する。   For example, in the example of FIG. 2, when the score calculated by the above equation (1) is 0.5 or more, the second generation unit 133 performs an edge between the first node and the second node corresponding to the score. Connect with For example, when the score of the first node and the second node connected by the edge in the first graph G11 is 0.5 or more, the second generation unit 133 calculates the first node and the second node corresponding to the score. Maintain edges that connect between them. In addition, for example, when the score of the first node and the second node that are not connected by the edge in the first graph G11 is 0.5 or more, the second generation unit 133 sets the first node and the second corresponding to the score. Connect nodes with edges. In addition, for example, when the score of the first node and the second node connected by the edge in the first graph G11 is less than 0.5, the second generation unit 133 outputs the first node and the second node corresponding to the score. The edge which connects between is released.

例えば、第2生成部133は、第1グラフG11においてエッジで連結されていないノードN11とノードN12のスコアが0.8であり閾値以上であるため、第2グラフG12において、ノードN11とノードN12との間をエッジで連結する。また、例えば、第2生成部133は、第1グラフG11においてエッジで連結されたノードN11とノードN13のスコアが0.7であり閾値以上であるため、第2グラフG12においても、ノードN11とノードN13との間を連結するエッジを維持する。また、例えば、第2生成部133は、第1グラフG11においてエッジで連結されたノードN21とノードN22のスコアが0.2であり閾値未満であるため、第2グラフG12において、ノードN21とノードN22との間を連結するエッジを解除する。   For example, since the score of the node N11 and the node N12 that are not connected by the edge in the first graph G11 is 0.8 and is equal to or higher than the threshold value, the second generation unit 133 has the node N11 and the node N12 in the second graph G12. Is connected with an edge. Further, for example, the second generation unit 133 has a node N11 and a node N13 connected by edges in the first graph G11 having a score of 0.7, which is equal to or higher than the threshold value. An edge connecting the node N13 is maintained. In addition, for example, the second generation unit 133 has a node N21 and a node N22 connected by edges in the first graph G11 having a score of 0.2 that is less than the threshold. The edge connecting N22 is released.

なお、第2生成部133は、上記の第2グラフの生成に限らず、以下のような各種処理を行ってもよい。例えば、第2生成部133は、第2グラフに含まれる所定のクラスタに属するノードの属性情報に基づいて、属性情報に対応するカテゴリを変更する。また、例えば、第2生成部133は、第2グラフに含まれる所定のクラスタに属するノードに共通する属性情報が複数ある場合、当該属性情報に対応するカテゴリを統合する。また、例えば、第2生成部133は、第2グラフに含まれる複数のクラスタの各々に属するノードに共通する属性情報がある場合、当該属性情報に対応するカテゴリを分割する。また、例えば、第2生成部133は、属性情報として各ノードに対応するユーザの属性情報が各ノードに対応付けられた第1グラフに基づいて、第2グラフを生成してもよい。また、例えば、第2生成部133は、第1ノードの第1カテゴリの属性情報及び第2ノードの第1カテゴリの属性情報と第3ノードの第1カテゴリの属性情報との関係性に基づいて、第1カテゴリの第2グラフを生成する。また、例えば、第2生成部133は、第1ノードの第2カテゴリの属性情報及び第2ノードの第2カテゴリの属性情報と第3ノードの第2カテゴリの属性情報との関係性に基づいて、第2カテゴリの第2グラフを生成する。また、例えば、第2生成部133は、第1カテゴリの第2グラフと第2カテゴリの第2グラフとに基づいて、第2グラフを生成する。なお、これらの点については後述する。   In addition, the 2nd production | generation part 133 may perform the following various processes not only in production | generation of said 2nd graph. For example, the second generation unit 133 changes the category corresponding to the attribute information based on the attribute information of nodes belonging to a predetermined cluster included in the second graph. For example, when there are a plurality of attribute information common to nodes belonging to a predetermined cluster included in the second graph, the second generation unit 133 integrates categories corresponding to the attribute information. For example, when there is attribute information common to nodes belonging to each of a plurality of clusters included in the second graph, the second generation unit 133 divides a category corresponding to the attribute information. For example, the second generation unit 133 may generate the second graph based on the first graph in which the attribute information of the user corresponding to each node is associated with each node as the attribute information. Further, for example, the second generation unit 133 is based on the attribute information of the first category of the first node and the relationship between the attribute information of the first category of the second node and the attribute information of the first category of the third node. The second graph of the first category is generated. Further, for example, the second generation unit 133 is based on the attribute information of the second category of the first node and the relationship between the attribute information of the second category of the second node and the attribute information of the second category of the third node. Then, a second graph of the second category is generated. Further, for example, the second generation unit 133 generates a second graph based on the second graph of the first category and the second graph of the second category. These points will be described later.

(送信部134)
送信部134は、各種情報を外部装置へ送信する。例えば、送信部134は、外部の情報処理装置に第2生成部133により生成された第2グラフ情報を送信してもよい。
(Transmitter 134)
The transmission unit 134 transmits various types of information to an external device. For example, the transmission unit 134 may transmit the second graph information generated by the second generation unit 133 to an external information processing apparatus.

〔3.生成処理のフロー〕
次に、図10を用いて、実施形態に係る生成装置100による生成処理の手順について説明する。図10は、実施形態に係る生成装置100による生成処理手順を示すフローチャートである。
[3. Generation process flow)
Next, a generation process procedure performed by the generation apparatus 100 according to the embodiment will be described with reference to FIG. FIG. 10 is a flowchart illustrating a generation processing procedure performed by the generation apparatus 100 according to the embodiment.

図10に示すように、生成装置100の取得部131は、取引情報を取得する(ステップS101)。例えば、取得部131は、取引情報記憶部121から取引情報を取得する。そして、生成装置100の第1生成部132は、取得部131により取得された取引情報に基づいて第1グラフを生成する(ステップS102)。例えば、第1生成部132は、第1グラフG11を生成する。   As illustrated in FIG. 10, the acquisition unit 131 of the generation apparatus 100 acquires transaction information (step S101). For example, the acquisition unit 131 acquires transaction information from the transaction information storage unit 121. And the 1st production | generation part 132 of the production | generation apparatus 100 produces | generates a 1st graph based on the transaction information acquired by the acquisition part 131 (step S102). For example, the first generation unit 132 generates the first graph G11.

その後、取得部131は、属性情報を取得する(ステップS103)。例えば、取得部131は、属性情報記憶部124から属性情報を取得する。そして、生成装置100の第2生成部133は、ステップS102において生成された第1グラフとステップS103において取得された属性情報に基づいて、ノードの組み合わせごとにスコアを算出する(ステップS104)。例えば、第2生成部133は、上記式(1)を用いて、第1ノードと第2ノードとの組み合わせにおけるスコアを算出する。   Thereafter, the acquisition unit 131 acquires attribute information (step S103). For example, the acquisition unit 131 acquires attribute information from the attribute information storage unit 124. And the 2nd production | generation part 133 of the production | generation apparatus 100 calculates a score for every combination of a node based on the 1st graph produced | generated in step S102, and the attribute information acquired in step S103 (step S104). For example, the second generation unit 133 calculates a score in the combination of the first node and the second node using the above formula (1).

そして、第2生成部133は、ステップS104において算出したスコアに基づいて、第2グラフを生成する(ステップS105)。例えば、第2生成部133は、第2グラフG12を生成する。なお、ステップS104とステップS105は、繰り返し行われてもよい。例えば、生成装置100は、各ノードの組み合わせごとにスコアを算出し、そのノード間のエッジを解除したり、そのノード間をエッジで連結したりする処理を繰り返してもよい。   Then, the second generation unit 133 generates a second graph based on the score calculated in step S104 (step S105). For example, the second generation unit 133 generates the second graph G12. Note that step S104 and step S105 may be repeated. For example, the generating apparatus 100 may calculate a score for each combination of nodes, and repeat the process of releasing edges between the nodes or connecting the nodes with edges.

〔4.変形例〕
上述した実施形態に係る生成装置100は、上記実施形態以外にも種々の異なる形態にて実施されてもよい。そこで、以下では、生成装置100の他の実施形態について説明する。
[4. (Modification)
The generation apparatus 100 according to the above-described embodiment may be implemented in various different forms other than the above-described embodiment. Therefore, in the following, another embodiment of the generation apparatus 100 will be described.

〔5.他の属性情報を有する生成装置の構成〕
上記例においては、ユーザ(買主)の属性情報として、買主が購入した商品のカテゴリ情報が用いられる場合を示したが、買主の属性情報は商品のカテゴリ情報に限らず種々の情報が用いられてもよい。すなわち、属性情報には種々の異なるカテゴリの属性情報が適宜用いられてもよい。この点について、図11を用いて、変形例に係る生成装置100Aの構成について説明する。図11は、変形例に係る生成装置の構成例を示す図である。なお、生成装置100Aにおいて、実施形態に係る生成装置100と同様の構成は、同一の符号を付して説明を省略する。
[5. Configuration of generation apparatus having other attribute information]
In the above example, the category information of the product purchased by the buyer is used as the attribute information of the user (buyer). However, the buyer's attribute information is not limited to the category information of the product, but various information is used. Also good. That is, attribute information of various different categories may be used as appropriate for the attribute information. With respect to this point, the configuration of the generation device 100A according to the modification will be described with reference to FIG. FIG. 11 is a diagram illustrating a configuration example of a generation apparatus according to a modification. Note that in the generation device 100A, the same configurations as those of the generation device 100 according to the embodiment are denoted by the same reference numerals, and description thereof is omitted.

図11に示すように、生成装置100Aは、記憶部120Aに属性情報記憶部124Aやスコア情報記憶部125Aや第2グラフ情報記憶部126Aを有する点において生成装置100と相違する。なお、図11に示す例では、カテゴリ情報記憶部を図示しないが、生成装置100Aは、カテゴリ情報記憶部を有してもよい。   As illustrated in FIG. 11, the generation device 100A is different from the generation device 100 in that the storage unit 120A includes an attribute information storage unit 124A, a score information storage unit 125A, and a second graph information storage unit 126A. In the example illustrated in FIG. 11, the category information storage unit is not illustrated, but the generation apparatus 100A may include a category information storage unit.

(属性情報記憶部124A)
変形例に係る属性情報記憶部124Aは、買主(ユーザ)の属性情報を記憶する。図12は、変形例に係る属性情報記憶部の一例を示す図である。図12に示す例においては、属性情報記憶部124Aには、買主の人口統計学的属性(デモグラフィック属性)が属性情報として記憶される。図12に示すように、属性情報記憶部124Aは、属性情報として、ノードID(買主ID)により識別される買主の性別や年齢等に関するデモグラフィック属性を記憶する。なお、属性情報には、デモグラフィック属性に限らず、目的に応じて種々の情報が含まれてもよい。例えば、属性情報には、心理学的属性(サイコグラフィック属性)に関する情報が含まれてもよい。
(Attribute information storage unit 124A)
The attribute information storage unit 124A according to the modification stores the attribute information of the buyer (user). FIG. 12 is a diagram illustrating an example of the attribute information storage unit according to the modification. In the example shown in FIG. 12, the demographic attribute (demographic attribute) of the buyer is stored as attribute information in the attribute information storage unit 124A. As shown in FIG. 12, the attribute information storage unit 124A stores demographic attributes relating to the sex, age, etc. of the buyer identified by the node ID (buyer ID) as attribute information. The attribute information is not limited to the demographic attribute, and may include various information depending on the purpose. For example, the attribute information may include information regarding psychological attributes (psychographic attributes).

例えば、図12に示す例においては、縦の行の各ノードに対応する買主が、横の列の各属性情報に該当する場合には「1」を、属性情報に該当しない場合には「0」を記憶する。例えば、ノードN11に対応する買主は、属性情報「男性」が「0」であり、属性情報「女性」が「1」であり、属性情報「20代」が「1」であり、属性情報「30代」が「0」である。すなわち、ノードN11に対応する買主は、20代女性のユーザであることを示す。   For example, in the example shown in FIG. 12, when the buyer corresponding to each node in the vertical row corresponds to each attribute information in the horizontal column, “1” is indicated. When the buyer does not correspond to the attribute information, “0” is indicated. Is memorized. For example, the buyer corresponding to the node N11 has the attribute information “male” “0”, the attribute information “female” “1”, the attribute information “20's” “1”, and the attribute information “ “30s” is “0”. That is, the buyer corresponding to the node N11 indicates that it is a female user in their 20s.

また、スコア情報記憶部125Aや第2グラフ情報記憶部126Aには、上記の属性情報記憶部124Aに記憶された属性情報に基づいて算出されたスコアや第2グラフが記憶されるが、図示を省略する。   The score information storage unit 125A and the second graph information storage unit 126A store the score and the second graph calculated based on the attribute information stored in the attribute information storage unit 124A. Omitted.

変形例に係る第2生成部133は、上記式(2)の第1指数uや第2指数vには、属性情報記憶部124Aに示す情報中において、ノードuの属性情報のi次元の領域に記憶された値を用いて、スコアを算出してもよい。 The second generation unit 133 according to the modified example uses the i-dimensional attribute information of the node u in the information shown in the attribute information storage unit 124A in the first index u i and the second index v i of the above formula (2). The score may be calculated using the value stored in the area.

例えば、ノードuがノードN11であり、iが1である場合、uは、ノードN11の属性情報の1次元の要素、例えば属性情報「男性」に対応する値を示す。例えば、ノードuがノードN11であり、iが1である場合、uは、属性情報記憶部124Aに示す情報中において、ノードuの属性情報の1次元の要素、例えば属性情報「男性」に対応する値「0」となる。また、例えば、ノードuがノードN11であり、iが2である場合、uは、属性情報記憶部124Aに示す情報中において、ノードuの属性情報の2次元の要素、例えば属性情報「女性」に対応する値「1」となる。変形例に係る第2生成部133は、上述したように属性情報記憶部124Aに記憶された値を用いて、スコアを算出し、第2グラフを生成してもよい。 For example, a node u is the node N11, when i is 1, u 1 shows one-dimensional element of the attribute information of the node N11, a value corresponding to, for example, attribute information "male". For example, when the node u is the node N11 and i is 1, u 1 is the one-dimensional element of the attribute information of the node u in the information shown in the attribute information storage unit 124A, for example, the attribute information “male”. The corresponding value is “0”. Further, for example, a node u is the node N11, when i is 2, u 2, during the information indicating the attribute information storage unit 124A, 2-dimensional element in the attribute information of the node u, for example, attribute information "female "1" corresponding to "". The second generation unit 133 according to the modification may calculate a score using the value stored in the attribute information storage unit 124A as described above, and generate a second graph.

なお、生成装置100Aは、属性情報に対応するカテゴリ情報を記憶してもよい。例えば、生成装置100Aは、属性情報にユーザの職業等が含まれる場合、職業の階層構造を示すカテゴリ情報等を記憶するカテゴリ情報記憶部を有してもよい。また、上述した例では、生成装置100Aは、記憶部120Aにカテゴリ情報記憶部123や属性情報記憶部124を有しない例を示したが、生成装置100Aは、記憶部120Aにカテゴリ情報記憶部123や属性情報記憶部124を有してもよい。また、生成装置100Aは、カテゴリ情報記憶部123や属性情報記憶部124に対応するスコア情報記憶部125や第2グラフ情報記憶部126を有してもよい。すなわち、実施形態に係る生成装置100と変形例に係る生成装置100Aとは統合されて1つの生成装置として用いられてもよい。   Note that the generation device 100A may store category information corresponding to the attribute information. For example, the generation device 100A may include a category information storage unit that stores category information indicating a hierarchical structure of occupations when the attribute information includes a user occupation or the like. In the above-described example, the generation apparatus 100A shows an example in which the storage unit 120A does not include the category information storage unit 123 and the attribute information storage unit 124. However, the generation apparatus 100A includes the category information storage unit 123 in the storage unit 120A. Or an attribute information storage unit 124. In addition, the generation device 100A may include a score information storage unit 125 and a second graph information storage unit 126 corresponding to the category information storage unit 123 and the attribute information storage unit 124. That is, the generation device 100 according to the embodiment and the generation device 100A according to the modification may be integrated and used as one generation device.

〔6.カテゴリの変更〕
なお、生成装置100や生成装置100Aは、例えば、第2グラフに含まれるノードのクラスタリングの結果に応じて、カテゴリの変更を行ってもよい。この点について、図13及び図14を用いて説明する。例えば、以下のようなカテゴリの変更処理は、生成装置100や生成装置100Aの第2生成部133が行ってもよい。なお、以下では、生成装置100が処理を行う場合を例に示す。
[6. (Category change)
Note that the generation device 100 and the generation device 100A may change the category according to the result of clustering the nodes included in the second graph, for example. This point will be described with reference to FIGS. For example, the following category change process may be performed by the generation device 100 or the second generation unit 133 of the generation device 100A. Hereinafter, a case where the generation apparatus 100 performs processing will be described as an example.

〔6−1.カテゴリの統合〕
まず、図13を用いて、カテゴリの統合について説明する。図13は、カテゴリの統合の一例を示す図である。例えば、生成装置100の第2生成部133は、第2グラフに含まれる所定のクラスタに属するノードに共通する属性情報が複数ある場合、当該属性情報に対応するカテゴリを統合する。
[6-1. Category integration
First, category integration will be described with reference to FIG. FIG. 13 is a diagram illustrating an example of category integration. For example, when there are a plurality of attribute information common to nodes belonging to a predetermined cluster included in the second graph, the second generation unit 133 of the generation apparatus 100 integrates categories corresponding to the attribute information.

図13に示す例では、生成装置100は、カテゴリ情報CLT11−1に示すようなカテゴリ情報を用いる。カテゴリ情報CLT11−1中の「第1階層」には、「第1分類C」のカテゴリC3等が含まれる。また、第1階層である「第1分類C」のカテゴリC3の下位の「第2階層」には、「第2分類_1」のカテゴリC31等が含まれる。また、第2階層である「第2分類_1」のカテゴリC31の下位の「第3階層」には、「第3分類_1」のカテゴリC311や「第3分類_2」のカテゴリC312や「第3分類_3」のカテゴリC313や「第3分類_4」のカテゴリC314等が含まれる。   In the example illustrated in FIG. 13, the generation device 100 uses category information as illustrated in the category information CLT 11-1. The “first hierarchy” in the category information CLT 11-1 includes the category C3 of “first classification C” and the like. Further, the “second hierarchy” that is lower than the category C3 of “first classification C” that is the first hierarchy includes the category C31 of “second classification_1” and the like. In addition, in the “third hierarchy” below the category C31 of “second classification_1” that is the second hierarchy, the category C311 of “third classification_1”, the category C312 of “third classification_2”, and “third The category C313 of "Classification_3", the category C314 of "Third classification_4", and the like are included.

図13に示す例では、生成装置100は、生成した第2グラフにおけるノード間の連結に基づいて、各ノードをクラスタリングする。例えば、生成装置100は、クラスタ一覧LT11に示すように、生成した第2グラフにおいてエッジで連結されたノードN111やノードN112やノードN113をクラスタCL11としてクラスタリングする。また、例えば、生成装置100は、生成した第2グラフにおいてエッジで連結された他のノード群をクラスタCL12としてクラスタリングする。   In the example illustrated in FIG. 13, the generation device 100 clusters each node based on the connection between the nodes in the generated second graph. For example, as illustrated in the cluster list LT11, the generation apparatus 100 clusters the nodes N111, N112, and N113 connected by edges in the generated second graph as the cluster CL11. Further, for example, the generating apparatus 100 clusters other node groups connected by edges in the generated second graph as the cluster CL12.

図13に示す例では、クラスタ一覧LT11に示すように、クラスタCL11に属するノードN111やノードN112やノードN113は、カテゴリC311とカテゴリC313との値が大きい点で共通する。そこで、生成装置100は、カテゴリC311とカテゴリC313とを1つのカテゴリに統合する(ステップS21)。例えば、生成装置100は、図13中のカテゴリ情報CLT11−2に示すように、カテゴリC311とカテゴリC313とを新たなカテゴリである「第3分類_I−3」のカテゴリC311−3に統合する。   In the example shown in FIG. 13, as shown in the cluster list LT11, the node N111, the node N112, and the node N113 belonging to the cluster CL11 are common in that the values of the category C311 and the category C313 are large. Therefore, the generation device 100 integrates the category C311 and the category C313 into one category (step S21). For example, as illustrated in the category information CLT11-2 in FIG. 13, the generation apparatus 100 integrates the category C311 and the category C313 into the new category “Category 3_I-3” category C311-3.

これにより、生成装置100は、クラスタリングの結果に基づいてカテゴリを変更したカテゴリ情報を用いることにより、ノードの属性情報を反映した第2グラフを生成することができる。したがって、生成装置100は、より適切なクラスタリングを行うことが可能となる。なお、図13の例では、説明を簡単にするために、同じ第2階層である第2分類_1であるカテゴリC31の下位階層を統合する例を示したが、生成装置100は、同じクラスタにクラスタリングされたノードの属性情報の類似性に基づいて、上位階層が異なるカテゴリを統合してもよい。また、上記の統合は一例であり、生成装置100は、種々の条件に基づいて、カテゴリを統合してもよい。例えば、生成装置100は、あるクラスタ中の半分(50%)以上の買主が同じ2つのカテゴリの商品を購入している場合には、2つのカテゴリを統合してもよい。   Thereby, the production | generation apparatus 100 can produce | generate the 2nd graph reflecting the attribute information of a node by using the category information which changed the category based on the result of clustering. Therefore, the generation apparatus 100 can perform more appropriate clustering. Note that, in the example of FIG. 13, in order to simplify the description, an example in which the lower hierarchy of the category C31 that is the second classification_1 that is the same second hierarchy is shown. Categories having different upper layers may be integrated based on the similarity of the attribute information of the clustered nodes. Moreover, said integration is an example and the production | generation apparatus 100 may integrate a category based on various conditions. For example, when more than half (50%) of buyers in a cluster purchase the same two categories of products, the generation apparatus 100 may integrate the two categories.

〔6−2.カテゴリの分割〕
次に、図14を用いて、カテゴリの分割について説明する。図14は、カテゴリの分割の一例を示す図である。例えば、生成装置100の第2生成部133は、第2グラフに含まれる複数のクラスタの各々に属するノードに共通する属性情報がある場合、当該属性情報に対応するカテゴリを分割する。
[6-2. Category division
Next, category division will be described with reference to FIG. FIG. 14 is a diagram illustrating an example of category division. For example, when there is attribute information common to nodes belonging to each of a plurality of clusters included in the second graph, the second generation unit 133 of the generation device 100 divides a category corresponding to the attribute information.

図14に示す例では、生成装置100は、カテゴリ情報CLT21−1に示すようなカテゴリ情報を用いる。カテゴリ情報CLT21−1中の「第1階層」には、「第1分類C」のカテゴリC4等が含まれる。また、第1階層である「第1分類C」のカテゴリC4の下位の「第2階層」には、「第2分類_1」のカテゴリC41等が含まれる。また、第2階層である「第2分類_1」のカテゴリC41の下位の「第3階層」には、「第3分類_1」のカテゴリC411や「第3分類_2」のカテゴリC412や「第3分類_3」のカテゴリC413等が含まれる。   In the example illustrated in FIG. 14, the generation apparatus 100 uses category information as illustrated in the category information CLT 21-1. The “first hierarchy” in the category information CLT 21-1 includes the category C4 of “first classification C” and the like. Further, the “second hierarchy” that is lower than the category C4 of “first classification C” that is the first hierarchy includes the category C41 of “second classification_1” and the like. In addition, the “third hierarchy”, which is lower than the “second classification_1” category C41, which is the second hierarchy, includes the “third classification_1” category C411, the “third classification_2” category C412, and the “third classification”. “Category_3” category C413 and the like are included.

図14に示す例では、生成装置100は、生成した第2グラフにおけるノード間の連結に基づいて、各ノードをクラスタリングする。例えば、生成装置100は、クラスタ一覧LT21に示すように、生成した第2グラフにおいてエッジで連結されたノードN211やノードN212やノードN213をクラスタCL21としてクラスタリングする。また、例えば、生成装置100は、クラスタ一覧LT21に示すように、生成した第2グラフにおいてエッジで連結されたノードN221やノードN222をクラスタCL22としてクラスタリングする。   In the example illustrated in FIG. 14, the generation device 100 clusters each node based on the connection between the nodes in the generated second graph. For example, as illustrated in the cluster list LT21, the generating apparatus 100 clusters the nodes N211, N212, and N213 connected by edges in the generated second graph as the cluster CL21. Further, for example, as illustrated in the cluster list LT21, the generation apparatus 100 clusters the nodes N221 and N222 connected by edges in the generated second graph as the cluster CL22.

図14に示す例では、クラスタ一覧LT21に示すように、クラスタCL21に属するノードN211〜N213とクラスタCL22に属するノードN221〜N222とは、カテゴリC411の値が大きい点で共通する。そこで、生成装置100は、カテゴリC411を2つのカテゴリに分割する(ステップS26)。例えば、生成装置100は、図14中のカテゴリ情報CLT21−2に示すように、「第3分類_I−1」のカテゴリC411−1と「第3分類_I−2」のカテゴリC411−2との2つの新たなカテゴリに、カテゴリC411を分割する。例えば、生成装置100は、「第3分類_I−1」のカテゴリC411−1にクラスタCL21に属するノードN211〜N213の属性情報が含まれ、「第3分類_I−2」のカテゴリC411−2にクラスタCL22に属するノードN221〜N222の属性情報が含まれるように、カテゴリC411を分割する。   In the example shown in FIG. 14, as shown in the cluster list LT21, the nodes N211 to N213 belonging to the cluster CL21 and the nodes N221 to N222 belonging to the cluster CL22 are common in that the value of the category C411 is large. Therefore, the generation device 100 divides the category C411 into two categories (step S26). For example, as illustrated in the category information CLT 21-2 in FIG. 14, the generation device 100 includes a category C411-1 of “third classification_I-1” and a category C411-2 of “third classification_I-2”. The category C411 is divided into two new categories. For example, the generation apparatus 100 includes the attribute information of the nodes N211 to N213 belonging to the cluster CL21 in the category C411-1 of “third classification_I-1”, and the category C411-2 of “third classification_I-2”. The category C411 is divided so that the attribute information of the nodes N221 to N222 belonging to the cluster CL22 is included.

これにより、生成装置100は、クラスタリングの結果に基づいてカテゴリを変更したカテゴリ情報を用いることにより、ノードの属性情報を反映した第2グラフを生成することができる。したがって、生成装置100は、より適切なクラスタリングを行うことが可能となる。なお、図14の例では、説明を簡単にするために、同じ第2階層である第2分類_1であるカテゴリC41の下位階層に分割したカテゴリを配置する例を示したが、生成装置100は、分割したカテゴリを分割前の上位階層とは異なる上位階層の下位階層のカテゴリとして配置してもよい。   Thereby, the production | generation apparatus 100 can produce | generate the 2nd graph reflecting the attribute information of a node by using the category information which changed the category based on the result of clustering. Therefore, the generation apparatus 100 can perform more appropriate clustering. In the example of FIG. 14, for the sake of simplicity, the example in which the divided categories are arranged in the lower hierarchy of the category C41 that is the second classification_1 that is the same second hierarchy is shown. The divided categories may be arranged as a category in a lower hierarchy of an upper hierarchy different from the upper hierarchy before the division.

〔7.アンサンブル〕
上述した例では、生成装置100や生成装置100Aは、1つの属性情報に基づいて第2グラフを生成する場合を示したが、生成装置100や生成装置100Aは、例えば、複数のカテゴリの属性情報に基づいて第2グラフを生成してもよい。言い換えると、生成装置100や生成装置100Aは、ノードに複数の属性情報(ベクトル)が存在する場合に、それらを結合して1つのベクトルとして扱うのではなく、各属性情報に対応するクラスタリングをそれぞれ行い、それらを統合してひとつの結果(第2グラフやクラスタ)を生成してもよい。例えば、複数のカテゴリの属性情報に基づいて第2グラフを生成する処理は、生成装置100や生成装置100Aの第2生成部133が行ってもよい。この点について、図15を用いて説明する。図15は、複数の第2グラフを統合した第2グラフの生成の一例を示す図である。なお、以下では、生成装置100が処理を行う場合を例に示す。図15の例では、生成装置100は、第1カテゴリの属性情報Aとして、例えば、各ノードに対応する買主(ユーザ)が購入した商品のカテゴリ情報を用いる。また、図15では、生成装置100は、第2カテゴリの属性情報Bとして、例えば、各ノードに対応する買主(ユーザ)のデモグラフィック属性に関する情報を用いる。
[7. ensemble〕
In the above-described example, the generation apparatus 100 and the generation apparatus 100A have shown the case where the second graph is generated based on one attribute information. However, the generation apparatus 100 and the generation apparatus 100A, for example, have attribute information of a plurality of categories. The second graph may be generated based on the above. In other words, when a plurality of attribute information (vectors) exist in a node, the generation device 100 and the generation device 100A do not combine them and handle them as one vector, but perform clustering corresponding to each attribute information. They may be integrated to generate a single result (second graph or cluster). For example, the process of generating the second graph based on the attribute information of a plurality of categories may be performed by the generation device 100 or the second generation unit 133 of the generation device 100A. This point will be described with reference to FIG. FIG. 15 is a diagram illustrating an example of generation of a second graph obtained by integrating a plurality of second graphs. Hereinafter, a case where the generation apparatus 100 performs processing will be described as an example. In the example of FIG. 15, the generation apparatus 100 uses, for example, category information of a product purchased by a buyer (user) corresponding to each node as the attribute information A of the first category. In FIG. 15, the generation apparatus 100 uses, for example, information regarding the demographic attribute of the buyer (user) corresponding to each node as the attribute information B of the second category.

図15に示す例では、生成装置100は、第1グラフ情報NL31に示すような第1グラフ情報を用いる。例えば、図15に示す例において、ノードID「N311」の行とノードID「N312」の列とが交差する領域には、「0」が記憶される。つまり、ノードID「N311」により識別される買主に対応するノードとノードID「N312」により識別される買主に対応するノードとの間にはエッジが連結されていない。また、図15に示す例においては、ノードID「N311」により識別される買主に対応するノードとノードID「N313」により識別される買主に対応するノードとの間にはエッジが連結されている。   In the example illustrated in FIG. 15, the generation device 100 uses the first graph information as illustrated in the first graph information NL31. For example, in the example illustrated in FIG. 15, “0” is stored in an area where the row of the node ID “N311” and the column of the node ID “N312” intersect. That is, no edge is connected between the node corresponding to the buyer identified by the node ID “N311” and the node corresponding to the buyer identified by the node ID “N312”. Further, in the example illustrated in FIG. 15, an edge is connected between a node corresponding to the buyer identified by the node ID “N311” and a node corresponding to the buyer identified by the node ID “N313”. .

図15では、生成装置100は、第1グラフ情報NL31と属性情報Aとを用いて第2グラフを生成する(ステップS31)。そして、図15に示す例では、生成装置100は、生成した属性情報Aの第2グラフにおけるノード間の連結に基づいて、各ノードをクラスタリングする。例えば、生成装置100は、クラスタ一覧LT311に示すように、生成した第2グラフにおいてエッジで連結されたノードN311やノードN312やノードN313をクラスタCL311としてクラスタリングする。   In FIG. 15, the generation device 100 generates a second graph using the first graph information NL31 and the attribute information A (step S31). In the example illustrated in FIG. 15, the generation device 100 clusters each node based on the connection between the nodes in the second graph of the generated attribute information A. For example, as illustrated in the cluster list LT311, the generation apparatus 100 clusters the nodes N311, N312 and N313 connected by edges in the generated second graph as the cluster CL311.

また、図15では、生成装置100は、第1グラフ情報NL31と属性情報Bとを用いて第2グラフを生成する(ステップS32)。そして、図15に示す例では、生成装置100は、生成した属性情報Bの第2グラフにおけるノード間の連結に基づいて、各ノードをクラスタリングする。例えば、生成装置100は、クラスタ一覧LT312に示すように、生成した第2グラフにおいてエッジで連結されたノードN311やノードN312をクラスタCL321としてクラスタリングする。また、例えば、生成装置100は、クラスタ一覧LT312に示すように、生成した第2グラフにおいてエッジで連結されたノードN314やノードN315をクラスタCL322としてクラスタリングする。   In FIG. 15, the generation device 100 generates the second graph using the first graph information NL31 and the attribute information B (Step S32). In the example illustrated in FIG. 15, the generation device 100 clusters each node based on the connection between the nodes in the second graph of the generated attribute information B. For example, as illustrated in the cluster list LT312, the generation apparatus 100 clusters the nodes N311 and N312 connected by edges in the generated second graph as a cluster CL321. Further, for example, as illustrated in the cluster list LT312, the generation apparatus 100 clusters the nodes N314 and N315 connected by edges in the generated second graph as the cluster CL322.

そして、生成装置100は、第1カテゴリの第2グラフと第2カテゴリの第2グラフとに基づいて、第2グラフ(以下、「統合第2グラフ」ともいう)を生成する(ステップS33)。図15では、生成装置100は、属性情報Aの第2グラフと属性情報Bの第2グラフとに基づいて、統合第2グラフを生成する。具体的には、生成装置100は、クラスタ一覧LT311に示すようなクラスタと、クラスタ一覧LT312に示すようなクラスタとに基づいて、クラスタ一覧LT31に示すようなクラスタを含む統合第2グラフを生成する。   Then, the generating apparatus 100 generates a second graph (hereinafter also referred to as “integrated second graph”) based on the second graph of the first category and the second graph of the second category (step S33). In FIG. 15, the generation device 100 generates an integrated second graph based on the second graph of attribute information A and the second graph of attribute information B. Specifically, the generating apparatus 100 generates an integrated second graph including clusters as shown in the cluster list LT31 based on the clusters as shown in the cluster list LT311 and the clusters as shown in the cluster list LT312. .

図15の例では、生成装置100は、クラスタ一覧LT311に示すようなクラスタと、クラスタ一覧LT312に示すようなクラスタとの積集合を求める処理により、統合第2グラフを生成する。例えば、生成装置100は、クラスタ一覧LT31に示すように、ノードN311やノードN312が1つのクラスタCL31としてクラスタリングされた統合第2グラフを生成する。すなわち、生成装置100は、ノードN311とノードN312とがエッジで連結された統合第2グラフを生成する。   In the example of FIG. 15, the generation apparatus 100 generates an integrated second graph by a process for obtaining a product set of a cluster as shown in the cluster list LT311 and a cluster as shown in the cluster list LT312. For example, as illustrated in the cluster list LT31, the generation apparatus 100 generates an integrated second graph in which the nodes N311 and N312 are clustered as one cluster CL31. That is, the generation device 100 generates an integrated second graph in which the node N311 and the node N312 are connected by an edge.

なお、生成装置100は、クラスタ一覧LT311に示すようなクラスタと、クラスタ一覧LT312に示すようなクラスタとの和集合を求める処理により、統合第2グラフを生成してもよい。この場合、生成装置100は、ノードN311やノードN312やノードN313が1つのクラスタとしてクラスタリングされ、ノードN314やノードN315が1つのクラスタとしてクラスタリングされた統合第2グラフを生成する。すなわち、生成装置100は、ノードN311とノードN312とノードN313とがエッジで連結され、ノードN314とノードN315とがエッジで連結された統合第2グラフを生成する。   Note that the generation apparatus 100 may generate the integrated second graph by a process of obtaining a union of clusters as shown in the cluster list LT311 and clusters as shown in the cluster list LT312. In this case, the generation apparatus 100 generates an integrated second graph in which the nodes N311, N312 and N313 are clustered as one cluster, and the nodes N314 and N315 are clustered as one cluster. That is, the generating apparatus 100 generates an integrated second graph in which the node N311, the node N312 and the node N313 are connected by an edge, and the node N314 and the node N315 are connected by an edge.

このように、生成装置100は、複数のカテゴリの属性情報を用いて統合第2グラフを生成することにより、各ノードの複数の属性情報を反映した第2グラフを生成することができる。したがって、生成装置100は、より適切なクラスタリングを行うことが可能となる。上述した複数の第2グラフを統合する処理を行う場合、生成装置100や生成装置100Aは、各カテゴリに対応するカテゴリ情報記憶部や、各属性情報に対応する属性情報記憶部やスコア情報記憶部や第2グラフ情報記憶部を有してもよい。また、生成装置100や生成装置100Aは、統合した第2グラフを記憶する統合第2グラフ情報記憶部を有してもよい。   As described above, the generation apparatus 100 can generate the second graph reflecting the plurality of attribute information of each node by generating the integrated second graph using the attribute information of the plurality of categories. Therefore, the generation apparatus 100 can perform more appropriate clustering. When performing the process of integrating the plurality of second graphs described above, the generation device 100 and the generation device 100A include a category information storage unit corresponding to each category, an attribute information storage unit and a score information storage unit corresponding to each attribute information Or a second graph information storage unit. The generation device 100 and the generation device 100A may include an integrated second graph information storage unit that stores the integrated second graph.

なお、上述した統合第2グラフの生成は一例であり、生成装置100は、種々の目的に応じて適宜の手法により統合第2グラフを生成してもよい。例えば、生成装置100は、属性情報ごとの第2グラフにおいてクラスタに属するか否かの0,1のビットを立てて、全属性情報の第2グラフにおけるクラスタリングの結果を合算することでヒートマップを作成してもよい。この場合、生成装置100は、所定の閾値を用いて各属性情報に対応する第2グラフのクラスタを統合した統合クラスタを抽出してもよい。また、生成装置100は、属性情報ごとの第2グラフにおけるクラスタリングの結果に基づいて、クラスタの重心を求めて、重心に近いほど高いスコアをノードに付与することにより、ヒートマップを作成して統合クラスタを抽出してもよい。このように、例えば、生成装置100は、各属性情報の第2グラフにおけるクラスタリングの結果を用いて、統合クラスタを抽出してもよい。例えば、生成装置100は、ある属性情報の第2グラフ中のクラスタのうち、他の属性情報の第2グラフ中のクラスタと所定の閾値以上のノードが重複する場合、その重複するノード群を、統合クラスタとして抽出してもよい。このような統合クラスタを抽出する処理により、生成装置100は、統合第2グラフを生成してもよい。なお、上記は一例であり、生成装置100は、どのような基準により統合第2グラフを生成してもよい。   The generation of the integrated second graph described above is an example, and the generation apparatus 100 may generate the integrated second graph by an appropriate method according to various purposes. For example, the generation apparatus 100 sets 0 and 1 bits indicating whether or not the cluster belongs to the cluster in the second graph for each attribute information, and adds the clustering results in the second graph for all the attribute information to add the heat map. You may create it. In this case, the generation apparatus 100 may extract an integrated cluster obtained by integrating the clusters of the second graph corresponding to each attribute information using a predetermined threshold value. Further, the generating apparatus 100 obtains the center of gravity of the cluster based on the result of clustering in the second graph for each attribute information, and assigns a higher score to the node as it is closer to the center of gravity, thereby creating and integrating the heat map. Clusters may be extracted. Thus, for example, the generation apparatus 100 may extract an integrated cluster using the result of clustering in the second graph of each attribute information. For example, when the cluster in the second graph of certain attribute information overlaps with a cluster in the second graph of other attribute information and a node having a predetermined threshold value or more, the generation apparatus 100 sets the overlapping node group as It may be extracted as an integrated cluster. The generation apparatus 100 may generate the integrated second graph by the process of extracting the integrated cluster. Note that the above is an example, and the generation apparatus 100 may generate the integrated second graph based on any criterion.

〔8.効果〕
上述してきたように、実施形態に係る生成装置100及び変形例に係る生成装置100Aは、取得部131と、生成部(実施形態においては、「第2生成部133」。以下、同じ)とを有する。取得部131は、ネットワーク上における主体の各々に対応する複数のノードと、所定の対応関係を有するノード間を連結するエッジとを含む第1グラフを取得する。生成部は、取得部131により取得された第1グラフにおける複数のノードのうち、第1ノード及び第2ノードと第3ノードとの関係性に基づいて、第1ノードと第2ノードとの間のエッジを変更した第2グラフを生成する。
[8. effect〕
As described above, the generation device 100 according to the embodiment and the generation device 100A according to the modification include an acquisition unit 131 and a generation unit (in the embodiment, “second generation unit 133”; the same applies hereinafter). Have. The acquisition unit 131 acquires a first graph including a plurality of nodes corresponding to each of the subjects on the network and an edge connecting nodes having a predetermined correspondence relationship. The generation unit is configured to determine whether the first node and the second node are based on the relationship between the first node, the second node, and the third node among the plurality of nodes in the first graph acquired by the acquisition unit 131. A second graph in which the edges of the second line are changed is generated.

これにより、実施形態に係る生成装置100及び変形例に係る生成装置100Aは、第1ノード及び第2ノードと第3ノードとの関係性に基づいて、第1ノードと第2ノードとの間のエッジを変更した第2グラフを生成することにより、ネットワーク上における主体を所望の関係性に基づいて連結するグラフを適切に生成することができる。   As a result, the generation device 100 according to the embodiment and the generation device 100A according to the modification may be configured such that the relationship between the first node and the second node is based on the relationship between the first node, the second node, and the third node. By generating the second graph in which the edge is changed, it is possible to appropriately generate a graph that connects the subjects on the network based on a desired relationship.

また、実施形態に係る生成装置100及び変形例に係る生成装置100Aにおいて、生成部は、第1ノード及び第2ノードとの間がエッジで連結された第3ノードとの関係性に基づいて、第2グラフを生成する。   Further, in the generation device 100 according to the embodiment and the generation device 100A according to the modification, the generation unit is based on the relationship with the third node in which the first node and the second node are connected by an edge. A second graph is generated.

これにより、実施形態に係る生成装置100及び変形例に係る生成装置100Aは、第1ノード及び第2ノードとの間がエッジで連結された第3ノードとの関係性に基づいて、ネットワーク上における主体を所望の関係性に基づいて連結するグラフを適切に生成することができる。   As a result, the generation device 100 according to the embodiment and the generation device 100A according to the modification may be configured on the network based on the relationship between the first node and the second node connected to each other by an edge. It is possible to appropriately generate a graph that connects the subjects based on a desired relationship.

また、実施形態に係る生成装置100及び変形例に係る生成装置100Aにおいて、生成部は、第1ノードと第3ノードとの類似度と、第2ノードと第3ノードとの類似度とに基づいて、第2グラフを生成する。   Further, in the generation device 100 according to the embodiment and the generation device 100A according to the modification, the generation unit is based on the similarity between the first node and the third node and the similarity between the second node and the third node. The second graph is generated.

これにより、実施形態に係る生成装置100及び変形例に係る生成装置100Aは、第1ノードと第3ノードとの類似度と、第2ノードと第3ノードとの類似度とに基づいて、ネットワーク上における主体を所望の関係性に基づいて連結するグラフを適切に生成することができる。   As a result, the generation device 100 according to the embodiment and the generation device 100A according to the modification have the network based on the similarity between the first node and the third node and the similarity between the second node and the third node. It is possible to appropriately generate a graph that connects the above subjects based on a desired relationship.

また、実施形態に係る生成装置100及び変形例に係る生成装置100Aにおいて、生成部は、第1ノード及び第2ノードとの間がエッジで連結された第3ノードの数に基づいて、第2グラフを生成する。   In addition, in the generation device 100 according to the embodiment and the generation device 100A according to the modification, the generation unit performs the second operation based on the number of third nodes in which the first node and the second node are connected by an edge. Generate a graph.

これにより、実施形態に係る生成装置100及び変形例に係る生成装置100Aは、第1ノード及び第2ノードとの間がエッジで連結された第3ノードの数に基づいて、ネットワーク上における主体を所望の関係性に基づいて連結するグラフを適切に生成することができる。   As a result, the generation device 100 according to the embodiment and the generation device 100A according to the modified example determine the subject on the network based on the number of third nodes in which the first node and the second node are connected by an edge. A graph to be connected based on a desired relationship can be appropriately generated.

また、実施形態に係る生成装置100及び変形例に係る生成装置100Aにおいて、取得部131は、各第1の主体と所定の関係を有する第2の主体が所定の条件を満たす第1の主体に対応するノード間をエッジで連結した第1グラフを取得する。   Further, in the generation device 100 according to the embodiment and the generation device 100A according to the modification, the acquisition unit 131 sets the second main body having a predetermined relationship with each first main body as the first main body that satisfies the predetermined condition. A first graph in which corresponding nodes are connected by an edge is acquired.

これにより、実施形態に係る生成装置100及び変形例に係る生成装置100Aは、各第1の主体と所定の関係を有する第2の主体が所定の条件を満たす第1の主体に対応するノード間をエッジで連結した第1グラフから、ネットワーク上における主体を所望の関係性に基づいて連結するグラフを適切に生成することができる。   As a result, the generation device 100 according to the embodiment and the generation device 100A according to the modified example are configured so that the second main body having a predetermined relationship with each first main body corresponds to the first main body that satisfies the predetermined condition. Can be appropriately generated from the first graph in which the entities on the network are connected based on the desired relationship.

また、実施形態に係る生成装置100及び変形例に係る生成装置100Aにおいて、取得部131は、第1の主体である買主と所定の関係を有する第2の主体である売主の集合が所定の条件を満たす買主に対応するノード間をエッジで連結した第1グラフを取得する。   Further, in the generation device 100 according to the embodiment and the generation device 100A according to the modification, the acquisition unit 131 has a predetermined condition that a set of sellers as second entities having a predetermined relationship with a buyer as a first entity is a predetermined condition. A first graph in which nodes corresponding to buyers satisfying the condition are connected by an edge is acquired.

これにより、実施形態に係る生成装置100及び変形例に係る生成装置100Aは、買主に対応するノードのうち、各買主と所定の関係を有する売主の集合が所定の条件を満たす買主に対応するノード間をエッジで連結した第1グラフから、ネットワーク上における主体を所望の関係性に基づいて連結するグラフを適切に生成することができる。   Accordingly, the generation device 100 according to the embodiment and the generation device 100A according to the modification include a node corresponding to a buyer that satisfies a predetermined condition by a set of sellers having a predetermined relationship with each buyer among nodes corresponding to the buyer. It is possible to appropriately generate a graph that connects the subjects on the network based on a desired relationship from the first graph in which the edges are connected by edges.

また、実施形態に係る生成装置100及び変形例に係る生成装置100Aにおいて、取得部131は、買主に対応するノードのうち、所定の回数以上の取引を行った売主の集合間の類似度が所定の閾値以上となるノード間をエッジで連結した第1グラフを取得する。   In addition, in the generation device 100 according to the embodiment and the generation device 100A according to the modification, the acquisition unit 131 has a predetermined degree of similarity between a set of sellers who have made a transaction a predetermined number of times or more among nodes corresponding to the buyer. A first graph in which nodes that are equal to or greater than the threshold value are connected by edges is acquired.

これにより、実施形態に係る生成装置100及び変形例に係る生成装置100Aは、買主に対応するノードのうち、所定の回数以上の取引を行った売主の集合間の類似度が所定の閾値以上となるノード間をエッジで連結した第1グラフから、ネットワーク上における主体を所望の関係性に基づいて連結するグラフを適切に生成することができる。   As a result, the generation device 100 according to the embodiment and the generation device 100A according to the modification have a similarity between a set of sellers who have made a transaction a predetermined number of times or more among nodes corresponding to the buyer with a predetermined threshold value or more. It is possible to appropriately generate a graph that connects the subjects on the network based on a desired relationship from the first graph in which the nodes are connected by edges.

また、実施形態に係る生成装置100及び変形例に係る生成装置100Aにおいて、取得部131は、各ノードに属性情報が対応付けられた第1グラフを取得する。また、生成部は、第1ノードの属性情報及び第2ノードの属性情報と第3ノードの属性情報との関係性に基づいて、第2グラフを生成する。   Further, in the generation device 100 according to the embodiment and the generation device 100A according to the modification, the acquisition unit 131 acquires a first graph in which attribute information is associated with each node. In addition, the generation unit generates the second graph based on the attribute information of the first node and the relationship between the attribute information of the second node and the attribute information of the third node.

これにより、実施形態に係る生成装置100及び変形例に係る生成装置100Aは、第1ノードの属性情報及び第2ノードの属性情報と第3ノードの属性情報との関係性に基づいて、ネットワーク上における主体を所望の関係性に基づいて連結するグラフを適切に生成することができる。   As a result, the generation device 100 according to the embodiment and the generation device 100A according to the modified example are connected to the network based on the attribute information of the first node and the relationship between the attribute information of the second node and the attribute information of the third node. It is possible to appropriately generate a graph that connects the subjects in, based on a desired relationship.

また、実施形態に係る生成装置100及び変形例に係る生成装置100Aにおいて、取得部131は、属性情報として各ノードに対応するユーザと所定の関係を有する商品のカテゴリ情報が各ノードに対応付けられた第1グラフを取得する。   In addition, in the generation device 100 according to the embodiment and the generation device 100A according to the modification, the acquisition unit 131 associates category information of a product having a predetermined relationship with a user corresponding to each node as attribute information. Obtain the first graph.

これにより、実施形態に係る生成装置100及び変形例に係る生成装置100Aは、属性情報として各ノードに対応するユーザと所定の関係を有する商品のカテゴリ情報が各ノードに対応付けられた第1グラフから、ネットワーク上における主体を所望の関係性に基づいて連結するグラフを適切に生成することができる。   Accordingly, the generation apparatus 100 according to the embodiment and the generation apparatus 100A according to the modification include the first graph in which the category information of the product having a predetermined relationship with the user corresponding to each node is associated with each node as attribute information. Therefore, it is possible to appropriately generate a graph that connects the subjects on the network based on a desired relationship.

また、実施形態に係る生成装置100及び変形例に係る生成装置100Aにおいて、取得部131は、属性情報として各ノードに対応するユーザが購入した商品のカテゴリ情報が各ノードに対応付けられた第1グラフを取得する。   In addition, in the generation device 100 according to the embodiment and the generation device 100A according to the modification, the acquisition unit 131 includes, as attribute information, first information in which category information of a product purchased by a user corresponding to each node is associated with each node. Get the graph.

これにより、実施形態に係る生成装置100及び変形例に係る生成装置100Aは、属性情報として各ノードに対応するユーザが購入した商品のカテゴリ情報が各ノードに対応付けられた第1グラフから、ネットワーク上における主体を所望の関係性に基づいて連結するグラフを適切に生成することができる。   As a result, the generation device 100 according to the embodiment and the generation device 100A according to the modification can generate a network from the first graph in which the category information of the product purchased by the user corresponding to each node is associated with each node as attribute information. It is possible to appropriately generate a graph that connects the above subjects based on a desired relationship.

また、実施形態に係る生成装置100及び変形例に係る生成装置100Aにおいて、取得部131は、属性情報として各ノードに対応するユーザの属性情報が各ノードに対応付けられた第1グラフを取得する。   Further, in the generation device 100 according to the embodiment and the generation device 100A according to the modification, the acquisition unit 131 acquires, as attribute information, a first graph in which user attribute information corresponding to each node is associated with each node. .

これにより、実施形態に係る生成装置100及び変形例に係る生成装置100Aは、属性情報として各ノードに対応するユーザの属性情報が各ノードに対応付けられた第1グラフから、ネットワーク上における主体を所望の関係性に基づいて連結するグラフを適切に生成することができる。   As a result, the generation device 100 according to the embodiment and the generation device 100A according to the modified example identify the subject on the network from the first graph in which user attribute information corresponding to each node is associated with each node as attribute information. A graph to be connected based on a desired relationship can be appropriately generated.

また、実施形態に係る生成装置100及び変形例に係る生成装置100Aにおいて、生成部は、第2グラフに含まれる所定のクラスタに属するノードの属性情報に基づいて、属性情報に対応するカテゴリを変更する。   In addition, in the generation device 100 according to the embodiment and the generation device 100A according to the modification, the generation unit changes the category corresponding to the attribute information based on the attribute information of the nodes belonging to the predetermined cluster included in the second graph. To do.

これにより、実施形態に係る生成装置100及び変形例に係る生成装置100Aは、第2グラフに含まれる所定のクラスタに属するノードの属性情報に基づいて、属性情報に対応するカテゴリを変更することにより、ネットワーク上における主体を所望の関係性に基づいて連結するグラフを適切に生成することができる。   Accordingly, the generation device 100 according to the embodiment and the generation device 100A according to the modification may change the category corresponding to the attribute information based on the attribute information of the nodes belonging to the predetermined cluster included in the second graph. The graph that connects the subjects on the network based on a desired relationship can be appropriately generated.

また、実施形態に係る生成装置100及び変形例に係る生成装置100Aにおいて、生成部は、第2グラフに含まれる所定のクラスタに属するノードに共通する属性情報が複数ある場合、当該属性情報に対応するカテゴリを統合する。   In addition, in the generation device 100 according to the embodiment and the generation device 100A according to the modification, the generation unit corresponds to the attribute information when there is a plurality of attribute information common to nodes belonging to the predetermined cluster included in the second graph. Integrate categories.

これにより、実施形態に係る生成装置100及び変形例に係る生成装置100Aは、クラスタリングの結果に基づいてカテゴリを変更したカテゴリ情報を用いることにより、ノードの属性情報を反映した第2グラフを生成することができる。したがって、生成装置100,100Aは、より適切なクラスタリングを行うことが可能となる。これにより、生成装置100,100Aは、ネットワーク上における主体を所望の関係性に基づいて連結するグラフを適切に生成することができる。   Thereby, the generating apparatus 100 according to the embodiment and the generating apparatus 100A according to the modification generate the second graph reflecting the attribute information of the node by using the category information in which the category is changed based on the clustering result. be able to. Therefore, the generation apparatuses 100 and 100A can perform more appropriate clustering. Accordingly, the generation devices 100 and 100A can appropriately generate a graph that connects the subjects on the network based on a desired relationship.

また、実施形態に係る生成装置100及び変形例に係る生成装置100Aにおいて、生成部は、第2グラフに含まれる複数のクラスタの各々に属するノードに共通する属性情報がある場合、当該属性情報に対応するカテゴリを分割する。   In the generation device 100 according to the embodiment and the generation device 100A according to the modification, the generation unit includes attribute information common to nodes belonging to each of a plurality of clusters included in the second graph. Split the corresponding category.

これにより、実施形態に係る生成装置100及び変形例に係る生成装置100Aは、クラスタリングの結果に基づいてカテゴリを変更したカテゴリ情報を用いることにより、ノードの属性情報を反映した第2グラフを生成することができる。したがって、生成装置100,100Aは、より適切なクラスタリングを行うことが可能となる。これにより、生成装置100,100Aは、ネットワーク上における主体を所望の関係性に基づいて連結するグラフを適切に生成することができる。   Thereby, the generating apparatus 100 according to the embodiment and the generating apparatus 100A according to the modification generate the second graph reflecting the attribute information of the node by using the category information in which the category is changed based on the clustering result. be able to. Therefore, the generation apparatuses 100 and 100A can perform more appropriate clustering. Accordingly, the generation devices 100 and 100A can appropriately generate a graph that connects the subjects on the network based on a desired relationship.

また、実施形態に係る生成装置100及び変形例に係る生成装置100Aにおいて、取得部131は、各ノードに第1カテゴリの属性情報と第2カテゴリの属性情報とが対応付けられた第1グラフを取得する。また、生成部は、第1ノードの第1カテゴリの属性情報及び第2ノードの第1カテゴリの属性情報と第3ノードの第1カテゴリの属性情報との関係性に基づいて、第1カテゴリの第2グラフを生成し、第1ノードの第2カテゴリの属性情報及び第2ノードの第2カテゴリの属性情報と第3ノードの第2カテゴリの属性情報との関係性に基づいて、第2カテゴリの第2グラフを生成し、第1カテゴリの第2グラフと第2カテゴリの第2グラフとに基づいて、第2グラフを生成する。   In addition, in the generation device 100 according to the embodiment and the generation device 100A according to the modification, the acquisition unit 131 displays a first graph in which the attribute information of the first category and the attribute information of the second category are associated with each node. get. In addition, the generation unit may determine the first category attribute information based on the relationship between the first category attribute information of the first node, the first category attribute information of the second node, and the first category attribute information of the third node. A second graph is generated, and based on the relationship between the attribute information of the second category of the first node and the attribute information of the second category of the second node and the attribute information of the second category of the third node, the second category The second graph is generated, and the second graph is generated based on the second graph of the first category and the second graph of the second category.

これにより、実施形態に係る生成装置100及び変形例に係る生成装置100Aは、複数のカテゴリの属性情報を用いて統合第2グラフを生成することにより、各ノードの複数の属性情報を反映した第2グラフを生成することができる。したがって、生成装置100,100Aは、より適切なクラスタリングを行うことが可能となる。つまり、生成装置100,100Aは、ネットワーク上における主体を所望の関係性に基づいて連結するグラフを適切に生成することができる。   Accordingly, the generation device 100 according to the embodiment and the generation device 100A according to the modification generate the integrated second graph using the attribute information of the plurality of categories, thereby reflecting the plurality of attribute information of each node. Two graphs can be generated. Therefore, the generation apparatuses 100 and 100A can perform more appropriate clustering. That is, the generation devices 100 and 100A can appropriately generate a graph that connects the subjects on the network based on a desired relationship.

〔9.ハードウェア構成〕
上述してきた実施形態に係る生成装置100及び変形例に係る生成装置100Aは、例えば図16に示すような構成のコンピュータ1000によって実現される。図16は、生成装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
[9. Hardware configuration)
The generation apparatus 100 according to the embodiment and the generation apparatus 100A according to the modification described above are realized by a computer 1000 having a configuration as illustrated in FIG. 16, for example. FIG. 16 is a hardware configuration diagram illustrating an example of a computer that realizes the function of the generation device. The computer 1000 includes a CPU 1100, RAM 1200, ROM 1300, HDD 1400, communication interface (I / F) 1500, input / output interface (I / F) 1600, and media interface (I / F) 1700.

CPU1100は、ROM1300またはHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。   The CPU 1100 operates based on a program stored in the ROM 1300 or the HDD 1400 and controls each unit. The ROM 1300 stores a boot program executed by the CPU 1100 when the computer 1000 is started up, a program depending on the hardware of the computer 1000, and the like.

HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を格納する。通信インターフェイス1500は、所定のネットワークNを介して他の機器からデータを受信してCPU1100へ送り、CPU1100が生成したデータを所定のネットワークNを介して他の機器へ送信する。   The HDD 1400 stores programs executed by the CPU 1100, data used by the programs, and the like. The communication interface 1500 receives data from other devices via a predetermined network N and sends the data to the CPU 1100, and transmits data generated by the CPU 1100 to other devices via the predetermined network N.

CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、生成したデータを入出力インターフェイス1600を介して出力装置へ出力する。   The CPU 1100 controls an output device such as a display and a printer and an input device such as a keyboard and a mouse via the input / output interface 1600. The CPU 1100 acquires data from the input device via the input / output interface 1600. In addition, the CPU 1100 outputs the generated data to the output device via the input / output interface 1600.

メディアインターフェイス1700は、記録媒体1800に格納されたプログラムまたはデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。   The media interface 1700 reads a program or data stored in the recording medium 1800 and provides it to the CPU 1100 via the RAM 1200. The CPU 1100 loads such a program from the recording medium 1800 onto the RAM 1200 via the media interface 1700, and executes the loaded program. The recording medium 1800 is, for example, an optical recording medium such as a DVD (Digital Versatile Disc) or PD (Phase change rewritable disk), a magneto-optical recording medium such as an MO (Magneto-Optical disk), a tape medium, a magnetic recording medium, or a semiconductor memory. Etc.

例えば、コンピュータ1000が実施形態に係る生成装置100として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部130の機能を実現する。コンピュータ1000のCPU1100は、これらのプログラムを記録媒体1800から読み取って実行するが、他の例として、他の装置から所定のネットワークNを介してこれらのプログラムを取得してもよい。   For example, when the computer 1000 functions as the generation apparatus 100 according to the embodiment, the CPU 1100 of the computer 1000 implements the function of the control unit 130 by executing a program loaded on the RAM 1200. The CPU 1100 of the computer 1000 reads these programs from the recording medium 1800 and executes them. However, as another example, these programs may be acquired from other devices via the predetermined network N.

以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の行に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。   As described above, some of the embodiments of the present application have been described in detail with reference to the drawings. However, these are merely examples, and various modifications based on the knowledge of those skilled in the art including the aspects described in the disclosure line of the invention, It is possible to implement the present invention in other forms with improvements.

〔10.その他〕
また、上記各実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
[10. Others]
In addition, among the processes described in the above embodiments, all or a part of the processes described as being automatically performed can be manually performed, or the processes described as being manually performed All or a part of the above can be automatically performed by a known method. In addition, the processing procedures, specific names, and information including various data and parameters shown in the document and drawings can be arbitrarily changed unless otherwise specified. For example, the various types of information illustrated in each drawing is not limited to the illustrated information.

また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。例えば、第1グラフを生成する装置と、第2グラフを生成する装置は別体であってもよい。   Further, each component of each illustrated apparatus is functionally conceptual, and does not necessarily need to be physically configured as illustrated. In other words, the specific form of distribution / integration of each device is not limited to that shown in the figure, and all or a part thereof may be functionally or physically distributed or arbitrarily distributed in arbitrary units according to various loads or usage conditions. Can be integrated and configured. For example, the device that generates the first graph and the device that generates the second graph may be separate.

また、上述してきた各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。   Moreover, each embodiment mentioned above can be combined suitably in the range which does not contradict a process content.

また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、取得部は、取得手段や取得回路に読み替えることができる。   In addition, the “section (module, unit)” described above can be read as “means” or “circuit”. For example, the acquisition unit can be read as acquisition means or an acquisition circuit.

100 生成装置
121 取引情報記憶部
122 第1グラフ情報記憶部
123 カテゴリ情報記憶部
124 属性情報記憶部
125 スコア情報記憶部
126 第2グラフ情報記憶部
130 制御部
131 取得部
132 第1生成部
133 第2生成部
134 送信部
100 Generating Device 121 Transaction Information Storage Unit 122 First Graph Information Storage Unit 123 Category Information Storage Unit 124 Attribute Information Storage Unit 125 Score Information Storage Unit 126 Second Graph Information Storage Unit 130 Control Unit 131 Acquisition Unit 132 First Generation Unit 133 First 2 generator 134 transmitter

Claims (17)

ネットワーク上における主体の各々に対応する複数のノードと、所定の対応関係を有するノード間を連結するエッジとを含む第1グラフを取得する取得部と、
前記取得部により取得された前記第1グラフにおける前記複数のノードのうち、第1ノード及び第2ノードと第3ノードとの関係性に基づいて、前記第1ノードと前記第2ノードとの間のエッジを変更した第2グラフを生成する生成部と、
を備えたことを特徴とする生成装置。
An acquisition unit that acquires a first graph including a plurality of nodes corresponding to each of the subjects on the network and an edge connecting nodes having a predetermined correspondence;
Based on the relationship between the first node, the second node, and the third node among the plurality of nodes in the first graph acquired by the acquisition unit, between the first node and the second node A generating unit for generating a second graph in which the edge of
A generating apparatus comprising:
前記生成部は、
前記第1ノード及び前記第2ノードとの間がエッジで連結された第3ノードとの関係性に基づいて、前記第2グラフを生成する
ことを特徴とする請求項1に記載の生成装置。
The generator is
The generating apparatus according to claim 1, wherein the second graph is generated based on a relationship with a third node in which the first node and the second node are connected by an edge.
前記生成部は、
前記第1ノードと前記第3ノードとの類似度と、前記第2ノードと前記第3ノードとの類似度とに基づいて、前記第2グラフを生成する
ことを特徴とする請求項2に記載の生成装置。
The generator is
The second graph is generated based on a similarity between the first node and the third node and a similarity between the second node and the third node. Generator.
前記生成部は、
前記第1ノード及び前記第2ノードとの間がエッジで連結された前記第3ノードの数に基づいて、前記第2グラフを生成する
ことを特徴とする請求項3に記載の生成装置。
The generator is
The generating apparatus according to claim 3, wherein the second graph is generated based on the number of the third nodes in which the first node and the second node are connected by an edge.
前記取得部は、
各第1の主体と所定の関係を有する第2の主体が所定の条件を満たす第1の主体に対応するノード間をエッジで連結した前記第1グラフを取得する
ことを特徴とする請求項1〜4のいずれか1項に記載の生成装置。
The acquisition unit
The second graph having a predetermined relationship with each first entity acquires the first graph in which nodes corresponding to the first entity satisfying a predetermined condition are connected by an edge. The production | generation apparatus of any one of -4.
前記取得部は、
前記第1の主体である買主と所定の関係を有する前記第2の主体である売主の集合が所定の条件を満たす買主に対応するノード間をエッジで連結した前記第1グラフを取得する
ことを特徴とする請求項5に記載の生成装置。
The acquisition unit
Obtaining the first graph in which a set of sellers as second entities having a predetermined relationship with a buyer as the first entity connects nodes corresponding to buyers satisfying a predetermined condition with edges. The generating apparatus according to claim 5, wherein the generating apparatus is characterized in that:
前記取得部は、
買主に対応するノードのうち、所定の回数以上の取引を行った売主の集合間の類似度が所定の閾値以上となるノード間をエッジで連結した前記第1グラフを取得する
ことを特徴とする請求項6に記載の生成装置。
The acquisition unit
The first graph in which nodes having a similarity equal to or higher than a predetermined threshold among nodes corresponding to a buyer among the nodes corresponding to the buyer is connected by an edge is acquired. The generation device according to claim 6.
前記取得部は、
各ノードに属性情報が対応付けられた前記第1グラフを取得し、
前記生成部は、
前記第1ノードの属性情報及び前記第2ノードの属性情報と前記第3ノードの属性情報との関係性に基づいて、前記第2グラフを生成する
ことを特徴とする請求項1〜7のいずれか1項に記載の生成装置。
The acquisition unit
Obtaining the first graph in which attribute information is associated with each node;
The generator is
The said 2nd graph is produced | generated based on the relationship between the attribute information of the said 1st node, the attribute information of the said 2nd node, and the attribute information of the said 3rd node, The any one of Claims 1-7 characterized by the above-mentioned. The generating device according to claim 1.
前記取得部は、
属性情報として前記各ノードに対応するユーザと所定の関係を有する商品のカテゴリ情報が前記各ノードに対応付けられた前記第1グラフを取得する
ことを特徴とする請求項8に記載の生成装置。
The acquisition unit
9. The generation apparatus according to claim 8, wherein category information of a product having a predetermined relationship with a user corresponding to each node is acquired as attribute information in the first graph in which each node is associated.
前記取得部は、
属性情報として前記各ノードに対応するユーザが購入した商品のカテゴリ情報が前記各ノードに対応付けられた前記第1グラフを取得する
ことを特徴とする請求項9に記載の生成装置。
The acquisition unit
The generation apparatus according to claim 9, wherein the first graph in which category information of a product purchased by a user corresponding to each node is associated with each node is acquired as attribute information.
前記取得部は、
属性情報として前記各ノードに対応するユーザの属性情報が前記各ノードに対応付けられた前記第1グラフを取得する
ことを特徴とする請求項8〜10のいずれか1項に記載の生成装置。
The acquisition unit
The generation apparatus according to claim 8, wherein the first graph in which attribute information of a user corresponding to each node is associated with each node is acquired as attribute information.
前記生成部は、
前記第2グラフに含まれる所定のクラスタに属するノードの属性情報に基づいて、属性情報に対応するカテゴリを変更する
ことを特徴とする請求項8〜11のいずれか1項に記載の生成装置。
The generator is
The generation device according to any one of claims 8 to 11, wherein a category corresponding to attribute information is changed based on attribute information of nodes belonging to a predetermined cluster included in the second graph.
前記生成部は、
前記第2グラフに含まれる所定のクラスタに属するノードに共通する属性情報が複数ある場合、当該属性情報に対応するカテゴリを統合する
ことを特徴とする請求項12に記載の生成装置。
The generator is
The generation apparatus according to claim 12, wherein when there are a plurality of attribute information common to nodes belonging to a predetermined cluster included in the second graph, the categories corresponding to the attribute information are integrated.
前記生成部は、
前記第2グラフに含まれる複数のクラスタの各々に属するノードに共通する属性情報がある場合、当該属性情報に対応するカテゴリを分割する
ことを特徴とする請求項12または請求項13に記載の生成装置。
The generator is
14. The generation according to claim 12, wherein when there is attribute information common to nodes belonging to each of the plurality of clusters included in the second graph, a category corresponding to the attribute information is divided. apparatus.
前記取得部は、
各ノードに第1カテゴリの属性情報と第2カテゴリの属性情報とが対応付けられた第1グラフを取得し、
前記生成部は、
第1ノードの第1カテゴリの属性情報及び第2ノードの第1カテゴリの属性情報と第3ノードの第1カテゴリの属性情報との関係性に基づいて、第1カテゴリの第2グラフを生成し、第1ノードの第2カテゴリの属性情報及び第2ノードの第2カテゴリの属性情報と第3ノードの第2カテゴリの属性情報との関係性に基づいて、第2カテゴリの第2グラフを生成し、前記第1カテゴリの第2グラフと前記第2カテゴリの第2グラフとに基づいて、第2グラフを生成する
ことを特徴とする請求項8〜14のいずれか1項に記載の生成装置。
The acquisition unit
Obtaining a first graph in which attribute information of the first category and attribute information of the second category are associated with each node;
The generator is
Based on the relationship between the attribute information of the first category of the first node and the attribute information of the first category of the second node and the attribute information of the first category of the third node, a second graph of the first category is generated. Generating a second graph of the second category based on the attribute information of the second category of the first node and the relationship between the attribute information of the second category of the second node and the attribute information of the second category of the third node The generation device according to claim 8, wherein the second graph is generated based on the second graph of the first category and the second graph of the second category. .
コンピュータが実行する生成方法であって、
ネットワーク上における主体の各々に対応する複数のノードと、所定の対応関係を有するノード間を連結するエッジとを含む第1グラフを取得する取得工程と、
前記取得工程により取得された前記第1グラフにおける前記複数のノードのうち、第1ノード及び第2ノードと第3ノードとの関係性に基づいて、前記第1ノードと前記第2ノードとの間のエッジを変更した第2グラフを生成する生成工程と、
を含むことを特徴とする生成方法。
A generation method executed by a computer,
An acquisition step of acquiring a first graph including a plurality of nodes corresponding to each of the subjects on the network and an edge connecting nodes having a predetermined correspondence relationship;
Based on the relationship between the first node, the second node, and the third node among the plurality of nodes in the first graph obtained by the obtaining step, the relationship between the first node and the second node. A generating step of generating a second graph in which the edge of
A generation method comprising:
ネットワーク上における主体の各々に対応する複数のノードと、所定の対応関係を有するノード間を連結するエッジとを含む第1グラフを取得する取得手順と、
前記取得手順により取得された前記第1グラフにおける前記複数のノードのうち、第1ノード及び第2ノードと第3ノードとの関係性に基づいて、前記第1ノードと前記第2ノードとの間のエッジを変更した第2グラフを生成する生成手順と、
をコンピュータに実行させることを特徴とする生成プログラム。
An acquisition procedure for acquiring a first graph including a plurality of nodes corresponding to each of the subjects on the network and an edge connecting nodes having a predetermined correspondence;
Among the plurality of nodes in the first graph acquired by the acquisition procedure, based on the relationship between the first node, the second node, and the third node, between the first node and the second node. A generation procedure for generating a second graph in which the edge of
A program for causing a computer to execute.
JP2016046694A 2016-03-10 2016-03-10 Generating device, generating method, and generating program Active JP6462611B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2016046694A JP6462611B2 (en) 2016-03-10 2016-03-10 Generating device, generating method, and generating program
JP2018245789A JP6917972B2 (en) 2016-03-10 2018-12-27 Generation device, generation method, and generation program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016046694A JP6462611B2 (en) 2016-03-10 2016-03-10 Generating device, generating method, and generating program

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2018245789A Division JP6917972B2 (en) 2016-03-10 2018-12-27 Generation device, generation method, and generation program

Publications (2)

Publication Number Publication Date
JP2017162237A true JP2017162237A (en) 2017-09-14
JP6462611B2 JP6462611B2 (en) 2019-01-30

Family

ID=59854100

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016046694A Active JP6462611B2 (en) 2016-03-10 2016-03-10 Generating device, generating method, and generating program

Country Status (1)

Country Link
JP (1) JP6462611B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019174889A (en) * 2018-03-27 2019-10-10 日本電気株式会社 Cluster analysis system, cluster analysis method and cluster analysis program
KR102472844B1 (en) * 2022-02-09 2022-12-01 주식회사 에스투더블유 A method for detecting abnormal transactions online automatically

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002312404A (en) * 2001-01-12 2002-10-25 Tsuyuki Soft Laboratory Ltd System and program for managing relating information, and recording medium
JP2004537076A (en) * 2000-11-17 2004-12-09 ヴァラケンタ インテレクチュアル プロパティーズ リミテッド Global e-commerce system
JP2007323385A (en) * 2006-06-01 2007-12-13 Nippon Telegr & Teleph Corp <Ntt> Network core extraction method and device, network core extraction program, and recording medium recording the program
JP2009205289A (en) * 2008-02-26 2009-09-10 Nippon Telegr & Teleph Corp <Ntt> Apparatus, method and program for forming graph of interest system
JP2009258794A (en) * 2008-04-11 2009-11-05 Fujitsu Ltd Information retrieval program, information retrieval device and information retrieval method
JP2010165166A (en) * 2009-01-15 2010-07-29 Nec Corp Graph structure estimation system, graph structure estimation method, and program
US20110040619A1 (en) * 2008-01-25 2011-02-17 Trustees Of Columbia University In The City Of New York Belief propagation for generalized matching
US20140214936A1 (en) * 2013-01-30 2014-07-31 Microsoft Corporation Identifying subgraphs in transformed social network graphs
US20140280143A1 (en) * 2013-03-15 2014-09-18 Oracle International Corporation Partitioning a graph by iteratively excluding edges
US20150071120A1 (en) * 2012-04-13 2015-03-12 Telefonaktiebolaget L M Ericsson (Publ) Method and apparatus for improving network performance
JP2015088037A (en) * 2013-10-31 2015-05-07 株式会社日立ソリューションズ Fund flow analysis device and method
JP2015162246A (en) * 2014-02-26 2015-09-07 パロ・アルト・リサーチ・センター・インコーポレーテッドPalo Alto Research Center Incorporated efficient link management for graph clustering

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004537076A (en) * 2000-11-17 2004-12-09 ヴァラケンタ インテレクチュアル プロパティーズ リミテッド Global e-commerce system
JP2002312404A (en) * 2001-01-12 2002-10-25 Tsuyuki Soft Laboratory Ltd System and program for managing relating information, and recording medium
JP2007323385A (en) * 2006-06-01 2007-12-13 Nippon Telegr & Teleph Corp <Ntt> Network core extraction method and device, network core extraction program, and recording medium recording the program
US20110040619A1 (en) * 2008-01-25 2011-02-17 Trustees Of Columbia University In The City Of New York Belief propagation for generalized matching
JP2009205289A (en) * 2008-02-26 2009-09-10 Nippon Telegr & Teleph Corp <Ntt> Apparatus, method and program for forming graph of interest system
JP2009258794A (en) * 2008-04-11 2009-11-05 Fujitsu Ltd Information retrieval program, information retrieval device and information retrieval method
JP2010165166A (en) * 2009-01-15 2010-07-29 Nec Corp Graph structure estimation system, graph structure estimation method, and program
US20150071120A1 (en) * 2012-04-13 2015-03-12 Telefonaktiebolaget L M Ericsson (Publ) Method and apparatus for improving network performance
US20140214936A1 (en) * 2013-01-30 2014-07-31 Microsoft Corporation Identifying subgraphs in transformed social network graphs
US20140280143A1 (en) * 2013-03-15 2014-09-18 Oracle International Corporation Partitioning a graph by iteratively excluding edges
JP2015088037A (en) * 2013-10-31 2015-05-07 株式会社日立ソリューションズ Fund flow analysis device and method
JP2015162246A (en) * 2014-02-26 2015-09-07 パロ・アルト・リサーチ・センター・インコーポレーテッドPalo Alto Research Center Incorporated efficient link management for graph clustering

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
小林 真雄、外2名: "Auction Network Trust:電子商取引ネットワークにおけるユーザ間の関係を利用した評", 電子情報通信学会論文誌, vol. 第J92−D巻,第11号, JPN6018006694, 1 November 2009 (2009-11-01), JP, pages 1869 - 1880, ISSN: 0003887983 *
杉山 浩平、外3名: "ネットワーク分析手法を用いた企業間の取引関係ネットワーク分析", 電子情報通信学会技術研究報告, vol. 第105巻,第113号, JPN6018006695, 9 June 2005 (2005-06-09), JP, pages 83 - 88, ISSN: 0003887984 *
槇 俊孝、外4名: "Linked Open Data生成のためのマルチプルラベル伝搬アルゴリズムの提案と性能評価", 電子情報通信学会技術研究報告, vol. 第115巻,第486号, JPN6018006691, 25 February 2016 (2016-02-25), JP, pages 51 - 56, ISSN: 0003887982 *
矢田 勝俊、外4名: "ビジネスにおけるアクティブマイニングの実践", 第69回 知識ベースシステム研究会資料 (SIG−KBS−A405), JPN6018006697, 25 February 2005 (2005-02-25), JP, pages 7 - 12, ISSN: 0003887985 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019174889A (en) * 2018-03-27 2019-10-10 日本電気株式会社 Cluster analysis system, cluster analysis method and cluster analysis program
JP7106924B2 (en) 2018-03-27 2022-07-27 日本電気株式会社 CLUSTER ANALYSIS SYSTEM, CLUSTER ANALYSIS METHOD AND CLUSTER ANALYSIS PROGRAM
KR102472844B1 (en) * 2022-02-09 2022-12-01 주식회사 에스투더블유 A method for detecting abnormal transactions online automatically

Also Published As

Publication number Publication date
JP6462611B2 (en) 2019-01-30

Similar Documents

Publication Publication Date Title
US11748379B1 (en) Systems and methods for generating and implementing knowledge graphs for knowledge representation and analysis
Jafarkarimi et al. A naive recommendation model for large databases
Zhao et al. The rise of fashion informatics: A case of data-mining-based social network analysis in fashion
US9436919B2 (en) System and method of tuning item classification
JP6414363B2 (en) Prediction system, method and program
CN104077279B (en) A kind of parallel communities discovery method and apparatus
CN104077723B (en) A kind of social networks commending system and method
Leng et al. Granular computing–based development of service process reference models in social manufacturing contexts
US11762819B2 (en) Clustering model analysis for big data environments
US9195962B2 (en) Generating a subgraph of key entities in a network and categorizing the subgraph entities into different types using social network analysis
JP6311851B2 (en) Co-clustering system, method and program
Ramasubbareddy et al. Comparative study of clustering techniques in market segmentation
Roberts et al. Visualising business data: A survey
Chen Developing a travel segmentation methodology: A criterion-based approach
WO2017203672A1 (en) Item recommendation method, item recommendation program, and item recommendation apparatus
EP3452916A1 (en) Large scale social graph segmentation
JP6462611B2 (en) Generating device, generating method, and generating program
JP6308339B1 (en) Clustering system, method and program, and recommendation system
Rogić et al. Customer response model in direct marketing: solving the problem of unbalanced dataset with a balanced support vector machine
US8577814B1 (en) System and method for genetic creation of a rule set for duplicate detection
US20150095183A1 (en) Methods and Apparatus for Generating Recommendations
Ranggadara et al. Applying customer loyalty classification with RFM and Naïve Bayes for better decision making
Xinchang et al. Movie recommendation algorithm using social network analysis to alleviate cold-start problem
Alcacer et al. Combining classification and user-based collaborative filtering for matching footwear size
JPWO2018088277A1 (en) Prediction model generation system, method and program

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180116

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180227

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180404

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181002

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181122

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181204

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181227

R150 Certificate of patent or registration of utility model

Ref document number: 6462611

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350