JP6917972B2 - Generation device, generation method, and generation program - Google Patents

Generation device, generation method, and generation program Download PDF

Info

Publication number
JP6917972B2
JP6917972B2 JP2018245789A JP2018245789A JP6917972B2 JP 6917972 B2 JP6917972 B2 JP 6917972B2 JP 2018245789 A JP2018245789 A JP 2018245789A JP 2018245789 A JP2018245789 A JP 2018245789A JP 6917972 B2 JP6917972 B2 JP 6917972B2
Authority
JP
Japan
Prior art keywords
node
graph
attribute information
category
nodes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018245789A
Other languages
Japanese (ja)
Other versions
JP2019071102A (en
Inventor
朋哉 山崎
朋哉 山崎
伸幸 清水
伸幸 清水
隼人 小林
隼人 小林
智 山内
智 山内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP2016046694A external-priority patent/JP6462611B2/en
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2018245789A priority Critical patent/JP6917972B2/en
Publication of JP2019071102A publication Critical patent/JP2019071102A/en
Application granted granted Critical
Publication of JP6917972B2 publication Critical patent/JP6917972B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、生成装置、生成方法、及び生成プログラムに関する。 The present invention relates to a generator, a generator, and a generator.

従来、グラフにおけるノード間のエッジ(連結)の有無に基づいて、クラスタリングを行う技術が提供されている。例えば、グラフ中のあるノードおよびそのノードに接続したノードの集合に基づいて、クラスタ構造を抽出する技術が提供されている。例えば、グラフ中のあるノードに接続したノードの集合と他のノードに接続したノードの集合とにおいて共通するノードの数に基づいて、局所的にクラスタリングを行う技術が提供されている。 Conventionally, a technique for performing clustering based on the presence or absence of edges (connections) between nodes in a graph has been provided. For example, a technique for extracting a cluster structure based on a node in a graph and a set of nodes connected to the node is provided. For example, a technique for locally clustering is provided based on the number of nodes common to a set of nodes connected to a certain node and a set of nodes connected to another node in the graph.

特開2015−156163号公報Japanese Unexamined Patent Publication No. 2015-156163

T. Uno et al. Micro-clustering,“Finding small clusters in large diversity.”CoRR, 2015.T. Uno et al. Micro-clustering, “Finding small clusters in large diversity.” CoRR, 2015.

しかしながら、上記の従来技術では、ネットワーク上における主体(例えば、ユーザ)を所望の関係性に基づいて連結するグラフを適切に生成できるとは限らない。例えば、あるノードに接続したノードの集合と他のノードに接続したノードの集合とにおいて共通するノードの数に基づいて、クラスタリングを行う場合、共通するノードの数によりクラスタリングを行うかを決定することとなる。このような場合、各ノードを所望の関係性に基づいて連結するグラフを適切に生成することは難しい。 However, in the above-mentioned prior art, it is not always possible to appropriately generate a graph that connects subjects (for example, users) on a network based on a desired relationship. For example, when clustering is performed based on the number of nodes common to a set of nodes connected to a certain node and a set of nodes connected to another node, it is determined whether to perform clustering based on the number of common nodes. It becomes. In such a case, it is difficult to properly generate a graph that connects each node based on a desired relationship.

本願は、上記に鑑みてなされたものであって、ネットワーク上における主体を所望の関係性に基づいて連結するグラフを適切に生成する生成装置、生成方法、及び生成プログラムを提供することを目的とする。 The present application has been made in view of the above, and an object of the present application is to provide a generation device, a generation method, and a generation program for appropriately generating a graph that connects subjects on a network based on a desired relationship. do.

本願に係る生成装置は、ネットワーク上における主体の各々に対応する複数のノードと、所定の対応関係を有するノード間を連結するエッジとを含む第1グラフであって、各ノードに属性情報が対応付けられた第1グラフを取得する取得部と、前記取得部により取得された前記第1グラフに含まれる複数のノードを分類した所定のクラスタに属するノードの属性情報に基づいて、前記エッジを変更した第2グラフを生成する生成部と、を備えたことを特徴とする。 The generator according to the present application is a first graph including a plurality of nodes corresponding to each of the subjects on the network and an edge connecting the nodes having a predetermined correspondence relationship, and the attribute information corresponds to each node. The edge is changed based on the attribute information of the acquisition unit that acquires the attached first graph and the node belonging to a predetermined cluster that classifies the plurality of nodes included in the first graph acquired by the acquisition unit. It is characterized in that it is provided with a generation unit for generating the second graph.

実施形態の一態様によれば、ネットワーク上における主体を所望の関係性に基づいて連結するグラフを適切に生成することができるという効果を奏する。 According to one aspect of the embodiment, there is an effect that a graph connecting the subjects on the network based on a desired relationship can be appropriately generated.

図1は、実施形態に係る生成処理の一例を示す図である。FIG. 1 is a diagram showing an example of a generation process according to an embodiment. 図2は、実施形態に係る生成処理の一例を示す図である。FIG. 2 is a diagram showing an example of the generation process according to the embodiment. 図3は、実施形態に係る生成装置の構成例を示す図である。FIG. 3 is a diagram showing a configuration example of the generator according to the embodiment. 図4は、実施形態に係る取引情報記憶部の一例を示す図である。FIG. 4 is a diagram showing an example of the transaction information storage unit according to the embodiment. 図5は、実施形態に係る第1グラフ情報記憶部の一例を示す図である。FIG. 5 is a diagram showing an example of the first graph information storage unit according to the embodiment. 図6は、実施形態に係るカテゴリ情報記憶部の一例を示す図である。FIG. 6 is a diagram showing an example of the category information storage unit according to the embodiment. 図7は、実施形態に係る属性情報記憶部の一例を示す図である。FIG. 7 is a diagram showing an example of the attribute information storage unit according to the embodiment. 図8は、実施形態に係るスコア情報記憶部の一例を示す図である。FIG. 8 is a diagram showing an example of the score information storage unit according to the embodiment. 図9は、実施形態に係る第2グラフ情報記憶部の一例を示す図である。FIG. 9 is a diagram showing an example of the second graph information storage unit according to the embodiment. 図10は、実施形態に係る生成処理手順を示すフローチャートである。FIG. 10 is a flowchart showing a generation processing procedure according to the embodiment. 図11は、変形例に係る生成装置の構成例を示す図である。FIG. 11 is a diagram showing a configuration example of a generator according to a modified example. 図12は、変形例に係る属性情報記憶部の一例を示す図である。FIG. 12 is a diagram showing an example of the attribute information storage unit according to the modified example. 図13は、カテゴリの統合の一例を示す図である。FIG. 13 is a diagram showing an example of category integration. 図14は、カテゴリの分割の一例を示す図である。FIG. 14 is a diagram showing an example of division of categories. 図15は、複数の第2グラフを統合した第2グラフの生成の一例を示す図である。FIG. 15 is a diagram showing an example of generation of a second graph in which a plurality of second graphs are integrated. 図16は、生成装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。FIG. 16 is a hardware configuration diagram showing an example of a computer that realizes the function of the generator.

以下に、本願に係る生成装置、生成方法、及び生成プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る生成装置、生成方法、及び生成プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。 Hereinafter, a generator, a generation method, and a mode for carrying out the generation program (hereinafter, referred to as “the embodiment”) according to the present application will be described in detail with reference to the drawings. It should be noted that this embodiment does not limit the generator, the generation method, and the generation program according to the present application. Further, in each of the following embodiments, the same parts are designated by the same reference numerals, and duplicate description is omitted.

(実施形態)
〔1−1.生成処理(第1グラフ)〕
図1及び図2では、電子商取引(例えば、インターネットショッピング)における買主(ユーザ)をノードとし、買主(ノード)間をエッジで連結したグラフを生成する場合を示す。図1では、生成装置100(図3参照)が、買主が商品を購入した売主の共通性に基づいて、買主間をエッジで連結したグラフ(以下、「第1グラフ」ともいう)を生成する場合を示す。また、図2では、生成装置100が、第1グラフに含まれるノード間のエッジを変更したグラフ(以下、「第2グラフ」ともいう)を生成する場合を示す。
(Embodiment)
[1-1. Generation process (1st graph)]
1 and 2 show a case where a buyer (user) in an electronic commerce (for example, Internet shopping) is a node and a graph in which buyers (nodes) are connected by an edge is generated. In FIG. 1, the generation device 100 (see FIG. 3) generates a graph (hereinafter, also referred to as “first graph”) in which buyers are connected by edges based on the commonality of sellers who have purchased goods. Show the case. Further, FIG. 2 shows a case where the generation device 100 generates a graph (hereinafter, also referred to as “second graph”) in which the edges between the nodes included in the first graph are changed.

まず、図1を用いて、実施形態に係る生成処理の一例について説明する。図1は、実施形態に係る生成処理の一例を示す図である。具体的には、図1は、第1グラフの生成処理の一例を示す図である。 First, an example of the generation process according to the embodiment will be described with reference to FIG. FIG. 1 is a diagram showing an example of a generation process according to an embodiment. Specifically, FIG. 1 is a diagram showing an example of the generation process of the first graph.

図1に示す例においては、生成装置100は、取引一覧表TL11に示すような電子商取引における買主と売主(ユーザ)との対応に基づいて第1グラフG11を生成する(ステップS1)。なお、各ユーザは、買主と売主との一方に含まれてもよいし、両方に含まれてもよい。例えば、取引一覧表TL11は、図4に示す取引情報記憶部121に記憶された取引情報に基づいて導出される。取引一覧表TL11に示すように、買主(ノード)は、買主ID(ノードID)「N11」〜「N14」や「N21」〜「N24」等により識別される買主(ノード)が含まれる。以下では、買主ID「N11」により識別されるノードをノードN11と記載する。他の買主IDにより識別されるノードも同様に記載する。例えば、買主ID「N21」により識別されるノードをノードN21と記載する。なお、図1に示す例において、説明のために取引一覧表TL11中の8個のノードN11〜N14、N21〜N24のみを図示するが、取引一覧表TL11には、電子商取引における買主の数、例えば100万のノードが含まれてもよい。 In the example shown in FIG. 1, the generation device 100 generates the first graph G11 based on the correspondence between the buyer and the seller (user) in the electronic commerce as shown in the transaction list TL11 (step S1). Each user may be included in one of the buyer and the seller, or may be included in both. For example, the transaction list TL11 is derived based on the transaction information stored in the transaction information storage unit 121 shown in FIG. As shown in the transaction list TL11, the buyer (node) includes a buyer (node) identified by a buyer ID (node ID) "N11" to "N14", "N21" to "N24", or the like. In the following, the node identified by the buyer ID "N11" will be referred to as node N11. Nodes identified by other buyer IDs are also described. For example, the node identified by the buyer ID "N21" is described as node N21. In the example shown in FIG. 1, only the eight nodes N11 to N14 and N21 to N24 in the transaction list TL11 are shown for explanation, but the transaction list TL11 shows the number of buyers in the electronic commerce. For example, one million nodes may be included.

また、取引一覧表TL11に示すように、売主は、売主ID「SR11」〜「SR14」や「SR21」〜「SR24」等により識別される売主が含まれる。以下では、売主ID「SR11」により識別される売主を売主SR11と記載する。他の売主IDにより識別される売主も同様に記載する。例えば、売主ID「SR21」により識別される売主を売主SR21と記載する。 Further, as shown in the transaction list TL11, the seller includes a seller identified by the seller IDs "SR11" to "SR14", "SR21" to "SR24", and the like. In the following, the seller identified by the seller ID "SR11" will be referred to as the seller SR11. The seller identified by another seller ID is also described in the same manner. For example, the seller identified by the seller ID "SR21" is described as the seller SR21.

取引一覧表TL11において、縦の行に示すノードN11〜N14、N21〜N24等と、横の列に示す売主SR11〜SR14、SR21〜SR24との各々が交差するマス目の数値は、対応する買主と売主とが商取引を行った回数を示す。例えば、ノードN11と売主SR11とが交差するマス目(左上のマス目)の数値「5」は、ノードN11に対応する買主と、売主SR11に対応する売主とが5回取引を行ったことを示す。また、例えば、ノードN22と売主SR22とが交差するマス目の数値「10」は、ノードN22に対応する買主と、売主SR22に対応する売主とが10回取引を行ったことを示す。 In the transaction list TL11, the numerical values of the squares where the nodes N11 to N14, N21 to N24, etc. shown in the vertical row and the sellers SR11 to SR14, SR21 to SR24 shown in the horizontal column intersect are the corresponding buyers. Indicates the number of times the seller has made a commercial transaction. For example, the numerical value "5" in the square (upper left square) where the node N11 and the seller SR11 intersect indicates that the buyer corresponding to the node N11 and the seller corresponding to the seller SR11 have made five transactions. show. Further, for example, the numerical value "10" in the square where the node N22 and the seller SR22 intersect indicates that the buyer corresponding to the node N22 and the seller corresponding to the seller SR22 have made transactions 10 times.

ここで、生成装置100は、第1の主体である買主に対応するノードのうち、所定の回数以上の取引を行った第2の主体である売主の集合間の類似度が所定の閾値以上となるノード間をエッジで連結した第1グラフを生成する。図1では、生成装置100は、買主に対応するノードのうち、5回以上の取引を行った売主の集合間のジャッカード係数が0.2以上となるノード間をエッジで連結した第1グラフG11を生成する。すなわち、図1では、所定の閾値を5回とし、売主の集合間の類似度を示す指標値としてジャッカード係数を用いた場合を示す。 Here, in the generation device 100, among the nodes corresponding to the buyer who is the first entity, the similarity between the set of sellers who are the second entity who have made transactions a predetermined number of times or more is equal to or more than a predetermined threshold value. Generates a first graph in which the nodes connected by edges are connected. In FIG. 1, the generator 100 is a first graph in which among the nodes corresponding to the buyer, the nodes having a Jaccard index of 0.2 or more between the sets of sellers who have made five or more transactions are connected by an edge. Generate G11. That is, FIG. 1 shows a case where the predetermined threshold value is set to 5 times and the Jaccard coefficient is used as an index value indicating the degree of similarity between the seller's sets.

図1に示す第1グラフG11には、8個のノードN11〜N14、N21〜N24を図示する。各ノードN11〜N14、N21〜N24は、取引一覧表TL11中に含まれる買主に対応する。例えば、第1グラフG11中のノードN11は、取引一覧表TL11中の買主ID「N11」により識別されるノード(買主)に対応する。なお、図1に示す例において、説明のために第1グラフG11中の8個のノードN11〜N14、N21〜N24のみを図示するが、第1グラフG11には、取引一覧表TL11に含まれる買主の数、例えば100万のノードが含まれてもよい。 In the first graph G11 shown in FIG. 1, eight nodes N11 to N14 and N21 to N24 are illustrated. Each node N11 to N14 and N21 to N24 correspond to the buyer included in the transaction list TL11. For example, the node N11 in the first graph G11 corresponds to the node (buyer) identified by the buyer ID "N11" in the transaction list TL11. In the example shown in FIG. 1, only eight nodes N11 to N14 and N21 to N24 in the first graph G11 are shown for explanation, but the first graph G11 includes the transaction list TL11. It may include a number of buyers, eg one million nodes.

図1の例では、取引一覧表TL11に示すように、ノードN11に対応する買主は、売主SR11に対応する売主から商品を購入した回数(以下、「取引数」ともいう)が5回である。すなわち、ノードN11に対応する買主は、売主SR11に対応する売主から商品を購入した回数(取引数)が所定の閾値以上となる買主である。また、ノードN11に対応する買主は、売主SR13に対応する売主から商品を購入した回数が7回である。すなわち、ノードN11に対応する買主は、売主SR13に対応する売主から商品を購入した回数が所定の閾値以上となる買主である。すなわち、ノードN11に対応する買主について、取引数が所定の閾値以上の売主の集合(以下、「ノードN11の売主集合」ともいう)には、売主SR11や売主SR13等が含まれる。また、取引一覧表TL11に示すように、ノードN13に対応する買主は、売主SR11に対応する売主から商品を購入した回数が6回である。すなわち、ノードN13に対応する買主は、売主SR11に対応する売主から商品を購入した回数が所定の閾値以上となる買主である。また、ノードN13に対応する買主は、売主SR14に対応する売主から商品を購入した回数が7回である。すなわち、ノードN13に対応する買主は、売主SR14に対応する売主から商品を購入した回数が所定の閾値以上となる買主である。すなわち、ノードN13に対応する買主について、取引数が所定の閾値以上の売主の集合(以下、「ノードN13の売主集合」ともいう)には、売主SR11や売主SR14等が含まれる。ここで、生成装置100は、ノードN11の売主集合とノードN13の売主集合とのジャッカード係数が0.2以上となる場合、ノードN11とノードN13との間をエッジで連結する。ここで、上述の例において、ノードN11の売主集合に含まれる売主を売主SR11、売主SR13とし、ノードN13の売主集合に含まれる売主を売主SR11、売主SR14とした場合を例に説明する。この場合、ノードN11とノードN13との売主集合間のジャッカード係数(sim)は、「sim=(ノードN11の売主集合とノードN13の売主集合との積集合)/(ノードN11の売主集合とノードN13の売主集合との和集合)」により算出される。すなわち、ノードN11とノードN13との売主集合間のジャッカード係数(sim)は、「sim=1/3(0.33・・・)」となる。具体的には、ノードN11とノードN13との売主集合間のジャッカード係数(sim)の分母は、ノードN11の売主集合とノードN13の売主集合との和集合の要素数、すなわち売主SR11、SR13、SR14の「3」となる。また、ノードN11とノードN13との売主集合間のジャッカード係数(sim)の分子は、ノードN11の売主集合とノードN13の売主集合との積集合の要素数、すなわち売主SR11の「1」となる。このように、ノードN11の売主集合とノードN13の売主集合との間のジャッカード係数(sim)は、「0.33・・・」となり、閾値「0.2」以上となるため、生成装置100は、ノードN11とノードN13とをエッジで連結した第1グラフG11を生成する。なお、ジャッカード係数(sim)の算出を例示するために、上記のノードN11の売主集合やノードN13の売主集合は、2つの要素のみを含む場合を例示したが、ノードN11の売主集合やノードN13の売主集合は、多数の要素が含まれてもよい。 In the example of FIG. 1, as shown in the transaction list TL11, the buyer corresponding to the node N11 has purchased the product from the seller corresponding to the seller SR11 (hereinafter, also referred to as “the number of transactions”) five times. .. That is, the buyer corresponding to the node N11 is a buyer whose number of purchases (number of transactions) of goods from the seller corresponding to the seller SR11 is equal to or greater than a predetermined threshold value. Further, the buyer corresponding to the node N11 has purchased the product from the seller corresponding to the seller SR13 seven times. That is, the buyer corresponding to the node N11 is a buyer whose number of purchases of goods from the seller corresponding to the seller SR13 is equal to or greater than a predetermined threshold value. That is, with respect to the buyer corresponding to the node N11, the set of sellers whose number of transactions is equal to or greater than a predetermined threshold value (hereinafter, also referred to as "seller set of node N11") includes the seller SR11, the seller SR13, and the like. Further, as shown in the transaction list TL11, the buyer corresponding to the node N13 has purchased the product from the seller corresponding to the seller SR11 six times. That is, the buyer corresponding to the node N13 is a buyer whose number of purchases of goods from the seller corresponding to the seller SR11 is equal to or greater than a predetermined threshold value. Further, the buyer corresponding to the node N13 has purchased the product from the seller corresponding to the seller SR14 seven times. That is, the buyer corresponding to the node N13 is a buyer whose number of purchases of goods from the seller corresponding to the seller SR14 is equal to or greater than a predetermined threshold value. That is, with respect to the buyer corresponding to the node N13, the set of sellers whose number of transactions is equal to or greater than a predetermined threshold value (hereinafter, also referred to as “seller set of node N13”) includes the seller SR11, the seller SR14, and the like. Here, the generation device 100 connects the node N11 and the node N13 with an edge when the Jaccard coefficient between the seller set of the node N11 and the seller set of the node N13 is 0.2 or more. Here, in the above example, the case where the seller included in the seller set of the node N11 is the seller SR11 and the seller SR13 and the seller included in the seller set of the node N13 is the seller SR11 and the seller SR14 will be described as an example. In this case, the Jaccard index (sim) between the seller set of the node N11 and the node N13 is "sim = (the intersection of the seller set of the node N11 and the seller set of the node N13) / (the seller set of the node N11). It is calculated by "sum set with seller set of node N13)". That is, the Jaccard index (sim) between the seller set between the node N11 and the node N13 is "sim = 1/3 (0.33 ...)". Specifically, the denominator of the Jaccard index (sim) between the seller sets of nodes N11 and N13 is the number of elements of the union of the seller set of node N11 and the seller set of node N13, that is, the sellers SR11 and SR13. , SR14 "3". Further, the molecule of the Jaccard coefficient (sim) between the seller set of the node N11 and the node N13 is the number of elements of the intersection of the seller set of the node N11 and the seller set of the node N13, that is, "1" of the seller SR11. Become. As described above, the Jaccard coefficient (sim) between the seller set of the node N11 and the seller set of the node N13 is "0.33 ...", which is equal to or higher than the threshold value "0.2". 100 generates the first graph G11 in which the node N11 and the node N13 are connected by an edge. In order to illustrate the calculation of the Jaccard index (sim), the case where the seller set of the node N11 and the seller set of the node N13 include only two elements is illustrated, but the seller set of the node N11 and the node The seller set of N13 may contain a large number of elements.

また、図1の例では、取引一覧表TL11に示すように、ノードN21に対応する買主は、売主SR22に対応する売主から商品を購入した回数が6回である。そのため、ノードN21に対応する買主について、取引数が所定の閾値以上の売主の集合(以下、「ノードN21の売主集合」ともいう)には、売主SR22等が含まれる。また、取引一覧表TL11に示すように、ノードN22に対応する買主は、売主SR22に対応する売主から商品を購入した回数が10回である。そのため、ノードN21に対応する買主について、取引数が所定の閾値以上の売主の集合(以下、「ノードN22の売主集合」ともいう)には、売主SR22等が含まれる。また、取引一覧表TL11に示すように、ノードN24に対応する買主は、売主SR22に対応する売主から商品を購入した回数が8回である。そのため、ノードN21に対応する買主について、取引数が所定の閾値以上の売主の集合(以下、「ノードN24の売主集合」ともいう)には、売主SR22等が含まれる。また、図1の例では、ノードN21の売主集合とノードN22の売主集合との間のジャッカード係数(sim)は、0.2以上であるものとする。また、ノードN21の売主集合とノードN24の売主集合との間のジャッカード係数(sim)は、0.2以上であるものとする。また、ノードN22の売主集合とノードN24の売主集合との間のジャッカード係数(sim)は、0.2以上であるものとする。これにより、生成装置100は、ノードN21とノードN22とノードN24との各々をエッジで連結した第1グラフG11を生成する。このように、生成装置100は、図1に示すような第1グラフG11を生成する。なお、生成装置100は、ジャッカード係数に限らず、種々の指標に基づいて第1グラフを生成してもよい。例えば、生成装置100は、買主に対応するノードのうち、所定の回数以上の取引を行った売主の集合の積集合に含まれる売主の数が所定の閾値(例えば「2」等)以上となるノード間をエッジで連結した第1グラフを生成してもよい。 Further, in the example of FIG. 1, as shown in the transaction list TL11, the buyer corresponding to the node N21 has purchased the product from the seller corresponding to the seller SR22 six times. Therefore, with respect to the buyer corresponding to the node N21, the set of sellers whose number of transactions is equal to or greater than a predetermined threshold value (hereinafter, also referred to as “seller set of node N21”) includes the seller SR22 and the like. Further, as shown in the transaction list TL11, the buyer corresponding to the node N22 has purchased the product from the seller corresponding to the seller SR22 10 times. Therefore, with respect to the buyer corresponding to the node N21, the set of sellers whose number of transactions is equal to or greater than a predetermined threshold value (hereinafter, also referred to as “seller set of node N22”) includes the seller SR22 and the like. Further, as shown in the transaction list TL11, the buyer corresponding to the node N24 has purchased the product from the seller corresponding to the seller SR22 eight times. Therefore, with respect to the buyer corresponding to the node N21, the set of sellers whose number of transactions is equal to or greater than a predetermined threshold value (hereinafter, also referred to as “seller set of node N24”) includes the seller SR22 and the like. Further, in the example of FIG. 1, it is assumed that the Jaccard coefficient (sim) between the seller set of the node N21 and the seller set of the node N22 is 0.2 or more. Further, it is assumed that the Jaccard coefficient (sim) between the seller set of the node N21 and the seller set of the node N24 is 0.2 or more. Further, it is assumed that the Jaccard coefficient (sim) between the seller set of the node N22 and the seller set of the node N24 is 0.2 or more. As a result, the generation device 100 generates the first graph G11 in which each of the node N21, the node N22, and the node N24 is connected by an edge. In this way, the generation device 100 generates the first graph G11 as shown in FIG. The generation device 100 may generate the first graph based on various indexes, not limited to the Jaccard coefficient. For example, in the generation device 100, among the nodes corresponding to the buyer, the number of sellers included in the intersection of the set of sellers who have made transactions a predetermined number of times or more is equal to or more than a predetermined threshold value (for example, "2"). A first graph in which nodes are connected by edges may be generated.

〔1−2.生成処理(第2グラフ)〕
次に、図2を用いて、実施形態に係る生成処理の一例について説明する。図2は、実施形態に係る生成処理の一例を示す図である。具体的には、図2は、第2グラフの生成処理の一例を示す図である。なお、図2では、生成装置100が図1に示す第1グラフの生成処理により第1グラフを生成するか、外部装置から第1グラフを取得済みである場合を例に説明する。なお、図2に示す例では、ノードの属性情報として、各ノードに対応する買主(ユーザ)が購入した商品のカテゴリ情報が用いられた場合を示す。
[1-2. Generation process (second graph)]
Next, an example of the generation process according to the embodiment will be described with reference to FIG. FIG. 2 is a diagram showing an example of the generation process according to the embodiment. Specifically, FIG. 2 is a diagram showing an example of the generation process of the second graph. In FIG. 2, a case where the generation device 100 generates the first graph by the generation process of the first graph shown in FIG. 1 or the first graph has already been acquired from the external device will be described as an example. In the example shown in FIG. 2, the case where the category information of the product purchased by the buyer (user) corresponding to each node is used as the attribute information of the node is shown.

また、図2に示す例では、商品のカテゴリ情報として、図6に示すカテゴリ情報記憶部123に示すカテゴリのうち第2階層が用いられた場合を示す。すなわち、図2に示す例では、生成装置100は、属性情報記憶部124に示すような各ノードN11〜N14、N21〜N24が購入した商品のカテゴリ情報を属性情報として用いる。具体的には、属性情報記憶部124に示す横の列のカテゴリC11は、第1階層である「本、雑誌」のカテゴリC1の下位の第2階層である「文芸」(図6参照)に対応する。すなわち、図2に示す例では、ノードN11に対応する買主は、「文芸」のカテゴリC11に属する商品を5回購入したことを示す。また、具体的には、属性情報記憶部124に示す横の列のカテゴリC21は、第1階層である「ファッション」のカテゴリC2の下位の第2階層である「レディース」(図6参照)に対応する。すなわち、図2に示す例では、ノードN22に対応する買主は、「レディース」のカテゴリC21に属する商品を7回購入したことを示す。例えば、各ノードN11〜N14、N21〜N24が購入した商品のカテゴリ情報は、横の列がk列、すなわちk次元のベクトルで表現される。この場合、各ノードN11〜N14、N21〜N24の属性情報は、横の列がk列、すなわちk次元のベクトルで表現される。 Further, in the example shown in FIG. 2, a case where the second layer of the categories shown in the category information storage unit 123 shown in FIG. 6 is used as the category information of the product is shown. That is, in the example shown in FIG. 2, the generation device 100 uses the category information of the products purchased by the nodes N11 to N14 and N21 to N24 as the attribute information as shown in the attribute information storage unit 124. Specifically, the category C11 in the horizontal column shown in the attribute information storage unit 124 is in the second layer "literary arts" (see FIG. 6) below the category C1 of the first layer "books and magazines". handle. That is, in the example shown in FIG. 2, it is shown that the buyer corresponding to the node N11 has purchased the product belonging to the category C11 of the “literary art” five times. Specifically, the category C21 in the horizontal column shown in the attribute information storage unit 124 is set to the second layer "ladies" (see FIG. 6), which is a lower layer of the category C2 of the "fashion" which is the first layer. handle. That is, in the example shown in FIG. 2, it is shown that the buyer corresponding to the node N22 has purchased the product belonging to the category C21 of the “ladies” seven times. For example, in the category information of the products purchased by the nodes N11 to N14 and N21 to N24, the horizontal columns are represented by k columns, that is, k-dimensional vectors. In this case, the attribute information of each node N11 to N14 and N21 to N24 is represented by a horizontal column of k columns, that is, a k-dimensional vector.

図2では、生成装置100は、第1グラフG11から第2グラフG12を生成する(ステップS2)。ここで、生成装置100は、第1グラフG11における一のノード(以下、「第1ノード」ともいう)と他のノード(以下、「第2ノード」ともいう)との間をエッジで連結するかの基準となるスコアを算出する。以下、スコアを算出する対象とする第1ノード及び第2ノード以外のノードを第3ノードとする場合がある。例えば、生成装置100は、第1グラフG11において第1ノードに連結された第3ノードと第1ノードとの類似度や、第1グラフG11において第2ノードに連結された第3ノードと第2ノードとの類似度に基づいて、スコアを算出する。例えば、生成装置100は、以下のような式(1)を用いて、第1ノードと第2ノードとの組み合わせにおけるスコアを算出する。 In FIG. 2, the generation device 100 generates the second graph G12 from the first graph G11 (step S2). Here, the generator 100 connects one node (hereinafter, also referred to as “first node”) and another node (hereinafter, also referred to as “second node”) in the first graph G11 with an edge. Calculate the standard score. Hereinafter, a node other than the first node and the second node for which the score is to be calculated may be referred to as the third node. For example, the generator 100 has a similarity between the third node and the first node connected to the first node in the first graph G11, and the third node and the second node connected to the second node in the first graph G11. Calculate the score based on the similarity with the node. For example, the generation device 100 calculates the score in the combination of the first node and the second node by using the following equation (1).

Figure 0006917972
Figure 0006917972

上記式(1)中の左辺に示すf(u,v)は、ノードuとノードvとの組み合わせにおけるスコアを示す。また、上記式(1)中の右辺に示すJ(U,na)は、ノードuと第3ノード(例えばノードn)との属性情報の類似度を示す。すなわち、上記式(1)中の「U」は、ノードuの属性情報のベクトル(例えば、k次元のベクトル)を示す。また、上記式(1)中の「na」は、ノードnの属性情報のベクトル(例えば、k次元のベクトル)を示す。また、上記式(1)中の右辺に示すJ(V,na)は、ノードvと第3ノード(例えばノードn)との属性情報の類似度を示す。すなわち、上記式(1)中の「V」は、ノードvの属性情報のベクトル(例えば、k次元のベクトル)を示す。ここで、関数Jは、例えばジャッカード類似度に対応する。例えば、関数Jの値は、以下の式(2)のように算出される。 The f (u, v) shown on the left side in the above equation (1) indicates the score in the combination of the node u and the node v. Further, J (U, na) shown on the right side in the above equation (1) indicates the degree of similarity of the attribute information between the node u and the third node (for example, node n). That is, "U" in the above equation (1) indicates a vector of attribute information of the node u (for example, a k-dimensional vector). Further, "na" in the above equation (1) indicates a vector of attribute information of the node n (for example, a k-dimensional vector). Further, J (V, na) shown on the right side in the above equation (1) indicates the degree of similarity of the attribute information between the node v and the third node (for example, node n). That is, "V" in the above equation (1) indicates a vector of attribute information of the node v (for example, a k-dimensional vector). Here, the function J corresponds to, for example, Jackard similarity. For example, the value of the function J is calculated by the following equation (2).

Figure 0006917972
Figure 0006917972

上記の式(2)では、説明のために、J(U,V)とし、ノードuとノードvとの属性情報の類似度を示す。すなわち、上記式(2)中の「U」は、ノードuの属性情報のベクトル(例えば、k次元のベクトル)を示し、「V」は、ノードvの属性情報のベクトル(例えば、k次元のベクトル)を示す。例えば、上記式(2)中の右辺に示すu(以下、「第1指数」ともいう)は、ノードuの属性情報のi次元の要素に対応する値を示す。例えば、uは、属性情報記憶部124に示す情報中において、ノードuの属性情報のi次元の要素に対応する商品の購入回数が所定の基準値以上である場合に「1」であり、所定の基準値未満である場合に「0」であるような値となる。また、例えば、上記式(2)中の右辺に示すv(以下、「第2指数」ともいう)は、ノードvの属性情報のi次元の要素に対応する値を示す。 In the above equation (2), for the sake of explanation, J (U, V) is used, and the similarity of the attribute information between the node u and the node v is shown. That is, "U" in the above equation (2) indicates a vector of the attribute information of the node u (for example, a k-dimensional vector), and "V" is a vector of the attribute information of the node v (for example, a k-dimensional vector). Vector) is shown. For example, the formula (2) are shown in the right-hand side u i (hereinafter, also referred to as "first index") indicates a value corresponding to the i-dimensional elements of the attribute information of the node u. For example, u i, during the information indicating the attribute information storage unit 124, the number of purchases of goods corresponding to the i-dimensional elements of the attribute information of the node u is "1" when it is more than the predetermined reference value, When it is less than a predetermined reference value, it becomes a value such that it is "0". Further, for example, the formula (2) are shown in the right-hand side v i (hereinafter, also referred to as a "second index") indicates a value corresponding to the i-dimensional elements of the attribute information of the node v.

例えば、ノードuがノードN11であり、iが1である場合、uは、ノードN11の属性情報の1次元の要素、例えばカテゴリC11に対応する値を示す。例えば、ノードuがノードN11であり、iが1であり、所定の基準値を3とした場合、uは、属性情報記憶部124に示す情報中において、ノードuの属性情報の1次元の要素、例えばカテゴリC11に対応する商品の購入回数が5であり、所定の基準値以上であるため、「1」となる。上記式(2)中の右辺における分母は、属性情報の各次元(例えば、1〜k次元)における第1指数uと第2指数vとのうち最大値の合計を示す。また、上記式(2)中の右辺における分子は、属性情報の各次元(例えば、1〜k次元)における第1指数uと第2指数vとのうち最小値の合計を示す。例えば、上記の式(2)のJ(U,V)は、0〜1の値となる。なお、第1指数uや第2指数vには、対応するノードuやノードvの属性情報における商品の購入回数の値が用いられてもよい。 For example, a node u is the node N11, when i is 1, u 1 shows one-dimensional element of the attribute information of the node N11, for example, a value corresponding to the category C11. For example, when node u is node N11, i is 1, and a predetermined reference value is 3, u 1 is one-dimensional of the attribute information of node u in the information shown in the attribute information storage unit 124. Since the number of purchases of an element, for example, a product corresponding to category C11 is 5, which is equal to or higher than a predetermined reference value, it is set to "1". The denominator in the right side of the formula (2) in the respective dimension of the attribute information (e.g., 1 to k dimensions) represents the sum of the first exponent u i and the second index v i Tonouchi maximum at. Moreover, molecules in the right-hand side in the formula (2), each dimension of the attribute information (e.g., 1 to k dimensions) represents the sum of the first exponent u i and the second index v i Tonouchi minimum at. For example, J (U, V) in the above equation (2) has a value of 0 to 1. Note that the first exponent u i and the second index v i, the value of the number of purchases of goods in the attribute information of the corresponding node u and node v may be used.

ここから、上記式(1)に戻って説明する。上記式(1)中のN(u)は、ノードuに連結する第3ノードの集合を示す。なお、ここでいう、ノードuに連結する第3ノードには、ノードuに直接エッジにより連結されるノードに限らず、他の第3ノードを経由して間接的にノードuに連結されるノードも含まれるものとする。なお、どの範囲までのノードをN(u)に含めるかは、目的等に応じて適宜設定されてもよい。例えば、上記式(1)中のN(u)には、ノードuにエッジで連結されたノードに連結されるノードまでを含めてもよい。上記式(1)中のN(v)は、ノードvに連結する第3ノードの集合を示す。なお、どの範囲までのノードをN(v)に含めるかは、上述したN(u)と同様に目的等に応じて適宜設定されてもよい。 From here, it will be described by returning to the above equation (1). N (u) in the above equation (1) represents a set of third nodes connected to the node u. The third node connected to the node u here is not limited to the node directly connected to the node u by the edge, but is indirectly connected to the node u via another third node. Is also included. The range of nodes to be included in N (u) may be appropriately set according to the purpose and the like. For example, N (u) in the above equation (1) may include up to a node connected to a node connected to the node u by an edge. N (v) in the above equation (1) indicates a set of third nodes connected to the node v. The range of nodes to be included in N (v) may be appropriately set according to the purpose and the like as in the case of N (u) described above.

上記式(1)中の右辺における分母は、ノードuに連結する第3ノードとノードvに連結する第3ノードとの和集合における、各第3ノードとノードuとの属性類似度と、各第3ノードとノードvとの属性類似度とのうち値が最大の属性類似度の値の合計を示す。上記式(1)中の右辺における分子は、ノードuに連結する第3ノードとノードvに連結する第3ノードとの積集合における、各第3ノードとノードuとの属性類似度と、各第3ノードとノードvとの属性類似度とのうち値が最小の属性類似度の値の合計を示す。例えば、上記の式(1)のf(u,v)は、0〜1の値となる。 The denominator on the right side in the above equation (1) is the attribute similarity between each third node and node u in the union of the third node connected to node u and the third node connected to node v, and each. The sum of the values of the attribute similarity having the maximum value among the attribute similarity between the third node and the node v is shown. The molecule on the right side in the above equation (1) is the attribute similarity between each third node and node u in the intersection of the third node connected to node u and the third node connected to node v, and each. The sum of the values of the attribute similarity with the smallest value among the attribute similarity between the third node and the node v is shown. For example, f (u, v) in the above equation (1) has a value of 0 to 1.

生成装置100は、上記式(1)により算出されたスコアと、所定の閾値とに基づいて、第1ノードと第2ノードとの間のエッジを変更した第2グラフG12を生成する。例えば、生成装置100は、上記式(1)により算出されたスコアと、所定の閾値とに基づいて、第1グラフG11においてノード間を連結したエッジを解除したり、ノード間を新たなエッジにより連結したりすることにより、第2グラフG12を生成する。 The generation device 100 generates the second graph G12 in which the edge between the first node and the second node is changed based on the score calculated by the above formula (1) and a predetermined threshold value. For example, the generation device 100 releases the edge connecting the nodes in the first graph G11 based on the score calculated by the above equation (1) and the predetermined threshold value, or uses a new edge between the nodes. The second graph G12 is generated by concatenating them.

例えば、所定の閾値を0.5とするものとする。この場合、生成装置100は、例えば、上記式(1)により算出されたスコアが0.5以上である場合、スコアに対応する第1ノードと第2ノードとの間をエッジで連結する。例えば、生成装置100は、第1グラフG11においてエッジで連結された第1ノードと第2ノードのスコアが0.5以上である場合、スコアに対応する第1ノードと第2ノードとの間を連結するエッジを維持する。また、例えば、生成装置100は、第1グラフG11においてエッジで連結されていない第1ノードと第2ノードのスコアが0.5以上である場合、スコアに対応する第1ノードと第2ノードとの間をエッジで連結する。また、例えば、生成装置100は、第1グラフG11においてエッジで連結された第1ノードと第2ノードのスコアが0.5未満である場合、スコアに対応する第1ノードと第2ノードとの間を連結するエッジを解除する。 For example, it is assumed that a predetermined threshold value is 0.5. In this case, for example, when the score calculated by the above equation (1) is 0.5 or more, the generation device 100 connects the first node and the second node corresponding to the score with an edge. For example, when the score of the first node and the second node connected by the edge in the first graph G11 is 0.5 or more, the generator 100 moves between the first node and the second node corresponding to the score. Maintain connecting edges. Further, for example, when the score of the first node and the second node not connected by the edge in the first graph G11 is 0.5 or more, the generation device 100 includes the first node and the second node corresponding to the score. Connect between them with an edge. Further, for example, when the score of the first node and the second node connected by the edge in the first graph G11 is less than 0.5, the generator 100 sets the score of the first node and the second node corresponding to the score. Release the edges that connect between.

図2の例では、生成装置100は、第1グラフG11においてエッジで連結されていないノードN11とノードN12のスコアが0.8であり閾値以上であるため、第2グラフG12において、ノードN11とノードN12との間をエッジで連結する。また、図2の例では、生成装置100は、第1グラフG11においてエッジで連結されたノードN11とノードN13のスコアが0.7であり閾値以上であるため、第2グラフG12においても、ノードN11とノードN13との間を連結するエッジを維持する。また、図2の例では、生成装置100は、第1グラフG11においてエッジで連結されたノードN21とノードN22のスコアが0.2であり閾値未満であるため、第2グラフG12において、ノードN21とノードN22との間を連結するエッジを解除する。 In the example of FIG. 2, since the score of the node N11 and the node N12 not connected by the edge in the first graph G11 is 0.8, which is equal to or higher than the threshold value, the generator 100 and the node N11 in the second graph G12. It is connected to the node N12 by an edge. Further, in the example of FIG. 2, since the score of the node N11 and the node N13 connected by the edge in the first graph G11 is 0.7, which is equal to or higher than the threshold value, the generator 100 also has the node in the second graph G12. Maintain an edge connecting N11 and node N13. Further, in the example of FIG. 2, since the score of the node N21 and the node N22 connected by the edge in the first graph G11 is 0.2, which is less than the threshold value, the generator 100 has the node N21 in the second graph G12. The edge connecting between the node N22 and the node N22 is released.

このように、生成装置100は、第1グラフG11における複数のノードのうち、第1ノードの属性情報及び第2ノードの属性情報と第3ノードの属性情報との関係性に基づいて、第1ノードと第2ノードとの間のエッジを変更した第2グラフG12を生成する。これにより、生成装置100は、ネットワーク上における主体を所望の関係性に基づいて連結するグラフを適切に生成することができる。 As described above, the generation device 100 is the first node based on the relationship between the attribute information of the first node, the attribute information of the second node, and the attribute information of the third node among the plurality of nodes in the first graph G11. Generate the second graph G12 with the edge changed between the node and the second node. As a result, the generation device 100 can appropriately generate a graph that connects the subjects on the network based on a desired relationship.

また、例えば、生成装置100は、第2グラフG12に含まれるクリーク(極大クリーク)等に基づいて、ノードをクラスタリングしてもよい。例えば、ここでいうクリークとは、そのクリークに含まれる各ノード間が全て連結されたノード群を意味する。なお、生成装置100は、マイクロクラスタリング等の従来手法を適宜用いてノードをクラスタリングしてもよい。例えば、生成装置100は、非特許文献1に記載されたクリーク計算処理を用いて、ノードをクラスタリングしてもよい。また、例えば、生成装置100は、グラフのクリーク・極大クリークを抽出する処理(プログラム)、例えばMACE(MAximal Clique Enumerater)を用いてもよい。なお、上記は一例であり、生成装置100は、どのような手段によりノードをクラスタリングしてもよい。 Further, for example, the generation device 100 may cluster the nodes based on the creek (maximum creek) included in the second graph G12. For example, the creek here means a group of nodes in which all the nodes included in the creek are connected. The generation device 100 may cluster the nodes by appropriately using a conventional method such as microclustering. For example, the generation device 100 may cluster the nodes by using the creek calculation process described in Non-Patent Document 1. Further, for example, the generation device 100 may use a process (program) for extracting cliques and maximum creeks in the graph, for example, MACE (MAximal Clique Enumerater). The above is an example, and the generation device 100 may cluster the nodes by any means.

例えば、生成装置100は、第2グラフG12において各ノード間がエッジで連結されたノード群を1つのクラスタとしてクラスタリングしてもよい。例えば、生成装置100は、第2グラフG12に含まれるノードN11とノードN12とノードN13とは、全てのノードがエッジで連結されたクリークである。例えば、生成装置100は、第2グラフG12に含まれるノードN11とノードN12とノードN13とを1つのクラスタとしてクラスタリングしてもよい。また、例えば、生成装置100は、第2グラフG12に含まれるノードN11とノードN12とノードN14とを1つのクラスタとしてクラスタリングしてもよい。また、第2グラフG12において、ノードN13とノードN14とがエッジで連結される場合、生成装置100は、ノードN11とノードN12とノードN13とノードN14とを1つのクラスタとしてクラスタリングしてもよい。 For example, the generation device 100 may cluster a group of nodes in which each node is connected by an edge in the second graph G12 as one cluster. For example, in the generation device 100, the node N11, the node N12, and the node N13 included in the second graph G12 are creeks in which all the nodes are connected by edges. For example, the generation device 100 may cluster the nodes N11, the nodes N12, and the nodes N13 included in the second graph G12 as one cluster. Further, for example, the generation device 100 may cluster the nodes N11, the nodes N12, and the nodes N14 included in the second graph G12 as one cluster. Further, in the second graph G12, when the node N13 and the node N14 are connected by an edge, the generator 100 may cluster the node N11, the node N12, the node N13, and the node N14 as one cluster.

なお上述した例では、買主に対応するノード間をエッジで連結した第1グラフを用いる場合を示したが、生成装置100は、買主に限らず種々の主体に対応するノード間をエッジで連結した第1グラフを用いてもよい。例えば、生成装置100は、所定のSNS(Social Networking Service)における主体(ユーザ)に対応するノード間をエッジで連結した第1グラフを用いてもよい。例えば、生成装置100は、ネットワーク(Web)上におけるユーザ(人間)の相関関係を示すソーシャルグラフを第1グラフとしても用いてもよい。すなわち、生成装置100は、ネットワーク上におけるユーザの相関関係を示すグラフを第1グラフとして用いてもよい。なお、ノードには、ソーシャルグラフに含まれる主体(ユーザ)全体が含まれてもよいし、所定の条件を満たす一部の主体(ユーザ)が含まれてもよい。また、例えば、ノードには実空間上に対象物(主体)であれば、ユーザに限らず、種々の対象物に対応付けられてもよい。例えば、いわゆるIoT(Internet of Things)等に関する種々の技術により電子機器同士が相互に通信可能な場合、例えばウェアラブル端末等の各電子機器を1つの主体として、各電子機器をノードに対応付けてもよい。この場合、主体(ユーザ)に対応する概念には、ユーザが使用する電子機器やユーザに操作に依らず自律的に動作する電子機器等、人間以外の種々の行動主体が含まれてもよい。上述のように、生成装置100は、ユーザに限らず、種々の対象物(主体)に対応づけられたノード間をエッジで連結した第1グラフを用いて、第2グラフを生成してもよい。すなわち、生成装置100は、ユーザや電子機器が混在した第1グラフを用いて、第2グラフを生成してもよい。例えば、生成装置100は、ユーザに対応するノードと電子機器に対応するノードとがエッジで連結された第1グラフを用いて、第2グラフを生成してもよい。このように、生成装置100は、どのような主体に対応するノード間をエッジで連結した第1グラフを用いてもよい。すなわち、生成装置100は、どのような第1グラフを用いて、第2グラフを生成してもよい。 In the above-mentioned example, the case where the first graph in which the nodes corresponding to the buyer are connected by an edge is used, but the generation device 100 is not limited to the buyer but connects the nodes corresponding to various entities by an edge. The first graph may be used. For example, the generation device 100 may use a first graph in which nodes corresponding to a subject (user) in a predetermined SNS (Social Networking Service) are connected by an edge. For example, the generation device 100 may also use a social graph showing the correlation of users (humans) on the network (Web) as the first graph. That is, the generation device 100 may use a graph showing the correlation of users on the network as the first graph. The node may include the entire subject (user) included in the social graph, or may include a part of the subject (user) that satisfies a predetermined condition. Further, for example, a node may be associated with various objects, not limited to the user, as long as it is an object (subject) in the real space. For example, when electronic devices can communicate with each other by various technologies related to so-called IoT (Internet of Things), for example, even if each electronic device such as a wearable terminal is regarded as one subject and each electronic device is associated with a node. good. In this case, the concept corresponding to the subject (user) may include various behavioral subjects other than humans, such as an electronic device used by the user and an electronic device that operates autonomously regardless of the operation of the user. As described above, the generation device 100 is not limited to the user, and may generate the second graph by using the first graph in which the nodes associated with various objects (subjects) are connected by edges. .. That is, the generation device 100 may generate the second graph by using the first graph in which users and electronic devices are mixed. For example, the generation device 100 may generate the second graph by using the first graph in which the node corresponding to the user and the node corresponding to the electronic device are connected by an edge. As described above, the generation device 100 may use the first graph in which the nodes corresponding to any subject are connected by edges. That is, the generation device 100 may use any first graph to generate the second graph.

〔2.生成装置の構成〕
次に、図3を用いて、実施形態に係る生成装置100の構成について説明する。図3は、実施形態に係る生成装置の構成例を示す図である。生成装置100は、第1グラフに基づいて、第2グラフを生成する情報処理装置である。図3に示すように、生成装置100は、通信部110と、記憶部120と、制御部130とを有する。なお、生成装置100は、各種の情報を表示する表示部や、各種の情報を入力する入力部を有してもよい。
[2. Generator configuration]
Next, the configuration of the generation device 100 according to the embodiment will be described with reference to FIG. FIG. 3 is a diagram showing a configuration example of the generator according to the embodiment. The generation device 100 is an information processing device that generates a second graph based on the first graph. As shown in FIG. 3, the generation device 100 includes a communication unit 110, a storage unit 120, and a control unit 130. The generation device 100 may have a display unit for displaying various information and an input unit for inputting various information.

(通信部110)
通信部110は、例えば、NIC等によって実現される。そして、通信部110は、所定のネットワークと有線または無線で接続され、外部の情報処理装置との間で情報の送受信を行う。
(Communication unit 110)
The communication unit 110 is realized by, for example, a NIC or the like. Then, the communication unit 110 is connected to a predetermined network by wire or wirelessly, and transmits / receives information to / from an external information processing device.

(記憶部120)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。実施形態に係る記憶部120は、図3に示すように、取引情報記憶部121と、第1グラフ情報記憶部122と、カテゴリ情報記憶部123と、属性情報記憶部124と、スコア情報記憶部125と、第2グラフ情報記憶部126とを有する。
(Memory unit 120)
The storage unit 120 is realized by, for example, a semiconductor memory element such as a RAM (Random Access Memory) or a flash memory (Flash Memory), or a storage device such as a hard disk or an optical disk. As shown in FIG. 3, the storage unit 120 according to the embodiment includes a transaction information storage unit 121, a first graph information storage unit 122, a category information storage unit 123, an attribute information storage unit 124, and a score information storage unit. It has 125 and a second graph information storage unit 126.

(取引情報記憶部121)
実施形態に係る取引情報記憶部121は、取引情報を記憶する。図4は、実施形態に係る取引情報記憶部の一例を示す図である。図4に示す例においては、取引情報として、電子商取引における取引のログ情報が記憶される。例えば、取引情報記憶部121に記憶された取引情報は、第1グラフの生成に用いられる。図4に示すように、取引情報記憶部121は、取引情報として、「取引ID」、「買主ID(ノードID)」、「売主ID」、「商品ID」、「日時」等の項目を有する。なお、項目は上記に限らず、取引情報記憶部121は、取引された商品が属するカテゴリに関する項目や取引金額等に関する項目など、目的に応じて種々の項目を有してもよい。
(Transaction Information Storage Unit 121)
The transaction information storage unit 121 according to the embodiment stores transaction information. FIG. 4 is a diagram showing an example of the transaction information storage unit according to the embodiment. In the example shown in FIG. 4, log information of transactions in electronic commerce is stored as transaction information. For example, the transaction information stored in the transaction information storage unit 121 is used to generate the first graph. As shown in FIG. 4, the transaction information storage unit 121 has items such as "transaction ID", "buyer ID (node ID)", "seller ID", "product ID", and "date and time" as transaction information. .. The items are not limited to the above, and the transaction information storage unit 121 may have various items depending on the purpose, such as items related to the category to which the traded product belongs and items related to the transaction amount.

「取引ID」は、電子商取引における各取引を識別するための識別情報を示す。「買主ID(ノードID)」は、対応する取引IDにより識別される取引における買主である主体(ユーザ)を識別するための識別情報を示す。また、「売主ID」は、対応する取引IDにより識別される取引における売主である主体(ユーザ)を識別するための識別情報を示す。なお、図4に示す例においては、買主IDとして、ノードIDを用いた場合を示すが、ノードIDと対応付けられたユーザIDやショップIDを用いてもよい。また、ノードIDは、図1に示す各ノードの符号に対応する。例えば、ノードID「N11」により識別される買主は、図1に示すノードN11に対応する。すなわち、ノードID「N11」により識別されるノードと、図1中のノードN11とは同じノードを示し、図1に示す他のノードについても同様である。また、「商品ID」は、対応する取引IDにより識別される取引において売買された商品を識別するための識別情報を示す。また、「日時」は、対応する取引IDにより識別される取引が成立した日時を示す。 The "transaction ID" indicates identification information for identifying each transaction in an electronic commerce transaction. The "buyer ID (node ID)" indicates identification information for identifying the subject (user) who is the buyer in the transaction identified by the corresponding transaction ID. Further, the "seller ID" indicates identification information for identifying the subject (user) who is the seller in the transaction identified by the corresponding transaction ID. In the example shown in FIG. 4, a case where a node ID is used as the buyer ID is shown, but a user ID or a shop ID associated with the node ID may be used. Further, the node ID corresponds to the code of each node shown in FIG. For example, the buyer identified by the node ID "N11" corresponds to the node N11 shown in FIG. That is, the node identified by the node ID "N11" and the node N11 in FIG. 1 indicate the same node, and the same applies to the other nodes shown in FIG. Further, the "product ID" indicates identification information for identifying the product bought and sold in the transaction identified by the corresponding transaction ID. Further, the "date and time" indicates the date and time when the transaction identified by the corresponding transaction ID was completed.

例えば、図4に示す例において、取引ID「T11」により識別される取引は、買主ID(ノードID)「N11」により識別されるノードに対応する買主が、売主ID「SR11」により識別される売主から、商品ID「G11」により識別される商品を、日時「2016/2/22 13:05」に購入したことを示す。 For example, in the example shown in FIG. 4, in the transaction identified by the transaction ID "T11", the buyer corresponding to the node identified by the buyer ID (node ID) "N11" is identified by the seller ID "SR11". Indicates that the seller has purchased the product identified by the product ID "G11" at the date and time "2016/2/22 13:05".

(第1グラフ情報記憶部122)
実施形態に係る第1グラフ情報記憶部122は、第1グラフに関する情報(以下、「第1グラフ情報」や単に「第1グラフ」ともいう)を記憶する。図5は、実施形態に係る第1グラフ情報記憶部の一例を示す図である。図5に示すように、第1グラフ情報記憶部122は、第1グラフ情報として、ノードID(買主ID)により識別される買主に対応するノード間を連結するエッジの有無を記憶する。例えば、ノード間を連結するエッジが有る場合は「1」を記憶し、ノード間を連結するエッジが無い場合は「0」を記憶する。
(First Graph Information Storage Unit 122)
The first graph information storage unit 122 according to the embodiment stores information related to the first graph (hereinafter, also referred to as “first graph information” or simply “first graph”). FIG. 5 is a diagram showing an example of the first graph information storage unit according to the embodiment. As shown in FIG. 5, the first graph information storage unit 122 stores, as the first graph information, the presence / absence of an edge connecting the nodes corresponding to the buyer identified by the node ID (buyer ID). For example, if there is an edge connecting the nodes, "1" is stored, and if there is no edge connecting the nodes, "0" is stored.

例えば、図5に示す例において、ノードID「N11」の行とノードID「N12」の列とが交差する領域には、ノードID「N11」により識別される買主に対応するノードとノードID「N12」により識別される買主に対応するノードとの間におけるエッジの有無が記憶される。図5に示す例においては、ノードID「N11」の行とノードID「N12」の列とが交差する領域には、「0」が記憶される。つまり、ノードID「N11」により識別される買主に対応するノードとノードID「N12」により識別される買主に対応するノードとの間にはエッジが連結されていないことを示す。また、図5に示す例においては、ノードID「N11」の行とノードID「N13」の列とが交差する領域には、「1」が記憶される。つまり、ノードID「N11」により識別される買主に対応するノードとノードID「N13」により識別される買主に対応するノードとの間にはエッジが連結されていることを示す。このように、第1グラフ情報記憶部122において「1」が記憶された領域に対応するノード間にはエッジが連結されていることを示す。 For example, in the example shown in FIG. 5, in the area where the row of the node ID “N11” and the column of the node ID “N12” intersect, the node corresponding to the buyer identified by the node ID “N11” and the node ID “N11” The presence or absence of an edge with the node corresponding to the buyer identified by "N12" is stored. In the example shown in FIG. 5, "0" is stored in the area where the row of the node ID "N11" and the column of the node ID "N12" intersect. That is, it indicates that the edge is not connected between the node corresponding to the buyer identified by the node ID “N11” and the node corresponding to the buyer identified by the node ID “N12”. Further, in the example shown in FIG. 5, "1" is stored in the area where the row of the node ID "N11" and the column of the node ID "N13" intersect. That is, it indicates that an edge is connected between the node corresponding to the buyer identified by the node ID “N11” and the node corresponding to the buyer identified by the node ID “N13”. In this way, it is shown that the edges are connected between the nodes corresponding to the area in which "1" is stored in the first graph information storage unit 122.

また、図5に示す例において、ノードID「N12」の行とノードID「N11」の列とが交差する領域には、ノードID「N11」の行とノードID「N12」の列とが交差する領域と同様の情報が記憶される。なお、生成装置100は、ノードID「N11」の行とノードID「N12」の列とが交差する領域かノードID「N12」の行とノードID「N11」の列とが交差する領域かのいずれか一方のみを記憶してもよい。なお、ノードID「N11」の行とノードID「N11」の列とが交差する領域には、「0」を記憶してもよい。他のノードID「N12」等についても同様である。また、図5に示す例においては、ノードIDとノードIDとの行列(マトリクス)の形状で記憶される場合を一例として図示したが、第1グラフ情報を記憶できれば、どのように記憶されてもよい。例えば、第1グラフ情報は、各ノードIDに対してエッジが張られているノードID、すなわち各ノードIDと連結されているノードIDのリストを保存する辞書の形状で記憶されてもよい。 Further, in the example shown in FIG. 5, in the area where the row of the node ID “N12” and the column of the node ID “N11” intersect, the row of the node ID “N11” and the column of the node ID “N12” intersect. The same information as the area to be stored is stored. The generation device 100 is an area where the row of the node ID "N11" and the column of the node ID "N12" intersect or the area where the row of the node ID "N12" and the column of the node ID "N11" intersect. Only one of them may be stored. Note that "0" may be stored in the area where the row of the node ID "N11" and the column of the node ID "N11" intersect. The same applies to other node IDs "N12" and the like. Further, in the example shown in FIG. 5, the case where the node ID and the node ID are stored in the form of a matrix is shown as an example, but if the first graph information can be stored, no matter how it is stored. good. For example, the first graph information may be stored in the form of a node ID having an edge for each node ID, that is, a dictionary that stores a list of node IDs linked to each node ID.

(カテゴリ情報記憶部123)
実施形態に係るカテゴリ情報記憶部123は、カテゴリに関する情報(以下、「カテゴリ情報」ともいう)を記憶する。図6は、実施形態に係るカテゴリ情報記憶部の一例を示す図である。図6に示す例においては、取引される商品を分類するカテゴリに関する情報が記憶される。図6に示すように、カテゴリ情報記憶部123は、カテゴリ情報として、「第1階層」、「第2階層」、「第3階層」の項目を有する。なお、項目は上記に限らず、カテゴリ情報記憶部123は、カテゴリの階層構造に応じて「第4階層」や「第5階層」等の項目を有してもよい。
(Category information storage unit 123)
The category information storage unit 123 according to the embodiment stores information related to the category (hereinafter, also referred to as “category information”). FIG. 6 is a diagram showing an example of the category information storage unit according to the embodiment. In the example shown in FIG. 6, information about the category that classifies the traded goods is stored. As shown in FIG. 6, the category information storage unit 123 has items of "first layer", "second layer", and "third layer" as category information. The items are not limited to the above, and the category information storage unit 123 may have items such as "fourth layer" and "fifth layer" depending on the hierarchical structure of the category.

「第1階層」には、「本、雑誌」のカテゴリC1や「ファッション」のカテゴリC2等が含まれる。また、第1階層である「本、雑誌」のカテゴリC1の下位の「第2階層」には、「文芸」のカテゴリC11や「子ども」のカテゴリC12等が含まれる。また、第2階層である「文芸」のカテゴリC11の下位の「第3階層」には、「ファンタジー」のカテゴリC111や「ノンフィクション」のカテゴリC112や「歴史」のカテゴリC113等が含まれる。なお、上記のカテゴリ階層は一例であり、目的に応じて種々のカテゴリ階層が構成されてもよい。また、カテゴリ情報記憶部123に記憶されるカテゴリ情報は、適宜変更されてもよい。この点については後述する。 The "first layer" includes category C1 of "books and magazines", category C2 of "fashion", and the like. Further, the "second layer" below the category C1 of the "books and magazines" which is the first layer includes the category C11 of the "literary arts" and the category C12 of the "children". Further, the "third layer" below the category C11 of the "literary arts" which is the second layer includes the category C111 of the "fantasy", the category C112 of the "nonfiction", the category C113 of the "history" and the like. The above category hierarchy is an example, and various category hierarchies may be configured depending on the purpose. Further, the category information stored in the category information storage unit 123 may be changed as appropriate. This point will be described later.

(属性情報記憶部124)
実施形態に係る属性情報記憶部124は、買主(ユーザ)の属性に関する情報(以下、「属性情報」ともいう)を記憶する。図7は、実施形態に係る属性情報記憶部の一例を示す図である。図7に示す例においては、属性情報記憶部124には、買主(ユーザ)が購入した商品のカテゴリ情報が属性情報として記憶される。図7に示すように、属性情報記憶部124は、属性情報として、ノードID(買主ID)により識別される買主が購入した商品のカテゴリごとにその購入回数を記憶する。
(Attribute information storage unit 124)
The attribute information storage unit 124 according to the embodiment stores information related to the attributes of the buyer (user) (hereinafter, also referred to as “attribute information”). FIG. 7 is a diagram showing an example of the attribute information storage unit according to the embodiment. In the example shown in FIG. 7, the attribute information storage unit 124 stores the category information of the product purchased by the buyer (user) as the attribute information. As shown in FIG. 7, the attribute information storage unit 124 stores the number of purchases for each category of the product purchased by the buyer identified by the node ID (buyer ID) as the attribute information.

例えば、図7に示す例においては、ノードN11に対応する買主は、「文芸」のカテゴリC11に属する商品を5回購入し、「子ども」のカテゴリC12に属する商品を購入したことがないことを示す。また、例えば、図7に示す例においては、ノードN12に対応する買主は、「文芸」のカテゴリC11に属する商品を4回購入し、「子ども」のカテゴリC12に属する商品を1回購入したことを示す。 For example, in the example shown in FIG. 7, the buyer corresponding to the node N11 has purchased the product belonging to the category C11 of "literary arts" five times and has never purchased the product belonging to the category C12 of "children". show. Further, for example, in the example shown in FIG. 7, the buyer corresponding to the node N12 purchased the product belonging to the category C11 of "literary arts" four times and the product belonging to the category C12 of "children" once. Is shown.

(スコア情報記憶部125)
実施形態に係るスコア情報記憶部125は、各ノードの組み合わせにおけるスコアに関する情報(以下、「スコア情報」ともいう)を記憶する。図8は、実施形態に係るスコア情報記憶部の一例を示す図である。図8に示す例においては、第1ノードと第2ノードとの組み合わせごとに算出されたスコアが記憶される。図8に示すように、スコア情報記憶部125は、スコア情報として、「買主ID(ノードID)」、「スコア」の項目を有する。また、「買主ID(ノードID)」には、「第1ノード」、「第2ノード」の項目が含まれる。なお、項目は上記に限らず、スコア情報記憶部125は、目的に応じて種々の項目を有してもよい。
(Score information storage unit 125)
The score information storage unit 125 according to the embodiment stores information regarding the score in the combination of each node (hereinafter, also referred to as “score information”). FIG. 8 is a diagram showing an example of the score information storage unit according to the embodiment. In the example shown in FIG. 8, the score calculated for each combination of the first node and the second node is stored. As shown in FIG. 8, the score information storage unit 125 has items of “buyer ID (node ID)” and “score” as score information. Further, the "buyer ID (node ID)" includes the items of "first node" and "second node". The items are not limited to the above, and the score information storage unit 125 may have various items depending on the purpose.

「第1ノード」及び「第2ノード」は、対応するスコアを算出する対象となった一組のノードを示す。「スコア」は、対応する一組のノードについて算出されたスコアを示す。 The "first node" and the "second node" indicate a set of nodes for which the corresponding score is calculated. "Score" indicates the score calculated for the corresponding set of nodes.

例えば、図8に示す例においては、ノードN11とノードN12との一組のノードについて算出されたスコアが「0.8」であることを示す。また、例えば、図8に示す例においては、ノードN11とノードN13との一組のノードについて算出されたスコアが「0.7」であることを示す。また、例えば、図8に示す例においては、ノードN21とノードN22との一組のノードについて算出されたスコアが「0.2」であることを示す。 For example, in the example shown in FIG. 8, it is shown that the score calculated for a set of nodes of node N11 and node N12 is "0.8". Further, for example, in the example shown in FIG. 8, it is shown that the score calculated for a set of nodes of node N11 and node N13 is "0.7". Further, for example, in the example shown in FIG. 8, it is shown that the score calculated for a set of nodes of node N21 and node N22 is "0.2".

(第2グラフ情報記憶部126)
実施形態に係る第2グラフ情報記憶部126は、第2グラフに関する情報(以下、「第2グラフ情報」や単に「第2グラフ」ともいう)を記憶する。図9は、実施形態に係る第2グラフ情報記憶部の一例を示す図である。図9に示すように、第2グラフ情報記憶部126は、第2グラフ情報として、ノードID(買主ID)により識別される買主に対応するノード間を連結するエッジの有無を記憶する。具体的には、第2グラフ情報記憶部126は、第1グラフ情報記憶部122に記憶された第1グラフ情報に基づいて生成された第2グラフ情報を記憶する。例えば、ノード間を連結するエッジが有る場合は「1」を記憶し、ノード間を連結するエッジが無い場合は「0」を記憶する。
(2nd Graph Information Storage Unit 126)
The second graph information storage unit 126 according to the embodiment stores information related to the second graph (hereinafter, also referred to as “second graph information” or simply “second graph”). FIG. 9 is a diagram showing an example of the second graph information storage unit according to the embodiment. As shown in FIG. 9, the second graph information storage unit 126 stores as the second graph information the presence / absence of an edge connecting the nodes corresponding to the buyer identified by the node ID (buyer ID). Specifically, the second graph information storage unit 126 stores the second graph information generated based on the first graph information stored in the first graph information storage unit 122. For example, if there is an edge connecting the nodes, "1" is stored, and if there is no edge connecting the nodes, "0" is stored.

例えば、図9に示す例において、ノードID「N11」の行とノードID「N12」の列とが交差する領域には、ノードID「N11」により識別される買主に対応するノードとノードID「N12」により識別される買主に対応するノードとの間におけるエッジの有無が記憶される。図9に示す例においては、ノードID「N11」の行とノードID「N12」の列とが交差する領域には、「1」が記憶される。つまり、ノードID「N11」により識別される買主に対応するノードとノードID「N12」により識別される買主に対応するノードとの間にはエッジが連結されていることを示す。このように、第2グラフ情報記憶部126に記憶された第2グラフ情報には、第1グラフ情報記憶部122に記憶された第1グラフ情報においてエッジが連結されていなかったノードN11とノードN12との間にエッジが連結されたことを示す。 For example, in the example shown in FIG. 9, in the area where the row of the node ID “N11” and the column of the node ID “N12” intersect, the node corresponding to the buyer identified by the node ID “N11” and the node ID “N11” The presence or absence of an edge with the node corresponding to the buyer identified by "N12" is stored. In the example shown in FIG. 9, "1" is stored in the area where the row of the node ID "N11" and the column of the node ID "N12" intersect. That is, it indicates that an edge is connected between the node corresponding to the buyer identified by the node ID “N11” and the node corresponding to the buyer identified by the node ID “N12”. As described above, the second graph information stored in the second graph information storage unit 126 includes the nodes N11 and N12 whose edges are not connected in the first graph information stored in the first graph information storage unit 122. Indicates that the edge is connected between and.

例えば、図9に示す例において、ノードID「N21」の行とノードID「N22」の列とが交差する領域には、ノードID「N21」により識別される買主に対応するノードとノードID「N22」により識別される買主に対応するノードとの間におけるエッジの有無が記憶される。図9に示す例においては、ノードID「N21」の行とノードID「N22」の列とが交差する領域には、「0」が記憶される。つまり、ノードID「N21」により識別される買主に対応するノードとノードID「N22」により識別される買主に対応するノードとの間にはエッジが連結されていないことを示す。このように、第2グラフ情報記憶部126に記憶された第2グラフ情報には、第1グラフ情報記憶部122に記憶された第1グラフ情報においてエッジが連結されていたノードN21とノードN22との間のエッジが解除されたことを示す。 For example, in the example shown in FIG. 9, in the area where the row of the node ID “N21” and the column of the node ID “N22” intersect, the node corresponding to the buyer identified by the node ID “N21” and the node ID “N21” The presence or absence of an edge with the node corresponding to the buyer identified by "N22" is stored. In the example shown in FIG. 9, "0" is stored in the area where the row of the node ID "N21" and the column of the node ID "N22" intersect. That is, it indicates that the edge is not connected between the node corresponding to the buyer identified by the node ID “N21” and the node corresponding to the buyer identified by the node ID “N22”. As described above, the second graph information stored in the second graph information storage unit 126 includes the node N21 and the node N22 in which the edges are connected in the first graph information stored in the first graph information storage unit 122. Indicates that the edge between is released.

また、図9に示す例において、ノードID「N12」の行とノードID「N11」の列とが交差する領域には、ノードID「N11」の行とノードID「N12」の列とが交差する領域と同様の情報が記憶される。なお、生成装置100は、ノードID「N11」の行とノードID「N12」の列とが交差する領域かノードID「N12」の行とノードID「N11」の列とが交差する領域かのいずれか一方のみを記憶してもよい。なお、ノードID「N11」の行とノードID「N11」の列とが交差する領域には、「0」を記憶してもよい。他のノードID「N12」等についても同様である。また、図9に示す例においては、ノードIDとノードIDとの行列(マトリクス)の形状で記憶される場合を一例として図示したが、第2グラフ情報を記憶できれば、どのように記憶されてもよい。例えば、第2グラフ情報は、各ノードIDに対してエッジが張られているノードID、すなわち各ノードIDと連結されているノードIDのリストを保存する辞書の形状で記憶されてもよい。 Further, in the example shown in FIG. 9, in the area where the row of the node ID "N12" and the column of the node ID "N11" intersect, the row of the node ID "N11" and the column of the node ID "N12" intersect. The same information as the area to be stored is stored. The generation device 100 is an area where the row of the node ID "N11" and the column of the node ID "N12" intersect or the area where the row of the node ID "N12" and the column of the node ID "N11" intersect. Only one of them may be stored. Note that "0" may be stored in the area where the row of the node ID "N11" and the column of the node ID "N11" intersect. The same applies to other node IDs "N12" and the like. Further, in the example shown in FIG. 9, the case where the node ID and the node ID are stored in the form of a matrix is shown as an example, but if the second graph information can be stored, no matter how it is stored. good. For example, the second graph information may be stored in the form of a node ID having an edge for each node ID, that is, a dictionary that stores a list of node IDs linked to each node ID.

(制御部130)
図3の説明に戻って、制御部130は、例えば、コントローラ(Controller)であり、CPUやMPU等によって、生成装置100内部の記憶装置に記憶されている各種プログラム(生成プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部130は、例えば、コントローラ(Controller)であり、ASICやFPGA等の集積回路により実現される。
(Control unit 130)
Returning to the description of FIG. 3, the control unit 130 is, for example, a controller, and various programs stored in the storage device inside the generation device 100 by the CPU, MPU, or the like (corresponding to an example of the generation program). Is realized by executing RAM as a work area. Further, the control unit 130 is, for example, a controller, and is realized by an integrated circuit such as an ASIC or FPGA.

図3に示すように、制御部130は、取得部131と、第1生成部132と、第2生成部133と、送信部134とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部130の内部構成は、図3に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、制御部130が有する各処理部の接続関係は、図3に示した接続関係に限られず、他の接続関係であってもよい。 As shown in FIG. 3, the control unit 130 includes an acquisition unit 131, a first generation unit 132, a second generation unit 133, and a transmission unit 134, and has functions and operations of information processing described below. Realize or execute. The internal configuration of the control unit 130 is not limited to the configuration shown in FIG. 3, and may be another configuration as long as it is a configuration for performing information processing described later. Further, the connection relationship of each processing unit included in the control unit 130 is not limited to the connection relationship shown in FIG. 3, and may be another connection relationship.

(取得部131)
取得部131は、各種情報を取得する。取得部131は、取引情報や第1グラフ情報等を取得する。例えば、取得部131は、電子商取引のサービスを提供する外部装置から取引情報を取得してもよい。また、取得部131は、電子商取引のサービスを提供する外部装置から取得した取引情報を取引情報記憶部121に格納する。また、例えば、取得部131は、属性情報記憶部124から属性情報を取得する。
(Acquisition unit 131)
The acquisition unit 131 acquires various types of information. The acquisition unit 131 acquires transaction information, first graph information, and the like. For example, the acquisition unit 131 may acquire transaction information from an external device that provides an electronic commerce service. Further, the acquisition unit 131 stores the transaction information acquired from the external device that provides the electronic commerce service in the transaction information storage unit 121. Further, for example, the acquisition unit 131 acquires the attribute information from the attribute information storage unit 124.

また、取得部131は、第1グラフ情報等を取得する。例えば、取得部131は、各第1の主体と所定の関係を有する第2の主体が所定の条件を満たす第1の主体に対応するノード間をエッジで連結した第1グラフを取得する。例えば、取得部131は、各買主と所定の関係を有する売主の集合が所定の条件を満たす買主に対応するノード間をエッジで連結した第1グラフを取得する。例えば、取得部131は、買主に対応するノードのうち、所定の回数以上の取引を行った売主の集合間の類似度が所定の閾値以上となるノード間をエッジで連結した第1グラフを取得する。例えば、取得部131は、買主に対応するノードのうち、5回以上の取引を行った売主の集合間のジャッカード係数が0.2以上となるノード間をエッジで連結した第1グラフを取得する。例えば、取得部131は、各ノードに属性情報が対応付けられた第1グラフを取得する。例えば、取得部131は、属性情報として各ノードに対応するユーザと所定の関係を有する商品のカテゴリ情報が各ノードに対応付けられた第1グラフを取得する。例えば、取得部131は、属性情報として各ノードに対応するユーザが購入した商品のカテゴリ情報が各ノードに対応付けられた第1グラフを取得する。例えば、取得部131は、第1グラフ情報記憶部122から第1グラフ情報を取得する。また、例えば、取得部131は、外部装置から第1グラフ情報を取得してもよい。また、取得部131は外部装置から取得した第1グラフ情報を第1グラフ情報記憶部122に格納してもよい。また、取得部131は、属性情報として各ノードに対応するユーザの属性情報が各ノードに対応付けられた第1グラフを取得してもよい。取得部131は、各ノードに第1カテゴリの属性情報と第2カテゴリの属性情報とが対応付けられた第1グラフを取得する。なお、これらの点については後述する。 In addition, the acquisition unit 131 acquires the first graph information and the like. For example, the acquisition unit 131 acquires a first graph in which a second subject having a predetermined relationship with each first subject connects nodes corresponding to the first subject satisfying a predetermined condition with an edge. For example, the acquisition unit 131 acquires a first graph in which a set of sellers having a predetermined relationship with each buyer connects the nodes corresponding to the buyers satisfying the predetermined conditions with an edge. For example, the acquisition unit 131 acquires a first graph in which among the nodes corresponding to the buyer, the nodes in which the similarity between the sets of sellers who have made transactions a predetermined number of times or more is equal to or higher than a predetermined threshold value are connected by an edge. do. For example, the acquisition unit 131 acquires a first graph in which nodes having a Jaccard index of 0.2 or more between a set of sellers who have made five or more transactions among the nodes corresponding to the buyer are connected by an edge. do. For example, the acquisition unit 131 acquires the first graph in which the attribute information is associated with each node. For example, the acquisition unit 131 acquires the first graph in which the category information of the product having a predetermined relationship with the user corresponding to each node is associated with each node as the attribute information. For example, the acquisition unit 131 acquires the first graph in which the category information of the product purchased by the user corresponding to each node is associated with each node as the attribute information. For example, the acquisition unit 131 acquires the first graph information from the first graph information storage unit 122. Further, for example, the acquisition unit 131 may acquire the first graph information from an external device. Further, the acquisition unit 131 may store the first graph information acquired from the external device in the first graph information storage unit 122. Further, the acquisition unit 131 may acquire the first graph in which the attribute information of the user corresponding to each node is associated with each node as the attribute information. The acquisition unit 131 acquires the first graph in which the attribute information of the first category and the attribute information of the second category are associated with each node. These points will be described later.

(第1生成部132)
第1生成部132は、取引情報に基づいて第1グラフを生成する。例えば、第1生成部132は、各買主と所定の関係を有する売主の集合が所定の条件を満たす買主に対応するノード間をエッジで連結した第1グラフを生成する。例えば、第1生成部132は、取引情報記憶部121に記憶された取引情報に基づいて、第1グラフを生成する。図1では、第1生成部132は、取引一覧表TL11に示すような電子商取引における買主と売主(ユーザ)との対応に基づいて第1グラフG11を生成する。例えば、第1生成部132は、買主に対応するノードのうち、所定の回数以上の取引を行った売主の集合間の類似度が所定の閾値以上となるノード間をエッジで連結した第1グラフを生成する。図1では、第1生成部132は、買主に対応するノードのうち、5回以上の取引を行った売主の集合間のジャッカード係数が0.2以上となるノード間をエッジで連結した第1グラフG11を生成する。例えば、第1生成部132は、ノードN11とノードN13とをエッジで連結した第1グラフG11を生成する。例えば、第1生成部132は、ノードN21とノードN22とノードN24との各々をエッジで連結した第1グラフG11を生成する。
(1st generation unit 132)
The first generation unit 132 generates the first graph based on the transaction information. For example, the first generation unit 132 generates a first graph in which a set of sellers having a predetermined relationship with each buyer connects nodes corresponding to buyers satisfying a predetermined condition with an edge. For example, the first generation unit 132 generates the first graph based on the transaction information stored in the transaction information storage unit 121. In FIG. 1, the first generation unit 132 generates the first graph G11 based on the correspondence between the buyer and the seller (user) in the electronic commerce as shown in the transaction list TL11. For example, the first generation unit 132 connects the nodes corresponding to the buyer with the edges where the similarity between the sets of sellers who have made transactions a predetermined number of times or more is equal to or higher than a predetermined threshold value. To generate. In FIG. 1, the first generation unit 132 connects nodes having a Jaccard index of 0.2 or more between a set of sellers who have made five or more transactions among the nodes corresponding to the buyer at an edge. 1 Graph G11 is generated. For example, the first generation unit 132 generates the first graph G11 in which the node N11 and the node N13 are connected by an edge. For example, the first generation unit 132 generates the first graph G11 in which each of the node N21, the node N22, and the node N24 is connected by an edge.

なお、生成装置100は、外部装置から第1グラフ情報を取得する場合、第1生成部132を有しなくてもよい。 The generation device 100 does not have to have the first generation unit 132 when acquiring the first graph information from the external device.

(第2生成部133)
第2生成部133は、第1グラフに基づいて第2グラフを生成する生成部である。例えば、第2生成部133は、取得部131により取得された第1グラフにおける複数のノードのうち、第1ノード及び第2ノードと第3ノードとの関係性に基づいて、第1ノードと第2ノードとの間のエッジを変更した第2グラフを生成する。
(2nd generation unit 133)
The second generation unit 133 is a generation unit that generates a second graph based on the first graph. For example, the second generation unit 133 has the first node and the second node based on the relationship between the first node and the second node and the third node among the plurality of nodes in the first graph acquired by the acquisition unit 131. Generate a second graph with modified edges between the two nodes.

また、第2生成部133は、第1ノード及び第2ノードとの間がエッジで連結された第3ノードとの関係性に基づいて、第2グラフを生成する。例えば、第2生成部133は、第1ノードと第3ノードとの類似度と、第2ノードと第3ノードとの類似度とに基づいて、第2グラフを生成する。例えば、第2生成部133は、第1ノード及び第2ノードとの間がエッジで連結された第3ノードの数に基づいて、第2グラフを生成する。 In addition, the second generation unit 133 generates the second graph based on the relationship with the third node in which the first node and the second node are connected by an edge. For example, the second generation unit 133 generates the second graph based on the similarity between the first node and the third node and the similarity between the second node and the third node. For example, the second generation unit 133 generates the second graph based on the number of the third nodes in which the first node and the second node are connected by an edge.

また、第2生成部133は、第1ノードの属性情報及び第2ノードの属性情報と第3ノードの属性情報との関係性に基づいて、第2グラフを生成する。また、例えば、第2生成部133は、属性情報として各ノードに対応するユーザが購入した商品のカテゴリ情報が各ノードに対応付けられた第1グラフに基づいて、第2グラフを生成する。 In addition, the second generation unit 133 generates the second graph based on the attribute information of the first node and the relationship between the attribute information of the second node and the attribute information of the third node. Further, for example, the second generation unit 133 generates a second graph based on the first graph in which the category information of the product purchased by the user corresponding to each node is associated with each node as the attribute information.

図2では、第2生成部133は、第1グラフG11から第2グラフG12を生成する。例えば、第2生成部133は、第1グラフG11において第1ノードに連結された第3ノードと第1ノードとの類似度や、第1グラフG11において第2ノードに連結された第3ノードと第2ノードとの類似度に基づいて、スコアを算出する。例えば、第2生成部133は、上記式(1)を用いて、第1ノードと第2ノードとの組み合わせにおけるスコアを算出する。 In FIG. 2, the second generation unit 133 generates the second graph G12 from the first graph G11. For example, the second generation unit 133 includes the similarity between the third node connected to the first node in the first graph G11 and the first node, and the third node connected to the second node in the first graph G11. The score is calculated based on the similarity with the second node. For example, the second generation unit 133 calculates the score in the combination of the first node and the second node by using the above equation (1).

例えば、第2生成部133は、上記式(1)により算出されたスコアと、所定の閾値とに基づいて、第1ノードと第2ノードとの間のエッジを変更した第2グラフG12を生成する。例えば、第2生成部133は、上記式(1)により算出されたスコアと、所定の閾値とに基づいて、第1グラフG11においてノード間を連結したエッジを解除したり、ノード間を新たなエッジにより連結したりすることにより、第2グラフG12を生成する。 For example, the second generation unit 133 generates a second graph G12 in which the edge between the first node and the second node is changed based on the score calculated by the above equation (1) and a predetermined threshold value. do. For example, the second generation unit 133 releases the edges connecting the nodes in the first graph G11 based on the score calculated by the above equation (1) and a predetermined threshold value, or newly creates the nodes. The second graph G12 is generated by connecting by edges.

例えば、図2の例では、第2生成部133は、上記式(1)により算出されたスコアが0.5以上である場合、スコアに対応する第1ノードと第2ノードとの間をエッジで連結する。例えば、第2生成部133は、第1グラフG11においてエッジで連結された第1ノードと第2ノードのスコアが0.5以上である場合、スコアに対応する第1ノードと第2ノードとの間を連結するエッジを維持する。また、例えば、第2生成部133は、第1グラフG11においてエッジで連結されていない第1ノードと第2ノードのスコアが0.5以上である場合、スコアに対応する第1ノードと第2ノードとの間をエッジで連結する。また、例えば、第2生成部133は、第1グラフG11においてエッジで連結された第1ノードと第2ノードのスコアが0.5未満である場合、スコアに対応する第1ノードと第2ノードとの間を連結するエッジを解除する。 For example, in the example of FIG. 2, when the score calculated by the above equation (1) is 0.5 or more, the second generation unit 133 has an edge between the first node and the second node corresponding to the score. Connect with. For example, when the score of the first node and the second node connected by the edge in the first graph G11 is 0.5 or more, the second generation unit 133 sets the first node and the second node corresponding to the score. Maintain the edges that connect between. Further, for example, when the scores of the first node and the second node not connected by the edge in the first graph G11 are 0.5 or more, the second generation unit 133 has the first node and the second node corresponding to the scores. Connect to the node with an edge. Further, for example, when the score of the first node and the second node connected by the edge in the first graph G11 is less than 0.5, the second generation unit 133 has the first node and the second node corresponding to the score. Release the edge that connects to and.

例えば、第2生成部133は、第1グラフG11においてエッジで連結されていないノードN11とノードN12のスコアが0.8であり閾値以上であるため、第2グラフG12において、ノードN11とノードN12との間をエッジで連結する。また、例えば、第2生成部133は、第1グラフG11においてエッジで連結されたノードN11とノードN13のスコアが0.7であり閾値以上であるため、第2グラフG12においても、ノードN11とノードN13との間を連結するエッジを維持する。また、例えば、第2生成部133は、第1グラフG11においてエッジで連結されたノードN21とノードN22のスコアが0.2であり閾値未満であるため、第2グラフG12において、ノードN21とノードN22との間を連結するエッジを解除する。 For example, in the second graph G12, since the score of the node N11 and the node N12 not connected by the edge in the first graph G11 is 0.8, which is equal to or higher than the threshold value, the second generation unit 133 has the node N11 and the node N12 in the second graph G12. Connect with the edge at the edge. Further, for example, in the second graph G11, the score of the node N11 and the node N13 connected by the edge in the first graph G11 is 0.7, which is equal to or higher than the threshold value. Maintain an edge connecting to and from node N13. Further, for example, in the second graph G12, since the score of the node N21 and the node N22 connected by the edge in the first graph G11 is 0.2, which is less than the threshold value, the second generation unit 133 has the node N21 and the node in the second graph G12. The edge connecting with N22 is released.

なお、第2生成部133は、上記の第2グラフの生成に限らず、以下のような各種処理を行ってもよい。例えば、第2生成部133は、第2グラフに含まれる所定のクラスタに属するノードの属性情報に基づいて、属性情報に対応するカテゴリを変更する。また、例えば、第2生成部133は、第2グラフに含まれる所定のクラスタに属するノードに共通する属性情報が複数ある場合、当該属性情報に対応するカテゴリを統合する。また、例えば、第2生成部133は、第2グラフに含まれる複数のクラスタの各々に属するノードに共通する属性情報がある場合、当該属性情報に対応するカテゴリを分割する。また、例えば、第2生成部133は、属性情報として各ノードに対応するユーザの属性情報が各ノードに対応付けられた第1グラフに基づいて、第2グラフを生成してもよい。また、例えば、第2生成部133は、第1ノードの第1カテゴリの属性情報及び第2ノードの第1カテゴリの属性情報と第3ノードの第1カテゴリの属性情報との関係性に基づいて、第1カテゴリの第2グラフを生成する。また、例えば、第2生成部133は、第1ノードの第2カテゴリの属性情報及び第2ノードの第2カテゴリの属性情報と第3ノードの第2カテゴリの属性情報との関係性に基づいて、第2カテゴリの第2グラフを生成する。また、例えば、第2生成部133は、第1カテゴリの第2グラフと第2カテゴリの第2グラフとに基づいて、第2グラフを生成する。なお、これらの点については後述する。 The second generation unit 133 is not limited to the generation of the second graph described above, and may perform various processes as follows. For example, the second generation unit 133 changes the category corresponding to the attribute information based on the attribute information of the nodes belonging to the predetermined cluster included in the second graph. Further, for example, when the second generation unit 133 has a plurality of attribute information common to the nodes belonging to the predetermined cluster included in the second graph, the second generation unit 133 integrates the categories corresponding to the attribute information. Further, for example, when the second generation unit 133 has attribute information common to the nodes belonging to each of the plurality of clusters included in the second graph, the second generation unit 133 divides the categories corresponding to the attribute information. Further, for example, the second generation unit 133 may generate a second graph based on the first graph in which the attribute information of the user corresponding to each node is associated with each node as the attribute information. Further, for example, the second generation unit 133 is based on the relationship between the attribute information of the first category of the first node, the attribute information of the first category of the second node, and the attribute information of the first category of the third node. , Generate a second graph of the first category. Further, for example, the second generation unit 133 is based on the relationship between the attribute information of the second category of the first node, the attribute information of the second category of the second node, and the attribute information of the second category of the third node. , Generate a second graph of the second category. Further, for example, the second generation unit 133 generates a second graph based on the second graph of the first category and the second graph of the second category. These points will be described later.

(送信部134)
送信部134は、各種情報を外部装置へ送信する。例えば、送信部134は、外部の情報処理装置に第2生成部133により生成された第2グラフ情報を送信してもよい。
(Transmission unit 134)
The transmission unit 134 transmits various information to the external device. For example, the transmission unit 134 may transmit the second graph information generated by the second generation unit 133 to an external information processing device.

〔3.生成処理のフロー〕
次に、図10を用いて、実施形態に係る生成装置100による生成処理の手順について説明する。図10は、実施形態に係る生成装置100による生成処理手順を示すフローチャートである。
[3. Generation process flow]
Next, the procedure of the generation process by the generation apparatus 100 according to the embodiment will be described with reference to FIG. FIG. 10 is a flowchart showing a generation processing procedure by the generation device 100 according to the embodiment.

図10に示すように、生成装置100の取得部131は、取引情報を取得する(ステップS101)。例えば、取得部131は、取引情報記憶部121から取引情報を取得する。そして、生成装置100の第1生成部132は、取得部131により取得された取引情報に基づいて第1グラフを生成する(ステップS102)。例えば、第1生成部132は、第1グラフG11を生成する。 As shown in FIG. 10, the acquisition unit 131 of the generation device 100 acquires transaction information (step S101). For example, the acquisition unit 131 acquires transaction information from the transaction information storage unit 121. Then, the first generation unit 132 of the generation device 100 generates the first graph based on the transaction information acquired by the acquisition unit 131 (step S102). For example, the first generation unit 132 generates the first graph G11.

その後、取得部131は、属性情報を取得する(ステップS103)。例えば、取得部131は、属性情報記憶部124から属性情報を取得する。そして、生成装置100の第2生成部133は、ステップS102において生成された第1グラフとステップS103において取得された属性情報に基づいて、ノードの組み合わせごとにスコアを算出する(ステップS104)。例えば、第2生成部133は、上記式(1)を用いて、第1ノードと第2ノードとの組み合わせにおけるスコアを算出する。 After that, the acquisition unit 131 acquires the attribute information (step S103). For example, the acquisition unit 131 acquires attribute information from the attribute information storage unit 124. Then, the second generation unit 133 of the generation device 100 calculates a score for each combination of nodes based on the first graph generated in step S102 and the attribute information acquired in step S103 (step S104). For example, the second generation unit 133 calculates the score in the combination of the first node and the second node by using the above equation (1).

そして、第2生成部133は、ステップS104において算出したスコアに基づいて、第2グラフを生成する(ステップS105)。例えば、第2生成部133は、第2グラフG12を生成する。なお、ステップS104とステップS105は、繰り返し行われてもよい。例えば、生成装置100は、各ノードの組み合わせごとにスコアを算出し、そのノード間のエッジを解除したり、そのノード間をエッジで連結したりする処理を繰り返してもよい。 Then, the second generation unit 133 generates a second graph based on the score calculated in step S104 (step S105). For example, the second generation unit 133 generates the second graph G12. In addition, step S104 and step S105 may be repeated. For example, the generation device 100 may repeat a process of calculating a score for each combination of nodes, releasing edges between the nodes, and connecting the nodes with edges.

〔4.変形例〕
上述した実施形態に係る生成装置100は、上記実施形態以外にも種々の異なる形態にて実施されてもよい。そこで、以下では、生成装置100の他の実施形態について説明する。
[4. Modification example]
The generator 100 according to the above-described embodiment may be implemented in various different forms other than the above-described embodiment. Therefore, another embodiment of the generator 100 will be described below.

〔5.他の属性情報を有する生成装置の構成〕
上記例においては、ユーザ(買主)の属性情報として、買主が購入した商品のカテゴリ情報が用いられる場合を示したが、買主の属性情報は商品のカテゴリ情報に限らず種々の情報が用いられてもよい。すなわち、属性情報には種々の異なるカテゴリの属性情報が適宜用いられてもよい。この点について、図11を用いて、変形例に係る生成装置100Aの構成について説明する。図11は、変形例に係る生成装置の構成例を示す図である。なお、生成装置100Aにおいて、実施形態に係る生成装置100と同様の構成は、同一の符号を付して説明を省略する。
[5. Configuration of generator with other attribute information]
In the above example, the case where the category information of the product purchased by the buyer is used as the attribute information of the user (buyer) is shown, but the attribute information of the buyer is not limited to the category information of the product and various information is used. May be good. That is, various different categories of attribute information may be appropriately used as the attribute information. Regarding this point, the configuration of the generation device 100A according to the modified example will be described with reference to FIG. FIG. 11 is a diagram showing a configuration example of a generator according to a modified example. In the generation device 100A, the same configurations as those of the generation device 100 according to the embodiment are designated by the same reference numerals, and the description thereof will be omitted.

図11に示すように、生成装置100Aは、記憶部120Aに属性情報記憶部124Aやスコア情報記憶部125Aや第2グラフ情報記憶部126Aを有する点において生成装置100と相違する。なお、図11に示す例では、カテゴリ情報記憶部を図示しないが、生成装置100Aは、カテゴリ情報記憶部を有してもよい。 As shown in FIG. 11, the generation device 100A differs from the generation device 100 in that the storage unit 120A includes the attribute information storage unit 124A, the score information storage unit 125A, and the second graph information storage unit 126A. In the example shown in FIG. 11, although the category information storage unit is not shown, the generation device 100A may have a category information storage unit.

(属性情報記憶部124A)
変形例に係る属性情報記憶部124Aは、買主(ユーザ)の属性情報を記憶する。図12は、変形例に係る属性情報記憶部の一例を示す図である。図12に示す例においては、属性情報記憶部124Aには、買主の人口統計学的属性(デモグラフィック属性)が属性情報として記憶される。図12に示すように、属性情報記憶部124Aは、属性情報として、ノードID(買主ID)により識別される買主の性別や年齢等に関するデモグラフィック属性を記憶する。なお、属性情報には、デモグラフィック属性に限らず、目的に応じて種々の情報が含まれてもよい。例えば、属性情報には、心理学的属性(サイコグラフィック属性)に関する情報が含まれてもよい。
(Attribute information storage unit 124A)
The attribute information storage unit 124A according to the modified example stores the attribute information of the buyer (user). FIG. 12 is a diagram showing an example of the attribute information storage unit according to the modified example. In the example shown in FIG. 12, the demographic attribute (demographic attribute) of the buyer is stored as attribute information in the attribute information storage unit 124A. As shown in FIG. 12, the attribute information storage unit 124A stores demographic attributes related to the gender, age, etc. of the buyer identified by the node ID (buyer ID) as the attribute information. The attribute information is not limited to the demographic attribute, and various information may be included depending on the purpose. For example, the attribute information may include information about psychological attributes (psychographic attributes).

例えば、図12に示す例においては、縦の行の各ノードに対応する買主が、横の列の各属性情報に該当する場合には「1」を、属性情報に該当しない場合には「0」を記憶する。例えば、ノードN11に対応する買主は、属性情報「男性」が「0」であり、属性情報「女性」が「1」であり、属性情報「20代」が「1」であり、属性情報「30代」が「0」である。すなわち、ノードN11に対応する買主は、20代女性のユーザであることを示す。 For example, in the example shown in FIG. 12, the buyer corresponding to each node in the vertical row corresponds to "1" when it corresponds to each attribute information in the horizontal column, and "0" when it does not correspond to the attribute information. Remember. For example, in the buyer corresponding to the node N11, the attribute information "male" is "0", the attribute information "female" is "1", the attribute information "20's" is "1", and the attribute information "1". "30's" is "0". That is, it indicates that the buyer corresponding to the node N11 is a female user in her twenties.

また、スコア情報記憶部125Aや第2グラフ情報記憶部126Aには、上記の属性情報記憶部124Aに記憶された属性情報に基づいて算出されたスコアや第2グラフが記憶されるが、図示を省略する。 Further, the score information storage unit 125A and the second graph information storage unit 126A store the score and the second graph calculated based on the attribute information stored in the attribute information storage unit 124A. Omit.

変形例に係る第2生成部133は、上記式(2)の第1指数uや第2指数vには、属性情報記憶部124Aに示す情報中において、ノードuの属性情報のi次元の領域に記憶された値を用いて、スコアを算出してもよい。 Second generating unit 133 according to the modified example, the first exponent u i and the second index v i of the expression (2), during the information indicating the attribute information storage unit 124A, i dimension of the attribute information of the node u The score may be calculated using the value stored in the area of.

例えば、ノードuがノードN11であり、iが1である場合、uは、ノードN11の属性情報の1次元の要素、例えば属性情報「男性」に対応する値を示す。例えば、ノードuがノードN11であり、iが1である場合、uは、属性情報記憶部124Aに示す情報中において、ノードuの属性情報の1次元の要素、例えば属性情報「男性」に対応する値「0」となる。また、例えば、ノードuがノードN11であり、iが2である場合、uは、属性情報記憶部124Aに示す情報中において、ノードuの属性情報の2次元の要素、例えば属性情報「女性」に対応する値「1」となる。変形例に係る第2生成部133は、上述したように属性情報記憶部124Aに記憶された値を用いて、スコアを算出し、第2グラフを生成してもよい。 For example, when node u is node N11 and i is 1, u 1 indicates a value corresponding to a one-dimensional element of the attribute information of node N11, for example, the attribute information "male". For example, a node u is the node N11, when i is 1, u 1, during the information indicating the attribute information storage unit 124A, 1-dimensional element attribute information of the node u, for example, the attribute information "male" The corresponding value is "0". Further, for example, when the node u is the node N11 and the i is 2, the u 2 is a two-dimensional element of the attribute information of the node u in the information shown in the attribute information storage unit 124A, for example, the attribute information “female”. It becomes the value "1" corresponding to. The second generation unit 133 according to the modified example may calculate the score by using the value stored in the attribute information storage unit 124A as described above, and generate the second graph.

なお、生成装置100Aは、属性情報に対応するカテゴリ情報を記憶してもよい。例えば、生成装置100Aは、属性情報にユーザの職業等が含まれる場合、職業の階層構造を示すカテゴリ情報等を記憶するカテゴリ情報記憶部を有してもよい。また、上述した例では、生成装置100Aは、記憶部120Aにカテゴリ情報記憶部123や属性情報記憶部124を有しない例を示したが、生成装置100Aは、記憶部120Aにカテゴリ情報記憶部123や属性情報記憶部124を有してもよい。また、生成装置100Aは、カテゴリ情報記憶部123や属性情報記憶部124に対応するスコア情報記憶部125や第2グラフ情報記憶部126を有してもよい。すなわち、実施形態に係る生成装置100と変形例に係る生成装置100Aとは統合されて1つの生成装置として用いられてもよい。 The generation device 100A may store the category information corresponding to the attribute information. For example, when the attribute information includes the occupation of the user, the generation device 100A may have a category information storage unit that stores the category information or the like indicating the hierarchical structure of the occupation. Further, in the above-described example, the generation device 100A shows an example in which the storage unit 120A does not have the category information storage unit 123 or the attribute information storage unit 124, but the generation device 100A has the category information storage unit 123 in the storage unit 120A. And the attribute information storage unit 124 may be provided. Further, the generation device 100A may have a score information storage unit 125 and a second graph information storage unit 126 corresponding to the category information storage unit 123 and the attribute information storage unit 124. That is, the generation device 100 according to the embodiment and the generation device 100A according to the modified example may be integrated and used as one generation device.

〔6.カテゴリの変更〕
なお、生成装置100や生成装置100Aは、例えば、第2グラフに含まれるノードのクラスタリングの結果に応じて、カテゴリの変更を行ってもよい。この点について、図13及び図14を用いて説明する。例えば、以下のようなカテゴリの変更処理は、生成装置100や生成装置100Aの第2生成部133が行ってもよい。なお、以下では、生成装置100が処理を行う場合を例に示す。
[6. Change category]
The generation device 100 and the generation device 100A may change the category according to, for example, the result of clustering of the nodes included in the second graph. This point will be described with reference to FIGS. 13 and 14. For example, the following category change processing may be performed by the generation device 100 or the second generation unit 133 of the generation device 100A. In the following, a case where the generation device 100 performs the processing will be shown as an example.

〔6−1.カテゴリの統合〕
まず、図13を用いて、カテゴリの統合について説明する。図13は、カテゴリの統合の一例を示す図である。例えば、生成装置100の第2生成部133は、第2グラフに含まれる所定のクラスタに属するノードに共通する属性情報が複数ある場合、当該属性情報に対応するカテゴリを統合する。
[6-1. Category integration]
First, the integration of categories will be described with reference to FIG. FIG. 13 is a diagram showing an example of category integration. For example, when the second generation unit 133 of the generation device 100 has a plurality of attribute information common to the nodes belonging to the predetermined cluster included in the second graph, the second generation unit 133 integrates the categories corresponding to the attribute information.

図13に示す例では、生成装置100は、カテゴリ情報CLT11−1に示すようなカテゴリ情報を用いる。カテゴリ情報CLT11−1中の「第1階層」には、「第1分類C」のカテゴリC3等が含まれる。また、第1階層である「第1分類C」のカテゴリC3の下位の「第2階層」には、「第2分類_1」のカテゴリC31等が含まれる。また、第2階層である「第2分類_1」のカテゴリC31の下位の「第3階層」には、「第3分類_1」のカテゴリC311や「第3分類_2」のカテゴリC312や「第3分類_3」のカテゴリC313や「第3分類_4」のカテゴリC314等が含まれる。 In the example shown in FIG. 13, the generator 100 uses the category information as shown in the category information CLT11-1. The "first layer" in the category information CLT11-1 includes the category C3 and the like of the "first category C". Further, the "second layer" below the category C3 of the "first category C" which is the first layer includes the category C31 of the "second category _1" and the like. Further, in the "third layer" lower than the category C31 of the "second category _1" which is the second layer, the category C311 of the "third category _1", the category C312 of the "third category _1", and the "third". Category C313 of "Category_3", category C314 of "Third category_4", and the like are included.

図13に示す例では、生成装置100は、生成した第2グラフにおけるノード間の連結に基づいて、各ノードをクラスタリングする。例えば、生成装置100は、クラスタ一覧LT11に示すように、生成した第2グラフにおいてエッジで連結されたノードN111やノードN112やノードN113をクラスタCL11としてクラスタリングする。また、例えば、生成装置100は、生成した第2グラフにおいてエッジで連結された他のノード群をクラスタCL12としてクラスタリングする。 In the example shown in FIG. 13, the generation device 100 clusters each node based on the connection between the nodes in the generated second graph. For example, as shown in the cluster list LT11, the generation device 100 clusters the node N111, the node N112, and the node N113 connected by the edge in the generated second graph as the cluster CL11. Further, for example, the generation device 100 clusters another node group connected by an edge in the generated second graph as a cluster CL12.

図13に示す例では、クラスタ一覧LT11に示すように、クラスタCL11に属するノードN111やノードN112やノードN113は、カテゴリC311とカテゴリC313との値が大きい点で共通する。そこで、生成装置100は、カテゴリC311とカテゴリC313とを1つのカテゴリに統合する(ステップS21)。例えば、生成装置100は、図13中のカテゴリ情報CLT11−2に示すように、カテゴリC311とカテゴリC313とを新たなカテゴリである「第3分類_I−3」のカテゴリC311−3に統合する。 In the example shown in FIG. 13, as shown in the cluster list LT11, the node N111, the node N112, and the node N113 belonging to the cluster CL11 are common in that the values of the category C311 and the category C313 are large. Therefore, the generation device 100 integrates the category C311 and the category C313 into one category (step S21). For example, the generation device 100 integrates the category C311 and the category C313 into the category C311-3 of the new category "third category_I-3" as shown in the category information CLT11-2 in FIG.

これにより、生成装置100は、クラスタリングの結果に基づいてカテゴリを変更したカテゴリ情報を用いることにより、ノードの属性情報を反映した第2グラフを生成することができる。したがって、生成装置100は、より適切なクラスタリングを行うことが可能となる。なお、図13の例では、説明を簡単にするために、同じ第2階層である第2分類_1であるカテゴリC31の下位階層を統合する例を示したが、生成装置100は、同じクラスタにクラスタリングされたノードの属性情報の類似性に基づいて、上位階層が異なるカテゴリを統合してもよい。また、上記の統合は一例であり、生成装置100は、種々の条件に基づいて、カテゴリを統合してもよい。例えば、生成装置100は、あるクラスタ中の半分(50%)以上の買主が同じ2つのカテゴリの商品を購入している場合には、2つのカテゴリを統合してもよい。 As a result, the generation device 100 can generate a second graph that reflects the attribute information of the node by using the category information in which the category is changed based on the result of clustering. Therefore, the generation device 100 can perform more appropriate clustering. In the example of FIG. 13, for the sake of simplicity, an example of integrating the lower layers of category C31, which is the same second layer and second classification _1, is shown, but the generator 100 is in the same cluster. Categories with different upper hierarchies may be integrated based on the similarity of the attribute information of the clustered nodes. Further, the above integration is an example, and the generator 100 may integrate the categories based on various conditions. For example, the generator 100 may integrate the two categories if more than half (50%) of the buyers in a cluster purchase the same two categories of goods.

〔6−2.カテゴリの分割〕
次に、図14を用いて、カテゴリの分割について説明する。図14は、カテゴリの分割の一例を示す図である。例えば、生成装置100の第2生成部133は、第2グラフに含まれる複数のクラスタの各々に属するノードに共通する属性情報がある場合、当該属性情報に対応するカテゴリを分割する。
[6-2. Category division]
Next, the division of categories will be described with reference to FIG. FIG. 14 is a diagram showing an example of division of categories. For example, when the second generation unit 133 of the generation device 100 has attribute information common to the nodes belonging to each of the plurality of clusters included in the second graph, the second generation unit 133 divides the categories corresponding to the attribute information.

図14に示す例では、生成装置100は、カテゴリ情報CLT21−1に示すようなカテゴリ情報を用いる。カテゴリ情報CLT21−1中の「第1階層」には、「第1分類C」のカテゴリC4等が含まれる。また、第1階層である「第1分類C」のカテゴリC4の下位の「第2階層」には、「第2分類_1」のカテゴリC41等が含まれる。また、第2階層である「第2分類_1」のカテゴリC41の下位の「第3階層」には、「第3分類_1」のカテゴリC411や「第3分類_2」のカテゴリC412や「第3分類_3」のカテゴリC413等が含まれる。 In the example shown in FIG. 14, the generator 100 uses the category information as shown in the category information CLT21-1. The "first layer" in the category information CLT21-1 includes the category C4 and the like of the "first category C". Further, the "second layer" below the category C4 of the "first category C" which is the first layer includes the category C41 of the "second category _1" and the like. Further, in the "third layer" lower than the category C41 of the "second category _1" which is the second layer, the category C411 of the "third category _1", the category C412 of the "third category _1", and the "third". Category C413 and the like of "Category_3" are included.

図14に示す例では、生成装置100は、生成した第2グラフにおけるノード間の連結に基づいて、各ノードをクラスタリングする。例えば、生成装置100は、クラスタ一覧LT21に示すように、生成した第2グラフにおいてエッジで連結されたノードN211やノードN212やノードN213をクラスタCL21としてクラスタリングする。また、例えば、生成装置100は、クラスタ一覧LT21に示すように、生成した第2グラフにおいてエッジで連結されたノードN221やノードN222をクラスタCL22としてクラスタリングする。 In the example shown in FIG. 14, the generation device 100 clusters each node based on the connection between the nodes in the generated second graph. For example, as shown in the cluster list LT21, the generation device 100 clusters the node N211, the node N212, and the node N213 connected by the edge in the generated second graph as the cluster CL21. Further, for example, as shown in the cluster list LT21, the generation device 100 clusters the nodes N221 and the nodes N222 connected by the edges in the generated second graph as the cluster CL22.

図14に示す例では、クラスタ一覧LT21に示すように、クラスタCL21に属するノードN211〜N213とクラスタCL22に属するノードN221〜N222とは、カテゴリC411の値が大きい点で共通する。そこで、生成装置100は、カテゴリC411を2つのカテゴリに分割する(ステップS26)。例えば、生成装置100は、図14中のカテゴリ情報CLT21−2に示すように、「第3分類_I−1」のカテゴリC411−1と「第3分類_I−2」のカテゴリC411−2との2つの新たなカテゴリに、カテゴリC411を分割する。例えば、生成装置100は、「第3分類_I−1」のカテゴリC411−1にクラスタCL21に属するノードN211〜N213の属性情報が含まれ、「第3分類_I−2」のカテゴリC411−2にクラスタCL22に属するノードN221〜N222の属性情報が含まれるように、カテゴリC411を分割する。 In the example shown in FIG. 14, as shown in the cluster list LT21, the nodes N211 to N213 belonging to the cluster CL21 and the nodes N221 to N222 belonging to the cluster CL22 are common in that the value of the category C411 is large. Therefore, the generation device 100 divides the category C411 into two categories (step S26). For example, as shown in the category information CLT21-2 in FIG. 14, the generator 100 has a category C411-1 of the “third category_I-1” and a category C411-2 of the “third category_I-2”. Category C411 is divided into two new categories. For example, in the generator 100, the attribute information of the nodes N211 to N213 belonging to the cluster CL21 is included in the category C411-1 of the "third category_I-1", and the category C411-2 of the "third category_I-2" includes the attribute information. Category C411 is divided so that the attribute information of the nodes N221 to N222 belonging to the cluster CL22 is included.

これにより、生成装置100は、クラスタリングの結果に基づいてカテゴリを変更したカテゴリ情報を用いることにより、ノードの属性情報を反映した第2グラフを生成することができる。したがって、生成装置100は、より適切なクラスタリングを行うことが可能となる。なお、図14の例では、説明を簡単にするために、同じ第2階層である第2分類_1であるカテゴリC41の下位階層に分割したカテゴリを配置する例を示したが、生成装置100は、分割したカテゴリを分割前の上位階層とは異なる上位階層の下位階層のカテゴリとして配置してもよい。 As a result, the generation device 100 can generate a second graph that reflects the attribute information of the node by using the category information in which the category is changed based on the result of clustering. Therefore, the generation device 100 can perform more appropriate clustering. In the example of FIG. 14, for the sake of simplicity, an example of arranging the divided categories in the lower layers of the category C41, which is the second classification _1 of the same second layer, is shown, but the generator 100 , The divided category may be arranged as a lower layer category of the upper layer different from the upper layer before the division.

〔7.アンサンブル〕
上述した例では、生成装置100や生成装置100Aは、1つの属性情報に基づいて第2グラフを生成する場合を示したが、生成装置100や生成装置100Aは、例えば、複数のカテゴリの属性情報に基づいて第2グラフを生成してもよい。言い換えると、生成装置100や生成装置100Aは、ノードに複数の属性情報(ベクトル)が存在する場合に、それらを結合して1つのベクトルとして扱うのではなく、各属性情報に対応するクラスタリングをそれぞれ行い、それらを統合してひとつの結果(第2グラフやクラスタ)を生成してもよい。例えば、複数のカテゴリの属性情報に基づいて第2グラフを生成する処理は、生成装置100や生成装置100Aの第2生成部133が行ってもよい。この点について、図15を用いて説明する。図15は、複数の第2グラフを統合した第2グラフの生成の一例を示す図である。なお、以下では、生成装置100が処理を行う場合を例に示す。図15の例では、生成装置100は、第1カテゴリの属性情報Aとして、例えば、各ノードに対応する買主(ユーザ)が購入した商品のカテゴリ情報を用いる。また、図15では、生成装置100は、第2カテゴリの属性情報Bとして、例えば、各ノードに対応する買主(ユーザ)のデモグラフィック属性に関する情報を用いる。
[7. ensemble〕
In the above example, the generator 100 and the generator 100A show the case where the second graph is generated based on one attribute information, but the generator 100 and the generator 100A have, for example, the attribute information of a plurality of categories. A second graph may be generated based on. In other words, when the generation device 100 and the generation device 100A have a plurality of attribute information (vectors) in the node, they do not combine them and treat them as one vector, but clustering corresponding to each attribute information. It may be done and integrated to produce one result (second graph or cluster). For example, the process of generating the second graph based on the attribute information of a plurality of categories may be performed by the generation device 100 or the second generation unit 133 of the generation device 100A. This point will be described with reference to FIG. FIG. 15 is a diagram showing an example of generation of a second graph in which a plurality of second graphs are integrated. In the following, a case where the generation device 100 performs the processing will be shown as an example. In the example of FIG. 15, the generation device 100 uses, for example, the category information of the product purchased by the buyer (user) corresponding to each node as the attribute information A of the first category. Further, in FIG. 15, the generation device 100 uses, for example, information on the demographic attribute of the buyer (user) corresponding to each node as the attribute information B of the second category.

図15に示す例では、生成装置100は、第1グラフ情報NL31に示すような第1グラフ情報を用いる。例えば、図15に示す例において、ノードID「N311」の行とノードID「N312」の列とが交差する領域には、「0」が記憶される。つまり、ノードID「N311」により識別される買主に対応するノードとノードID「N312」により識別される買主に対応するノードとの間にはエッジが連結されていない。また、図15に示す例においては、ノードID「N311」により識別される買主に対応するノードとノードID「N313」により識別される買主に対応するノードとの間にはエッジが連結されている。 In the example shown in FIG. 15, the generator 100 uses the first graph information as shown in the first graph information NL31. For example, in the example shown in FIG. 15, "0" is stored in the area where the row of the node ID "N311" and the column of the node ID "N312" intersect. That is, no edge is connected between the node corresponding to the buyer identified by the node ID "N311" and the node corresponding to the buyer identified by the node ID "N312". Further, in the example shown in FIG. 15, an edge is connected between the node corresponding to the buyer identified by the node ID “N311” and the node corresponding to the buyer identified by the node ID “N313”. ..

図15では、生成装置100は、第1グラフ情報NL31と属性情報Aとを用いて第2グラフを生成する(ステップS31)。そして、図15に示す例では、生成装置100は、生成した属性情報Aの第2グラフにおけるノード間の連結に基づいて、各ノードをクラスタリングする。例えば、生成装置100は、クラスタ一覧LT311に示すように、生成した第2グラフにおいてエッジで連結されたノードN311やノードN312やノードN313をクラスタCL311としてクラスタリングする。 In FIG. 15, the generation device 100 generates the second graph using the first graph information NL31 and the attribute information A (step S31). Then, in the example shown in FIG. 15, the generation device 100 clusters each node based on the connection between the nodes in the second graph of the generated attribute information A. For example, as shown in the cluster list LT311, the generation device 100 clusters the node N311, the node N312, and the node N313 connected by the edge in the generated second graph as the cluster CL311.

また、図15では、生成装置100は、第1グラフ情報NL31と属性情報Bとを用いて第2グラフを生成する(ステップS32)。そして、図15に示す例では、生成装置100は、生成した属性情報Bの第2グラフにおけるノード間の連結に基づいて、各ノードをクラスタリングする。例えば、生成装置100は、クラスタ一覧LT312に示すように、生成した第2グラフにおいてエッジで連結されたノードN311やノードN312をクラスタCL321としてクラスタリングする。また、例えば、生成装置100は、クラスタ一覧LT312に示すように、生成した第2グラフにおいてエッジで連結されたノードN314やノードN315をクラスタCL322としてクラスタリングする。 Further, in FIG. 15, the generation device 100 generates the second graph by using the first graph information NL31 and the attribute information B (step S32). Then, in the example shown in FIG. 15, the generation device 100 clusters each node based on the connection between the nodes in the second graph of the generated attribute information B. For example, as shown in the cluster list LT312, the generation device 100 clusters the nodes N311 and the nodes N312 connected by the edges in the generated second graph as the cluster CL321. Further, for example, as shown in the cluster list LT312, the generation device 100 clusters the nodes N314 and the nodes N315 connected by the edges in the generated second graph as the cluster CL322.

そして、生成装置100は、第1カテゴリの第2グラフと第2カテゴリの第2グラフとに基づいて、第2グラフ(以下、「統合第2グラフ」ともいう)を生成する(ステップS33)。図15では、生成装置100は、属性情報Aの第2グラフと属性情報Bの第2グラフとに基づいて、統合第2グラフを生成する。具体的には、生成装置100は、クラスタ一覧LT311に示すようなクラスタと、クラスタ一覧LT312に示すようなクラスタとに基づいて、クラスタ一覧LT31に示すようなクラスタを含む統合第2グラフを生成する。 Then, the generation device 100 generates a second graph (hereinafter, also referred to as “integrated second graph”) based on the second graph of the first category and the second graph of the second category (step S33). In FIG. 15, the generation device 100 generates an integrated second graph based on the second graph of the attribute information A and the second graph of the attribute information B. Specifically, the generation device 100 generates an integrated second graph including the clusters shown in the cluster list LT31 based on the clusters shown in the cluster list LT311 and the clusters shown in the cluster list LT312. ..

図15の例では、生成装置100は、クラスタ一覧LT311に示すようなクラスタと、クラスタ一覧LT312に示すようなクラスタとの積集合を求める処理により、統合第2グラフを生成する。例えば、生成装置100は、クラスタ一覧LT31に示すように、ノードN311やノードN312が1つのクラスタCL31としてクラスタリングされた統合第2グラフを生成する。すなわち、生成装置100は、ノードN311とノードN312とがエッジで連結された統合第2グラフを生成する。 In the example of FIG. 15, the generation device 100 generates an integrated second graph by a process of obtaining an intersection of a cluster as shown in the cluster list LT311 and a cluster as shown in the cluster list LT312. For example, the generation device 100 generates an integrated second graph in which nodes N311 and nodes N312 are clustered as one cluster CL31 as shown in the cluster list LT31. That is, the generation device 100 generates an integrated second graph in which the node N311 and the node N312 are connected by an edge.

なお、生成装置100は、クラスタ一覧LT311に示すようなクラスタと、クラスタ一覧LT312に示すようなクラスタとの和集合を求める処理により、統合第2グラフを生成してもよい。この場合、生成装置100は、ノードN311やノードN312やノードN313が1つのクラスタとしてクラスタリングされ、ノードN314やノードN315が1つのクラスタとしてクラスタリングされた統合第2グラフを生成する。すなわち、生成装置100は、ノードN311とノードN312とノードN313とがエッジで連結され、ノードN314とノードN315とがエッジで連結された統合第2グラフを生成する。 The generator 100 may generate the integrated second graph by a process of obtaining the union of the clusters as shown in the cluster list LT311 and the clusters as shown in the cluster list LT312. In this case, the generation device 100 generates an integrated second graph in which the node N311, the node N312, and the node N313 are clustered as one cluster, and the node N314 and the node N315 are clustered as one cluster. That is, the generation device 100 generates an integrated second graph in which the node N311, the node N312, and the node N313 are connected by an edge, and the node N314 and the node N315 are connected by an edge.

このように、生成装置100は、複数のカテゴリの属性情報を用いて統合第2グラフを生成することにより、各ノードの複数の属性情報を反映した第2グラフを生成することができる。したがって、生成装置100は、より適切なクラスタリングを行うことが可能となる。上述した複数の第2グラフを統合する処理を行う場合、生成装置100や生成装置100Aは、各カテゴリに対応するカテゴリ情報記憶部や、各属性情報に対応する属性情報記憶部やスコア情報記憶部や第2グラフ情報記憶部を有してもよい。また、生成装置100や生成装置100Aは、統合した第2グラフを記憶する統合第2グラフ情報記憶部を有してもよい。 As described above, the generation device 100 can generate the second graph reflecting the plurality of attribute information of each node by generating the integrated second graph using the attribute information of the plurality of categories. Therefore, the generation device 100 can perform more appropriate clustering. When performing the process of integrating the plurality of second graphs described above, the generation device 100 and the generation device 100A include a category information storage unit corresponding to each category, an attribute information storage unit corresponding to each attribute information, and a score information storage unit. Or a second graph information storage unit may be provided. Further, the generation device 100 and the generation device 100A may have an integrated second graph information storage unit that stores an integrated second graph.

なお、上述した統合第2グラフの生成は一例であり、生成装置100は、種々の目的に応じて適宜の手法により統合第2グラフを生成してもよい。例えば、生成装置100は、属性情報ごとの第2グラフにおいてクラスタに属するか否かの0,1のビットを立てて、全属性情報の第2グラフにおけるクラスタリングの結果を合算することでヒートマップを作成してもよい。この場合、生成装置100は、所定の閾値を用いて各属性情報に対応する第2グラフのクラスタを統合した統合クラスタを抽出してもよい。また、生成装置100は、属性情報ごとの第2グラフにおけるクラスタリングの結果に基づいて、クラスタの重心を求めて、重心に近いほど高いスコアをノードに付与することにより、ヒートマップを作成して統合クラスタを抽出してもよい。このように、例えば、生成装置100は、各属性情報の第2グラフにおけるクラスタリングの結果を用いて、統合クラスタを抽出してもよい。例えば、生成装置100は、ある属性情報の第2グラフ中のクラスタのうち、他の属性情報の第2グラフ中のクラスタと所定の閾値以上のノードが重複する場合、その重複するノード群を、統合クラスタとして抽出してもよい。このような統合クラスタを抽出する処理により、生成装置100は、統合第2グラフを生成してもよい。なお、上記は一例であり、生成装置100は、どのような基準により統合第2グラフを生成してもよい。 The above-mentioned generation of the integrated second graph is an example, and the generation device 100 may generate the integrated second graph by an appropriate method according to various purposes. For example, the generation device 100 sets 0,1 bits for whether or not it belongs to a cluster in the second graph for each attribute information, and adds up the clustering results in the second graph for all attribute information to create a heat map. You may create it. In this case, the generation device 100 may extract an integrated cluster that integrates the clusters of the second graph corresponding to each attribute information using a predetermined threshold value. Further, the generator 100 creates and integrates a heat map by obtaining the center of gravity of the cluster based on the result of clustering in the second graph for each attribute information and assigning a higher score to the node as it is closer to the center of gravity. You may extract the cluster. In this way, for example, the generation device 100 may extract the integrated cluster by using the result of clustering in the second graph of each attribute information. For example, when the generation device 100 overlaps the clusters in the second graph of certain attribute information with the clusters in the second graph of other attribute information and the nodes having a predetermined threshold value or more, the overlapping node group is selected. It may be extracted as an integrated cluster. By the process of extracting such an integrated cluster, the generation device 100 may generate an integrated second graph. The above is an example, and the generation device 100 may generate the integrated second graph by any standard.

〔8.効果〕
上述してきたように、実施形態に係る生成装置100及び変形例に係る生成装置100Aは、取得部131と、生成部(実施形態においては、「第2生成部133」。以下、同じ)とを有する。取得部131は、ネットワーク上における主体の各々に対応する複数のノードと、所定の対応関係を有するノード間を連結するエッジとを含む第1グラフを取得する。生成部は、取得部131により取得された第1グラフにおける複数のノードのうち、第1ノード及び第2ノードと第3ノードとの関係性に基づいて、第1ノードと第2ノードとの間のエッジを変更した第2グラフを生成する。
[8. effect〕
As described above, the generator 100 according to the embodiment and the generator 100A according to the modified example have the acquisition unit 131 and the generation unit (“second generation unit 133” in the embodiment; the same applies hereinafter). Have. The acquisition unit 131 acquires a first graph including a plurality of nodes corresponding to each of the subjects on the network and an edge connecting the nodes having a predetermined correspondence relationship. The generation unit is located between the first node and the second node based on the relationship between the first node and the second node and the third node among the plurality of nodes in the first graph acquired by the acquisition unit 131. Generates a second graph with modified edges.

これにより、実施形態に係る生成装置100及び変形例に係る生成装置100Aは、第1ノード及び第2ノードと第3ノードとの関係性に基づいて、第1ノードと第2ノードとの間のエッジを変更した第2グラフを生成することにより、ネットワーク上における主体を所望の関係性に基づいて連結するグラフを適切に生成することができる。 As a result, the generator 100 according to the embodiment and the generator 100A according to the modified example are located between the first node and the second node based on the relationship between the first node and the second node and the third node. By generating the second graph with the edge changed, it is possible to appropriately generate a graph that connects the subjects on the network based on the desired relationship.

また、実施形態に係る生成装置100及び変形例に係る生成装置100Aにおいて、生成部は、第1ノード及び第2ノードとの間がエッジで連結された第3ノードとの関係性に基づいて、第2グラフを生成する。 Further, in the generation device 100 according to the embodiment and the generation device 100A according to the modified example, the generation unit is based on the relationship with the third node in which the first node and the second node are connected by an edge. Generate a second graph.

これにより、実施形態に係る生成装置100及び変形例に係る生成装置100Aは、第1ノード及び第2ノードとの間がエッジで連結された第3ノードとの関係性に基づいて、ネットワーク上における主体を所望の関係性に基づいて連結するグラフを適切に生成することができる。 As a result, the generator 100 according to the embodiment and the generator 100A according to the modified example are on the network based on the relationship with the third node in which the first node and the second node are connected by an edge. A graph that connects the subjects based on the desired relationship can be appropriately generated.

また、実施形態に係る生成装置100及び変形例に係る生成装置100Aにおいて、生成部は、第1ノードと第3ノードとの類似度と、第2ノードと第3ノードとの類似度とに基づいて、第2グラフを生成する。 Further, in the generation device 100 according to the embodiment and the generation device 100A according to the modified example, the generation unit is based on the degree of similarity between the first node and the third node and the degree of similarity between the second node and the third node. To generate the second graph.

これにより、実施形態に係る生成装置100及び変形例に係る生成装置100Aは、第1ノードと第3ノードとの類似度と、第2ノードと第3ノードとの類似度とに基づいて、ネットワーク上における主体を所望の関係性に基づいて連結するグラフを適切に生成することができる。 As a result, the generation device 100 according to the embodiment and the generation device 100A according to the modified example are based on the degree of similarity between the first node and the third node and the degree of similarity between the second node and the third node. A graph that connects the above subjects based on the desired relationship can be appropriately generated.

また、実施形態に係る生成装置100及び変形例に係る生成装置100Aにおいて、生成部は、第1ノード及び第2ノードとの間がエッジで連結された第3ノードの数に基づいて、第2グラフを生成する。 Further, in the generation device 100 according to the embodiment and the generation device 100A according to the modified example, the generation unit has a second generation unit based on the number of third nodes in which the first node and the second node are connected by an edge. Generate a graph.

これにより、実施形態に係る生成装置100及び変形例に係る生成装置100Aは、第1ノード及び第2ノードとの間がエッジで連結された第3ノードの数に基づいて、ネットワーク上における主体を所望の関係性に基づいて連結するグラフを適切に生成することができる。 As a result, the generator 100 according to the embodiment and the generator 100A according to the modified example have the main body on the network based on the number of the third nodes in which the first node and the second node are connected by an edge. Graphs that are concatenated based on the desired relationships can be appropriately generated.

また、実施形態に係る生成装置100及び変形例に係る生成装置100Aにおいて、取得部131は、各第1の主体と所定の関係を有する第2の主体が所定の条件を満たす第1の主体に対応するノード間をエッジで連結した第1グラフを取得する。 Further, in the generator 100 according to the embodiment and the generator 100A according to the modified example, the acquisition unit 131 is a first subject in which the second subject having a predetermined relationship with each first subject satisfies a predetermined condition. Acquire the first graph in which the corresponding nodes are connected by an edge.

これにより、実施形態に係る生成装置100及び変形例に係る生成装置100Aは、各第1の主体と所定の関係を有する第2の主体が所定の条件を満たす第1の主体に対応するノード間をエッジで連結した第1グラフから、ネットワーク上における主体を所望の関係性に基づいて連結するグラフを適切に生成することができる。 As a result, in the generator 100 according to the embodiment and the generator 100A according to the modified example, the second subject having a predetermined relationship with each first subject corresponds to the first subject satisfying the predetermined condition. From the first graph in which the above are connected by an edge, a graph in which the subjects on the network are connected based on a desired relationship can be appropriately generated.

また、実施形態に係る生成装置100及び変形例に係る生成装置100Aにおいて、取得部131は、第1の主体である買主と所定の関係を有する第2の主体である売主の集合が所定の条件を満たす買主に対応するノード間をエッジで連結した第1グラフを取得する。 Further, in the generation device 100 according to the embodiment and the generation device 100A according to the modified example, the acquisition unit 131 is subject to a predetermined condition that a set of sellers, which are the second main body, having a predetermined relationship with the buyer, which is the first main body, is a predetermined condition. Acquire the first graph in which the nodes corresponding to the buyers satisfying the above conditions are connected by an edge.

これにより、実施形態に係る生成装置100及び変形例に係る生成装置100Aは、買主に対応するノードのうち、各買主と所定の関係を有する売主の集合が所定の条件を満たす買主に対応するノード間をエッジで連結した第1グラフから、ネットワーク上における主体を所望の関係性に基づいて連結するグラフを適切に生成することができる。 As a result, the generator 100 according to the embodiment and the generator 100A according to the modified example are nodes in which a set of sellers having a predetermined relationship with each buyer corresponds to a buyer who satisfies a predetermined condition among the nodes corresponding to the buyer. From the first graph in which the intervals are connected by edges, it is possible to appropriately generate a graph in which the subjects on the network are connected based on a desired relationship.

また、実施形態に係る生成装置100及び変形例に係る生成装置100Aにおいて、取得部131は、買主に対応するノードのうち、所定の回数以上の取引を行った売主の集合間の類似度が所定の閾値以上となるノード間をエッジで連結した第1グラフを取得する。 Further, in the generation device 100 according to the embodiment and the generation device 100A according to the modified example, the acquisition unit 131 determines the degree of similarity between the sets of sellers who have made transactions a predetermined number of times or more among the nodes corresponding to the buyer. The first graph in which the nodes that are equal to or greater than the threshold value of are connected by an edge is acquired.

これにより、実施形態に係る生成装置100及び変形例に係る生成装置100Aは、買主に対応するノードのうち、所定の回数以上の取引を行った売主の集合間の類似度が所定の閾値以上となるノード間をエッジで連結した第1グラフから、ネットワーク上における主体を所望の関係性に基づいて連結するグラフを適切に生成することができる。 As a result, in the generator 100 according to the embodiment and the generator 100A according to the modified example, the similarity between the set of sellers who have made transactions a predetermined number of times or more among the nodes corresponding to the buyer is equal to or higher than a predetermined threshold value. From the first graph in which the nodes are connected by an edge, a graph in which the subjects on the network are connected based on a desired relationship can be appropriately generated.

また、実施形態に係る生成装置100及び変形例に係る生成装置100Aにおいて、取得部131は、各ノードに属性情報が対応付けられた第1グラフを取得する。また、生成部は、第1ノードの属性情報及び第2ノードの属性情報と第3ノードの属性情報との関係性に基づいて、第2グラフを生成する。 Further, in the generation device 100 according to the embodiment and the generation device 100A according to the modified example, the acquisition unit 131 acquires the first graph in which the attribute information is associated with each node. In addition, the generation unit generates the second graph based on the relationship between the attribute information of the first node, the attribute information of the second node, and the attribute information of the third node.

これにより、実施形態に係る生成装置100及び変形例に係る生成装置100Aは、第1ノードの属性情報及び第2ノードの属性情報と第3ノードの属性情報との関係性に基づいて、ネットワーク上における主体を所望の関係性に基づいて連結するグラフを適切に生成することができる。 As a result, the generation device 100 according to the embodiment and the generation device 100A according to the modified example are on the network based on the relationship between the attribute information of the first node, the attribute information of the second node, and the attribute information of the third node. It is possible to appropriately generate a graph that connects the subjects in the above based on the desired relationship.

また、実施形態に係る生成装置100及び変形例に係る生成装置100Aにおいて、取得部131は、属性情報として各ノードに対応するユーザと所定の関係を有する商品のカテゴリ情報が各ノードに対応付けられた第1グラフを取得する。 Further, in the generation device 100 according to the embodiment and the generation device 100A according to the modified example, the acquisition unit 131 associates the category information of the product having a predetermined relationship with the user corresponding to each node as the attribute information with each node. The first graph is acquired.

これにより、実施形態に係る生成装置100及び変形例に係る生成装置100Aは、属性情報として各ノードに対応するユーザと所定の関係を有する商品のカテゴリ情報が各ノードに対応付けられた第1グラフから、ネットワーク上における主体を所望の関係性に基づいて連結するグラフを適切に生成することができる。 As a result, in the generator 100 according to the embodiment and the generator 100A according to the modified example, the first graph in which the category information of the product having a predetermined relationship with the user corresponding to each node is associated with each node as the attribute information. Therefore, it is possible to appropriately generate a graph that connects the subjects on the network based on the desired relationship.

また、実施形態に係る生成装置100及び変形例に係る生成装置100Aにおいて、取得部131は、属性情報として各ノードに対応するユーザが購入した商品のカテゴリ情報が各ノードに対応付けられた第1グラフを取得する。 Further, in the generation device 100 according to the embodiment and the generation device 100A according to the modified example, the acquisition unit 131 is the first in which the category information of the product purchased by the user corresponding to each node is associated with each node as the attribute information. Get the graph.

これにより、実施形態に係る生成装置100及び変形例に係る生成装置100Aは、属性情報として各ノードに対応するユーザが購入した商品のカテゴリ情報が各ノードに対応付けられた第1グラフから、ネットワーク上における主体を所望の関係性に基づいて連結するグラフを適切に生成することができる。 As a result, the generator 100 according to the embodiment and the generator 100A according to the modified example are networked from the first graph in which the category information of the product purchased by the user corresponding to each node is associated with each node as attribute information. A graph that connects the above subjects based on the desired relationship can be appropriately generated.

また、実施形態に係る生成装置100及び変形例に係る生成装置100Aにおいて、取得部131は、属性情報として各ノードに対応するユーザの属性情報が各ノードに対応付けられた第1グラフを取得する。 Further, in the generation device 100 according to the embodiment and the generation device 100A according to the modified example, the acquisition unit 131 acquires the first graph in which the attribute information of the user corresponding to each node is associated with each node as the attribute information. ..

これにより、実施形態に係る生成装置100及び変形例に係る生成装置100Aは、属性情報として各ノードに対応するユーザの属性情報が各ノードに対応付けられた第1グラフから、ネットワーク上における主体を所望の関係性に基づいて連結するグラフを適切に生成することができる。 As a result, the generation device 100 according to the embodiment and the generation device 100A according to the modified example identify the subject on the network from the first graph in which the attribute information of the user corresponding to each node is associated with each node as the attribute information. Graphs that are concatenated based on the desired relationships can be appropriately generated.

また、実施形態に係る生成装置100及び変形例に係る生成装置100Aにおいて、生成部は、第2グラフに含まれる所定のクラスタに属するノードの属性情報に基づいて、属性情報に対応するカテゴリを変更する。 Further, in the generation device 100 according to the embodiment and the generation device 100A according to the modified example, the generation unit changes the category corresponding to the attribute information based on the attribute information of the nodes belonging to the predetermined cluster included in the second graph. do.

これにより、実施形態に係る生成装置100及び変形例に係る生成装置100Aは、第2グラフに含まれる所定のクラスタに属するノードの属性情報に基づいて、属性情報に対応するカテゴリを変更することにより、ネットワーク上における主体を所望の関係性に基づいて連結するグラフを適切に生成することができる。 As a result, the generator 100 according to the embodiment and the generator 100A according to the modified example change the category corresponding to the attribute information based on the attribute information of the nodes belonging to the predetermined cluster included in the second graph. , It is possible to appropriately generate a graph that connects subjects on a network based on a desired relationship.

また、実施形態に係る生成装置100及び変形例に係る生成装置100Aにおいて、生成部は、第2グラフに含まれる所定のクラスタに属するノードに共通する属性情報が複数ある場合、当該属性情報に対応するカテゴリを統合する。 Further, in the generation device 100 according to the embodiment and the generation device 100A according to the modified example, when there is a plurality of attribute information common to the nodes belonging to the predetermined cluster included in the second graph, the generation unit corresponds to the attribute information. Integrate the categories you want to do.

これにより、実施形態に係る生成装置100及び変形例に係る生成装置100Aは、クラスタリングの結果に基づいてカテゴリを変更したカテゴリ情報を用いることにより、ノードの属性情報を反映した第2グラフを生成することができる。したがって、生成装置100,100Aは、より適切なクラスタリングを行うことが可能となる。これにより、生成装置100,100Aは、ネットワーク上における主体を所望の関係性に基づいて連結するグラフを適切に生成することができる。 As a result, the generation device 100 according to the embodiment and the generation device 100A according to the modified example generate a second graph reflecting the attribute information of the node by using the category information whose category is changed based on the result of clustering. be able to. Therefore, the generators 100 and 100A can perform more appropriate clustering. As a result, the generators 100 and 100A can appropriately generate a graph that connects the subjects on the network based on a desired relationship.

また、実施形態に係る生成装置100及び変形例に係る生成装置100Aにおいて、生成部は、第2グラフに含まれる複数のクラスタの各々に属するノードに共通する属性情報がある場合、当該属性情報に対応するカテゴリを分割する。 Further, in the generation device 100 according to the embodiment and the generation device 100A according to the modified example, if the generation unit has attribute information common to the nodes belonging to each of the plurality of clusters included in the second graph, the attribute information includes the attribute information. Split the corresponding category.

これにより、実施形態に係る生成装置100及び変形例に係る生成装置100Aは、クラスタリングの結果に基づいてカテゴリを変更したカテゴリ情報を用いることにより、ノードの属性情報を反映した第2グラフを生成することができる。したがって、生成装置100,100Aは、より適切なクラスタリングを行うことが可能となる。これにより、生成装置100,100Aは、ネットワーク上における主体を所望の関係性に基づいて連結するグラフを適切に生成することができる。 As a result, the generation device 100 according to the embodiment and the generation device 100A according to the modified example generate a second graph reflecting the attribute information of the node by using the category information whose category is changed based on the result of clustering. be able to. Therefore, the generators 100 and 100A can perform more appropriate clustering. As a result, the generators 100 and 100A can appropriately generate a graph that connects the subjects on the network based on a desired relationship.

また、実施形態に係る生成装置100及び変形例に係る生成装置100Aにおいて、取得部131は、各ノードに第1カテゴリの属性情報と第2カテゴリの属性情報とが対応付けられた第1グラフを取得する。また、生成部は、第1ノードの第1カテゴリの属性情報及び第2ノードの第1カテゴリの属性情報と第3ノードの第1カテゴリの属性情報との関係性に基づいて、第1カテゴリの第2グラフを生成し、第1ノードの第2カテゴリの属性情報及び第2ノードの第2カテゴリの属性情報と第3ノードの第2カテゴリの属性情報との関係性に基づいて、第2カテゴリの第2グラフを生成し、第1カテゴリの第2グラフと第2カテゴリの第2グラフとに基づいて、第2グラフを生成する。 Further, in the generation device 100 according to the embodiment and the generation device 100A according to the modified example, the acquisition unit 131 provides a first graph in which the attribute information of the first category and the attribute information of the second category are associated with each node. get. Further, the generation unit is based on the relationship between the attribute information of the first category of the first node, the attribute information of the first category of the second node, and the attribute information of the first category of the third node. The second graph is generated, and the second category is based on the relationship between the attribute information of the second category of the first node, the attribute information of the second category of the second node, and the attribute information of the second category of the third node. The second graph of is generated, and the second graph is generated based on the second graph of the first category and the second graph of the second category.

これにより、実施形態に係る生成装置100及び変形例に係る生成装置100Aは、複数のカテゴリの属性情報を用いて統合第2グラフを生成することにより、各ノードの複数の属性情報を反映した第2グラフを生成することができる。したがって、生成装置100,100Aは、より適切なクラスタリングを行うことが可能となる。つまり、生成装置100,100Aは、ネットワーク上における主体を所望の関係性に基づいて連結するグラフを適切に生成することができる。 As a result, the generation device 100 according to the embodiment and the generation device 100A according to the modified example reflect the plurality of attribute information of each node by generating the integrated second graph using the attribute information of a plurality of categories. Two graphs can be generated. Therefore, the generators 100 and 100A can perform more appropriate clustering. That is, the generation devices 100 and 100A can appropriately generate a graph that connects the subjects on the network based on a desired relationship.

〔9.ハードウェア構成〕
上述してきた実施形態に係る生成装置100及び変形例に係る生成装置100Aは、例えば図16に示すような構成のコンピュータ1000によって実現される。図16は、生成装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
[9. Hardware configuration]
The generation device 100 according to the above-described embodiment and the generation device 100A according to a modified example are realized by, for example, a computer 1000 having a configuration as shown in FIG. FIG. 16 is a hardware configuration diagram showing an example of a computer that realizes the function of the generator. The computer 1000 has a CPU 1100, a RAM 1200, a ROM 1300, an HDD 1400, a communication interface (I / F) 1500, an input / output interface (I / F) 1600, and a media interface (I / F) 1700.

CPU1100は、ROM1300またはHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。 The CPU 1100 operates based on a program stored in the ROM 1300 or the HDD 1400, and controls each part. The ROM 1300 stores a boot program executed by the CPU 1100 when the computer 1000 is started, a program depending on the hardware of the computer 1000, and the like.

HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を格納する。通信インターフェイス1500は、所定のネットワークNを介して他の機器からデータを受信してCPU1100へ送り、CPU1100が生成したデータを所定のネットワークNを介して他の機器へ送信する。 The HDD 1400 stores a program executed by the CPU 1100, data used by such a program, and the like. The communication interface 1500 receives data from another device via a predetermined network N and sends the data to the CPU 1100, and transmits the data generated by the CPU 1100 to the other device via the predetermined network N.

CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、生成したデータを入出力インターフェイス1600を介して出力装置へ出力する。 The CPU 1100 controls an output device such as a display or a printer, and an input device such as a keyboard or a mouse via the input / output interface 1600. The CPU 1100 acquires data from the input device via the input / output interface 1600. Further, the CPU 1100 outputs the generated data to the output device via the input / output interface 1600.

メディアインターフェイス1700は、記録媒体1800に格納されたプログラムまたはデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。 The media interface 1700 reads a program or data stored in the recording medium 1800 and provides the program or data to the CPU 1100 via the RAM 1200. The CPU 1100 loads the program from the recording medium 1800 onto the RAM 1200 via the media interface 1700, and executes the loaded program. The recording medium 1800 is, for example, an optical recording medium such as a DVD (Digital Versatile Disc) or PD (Phase change rewritable Disk), a magneto-optical recording medium such as an MO (Magneto-Optical disk), a tape medium, a magnetic recording medium, or a semiconductor memory. And so on.

例えば、コンピュータ1000が実施形態に係る生成装置100として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部130の機能を実現する。コンピュータ1000のCPU1100は、これらのプログラムを記録媒体1800から読み取って実行するが、他の例として、他の装置から所定のネットワークNを介してこれらのプログラムを取得してもよい。 For example, when the computer 1000 functions as the generator 100 according to the embodiment, the CPU 1100 of the computer 1000 realizes the function of the control unit 130 by executing the program loaded on the RAM 1200. The CPU 1100 of the computer 1000 reads and executes these programs from the recording medium 1800, but as another example, these programs may be acquired from another device via a predetermined network N.

以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の行に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。 Although some of the embodiments of the present application have been described in detail with reference to the drawings, these are examples, and various modifications are made based on the knowledge of those skilled in the art, including the embodiments described in the disclosure line of the invention. It is possible to practice the present invention in other improved forms.

〔10.その他〕
また、上記各実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
[10. others〕
Further, among the processes described in each of the above embodiments, all or a part of the processes described as being automatically performed can be manually performed, or the processes described as being manually performed. It is also possible to automatically perform all or part of the above by a known method. In addition, the processing procedure, specific name, and information including various data and parameters shown in the above document and drawings can be arbitrarily changed unless otherwise specified. For example, the various information shown in each figure is not limited to the illustrated information.

また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。例えば、第1グラフを生成する装置と、第2グラフを生成する装置は別体であってもよい。 Further, each component of each of the illustrated devices is a functional concept, and does not necessarily have to be physically configured as shown in the figure. That is, the specific form of distribution / integration of each device is not limited to the one shown in the figure, and all or part of the device is functionally or physically distributed / physically in arbitrary units according to various loads and usage conditions. Can be integrated and configured. For example, the device for generating the first graph and the device for generating the second graph may be separate bodies.

また、上述してきた各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。 In addition, the above-described embodiments can be appropriately combined as long as the processing contents do not contradict each other.

また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、取得部は、取得手段や取得回路に読み替えることができる。 Further, the above-mentioned "section, module, unit" can be read as "means" or "circuit". For example, the acquisition unit can be read as an acquisition means or an acquisition circuit.

100 生成装置
121 取引情報記憶部
122 第1グラフ情報記憶部
123 カテゴリ情報記憶部
124 属性情報記憶部
125 スコア情報記憶部
126 第2グラフ情報記憶部
130 制御部
131 取得部
132 第1生成部
133 第2生成部
134 送信部
100 Generator 121 Transaction information storage unit 122 First graph information storage unit 123 Category information storage unit 124 Attribute information storage unit 125 Score information storage unit 126 Second graph information storage unit 130 Control unit 131 Acquisition unit 132 First generation unit 133 2 Generator 134 Transmitter

Claims (21)

ネットワーク上における主体である第1の主体の各々に対応する複数のノードと、所定の対応関係を有するノード間であって、当該複数のノードのうち、所定の条件を満たす主体である第2の主体の集合間の類似度が所定の閾値以上となるノード間を連結するエッジとを含む第1グラフであって、各ノードに属性情報が対応付けられた第1グラフを取得する取得部と、
前記取得部により取得された前記第1グラフに含まれる複数のノードを分類した所定のクラスタに属するノードの属性情報に基づいて、前記エッジを変更した第2グラフを生成する生成部と、
を備えたことを特徴とする生成装置。
A second of the plurality of nodes, which is between a plurality of nodes corresponding to each of the first subjects on the network and a node having a predetermined correspondence relationship and which satisfies a predetermined condition. A first graph including edges connecting nodes whose similarity between a set of subjects is equal to or higher than a predetermined threshold, and an acquisition unit for acquiring a first graph in which attribute information is associated with each node.
A generation unit that generates a second graph with the edge changed based on the attribute information of the nodes belonging to a predetermined cluster that classifies the plurality of nodes included in the first graph acquired by the acquisition unit.
A generator characterized by being equipped with.
前記生成部は、
前記第1グラフに含まれる前記所定のクラスタに属するノードの属性情報に基づいて、属性情報に対応するカテゴリを変更したカテゴリ情報に基づいて、前記エッジを変更した第2グラフを生成する
ことを特徴とする請求項1に記載の生成装置。
The generator
Based on the attribute information of the node belonging to the predetermined cluster included in the first graph, the second graph in which the edge is changed is generated based on the category information in which the category corresponding to the attribute information is changed. The generator according to claim 1.
前記生成部は、
前記第1グラフに含まれる前記所定のクラスタに属するノードに共通する属性情報が複数ある場合、当該属性情報に対応するカテゴリを統合したカテゴリ情報に基づいて、前記エッジを変更した第2グラフを生成する
ことを特徴とする請求項2に記載の生成装置。
The generator
When there is a plurality of attribute information common to the nodes belonging to the predetermined cluster included in the first graph, a second graph in which the edge is changed is generated based on the category information in which the categories corresponding to the attribute information are integrated. The generator according to claim 2, wherein the generator is characterized by the above.
前記生成部は、
前記第1グラフに含まれる複数の前記クラスタの各々に属するノードに共通する属性情報がある場合、当該属性情報に対応するカテゴリを分割したカテゴリ情報に基づいて、前記エッジを変更した第2グラフを生成する
ことを特徴とする請求項2または請求項3に記載の生成装置。
The generator
When there is attribute information common to the nodes belonging to each of the plurality of clusters included in the first graph, the second graph in which the edge is changed is displayed based on the category information obtained by dividing the category corresponding to the attribute information. The generator according to claim 2 or 3, wherein the generator is generated.
前記取得部は、
属性情報として前記各ノードに対応するユーザと所定の関係を有する対象のカテゴリ情報が前記各ノードに対応付けられた前記第1グラフを取得する
ことを特徴とする請求項1〜4のいずれか1項に記載の生成装置。
The acquisition unit
Any one of claims 1 to 4, wherein as attribute information, the first graph in which the target category information having a predetermined relationship with the user corresponding to each node is associated with each node is acquired. The generator described in the section.
前記取得部は、
属性情報として前記各ノードに対応するユーザが購入した商品のカテゴリ情報が前記各ノードに対応付けられた前記第1グラフを取得する
ことを特徴とする請求項5に記載の生成装置。
The acquisition unit
The generator according to claim 5, wherein the first graph in which the category information of the product purchased by the user corresponding to each node is associated with each node is acquired as the attribute information.
前記取得部は、
属性情報として前記各ノードに対応するユーザの属性情報が前記各ノードに対応付けられた前記第1グラフを取得する
ことを特徴とする請求項5に記載の生成装置。
The acquisition unit
The generator according to claim 5, wherein the first graph in which the attribute information of the user corresponding to each node is associated with each node is acquired as the attribute information.
前記取得部は、
属性情報として前記各ノードに対応するユーザの職業のカテゴリ情報が前記各ノードに対応付けられた前記第1グラフを取得する
ことを特徴とする請求項7に記載の生成装置。
The acquisition unit
The generator according to claim 7, wherein the first graph in which the category information of the occupation of the user corresponding to each node is associated with each node is acquired as the attribute information.
前記取得部は、
属性情報として前記対象を分類する階層構造に応じてカテゴリを変更したカテゴリ情報が前記各ノードに対応付けられた前記第1グラフを取得する
ことを特徴とする請求項5〜8のいずれか1項に記載の生成装置。
The acquisition unit
Any one of claims 5 to 8, wherein the first graph in which the category information whose category is changed according to the hierarchical structure for classifying the target as the attribute information is associated with each node is acquired. The generator described in.
前記生成部は、
前記取得部により取得された前記第1グラフにおける前記複数のノードのうち、第1ノード及び第2ノードと第3ノードとの関係性に基づいて、前記第1ノードと前記第2ノードとの間のエッジを変更した前記第2グラフを生成する
ことを特徴とする請求項1〜9のいずれか1項に記載の生成装置。
The generator
Among the plurality of nodes in the first graph acquired by the acquisition unit, between the first node and the second node based on the relationship between the first node and the second node and the third node. The generator according to any one of claims 1 to 9, wherein the second graph is generated by changing the edge of the above.
前記生成部は、
前記第1ノード及び前記第2ノードとの間がエッジで連結された第3ノードとの関係性に基づいて、前記第2グラフを生成する
ことを特徴とする請求項10に記載の生成装置。
The generator
The generator according to claim 10, wherein the second graph is generated based on the relationship between the first node and the third node connected by an edge.
前記生成部は、
前記第1ノードと前記第3ノードとの類似度と、前記第2ノードと前記第3ノードとの類似度とに基づいて、前記第2グラフを生成する
ことを特徴とする請求項11に記載の生成装置。
The generator
The eleventh claim is characterized in that the second graph is generated based on the similarity between the first node and the third node and the similarity between the second node and the third node. Generator.
前記生成部は、
前記第1ノード及び前記第2ノードとの間がエッジで連結された前記第3ノードの数に基づいて、前記第2グラフを生成する
ことを特徴とする請求項12に記載の生成装置。
The generator
The generator according to claim 12, wherein the second graph is generated based on the number of the third nodes in which the first node and the second node are connected by an edge.
前記生成部は、
前記第1ノードの属性情報及び前記第2ノードの属性情報と前記第3ノードの属性情報との関係性に基づいて、前記第2グラフを生成する
ことを特徴とする請求項10〜13のいずれか1項に記載の生成装置。
The generator
Any of claims 10 to 13, wherein the second graph is generated based on the attribute information of the first node and the relationship between the attribute information of the second node and the attribute information of the third node. The generator according to item 1.
前記取得部は、
各ノードに第1カテゴリの属性情報と第2カテゴリの属性情報とが対応付けられた第1グラフを取得し、
前記生成部は、
第1ノードの第1カテゴリの属性情報及び第2ノードの第1カテゴリの属性情報と第3ノードの第1カテゴリの属性情報との関係性に基づいて、第1カテゴリの第2グラフを生成し、第1ノードの第2カテゴリの属性情報及び第2ノードの第2カテゴリの属性情報と第3ノードの第2カテゴリの属性情報との関係性に基づいて、第2カテゴリの第2グラフを生成し、前記第1カテゴリの第2グラフと前記第2カテゴリの第2グラフとに基づいて、第2グラフを生成する
ことを特徴とする請求項10〜14のいずれか1項に記載の生成装置。
The acquisition unit
Acquire the first graph in which the attribute information of the first category and the attribute information of the second category are associated with each node.
The generator
A second graph of the first category is generated based on the relationship between the attribute information of the first category of the first node, the attribute information of the first category of the second node, and the attribute information of the first category of the third node. , Generates the second graph of the second category based on the relationship between the attribute information of the second category of the first node and the attribute information of the second category of the second node and the attribute information of the second category of the third node. The generator according to any one of claims 10 to 14, wherein the second graph is generated based on the second graph of the first category and the second graph of the second category. ..
前記取得部は、
各第1の主体と所定の関係を有する第2の主体が所定の条件を満たす第1の主体に対応するノード間をエッジで連結した前記第1グラフを取得する
ことを特徴とする請求項1〜15のいずれか1項に記載の生成装置。
The acquisition unit
Claim 1 is characterized in that a second subject having a predetermined relationship with each first subject acquires the first graph in which nodes corresponding to the first subject satisfying a predetermined condition are connected by an edge. The generator according to any one of 1 to 15.
前記取得部は、
前記第1の主体である買主と取引を行った第2の主体である売主に関する情報が所定の条件を満たす買主に対応するノード間を連結した前記第1グラフを取得する
ことを特徴とする請求項16に記載の生成装置。
The acquisition unit
A claim characterized in that the information about the seller who is the second entity that has made a transaction with the buyer who is the first entity acquires the first graph in which the nodes corresponding to the buyer satisfying a predetermined condition are connected. Item 16. The generator according to item 16.
前記取得部は、
前記第1の主体である買主と所定の関係を有する前記第2の主体である売主の集合が所定の条件を満たす買主に対応するノード間をエッジで連結した前記第1グラフを取得する
ことを特徴とする請求項17に記載の生成装置。
The acquisition unit
Acquiring the first graph in which a set of sellers who are the second subject having a predetermined relationship with the buyer who is the first subject connects the nodes corresponding to the buyers who satisfy the predetermined conditions at an edge. The generator according to claim 17.
前記取得部は、
買主に対応するノードのうち、所定の回数以上の取引を行った売主の集合間の類似度が所定の閾値以上となるノード間をエッジで連結した前記第1グラフを取得する
ことを特徴とする請求項18に記載の生成装置。
The acquisition unit
Among the nodes corresponding to the buyer, the first graph in which the nodes in which the similarity between the sets of sellers who have made transactions a predetermined number of times or more is equal to or higher than a predetermined threshold is connected by an edge is acquired. The generator according to claim 18.
コンピュータが実行する生成方法であって、
ネットワーク上における主体である第1の主体の各々に対応する複数のノードと、所定の対応関係を有するノード間であって、当該複数のノードのうち、所定の条件を満たす主体である第2の主体の集合間の類似度が所定の閾値以上となるノード間を連結するエッジとを含む第1グラフであって、各ノードに属性情報が対応付けられた第1グラフを取得する取得工程と、
前記取得工程により取得された前記第1グラフに含まれる複数のノードを分類した所定のクラスタに属するノードの属性情報に基づいて、前記エッジを変更した第2グラフを生成する生成工程と、
を含むことを特徴とする生成方法。
It ’s a computer-executed generation method.
A second of the plurality of nodes, which is between a plurality of nodes corresponding to each of the first subjects on the network and a node having a predetermined correspondence relationship and which satisfies a predetermined condition. A first graph including edges connecting nodes whose similarity between a set of subjects is equal to or higher than a predetermined threshold, and an acquisition step of acquiring a first graph in which attribute information is associated with each node.
A generation step of generating a second graph in which the edge is changed based on the attribute information of the nodes belonging to a predetermined cluster that classifies the plurality of nodes included in the first graph acquired by the acquisition step, and a generation step.
A generation method characterized by including.
ネットワーク上における主体である第1の主体の各々に対応する複数のノードと、所定の対応関係を有するノード間であって、当該複数のノードのうち、所定の条件を満たす主体である第2の主体の集合間の類似度が所定の閾値以上となるノード間を連結するエッジとを含む第1グラフであって、各ノードに属性情報が対応付けられた第1グラフを取得する取得手順と、
前記取得手順により取得された前記第1グラフに含まれる複数のノードを分類した所定のクラスタに属するノードの属性情報に基づいて、前記エッジを変更した第2グラフを生成する生成手順と、
をコンピュータに実行させることを特徴とする生成プログラム。
A second of the plurality of nodes, which is between a plurality of nodes corresponding to each of the first subjects on the network and a node having a predetermined correspondence relationship and which satisfies a predetermined condition. A first graph including edges connecting nodes whose similarity between a set of subjects is equal to or higher than a predetermined threshold, and an acquisition procedure for acquiring a first graph in which attribute information is associated with each node.
A generation procedure for generating a second graph in which the edge is changed based on the attribute information of a node belonging to a predetermined cluster that classifies a plurality of nodes included in the first graph acquired by the acquisition procedure, and a generation procedure.
A generator characterized by having a computer execute.
JP2018245789A 2016-03-10 2018-12-27 Generation device, generation method, and generation program Active JP6917972B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018245789A JP6917972B2 (en) 2016-03-10 2018-12-27 Generation device, generation method, and generation program

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2016046694A JP6462611B2 (en) 2016-03-10 2016-03-10 Generating device, generating method, and generating program
JP2018245789A JP6917972B2 (en) 2016-03-10 2018-12-27 Generation device, generation method, and generation program

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2016046694A Division JP6462611B2 (en) 2016-03-10 2016-03-10 Generating device, generating method, and generating program

Publications (2)

Publication Number Publication Date
JP2019071102A JP2019071102A (en) 2019-05-09
JP6917972B2 true JP6917972B2 (en) 2021-08-11

Family

ID=66441876

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018245789A Active JP6917972B2 (en) 2016-03-10 2018-12-27 Generation device, generation method, and generation program

Country Status (1)

Country Link
JP (1) JP6917972B2 (en)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7184984B2 (en) * 2000-11-17 2007-02-27 Valaquenta Intellectual Properties Limited Global electronic trading system
WO2013152815A1 (en) * 2012-04-13 2013-10-17 Telefonaktiebolaget L M Ericsson (Publ) Method and apparatus for improving network performance
EP2690569B1 (en) * 2012-07-23 2019-11-13 Facebook, Inc. Method and system, in particular relating to structured search queries based on social-graph information
US9439053B2 (en) * 2013-01-30 2016-09-06 Microsoft Technology Licensing, Llc Identifying subgraphs in transformed social network graphs
US9529935B2 (en) * 2014-02-26 2016-12-27 Palo Alto Research Center Incorporated Efficient link management for graph clustering

Also Published As

Publication number Publication date
JP2019071102A (en) 2019-05-09

Similar Documents

Publication Publication Date Title
Oestreicher-Singer et al. The network value of products
Zhao et al. The rise of fashion informatics: A case of data-mining-based social network analysis in fashion
JP6440661B2 (en) Determination device, determination method, and determination program
US11762819B2 (en) Clustering model analysis for big data environments
KR102468827B1 (en) Method, device and system for sourcing products based on artificial intelligence and providing category-customized review analysis service
JP2018045553A (en) Selection device, selection method, and selection program
Liu et al. Inferring gender and age of customers in shopping malls via indoor positioning data
WO2017203672A1 (en) Item recommendation method, item recommendation program, and item recommendation apparatus
Manikiran et al. E-commerce clothing review analysis and model building
Rogić et al. Customer response model in direct marketing: solving the problem of unbalanced dataset with a balanced support vector machine
JP7210958B2 (en) Product recommendation device and program
Furquim et al. The different phases of the omnichannel consumer buying journey: a systematic literature review and future research directions
JP6462611B2 (en) Generating device, generating method, and generating program
US8577814B1 (en) System and method for genetic creation of a rule set for duplicate detection
Goti et al. Artificial Intelligence in Business-to-Customer Fashion Retail: A Literature Review
Ranggadara et al. Applying customer loyalty classification with RFM and Naïve Bayes for better decision making
Xinchang et al. Movie recommendation algorithm using social network analysis to alleviate cold-start problem
Patil et al. Social context-aware and fuzzy preference temporal graph for personalized B2B marketing campaigns recommendations
JP6917972B2 (en) Generation device, generation method, and generation program
CN111091416A (en) Method and device for predicting probability of hotel purchase robot
JP6679415B2 (en) Selection device, selection method, and selection program
KR102290213B1 (en) Method for generating customer profile using card usage information and appratus for generating customer profile
Schwartz et al. Style similarity as feedback for product design
Ji et al. Garment customization big data–processing and analysis in optimization design
Falih et al. A recommendation system based on unsupervised topological learning

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190208

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20191101

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20191108

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200421

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200601

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201020

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201218

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210622

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210720

R150 Certificate of patent or registration of utility model

Ref document number: 6917972

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350