JP7282052B2 - Graph variable estimation model, apparatus and method for convolution with edge feature dependent intra-graph relations - Google Patents

Graph variable estimation model, apparatus and method for convolution with edge feature dependent intra-graph relations Download PDF

Info

Publication number
JP7282052B2
JP7282052B2 JP2020055994A JP2020055994A JP7282052B2 JP 7282052 B2 JP7282052 B2 JP 7282052B2 JP 2020055994 A JP2020055994 A JP 2020055994A JP 2020055994 A JP2020055994 A JP 2020055994A JP 7282052 B2 JP7282052 B2 JP 7282052B2
Authority
JP
Japan
Prior art keywords
graph
node
intra
feature
variable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020055994A
Other languages
Japanese (ja)
Other versions
JP2021157395A (en
Inventor
達也 小西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2020055994A priority Critical patent/JP7282052B2/en
Publication of JP2021157395A publication Critical patent/JP2021157395A/en
Application granted granted Critical
Publication of JP7282052B2 publication Critical patent/JP7282052B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、グラフの構造から当該グラフに係る情報を推定する技術に関する。 The present invention relates to technology for estimating information related to a graph from the structure of the graph.

複数の構成員の集合としての組織においては、当該組織や当該構成員に関して発生し得る様々な事象を予測して、当該組織の管理・運営に役立てたいとのニーズが少なからず存在する。 2. Description of the Related Art In an organization as a group of multiple members, there are not a few needs to predict various events that may occur in relation to the organization and its members, and to make use of it for the management and operation of the organization.

このようなニーズに応えた技術例として、例えば特許文献1には、会社等の従業員が所定の時期に休職するか否かを予測することができる休職予測システムが開示されている。このシステムは具体的に、従業員の勤務時間を含むデータと、従業員の休職の有無を示すデータとの関係を学習し、従業員が所定の時期に休職するリスクを予測する予測モデルを構築する予測モデル構築手段と、予測対象となる従業員の勤務時間を含むデータと予測モデルとに基づいて、予測対象となる従業員が所定の時期に休職するリスクを予測する予測手段とを備えている。 As a technical example that meets such needs, for example, Patent Document 1 discloses a leave of absence prediction system capable of predicting whether or not an employee of a company or the like will take a leave of absence at a predetermined time. Specifically, this system learns the relationship between data that includes employee working hours and data that indicates whether employees are on leave or not, and builds a prediction model that predicts the risk of employees taking leave at a given time. predictive model construction means for predicting the risk of an employee subject to prediction taking a leave of absence at a predetermined time based on data including the working hours of the employee subject to prediction and the prediction model; there is

一方で近年、画像認識や自然言語解析といったような分野で目覚ましい成果をあげてきた深層学習(ディープラーニング)をグラフ構造に適用し、当該グラフに係る情報を推定するGNN(Graph Neural Networks)の技術が、大きな進展をみせている。 On the other hand, GNN (Graph Neural Networks) technology that applies deep learning, which has achieved remarkable results in recent years in fields such as image recognition and natural language analysis, to the graph structure and estimates information related to the graph. is making great progress.

このGNNを用いれば、例えば組織をグラフに見立て、各構成員をその中のノードとし、さらにノード(構成員)間の関係をエッジで表現することによって、当該組織や当該構成員に関して発生し得る事象を、当該グラフに係る情報の推定問題として予測可能となるのである。 By using this GNN, for example, an organization can be regarded as a graph, each member can be a node in it, and the relationship between nodes (members) can be represented by edges. Events can be predicted as a matter of estimating information related to the graph.

また現在、このようなGNNの中でも、非特許文献1で提案されているR-GCN(Relational Graph Convolutional Networks)が大きな注目を集めている。このR-GCNは、グラフ内のノード間に複数の関係が存在する状況において、これらの関係毎にグラフの特徴量を畳み込み、グラフに係る情報の推定精度の向上を図ったアルゴリズムとなっている。 Among these GNNs, R-GCNs (Relational Graph Convolutional Networks) proposed in Non-Patent Document 1 are currently attracting a great deal of attention. This R-GCN is an algorithm that improves the accuracy of estimating information related to the graph by convolving the feature amount of the graph for each relationship in a situation where there are multiple relationships between nodes in the graph. .

特開2019-135662号公報JP 2019-135662 A

Michael Schlichtkrull, Thomas N. Kipf, Peter Bloem, Rianne van den Berg, Ivan Titov, Max Welling, “Modeling Relational Data with Graph Convolutional Networks”, European Semantic Web Conference (ESWC 2018): The Semantic Web, pp.593-607, 2018年Michael Schlichtkrull, Thomas N. Kipf, Peter Bloem, Rianne van den Berg, Ivan Titov, Max Welling, “Modeling Relational Data with Graph Convolutional Networks”, European Semantic Web Conference (ESWC 2018): The Semantic Web, pp.593-607 , 2018

上述した特許文献1に記載された技術は、個々の従業員の勤怠データから当該従業員の休職リスクを算出するものである。しかしながら、従業員の休職は、職場におけるメンタルヘルスの状況も遠因としており、個々の従業員の勤怠状況からだけではなく、当該従業員と上司・同僚・部下との関係や、さらには職場の雰囲気等からも大きな影響を受けることが知られている。したがって、特許文献1に記載された技術では、十分に高い精度の休職リスクの予測値を得ることは困難となっている。 The technology described in the above-mentioned Patent Document 1 calculates the leave of absence risk of the employee from the attendance data of the individual employee. However, the mental health situation in the workplace is also an indirect cause of employees taking leave of absence. It is also known to be greatly influenced by Therefore, with the technique described in Patent Document 1, it is difficult to obtain a sufficiently high-precision predicted value of the risk of absence from work.

一方、このような問題に対し、上述したR-GCNを用いれば、組織(グラフ)における構成員(ノード)間の関係(エッジ)も推定処理に取り込むことができ、当該組織の実情に合致したより精度の高い推定処理を行える可能性がある。 On the other hand, if the above-mentioned R-GCN is used to address such a problem, the relationships (edges) between the members (nodes) in the organization (graph) can also be incorporated into the estimation process, which matches the actual situation of the organization. There is a possibility that more accurate estimation processing can be performed.

しかしながら、例えば従業員の休職問題にR-GCNを適用するにしても、組織(グラフ)の特徴量の集約・抽出は自明ではなく、さらに、例えば上司・同僚・部下との関係や職場の雰囲気等は通常、固定されたものではなく時間変化を起こす動的なものと考えられ、このような動的な関係を如何に取り込むかについては全くの未解決となっている。 However, even if R-GCN is applied to the problem of employees taking leave of absence, it is not trivial to aggregate/extract the feature values of the organization (graph). , etc. are usually considered to be dynamic things that change over time rather than fixed things, and how to take in such dynamic relationships is completely unsolved.

そこで、本発明は、グラフに内在するグラフ内関係をより確実に取り込んで、当該グラフに係る情報を推定することができるグラフ変数推定モデル、グラフ変数推定装置、及びグラフ変数推定方法を提供することを目的とする。 Therefore, the present invention provides a graph variable estimation model, a graph variable estimation device, and a graph variable estimation method that can more reliably capture the intra-graph relationships inherent in a graph and estimate information related to the graph. With the goal.

本発明によれば、グラフに係るグラフ情報を入力とし、当該グラフのノードに対応する仮想ノードを有する複数の中間層において当該グラフ情報を畳み込み、当該グラフについての目的変数を推定するグラフ変数推定モデルであって、
当該グラフにおけるエッジの特徴を表すエッジ特徴量のとる値についての少なくとも1つの値範囲のそれぞれに対応して、少なくとも1つのグラフ内関係が設定されており、
当該中間層の各仮想ノードは、少なくとも1つのグラフ内関係を含むグラフ内関係の集合に含まれるグラフ内関係毎に、前段の中間層における当該グラフ内関係に該当する仮想ノードの特徴を表すノード特徴量と、前段の中間層における当該グラフ内関係に該当する仮想ノードを結ぶ仮想エッジの特徴を表すエッジ特徴量とを畳み込んで、自身の特徴を表すノード特徴量を生成する
ことを特徴とするグラフ変数推定モデルが提供される。
また、本発明によれば、
グラフに係るグラフ情報を入力とし、当該グラフのノードに対応する仮想ノードを有する複数の中間層において当該グラフ情報を畳み込み、当該グラフについての目的変数を推定するグラフ変数推定モデルであって、
当該グラフにおけるエッジの特徴を表すエッジ特徴量のとる値についての少なくとも1つの値範囲のそれぞれに対応して、少なくとも1つのグラフ内関係が設定されており、
当該中間層の各仮想ノードは、前記少なくとも1つのグラフ内関係を含むグラフ内関係の集合に含まれるグラフ内関係毎に、前段の中間層における当該グラフ内関係に該当する仮想ノードの特徴を表すノード特徴量を畳み込んで、自身の特徴を表すノード特徴量を生成し、
当該グラフは、互いにコミュニケーションを行い得るノードとしての複数のコミュニケーション主体を含むグループを表現したものであり、当該グループには、当該コミュニケーションの状況によって決定される、当該グラフ内関係としての動的なサブグループが形成され、当該目的変数は、当該コミュニケーション主体が当該サブグループに属するか否かに影響され得る事象に係る値をとる変数である
ことを特徴とするグラフ変数推定モデルが提供される。
According to the present invention, a graph variable estimation model that receives graph information related to a graph as an input, convolves the graph information in a plurality of intermediate layers having virtual nodes corresponding to nodes of the graph, and estimates objective variables for the graph. and
at least one intra-graph relationship is set corresponding to each of at least one value range of values taken by edge feature quantities representing edge features in the graph;
Each virtual node in the intermediate layer is a node representing the characteristics of the virtual node corresponding to the intra-graph relationship in the preceding intermediate layer for each intra-graph relationship included in a set of intra-graph relationships including at least one intra-graph relationship. Convoluting the feature amount and the edge feature amount representing the feature of the virtual edge connecting the virtual nodes corresponding to the intra-graph relation in the intermediate layer in the previous stage to generate the node feature amount representing the feature of itself. A graph variable estimation model is provided.
Moreover, according to the present invention,
A graph variable estimation model that receives graph information related to a graph as an input, convolves the graph information in a plurality of intermediate layers having virtual nodes corresponding to the nodes of the graph, and estimates an objective variable for the graph,
at least one intra-graph relation is set corresponding to each of at least one value range of values taken by edge feature quantities representing edge features in the graph,
Each virtual node in the intermediate layer represents, for each intra-graph relation included in a set of intra-graph relations including the at least one intra-graph relation, a feature of a virtual node corresponding to the intra-graph relation in the preceding intermediate layer. Convolve the node features to generate node features that represent their own features,
The graph expresses a group including a plurality of communication subjects as nodes that can communicate with each other. A group is formed, and the target variable is a variable that takes a value related to an event that can be affected by whether or not the communication subject belongs to the subgroup.
Provided is a graph variable estimation model characterized by:

また、本発明によるグラフ変数推定モデルにおいて、当該中間層の各仮想ノードは、当該集合に含まれるグラフ内関係毎に、当該グラフ内関係についての畳み込み結果に対し、当該グラフ内関係について決定された又は学習された重みを付与して、自身の特徴を表すノード特徴量を生成することも好ましい。 Further, in the graph variable estimation model according to the present invention, each virtual node in the intermediate layer is determined for each in-graph relation for each in-graph relation included in the set, with respect to the convolution result for the in-graph relation Alternatively, it is also preferable to generate a node feature amount representing its own feature by adding learned weights.

さらに、本発明によるグラフ変数推定モデルは、複数の中間層の最後段からの出力を受け取り、当該グラフについて推定される当該目的変数に係る値を出力する目的変数推定層を更に有することも好ましい。 Furthermore, the graph variable estimation model according to the present invention preferably further includes an objective variable estimation layer that receives outputs from the last stages of the plurality of intermediate layers and outputs values related to the objective variables estimated for the graph.

また、本発明によるグラフ変数推定モデルにおける、推定対象となる当該目的変数は、当該グラフのノードに係る目的変数、当該グラフのエッジに係る目的変数、及び当該グラフの全体又は一部に係る目的変数のうちの少なくとも1つであることも好ましい。 In addition, in the graph variable estimation model according to the present invention, the objective variables to be estimated are the objective variables related to the nodes of the graph, the objective variables related to the edges of the graph, and the objective variables related to the whole or part of the graph. It is also preferred that at least one of

本発明によれば、また、グラフに係るグラフ情報を入力とし、当該グラフのノードに対応する仮想ノードを有する複数の中間層において、当該グラフ情報を畳み込み、当該グラフについての目的変数を推定するグラフ変数推定モデルであって、
当該グラフにおけるエッジの特徴を表すエッジ特徴量のとる値についての少なくとも1つの値範囲のそれぞれに対応して、少なくとも1つのグラフ内関係が設定されており、
当該中間層の各仮想ノードは、少なくとも1つのグラフ内関係を含むグラフ内関係の集合に含まれるグラフ内関係毎に、前段の中間層における当該グラフ内関係に該当する仮想ノードを結ぶ仮想エッジの特徴を表すエッジ特徴量を畳み込んで、自身の特徴を表すノード特徴量を生成する
ことを特徴とするグラフ変数推定モデルが提供される。
According to the present invention, graph information related to a graph is input, the graph information is convoluted in a plurality of intermediate layers having virtual nodes corresponding to the nodes of the graph, and an objective variable for the graph is estimated. A variable estimation model,
at least one intra-graph relationship is set corresponding to each of at least one value range of values taken by edge feature quantities representing edge features in the graph;
Each virtual node in the intermediate layer has, for each intra-graph relation included in a set of intra-graph relations including at least one intra-graph relation, a virtual edge connecting the virtual nodes corresponding to the intra-graph relation in the preceding intermediate layer. Provided is a graph variable estimation model characterized by convolving an edge feature quantity representing a feature to generate a node feature quantity representing its own feature.

本発明によれば、さらに、以上に述べたようなグラフ変数推定モデルを用いて、入力されたグラフ情報から、当該グラフ情報に係るグラフについて推定される目的変数に係る情報を出力することを特徴とするグラフ変数推定装置が提供される。 According to the present invention, further, using the graph variable estimation model as described above, the input graph information is used to output information about the objective variable estimated for the graph associated with the graph information. A graph variable estimator is provided.

本発明によれば、さらにまた、グラフに係るグラフ情報を入力とし、当該グラフのノードに対応する仮想ノードを有する複数の中間層において当該グラフ情報を畳み込み、当該グラフについての目的変数を推定するグラフ変数推定モデルを用いた、コンピュータによって実施されるグラフ変数推定方法であって、
当該グラフにおけるエッジの特徴を表すエッジ特徴量のとる値についての少なくとも1つの値範囲のそれぞれに対応して、少なくとも1つのグラフ内関係を設定するステップと、
当該中間層の各仮想ノードにおいて、前記少なくとも1つのグラフ内関係を含むグラフ内関係の集合に含まれるグラフ内関係毎に、前段の中間層における当該グラフ内関係に該当する仮想ノードの特徴を表すノード特徴量と、前段の中間層における当該グラフ内関係に該当する仮想ノードを結ぶ仮想エッジの特徴を表すエッジ特徴量とを畳み込み、当該各仮想ノードの特徴を表すノード特徴量を生成するステップと
を有するグラフ変数推定方法が提供される。
また、本発明によれば、グラフに係るグラフ情報を入力とし、当該グラフのノードに対応する仮想ノードを有する複数の中間層において当該グラフ情報を畳み込み、当該グラフについての目的変数を推定するグラフ変数推定モデルを用いた、コンピュータによって実施されるグラフ変数推定方法であって、
当該グラフにおけるエッジの特徴を表すエッジ特徴量のとる値についての少なくとも1つの値範囲のそれぞれに対応して、少なくとも1つのグラフ内関係を設定するステップと、
当該中間層の各仮想ノードにおいて、前記少なくとも1つのグラフ内関係を含むグラフ内関係の集合に含まれるグラフ内関係毎に、前段の中間層における当該グラフ内関係に該当する仮想ノードについて、当該仮想ノードの特徴を表すノード特徴量を畳み込み、当該各仮想ノードの特徴を表すノード特徴量を生成するステップと
を有し、
当該グラフは、互いにコミュニケーションを行い得るノードとしての複数のコミュニケーション主体を含むグループを表現したものであり、当該グループには、当該コミュニケーションの状況によって決定される、当該グラフ内関係としての動的なサブグループが形成され、当該目的変数は、当該コミュニケーション主体が当該サブグループに属するか否かに影響され得る事象に係る値をとる変数である
ことを特徴とするグラフ変数推定方法が提供される。
According to the present invention, there is further provided a graph that receives graph information related to a graph as an input, convolves the graph information in a plurality of intermediate layers having virtual nodes corresponding to the nodes of the graph, and estimates an objective variable for the graph. A computer -implemented method of graph variable estimation using a variable estimation model, comprising:
setting at least one intra-graph relation corresponding to each of at least one value range of values taken by edge feature quantities representing features of edges in the graph;
In each virtual node of the intermediate layer, for each intra-graph relation included in a set of intra-graph relations including the at least one intra-graph relation, characteristics of the virtual node corresponding to the intra-graph relation in the previous intermediate layer are determined. A step of convolving the node feature value representing the node feature value and the edge feature value representing the feature of the virtual edge connecting the virtual nodes corresponding to the intra-graph relation in the intermediate layer in the previous stage to generate the node feature value representing the feature of each of the virtual nodes. There is provided a graph variable estimation method comprising:
Further, according to the present invention, graph information relating to a graph is input, the graph information is convoluted in a plurality of intermediate layers having virtual nodes corresponding to the nodes of the graph, and an objective variable for the graph is estimated. A computer-implemented method of graph variable estimation using an estimation model, comprising:
setting at least one intra-graph relation corresponding to each of at least one value range of values taken by edge feature quantities representing features of edges in the graph;
In each virtual node of the intermediate layer, for each in-graph relation included in a set of in-graph relations including the at least one in-graph relation, for a virtual node corresponding to the in-graph relation in the preceding intermediate layer, the virtual a step of convolving a node feature representing a feature of a node to generate a node feature representing a feature of each virtual node;
has
The graph expresses a group including a plurality of communication subjects as nodes that can communicate with each other. A group is formed, and the target variable is a variable that takes a value related to an event that can be affected by whether or not the communication subject belongs to the subgroup.
There is provided a graph variable estimation method characterized by:

本発明のグラフ変数推定モデル、グラフ変数推定装置、及びグラフ変数推定方法によれば、グラフに内在するグラフ内関係をより確実に取り込んで、当該グラフに係る情報を推定することができる。 According to the graph variable estimation model, the graph variable estimation device, and the graph variable estimation method of the present invention, it is possible to more reliably capture the intra-graph relationships inherent in a graph and estimate information related to the graph.

本発明によるグラフ変数推定モデルを用いてグラフ変数推定処理を実施するグラフ変数推定装置の一実施形態を示す模式図である。1 is a schematic diagram showing an embodiment of a graph variable estimation device that performs graph variable estimation processing using a graph variable estimation model according to the present invention; FIG. 本発明に係る「動的グラフ内関係」の設定の一具体例を説明するための模式図である。FIG. 10 is a schematic diagram for explaining a specific example of setting the "dynamic graph relations" according to the present invention;

以下、本発明の実施形態について、図面を用いて詳細に説明する。 BEST MODE FOR CARRYING OUT THE INVENTION Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.

[グラフ変数推定装置,グラフ変数推定モデル]
図1は、本発明によるグラフ変数推定モデルを用いてグラフ変数推定処理を実施するグラフ変数推定装置の一実施形態を示す模式図である。
[Graph variable estimation device, graph variable estimation model]
FIG. 1 is a schematic diagram showing an embodiment of a graph variable estimation device that performs graph variable estimation processing using a graph variable estimation model according to the present invention.

図1に示した本実施形態のグラフ変数推定装置2は、複数の構成要素(例えば従業員)を含む所定のグループ(例えば会社A)における、
(a)個々の構成要素(従業員)に係る情報(例えば、従業員の属性情報や勤怠データ、さらにはこれらの値の平均や分散といったような統計量等)や、
(b)構成要素(従業員)間のコミュニケーション若しくは作用・結び付きに係る情報(例えば、従業員間でやり取りされるメールやチャットに係る量)
に基づき、
(c)構成要素(従業員)やグループ(会社A)に係る情報である目的変数(例えば、特定の従業員が将来のある時点又は期間で休職する確率である休職リスク)
を推定する装置となっている。
The graph variable estimation device 2 of this embodiment shown in FIG.
(a) Information on individual components (employees) (e.g., employee attribute information, attendance data, and statistics such as the average and variance of these values),
(b) Information related to communication or action/connection between components (employees) (e.g., amount related to e-mails and chats exchanged between employees)
Based on
(c) Objective variables that are information about constituents (employees) or groups (company A) (e.g., absence risk, which is the probability that a particular employee will be absent from work at some point or period in the future).
is a device for estimating

より具体的に、このグラフ変数推定装置2では、グループ(会社A)をグラフに見立て、構成要素(従業員)をノードとし、さらに、構成要素(従業員)間のコミュニケーション若しくは作用・結び付きに係る情報をエッジで表現した上で、
上記(a)の情報を、ノードに係る特徴量(ノード特徴量)とし、
上記(b)の情報を、エッジに係る特徴量(エッジ特徴量)として、
グラフ変数推定モデル1を用いて、上記(c)の目的変数であるグラフ変数(休職リスク)を推定しているのである。
More specifically, in this graph variable estimating device 2, the group (company A) is regarded as a graph, the constituent elements (employees) are nodes, and the communication or action/connection between the constituent elements (employees) is After expressing the information at the edge,
Let the information in (a) above be a feature amount related to a node (node feature amount),
Using the above information (b) as a feature amount related to the edge (edge feature amount),
Using the graph variable estimation model 1, the graph variable (risk of absence from work), which is the objective variable of (c) above, is estimated.

ここで、このようなグラフ変数推定処理の要であるグラフ変数推定モデル1は、本実施形態においてGCN(Graph Convolutional Networks)アルゴリズムを用いて構築されたモデルであり、グラフ(グループ,会社)内に存在する「グラフ内関係」であって、ノード(構成要素,従業員)間のコミュニケーション若しくは作用・結び付きの状況(エッジ状態)に依存して動的に変化するような「動的グラフ内関係」を含む「グラフ内関係」毎に、上記の特徴量を畳み込んで、推定値としてのグラフ変数(目的変数,休職リスク)を出力するモデルとなっている。 Here, the graph variable estimation model 1, which is the core of such graph variable estimation processing, is a model constructed using the GCN (Graph Convolutional Networks) algorithm in this embodiment, and in the graph (group, company) A dynamic graph relationship that exists and changes dynamically depending on the communication between nodes (components, employees) or the state of action/connection (edge state). The above feature amount is convoluted for each “relationship in the graph” including , and the model outputs graph variables (objective variable, risk of absence from work) as estimated values.

ちなみに上述したような、エッジ状態に依存して動的に変化する「動的グラフ内関係」は、グラフ(グループ,会社)内における、それに属するノード(構成要素,従業員)が動的に変化する動的サブグラフ(動的サブグループ)を規定するものとも解される。そうすると、推定値としてのグラフ変数(目的変数,休職リスク)は、コミュニケーション若しくは作用・結び付きの主体であるノード(構成要素,従業員)が、当該動的サブグラフ(動的サブグループ)に属するか否かにも影響される変数と捉えることもできるのである。 By the way, the "dynamic intra-graph relation" that dynamically changes depending on the edge state, as described above, means that the nodes (components, employees) that belong to it in the graph (group, company) change dynamically. It is also understood to define a dynamic subgraph (dynamic subgroup) that Then, the graph variables (objective variable, risk of absence from work) as estimated values are whether or not the node (component, employee), which is the subject of communication or action/connection, belongs to the dynamic subgraph (dynamic subgroup). It can also be regarded as a variable that is influenced by something.

同じく図1において、グラフ変数推定モデル1はより具体的に、
(A)グラフに係るグラフ情報(例えばノード特徴量やエッジ特徴量)を入力とし、当該グラフのノードに対応する「仮想ノード」を有する複数の「中間層」において当該グラフ情報(ノード特徴量やエッジ特徴量)を畳み込み、当該グラフについての目的変数を推定するグラフ変数推定モデルとなっており、
(B)複数の「中間層」の各々における各「仮想ノード」は、設定された少なくとも1つの「動的グラフ内関係」を含むグラフ内関係の集合に含まれるグラフ内関係毎に、前段の「中間層」における当該グラフ内関係に該当する「仮想ノード」の特徴を表すノード特徴量を畳み込んで、自身の特徴を表すノード特徴量を生成する
ことを特徴としている。
Also in FIG. 1, graph variable estimation model 1 is more specifically:
(A) Graph information (for example, node features and edge features) related to a graph is input, and the graph information (node features and It is a graph variable estimation model that convolves the edge feature value) and estimates the objective variable for the graph,
(B) Each “virtual node” in each of a plurality of “intermediate layers” is set for each in-graph relation included in a set of in-graph relations including at least one set “dynamic in-graph relation”, It is characterized by convoluting the node feature amount representing the feature of the "virtual node" corresponding to the intra-graph relation in the "middle layer" to generate the node feature amount representing its own feature.

また、上記(B)の「動的グラフ内関係」は、後に図2を用いて詳細に説明するが、
(C)当該グラフにおけるエッジ特徴量のとる値についての少なくとも1つの値範囲のそれぞれに対応して、少なくとも1つ設定される
ものとなっている。このように「動的グラフ内関係」は、エッジ特徴量の値が変化してこの値の属する値範囲も変化するに伴い、「動的に」変化する関係となっているのである。
In addition, the above (B) "relationship within dynamic graph" will be described later in detail with reference to FIG.
(C) At least one is set corresponding to each of at least one value range of the value taken by the edge feature amount in the graph. In this way, the "dynamic intra-graph relation" is a relation that changes "dynamically" as the value of the edge feature quantity changes and the value range to which this value belongs also changes.

例えば、会社Aの各従業員における将来の休職リスクを推定するケースにおいて、エッジ特徴量として例えば「(当該エッジで結ばれるノードとしての)従業員の間における所定単位期間での電子メールの本数」が規定されている場合に、「動的グラフ内関係」として例えば、
(a)「動的グラフ内関係r_1」:当該本数が10通未満である関係、
(b)「動的グラフ内関係r_2」:当該本数が10通以上であって20通未満である関係、
(c)「動的グラフ内関係r_3」:当該本数が20通以上である関係
を設定することができる。このような関係は、エッジ特徴量(電子メールの本数)によって自動的に算定されるものであり、且つ当該エッジ特徴量の変化に応じて例えば日々変化していく動的なものとなっている。
For example, in the case of estimating the future risk of absence from work for each employee of company A, the edge feature value is, for example, "the number of e-mails in a predetermined unit period between employees (as nodes connected by the edge)" is defined, as a "dynamic graph relation", for example,
(a) "Relationship r_1 in dynamic graph": a relation whose number is less than 10;
(b) "Intra-dynamic graph relation r_2": a relation whose number is 10 or more and less than 20;
(c) "Intra-dynamic graph relation r_3": A relation whose number is 20 or more can be set. Such a relationship is automatically calculated based on the edge feature amount (the number of e-mails), and is dynamic in that it changes, for example, daily according to changes in the edge feature amount. .

ここで、グラフ変数推定モデル1に含まれる「中間層」における各従業員に相当する各「仮想ノード」は、上記(a)~(c)の「動的グラフ内関係」の各々について、各従業員と当該動的グラフ内関係にある他の従業員に相当する(前段の中間層の)「仮想ノード」のノード特徴量を畳み込んで、自身の特徴を表すノード特徴量を生成する。 Here, each "virtual node" corresponding to each employee in the "middle layer" included in the graph variable estimation model 1 has each The node features of the "virtual nodes" (in the intermediate layer in the previous stage) corresponding to the employee and other employees who have a relationship within the dynamic graph are convoluted to generate a node feature representing the feature of the employee.

このように、グラフ変数推定モデル1は、上述したような「動的グラフ内関係」を含むグラフ内関係をより確実に取り込むことにより、グラフ変数(目的変数,休職リスク)をより高い精度で推定することも可能にするのである。 In this way, the graph variable estimation model 1 more reliably captures the relationships within the graph including the "dynamic relationships within the graph" as described above, thereby estimating the graph variables (objective variable, risk of absence from work) with higher accuracy. It also makes it possible to

この点たしかに、上述した休職リスクを推定するケースにおいて、単に各従業員の勤怠データ(ノード特徴量)を考慮するだけではなく、上記(a)~(c)に示したような「動的グラフ内関係」、すなわち従業員同士のコミュニケーションの度合い・頻度で形成される動的な従業員のサブグループをも勘案することによって、より高い精度の休職リスク推定結果をもたらすことができると考えられる。しかしながら従来、このような「動的グラフ内関係」を適宜設定して推定モデルに取り込むことは困難であった。 In this regard, it is true that in the case of estimating the risk of absence from work described above, not only the attendance data (node feature amount) of each employee is taken into consideration, but also the dynamic graph shown in (a) to (c) above. By taking into account dynamic employee subgroups that are formed by the degree and frequency of communication between employees, it is possible to obtain more accurate results for estimating the risk of absence from work. Conventionally, however, it has been difficult to appropriately set such "dynamic graph relationships" and incorporate them into an estimation model.

これに対し、グラフ変数推定モデル1は、上記(C)で規定されたように、各エッジにおけるエッジ特徴量の値に基づき「動的グラフ内関係」を自動設定可能としたことによって、当該「動的グラフ内関係」をも勘案したグラフ変数(目的変数,休職リスク)推定処理を実現したのである。これにより、グラフに内在する動的な関係も反映した、より精度の高いグラフ変数(目的変数,休職リスク)の推定値を得ることも可能となる。 On the other hand, the graph variable estimation model 1, as defined in (C) above, can automatically set the "dynamic graph relations" based on the value of the edge feature value of each edge. Graph variables (objective variable, risk of absence from work) estimation processing that takes into account dynamic relationships within graphs has also been realized. This makes it possible to obtain more accurate estimates of graph variables (objective variable, risk of absence from work) that also reflect the dynamic relationships inherent in the graph.

ちなみに、上記(C)の「動的グラフ内関係」はいわば、ノード間の関係性を表現したエッジ特徴量を離散化・量子化して、畳み込み処理を可能にしたものとも言える。このような工夫により、例えば上記の休職リスクを推定するケースでは、会社Aにおける上司、同僚や部下といった労務人事的知見とともに、これらの仕事上の各関係におけるコミュニケーションの度合い・頻度といったような、職場の活性化度や働き易さに関係する可変的な情報をも、休職リスク推定に取り込むことができるのである。 By the way, the "dynamic intra-graph relation" in (C) above can be said to be a convolution process enabled by discretizing and quantizing the edge feature quantity expressing the relation between nodes. With this kind of ingenuity, for example, in the case of estimating the above-mentioned risk of absence from work, in addition to labor and personnel knowledge such as superiors, colleagues and subordinates at company A, the degree and frequency of communication in each of these work relationships It is possible to incorporate variable information related to the degree of activation of workers and ease of work into the estimation of the risk of absence from work.

またさらに、図1に示したグラフ変数推定モデル1においては、その好適な実施形態として、
(D)複数の「中間層」の各々における各「仮想ノード」は、設定された少なくとも1つの「動的グラフ内関係」を含むグラフ内関係の集合に含まれるグラフ内関係毎に、前段の「中間層」における当該グラフ内関係に該当する「仮想ノード」を結ぶ「仮想エッジ」の特徴を表すエッジ特徴量も畳み込んで、自身の特徴を表すノード特徴量を生成する
ことも好ましい。
Furthermore, in the graph variable estimation model 1 shown in FIG. 1, as a preferred embodiment,
(D) Each “virtual node” in each of a plurality of “intermediate layers” is set for each in-graph relation included in a set of in-graph relations including at least one set “dynamic in-graph relation”, It is also preferable to convolve the edge feature quantity representing the feature of the "virtual edge" connecting the "virtual nodes" corresponding to the intra-graph relation in the "intermediate layer" to generate the node feature quantity representing its own feature.

この場合、前段の「中間層」の「仮想ノード(の特徴量)」だけではなく、「仮想エッジ(の特徴量)」をも「動的グラフ内関係」に基づいて畳み込むので、動的に変化するコミュニケーション若しくは作用・結び付きの状況をも適宜、直接的に取り込むことができ、これにより、より精度の高いグラフ変数(目的変数,休職リスク)の推定処理を実施することが可能となる。 In this case, not only the "virtual nodes (features)" of the "intermediate layer" in the previous stage, but also the "virtual edges (features)" are convoluted based on the "dynamic intra-graph relations". It is also possible to directly incorporate changing communication or action/connection situations as appropriate, thereby enabling execution of more accurate estimation processing of graph variables (objective variable, risk of absence from work).

なお上述したように、グラフ変数推定モデル1の上記構成は、当該モデルを実現する機械学習アルゴリズム、本実施形態ではGCNアルゴリズム、を具現したプログラムの構造を表現したものであるが、特に、本技術分野において先進的なR-GCN(Relational Graph Convolutional Networks)アルゴリズムに係るものとすることが好ましい。 As described above, the above configuration of the graph variable estimation model 1 expresses the structure of a program that embodies a machine learning algorithm that realizes the model, in this embodiment, the GCN algorithm. It preferably relates to the R-GCN (Relational Graph Convolutional Networks) algorithm, which is advanced in the field.

[モデル構成,装置構成,グラフ変数推定プログラム]
以下、グラフ変数推定モデル1及びグラフ変数推定装置2の構成・機能を詳細に説明する。このうちグラフ変数推定モデル1は、図1に示したように、グラフ変数推定装置2に搭載された本発明によるグラフ変数推定プログラムに取り込まれてグラフ変数推定処理の主要ステップを実行可能にするモデルであり、その構成要素として、
(ア)グラフ特徴量抽出部10と、(イ)目的変数推定部11と
を有している。
[Model configuration, device configuration, graph variable estimation program]
The configurations and functions of the graph variable estimation model 1 and the graph variable estimation device 2 will be described in detail below. Of these, the graph variable estimation model 1, as shown in FIG. 1, is a model that is incorporated into the graph variable estimation program according to the present invention installed in the graph variable estimation device 2 and that makes it possible to execute the main steps of the graph variable estimation process. and, as its constituent elements,
It has (a) a graph feature quantity extraction unit 10 and (b) an objective variable estimation unit 11 .

ここで最初に、上記(ア)のグラフ特徴量抽出部10へ入力されるグラフ情報である、「ノード特徴量」及び「エッジ特徴量」の説明を行う。 First, the "node feature amount" and the "edge feature amount", which are the graph information input to the graph feature amount extraction unit 10 in (a) above, will be described.

「ノード特徴量」は、各ノードについて算出され、当該ノードに係るノード情報を特徴量成分とするベクトル量であり、例えばノードとして従業員を設定した場合、このノード情報として、
(a)従業員の性別、年齢、居住地や、勤続年数といったような属性情報、
(b)従業員の(所定期間における)勤務時間、残業時間、有給休暇取得日数、職制、休職履歴等のうちの少なくとも1つを含む勤怠データや、さらには、
(c)上記(a)や(b)の値における(所属の部署毎に又は会社A全体で計算した)平均や分散等の統計量
を採用することができる。また勿論、目的変数を従業員(ノード)毎の休職リスクとした場合において、休職という事象に関係する可能性のある従業員に係る他の情報も、ノード特徴量に採用することが可能である。
"Node feature amount" is a vector amount calculated for each node and having node information related to the node as a feature amount component. For example, when an employee is set as a node, the node information is:
(a) Employee demographic information such as gender, age, place of residence, and length of service;
(b) Attendance data including at least one of the employee's working hours (in a predetermined period), overtime hours, days of paid leave taken, job organization, leave history, etc.;
(c) Statistical quantities such as averages and variances (calculated for each department or company A as a whole) in the above values (a) and (b) can be employed. Of course, when the objective variable is the risk of absence from work for each employee (node), other information related to employees that may be related to the event of absence from work can also be adopted as the node feature amount. .

次いで「エッジ特徴量」は、ノード間を接続する各エッジについて算出され、当該エッジに係るエッジ情報を特徴量成分とするベクトル量であり、例えばノードとして従業員を設定した場合、このエッジ情報として、
(d)従業員間でやり取りされる電子メールやチャット等による従業員同士のコミュニケーションに係る情報(例えば、(所定期間においてやり取りされる)メールやチャットの本数、メールやチャットに含まれる所定の単語の出現回数若しくは出現頻度、(ニューラルネットワーク等を用いた公知の特徴量化手法によって生成される)メールやチャットに含まれる文を埋め込み表現したベクトル、メールやチャットに対する絵文字リアクションの有無若しくはその数等)や、
(e)従業員の間における職制上の関係(例えば、上司と部下の関係、同僚の関係、同じ課に属する関係等)
を採用してもよい。また勿論、目的変数を従業員(ノード)毎の休職リスクとした場合において、休職という事象に関係する可能性のある従業員間の状態・事象に係る他の情報も、エッジ特徴量に採用することが可能である。
Next, the "edge feature amount" is calculated for each edge connecting nodes, and is a vector amount whose feature amount component is the edge information related to the edge. For example, when an employee is set as a node, the edge information is ,
(d) Information related to communication between employees by e-mails, chats, etc. exchanged between employees (for example, the number of e-mails and chats (exchanged during a predetermined period), predetermined words included in e-mails and chats number of appearances or frequency of appearance, vectors embedded representation of sentences contained in emails and chats (generated by known feature quantification methods using neural networks, etc.), presence or absence or number of pictogram reactions to emails and chats, etc.) or,
(e) Organizational relationships between employees (e.g., superior-subordinate relationships, co-worker relationships, relationships belonging to the same department, etc.)
may be adopted. In addition, of course, when the objective variable is the risk of absence from work for each employee (node), other information related to the state/event between employees that may be related to the event of absence from work is also adopted as the edge feature value. Is possible.

次に、上記(ア)のグラフ特徴量抽出部10において、畳み込み処理の際に活用される(動的グラフ内関係を含む)「グラフ内関係」について説明する。 Next, the "intra-graph relation" (including the dynamic intra-graph relation) utilized in the convolution process in the graph feature quantity extraction unit 10 of (a) above will be described.

グラフ内関係は、すでに説明した「動的グラフ内関係」と、それ以外の「静的グラフ内関係」とに分けられる。このうち「動的グラフ内関係」は、所定のエッジ特徴量のとる値についての少なくとも1つの値範囲のそれぞれに対応して、少なくとも1つ設定される関係であり、エッジ特徴量の値が変化して、当該値の属する値範囲も変化するに伴い、動的に変化するものとなっている。 The intra-graph relations are divided into the already explained "dynamic intra-graph relations" and other "static intra-graph relations". Of these, the "dynamic graph relation" is a relation set at least one corresponding to each of at least one value range for the value taken by the predetermined edge feature value, and the value of the edge feature value changes. Then, as the value range to which the value belongs also changes, it dynamically changes.

例えばすでに説明した内容ではあるが、会社Aの各従業員における将来の休職リスクを推定するケースにおいて、エッジ特徴量として例えば「(当該エッジで結ばれるノードとしての)従業員の間における所定単位期間での電子メールの本数」が規定されている場合に、「動的グラフ内関係」として例えば、
(a)「動的グラフ内関係r_1」:当該本数が10通未満である関係、
(b)「動的グラフ内関係r_2」:当該本数が10通以上であって20通未満である関係、
(c)「動的グラフ内関係r_3」:当該本数が20通以上である関係
を設定することができるのである。
For example, as already explained, in the case of estimating the future risk of absence from work for each employee of company A, the edge feature value is, for example, "a predetermined unit period between employees (as a node connected by the edge) If the number of e-mails in "is defined, as the "dynamic graph relationship", for example,
(a) "Relationship r_1 in dynamic graph": a relation whose number is less than 10;
(b) "Intra-dynamic graph relation r_2": a relation whose number is 10 or more and less than 20;
(c) "Relationship r_3 in dynamic graph": A relation whose number is 20 or more can be set.

ここで、上記(a)~(c)の「動的グラフ内関係」を決定するエッジ特徴量(電子メールの本数)は通常、日々又は刻々と変化する量であり、そのため、当該「動的グラフ内関係」も、当該エッジ特徴量の時間的な変化に応じて例えば日々又は刻々と変化していくものとなっている。 Here, the edge feature quantity (the number of e-mails) that determines the “dynamic relations in the graph” of (a) to (c) above is usually a quantity that changes day by day or moment by moment. The "relationship in the graph" also changes, for example, day by day or moment by moment, according to the temporal change in the edge feature amount.

また他の例として、エッジ特徴量を、「従業員の間における職制上の関係(例えば、上司と部下の関係、同僚の関係等)」とした場合、「動的グラフ内関係」として例えば、
(d)「動的グラフ内関係r_4」:当該職制上の関係を表す数値(エッジ特徴量の値)が、「上司と部下の関係」を示す数値(例えば"2")である関係、
(e)「動的グラフ内関係r_5」:当該職制上の関係を表す数値(エッジ特徴量の値)が、「同僚の関係」を示す数値(例えば"1")である関係
を設定することもできる。
As another example, if the edge feature value is "relationships between employees in terms of organizational structure (e.g., relationships between superiors and subordinates, relationships between colleagues, etc.)", "relationships within a dynamic graph" may be, for example,
(d) “Relationship r_4 in dynamic graph”: A relation in which the numerical value (the value of the edge feature value) representing the relationship on the organizational structure is a numerical value (for example, “2”) indicating the “relationship between superior and subordinate”;
(e) "Relationship r_5 in dynamic graph": Setting a relationship in which the numerical value (edge feature value) representing the relation in the job organization is a numerical value (for example, "1") indicating the "relationship between colleagues". can also

ここで、上記(d)及び(e)の「動的グラフ内関係」を決定するエッジ特徴量(職制上の関係)も、比較的長期となる期間でみれば変化し得る量であり、そのため、当該「動的グラフ内関係」も、当該エッジ特徴量の経時的な変化に応じて変化していくものとなっている。 Here, the edge features (relationships in the organizational structure) that determine the "dynamic graph relationships" in (d) and (e) above are also variables that can change over a relatively long period of time. , the "relationship in the dynamic graph" also changes according to the temporal change of the edge feature amount.

なお、「動的グラフ内関係」は、当該関係における影響を与える向き及びその影響の度合いをそれぞれ、エッジの向き及びその特徴量で表現した有向エッジによって(又は当該有向エッジも含めて)規定されるものであってもよい。例えば、上記(d)のような「上司と部下の関係」の場合に、「上司」のノードから「部下」のノードへの向きと、あるエッジ特徴量とを有する有向エッジによって、「(相手のノードに対し)自らが部下である」といったような「動的グラフ内関係」を規定することも可能となる。ここで、このような「動的グラフ内関係」を規定することによって、(後に詳細に説明するが、)仮想ノードのノード特徴量算出の際、例えばある部下にとって「上司」となる仮想ノードに関する特徴量を畳み込んで、当該上司が当該部下へ与える影響を確実に取り込むことも可能となるのである。ちなみに、このような有向エッジは、1つのノードのペアに対し、異なる向きやエッジ特徴量を有するものとして複数設定されてもよい。 In addition, the "dynamic graph relationship" is defined by directed edges (or including the directed edges) that express the direction of influence in the relationship and the degree of influence by the direction of the edge and its feature value, respectively. It may be specified. For example, in the case of the "relationship between a boss and a subordinate" as in (d) above, a directed edge having a direction from the "supervisor" node to the "subordinate" node and a certain edge feature quantity can be used to generate "( It is also possible to define a "dynamic intra-graph relation" such as "I am a subordinate to the other node". Here, by prescribing such a "dynamic graph relationship", (as will be explained in detail later), when calculating the node feature values of virtual nodes, for example, By convoluting the feature quantity, it is possible to reliably capture the influence of the boss on the subordinate. Incidentally, a plurality of such directed edges may be set as having different orientations and edge feature amounts for one pair of nodes.

一方、「静的グラフ内関係」は、エッジ特徴量とはリンクしていない、「動的グラフ内関係」以外のグラフ内関係であり、例えば、静的な(時間変化しない)ノード特徴量の値に依存して設定される関係とすることができる。例えばノード特徴量を、「従業員の性別」とした場合、「静的グラフ内関係」として例えば、
(f)「静的グラフ内関係r_6」:従業員の性別(ノード特徴量の値)が「女性」(例えば"2")である関係、
(g)「静的グラフ内関係r_7」:従業員の性別(ノード特徴量の値)が「男性」(例えば"1")である関係
を設定することができる。
On the other hand, the "static relations in the graph" are relations in the graph other than the "dynamic relations in the graph" that are not linked to edge features. It can be a relationship that is set depending on the value. For example, if the node feature value is "employee's gender", the "static graph relation" is, for example,
(f) “Relationship r_6 in static graph”: A relation in which the sex of the employee (the value of the node feature value) is “female” (for example, “2”);
(g) "Relationship r_7 in static graph": A relation can be set in which the sex of the employee (the value of the node feature value) is "male" (for example, "1").

さらに「静的グラフ内関係」として、例えば「従業員間における特定のレポートや論文の共同作成者(共著者)の関係」といったものを設定することも可能である。この場合、「従業員(作成者,著者)」と「レポート,論文」といったような異なる概念のものを結びつける静的な関係が設定されている、と捉えることができる。 Furthermore, it is also possible to set, for example, a "relationship between co-creators (co-authors) of a specific report or paper among employees" as the "relationship within the static graph". In this case, it can be understood that a static relationship is set that connects different concepts such as "employee (creator, author)" and "report, paper".

図2は、本発明に係る「動的グラフ内関係」の設定の一具体例を説明するための模式図である。 FIG. 2 is a schematic diagram for explaining a specific example of the setting of the "dynamic graph relations" according to the present invention.

図2に示した関係設定例によれば、動的グラフ内関係r_p,r_q,r_r,・・・が、ノードiとノードjとを結ぶエッジのエッジ特徴量ei,jの値に依存して設定されている。具体的には、
(a)グラフ内関係r_p:エッジ特徴量ei,jの値が、a以上であってb未満の値範囲内である関係、
(b)グラフ内関係r_q:エッジ特徴量ei,jの値が、cである関係、
(c)グラフ内関係r_r:エッジ特徴量ei,jの値が、d以上であってe未満の値範囲内である関係、
・・・
が設定されている。なお当然に、図2に示した値a~eを含む数直線範囲は、エッジ特徴量ei,jの取り得る値範囲となっている。
According to the relationship setting example shown in FIG. 2, the dynamic graph relationships r_p , r_q, r_r, . is set. in particular,
(a) intra-graph relation r_p: a relation in which the value of the edge feature quantity e i,j is within a value range equal to or greater than a and less than b;
(b) intra-graph relation r_q: a relation in which the value of the edge feature quantity e i,j is c;
(c) intra-graph relation r_r: a relation in which the value of the edge feature quantity e i,j is within a value range equal to or greater than d and less than e;
・・・
is set. Of course, the number line range including the values a to e shown in FIG. 2 is the value range that the edge feature quantity e i,j can take.

ここで、各エッジにおいてエッジ特徴量ei,jの値が変化すれば、それに伴って、図2に模式的に示したグラフ構造における、動的グラフ内関係r_p,r_q,r_r,・・・の設定範囲や分布の様子も変化するのである。 Here, if the value of the edge feature quantity e i,j changes for each edge, the relationships r_p, r_q, r_r, . . . The setting range and distribution of

ちなみに、各エッジにおいてエッジ特徴量ei,jの値が時間的に変化しても、動的グラフ内関係r_p,r_q,r_r,・・・の設定範囲や分布の様子は変化しない状況、さらには、各エッジにおいてそもそもエッジ特徴量ei,jの値が変化しない状況もあり得るが、このような状況でも、動的グラフ内関係r_p,r_q,r_r,・・・は、エッジ特徴量に依存して変わり得るという意味で「動的」といえるのである。 By the way, even if the value of the edge feature quantity e i,j at each edge changes over time, the setting range and distribution state of the relations r_p, r_q, r_r, ... in the dynamic graph do not change. However, even in such a situation, the relationships r_p , r_q, r_r, . . . It can be said to be "dynamic" in the sense that it can change depending on it.

このように本実施形態において、「動的グラフ内関係」は、エッジ特徴量に係るハイパーパラメータとしての閾値によって自動的に規定される動的な関係性を表現したものとなっている。すなわち例えば、所定の知見に基づいて当該閾値を設定しさえすれば、「動的グラフ内関係」自体は、自動的に生成されてグラフ変数推定処理に組み込み可能となるのである。 As described above, in the present embodiment, the "dynamic intra-graph relation" expresses a dynamic relation automatically defined by a threshold value as a hyperparameter related to the edge feature amount. That is, for example, if the threshold value is set based on a predetermined knowledge, the "dynamic graph intra-relationship" itself can be automatically generated and incorporated into the graph variable estimation process.

図1に戻って、(上記(ア)の)グラフ特徴量抽出部10は、以上に説明したようなグラフ情報(「ノード特徴量」や「エッジ特徴量」)を入力とし、「動的グラフ内関係」を含むグラフ内関係をもって当該グラフ情報を畳み込んで仮想グラフ特徴量を生成し、自らの後段に接続された目的変数推定部11へ当該仮想グラフ特徴量を出力する。 Returning to FIG. 1, the (above (a)) graph feature amount extraction unit 10 receives graph information ("node feature amount" and "edge feature amount") as described above, and extracts "dynamic graph The virtual graph feature amount is generated by convolving the graph information with the graph intra-relationship including the "internal relation", and the virtual graph feature amount is output to the objective variable estimating unit 11 connected to its subsequent stage.

より具体的にグラフ特徴量抽出部10は、本実施形態において、推定すべきグラフ変数(目的変数)に係るグラフにおける複数のノードにそれぞれ対応する複数の仮想ノードを有する中間層が、複数連結された構成を有している。 More specifically, in the present embodiment, the graph feature amount extraction unit 10 extracts a plurality of intermediate layers each having a plurality of virtual nodes respectively corresponding to a plurality of nodes in a graph related to a graph variable to be estimated (objective variable). configuration.

ここで、中間層を示すインデックスをlとし、中間層内の仮想ノードを示すインデックスをiとして、中間層(l)内の仮想ノードiにおけるノード特徴量をhi (l)と表現する。このようにノード特徴量を表現した場合、lは0~L(Lは(中間層数-1))の整数値をとり、iは1~N(Nは1つの中間層での仮想ノード数)の整数値をとることになる。ただし、最初の中間層(0)内の仮想ノードは、推定すべきグラフ変数(目的変数)に係るグラフのノードそのものであり、ノード特徴量hi (0)は、当該グラフのノードのノード特徴量となる。なお中間層(0)は、このようなノード特徴量hi (0)(やエッジ特徴量)を、(図示していない)入力層からそのまま受け取ることとしてもよく、または、入力層そのものであってもよい。 Let l be the index indicating the intermediate layer, i be the index indicating the virtual node in the intermediate layer, and h i (l) be the node feature amount at the virtual node i in the intermediate layer ( l) . When node features are expressed in this way, l takes an integer value from 0 to L (L is (the number of intermediate layers - 1)), and i takes an integer value from 1 to N (N is the number of virtual nodes in one intermediate layer. ). However, the virtual node in the first hidden layer (0) is the node of the graph related to the graph variable (objective variable) to be estimated, and the node feature quantity h i (0) is the node feature of the node of the graph. amount. Note that the hidden layer (0) may directly receive such node features h i (0) (or edge features) from the input layer (not shown), or may be the input layer itself. may

また、「動的グラフ内関係」を含む、設定されたグラフ内関係の集合をRとし、集合Rに属するグラフ内関係をr(r∈R)とし、さらに、関係rにおいて仮想ノードiに隣接する(仮想ノードiとの間で関係rを有する)仮想ノードの集合をNi rとし、集合Ni rに属する仮想ノードを示すインデックスをj(j∈Ni r)とすると、中間層(l+1)内の仮想ノードiにおけるノード特徴量hi (l+1)は、次式
(1) hi (l+1)=σ(ΣrΣjci,r -1・Ar (l)・hj (l)+C(l)・hi (l))
をもって算出される。
In addition, let R be the set of set intra-graph relations including "dynamic intra-graph relations", let r be the intra-graph relation belonging to the set R (r∈R), and be adjacent to the virtual node i in the relation r Let N i r be a set of virtual nodes (having relationship r with virtual node i), and let j (j∈N i r ) be an index indicating a virtual node belonging to set N i r . The node feature value h i (l+1) at the virtual node i in l+1) is expressed by the following equation (1) h i (l+1) = σ(Σ r Σ j c i,r −1・A r (l)hj (l) +C (l)・h i (l) )
is calculated as

ここで上式(1)において、lは0~(L-1)の整数値をとるものとする。また、σはランプ関数(ReLU)等の活性化関数であり、Σrは集合Rにおけるr(r∈R)についての総和(summation)であり、Σjは集合Ni rにおけるノードj(j∈Ni r)についての総和(summation)である。ちなみに、関係rは、中間層によらず所与のものとして固定されている。また、ci,rは関係rにおける仮想ノードiについての正規化定数であって、関係rにおける仮想ノードiの隣接ノード数とも解釈される値となっており、固定値又は学習可能な変数として設定される。さらに、Ar (l)及びC(l)は、学習される内部パラメータ(行列)である。 Here, in the above formula (1), l takes an integer value from 0 to (L-1). Also, σ is an activation function such as a ramp function ( ReLU), Σ r is the summation of r (r∈R) in the set R, and Σ j is the node j (j ∈N i r ). Incidentally, the relationship r is fixed as given regardless of the intermediate layer. In addition, c i,r is a normalization constant for virtual node i in relation r, and is a value that can be interpreted as the number of adjacent nodes of virtual node i in relation r. set. Furthermore, A r (l) and C (l) are the learned internal parameters (matrices).

このように、中間層(l+1)の各仮想ノードiは、「動的グラフ内関係」を含むグラフ内関係の集合Rに含まれるグラフ内関係r毎に、前段の中間層(l)における当該グラフ内関係rに該当する仮想ノードjの特徴を表すノード特徴量hj (l)を畳み込んで、自身の特徴を表すノード特徴量hi (l+1)を生成している。すなわち、仮想ノードのノード特徴量を生成するにあたり、「動的グラフ内関係」を含めてグラフ内関係rを適切に取り込むことが可能となっているのである。 In this way, each virtual node i in the intermediate layer (l+1) is assigned to the intermediate layer (l) is convoluted with the node feature h j (l) representing the feature of the virtual node j corresponding to the intra-graph relation r in , to generate the node feature h i (l+1) representing its own feature. In other words, in generating the node feature amount of the virtual node, it is possible to appropriately capture the intra-graph relation r including the "dynamic intra-graph relation".

また、上式(1)によるノード特徴量生成処理とは別の実施形態として、エッジ特徴量も合せて畳み込むノード特徴量生成処理を実施することも可能である。 Further, as an embodiment different from the node feature amount generation processing according to the above equation (1), it is possible to perform node feature amount generation processing in which the edge feature amount is also convoluted.

この場合、中間層(l)内の仮想ノードiと仮想ノードj(j∈Ni r)とを結ぶ仮想エッジ(i,j)のエッジ特徴量を、ei,jと表現する。ここで、エッジ特徴量ei,jは本実施形態において、最初の中間層(0)を含め全ての中間層に関し同一の値をとるのであり、言い換えれば、当初、グラフ特徴量抽出部10に入力されたエッジ特徴量が、このエッジ特徴量ei,jとして各中間層に引き継がれていくのである。 In this case, the edge feature amount of the virtual edge (i,j) connecting the virtual node i and the virtual node j (j∈N i r ) in the intermediate layer (l) is expressed as ei ,j . Here, in this embodiment, the edge feature quantity e i,j takes the same value for all intermediate layers including the first intermediate layer (0). The input edge feature amount is handed over to each intermediate layer as this edge feature amount ei ,j .

このようなエッジ特徴量ei,jも合せて畳み込む実施形態においては、中間層(l+1)内の仮想ノードiにおけるノード特徴量hi (l+1)は、次式
(2) hi (l+1)=σ(ΣrΣjci,r -1・(Ar (l)・hj (l)+Br (l)・ei,j)+C(l)・hi (l))
をもって算出される。ここで、lは0~(L-1)の整数値をとるものとする。また、Br (l)は、Ar (l)やC(l)と同じく学習される内部パラメータ(行列)となっている。
In the embodiment in which such edge features e i,j are also convoluted, the node feature h i (l+1) at the virtual node i in the intermediate layer (l+1 ) is expressed by the following equation (2) h i (l+1) =σ(Σ r Σ j c i,r −1・(A r (l)・h j (l) +B r (l)・e i,j )+C (l)・h i (l) )
is calculated as Here, l takes an integer value from 0 to (L-1). Also, B r (l) is an internal parameter (matrix) to be learned like A r (l) and C (l) .

このように上式(2)を用いたノード特徴量生成処理においては、「動的グラフ内関係」を含むグラフ内関係の集合Rに含まれるグラフ内関係r毎に、前段の中間層(l)における当該グラフ内関係rに該当する仮想ノードiと仮想ノードjとを結ぶ、若しくは仮想ノードiから仮想ノードjへの向きも含めて両者を結ぶ仮想エッジ(i,j)のエッジ特徴量ei,j(本実施形態ではl値によらない一定のエッジ特徴量ei,j)も畳み込んで、ノード特徴量hi (l+1)が生成されるのである。すなわちこの場合においても、仮想ノードのノード特徴量を生成するにあたり、「動的グラフ内関係」を含めてグラフ内関係rを適切に取り込むことが可能となっている。 In this way, in the node feature value generation processing using the above formula (2), the intermediate layer (l ), the edge feature value e of the virtual edge (i, j) that connects the virtual node i and the virtual node j corresponding to the relation r in the graph, or connects the two including the direction from the virtual node i to the virtual node j The node feature quantity h i (l+1 ) is generated by also convolving i,j ( a constant edge feature quantity e i,j independent of the l value in this embodiment). That is, even in this case, it is possible to appropriately incorporate the intra-graph relation r including the "dynamic intra-graph relation" when generating the node feature amount of the virtual node.

またさらに、上式(2)によるノード特徴量生成処理は、関係r(r∈R)での畳み込みにおいてエッジ特徴量ei,jも加味した分だけ、推定すべきグラフ変数(目的変数)に係るグラフの特徴を、より確実に抽出する処理となっているのである。 Furthermore, the node feature value generation processing according to the above equation (2) is based on the graph variable (objective variable) to be estimated by adding the edge feature value e i,j in the convolution with the relation r (r∈R). This is a process for more reliably extracting the characteristics of such graphs.

また、上式(1)や上式(2)によるノード特徴量生成処理とはさらに異なる実施形態として、ノード特徴量は用いず、エッジ特徴量を畳み込むノード特徴量生成処理を実施することも可能である。この場合、中間層(l+1)内の仮想ノードiにおけるノード特徴量hi (l+1)は、次式
(3) hi (l+1)=σ(ΣrΣjci,r -1・Br (l)・ei,j+C(l)・hi (l))
をもって算出される。ここで、lは0~(L-1)の整数値をとるものとする。
Further, as an embodiment different from the node feature amount generation processing by the above equations (1) and (2), it is also possible to perform node feature amount generation processing by convolving the edge feature amount without using the node feature amount. is. In this case, the node feature value h i (l+1) at the virtual node i in the intermediate layer (l+1) is expressed by the following equation (3) h i (l+1) = σ(Σ r Σ j c i, r -1・B r (l)・e i,j +C (l)・h i (l) )
is calculated as Here, l takes an integer value from 0 to (L-1).

このように上式(3)を用いたノード特徴量生成処理においては、「動的グラフ内関係」を含むグラフ内関係の集合Rに含まれるグラフ内関係r毎に、前段の中間層(l)における当該グラフ内関係rに該当する仮想ノードiと仮想ノードjとを結ぶ、若しくは仮想ノードiから仮想ノードjへの向きも含めて両者を結ぶ仮想エッジ(i,j)のエッジ特徴量ei,j(本実施形態ではl値によらない一定のエッジ特徴量ei,j)を畳み込んで、ノード特徴量hi (l+1)が生成されるのである。すなわちこの場合においても、仮想ノードのノード特徴量を生成するにあたり、「動的グラフ内関係」を含めてグラフ内関係rを適切に取り込むことが可能となっている。 In this way, in the node feature value generation processing using the above formula (3), for each in-graph relation r included in the set R of in-graph relations including the "dynamic in-graph relation", the intermediate layer (l ), the edge feature value e of the virtual edge (i, j) that connects the virtual node i and the virtual node j corresponding to the relation r in the graph, or connects the two including the direction from the virtual node i to the virtual node j The node feature quantity h i (l+1 ) is generated by convolving i,j (a constant edge feature quantity e i,j independent of the l value in this embodiment). That is, even in this case, it is possible to appropriately incorporate the intra-graph relation r including the "dynamic intra-graph relation" when generating the node feature amount of the virtual node.

以上、式(1)~(3)を用いて各中間層におけるノード特徴量生成処理に係る3つの実施形態を説明したが、いずれにしても、最後の中間層(L)で算出される最終的なノード特徴量:
h1 (L),h2 (L),・・・,hN (L)
と、さらに必要であればエッジ特徴量ei,jとが、仮想グラフ特徴量として目的変数推定部11へ出力されるのである。
Three embodiments relating to the node feature generation processing in each intermediate layer have been described above using equations (1) to (3), but in any case, the final typical node features:
h 1 (L) , h 2 (L) , . . . , h N (L)
and, if necessary, the edge feature quantity e i,j are output to the objective variable estimation unit 11 as the virtual graph feature quantity.

ここで、上記の最終的なノード特徴量h1 (L),h2 (L),・・・,hN (L)は、特徴量を算出する中間層(l+l)において、その前段となる中間層(l)における仮想グラフの状態を、(動的グラフ内関係に対応する)動的なサブグループを含むサブグラフ群の各々をもって(中間層(l+l)の各仮想ノードiへ向けて)集約するといった処理を、中間層(1)から順次、積み重ねて実施した結果と捉えることができる。 Here, the final node feature values h 1 (L) , h 2 (L) , . , with each subgraph group containing dynamic subgroups (corresponding to dynamic intragraph relations) (to each virtual node i in the hidden layer (l+l) It can be regarded as the result of accumulating the process of aggregating (towards) from the middle layer (1).

また1つの例として、中間層(l+1)のノード特徴量hi (l+1)は、lが0から順次大きくなるにつれ、その次元数(特徴量ベクトル成分数)がより小さくなるように設定されてもよい。例えば入力されるノード特徴量hi (0)が100次元であるのに対し、最終的なノード特徴量hi (L)を例えば10次元に縮約することができる。このような場合においても、グラフ特徴量抽出部10は、推定すべきグラフ変数(目的変数)に係るグラフの特徴を、低次元に縮約しつつ抽出するのであるが、この縮約処理の際、特徴量集約の条件として「動的グラフ内関係」を巧みに取り入れ可能とするのである。 As another example, the node feature value h i (l+1) of the intermediate layer ( l+1) is such that the number of dimensions (the number of feature vector components) becomes smaller as l increases from 0. may be set to For example, while the input node feature quantity h i (0) has 100 dimensions, the final node feature quantity h i (L) can be reduced to 10 dimensions, for example. Even in such a case, the graph feature quantity extraction unit 10 extracts the features of the graph related to the graph variable (objective variable) to be estimated while contracting to a lower dimension. , it is possible to skillfully incorporate "dynamic graph relations" as conditions for feature aggregation.

さらに、式(1)~(3)を用いた上記の3つの実施形態のいずれにおいても、中間層(l+1)内の各仮想ノードiは、集合Rに含まれるグラフ内関係r毎に、当該グラフ内関係rについての畳み込み結果に対し、当該グラフ内関係rについて決定された又は学習された重みci,r -1(ci,rは正規化定数)を掛けて重み付けを行い、自身のノード特徴量hi (l+1)を生成している。ここで、この重みci,r -1を学習される値とすることによって、生成するノード特徴量hi (l+1)に対する(動的グラフ内関係を含む)グラフ内関係rの寄与の程度を、適切に調整することも可能となるのである。 Furthermore, in any of the above three embodiments using equations (1)-(3), each virtual node i in the hidden layer (l+1) is for each intra-graph relation r contained in the set R , weighting the convolution result for the in-graph relation r by multiplying the determined or learned weight c i,r −1 (c i,r is a normalization constant) for the in-graph relation r, It generates its own node feature h i (l+1) . Here, by setting this weight c i,r −1 as a value to be learned, the contribution of the intra-graph relation r (including the dynamic intra-graph relation) to the node feature h i (l+1) to be generated is It is also possible to adjust the degree appropriately.

例えば、エッジ特徴量として「従業員間における所定単位期間での電子メールの本数」が規定されていて、動的グラフ内関係r_1及び動的グラフ内関係r_2としてそれぞれ「当該本数が10通未満である関係」及び「当該本数が10通以上であって20通未満である関係」を設定した場合に、学習処理によって例えば、動的グラフ内関係r_1の重みci,r_1 -1が動的グラフ内関係r_2の重みci,r_2 -1よりも大きくなり、その結果、動的グラフ内関係r_1が、目的変数である休職リスクの推定により大きな影響を及ぼす、といったようなより好適なモデルを構築することも可能となるのである。 For example, "the number of e-mails between employees in a predetermined unit period" is specified as an edge feature value, and "the number of e-mails is less than 10" is defined as the relationship r_1 in the dynamic graph and the relationship r_2 in the dynamic graph. a certain relation” and “a relation whose number is 10 or more and less than 20” are set, for example, the weight c i,r_1 −1 of the relation r_1 in the dynamic graph becomes Construct a more suitable model such that the weight c i,r_2 of the internal relation r_2 becomes greater than -1 , and as a result, the dynamic graph internal relation r_1 has a greater impact on the estimation of the risk of absence from work, which is the objective variable. It is also possible to

ここで、式(1)~(3)を用いた上記の3つの実施形態の比較を行う。最初に、式(1)に係る実施形態においては、ノード特徴量hi (l+1)の算出において、エッジ特徴量ei,jは、式(1)中に明示的には存在せず、「動的グラフ内関係」による畳み込みの形で大まかな(量子化された)特徴として取り込まれている。その結果、特徴量抽出処理の負担が低減し、さらに構築されたグラフ変数推定モデル1のオーバーフィッティングも、抑制又は回避可能となるのである。 A comparison of the above three embodiments using equations (1)-(3) will now be made. First, in the embodiment according to Equation (1), in calculating the node feature quantity h i (l+1) , the edge feature quantity e i,j does not explicitly exist in Equation (1). , are captured as rough (quantized) features in the form of convolutions with “dynamic intra-graph relations”. As a result, the burden of feature quantity extraction processing is reduced, and overfitting of the constructed graph variable estimation model 1 can be suppressed or avoided.

これに対し、式(2)に係る実施形態、及び式(3)に係る実施形態においては、ノード特徴量hi (l+1)の算出において、エッジ特徴量ei,jは式(2)及び(3)中に明示的に存在している。その結果、エッジ特徴量ei,jは、「動的グラフ内関係」による畳み込みの形で大まかな(量子化された)特徴として取り込まれる一方で、自らの生の値をもって、抽出される特徴の調整も行っていると捉えることができる。その結果、グラフ特徴量抽出部10においてより好適な特徴量を抽出することも可能となり、最終的にグラフ変数の推定精度が向上することも期されるのである。 On the other hand, in the embodiment according to the formula (2) and the embodiment according to the formula (3), in calculating the node feature amount h i (l+1) , the edge feature amount e i,j is calculated by the formula (2 ) and (3). As a result, the edge features e i,j are captured as rough (quantized) features in the form of convolution with the "dynamic intra-graph relations", while their raw values are taken as the extracted features It can be understood that the adjustment of As a result, it is possible to extract more suitable feature amounts in the graph feature amount extracting unit 10, and it is expected that the accuracy of estimating the graph variables will eventually be improved.

同じく図1において、(上記(イ)の)目的変数推定部11は、グラフ特徴量抽出部10から仮想グラフ特徴量を受け取り、グラフ変数(目的変数)を推定する。すなわち、グラフ特徴量抽出部10で生成された仮想グラフ特徴量を入力として、推定値としてのグラフ変数(目的変数)に係る値を出力する。 Similarly, in FIG. 1, the objective variable estimator 11 (above (b)) receives the virtual graph feature quantity from the graph feature quantity extractor 10 and estimates a graph variable (objective variable). That is, the virtual graph feature amount generated by the graph feature amount extraction unit 10 is input, and a value related to the graph variable (objective variable) as an estimated value is output.

具体的に目的変数推定部11は、例えば会社Aの各従業員における将来の休職リスクを推定するケースにおいて、例えばニューラルネットワークの全結合層で構成されており、出力層を構成する各ニューロンの出力値が、各従業員における休職リスク値(例えば0~1の間の値)となるように設定されていてもよい。 Specifically, in the case of estimating the future risk of absence from work for each employee of Company A, for example, the objective variable estimation unit 11 is composed of, for example, a fully connected layer of a neural network, and the output of each neuron constituting the output layer The value may be set to be the absence risk value for each employee (eg, a value between 0 and 1).

ここで当然ではあるが、目的変数推定部11で推定される目的変数(グラフ変数)は、上記のケースにおける各従業員の休職リスク値のように、ノード単位の指標に係る変数に限定されるものではない。実際、グラフ情報(ノード特徴量やエッジ特徴量)を入力とするグラフ変数推定モデル1において推定可能な目的変数は、
(a)ノードに係る又はノード単位の指標:例えば、従業員の休職リスクや、SNS(Social Networking Service)ユーザのクリック率・コンバージョン率等、
(b)エッジに係る又はエッジ単位の指標:例えば、(各ウェブページをノードとするケースにおける)ウェブページ間の遷移確率や、(交差点や基点をノードとするケースにおける)エッジとしての道路の交通量等、
(c)グラフに係る又はグラフ単位の指標:例えば、会社全体の活性度指標や、(互いに結合している原子・分子・基等をノードとするケースにおける)生成化合物の特性等、
(d)グラフ内に形成される(当該グラフの一部としての)サブグラフに係る又はサブグラフ単位の指標:例えば、会社内の事業部毎の活性度指標等
との4つの種別に分類され、いずれの種別の目的変数も、推定対象として採用可能となっている。
As a matter of course, the objective variables (graph variables) estimated by the objective variable estimation unit 11 are limited to variables related to indicators for each node, such as the risk value of leave of absence for each employee in the above case. not a thing In fact, the target variable that can be estimated in the graph variable estimation model 1 that inputs graph information (node feature amount and edge feature amount) is
(a) Node-related or node-based indicators: For example, employee leave risk, SNS (Social Networking Service) user click rate/conversion rate, etc.
(b) Edge-related or per-edge metrics: e.g., transition probability between web pages (in the case where each web page is a node) or road traffic as an edge (in the case where an intersection or base point is a node) quantity, etc.
(c) Indicators related to graphs or graph units: For example, the activity index of the entire company, the characteristics of the product compound (in the case where atoms, molecules, groups, etc. that are bonded to each other are nodes), etc.
(d) Indicators related to sub-graphs (as a part of the graph) formed in the graph or for each sub-graph The objective variable of the type can also be adopted as an estimation target.

またいずれにしても、目的変数推定部11は、実行すべきタスク、すなわち推定すべき目的変数の態様に応じ、例えば公知の様々な機械学習アルゴリズムをもって構成可能なモデル部分となっているのである。 In any case, the objective variable estimator 11 is a model part that can be configured with various known machine learning algorithms, for example, according to the task to be executed, that is, the aspect of the objective variable to be estimated.

さらにこの場合、所定のグラフ(例えば会社Aを表現するグラフ)について構築された1つのグラフ特徴量抽出部10に対し、当該グラフについての推定すべき目的変数に応じ、当該目的変数推定用の目的変数推定部11を接続してグラフ変数推定モデル1を構成することも可能である。例えば、当該グラフに関して汎用の(共通仕様の)グラフ特徴量抽出部10を準備しておけば、目的変数推定部11のラインアップの中から、推定すべき目的変数用の目的変数推定部11を選択して、グラフ変数推定モデル1を簡便に構築することも可能となるのである。この場合、グラフ特徴量抽出部10は、モデル構成の共通部分として高い汎用性を有するモデルモジュールとして機能するのである。 Furthermore, in this case, for one graph feature amount extraction unit 10 constructed for a predetermined graph (for example, a graph expressing company A), according to the objective variable to be estimated for the graph, the objective variable for estimating the objective variable It is also possible to configure the graph variable estimation model 1 by connecting the variable estimation unit 11 . For example, if a general-purpose (common specification) graph feature quantity extraction unit 10 is prepared for the graph, the objective variable estimation unit 11 for the objective variable to be estimated can be selected from the lineup of objective variable estimation units 11. It is also possible to select and construct the graph variable estimation model 1 simply. In this case, the graph feature quantity extraction unit 10 functions as a highly versatile model module as a common part of the model configuration.

次に同じく図1を用いて、以上に説明したようなグラフ変数推定モデル1を搭載し、入力されたグラフ情報から、当該グラフ情報に係るグラフについての所定の目的変数を推定する(推定値としての当該目的変数に係る値を出力する)グラフ変数推定装置2について説明する。 Next, similarly using FIG. 1, the graph variable estimation model 1 described above is installed, and from the input graph information, a predetermined target variable for the graph related to the graph information is estimated (as an estimated value ) will be described.

グラフ変数推定装置2は、入力部21と、学習部22と、グラフ変数推定部23と、出力部24とを備えており、このうち学習部22及びグラフ変数推定部23は、本発明によるグラフ変数推定プログラムの一実施形態を保存したプロセッサ・メモリの機能と捉えることができる。またこのことから、グラフ変数推定装置2は、グラフ変数推定の専用装置であってもよいが、本発明によるグラフ変数推定プログラムを搭載した、例えばクラウドサーバ、非クラウドのサーバ装置、パーソナル・コンピュータ(PC)、ノート型若しくはタブレット型コンピュータ、又はスマートフォン等とすることも可能である。 The graph variable estimating device 2 includes an input unit 21, a learning unit 22, a graph variable estimating unit 23, and an output unit 24. The learning unit 22 and the graph variable estimating unit 23 are configured to generate graphs according to the present invention. One can think of it as a function of a processor memory that stores an embodiment of a variable estimation program. Further, from this, the graph variable estimation device 2 may be a dedicated device for graph variable estimation, but it may be a cloud server, a non-cloud server device, a personal computer (for example, a cloud server, a non-cloud server device, a personal computer ( PC), a notebook or tablet computer, or a smart phone.

同じく図1において、グラフ変数推定装置2の入力部21は、通信機能を備えていて、例えば外部に設置されたサーバ(例えば社内の勤怠管理サーバ)のデータベースから、目的変数(例えば休職リスク)情報に係る正解ラベル(例えば休職の有無)の付されたグラフ情報(ノード特徴量やエッジ特徴量)を受信し、所定のデータ形式に変換した上で、学習部22に保存させる。また、入力部21は、例えばオペレータによって入力された、動的グラフ内関係を含むグラフ内関係の設定情報(例えば各動的グラフ内関係を規定する閾値の情報)も受け取り、学習部22へ出力する。 Similarly, in FIG. 1, the input unit 21 of the graph variable estimation device 2 has a communication function, for example, from a database of an externally installed server (for example, an in-house attendance management server), objective variable (for example, leave of absence risk) information Graph information (node feature amount and edge feature amount) with a correct label (for example, presence or absence of leave of absence) is received, converted into a predetermined data format, and stored in the learning unit 22 . The input unit 21 also receives, for example, the setting information of the intra-graph relations including the dynamic intra-graph relations input by the operator (for example, threshold information defining each dynamic intra-graph relation), and outputs it to the learning unit 22. do.

学習部22は、
(a)受け取ったグラフ内関係の設定情報とエッジ特徴量とに基づいて、動的グラフ内関係を含むグラフ内関係を設定し、
(b)設定したグラフ内関係に基づき、自ら保存している正解ラベルの付されたグラフ情報群を用いて、グラフ変数推定モデル1を学習によって構築し、グラフ変数推定部23へ出力する。
The learning unit 22
(a) setting an intra-graph relationship including a dynamic intra-graph relationship based on the received intra-graph relationship setting information and the edge feature;
(b) Based on the set intra-graph relations, the graph variable estimation model 1 is constructed by learning using the self-stored graph information group labeled with the correct answer, and output to the graph variable estimation unit 23 .

グラフ変数推定部23は、入力部21より受け取った、推定すべき目的変数(例えば休職リスク)に係るグラフ(例えば会社A)のグラフ情報(ノード特徴量やエッジ特徴量)を、学習部22から受け取った学習済みのグラフ変数推定モデル1へ入力し、その出力として、所望の目的変数の推定値(例えば各従業員の休職リスクに係る値)を取得して、出力部24へ出力する。 The graph variable estimation unit 23 receives from the input unit 21 the graph information (node feature amount and edge feature amount) of the graph (for example, company A) related to the objective variable to be estimated (for example, risk of absence from work), from the learning unit 22. It is input to the received learned graph variable estimation model 1, and as its output, an estimated value of a desired objective variable (for example, a value related to the risk of absence from work of each employee) is acquired and output to the output unit 24.

出力部24は、受け取った目的変数推定値に係る情報を例えば、ディスプレイに表示させたり、(通信機能を備えている場合に)外部の情報処理装置に送信したりすることができる。ここで、表示・送信される目的変数推定値に係る情報は、例えば「従業員αについて、来年度休職するリスクは**%と低く、要サポートレベルを大きく下回っている」旨の情報となる。 The output unit 24 can, for example, display information related to the received objective variable estimated value on a display, or transmit the information to an external information processing device (if it has a communication function). Here, the information related to the objective variable estimated value to be displayed/transmitted is, for example, information to the effect that "the risk of taking a leave of absence in the next fiscal year for employee α is as low as **%, which is significantly below the support required level".

以上詳細に説明したように、本発明によるグラフ変数推定モデルは、動的グラフ内関係を含むグラフ内関係をより確実に取り込むことにより、目的変数としてのグラフ変数をより高い精度で推定することができる。 As described in detail above, the graph variable estimation model according to the present invention can more accurately estimate graph variables as objective variables by more reliably capturing intra-graph relationships including dynamic intra-graph relationships. can.

ここで、動的グラフ内関係はいわば、ノード間の関係性を表現したエッジ特徴量を離散化・量子化して、畳み込み処理を可能にしたものであり、このような工夫によって、例えば上述したような会社の従業員の休職リスクを推定するケースにおいては、会社における上司、同僚や部下といった労務人事的知見とともに、これらの仕事上の各関係におけるコミュニケーションの度合い・頻度といったような、職場の活性化度や働き易さに関係する可変的な情報をも、休職リスク推定に取り込むことができるのである。 Here, the relationship in the dynamic graph is, so to speak, the discretization and quantization of the edge feature value expressing the relationship between nodes to enable convolution processing. In the case of estimating the risk of absence from work for employees of a large company, in addition to labor and personnel knowledge such as superiors, colleagues, and subordinates in the company, the degree and frequency of communication in each of these work relationships, such as the activation of the workplace. It is possible to incorporate variable information related to the degree and ease of work into the risk estimation for absence from work.

また、本発明は特に、現在盛んに研究開発の進められているGNNの技術において、グラフに内在する上述したような動的グラフ内関係を、推定処理に取り込み可能とする手法を提示するものであり、グラフに係る目的変数の推定精度を向上させるだけでなく、その適用分野の拡大にも貢献するものと考えられる。 In particular, the present invention presents a method of incorporating the above-described dynamic graph relations inherent in the graph into the estimation process in the GNN technology, which is currently being actively researched and developed. It is believed that this method not only improves the accuracy of estimating objective variables related to graphs, but also contributes to the expansion of its application fields.

前述した本発明の種々の実施形態について、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。 For the various embodiments of the present invention described above, various changes, modifications and omissions within the spirit and scope of the present invention can be easily made by those skilled in the art. The foregoing description is exemplary only and is not intended to be limiting. The invention is to be limited only as limited by the claims and the equivalents thereof.

1 グラフ変数推定モデル
10 グラフ特徴量抽出部
11 目的変数推定部
2 グラフ変数推定装置
21 入力部
22 学習部
23 グラフ変数推定部
24 出力部
1 graph variable estimation model 10 graph feature amount extraction unit 11 objective variable estimation unit 2 graph variable estimation device 21 input unit 22 learning unit 23 graph variable estimation unit 24 output unit

Claims (9)

グラフに係るグラフ情報を入力とし、当該グラフのノードに対応する仮想ノードを有する複数の中間層において当該グラフ情報を畳み込み、当該グラフについての目的変数を推定するグラフ変数推定モデルであって、
当該グラフにおけるエッジの特徴を表すエッジ特徴量のとる値についての少なくとも1つの値範囲のそれぞれに対応して、少なくとも1つのグラフ内関係が設定されており、
当該中間層の各仮想ノードは、前記少なくとも1つのグラフ内関係を含むグラフ内関係の集合に含まれるグラフ内関係毎に、前段の中間層における当該グラフ内関係に該当する仮想ノードの特徴を表すノード特徴量と、前段の中間層における当該グラフ内関係に該当する仮想ノードを結ぶ仮想エッジの特徴を表すエッジ特徴量とを畳み込んで、自身の特徴を表すノード特徴量を生成する
ことを特徴とするグラフ変数推定モデル。
A graph variable estimation model that receives graph information related to a graph as an input, convolves the graph information in a plurality of intermediate layers having virtual nodes corresponding to the nodes of the graph, and estimates an objective variable for the graph,
at least one intra-graph relationship is set corresponding to each of at least one value range of values taken by edge feature quantities representing edge features in the graph;
Each virtual node in the intermediate layer represents a feature of a virtual node corresponding to the intra-graph relationship in the preceding intermediate layer for each intra-graph relationship included in a set of intra-graph relationships including the at least one intra-graph relationship. Convoluting the node feature amount and the edge feature amount representing the feature of the virtual edge connecting the virtual nodes corresponding to the intra-graph relation in the intermediate layer in the previous stage to generate the node feature amount representing the feature of itself Graph variable estimation model for .
グラフに係るグラフ情報を入力とし、当該グラフのノードに対応する仮想ノードを有する複数の中間層において当該グラフ情報を畳み込み、当該グラフについての目的変数を推定するグラフ変数推定モデルであって、
当該グラフにおけるエッジの特徴を表すエッジ特徴量のとる値についての少なくとも1つの値範囲のそれぞれに対応して、少なくとも1つのグラフ内関係が設定されており、
当該中間層の各仮想ノードは、前記少なくとも1つのグラフ内関係を含むグラフ内関係の集合に含まれるグラフ内関係毎に、前段の中間層における当該グラフ内関係に該当する仮想ノードの特徴を表すノード特徴量を畳み込んで、自身の特徴を表すノード特徴量を生成し、
当該グラフは、互いにコミュニケーションを行い得るノードとしての複数のコミュニケーション主体を含むグループを表現したものであり、当該グループには、当該コミュニケーションの状況によって決定される、当該グラフ内関係としての動的なサブグループが形成され、当該目的変数は、当該コミュニケーション主体が当該サブグループに属するか否かに影響され得る事象に係る値をとる変数である
ことを特徴とするグラフ変数推定モデル。
A graph variable estimation model that receives graph information related to a graph as an input, convolves the graph information in a plurality of intermediate layers having virtual nodes corresponding to the nodes of the graph, and estimates an objective variable for the graph,
at least one intra-graph relationship is set corresponding to each of at least one value range of values taken by edge feature quantities representing edge features in the graph;
Each virtual node in the intermediate layer represents a feature of a virtual node corresponding to the intra-graph relationship in the preceding intermediate layer for each intra-graph relationship included in a set of intra-graph relationships including the at least one intra-graph relationship. Convolve the node features to generate node features that represent their own features,
The graph expresses a group including a plurality of communication subjects as nodes that can communicate with each other. A group is formed, and the target variable is a variable that takes a value related to an event that can be affected by whether or not the communication subject belongs to the subgroup.
A graph variable estimation model characterized by:
当該中間層の各仮想ノードは、当該集合に含まれるグラフ内関係毎に、当該グラフ内関係についての畳み込み結果に対し、当該グラフ内関係について決定された又は学習された重みを付与して、自身の特徴を表すノード特徴量を生成することを特徴とする請求項1又は2に記載のグラフ変数推定モデル。 Each virtual node of the intermediate layer assigns a determined or learned weight to the convolution result of the in-graph relation for each in-graph relation included in the set, 3. The graph variable estimation model according to claim 1 or 2, wherein a node feature quantity representing the feature of is generated. 前記複数の中間層の最後段からの出力を受け取り、当該グラフについて推定される当該目的変数に係る値を出力する目的変数推定層を更に有することを特徴とする請求項1から3のいずれか1項に記載のグラフ変数推定モデル。 4. The method according to any one of claims 1 to 3, further comprising an objective variable estimation layer that receives an output from the last stage of the plurality of intermediate layers and outputs a value related to the objective variable estimated for the graph. Graph variable estimation model described in section. 当該目的変数は、当該グラフのノードに係る目的変数、当該グラフのエッジに係る目的変数、及び当該グラフの全体又は一部に係る目的変数のうちの少なくとも1つであることを特徴とする請求項1から4のいずれか1項に記載のグラフ変数推定モデル。 The objective variable is at least one of an objective variable associated with a node of the graph, an objective variable associated with an edge of the graph, and an objective variable associated with the whole or part of the graph. 5. The graph variable estimation model according to any one of 1 to 4. グラフに係るグラフ情報を入力とし、当該グラフのノードに対応する仮想ノードを有する複数の中間層において、当該グラフ情報を畳み込み、当該グラフについての目的変数を推定するグラフ変数推定モデルであって、
当該グラフにおけるエッジの特徴を表すエッジ特徴量のとる値についての少なくとも1つの値範囲のそれぞれに対応して、少なくとも1つのグラフ内関係が設定されており、
当該中間層の各仮想ノードは、前記少なくとも1つのグラフ内関係を含むグラフ内関係の集合に含まれるグラフ内関係毎に、前段の中間層における当該グラフ内関係に該当する仮想ノードを結ぶ仮想エッジの特徴を表すエッジ特徴量を畳み込んで、自身の特徴を表すノード特徴量を生成する
ことを特徴とするグラフ変数推定モデル。
A graph variable estimation model that receives graph information related to a graph as an input, convolves the graph information in a plurality of intermediate layers having virtual nodes corresponding to the nodes of the graph, and estimates an objective variable for the graph,
at least one intra-graph relationship is set corresponding to each of at least one value range of values taken by edge feature quantities representing edge features in the graph;
Each virtual node in the intermediate layer is a virtual edge connecting virtual nodes corresponding to the intra-graph relationship in the preceding intermediate layer for each intra-graph relationship included in a set of intra-graph relationships including the at least one intra-graph relationship. A graph variable estimation model characterized by convolving an edge feature representing a feature of to generate a node feature representing its own feature.
請求項1からのいずれか1項に記載されたグラフ変数推定モデルを用いて、入力されたグラフ情報から、当該グラフ情報に係るグラフについて推定される目的変数に係る情報を出力することを特徴とするグラフ変数推定装置。 The graph variable estimation model according to any one of claims 1 to 6 is used to output, from input graph information, information on objective variables estimated for graphs related to the graph information. Graph variable estimator for . グラフに係るグラフ情報を入力とし、当該グラフのノードに対応する仮想ノードを有する複数の中間層において当該グラフ情報を畳み込み、当該グラフについての目的変数を推定するグラフ変数推定モデルを用いた、コンピュータによって実施されるグラフ変数推定方法であって、
当該グラフにおけるエッジの特徴を表すエッジ特徴量のとる値についての少なくとも1つの値範囲のそれぞれに対応して、少なくとも1つのグラフ内関係を設定するステップと、
当該中間層の各仮想ノードにおいて、前記少なくとも1つのグラフ内関係を含むグラフ内関係の集合に含まれるグラフ内関係毎に、前段の中間層における当該グラフ内関係に該当する仮想ノードの特徴を表すノード特徴量と、前段の中間層における当該グラフ内関係に該当する仮想ノードを結ぶ仮想エッジの特徴を表すエッジ特徴量とを畳み込み、当該各仮想ノードの特徴を表すノード特徴量を生成するステップと
を有することを特徴とするグラフ変数推定方法。
By a computer using a graph variable estimation model that inputs graph information related to a graph, convolves the graph information in a plurality of intermediate layers having virtual nodes corresponding to the nodes of the graph, and estimates objective variables for the graph A graph variable estimation method implemented comprising:
setting at least one intra-graph relation corresponding to each of at least one value range of values taken by edge feature quantities representing features of edges in the graph;
In each virtual node of the intermediate layer, for each intra-graph relation included in a set of intra-graph relations including the at least one intra-graph relation, characteristics of the virtual node corresponding to the intra-graph relation in the previous intermediate layer are determined. A step of convolving the node feature value representing the node feature value and the edge feature value representing the feature of the virtual edge connecting the virtual nodes corresponding to the intra-graph relation in the intermediate layer in the previous stage to generate the node feature value representing the feature of each of the virtual nodes. A graph variable estimation method characterized by comprising:
グラフに係るグラフ情報を入力とし、当該グラフのノードに対応する仮想ノードを有する複数の中間層において当該グラフ情報を畳み込み、当該グラフについての目的変数を推定するグラフ変数推定モデルを用いた、コンピュータによって実施されるグラフ変数推定方法であって、
当該グラフにおけるエッジの特徴を表すエッジ特徴量のとる値についての少なくとも1つの値範囲のそれぞれに対応して、少なくとも1つのグラフ内関係を設定するステップと、
当該中間層の各仮想ノードにおいて、前記少なくとも1つのグラフ内関係を含むグラフ内関係の集合に含まれるグラフ内関係毎に、前段の中間層における当該グラフ内関係に該当する仮想ノードについて、当該仮想ノードの特徴を表すノード特徴量を畳み込み、当該各仮想ノードの特徴を表すノード特徴量を生成するステップと
を有し、
当該グラフは、互いにコミュニケーションを行い得るノードとしての複数のコミュニケーション主体を含むグループを表現したものであり、当該グループには、当該コミュニケーションの状況によって決定される、当該グラフ内関係としての動的なサブグループが形成され、当該目的変数は、当該コミュニケーション主体が当該サブグループに属するか否かに影響され得る事象に係る値をとる変数である
とを特徴とするグラフ変数推定方法。
By a computer using a graph variable estimation model that inputs graph information related to a graph, convolves the graph information in a plurality of intermediate layers having virtual nodes corresponding to the nodes of the graph, and estimates objective variables for the graph A graph variable estimation method implemented comprising:
setting at least one intra-graph relationship corresponding to each of at least one value range of values taken by edge feature quantities representing features of edges in the graph;
In each virtual node of the intermediate layer, for each in-graph relation included in a set of in-graph relations including the at least one in-graph relation, for a virtual node corresponding to the in-graph relation in the preceding intermediate layer, the virtual convolving the node feature representing the feature of the node to generate a node feature representing the feature of each virtual node ;
The graph expresses a group including a plurality of communication subjects as nodes that can communicate with each other. A group is formed, and the target variable is a variable that takes a value related to an event that can be affected by whether or not the communication subject belongs to the subgroup.
A graph variable estimation method characterized by :
JP2020055994A 2020-03-26 2020-03-26 Graph variable estimation model, apparatus and method for convolution with edge feature dependent intra-graph relations Active JP7282052B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020055994A JP7282052B2 (en) 2020-03-26 2020-03-26 Graph variable estimation model, apparatus and method for convolution with edge feature dependent intra-graph relations

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020055994A JP7282052B2 (en) 2020-03-26 2020-03-26 Graph variable estimation model, apparatus and method for convolution with edge feature dependent intra-graph relations

Publications (2)

Publication Number Publication Date
JP2021157395A JP2021157395A (en) 2021-10-07
JP7282052B2 true JP7282052B2 (en) 2023-05-26

Family

ID=77919702

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020055994A Active JP7282052B2 (en) 2020-03-26 2020-03-26 Graph variable estimation model, apparatus and method for convolution with edge feature dependent intra-graph relations

Country Status (1)

Country Link
JP (1) JP7282052B2 (en)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021140552A (en) 2020-03-06 2021-09-16 Kddi株式会社 Explanation variable estimation method, program, and device using model additional portion

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021140552A (en) 2020-03-06 2021-09-16 Kddi株式会社 Explanation variable estimation method, program, and device using model additional portion

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
加藤暢之 ほか,所在地情報とGraph Convolutionによる賃貸物件価格推定の一手法,第12回データ工学と情報マネジメントに関するフォーラム,日本,データ工学研究専門委員会 日本データベース学会 データベースシステム研究会,2020年03月02日,[retrieved on 2022.11.29], Retrieved from the Internet: <URL: https://proceedings-of-deim.github.io/DEIM2020/papers/J2-1.pdf>

Also Published As

Publication number Publication date
JP2021157395A (en) 2021-10-07

Similar Documents

Publication Publication Date Title
Schumann et al. We need fairness and explainability in algorithmic hiring
US11521221B2 (en) Predictive modeling with entity representations computed from neural network models simultaneously trained on multiple tasks
Claveria et al. Combination forecasts of tourism demand with machine learning models
Li et al. A new methodology to support group decision-making for IoT-based emergency response systems
CA3134043A1 (en) Systems and methods for model fairness
US20180268318A1 (en) Training classification algorithms to predict end-user behavior based on historical conversation data
US20200034776A1 (en) Managing skills as clusters using machine learning and domain knowledge expert
US20060116920A1 (en) Methods and systems for forecasting with model-based PDF estimates
CN110020877B (en) Click rate prediction method, click rate determination method and server
JP2019079302A (en) Sales activity support system, sales activity support method and sales activity support program
Sharma et al. Preserving patient privacy while training a predictive model of in-hospital mortality
US20210342691A1 (en) System and method for neural time series preprocessing
Mulesa et al. Optimal alternative selection models in a multi-stage decision-making process
CN115249081A (en) Object type prediction method and device, computer equipment and storage medium
Deng et al. Prediction of vehicle-cargo matching probability based on dynamic Bayesian network
Zhu et al. A DEALG methodology for prediction of effective customers of internet financial loan products
Linares-Mustaros et al. Processing extreme values in sales forecasting
Prabowo et al. Continually learning out-of-distribution spatiotemporal data for robust energy forecasting
Soto-Ferrari et al. AGGFORCLUS: A hybrid methodology integrating forecasting with clustering to assess mitigation plans and contagion risk in pandemic outbreaks: the COVID-19 Case Study
Santin On the approximation of production functions: a comparison of artificial neural networks frontiers and efficiency techniques
WO2021186338A1 (en) System and method for determining solution for problem in organization
JP6468653B2 (en) Prediction model construction device
CN110717537B (en) Method and device for training user classification model and executing user classification prediction
JP7282052B2 (en) Graph variable estimation model, apparatus and method for convolution with edge feature dependent intra-graph relations
Almomani et al. Selecting a good stochastic system for the large number of alternatives

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220118

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221026

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221202

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230124

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230510

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230516

R150 Certificate of patent or registration of utility model

Ref document number: 7282052

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150