WO2023166565A1 - Estimation device - Google Patents

Estimation device Download PDF

Info

Publication number
WO2023166565A1
WO2023166565A1 PCT/JP2022/008618 JP2022008618W WO2023166565A1 WO 2023166565 A1 WO2023166565 A1 WO 2023166565A1 JP 2022008618 W JP2022008618 W JP 2022008618W WO 2023166565 A1 WO2023166565 A1 WO 2023166565A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
weight
marginal distribution
unit
conditional
Prior art date
Application number
PCT/JP2022/008618
Other languages
French (fr)
Japanese (ja)
Inventor
邦大 伊東
Original Assignee
日本電気株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気株式会社 filed Critical 日本電気株式会社
Priority to PCT/JP2022/008618 priority Critical patent/WO2023166565A1/en
Publication of WO2023166565A1 publication Critical patent/WO2023166565A1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Abstract

An estimation device 400 includes: a weight calculation unit 421 that calculates a predetermined weight on the basis of information indicating a candidate of an unknown attribute and information regarding known attributes; a conditional-marginal-distribution calculation unit 422 that calculates, on the basis of the information in a decision tree, a value corresponding to the conditional marginal distribution of the unknown attribute under the condition that the values of some attributes are known; and an estimation unit 423 that estimates the value of the unknown attribute on the basis of the weight calculated by the weight calculation unit 421 and the value corresponding to the conditional marginal distribution calculated by the conditional-marginal-distribution calculation unit 422.

Description

推定装置estimation device
 本発明は、推定装置、推定方法、記録媒体に関する。 The present invention relates to an estimation device, an estimation method, and a recording medium.
 機会学習などを用いて学習された学習モデルのリスク評価などを目的として、学習モデルからの出力に基づいて学習時に用いられたデータを推定する技術が知られている。 A known technique is to estimate the data used during learning based on the output from a learning model for the purpose of risk assessment of a learning model learned using machine learning.
 例えば、非特許文献1には、標的データの既知属性と真のラベルを入力として、所定の処理を実行することで尤もらしい属性値を出力する方法が記載されている。例えば、非特許文献1によると、推定対象の未知属性をある値で固定して、決定木の出力する推定ラベルを計算する。その後、仮定したエラー関数を用いて真のラベルと推定ラベルの間のずれを算出し、算出したずれを重みとして周辺確率を評価する。非特許文献1によると、例えば、上記のような処理の結果として、尤もらしい属性値を特定する。 For example, Non-Patent Document 1 describes a method of outputting a plausible attribute value by executing a predetermined process with known attributes and true labels of target data as inputs. For example, according to Non-Patent Document 1, an estimated label to be output from a decision tree is calculated by fixing an unknown attribute to be estimated at a certain value. After that, the error function assumed is used to calculate the deviation between the true label and the estimated label, and the marginal probability is evaluated using the calculated deviation as a weight. According to Non-Patent Document 1, for example, a plausible attribute value is specified as a result of the above processing.
 また、関連する文献として、非特許文献2がある。非特許文献2では、エラー関数を用いてずれを算出する代わりに、決定木の訓練データのうち標的データと同じ分割領域に割り当てられる比率を計算して、計算した比率を重みとして周辺確率を評価している。 In addition, there is Non-Patent Document 2 as a related document. In Non-Patent Document 2, instead of calculating the deviation using the error function, the ratio of the decision tree training data assigned to the same divided region as the target data is calculated, and the calculated ratio is used as a weight to evaluate the marginal probability. are doing.
 また、機械学習について記載された文献として、例えば、特許文献1のようなものがある。例えば、特許文献1には、取得されたデータを学習済み機械学習モデルに与えて、学習済み機械学習モデルで所定の推論を実行させ、その結果として、データに対する推論結果を取得することが記載されている。 Also, as a document describing machine learning, there is, for example, Patent Document 1. For example, Patent Document 1 describes giving acquired data to a trained machine learning model, causing the trained machine learning model to perform predetermined inference, and as a result, obtaining an inference result for the data. ing.
国際公開2021/014878号公報International Publication No. 2021/014878
 非特許文献1や非特許文献2に記載の技術の場合、周辺確率として条件なしの、つまり、平均の周辺確率を使っている。そのため、必ずしも推定対象に対する正確な周辺分布を表しているとはいえず、その結果として、的確にデータを推定できないおそれがある、という課題が生じていた。 In the case of the techniques described in Non-Patent Document 1 and Non-Patent Document 2, unconditional, that is, average marginal probabilities are used as marginal probabilities. Therefore, it cannot necessarily be said that it represents an accurate marginal distribution for an estimation target, and as a result, there is a possibility that the data cannot be accurately estimated.
 そこで、本発明の目的は、上述した課題を解決することが可能な推定装置、推定方法、記録媒体を提供することにある。 Therefore, an object of the present invention is to provide an estimating device, an estimating method, and a recording medium that can solve the above-described problems.
 かかる目的を達成するため本開示の一形態である推定装置は、
 未知の属性候補を示す情報と既知の属性についての情報とに基づいて所定の重みを算出する重み算出部と、
 決定木の情報に基づいて、一部の属性の値が既知である条件下における未知属性の条件付周辺分布に応じた値を算出する条件付周辺分布算出部と、
 前記重み算出部が算出した前記重みと、前記条件付周辺分布算出部が算出した前記条件付周辺分布に応じた値と、に基づいて、未知の属性の値を推定する推定部と、
 を有する
 という構成をとる。
In order to achieve such an object, the estimating device, which is one aspect of the present disclosure,
a weight calculator that calculates a predetermined weight based on information indicating unknown attribute candidates and information about known attributes;
a conditional marginal distribution calculation unit that calculates a value according to the conditional marginal distribution of unknown attributes under the condition that the values of some attributes are known, based on the decision tree information;
an estimating unit for estimating a value of an unknown attribute based on the weight calculated by the weight calculating unit and a value corresponding to the conditional marginal distribution calculated by the conditional marginal distribution calculating unit;
It has a configuration of
 また、本開示の他の形態である推定方法は、
 情報処理装置が、
 未知の属性候補を示す情報と既知の属性についての情報とに基づいて所定の重みを算出し、
 決定木の情報に基づいて、一部の属性の値が既知である条件下における未知属性の条件付周辺分布に応じた値を算出し、
 算出した前記重みと、算出した前記条件付周辺分布に応じた値と、に基づいて、未知の属性の値を推定する
 という構成をとる。
In addition, an estimation method, which is another form of the present disclosure,
The information processing device
calculating a predetermined weight based on information indicating unknown attribute candidates and information about known attributes;
Based on the information of the decision tree, calculate the value according to the conditional marginal distribution of the unknown attribute under the condition that the value of some attribute is known,
A value of an unknown attribute is estimated based on the calculated weight and the calculated value according to the conditional marginal distribution.
 また、本開示の他の形態である記録媒体は、
 情報処理装置に、
 未知の属性候補を示す情報と既知の属性についての情報とに基づいて所定の重みを算出し、
 決定木の情報に基づいて、一部の属性の値が既知である条件下における未知属性の条件付周辺分布に応じた値を算出し、
 算出した前記重みと、算出した前記条件付周辺分布に応じた値と、に基づいて、未知の属性の値を推定する
 処理を実現するためのプログラムを記録した、コンピュータが読み取り可能な記録媒体である。
In addition, a recording medium that is another aspect of the present disclosure includes:
information processing equipment,
calculating a predetermined weight based on information indicating unknown attribute candidates and information about known attributes;
Based on the information of the decision tree, calculate the value according to the conditional marginal distribution of the unknown attribute under the condition that the value of some attribute is known,
A computer-readable recording medium recording a program for realizing a process of estimating the value of an unknown attribute based on the calculated weight and the calculated value according to the conditional marginal distribution be.
 上述したような各構成によると、より的確にデータを推定可能な推定装置、推定方法、記録媒体を提供することができる。 According to each configuration as described above, it is possible to provide an estimation device, an estimation method, and a recording medium capable of more accurately estimating data.
本開示の概要を説明するための図である。BRIEF DESCRIPTION OF THE DRAWINGS FIG. 1 is a diagram for explaining the outline of the present disclosure; 本開示の第1の実施形態におけるリスク評価システムの構成例を示す図である。1 is a diagram illustrating a configuration example of a risk evaluation system according to a first embodiment of the present disclosure; FIG. モデル格納装置の構成例を示すブロック図である。3 is a block diagram showing a configuration example of a model storage device; FIG. モデル格納装置に格納されたモデルの一例を示す図である。FIG. 3 is a diagram showing an example of a model stored in a model storage device; FIG. リスク評価装置の構成例を示すブロック図である。It is a block diagram which shows the structural example of a risk-evaluation apparatus. 事前情報の一例を示す図である。It is a figure which shows an example of prior information. 条件付周辺分布算出部の処理例を説明するための図である。It is a figure for demonstrating the example of a process of a conditional marginal-distribution calculation part. 条件付周辺分布算出部の処理例を説明するための図である。It is a figure for demonstrating the example of a process of a conditional marginal-distribution calculation part. 属性推定時のリスク評価装置の動作例を示すフローチャートである。It is a flowchart which shows the operation example of the risk-evaluation apparatus at the time of attribute estimation. リスク評価時のリスク評価装置の動作例を示すフローチャートである。4 is a flowchart showing an operation example of the risk evaluation device during risk evaluation; 事前情報の他の一例を示す図である。It is a figure which shows another example of prior information. 本開示の第2の実施形態における推定装置のハードウェア構成例を示す図である。It is a figure which shows the hardware structural example of the estimation apparatus in 2nd Embodiment of this indication. 推定装置の構成例を示すブロック図である。It is a block diagram which shows the structural example of an estimation apparatus.
[第1の実施形態]
 本開示の第1の実施形態について、図1から図11までを参照して説明する。図1は、本開示の概要を説明するための図である。図2は、本開示の第1の実施形態におけるリスク評価システム100の構成例を示す図である。図3は、モデル格納装置200の構成例を示すブロック図である。図4は、モデル格納装置200に格納されたモデルの一例を示す図である。図5は、リスク評価装置300の構成例を示すブロック図である。図6は、事前情報341の一例を示す図である。図7、図8は、条件付周辺分布算出部356の処理例を説明するための図である。図9は、属性推定時のリスク評価装置300の動作例を示すフローチャートである。図10は、リスク評価時のリスク評価装置300の動作例を示すフローチャートである。図11は、事前情報341の他の一例を示す図である。
[First embodiment]
A first embodiment of the present disclosure will be described with reference to FIGS. 1 to 11. FIG. FIG. 1 is a diagram for explaining the outline of the present disclosure. FIG. 2 is a diagram showing a configuration example of the risk assessment system 100 according to the first embodiment of the present disclosure. FIG. 3 is a block diagram showing a configuration example of the model storage device 200. As shown in FIG. FIG. 4 is a diagram showing an example of a model stored in the model storage device 200. As shown in FIG. FIG. 5 is a block diagram showing a configuration example of the risk evaluation device 300. As shown in FIG. FIG. 6 is a diagram showing an example of the prior information 341. As shown in FIG. 7 and 8 are diagrams for explaining a processing example of the conditional marginal distribution calculator 356. FIG. FIG. 9 is a flowchart showing an operation example of the risk evaluation device 300 during attribute estimation. FIG. 10 is a flowchart showing an operation example of the risk evaluation device 300 during risk evaluation. FIG. 11 is a diagram showing another example of the prior information 341. As shown in FIG.
 本開示の第1の実施形態においては、学習モデル241の訓練時に用いた訓練データを構成する属性のうち一部が秘匿されているなどの理由により一部欠損している場合に、既知の属性を用いて欠損している属性の値を推定するリスク評価システム100について説明する。本開示の場合、リスク評価システム100は、訓練データを構成する属性(x、x2、…、x)のうちの一部の属性の値(x2、…、x)を知っているとともに、未知の属性xがk個の値(v11、…、v1k)のうちのいずれかを取ることができることを知っている。例えば、リスク評価システム100は、既知属性についての知識と未知属性についての知識を用いて、所定の重みを算出する。また、リスク評価システム100は、学習モデル241である決定木についての情報である決定木情報343に基づいて、訓練データを構成する属性(x、x2、…、x)のうちの一部の属性の値(x2、…、x)が既知である条件下における未知属性の条件付周辺分布に応じた値を算出する。そして、リスク評価システム100は、算出した重みと条件付周辺分布に応じた値とを用いて、未知の属性を推定する。このように、本実施形態において説明するリスク評価システム100は、決定木情報343を用いることで、既知属性の下で未知属性の値がどのくらいの確率で生じるかを示す条件付周辺分布に応じた値を算出する。そして、リスク評価システム100は、算出結果に基づいて、未知の属性値を推定する。また、リスク評価システム100は、属性値の推定結果に基づいて、訓練データが漏えいするおそれなどに応じたリスク評価を行うことができる。 In the first embodiment of the present disclosure, if some of the attributes that make up the training data used during training of the learning model 241 are partially missing due to reasons such as being concealed, a known attribute A risk assessment system 100 that estimates the values of missing attributes using In the case of the present disclosure, the risk assessment system 100 knows the values (x 2, ..., x d ) of some of the attributes (x 1 , x 2 , ..., x d ) that make up the training data. and we know that the unknown attribute x 1 can take any of k values (v 11 , . . . , v 1k ). For example, the risk evaluation system 100 uses knowledge about known attributes and knowledge about unknown attributes to calculate predetermined weights. In addition, the risk evaluation system 100 uses one of the attributes (x 1 , x 2 , . Calculate the value according to the conditional marginal distribution of the unknown attribute under the condition that the value of the part attribute (x 2 , . . . , x d ) is known. The risk evaluation system 100 then uses the calculated weights and values according to the conditional marginal distribution to estimate unknown attributes. In this way, the risk assessment system 100 described in the present embodiment uses the decision tree information 343 to determine the conditional marginal distribution that indicates the probability of occurrence of unknown attribute values under known attributes. Calculate the value. The risk evaluation system 100 then estimates unknown attribute values based on the calculation results. In addition, the risk evaluation system 100 can perform risk evaluation according to the possibility of leakage of training data based on the attribute value estimation result.
 例えば、図1は、zとzという2つの値によって値yが推測されるデータセットにおいて、山が高いほどデータセットに含まれるデータの数が多いことを示している。また、図1において、zが未知属性でありzが既知属性であるとする。このような状況下で、例えば、非特許文献1や非特許文献2に記載されているような条件なしの周辺確率P(z=v)を用いた場合、条件なしの周辺確率が平均的な分布を表現するため、例えばzの周辺分布は、zがv(1)である場合とzがv(2)である場合の中間程度のなだらかな山となる。一方、既知属性であるzについての知識を用いると、例えば、zの値がv(0)である場合、zの周辺分布はなだらかな山ではなくより平坦になることが分かる。また、例えば、zの値がv(3)である場合、zの周辺分布はより大きな山になることが分かる。このように、条件付きの周辺分布の方が、条件なしの周辺分布よりもより適切な周辺分布を表すことができる。ただし、条件付の周辺分布をいつも得られるとは限らない。そこで、本実施形態においては、決定木情報343を用いることで条件付き周辺分布に応じた値を経験的に算出して、算出結果に基づく推定を行う。 For example, FIG. 1 shows that in a data set in which the value y is inferred by two values z1 and z2 , the higher the peak, the more data the data set contains. Also, in FIG. 1, assume that z1 is an unknown attribute and z2 is a known attribute. Under such circumstances, for example, when the unconditional marginal probability P(z 1 =v) as described in Non-Patent Document 1 and Non-Patent Document 2 is used, the unconditional marginal probability is distribution, for example, the marginal distribution of z1 becomes a gentle peak intermediate between the case where z2 is v(1) and the case where z2 is v(2). On the other hand, using knowledge about z2 , which is a known attribute, we know that, for example, if the value of z2 is v(0), the marginal distribution of z1 will be flatter rather than rolling hills. Also, for example, when the value of z2 is v(3), it can be seen that the marginal distribution of z1 becomes a larger peak. Thus, conditional marginal distributions can represent better marginal distributions than unconditional marginal distributions. However, it is not always possible to obtain conditional marginal distributions. Therefore, in the present embodiment, the decision tree information 343 is used to empirically calculate a value corresponding to the conditional marginal distribution, and estimation is performed based on the calculation result.
 なお、本実施形態において、学習モデル241は、複数の訓練データを用いた教師あり学習により生成されているものとする。例えば、学習モデル241は、性別、年齢、身長、体重、…、などの複数の属性の入力に応じて、病気か否かなどを示すラベルを出力するように、複数の属性とラベルとを含む訓練データを複数用いて学習されている。なお、属性やラベルの具体例は、上記例示した場合に限られず任意に設定してよい。また、本実施形態において、訓練データを用いて訓練するモデルは、決定木である。決定木とは、入力データに対して、その属性の条件分岐によりラベルの説明性能が十分によくなるまで二分木で振り分ける作業を複数回行い、訓練するモデルのことをいう。なお、属性は、説明変数、または、特徴量などとも呼ばれうる。また、ラベルは、目的変数などとも呼ばれうる。 In addition, in this embodiment, the learning model 241 is generated by supervised learning using a plurality of training data. For example, the learning model 241 includes a plurality of attributes and labels so as to output a label indicating whether or not the patient is ill in response to the input of a plurality of attributes such as gender, age, height, weight, and so on. It is learned using multiple training data. Note that specific examples of attributes and labels are not limited to the above examples, and may be set arbitrarily. Also, in this embodiment, the model trained using the training data is a decision tree. A decision tree is a model that is trained by dividing input data into binary trees multiple times until the descriptive performance of the label is sufficiently improved by conditional branching of its attributes. An attribute can also be called an explanatory variable or a feature amount. A label can also be called an objective variable.
 また、本実施形態において説明するリスク評価システム100は、例えば、学習モデル241がホワイトボックス設定である場合において、未知属性の推定を行う。例えば、機械学習で生成するモデルは、入力に対する出力だけがユーザに公開されるブラックボックス設定のほか、モデルの構造や分岐条件などのモデル情報も公開するホワイトボックス設定がとられることがある。後述するように、本実施形態におけるリスク評価システム100は、ホワイトボックス設定により公開される情報である決定木情報343を用いて、条件付周辺分布に応じた値を算出する。ホワイトボックス設定は、例えば、クライアント間で情報を交換しながらモデル訓練を行う連合学習を実施する際などに設定される。 Also, the risk evaluation system 100 described in this embodiment estimates unknown attributes when, for example, the learning model 241 is set in a white box. For example, a model generated by machine learning may have a black box setting in which only the output for the input is disclosed to the user, and a white box setting in which model information such as the model structure and branching conditions are also disclosed. As will be described later, the risk assessment system 100 in this embodiment uses the decision tree information 343, which is information disclosed by white box setting, to calculate values according to conditional marginal distributions. The white box setting is set, for example, when performing federated learning in which model training is performed while exchanging information between clients.
 図2は、本実施形態におけるリスク評価システム100の構成例を示している。図2を参照すると、リスク評価システム100は、例えば、リスク評価装置300と、モデル格納装置200と、を有している。図2で示すように、リスク評価装置300とモデル格納装置200とは、例えば、ネットワークなどを介して互いに通信可能なよう接続されている。 FIG. 2 shows a configuration example of the risk assessment system 100 in this embodiment. With reference to FIG. 2, the risk assessment system 100 has, for example, a risk assessment device 300 and a model storage device 200 . As shown in FIG. 2, the risk evaluation device 300 and the model storage device 200 are connected, for example, via a network or the like so that they can communicate with each other.
 モデル格納装置200は、訓練データを用いて学習された学習モデル241が格納されている情報処理装置である。図3は、モデル格納装置200の構成例を示している。例えば、図3を参照すると、モデル格納装置200は、学習モデル241が格納された記憶部240を有するとともに、受信部210と、推論部220と、出力部230と、を有している。例えば、モデル格納装置200は、CPU(Central Processing Unit)などの演算装置と記憶装置とを有している。モデル格納装置200は、記憶装置に格納されたプログラムを演算装置が実行することで、上記各処理部を実現することができる。 The model storage device 200 is an information processing device that stores a learning model 241 learned using training data. FIG. 3 shows a configuration example of the model storage device 200. As shown in FIG. For example, referring to FIG. 3, the model storage device 200 has a storage unit 240 in which a learning model 241 is stored, a receiving unit 210 , an inference unit 220 and an output unit 230 . For example, the model storage device 200 has an arithmetic device such as a CPU (Central Processing Unit) and a storage device. The model storage device 200 can realize each of the above-described processing units by executing the program stored in the storage device by the arithmetic device.
 なお、図3で示すように、記憶部240に格納されている学習モデル241は、複数の属性とラベルとを含む訓練データを複数用いて予め学習されている。学習モデル241は、モデル格納装置200内で学習されていてもよいし、モデル格納装置200外で学習されていてもよい。また、図4で示すように、学習モデル241は、決定木である。決定木である学習モデル241において、推論は、例えば、入力データに対して説明変数である属性で振り分けられた1つの葉ノードの持つ値(ラベル)を出力することでなされる。 Note that, as shown in FIG. 3, the learning model 241 stored in the storage unit 240 is learned in advance using a plurality of training data including a plurality of attributes and labels. The learning model 241 may be learned within the model storage device 200 or may be learned outside the model storage device 200 . Also, as shown in FIG. 4, the learning model 241 is a decision tree. In the learning model 241, which is a decision tree, inference is performed by, for example, outputting a value (label) of one leaf node sorted by an attribute, which is an explanatory variable, for input data.
 受信部210は、リスク評価装置300から後述する候補データを受信する。例えば、受信部210は、“v11、x2、…、x”や“v12、x2、…、x”など、リスク評価装置300にとって既知の属性の値を含むとともに、未知の属性の候補を含む訓練データを受信する。一例として、受信部210は、リスク評価装置300にとっての未知の属性候補の数に応じた数の候補データをリスク評価装置300から受信する。受信部210は、候補データとともに識別情報など上記例示した以外の情報を受信してもよい。 Receiving unit 210 receives candidate data, which will be described later, from risk evaluation device 300 . For example, the receiving unit 210 includes values of attributes known to the risk assessment apparatus 300 such as “v 11 , x 2 , . . . , x d ” and “v 12 , x 2 , . Receive training data containing attribute candidates. As an example, the receiving unit 210 receives from the risk assessment device 300 a number of pieces of candidate data corresponding to the number of unknown attribute candidates for the risk assessment device 300 . The receiving unit 210 may receive information other than the above examples, such as identification information, together with the candidate data.
 推論部220は、受信部210が受信した各候補データを学習モデル241に入力する。また、上記入力の結果として、推論部220は、各候補データに対応する推論結果である推論ラベルを取得する。 The inference unit 220 inputs each candidate data received by the reception unit 210 to the learning model 241 . As a result of the input, the inference unit 220 acquires an inference label, which is an inference result corresponding to each candidate data.
 出力部230は、推論部220が取得した推論ラベルをリスク評価装置300に対して送信する。例えば、出力部230は、推論ラベルがどの候補データに基づいて推論した結果であるのかを判別可能なように、候補データの識別情報などとともに推論ラベルをリスク評価装置300に対して送信してよい。 The output unit 230 transmits the inference label acquired by the inference unit 220 to the risk evaluation device 300 . For example, the output unit 230 may transmit the inference label to the risk assessment apparatus 300 together with the identification information of the candidate data so that the inference label can be determined based on which candidate data. .
 また、出力部230は、学習モデル241についての情報をリスク評価装置300に対して送信することができる。例えば、出力部230は、二分木の分割構造などのモデル構造、属性が閾値より大きい、または、小さいなどを示すモデルの分岐条件、各葉ノードに割り振られる訓練データの数、などの情報を学習モデル241についての情報としてリスク評価装置300に対して送信する。出力部230は、上記例示した以外の学習モデル241についての情報をリスク評価装置300に対して送信してもよい。なお、例えば、出力部230は、リスク評価装置300に対して推論ラベルを送信する際やリスク評価装置300から学習モデル241についての情報を送信する旨の指示を受けた際など、任意のタイミングで学習モデル241についての情報をリスク評価装置300に対して送信してよい。 Also, the output unit 230 can transmit information about the learning model 241 to the risk evaluation device 300 . For example, the output unit 230 learns information such as a model structure such as a binary tree split structure, a model branching condition indicating that an attribute is larger or smaller than a threshold, and the number of training data allocated to each leaf node. It is transmitted to the risk evaluation device 300 as information about the model 241 . The output unit 230 may transmit information about the learning model 241 other than the above examples to the risk evaluation device 300 . Note that, for example, the output unit 230 can be set at an arbitrary timing, such as when transmitting an inference label to the risk evaluation device 300 or when receiving an instruction to transmit information about the learning model 241 from the risk evaluation device 300. Information about the learning model 241 may be transmitted to the risk assessment device 300 .
 例えば、以上のように、モデル格納装置200は、訓練データを用いて学習された学習モデル241を有している。また、モデル格納装置200は、リスク評価装置300から候補データを受信すると、受信した候補データに基づいて学習モデル241を用いた推論を行うことで、候補データに対応する推論ラベルを取得する。そして、モデル格納装置200は、取得した推論ラベルをリスク評価装置300に対して送信する。また、モデル格納装置200は、学習モデル241についての情報をリスク評価装置300に対して送信する。 For example, as described above, the model storage device 200 has a learning model 241 learned using training data. Also, upon receiving candidate data from the risk evaluation device 300, the model storage device 200 obtains an inference label corresponding to the candidate data by performing inference using the learning model 241 based on the received candidate data. The model storage device 200 then transmits the acquired inference label to the risk evaluation device 300 . The model storage device 200 also transmits information about the learning model 241 to the risk assessment device 300 .
 リスク評価装置300は、既知の属性についての情報や学習モデル241についての情報などを用いて秘匿されている属性の値を推定する情報処理装置である。また、リスク評価装置300は、推定結果に基づくリスク評価を行うことができる。 The risk evaluation device 300 is an information processing device that estimates the values of hidden attributes using information about known attributes, information about the learning model 241, and the like. Also, the risk assessment device 300 can perform risk assessment based on the estimation results.
 図5は、リスク評価装置300の構成例を示している。図5を参照すると、リスク評価装置300は、主な構成要素として、例えば、操作入力部310と、画面表示部320と、通信I/F部330と、記憶部340と、演算処理部350と、を有している。 FIG. 5 shows a configuration example of the risk assessment device 300. FIG. Referring to FIG. 5, the risk assessment device 300 includes, as main components, an operation input unit 310, a screen display unit 320, a communication I/F unit 330, a storage unit 340, and an arithmetic processing unit 350. ,have.
 なお、図5では、1台の情報処理装置を用いてリスク評価装置300としての機能を実現する場合について例示している。しかしながら、リスク評価装置300は、例えば、クラウド上に実現されるなど、複数台の情報処理装置を用いて実現されてもよい。例えば、リスク評価装置300としての機能は、候補データ作成部351と候補データ送信部352と推論結果取得部353と決定木情報受取部354と重み算出部355と条件付周辺分布算出部356と推定部357としての機能を有する推定装置と、評価部358と出力部359としての機能を有する評価装置と、の2台の情報処理装置により実現されてもよい。また、リスク評価装置300は、操作入力部や画面表示部を有さないなど上記例示した構成の一部を含まなくてもよいし、上記例示した以外の構成を有してもよい。 Note that FIG. 5 illustrates a case where the function of the risk evaluation device 300 is realized using one information processing device. However, the risk evaluation device 300 may be implemented using a plurality of information processing devices, such as being implemented on a cloud. For example, the functions of the risk evaluation device 300 include a candidate data generation unit 351, a candidate data transmission unit 352, an inference result acquisition unit 353, a decision tree information reception unit 354, a weight calculation unit 355, a conditional marginal distribution calculation unit 356, and an estimation It may be implemented by two information processing devices, an estimation device functioning as the unit 357 and an evaluation device functioning as the evaluation unit 358 and the output unit 359 . Moreover, the risk assessment device 300 may not include a part of the above-exemplified configuration such as having no operation input unit or screen display unit, or may have a configuration other than the above-exemplified configuration.
 操作入力部310は、キーボード、マウスなどの操作入力装置からなる。操作入力部310は、リスク評価装置300を操作する操作者の操作を検出して演算処理部350に出力する。 The operation input unit 310 consists of operation input devices such as a keyboard and a mouse. The operation input unit 310 detects the operation of the operator who operates the risk evaluation device 300 and outputs it to the arithmetic processing unit 350 .
 画面表示部320は、LCD(Liquid Crystal Display、液晶ディスプレイ)などの画面表示装置からなる。画面表示部320は、演算処理部350からの指示に応じて、記憶部340に格納されている各種情報などを画面表示することができる。 The screen display unit 320 consists of a screen display device such as an LCD (Liquid Crystal Display). The screen display unit 320 can display various information stored in the storage unit 340 on the screen in accordance with instructions from the arithmetic processing unit 350 .
 通信I/F部330は、データ通信回路などからなる。通信I/F部330は、通信回線を介して接続されたモデル格納装置200などの外部装置との間でデータ通信を行う。 The communication I/F unit 330 consists of a data communication circuit and the like. The communication I/F unit 330 performs data communication with an external device such as the model storage device 200 connected via a communication line.
 記憶部340は、ハードディスクやメモリなどの記憶装置である。記憶部340は、演算処理部350における各種処理に必要な処理情報やプログラム346を記憶する。プログラム346は、演算処理部350に読み込まれて実行されることにより各種処理部を実現する。プログラム346は、通信I/F部330などのデータ入出力機能を介して外部装置や記録媒体から予め読み込まれ、記憶部340に保存されている。記憶部340で記憶される主な情報としては、例えば、事前情報341、推論結果情報342、決定木情報343、重み情報344、推定情報345などがある。記憶部340には、推論結果情報342が格納されないなど、上記例示したうちの一部の情報のみが格納されていてもよい。 The storage unit 340 is a storage device such as a hard disk or memory. The storage unit 340 stores processing information and programs 346 required for various processes in the arithmetic processing unit 350 . The program 346 realizes various processing units by being read and executed by the arithmetic processing unit 350 . The program 346 is read in advance from an external device or recording medium via a data input/output function such as the communication I/F unit 330 and stored in the storage unit 340 . Main information stored in the storage unit 340 includes prior information 341, inference result information 342, decision tree information 343, weight information 344, and estimation information 345, for example. The storage unit 340 may store only part of the information exemplified above, such as not storing the inference result information 342 .
 事前情報341は、モデル格納装置200に格納された学習モデル241の訓練時に用いた訓練データについて予め知っている情報を含んでいる。例えば、事前情報341は、通信I/F部330を介して外部装置から取得する、操作入力部310を用いて入力する、などの方法を用いて予め取得されており、記憶部340に格納されている。 The prior information 341 includes previously known information about training data used during training of the learning model 241 stored in the model storage device 200 . For example, prior information 341 is acquired in advance using a method such as being acquired from an external device via communication I/F unit 330 or being input using operation input unit 310, and is stored in storage unit 340. ing.
 図6は、事前情報341の一例を示している。図6を参照すると、事前情報341には、部分訓練データ情報と、欠損属性情報と、が含まれている。例えば、図6で示すように、事前情報341には、部分訓練データ情報と欠損属性情報とが関連付けられた情報が複数含まれている。 FIG. 6 shows an example of the prior information 341. Referring to FIG. 6, the prior information 341 includes partial training data information and missing attribute information. For example, as shown in FIG. 6, the prior information 341 includes multiple pieces of information in which partial training data information and missing attribute information are associated.
 ここで、部分訓練データ情報は、学習モデル241を学習する際に用いた訓練データのうち一部の属性が秘匿(欠損)された状態における既知の属性の値と対応するラベルとを示している。例えば、図6では、属性(x、…、x)とラベルyとが既知であり、属性xが欠損している場合について例示されている。また、欠損属性情報は、欠損している属性の値についての情報を示している。例えば、図6では、欠損した属性xがk個の値(v11、…、v1k)のうちのいずれかをとることを示している。なお、本実施形態において、欠損した属性は、例えば、カテゴリカル変数(離散変数)である。なお、事前情報341には、上記例示した以外の情報が含まれてもよい。 Here, the partial training data information indicates known attribute values and corresponding labels in a state in which some attributes of the training data used for learning the learning model 241 are concealed (deleted). . For example, FIG. 6 illustrates a case where attributes (x 2 , . . . , x d ) and label y are known and attribute x 1 is missing. Missing attribute information indicates information about the value of the missing attribute. For example, FIG. 6 shows that the missing attribute x 1 takes one of k values (v 11 , . . . , v 1k ). Note that in the present embodiment, missing attributes are, for example, categorical variables (discrete variables). Note that the prior information 341 may include information other than the above examples.
 推論結果情報342は、後述する候補データ作成部351が事前情報341に基づいて作成する候補データを学習モデル241に入力することで取得される推論ラベルを示す情報を含んでいる。例えば、推論結果情報342には、欠損した属性における候補の数に応じた推論ラベルを示す情報が含まれうる。例えば、推論結果情報342は、後述する推論結果取得部353が推論ラベルをモデル格納装置200から取得することに応じて、生成、更新される。 The inference result information 342 includes information indicating an inference label obtained by inputting candidate data created by the candidate data creation unit 351 based on the prior information 341 to the learning model 241, which will be described later. For example, the inference result information 342 may include information indicating inference labels corresponding to the number of candidates for missing attributes. For example, the inference result information 342 is generated and updated in response to an inference label acquired from the model storage device 200 by an inference result acquisition unit 353 (to be described later).
 決定木情報343は、モデル格納装置200から取得した学習モデル241についての情報を含んでいる。換言すると、決定木情報343には、決定木についての情報が含まれている。例えば、決定木情報343には、モデル構造、モデルの分岐条件、各葉ノードに割り振られる訓練データの数、などの学習モデル241についての情報が含まれる。決定木情報343は、例えば、決定木情報受取部354が学習モデル241についての情報をモデル格納装置200から受け取ることに応じて更新される。 The decision tree information 343 includes information about the learning model 241 acquired from the model storage device 200. In other words, the decision tree information 343 includes information about decision trees. For example, the decision tree information 343 includes information about the learning model 241, such as model structure, model branching conditions, and the number of training data assigned to each leaf node. The decision tree information 343 is updated, for example, when the decision tree information receiving unit 354 receives information about the learning model 241 from the model storage device 200 .
 重み情報344は、後述する重み算出部355が算出した重みを示す情報を含んでいる。例えば、重み情報344には、欠損した属性における候補の数に応じた重みを示す情報が含まれうる。例えば、重み情報344は、重み算出部355が重みを算出することに応じて、生成、更新される。 The weight information 344 includes information indicating the weight calculated by the weight calculator 355, which will be described later. For example, weight information 344 may include information indicating a weight according to the number of candidates for missing attributes. For example, the weight information 344 is generated and updated as the weight calculator 355 calculates the weight.
 推定情報345は、重み情報344と条件付周辺分布算出部356による算出結果とに基づいて後述する推定部357が推定した結果を示す情報を含んでいる。例えば、推定情報345には、未知の属性候補のうち推定部357が推定した属性の値を示す情報などが含まれうる。例えば、推定情報345は、推定部357が重みを用いて条件付周辺確率を評価した結果などに応じて、生成、更新される。 The estimation information 345 includes information indicating the result estimated by the estimation unit 357 described later based on the weight information 344 and the calculation result by the conditional marginal distribution calculation unit 356 . For example, the estimation information 345 may include information indicating attribute values estimated by the estimation unit 357 among unknown attribute candidates. For example, the estimation information 345 is generated and updated according to the results of evaluation of conditional marginal probabilities by the estimation unit 357 using weights.
 演算処理部350は、CPUなどの演算装置とその周辺回路を有する。演算処理部350は、記憶部340からプログラム346を読み込んで実行することにより、上記ハードウェアとプログラム346とを協働させて各種処理部を実現する。演算処理部350で実現される主な処理部としては、例えば、候補データ作成部351、候補データ送信部352、推論結果取得部353、決定木情報受取部354、重み算出部355、条件付周辺分布算出部356、推定部357、評価部358、出力部359などがある。 The arithmetic processing unit 350 has an arithmetic device such as a CPU and its peripheral circuits. The arithmetic processing unit 350 reads the program 346 from the storage unit 340 and executes it, so that the hardware and the program 346 work together to realize various processing units. Main processing units realized by the arithmetic processing unit 350 include, for example, a candidate data generation unit 351, a candidate data transmission unit 352, an inference result acquisition unit 353, a decision tree information reception unit 354, a weight calculation unit 355, a conditional peripheral There are a distribution calculation unit 356, an estimation unit 357, an evaluation unit 358, an output unit 359, and the like.
 なお、リスク評価装置300は、上記例示した構成のうち、重み算出部355が重みを算出するために必要となる構成のみを有してよい。例えば、後述するように、重み算出部355は、非特許文献1に記載されている方法や非特許文献2に記載されているような方法で重みを算出することができる。ここで、非特許文献2に記載されている方法の場合、推論ラベルは必ずしも必要ではない。そのため、リスク評価装置300は、重み算出部355による重み算出方法などによっては、候補データ送信部352や推論結果取得部353などの構成を有さなくてもよい。 Note that the risk evaluation device 300 may have only the configuration necessary for the weight calculation unit 355 to calculate the weight among the configurations illustrated above. For example, as will be described later, the weight calculator 355 can calculate the weight by the method described in Non-Patent Document 1 or the method described in Non-Patent Document 2. Here, in the case of the method described in Non-Patent Document 2, inference labels are not necessarily required. Therefore, the risk evaluation apparatus 300 may not have the configuration of the candidate data transmission unit 352 and the inference result acquisition unit 353 depending on the weight calculation method of the weight calculation unit 355 or the like.
 候補データ作成部351は、事前情報341に基づいて候補データを作成する。例えば、候補データ作成部351は、欠損属性情報が示す候補の数に応じた候補データを作成する。候補データ作成部351は、任意のタイミングで候補データを作成してよい。 The candidate data creation unit 351 creates candidate data based on the prior information 341. For example, the candidate data creation unit 351 creates candidate data according to the number of candidates indicated by the missing attribute information. The candidate data creation unit 351 may create candidate data at any timing.
 具体的に、例えば、事前情報341として、部分訓練データ情報(x、…、x、y)が格納されており、欠損属性情報として未知の属性xが(v11、…、v1k)のいずれかの値である旨が格納されているとする。この場合、候補データ作成部351は、未知の属性xが(v11、…、v1k)のうちのいずれかの値をとるとして、(v11、…、v1k)それぞれに対応する候補データを作成する。つまり、候補データ作成部351は、(v11、x、…、x)、…、(v1k、x、…、x)という候補データを作成する。 Specifically, for example , as the prior information 341, partial training data information (x 2 , . ) is stored. In this case, the candidate data generating unit 351 assumes that the unknown attribute x 1 takes any value of (v 11 , . . . , v 1k ), and the candidate Create data. That is, the candidate data creating unit 351 creates candidate data (v 11 , x 2 , ..., x d ), ..., (v 1k , x 2 , ..., x d ).
 なお、上述したように、事前情報341には、部分訓練データ情報と欠損属性情報とを対応付けた情報を複数含むことができる。候補データ作成部351は、上記対応付けた情報ごとに、上述した方法を用いて候補データを作成してよい。 As described above, the prior information 341 can include a plurality of pieces of information in which partial training data information and missing attribute information are associated with each other. The candidate data creation unit 351 may create candidate data using the method described above for each of the associated information.
 候補データ送信部352は、候補データ作成部351が作成した候補データをモデル格納装置200に対して送信する。候補データ送信部352は、候補データ作成時に用いた部分訓練データ情報などに応じた候補データの識別情報などを候補データとともに送信してもよい。 The candidate data transmission unit 352 transmits the candidate data created by the candidate data creation unit 351 to the model storage device 200 . The candidate data transmission unit 352 may transmit, together with the candidate data, identification information of the candidate data according to the partial training data information used when creating the candidate data.
 推論結果取得部353は、モデル格納装置200から候補データに基づく推論の結果として、推論ラベルを受信、取得する。例えば、推論結果取得部353は、推論対象となった候補データが判別可能なように、識別情報などとともにモデル格納装置200から推論ラベルを取得する。また、推論結果取得部353は、受信した推論ラベルを推論結果情報342として記憶部340に格納する。推論結果取得部353は、対応する候補データの識別情報などともに、推論ラベルを記憶部340に格納してもよい。 The inference result acquisition unit 353 receives and acquires an inference label from the model storage device 200 as a result of inference based on candidate data. For example, the inference result acquisition unit 353 acquires the inference label from the model storage device 200 together with the identification information so that the inference target candidate data can be identified. The inference result acquisition unit 353 also stores the received inference label as the inference result information 342 in the storage unit 340 . The inference result acquisition unit 353 may store the inference label in the storage unit 340 together with the identification information of the corresponding candidate data.
 決定木情報受取部354は、モデル格納装置200から学習モデル241についての情報を受け取る。例えば、決定木情報受取部354は、モデル格納装置200から、モデル構造、モデルの分岐条件、各葉ノードに割り振られる訓練データの数、などの学習モデル241についての情報を受け取る。また、決定木情報受取部354は、受け取った学習モデル241についての情報を決定木情報343として記憶部340に格納する。 The decision tree information receiving unit 354 receives information about the learning model 241 from the model storage device 200 . For example, the decision tree information receiving unit 354 receives information about the learning model 241 from the model storage device 200, such as the model structure, the branching condition of the model, the number of training data assigned to each leaf node, and the like. Also, the decision tree information receiving unit 354 stores the received information about the learning model 241 as the decision tree information 343 in the storage unit 340 .
 なお、決定木情報受取部354は、任意のタイミングで学習モデル241についての情報を送信するようモデル格納装置200に対して指示してもよい。例えば、決定木情報受取部354は、上記指示に応じて送信された学習モデル241についての情報を受け取るよう構成してもよい。 Note that the decision tree information receiving unit 354 may instruct the model storage device 200 to transmit information about the learning model 241 at any timing. For example, the decision tree information receiving unit 354 may be configured to receive information about the learning model 241 transmitted in response to the instruction.
 重み算出部355は、既知属性についての情報と未知属性についての情報を用いて、所定の重みを算出する。また、重み算出部355は、算出した重みを重み情報344として記憶部340に格納する。重み算出部355は、対応する候補データの識別情報などともに、算出結果を記憶部340に格納してもよい。 The weight calculation unit 355 calculates a predetermined weight using information about known attributes and information about unknown attributes. Also, the weight calculation unit 355 stores the calculated weight in the storage unit 340 as weight information 344 . The weight calculation unit 355 may store the calculation result in the storage unit 340 together with the identification information of the corresponding candidate data.
 例えば、重み算出部355は、非特許文献1に記載されている方法と同様の方法を用いて重みを算出する。具体的に、例えば、重み算出部355は、数1で示すように、事前情報341と推論結果情報342に基づいて、所定のエラー関数err()を用いることで、推論ラベルと推論対象となった候補データの作成元になった部分訓練データ情報に含まれるラベルとの間のずれを算出する。つまり、重み算出部355は、既知属性についての情報と未知属性についての情報とに基づいて推論される推論ラベルと、ラベルと、の間のずれを算出することで重みを算出する。
 なお、yがラベルであり、f(x’)が推測ラベルである。
For example, the weight calculator 355 calculates the weight using a method similar to the method described in Non-Patent Document 1. Specifically, for example, the weight calculation unit 355 uses a predetermined error function err( ) based on the prior information 341 and the inference result information 342 as shown in Equation 1 to obtain an inference label and an inference target. The deviation from the label included in the partial training data information from which the candidate data was created is calculated. In other words, the weight calculator 355 calculates the weight by calculating the deviation between the label and the inference label inferred based on the information about the known attribute and the information about the unknown attribute.
Note that y is the label and f(x') is the guess label.
 また、例えば、重み算出部355は、上記方法の代わりに、非特許文献2に記載されているような方法で比率を算出して、算出した比率を重みとして用いるよう構成してもよい。例えば、重み算出部355は、数2で示すような式を解くことで比率を算出することができる。
 なお、非特許文献2で示すように、φi()は、欠損した属性の値候補vに関する所定の指示関数である。また、訓練データ総数Nに対してp= ni/Nとなる。なお、niは葉ノードiに振り分けられる訓練データの数を示す。また、S = (si)i=1,…,m=(φi ,ni )i=1,…,mであり、決定木のすべての経路集合を示す。また、s1,…,smkは既知属性がzkであるデータがひとつは通る経路を示す。
Further, for example, instead of the above method, the weight calculation unit 355 may be configured to calculate a ratio by a method described in Non-Patent Document 2 and use the calculated ratio as a weight. For example, the weight calculator 355 can calculate the ratio by solving the equation shown in Equation 2.
Note that, as shown in Non-Patent Document 2, φ i ( ) is a predetermined indicator function for the value candidate v of the missing attribute. Also, p i =n i /N for the total number of training data N. Note that n i indicates the number of training data assigned to leaf node i . Also, S = (s i ) i=1,...,m =(φ i ,n i ) i=1,...,m , indicating all path sets of the decision tree. Also , s 1 , .
 また、重み算出部355は、上記例示した以外の方法で重みを算出してもよい。例えば、重み算出部355は、任意の方法で決定された重み初期値を既知属性の値で調整することなどにより重みを算出してもよい。 Also, the weight calculation unit 355 may calculate the weight by a method other than the above example. For example, the weight calculator 355 may calculate the weight by adjusting the weight initial value determined by any method with the value of the known attribute.
 例えば、以上説明したように、重み算出部355は、既知属性についての情報と未知属性についての情報を用いて、所定の重みを算出する。なお、重み算出部355は、上記例示したうちのいずれかの方法を用いて重みを算出するよう構成してもよい。 For example, as described above, the weight calculator 355 calculates a predetermined weight using information about known attributes and information about unknown attributes. Note that the weight calculator 355 may be configured to calculate the weight using any one of the methods exemplified above.
 条件付周辺分布算出部356は、決定木情報343を用いて対象となる葉ノードに落ちる訓練データの数を算出することなどにより条件付周辺分布に応じた値を算出する。例えば、条件付周辺分布算出部356は、未知属性の候補ごとに条件付周辺分布を算出することができる。 The conditional marginal distribution calculation unit 356 calculates a value according to the conditional marginal distribution by calculating the number of training data falling on the target leaf node using the decision tree information 343 . For example, the conditional marginal distribution calculator 356 can calculate the conditional marginal distribution for each unknown attribute candidate.
 例えば、図7は、特徴量の空間を長方形に分割する決定木において、二分木によって分割された後の領域の一例を示している。また、図7において、例えば、zが既知属性でありzが未知属性であるとする。この場合、決定木情報343を用いて決定木のある領域に割り当てられているデータ量をみることで、図7で例示するように間接的に真の条件付周辺分布に応じた値を算出できる。この値は、真の分布とは異なっているものの、平均を用いるよりは良くなる可能性を期待することができる。 For example, FIG. 7 shows an example of a region divided by a binary tree in a decision tree that divides the space of feature values into rectangles. Also, in FIG. 7, for example, z2 is a known attribute and z1 is an unknown attribute. In this case, by using the decision tree information 343 to see the amount of data assigned to the region with the decision tree, it is possible to indirectly calculate the value corresponding to the true conditional marginal distribution as illustrated in FIG. . Although this value is different from the true distribution, it can be expected to be better than using the average.
 具体的に、例えば、条件付周辺分布算出部356は、下記数3で示すような式を解くことで、経験的に条件付周辺分布に応じた値を算出する。
Specifically, for example, the conditional marginal distribution calculation unit 356 empirically calculates a value according to the conditional marginal distribution by solving the equation shown in Equation 3 below.
 換言すると、例えば、条件付周辺分布算出部356は、決定木情報343を参照して、未知属性をある候補とした際に落ちる葉ノードを特定する。そして、条件付周辺分布算出部356は、訓練データ全体Dのうち特定した葉ノードに対して落ちる訓練データの数を算出することで、第1の値を算出する。また、条件付周辺分布算出部356は、未知属性を各候補とした際にそれぞれ落ちる葉ノードを特定する。そして、条件付周辺分布算出部356は、訓練データ全体Dのうち、特定した各葉ノードに対して落ちる訓練データの数の和を算出することで、第2の値を算出する。その後、条件付周辺分布算出部356は、第1の値を第2の値で割ることで、条件付周辺分布に応じた値を算出する。 In other words, for example, the conditional marginal distribution calculation unit 356 refers to the decision tree information 343 to identify leaf nodes that fall when an unknown attribute is taken as a candidate. Then, the conditional marginal distribution calculator 356 calculates the first value by calculating the number of pieces of training data falling on the specified leaf node among the entire training data D. FIG. In addition, the conditional marginal distribution calculation unit 356 identifies the leaf node that falls when each candidate is an unknown attribute. Then, the conditional marginal distribution calculation unit 356 calculates the second value by calculating the sum of the number of pieces of training data falling for each of the identified leaf nodes among the entire training data D. FIG. After that, the conditional marginal distribution calculator 356 divides the first value by the second value to calculate a value according to the conditional marginal distribution.
 なお、決定木では、すべての特徴量の値に対応するように特徴量空間を分割するわけではない。そのため、実際には、図8に示すように、分割領域の粒度は図7で例示するよりも荒くなる可能性が高い。その結果、例えば、図7と図8を比較すると、粒度が荒くなった結果として、図7で示す場合よりも葉ノード(分割領域)に落ちる訓練データの数が多くなったり、頻度の中心がずれるおそれがあったりすることが分かる。そこで、条件付周辺分布算出部356は、下記数4で示すように葉ノードに対して落ちる訓練データの数を単位面積あたりに補正するよう構成することができる。一般に、特徴量空間において近傍では分布はほぼ不変である。そのため、上記のような補正を行うことで、性能改善を見込むことができる。
Note that the decision tree does not divide the feature amount space so as to correspond to all the feature amount values. Therefore, in practice, as shown in FIG. 8, the granularity of the divided regions is likely to be coarser than illustrated in FIG. As a result, for example, when comparing FIG. 7 and FIG. 8, as a result of coarser granularity, the number of training data falling on leaf nodes (divided regions) is greater than in the case shown in FIG. It can be seen that there is a risk of slippage. Therefore, the conditional marginal distribution calculator 356 can be configured to correct the number of training data falling on a leaf node per unit area, as indicated by Equation 4 below. In general, the distribution is almost unchanged in the neighborhood in the feature amount space. Therefore, performance improvement can be expected by performing the above correction.
 上述したように、数4で示す式では、数3の式における分子を特徴量空間上で占める面積で割ることで、上述した補正処理を行っている。ここで、上記面積は、例えば、下記のようにして算出することができる。 As described above, in the equation shown in Equation 4, the correction process described above is performed by dividing the numerator in Equation 3 by the area occupied in the feature amount space. Here, the area can be calculated, for example, as follows.
 例えば、属性z(j=1、…、d)に対してzが離散値の場合、条件付周辺分布算出部356は、zがとりうる値の個数を数えることでNを算出する。例えば、属性zが{A,B,C}の3値を取りうるならば、Nは3となる。また、条件付周辺分布算出部356は、葉ノードiに振り分けられる訓練データにおいてzが取りうる値の個数を数えることで、nj,iを算出する。例えば、葉ノードiに至る経路で{A,C}の2値が許容される場合、nj,iは2となる。そして、条件付周辺分布算出部356は、nj,iをNで割ることで幅wを算出する。例えば、上記のようにして幅wを算出した後、条件付周辺分布算出部356は、下記数5で示す式を解くことで面積を算出することができる。
For example, when z j is a discrete value for attribute z j (j=1, . . . , d), the conditional marginal distribution calculator 356 calculates N j by counting the number of possible values do. For example, if the attribute zj can take three values {A, B, C}, then Nj is 3. The conditional marginal distribution calculator 356 also calculates nj ,i by counting the number of possible values of zj in the training data assigned to leaf node i. For example, nj,i is 2 if the path to leaf node i allows two values of {A,C}. Then, the conditional marginal distribution calculator 356 calculates the width wj by dividing nj,i by Nj . For example, after calculating the width wj as described above, the conditional marginal distribution calculator 356 can calculate the area by solving the equation shown in Equation 5 below.
 なお、上記処理では、nj,iをNで割ることで正規化を行っている。例えば、身長という属性がcmであり距離という属性がmであるなど、属性ごとにスケーリングが異なっている場合がある。そのため、単にnj,iを用いるのではなくNで割っておくことで、より適切な値を算出することができる。正規化の必要がないことが予め分かっている場合などにおいて、Nで割る処理を省略してもよい。 In the above processing, normalization is performed by dividing nj ,i by Nj . For example, scaling may be different for each attribute, such as cm for an attribute of height and m for an attribute of distance. Therefore, a more appropriate value can be calculated by dividing by Nj instead of simply using nj ,i . In cases such as when it is known in advance that normalization is unnecessary, the process of dividing by Nj may be omitted.
 また、例えば、属性z(j=1、…、d)に対してzが連続値の場合、条件付周辺分布算出部356は、zがとりうる値の範囲の差を算出することでNを算出する。例えば、属性zが1から10までの値を取りうる場合、Nは10-1より9となる。また、条件付周辺分布算出部356は、葉ノードiに振り分けられる訓練データにおいてzが取りうる値の範囲の差を算出することでnj,iを算出する。例えば、葉ノードiに至る経路で2から5までの値が許容される場合、nj,iは5-2より3となる。そして、条件付周辺分布算出部356は、nj,iをNで割ることで幅wを算出する。その後、条件付周辺分布算出部356は、上述した数5で示す式を解くことで面積を算出することができる。なお、属性が離散値である場合と同様に、属性が連続値である場合も、正規化する処理を省略してもよい。 Also, for example , if z j is a continuous value for attribute z j (j=1, . to calculate Nj . For example, if the attribute z j can take values from 1 to 10, then N j is 9 from 10−1. The conditional marginal distribution calculator 356 also calculates nj ,i by calculating the difference in the range of values that zj can take in the training data assigned to leaf node i. For example, if the path to leaf node i allows values from 2 to 5, nj ,i becomes 3 instead of 5-2. Then, the conditional marginal distribution calculator 356 calculates the width wj by dividing nj,i by Nj . After that, the conditional marginal distribution calculation unit 356 can calculate the area by solving the equation shown in Equation 5 above. As in the case where the attributes are discrete values, the normalization process may be omitted when the attributes are continuous values.
 例えば、以上のように、条件付周辺分布算出部356は、葉ノードiに振り分けられる訓練データにおいてzが取りうる値の個数または範囲に基づいて算出される特徴量空間上の面積を用いて、葉ノードに対して落ちる訓練データの数を補正するよう構成してもよい。 For example, as described above, the conditional marginal distribution calculation unit 356 uses the area in the feature amount space calculated based on the number or range of possible values of zj in the training data assigned to the leaf node i. , may be configured to compensate for the number of training data falling for leaf nodes.
 なお、後述するように、条件付周辺分布算出部356が算出した条件付周辺分布に応じた値は、推定部357が推定を行う際に比較される対象となる。また、数3や数4で示す式のうち分母の部分は、未知属性の各候補で同一の値となる。そのため、条件付周辺分布算出部356は、条件付周辺分布に応じた値として、数3や数4で示す式の分子の部分のみを算出するよう構成してもよい。換言すると、条件付周辺分布算出部356は、条件付周辺分布に応じた値として、訓練データ全体Dのうち特定した葉ノードに対して落ちる訓練データの数や、当該数を面積で補正した値などを算出するよう構成してもよい。 As will be described later, the values corresponding to the conditional marginal distributions calculated by the conditional marginal distribution calculation unit 356 are compared when the estimation unit 357 performs estimation. In addition, the denominator portion of the formulas shown in Equations 3 and 4 has the same value for each candidate for the unknown attribute. Therefore, the conditional marginal distribution calculator 356 may be configured to calculate only the numerator portion of the equations shown in Equations 3 and 4 as values according to the conditional marginal distribution. In other words, the conditional marginal distribution calculation unit 356 calculates the number of training data falling on the specified leaf node out of the entire training data D, or a value obtained by correcting the number with the area, as a value according to the conditional marginal distribution. and the like may be calculated.
 推定部357は、重み情報344と条件付周辺分布算出部356が算出した条件付周辺分布に応じた値とに基づいて、候補のうち未知の属性として尤もらしい属性の値を推定する。また、推定部357は、推定した結果を推定情報345として記憶部340に格納する。 Based on the weight information 344 and the value corresponding to the conditional marginal distribution calculated by the conditional marginal distribution calculation unit 356, the estimation unit 357 estimates the value of the attribute that is likely to be the unknown attribute among the candidates. Also, the estimation unit 357 stores the estimated result in the storage unit 340 as estimation information 345 .
 例えば、推定部357は、下記数6で示すように、重みと条件付周辺分布に応じた値との積が最大化するiを特定することで、i’を特定する。そして、尤もらしい属性の値として、特定したi’に応じたv1i’を出力する。なお、i’は、1からkまでのうちのいずれかの値をとる。
For example, the estimation unit 357 identifies i′ by identifying i that maximizes the product of the weight and the value according to the conditional marginal distribution, as shown in Equation 6 below. Then, v 1i' corresponding to the specified i' is output as a plausible attribute value. Note that i' takes any value from 1 to k.
 なお、数6は、重み算出部355が非特許文献1に記載の方法で重みを算出した場合の推定部357の処理例を例示している。例えば、数6では、非特許文献1における推定方法のうち条件なしの周辺分布を用いる部分を条件付きの周辺分布に応じた値に置き換えている。このように、推定部357は、重み算出部355による重みの算出方法に応じた方法で推定処理を行ってよい。例えば、重み算出部355が非特許文献2に記載の方法で重みを算出する場合、推定部357は、非特許文献2における推定方法のうち条件なしの周辺分布を用いる部分を条件付きの周辺分布に応じた値に置き換えて推定処理を行うよう構成してよい。 Note that Equation 6 exemplifies a processing example of the estimation unit 357 when the weight calculation unit 355 calculates the weight by the method described in Non-Patent Document 1. For example, in Equation 6, the portion using unconditional marginal distributions in the estimation method in Non-Patent Document 1 is replaced with values according to conditional marginal distributions. In this manner, the estimating section 357 may perform the estimation process by a method according to the weight calculation method by the weight calculating section 355 . For example, when the weight calculator 355 calculates the weights by the method described in Non-Patent Document 2, the estimator 357 replaces the portion of the estimation method in Non-Patent Document 2 that uses the unconditional marginal distribution with the conditional marginal distribution. may be configured to perform the estimation process by replacing with a value corresponding to .
 評価部358は、推定情報345に基づく評価を行う。換言すると、評価部358は、推定部357による推定の結果に基づいて、リスク評価を行う。 The evaluation unit 358 performs evaluation based on the estimated information 345. In other words, the evaluation unit 358 performs risk evaluation based on the estimation results of the estimation unit 357 .
 例えば、評価部358は、事前情報341が示す未知の属性が実際にはどのような値であったかを示す情報である正解情報を有している。例えば、図6で例示する場合、評価部358は、xが(v11、…、v1k)のうちのいずれの値であるかを示す正解情報を有している。評価部358は、推定部357による推定の結果と、正解情報が示す実際の値と、を比較して、比較した結果に基づいてリスクの評価を行うことができる。例えば、評価部358は、推定部357による推定の結果と、正解情報が示す実際の値と、が一致している場合にリスクが高い、と評価することができる。一方、推定部357による推定の結果と、正解情報が示す実際の値と、が一致していない場合、評価部358は、リスクが低い、と評価することができる。 For example, the evaluation unit 358 has correct answer information, which is information indicating what values the unknown attributes indicated by the prior information 341 were actually. For example, in the case of FIG. 6, the evaluation unit 358 has correct answer information indicating which value of (v 11 , . . . , v 1k ) x 1 is. The evaluation unit 358 can compare the result of estimation by the estimation unit 357 and the actual value indicated by the correct answer information, and perform risk evaluation based on the comparison result. For example, the evaluation unit 358 can evaluate that the risk is high when the result of estimation by the estimation unit 357 and the actual value indicated by the correct answer information match. On the other hand, when the result of estimation by the estimation unit 357 and the actual value indicated by the correct answer information do not match, the evaluation unit 358 can evaluate that the risk is low.
 なお、上述したように、事前情報341には、部分訓練データ情報と欠損属性情報とを対応付けた情報が複数含まれている。そのため、推定部357は、上記対応付けた情報ごとに候補の推定を行うことができる。そこで、例えば、評価部358は、推定部357による複数の推定の結果と、各推定に応じた正解情報と、の比較結果に基づいて、リスクの評価を行ってもよい。具体的に、例えば、評価部358は、複数の比較の結果に応じて、推定の結果と正解情報とが一致した割合を示す正答率を算出する。そして、評価部358は、リスクを示す情報として、例えば、算出した正答率を出力することができる。評価部358は、算出した正答率が予め定められた閾値を超えているか否かなどに応じてリスクを評価して、評価した結果を出力するよう構成してもよい。 As described above, the prior information 341 includes a plurality of pieces of information in which partial training data information and missing attribute information are associated with each other. Therefore, the estimating unit 357 can estimate a candidate for each of the associated information. Therefore, for example, the evaluation unit 358 may perform risk evaluation based on a comparison result between a plurality of estimation results by the estimation unit 357 and correct information corresponding to each estimation. Specifically, for example, the evaluation unit 358 calculates the percentage of correct answers indicating the percentage of matches between the estimation results and the correct information, according to the results of a plurality of comparisons. Then, the evaluation unit 358 can output, for example, the calculated percentage of correct answers as the information indicating the risk. The evaluation unit 358 may be configured to evaluate the risk according to whether or not the calculated percentage of correct answers exceeds a predetermined threshold, and output the evaluation result.
 出力部359は、推定部357が推定した候補を示す情報や、評価部358による評価結果を示す情報などを出力する。例えば、出力部359は、上記各情報を画面表示部320上に表示させたり、通信I/F部330を介して外部装置に対して送信したりする。 The output unit 359 outputs information indicating candidates estimated by the estimation unit 357, information indicating evaluation results by the evaluation unit 358, and the like. For example, the output unit 359 displays each of the above information on the screen display unit 320 or transmits the information to an external device via the communication I/F unit 330 .
 以上が、リスク評価装置300の構成例である。続いて、図9、図10を参照してリスク評価装置300の動作例について説明する。 The above is a configuration example of the risk evaluation device 300. Next, an operation example of the risk assessment device 300 will be described with reference to FIGS. 9 and 10. FIG.
 まず、図9を参照して、未知の属性を推定する際のリスク評価装置300の動作例について説明する。図9は、非特許文献1に記載の方法で重みを算出する場合における、未知の属性推定時のリスク評価装置300の動作例を示すフローチャートである。図9を参照すると、候補データ作成部351は、事前情報341に基づいて候補データを作成する(ステップS101)。例えば、候補データ作成部351は、欠損属性情報が示す候補の数に応じた候補データを作成する。 First, an operation example of the risk evaluation device 300 when estimating an unknown attribute will be described with reference to FIG. FIG. 9 is a flowchart showing an operation example of the risk evaluation device 300 when estimating an unknown attribute when calculating weights by the method described in Non-Patent Document 1. FIG. Referring to FIG. 9, the candidate data creating unit 351 creates candidate data based on the prior information 341 (step S101). For example, the candidate data creation unit 351 creates candidate data according to the number of candidates indicated by the missing attribute information.
 候補データ送信部352は、候補データ作成部351が作成した各候補データをモデル格納装置200に対して送信する(ステップS102)。 The candidate data transmission unit 352 transmits each candidate data created by the candidate data creation unit 351 to the model storage device 200 (step S102).
 推論結果取得部353は、モデル格納装置200から候補データに基づく推論の結果として、候補データごとに推論ラベルを取得する(ステップS103)。 The inference result acquisition unit 353 acquires an inference label for each candidate data from the model storage device 200 as an inference result based on the candidate data (step S103).
 決定木情報受取部354は、学習モデル241についての情報をモデル格納装置200から受け取る(ステップS104)。ステップS103とステップS104の処理は、どちらが先に行われてもよいし、並列で行われてもよい。 The decision tree information receiving unit 354 receives information about the learning model 241 from the model storage device 200 (step S104). Either step S103 or step S104 may be performed first, or may be performed in parallel.
 重み算出部355は、既知属性についての知識と未知属性についての知識を用いて、重みを算出する(ステップS105)。例えば、重み算出部355は、事前情報341と推論結果情報342に基づいて、所定のエラー関数を用いることで、推論ラベルと推論対象となった候補データの作成元になった部分訓練データ情報に含まれるラベルとの間のずれを重みとして算出する。 The weight calculation unit 355 calculates weights using knowledge about known attributes and knowledge about unknown attributes (step S105). For example, the weight calculation unit 355 uses a predetermined error function based on the prior information 341 and the inference result information 342 to obtain the partial training data information from which the inference label and the candidate data to be inferred are created. Calculate the deviation between the included labels as a weight.
 条件付周辺分布算出部356は、決定木情報343を用いて条件付周辺分布に応じた値を算出する(ステップS106)。例えば、条件付周辺分布算出部356は、訓練データ全体Dのうち、特定した葉ノードに対して落ちる訓練データの数を算出することなどにより、条件付周辺分布に応じた値を算出する。 The conditional marginal distribution calculator 356 calculates a value according to the conditional marginal distribution using the decision tree information 343 (step S106). For example, the conditional marginal distribution calculation unit 356 calculates a value according to the conditional marginal distribution by calculating the number of training data falling on a specified leaf node among the entire training data D. FIG.
 推定部357は、重み情報344と条件付周辺分布算出部356が算出した条件付周辺分布に応じた値とに基づいて、候補のうち未知の属性として尤もらしい属性の値を推定する(ステップS107)。例えば、推定部357は、重みと条件付周辺分布に応じた値との積が最大化するiを特定することなどにより、未知の属性値を推定する。 Based on the weight information 344 and the value corresponding to the conditional marginal distribution calculated by the conditional marginal distribution calculation unit 356, the estimation unit 357 estimates the value of the attribute that is likely to be the unknown attribute among the candidates (step S107). ). For example, the estimating unit 357 estimates the unknown attribute value by specifying i that maximizes the product of the weight and the value according to the conditional marginal distribution.
 以上が、属性推定時のリスク評価装置300の構成例である。なお、非特許文献1に記載方法を用いて重みを算出する代わりに非特許文献2に記載の方法を用いて重みを算出する場合、リスク評価装置300は、ステップS101からステップS103までの処理を省略してもよい。この場合、リスク評価装置300は、ステップS105の処理において、決定木情報343などを用いて重みを算出してよい。 The above is a configuration example of the risk evaluation device 300 at the time of attribute estimation. When calculating the weight using the method described in Non-Patent Document 2 instead of using the method described in Non-Patent Document 1, the risk evaluation device 300 performs the processes from step S101 to step S103. May be omitted. In this case, the risk evaluation device 300 may calculate the weight using the decision tree information 343 or the like in the process of step S105.
 続いて、図10を参照してリスク評価時のリスク評価装置300の動作例について説明する。図10は、リスク評価時におけるリスク評価装置300の動作例を示すフローチャートである。図10を参照すると、リスク評価装置300は、図9を参照して説明した未知の属性について推定する処理を行う(ステップS201)。 Next, an operation example of the risk evaluation device 300 during risk evaluation will be described with reference to FIG. FIG. 10 is a flowchart showing an operation example of the risk evaluation device 300 during risk evaluation. Referring to FIG. 10, the risk evaluation device 300 performs the process of estimating the unknown attributes described with reference to FIG. 9 (step S201).
 推定対象が事前情報341に残っている場合(ステップS202、No)、リスク評価装置300は、ステップS201の処理に戻って推定処理を行う。一方、事前情報341内に推定対象がなくなった場合(ステップS202、Yes)、リスク評価装置300は、各推定の結果に応じたリスク評価を行う(ステップS203)。例えば、リスク評価装置300は、各推定の結果と、各推定に応じた正解情報と、の比較結果に基づいて正答率を算出して、算出した正答率に応じた出力を行うことができる。 When the estimation target remains in the prior information 341 (step S202, No), the risk evaluation device 300 returns to the process of step S201 and performs the estimation process. On the other hand, when there is no estimation target in the prior information 341 (step S202, Yes), the risk evaluation device 300 performs risk evaluation according to each estimation result (step S203). For example, the risk assessment device 300 can calculate the percentage of correct answers based on the results of comparison between the results of each estimation and the correct answer information corresponding to each estimation, and output according to the calculated percentage of correct answers.
 以上が、リスク評価時におけるリスク評価装置300の動作例である。なお、ステップS203の処理は、ステップS201、S202の処理の後に必ずしも連続的に行われなくてもよい。例えば、ステップS203の処理は、ステップS201、S202の処理の後、任意のタイミングで行ってよい。 The above is an example of the operation of the risk evaluation device 300 during risk evaluation. Note that the process of step S203 does not necessarily have to be performed continuously after the processes of steps S201 and S202. For example, the process of step S203 may be performed at any timing after the processes of steps S201 and S202.
 このように、リスク評価装置300は、重み算出部355と、条件付周辺分布算出部356と、推定部357と、を有している。このような構成によると、推定部357は、重み算出部355が算出した重みと条件付周辺分布算出部356が算出した条件付周辺分布に応じた値とに基づいて、候補のうち未知の属性として尤もらしい属性の値を推定することができる。その結果、より的確にデータを推定できる。 Thus, the risk evaluation device 300 has a weight calculator 355 , a conditional marginal distribution calculator 356 and an estimator 357 . According to such a configuration, the estimation unit 357 calculates the unknown attribute of the candidate based on the weight calculated by the weight calculation unit 355 and the value corresponding to the conditional marginal distribution calculated by the conditional marginal distribution calculation unit 356. can estimate the value of the plausible attribute as As a result, data can be estimated more accurately.
 なお、本実施形態においては、未知の属性がx1つである場合について例示した。しかしながら、本発明は、未知の属性が複数ある場合であっても問題なく適用することができる。 Note that the present embodiment has exemplified the case where there is one unknown attribute x 1 . However, the present invention can be applied without problems even when there are multiple unknown attributes.
 例えば、図11は、未知の属性がxからxまで複数ある場合における事前情報341の一例を示している。例えば、図11では、属性(xn+1、…、x)とラベルyとが既知であり、属性(x、…、x)が欠損している場合について例示している。この場合、欠損属性情報は、欠損している各属性の値についての情報を示すことになる。このように、未知属性が複数ある場合であっても、本発明は問題なく適用できる。 For example, FIG. 11 shows an example of prior information 341 when there are multiple unknown attributes from x1 to xn . For example, FIG. 11 illustrates a case where attributes (x n+1 , . . . , x d ) and label y are known and attributes (x 1 , . . . , x n ) are missing. In this case, the missing attribute information indicates information about the value of each missing attribute. Thus, even if there are multiple unknown attributes, the present invention can be applied without any problem.
 なお、本実施形態においては、リスク評価システム100がモデル格納装置200とリスク評価装置300とを有する場合について例示した。しかしながら、リスク評価システム100は、例えば、本実施形態で説明したモデル格納装置200とリスク評価装置300としての機能を有する1台の情報処理装置から構成されてもよい。リスク評価システム100は、その他既知の変形例を採用してもよい。 In addition, in this embodiment, the case where the risk evaluation system 100 has the model storage device 200 and the risk evaluation device 300 is exemplified. However, the risk evaluation system 100 may be composed of, for example, one information processing device having the functions of the model storage device 200 and the risk evaluation device 300 described in this embodiment. Risk assessment system 100 may employ other known variations.
[第2の実施形態]
 次に、本開示の第2の実施形態について、図12、図13を参照して説明する。図12は、推定装置400のハードウェア構成例を示す図である。図13は、推定装置400の構成例を示すブロック図である。
[Second embodiment]
Next, a second embodiment of the present disclosure will be described with reference to FIGS. 12 and 13. FIG. FIG. 12 is a diagram illustrating a hardware configuration example of the estimation device 400. As illustrated in FIG. FIG. 13 is a block diagram showing a configuration example of the estimation device 400. As shown in FIG.
 本開示の第2の実施形態においては、既知の属性についての情報などに基づいて未知の属性値を推定する情報処理装置である推定装置400の構成例について説明する。図12は、推定装置400のハードウェア構成例を示している。図12を参照すると、推定装置400は、一例として、以下のようなハードウェア構成を有している。
 ・CPU(Central Processing Unit)401(演算装置)
 ・ROM(Read Only Memory)402(記憶装置)
 ・RAM(Random Access Memory)403(記憶装置)
 ・RAM403にロードされるプログラム群404
 ・プログラム群404を格納する記憶装置405
 ・情報処理装置外部の記録媒体410の読み書きを行うドライブ装置406
 ・情報処理装置外部の通信ネットワーク411と接続する通信インタフェース407
 ・データの入出力を行う入出力インタフェース408
 ・各構成要素を接続するバス409
In a second embodiment of the present disclosure, a configuration example of an estimation device 400, which is an information processing device that estimates unknown attribute values based on information about known attributes, will be described. FIG. 12 shows a hardware configuration example of the estimation device 400. As shown in FIG. Referring to FIG. 12, the estimating device 400 has the following hardware configuration as an example.
- CPU (Central Processing Unit) 401 (arithmetic unit)
・ROM (Read Only Memory) 402 (storage device)
・RAM (Random Access Memory) 403 (storage device)
Program group 404 loaded into RAM 403
- Storage device 405 for storing program group 404
- A drive device 406 that reads and writes a recording medium 410 outside the information processing device
- A communication interface 407 that connects to a communication network 411 outside the information processing apparatus
An input/output interface 408 for inputting/outputting data
A bus 409 connecting each component
 また、推定装置400は、プログラム群404をCPU401が取得して当該CPU401が実行することで、図13に示す重み算出部421、条件付周辺分布算出部422、推定部423としての機能を実現することができる。なお、プログラム群404は、例えば、予め記憶装置405やROM402に格納されており、必要に応じてCPU401がRAM403などにロードして実行する。また、プログラム群404は、通信ネットワーク411を介してCPU401に供給されてもよいし、予め記録媒体410に格納されており、ドライブ装置406が該プログラムを読み出してCPU401に供給してもよい。 Also, the estimation apparatus 400 realizes the functions of the weight calculation unit 421, the conditional marginal distribution calculation unit 422, and the estimation unit 423 shown in FIG. be able to. The program group 404 is stored in the storage device 405 or the ROM 402 in advance, for example, and is loaded into the RAM 403 or the like by the CPU 401 as necessary and executed. The program group 404 may be supplied to the CPU 401 via the communication network 411 or stored in the recording medium 410 in advance, and the drive device 406 may read the program and supply it to the CPU 401 .
 なお、図12は、推定装置400のハードウェア構成例を示している。推定装置400のハードウェア構成は上述した場合に限定されない。例えば、推定装置400は、ドライブ装置406を有さないなど、上述した構成の一部から構成されてもよい。 Note that FIG. 12 shows a hardware configuration example of the estimating device 400 . The hardware configuration of estimation device 400 is not limited to the case described above. For example, the estimating device 400 may be configured from part of the configuration described above, such as not having the drive device 406 .
 重み算出部421は、未知の属性候補を示す情報と既知の属性についての情報とに基づいて、所定の重みを算出する。例えば、重み算出部421は、非特許文献1や非特許文献2に記載されている方法を用いて重みを算出することができる。 The weight calculator 421 calculates a predetermined weight based on information indicating unknown attribute candidates and information about known attributes. For example, the weight calculator 421 can calculate the weight using the methods described in Non-Patent Document 1 and Non-Patent Document 2.
 条件付周辺分布算出部422は、決定木の情報に基づいて、一部の属性の値が既知である条件下における未知属性の条件付周辺分布に応じた値を算出する。例えば、条件付周辺分布算出部422は、未知属性をある候補とした際に落ちる葉ノードに対して落ちる訓練データの数を算出することで前記条件付周辺分布に応じた値を算出する。 The conditional marginal distribution calculation unit 422 calculates values according to the conditional marginal distribution of unknown attributes under the condition that the values of some attributes are known, based on the information of the decision tree. For example, the conditional marginal distribution calculation unit 422 calculates a value corresponding to the conditional marginal distribution by calculating the number of falling training data for a leaf node that falls when an unknown attribute is set as a candidate.
 推定部423は、重み算出部421が算出した重みと、条件付周辺分布算出部422が算出した条件付周辺分布に応じた値と、に基づいて、未知の属性の値を推定する。 The estimation unit 423 estimates the value of the unknown attribute based on the weight calculated by the weight calculation unit 421 and the value corresponding to the conditional marginal distribution calculated by the conditional marginal distribution calculation unit 422 .
 このように推定装置400は、重み算出部421と、条件付周辺分布算出部422と、推定部423と、を有している。このような構成によると、推定部423は、重み算出部421が算出した重みと、条件付周辺分布算出部422が算出した条件付周辺分布に応じた値と、に基づいて、未知の属性の値を推定することができる。その結果、より正確な周辺分布であることが期待できる条件付周辺分布に応じた値に基づく推定を行うことができ、これにより、より的確な推定を行うことができる。 Thus, the estimation device 400 has a weight calculator 421 , a conditional marginal distribution calculator 422 , and an estimator 423 . According to such a configuration, the estimation unit 423 calculates the unknown attribute based on the weight calculated by the weight calculation unit 421 and the value according to the conditional marginal distribution calculated by the conditional marginal distribution calculation unit 422. values can be estimated. As a result, it is possible to perform estimation based on values corresponding to the conditional marginal distribution, which can be expected to be a more accurate marginal distribution, thereby performing more accurate estimation.
 なお、上述した推定装置400は、当該推定装置400などの情報処理装置に所定のプログラムが組み込まれることで実現できる。具体的に、本発明の他の形態であるプログラムは、推定装置400などの情報処理装置に、未知の属性候補を示す情報と既知の属性についての情報とに基づいて所定の重みを算出し、決定木の情報に基づいて条件付周辺分布に応じた値を算出し、算出した重みと、算出した条件付周辺分布に応じた値と、に基づいて、未知の属性の値を推定する、処理を実現するためのプログラムである。 Note that the estimation device 400 described above can be realized by installing a predetermined program in an information processing device such as the estimation device 400 . Specifically, a program that is another aspect of the present invention causes an information processing device such as the estimation device 400 to calculate a predetermined weight based on information indicating an unknown attribute candidate and information about a known attribute, A process of calculating a value according to the conditional marginal distribution based on the decision tree information, and estimating the value of the unknown attribute based on the calculated weight and the calculated value according to the conditional marginal distribution. It is a program to realize
 また、上述した推定装置400などの情報処理装置により実行される推定方法は、推定装置400などの情報処理装置が、未知の属性候補を示す情報と既知の属性についての情報とに基づいて所定の重みを算出し、決定木の情報に基づいて条件付周辺分布に応じた値を算出し、算出した重みと、算出した条件付周辺分布に応じた値と、に基づいて、未知の属性の値を推定する、という方法である。 Further, in the estimation method executed by the information processing apparatus such as the estimation apparatus 400 described above, the information processing apparatus such as the estimation apparatus 400 performs a predetermined calculation based on information indicating unknown attribute candidates and information about known attributes. Calculate the weight, calculate the value according to the conditional marginal distribution based on the decision tree information, and calculate the value of the unknown attribute based on the calculated weight and the calculated value according to the conditional marginal distribution is a method of estimating
 上述した構成を有する、プログラム、又は、プログラムを記録したコンピュータが読み取り可能な記録媒体、又は、推定方法、の発明であっても、上述した推定装置400と同様の作用・効果を奏するために、上述した本開示の目的を達成することができる。 Even in the invention of the program, the computer-readable recording medium recording the program, or the estimation method having the configuration described above, in order to achieve the same effects and effects as the estimation device 400 described above, The objectives of the present disclosure described above can be achieved.
 <付記>
 上記実施形態の一部又は全部は、以下の付記のようにも記載されうる。以下、本発明における推定装置などの概略を説明する。但し、本発明は、以下の構成に限定されない。
<Appendix>
Some or all of the above embodiments may also be described as the following appendices. An outline of the estimation device and the like according to the present invention will be described below. However, the present invention is not limited to the following configurations.
(付記1)
 未知の属性候補を示す情報と既知の属性についての情報とに基づいて所定の重みを算出する重み算出部と、
 決定木の情報に基づいて、一部の属性の値が既知である条件下における未知属性の条件付周辺分布に応じた値を算出する条件付周辺分布算出部と、
 前記重み算出部が算出した前記重みと、前記条件付周辺分布算出部が算出した前記条件付周辺分布に応じた値と、に基づいて、未知の属性の値を推定する推定部と、
 を有する
 推定装置。
(付記2)
 付記1に記載の推定装置であって
 前記条件付周辺分布算出部は、未知属性をある候補とした際に落ちる葉ノードに対して落ちる訓練データの数を算出することで前記条件付周辺分布に応じた値を算出する
 推定装置。
(付記3)
 付記2に記載の推定装置であって、
 前記条件付周辺分布算出部は、未知属性をある候補とした際に落ちる葉ノードに対して落ちる訓練データの数を、未知属性を各候補とした際にそれぞれ落ちる葉ノードに対してそれぞれ落ちる訓練データの数の和で割ることで、前記条件付周辺分布に応じた値を算出する
 推定装置。
(付記4)
 付記2または付記3に記載の推定装置であって、
 前記条件付周辺分布算出部は、未知属性をある候補とした際に落ちる葉ノードに対して落ちる訓練データの数に対して所定の補正処理を行うことで、前記条件付周辺分布に応じた値を算出する
 推定装置。
(付記5)
 付記4に記載の推定装置であって、
 前記条件付周辺分布算出部は、未知属性をある候補とした際に落ちる葉ノードに対して落ちる訓練データの数を特徴量空間における単位面積あたりの数に補正する補正処理を行うことで、前記条件付周辺分布に応じた値を算出する
 推定装置。
(付記6)
 付記5に記載の推定装置であって、
 葉ノードに振り分けられる訓練データにおいて属性が取りうる値の個数または範囲に基づいて面積を算出する
 推定装置。
(付記7)
 付記1から付記6までのうちのいずれか1項に記載の推定装置であって、
 前記重み算出部は、未知の属性候補を示す情報と既知の属性についての情報とに基づいて推測される推測ラベルと、真のラベルと、の間のずれを所定のエラー関数を用いて算出することで前記重みを算出し、
 前記推定部は、前記重み算出部が前記重みとして算出した前記ずれと、前記条件付周辺分布算出部が算出した前記条件付周辺分布に応じた値と、に基づいて、未知の属性の値を推定する
 推定装置。
(付記8)
 付記1から付記6までのうちのいずれか1項に記載の推定装置であって、
 前記重み算出部は、未知の属性候補を示す情報と既知の属性についての情報とに基づいて所定の比率を算出することで前記重みを算出し、
 前記推定部は、前記重み算出部が前記重みとして算出した前記比率と、前記条件付周辺分布算出部が算出した前記条件付周辺分布に応じた値と、に基づいて、未知の属性の値を推定する
 推定装置。
(付記9)
 情報処理装置が、
 未知の属性候補を示す情報と既知の属性についての情報とに基づいて所定の重みを算出し、
 決定木の情報に基づいて条件付周辺分布に応じた値を算出し、
 算出した前記重みと、算出した前記条件付周辺分布に応じた値と、に基づいて、未知の属性の値を推定する
 推定方法。
(付記10)
 情報処理装置に、
 未知の属性候補を示す情報と既知の属性についての情報とに基づいて所定の重みを算出し、
 決定木の情報に基づいて条件付周辺分布に応じた値を算出し、
 算出した前記重みと、算出した前記条件付周辺分布に応じた値と、に基づいて、未知の属性の値を推定する
 処理を実現するためのプログラムを記録した、コンピュータが読み取り可能な記録媒体。
(Appendix 1)
a weight calculator that calculates a predetermined weight based on information indicating unknown attribute candidates and information about known attributes;
a conditional marginal distribution calculation unit that calculates a value according to the conditional marginal distribution of unknown attributes under the condition that the values of some attributes are known, based on the decision tree information;
an estimating unit for estimating a value of an unknown attribute based on the weight calculated by the weight calculating unit and a value corresponding to the conditional marginal distribution calculated by the conditional marginal distribution calculating unit;
an estimator.
(Appendix 2)
1. The estimation apparatus according to appendix 1, wherein the conditional marginal distribution calculation unit calculates the number of training data that falls for a leaf node that falls when an unknown attribute is a certain candidate, so that the conditional marginal distribution An estimating device that calculates a corresponding value.
(Appendix 3)
The estimating device according to Supplementary Note 2,
The conditional marginal distribution calculation unit calculates the number of training data falling for each leaf node falling when an unknown attribute is a certain candidate, and the number of training data falling for each leaf node falling when each candidate is an unknown attribute. An estimating device that calculates a value according to the conditional marginal distribution by dividing by the sum of the number of data.
(Appendix 4)
The estimating device according to Supplementary Note 2 or Supplementary Note 3,
The conditional marginal distribution calculation unit performs a predetermined correction process on the number of falling training data for a leaf node that falls when an unknown attribute is a certain candidate, thereby obtaining a value corresponding to the conditional marginal distribution. An estimator that calculates
(Appendix 5)
The estimating device according to Supplementary Note 4,
The conditional marginal distribution calculation unit performs a correction process of correcting the number of falling training data for a leaf node falling when an unknown attribute is a certain candidate to the number per unit area in the feature amount space, An estimator that calculates values according to conditional marginal distributions.
(Appendix 6)
The estimating device according to Supplementary Note 5,
An estimator that calculates an area based on the number or range of values that attributes can take in training data assigned to leaf nodes.
(Appendix 7)
The estimating device according to any one of Supplements 1 to 6,
The weight calculator uses a predetermined error function to calculate a deviation between an estimated label estimated based on information indicating an unknown attribute candidate and information about a known attribute and a true label. Calculate the weights by
The estimating unit calculates a value of an unknown attribute based on the deviation calculated as the weight by the weight calculating unit and the value corresponding to the conditional marginal distribution calculated by the conditional marginal distribution calculating unit. estimating estimating device.
(Appendix 8)
The estimating device according to any one of Supplements 1 to 6,
The weight calculation unit calculates the weight by calculating a predetermined ratio based on information indicating an unknown attribute candidate and information about a known attribute,
The estimation unit calculates a value of an unknown attribute based on the ratio calculated as the weight by the weight calculation unit and the value corresponding to the conditional marginal distribution calculated by the conditional marginal distribution calculation unit. estimating estimating device.
(Appendix 9)
The information processing device
calculating a predetermined weight based on information indicating unknown attribute candidates and information about known attributes;
Calculate the value according to the conditional marginal distribution based on the information of the decision tree,
An estimation method for estimating a value of an unknown attribute based on the calculated weight and the calculated value according to the conditional marginal distribution.
(Appendix 10)
information processing equipment,
calculating a predetermined weight based on information indicating unknown attribute candidates and information about known attributes;
Calculate the value according to the conditional marginal distribution based on the information of the decision tree,
A computer-readable recording medium recording a program for realizing a process of estimating the value of an unknown attribute based on the calculated weight and the calculated value according to the conditional marginal distribution.
 以上、上記各実施形態を参照して本願発明を説明したが、本願発明は、上述した実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明の範囲内で当業者が理解しうる様々な変更をすることができる。 Although the present invention has been described with reference to the above-described embodiments, the present invention is not limited to the above-described embodiments. Various changes that can be understood by those skilled in the art can be made to the configuration and details of the present invention within the scope of the present invention.
100 リスク評価システム
200 モデル格納装置
210 受信部
220 推論部
230 出力部
240 記憶部
241 学習モデル
300 リスク評価装置
310 操作入力部
320 画面表示部
330 通信I/F部
340 記憶部
341 事前情報
342 推論結果情報
343 決定木情報
344 重み情報
345 推定情報
346 プログラム
350 演算処理部
351 候補データ作成部
352 候補データ送信部
353 推論結果取得部
354 決定木情報受取部
355 重み算出部
356 条件付周辺分布算出部
357 推定部
358 評価部
359 出力部
400 推定装置
401 CPU
402 ROM
403 RAM
404 プログラム群
405 記憶装置
406 ドライブ装置
407 通信インタフェース
408 入出力インタフェース
409 バス
410 記録媒体
411 通信ネットワーク
421 重み算出部
422 条件付周辺分布算出部
423 推定部

 
100 Risk evaluation system 200 Model storage device 210 Reception unit 220 Inference unit 230 Output unit 240 Storage unit 241 Learning model 300 Risk evaluation device 310 Operation input unit 320 Screen display unit 330 Communication I/F unit 340 Storage unit 341 Prior information 342 Inference result Information 343 Decision tree information 344 Weight information 345 Estimation information 346 Program 350 Operation processing unit 351 Candidate data generation unit 352 Candidate data transmission unit 353 Inference result acquisition unit 354 Decision tree information reception unit 355 Weight calculation unit 356 Conditional marginal distribution calculation unit 357 Estimation unit 358 Evaluation unit 359 Output unit 400 Estimation device 401 CPU
402 ROMs
403 RAM
404 program group 405 storage device 406 drive device 407 communication interface 408 input/output interface 409 bus 410 recording medium 411 communication network 421 weight calculator 422 conditional marginal distribution calculator 423 estimator

Claims (10)

  1.  未知の属性候補を示す情報と既知の属性についての情報とに基づいて所定の重みを算出する重み算出部と、
     決定木の情報に基づいて、一部の属性の値が既知である条件下における未知属性の条件付周辺分布に応じた値を算出する条件付周辺分布算出部と、
     前記重み算出部が算出した前記重みと、前記条件付周辺分布算出部が算出した前記条件付周辺分布に応じた値と、に基づいて、未知の属性の値を推定する推定部と、
     を有する
     推定装置。
    a weight calculator that calculates a predetermined weight based on information indicating unknown attribute candidates and information about known attributes;
    a conditional marginal distribution calculation unit that calculates a value according to the conditional marginal distribution of unknown attributes under the condition that the values of some attributes are known, based on the decision tree information;
    an estimating unit for estimating a value of an unknown attribute based on the weight calculated by the weight calculating unit and a value corresponding to the conditional marginal distribution calculated by the conditional marginal distribution calculating unit;
    an estimator.
  2.  請求項1に記載の推定装置であって
     前記条件付周辺分布算出部は、未知属性をある候補とした際に落ちる葉ノードに対して落ちる訓練データの数を算出することで前記条件付周辺分布に応じた値を算出する
     推定装置。
    2. The estimation apparatus according to claim 1, wherein the conditional marginal distribution calculation unit calculates the number of training data that falls for a leaf node that falls when an unknown attribute is a candidate, and the conditional marginal distribution An estimating device that calculates a value according to
  3.  請求項2に記載の推定装置であって、
     前記条件付周辺分布算出部は、未知属性をある候補とした際に落ちる葉ノードに対して落ちる訓練データの数を、未知属性を各候補とした際にそれぞれ落ちる葉ノードに対してそれぞれ落ちる訓練データの数の和で割ることで、前記条件付周辺分布に応じた値を算出する
     推定装置。
    The estimating device according to claim 2,
    The conditional marginal distribution calculation unit calculates the number of training data falling for each leaf node falling when an unknown attribute is a certain candidate, and the number of training data falling for each leaf node falling when each candidate is an unknown attribute. An estimating device that calculates a value according to the conditional marginal distribution by dividing by the sum of the number of data.
  4.  請求項2または請求項3に記載の推定装置であって、
     前記条件付周辺分布算出部は、未知属性をある候補とした際に落ちる葉ノードに対して落ちる訓練データの数に対して所定の補正処理を行うことで、前記条件付周辺分布に応じた値を算出する
     推定装置。
    The estimating device according to claim 2 or 3,
    The conditional marginal distribution calculation unit performs a predetermined correction process on the number of falling training data for a leaf node that falls when an unknown attribute is a certain candidate, thereby obtaining a value corresponding to the conditional marginal distribution. An estimator that calculates
  5.  請求項4に記載の推定装置であって、
     前記条件付周辺分布算出部は、未知属性をある候補とした際に落ちる葉ノードに対して落ちる訓練データの数を特徴量空間における単位面積あたりの数に補正する補正処理を行うことで、前記条件付周辺分布に応じた値を算出する
     推定装置。
    The estimating device according to claim 4,
    The conditional marginal distribution calculation unit performs a correction process of correcting the number of falling training data for a leaf node falling when an unknown attribute is a certain candidate to the number per unit area in the feature amount space, An estimator that calculates values according to conditional marginal distributions.
  6.  請求項5に記載の推定装置であって、
     葉ノードに振り分けられる訓練データにおいて属性が取りうる値の個数または範囲に基づいて面積を算出する
     推定装置。
    The estimating device according to claim 5,
    An estimator that calculates an area based on the number or range of values that attributes can take in training data assigned to leaf nodes.
  7.  請求項1から請求項6までのうちのいずれか1項に記載の推定装置であって、
     前記重み算出部は、未知の属性候補を示す情報と既知の属性についての情報とに基づいて推測される推測ラベルと、真のラベルと、の間のずれを所定のエラー関数を用いて算出することで前記重みを算出し、
     前記推定部は、前記重み算出部が前記重みとして算出した前記ずれと、前記条件付周辺分布算出部が算出した前記条件付周辺分布に応じた値と、に基づいて、未知の属性の値を推定する
     推定装置。
    The estimating device according to any one of claims 1 to 6,
    The weight calculator uses a predetermined error function to calculate a deviation between an estimated label estimated based on information indicating an unknown attribute candidate and information about a known attribute and a true label. Calculate the weights by
    The estimating unit calculates a value of an unknown attribute based on the deviation calculated as the weight by the weight calculating unit and the value corresponding to the conditional marginal distribution calculated by the conditional marginal distribution calculating unit. estimating estimating device.
  8.  請求項1から請求項6までのうちのいずれか1項に記載の推定装置であって、
     前記重み算出部は、未知の属性候補を示す情報と既知の属性についての情報とに基づいて所定の比率を算出することで前記重みを算出し、
     前記推定部は、前記重み算出部が前記重みとして算出した前記比率と、前記条件付周辺分布算出部が算出した前記条件付周辺分布に応じた値と、に基づいて、未知の属性の値を推定する
     推定装置。
    The estimating device according to any one of claims 1 to 6,
    The weight calculation unit calculates the weight by calculating a predetermined ratio based on information indicating an unknown attribute candidate and information about a known attribute,
    The estimation unit calculates a value of an unknown attribute based on the ratio calculated as the weight by the weight calculation unit and the value corresponding to the conditional marginal distribution calculated by the conditional marginal distribution calculation unit. estimating estimating device.
  9.  情報処理装置が、
     未知の属性候補を示す情報と既知の属性についての情報とに基づいて所定の重みを算出し、
     決定木の情報に基づいて条件付周辺分布に応じた値を算出し、
     算出した前記重みと、算出した前記条件付周辺分布に応じた値と、に基づいて、未知の属性の値を推定する
     推定方法。
    The information processing device
    calculating a predetermined weight based on information indicating unknown attribute candidates and information about known attributes;
    Calculate the value according to the conditional marginal distribution based on the information of the decision tree,
    An estimation method for estimating a value of an unknown attribute based on the calculated weight and the calculated value according to the conditional marginal distribution.
  10.  情報処理装置に、
     未知の属性候補を示す情報と既知の属性についての情報とに基づいて所定の重みを算出し、
     決定木の情報に基づいて条件付周辺分布に応じた値を算出し、
     算出した前記重みと、算出した前記条件付周辺分布に応じた値と、に基づいて、未知の属性の値を推定する
     処理を実現するためのプログラムを記録した、コンピュータが読み取り可能な記録媒体。
     
    information processing equipment,
    calculating a predetermined weight based on information indicating unknown attribute candidates and information about known attributes;
    Calculate the value according to the conditional marginal distribution based on the information of the decision tree,
    A computer-readable recording medium recording a program for realizing a process of estimating the value of an unknown attribute based on the calculated weight and the calculated value according to the conditional marginal distribution.
PCT/JP2022/008618 2022-03-01 2022-03-01 Estimation device WO2023166565A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/JP2022/008618 WO2023166565A1 (en) 2022-03-01 2022-03-01 Estimation device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2022/008618 WO2023166565A1 (en) 2022-03-01 2022-03-01 Estimation device

Publications (1)

Publication Number Publication Date
WO2023166565A1 true WO2023166565A1 (en) 2023-09-07

Family

ID=87883183

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2022/008618 WO2023166565A1 (en) 2022-03-01 2022-03-01 Estimation device

Country Status (1)

Country Link
WO (1) WO2023166565A1 (en)

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
JUN YAJIMA AND OTHERS: "A study on analysis methods for AI security vulnerabilities hidden in machine learning systems", PROCEEDINGS OF THE 2021 CRYPTOGRAPHY AND INFORMATION SECURITY SYMPOSIUM (SCIS 2021); JANUARY 19-22, 2021, IEICE, JP, 19 January 2021 (2021-01-19), JP, pages 1 - 8, XP009549404 *
NAKAMURA, KAZUAKI: "The 141st Keywords you should know. Model Inversion Attack.", THE JOURNAL OF THE INSTITUTE OF IMAGE INFORMATION AND TELEVISION ENGINEERS, vol. 75, no. 3, 1 May 2021 (2021-05-01), pages 384 - 386, XP009548565 *
UNE, MASASHI: "Research trends and issues of machine learning on system security", KINYU KENKYU, vol. 38, no. 1, 22 January 2019 (2019-01-22), pages 97 - 123, XP093088996 *
YUJI HIGUCHI AND OTHERS: "Training data estimation attack using VAE against classification model", PROCEEDINGS OF THE 2020 CRYPTOGRAPHY AND INFORMATION SECURITY SYMPOSIUM (SCIS2020); JANUARY 28-31, 2020, IEICE, JP, 21 January 2020 (2020-01-21) - 31 January 2020 (2020-01-31), JP, pages 1 - 8, XP009549403 *

Similar Documents

Publication Publication Date Title
US20210295100A1 (en) Data processing method and apparatus, electronic device, and storage medium
US11062215B2 (en) Using different data sources for a predictive model
US9721221B2 (en) Skill estimation method in machine-human hybrid crowdsourcing
JP2022514508A (en) Machine learning model commentary Possibility-based adjustment
US10395646B2 (en) Two-stage training of a spoken dialogue system
TW202008264A (en) Method and apparatus for recommendation marketing via deep reinforcement learning
WO2017159403A1 (en) Prediction system, method, and program
US11216534B2 (en) Apparatus, system, and method of covariance estimation based on data missing rate for information processing
KR20210017342A (en) Time series prediction method and apparatus based on past prediction data
US10635078B2 (en) Simulation system, simulation method, and simulation program
Mehdi et al. Trust and reputation of web services through QoS correlation lens
US20210406598A1 (en) Label shift detection and adjustment in predictive modeling
CN110909868A (en) Node representation method and device based on graph neural network model
KR102093080B1 (en) System and method for classifying base on generative adversarial network using labeled data and unlabled data
CN115296984A (en) Method, device, equipment and storage medium for detecting abnormal network nodes
US20160364810A1 (en) Hybrid classification system
CN110717537B (en) Method and device for training user classification model and executing user classification prediction
WO2023166565A1 (en) Estimation device
US20220230028A1 (en) Determination method, non-transitory computer-readable storage medium, and information processing device
US20230162018A1 (en) Dimensional reduction of correlated vectors
CN111724176A (en) Shop traffic adjusting method, device, equipment and computer readable storage medium
WO2023166564A1 (en) Estimation device
WO2022249224A1 (en) Information processing device, information processing method, and program
CN110502715B (en) Click probability prediction method and device
US11640447B1 (en) Meta-model classifier

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22929713

Country of ref document: EP

Kind code of ref document: A1