JPH09297685A - Action deciding method for inference device, and device for executing the method - Google Patents

Action deciding method for inference device, and device for executing the method

Info

Publication number
JPH09297685A
JPH09297685A JP8112738A JP11273896A JPH09297685A JP H09297685 A JPH09297685 A JP H09297685A JP 8112738 A JP8112738 A JP 8112738A JP 11273896 A JP11273896 A JP 11273896A JP H09297685 A JPH09297685 A JP H09297685A
Authority
JP
Japan
Prior art keywords
action
loss
similarity
value
proposition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8112738A
Other languages
Japanese (ja)
Inventor
Kazunori Fujimoto
和則 藤本
Kazumitsu Matsuzawa
和光 松澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP8112738A priority Critical patent/JPH09297685A/en
Publication of JPH09297685A publication Critical patent/JPH09297685A/en
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

PROBLEM TO BE SOLVED: To obtain a decision result equivalent to that obtained when a human being describes the loss value by securing the correspondence between the proposition of an action pair and the small real number value when the similarity is high to the optimum action pair, leading the expected loss value of an action based on the loss value and the posterior probability value, and selecting an action of the least expected loss value. SOLUTION: A loss data processing part 2 sends a pair of propositions to a similarity calculation part 3 to secure the correspondence between the propositions and the similarity of >=0.0 and <=1.0 real number value. A loss value calculation part 4 secures the correspondence between an optional action pair and the loss value of >=0.0 and <=1.0 real number value. At the same time, the correspondence is secured between the optimum action pair and 0.0. Then the correspondence is secured between the loss value and the small value when the similarity is high to the proposition of the optimum action pair. A probability calculation part 6 leads the posterior probability value of each proposition from a fact and the probability data to output it to an expected loss value calculation part 7, and the expected loss value of each action is led from the posterior probability value and the loss data given from the part 2. Then an action decision part 8 extracts an action of the least expected loss value.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】この発明は、推論装置におけ
る行動決定方法およびこの方法を実施する装置に関し、
特に、エキスパートシステム或は知的ロボットの如き知
識処理部を有する自動装置の推論装置において、複数の
解候補の内からユーザに適切な解を選出して複数の行動
パターンの内から自動装置の目的に適合した行動を選出
する推論装置における行動決定方法およびこの方法を実
施する装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an action determining method in an inference apparatus and an apparatus for implementing this method,
In particular, in an inference device of an automatic device having a knowledge processing unit such as an expert system or an intelligent robot, an appropriate solution for a user is selected from a plurality of solution candidates, and the purpose of the automatic device is selected from a plurality of action patterns. The present invention relates to a method for determining an action in an inference device that selects an action suitable for, and a device for performing this method.

【0002】[0002]

【従来の技術】従来例を図2ないし図4を参照して説明
する。人間の行動にアドバイスを与える推論装置は、複
数の行動の内から人間にとって適切な行動を選出する機
能を必要とする。こうした機能を実現する方法として
“人間が被る損失の程度をできるだけ小さくする行動”
を適切な行動として選び出す方法が採用されている。人
間が推論装置に“外出時の服装或は持物”を尋ねる場合
について考える。天気計には{高}、{中}、{低}の
目盛があり、天気としては{晴}、{雨}、{雪}があ
り、行動としては{手ぶら}、{傘}、{傘とブーツ}
がそれぞれあるとする。質問者が事実である{天気計:
高}を入力すると、推論装置は、先ず、図3に示される
確率データPから天気計の目盛に対応する各天気の事後
確率値を取得する。図3において、P(晴|高)=0.
7は天気計の目盛が{高}を示しているとき、晴となる
確率が0. 7であることを示す。この例は図3に基づい
て各天気{晴}、{雨}、{雪}の事後確率値をそれぞ
れ0. 7、0. 2、0. 1と取得することができる。更
に、図4に示される損失データLから、各行動の損失値
を取得する。図4において、L(雨、手ぶら)=1. 0
は、手ぶらで外出して雨が降ったときの損失程度を評価
した値である。この場合、損失値の最大値を1. 0、最
小値を0. 0とし、損失の程度を0. 0から1. の間の
実数値として表す。従って、損失値1. 0は、損失が非
常に大きいことを意味する。そして、推論装置は、こう
して取得した事後確率値Pと損失値Lとから各行動につ
いて損失値の期待値である期待損失値を計算する。例え
ば天気計{高}で行動{傘}をとったときの期待損失値
は、L(晴、傘)×P(晴|高)+L(雨、傘)×P
(雨|高)+L(雪、傘)×P(雪|高)=0. 5×
0. 7+0. 0×0. 2+0. 3×0. 1=0. 38と
計算される。この期待損失値は、天気計の目盛のみがわ
かった段階で予測される損失値を各行動について求めた
値である。同様に、天気計{高}のときの各行動{手ぶ
ら}および{傘とブーツ}の期待損失値は、それぞれ
0. 3、0. 46と計算される。こうして算出された期
待損失値を最小の0. 3にする行動{手ぶら}は、予測
した損失値を最小にする行動であるという意味で“人間
が被る損失の程度をできるだけ小さくする行動”という
ことができる。従って、推論装置は、期待損失値が最小
の行動を適切な行動{手ぶら}を選び出して提示する。
2. Description of the Related Art A conventional example will be described with reference to FIGS. An inference device that gives advice to a human action needs a function of selecting a proper action for a human from a plurality of actions. As a method to realize such a function, "action to reduce the degree of loss human suffers as much as possible"
Is adopted as an appropriate action. Consider a case where a human being asks the reasoning device about “clothes or belongings when going out”. The weather gauge has {high}, {medium}, and {low} scales, the weather has {fine}, {rain}, and {snow}, and the actions are {hands}, {umbrella}, and {umbrella}. And boots}
Suppose that there is each. The questioner is a fact {weather gauge:
When High} is input, the inference apparatus first obtains the posterior probability value of each weather corresponding to the scale of the weather meter from the probability data P shown in FIG. In FIG. 3, P (clear | high) = 0.
7 indicates that when the scale of the weather gauge indicates {high}, the probability of clear weather is 0.7. In this example, the posterior probability values of each weather {clear}, {rain}, and {snow} can be acquired as 0.7, 0.2, and 0.1 based on FIG. Furthermore, the loss value of each action is acquired from the loss data L shown in FIG. In FIG. 4, L (rain, empty-handed) = 1.0
Is a value that evaluates the degree of loss when it goes out by hand and it rains. In this case, the maximum loss value is 1.0 and the minimum value is 0.0, and the degree of loss is expressed as a real value between 0.0 and 1.0. Therefore, a loss value of 1.0 means that the loss is very large. Then, the inference apparatus calculates the expected loss value which is the expected value of the loss value for each action from the posterior probability value P and the loss value L thus acquired. For example, the expected loss value when taking an action {umbrella} with a weather meter {high} is L (fine, umbrella) x P (fine | high) + L (rain, umbrella) x P
(Rain | High) + L (Snow, Umbrella) x P (Snow | High) = 0.5 x
It is calculated as 0.7 + 0.0 × 0.2 × 2 + 0.3 × 0.1 = 0.38. This expected loss value is a value obtained by calculating the loss value predicted for each action when only the scale of the weather gauge is known. Similarly, the expected loss values of each action {empty hand} and {umbrella and boots} when the weather meter is {high} are calculated to be 0.3 and 0.46, respectively. The action {empty} that minimizes the expected loss value calculated in this way to 0.3 means that it is the action that minimizes the predicted loss value. You can Therefore, the inference apparatus selects an appropriate action {blank} and presents the action with the smallest expected loss value.

【0003】こうした方法に基づいて、人間の抱える様
々な悩み或は迷いに応えるシステムを実現するには、多
くの命題および行動についての損失データを予め推論装
置に内蔵しておく必要がある。推論に必要となる損失値
の数は、図4に示される如く“行動数×命題数”である
ので、推論装置の取り扱う事象と行動の数が多いと、必
要となる損失値の数はこれらの積として飛躍的に多くな
り、結果として膨大な数の損失値を内蔵することが要求
されるに到る。
In order to realize a system for responding to various worries or hesitations held by humans based on such a method, it is necessary to preliminarily incorporate loss data for many propositions and actions into an inference device. Since the number of loss values required for inference is “the number of actions × the number of propositions” as shown in FIG. 4, if the number of events and actions handled by the inference apparatus is large, the number of loss values required will be these. As a result, the number of loss values increases dramatically, and as a result, it becomes necessary to incorporate a huge number of loss values.

【0004】損失データの獲得にあたって、従来から人
間が直接に数値を記述するという方法が採用されてき
た。例えば、行動{手ぶら}で天気{雨}のときの損失
値は、服がびしょ濡れになるので損失値が大きいと考
え、その損失値を大きい値1. 0として記述する。これ
に対して行動{傘}で天気{晴}のときの損失値は、格
好が悪いがびしょ濡れになるよりはましだから1. 0よ
り小さい値、例えば0. 5として記述する。しかし、こ
うした“人間にとって不得意な数値化作業”に基づく損
失データの獲得方法は、人間の様々な悩み或は迷いに応
えることのできる程多くの損失データを獲得するには困
難な方法である。こうした困難さが推論装置の取り扱え
る問題を或る特定の狭い領域に限定することとなり、好
ましくない制限を強いる原因となっている。
In order to obtain the loss data, a method in which a person directly describes a numerical value has been adopted. For example, the loss value when the behavior is {hands up} and the weather is {rain} is considered to be large because the clothes are soaked, and the loss value is described as a large value 1.0. On the other hand, the loss value when the behavior is {umbrella} and the weather is {clear} is less than 1.0 because it is not so good but it is better than soaking wet, so it is described as 0.5, for example. However, such a loss data acquisition method based on "quantification work that humans are not good at" is a difficult method to obtain a large amount of loss data that can respond to various worries or hesitations of humans. . Such difficulty limits the problem that the reasoning apparatus can handle to a specific narrow area, and causes an undesirable restriction.

【0005】[0005]

【発明が解決しようとする課題】以上の通り、全ての損
失値を人間が主観に基づいて記述することに依っては、
大規模な問題領域を取り扱える推論装置の構築をするこ
とは困難である。この発明は、人間が全ての損失値を記
述しなくても、自動的に損失値を生成することにより人
間が損失値を記述した場合と同等な決定結果を得ること
ができる推論装置における行動決定方法およびこの方法
を実施する装置を提供するものである。
As described above, human beings subjectively describe all loss values,
It is difficult to construct an inference device that can handle large-scale problem areas. The present invention is a behavior determination in an inference device that can obtain a determination result equivalent to that when a human describes a loss value by automatically generating a loss value, even if the human does not describe all loss values. A method and an apparatus for carrying out the method are provided.

【0006】[0006]

【課題を解決するための手段】確率値を値にとる複数の
命題に関して、或る事実と、事実に基づいて命題の事後
確率値を導く確率データと、命題に一つの行動を組み合
わせた行動組の内の最適行動組とを使用して一つの行動
を選出する推論装置における行動決定方法において、任
意の二つの行動組の命題を0以上1以下の実数値より成
る類似度と対応付けし、任意の一つの行動組を0以上1
以下の実数値より成る損失値と対応付けるに際して、最
適行動組については0と対応付け、最適行動組の命題と
類似度がsである命題の行動組については、sが大きい
値のときは小さい値と対応付け、sが小さい値のときは
大きい値と対応付け、損失値と事後確率値とに基づいて
各行動の期待損失値を導き、期待損失値が最小である行
動を一つ選出する推論装置における行動決定方法を構成
した。
[Means for Solving the Problems] Regarding a plurality of propositions whose values are probability values, a certain fact, probability data that derives the posterior probability value of the proposition based on the facts, and an action set that combines one action with the proposition In the action determination method in the inference apparatus that selects one action using the optimal action set in the above, the proposition of any two action sets is associated with a similarity degree consisting of a real value of 0 or more and 1 or less, 0 or more 1 for any one action group
When associating with a loss value consisting of the following real values, the optimal action set is associated with 0, and the action set of the optimal action set and the proposition whose similarity is s are small values when s is large. Inference that associates with a large value when s is a small value, derives the expected loss value of each action based on the loss value and the posterior probability value, and selects one action with the smallest expected loss value. The behavior decision method in the device was constructed.

【0007】そして、先の推論装置における行動決定方
法において、類似度は行動を観点としてみたときの二つ
の命題の類似度である観点類似度である推論装置におけ
る行動決定方法を構成した。また、最適行動組(命題
W、行動A)および行動組(命題X、行動A)が入力さ
れる損失データ処理部2を具備し、損失データ処理部2
から渡される行動Aを有する行動組の命題Xと命題Wよ
り成る命題組(命題W、命題X)の類似度を計算して計
算結果を損失データ処理部2に返す類似計算部3を具備
し、損失データ処理部2から渡される命題組の類似度に
基づいて当該行動組の損失値を計算して計算結果を損失
データ処理部2に返す損失計算部4を具備し、与えられ
る事実および確率データに基づいて命題の事後確率値を
計算処理する確率計算部6を具備し、損失データ処理部
2に返された行動組の損失値の集合である損失データお
よび事後確率値に基づいて期待損失データを計算処理す
る期待損失計算部7を具備し、入力される期待損失デー
タの内の最小期待損失値を取り出す行動決定部8を具備
する推論装置における行動決定装置を構成した。
In the behavior decision method in the inference apparatus, the behavior decision method in the inference apparatus is the point of view similarity, which is the similarity between two propositions when the behavior is viewed from the viewpoint. The loss data processing unit 2 is provided with the loss data processing unit 2 to which the optimum action set (proposition W, action A) and the action set (proposition X, action A) are input.
The similarity calculator 3 that calculates the similarity between the propositional set X and the propositional set (proposition W, propositional X) of the action set having the action A given from A and returns the calculation result to the loss data processing unit 2 is provided. , A loss calculation unit 4 for calculating the loss value of the action set based on the similarity of the propositional set passed from the loss data processing unit 2 and returning the calculation result to the loss data processing unit 2 The expected loss based on the posterior probability value and the loss data, which is a set of the loss values of the action set returned to the loss data processing unit 2, is provided with the probability calculator 6 that calculates the posterior probability value of the proposition based on the data. The action determination device in the inference device is configured to include the expected loss calculation unit 7 that calculates data, and the action determination unit 8 that extracts the minimum expected loss value from the input expected loss data.

【0008】更に、先の推論装置における行動決定装置
において、類似計算部3における類似度は行動を観点と
してみたときの二つの命題の類似度である観点類似度に
変換されたものである推論装置における行動決定装置を
構成した。
Further, in the action determining device in the above inference device, the inference device in which the similarity in the similarity calculating unit 3 is converted into the viewpoint similarity which is the similarity between two propositions when the action is viewed from the viewpoint. The behavior decision device in.

【0009】[0009]

【発明の実施の形態】ここで、この発明において頻繁に
使用される用語をまとめて定義しておく。 行動組:一つの命題と一つの行動の組 行動組の損失値:行動組の命題の確率値1である真の上
において当該行動組の行動をとったときの損失値 損失データ:全ての行動組についての損失値の集合 命題組:二つの命題の組 命題組の類似度:命題組の二つの命題の類似度 この発明は、二つの命題の類似している程度、即ち類似
度に基づいて損失値を自動的に算出しても、人間が直接
的に損失値を記述した場合と同等な決定結果を得る行動
決定方法および装置を実現する。
BEST MODE FOR CARRYING OUT THE INVENTION Here, terms frequently used in the present invention are collectively defined. Action set: One proposition and one action set Loss value of action set: Loss value when the action of the action set is taken on the truth that is the probability value 1 of the proposition of the action set Loss data: All actions A set of loss values for a set Propositional set: a set of two propositions Similarity of a propositional set: similarity of two propositions of a propositional set This invention is based on the degree of similarity between two propositions, that is, the degree of similarity. Even if a loss value is automatically calculated, a behavior determination method and device that obtain a determination result equivalent to that when a human directly describes the loss value is realized.

【0010】ここで、行動組(晴、手ぶら)、行動組
(雨、手ぶら)、行動組(曇、手ぶら)の三つの損失値
について考える。先ず、命題である天気が晴のときは、
傘もブーツも必要ないので、手ぶらで外出したときの損
失はなく、行動組(晴、手ぶら)の損失値を0. 0とす
る。これに対して、手ぶらで外出したときに雨が降ると
びしょ濡れになるので、行動組(雨、手ぶら)の損失値
は大きな値となる。この様に、行動組(雨、手ぶら)の
損失値が行動組(晴、手ぶら)の損失値と比較して大き
く変化するのは、“晴”と“雨”とは水分を降らすか否
かと言う点で本質的に異なる天候であることに起因す
る。即ち、天気{雨}と天気{晴}とは全く異なった天
候であり、行動{手ぶら}をとったときに天気が{晴}
か{雨}かで人間の被る損失値は大きく変化することに
なる。この様に、類似していない天気のときは損失値が
大きく変化することがわかる。
Now, consider three loss values of an action group (fine, empty-handed), an action group (rain, empty-handed), and an action group (cloudy, empty-handed). First, when the weather, which is a proposition, is fine,
No umbrellas or boots are needed, so there is no loss when going out empty-handed, and the loss value of the action group (fine, empty-handed) is set to 0.0. On the other hand, the loss value of the action group (rain, empty-handed) is large because it gets wet when it goes out empty-handed. In this way, the loss value of the action group (rain, empty-handedness) changes greatly compared to the loss value of the action group (fine, empty-handedness), depending on whether "fine" and "rain" drain water or not. This is due to the fact that the weather is essentially different. That is, the weather {rain} and the weather {clear} are completely different, and when the action {hand-held} is taken, the weather is {clear}.
Depending on whether it is rain or not, the loss value that human suffers will change greatly. Thus, it can be seen that the loss value changes significantly when the weather is not similar.

【0011】次に、手ぶらで外出したときに曇になる
と、雨が降りそうなので不安になるという損失はある
が、濡れるわけではないので行動組(曇、手ぶら)の損
失値は非常に小さいことになる。この様に行動組(曇、
手ぶら)の損失値が行動組(晴、手ぶら)の損失値と比
較して余り変化しないのは、“晴”と“曇”とは、水分
を降らすか否かという点で本質的に類似した天候である
ためである。この様に、類似した天気のときは損失値も
類似していて余り変化しないことがわかる。
Next, if it becomes cloudy when you go out with your hands empty, there is a loss that you will be anxious because it is likely to rain, but since it does not get wet, the loss value of the action group (cloudy, empty-handed) is very small. become. In this way action groups (cloudy,
The reason why the loss value of (hand-held) does not change much compared to the loss value of the action group (fine, hand-held) is that "fine" and "cloudy" are essentially similar in terms of whether or not to drain water. Because it is the weather. Thus, it can be seen that when the weather is similar, the loss values are also similar and do not change much.

【0012】この発明は、以上の様に、“命題が類似し
ていれば損失値の変化は少ない”という現象を利用して
算出された損失値に基づいて適切な行動を選び出す決定
方法および装置を実現する。推論装置は、最適行動組
(命題W、行動A)に対して行動組(命題X、行動A)
の損失値を“命題Xと命題Wの組の類似度が大きければ
小さな値”として計算し、“類似度が小さければ大きい
値”として計算する。全ての最適行動組についてこの計
算法を適用することにより損失データを得る。この発明
は、こうして算出された損失データを利用する。質問者
から事実の集合が与えられると、推論装置は、確率デー
タに基づいて各命題の事後確率データを生成する。そし
て、事後確率データと上述の様にして生成された損失デ
ータとから期待損失データを生成する。この期待損失値
の内の最も小さい行動を一つ選び出す。
As described above, the present invention employs the phenomenon that "the loss value changes little if the propositions are similar", and a determining method and apparatus for selecting an appropriate action based on the loss value calculated. To realize. The reasoning device has an action set (proposition X, action A) for an optimum action set (proposition W, action A).
Is calculated as "a small value if the degree of similarity of the set of proposition X and proposition W is large" and "a large value if the degree of similarity is small". Loss data is obtained by applying this calculation method to all optimal behavior sets. The present invention utilizes the loss data thus calculated. When the questioner gives a set of facts, the inference device generates posterior probability data of each proposition based on the probability data. Then, expected loss data is generated from the posterior probability data and the loss data generated as described above. Select one of the smallest expected loss values.

【0013】この発明を更に詳しく説明するに、最適行
動組(命題W、行動A)と行動組(命題X、行動A)に
ついて、命題Wと命題Xの類似度を算出する。当該類似
度が大きければ命題Wと命題Xは類似していることを意
味するので、行動組の損失値は最適行動組の損失値と比
較して余り変わらないことになる。例えば、最適行動組
(晴、手ぶら)と行動組(曇、手ぶら)について考える
に、“晴”と“曇”とは水分が降らないという点で類似
した天候であるので類似度は大きい値として算出され
る。従って、最適行動組(晴、手ぶら)と行動組(曇、
手ぶら)の損失値は余り変化しないことになる。即ち、
最適行動組(晴、手ぶら)の損失値は小さいので、行動
組(曇、手ぶら)の損失値も小さいことがわかる。以上
の様に行動組(命題X、行動A)の損失値は小さい値と
して計算する。
To explain the present invention in more detail, the similarity between the proposition W and the proposition X is calculated for the optimum action set (proposition W, action A) and the action set (proposition X, action A). If the degree of similarity is large, it means that the proposition W and the proposition X are similar to each other, so that the loss value of the action set is not so different from the loss value of the optimum action set. For example, considering the optimum action group (fine, empty-handed) and the action group (cloudy, empty-handed), “sunny” and “cloudy” are similar weathers in that moisture does not fall, and therefore the similarity is set to a large value. It is calculated. Therefore, the optimal action group (fine, empty-handed) and the action group (cloudy,
The loss value of the empty hand will not change much. That is,
It can be seen that the loss value of the optimum action group (fine, empty-handed) is small, so that the loss value of the action group (cloudy, empty-handed) is also small. As described above, the loss value of the action set (proposition X, action A) is calculated as a small value.

【0014】逆に、当該類似度が小さければ、命題Wと
命題Xは類似していないことを意味するので、行動組
(命題X、行動A)の損失値は最適行動組(命題W、行
動A)の損失値と比較して大きく変わることになる。例
えば、最適行動組(晴、手ぶら)と行動組(雨、手ぶ
ら)について考えるに、“晴”は“雨”と比較して水分
が降らないという点で異なる天候であるので、両者の類
似度は小さい値として算出される。従って、最適行動組
(晴、手ぶら)と行動組(雨、手ぶら)の損失値は大き
く変わることになる。ここで、最適行動組(晴、手ぶ
ら)の損失値は小さいので、行動組(曇、手ぶら)の損
失値は大きいことがわかる。以上の様に、行動組(命題
X、行動A)の損失値は大きな値として計算する。
On the contrary, if the degree of similarity is small, it means that the proposition W and the proposition X are not similar. Therefore, the loss value of the action set (proposition X, action A) is the optimal action set (proposition W, action). Compared with the loss value of A), it will change greatly. For example, when considering the optimum action group (fine, empty-handed) and the action group (rain, empty-handed), “sunny” is a different weather in that it does not get water as compared with “rain”, and therefore the similarity between the two is similar. Is calculated as a small value. Therefore, the loss values of the optimum action group (fine and empty-handed) and the optimum action group (rain and empty-handed) greatly change. Here, it can be seen that the loss value of the optimum action group (fine, empty-handed) is small, and the loss value of the action group (cloudy, empty-handed) is large. As described above, the loss value of the action set (proposition X, action A) is calculated as a large value.

【0015】この発明は、こうして損失値を計算するこ
とにより、人間の主観に基づいた損失値を近似的に獲得
することができる。この様にして獲得した損失データか
ら計算された期待損失値は、近似的に質問者が被るであ
ろう損失値の期待値を与えることになる。従って、期待
損失値が最小となる行動を提示することにより、質問者
にとって適切な解を一つ選び出して提示するというこの
発明の目的を達成することができる。
By calculating the loss value in this way, the present invention can approximately obtain the loss value based on human subjectivity. The expected loss value calculated from the loss data thus obtained approximately gives the expected value of the loss value that the questioner will suffer. Therefore, by presenting the action that minimizes the expected loss value, it is possible to achieve the object of the present invention to select and present one solution that is appropriate for the questioner.

【0016】[0016]

【実施例】この発明の実施例を図1を参照して説明す
る。先ず、最適行動組の集合および行動組の集合を損失
データ処理部2に入力して損失データを生成する処理を
実行する。損失データ処理部2は或る最適行動組(命題
W、行動A)を元にして行動Aを組に含む全ての行動組
について損失値を生成する。具体的に説明すると、或る
命題Xと命題Wの組を類似計算部3に渡して類似度を計
算させ、損失データ処理部2は当該命題組の類似度を受
け取る。更に当該類似度を損失計算部4に渡して損失値
を計算させて、損失データ処理部2はその損失値を受け
取る。以上の様にして得られた損失値を行動組(命題
X、行動A)の損失値とする。行動Aを含む全ての行動
組について損失値の計算が終了すると、損失データ処理
部2は、行動A以外の別の行動について同様の計算を実
行する。全ての行動組について損失値が得られたところ
で損失データ処理部2の計算処理動作は終了する。以上
の通りにして損失データを得ることができる。ここで、
確率計算部6に事実である天気計の状態が与えられる
と、この事実と確率データとから各命題の事後確率値を
導く処理が実行される。確率計算部6において導かれた
各命題の事後確率値は期待損失計算部7に入力され、こ
の事後確率値と損失データ処理部2から入力される損失
データとから各行動の期待損失値を導く処理を実行す
る。そして、これら期待損失値は行動決定部8に入力さ
れ、行動決定部8において最小の期待損失値をとる一つ
の行動を取り出す処理を実行する。以上の様にして、適
切な一つの行動を取り出すことができる。
An embodiment of the present invention will be described with reference to FIG. First, a set of optimum action sets and a set of action sets are input to the loss data processing unit 2 to execute a process of generating loss data. The loss data processing unit 2 generates a loss value for all action sets including the action A based on a certain optimum action set (proposition W, action A). More specifically, a set of proposition X and proposition W is passed to the similarity calculation unit 3 to calculate the similarity, and the loss data processing unit 2 receives the similarity of the proposition set. Further, the degree of similarity is passed to the loss calculation section 4 to calculate the loss value, and the loss data processing section 2 receives the loss value. The loss value obtained as described above is set as the loss value of the action group (proposition X, action A). When the loss value calculation is completed for all the action groups including the action A, the loss data processing unit 2 executes the same calculation for other actions other than the action A. When the loss values have been obtained for all the action groups, the calculation processing operation of the loss data processing unit 2 ends. The loss data can be obtained as described above. here,
When the probability calculator 6 is given a fact, that is, the state of the weather meter, a process of deriving the posterior probability value of each proposition from this fact and the probability data is executed. The posterior probability value of each proposition derived in the probability calculation unit 6 is input to the expected loss calculation unit 7, and the expected loss value of each action is derived from this posterior probability value and the loss data input from the loss data processing unit 2. Execute the process. Then, these expected loss values are input to the action determining unit 8, and the action determining unit 8 executes a process of extracting one action having the smallest expected loss value. As described above, one appropriate action can be taken out.

【0017】類似計算部3における二つの命題が類似し
ている程度を計算する仕方を説明する。この様な類似計
算を実施する方法としては、例えば、当該特許出願人の
出願に係わる特願平4−315233号(特開平6−1
62099号公報)の明細書に記載される技術内容を採
用することができる。これについて概略を説明する。各
命題について、属性リストおよび重要度リストなるもの
を用意しておき、これらのリストを使用して類似度計算
を行う方法である。この明細書においては、命題を
“馬”として説明している。“馬”の属性リストとは
“馬”のもつ属性である生物、けもの、家畜、たてが
み、・・・・その他を示すリストであり、そして重要度リス
トとは各属性である生物、けもの、家畜、たてがみ、そ
の他が“馬”にとりどの程度重要な属性であるのかを表
わす度合を数値、例えば0. 8、0. 3、0. 6、0.
8、・・・・・・により示すリストである。この例は重要度を
0.0ないし1.0の実数値により表示している。
A method of calculating the degree of similarity between two propositions in the similarity calculator 3 will be described. As a method for performing such a similar calculation, for example, Japanese Patent Application No. 4-315233 (Japanese Patent Application Laid-Open No. 6-1331) relating to the application of the applicant of the patent
The technical contents described in the specification of Japanese Patent Laid-Open No. 62099) can be adopted. This will be outlined below. This is a method in which an attribute list and an importance list are prepared for each proposition and the similarity calculation is performed using these lists. In this specification, the proposition is described as "horse". "Horse" attribute list is a list showing creatures, beasts, livestock, mane, etc. that are attributes of "horses", and an importance list is a creature, beast that is each attribute. A numerical value, for example, 0.8, 0.3, 0.6, 0.0, indicating the degree of importance of "horses" for livestock, mane, and others.
8 is a list indicated by. In this example, the degree of importance is displayed by a real value of 0.0 to 1.0.

【0018】この技術内容を使用することにより、二つ
の命題である命題1と命題2との間の類似度計算は、一
般に、次の様に実施することができる。先ず、命題1の
属性リストと命題2の属性リストに共通に含まれる共通
属性に着目する。そして、この共通属性について命題1
の重要度リストの重要度と命題2の重要度リストの重要
度とを乗じた値を、全共通属性について加えた値を類似
度とする。例えば、命題1の属性リストが(T2
3 、T8 )、重要度リストが(0. 3、0. 8、0.
7)であり、そして、命題2の属性リストが(T3 、T
7 、T9 )、重要度リストが(0. 6、0. 5、0.
2)であるものとする。このとき、共通属性T 3 の重要
度の積は“0. 8×0. 6=0. 48”となり、他に共
通属性はないので共通属性T3 の重要度の積がそのまま
類似度の値となる。この様な方法は、命題1と命題2が
類似していればこれら共通属性の数は多くなり、その上
に重要度も互いに大きくなるので積も大きくなり、従っ
て、これらの積の総和である類似度は大きい値をとるこ
とになる。逆に、類似していなければこれら共通属性の
数は少なくなり、その重要度も互いに小さくなるので類
似度は小さい値をとることになる。即ち、類似度は命題
1と命題2が類似している程度を表す。
By using this technical content, two
The similarity calculation between Proposition 1 and Proposition 2 is
Generally, it can be carried out as follows. First, of Proposition 1
Common included in the attribute list and the attribute list of Proposition 2
Focus on attributes. And about this common attribute, Proposition 1
Of the importance list of Proposition 2 and the importance list of Proposition 2
Similar to the value obtained by multiplying the value multiplied by the degree and the value added for all common attributes.
Degree. For example, the attribute list of Proposition 1 is (TTwo,
TThree, T8), The importance list is (0.3, 0.8, 0.
7) and the attribute list of Proposition 2 is (TThree, T
7, T9), The importance list is (0.6, 0.5, 0.
2). At this time, the common attribute T ThreeImportant to
The product of degrees is "0. 8 × 0. 6 = 0.48 ”, and
There is no common attribute, so common attribute TThreeThe product of the importance of
It becomes the value of similarity. In this way, Proposition 1 and Proposition 2 are
If they are similar, the number of these common attributes increases, and
The importance also increases with each other, so the product also increases, and
Therefore, the similarity, which is the sum of these products, takes a large value.
And On the contrary, if they are not similar, these common attributes
Since the numbers are smaller and their importance is smaller,
The similarity will take a small value. That is, similarity is a proposition
It shows the degree to which 1 and Proposition 2 are similar.

【0019】また、この類似計算部3は、先の属性とは
異なる「行動」を観点としてみたときの二つの命題の類
似度である観点類似度を計算する構成とすることができ
る(詳細は、先の特開平6−162099号公報参
照)。例えば、最適行動組(雨、傘)から行動組(晴、
傘)の損失値を計算するに際して、“傘をもつという行
動をとる”という前提に基づいて{晴}のときと{雨}
のときにどれ程異なった影響を人間に与えるかを重視す
る。即ち、行動{傘}を以上の観点から取り扱い、
{晴}と{雨}との間の類似度を計算する構成を類似計
算部3に具備せしめることにより行動{傘}という前提
に対応する{晴}と{雨}の類似度が得られる。これに
より類似度の値の精度向上が期待される。この様に、一
つの行動を類似度計算の要件として採用したときの二つ
の命題の類似度を観点類似度と呼ぶ。観点類似度を計算
する類似計算部3を構成するには、上述と同様に、属性
リストと重要度リストに基づく方法を採用することがで
きる。この場合、行動も一つの命題として捉え、各行動
についても属性リストおよび重要度リストを用意する。
ここで、観点を考慮しない場合は類似度計算に重要度リ
ストを直接利用して類似度を計算したが、観点を考慮す
る場合は二つの命題の重要度リストを観点を考慮した重
要度リストに変換してから観点類似度の算出を行う。重
要度リストの変換を実施するには、命題の属性リストの
属性の内の行動の属性リストに含まれている属性の重要
度は大きく例えば2倍とし、含まれていない属性の重要
度は小さく例えば1/2倍とする。この変換によって、
行動の意味が各命題に反映されたことになる。この様に
して得られた命題の重要度リストを変調重要度リストと
呼ぶ。この変調重要度リストを使用することにより、上
述と同様に共通属性に着目した方法で類似度を計算する
ことにより、行動を観点として反映させた観点類似度を
得ることができる。以上の様に、類似計算部3を観点類
似度を算出する構成としてその値を類似度として利用す
る。この様に観点を反映させた類似計算部3を構成した
ときは、損失データ処理部2は類似計算部3に命題組を
渡すと共に行動をも渡す構成とする。
Further, the similarity calculation unit 3 can be configured to calculate the viewpoint similarity, which is the similarity between the two propositions when the "behavior" different from the previous attribute is viewed from the viewpoint (details are described below. , Japanese Unexamined Patent Publication No. 6-162099). For example, from the optimum action group (rain, umbrella) to the action group (fine,
When calculating the loss value of (umbrella), it is based on the premise of "taking the action of holding an umbrella" when {clear} and when {rain}
At that time, we attach importance to how different influences humans have. That is, the action {umbrella} is handled from the above viewpoint,
By providing the similarity calculation unit 3 with a configuration for calculating the similarity between {clear} and {rain}, the similarity between {clear} and {rain} corresponding to the premise of action {umbrella} can be obtained. This is expected to improve the accuracy of the similarity value. In this way, the similarity between two propositions when one action is adopted as a requirement for similarity calculation is called the viewpoint similarity. In order to configure the similarity calculation unit 3 that calculates the viewpoint similarity, a method based on the attribute list and the importance list can be adopted, as described above. In this case, the action is also regarded as one proposition, and an attribute list and an importance list are prepared for each action.
Here, when the viewpoint is not considered, the importance list is directly used for similarity calculation to calculate the similarity, but when considering the viewpoint, the importance lists of the two propositions are converted into the importance list considering the viewpoint. After conversion, the viewpoint similarity is calculated. In order to carry out the conversion of the importance list, the attribute included in the action attribute list among the attributes in the propositional attribute list has a large importance, for example, twice, and the attribute not included in the attribute list has a small importance. For example, it is set to 1/2. With this conversion,
The meaning of the action is reflected in each proposition. The propositional importance list thus obtained is called a modulation importance list. By using this modulation importance list, it is possible to obtain the viewpoint similarity reflecting the action as the viewpoint by calculating the similarity by the method focusing on the common attribute as described above. As described above, the similarity calculation unit 3 is configured to calculate the viewpoint similarity, and the value is used as the similarity. When the similarity calculation unit 3 that reflects the viewpoint is configured in this way, the loss data processing unit 2 is configured to pass the proposition set to the similarity calculation unit 3 as well as the action.

【0020】損失計算部4は、類似度が大きければ小さ
な損失値を算出し、類似度が小さければ大きな損失値を
算出する構成とされている。損失値の計算式としては、
各種のものが考えられるが、例えば、1から類似度を減
じた値として計算する方法がある。損失値の計算式とし
ては、命題対の類似度が大きければ小さな損失値を計算
し、小さければ大きな損失値を計算する式であれば如何
なる式であっても差し支えない。以上の通りにして損失
データの生成、蓄積は終了する。
The loss calculation section 4 is configured to calculate a small loss value if the degree of similarity is large and a large loss value if the degree of similarity is small. The formula for calculating the loss value is
Although various types are conceivable, for example, there is a method of calculating as a value obtained by subtracting the degree of similarity from 1. The loss value calculation formula may be any formula as long as the similarity of the propositional pair is large, a small loss value is calculated, and if it is small, a large loss value is calculated. As described above, the generation and storage of loss data is completed.

【0021】確率計算部6は、事実と確率データとから
各命題の事後確率値を取得する構成とする。例えば、確
率データとして図3に示される形式のデータを前提とし
てこの確率データから各命題の事後確率値を取得する。
確率データとしては、図3に示される形式のものに限ら
ず、事後確率値を導くことができるデータであれば如何
なる形式のデータをも採用することができる。確率計算
部6は、こうした確率データから既存の確率計算式に基
づいて各命題の事後確率値を計算する構成とされてい
る。
The probability calculator 6 is configured to acquire the posterior probability value of each proposition from the facts and the probability data. For example, assuming the data of the format shown in FIG. 3 as the probability data, the posterior probability value of each proposition is acquired from this probability data.
The probability data is not limited to the format shown in FIG. 3, and any format of data can be adopted as long as the data can derive the posterior probability value. The probability calculator 6 is configured to calculate the posterior probability value of each proposition from such probability data based on an existing probability calculation formula.

【0022】期待損失計算部7は、確率計算部6から供
給される各命題の事後確率値と損失データ処理部2から
供給される損失データとから各行動の期待損失値を計算
算処理する。全ての命題の集合を{W1 、…、Wn }と
すると、事実Fが与えられたときの行動Aの期待損失値
は、“命題Wi の事後確率値と行動組(命題Wi 、行動
A)の損失値の積を全ての命題W1 、…、Wn について
総和した値”として計算する。期待損失計算部7は全て
の行動について上述の様に期待損失値を計算する構成と
される。
The expected loss calculation unit 7 calculates the expected loss value of each action from the posterior probability value of each proposition supplied from the probability calculation unit 6 and the loss data supplied from the loss data processing unit 2. {W 1, ..., W n } the set of all propositions When, the expected loss values of actions A when the facts F is given, "a posteriori probability value proposition W i and action sets (Proposition W i, The product of the loss values of the action A) is calculated as the sum of all propositions W 1 , ..., W n . The expected loss calculation unit 7 is configured to calculate the expected loss value for all actions as described above.

【0023】行動決定部8は、期待損失計算部7により
得られた各行動の期待損失値の内の最小期待損失値を示
す行動を一つ選出して提示する構成とする。以下、この
発明の行動決定の手順を図1を参照して更に具体的に説
明する。この場合、確率データとしては図3に示される
ものを使用し、最適行動組としては図5に示されるもの
を使用する。そして、損失計算部4は、損失値を“1か
ら類似度を減じた値”として計算する方法を使用する。
また、類似計算部3は、二つの命題の類似度を算出する
方法を使用し、(晴、雨)、(晴、雪)、(雨、雪)の
類似度を、それぞれ、0. 2、0. 1、0. 8として計
算する。ただし、同一命題の類似度は1. 0である。
The action determining unit 8 is configured to select and present one action showing the minimum expected loss value out of the expected loss values of each action obtained by the expected loss calculating unit 7. Hereinafter, the procedure of action determination according to the present invention will be described more specifically with reference to FIG. In this case, the probability data shown in FIG. 3 is used, and the optimum action set shown in FIG. 5 is used. Then, the loss calculation unit 4 uses a method of calculating the loss value as “a value obtained by subtracting the degree of similarity from 1”.
The similarity calculation unit 3 uses the method of calculating the similarity between two propositions, and the similarity of (fine, rain), (fine, snow), (rain, snow) is 0.2, It is calculated as 0.1 and 0.8. However, the similarity of the same proposition is 1.0.

【0024】先ず、損失データ処理部2は最適行動組と
して(晴、手ぶら)を取り出す。そして、取り出された
最適行動組の行動“手ぶら”を組に含む全ての行動組
(晴、手ぶら)、(雨、手ぶら)、(雪、手ぶら)のそ
れぞれの損失値を計算する。行動組(晴、手ぶら)の損
失値計算に際して、この行動組の命題“晴”と最適行動
組の命題“晴”の命題組(晴、晴)を類似計算部3に渡
す。類似計算部3はこの命題組(晴、晴)の類似度を
1. 0と計算し、損失データ処理部2に返す。損失デー
タ処理部2は、計算された類似度1. 0を損失計算部4
に渡す。損失計算部4は、この類似度1. 0から損失値
0. 0を損失データ処理部2に返す。損失データ処理部
2はこの損失値0. 0を行動組(晴、手ぶら)の損失値
として獲得する。
First, the loss data processing unit 2 takes out (clear, empty-handed) as an optimum action set. Then, the respective loss values of all the action groups (fine, empty-handed), (rain, empty-handed), (snow, empty-handed) including the extracted action “empty” of the optimum action set are calculated. When calculating the loss value of the action set (fine, empty-handed), the proposition “fine” of this action set and the proposition “fine” of the optimal action set (fine, clear) are passed to the similar calculation unit 3. The similarity calculator 3 calculates the similarity of this proposition set (fine, fine) as 1.0 and returns it to the loss data processor 2. The loss data processing unit 2 uses the calculated similarity of 1.0 as the loss calculation unit 4
Pass to. The loss calculation unit 4 returns the loss value 0.0 from the similarity 1.0 to the loss data processing unit 2. The loss data processing unit 2 acquires this loss value 0.0 as the loss value of the action group (fine, empty-handed).

【0025】行動組(雨、手ぶら)の損失値計算に際し
て、この行動組の命題“雨”と最適行動組の命題“晴”
の命題組(雨、晴)を類似計算部3に渡す。類似計算部
3はこの命題組(雨、晴)の類似度を0. 2と計算し、
損失データ処理部2に返す。損失データ処理部2はこの
類似度0. 2を損失計算部4に渡す。損失計算部4はこ
の類似度から損失値0. 8を損失データ処理部2に返
す。損失データ処理部2はこの損失値0. 8を行動組
(雨、手ぶら)の損失値として獲得する。
In calculating the loss value of the action group (rain, empty-handed), the proposition "rain" of this action group and the proposition "fine" of the optimum action group
The proposition set (rain, fine) is passed to the similarity calculation unit 3. The similarity calculator 3 calculates the similarity of this propositional set (rain, fine) as 0.2,
It is returned to the loss data processing unit 2. The loss data processing unit 2 passes this similarity of 0.2 to the loss calculation unit 4. The loss calculation unit 4 returns a loss value of 0.8 to the loss data processing unit 2 based on this similarity. The loss data processing unit 2 acquires this loss value of 0.8 as the loss value of the action group (rain, empty-handed).

【0026】行動組(雪、手ぶら)の損失値計算に際し
て、この行動組の命題“雪”と最適行動組の命題“晴”
の命題組(雪、晴)を類似計算部3に渡す。類似計算部
3はこの命題組(雪、晴)の類似度を0. 1と計算し、
損失データ処理部2に返す。損失データ処理部2は、こ
の類似度0. 1を損失計算部4に渡す。損失計算部4は
この類似度0. 1から損失値0. 9を損失データ処理部
2に返す。損失データ処理部2はこの損失値0. 9を行
動組(雪、手ぶら)の損失値として獲得する。
In calculating the loss value of the action set (snow, empty-handed), the proposition "snow" of this action set and the proposition "fine" of the optimum action set.
The propositional group (snow, fine) is passed to the similarity calculation unit 3. The similarity calculator 3 calculates the similarity of this propositional group (snow, clear) as 0.1,
It is returned to the loss data processing unit 2. The loss data processing unit 2 passes this similarity 0.1 to the loss calculation unit 4. The loss calculation unit 4 returns the loss value 0.9 from the similarity 0.1 to the loss data processing unit 2. The loss data processing unit 2 acquires this loss value of 0.9 as the loss value of the action group (snow, empty-handed).

【0027】次いで、損失データ処理部2は最適行動組
として(雨、傘)を取り出す。そして、この最適行動組
の行動“傘”を組に含むすべての行動組(晴、傘)、
(雨、傘)、(雪、傘)のそれぞれの損失値を計算す
る。これら行動組の損失値は、最適行動組(晴、手ぶ
ら)の場合の計算処理と同様に計算することができ、そ
れぞれ0. 8、0. 0、0. 2を得る。
Next, the loss data processing unit 2 takes out (rain, umbrella) as the optimum action set. And all the action groups (fine, umbrella) including the action "umbrella" of this optimal action group,
Calculate the respective loss values for (rain, umbrella) and (snow, umbrella). The loss values of these action sets can be calculated in the same manner as the calculation process in the case of the optimum action set (fine, empty-handed), and 0.8, 0.0, and 0.2 are obtained, respectively.

【0028】更に、損失データ処理部2は、最適行動組
として(雪、傘とブーツ)を取り出す。そして、最適行
動組の行動“傘とブーツ”を組に含む全ての行動組
(晴、傘とブーツ)、(雨、傘とブーツ)、(雪、傘と
ブーツ)それぞれの損失値を計算する。これらの行動組
の損失値は、以上と同様に計算することができ、0.
9、0. 2、0. 0を得ることができる。以上の様にし
て、損失データを獲得することができる。こうして得ら
れた損失データを図6にまとめる。
Further, the loss data processing unit 2 takes out (snow, umbrella and boots) as the optimum action set. Then, the loss values of all the action groups (fine, umbrella and boots), (rain, umbrella and boots), (snow, umbrella and boots) including the action “umbrella and boots” of the optimum action group are calculated. . The loss values for these behavioral groups can be calculated as above,
It is possible to obtain 9, 0.2, 0.0. As described above, the loss data can be obtained. The loss data thus obtained is summarized in FIG.

【0029】ここで、行動を決定する処理にとりかか
る。先ず、事実である天気計の状態が{天気計:高}の
場合について説明するに、確率計算部6は、図3に示さ
れる確率データに基づいて各天気「晴」「雨」「雪」の
事後確率値として、それぞれ、0. 7、0. 2、0. 1
を取得する。期待損失計算部7は損失データ処理部2に
より得られた損失データと確率計算部6により得られた
事後確率データから各行動について損失値の期待損失値
を計算する。行動{傘}をとったときの期待損失値はL
(晴、傘)×P(晴|高)+L(雨、傘)×P(雨|
高)+L(雪、傘)×P(雪|高)=0. 8×0. 7+
0. 0×0. 2+0. 2×0. 1=0. 58と計算され
る。以下、同様に、各行動「手ぶら」「傘とブーツ」の
期待損失値はそれぞれ0. 25、0. 67と計算され
る。行動決定部8は、最小の期待損失値0. 25をとる
行動「手ぶら」を選出する。この「手ぶら」を提示する
ことにより、質問者にとって適切な行動を提示するとい
う目的を達成することができる。
Now, the process for determining the action is started. First, the case where the state of the weather meter is {weather meter: high}, which is a fact, will be described. The probability calculation unit 6 uses the probability data shown in FIG. 3 for each weather “fine”, “rain”, and “snow”. The posterior probability values of 0.7, 0.2, 0.1, respectively.
To get. The expected loss calculation unit 7 calculates the expected loss value of the loss value for each action from the loss data obtained by the loss data processing unit 2 and the posterior probability data obtained by the probability calculation unit 6. The expected loss value when taking an action {umbrella} is L
(Clear, umbrella) x P (clear | high) + L (rain, umbrella) x P (rain |
High) + L (snow, umbrella) x P (snow | high) = 0.8 x 0.7+
It is calculated as 0.0 × 0.2 + 0.2 × 0.1 = 0.58. Similarly, the expected loss values for each of the actions “hand-held” and “umbrella and boots” are calculated as 0.25 and 0.67, respectively. The action determining unit 8 selects the action “hand-held” that takes the minimum expected loss value of 0.25. By presenting this "hands-free", it is possible to achieve the purpose of presenting an appropriate action for the questioner.

【0030】事実が{天気計:中}の場合について説明
する。確率計算部6は図3に基づいて各天気「晴」
「雨」「雪」の事後確率値として、それぞれ、0. 4、
0. 4、0. 2を取得する。期待損失計算部7は損失デ
ータ処理部2により得られた損失データと確率計算部6
により得られた事後確率データに基づいて、各行動につ
いて期待損失値を計算する。行動{傘}をとったときの
期待損失値はL(晴、傘)×P(晴|中)+L(雨、
傘)×P(雨|中)+L(雪、傘)×P(雪|中)=
0. 36と計算できる。以下、同様に、各行動「手ぶ
ら」「傘とブーツ」の期待損失値は、それぞれ0. 5、
0. 44と計算される。行動決定部8は最小の期待損失
値0. 36をとる行動「傘」を選出する。この「傘」を
提示することにより質問者にとって適切な行動を提示す
るという目的を達成することができる。
A case where the fact is {weather meter: medium} will be described. Probability calculation unit 6 is based on FIG.
The posterior probability values of “rain” and “snow” are 0.4,
Get 0.4 and 0.2. The expected loss calculation unit 7 is the loss data obtained by the loss data processing unit 2 and the probability calculation unit 6
An expected loss value is calculated for each action based on the posterior probability data obtained by. Expected loss value when taking action {umbrella} is L (fine, umbrella) x P (fine | medium) + L (rain,
Umbrella) x P (rain | medium) + L (snow, umbrella) x P (snow | medium) =
It can be calculated as 0.36. Similarly, the expected loss values for each of the actions “hand-held” and “umbrella and boots” are 0.5 and
Calculated as 0.44. The action determining unit 8 selects the action “umbrella” having the minimum expected loss value of 0.36. By presenting this "umbrella", the purpose of presenting an appropriate action for the questioner can be achieved.

【0031】事実が{天気計:低}の場合について説明
する。確率計算部6は図3に基づいて各天気「晴」
「雨」「雪」の事後確率値として、それぞれ、0. 1、
0. 4、0.5 を取得する。期待損失計算部7は損失デ
ータ処理部2により得られた損失データ”と確率計算部
6により得られた事後確率データに基づいて、各行動に
ついて期待損失値を計算する。行動{傘}をとった時の
期待損失値はL(晴、傘)×P(晴|低)+L(雨、
傘)×P(雨|低)+L(雪、傘)×P(雪|低)=
0. 18と計算される。以下、同様に、各行動「手ぶ
ら」「傘とブーツ」の期待損失値は、それぞれ0. 7
7、0. 17と計算される。行動決定部8は最小の期待
損失値0. 17をとる行動「傘とブーツ」を選出する。
この「傘とブーツ」を提示することにより、質問者にと
って適切な行動を提示するという目的を達成することが
できる。
A case where the fact is {weather gauge: low} will be described. Probability calculation unit 6 is based on FIG.
The posterior probability values of "rain" and "snow" are 0.1,
Get 0.4 and 0.5. The expected loss calculation unit 7 calculates an expected loss value for each action based on the loss data obtained by the loss data processing unit 2 "and the posterior probability data obtained by the probability calculation unit 6. The action {umbrella} is taken. Expected loss value is L (fine, umbrella) × P (fine | low) + L (rain,
Umbrella) x P (rain | low) + L (snow, umbrella) x P (snow | low) =
Calculated as 0.18. Similarly, the expected loss value for each of the actions “hand-held” and “umbrella and boots” is 0.7.
It is calculated to be 7, 0.17. The action determining unit 8 selects the action “umbrella and boots” having the smallest expected loss value of 0.17.
By presenting this “umbrella and boots”, it is possible to achieve the purpose of presenting an appropriate action for the questioner.

【0032】[0032]

【発明の効果】以上の通りであって、損失データの獲得
に際して、従来から人間が直接に数値を記述するという
方法が採用されてきたが、この損失データの獲得方法は
人間の様々な悩み或は迷いに応えることのできる程の多
くの損失データを獲得するには困難な方法であり、この
困難さが推論装置の取り扱える問題を或る特定の狭い領
域に限定することとなっていた。ところが、この発明
は、損失値を人間が直接的に記述しなくても、類似度に
基づいて自動的に算出された損失値を使用して行動を決
定することにより、人間が直接的に記述した場合と同等
な決定を実現することができる。こうして選ばれた行動
を提示することにより、質問者にとって適切な行動を提
示するという目的を達成することができる。
As described above, when the loss data is acquired, a method in which a person directly writes a numerical value has been conventionally adopted. However, this loss data acquisition method causes various troubles to the human. Is a difficult method to obtain enough lost data to be able to answer the hesitation, and this difficulty has limited the problem that the reasoning device can handle to a certain narrow area. However, according to the present invention, even if the human being does not directly describe the loss value, the human being can directly describe the loss value by determining the action by using the loss value automatically calculated based on the similarity. You can achieve a decision equivalent to what you did. By presenting the action selected in this way, the purpose of presenting an appropriate action for the questioner can be achieved.

【図面の簡単な説明】[Brief description of drawings]

【図1】実施例を説明する図。FIG. 1 is a diagram illustrating an example.

【図2】推論装置の概念図。FIG. 2 is a conceptual diagram of an inference device.

【図3】確率データを示す図。FIG. 3 is a diagram showing probability data.

【図4】損失データを示す図。FIG. 4 is a diagram showing loss data.

【図5】最適行動組を示す図。FIG. 5 is a diagram showing an optimum action group.

【図6】類似度から計算された損失データを示す図。FIG. 6 is a diagram showing loss data calculated from similarity.

【符号の説明】[Explanation of symbols]

2 損失データ処理部 3 類似計算部 4 損失計算部 6 確率計算部 7 期待損失計算部 8 行動決定部 2 Loss data processing unit 3 Similarity calculation unit 4 Loss calculation unit 6 Probability calculation unit 7 Expected loss calculation unit 8 Behavior decision unit

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】 確率値を値にとる複数の命題に関して、
或る事実と、事実に基づいて命題の事後確率値を導く確
率データと、命題に一つの行動を組み合わせた行動組の
内の最適行動組を使用して一つの行動を選出する推論装
置における行動決定方法において、 任意の二つの行動組の命題を0. 0以上1. 0以下の実
数値より成る類似度と対応付けし、 任意の一つの行動組を0. 0以上1. 0以下の実数値よ
り成る損失値と対応付けるに際して、最適行動組につい
ては0. 0と対応付け、最適行動組の命題と類似度がs
である命題の行動組については、sが大きい値のときは
小さい値と対応付け、sが小さい値のときは大きい値と
対応付け、 損失値と事後確率値とに基づいて各行動の期待損失値を
導き、 期待損失値が最小である行動を一つ選出することを特徴
とする推論装置における行動決定方法。
1. A plurality of propositions whose values are probability values,
Actions in an inference device that selects a certain action by using certain facts, probability data that derives the posterior probability value of the proposition based on the facts, and the optimal action set of action sets that combine one action with the proposition In the determination method, the proposition of any two action sets is associated with a similarity consisting of real numbers of 0.0 or more and 1.0 or less, and any one action set is associated with a real number of 0.0 or more and 1.0 or less. When associating with a loss value consisting of numerical values, the optimal action set is associated with 0.0, and the proposition and similarity of the optimal action set are s.
With regard to the action set of the proposition that is, the small loss is associated with the small value when s is large, and the high loss is associated with the large value when s is small. A method for deciding an action in an inference device, which is characterized by deriving a value and selecting one action having the smallest expected loss value.
【請求項2】 請求項1に記載される推論装置における
行動決定方法において、 類似度は行動を観点としてみたときの二つの命題の類似
度である観点類似度であることを特徴とする推論装置に
おける行動決定方法。
2. The action determining method in the inference device according to claim 1, wherein the similarity is a viewpoint similarity which is a similarity between two propositions when an action is viewed from a viewpoint. Behavior decision method.
【請求項3】 最適行動組(命題W、行動A)および行
動組(命題X、行動A)が入力される損失データ処理部
を具備し、 損失データ処理部から渡される行動Aを有する行動組の
命題Xと命題Wより成る命題組(命題W、命題X)の類
似度を計算して計算結果を損失データ処理部に返す類似
計算部を具備し、 損失データ処理部から渡される命題組の類似度に基づい
て当該行動組の損失値を計算して計算結果を損失データ
処理部に返す損失計算部を具備し、 与えられる事実および確率データに基づいて命題の事後
確率値を計算処理する確率計算部を具備し、 損失データ処理部に返された行動組の損失値の集合であ
る損失データおよび事後確率値に基づいて期待損失デー
タを計算処理する期待損失計算部を具備し、 入力される期待損失データの内の最小期待損失値を取り
出す行動決定部を具備することを特徴とする推論装置に
おける行動決定装置。
3. An action set having a loss data processing unit to which an optimum action set (proposition W, action A) and an action set (proposition X, action A) are input, and having the action A passed from the loss data processing unit. The propositional set of the propositional set passed from the lossy data processing unit is provided with a similarity calculation unit that calculates the similarity of the propositional set (proposition W, propositional X) consisting of the proposition X and the proposition W of Probability of calculating the posterior probability value of the proposition based on the given facts and probability data, with the loss calculator that calculates the loss value of the action group based on the similarity and returns the calculation result to the loss data processor. It is equipped with a calculation unit, and has an expected loss calculation unit that calculates expected loss data based on the loss data and posterior probability values, which are the set of loss values of the action set returned to the loss data processing unit, and is input. Expected loss data Action decision device in the inference apparatus characterized by comprising the action determining unit to retrieve the minimum expected loss values.
【請求項4】 請求項3に記載される推論装置における
行動決定装置において、 類似計算部における類似度は行動を観点としてみたとき
の二つの命題の類似度である観点類似度に変換されたも
のであることを特徴とする推論装置における行動決定装
置。
4. The action determination device in the inference device according to claim 3, wherein the similarity in the similarity calculation unit is converted into the viewpoint similarity, which is the similarity between two propositions when the behavior is viewed from the viewpoint. An action determining device in an inference device characterized by being.
JP8112738A 1996-05-07 1996-05-07 Action deciding method for inference device, and device for executing the method Pending JPH09297685A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8112738A JPH09297685A (en) 1996-05-07 1996-05-07 Action deciding method for inference device, and device for executing the method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8112738A JPH09297685A (en) 1996-05-07 1996-05-07 Action deciding method for inference device, and device for executing the method

Publications (1)

Publication Number Publication Date
JPH09297685A true JPH09297685A (en) 1997-11-18

Family

ID=14594320

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8112738A Pending JPH09297685A (en) 1996-05-07 1996-05-07 Action deciding method for inference device, and device for executing the method

Country Status (1)

Country Link
JP (1) JPH09297685A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109920172A (en) * 2017-12-12 2019-06-21 富士施乐株式会社 Information processing unit

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109920172A (en) * 2017-12-12 2019-06-21 富士施乐株式会社 Information processing unit

Similar Documents

Publication Publication Date Title
Auer Using confidence bounds for exploitation-exploration trade-offs
US7418434B2 (en) Forward-chaining inferencing
Wachs The use and abuse of environment in behavior-genetic research
Green et al. Characterization of satisfactory mechanisms for the revelation of preferences for public goods
Otero et al. Inducing decision trees with an ant colony optimization algorithm
Shoham et al. Multiagent systems: Algorithmic, game-theoretic, and logical foundations
Benson Inductive learning of reactive action models
Reeves et al. A simplified interactive multiple objective linear programming procedure
JP3637412B2 (en) Time-series data learning / prediction device
CN110991658A (en) Model training method and device, electronic equipment and computer readable storage medium
González et al. Improving the genetic algorithm of SLAVE
CN111797333A (en) Public opinion spreading task display method and device
Sun et al. Query-dependent prompt evaluation and optimization with offline inverse RL
JPH09297685A (en) Action deciding method for inference device, and device for executing the method
Langley et al. Tractable average-case analysis of naive Bayesian classifiers
Ordóñez et al. Genetic Approach for Optimizing Ensembles of Classifiers.
CN109635706A (en) Gesture identification method, equipment, storage medium and device neural network based
McCreath et al. ILP with noise and fixed example size: a Bayesian approach
Punt et al. An examination of certain of the assumptions made in the Bayesian approach used to assess the eastern North Pacific stock of gray whales (Eschrichtius robustus)
McClelland et al. Optimal replacement policies for rejuvenated assets
KR102365838B1 (en) Method and apparatus for generating neural symbolic-based rule for user intention inference
Cano et al. Recursive probability trees for Bayesian networks
Pereda et al. Processing algorithmic skeletons at compile-time
JP7398833B1 (en) Information processing device, information processing method, and program
Khelassi et al. Cognitive Amalgam with a Fuzzy sets and case based reasoning for accurate cardiac arrhythmias diagnosis