JP2012212276A - Learning unit, learning method and learning program - Google Patents

Learning unit, learning method and learning program Download PDF

Info

Publication number
JP2012212276A
JP2012212276A JP2011076960A JP2011076960A JP2012212276A JP 2012212276 A JP2012212276 A JP 2012212276A JP 2011076960 A JP2011076960 A JP 2011076960A JP 2011076960 A JP2011076960 A JP 2011076960A JP 2012212276 A JP2012212276 A JP 2012212276A
Authority
JP
Japan
Prior art keywords
observation
conditional
observations
value
observation frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2011076960A
Other languages
Japanese (ja)
Inventor
Shinichiro Sega
信一郎 瀬賀
Hirotoshi Iwasaki
弘利 岩崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso IT Laboratory Inc
Original Assignee
Denso IT Laboratory Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso IT Laboratory Inc filed Critical Denso IT Laboratory Inc
Priority to JP2011076960A priority Critical patent/JP2012212276A/en
Publication of JP2012212276A publication Critical patent/JP2012212276A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a learning unit capable of curbing an excessive increase or decrease in learning sensitivity, in a Bayesian network that updates a conditional probability list by learning based on observation.SOLUTION: A learning unit 10 of an inference device 100 comprises: an observation frequency increase-decrease management section 111 for adding an observation frequency addition value to an observation frequency of a cell relevant to observation data in a conditional observation frequency list 23, based on the observation data including each observation value of parent and child nodes; a total observation frequency calculation section 112 for calculating a total of observation frequencies in the conditional observation frequency list 23; an observation frequency list normalization section 113 for, when the total of observation frequencies exceeds a predetermined upper limit, normalizing the conditional observation frequency list 23 so that the total of observation frequencies becomes equivalent to a predetermined reference value lower than the upper limit; and a conditional probability list update section 12 for updating a conditional probability list 22 corresponding to the conditional observation frequency list 23.

Description

本発明は、ベイジアンネットワークの条件付確率表を観測に基づく学習によって更新する学習装置、学習方法、及び学習プログラムに関するものである。   The present invention relates to a learning apparatus, a learning method, and a learning program for updating a conditional probability table of a Bayesian network by learning based on observation.

従来、複数の要因の依存関係に基づいて確率計算を行う情報処理モデルとしてベイジアンネットワークが知られている。ベイジアンネットワークとは、確率変数、確率変数間の条件付依存関係、及びその条件付確率の3つによって定義されるネットワーク状の確率モデルである。   Conventionally, a Bayesian network is known as an information processing model that performs probability calculation based on the dependency of a plurality of factors. A Bayesian network is a network-like probability model defined by a random variable, a conditional dependency between random variables, and a conditional probability.

確率変数はノード、確率変数間の条件付依存関係はノード間に張った有向リンクで表され、リンクの先に来るノードを子ノード、リンクの元にあるノードを親ノードと呼ぶ。条件付確率は、親ノードがある値をとった時に、子ノードがある値をとる確率であり、離散変数の場合にはP(子ノード=y|親ノード=x1,x2,...)=pのような、子ノードと親ノードがとるすべての状態のそれぞれにおける確率値を列挙した表(条件付確率表)の形で表現される(非特許文献1)。   A random variable is represented by a node, and a conditional dependency between random variables is represented by a directed link extending between the nodes. A node that comes before the link is called a child node, and a node that is at the link source is called a parent node. The conditional probability is a probability that a child node takes a certain value when the parent node takes a certain value. In the case of a discrete variable, P (child node = y | parent node = x1, x2,...) = P is expressed in the form of a table (conditional probability table) in which the probability values in all the states taken by the child node and the parent node are listed (Non-Patent Document 1).

図3は、親ノードである「シーン」及び「番組総時間」からそれぞれ子ノードである「ジャンル」に有向リンクが張られたベイジアンネットワークのグラフ構造を示す図であり、図4は、このベイジアンネットワークの条件付確率表を示す図である。図4に示すように、条件付確率表では、各「シーン」及び「番組総時間」について、「ジャンル」の確率値が列挙されている。   FIG. 3 is a diagram showing a graph structure of a Bayesian network in which a directed link is extended from a parent node “scene” and “total program time” to a child node “genre”, respectively. It is a figure which shows the conditional probability table | surface of a Bayesian network. As shown in FIG. 4, in the conditional probability table, probability values of “genre” are listed for each “scene” and “total program time”.

図4に示す条件付確率表は、図5に示すような条件付観測回数表に基づいて作成される。即ち、条件付確率は、ある親ノードのステート(図3の例では「シーン」及び「番組総時間」であり、図4の列に相当する)における、子ノードの各ステート(図3の例では「ジャンル」であり、図4の行に相当する)の確率であるので、各確率は、親ノードと子ノードの観測値が得られた場合には、条件付観測回数表における該当するセルの観測回数を増加させるとともに、親ノードの当該ステートにおける子ノードの各ステートの観測回数を、それぞれ当該親ノードのステートにおける合計観測回数で割ることで、当該親ノードのステートにおける子ノードの各ステートの条件付確率を求めることができる。   The conditional probability table shown in FIG. 4 is created based on the conditional observation frequency table as shown in FIG. In other words, the conditional probability is a state of a parent node (in the example of FIG. 3, “scene” and “total program time”, which corresponds to the column in FIG. 4), and each state of the child node (example in FIG. 3). Is a “genre” and corresponds to the row in FIG. 4), each probability is the corresponding cell in the conditional observation count table when the observation values of the parent node and the child node are obtained. And the number of observations of each state of the child node in the state of the parent node is divided by the total number of observations of the state of the parent node, respectively, so that each state of the child node in the state of the parent node Can be obtained.

具体的には、図5に示すように、例えば、「シーン」=「レジャー」かつ「番組総時間」=「2〜2.5時間」という親ノードのステートにおいて、子ノードの「ジャンル」の観測回数は、「J−POP」が5回、「ロック」が3回、「ジャズ」が11回、「クラシック」が1回、「フォーク」が3回、「ダンス」が1回であり、合計観測回数は24回である。   Specifically, as shown in FIG. 5, for example, in the state of the parent node “scene” = “leisure” and “total program time” = “2-2.5 hours”, the “genre” of the child node The number of observations is “J-POP” 5 times, “Rock” 3 times, “Jazz” 11 times, “Classic” 1 time, “Folk” 3 times, “Dance” 1 time, The total number of observations is 24.

したがって、図4の条件付確率表において、「シーン」=「レジャー」かつ「番組総時間」=「2〜2.5時間」という親ノードのステートについては、子ノードの「ジャンル」の条件付確率は、「J−POP」が5回/24回=20.8%、「ロック」が3回/24回=12.5%、「ジャズ」が11回/24回=45.8%、「クラシック」が1回/24回=4.2%、「フォーク」が3回/24回=12.5%、「ダンス」が1回/24回=4.2%となる。   Therefore, in the conditional probability table of FIG. 4, regarding the state of the parent node “scene” = “leisure” and “total program time” = “2-2.5 hours”, the child node “genre” is conditionalized. Probability is “J-POP” 5 times / 24 times = 20.8%, “Rock” 3 times / 24 times = 12.5%, “Jazz” 11 times / 24 times = 45.8%, “Classic” is 1 time / 24 times = 4.2%, “Folk” is 3 times / 24 times = 12.5%, and “Dance” is 1 time / 24 times = 4.2%.

観測に基づく学習により条件付確率表を更新する場合には、まず、図5に示す条件付観測回数表において、該当するセルの観測回数を増加させることで、条件付観測回数表を更新する。そして、その更新された条件付観測回数表に基づいて、条件付確率表を作成しなおすことで条件付き確率表を更新する。   When the conditional probability table is updated by learning based on observation, first, the conditional observation number table is updated by increasing the number of observations of the corresponding cell in the conditional observation number table shown in FIG. Then, the conditional probability table is updated by recreating the conditional probability table based on the updated conditional observation frequency table.

例えば、「シーン」=「レジャー」かつ「番組総時間」=「2〜2.5時間」であって、「ジャンル」が「ロック」であるという観測データを得た場合には、条件付観測回数表において、「シーン」=「レジャー」かつ「番組総時間」=「2〜2.5時間」であって、「ジャンル」=「ロック」であるセルの観測回数に観測回数加算値が加算され、この観測回数加算値が加算された後の条件付観測回数表に基づいて、条件付確率表を計算しなおすことで、条件付確率表が更新される。   For example, when observation data is obtained that “scene” = “leisure” and “total program time” = “2-2.5 hours” and “genre” is “lock”, conditional observation In the frequency table, “Scene” = “Leisure” and “Program total time” = “2 to 2.5 hours”, and “Genre” = “Lock” is added to the observation frequency addition value. The conditional probability table is updated by recalculating the conditional probability table based on the conditional observation number table after the addition of the observation number addition value.

このように、観測に基づく学習により条件付確率表を更新することで、条件付確率表の信頼度が向上し、この条件付確率表を使った推論の精度を向上させることができる。   In this way, by updating the conditional probability table by learning based on observation, the reliability of the conditional probability table is improved, and the accuracy of inference using the conditional probability table can be improved.

本村陽一「ベイジアンネットソフトウェア」、人工知能学会論文誌、第17巻 5号a(2002年)Yoichi Motomura “Bayesian Net Software”, Journal of the Japanese Society for Artificial Intelligence, Vol. 17 No. 5a (2002)

しかしながら、観測に基づく学習を繰り返していくと、条件付観測回数表における観測回数の総数が大きくなっていく。観測回数の総数があまりに大きくなると、1回の観測による学習の効果(学習感度)が小さくなりすぎて、1回の観測による学習によっては条件付確率表がほとんど更新されなくなってしまう。   However, as learning based on observation is repeated, the total number of observations in the conditional observation table increases. When the total number of observations becomes too large, the learning effect (learning sensitivity) by one observation becomes too small, and the conditional probability table is hardly updated by learning by one observation.

また、観測に基づいて、条件付観測回数表の観測回数を増加又は減少させるという学習を行う場合がある。このような学習方法においては、観測に基づく学習を繰り返すことで、条件付観測回数表における観測回数が減少していき、観測回数の総数が小さくなっていくことがある。観測回数の総数があまりに小さくなると、1回の観測による学習の効果(学習感度)が高くなりすぎて、1回の観測による学習によって条件付確率表が大きく変動してしまう。   In addition, learning may be performed to increase or decrease the number of observations in the conditional observation number table based on the observation. In such a learning method, by repeating learning based on observation, the number of observations in the conditional observation number table may decrease and the total number of observations may decrease. If the total number of observations becomes too small, the learning effect (learning sensitivity) by one observation becomes too high, and the conditional probability table greatly fluctuates by learning by one observation.

また、観測回数表の観測回数が減少していって、すべての観測回数が0になってしまうと、条件付確率が計算できず、ベイジアンネットワークの計算自体が不可能になる。   In addition, if the number of observations in the observation number table decreases and all the observation times become zero, the conditional probability cannot be calculated, and the Bayesian network itself cannot be calculated.

本発明は、上記の問題に鑑みてなされたものであり、条件付確率表を観測に基づく学習によって更新するベイジアンネットワークにおいて、学習感度の過度の増加又は過度の低下を抑えることができる学習装置を提供することを目的とする。   The present invention has been made in view of the above problems, and in a Bayesian network that updates a conditional probability table by learning based on observation, a learning device that can suppress an excessive increase or excessive decrease in learning sensitivity. The purpose is to provide.

本発明の学習装置は、ベイジアンネットワークの条件付確率表を観測に基づく学習によって更新する学習装置であって、親ノードの観測値及び子ノードの観測値を含む観測データに基づいて、前記親ノードの各ステート及び前記子ノードの各ステートの組合せごとに観測回数を規定した条件付観測回数表における該当する前記組合せの観測回数に観測回数加算値を加算する観測回数増減管理部と、前記条件付観測回数表における観測回数の総和を計算する観測回数総和計算部と、前記観測回数の総和が所定の上限値を超えたときに、前記観測回数の総和が前記上限値より低い所定の基準値となるように、前記条件付観測回数表を正規化する観測回数表正規化部と、前記条件付観測回数表に基づいて、当該条件付観測回数表に対応する条件付確率表を更新する条件付確率表更新部とを備えた構成を有している。   The learning device of the present invention is a learning device that updates a conditional probability table of a Bayesian network by learning based on observation, and based on observation data including observation values of a parent node and observation values of a child node, the parent node An observation frequency increase / decrease management unit that adds the observation frequency addition value to the observation frequency of the corresponding combination in the conditional observation frequency table that defines the observation frequency for each combination of each state of the child node and each state of the child node, and the conditional An observation number sum calculation unit for calculating the total number of observations in the observation number table, and when the total number of observations exceeds a predetermined upper limit value, a predetermined reference value in which the total number of observation times is lower than the upper limit value; An observation frequency table normalization unit that normalizes the conditional observation frequency table, and a conditional confirmation corresponding to the conditional observation frequency table based on the conditional observation frequency table. It has a configuration that includes a conditional probability table updating unit that updates a table.

この構成によれば、観測回数の総和が所定の上限値を超えたときに、観測回数の総和が基準値となるように、条件付観測回数表を正規化するので、学習感度の過度の低下を抑えることができる。   According to this configuration, the conditional observation frequency table is normalized so that the total number of observations becomes the reference value when the total number of observations exceeds a predetermined upper limit value. Can be suppressed.

本発明の学習装置において、前記観測回数増減管理部は、前記観測データに基づいて、前記観測回数加算値を増減させてよい。   In the learning device of the present invention, the observation frequency increase / decrease management unit may increase or decrease the observation frequency addition value based on the observation data.

この構成によれば、観測回数の増加が観測データに基づいて加速される場合にも、学習感度の過度の低下を抑えることができる。   According to this configuration, even when the increase in the number of observations is accelerated based on the observation data, an excessive decrease in learning sensitivity can be suppressed.

本発明の別の態様の学習装置は、ベイジアンネットワークの条件付確率表を観測に基づく学習によって更新する学習装置であって、親ノードの観測値及び子ノードの観測値を含む観測データに基づいて、前記親ノードの各ステート及び前記子ノードの各ステートの組合せごとに観測回数を規定した条件付観測回数表における該当する組合せの観測回数に対して、観測回数加算値を加算し、又は観測回数減算値を減算する観測回数増減管理部と、前記条件付観測回数表における観測回数の総和を計算する観測回数総和計算部と、前記観測回数の総和が所定の上限値を超えたとき、又は前記観測回数の総和が所定の下限値を下回ったときに、前記観測回数の総和が前記上限値より小さく前記下限値より大きい所定の基準値となるように、前記条件付観測回数表を正規化する観測回数表正規化部と、前記条件付観測回数表に基づいて、当該条件付観測回数表に対応する条件付確率表を更新する条件付確率表更新部とを備えた構成を有している。   A learning device according to another aspect of the present invention is a learning device that updates a conditional probability table of a Bayesian network by learning based on observation, and is based on observation data including observation values of a parent node and observation values of a child node. , Adding the observation count addition value to the number of observations in the conditional observation count table that defines the number of observations for each combination of each state of the parent node and each state of the child node, or the number of observations The observation frequency increase / decrease management unit for subtracting the subtraction value, the observation frequency total calculation unit for calculating the total number of observations in the conditional observation frequency table, and when the total number of observations exceeds a predetermined upper limit value, or When the total number of observations falls below a predetermined lower limit value, the condition is set so that the total number of observations becomes a predetermined reference value smaller than the upper limit value and larger than the lower limit value. An observation frequency table normalization unit that normalizes the observation frequency table, and a conditional probability table update unit that updates the conditional probability table corresponding to the conditional observation frequency table based on the conditional observation frequency table. It has a configuration.

この構成によれば、観測回数の総和が所定の上限値を超えたとき、又は観測回数の総和が所定の下限値を下回ったときに、観測回数の総和が基準値となるように、観測回数表を正規化するので、学習感度の過度の増加及び過度の低下を抑えることができる。   According to this configuration, when the total number of observations exceeds a predetermined upper limit value, or when the total number of observations falls below a predetermined lower limit value, the total number of observations is set to the reference value. Since the table is normalized, an excessive increase and excessive decrease in learning sensitivity can be suppressed.

本発明の学習装置において、前記観測回数増減管理部は、前記観測データに基づいて、前記観測回数加算値又は前記観測回数減算値を増減させてよい。   In the learning device of the present invention, the observation frequency increase / decrease management unit may increase or decrease the observation frequency addition value or the observation frequency subtraction value based on the observation data.

この構成によれば、観測回数の増加及び減少が観測データに基づいて加速される場合にも、学習感度の過度の増加及び過度の低下を抑えることができる。   According to this configuration, even when the increase and decrease in the number of observations are accelerated based on the observation data, it is possible to suppress the excessive increase and excessive decrease in the learning sensitivity.

上記の学習装置において、前記ベイジアンネットワークは、情報コンテンツの再生に係る確率モデルであってよく、前記情報コンテンツの属性に関するノードと、前記再生の属性に関するノードとを含み、前記情報コンテンツの属性に関するノードは、前記観測データに基づいて、観測回数が増加または減少してよい。   In the above learning apparatus, the Bayesian network may be a probability model related to reproduction of information content, and includes a node related to the attribute of the information content and a node related to the attribute of the reproduction, and a node related to the attribute of the information content The number of observations may increase or decrease based on the observation data.

この構成によれば、情報コンテンツの属性に関するノードが、前記観測データに基づいて、観測回数が増加または減少するので、この情報コンテンツの属性に関するノードの過度の増加及び過度の減少による学習感度の過度の増加及び過度の低下を抑えることができる。なお、情報コンテンツは例えば楽曲コンテンツであってよく、情報コンテンツの属性に関するノードには、楽曲のジャンル、年代、アーティスト、各情報コンテンツの有無が含まれてよい。また、情報コンテンツの再生に関するノードには、再生の曜日、時間、シーン、番組総時間が含まれてよい。   According to this configuration, since the number of observations increases or decreases for the nodes related to the information content attribute based on the observation data, the learning sensitivity is excessively increased due to excessive increase and decrease of the nodes related to the information content attribute. Increase and excessive reduction can be suppressed. Note that the information content may be, for example, music content, and the node related to the attribute of the information content may include the genre of the music, the age, the artist, and the presence of each information content. In addition, the node relating to the reproduction of the information content may include a reproduction day of the week, a time, a scene, and a total program time.

また、本発明の学習装置において、前記情報コンテンツは、所定の順序に従って自動的に再生可能であるとともに、直接再生することも可能であってよく、前記観測回数増減管理部は、情報コンテンツが再生されたときに、前記情報コンテンツの属性に関するノードの該当するステートの観測回数に前記観測回数加算値を加算するとともに、情報コンテンツが直接再生されたときに、前記情報コンテンツの属性に関するノードの該当するステートの観測回数加算値を、自動的に再生されたときの前記情報コンテンツの属性に関するノードの該当するステートの観測回数加算値より大きくしてよい。   In the learning device of the present invention, the information content can be automatically reproduced in a predetermined order and can be directly reproduced. The observation frequency increase / decrease management unit reproduces the information content. When the information content is reproduced, the observation number addition value is added to the number of observations of the corresponding state of the node related to the information content attribute. The state observation count addition value may be larger than the observation count addition value of the corresponding state of the node related to the attribute of the information content when automatically reproduced.

この構成によれば、情報コンテンツが直接再生された場合に、観測回数の増加を加速させることができる。   According to this configuration, the increase in the number of observations can be accelerated when the information content is directly reproduced.

本発明の学習装置において、前記情報コンテンツは、所定の順序に従って自動的に再生可能であるとともに、リピート再生をすることも可能であってよく、前記観測回数増減管理部は、情報コンテンツが再生されたときに、前記情報コンテンツの属性に関するノードの該当するステートの観測回数に前記観測回数加算値を加算するとともに、情報コンテンツがリピート再生されたときに、前記情報コンテンツの属性に関するノードの該当するステートの観測回数加算値を、自動的に再生されたときの前記情報コンテンツの属性に関するノードの該当するステートの観測回数加算値より大きくしてよい。   In the learning device of the present invention, the information content can be automatically reproduced according to a predetermined order and can be repeatedly reproduced. The observation frequency increase / decrease management unit reproduces the information content. When the information content is repeatedly played, the corresponding state of the node related to the information content attribute is added to the number of observations of the corresponding state of the node related to the information content attribute. May be larger than the observation count addition value of the corresponding state of the node related to the attribute of the information content when automatically reproduced.

この構成によれば、情報コンテンツがリピート再生された場合に、観測回数の増加を加速させることができる。   According to this configuration, the increase in the number of observations can be accelerated when the information content is repeatedly reproduced.

前記情報コンテンツは、所定の順序に従って自動的に再生可能であるとともに、順序に従った自動的な再生の際に再生をスキップすることも可能であってよく、前記観測回数増減管理部は、情報コンテンツの再生がスキップされたときに、前記情報コンテンツの属性に関するノードの該当するステートの観測回数から前記観測回数減算値を減算してよい。   The information content can be automatically reproduced according to a predetermined order, and can be skipped during automatic reproduction according to the order. When the reproduction of the content is skipped, the observation number subtraction value may be subtracted from the observation number of the corresponding state of the node related to the information content attribute.

この構成によれば、情報コンテンツの再生がスキップされた場合に、観測回数を減少させることができる。   According to this configuration, when the reproduction of information content is skipped, the number of observations can be reduced.

本発明のさらに別の態様は、ベイジアンネットワークの条件付確率表を観測に基づく学習によって更新する学習方法であって、この方法は、親ノードの観測値及び子ノードの観測値を含む観測データに基づいて、前記親ノードの各ステート及び前記子ノードの各ステートの組合せごとに観測回数を規定した条件付観測回数表における該当する前記組合せの観測回数に観測回数加算値を加算する観測回数増減管理ステップと、前記条件付観測回数表における観測回数の総和を計算する観測回数総和計算ステップと、前記観測回数の総和が所定の上限値を超えたときに、前記観測回数の総和が前記上限値より低い所定の基準値となるように、前記条件付観測回数表を正規化する観測回数表正規化ステップと、前記条件付観測回数表に基づいて、当該条件付観測回数表に対応する条件付確率表を更新する条件付確率表更新ステップとを含んでいる。   Yet another aspect of the present invention is a learning method for updating a conditional probability table of a Bayesian network by observation-based learning, which includes observation data including observation values of a parent node and observation values of a child node. Based on the observation number increase / decrease management for adding the observation number addition value to the number of observations of the combination in the conditional observation number table that defines the number of observations for each combination of each state of the parent node and each state of the child node Step, a total number of observations calculation step for calculating the total number of observations in the conditional observation number table, and when the total number of observations exceeds a predetermined upper limit, the total number of observations is greater than the upper limit. Based on the observation frequency table normalizing step for normalizing the conditional observation frequency table so as to be a low predetermined reference value, and the conditional observation frequency table, And a probability table updating step conditional updating conditional probability table corresponding to the conditional number of observations table.

この構成によっても、観測回数の総和が所定の上限値を超えたときに、観測回数の総和が基準値となるように、条件付観測回数表を正規化するので、学習感度の過度の低下を抑えることができる。   Even with this configuration, when the total number of observations exceeds a predetermined upper limit, the conditional observation table is normalized so that the total number of observations becomes the reference value. Can be suppressed.

本発明のさらに別の態様は、ベイジアンネットワークの条件付確率表を観測に基づく学習によって更新する学習方法であって、親ノードの観測値及び子ノードの観測値を含む観測データに基づいて、前記親ノードの各ステート及び前記子ノードの各ステートの組合せごとに観測回数を規定した条件付観測回数表における該当する組合せの観測回数に対して、観測回数加算値を加算し、又は観測回数減算値を減算する観測回数増減管理ステップと、前記条件付観測回数表における観測回数の総和を計算する観測回数総和計ステップ部と、前記観測回数の総和が所定の上限値を超えたとき、又は前記観測回数の総和が所定の下限値を下回ったときに、前記観測回数の総和が前記上限値より小さく前記下限値より大きい所定の基準値となるように、前記条件付観測回数表を正規化する観測回数表正規化ステップと、前記条件付観測回数表に基づいて、当該条件付観測回数表に対応する条件付確率表を更新する条件付確率表更新ステップとを含んでいる。   Still another aspect of the present invention is a learning method for updating a conditional probability table of a Bayesian network by observation-based learning, wherein the observation method includes observation values of a parent node and observation values of a child node. Add the observation count addition value to the observation count of the corresponding combination in the conditional observation count table that defines the number of observations for each combination of each state of the parent node and each of the child nodes, or subtract the observation count value The observation frequency increase / decrease management step for subtracting, the observation frequency summation step unit for calculating the total number of observations in the conditional observation frequency table, and when the total of the observation frequency exceeds a predetermined upper limit, or the observation When the total number of times falls below a predetermined lower limit value, the total number of observations becomes a predetermined reference value smaller than the upper limit value and larger than the lower limit value, An observation frequency table normalizing step for normalizing the conditional observation frequency table, and a conditional probability table updating step for updating the conditional probability table corresponding to the conditional observation frequency table based on the conditional observation frequency table Including.

この構成によっても、観測回数の総和が所定の上限値を超えたとき、又は観測回数の総和が所定の下限値を下回ったときに、観測回数の総和が基準値となるように、観測回数表を正規化するので、学習感度の過度の増加及び過度の低下を抑えることができる。   Even with this configuration, when the total number of observations exceeds a predetermined upper limit value or when the total number of observations falls below a predetermined lower limit value, the observation number table is set so that the total number of observations becomes the reference value. Is normalized, so that an excessive increase and excessive decrease in learning sensitivity can be suppressed.

本発明のさらに別の態様は、上記の学習方法をコンピュータに実行させるためのコンピュータプログラムである。   Yet another embodiment of the present invention is a computer program for causing a computer to execute the learning method described above.

本発明によれば、条件付確率表を観測に基づく学習によって更新するベイジアンネットワークにおいて、学習感度の過度の増加又は過度の低下を抑えることができる。   According to the present invention, in a Bayesian network in which a conditional probability table is updated by learning based on observation, an excessive increase or excessive decrease in learning sensitivity can be suppressed.

本発明の実施の形態における学習装置の構成を示すブロック図The block diagram which shows the structure of the learning apparatus in embodiment of this invention 本発明の実施の形態における条件付依存関係のグラフ構造を示す図The figure which shows the graph structure of the conditional dependence relationship in embodiment of this invention 本発明の実施の形態における条件付依存関係の一部のグラフ構造を示す図The figure which shows the graph structure of a part of conditional dependency in embodiment of this invention 本発明の実施の形態における条件付確率表の例を示す図The figure which shows the example of the conditional probability table | surface in embodiment of this invention 本発明の実施の形態における条件付観測回数表の例を示す図The figure which shows the example of the conditional observation frequency table in embodiment of this invention 本発明の実施の形態の条件付確率更新処理のフロー図Flow chart of conditional probability update processing according to the embodiment of the present invention

以下、本発明の実施の形態の学習装置について、図面を参照しながら説明する。図1は、本発明の実施の形態の学習装置を含む推論装置の構成を示す図である。推論装置100は、情報コンテンツである楽曲コンテンツの再生に係る確率モデルを用いて、推論を行なう装置である。   Hereinafter, a learning apparatus according to an embodiment of the present invention will be described with reference to the drawings. FIG. 1 is a diagram showing a configuration of an inference device including a learning device according to an embodiment of the present invention. The inference apparatus 100 is an apparatus that performs inference using a probability model related to reproduction of music content that is information content.

この推論装置100には、図示しない情報コンテンツ再生装置(楽曲コンテンツ再生装置)が接続され、情報コンテンツ再生装置から、条件付確率表を学習するための観測データを入力する。また、推論装置100は、推論を行なう際に、情報コンテンツ再生装置から観測値が得られたノード(以下、「観測ノード」という。)の観測値を入力するとともに、推論すべきノード(以下、「推論ノード」という。)の推論結果を情報コンテンツ再生装置に出力する。   The inference device 100 is connected to an information content reproduction device (music content reproduction device) not shown, and receives observation data for learning a conditional probability table from the information content reproduction device. In addition, the inference device 100 inputs an observation value of a node (hereinafter referred to as an “observation node”) from which an observation value is obtained from the information content reproduction device when performing inference, and a node to be inferred (hereinafter referred to as “observation node”) The inference result of “inference node” is output to the information content reproduction apparatus.

図1に示すように、本実施の形態の推論装置100は、学習部10と、モデル記憶部20と、推論部30と、入力部40と、出力部50とを備えている。学習部10は、本発明の学習装置に相当する。なお、学習部10は、コンピュータが学習プログラムを実行することによって実現されてよい。   As illustrated in FIG. 1, the inference apparatus 100 according to the present embodiment includes a learning unit 10, a model storage unit 20, an inference unit 30, an input unit 40, and an output unit 50. The learning unit 10 corresponds to the learning device of the present invention. The learning unit 10 may be realized by a computer executing a learning program.

モデル記憶部20は、ベイジアンネットワークの確率モデルを記憶している。学習部10は、学習によってモデル記憶部20に記憶された確率モデルを更新する。推論部30は、観測ノードの観測値に基づいて、推論ノードの事後確率表を作成する。推論部30は、事後確率表を推論結果として出力してもよいし、事後確率表における最大事後確率のステートを推論結果として出力してもよい。入力部40は、学習の際には親ノードとその子ノードの観測値を情報コンテンツ再生装置から入力し、推論の際には観測ノードの観測値を情報コンテンツ再生装置から入力する。出力部50は、推論部30で得られた推論結果を出力する。   The model storage unit 20 stores a Bayesian network probability model. The learning unit 10 updates the probability model stored in the model storage unit 20 by learning. The inference unit 30 creates an a posteriori probability table of the inference node based on the observation value of the observation node. The inference unit 30 may output the posterior probability table as an inference result, or may output the state of the maximum posterior probability in the posterior probability table as the inference result. The input unit 40 inputs the observation value of the parent node and its child node from the information content reproduction device during learning, and inputs the observation value of the observation node from the information content reproduction device during inference. The output unit 50 outputs the inference result obtained by the inference unit 30.

モデル記憶部20は、具体的には、確率変数間の条件付依存関係21(即ち、ベイジアンネットワークのグラフ構造)と、条件付確率表22と、条件付確率表22を作成するための条件付観測回数表23を記憶している。   Specifically, the model storage unit 20 includes a conditional dependency relationship 21 between random variables (that is, a Bayesian network graph structure), a conditional probability table 22, and a conditional probability table 22 for creating the conditional probability table 22. The observation frequency table 23 is stored.

図2は、条件付依存関係21のグラフ構造を示す図である。上述のように、この確率モデルは、情報コンテンツとしての楽曲コンテンツの再生に係る確率モデルである。図2に示すように、この確率モデルには、楽曲コンテンツの属性に関するノードとして、楽曲の「ジャンル」、「年代」、「アーティスト」、「各情報コンテンツの有無」のノードが含まれており、楽曲コンテンツの再生に関するノードとして、再生の「曜日」、「時間」、「シーン」、「番組総時間」のノードが含まれている。   FIG. 2 is a diagram illustrating a graph structure of the conditional dependency relationship 21. As described above, this probability model is a probability model related to reproduction of music content as information content. As shown in FIG. 2, this probability model includes nodes of “genre”, “age”, “artist”, and “presence / absence of each information content” as nodes related to the attributes of the music content, As nodes related to the reproduction of the music content, the nodes of “Day of Week”, “Time”, “Scene”, and “Total Program Time” of reproduction are included.

入力部40は、ある事象が観測された場合に、条件付観測回数表23を更新するために、その事象の観測データとして、確率変数の値を入力する。入力部40は、観測データを情報コンテンツ再生装置から入力する。この情報コンテンツ再生装置は、車両に搭載されている。   When a certain event is observed, the input unit 40 inputs the value of a random variable as observation data of the event in order to update the conditional observation count table 23. The input unit 40 inputs observation data from the information content reproduction device. This information content reproduction apparatus is mounted on a vehicle.

情報コンテンツ再生装置は、楽曲コンテンツが再生されると、その楽曲コンテンツの属性に関する観測値として、「ジャンル」、「年代」、「アーティスト」、「各情報コンテンツの有無」の値を出力し、再生に関する観測値として、再生の「曜日」、「時間」、「シーン」、「番組総時間」の値を出力する。入力部40は、これらの値を観測データとして入力する。   When the music content is played back, the information content playback device outputs the values of “genre”, “age”, “artist”, and “presence / absence of each information content” as the observed values related to the attributes of the music content, and plays them. As the observed values, the values of “day of the week”, “time”, “scene”, and “total program time” of the reproduction are output. The input unit 40 inputs these values as observation data.

情報コンテンツ再生装置は、複数の楽曲コンテンツを所定の再生順序に従って自動的に再生可能である。また、情報コンテンツ再生装置は、ユーザの操作に従って、再生する楽曲コンテンツを直接指定して再生するダイレクト再生も可能である。さらに、情報コンテンツ再生装置は、ユーザの操作に従って、複数の楽曲コンテンツを再生順序に従って順に再生するのではなく、一の楽曲コンテンツを繰り返し再生するリピート再生も可能である。   The information content reproduction apparatus can automatically reproduce a plurality of music contents according to a predetermined reproduction order. In addition, the information content reproduction apparatus can also perform direct reproduction in which music content to be reproduced is directly designated and reproduced in accordance with a user operation. Furthermore, the information content reproduction apparatus can perform repeat reproduction in which a plurality of music contents are not reproduced in order according to the user's operation in accordance with the reproduction order, but one music content is repeatedly reproduced.

また、情報コンテンツ再生装置は、ユーザの操作に従って、複数の楽曲コンテンツを再生順序に従って順に再生しているときに、一の楽曲コンテンツをスキップして、次の楽曲コンテンツを再生することもできる。情報コンテンツ再生装置は、再生されたときの上述の観測データのほかに、ダイレクト再生の情報、リピート再生の情報、再生スキップの情報も観測データとして出力し、入力部40はこれらの観測データを入力する。   In addition, the information content playback apparatus can also skip the one music content and play the next music content when the plurality of music contents are played in order according to the playback order according to the user's operation. In addition to the above-mentioned observation data at the time of reproduction, the information content reproduction device outputs direct reproduction information, repeat reproduction information, and reproduction skip information as observation data, and the input unit 40 inputs these observation data. To do.

以下、条件付確率表の学習について説明するが、以下の説明では、図2に示す条件付依存関係21のグラフ構造のうち、「シーン」、「番組総時間」、及び「ジャンル」に係るグラフ構造部分を例に説明する。図3は、このグラフ構造部分に係る条件付依存関係を示す図である。このグラフ構造部分では、「シーン」及び「番組総時間」が親ノードとなり、「ジャンル」が子ノードとなる。   Hereinafter, learning of the conditional probability table will be described. In the following description, among the graph structure of the conditional dependency relationship 21 shown in FIG. 2, graphs relating to “scene”, “total program time”, and “genre” The structure portion will be described as an example. FIG. 3 is a diagram showing a conditional dependency relationship related to the graph structure portion. In this graph structure portion, “scene” and “total program time” are parent nodes, and “genre” is a child node.

図4は、このグラフ構造部分の条件付確率表22の例を示す図である。この条件付確率表において、各列は、親ノードである「シーン」及び「番組総時間」の各ステートを表し、各行は、子ノードである「ジャンル」の各ステートを表す。図5は、条件付観測回数表23の例を示す図である。図5の条件付観測回数表は、図4の条件付確率表に対応している。   FIG. 4 is a diagram showing an example of the conditional probability table 22 of this graph structure part. In this conditional probability table, each column represents each state of “scene” as a parent node and “total program time”, and each row represents each state of “genre” as a child node. FIG. 5 is a diagram illustrating an example of the conditional observation count table 23. The conditional observation frequency table in FIG. 5 corresponds to the conditional probability table in FIG.

学習部10は、条件付観測回数更新部11と、観測回数総和計算部112と、観測回数表正規化部113とを備えた条件付観測回数標高深部11と、条件付確率更新部12とを備えている。   The learning unit 10 includes a conditional observation frequency elevation unit 11 including a conditional observation frequency update unit 11, an observation frequency total calculation unit 112, an observation frequency table normalization unit 113, and a conditional probability update unit 12. I have.

観測回数増減管理部111は、親ノードである「シーン」及び「番組総時間」のそれぞれの観測値、及び子ノードである「ジャンル」の観測値を含む観測データを入力部40から取得する。観測回数増減管理部11は、観測ノードに基づいて、親ノードである「シーン」の各ステート(レジャー、通勤、買い物等)及び親ノードである「番組総時間」の各ステート(0.5〜1時間、1〜1.5時間、1.5〜2時間、・・・)と子ノードである「ジャンル」の各ステート(J−POP、ロック、ジャズ、クラシック、フォーク、ダンス)の組合せごとに観測回数を規定した条件付観測回数表において、取得した観測ノードに該当するセルの観測回数に観測回数加算値を加算する。   The observation frequency increase / decrease management unit 111 acquires from the input unit 40 observation data including observation values of the parent node “scene” and “program total time” and child node “genre” observation values. Based on the observation node, the observation frequency increase / decrease management unit 11 sets each state of the “scene” as a parent node (leisure, commuting, shopping, etc.) and each state of the “total program time” as a parent node (from 0.5 to 0.5). 1 hour, 1 to 1.5 hours, 1.5 to 2 hours, ...) and each combination of child node "genre" states (J-POP, rock, jazz, classic, folk, dance) In the conditional observation count table in which the number of observations is defined, the observation count addition value is added to the observation count of the cell corresponding to the acquired observation node.

観測回数増減管理部111は、再生順序に従って自動的に再生された楽曲コンテンツにいては、基準の観測回数加算値を加算する。基準の観測回数加算値は、例えば1である。観測回数増減管理部111は、再生順序に従って自動的に再生されたのではなく、ユーザの操作によって直接指定されて再生された楽曲コンテンツについては、割り増しの観測回数加算値を加算するポジティブ学習を行なう。また、観測回数増減管理部111は、ユーザの操作によってリピート再生された楽曲コンテンツについても、同様に割り増しの観測回数加算値を加算するポジティブ学習を行なう。割り増しの観測回数加算値は、例えば2である。   The observation frequency increase / decrease management unit 111 adds the reference observation frequency addition value for the music content that is automatically reproduced according to the reproduction order. The reference observation frequency addition value is, for example, 1. The observation frequency increase / decrease management unit 111 performs positive learning that adds the additional observation frequency addition value for the music content that is not directly reproduced according to the reproduction order but is directly designated and reproduced by the user's operation. . In addition, the observation frequency increase / decrease management unit 111 performs positive learning for adding the additional observation frequency addition value in the same manner for the music content that is repeatedly played by the user's operation. The additional observation count addition value is 2, for example.

観測回数増減管理部111は、さらに、観測データに基づいて観測回数を増加させるだけでなく、次の場合には観測回数を減少させるネガティブ学習を行なう。即ち、情報コンテンツ再生装置において、楽曲コンテンツがスキップされた場合には、観測回数増減管理部111は、その情報を観測データとして取得して、当該スキップされた楽曲コンテンツについて、該当するセルの観測回数から観測回数減算値を減算する。観測回数減算値は、例えば1である。   The observation frequency increase / decrease management unit 111 not only increases the observation frequency based on the observation data, but also performs negative learning to decrease the observation frequency in the following case. That is, in the information content reproduction apparatus, when the music content is skipped, the observation frequency increase / decrease management unit 111 acquires the information as observation data, and for the skipped music content, the observation frequency of the corresponding cell. Subtract the observation count subtraction value from. The observation frequency subtraction value is, for example, 1.

観測回数総和計算部112は、条件付観測回数表23における観測回数の総和を計算する。観測回数表正規化部113は、観測回数総和計算部112にて算出された観測回数の総和が所定の上限値(例えば1200)を超えたか否かを判断する。   The observation count total calculation unit 112 calculates the sum of the observation counts in the conditional observation count table 23. The observation number table normalization unit 113 determines whether the total number of observations calculated by the observation number total calculation unit 112 exceeds a predetermined upper limit value (for example, 1200).

観測回数の総和が上限値を超えている場合には、観測回数表正規化部113は、観測回数の総和が上限値より低い所定の基準値(例えば1000)となるように、条件付観測回数表を正規化する。具体的には、すべてのセルの観測回数に(基準値/上限値)(上記の例では、1000/1200=5/6)を掛けて、観測回数の総和が基準値程度になるようにする。即ち、観測回数総和計算部112は、観測回数の総和が基準値を所定の割合(上記の例では、20%)以上上回った場合に、観測回数の総和を基準値に戻すように、すべてのセルの観測回数に(基準値/上限値)=(1/(1+所定の割合))を掛けて、条件付観測回数表全体を正規化する。   When the total number of observations exceeds the upper limit, the observation number table normalization unit 113 sets the number of conditional observations so that the total number of observations becomes a predetermined reference value (for example, 1000) lower than the upper limit. Normalize the table. Specifically, the number of observations of all cells is multiplied by (reference value / upper limit value) (in the above example, 1000/1200 = 5/6) so that the total number of observations is about the reference value. . That is, the total number of observations calculation unit 112 sets all the observation numbers so that the total number of observations is returned to the reference value when the total number of observations exceeds the reference value by a predetermined ratio (20% in the above example). Multiply the number of cell observations by (reference value / upper limit) = (1 / (1 + predetermined ratio)) to normalize the entire conditional observation table.

また、観測回数表正規化部113は、観測回数総和計算部112にて算出された観測回数の総和が所定の下限値(例えば800)を下回ったか否かを判断する。観測回数の総和が下限値を下回った場合には、観測回数表正規化部113は、観測回数の総和が下限値より高い基準値(例えば1000)となるように、条件付観測回数表を正規化する。   In addition, the observation number table normalization unit 113 determines whether or not the total number of observations calculated by the observation number total calculation unit 112 is below a predetermined lower limit value (for example, 800). When the total number of observations falls below the lower limit, the observation number table normalization unit 113 normalizes the conditional observation number table so that the total number of observations becomes a reference value higher than the lower limit (for example, 1000). Turn into.

具体的には、すべてのセルの観測回数に(基準値/下限値)(上記の例では、10000/800=5/4)を掛けて、観測回数の総和が基準値程度になるようにする。即ち、観測回数総和計算部112は、観測回数の総和が基準値を所定の割合(上記の例では、20%)以上下回った場合に、観測回数の総和を基準値に戻すように、すべてのセルの観測回数に(基準値/下限値)=(1/(1−所定の割合))を掛けて、条件付観測回数表全体を正規化する。   Specifically, the number of observations of all cells is multiplied by (reference value / lower limit value) (10000/800 = 5/4 in the above example) so that the total number of observations is about the reference value. . That is, the total number of observations calculation unit 112 sets all the observation numbers so that the total number of observations is returned to the reference value when the total number of observations falls below the reference value by a predetermined ratio (20% in the above example). Multiply the number of cell observations by (reference value / lower limit value) = (1 / (1−predetermined ratio)) to normalize the entire conditional observation frequency table.

以上のようにして、条件付観測回数表更新部11は、条件付観測回数表23を更新し、必要に応じて観測回数の総和が基準値になるように条件付観測回数表23を正規化する。条件付確率表更新部12は、このようにして得られた条件付観測回数表に基づいて条件付確率表を作成しなおす。   As described above, the conditional observation count table updating unit 11 updates the conditional observation count table 23 and normalizes the conditional observation count table 23 so that the sum of the observation counts becomes a reference value as necessary. To do. The conditional probability table updating unit 12 recreates the conditional probability table based on the conditional observation frequency table obtained in this way.

上記では、学習部10において、観測に基づく学習を行なう際に入力部40が入力する観測データについて説明したが、入力部40はさらに、推論部30が観測ノードの値に基づいて、推論ノードの推論を行なうために、観測ノードの観測値を入力する。   In the above, the observation data input by the input unit 40 when performing learning based on observation in the learning unit 10 has been described. However, the input unit 40 is further configured so that the inference unit 30 determines the inference node based on the value of the observation node. In order to make an inference, the observation value of the observation node is input.

推論部30は、入力部40に入力された観測ノードの値に基づいて、モデル記憶部20に記憶されたベイジアンネットワークの確率モデルを用いて推論を行なう。図2において枠で囲った部分について、推論部30は、「シーン」及び「番組総時間」のノードを観測ノードとし、かつ、「ジャンル」、「年代」、「アーティスト」、「各情報コンテンツの有無」をそれぞれ推論ノードとして、推論を行なう。   The inference unit 30 performs inference using a Bayesian network probability model stored in the model storage unit 20 based on the value of the observation node input to the input unit 40. 2, the inference unit 30 uses the “scene” and “total program time” nodes as observation nodes, and also includes “genre”, “age”, “artist”, and “information contents”. Inference is performed using “existence” as an inference node.

推論部30は、観測ノードの観測値に基づいて観測ノードの事後確率表を生成し、この観測ノードの事後確率表に基づいて、推定ノードの事後確率表を求める。推論部30は、この推論ノードの事後確率表を、出力部50を介して情報コンテンツ再生装置に出力する。情報コンテンツ再生装置では、この推論ノードの事後確率表に基づいて、ユーザの傾向や嗜好を考慮したお薦めの楽曲コンテンツを提示する。推論部30は、推論ノードの事後確率表における最大事後確率の楽曲コンテンツを、出力部50を介して情報コンテンツ再生装置に出力してもよい。   The inference unit 30 generates a posterior probability table of the observation node based on the observation value of the observation node, and obtains a posterior probability table of the estimation node based on the posterior probability table of the observation node. The inference unit 30 outputs the posterior probability table of the inference node to the information content reproduction device via the output unit 50. The information content reproduction apparatus presents recommended music content in consideration of the user's tendency and preference based on the a posteriori probability table of the inference node. The inference unit 30 may output the music content having the maximum posterior probability in the posterior probability table of the inference node to the information content reproduction device via the output unit 50.

図6は、学習部10による条件付確率更新処理のフロー図である。学習部10は、まず入力部40より、観測データを取得する(ステップS61)。条件付観測回数表更新部11の観測回数増減管理部111は、観測データに基づいて、条件付観測回数表23中の観測回数を更新するセルを選択し、当該セルの観測回数を増加させるか減少させるかを判断し、増加させる場合には、基準の観測回数加算値を加算するか、割り増しの観測回数加算値を加算するかを判断し、選択したセルの観測回数に対して、観測回数加算値を加算し、又は観測回数減算値を減算する(ステップS62)。   FIG. 6 is a flowchart of conditional probability update processing by the learning unit 10. The learning unit 10 first acquires observation data from the input unit 40 (step S61). Whether the observation frequency increase / decrease management unit 111 of the conditional observation frequency table update unit 11 selects a cell for updating the observation frequency in the conditional observation frequency table 23 based on the observation data, and increases the observation frequency of the cell. Decide whether to decrease, and if you want to increase it, determine whether to add the standard observation count addition value or the additional observation count addition value, and count the number of observations relative to the observation count of the selected cell. The addition value is added or the observation number subtraction value is subtracted (step S62).

次に、観測回数総和計算部112は、条件付観測回数表23について、観測回数の総和を計算する(ステップS63)。そして、観測回数表正規化部113は、観測回数総和計算部112にて算出された観測回数の総和が、所定の上限値(基準値の20%増)を超えており、又は所定の下限値(基準値の20%減)を下回っているかを判断する(ステップS64)。   Next, the observation number total calculation unit 112 calculates the total number of observations for the conditional observation number table 23 (step S63). Then, the observation number table normalization unit 113 has the total number of observations calculated by the observation number sum calculation unit 112 exceeding a predetermined upper limit value (20% increase of the reference value), or a predetermined lower limit value. It is determined whether it is below (20% reduction of the reference value) (step S64).

観測回数の総和が所定の上限値を超えており、又は所定の下限値を下回っている場合には(ステップS64にてYES)、観測回数表正規化部113は、条件付観測回数表23を正規化する(ステップS65)。観測回数の総和が上限値以下であって下限値以上である場合(ステップS64にてNO)、及び観測回数表正規化部113にて条件付観測回数表23を正規化した後には、条件付確率表更新部12が、その条件付観測回数表23に基づいて条件付確率表を更新する(ステップS66)。   When the total number of observations exceeds a predetermined upper limit value or is lower than a predetermined lower limit value (YES in step S64), observation number table normalization unit 113 stores conditional observation number table 23. Normalization is performed (step S65). If the total number of observations is less than or equal to the upper limit value and greater than or equal to the lower limit value (NO in step S64), and after normalizing the conditional observation frequency table 23 by the observation frequency table normalization unit 113, the conditional The probability table update unit 12 updates the conditional probability table based on the conditional observation count table 23 (step S66).

なお、条件付確率表の更新は、ステップS62にて、観測回数表の観測回数が増減された後であれば、いつ実施されてもよい。これは、条件付観測回数表23の正規化は、上述のように、全体に一定の係数を掛けることで行なわれるので、条件付観測回数表23に基づいて計算される条件付確率表22は、条件付観測回数表23が正規化される前後で変わらないからである。   The conditional probability table may be updated any time after the number of observations in the observation number table is increased or decreased in step S62. This is because normalization of the conditional observation count table 23 is performed by multiplying the whole by a constant coefficient as described above, so that the conditional probability table 22 calculated based on the conditional observation count table 23 is This is because the conditional observation count table 23 does not change before and after normalization.

なお、上記の実施の形態では、上限値を基準値の20%増とし、下限値を基準値の20%減としたが、上限値及び下限値がこれらに限られないことはいうまでもない。また、上記の実施の形態では、基準値を1000としたが、これに限られない。基準値は、セルの個数及び観測回数加算値及び観測回数減算値の大きさに基づいて設定される。好ましくは、1回の観測回数加算値の加算によって、条件付確率表の条件付き確率が0.1〜10%程度変動するように、基準値を定める。   In the above embodiment, the upper limit value is increased by 20% of the reference value and the lower limit value is decreased by 20% of the reference value. However, it goes without saying that the upper limit value and the lower limit value are not limited to these. . In the above embodiment, the reference value is 1000, but the present invention is not limited to this. The reference value is set based on the number of cells, the number of observation count addition values, and the number of observation count subtraction values. Preferably, the reference value is determined so that the conditional probability of the conditional probability table varies by about 0.1 to 10% by adding the observation number addition value for one time.

また、上記の実施の形態では、条件付観測回数表23における観測回数の総和が上限値を超えた場合に、条件付観測回数表23のすべての観測回数に(基準値/上限値)を掛け、又は下限値を下回った場合に、条件付観測回数表23のすべての観測回数に(基準値/下限値)を掛けることで、条件付観測回数表23を正規化したが、条件付観測回数表23における観測回数の総和が上限値を超えた場合に、条件付観測回数表23のすべての観測回数に(基準値/観測回数の総和)を掛け、又は下限値を下回った場合に、条件付観測回数表23のすべての観測回数に(基準値/観測回数の総和)を掛けることで、条件付観測回数表23を正規化してもよい。   In the above embodiment, when the total number of observations in the conditional observation count table 23 exceeds the upper limit value, all the observation counts in the conditional observation count table 23 are multiplied by (reference value / upper limit value). Or, when the value is below the lower limit value, the conditional observation count table 23 is normalized by multiplying all the observation counts in the conditional observation count table 23 by (reference value / lower limit value). When the total number of observations in Table 23 exceeds the upper limit value, multiply all the observation times in the conditional observation number table 23 by (reference value / total number of observations) or below the lower limit value. The conditional observation count table 23 may be normalized by multiplying all the observation counts in the additional observation count table 23 by (reference value / total number of observations).

上記の後者の方法によれば、正規化によって観測回数の総和がちょうど基準値になる。しかし、正規化の際に観測回数の総和を正確に基準値に戻す必要はないので、前者の方法であっても本発明の効果には実質的に影響しない。   According to the latter method, the sum of the number of observations becomes the reference value just by normalization. However, since it is not necessary to accurately return the total number of observations to the reference value during normalization, even the former method does not substantially affect the effects of the present invention.

また、上記の実施の形態では、観測回数増減管理部111が、観測データに基づいて、観測回数を増加又は減少させたが、観測データを得た場合に条件付観測回数表23の該当するセルに観測回数加算値を加算するだけであってもよい。また、観測回数増減管理部111は、直接再生やリピート再生がされた場合には、観測回数の加算を加速すべく条件付観測回数表23の該当するセルに割り増しの観測回数加算値を加算したが、このような観測回数の加算を行わなくてもよい。一方、観測回数増減管理部111は、観測回数の減算についても、よりネガティブな事象を観測した場合には、割り増しの観測回数減算値を減算して、観測回数の減算を加速するようにしてもよい。   In the above embodiment, the observation frequency increase / decrease management unit 111 increases or decreases the observation frequency based on the observation data. However, when the observation data is obtained, the corresponding cell in the conditional observation frequency table 23 It is also possible to simply add the observation count addition value to. In addition, the observation number increase / decrease management unit 111 adds the additional observation number addition value to the corresponding cell in the conditional observation number table 23 in order to accelerate the addition of the observation number when direct reproduction or repeat reproduction is performed. However, it is not necessary to add such observation times. On the other hand, the observation frequency increase / decrease management unit 111 also accelerates the subtraction of the observation frequency by subtracting the additional observation frequency subtraction value when a more negative event is observed in the subtraction of the observation frequency. Good.

本発明は、条件付確率表を観測に基づく学習によって更新するベイジアンネットワークにおいて、学習感度の過度の増加又は過度の低下を抑えることができるという効果を有し、ベイジアンネットワークの条件付確率表を観測に基づく学習によって更新する学習装置等として有用である。   The present invention has an effect of suppressing an excessive increase or decrease in learning sensitivity in a Bayesian network that updates a conditional probability table by learning based on observation, and observes a conditional probability table of a Bayesian network. It is useful as a learning device that is updated by learning based on the above.

10 学習部
11 条件付観測回数表更新部
111 観測回数増減管理部
112 観測回数総和計算部
113 観測回数表正規化部
12 条件付確率更新部
20 モデル記憶部
21 条件付依存関係
22 条件付確率表
23 条件付観測回数表
30 推論部
40 入力部
50 出力部
100 推論装置
DESCRIPTION OF SYMBOLS 10 Learning part 11 Conditional observation frequency table update part 111 Observation frequency increase / decrease management part 112 Observation frequency sum total calculation part 113 Observation frequency table normalization part 12 Conditional probability update part 20 Model storage part 21 Conditional dependence 22 Conditional probability table 23 Conditional Observation Count Table 30 Inference Unit 40 Input Unit 50 Output Unit 100 Inference Device

Claims (11)

ベイジアンネットワークの条件付確率表を観測に基づく学習によって更新する学習装置であって、
親ノードの観測値及び子ノードの観測値を含む観測データに基づいて、前記親ノードの各ステート及び前記子ノードの各ステートの組合せごとに観測回数を規定した条件付観測回数表における該当する前記組合せの観測回数に観測回数加算値を加算する観測回数増減管理部と、
前記条件付観測回数表における観測回数の総和を計算する観測回数総和計算部と、
前記観測回数の総和が所定の上限値を超えたときに、前記観測回数の総和が前記上限値より低い所定の基準値となるように、前記条件付観測回数表を正規化する観測回数表正規化部と、
前記条件付観測回数表に基づいて、当該条件付観測回数表に対応する条件付確率表を更新する条件付確率表更新部と、
を備えたことを特徴とする学習装置。
A learning device that updates a conditional probability table of a Bayesian network by observation-based learning,
Based on the observation data including the observation value of the parent node and the observation value of the child node, the corresponding observation number in the conditional observation number table defining the number of observations for each combination of each state of the parent node and each state of the child node An observation frequency increase / decrease management unit for adding the observation frequency addition value to the number of observations of the combination;
A total number of observations calculation unit for calculating the total number of observations in the conditional number of observations table;
An observation frequency table normalization that normalizes the conditional observation frequency table so that the total number of observations becomes a predetermined reference value lower than the upper limit value when the total number of observations exceeds a predetermined upper limit value. And
A conditional probability table updating unit that updates a conditional probability table corresponding to the conditional observation frequency table based on the conditional observation frequency table;
A learning apparatus comprising:
前記観測回数増減管理部は、前記観測データに基づいて、前記観測回数加算値を増減させることを特徴とする請求項1に記載の学習装置。   The learning apparatus according to claim 1, wherein the observation frequency increase / decrease management unit increases or decreases the observation frequency addition value based on the observation data. ベイジアンネットワークの条件付確率表を観測に基づく学習によって更新する学習装置であって、
親ノードの観測値及び子ノードの観測値を含む観測データに基づいて、前記親ノードの各ステート及び前記子ノードの各ステートの組合せごとに観測回数を規定した条件付観測回数表における該当する組合せの観測回数に対して、観測回数加算値を加算し、又は観測回数減算値を減算する観測回数増減管理部と、
前記条件付観測回数表における観測回数の総和を計算する観測回数総和計算部と、
前記観測回数の総和が所定の上限値を超えたとき、又は前記観測回数の総和が所定の下限値を下回ったときに、前記観測回数の総和が前記上限値より小さく前記下限値より大きい所定の基準値となるように、前記条件付観測回数表を正規化する観測回数表正規化部と、
前記条件付観測回数表に基づいて、当該条件付観測回数表に対応する条件付確率表を更新する条件付確率表更新部と、
を備えたことを特徴とする学習装置。
A learning device that updates a conditional probability table of a Bayesian network by observation-based learning,
Corresponding combinations in the conditional observation count table that specifies the number of observations for each combination of each state of the parent node and each state of the child node based on observation data including the observation value of the parent node and the observation value of the child node The observation frequency increase / decrease management unit for adding the observation frequency addition value or subtracting the observation frequency subtraction value to the observation frequency of
A total number of observations calculation unit for calculating the total number of observations in the conditional number of observations table;
When the total number of observations exceeds a predetermined upper limit value or when the total number of observations falls below a predetermined lower limit value, the total number of observations is smaller than the upper limit value and larger than the lower limit value. An observation frequency table normalization unit that normalizes the conditional observation frequency table so as to be a reference value;
A conditional probability table updating unit that updates a conditional probability table corresponding to the conditional observation frequency table based on the conditional observation frequency table;
A learning apparatus comprising:
前記観測回数増減管理部は、前記観測データに基づいて、前記観測回数加算値又は前記観測回数減算値を増減させることを特徴とする請求項3に記載の学習装置。   The learning device according to claim 3, wherein the observation frequency increase / decrease management unit increases or decreases the observation frequency addition value or the observation frequency subtraction value based on the observation data. 前記ベイジアンネットワークは、情報コンテンツの再生に係る確率モデルであり、前記情報コンテンツの属性に関するノードと、前記再生の属性に関するノードとを含み、前記情報コンテンツの属性に関するノードは、前記観測データに基づいて、観測回数が増加または減少することを特徴とする請求項1ないし4のいずれか一項に記載の学習装置。   The Bayesian network is a probabilistic model related to reproduction of information content, and includes a node related to the attribute of the information content and a node related to the attribute of the reproduction, and the node related to the attribute of the information content is based on the observation data The learning apparatus according to claim 1, wherein the number of observations increases or decreases. 前記情報コンテンツは、所定の順序に従って自動的に再生可能であるとともに、直接再生することも可能であり、
前記観測回数増減管理部は、情報コンテンツが再生されたときに、前記情報コンテンツの属性に関するノードの該当するステートの観測回数に前記観測回数加算値を加算するとともに、情報コンテンツが直接再生されたときに、前記情報コンテンツの属性に関するノードの該当するステートの観測回数加算値を、自動的に再生されたときの前記情報コンテンツの属性に関するノードの該当するステートの観測回数加算値より大きくする
ことを特徴とする請求項5に記載の学習装置。
The information content can be automatically reproduced according to a predetermined order, and can also be directly reproduced.
When the information content is reproduced, the observation frequency increase / decrease management unit adds the observation frequency addition value to the observation frequency of the corresponding state of the node related to the attribute of the information content, and when the information content is directly reproduced. In addition, the observation number addition value of the corresponding state of the node related to the attribute of the information content is made larger than the observation number addition value of the corresponding state of the node related to the attribute of the information content when the information content is automatically played back. The learning device according to claim 5.
前記情報コンテンツは、所定の順序に従って自動的に再生可能であるとともに、リピート再生をすることも可能であり、
前記観測回数増減管理部は、情報コンテンツが再生されたときに、前記情報コンテンツの属性に関するノードの該当するステートの観測回数に前記観測回数加算値を加算するとともに、情報コンテンツがリピート再生されたときに、前記情報コンテンツの属性に関するノードの該当するステートの観測回数加算値を、自動的に再生されたときの前記情報コンテンツの属性に関するノードの該当するステートの観測回数加算値より大きくする
ことを特徴とする請求項5又は6に記載の学習装置。
The information content can be automatically reproduced according to a predetermined order, and can also be reproduced repeatedly.
When the information content is reproduced, the observation frequency increase / decrease management unit adds the observation frequency addition value to the observation frequency of the corresponding state of the node related to the attribute of the information content, and when the information content is reproduced repeatedly In addition, the observation number addition value of the corresponding state of the node related to the attribute of the information content is made larger than the observation number addition value of the corresponding state of the node related to the attribute of the information content when the information content is automatically played back. The learning device according to claim 5 or 6.
前記情報コンテンツは、所定の順序に従って自動的に再生可能であるとともに、順序に従った自動的な再生の際に再生をスキップすることも可能であり、
前記観測回数増減管理部は、情報コンテンツの再生がスキップされたときに、前記情報コンテンツの属性に関するノードの該当するステートの観測回数から前記観測回数減算値を減算する
ことを特徴とする請求項5ないし7のいずれか一項に記載の学習装置。
The information content can be automatically reproduced according to a predetermined order, and can be skipped during automatic reproduction according to the order,
The observation frequency increase / decrease management unit subtracts the observation frequency subtraction value from the observation frequency of a corresponding state of a node related to the attribute of the information content when reproduction of the information content is skipped. The learning apparatus as described in any one of thru | or 7.
ベイジアンネットワークの条件付確率表を観測に基づく学習によって更新する学習方法であって、
親ノードの観測値及び子ノードの観測値を含む観測データに基づいて、前記親ノードの各ステート及び前記子ノードの各ステートの組合せごとに観測回数を規定した条件付観測回数表における該当する前記組合せの観測回数に観測回数加算値を加算する観測回数増減管理ステップと、
前記条件付観測回数表における観測回数の総和を計算する観測回数総和計算ステップと、
前記観測回数の総和が所定の上限値を超えたときに、前記観測回数の総和が前記上限値より低い所定の基準値となるように、前記条件付観測回数表を正規化する観測回数表正規化ステップと、
前記条件付観測回数表に基づいて、当該条件付観測回数表に対応する条件付確率表を更新する条件付確率表更新ステップと、
を含むことを特徴とする学習方法。
A learning method for updating a conditional probability table of a Bayesian network by observation-based learning,
Based on the observation data including the observation value of the parent node and the observation value of the child node, the corresponding observation number in the conditional observation number table defining the number of observations for each combination of each state of the parent node and each state of the child node Observation number increase / decrease management step of adding the observation number addition value to the number of observations of the combination;
A total number of observations calculation step for calculating the total number of observations in the conditional observation number table;
An observation frequency table normalization that normalizes the conditional observation frequency table so that the total number of observations becomes a predetermined reference value lower than the upper limit value when the total number of observations exceeds a predetermined upper limit value. Step,
A conditional probability table update step for updating a conditional probability table corresponding to the conditional observation frequency table based on the conditional observation frequency table;
The learning method characterized by including.
ベイジアンネットワークの条件付確率表を観測に基づく学習によって更新する学習方法であって、
親ノードの観測値及び子ノードの観測値を含む観測データに基づいて、前記親ノードの各ステート及び前記子ノードの各ステートの組合せごとに観測回数を規定した条件付観測回数表における該当する組合せの観測回数に対して、観測回数加算値を加算し、又は観測回数減算値を減算する観測回数増減管理ステップと、
前記条件付観測回数表における観測回数の総和を計算する観測回数総和計算ステップと、
前記観測回数の総和が所定の上限値を超えたとき、又は前記観測回数の総和が所定の下限値を下回ったときに、前記観測回数の総和が前記上限値より小さく前記下限値より大きい所定の基準値となるように、前記条件付観測回数表を正規化する観測回数表正規化ステップと、
前記条件付観測回数表に基づいて、当該条件付観測回数表に対応する条件付確率表を更新する条件付確率表更新ステップと、
を含むことを特徴とする学習方法。
A learning method for updating a conditional probability table of a Bayesian network by observation-based learning,
Corresponding combinations in the conditional observation count table that specifies the number of observations for each combination of each state of the parent node and each state of the child node based on observation data including the observation value of the parent node and the observation value of the child node The observation frequency increase / decrease management step of adding the observation frequency addition value or subtracting the observation frequency subtraction value to the observation frequency of
A total number of observations calculation step for calculating the total number of observations in the conditional observation number table;
When the total number of observations exceeds a predetermined upper limit value or when the total number of observations falls below a predetermined lower limit value, the total number of observations is smaller than the upper limit value and larger than the lower limit value. An observation frequency table normalizing step for normalizing the conditional observation frequency table to be a reference value;
A conditional probability table update step for updating a conditional probability table corresponding to the conditional observation frequency table based on the conditional observation frequency table;
The learning method characterized by including.
コンピュータに請求項9又は10に記載の学習方法を実行させるための学習プログラム。   A learning program for causing a computer to execute the learning method according to claim 9 or 10.
JP2011076960A 2011-03-31 2011-03-31 Learning unit, learning method and learning program Pending JP2012212276A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011076960A JP2012212276A (en) 2011-03-31 2011-03-31 Learning unit, learning method and learning program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011076960A JP2012212276A (en) 2011-03-31 2011-03-31 Learning unit, learning method and learning program

Publications (1)

Publication Number Publication Date
JP2012212276A true JP2012212276A (en) 2012-11-01

Family

ID=47266181

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011076960A Pending JP2012212276A (en) 2011-03-31 2011-03-31 Learning unit, learning method and learning program

Country Status (1)

Country Link
JP (1) JP2012212276A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017146635A (en) * 2016-02-15 2017-08-24 株式会社日立製作所 Inference model construction system and inference model construction method

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3184568B2 (en) * 1991-07-31 2001-07-09 シャープ株式会社 Calculation method of frequency of appearance of stochastic transition matrix
JP2005202453A (en) * 2004-01-13 2005-07-28 Mitsubishi Electric Corp Content reproduction device, content reproduction method and program
JP2009100406A (en) * 2007-10-19 2009-05-07 Toshiba Corp Habit-of-viewing learning apparatus

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3184568B2 (en) * 1991-07-31 2001-07-09 シャープ株式会社 Calculation method of frequency of appearance of stochastic transition matrix
JP2005202453A (en) * 2004-01-13 2005-07-28 Mitsubishi Electric Corp Content reproduction device, content reproduction method and program
JP2009100406A (en) * 2007-10-19 2009-05-07 Toshiba Corp Habit-of-viewing learning apparatus

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
CSNB200800404001; 本村 陽一: ベイジアンネットワーク技術 第1版, 20060730, pp.114-115 *
CSNG201100181002; 山口 大輔: '暗黙的評価を含む再生履歴に基づく多様な楽曲推薦' 電子情報通信学会技術研究報告 第110巻, 20110224, pp.7-12 *
CSNJ201110031012; 石井 充: 'マルコフ過程とGAを組み合わせた楽曲再生順序最適化' 第73回(平成23年)全国大会講演論文集(2) 人工知能と認知科学 , 20110302, pp.2-23-2-24 *
JPN6014006714; 石井 充: 'マルコフ過程とGAを組み合わせた楽曲再生順序最適化' 第73回(平成23年)全国大会講演論文集(2) 人工知能と認知科学 , 20110302, pp.2-23-2-24 *
JPN6014006715; 山口 大輔: '暗黙的評価を含む再生履歴に基づく多様な楽曲推薦' 電子情報通信学会技術研究報告 第110巻, 20110224, pp.7-12 *
JPN6014006716; 本村 陽一: ベイジアンネットワーク技術 第1版, 20060730, pp.114-115 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017146635A (en) * 2016-02-15 2017-08-24 株式会社日立製作所 Inference model construction system and inference model construction method

Similar Documents

Publication Publication Date Title
US9058564B2 (en) Controlling quarantining and biasing in cataclysms for optimization simulations
US20180260750A1 (en) Association-based product design
Brest et al. Performance comparison of self-adaptive and adaptive differential evolution algorithms
Moore et al. Optimal reinsertion: A new search operator for accelerated and more accurate Bayesian network structure learning
Jerzak et al. Bloom filter based routing for content-based publish/subscribe
US20050240546A1 (en) Forward-chaining inferencing
CN104462668A (en) Computer-implemented method for designing an industrial product modeled with a binary tree
JP2007122144A (en) System and method for supporting selection of project member
KR20110032222A (en) Emf model synchronization method and system
JP5490819B2 (en) Method, apparatus, and computer program product for polynomial-based data conversion and utilization
WO2014020834A1 (en) Word latent topic estimation device and word latent topic estimation method
JP2012212276A (en) Learning unit, learning method and learning program
US20230334325A1 (en) Model Training Method and Apparatus, Storage Medium, and Device
JP2012064154A (en) Design device
Abdou et al. Multi-pareto-ranking evolutionary algorithm
Borboudakis et al. Scoring and searching over Bayesian networks with causal and associative priors
US20130288796A1 (en) Random data generation
JP7242865B2 (en) Using Bayesian Inference to Predict Review Decisions in Match Graphs
JP2014109879A (en) Extraction program, extraction device, and extraction method
WO2019244446A1 (en) System configuration derivation device, method, and program
JP2005259119A (en) Application management system and method of managing application
JP6036224B2 (en) Sequence control system, sequence control method, sequence control program, and message management system
US20230237036A1 (en) Data modification method and information processing apparatus
Fatemi et al. Rating and generating Sudoku puzzles based on constraint satisfaction problems
WO2018207649A1 (en) Inference system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130318

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140218

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140409

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20141111