JP5070860B2 - 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム - Google Patents
情報処理装置、および情報処理方法、並びにコンピュータ・プログラム Download PDFInfo
- Publication number
- JP5070860B2 JP5070860B2 JP2007020470A JP2007020470A JP5070860B2 JP 5070860 B2 JP5070860 B2 JP 5070860B2 JP 2007020470 A JP2007020470 A JP 2007020470A JP 2007020470 A JP2007020470 A JP 2007020470A JP 5070860 B2 JP5070860 B2 JP 5070860B2
- Authority
- JP
- Japan
- Prior art keywords
- action
- information
- observation
- attribute
- rule
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Pure & Applied Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Algebra (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Computational Mathematics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
(a)状態情報(State space):S
(b)行動情報(Action space):A
(c)観測情報(Observation space):O
(d)報酬情報(Reward space):R
これらの各情報が、時間(t)の経過に伴って推移するものとし、
例えば状態遷移確率の算出関数や、報酬の算出関数、ある観測状態の発生確率を算出する関数などを定義して、取得可能な情報と、定義関数に基づいて状態予測や行動決定を実行する。
時間T=(t)の状態S=stと行動A=atからの報酬(Reward)を算出する報酬関数:R(st,at)
時間T=(t−1)の行動A=at−1と、時間T=(t)の状態S=stとから時間T=(t)の観測状態の発生確率を算出する観測状態確率関数:O(st,at−1,ot−1)=P(ot|at−1,st)
などが定義され、利用されることになる。
報酬Rt−1は、時間T=t−1の状態st−1,行動at−1に基づいて、上述したように、報酬関数:R(st−1,at−1)で求められる。
また、観測情報ot−1は、例えば、状態st−1の変化に伴って変化する観察可能な情報である。
これらの関係は、いずれの時間T=t−1,t,t+1,・・・においても同様となる。
(a)状態情報(State space):S
(b)行動情報(Action space):A
(c)観測情報(Observation space):O
(d)報酬情報(Reward space):R
これらの様々な情報や、状態遷移確率の算出関数、報酬の算出関数、観測状態の発生確率の算出関数などを定義することが必要であり、POMDPモデルの構築処理には専門の知識や経験が必要である。
不確実性を含む対象領域における情報分析処理に適用する情報分析処理構成を構築する情報処理装置であり、
属性情報および属性値を含む属性データを入力し、部分観測マルコフ決定過程(POMDP:Partially Observable Markov Decision Process)モデルの自動生成処理を実行するデータ処理部と、
前記データ処理部における部分観測マルコフ決定過程(POMDP)モデルの生成処理に適用するルールを格納したルール記憶部とを有し、
前記データ処理部は、
前記属性データに基づく質問の生成、出力処理を行動として実行して、質問に対する回答を観測情報として取得し、取得した観測情報に基づくオブジェクト対応の確率分布情報の生成処理を実行して部分観測マルコフ決定過程(POMDP)モデルを生成する構成であることを特徴とする情報処理装置にある。
(1)状態遷移関数(State Transition Function)に関するルール、
(2)観測関数(Observation Function)に関するルール、
(3)報酬関数(Reward Function)に関するルール、
これらのルールの少なくともいずれかのルールを格納しており、
前記データ処理部は、
前記状態遷移関数に関するルール、観測関数に関するルール、報酬関数に関するルールの少なくともいずれかのルールを適用して部分観測マルコフ決定過程(POMDP)モデルを生成する構成であることを特徴とする。
正答観測確率値[OFr%]、
誤答観測確率値[OFw%]、
不適切回答観測確率値[OFir%]、
これらの各確率値を定義したルールであることを特徴とする。
(A)推定的アクション(Guess Action)における、
(A1)包括的アクション(Generic Action)
(A2)特定的アクション(Specific Action)
(B)非推定的アクション(Other Action)における、
(B1)包括的アクション(Generic Action)
(B2)特定的アクション(Specific Action)
これらの各々に対応して設定される報酬の値を定めたルールであることを特徴とする。
情報処理装置において、不確実性を含む対象領域における情報分析処理に適用する情報分析処理構成を構築する情報処理方法であり、
データ処理部が、属性情報および属性値を含む属性データを入力し、部分観測マルコフ決定過程(POMDP:Partially Observable Markov Decision Process)モデルの自動生成処理を実行するデータ処理ステップを有し、
前記データ処理ステップは、
前記属性データに基づく質問の生成、出力処理を行動として実行する行動ステップと、
質問に対する回答を観測情報として取得する観測情報取得ステップと、
ルール記憶部に記録されたルールに基づいて、取得した観測情報に基づくオブジェクト対応の確率分布情報の生成処理を実行して部分観測マルコフ決定過程(POMDP)モデルを生成するステップと、
を有することを特徴とする情報処理方法にある。
情報処理装置において、不確実性を含む対象領域における情報分析処理に適用する情報分析処理構成を構築させるコンピュータ・プログラムであり、
データ処理部に、属性情報および属性値を含む属性データを入力し、部分観測マルコフ決定過程(POMDP:Partially Observable Markov Decision Process)モデルの自動生成処理を実行させるデータ処理ステップを有し、
前記データ処理ステップは、
前記属性データに基づく質問の生成、出力処理を行動として実行させる行動ステップと、
質問に対する回答を観測情報として取得させる観測情報取得ステップと、
ルール記憶部に記録されたルールに基づいて、取得した観測情報に基づくオブジェクト対応の確率分布情報の生成処理を実行して部分観測マルコフ決定過程(POMDP)モデルを生成させるステップと、
を有することを特徴とするコンピュータ・プログラムにある。
station: テレビABC
year: 2006
month: 05
date: 11
start: 13:30
end: 15:30
program−title: 映画「プリティ・リーグ」
program−subtitle:
genre: 80
subgenre: 144
:
本発明の情報処理装置ではこのような属性とその値とからなる属性データセットを入力してPOMDPを自動生成する。
(a)状態情報(State space):S
(b)行動情報(Action space):A
(c)観測情報(Observation space):O
(d)報酬情報(Reward space):R
これらの様々な情報や、状態遷移確率の算出関数、報酬の算出関数、観測状態の発生確率の算出関数などが定義されたモデルである。
(A)推定的アクション(Guess Action)
(B)非推定的アクション(Other Action)
さらに、上記の推定的アクションと非推定的アクションの具体的なアクション態様として、
(1)包括的アクション(Generic Action)
(2)特定的アクション(Specific Action)
これらの2つのアクションが定義される。
(A)推定的アクション(Guess Action)の種類として、
(A1)包括的アクション(Generic Action)
(A2)特定的アクション(Specific Action)
があり、
(B)非推定的アクション(Other Action)の種類としても、
(B1)包括的アクション(Generic Action)
(B2)特定的アクション(Specific Action)
がある。
「プログラムタイトルはおはよう日本ですか?」
という質問が推定アクションに相当する。プログラムタイトルがおはよう日本であるオブジェクト(EPGデータ)は、図に示す属性データ201に相当するものであり、1つの特定のオブジェクトを推定した質問が推定的アクションとして定義される。
「どこの放送局ですか」
という質問が包括的アクションに相当する。この質問は、属性データ201中の属性情報(Attribute)に基づいて生成され、その属性値を回答として期待した質問である。
「放送局はテレビABCですか」
という質問が特定的アクションに相当する。この質問は、属性データ201中の値(Value)に基づいて生成され、質問に含まれる属性値(Value)が正しいか否かを回答として期待した質問である。
(A)推定的アクション(Guess Action)
(B)非推定的アクション(Other Action)のいずれにおいても、
(1)包括的アクション(Generic Action)
(2)特定的アクション(Specific Action)
が適用できる。
「テレビABC」、
「Yes,No,Other」
といった回答を入力して、これを観測情報とする。
(1)包括的アクション(Generic Action)
(2)特定的アクション(Specific Action)
これらのいずれかの行動情報212を定義して実行し、この行動に基づく回答を観測情報213として取得する。情報処理装置では、属性データ201に基づく様々な質問の生成、出力を行い、質問に対する回答の入力処理を実行する。
(1)正しい回答(RA:Right Answer)サブセット、
(2)誤った回答(WA:Wrong Anxwer)サブセット、
(3)不適切な回答(IrA:Irrelevant Anxwer)サブセット、
この3つのサブセットに分類され、観測情報213として取得される。なお、(1)正しい回答(RA:Right Answer)と、(2)誤った回答(WA:Wrong Anxwer)は、適切な回答(Relevant Answer)として解釈される。
(1)状態遷移関数(State Transition Function)に関するルール、
(2)観測関数(Observation Function)に関するルール、
(3)報酬関数(Reward Function)に関するルール、
がある。
右移動アクション311、
左移動アクション312、
ストップアクション313、
のいずれかである。
(2−1)は、右移動アクションを行なった場合の初期状態(s)と最終状態(s')の対応確率値、
(2−2)は、左移動アクションを行なった場合の初期状態(s)と最終状態(s')の対応確率値、
(2−3)は、ストップアクションを行なった場合の初期状態(s)と最終状態(s')の対応確率値、
である。
領域[1]=0.1
領域[2]=0.9
領域[3]=0.0
領域[4]=0.0
これらの確率分布となる。
例えば、図6(1)に示すロボット301は、領域302の領域[1]〜[4]のいずれかの領域に存在する。左側には壁(Wall)315がある。このとき、右移動アクション(a)を実行した場合の、初期状態(s)と観測情報(O)の対応関係としての確率値を示したのが、図6(2)である。
左が壁(L_Wall)=0.9
左がオープン(L_Opening)=0.1
右が壁(R_Wall)=0.1
右がオープン(R_Opening)=0.9
となる。
なお、この観測情報は、ロボット301の初期状態(s)が領域[1]にあったとき、右移動アクションを行なうことでロボット301が領域[2]に移動した場合にロボット301の観測する情報に対応する。
(1)状態遷移関数(State Transition Function)に関するルール、
(2)観測関数(Observation Function)に関するルール、
(3)報酬関数(Reward Function)に関するルール、
これらのルールの少なくともいずれかを適用したPOMDP生成処理を実行する。これらのルールはルール記憶部130に予め登録されている。本実施例におけるPOMDP生成処理において適用するルールの具体例について説明する。例えば以下の4つのルールを適用する。
(ルール1),(ルール2)
ルール1、ルール2は、状態遷移関数(State Transition Function)に関するルールであり、以下のように定義されるルールである。
(ルール1)
推定的アクション以外のアクションの実行によって状態変化が発生しない確率を[STdig%]とする。
(ルール2)
推定的アクションによって状態変化が発生しない確率を[STdigx]とする。
ルール3は、観測関数(Observation Function)に関するルールである。前述したように、情報処理装置は、行動として様々な質問の生成、出力を実行しその回答を観測情報とする。観測情報として得られる回答は、以下の3つの種類に区分できる。
正しい答(Right Answer)
誤った答(Wrong Answer)
不適切な答(Irrevant Answer)
ルール3は、これらの回答、すなわち観測データに対応して設定される観測関数確率値の設定ルールである。
正しい答(Right Answer)に対しては、予め定めた正答観測確率値[OFr%]を設定し、
誤った答(Wrong Answer)に対しては、予め定めた誤答観測確率値[OFw%]を設定し、
その他の不適切な答(Irrevant Answer)に対しては、予め定めた不適切回答観測確率値[OFir%]を設定する。
正答観測確率値[OFr%]=85%、
誤答観測確率値[OFw%]=10%、
不適切回答観測確率値[OFir%]=5%
といった設定を行う。
一週間のどの日か{dayofweek}と、
年月日{year,month,day}、
これらの回答を求める行動(質問)に対して得られる回答は、日や曜日などであり、回答が適切か不適切か、正答か誤答かといった回答の区分に際しては、意味的な解釈を含めた区分を実行して各観測確率値を設定すべきである。
行動(a:アクション)として、
「その日は19日ですか」
に対応する観測関数ルールの設定例を示している。
正答観測確率値[OFr%]=85%、
誤答観測確率値[OFw%]=10%、
不適切回答観測確率値[OFir%]=5%
としており、
例えばEPG−Aが19日のプログラムである場合、
観測情報である回答[Yes]と[19]を正答観測確率値[OFr%]=85%、
回答[No]と[18]を誤答観測確率値[OFw%]=10%、
その他の回答を不適切回答観測確率値[OFir%]=5%
として設定した観測関数ルールとしている。
観測情報である回答[No]と[18]を正答観測確率値[OFr%]=85%、
回答[Yes]と[19]を誤答観測確率値[OFw%]=10%、
その他の回答を不適切回答観測確率値[OFir%]=5%
として設定した観測関数ルールとしている。
「その日は19日ですか」
という質問に対する回答として、
金曜日(Friday)という回答(観測情報)と、
木曜日(Thursday)という回答(観測情報)
これらを同列のノイズ、すなわち不適切な回答とすることは好ましくない。
19日(金(Fri))のプログラムであるEPG−Aに対しては、
「その日は19日ですか」
という質問に対する回答として、
観測情報である回答[Yes]と[19]に、さらに[Friday]を正答観測確率値[OFr%]=85%
として設定し、
18日(木(Fri))のプログラムであるEPG−Aに対しては、
観測情報である回答[No]と[18]と[Thurseday]を正答観測確率値[OFr%]=85%
として設定する。
このような処理によって、観測情報に対する処理を的確に実行する。
行動(a:アクション)として、
「それは週のいつですか」
に対応する観測関数ルールの設定例を示している。
正答観測確率値[OFr%]=85%、
誤答観測確率値[OFw%]=10%、
不適切回答観測確率値[OFir%]=5%
としており、
例えばEPG−Aが19日(金)のプログラムである場合、
観測情報である回答[Friday(金)]を正答観測確率値[OFr%]=85%、
回答[Thurseday(木)]を誤答観測確率値[OFw%]=10%、
その他の回答を不適切回答観測確率値[OFir%]=5%
として設定した観測関数ルールとし、
EPG−Bが18日(木)のプログラムである場合、
観測情報である回答[Thurseday(木)]を正答観測確率値[OFr%]=85%、
回答[Friday(金)]を誤答観測確率値[OFw%]=10%、
その他の回答を不適切回答観測確率値[OFir%]=5%
として設定した観測関数ルールとしている。
「それは週のいつですか」
に対する観測情報(回答)として日にちが得られる場合もあり、
19日が2006年5月19日であり金曜日(Friday)である場合、EPG−Aが19日のプログラムである場合の回答として、
18日という回答(観測情報)と、
19日という回答(観測情報)
これらを同列のノイズ、すなわち不適切な回答とすることは好ましくない。
19日(金(Fri))のプログラムであるEPG−Aに対しては、
「それは週のいつですか」
という質問に対する回答として、
観測情報である回答[Friday]に、さらに[19]を正答観測確率値[OFr%]=85%
として設定し、
18日(木(Fri))のプログラムであるEPG−Aに対しては、
観測情報である回答[Thurseday]にさらに[18]を正答観測確率値[OFr%]=85%
として設定する。
このような処理によって、観測情報に対する処理を的確に実行する。
ルール4は、報酬関数(Reward Function)に関するルールである。このルールは、前述した
(A)推定的アクション(Guess Action)における、
(A1)包括的アクション(Generic Action)
(A2)特定的アクション(Specific Action)
(B)非推定的アクション(Other Action)における、
(B1)包括的アクション(Generic Action)
(B2)特定的アクション(Specific Action)
これらの各々に対応して設定される報酬の値を定めたルールである。
(A)推定的アクション(Guess Action)において、
(A1)包括的アクション(Generic Action)に対する報酬の値を[RWgx]、
(A2)特定的アクション(Specific Action)に対する適切(relevant)な回等が得られた場合の報酬の値を[RWpx]、
(A2)特定的アクション(Specific Action)に対する非適切(not relevant)な回等が得られた場合の報酬の値を[RWnpx]、
とする。
(B1)包括的アクション(Generic Action)に対する報酬の値を[RWg]、
(B2)特定的アクション(Specific Action)に対する適切(relevant)な回等が得られた場合の報酬の値を[RWp]、
(B2)特定的アクション(Specific Action)に対する不適切(not relevant)な回等が得られた場合の報酬の値を[RWnp]、
とする。
アクション=一日のうちのいつですか{ask_partofday}
に対する観測情報(Observation)として、
観測情報=午後
この観測情報が得られたことを示している。
正答観測確率値[OFr%]、
誤答観測確率値[OFw%]、
不適切回答観測確率値[OFir%]、
の各確率値を設定する。これらの各率値の具体的な値は予め設定しておく。例えば、
正答観測確率値[OFr%]=85%、
誤答観測確率値[OFw%]=10%、
不適切回答観測確率値[OFir%]=5%
である。
アクション=一日のうちのいつですか{ask_partofday}
に対する観測情報(Observation)として、
観測情報=午後
に対して、正答観測確率値[OFr%]が与えられたオブジェクトである。
アクション=テレビ局はどこですか{ask_station}
であり、このアクションに対する観測情報(Observation)として、
観測情報=WOテレビ
この観測情報が得られたことを示している。
正答観測確率値[OFr%]、
誤答観測確率値[OFw%]、
不適切回答観測確率値[OFir%]、
の各確率値を設定する。この確率値を設定したのが、図10に示すグラフ321の行動(Action)の[2]に相当するラインに示されたデータである。オブジェクト=Ob4,Ob6等の確率値が大きく設定されている。これらのオブジェクトは、確率値の配分を決定するルール(観測関数に対応するルール)に基づいて高い確率値が設定されたオブジェクトである。
アクション=プログラムはダックテイルですか、
であり、このアクションに対する観測情報(Observation)として、
観測情報=Yes
この観測情報が得られたことを示している。
正答観測確率値[OFr%]、
誤答観測確率値[OFw%]、
不適切回答観測確率値[OFir%]、
の各確率値を設定する。この確率値を設定したのが、図11に示すグラフ321の行動(Action)の[3]に相当するラインに示されたデータである。オブジェクト=Ob4等の確率値が大きく設定されている。これらのオブジェクトは、確率値の配分を決定するルール(観測関数に対応するルール)に基づいて高い確率値が設定されたオブジェクトである。
アクション=一日のうちのいつですか{ask_partofday}
であり、このアクションに対する観測情報(Observation)として、
観測情報=午後
この観測情報が得られたことを示している。
正答観測確率値[OFr%]、
誤答観測確率値[OFw%]、
不適切回答観測確率値[OFir%]、
の各確率値を設定する。この確率値を設定したのが、図13に示す確率分布グラフ422の行動(Action)の[1]に相当するラインに示されたデータである。オブジェクト=Ob4等の確率値が大きく設定されている。これらのオブジェクトは、確率値の配分を決定するルール(観測関数に対応するルール)に基づいて高い確率値が設定されたオブジェクトである。
アクション=テレビ局はどこですか{ask_station}
であり、このアクションに対する観測情報(Observation)として、
観測情報=WOテレビ
この観測情報が得られたことを示している。
正答観測確率値[OFr%]、
誤答観測確率値[OFw%]、
不適切回答観測確率値[OFir%]、
の各確率値を設定する。この確率値を設定したのが、図14に示すグラフ321の行動(Action)の[2]に相当するラインに示されたデータである。オブジェクト=Ob4,Ob6等の確率値が大きく設定されている。これらのオブジェクトは、確率値の配分を決定するルール(観測関数に対応するルール)に基づいて高い確率値が設定されたオブジェクトである。
アクション=番組はダックテイルですか
であり、このアクションに対する観測情報(Observation)として、
観測情報=No
この観測情報が得られたことを示している。
正答観測確率値[OFr%]、
誤答観測確率値[OFw%]、
不適切回答観測確率値[OFir%]、
の各確率値を設定する。この確率値を設定したのが、図15に示すオブジェクト対応確率分布グラフ422の行動(Action)の[3]に相当するラインに示されたデータである。多くのオブジェクトの確率値が比較的大きく設定されている。これらの多くのオブジェクトは、ダックテイルの番組に相当しないオブジェクト(EPGプログラム)であり、確率値の配分を決定するルール(観測関数に対応するルール)に基づいて高い確率値が設定されたオブジェクトである。
アクション=テレビ局はどこですか{ask_station}
であり、このアクションに対する観測情報(Observation)として、
観測情報=衛星第二テレビ
この観測情報が得られたことを示している。
正答観測確率値[OFr%]、
誤答観測確率値[OFw%]、
不適切回答観測確率値[OFir%]、
の各確率値を設定する。この確率値を設定したのが、図16に示すオブジェクト対応確率分布グラフ422の行動(Action)の[4]に相当するラインに示されたデータである。オブジェクト=Ob2,Ob5,Ob8等の確率値が大きく設定されている。これらのオブジェクトは、確率値の配分を決定するルール(観測関数に対応するルール)に基づいて高い確率値が設定されたオブジェクトである。
アクション=ジャンルは何ですか{ask_genre}
であり、このアクションに対する観測情報(Observation)として、
観測情報=料理
この観測情報が得られたことを示している。
正答観測確率値[OFr%]、
誤答観測確率値[OFw%]、
不適切回答観測確率値[OFir%]、
の各確率値を設定する。この確率値を設定したのが、図17に示すオブジェクト対応確率分布グラフ422の行動(Action)の[5]に相当するラインに示されたデータである。オブジェクト=Ob2,Ob8等の確率値が大きく設定されている。これらのオブジェクトは、確率値の配分を決定するルール(観測関数に対応するルール)に基づいて高い確率値が設定されたオブジェクトである。
アクション=一日のうちどの時間帯ですか{ask_partofday}
であり、このアクションに対する観測情報(Observation)として、
観測情報=夕方
この観測情報が得られたことを示している。
正答観測確率値[OFr%]、
誤答観測確率値[OFw%]、
不適切回答観測確率値[OFir%]、
の各確率値を設定する。この確率値を設定したのが、図18に示すオブジェクト対応確率分布グラフ422の行動(Action)の[6]に相当するラインに示されたデータである。オブジェクト=Ob2,Ob8等の確率値が大きく設定されている。これらのオブジェクトは、確率値の配分を決定するルール(観測関数に対応するルール)に基づいて高い確率値が設定されたオブジェクトである。
図12に示すオブジェクト401,402がNo1,No2となる確率がもっとも高くなる。このように、ターゲットが複数の場合であっても、POMDPによって得られた確率分布情報からターゲットを推定することが可能となる。
(1)状態遷移関数(State Transition Function)に関するルール、
(2)観測関数(Observation Function)に関するルール、
(3)報酬関数(Reward Function)に関するルール、
これらのルールの少なくともいずれかのルールを格納しており、
データ処理部452は、状態遷移関数に関するルール、観測関数に関するルール、報酬関数に関するルールの少なくともいずれかのルールを適用して部分観測マルコフ決定過程(POMDP)モデルを生成する。
正答観測確率値[OFr%]、
誤答観測確率値[OFw%]、
不適切回答観測確率値[OFir%]、
これらの各確率値を定義したルールである。
また、観測関数に関するルールは、先に、図7、図8を参照して説明したように、質問または回答の持つ意味の同一性判定結果に基づいて確率値定義がなされたルールである。
(A)推定的アクション(Guess Action)における、
(A1)包括的アクション(Generic Action)
(A2)特定的アクション(Specific Action)
(B)非推定的アクション(Other Action)における、
(B1)包括的アクション(Generic Action)
(B2)特定的アクション(Specific Action)
これらの各々に対応して設定される報酬の値を定めたルールである。
110 POMDP生成部
120 パラメータ入力部
130 ルール記憶部
151 属性データセット
152 POMDPモデル
201 属性データ
211 状態情報(Stae Space)
212 行動情報(Action Space)
213 観測情報(Observation Space)
301 ロボット
302 領域
321 オブジェクト対応確率分布グラフ
322 アクション−観測情報
323 EPGプログラム
401 EPGプログラム
402 EPGプログラム
421 アクション−観測情報
422 オブジェクト対応確率分布グラフ
450 情報処理装置
451 データ入出力部
452 データ処理部
453 記憶部
454 データベース
501 CPU(Central Processing Unit)
502 ROM(Read−Only−Memory)
503 RAM(Random Access Memory)
504 ホストバス
505 ブリッジ
506 外部バス
507 インタフェース
508 キーボード
509 ポインティングデバイス
510 ディスプレイ
511 HDD(Hard Disk Drive)
512 ドライブ
514 接続ポート
515 通信部
521 リムーバブル記録媒体
522 外部接続機器
Claims (8)
- 不確実性を含む対象領域における情報分析処理に適用する情報分析処理構成を構築する情報処理装置であり、
属性情報および属性値を含む属性データを入力し、部分観測マルコフ決定過程(POMDP:Partially Observable Markov Decision Process)モデルの自動生成処理を実行するデータ処理部と、
前記データ処理部における部分観測マルコフ決定過程(POMDP)モデルの生成処理に適用するルールを格納したルール記憶部とを有し、
前記データ処理部は、
前記属性データに基づく質問の生成、出力処理を行動として実行して、質問に対する回答を観測情報として取得し、取得した観測情報に基づくオブジェクト対応の確率分布情報の生成処理を実行して部分観測マルコフ決定過程(POMDP)モデルを生成する構成であり、
前記データ処理部は、
前記属性データに基づく質問の生成、出力処理において、
回答に基づく特定オブジェクト推定が可能な推定的アクション(Guess Action)と、推定的アクション以外の非推定的アクション(Other Action)のいずれかを実行する構成であり、
前記データ処理部は、
前記推定的アクション(Guess Action)、および前記非推定的アクション(Other Action)の実行に際して、
前記属性データに含まれる属性情報に基づいて生成される質問を適用した包括的アクション(Generic Action)と、前記属性データに含まれる属性値に基づいて生成される質問を適用した特定的アクション(Specific Action)のいずれかを実行し、各アクションに応じたルールに基づいて、オブジェクト対応の確率分布情報の生成処理を実行する構成であることを特徴とする情報処理装置。 - 前記ルール記憶部は、
部分観測マルコフ決定過程(POMDP)において規定される
(1)状態遷移関数(State Transition Function)に関するルール、
(2)観測関数(Observation Function)に関するルール、
(3)報酬関数(Reward Function)に関するルール、
これらのルールの少なくともいずれかのルールを格納しており、
前記データ処理部は、
前記状態遷移関数に関するルール、観測関数に関するルール、報酬関数に関するルールの少なくともいずれかのルールを適用して部分観測マルコフ決定過程(POMDP)モデルを生成する構成であることを特徴とする請求項1に記載の情報処理装置。 - 前記観測関数に関するルールは、
前記質問に対応する回答として得られる観測情報に基づいて、各オブジェクトに付与する確率値、すなわち、
正答観測確率値[OFr%]、
誤答観測確率値[OFw%]、
不適切回答観測確率値[OFir%]、
これらの各確率値を定義したルールであることを特徴とする請求項2に記載の情報処理装置。 - 前記観測関数に関するルールは、
質問または回答の持つ意味の同一性判定結果に基づいて確率値定義がなされたルールであることを特徴とする請求項3に記載の情報処理装置。 - 前記状態遷移関数に関するルールは、
推定的アクション以外のアクションの実行によって状態変化が発生しない確率[STdig%]と、
推定的アクションによって状態変化が発生しない確率[STdigx%]を定めたルールであることを特徴とする請求項2に記載の情報処理装置。 - 前記報酬関数に関するルールは、
(A)推定的アクション(Guess Action)における、
(A1)包括的アクション(Generic Action)
(A2)特定的アクション(Specific Action)
(B)非推定的アクション(Other Action)における、
(B1)包括的アクション(Generic Action)
(B2)特定的アクション(Specific Action)
これらの各々に対応して設定される報酬の値を定めたルールであることを特徴とする請求項2に記載の情報処理装置。 - 情報処理装置において、不確実性を含む対象領域における情報分析処理に適用する情報分析処理構成を構築する情報処理方法であり、
データ処理部が、属性情報および属性値を含む属性データを入力し、部分観測マルコフ決定過程(POMDP:Partially Observable Markov Decision Process)モデルの自動生成処理を実行するデータ処理ステップを有し、
前記データ処理ステップは、
前記属性データに基づく質問の生成、出力処理を行動として実行する行動ステップと、
質問に対する回答を観測情報として取得する観測情報取得ステップと、
ルール記憶部に記録されたルールに基づいて、取得した観測情報に基づくオブジェクト対応の確率分布情報の生成処理を実行して部分観測マルコフ決定過程(POMDP)モデルを生成するモデル生成ステップを有し、
前記行動ステップにおいて、
回答に基づく特定オブジェクト推定が可能な推定的アクション(Guess Action)と、推定的アクション以外の非推定的アクション(Other Action)のいずれかを実行し、
前記推定的アクション(Guess Action)、および前記非推定的アクション(Other Action)の実行に際して、前記属性データに含まれる属性情報に基づいて生成される質問を適用した包括的アクション(Generic Action)と、前記属性データに含まれる属性値に基づいて生成される質問を適用した特定的アクション(Specific Action)のいずれかを実行し、
前記モデル生成ステップにおいて、
各アクションに応じたルールに基づいて、オブジェクト対応の確率分布情報の生成処理を実行することを特徴とする情報処理方法。 - 情報処理装置において、不確実性を含む対象領域における情報分析処理に適用する情報分析処理構成を構築させるコンピュータ・プログラムであり、
データ処理部に、属性情報および属性値を含む属性データを入力し、部分観測マルコフ決定過程(POMDP:Partially Observable Markov Decision Process)モデルの自動生成処理を実行させるデータ処理ステップを有し、
前記データ処理ステップは、
前記属性データに基づく質問の生成、出力処理を行動として実行させる行動ステップと、
質問に対する回答を観測情報として取得させる観測情報取得ステップと、
ルール記憶部に記録されたルールに基づいて、取得した観測情報に基づくオブジェクト対応の確率分布情報の生成処理を実行して部分観測マルコフ決定過程(POMDP)モデルを生成させるモデル生成ステップと、
を有し、
前記行動ステップにおいて、
回答に基づく特定オブジェクト推定が可能な推定的アクション(Guess Action)と、推定的アクション以外の非推定的アクション(Other Action)のいずれかを実行させ、
前記推定的アクション(Guess Action)、および前記非推定的アクション(Other Action)の実行に際して、前記属性データに含まれる属性情報に基づいて生成される質問を適用した包括的アクション(Generic Action)と、前記属性データに含まれる属性値に基づいて生成される質問を適用した特定的アクション(Specific Action)のいずれかを実行させ、
前記モデル生成ステップにおいて、
各アクションに応じたルールに基づいて、オブジェクト対応の確率分布情報の生成処理を実行させることを特徴とするコンピュータ・プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007020470A JP5070860B2 (ja) | 2007-01-31 | 2007-01-31 | 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム |
US12/011,754 US8095493B2 (en) | 2007-01-31 | 2008-01-29 | Information processing apparatus, information processing method and computer program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007020470A JP5070860B2 (ja) | 2007-01-31 | 2007-01-31 | 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008186326A JP2008186326A (ja) | 2008-08-14 |
JP5070860B2 true JP5070860B2 (ja) | 2012-11-14 |
Family
ID=39669070
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007020470A Expired - Fee Related JP5070860B2 (ja) | 2007-01-31 | 2007-01-31 | 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US8095493B2 (ja) |
JP (1) | JP5070860B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5440840B2 (ja) | 2009-06-11 | 2014-03-12 | ソニー株式会社 | 情報処理装置、情報処理方法、及び、プログラム |
JP5874292B2 (ja) * | 2011-10-12 | 2016-03-02 | ソニー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
US11093533B2 (en) * | 2018-06-05 | 2021-08-17 | International Business Machines Corporation | Validating belief states of an AI system by sentiment analysis and controversy detection |
CN111401033B (zh) * | 2020-03-19 | 2023-07-25 | 北京百度网讯科技有限公司 | 事件抽取方法、事件抽取装置和电子设备 |
CN114469000B (zh) * | 2022-01-27 | 2023-08-11 | 重庆邮电大学 | 基于多传感器数据强化学习的人体减跌防震智能监测方法及系统 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020103793A1 (en) | 2000-08-02 | 2002-08-01 | Daphne Koller | Method and apparatus for learning probabilistic relational models having attribute and link uncertainty and for performing selectivity estimation using probabilistic relational models |
JP2003271168A (ja) | 2002-03-15 | 2003-09-25 | Nippon Telegr & Teleph Corp <Ntt> | 信号抽出方法および信号抽出装置、信号抽出プログラムとそのプログラムを記録した記録媒体 |
US20040220892A1 (en) | 2003-04-29 | 2004-11-04 | Ira Cohen | Learning bayesian network classifiers using labeled and unlabeled data |
JP4449871B2 (ja) | 2005-01-26 | 2010-04-14 | ソニー株式会社 | 音声信号分離装置及び方法 |
-
2007
- 2007-01-31 JP JP2007020470A patent/JP5070860B2/ja not_active Expired - Fee Related
-
2008
- 2008-01-29 US US12/011,754 patent/US8095493B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20080183652A1 (en) | 2008-07-31 |
US8095493B2 (en) | 2012-01-10 |
JP2008186326A (ja) | 2008-08-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ripley et al. | Manual for RSIENA | |
JP4863778B2 (ja) | 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム | |
US20180137424A1 (en) | Methods and systems for identifying gaps in predictive model ontology | |
US20180129959A1 (en) | Methods and systems for programmatically selecting predictive model parameters | |
Chen et al. | Usher: Improving data quality with dynamic forms | |
Mao et al. | Learning deterministic probabilistic automata from a model checking perspective | |
EP3882776B1 (en) | Autonomous self-healing test automation | |
JP5070860B2 (ja) | 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム | |
JP7245961B2 (ja) | 対話型機械学習 | |
US9355020B2 (en) | Resolving nondeterminism in application behavior models | |
JP2023512856A (ja) | 対話型機械学習 | |
JP2007257184A (ja) | 障害原因推定システム、方法、及び、プログラム | |
JP2007249873A (ja) | 分析モデル作成方法、分析モデル作成プログラムおよび分析モデル作成装置 | |
US11481650B2 (en) | Method and system for selecting label from plurality of labels for task in crowd-sourced environment | |
US20220067541A1 (en) | Hybrid machine learning | |
CN115345600B (zh) | 一种rpa流程的生成方法和装置 | |
Chopra et al. | Conversational challenges in ai-powered data science: Obstacles, needs, and design opportunities | |
Čertický | Real-time action model learning with online algorithm 3 sg | |
Gasparic et al. | Context-aware integrated development environment command recommender systems | |
CN115349129A (zh) | 生成具有不确定性区间的性能预测 | |
US20140067848A1 (en) | Estimation of effects of process customization | |
JP7127686B2 (ja) | 仮説推論装置、仮説推論方法、及びプログラム | |
Sánchez-Ruiz et al. | Abstraction in knowledge-rich models for case-based planning | |
RU2819647C2 (ru) | Способ и система генерирования обучающих данных для алгоритма машинного обучения | |
Brown et al. | Developer productivity for humans, part 6: Measuring flow, focus, and friction for developers |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20091221 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120522 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120703 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120724 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120806 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150831 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |