JP2007249873A - 分析モデル作成方法、分析モデル作成プログラムおよび分析モデル作成装置 - Google Patents

分析モデル作成方法、分析モデル作成プログラムおよび分析モデル作成装置 Download PDF

Info

Publication number
JP2007249873A
JP2007249873A JP2006075696A JP2006075696A JP2007249873A JP 2007249873 A JP2007249873 A JP 2007249873A JP 2006075696 A JP2006075696 A JP 2006075696A JP 2006075696 A JP2006075696 A JP 2006075696A JP 2007249873 A JP2007249873 A JP 2007249873A
Authority
JP
Japan
Prior art keywords
variable
analysis model
child
causal
parent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006075696A
Other languages
English (en)
Inventor
Tomoko Murakami
知子 村上
Hideki Kobayashi
英樹 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2006075696A priority Critical patent/JP2007249873A/ja
Priority to US11/650,934 priority patent/US7630951B2/en
Publication of JP2007249873A publication Critical patent/JP2007249873A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Pure & Applied Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Algebra (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】処理効率の低下を防ぎつつ分析に必要な適切な変数を含む分析モデルを作成することのできる分析モデル作成方法、分析モデル作成プログラムおよび分析モデル作成装置を提供する。
【解決手段】ベイジアンネットワークにより示された分析モデルを作成する分析モデル作成方法であって、分析モデルに加えるべき子変数を選択する子変数選択ステップと、子変数と因果関係のある親変数の複数の変数候補を選択する変数候補選択ステップと、各変数候補と子変数との因果関係に基づいて、各変数候補と子変数との因果関係の値が高いか低いかを判定する因果判定ステップと、因果関係の値が低いと判定された複数の低相関変数候補を集約し、変数候補と異なる集約変数を作成する集約変数作成ステップと、相関が高いと判定された高相関候補と、集約変数とを子変数に対する親変数として分析モデルに含める親変数決定ステップとを有する。
【選択図】 図1

Description

本発明は、変数間の因果関係を示す分析モデルをベイジアンネットワークとして作成する分析モデル作成方法、分析モデル作成プログラムおよび分析モデル作成装置に関するものである。
従来、各変数同士の因果関係をモデル化するための手法としてベイジアンネットワークが知られている。例えば、アンケートデータから回答者の意思決定モデルをベイジアンネットワークとして作成することができる。
アンケートデータから回答者の意思決定モデルを作成する際に、モデルの構造を決定する方法としては、アンケート設問の項目を直接モデルに反映する方法や、K2アルゴリズムを利用した方法が知られている。例えば、K2アルゴリズムを利用して、意思決定モデルの構造を決定する方法が開示されている(例えば、「特許文献1」参照)。
特開2005−107747号公報
しかしながら、上述のようなモデル構造の決定方法においては、回答者の意思決定の要因がアンケート調査前の時点で必ずしも明らかでない。このため、実際にアンケートを行う際には、意思決定の要因と考えられるすべての要素をアンケートの設問項目として準備する必要がある。そのため、設問項目が多数になる場合が多い。
このように多数のアンケートの設問項目を直接モデルに導入すると、モデルのパラメータが多くなり、信頼性のあるモデルを作成するためには大量データが必要になるため現実的でない。
このような問題を解決すべく、K2アルゴリズムを用いて、因果関係の強い変数のみを選択し、重要なアンケート設問項目を意思決定モデルに導入することも可能であるが、因果関係が弱く意思決定モデルに導入されないアンケート設問項目に含まれる情報を逃す可能性がある。
本発明は、上記に鑑みてなされたものであって、処理効率の低下を防ぎつつ分析に必要な適切な変数を含む分析モデルを作成することのできる分析モデル作成方法、分析モデル作成プログラムおよび分析モデル作成装置を提供することを目的とする。
上述した課題を解決し、目的を達成するために、本発明は、ベイジアンネットワークにより変数間の因果関係が示された分析モデルを作成する分析モデル作成方法であって、前記分析モデルに加えるべき子変数を選択する子変数選択ステップと、前記子変数決定ステップにおいて決定された前記子変数と因果関係のある親変数として前記分析モデルに加えるべき複数の変数候補を選択する変数候補選択ステップと、前記変数候補選択ステップにおいて選択された各変数候補と前記子変数との因果関係に基づいて、各変数候補と前記子変数との因果関係の値が高いか低いかを判定する因果判定ステップと、前記因果判定ステップにおいて、因果関係の値が低いと判定された複数の低因果変数候補を集約し、前記変数候補と異なる集約変数を作成する集約変数作成ステップと、前記因果判定ステップにおいて因果関係の値が高いと判定された高因果候補と、前記集約変数作成ステップにおいて作成された前記集約変数とを前記子変数に対する親変数として前記分析モデルに含める親変数決定ステップとを有することを特徴とする。
また、本発明の他の形態は、ベイジアンネットワークにより変数間の因果関係が示された分析モデルを作成する分析モデル作成処理をコンピュータに実行させる分析モデル作成プログラムであって、前記分析モデルに加えるべき子変数を選択する子変数選択ステップと、前記子変数決定ステップにおいて決定された前記子変数と因果関係のある親変数として前記分析モデルに加えるべき複数の変数候補を選択する変数候補選択ステップと、前記変数候補選択ステップにおいて選択された各変数候補と前記子変数との因果関係に基づいて、各変数候補と前記子変数との因果関係の値が高いか低いかを判定する因果判定ステップと、前記因果判定ステップにおいて、因果関係の値が低いと判定された複数の低因果変数候補を集約し、前記変数候補と異なる集約変数を作成する集約変数作成ステップと、前記因果判定ステップにおいて因果関係の値が高いと判定された高因果候補と、前記集約変数作成ステップにおいて作成された前記集約変数とを前記子変数に対する親変数として前記分析モデルに含める親変数決定ステップとを有することを特徴とする。
また、本発明の他の形態は、ベイジアンネットワークにより変数間の因果関係が示された分析モデルを作成する分析モデル作成装置であって、前記分析モデルに加えるべき子変数を選択する子変数選択手段と、前記子変数決定手段により決定された前記子変数と因果関係のある親変数として前記分析モデルに加えるべき複数の変数候補を選択する変数候補選択手段と、前記変数候補選択手段により選択された各変数候補と前記子変数との因果関係に基づいて、各変数候補と前記子変数との因果関係の値が高いか低いかを判定する因果判定手段と、前記因果判定手段により因果関係の値が低いと判定された複数の低因果変数候補を集約し、前記変数候補と異なる集約変数を作成する集約変数作成手段と、前記因果判定手段により因果関係の値が高いと判定された高因果候補と、前記集約変数作成手段により作成された前記集約変数とを前記子変数に対する親変数として前記分析モデルに含める親変数決定手段とを備えたことを特徴とする。
本発明にかかる分析モデル作成方法によれば、子変数選択ステップにおいて、分析モデルに加えるべき子変数を選択し、変数候補選択ステップにおいて、子変数決定ステップにおいて決定された子変数と因果関係のある親変数として分析モデルに加えるべき複数の変数候補を選択し、因果判定ステップにおいて、変数候補選択ステップにおいて選択された各変数候補と子変数との因果関係に基づいて、各変数候補と子変数との因果関係の値が高いか低いかを判定し、集約変数作成ステップにおいて、因果判定ステップにおいて、因果関係の値が低いと判定された複数の低因果変数候補を集約し、変数候補と異なる集約変数を作成し、親変数決定ステップにおいて、因果判定ステップにおいて因果関係の値が高いと判定された高因果候補と、集約変数作成ステップにおいて作成された集約変数とを子変数に対する親変数として分析モデルに含めるので、処理効率の低下を防ぎつつ分析に必要な適切な変数を含む分析モデルを作成することができるという効果を奏する。
また、本発明にかかる分析モデル作成プログラムによれば、子変数選択ステップにおいて、分析モデルに加えるべき子変数を選択し、変数候補選択ステップにおいて、子変数決定ステップにおいて決定された子変数と因果関係のある親変数として分析モデルに加えるべき複数の変数候補を選択し、因果判定ステップにおいて、変数候補選択ステップにおいて選択された各変数候補と子変数との因果関係に基づいて、各変数候補と子変数との因果関係の値が高いか低いかを判定し、集約変数作成ステップにおいて、因果判定ステップにおいて、因果関係の値が低いと判定された複数の低因果変数候補を集約し、変数候補と異なる集約変数を作成し、親変数決定ステップにおいて、因果判定ステップにおいて因果関係の値が高いと判定された高因果候補と、集約変数作成ステップにおいて作成された集約変数とを子変数に対する親変数として分析モデルに含めるので、処理効率の低下を防ぎつつ分析に必要な適切な変数を含む分析モデルを作成することができるという効果を奏する。
また、本発明にかかる分析モデル作成装置によれば、子変数選択手段が、分析モデルに加えるべき子変数を選択し、変数候補選択手段が、子変数決定手段により決定された子変数と因果関係のある親変数として分析モデルに加えるべき複数の変数候補を選択し、因果判定手段が、変数候補選択手段により選択された各変数候補と子変数との因果関係に基づいて、各変数候補と子変数との因果関係の値が高いか低いかを判定し、集約変数作成手段が、因果判定手段により因果関係の値が低いと判定された複数の低因果変数候補を集約し、変数候補と異なる集約変数を作成し、親変数決定手段が、因果判定手段により因果関係の値が高いと判定された高因果候補と、集約変数作成手段により作成された集約変数とを子変数に対する親変数として分析モデルに含めるので、処理効率の低下を防ぎつつ分析に必要な適切な変数を含む分析モデルを作成することができるという効果を奏する。
以下に、本発明にかかる分析モデル作成方法、分析モデル作成プログラムおよび分析モデル作成装置の実施の形態を図面に基づいて詳細に説明する。なお、この実施の形態によりこの発明が限定されるものではない。
図1は、実施の形態にかかる分析モデル作成装置10の機能構成を示すブロック図である。分析モデル作成装置10は、消費者購買意識調査で収集するアンケートの回答データから、分析モデルとして回答者の購買意思決定モデルを構築する装置である。より具体的には、モデル構造を決定する。なお、購買意思決定モデルは、ベイジアンネットワークにおける構造モデルであり、各変数同士の因果関係などに基づいて構築されるモデルである。
なお、分析モデル作成装置10が作成対象とする分析モデルは、消費者購入意識調査に対するアンケートの回答データに限定されるものではない。さらには、アンケートの回答データだけでなく、変数で表現することのできる複数要素により分析可能であり、ベイジアンネットワークにおける構造モデルにおいて分析可能なデータであればよい。
分析モデル作成装置10は、回答データ読込部100と、回答データ保持部102と、変数候補特定部110と、子変数選択部112と、親候補選択部114と、親変数決定部116と、集約変数作成部118と、分析モデル構築部120と、分析モデル保持部122と、回答データ評価部130とを備えている。
回答データ読込部100は、アンケート調査の回答データを読み込む。回答データ保持部102は、回答データ読込部100が取得した回答データを保持する。変数候補特定部110は、回答データ保持部102に保持される回答データから変数候補を特定する。ここで、変数候補とは、回答データの分析モデルに含める可能性のある変数のことである。なお、変数候補特定部110は、ユーザからの指示により変数候補を特定してもよい。例えば、専門家などにより購買意思決定モデルにおいて必要と思われる変数が予め推定されている場合には、これらの変数を変数候補としてユーザが指定する。
なお、ユーザからの指示は、例えば、ユーザがキーボード入力したものを取得する。また、他の例としては、ネットワークによるオンライン入力、情報伝達の媒体である磁気テープから読み取る等でもよい。
図2は、回答データの一例を示す図である。図2に示すように、分析モデル作成装置10の対象データには、質問項目に対する複数の選択項目が含まれている。変数候補特定部110は、これらの項目を変数候補として特定する。図2に示す例においては、例えば、設問「Q2」の「機能」、「省エネ・経済性」など各選択項目が変数候補として特定される。
子変数選択部112は、変数候補特定部110により特定された変数候補の中から子変数を選択する。子変数は、ユーザからの指示に応じて選択される。他の例としては、変数候補特定部110により選択された変数候補を任意の順番にしたがい子変数として順に選択してもよい。親候補選択部114は、子変数選択部112により選択された子変数と親子関係にある親変数となる可能性のある親候補を選択する。親変数候補は、ユーザからの指示に応じて選択される。
親変数決定部116は、回答データにおける子変数と各親候補との間の因果関係に基づいて、親候補を因果関係の大きい高因果親候補と因果関係の小さい低因果親候補とに分類する。そして高因果親候補に分類された変数を親変数と決定する。集約変数作成部118は、親変数決定部116により低因果親候補に分類された親候補を集約した新たな集約変数を作成する。
分析モデル構築部120は、親変数決定部116により決定された親変数と、集約変数作成部118により作成された集約変数とを含む分析モデルを構築する。分析モデル構築部120は、各子変数に対して選択された親変数および集約変数を反映させて、分析モデルを完成させる。分析モデル保持部122は、分析モデルを保持する。回答データ評価部130は、分析モデル保持部122が保持する分析モデルを利用して、回答データ保持部102に保持される回答データの分析を行う。
図3は、分析モデル作成装置10による分析モデル作成処理を示すフローチャートである。まず、回答データ読込部100は、回答データを読み込み、回答データ保持部102に保持させる(ステップS100)。次に、変数候補特定部110は、変数候補を特定する(ステップS102)。なお、回答データにおいては、質問に対する回答部分が変数候補として特定される。なお、変数候補として選択される変数は、分析対象となるデータの種類に応じて定まるものである。すなわち、分析対象となるデータに含まれる変数に関する情報に基づいて、変数候補を選択する。
次に、子変数選択部112は、子変数を選択する(ステップS104)。次に、親候補選択部114は、親候補を選択する(ステップS106)。次に、親変数決定部116は、親候補と子変数との因果関係に基づいて、親候補と子変数の因果関係の値を判定する(ステップS108)。具体的には、因果関係の値が予め定められた閾値以上である場合に高因果親候補と判定し、閾値未満である場合に低因果親候補と判定する。例えば、K2アルゴリズムを利用してもよい。
次に、親変数決定部116は、高因果親候補を親変数として決定し、分析モデル構築部120は、高因果親候補を子変数選択部112により選択された子変数に対する親変数として分析モデルに加える(ステップS110)。次に、集約変数作成部118は、低因果親候補を集約した新たな集約変数を作成する(ステップS112)。次に、集約変数を子変数選択部112により選択された子変数に対する親変数として分析モデルに加える(ステップS114)。なお、低因果親候補は、分析モデルには加えずに削除する。
以上のように、低因果親候補を削除して分析処理の対象を絞ることにより、処理の効率化を図ることができるが、その一方で、低因果親候補に因果関係に直接反映されない重要な情報が含まれている場合には、このような情報を逃し適切な分析を行えない可能性がある。これに対し、上述のように低因果親候補を1つの集約変数に集約することにより、すべての低因果親候補の情報を加味することができる。さらに、低因果親候補が多数ある場合であっても、これらを1つに集約するので、低因果親候補を加味することによる処理効率の低下を避けることができる。
さらに、子変数選択部112において選択された子変数が集約変数の集約元になっているか否かを確認する。例えば、変数候補特定部110により特定された変数候補が階層構造を有する場合には、各層に対し再帰的に上述の処理を行う。具体的には、第1層の子変数に対し、第2層の親変数を特定する。続いて、第2層の変数を子変数として第3層の親変数を特定する。以上の処理を最上位層まで繰り返す。
このような処理において、所定の層における子変数が、この層の下位の層の子変数における親候補として処理された際に削除され、集約変数が作成されたとする。この場合には、所定の層における子変数は、集約変数の集約元であると判断される(ステップS116,Yes)。この場合には、この子変数と、当該子変数に対して親変数決定部116により決定された親変数との間の因果関係を、この子変数から作成された集約変数と親変数との間の因果関係に変更する(ステップS118)。すなわち、子変数を集約変数に変更する。以上の処理をすべての変数について行い(ステップS120,Yes)、処理が完了する。前述のように、各変数が階層化されている場合には、下位の層から順に再帰的にステップS104〜ステップS118の処理を繰り返す。
次に、図4から図10を参照しつつ、図2に示すアンケート結果に対する分析モデルを作成する際の分析モデル作成処理を具体的に説明する。図4は、ステップS102において、図2に示す回答データから特定された変数候補を示す図である。設問「Q1」においては、「女性」が変数候補として特定されている。また、設問「Q2」においては、「機能」、「省エネ・経済性」、「安全性」、「発売日」など設問「Q2」におけるすべての選択肢が変数候補として特定されている。また、設問「Q3」における「はい」の選択肢に対応する「購入」が変数候補として特定されている。
このうち、「購入」が子変数として選択される(ステップS104)。さらに、親候補として設問「Q2」に対する所定の選択項目が選択される(ステップS106)。図5は、子変数と親候補とを示す図である。本例においては、設問「Q2」のうち一部の選択項目のみが親候補として選択されている。これは、例えば専門家の見解、これまでの統計結果などに基づいて選択されている。このように、子変数「購入」との因果関係の大きい変数を親候補として選択してもよい。
なお、設問「Q2」に対する選択項目はすべて子変数に対する親変数となりうる。したがって、他の例としては、設問「「Q2」に対する選択項目すべてを親候補として選択することとしてもよい。
次に、図5に示す親候補すべてに対し、因果判定を行う(ステップS108)。図6は、高因果親候補に対する処理を説明するための図である。図6に示す例においては、「機能」、「価格」および「ブランド名」が高因果親候補として選択されている。この場合には、これらの高因果親候補が親変数として分析モデルに加えられる(ステップS110)。さらに、図6に示すように、親変数と子変数との間の因果関係が記述される。
図7は、低因果親候補に対する処理を説明するための図である。図7に示す例においては、「省エネ」および「評判」が低因果親候補として選択されている。これらの変数は、集約されて集約変数が作成される(ステップS112)。なお、本例における集約変数は、「省エネ」および「評判」を選択した回数を示す「回答頻度」である。「回答頻度」に対する変数値としては、例えば、「高い(「省エネ」と「評判」の両方を選択)」、「普通(いずれか一方を選択)」、および「低い(いずれも選択なし)」の3段階を設定する。
本例のように購入の有無との因果関係を考える際には、回答頻度が重要な要因となってくる。購入者は、商品等への感心が高く回答頻度も高いと予想される。このように、購入の有無と回答頻度に関係があると予想されるからである。しかし、因果判定処理により低因果親変数(ここでは、「省エネ」および「評判」)と判定され削除された場合には、このような要因と購入との因果関係を考慮することができない。
これに対し、本例のように集約変数として回答頻度を新たに作成することにより、低因果親変数についても考慮した分析モデルを作成することができる。さらに、低因果親変数はまとめて1つの集約変数としているため、処理効率の低下を防ぐことができる。すなわち、因果関係の小さい変数についても考慮することができ、かつ処理効率のよい分析モデルを作成することができる。
図8は、子変数と集約変数との関係を示す図である。子変数「購入」に対する処理が終わり、「省エネ」を子変数として新たに選択した場合について説明する。このとき「女性」が親候補として選択され、高因果親候補と判定されたとする。この場合には、「女性」は親変数となり、「省エネ」との因果関係が記述されることになる。しかし、「省エネ」は、子変数「購入」に対する処理において削除され「回答頻度」という集約変数に集約されている。このように、子変数が集約変数に集約されている場合、すなわち子変数が集約変数の集約元である場合には、親変数と集約変数との因果関係が記述される。図8に示す例では、親変数「女性」と集約変数「回答頻度」との因果関係が記述される。
以上の処理により、図2に示すアンケートに対する分析モデルが完成する。図9および図10は、図2に示すアンケートに対して作成された分析モデルを模式的に示す図である。このように、分析モデルに含まれる各変数(ノード)と、ルートノードとが記述される。さらに各ノードに対し、ノード名、ノードの値、親のノード名および子のノード名が定義される。設問「Q2」の選択項目に対応する変数のノードの値は、「はい」および「いいえ」の2変数である。また、集約変数のノード値は、「高い」、「普通」および「低い」の3変数である。なお、これらの値は、分析対象に応じて任意に設定することができる。さらに、図10に示すように各変数および各変数の因果関係を数値化したもの(条件付き確率)が記述される。
以上のように、実施の形態にかかる分析モデル作成装置10によれば、アンケートデータから回答者の意思決定モデルとしての分析モデルを作成する際に、意思決定に重要な要因を漏れなくモデルに導入し、妥当なモデルを構築することができる。
図11は、実施の形態にかかる分析モデル作成装置10のハードウェア構成を示す図である。分析モデル作成装置10は、ハードウェア構成として、分析モデル作成装置10における分析モデル作成処理を実行する分析モデル作成プログラムなどが格納されているROM52と、ROM52内のプログラムに従って分析モデル作成装置10の各部を制御するCPU51と、分析モデル作成装置10の制御に必要な種々のデータを記憶するRAM53と、ネットワークに接続して通信を行う通信I/F57と、各部を接続するバス62とを備えている。
先に述べた分析モデル作成装置10における分析モデル作成プログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、フロッピー(R)ディスク(FD)、DVD等のコンピュータで読み取り可能な記録媒体に記録されて提供されてもよい。
この場合には、分析モデル作成プログラムは、分析モデル作成装置10において上記記録媒体から読み出して実行することにより主記憶装置上にロードされ、上記ソフトウェア構成で説明した各部が主記憶装置上に生成されるようになっている。
また、本実施の形態の分析モデル作成プログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよい。
以上、本発明を実施の形態を用いて説明したが、上記実施の形態に多様な変更または改良を加えることができる。
そうした第1の変更例としては、本実施の形態においては、低因果親変数を集約した集約変数を作成したが、低因果親変数のみでなく他の親変数を含む集約変数を作成してもよい。例えば、設問「Q2」における全項目に対する実際に選択された項目数を集約変数としてもよい。
また第2の変更例としては、本実施の形態においては、構築した分析モデルを利用して、回答データの評価を行ったが、分析モデルを出力してもよい。これにより、他の装置においても、分析モデルを利用した評価を行うことができる。
実施の形態にかかる分析モデル作成装置10の機能構成を示すブロック図である。 回答データの一例を示す図である。 分析モデル作成装置10による分析モデル作成処理を示すフローチャートである。 ステップS102において、図2に示す回答データから特定された変数候補を示す図である。 子変数と親候補とを示す図である。 高因果親候補に対する処理を説明するための図である。 低因果親候補に対する処理を説明するための図である。 子変数と集約変数との関係を示す図である。 図2に示すアンケートに対して作成された分析モデルを模式的に示す図である。 図2に示すアンケートに対して作成された分析モデルを模式的に示す図である。 実施の形態にかかる分析モデル作成装置10のハードウェア構成を示す図である。
符号の説明
10 分析モデル作成装置
51 CPU
52 ROM
53 RAM
57 通信I/F
62 バス
100 回答データ読込部
102 回答データ保持部
110 変数候補特定部
112 子変数選択部
114 親候補選択部
116 親変数決定部
118 集約変数作成部
120 分析モデル構築部
122 分析モデル保持部
130 回答データ評価部

Claims (9)

  1. ベイジアンネットワークにより変数間の因果関係が示された分析モデルを作成する分析モデル作成方法であって、
    前記分析モデルに加えるべき子変数を選択する子変数選択ステップと、
    前記子変数決定ステップにおいて決定された前記子変数と因果関係のある親変数として前記分析モデルに加えるべき複数の変数候補を選択する変数候補選択ステップと、
    前記変数候補選択ステップにおいて選択された各変数候補と前記子変数との因果関係に基づいて、各変数候補と前記子変数との因果関係の値が高いか低いかを判定する因果判定ステップと、
    前記因果判定ステップにおいて、因果関係の値が低いと判定された複数の低因果変数候補を集約し、前記変数候補と異なる集約変数を作成する集約変数作成ステップと、
    前記因果判定ステップにおいて因果関係の値が高いと判定された高因果候補と、前記集約変数作成ステップにおいて作成された前記集約変数とを前記子変数に対する親変数として前記分析モデルに含める親変数決定ステップと
    を有することを特徴とする分析モデル作成方法。
  2. 前記変数候補選択ステップでは、前記分析モデルによる分析対象となる対象データに含まれる各変数に関する情報に基づいて、前記変数候補を選択することを特徴とする請求項1に記載の分析モデル作成方法。
  3. 前記対象データに含まれる各変数に関する情報に基づいて、前記変数候補と前記子変数との間の因果関係を評価する因果関係評価ステップをさらに有し、
    前記変数候補選択ステップでは、前記因果関係評価ステップにおいて評価された前記因果関係に基づいて、前記変数候補を選択することを特徴とする請求項2に記載の分析モデル作成方法。
  4. 前記変数候補選択ステップでは、ユーザによる指定に基づいて、前記変数候補を選択することを特徴とする請求項1に記載の分析モデル作成方法。
  5. 前記集約変数作成ステップでは、前記低因果変数候補と前記高因果変数候補とを集約した前記集約変数を作成することを特徴とする請求項1から4のいずれか一項に記載の分析モデル作成方法。
  6. 前記子変数選択ステップにおいては、前記分析モデルに含めるべきすべての変数を子変数として選択し、すべての前記子変数に対し、前記変数候補選択ステップと、前記親変数作成ステップと、前記親変数決定ステップとを再帰的に繰り返すことを特徴とする請求項1から5のいずれか一項に記載の分析モデル作成方法。
  7. 前記親変数決定ステップでは、前記集約変数作成ステップにおいて作成された前記集約変数の集約元の複数の前記変数候補を子変数としたときの親変数を決定する場合に、前記子変数と親変数との因果関係を前記集約変数と親変数との因果関係に変更することを特徴とする請求項6に記載の分析モデル作成方法。
  8. ベイジアンネットワークにより変数間の因果関係が示された分析モデルを作成する分析モデル作成処理をコンピュータに実行させる分析モデル作成プログラムであって、
    前記分析モデルに加えるべき子変数を選択する子変数選択ステップと、
    前記子変数決定ステップにおいて決定された前記子変数と因果関係のある親変数として前記分析モデルに加えるべき複数の変数候補を選択する変数候補選択ステップと、
    前記変数候補選択ステップにおいて選択された各変数候補と前記子変数との因果関係に基づいて、各変数候補と前記子変数との因果関係の値が高いか低いかを判定する因果判定ステップと、
    前記因果判定ステップにおいて、因果関係の値が低いと判定された複数の低因果変数候補を集約し、前記変数候補と異なる集約変数を作成する集約変数作成ステップと、
    前記因果判定ステップにおいて因果関係の値が高いと判定された高因果候補と、前記集約変数作成ステップにおいて作成された前記集約変数とを前記子変数に対する親変数として前記分析モデルに含める親変数決定ステップと
    を有することを特徴とする分析モデル作成プログラム。
  9. ベイジアンネットワークにより変数間の因果関係が示された分析モデルを作成する分析モデル作成装置であって、
    前記分析モデルに加えるべき子変数を選択する子変数選択手段と、
    前記子変数決定手段により決定された前記子変数と因果関係のある親変数として前記分析モデルに加えるべき複数の変数候補を選択する変数候補選択手段と、
    前記変数候補選択手段により選択された各変数候補と前記子変数との因果関係に基づいて、各変数候補と前記子変数との因果関係の値が高いか低いかを判定する因果判定手段と、
    前記因果判定手段により因果関係の値が低いと判定された複数の低因果変数候補を集約し、前記変数候補と異なる集約変数を作成する集約変数作成手段と、
    前記因果判定手段により因果関係の値が高いと判定された高因果候補と、前記集約変数作成手段により作成された前記集約変数とを前記子変数に対する親変数として前記分析モデルに含める親変数決定手段と
    を備えたことを特徴とする分析モデル作成装置。
JP2006075696A 2006-03-17 2006-03-17 分析モデル作成方法、分析モデル作成プログラムおよび分析モデル作成装置 Pending JP2007249873A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2006075696A JP2007249873A (ja) 2006-03-17 2006-03-17 分析モデル作成方法、分析モデル作成プログラムおよび分析モデル作成装置
US11/650,934 US7630951B2 (en) 2006-03-17 2007-01-09 Method, program product, and apparatus for generating analysis model

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006075696A JP2007249873A (ja) 2006-03-17 2006-03-17 分析モデル作成方法、分析モデル作成プログラムおよび分析モデル作成装置

Publications (1)

Publication Number Publication Date
JP2007249873A true JP2007249873A (ja) 2007-09-27

Family

ID=38560579

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006075696A Pending JP2007249873A (ja) 2006-03-17 2006-03-17 分析モデル作成方法、分析モデル作成プログラムおよび分析モデル作成装置

Country Status (2)

Country Link
US (1) US7630951B2 (ja)
JP (1) JP2007249873A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019194849A (ja) * 2018-04-30 2019-11-07 富士通株式会社 機械学習システムのための因果関係
WO2020162073A1 (ja) * 2019-02-06 2020-08-13 日本電気株式会社 情報可視化装置、情報可視化方法、及びコンピュータ読み取り可能な記録媒体

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110191141A1 (en) * 2010-02-04 2011-08-04 Thompson Michael L Method for Conducting Consumer Research
US11455561B2 (en) * 2019-11-14 2022-09-27 International Business Machines Corporation Alerting to model degradation based on distribution analysis using risk tolerance ratings
US11810013B2 (en) 2019-11-14 2023-11-07 International Business Machines Corporation Systems and methods for alerting to model degradation based on survival analysis
US11768917B2 (en) 2019-11-14 2023-09-26 International Business Machines Corporation Systems and methods for alerting to model degradation based on distribution analysis
US11256597B2 (en) 2019-11-14 2022-02-22 International Business Machines Corporation Ensemble approach to alerting to model degradation

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005107748A (ja) * 2003-09-29 2005-04-21 National Institute Of Advanced Industrial & Technology モデル作成装置、情報分析装置、モデル作成方法、情報分析方法およびプログラム
JP2006202619A (ja) * 2005-01-21 2006-08-03 Tyco Electronics Amp Kk コネクタ用電線カバー

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6232974B1 (en) * 1997-07-30 2001-05-15 Microsoft Corporation Decision-theoretic regulation for allocating computational resources among components of multimedia content to improve fidelity
WO2001082225A2 (en) * 2000-04-24 2001-11-01 Washington University Method and apparatus for probabilistic model of ultrasonic images
US7035790B2 (en) * 2000-06-02 2006-04-25 Canon Kabushiki Kaisha Speech processing system
US7010483B2 (en) * 2000-06-02 2006-03-07 Canon Kabushiki Kaisha Speech processing system
US7072833B2 (en) * 2000-06-02 2006-07-04 Canon Kabushiki Kaisha Speech processing system
US6954745B2 (en) * 2000-06-02 2005-10-11 Canon Kabushiki Kaisha Signal processing system
US6574537B2 (en) * 2001-02-05 2003-06-03 The Boeing Company Diagnostic system and method
NZ532120A (en) * 2001-09-26 2006-03-31 Gni Kk Biological discovery using gene regulatory networks generated from multiple-disruption expression libraries
US7454393B2 (en) * 2003-08-06 2008-11-18 Microsoft Corporation Cost-benefit approach to automatically composing answers to questions by extracting information from large unstructured corpora
JP4164669B2 (ja) 2003-09-29 2008-10-15 独立行政法人産業技術総合研究所 モデル作成装置、情報分析装置、モデル作成方法、情報分析方法、およびプログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005107748A (ja) * 2003-09-29 2005-04-21 National Institute Of Advanced Industrial & Technology モデル作成装置、情報分析装置、モデル作成方法、情報分析方法およびプログラム
JP2006202619A (ja) * 2005-01-21 2006-08-03 Tyco Electronics Amp Kk コネクタ用電線カバー

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019194849A (ja) * 2018-04-30 2019-11-07 富士通株式会社 機械学習システムのための因果関係
JP7275791B2 (ja) 2018-04-30 2023-05-18 富士通株式会社 機械学習システムのための因果関係
WO2020162073A1 (ja) * 2019-02-06 2020-08-13 日本電気株式会社 情報可視化装置、情報可視化方法、及びコンピュータ読み取り可能な記録媒体
JPWO2020162073A1 (ja) * 2019-02-06 2021-12-09 日本電気株式会社 情報可視化装置、情報可視化方法、及びプログラム
JP7259874B2 (ja) 2019-02-06 2023-04-18 日本電気株式会社 情報可視化装置、情報可視化方法、及びプログラム

Also Published As

Publication number Publication date
US7630951B2 (en) 2009-12-08
US20070233632A1 (en) 2007-10-04

Similar Documents

Publication Publication Date Title
US20220245667A1 (en) Adaptive lead generation for marketing
JP6007430B2 (ja) 機械学習モデル設計支援装置、機械学習モデル設計支援方法、機械学習モデル設計支援装置用プログラム
Simons et al. Interactive, evolutionary search in upstream object-oriented class design
US9336184B2 (en) Representation of an interactive document as a graph of entities
KR101130525B1 (ko) 서식 유형들을 사용하여 서식을 생성하기 위한 방법 및장치
CN102446220B (zh) 用于可视化数据的自适应树结构
JP2007249873A (ja) 分析モデル作成方法、分析モデル作成プログラムおよび分析モデル作成装置
US20120159333A1 (en) Representation of an interactive document as a graph of entities
US20110191141A1 (en) Method for Conducting Consumer Research
JP2007328507A (ja) 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
Le Nagard-Assayag et al. Modeling the impact of product preannouncements in the context of indirect network externalities
CN105144227A (zh) 社交媒体影响力评估
JP6642090B2 (ja) 品質管理装置及び品質管理プログラム
CA2680978A1 (en) Integrated design application
JP2019148897A (ja) 行動パターン探索システム、および行動パターン探索方法
CN109324864B (zh) 一种人机交互操作信息的获取方法及装置
EP3696745A1 (en) Intelligent workflow advisor for part design, simulation and manufacture
JP3925857B2 (ja) スケジュール作成方法、プログラム及びタスクスケジュール作成装置
Bemthuis et al. Discovering agent models using process mining: Initial approach and a case study
CN114675928A (zh) 容器镜像的构建方法和装置、存储介质及电子装置
Agostinho et al. Model-driven service engineering towards the manufacturing liquid-sensing enterprise
d'Aloisio et al. Modeling quality and machine learning pipelines through extended feature models
JP2009116844A (ja) 社会ネットワーク構造モデルを算出する電子計算機及びプログラム
Porouhan et al. Workflow mining: Discovering process patterns & data analysis from MXML logs
US20130097096A1 (en) Process entity graphs

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070926

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110125

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110712