JPH11328146A - デ―タ集合の変数をモデル化する方法及び装置 - Google Patents

デ―タ集合の変数をモデル化する方法及び装置

Info

Publication number
JPH11328146A
JPH11328146A JP11060453A JP6045399A JPH11328146A JP H11328146 A JPH11328146 A JP H11328146A JP 11060453 A JP11060453 A JP 11060453A JP 6045399 A JP6045399 A JP 6045399A JP H11328146 A JPH11328146 A JP H11328146A
Authority
JP
Japan
Prior art keywords
genome
data
data set
genomes
variables
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11060453A
Other languages
English (en)
Inventor
Ramin C Nakisa
シー ナキサ ラミン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NCR International Inc
Original Assignee
NCR International Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NCR International Inc filed Critical NCR International Inc
Publication of JPH11328146A publication Critical patent/JPH11328146A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 (修正有) 【課題】 データ集合の変数をデータ・ノード及び因果
リンクを含む確率的ネットワークによってモデル化する
方法を提供する。 【解決手段】 入力データの変数が登録され、複数ゲノ
ムから成る個体群が生成されてその各々が入力データ集
合を個々別々にモデル化する。個々のゲノムは、確率的
ネットワーク内のデータ・ノードを表す染色体と、デー
タ・ノード間の因果リンクを表す染色体とを有する。そ
の個体群内の親ゲノムの染色体データ間で交差組換操作
が実行されて、末裔ゲノムを生成してゲノム個体群に追
加される。前記個体群内のゲノムに対して、ゲノム及び
入力データ間の合致を表す採点を行い、個体群からゲノ
ムが選択されて交差組換、採点、追加、並びに、選択の
各操作が複数のゲノム世代に対して為されて、最も良好
な採点に従って最後の世代からゲノムが選択される。

Description

【発明の詳細な説明】
【0001】
【発明が属する技術分野】本発明は、データ・ノード及
び因果リンクを含む確率的ネットワークによってデータ
集合の変数をモデル化する方法及び装置に関する。
【0002】
【従来技術】確率的ネットワークは、データ・セット又
はデータ集合の変数間の原因及び結果の関係における図
形モデル化である。そうしたネットワークは、ベイズ・
ネットワーク、信頼性ネットワーク、因果ネットワー
ク、並びに、知識マップとして文献では呼称されてい
る。この明細書では、用語「確率的ネットワーク」はベ
イズ・ネットワーク、信頼性ネットワーク、因果ネット
ワーク、並びに、知識マップを含む。各場合における図
形モデルは、変数を表すデータ・ノードと、それらデー
タ・ノード間に連結される従属性を云う因果リンク又は
アークとを含む。それぞれが複数のノード及びアークか
ら成る所与の集合はネットワーク構造を画成する。
【0003】ネットワーク構造がデータ集合を正確にモ
デル化していることが判明されると、そのモデルはその
データ集合内の変数間の可能性ある因果関係についての
知識を要約している。そうしたモデルは、データの大き
な集合内の変数間の関係についての知識を簡潔にして理
解し易い形態に単純化させることを可能とし、データ・
マイニング(データ発掘)の主要な目的である。
【0004】確率的ネットワークを用いてのデータ集合
のモデル化に伴う様々な問題の内の1つは、所与の入力
データ集合に適合する最も確かなネットワーク構造を見
出すことである。それは、可能性あるネットワーク構造
の探索スペースがネットワーク内のデータ・ノード数と
共に指数関数的に増大するからである。入力データ集合
にどの程度充分に合致するかを測定すべく可能性あるネ
ットワークの全ての徹底的な評価は、適度なサイズのネ
ットワーク構造に限定された場合でさえ現実性がないも
のと見なされてきた。
【0005】
【発明が解決しようとする課題】本発明は、入力データ
集合の変数をモデル化する確率的ネットワークの表示を
より効率的に生成することを目的とする。
【0006】
【課題を解決するための手段】本発明に従えば、入力デ
ータ集合内の変数をデータ・ノード及び因果リンクを含
む確率的ネットワークによってモデル化する方法がここ
で提供され、その方法は、前記入力データ集合を登録す
るステップと、確率的ネットワーク内のデータ・ノード
と該データ・ノード間の因果リンクとを表すべく、各々
が染色体データによって前記入力データを個々別々にモ
デル化している複数のゲノムから成る個体群を生成する
ステップと、末裔ゲノムを生成すべく、前記個体群内の
親ゲノムの染色体データ間で交差組換操作を実行するス
テップと、前記末裔ゲノムを前記個体群へ追加するべ
く、追加操作を実行するステップと、前記ゲノム及び前
記入力データ集合間の一致を表す採点を引き出すべく、
前記個体群内のゲノムに対して採点操作を実行するステ
ップと、前記採点に従って前記個体群からゲノムを選択
すべく、選択操作を実行するステップと、ゲノムの複数
の世代に対して、前記交差操作、前記採点操作、前記追
加操作、並びに、前記選択操作を繰り返すステップと、
出力として最終世代からのゲノムを選択するステップ
と、の諸ステップを含むことから構成される。
【0007】更に本発明に従えば、入力データ集合内の
変数をデータ・ノード及び因果リンクを含む確率的ネッ
トワークによってモデル化する装置が提供され、その装
置は、前記入力データ集合を登録するデータ登録手段
と、確率的ネットワーク内のデータ・ノードと該データ
・ノード間の因果リンクとを表すべく、各々が染色体デ
ータによって前記入力データを個々別々にモデル化して
いる複数のゲノムから成る個体群を生成する生成手段
と、末裔ゲノムを生成すべく、前記個体群内の親ゲノム
の染色体データ間で交差組換操作を実行する交差組換手
段と、前記末裔ゲノムを前記個体群へ追加するべく、追
加操作を実行する追加手段と、前記ゲノム及び前記入力
データ集合間の一致を表す採点を引き出すべく、前記個
体群内のゲノムに対して採点操作を実行する採点手段
と、前記採点に従って前記個体群からゲノムを選択すべ
く、選択操作を実行する選択手段と、ゲノムの複数の世
代に対して、前記交差手段、前記採点手段、前記追加手
段、並びに、前記選択手段を制御してそれらの操作を繰
り返す制御手段と、出力モデルとして最終世代からのゲ
ノムを選択する出力手段と、を備えることから構成され
る。
【0008】本発明を、例示的目的で、添付図面を参照
して以下説明する。
【0009】図1において、1つのデータ集合が統計的
データのテーブル10内に含まれており、該データ集合
は銀行の顧客に関連する変数を含む。これら変数は、顧
客の個人的な年齢、性別、住所、職業、並びに、所得の
データを含む。更にこれら変数は、顧客がテレホンバン
キング或はインターネットバンキングを利用しているか
否か、銀行のどの支店が顧客の取引口座を保持している
か、そして顧客が保険保証金を取得すべく銀行を利用し
ているか否かについての情報を含む。テーブル10の各
行は各種変数の内の1つに関連しているデータに関し、
各列は各種変数データ内のデータ・フィールドを含む。
図1におけるテーブルはM×Nのマトリックスで示さ
れ、各変数に対して共通数のデータ・フィールドを具備
する。しかしながら明らかなことは、任意の所与変数に
対するデータを表すべく使用されるフィールド数は変数
毎に異なることである。
【0010】図1に表されるようなデータ集合は、銀行
によって提供されるサービスを利用するに際して、顧客
が為す可能性がある選択についての有用情報ソースとし
て見なされる。例えば、特定の顧客がテレホンバンキン
グを選択する可能性があるか否かについては、このデー
タ集合から推論が引き出せる。1つのデータ集合から穏
当な結論を引き出す補助を為す強力なツールは、そのデ
ータ集合内における各種変数間の関係を規定する確率的
ネットワーク構造を構築することである。そうしたネッ
トワーク構造はベイズ信頼性ネットワークとしてモデル
化可能であり、そのネットワーク構造内のデータ・ノー
ドとして変数を表すことによってそのデータ集合内での
統計的従属性や、そうしたデータ・ノードを相互接続す
るアークとしての変数間での従属性を説明するものであ
る。
【0011】図2は、図1のデータ集合に適合するモデ
ルとして仮定され得るベイズ信頼性ネットワークを示
す。このネットワークにおいて、年齢、性別、住所、並
びに、所得の各種変数は独立変数として示され、残りの
変数は図2での矢印によって印されている従属性を有す
るものとして示される。このネットワークは、年齢の変
数と職業の変数との間の因果関係を示す。他の因果関係
は性別と職業との間で示されている。因果関係は、住所
及び所得の各独立変数から銀行支店箇所の従属変数まで
の矢印で印されている。残りの因果関係は職業及び支店
箇所の変数から、インターネットバンキング、テレホン
バンキング、並びに、保険取得の更なる従属性までの矢
印によって印されている。
【0012】確率分布がデータ・ノード各々に割り当て
られて、このモデルはそのデータ集合内の統計的従属性
を図形的に表す。このモデルは、データ集合内の可能性
ある因果関係についての知識を記録する簡潔で分かり易
い方法である。
【0013】穏当なベイズ信頼性ネットワークを考案す
る難しさは、変数各々の条件付きの分布を指定するこ
と、そして因果因子の複雑な組合せがどのように相互作
用するかを仮定又は推測することにある。可能性あるネ
ットワーク構造の探索スペースはネットワーク内のノー
ド数と共に指数関数的に増大して、可能性あるネットワ
ークの全てに対しての徹底的な探索を非現実的なものと
している。
【0014】図3には、図1に示される統計的データを
受け取って、そのデータの穏当なモデルとして評価され
るベイズ信頼性ネットワークを生成する手段を提供する
装置が示されている。入力された統計的データは、デー
タI/O装置30からI/Oポート31を通過して、デ
ータ・バス32にエントリされる。オペレーティング・
システム34によって制御される中央演算処理ユニット
(CPU)33は、データ・バス32に対するデータの
エントリを制御する。ランダム・アクセス・メモリ35
はこのI/Oバス32に接続されて、該バス32へ供給
されるデータを受け取って記憶する。
【0015】データI/O装置30によって、図1に示
される変数を表している統計的データのエントリに応じ
て、CPU33はそのデータをメモリ35にエンターす
るようにプログラムされている。次いでデータは、図5
のブロック流れ線図に表されている演算を処理するシー
ケンスでCPU33によって処理される。図5におい
て、I/O装置30を介してのデータ集合のエントリが
ステップ50に示され、そのデータ集合のメモリ35内
への記憶又は登録がステップ51に示されている。ステ
ップ52において、そのデータはメモリ35内に記憶さ
れている複数のゲノムから成る個体群を表すべく再フォ
ーマットされる。
【0016】用語ゲノムは遺伝的アルゴリズムの分野か
らの由来である。遺伝的アルゴリズムは、個々の数学的
対象の個体群を新しい個体群へ変換する平行アルゴリズ
ムである。この変換を実行するために使用される演算
は、有性組換或は交差組換等の自然界の遺伝的操作に見
出されるものと類似している。個体群内の各個体は、固
定長或は可変長の2進数文字列から典型的には成る数の
シーケンスでコード化されている。遺伝的アルゴリズム
の初期的個体群は、特定の目的に対する適合性に関して
テストすべく評価され、選択された複数の個体に対する
遺伝操作は複数の個体から成る新しい個体群を生成する
ことになる。
【0017】図5のステップ52において、複数ゲノム
から成る初期的個体群は、メモリ35内に記憶されてい
るデータ集合からCPU33によって生成される。CP
U33は、データ集合から、各ゲノムに対して2進数の
異なる文字列を生成する。文字列40は図4に示される
2つの染色体41及び42を有する。第1の染色体41
はデータ集合内の選択された変数をデータ・ノードD
からDとしてコード化する。これらデータ・ノードの
各々は、データ内のフィールドか、データ内の仮定され
た「隠れ」変数かの何れかを指定し、またガウス分布、
多項分布、或は、ポアソン分布等のタイプの特殊な分布
を指定するように符号化され得る。分布タイプはデータ
の性質に依存すると共に、それが連続的データとして表
されるか或は範疇的データとして表されるかに依存す
る。第2の染色体はデータ・ノード間を接続するアーク
を表し、複数の1及び複数のゼロから成る平方N×Nマ
トリックスであり、ここでNはネットワークにおけるノ
ード数であり、要素内の各アークはそのマトリックス内
の要素aijによって表される。もしaij=1であれ
ば、ノードi及びj間のアークである。
【0018】再度図5を参照すると、ゲノムの初期的個
体群はステップ53で交差組換操作を被る。交差組換オ
ペレータは無作為にゲノムを選択して、2つの染色体が
独立的に遺伝を受け継いで、独立的に交差させられる交
差組換操作を実行する。ノード染色体は線形アレイに沿
った一点を無作為に選択して、父性染色体の部分41a
をその点までコピーすることによって交差組換を行われ
る。その点を越えた母性ゲノムの部分41bを、父性染
色体の部分41aにコピーして組み継がれる。図4にお
ける破線は、交差組換が実行される点の無作為選択を示
す。明らかなことは、ノード染色体41が、データの性
質、ゲノムがステップ52で生成される方法、並びに、
ステップ53での交差組換操作の性質に依存する固定長
或は可変長の文字列であり得ることである。
【0019】アーク染色体42の交差組換は、父性マト
リックスを分割する線を無作為に選択し、父性マトリッ
クスの部分42aをその線までコピーし、その線を越え
る母性マトリックスの部分42bにコピーし、そしてそ
れら部分42a及び42bを新マトリックスに再整理す
ることによって実行される。図4における破線は、部分
42a及び42bの選択の無作為性を示す。明らかなこ
とは、平方マトリックスのサイズがノード染色体が可変
長文字列である場合に変動することである。
【0020】ステップ54で個体群は無作為な突然変異
を被る。この突然変異ステップは、複数ゲノムから成る
個体群の所定の小さな割合又は部分の無作為選択を含
む。無作為に選択されたゲノムは4つの可能性ある突然
変異の1つによって突然変異させられる。これら可能性
ある突然変異は、ノード染色体41に関してのノード追
加或はノード削除であり、アーク染色体42に関しての
アーク追加或はアーク削除である。ノード染色体に関す
るノードの追加或は削除は、対応するアーク染色体の更
新を必要とする。よってノードの追加はアーク染色体へ
の行及び列の追加と、その新ノードを現存するノードに
接続するアークの無作為生成とを必要とする。ノードの
削除はアーク染色体からの対応する行及び列の削除を必
要とする。
【0021】突然変異ステップに続いて、ゲノムの個体
群はステップ55で検査及び選別(淘汰)を被る。ステ
ップ55ではネットワークの構造に対する束縛が満たさ
れているかが検査される。1つのそうした束縛は、ネッ
トワークが有向非巡回図形であるという要件を満足して
いることである。また、先行知識は特定の因果リンクを
除外するか強制し、それで幾つかのノード及びアークは
その有無が束縛されて、突然変異を被らない。更に、同
等であるネットワークの進展を回避することが望まし
い。同等ネットワークは異なる構造を有するが、同一の
確率モデルをコード化する。ステップ55での選別は、
必要とされる束縛に合致しないか、或は個体群の現存メ
ンバーに同等であるようなネットワークに対して為され
る。
【0022】採点操作はステップ56で為されて、ゲノ
ムのデータ集合に対する適合性を採点する。データ集合
に対する最良の適合性を得点するゲノムの選択は、ゲノ
ムの次の世代を形成すべく選択される。各ゲノムに対す
る採点は、そのゲノムによって表されるネットワークが
データ集合にどの程度良好に適合され得るかに関連して
評価される。データ集合内のデータがネットワークによ
って定義される合併分布から生成される無作為サンプル
であることを仮定することによって、採点は評価され
る。データ集合内の変数の値と合併分布内で生成された
値との間で比較が為されて、より高い採点がより高い対
応又は一致によって達成される。次いで各ゲノムに対す
る採点は評価されて、同一世代の他のゲノムの採点との
比較のために記憶される。ゲノムはそれらの採点に従っ
て選択される。
【0023】非常に複雑なネットワーク・モデルはより
簡単なネットワークよりもデータをより正確にモデル化
し、これはデータの適合過剰となり得る。よって各ネッ
トワークによって達成された採点は、ネットワーク内で
表されるノード及びアークの数に対してペナルティを導
入することによって束縛され得る。
【0024】このプロセスは決定ステップ58を通過し
て続行されて、ゲノムの世代数であるプリセット数Nの
間、ステップ53,54,55,56,57を繰り返
す。この繰り返しは、決定ステップ58でそのプリセッ
ト世代数がカウントされるまで続行される。それに及ん
でプロセスはステップ59へ続き、そこでゲノムの最終
世代が採点操作を再度被って、データ集合に対して最も
良好な適合性の採点をとったゲノムを選択する。その選
択されたゲノムを表す文字列はI/O装置30へ出力デ
ータとして供給される。
【0025】図5のプロセスにおけるステップ中、ステ
ップ55,56,57は最大の処理パワーを必要とす
る。当業者には明らかであるように、これらのステップ
は、図1に示される単一プロセッサの代わりとして、平
行して動作する複数のプロセッサによって実行可能であ
る。そうした複数の平行プロセッサは、計算タスクをそ
れら複数の平行プロセッサに振り分けるようにプログラ
ムされたマスタ・プロセッサの制御で動作させられ得
る。
【0026】ステップ52及びステップ57で形成され
る個体群におけるネットワークの個体群は、ネットワー
クから成る複数のプール或はデームに再分割され得て、
1つのデーム内での2つの個体間で生ずる交差組換の確
率が異なるデームにおける2つの個体間での交差組換よ
りもより大きくなるようにしている。この手段によっ
て、個体群内の多様性が維持され、最終的に作り出され
るネットワークの採点の改善が生ずる。
【0027】以上に説明したことは、入力データ集合に
適合する確率的ネットワークを表すべく出力データの産
出に対する一般的用途を有する。データ集合は広範なソ
ースからのデータを含み得て、本発明は以上に説明した
ような銀行のデータ集合の特定例に制限されない。
【0028】遺伝的アルゴリズムの使用は、データ集合
を表現するネットワーク位相幾何学を見つけ出す他の方
法を凌ぐ多数の長所を有する。遺伝的アルゴリズムは、
幾つかの探索方法(例えば、傾斜継承)に見い出される
局所最小の問題を回避している。これは、探索方法がパ
ラメータ・スペースの領域内で局所的に高いが、包括的
には低い適合性に捕らわれた際に生ずる。遺伝的アルゴ
リズムは内在的に平行すると共に、探索を実行するため
に使用されるコードへの変更なしに、新プロセッサを追
加することによって探索プロセスを高速化することがで
きる。専門家から取得した変域知識等の先行する束縛
は、類似の束縛をゲノムの生成に置くことによって探索
スペースに容易に適用可能である。
【図面の簡単な説明】
【図1】入力データ集合内のデータ・テーブルを示す図
である。
【図2】図1のデータをモデル化するデータ・ノード及
び因果リンクを含む確率的ネットワークを示す図であ
る。
【図3】図1のデータ・テーブルをモデル化すべく確率
的ネットワークの表示を提供するための、本発明に従っ
たデータ演算処理装置を示す図である。
【図4】図3の装置によって処理される遺伝的アルゴリ
ズム内に含まれる染色体データを示す図である。
【図5】図3の装置によって実行される操作ステップの
ブロック線図である。
【符号の説明】
10 データ・テーブル 30 データI/O装置 31 I/Oポート 32 データ・バス 33 中央演算処理ユニット 34 オペレーティング・システム 35 ランダム・アクセス・メモリ 40 文字列 41 染色体 42 染色体 41a 父性染色体の部分 41a 母性ゲノムの部分

Claims (22)

    【特許請求の範囲】
  1. 【請求項1】 前記入力データ集合を登録するステップ
    と、 確率的ネットワーク内のデータ・ノードと該データ・ノ
    ード間の因果リンクとを表すべく、各々が染色体データ
    によって前記入力データを個々別々にモデル化している
    複数のゲノムから成る個体群を生成するステップと、 末裔ゲノムを生成すべく、前記個体群内の親ゲノムの染
    色体データ間で交差組換操作を実行するステップと、 前記末裔ゲノムを前記個体群へ追加するべく、追加操作
    を実行するステップと、 前記ゲノム及び前記入力データ集合間の一致を表す採点
    を引き出すべく、前記個体群内のゲノムに対して採点操
    作を実行するステップと、 前記採点に従って前記個体群からゲノムを選択すべく、
    選択操作を実行するステップと、 ゲノムの複数の世代に対して、前記交差操作、前記採点
    操作、前記追加操作、並びに、前記選択操作を繰り返す
    ステップと、 出力として最終世代からのゲノムを選択するステップ
    と、を含むことを特徴とするデータ集合の変数をモデル
    化する方法。
  2. 【請求項2】 前記ゲノムを無作為に突然変異させるス
    テップを更に含む請求項1に記載のデータ集合の変数を
    モデル化する方法。
  3. 【請求項3】 前記ゲノムを無作為に突然変異させるス
    テップが、データ・ノードの追加を含む請求項2に記載
    のデータ集合の変数をモデル化する方法。
  4. 【請求項4】 前記ゲノムを無作為に突然変異させるス
    テップが、データ・ノードの削除を含む請求項2乃至3
    に記載のデータ集合の変数をモデル化する方法。
  5. 【請求項5】 前記ゲノムを無作為に突然変異させるス
    テップが、因果リンクの追加を含む請求項2乃至4に記
    載のデータ集合の変数をモデル化する方法。
  6. 【請求項6】 前記ゲノムを無作為に突然変異をさせる
    ステップが、因果リンクの削除を含む請求項2乃至5に
    記載のデータ集合の変数をモデル化する方法。
  7. 【請求項7】 各ゲノムの前記染色体データが、複数の
    ノード・データから成る線形アレイの形態であるノード
    染色体と、複数の因果リンクから成るマトリックスの形
    態の因果リンク染色体とを含む請求項1乃至6に記載の
    データ集合の変数をモデル化する方法。
  8. 【請求項8】 前記交差組換操作が、前記末裔ゲノムに
    独立して継承されたノードと因果リンク染色体とを提供
    する請求項7に記載のデータ集合の変数をモデル化する
    方法。
  9. 【請求項9】 所定の構造的束縛に合致し損なったゲノ
    ムを淘汰する更なるステップを含む請求項1乃至8に記
    載のデータ集合の変数をモデル化する方法。
  10. 【請求項10】 前記所定の構造的束縛が、予め選択さ
    れた因果リンクの排除を含む請求項9に記載のデータ集
    合の変数をモデル化する方法。
  11. 【請求項11】 前記所定の構造的束縛が、有向非巡回
    図形を表さないゲノムの排除を含む請求項9又は10に
    記載のデータ集合の変数をモデル化する方法。
  12. 【請求項12】 前記入力データ集合を登録するデータ
    登録手段と、 確率的ネットワーク内のデータ・ノードと該データ・ノ
    ード間の因果リンクとを表すべく、各々が染色体データ
    によって前記入力データを個々別々にモデル化している
    複数のゲノムから成る個体群を生成する生成手段と、 末裔ゲノムを生成すべく、前記個体群内の親ゲノムの染
    色体データ間で交差組換操作を実行する交差組換手段
    と、 前記末裔ゲノムを前記個体群へ追加するべく、追加操作
    を実行する追加手段と、 前記ゲノム及び前記入力データ集合間の一致を表す採点
    を引き出すべく、前記個体群内のゲノムに対して採点操
    作を実行する採点手段と、 前記採点に従って前記個体群からゲノムを選択すべく、
    選択操作を実行する選択手段と、 ゲノムの複数の世代に対して、前記交差手段、前記採点
    手段、前記追加手段、並びに、前記選択手段を制御して
    それらの操作を繰り返す制御手段と、 出力モデルとして最終世代からのゲノムを選択する出力
    手段と、を含むことを特徴とするデータ集合の変数をモ
    デル化する装置。
  13. 【請求項13】 前記ゲノムを無作為に突然変異させる
    突然変位手段を更に備える請求項12に記載のデータ集
    合の変数をモデル化する装置。
  14. 【請求項14】 前記突然変異手段が、データ・ノード
    の追加を含む無作為な突然変異の実行に適合している請
    求項13に記載のデータ集合の変数をモデル化する装
    置。
  15. 【請求項15】 前記突然変異手段が、データ・ノード
    の削除を含む無作為な突然変異の実行に適合している請
    求項13乃至14に記載のデータ集合の変数をモデル化
    する装置。
  16. 【請求項16】 前記突然変異手段が、因果リンクの追
    加を含む無作為な突然変異の実行に適合している、請求
    項13乃至15に記載のデータ集合の変数をモデル化す
    る装置。
  17. 【請求項17】 前記突然変異手段が、因果リンクの削
    除を含む無作為な突然変異の実行に適合している請求項
    13乃至16に記載のデータ集合の変数をモデル化する
    装置。
  18. 【請求項18】 前記生成手段が、複数のノード・デー
    タから成る線形アレイの形態であるノード染色体と、複
    数の因果リンクから成るマトリックスの形態の因果リン
    ク染色体とを各々が含むことから成るゲノムの生成に適
    合している請求項12乃至17に記載のデータ集合の変
    数をモデル化する装置。
  19. 【請求項19】 前記交差組換手段が、独立して継承さ
    れたノードと因果リンク染色体との前記末裔ゲノムに対
    する提供に適合している請求項18に記載のデータ集合
    の変数をモデル化する装置。
  20. 【請求項20】 所定の構造的束縛に合致し損なったゲ
    ノムを淘汰する淘汰手段を更に備える請求項12乃至1
    9に記載のデータ集合の変数をモデル化する装置。
  21. 【請求項21】 前記所定の構造的束縛が、予め選択さ
    れた因果リンクの排除を含む請求項20に記載のデータ
    集合の変数をモデル化する装置。
  22. 【請求項22】 前記所定の構造的束縛が、有向非巡回
    図形を表さないゲノムの排除を含む請求項20乃至21
    に記載のデータ集合の変数をモデル化する装置。
JP11060453A 1998-03-13 1999-03-08 デ―タ集合の変数をモデル化する方法及び装置 Pending JPH11328146A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GBGB9805260.8A GB9805260D0 (en) 1998-03-13 1998-03-13 Method and apparatus to model the variables of a data set
GB9805260.8 1998-03-13

Publications (1)

Publication Number Publication Date
JPH11328146A true JPH11328146A (ja) 1999-11-30

Family

ID=10828423

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11060453A Pending JPH11328146A (ja) 1998-03-13 1999-03-08 デ―タ集合の変数をモデル化する方法及び装置

Country Status (4)

Country Link
US (1) US6480832B2 (ja)
EP (1) EP0942384A2 (ja)
JP (1) JPH11328146A (ja)
GB (1) GB9805260D0 (ja)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010101736A (ko) * 1999-01-27 2001-11-14 추후제출 자극에 대한 인체반응의 시뮬레이션 방법
US6658581B1 (en) * 1999-03-29 2003-12-02 Agency Of Industrial Science & Technology Timing adjustment of clock signals in a digital circuit
US20010053991A1 (en) * 2000-03-08 2001-12-20 Bonabeau Eric W. Methods and systems for generating business models
GB0013011D0 (en) * 2000-05-26 2000-07-19 Ncr Int Inc Method and apparatus for determining one or more statistical estimators of customer behaviour
JPWO2002027592A1 (ja) 2000-09-29 2004-02-05 ソニー株式会社 エージェントを用いた情報管理システム
US6859796B1 (en) * 2001-07-19 2005-02-22 Hewlett-Packard Development Company, L.P. Method of using multiple populations with cross-breeding in a genetic algorithm
WO2003038749A1 (en) * 2001-10-31 2003-05-08 Icosystem Corporation Method and system for implementing evolutionary algorithms
US7117185B1 (en) 2002-05-15 2006-10-03 Vanderbilt University Method, system, and apparatus for casual discovery and variable selection for classification
US7043463B2 (en) 2003-04-04 2006-05-09 Icosystem Corporation Methods and systems for interactive evolutionary computing (IEC)
US20040220892A1 (en) * 2003-04-29 2004-11-04 Ira Cohen Learning bayesian network classifiers using labeled and unlabeled data
WO2005013081A2 (en) 2003-08-01 2005-02-10 Icosystem Corporation Methods and systems for applying genetic operators to determine system conditions
US7356518B2 (en) 2003-08-27 2008-04-08 Icosystem Corporation Methods and systems for multi-participant interactive evolutionary computing
ATE370466T1 (de) * 2003-09-15 2007-09-15 Philippe Baumard Verfahren und system zur interessenniveaumessung von digitalen nachrichten
US7707220B2 (en) 2004-07-06 2010-04-27 Icosystem Corporation Methods and apparatus for interactive searching techniques
US20070033211A1 (en) * 2005-08-04 2007-02-08 Berman Saul J Mergers and acquisitions using component business model
US8423323B2 (en) 2005-09-21 2013-04-16 Icosystem Corporation System and method for aiding product design and quantifying acceptance
JP4445480B2 (ja) * 2006-03-23 2010-04-07 富士通株式会社 シナリオ生成方法、シナリオ生成プログラム、シナリオ生成装置
CN100442288C (zh) * 2006-04-04 2008-12-10 华为技术有限公司 一种确定变量相关关系的方法
US20080154808A1 (en) * 2006-10-20 2008-06-26 Genalytics, Inc. Use and construction of time series interactions in a predictive model
US20080154809A1 (en) * 2006-10-20 2008-06-26 Genalytics, Inc. Use and construction of categorical interactions using a rule gene in a predictive model
US7720782B2 (en) * 2006-12-22 2010-05-18 American Express Travel Related Services Company, Inc. Automated predictive modeling of business future events based on historical data
US7792816B2 (en) 2007-02-01 2010-09-07 Icosystem Corporation Method and system for fast, generic, online and offline, multi-source text analysis and visualization
US20080294498A1 (en) * 2007-05-24 2008-11-27 Christopher Adrien Methods and apparatus to improve market launch performance
US20090119130A1 (en) * 2007-11-05 2009-05-07 Zebadiah Kimmel Method and apparatus for interpreting data
US10210479B2 (en) * 2008-07-29 2019-02-19 Hartford Fire Insurance Company Computerized sysem and method for data acquistion and application of disparate data to two stage bayesian networks to generate centrally maintained portable driving score data
US20100070446A1 (en) * 2008-09-12 2010-03-18 Mark Philip Shipman System and method for representing inconsistently formatted data sets
CN102422279B (zh) * 2009-04-28 2016-09-21 思腾科技(巴巴多斯)有限公司 用于资产管理和交易的基于类的分布式进化算法
US10430429B2 (en) 2015-09-01 2019-10-01 Cognizant Technology Solutions U.S. Corporation Data mining management server
WO2017059012A1 (en) * 2015-09-29 2017-04-06 Skytree, Inc. Exporting a transformation chain including endpoint of model for prediction
CN108304493B (zh) * 2018-01-10 2020-06-12 深圳市腾讯计算机系统有限公司 一种基于知识图谱的上位词挖掘方法及装置
US11403267B2 (en) 2020-07-06 2022-08-02 Bank Of America Corporation Dynamic transformation code prediction and generation for unavailable data element

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5140530A (en) 1989-03-28 1992-08-18 Honeywell Inc. Genetic algorithm synthesis of neural networks
US5245696A (en) 1990-11-21 1993-09-14 Ricoh Co. Ltd. Evolution and learning in neural networks: the number and distribution of learning trials affect the rate of evolution
US5214746A (en) 1991-06-17 1993-05-25 Orincon Corporation Method and apparatus for training a neural network using evolutionary programming
US6128607A (en) * 1996-07-12 2000-10-03 Nordin; Peter Computer implemented machine learning method and system
US6192354B1 (en) * 1997-03-21 2001-02-20 International Business Machines Corporation Apparatus and method for optimizing the performance of computer tasks using multiple intelligent agents having varied degrees of domain knowledge
US6088690A (en) * 1997-06-27 2000-07-11 Microsoft Method and apparatus for adaptively solving sequential problems in a target system utilizing evolutionary computation techniques
US6154736A (en) * 1997-07-30 2000-11-28 Microsoft Corporation Belief networks with decision graphs
US6128608A (en) * 1998-05-01 2000-10-03 Barnhill Technologies, Llc Enhancing knowledge discovery using multiple support vector machines

Also Published As

Publication number Publication date
US6480832B2 (en) 2002-11-12
EP0942384A2 (en) 1999-09-15
US20020062296A1 (en) 2002-05-23
GB9805260D0 (en) 1998-05-06

Similar Documents

Publication Publication Date Title
JPH11328146A (ja) デ―タ集合の変数をモデル化する方法及び装置
Sohail Genetic algorithms in the fields of artificial intelligence and data sciences
JP7186797B2 (ja) 量子計算のための方法及びシステム
Reeves et al. Genetic algorithms: principles and perspectives: a guide to GA theory
CN112734034A (zh) 模型训练方法、调用方法、装置、计算机设备和存储介质
US20100306167A1 (en) Article and method for finding a compact representation to visualize complex decision trees
JPH08272659A (ja) データ記憶方法
US20080065575A1 (en) Evolutionary neural network and method of generating an evolutionary neural network
CN111476038A (zh) 长文本生成方法、装置、计算机设备和存储介质
Kalita et al. Bi-objective corridor allocation problem using a permutation-based genetic algorithm hybridized with a local search technique
Billings et al. Identification of probabilistic cellular automata
Rivero et al. Dome: a deterministic technique for equation development and symbolic regression
CN113971992A (zh) 针对分子属性预测图网络的自监督预训练方法与系统
Ishii et al. Constrained neural approaches to quadratic assignment problems
US20200040329A1 (en) Systems and methods for predicting repair outcomes in genetic engineering
CN114550849A (zh) 基于量子图神经网络解决化学分子性质预测的方法
Chen et al. Graph unfolding networks
Attar et al. Automatic generation of adaptive network models based on similarity to the desired complex network
Onwubolu et al. New ideas and applications of scatter search and path relinking
Elsayed et al. Evolutionary behavior of dna sequences analysis using non-uniform probabilistic cellular automata model
Likas et al. Group updates and multiscaling: An efficient neural network approach to combinatorial optimization
Bull et al. A Learning Classifier System Approach to the Identification of Cellular Automata.
Cordón et al. On the use of bagging, mutual information-based feature selection and multicriteria genetic algorithms to design fuzzy rule-based classification ensembles
Vai et al. Representing knowledge by neural networks for qualitative analysis and reasoning
Alexandre et al. Compu-search methodologies II: scheduling using genetic algorithms and artificial neural networks