JP2004530967A - 予測用モデルを展開する方法及び装置 - Google Patents

予測用モデルを展開する方法及び装置 Download PDF

Info

Publication number
JP2004530967A
JP2004530967A JP2002561698A JP2002561698A JP2004530967A JP 2004530967 A JP2004530967 A JP 2004530967A JP 2002561698 A JP2002561698 A JP 2002561698A JP 2002561698 A JP2002561698 A JP 2002561698A JP 2004530967 A JP2004530967 A JP 2004530967A
Authority
JP
Japan
Prior art keywords
gene
variable
chromosome
chromosomes
observed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002561698A
Other languages
English (en)
Inventor
ケーダー・マティアス
ディロン・デイビッド・エス
Original Assignee
ゼナリティクス・インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ゼナリティクス・インコーポレイテッド filed Critical ゼナリティクス・インコーポレイテッド
Publication of JP2004530967A publication Critical patent/JP2004530967A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Genetics & Genomics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Physiology (AREA)
  • Complex Calculations (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Debugging And Monitoring (AREA)

Abstract

開示内容の要約
本発明は、少なくとも1つの独立変数値に基づいて単一の従属変数値を予測するモデルを展開するコンピュータ実行法に関する。コンピュータ実行法は、各従属変数に対する値と少なくとも1つの独立変数に対する値とを各々含む複数の観察値を有するデータ集合体を構築する過程と、可能性のある予測用モデルを各々含む複数の最初の染色体をデータ集合体から構築する過程と、各染色体の量的な適応度測定値を展開する過程と、適応度測定値に基づいて多くの初期染色体を選択し、クローニング及び純粋な(標準の)交叉技術の少なくとも1つにより選択された最初の染色体を交叉させ、かつ交叉した染色体を突然変異させることにより、染色体の新世代を形成する過程とを含む。また、本発明の方法を実行する装置について記載する。
【選択図】図6

Description

【関連する出願に対する相互参照】
【0001】
本願は、2001年1月19日付け米国特許仮出願第60/263,024号「統計モデル及びニューラルネットワーク(神経回路網)モデルの解析の自動化」に関する利益を要求する。
【背景技術】
【0002】
本発明は、1又は複数の独立変数の値に基づいて、単一又は複数の従属変数の値を予測するモデルを展開する方法及び装置に関する。また、本発明は、前記方法に使用する特有の染色体の構造に関する。
【0003】
電子商取引の企業間及び企業−消費者間の市場取引(マーケティング)に統計(S)モデル及びニューラルネットワーク(NN)モデルを適用した解析法は非常に有効であるが、この方法には2つの重大な問題がある。第1の問題は、市場取引の問題を正確に示す解析変数の構築が必要となることである。一般に、この方法は、統計学の専門家を必要とし非常に長時間要する。
【0004】
第2の問題は、モデルに含むことができる変数の異なる多数の組合せが存在することである。単純な例として、50変数のデータ集合から15変数の選択を解析で要求すると仮定する。この方法は、変数データ集合体の2兆2500億の組合せを形成するであろう。作業が複雑になるほど解析の実行も複雑になる。1000の独立変数から成るデータ集合体から構築すべき記号論理学上の回帰モデルを形成する適度に複雑な作業を検討する。有効な組合せモデル数は信じられないほど大きく、莫大な時間と労力を必要とするであろう。形成することを要する多数の組合せ変数の複雑性に加えて、追加の状況複雑性が存在する。例えば、ニューラルネットワークモデルは構造上の最適化、即ちヒドンノード(隠れ接続ポイント)及びヒドンレイヤー(隠れ階層)を識別することが必要である。独立変数を使用して、従属変数従ってその結果を予測するので、独立変数を慎重に選ぶ必要がある。構造の最適化の追加要件は、莫大な変数の組合せを生じるであろう。制約(小さい)ニューラルネットワークを必要としかつ前記値を使用する作業の非常に単純な例として、50のリストから15変数を選択して、25以下の隠れ接続ポイントの選択を有する各隠れ階層と共に、1と2の隠れ階層の間の決定により形成できる組合せ変数の数は、信じられないほどに大きい。実際に、適度の大きさのニューラルネットワークを現に適用すると、可能な組合せ数が非常に増大するであろう。更に、モデル複雑性が増すので、問題の前記種類に対する組合せ数が非常に大きくなり、現行のコンピュータCPU速度では、特に大きい商業上の問題に対し、合理的な時間内に単一モデルの組合せ毎に検定することはほぼ不可能である。また、複数のモデル及びデータ集合体は両方とも劣化する欠点がある。これは、徹底的な検索の間にデータがやがてビジネス上の問題に同調しなくなることを意味する。このため、徹底的な検索により発見される解決法は、解決法が発見される時間までにもはや最適ではなくなるであろう。相関解析技術を利用して、より許容可能(かつ合理的)な数に変数を限定できる(ピアソンの相関を使用して、従属変数に対する15の最強の相関を決定できる)が、従来の統計技術は、変数の数が減少する瞬間に、解析解空間の大部分が排除される1つの主固有欠陥を有する。相関解析が選択しない変数から最良の解が構成される場合、前記変数選択法により、統計的方法は、常に最良の又は最適な解を発見しない。
【0005】
また、各独立変数に適用できる独立変数の変換及び操作の数は依然として無限数に近い。更に、交互作用項又は2つの独立変数の積である項を識別しなければならない。これは、個々にではなく互いに組み合わされてこれらの項が複雑な作用を表すためである。この問題は、従属変数の変化を正確かつ同時に記述するため、独立変数に対する正しい変換、操作及び交互作用を見い出すことである。
【0006】
従って、電子商取引の企業間及び企業と消費者間の市場取引に対し、統計(S)モデル及びニューラルネットワーク(NN)モデルを適用して、独立変数に対して、データの変換、操作及び交互作用を決定する方法を最適化し、従属変数の変動を正確に表現する解析法が必要である。
【発明の開示】
【発明が解決しようとする課題】
【0007】
従って、本発明は、予測用モデルを展開する進化論的方法を提供することを目的とする。
【0008】
また、本発明は、大量の操作データ又は人口統計学的データを解析できる前記方法を提供し、精密かつ最適な予測用モデルを構築することを目的とする。
【0009】
更に、本発明は、遺伝子上に統計的概念を位置付ける方法を提供することを目的とする。
【0010】
更に、本発明は、本発明の方法を実行する装置を提供することを目的とする。
【0011】
前記目的は、本発明による方法及び装置により達成される。
【課題を解決するための手段】
【0012】
本発明では、少なくとも1つの独立変数値に基づき、単一の従属変数値を予測するモデルを展開するコンピュータ実行法を提供する。この方法は、(a) 1つの従属変数値と少なくとも1つの独立変数値とを各々含む複数の観察値を有するデータ集合体を準備する過程と、(b) 可能性のある予測用モデルを各々含む染色体の初期世代をデータ集合体から形成する過程と、(c) 初期世代の各染色体に対して、量的な適応度測定値を決定する過程と、(d) 初期世代の多くの染色体を選択し、クローニング及び交叉法の少なくとも1により選択された初期世代の染色体を交叉させ、交叉された染色体を突然変異させることにより、染色体の次世代を形成する過程とを広く含む。過程(c)及び(d)を数多く反復して、精密な最適な結果を生ずる染色体の世代を形成できる。
【0013】
本発明の方法を実行する装置は、略説すれば、可能性のある予測用モデルを含む初期世代の各染色体を有するデータ集合体から、染色体の初期世代を形成する手段と、初期世代の各染色体に対して、量的な適応度の測定値を決定する手段と、多くの初期世代染色体を選択し、クローニング及び交叉法の少なくとも1により選択される初期世代の染色体を交叉させ、新規な染色体を突然変異させる手段とを備える。
【0014】
本発明の方法及び装置に付随する他の目的及び利点と同様に、以下の詳細な説明及び同一部分には同一の参照符号を付す添付の図面に本発明の方法及び装置を説明する。
【発明を実施するための最良の形態】
【0015】
前記のように、本発明は、1又は多数の独立変数値に基づき、単一の従属変数値を予測する予測用モデルを展開するコンピュータ実行法に関する。このコンピュータ実行法は、公知の適切なコンピュータを使用し、公知の適切な言語によりプログラム制御し、限定しないがウインドウズ98、ウインドウズNT、ウインドウズ2000、リナックス(Linux)及びサン・オーエス(Sun OS)のオペレーティングシステムにより実行できる。
【0016】
本発明の方法は、複数の観察値を含むトレーニングデータ集合体の作成から始まる。各観察値は、単一の従属変数値及び好ましくはあらゆる数の独立変数値を含む。トレーニングデータ集合体は、未加工のデータから形成される。トレーニングデータ集合体を作成する間、ビジネスルール及び標本化を適用して、トレーニングデータ集合体のデータ観察値の数を減少させてもよい。ビジネスルールは、データ集合体の観察値の状態を検定する論理文である。異なる変数の値を検定する1又は2以上の比較器からビジネスルールを構成してもよい。例えば論理和、論理積又は論理否定等のブール演算子によって、2又はそれ以上の比較器を結合できる。ビジネスルールを使用して、有効なビジネスルールを満足しない観察値を除外することによって、未加工のデータファイルの大きさを減少させる。トレーニングデータ集合体が形成されると、コンピュータ100に接続された記憶装置内若しくはコンピュータ100のデータベース内又はその両方内にトレーニングデータ集合体を記憶してもよい。その後、トレーニングデータ集合体を使用する初期世代染色体を形成する方法を開始する。
【0017】
本発明の方法は、世代と呼ばれる多くの染色体10を繰り返して評価することに基づく。1世代中の染色体10の数を固定し又は限定されたパターンに変更してもよい。例えば、固定された世代のシナリオでは、全世代が、第1の又は初期の世代と同一のサイズである。代わりに、可変世代のシナリオでは、比較的大きな世代サイズから開始して、所与の世代数にわたって目標サイズに減少させることができる。その後、全ての次世代に対して目標サイズの世代を使用する。この可変世代シナリオは、初期にコンピュータリソース(演算)をより必要とするが、大きな世代サイズでは、探索空間のより大きい部分を最初に探索し、小さい世代サイズを使用する場合より迅速に、解を識別できることがある。
【0018】
本発明は、最良の解を含む可能性のある探索空間の有望な全領域を探索する方法を構築することを目的とする。これは、従属変数値を最も良く予測するモデルに対して、トレーニングデータ集合体の観察値により表される領域を探索することを意味する。初期の染色体世代を形成するのに使用される方法は、満足なモデルを識別するのに要求される世代数に影響を与えることができる。従って、使用者は、初期世代を形成するのに使用すべき方法だけでなく世代サイズを指定できる。初期世代サイズは、入力媒介変数(パラメータ)に基づくことが好ましい。初期世代サイズ及び目標世代サイズの両方を指定できる。2つのサイズを等しくすることにより、全世代に対して固定数の染色体を使用する。
【0019】
本発明による好適な方法では、ランダム法又は分布法の何れかを使用して、初期世代の染色体10を形成できる。ランダム法は、各観察変数の断片(セグメント)12内の遺伝子の値を選択する無作為な方法を使用して各染色体10を形成する。同様の方法を使用して、無作為の選択に基づき観察変数、利用可能な演算子及び導入遺伝子を選択することによって、必要な数の交互作用変数断片14を形成できる。このように形成した染色体10は、異なる数の活性変数を有する。全ての染色体内では1又は2以上の変数が非活性とすることも可能である。
【0020】
分布法は、単一の変数モデルを含む染色体10を形成し、正の係数及び負の係数を含む各観察変数の2つの染色体10を形成する。分布法により、初期世代に全ての変数が確実に表れる。この方法は、トレーニングデータ集合体内の変数に対して少なくとも2倍の染色体数を有する世代を形成する。
【0021】
初期世代に形成される各染色体10は、予測用モデルの要素を含み、固定された長さを有することが好ましい。図1は、本発明による染色体10の構成を示す。図1から分かるように、各染色体10は、複数の観察された変数断片12を備え、各断片12は、トレーニングデータ集合体内の観察された変数を表す一群の遺伝子を含む。本発明の好適な実施の形態では、トレーニングデータ集合体内の各変数に対する可変遺伝子断片12は、各染色体10内に存在する。換言すると、観察される連続的な変数の断片12'と観察される区分(分類)変数断片12''とが存在する。また、各染色体10は、2つの観察される変数から誘導される変数を表す一群の遺伝子により各々形成される複数の交互作用変数の断片14を備えている。交互作用変数断片14の数は、モデルを展開する媒介変数として設定される。例えば、染色体毎に20の交互作用変数の断片があってもよい。
【0022】
更に、各染色体10は、切片遺伝子又は偏位遺伝子16を含む。複数の変数成分の合計がゼロのとき、切片又は偏位遺伝子16は組み込まれたモデル出力を指定する。切片又は偏位遺伝子16は、全ての交互作用変数の遺伝子断片14の後に染色体10内に配置される。切片又は偏位遺伝子16は、1の符号ビット、11の指数ビット及び52の仮数ビットを含む64ビットから成る。
【0023】
観察される連続的な各変数断片12'は、導入/排除遺伝子18、係数遺伝子20、最小外れ値(異常値)遺伝子22、最大外れ値(異常値)遺伝子24、変換遺伝子27及び順位付け遺伝子29を有する複数の遺伝子を含む。観察される各区分変数断片12''は、導入/排除遺伝子18、対比遺伝子26及び1又は2以上の係数遺伝子20を有する複数の遺伝子を含む。
【0024】
連続的な変数は、あらゆる数の数値を含むことができる変数である。連続的な変数の例は、次週の株価又は顧客の会計収支でもよい。データ集合体にみられる数値が区分切断部媒介変数を超える場合、変数は連続的なものとして分類される。区分変数は、データ集合体内の限られた数の固有値を有する変数である。2進変数は、2つの可能な値又は区分のみを有する特別な分類の種類である。区分切断部媒介変数は、区分変数に対する区分の最大数を指定する。例えばその数を1から32までの範囲とすることができる。
【0025】
導入/排除遺伝子18は、各モデルの構築に重要な役割を担う。導入/排除遺伝子18は、特有のモデルに対してオンに切り換えられる変数の数を制限する。このように、データ集合体が1000の変数を有する場合、各染色体は1000の変数についてデータを含むが、変数の特定数、例えば10〜20だけオンに切り換わるに過ぎないであろう。「0」は特定の観察される変数をオフに切り換えることを示し、「1」は特定の観察される変数をオンに切り換えることを示す1ビットを消費する導入/排除遺伝子の2進構造を利用して切換えが実行される。従って、特定の観察される変数の遺伝子断片12に対して、導入/排除遺伝子18は、その断片12により記述される変数が、組込まれるモデルに含まれるか否かを指示する。導入/排除遺伝子により、この方法は、各解空間内の変数の適切な部分集合体を決定する。
【0026】
係数遺伝子20は、変数断片により記述される観察された変数に対する係数値を含み、好ましくは64ビット等の複数ビットを有する。ビットに何等かの変化がある場合、即ちビットの1つが反転する場合、全てが反転する多数ビットからなるスーパービットが前記複数のビット内に存在する。これは、モデルの最適化を促進する。スーパービットは、64ビット内にいかなる多数の選択ビットを備えてもよい。係数遺伝子は、遺伝子に係数を組込むことにより、統計的な評価法の除去を促進する。
【0027】
トレーニングデータ集合体内で連続的な変数に対し観察される値は、最大値と最小値とにより限定される範囲にわたって変化する。変数に対する値範囲が大きい(最大値及び/又は最小値が中央値から大きく相違する)とき、少数の極値は、モデル展開に不均衡な影響を与えることがある。その場合、極端に高い値又は低い値を正しい方法で中央値に近い値に書き換えることにより、より有効なモデルを展開できる。この方法は、トリミングアウトライア(trimming outliers)と呼ばれる。これは、如何なる偏りもない自然の適合性を得るために実行される。外れ値遺伝子22及び24は、トレーニングデータ集合体の記録を清掃して、予測上の偏りを最少にできる。
【0028】
本発明の染色体形成法では、中央値と最大観察値との間の最大制約値と、中央値と最小観察値との間の最小制約値とが形成される。これらの制約値は、実際の範囲未満の目標範囲値を示す。制約範囲外の変数値は、最も精密な制約値を持つように書き換えられる。トリミング過程の結果として、制約値は、トリム領域内で観察される値に対して書き換えられた値になる。
【0029】
既存の範囲の値に比率を適用することにより各制約値を展開させて、トリミングを要する値を識別する。中央値と変数に対する観察最小値との差に最小トリム比率を適用して、トリミングすべき値の領域を決定する。同様の方法により、中央値と最大値との差に最大トリム率を適用する。
【0030】
図2は、At=最小トリム率×A、Bt=最大トリム率×Bである本発明に利用されるトリミングの概念を示す。
【0031】
要求される各モデルに対して指定される多くの精密ビットを有しかつ外れ値ビット数と称する媒介変数である2進数として、前記比率の分子及び分母の両方を形成する。トリム率の分母は、外れ値ビットの指定数を有する2進数の最大値に等しい。例えば、10ビットの精度は、10進フォーマットの1023に等しい。各トリム率の分子は、遺伝子的に誘導される。
【0032】
連続的な変数断片内の最大外れ値遺伝子24は、最大トリム率の分子を含む。最小外れ値遺伝子22は、最小トリム率に対する分子を含む。図3は、4つの外れ値ビットを有する最大トリムシナリオを示すダイアグラムである。このシナリオでは、最大外れ値遺伝子は5(2進形式の0101)であり、指定数の4の外れ値ビットを有する2進数の最大値は15(2進数は1111)である。従って、最大トリム率は、0101/1111(5/15)である。従って、中央値から観察最大値までの範囲の1/3が、最大外れ値遺伝子によりトリミングされる。
【0033】
連続的な変数の遺伝子断片の外れ値遺伝子22及び24は、適応値を決定するとき、トリミング実行値の範囲及び変数使用値の範囲を限定する。外れ値遺伝子22及び24は、2本鎖遺伝子として、連続的な各変数の染色体10内に表現される。遺伝子22及び24を表現するのに使用されるビット数は、あらゆる応用に対して変動可能である。起動時にビット数を限定して、染色体の全世代を通じて一定に維持し、即ち使用されるビット数は、染色体毎又は世代毎に変化しない。遺伝子22及び24を表すビットは、正しい2進表示を使用して処理される。区分変数ではなく、連続的な変数にだけ外れ値のトリミングを適用できる点に留意すべきである。
【0034】
本発明の方法では、使用者は外れ値ビット数を指定できるので、値の範囲を定めるのに使用されるユニット(単位)数を制御できる。ビット数が多いほど、より多くの単位及びより高精度のトリミングを与える。
【0035】
トリム法を制御する他の方法は、各外れ値ビットの突然変異の確率を指定することにより行われる。各確率は、特定のビットが突然変異する可能性を制御する。1.0にトリム率を設定することは、突然変異の結果として、反転されるべき全可能性にその全ビットを暴露することを意味する。一方、例えば0.01又は0.001の小さな値にトリム確率を設定するは、突然変異によりビットが反転される可能性が非常に低いことを表す。図4は、4つの外れ値ビットを有するシナリオに対して、確率が如何に指定されるかを示す。表示法に依存して、第4ビットの位置は、最上位ビットであり、過剰なトリミングを回避するために変更する場合でも、最大量だけ全体的な値を変更するものであることに留意する必要がある。
【0036】
区分として分類される変数に対して対比遺伝子26を使用して、区分変数に対して最適の対比を自動的に決定する。本発明の解析法に対し知的かつ数値的に区分変数を表示することによって、対比遺伝子は、区分変数を解析法に役立てる。前記のように、区分変数は、トレーニングデータ集合体内に限られた数の固有値を有し、固有値は、ある値を他の値と比較させる有意性がない。区分変数は、標準値と序数値との2つの種類に分割される。例えばある人の人種のような標準変数は順序がないが、序数変数は順序を有する。この遺伝子に関する表は、対比又は指標として知られたいかに多くの2進の変数又は標識を特定の区分変数から形成できるかを決定する。対比遺伝子により、別の方法では使用できない情報が使用可能となる。
【0037】
本発明の方法により、区分切断部媒介変数を通じて、区分変数対連続的な変数として変数を分類するものを使用者が制御できる。本発明の方法は、指定数のビットを有する各変数区分に2進数を割当てる。この符号化方式によって、本発明の装置は、符号化に使用されるビット数に数が等しい対比媒介変数と称するサブグループを形成できる。最大対比媒介変数と称する媒介変数値を指定することによって、使用者は、各区分に割当てられる2進符号内の2進符号として形成可能な対比媒介変数の最大数を指定する。
【0038】
前記から分かるように、本発明の方法は、一種の変数として区分変数に対する対比値を使用して、予測用モデルに有効な対比値(変数値)を識別する。最大対比の装置初期設定値は、統計的有意性の解析に基づいて展開され、これらの値は、トレーニングデータ集合体内の観察値の数と共に増大するが、対比遺伝子の有用性を変更せずに前記値を書き換えることができる。
【0039】
変数遺伝子断片内の対比遺伝子26は、区分切断部媒介変数により指定される要求されるモデルに許される最大区分に数が等しい対比ビット列から構成される。変数に対して実際に使用される対比ビット列の数は、その変数に対する区分の数に依存する。
【0040】
例えば、10の区分切断部及び4の最大対比を有する要求されるモデルは、各区分変数遺伝子断片内の4ビットの10列から構成される対比遺伝子を有するであろう。この種のモデルを図5に示す。6値(複数の区分)を有する区分変数では、最初の6つの対比列だけが関連する変数断片に使用される。
【0041】
変換遺伝子27を使用して特定の観察変数に関連する分布から非対称性及び尖りを除去し、データ分布を変形して最大の有用性を与えることができる。変換遺伝子27は、例えば式x1=xYのように、歪むデータ曲線を定義する値Yを決定する。Y値を1に決定する場合、変換を要しない。Y値が1以外の何れかの場合、変換が適切である。ゼロの値では、自然対数が実行される。Y値を決定するために、Yの可能性のある範囲(PR)と所望の精度とを最初に決定する。例えば、所望の精度が10である場合、最大2進値は1023である。次に、次の過程はべき変換の値を決定する。Yを決定するために、染色体の値にYの範囲を掛け合わせる。続いて、得られた数を最大2進値で割って、中間値を決定する。Yに対する可能最小値を中間値に加えてY値を決定する。このように、染色体の値が750、Yの可能な範囲が10、Yの最小値が−5、最大2進値が1023の場合、
Y=10*750/1023−5=7.5−5=2.5
である。
【0042】
本発明では、変換遺伝子に対する条件及び基礎となる前提は、各連続的(非区分)変数が変換遺伝子を有することである。変換遺伝子を適用するために、最小許容可能なべき変換、最大許容可能なべき変換及びべき変換範囲を分割するビット数の情報が存在しなければならない。更に、1のべき変換はそれ自身等しいため、オン/オフ動作のスイッチを必要としない。全ての変換遺伝子は、1に初期化されるがそれに限定されない。
【0043】
順位付け遺伝子29は、独立変数の予測性向上を促進し、連続的な変数にのみ適用する。この遺伝子は、配列される変数のランキングを助長しかつ固定された幅ランキングと可変幅ランキングとの生成を助長する。順位付け遺伝子は、使用者が命令した幅を有する多くの固定幅群に変数分布を分割する。順位付け遺伝子は、例えば100ビットの多数の精密ビットと、例えば4ビットの多数の連続ビットとを含み、その範囲内の各群の境界を示す。見出される境界の数は、変数分布に順位付けされる変数幅群の数を決定する。順位付け遺伝子の能力は、異なる分布を形成することにより、使用不能な連続分布を有用な又は予測可能な情報に切り換えることができることである。
【0044】
各交互作用遺伝子の断片14は、トレーニングデータ集合体に認められる2つの観察変数から誘導される交互作用変数を表す。観察される2つの変数に適用される6の演算子の1を使用して、交互作用項の値を形成できる。各交互作用の遺伝子断片14は、導入/排除遺伝子28、係数遺伝子30、第1の変数遺伝子32、演算子遺伝子34及び第2の変数遺伝子36を含む複数の遺伝子から成る。
【0045】
交互作用変数の断片14内の導入/排除遺伝子28は、観察変数の断片12と同一の方法により使用される。導入/排除遺伝子28は、交互作用遺伝子の断片14により記述される交互作用変数が染色体モデルに含まれるか否かを示す。組み込まれたモデルに含まれる前記交互作用変数は、オン状態に設定される導入/排除遺伝子を有する。
【0046】
係数遺伝子30は、交互作用遺伝子の断片14により記述される交互作用変数の係数値を含む。
【0047】
第1の変数遺伝子32は、交互作用変数値の誘導に使用されるトレーニングデータ集合体の第1の2つの観察される変数を識別する。
【0048】
第2の変数遺伝子36は、交互作用変数値の誘導に使用されるトレーニングデータ集合体の第2の2つの観察される変数を識別する。
【0049】
本発明の好適な実施の形態では、第1及び第2の変数遺伝子32及び36に使用される第1及び第2の変数は、トレーニングデータ集合体から無作為に選択される。
【0050】
演算子遺伝子34は、2つの観察される変数から交互作用値を誘導するのに使用される演算子を識別する。演算子は、加算(2つの観察される変数の合計値)、乗算(2つの観察される変数の積値)、除算(1の変数を第2の変数で割った値)、減算(2つの観察される値間の数的な差を表す数値)、差の2乗(2つの観察される変数間の差の二乗値)、又は絶対差(2つの観察される変数間の絶対差であり常に正又はゼロ)とすることができる。
【0051】
観察される変数が絶対的であるとき、演算子は、各観察される変数の区分/値の率指標に適用される。
【0052】
以下の観察される区分変数が交互作用変数(IA Var02)を誘導するのに使用されると仮定する。
【0053】
変数 区分/率
Figure 2004530967
【0054】
Var01が値10n、Var04が値SWを有する場合、IA Var02=(6)*(2)=12である。遺伝子断片では、次に本結果をIA Var02の係数遺伝子の係数値に掛ける。
【0055】
各染色体10の終端に付加される交互作用遺伝子の断片14の数は、固定された媒介変数により決定され、又はトレーニングデータ集合体の変数の数の二乗根等の予め決められた規則を適用することにより決定される。
【0056】
初期世代に形成された染色体10は、統計モデルに使用されるデータを含むだけでなく統計モデルを組み込む方法を示す。従って、初期世代の各染色体10が予測値としてどれぐらい十分に作用するかを決定するのに好ましいものになる。
【0057】
図6に示すように、コンピュータ100を使用して、初期世代の各染色体10の能力を評価しイベント又はモデルを予測する。このために、コンピュータ100は、未加工のデータを受信するデータパイプモジュール102と、データベース104とを含む。データベース104は、ユーザインタフェース部106(使用者毎に1つのユーザインタフェース)を使用して設定された全モデル媒介変数を加えた所要モデルに対する全データ集合体を含む。データベース104は、記憶装置(図示せず)を備えるか又は記憶装置に接続される。トレーニングデータ集合体、メタデータ、確認データ集合体、所要モデルの媒介変数及び最良のモデル要素がデータベース104内に記憶される。更に、コンピュータ100には、少なくとも1つ好ましくは複数のモデラモジュール108と、スケジューラモジュール110と、複数の適応度評価器112とが設けられる。モデル展開の間に、割り当てられたモデラモジュール108及び適応度評価器112は、データベース104から必要なデータを得て、データベース104に最良のモデルの要素を記憶する。例えばリフトチャート及び分類表の記録を準備し又は最良のモデルの要素を表示するとき、ユーザインタフェース部106は、データベース104からデータを得る。
【0058】
各モデラモジュール108は、ユーザインタフェース部106からのモデル要求に応答して、予測用モデルを展開する。展開用所要モデルを使用者が入力するとき、装置は未使用のモデラモジュール108に作業を割り当てる。あらゆる所与の時間で送信できるモデルの要求の予想数に基づいて、装置(ユーザインターフェース106)はあらゆる数のモデラモジュール108を備えることができる。指定数の世代が形成されかつ評価されるまで、割り当てられたモデラモジュール108は、所要のモデル専用に維持される。使用者が連続的に実行を指定する場合、使用者が手動でモデルの展開を停止するまで、専用のモデラモジュール108は所要モデルに専念する。各モデラモジュール108は、染色体10の継続する世代を生成することによって、本発明の方法を実行する。モデラモジュール108はスケジューラモジュール110に各世代を送信し、スケジューラモジュール110は適応度評価器112に各世代を送信し、その後、次世代を形成するのに使用される結果を受信する。
【0059】
スケジューラモジュール110は、全ての作動するモデラ108からの評価要求を受信する。各要求は、所要のモデルに対する染色体の世代を含む。前記のように、各染色体10は、トレーニングデータ集合体内の従属変数値をモデルがどれくらい適切に予測するかを決定するのに評価すべき予測用モデル要素を含む(適応値評価と称する方法)。スケジューラモジュール110は、全てのモデラ108により形成される染色体の世代の評価を調整する。スケジューラモジュール110は、未使用の適応度評価器112に各染色体を送信する。適応度評価器112は、使用者指定適応度測定基準の値を展開する。使用者により選択される適応度測定基準は、区分従属変数と共に使用可能に正確に分類される百分率、連続従属変数と共に使用可能な直線相関又は世代の最上変位値だけに基づく適応度測定値である上部リフトでもよい。適応度評価器112は、スケジューラモジュール110に適応度測定基準を返送して、
世代の全染色体に対する値も受信するとき、スケジューラモジュール110は、所要のモデラ108にその情報を返送する。
【0060】
各適応度評価器112は、関連するトレーニングデータ集合体の各観察値に染色体モデルを適用して、従属変数の予測値を決定する。適応度評価は、各観察の予測値と実際値とを比較して、トレーニングデータ集合体の全観察値にわたって、予測値と実際値とがどれくらいよく一致するかを表す単一の適応度測定基準を展開する。本発明の装置は、あらゆる数の適応度評価器112を備えることができる。染色体の評価を完了した後に、適応度評価器112は、適応度測定基準をスケジューラモジュール110に送信して、同一の世代からの他の染色体又は他の所要モデルを評価するのに利用可能となる。
【0061】
初期世代内の染色体10を評価し適応度測定基準を割り当てた後に、コンピュータ100内で割り当てられたモデラモジュール108は、遺伝的アルゴリズムを使用して、染色体の次世代を生成する。遺伝的アルゴリズムは、選択、交叉及び突然変異の過程を含む。図8は、初期世代及び複数の継続世代を形成する本発明の方法を示す。
【0062】
選択過程は、染色体の次世代を形成するのに使用される初期世代の染色体10を識別する。染色体の選択は無作為であり回転式抽籤器に類似する。この選択は基本的にランダム法であるが、初期世代の各染色体10は、選択に対して同等の可能性を有しない。適応度評価によって、割り当てられた適応度測定値に比例して、選択の可能性を増大させる加重値により、初期世代の各染色体10は抽選で表される。
【0063】
交叉の目的は、次世代候補の染色体を生成することである。選択された媒介変数は、各世代の染色体の目標数及びウイルス率を指定する。ランダム法により形成される各世代では、ウイルス率は、染色体数を決定する(目標数×ウイルス率)。ウイルス率により導出される染色体は、選択、交叉又は適応度の何等かの考察の結果ではない。
【0064】
クローニング又は純粋な(標準の)交叉の2つの方法の1つに、増殖のために選択される染色体10を利用できる。使用者が交叉率を設定して、各種の交叉に使用される割合を制御できる。例えば、70%の交叉率は、選択された染色体の70%を使用して交叉法により子を形成し、残りの30%を単純なクローニングに使用することを意味する。クローニング法は、現世代から選択された染色体の複製である新世代の染色体を形成する。
【0065】
交叉法は、図7に示すように、2つの選択された親染色体64及び66に基づいて、次世代の2つの子染色体60及び62を形成する。前記方法は、各親からの遺伝子を使用して子染色体を各々生成する。
【0066】
使用者は、多くの交叉点70を指定するか又は均一な交叉法を選択することにより交叉法を制御する。多くの交叉点70を指定するとき、本発明による装置は、染色体の無作為位置に各交叉点を配置する。交叉点70は、子を形成するのに交換される遺伝子の区画を限定する。図7は、2つの交叉点により如何に子が形成されるかを示す。
【0067】
交叉法は、第1の交叉点までの遺伝子を一方の親から取り出し、第1と第2との交叉点間の遺伝子を他の親から取り出すことにより子を形成する。第2と第3との交叉点間の遺伝子を第1の親から取り出す。交互に取り出すこの方法は、あらゆる数の交叉点に対して継続できる。
【0068】
一様交叉法は、染色体の各可能な点を交叉点として使用する。遺伝子の区画を交互に使用する代わりに、本装置は、他の親からの遺伝子を次の区画に使用するか否かを決定する無作為の方法を使用する。多数の遺伝子を有する染色体に対して、交叉(他の親からの遺伝子を使用する)は、選ぶに値する交叉点の半分で発生する。
【0069】
交叉点は、変数遺伝子断片のあらゆる点に発生可能である。あらゆる変数に対して、子は、一方の親からの導入/排除遺伝子を含み、他方の親からの係数遺伝子を含むことができる。子染色体内の活性化変数(交叉により生成される)は、一方の両親内で活性でなければならないが、活性化変数の全体設定は、どちらか親とも相違する可能性がある。
【0070】
増殖(クローニング及び交叉)により生成される染色体は、次世代候補と認められ突然変異を受ける。突然変異は、突然変異率として入力される確率値に基づいて、候補染色体の選択ビットを反転させる無作為の方法である。突然変異の間に、染色体内でビットが無作為に反転され、確実に世代の多様化が促進される。比較的小さい外れ値ビット率を割当てることにより、外れ値遺伝子の選択ビットを突然変異から保護できる点に留意すべきである。
【0071】
前記のように、ウイルス率は、ランダム法により生成される染色体の数を決定する。本装置は、ランダム法を使用して、所望の個体サイズに適用されるウイルス率と等しい数の染色体を生成する。世代中の残部の染色体は、交叉により形成される。ウイルス率により導出される染色体は、適応度測定値又は現行世代の他の特性に無関係に形成されるので、探索領域の新領域を探索する新世代に多様性を導入する傾向がある。ウイルス率の増大は、新領域を探索する傾向がある反面、ウイルス率の減少は、既に達成された最良モデルを微調整する傾向がある。
【0072】
次世代が形成された後に、次世代の各染色体は、前記の通り適応度を評価される。適応度評価に続いて、前記のように染色体の次世代に遺伝的アルゴリズムを適用して、染色体の新世代が生成される。染色体の形成、評価及び次世代染色体の形成の反復法は、コンピュータ100の一部の範囲内で、使用者が前記方法を停止するまで継続する。
【0073】
本発明による方法の長所の1つは、染色体の各世代に見られる改善である。本発明による方法の他の長所は、人的な誤り(ヒューマンエラー)を顕著に減少し、予測用モデルを生成する能力を向上することである。更に本発明による方法の他の長所は、多種多様なビジネス環境に使用して、広範囲に役立つモデルを予測できることである。更に本発明の方法による他の長所は、各染色体の生成法に使用する遺伝子マッピングが、変数の正しい組合せを選択しない確率をほぼゼロに低減することである。
【0074】
本発明による予測用モデルを展開する方法及び装置により、前記目的、手段及び長所を十分に満足することは明らかである。本発明は、特定の実施の形態の状況について記載されたが、他の代替、変更及び変形は、前記詳細な説明から当業者に明白であろう。従って、広範な特許請求の範囲内に包含される代替、変更及び変形を含むことを意図する。
【図面の簡単な説明】
【0075】
【図1】本発明の方法により形成される染色体の構造を示す概略図
【図2】本発明の方法に使用されるトリム(刈り込み)法を示す概略図
【図3】4つの外れ値ビットを使用して、最大トリム範囲を示すグラフ
【図4】4つの外れ値ビットを有するシナリオの外れ値ビット確率を示すグラフ
【図5】4つの対比部を有する対比遺伝子及び10の分割切断部の概略図
【図6】本発明の方法を実行するコンピュータ装置の概略図
【図7】本発明の方法に使用する交叉法の概略図
【図8】本発明の方法を示すフローチャート
【符号の説明】
【0076】
(10)・・染色体、 (12)・・観察された変数断片、 (12')・・観察された連続的な変数の断片(観察された変数断片)、 (12'')・・観察された区分変数断片(観察された変数断片)、 (14)・・交互作用断片、 (16)・・切片遺伝子、 (18)・・導入/排除遺伝子、 (20)・・係数遺伝子、 (22)・・最小外れ値遺伝子、 (24)・・最大外れ値遺伝子、 (26)・・対比遺伝子、 (27)・・変換遺伝子、 (28)・・導入/排除遺伝子、 (29)・・順位付け遺伝子、 (30)・・係数遺伝子、 (32)・・第1の変数遺伝子、 (34)・・第2の変数遺伝子、 (36)・・演算子遺伝子、 (100)・・コンピュータ、 (106)・・ユーザインタフェースモジュール、 (108)・・モデラモジュール、 (110)・・スケジューラモジュール、 (112)・・適応度評価器、

Claims (48)

  1. 少なくとも1つの独立変数値に基づいて、単一の従属変数値を予測するモデルを展開するコンピュータ実行法において、
    (a) 従属変数に対する値と少なくと1つの独立変数に対する値とを各々有する複数の観察値を含むデータ集合体を準備する過程と、
    (b) 予測用モデルを各々含む染色体の初期世代をデータ集合体から生成する過程と、
    (c) 初期世代の各染色体の量的な適応度測定値を決定する過程と、
    (d) 多くの染色体を初期世代から選択し、クローニング及び交叉技術の少なくとも1により選択された染色体を交叉し、かつ染色体を突然変異させることにより、染色体の次世代を生成する過程とを含むことを特徴とする方法。
  2. (e) 次世代の染色体の新規な適応度測定値を決定する過程と、(f) 選択、交叉及び突然変異を繰り返して、染色体の継続世代を生成する過程とを含む請求項1に記載の方法。
  3. 染色体の継続世代を生成する過程(e)及び(f)を繰り返して、染色体の他の継続世代を生成する請求項2に記載の方法。
  4. 初期世代の染色体を生成する過程は、ランダム法を使用して実行される請求項1に記載の方法。
  5. 初期世代の染色体を生成する過程は、分布法を使用して実行される請求項1に記載の方法。
  6. 染色体を生成する過程は、複数の遺伝子により各々形成される複数の観察された変数断片と、複数の遺伝子により各々形成される複数の交互作用断片と、複数の交互作用断片の後に配置される切片遺伝子とを有する染色体を形成する過程を含む請求項1に記載の方法。
  7. 染色体の交互作用断片の数を固定した媒介変数に限定し、又は所定の規則を適用して交互作用の遺伝子断片の数を決定する過程を含む請求項6に記載の方法。
  8. 染色体を生成する過程は、導入/排除遺伝子、係数遺伝子、最小外れ値遺伝子、最大外れ値遺伝子、変換遺伝子及び順位付け遺伝子を含むように、少なくとも1つの観察された連続的な変数の遺伝子断片を形成する過程を含む請求項6に記載の方法。
  9. 複数の観察された連続的な変数の遺伝子断片を形成する過程と、観察された連続的な変数断片の特定の1の変数が、組込まれたモデルに含まれるか否かを導入/排除遺伝子を使用して示す過程とを含む請求項8に記載の方法。
  10. 観察された変数断片の特定の1により記述される観察された連続的な変数の係数値を識別する係数遺伝子を使用する過程を含む請求項9に記載の方法。
  11. 複数の2進ビットから係数遺伝子を形成し、特定の状態で全ビットが反転するスーパービットとして、多くの2進ビットを指定する過程を含む請求項10に記載の方法。
  12. 観察された連続的な各変数断片の外れ値遺伝子を使用して、観察された連続的な変数断片内の観察値の分布範囲をトリミングする過程を含む請求項10に記載の方法。
  13. 2本鎖形式の外れ値遺伝子を示す過程を含む請求項12に記載の方法。
  14. 変換遺伝子を使用して、観察された連続的な変数断片内の観察された変数の分布範囲から非対称性及び尖りを除去し、可能な限り分布範囲を正規分布に近付けるように変換させる過程を含む請求項12に記載の方法。
  15. 染色体を生成する過程は、導入/排除遺伝子、対比遺伝子及び少なくとも1つの係数遺伝子から成る少なくとも1つの観察された区分変数断片を形成する過程を含む請求項6に記載の方法。
  16. 複数の観察された区分変数断片を形成する過程と、導入/排除遺伝子を使用して、観察された区分変数の断片の特定の1つの変数が、組込まれたモデルに含まれるか否かを示す過程とを含む請求項15に記載の方法。
  17. 係数遺伝子を使用して、観察された変数断片の特定の1つにより記述される観察された区分変数の係数値を識別する過程を含む請求項16に記載の方法。
  18. 複数の2進ビットから係数遺伝子を形成する過程と、特定の状態でビットの全てが反転するスーパービットとして多くの2進ビットを指定する過程とを含む請求項17に記載の方法。
  19. 要求されるモデルに許される区分の最大数を示す対比遺伝子を使用する過程を含む請求項15に記載の方法。
  20. 染色体を生成する過程は、導入/排除遺伝子、係数遺伝子、第1の変数遺伝子、第2の変数遺伝子及び演算子遺伝子を含む各交互作用断片を形成する過程を含む請求項6に記載の方法。
  21. 導入/排除遺伝子を使用して、特定の交互作用断片により記述される特定の交互作用変数がモデル内に含まれるか否かを示す過程を含む請求項20に記載の方法。
  22. 係数遺伝子を使用して、特定の交互作用断片により記述される交互作用変数の係数値を示す過程を含む請求項21に記載の方法。
  23. 第1の変数遺伝子を使用して、交互作用変数値の誘導に使用される第1の観察された変数を識別する過程を含む請求項22に記載の方法。
  24. 演算子遺伝子を使用して、2つの観察された変数から交互作用値の誘導に使用される演算子を選択する請求項23に記載の方法。
  25. 演算子は、加算、乗算、減算、差の二乗、除算及び絶対差からなる群から選択される請求項24に記載の方法。
  26. 第2の変数遺伝子を使用して、交互作用変数値の誘導に使用される観察された第2の2つの変数を識別する請求項24に記載の方法。
  27. 各々の交互作用断片の第1及び第2の変数遺伝子を選択する過程を含む請求項26に記載の方法。
  28. 適応度測定値を決定する過程は、1つのスケジューラモジュール及び複数の適応度評価器モジュールを準備する過程と、スケジューラモジュールを使用して、世代の染色体の1つを評価器モジュールの利用可能な1つに送出して計測する過程とを含む請求項1に記載の方法。
  29. 適応度測定値を決定する過程は、適応度測定基準を選択する過程と、適応度測定基準を使用する1つの染色体の適応度率を決定する過程とを含む請求項28に記載の方法。
  30. 少なくとも1つのモデラモジュールを準備する過程と、各染色体の適応度測定値をスケジューラモジュール内に蓄積する過程と、スケジューラモジュールから少なくとも1つのモデラモジュールに蓄積された適応度測定値を送信する過程とを含む請求項28に記載の方法。
  31. 少なくとも1つのモデラモジュールを使用して新世代の染色体を生成する過程を実行する過程を含む請求項30に記載の方法。
  32. 世代の各染色体に加重する過程を含み、選択過程は、無作為に重みを付けた染色体を選択する過程を含む請求項31に記載の方法。
  33. 交叉率及び複数の交叉点を選択する過程と、選択された交叉率及び複数の交叉点を使用する2つの選択された親染色体から2つの子染色体を形成する過程とを含む請求項32に記載の方法。
  34. 予測用モデルを含む初期世代内の各染色体を有するデータ集合体から染色体の初期世代を生成する手段と、
    初期世代の各染色体の量的な適応度測定値を決定する手段と、
    多くの初期世代染色体を選択し、少なくとも1つのクローニング及び純粋な(標準の)交叉法により選択された初期世代染色体を交叉し、かつ交叉した染色体を染色体の次世代に突然変異させる手段とを備えることを特徴とする予測用モデルを構築する装置。
  35. コンピュータと、コンピュータ内に少なくとも1つのモデラモジュールを有する初期世代の染色体を生成する手段とを備える請求項34に記載の装置。
  36. コンピュータ内に設けられるスケジューラモジュールと、コンピュータ内に設けられかつ量的な適応度測定値を決定する手段を形成する少なくとも1つの適応度評価器とを備える請求項35に記載の装置。
  37. コンピュータ内に設けられた複数の適応度評価器を備え、スケジューラモジュールは、複数の適応度評価器の何れにより、染色体の特定の1つの適応度測定値を決定すべきかを決定する請求項36に記載の装置。
  38. 少なくとも1つのモデラモジュールは、多くの初期世代染色体を選択し、選択された初期世代染色体を交叉させ、かつ交叉した染色体を突然変異させる手段を形成する請求項35に記載の装置。
  39. ユーザインタフェースモジュールを備える請求項35に記載の装置。
  40. データ集合体及び最良の予測用モデルを記憶するコンピュータ内のデータベースと、データベースと連絡する少なくとも1つのモデラモジュールとを備える請求項35に記載の装置。
  41. 観察された複数の変数断片と、複数の交互作用断片と、切片遺伝子とを備えることを特徴とするモデルを予測する染色体。
  42. 複数の交互作用断片の後に染色体上に配置される切片遺伝子を備える請求項41に記載の染色体。
  43. 複数の交互作用断片は、所定の規則により又は所定の値に数を制限する請求項41に記載の染色体。
  44. 観察された変数は、導入/排除遺伝子、係数遺伝子、最小外れ値遺伝子、最大外れ値遺伝子、変換遺伝子及び順位付け遺伝子を含む少なくとも1つの観察された連続的な変数断片を含む請求項41に記載の染色体。
  45. 外れ値遺伝子の各々は、2本鎖の形式で表される請求項44に記載の染色体。
  46. 観察された変数断片は、導入/排除遺伝子、対比遺伝子及び少なくとも1つの係数遺伝子を含む少なくとも1つの観察された区分変数の断片を含む請求項41に記載の染色体。
  47. 交互作用断片の各々は、導入/排除遺伝子、係数遺伝子、第1の変数、第2の変数及び演算子を含む請求項41に記載の染色体。
  48. 第1及び第2の変数のデータ集合体の多くの変数から無作為に選択する請求項47に記載の染色体。
JP2002561698A 2001-01-19 2001-12-13 予測用モデルを展開する方法及び装置 Pending JP2004530967A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US26302401P 2001-01-19 2001-01-19
US09/863,175 US7043461B2 (en) 2001-01-19 2001-05-23 Process and system for developing a predictive model
PCT/US2001/047480 WO2002061595A1 (en) 2001-01-19 2001-12-13 Process and system for developing a predictive model

Publications (1)

Publication Number Publication Date
JP2004530967A true JP2004530967A (ja) 2004-10-07

Family

ID=26949615

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002561698A Pending JP2004530967A (ja) 2001-01-19 2001-12-13 予測用モデルを展開する方法及び装置

Country Status (5)

Country Link
US (1) US7043461B2 (ja)
EP (1) EP1352331A4 (ja)
JP (1) JP2004530967A (ja)
CA (1) CA2436352C (ja)
WO (1) WO2002061595A1 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018116714A (ja) * 2013-02-20 2018-07-26 ハートフォード スチーム ボイラー インスペクション アンド インシュアランス カンパニー コンピュータ実装方法、コンピュータシステム及びコンピュータ装置
US10557840B2 (en) 2011-08-19 2020-02-11 Hartford Steam Boiler Inspection And Insurance Company System and method for performing industrial processes across facilities
US11288602B2 (en) 2019-09-18 2022-03-29 Hartford Steam Boiler Inspection And Insurance Company Computer-based systems, computing components and computing objects configured to implement dynamic outlier bias reduction in machine learning models
US11328177B2 (en) 2019-09-18 2022-05-10 Hartford Steam Boiler Inspection And Insurance Company Computer-based systems, computing components and computing objects configured to implement dynamic outlier bias reduction in machine learning models
US11334645B2 (en) 2011-08-19 2022-05-17 Hartford Steam Boiler Inspection And Insurance Company Dynamic outlier bias reduction system and method
US11550874B2 (en) 2014-04-11 2023-01-10 Hartford Steam Boiler Inspection And Insurance Company Future reliability prediction based on system operational and performance data modelling
US11615348B2 (en) 2019-09-18 2023-03-28 Hartford Steam Boiler Inspection And Insurance Company Computer-based systems, computing components and computing objects configured to implement dynamic outlier bias reduction in machine learning models
US11636292B2 (en) 2018-09-28 2023-04-25 Hartford Steam Boiler Inspection And Insurance Company Dynamic outlier bias reduction system and method

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040015381A1 (en) * 2002-01-09 2004-01-22 Johnson Christopher D. Digital cockpit
WO2003079244A2 (en) * 2002-03-15 2003-09-25 Maz Laboratory An adaptive decision engine
US20040138936A1 (en) * 2003-01-09 2004-07-15 Johnson Christopher D. Performing what-if forecasts using a business information and decisioning control system
US20040138935A1 (en) * 2003-01-09 2004-07-15 Johnson Christopher D. Visualizing business analysis results
US20040138933A1 (en) * 2003-01-09 2004-07-15 Lacomb Christina A. Development of a model for integration into a business intelligence system
US20040138932A1 (en) * 2003-01-09 2004-07-15 Johnson Christopher D. Generating business analysis results in advance of a request for the results
US7676390B2 (en) 2003-09-04 2010-03-09 General Electric Company Techniques for performing business analysis based on incomplete and/or stage-based data
US8170841B2 (en) 2004-04-16 2012-05-01 Knowledgebase Marketing, Inc. Predictive model validation
US7725300B2 (en) * 2004-04-16 2010-05-25 Fortelligent, Inc. Target profiling in predictive modeling
WO2005106656A2 (en) * 2004-04-16 2005-11-10 Fortelligent, Inc. Predictive modeling
US7933762B2 (en) * 2004-04-16 2011-04-26 Fortelligent, Inc. Predictive model generation
US7730003B2 (en) * 2004-04-16 2010-06-01 Fortelligent, Inc. Predictive model augmentation by variable transformation
US7562058B2 (en) * 2004-04-16 2009-07-14 Fortelligent, Inc. Predictive model management using a re-entrant process
US20050234761A1 (en) * 2004-04-16 2005-10-20 Pinto Stephen K Predictive model development
US8165853B2 (en) * 2004-04-16 2012-04-24 Knowledgebase Marketing, Inc. Dimension reduction in predictive model development
US7499897B2 (en) * 2004-04-16 2009-03-03 Fortelligent, Inc. Predictive model variable management
US7555405B2 (en) * 2004-09-30 2009-06-30 John Antanies Computerized method for creating a CUSUM chart for data analysis
US8195426B1 (en) 2004-09-30 2012-06-05 John Antanies Data analysis systems and related methods
US7957932B1 (en) 2004-09-30 2011-06-07 John Antanies Data analysis systems and related methods
US7283928B2 (en) * 2004-09-30 2007-10-16 John Antanies Computerized method and software for data analysis
US20080015891A1 (en) * 2006-07-12 2008-01-17 Medai, Inc. Method and System to Assess an Acute and Chronic Disease Impact Index
US8364614B2 (en) * 2008-01-08 2013-01-29 General Electric Company Method for building predictive models with incomplete data
KR101167247B1 (ko) * 2008-01-28 2012-07-23 삼성전자주식회사 유사 사용자 그룹의 적응적 갱신 방법 및 그 장치
US8374588B2 (en) 2008-06-02 2013-02-12 Mocapay, Inc. Method and system for sending marketing messages to mobile-device users from a mobile-commerce platform
US8296257B1 (en) 2009-04-08 2012-10-23 Google Inc. Comparing models
US8405996B2 (en) * 2009-06-30 2013-03-26 General Electric Company Article including thermal interface element and method of preparation
EP2426615A1 (en) * 2010-08-06 2012-03-07 Roche Diagnostics GmbH Evaluation device for assisting in the assessment of colorectal cancer
US10468122B2 (en) * 2012-06-21 2019-11-05 International Business Machines Corporation Exact haplotype reconstruction of F2 populations
US10176293B2 (en) * 2012-10-02 2019-01-08 Roche Molecular Systems, Inc. Universal method to determine real-time PCR cycle threshold values
US20140136161A1 (en) * 2012-11-13 2014-05-15 International Business Machines Corporation Precise simulation of progeny derived from recombining parents
US10607139B2 (en) * 2015-09-23 2020-03-31 International Business Machines Corporation Candidate visualization techniques for use with genetic algorithms
US11151457B1 (en) 2017-08-03 2021-10-19 Castlight Health, Inc. Predictor generation genetic algorithm
US11461646B2 (en) * 2019-12-05 2022-10-04 Capital One Services, Llc Systems and methods for training machine learning models
WO2022182291A1 (en) * 2021-02-25 2022-09-01 National University Of Singapore Prediction function generator
CN116402625B (zh) * 2023-06-07 2023-08-29 平安科技(深圳)有限公司 客户评估方法、装置、计算机设备及存储介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5742738A (en) * 1988-05-20 1998-04-21 John R. Koza Simultaneous evolution of the architecture of a multi-part program to solve a problem using architecture altering operations
US5343554A (en) 1988-05-20 1994-08-30 John R. Koza Non-linear genetic process for data encoding and for solving problems using automatically defined functions
US5140530A (en) * 1989-03-28 1992-08-18 Honeywell Inc. Genetic algorithm synthesis of neural networks
WO1991011771A1 (en) * 1990-01-23 1991-08-08 Massachusetts Institute Of Technology Genetic algorithm technique for, e.g., designing neural networks
WO1991014990A1 (en) 1990-03-28 1991-10-03 Koza John R Non-linear genetic algorithms for solving problems by finding a fit composition of functions
US5390282A (en) 1992-06-16 1995-02-14 John R. Koza Process for problem solving using spontaneously emergent self-replicating and self-improving entities
DE19610849C1 (de) * 1996-03-19 1997-10-16 Siemens Ag Verfahren zur iterativen Ermittlung einer optimierten Netzarchitektur eines Neuronalen Netzes durch einen Rechner

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10557840B2 (en) 2011-08-19 2020-02-11 Hartford Steam Boiler Inspection And Insurance Company System and method for performing industrial processes across facilities
US11334645B2 (en) 2011-08-19 2022-05-17 Hartford Steam Boiler Inspection And Insurance Company Dynamic outlier bias reduction system and method
US11868425B2 (en) 2011-08-19 2024-01-09 Hartford Steam Boiler Inspection And Insurance Company Dynamic outlier bias reduction system and method
JP2018116714A (ja) * 2013-02-20 2018-07-26 ハートフォード スチーム ボイラー インスペクション アンド インシュアランス カンパニー コンピュータ実装方法、コンピュータシステム及びコンピュータ装置
US11550874B2 (en) 2014-04-11 2023-01-10 Hartford Steam Boiler Inspection And Insurance Company Future reliability prediction based on system operational and performance data modelling
US11636292B2 (en) 2018-09-28 2023-04-25 Hartford Steam Boiler Inspection And Insurance Company Dynamic outlier bias reduction system and method
US11803612B2 (en) 2018-09-28 2023-10-31 Hartford Steam Boiler Inspection And Insurance Company Systems and methods of dynamic outlier bias reduction in facility operating data
US11288602B2 (en) 2019-09-18 2022-03-29 Hartford Steam Boiler Inspection And Insurance Company Computer-based systems, computing components and computing objects configured to implement dynamic outlier bias reduction in machine learning models
US11328177B2 (en) 2019-09-18 2022-05-10 Hartford Steam Boiler Inspection And Insurance Company Computer-based systems, computing components and computing objects configured to implement dynamic outlier bias reduction in machine learning models
US11615348B2 (en) 2019-09-18 2023-03-28 Hartford Steam Boiler Inspection And Insurance Company Computer-based systems, computing components and computing objects configured to implement dynamic outlier bias reduction in machine learning models

Also Published As

Publication number Publication date
WO2002061595A8 (en) 2003-10-02
CA2436352C (en) 2009-11-17
US20030004903A1 (en) 2003-01-02
US7043461B2 (en) 2006-05-09
EP1352331A4 (en) 2008-06-25
WO2002061595A1 (en) 2002-08-08
EP1352331A1 (en) 2003-10-15
CA2436352A1 (en) 2002-08-08

Similar Documents

Publication Publication Date Title
JP2004530967A (ja) 予測用モデルを展開する方法及び装置
Erickson et al. Comparison of Gaussian process modeling software
CN111258767B (zh) 复杂系统仿真应用的云计算资源智能分配方法与装置
Vlasblom et al. Markov clustering versus affinity propagation for the partitioning of protein interaction graphs
Li et al. Analysis of computational approaches for motif discovery
CN109657805A (zh) 超参数确定方法、装置、电子设备及计算机可读介质
KR100724104B1 (ko) 멀티플 지지벡터장치를 사용하여 멀티플 데이터세트로부터의 지식발견 강화방법
EA003796B1 (ru) Способ (варианты) и устройство воспроизведения данных о сходстве объектов в многомерном пространстве
Murphy et al. Risky planning on probabilistic costmaps for path planning in outdoor environments
JP2020128962A (ja) 材料特性予測装置および材料特性予測方法
JP6791600B2 (ja) モータ励起信号検索方法及び電子機器
CN104679754B (zh) 用于数据预测的模型选择设备和方法
Moustapha et al. Multi-objective robust optimization using adaptive surrogate models for problems with mixed continuous-categorical parameters
CN111209930A (zh) 一种生成授信策略的方法、装置和电子设备
CN117236656B (zh) 工程项目的信息化管理方法及系统
US20070036441A1 (en) Monotonic classifier
JP2023057945A (ja) 最適化問題求解装置及び最適化問題求解方法
JP2020009122A (ja) 制御プログラム、制御方法及びシステム
JP7384999B2 (ja) 機械学習モデル決定システム及び機械学習モデル決定方法
CN111340276B (zh) 一种生成预测数据的方法及系统
Bry et al. Clusterwise elastic-net regression based on a combined information criterion
Zou et al. Decomposition-based Multi-objective Backtracking Search Algorithm for Personalized Recommendation
JP3452308B2 (ja) データ分析装置
CN117539520B (zh) 固件自适应升级方法、系统以及设备
Gaier et al. Feature space modeling through surrogate illumination

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060105

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20060405

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20060413

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060628

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070329

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070727

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070824

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20070928

A912 Removal of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20071012