JP7185853B2 - 探索装置、探索システム、探索方法およびプログラム - Google Patents
探索装置、探索システム、探索方法およびプログラム Download PDFInfo
- Publication number
- JP7185853B2 JP7185853B2 JP2020567728A JP2020567728A JP7185853B2 JP 7185853 B2 JP7185853 B2 JP 7185853B2 JP 2020567728 A JP2020567728 A JP 2020567728A JP 2020567728 A JP2020567728 A JP 2020567728A JP 7185853 B2 JP7185853 B2 JP 7185853B2
- Authority
- JP
- Japan
- Prior art keywords
- value
- parameter
- parameter values
- frequency
- values
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N99/00—Subject matter not provided for in other groups of this subclass
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Computational Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Probability & Statistics with Applications (AREA)
- Algebra (AREA)
- Evolutionary Biology (AREA)
- Databases & Information Systems (AREA)
- Operations Research (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Testing And Monitoring For Control Systems (AREA)
Description
対象事象(発生条件を探索する対象となっている事象)が発生する条件を探索する装置が、パラメータ値のサンプリングの確率分布など、探索の手掛かりとなる情報を予め得られていない場合であっても、対象事象が生じる状況を効率的に探索できることが好ましい。
図1は、実施形態に係る探索装置の機能構成を示す概略ブロック図である。図1に示すように、探索装置100は、表示部120と、操作入力部130と、記憶部180と、制御部190とを備える。記憶部180は、モデル記憶部181を備える。制御部190は、分布決定部191と、条件取得部192とを備える。条件取得部192は、係数設定部193と、サンプリング処理部194と、事象発生パラメータ値抽出部195とを備える。
探索装置100は、パラメータ値と、そのパラメータ値の場合に対象事象が生じている程度を示す数値情報とが組み合わされたセットを複数取得してもよい。探索装置100は、図13または図14等を参照しながら後述するような処理を実行することによって、対象事象が発生する状況(条件、以降、「発生条件」と称する)を探索する。数値情報は、例えば、発生した事象と、探索対象である対象事象とが類似している程度を示す情報である。探索装置100は、事象を示す情報を取得し、取得した該事象と対象事象とが類似している程度を算出してもよい。
シミュレーションモデルは、パラメータ値の入力を受けて、パラメータ値の場合に生じる事象(結果)を出力する。しかし、シミュレーションモデルは、逆演算、すなわち、事象(結果)の入力を受けてその結果となるパラメータ値(状況)を出力することはできないモデルであってよい。対象事象の発生条件を探索するために、探索装置100は、パラメータ値の生成と、生成したパラメータ値(状況)の場合に対象事象の発生の有無を確認する処理とを繰り返す。
本願の各実施形態では、サンプリングは、データベースに格納されている複数のパラメータ値から選ぶという処理、または、対象事象が生じている程度を示す数値と、関係性とに基づきパラメータ値を算出する処理のいずれかであってもよい。
探索装置100は、例えばパソコン(Personal Computer:PC)またはワークステーション(Workstation)等のコンピュータ(情報処理装置、計算装置)を用いて構成される。
操作入力部130は、例えばキーボードおよびマウスなどの入力デバイスを備え、ユーザ操作を受け付ける。例えば、操作入力部130は、発生条件(対象事象が発生する条件)の探索開始を指示するユーザ操作を受ける。
モデル記憶部181は、たとえば、パラメータ値と、そのパラメータ値の場合に対象事象が生じている程度を示す数値との間の関係性を示すモデルを記憶することができる。モデル記憶部181は、たとえば、パラメータ値と、そのパラメータ値の場合に対象事象が生じているか否かを示す情報との間の関係性を示すモデルを記憶してもよい。対象事象が生じているか否かを示す情報は、たとえば、対象事象が生じていることを示す情報、及び、対象事象が生じていないことを示す情報という2値であってもよい。
分布決定部191は、モデル記憶部181が記憶するモデルに入力するパラメータ値のサンプリングの分布を決定する。そして、分布決定部191は、サンプリングされたパラメータ値の入力に対するモデルの出力に基づいて、分布を更新する。
これにより、探索装置100は、この分布に基づいて、数値に応じたパラメータ値を算出する。
係数設定部193は、超曲面で示される分布に応じたサンプリングを行うための係数値(重み係数値)を設定する。
事象発生パラメータ値抽出部195は、サンプリングとして採用されたパラメータ値のうち、モデルに入力して対象事象の発生有りとされたパラメータ値を抽出する。事象発生パラメータ値抽出部195が抽出するパラメータ値は、対象事象が発生する条件を示す。
以下では、モデルのパラメータ(入力パラメータ)をXで示す。モデルのパラメータの個数は複数であってもよい。したがって、パラメータXは、式(1)のようにベクトルで示されていてもよい。
パラメータXの値の入力に対して、対象事象の発生の有無を示す値(または、対象事象の発生の程度を示す数値)を出力するモデルをF(X)で示す。モデルF(X)が、対象事象の発生の有無を示す値を出力する場合、モデルF(X)は、0または1の何れかの値をとる2値関数である。モデルF(X)の値「0」は、対象事象が発生しないことを示す。モデルF(X)の値「1」は、対象事象が発生することを示す。
分布決定部191は、関係性算出部の例に該当する。エネルギー関数は、パラメータ値と、そのパラメータ値の場合に対象事象が生じている程度を示す数値との関係性を示す情報の例に該当する。
また、エネルギー関数は、対象事象が生じる程度を示しているといえる。分布決定部191は、エネルギー関数を算出することで、対象事象が生じる程度を算出しているといえる。
分布決定部191は、パラメータXの値をモデルF(X)に入力して得られた複数のサンプリング点を超曲面で近似するようにエネルギー関数C(X)を設定する。分布決定部191が、パラメータ値とそのパラメータ値の場合に対象事象が生じている程度を示す数値との、複数のセットに対するエネルギー関数C(X)を求める方法として、例えば最小二乗法を用いるようにしてもよいが、この方法に限定されない。
分布決定部191がエネルギー関数C(X)を求める目的は、図2の例のように、対象事象が発生する数値の近傍で値が大きく、かつ、対象事象発生の有無の境界を含む裾野を有する確率密度に従いサンプリングを行うことである。
図2の場合と同じく、線L111は、モデルF(X)の例を示す。線L112は、エネルギー関数C(X)の例を示す。
図3の例で、エネルギー関数C(X)は、対象事象が発生するパラメータ値の近傍で値が大きく、かつ、対象事象発生の有無の境界を含む裾野を有している。条件取得部192が、このエネルギー関数C(X)に基づいてサンプリングを行うことで、対象事象が発生する領域および対象事象発生の有無の境界を含む領域で、他の領域と比較して、多数のサンプリングを行うことができる。これによって、以下の2つの効果を得られる。
条件取得部192が、対象事象が発生するか否かを分ける境界付近で比較的多数のサンプリングを行うことで境界の位置を特定できる。したがって、対象事象が発生する条件(状況)を境界の位置に基づき把握できることが期待される。
エネルギー関数C(X)の裾野が狭すぎる場合、境界付近では、エネルギー関数C(X)の値が急激に小さくなる。この結果、境界付近では条件取得部192によるパラメータ値のサンプリング数が少なくなる。この結果、条件取得部192が算出するパラメータ値が、対象事象が発生するパラメータ値に集中し、対象事象が発生する条件の探索が非効率的になってしまう。特に、対象事象が発生する条件と発生しない条件との境界の探索が非効率的になってしまう。
分布決定部191が、エネルギー関数C(X)の更新を繰り返すことで、対象事象が発生するパラメータ値の近傍でのサンプリング数が増加し、サンプリングデータに基づいて更新されるエネルギー関数C(X)が、適切な関数に更新されていくことが期待される。
対象事象が発生するパラメータ値が検出された場合、そのパラメータ値の近傍のパラメータ値は、対象事象が発生するパラメータ値と比較的類似した条件を示すと考えられる。この点で、検出されたパラメータ値が近傍におけるパラメータ値の場合に、対象事象が発生する可能性が比較的高い。したがって、探索装置100が、対象事象が発生するパラメータ値の近傍を探索することで、対象事象が発生するパラメータ値をさらに検出できる可能性が比較的高い。
エネルギー関数C(X)の初期設定で、分布決定部191が、エネルギー関数C(X)を予め定められた関数に設定するようにしてもよい。
図4のグラフG43で、図に向かって右側に、対象事象が発生するパラメータXの値(すなわち、「F(X)=1」となるXの値)が検出されている。このため、グラフG52の線L212で示されるように、エネルギー関数C(X)のピーク(極大点)が、図4のグラフG42の線L211で示されるエネルギー関数C(X)のピークよりも図に向かって右側にシフトしている。このことは、分布決定部191が、グラフG51でエネルギー関数C(X)のピークを図4のグラフG41のピークよりも図の右側にシフトしたエネルギー関数を算出していることに相当する。
このエネルギー関数のピークのシフトは、分布決定部191がグラフG41のエネルギー関数C(X)に基づいて得られた複数のセット(パラメータ値と、そのパラメータ値の場合に対象事象が生じている程度を示す数値とのセット)にフィットするように、グラフG51のエネルギー関数C(X)を生成し直した結果として生じている。
上述したように、図5のグラフG53で、対象事象が発生するパラメータXの値(すなわち、F(X)=1となるXの値)の数がグラフG43の場合よりも増えている。また、グラフG43では、対象事象が発生するパラメータXの値が、「F(X)=1」となる領域のうちパラメータ値が小さい側に偏っている。これに対し、グラフG53では、パラメータ値が大きい側にも、対象事象が発生するパラメータXの値が示されている。このため、分布決定部191は、グラフG62の線L213で示されるように、エネルギー関数C(X)のピークを図5のグラフG52の線L212で示されるエネルギー関数C(X)のピークよりもさらに、図に向かって右側にシフトしたエネルギー関数C(X)に更新する。また、分布決定部191は、グラフG62の線L213で示されるように、グラフG52の線L212の場合よりも急峻な(裾野の広がりが小さい)エネルギー関数C(X)に更新する。このことは、分布決定部191が、図5のグラフG53に例示された複数のセット(パラメータ値と、そのパラメータ値の場合における対象事象が生じている程度を示す数値との組み合わせ)に基づき、エネルギー関数C(X)を算出していることを表す。
図5のグラフG53では、対象事象が発生するパラメータXの値のサンプリング点の数は4つであった。これに対し、エネルギー関数C(X)のピークが右側でシフトしたことで、グラフG63では、対象事象が発生するパラメータXの値が5つに増えている。
このように、図7の例で、分布決定部191は、エネルギー関数C(X)を適切に設定している。条件取得部192が、グラフG71に示されるエネルギー関数に基づいてパラメータXの値をサンプリングすることで、対象事象が発生する条件および境界条件が明らかになると期待される。
図8では、エネルギー関数のグラフに加えて、複数セットが示す、対象事象が生じる程度を頻度解析する処理を実行することによって得られる結果(頻度分布、度数分布)が示されている。すなわち、条件取得部192の係数設定部193は、複数セットに含まれている、対象事象が生じる程度を示す値に関して頻度解析する処理を実行し、その結果、係数設定部193は、対象事象が生じる程度に関する区間と、その区間における頻度とを算出する。
ここでいう頻度解析は、解析対象となる値の大きさの分布を解析することであり、具体的には、その値がとり得る範囲を分割した区間について、その値がその区間に含まれる頻度を解析する。係数設定部193の場合、エネルギー関数値がとり得る範囲を分割した区間について、エネルギー関数値がその区間に含まれる頻度を解析する。
図8に示すエネルギー関数のグラフの横軸はパラメータXの値を示し、縦軸は、エネルギー関数C(X)の値およびモデルF(X)の値(すなわち、パラメータ値Xの場合において、対象事象が生じるか否かの値)を示す。
図8の例で、エネルギー関数C(X)の値の何れの区間にも、ドットが4つ含まれている。これは、条件取得部192が生成したパラメータ値の場合に対象事象が生じる程度が、その程度に関する何れの区間においても等しいことを示している。図8に示すエネルギー関数が、後述する図13~図15に示される1回の反復処理にて入力した複数セットに基づき生成されている場合について説明する。この場合は、複数セットに含まれているパラメータ値は、各区間において等しい個数分だけ生成されていたことが表されている。また、図8に示すエネルギー関数が、図13~図15に示される反復処理において受け取った全てのセットに基づき生成されている場合について説明する。この場合は、図9を参照しながら後述するような重み係数値を適切に調整する処理によって、各区間において等しい個数分だけパラメータ値が生成されていたことが表されている。
あるいは、係数設定部193が、頻度が少ない区間におけるパラメータ値の個数を、頻度が多い区間よりも多く設定するようにしてもよい。すなわち、係数設定部193は、サンプリング処理部194が、頻度が少ない区間に頻度が多い区間よりも多くの個数のパラメータ値を算出するよう、重み係数値を設定するようにしてもよい。
係数設定部193が、区間Rj(ただし、jは区間の個数を示す)に関して算出する重み係数値をW(Rj)と表記する。
このように、サンプリング処理部194は、係数設定部が設定する重み係数値が示す、パラメータ値の個数に関する設定に基づいて、パラメータ値を設定する。サンプリング処理部194は、パラメータ値設定実行部の例に該当する。
Rjは、jによって識別される区間を示す。hjは、区間Rjにおける度数(その区間に含まれるサンプリング数)を示す。
Wjは、jによって識別される区間(区間Rj)における重みを示す。W(Rj)は、区間Rjにおける重みを示す。したがって、式(2)に示されるように「Wj=W(Rj)」である。
h*は、所定の値が定められている、正の整数の定数を示す。「h*-hj>0」となって除数0による除算が生じることを回避できるよう、h*の値は、例えば、係数設定部193が行うサンプリングで想定される度数の最大値よりも大きい値に設定されてもよい。
図2の場合と同じく、線L111は、モデルF(X)(すなわち、対象事象が生じているか否かを示す情報)の例を示す。線L112は、エネルギー関数C(X)の例を示す。
したがって、サンプリング処理部194は、エネルギー関数を用いてXi-1とX’とに関するエネルギー関数値を、それぞれ求め、それらの大小を比較する。
この条件により、エネルギー関数C(X)の値が大きい箇所におけるサンプリング数を多くすることができる。
この条件により、図8を参照して説明したように、エネルギー関数C(X)の値に区間を設定した場合の、パラメータXの値のサンプリング点の数の度数分布の均等化を図ることができる。
式(3)によれば、「C(X’)/C(Xi-1)」により、エネルギー関数値C(Xi-1)との比較でエネルギー関数値C(X’)が大きいほど、スコアrの値が大きくなる。また、分子の「W(R(C(X’)))」により、重み係数値W(R(C(X’)))が大きいほど、スコアrの値が大きくなる。
係数設定部193は、式(4)に基づいて、仮サンプリングされたパラメータ値X’をサンプリングとして採用するか否かを決定する。
r0は、係数設定部193が式(4)による判定に用いる閾値であり、式(5)のように示される。
係数設定部193は、式(4)による判定を行う毎に、r0の値を設定する。
すなわち、係数設定部193は、式(3)~式(5)を参照しながら上述した処理を実行することによって、エネルギー関数値C(X)(すなわち、パラメータ値に関する対象が生じている程度を示す数値)が基準を満たしているか否かに基づき、そのパラメータ値を生成するか否か(仮パラメータ値を採用するか否か)を決定する。上述した例において、パラメータ値を生成するか否かの基準は、前回のパラメータ値に関するエネルギー関数値(パラメータ値に関する対象が生じている程度を示す数値)と異なる値であってもよい。例えば、この基準は、反復回数が増大するにつれ増える値であってもよい。この基準は、複数反復毎に増える値であってもよい。この基準は、I(Iは2以上の自然数とする)回目の反復において(I-1)回目までに算出されたパラメータ値に関するエネルギー関数の平均であってもよい。すなわち、基準は上述した例に限定されない。
図2の場合と同じく、線L111は、モデルF(X)の例を示す。線L112は、エネルギー関数C(X)の例を示す。
図11の場合と同様、図12でも、サンプリング処理部194がパラメータ値Xi(ここでは、iは、i≧2の整数)を算出する際の処理の例を示しており、前回のサンプリングにおけるパラメータ値は、パラメータ値Xi-1である。
図13は、探索装置100が対象事象の発生条件を検索する処理手順の例を示すフローチャートである。
図13の処理で、分布決定部191は、エネルギー関数C(X)を初期設定する(ステップS111)。パラメータ値と、そのパラメータ値の場合に対象事象が生じている程度を示す数値(または、対象事象が生じているか否かを示す情報)とが組み合わされたセットが無い場合に、分布決定部191は、例えば、パラメータ値に対して一定な値であるエネルギー関数を算出する。上記のセットが複数存在している場合には、分布決定部191は、複数のセットにおけるパラメータ値と、数値との関係性を算出する。説明の便宜上、複数セットが存在しているものとして、以降の処理を説明する。
そして、条件取得部192の係数設定部193は、得られた頻度に基づいて、パラメータ値の個数を調整するための重み係数値を区間毎に算出する(図15のステップS314参照)。
例えば、係数設定部193は、条件取得部192が算出した頻度に基づき、少なくとも一部の区間に関して算出するパラメータの個数を算出する。上述したように、係数設定部193は、頻度が少ない区間におけるパラメータ値の個数と、頻度が多い区間におけるパラメータ値の個数とを揃えるように、区間毎の重み係数値を設定する。言い換えれば、係数設定部193は、パラメータ値の頻度が少ない区間におけるパラメータ値の個数の増加量を、パラメータ値の頻度が多い区間におけるパラメータ値の個数の増加量よりも、より多くさせるように、重み係数値を設定する。係数設定部193は、式(2)~式(5)等を参照しながら説明した処理に従い、パラメータ値の個数(重み係数値)を算出してもよい。
そして、条件取得部192は、サンプリングされたパラメータ値の各々を、例えば、モデルF(X)に入力することによって、対象事象が生じている程度を示す数値(または対象事象が発生するか否かを示す情報)を取得する(ステップS113)。条件取得部192は、パラメータ値と、そのパラメータ値の場合に対象事象が生じている程度を示す数値とが組み合わされたセットを生成する。条件取得部192は、生成したパラメータ値の個数分(すなわち、サンプリング数分)のセットを生成する。
そして、制御部190は、図13の処理の終了条件が成立したか否かを判定する(ステップS115)。
一方、終了条件が成立していると制御部190が判定した場合(ステップS115:YES)、探索装置100は、探索結果を出力する(ステップS116)。例えば、ステップS113で、対象事象が発生するパラメータ値(F(X)=1となるX)が検出される毎に、条件取得部192の事象発生パラメータ値抽出部195が、そのパラメータ値を記憶部180に記憶させておく。そして、ステップS116では、条件取得部192が、記憶部180に記憶させておいたパラメータ値を読み出し、読み出したパラメータ値を表示部120に表示させる。
ステップS116の後、探索装置100は図13の処理を終了する。
図14の処理で、係数設定部193は、頻度解析の結果に基づき、区間毎の重み係数値W(Rj)を算出する(ステップS211)。ここでは、jは区間を識別する整数であり、区間の個数をMとして、1≦j≦Mである。
サンプリング処理部194は、パラメータ値X1をエネルギー関数C(X)に入力してエネルギー関数値C(X1)を算出する(ステップS213)。
また、サンプリング処理部194は、カウンタiの値を2に設定する(ステップS215)。カウンタiは、図14の処理でのサンプリング数を示すインデックスとして用いられる。すなわち、iの値が2である場合には、ステップS216~ステップS224に示す処理において、2つめのパラメータ値を算出することを表す。
サンプリング処理部194は、パラメータ値X’をエネルギー関数C(X)に入力してエネルギー関数値C(X’)を算出する(ステップS217)。
そして、サンプリング処理部194は、エネルギー関数値C(X’)に対応する区間(C(X’)が含まれる区間)R(C(X’))を求め、求めた区間R(C(X’))に関する重み係数値W(R(C(X’)))を取得する(ステップS218)。
また、サンプリング処理部194は、式(5)に基づいて閾値r0を設定する(ステップS220)。
そして、サンプリング処理部194は、スコアrの値が閾値r0以上か否かを判定する(ステップS221)。
一方、スコアrの値が閾値r0以上であるとサンプリング処理部194が判定した場合(ステップS221:YES)、サンプリング処理部194は、仮サンプリングのパラメータ値X’をサンプリングのパラメータ値Xiとして採用する(ステップS222)。具体的には、サンプリング処理部194は、パラメータ値XiをX’に設定し、「エネルギー関数値C(Xi)=C(X’)、C(Xi)」を含んでいる区間R(C(Xi))、および、重み係数値W(R(C(Xi)))を取得する。
サンプリング数が上限に到達していないとサンプリング処理部194が判定した場合(ステップS223:NO)、サンプリング処理部194は、カウンタiの値を1増加させる(ステップS224)。
ステップS224の後、処理がステップS216へ戻る。
図15の処理で、係数設定部193は、一様分布に基づいてパラメータXの値をサンプリングする(ステップS311)。
そして、係数設定部193は、エネルギー関数C(X)の値の度数毎のサンプリング数の度数分布を算出する(ステップS313)。
係数設定部193は、度数分布の区間毎に、式(2)に基づいて重み係数値W(C(R(X)))の値を算出する(ステップS314)。
ステップS314の後、係数設定部193は、図15の処理を終了する。
図16は、モデルF(X)の演算を探索装置とは別の装置が行う場合の、探索システムの構成例を示す図である。
図16に示す構成で、探索システム1は、探索装置101と、モデル演算装置200とを備える。探索装置101は、通信部110と、表示部120と、操作入力部130と、記憶部180と、制御部190とを備える。制御部190は、分布決定部191と、条件取得部192とを備える。条件取得部192は、係数設定部193と、サンプリング処理部194と、事象発生パラメータ値抽出部195とを備える。モデル演算装置200は、通信部210と、記憶部280と、制御部290とを備える。記憶部280は、モデル記憶部181を備える。
探索システム1では、モデルF(X)の演算を、探索装置101の外部のモデル演算装置200が行う。このため、モデル記憶部181を、探索装置101側の記憶部180ではなく、モデル演算装置200側の記憶部280が備えている。
従って、制御部190は、モデルF(X)の演算を行う必要がない。
それ以外の点については、探索装置101は、探索装置100(図1)と同様である。
モデル演算装置200は、例えばパソコンまたはワークステーション等のコンピュータを用いて構成される。
記憶部280は、各種データを記憶する。特に、記憶部280のモデル記憶部181は、上記のようにモデルF(X)を記憶する。記憶部280は、モデル演算装置200が備える記憶デバイスを用いて構成される。
制御部290は、モデル演算装置200が備えるCPUが記憶部280からプログラムを読み出して実行することで構成される。
このように、モデル演算装置200がモデルF(X)の演算を行うことで、探索装置101は、モデルF(X)の演算を行う必要がない。この点で、探索装置101の負荷が軽くて済む。
このように、探索装置100によれば、探索の手掛かりとなる情報を予め得られていない場合であっても、対象事象が生じる状況を効率的に探索することができる。
これにより、分布決定部191は、算出した対象事象が生じる程度を用いて、上記の関係性を算出することができる。
また、分布決定部191が、上述したエネルギー関数のように対象事象が生じる程度を3値以上で、あるいは連続的に算出することで、サンプリング処理部194によるパラメータ値の設定の分布のピークに裾野を持たせることができ、この点で、対象事象が発生する条件の境界を検出し易くなる。
サンプリング処理部194が、この設定に基づいてパラメータ値を設定することで、上記のように、対象事象が生じる領域およびその周辺に比較的多くのパラメータを設定することができ、対象事象が生じる状況を効率的に探索することができる。
このように、探索装置100によれば、探索の手掛かりとなる情報を予め得られていない場合であっても、対象事象が生じる状況を効率的に探索することができる。
これにより、サンプリング処理部194が、仮設定したパラメータ値を採用するか否かを決定することで、パラメータ値をランダムに設定するなど、パラメータ値の仮設定を比較的簡易に行うことができる。この点で、サンプリング処理部194の負荷が比較的軽くなる。
これにより、サンプリング処理部194は、この係数値に基づいて、対象事象が生じる領域およびその周辺に比較的多くのパラメータを設定することができ、探索装置100は、対象事象が生じる状況を効率的に探索することができる。
このように、探索装置100によれば、探索の手掛かりとなる情報を予め得られていない場合であっても、対象事象が生じる状況を効率的に探索することができる。
これにより、係数設定部193は、頻度(度数)の逆数を算出する等の比較的簡単な計算で係数値を算出することができる。この点で、係数設定部193の負荷が比較的軽くなる。
図17は、実施形態に係る事象発生探索装置の構成の例を示す図である。図17に示す構成で、探索装置10は、関係性算出部11と、頻度算出部12と、個数関連情報設定部13と、パラメータ値設定実行部14とを備える。
かかる構成にて、関係性算出部11は、パラメータ値と、そのパラメータ値の場合に対象事象が生じている程度を示す数値とが組み合わされた複数のセットに関して、パラメータ値と数値との間の関係性を算出する。頻度算出部12は、数値(対象事象が生じている程度を示す数値)がとり得る範囲を分割した区間毎に、数値がその区間に含まれる頻度を算出する。個数関連情報設定部13は、少なくとも一部の区間に対して、頻度を用いて、頻度が少ない区間ほど、数値の算出対象となる前記パラメータ値の個数をより増加させるように、パラメータ値の個数に関する設定を行う。パラメータ値設定実行部14は、パラメータ値の個数に関する設定に基づいてパラメータ値を設定する。
このように、探索装置10によれば、探索の手掛かりとなる情報を予め得られていない場合であっても、対象事象が生じる状況を効率的に探索することができる。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM(Read Only Memory)、CD-ROM(Compact Disc Read Only Memory)等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
10、100 探索装置
11 関係性取得部(関係性取得手段)
12 頻度算出部(頻度算出手段)
13 個数関連情報設定部(個数設定手段)
14 パラメータ値設定実行部(パラメータ設定手段)
110、210 通信部(通信手段)
120 表示部(表示手段)
130 操作入力部(操作入力手段)
180、280 記憶部(記憶手段)
181 モデル記憶部(モデル記憶手段)
190、290 制御部(制御手段)
191 分布決定部(分布決定手段)
192 条件取得部(条件取得手段)
193 係数設定部(係数設定手段)
194 サンプリング処理部(サンプリング処理手段)
195 事象発生パラメータ値抽出部(事象発生パラメータ値抽出手段)
200 モデル演算装置
Claims (7)
- パラメータ値と、前記パラメータ値の場合に対象事象が生じている程度を示す数値とのセットを複数用いて、前記パラメータ値と、前記数値との間の関係性を算出する関係性算出手段と、
前記数値がとり得る範囲の分割によって得られる複数の区間に関して、前記数値が区間に含まれる頻度を算出する頻度算出手段と、
前記複数の区間のうち少なくとも一部の前記区間に対して、前記頻度を用いて、前記頻度が少ない区間ほど、前記数値の算出対象となる前記パラメータ値の個数をより増加させるように調整するための係数値として、前記区間に関して前記頻度の逆数に応じた係数値を算出する個数設定手段と、
算出された前記係数値に基づく 個数分のパラメータ値を設定するパラメータ設定手段と、
を備える探索装置。 - 前記関係性算出手段は、前記対象事象が生じる程度を算出する、
請求項1に記載の探索装置。 - 前記パラメータ設定手段は、前記パラメータ値を仮設定し、前記関係性を用いて算出したそのパラメータ値に関する数値が基準を満たしているか否かに基づき、そのパラメータ値の設定を採用するか否かを決定する、
請求項1または請求項2に記載の探索装置。 - 前記複数のセットにフィットする前記関係性を求める分布決定手段を備える、
請求項1から3の何れか一項に記載の探索装置。 - 請求項1から4のいずれか一項に記載の探索装置と
入力されたパラメータ値に対応した前記対象事象が生じている程度を示す数値を算出する装置
とを備える探索システム。 - コンピュータが、
パラメータ値と、前記パラメータ値の場合に対象事象が生じている程度を示す数値とのセットを複数用いて、前記パラメータ値と、前記数値との間の関係性を算出し、
前記数値がとり得る範囲の分割によって得られる複数の区間に関して、前記数値が区間に含まれる頻度を算出し、
前記複数の区間のうち少なくとも一部の前記区間に対して、前記頻度を用いて、前記頻度が少ない区間ほど、前記数値の算出対象となる前記パラメータ値の個数をより増加させるように調整するための係数値として、前記区間に関して前記頻度の逆数に応じた係数値を算出し、
算出された前記係数値に基づく 個数分のパラメータ値を設定する、
探索方法。 - コンピュータに、
パラメータ値と、前記パラメータ値の場合に対象事象が生じている程度を示す数値とのセットを複数用いて、前記パラメータ値と、前記数値との間の関係性を算出し、
前記数値がとり得る範囲の分割によって得られる複数の区間に関して、前記数値が区間に含まれる頻度を算出し、
前記複数の区間のうち少なくとも一部の前記区間に対して、前記頻度を用いて、前記頻度が少ない区間ほど、前記数値の算出対象となる前記パラメータ値の個数をより増加させるように調整するための係数値として、前記区間に関して前記頻度の逆数に応じた係数値を算出し、
算出された前記係数値に基づく 個数分のパラメータ値を算出する、
機能を実行させる探索プログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019010663 | 2019-01-24 | ||
JP2019010663 | 2019-01-24 | ||
PCT/JP2020/002608 WO2020153495A1 (ja) | 2019-01-24 | 2020-01-24 | 探索装置、探索システム、探索方法および記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2020153495A1 JPWO2020153495A1 (ja) | 2021-12-02 |
JP7185853B2 true JP7185853B2 (ja) | 2022-12-08 |
Family
ID=71736975
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020567728A Active JP7185853B2 (ja) | 2019-01-24 | 2020-01-24 | 探索装置、探索システム、探索方法およびプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20220100819A1 (ja) |
JP (1) | JP7185853B2 (ja) |
WO (1) | WO2020153495A1 (ja) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019003644A1 (ja) | 2017-06-30 | 2019-01-03 | 日本電気株式会社 | 希少事象解析装置、希少事象解析方法および希少事象解析プログラム記録媒体 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2548880B2 (ja) * | 1992-04-23 | 1996-10-30 | インターナショナル・ビジネス・マシーンズ・コーポレイション | 空間分割型確率シミュレーション・システムおよび物質エネルギー・システムをシミュレートする方法 |
JP6649306B2 (ja) * | 2017-03-03 | 2020-02-19 | 株式会社東芝 | 情報処理装置、情報処理方法及びプログラム |
-
2020
- 2020-01-24 JP JP2020567728A patent/JP7185853B2/ja active Active
- 2020-01-24 WO PCT/JP2020/002608 patent/WO2020153495A1/ja active Application Filing
- 2020-01-24 US US17/424,087 patent/US20220100819A1/en active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019003644A1 (ja) | 2017-06-30 | 2019-01-03 | 日本電気株式会社 | 希少事象解析装置、希少事象解析方法および希少事象解析プログラム記録媒体 |
Non-Patent Citations (1)
Title |
---|
KISAMORI, Keiichi, et al.,"A Rare and Critical Condition Search Technique and its Application to Telescope Stray Light Analysi,Proceedings of the 2018 SIAM International Conference on Data Mining (SDM18),[online],2018年,Pages 567-575,eISBN: 978-1-61197-532-1, <DOI: 10.1137/1.9781611975321.64>, [retrieved on 2020-04-02], Retrieved from the Internet: <URL: https://epubs.siam.org/doi/ pdf/10.1137/1.9781611975321.64>. |
Also Published As
Publication number | Publication date |
---|---|
JPWO2020153495A1 (ja) | 2021-12-02 |
US20220100819A1 (en) | 2022-03-31 |
WO2020153495A1 (ja) | 2020-07-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Gorham et al. | Measuring sample quality with diffusions | |
US10242001B2 (en) | Systems and methods for conducting and terminating a technology-assisted review | |
Ravikumar et al. | Machine learning approach for automated visual inspection of machine components | |
Brookes et al. | Parsimonious regularization using genetic algorithms applied to the analysis of analytical ultracentrifugation experiments | |
US20130173648A1 (en) | Software Application Recognition | |
CN108681750A (zh) | Gbdt模型的特征解释方法和装置 | |
KR102382707B1 (ko) | 다유전자 위험점수를 이용한 시간 의존 연관성 기반의 질환 발병 정보 생성 장치 및 그 방법 | |
CN110738654A (zh) | 髋关节影像中的关键点提取及骨龄预测方法 | |
US20060242214A1 (en) | Periodicity judgement apparatus, periodicity judgement method and periodicity judgement program | |
JP7117687B2 (ja) | 解析装置、解析システム、解析方法およびプログラム | |
US20070239415A2 (en) | General graphical gaussian modeling method and apparatus therefore | |
CN114758771A (zh) | 一种基于约束型鲸鱼优化算法的肝癌生存预测方法 | |
JP7185853B2 (ja) | 探索装置、探索システム、探索方法およびプログラム | |
Aslam et al. | A comprehensive survey on optimization techniques in image processing | |
CN112036432A (zh) | 一种基于禁忌优化的光谱建模样本集快速划分方法 | |
Bom et al. | Deep learning in wide-field surveys: Fast analysis of strong lenses in ground-based cosmic experiments | |
Fuentes–García et al. | A probability for classification based on the Dirichlet process mixture model | |
CN114240899B (zh) | 一种基于图像配准的导波频散曲线模态追踪方法及系统 | |
US20200166497A1 (en) | Analysis apparatus, stratum age estimation apparatus, analysis method, stratum age estimation method, and program | |
JP2002024251A (ja) | 時系列データの分類方法及び装置並びに時系列データの分類プログラムを記録した記録媒体 | |
JP7117686B2 (ja) | 解析装置、解析システム、解析方法およびプログラム | |
Nematzadeh et al. | Distance-based mutual congestion feature selection with genetic algorithm for high-dimensional medical datasets | |
Zandee | A comparative study of bias mitigation methods applied on a multitude of classification algorithms | |
Low-Choy et al. | Experimenting with modelling via a virtual laboratory: Evaluating pseudo-absence strategies to refine a species distribution model | |
CN111091865B (zh) | MoRFs预测模型的生成方法、装置、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210721 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210721 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20210721 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220802 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221003 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221018 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221110 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7185853 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |