WO2022145332A1

WO2022145332A1 - サンプリング装置及びサンプリング方法

Info

Publication number: WO2022145332A1
Application number: PCT/JP2021/047811
Authority: WO
Inventors: 一郎蓮尾; 雄一郎大藪; クロビスエバーハート; 幸平末永; 健太長; 審也勝股
Original assignee: 大学共同利用機関法人情報・システム研究機構
Priority date: 2020-12-28
Filing date: 2021-12-23
Publication date: 2022-07-07
Also published as: US20230333829A1; EP4270178A4; CN116670642A; JPWO2022145332A1; EP4270178A1

Abstract

確率的プログラミングのための新規なサンプリング手法を提供することである。本発明の一態様は、確率的プログラムの各分岐に対応する制御フローを選択する制御フロー選択部と、前記選択した制御フローのプログラムに所定の変換規則を逆伝搬によって適用し、前記プログラムを最適化するプログラム最適化部と、前記最適化したプログラムに従ってサンプルを生成するサンプリング部と、を有するサンプリング装置に関する。

Description

サンプリング装置及びサンプリング方法

　本開示は、サンプリング装置及びサンプリング方法に関する。

　ベイズ推定は、観測事象（観測された事実）から推定した事柄（それの起因である原因事象）を確率的な意味で推論する統計的手法である。例えば、ベイズ推定は、ロケット制御、自動運転、衝突回避、迷惑メールフィルタリング、医療問診、学力テスト、音声解析及び合成、ゲノム解析、天文学、心理学、創薬、素材、エネルギー、セマンティック検索、ネット通販の販促、深層学習等の多分野に適用されている。

　ベイズ推定を実現するため確率的プログラミング（ＰＰＬ）が用いられる。確率的プログラミングを利用することによって、統計モデルをプログラムの形式で表現でき、統計モデル解析に際して様々な手法が提供できる。

　統計モデルとして、サンプリングを前提としたフレームワークが利用されることが多い。例えば、サンプリング手法として、連続モンテカルロ法（ＳＭＣ）、マルコフチェーン・モンテカルロ法（ＭＣＭＣ）、変分推論（ＶＩ）等が知られている。

Aditya V. Nori and Chung-Kil Hur, "R2: an efficient MCMC sampler for probabilistic programs," AAAI'14: Proceedings of the Twenty-Eighth AAAI Conference on Artificial Intelligence, July 2014, pp 2476－2482 Yuan Zhou, Hongseok Yang, Yee Whye Teh and Tom Rainforth, "Divide, Conquer, and Combine: a New Inference Strategy for Probabilistic Programs with Stochastic Support", (https://arxiv.org/pdf/1910.13324.pdf)

　本開示の課題は、確率的プログラミングのための新規なサンプリング手法を提供することである。

　上記課題を解決するため、本発明の一態様は、確率的プログラムの各分岐に対応する制御フローを選択する制御フロー選択部と、前記選択した制御フローのプログラムに所定の変換規則を逆伝搬によって適用し、前記プログラムを最適化するプログラム最適化部と、前記最適化したプログラムに従ってサンプルを生成するサンプリング部と、を有するサンプリング装置に関する。

　本開示によると、確率的プログラミングのための新規なサンプリング手法を提供することができる。

ベイズ推定の具体例を示す概略図である。ベイズ推定のための確率的プログラムを示すコード図である。確率的プログラムにおける異なる分布を示す概略図である。確率的プログラムによるサンプリング結果を示す概略図である。本開示の一実施例によるサンプリング装置を示す概略図である。本開示の一実施例によるサンプリング装置のハードウェア構成を示すブロック図である。本開示の一実施例によるサンプリング装置の機能構成を示すブロック図である。本開示の一実施例による制御フローを示す概略図である。本開示の一実施例による確率的プログラミングの変換規則を示す概略図である。本開示の一実施例による確率的プログラミングの変換規則を示す概略図である。本開示の一実施例による確率的プログラムの変換過程を示す概略図である。本開示の一実施例によるシミュレーション結果を示す概略図である。本開示の一実施例による確率的プログラムを示すコード図である。本開示の一実施例によるサンプリング処理を示すフローチャートである。

　以下の実施例では、確率的プログラミングのためのサンプリング装置が開示される。
［ベイズ推定と確率的プログラミング］
　ベイズ推定とは、事前分布Ｐ（Ｘ）と条件付き分布Ｐ（Ｄ｜Ｘ）とからベイズの定理によって事後分布Ｐ（Ｘ｜Ｄ）を導出することである。例えば、ベイズ推定のための確率モデルは、図１に示されるようなベイジアンネットワークによって記述されうる。ベイズ推定によって、図示されたベイジアンネットワークから、例えば、Ｊｏｈｎが通報した（ＪｏｈｎＣａｌｌｓ）という事象とＭａｒｒｙが通報した（ＭａｒｙＣａｌｌｓ）という事象との双方が事前確率として成り立つ場合に（ＪｏｈｎＣａｌｌｓ＝ｔｒｕｅ＆ＭａｒｒｙＣａｌｌｓ＝ｔｒｕｅ）強盗に入られるという事象Ｂが生起する確率Ｐ（Ｂ｜ＪｏｈｎＣａｌｌｓ＝ｔｒｕｅ＆ＭａｒｙＣａｌｌｓ＝ｔｒｕｅ）を事後確率として導出することができる。図示された具体例では、Ｐ（Ｂ｜ＪｏｈｎＣａｌｌｓ＝ｔｒｕｅ＆ＭａｒｙＣａｌｌｓ＝ｔｒｕｅ）＝Ｐ（ＪｏｈｎＣａｌｌｓ＝ｔｒｕｅ＆ＭａｒｙＣａｌｌｓ＝ｔｒｕｅ｜Ｂ）・Ｐ（Ｂ）／Ｐ（ＪｏｈｎＣａｌｌｓ＝ｔｒｕｅ＆ＭａｒｙＣａｌｌｓ＝ｔｒｕｅ）～０．２８４１となる。

　このようなベイズ推定を実現するため、確率的プログラミングが利用される。図１に示された確率モデルは、例えば、図２に示されるような確率的プログラムとして記述可能である。ここで、所望される事後確率Ｐ（Ｂ｜ＪｏｈｎＣａｌｌｓ＝ｔｒｕｅ＆ＭａｒｙＣａｌｌｓ＝ｔｒｕｅ）は、図示された確率的プログラムにおいて、“ｏｂｓｅｒｖｅ（ｊｏｈｎＣａｌｌｓ＆＆ｍａｒｙＣａｌｌｓ）”が成り立つ場合の“ｒｅｔｕｒｎ　ｂｕｒｇｌａｒｙ”によって出力できる。

　図示された確率的プログラムでは、ランダムにブール値を返すｆｌｉｐ関数が利用されているが、確率的プログラミングでは、様々な確率分布に従うサンプリング関数が利用可能である。例えば、図３に示される確率的プログラムでは、一様分布に従うサンプリング関数ｕｎｉｆｏｒｍ、ベータ分布に従うサンプリング関数ｂｅｔａ、及びガンマ分布に従うサンプリング関数ｇａｍｍａが利用される。そして、パラメータｚ０が負又は非負であるかに応じて処理が枝分かれし、ｂｅｔａ関数が利用される制御フローと、ｇａｍｍａ関数が利用される制御フローとに分かれる。しかしながら、このように異なる複数の確率分布が利用される場合、制御フロー間における確率分布のスムーズさが欠けるという問題が考えられる。この場合、ランダムに移動して目標の分布を取得するＭＣＭＣ法では、確率分布の切り替えタイミングを決定することが困難であり、また、分布テンプレートを用いてデータに当てはめるＶＩ法では、スムーズさに欠ける分布に適したテンプレートを見出すことが難しい。

　また、図２に示される確率的プログラムでは、ＪｏｈｎＣａｌｌｓ＝ｔｒｕｅ＆ＭａｒｙＣａｌｌｓ＝ｔｒｕｅは稀にしか生起しない事象であり、図４に示されるように、“ｏｂｓｅｒｖｅ（ｊｏｈｎＣａｌｌｓ＆＆ｍａｒｙＣａｌｌｓ）”が成立するサンプルは稀にしか生成されない。すなわち、生成される大部分のサンプルは利用されず、計算リソースの浪費となる。
［概略］
　本開示の一実施例によるサンプリング装置１００は、図５に示されるように、確率的プログラムを受け付けると、受け付けた確率的プログラムのｉｆ文などの条件分岐構造に着目して複数の制御フローを抽出する。そして、サンプリング装置１００は、いずれかの制御フローを選択し、後述される条件伝搬に従って、選択した制御フローのプログラムを最適化し、最適化したプログラムに従ってサンプルを生成する。この条件伝搬では、“ｏｂｓｅｒｖｅ”の成立条件を論理的に充足しないサンプリングが排除されるように、所定の変換規則に従ってプログラムが変換される。そして、サンプリング装置１００は、サンプリング結果に基づき次の制御フローを選択し、同様にして選択した制御フローのプログラムを最適化し、最適化したプログラムに従ってサンプルを生成する。

　ここで、サンプリング装置１００は、例えば、図６に示されるように、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）などのプロセッサ１０１、ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）、フラッシュメモリなどのメモリ１０２、ストレージ１０３、及び入出力（Ｉ／Ｏ）インタフェース１０４によるハードウェア構成を有してもよい。

　プロセッサ１０１は、後述されるサンプリング装置１００の各種処理を実行する。

　メモリ１０２は、サンプリング装置１００における各種データ及びプログラムを格納し、特に作業用データ、実行中のプログラムなどのためのワーキングメモリとして機能する。具体的には、メモリ１０２は、ハードディスク１０３からロードされた後述される各種処理を実行及び制御するためのプログラムなどを格納し、プロセッサ１０１によるプログラムの実行中にワーキングメモリとして機能する。

　ハードディスク１０３は、サンプリング装置１００における各種データ及びプログラムを格納する。

　Ｉ／Ｏインタフェース１０４は、ユーザからの命令、入力データなどを受け付け、出力結果を表示、再生などすると共に、外部装置との間でデータを入出力するためのインタフェースである。例えば、Ｉ／Ｏインタフェース１０４は、ＵＳＢ（Ｕｎｉｖｅｒｓａｌ　Ｓｅｒｉａｌ　Ｂｕｓ）、通信回線、キーボード、マウス、ディスプレイ、マイクロフォン、スピーカなどの各種データを入出力するためのデバイスであってもよい。

　しかしながら、本開示によるサンプリング装置１００は、上述したハードウェア構成に限定されず、他の何れか適切なハードウェア構成を有してもよい。例えば、サンプリング装置１００による各種処理の１つ以上は、これを実現するよう配線化された処理回路又は電子回路により実現されてもよい。
［サンプリング装置］
　次に、図７～１３を参照して、本開示の一実施例によるサンプリング装置１００を説明する。図７は、本開示の一実施例によるサンプリング装置１００の機能構成を示すブロック図である。

　図７に示されるように、サンプリング装置１００は、制御フロー選択部１１０、プログラム最適化部１２０及びサンプリング部１３０を有する。

　制御フロー選択部１１０は、確率的プログラムの各分岐に対応する制御フローを選択する。具体的には、処理対象の確率的プログラムが与えられると、制御フロー選択部１１０は、確率的プログラムにおけるｉｆ文などの分岐に関する制御構造を特定し、確率的プログラムの各分岐に対応する処理パス（制御フロー）を抽出する。例えば、図３に示されるような１つのｉｆ文を含む確率的プログラムが与えられると、制御フロー選択部１１０は、当該ｉｆ文を特定し、図８に示されるような制御フロー１，２を抽出する。ここで、制御フロー１は、ｉｆ文における条件“ｚ０＜０”がｔｒｕｅの場合の処理パスに相当し、ｂｅｔａ関数がサンプリング関数として利用される。他方、制御フロー２は、ｉｆ文における条件“ｚ０＜０”がｆａｌｓｅの場合の処理パスに相当し、ｇａｍｍａ関数がサンプリング関数として利用される。

　確率的プログラムにおける各制御フローを抽出すると、制御フロー選択部１１０は、確率的プログラムから各制御フローの直列プログラムを構成する。例えば、制御フロー１に対応する直列プログラムとして、制御フロー選択部１１０は、図５に示されるように、確率的プログラムの“ｉｆ（ｚ０＜０）”を“ｏｂｓｅｒｖｅ（ｚ０＜０）”に置換する。図示しないが、制御フロー２に対応する直列プログラムとして、制御フロー選択部１１０は、同様に確率的プログラムの“ｉｆ（ｚ０≧０）”を“ｏｂｓｅｒｖｅ（ｚ０≧０）”に置換する。

　このようにして、各制御フローの直列プログラムを構成すると、制御フロー選択部１１０は、抽出した制御フローの１つを選択し、プログラム最適化部１２０にわたす。初期的には、制御フロー選択部１１０は、ランダムに１つの制御フローを選択してもよい。以降、制御フロー選択部１１０は、後述されるように、最適化されたプログラムによるサンプリング結果に基づき次の制御フローを選択してもよい。

　プログラム最適化部１２０は、選択した制御フローのプログラムに所定の変換規則を逆伝搬によって適用し、プログラムを最適化する。具体的には、制御フロー選択部１１０から制御フローを取得すると、プログラム最適化部１２０は、取得した制御フローの直列プログラムの処理順序と逆方向に所定の変換規則を順次適用し、プログラムの最下位行から最上位行まで各行の命令を変換してプログラムを最適化する。例えば、プログラム最適化部１２０は、プログラムを最下位行から最上位行まで走査するローラを用いて、処理順序と逆方向にプログラムの各行を変換する。ローラは内部状態を有すると共に、走査に従って内部状態を遷移させながら、後述する変換規則に従ってプログラムの各行を変換する。

　第１の変換規則として、変換対象の行が“ｒｅｔｕｒｎ　ｘ”であるとき、プログラム最適化部１２０は、当該行を消去し、内部状態を“ｃｏｎｓｔ（１）”に設定する。ここで、“ｃｏｎｓｔ（１）”は、常に値１を返す関数である。例えば、変換対象の行が“ｒｅｔｕｒｎ　ｚ”であるとき、当該変換規則は、当該行を“ｃｏｎｓｔ（１）”に変換し、内部状態を“ｃｏｎｓｔ（１）”に設定する。

　第２の変換規則として、変換対象の行が決定的代入命令“ｘ：＝ｅ”であるとき、プログラム最適化部１２０は、図９に示されるように、内部状態ｆを“ｆ［ｅ／ｘ］”に置き換え、“ｘ：＝ｅ”を維持する。ここで、“ｆ［ｅ／ｘ］”は、ｆの中の変数ｘをｅに置き換えたものである。例えば、変換対象の行が“ｚ：＝ｚ０＋ｙ”であって、内部状態が“ｃｈａｒ（０＜＝ｚ＜＝２）”であるとき、当該変換規則は、当該行を維持し、内部状態を“ｃｈａｒ（０＜＝ｚ０＋ｙ＜＝２）”に設定する。ここで、“ｃｈａｒ（ｘ）”は、論理式ｘの特性関数であり、ｘが真である場合に１を返し、そうでない場合に０を返す。

　第３の変換規則として、変換対象の行が重み付け命令“ｗｅｉｇｈｔ（ｇ）”であるとき、プログラム最適化部１２０は、図９に示されるように、内部状態ｆを“ｆ×ｇ”に置き換え、“ｗｅｉｇｈｔ（ｇ）”を消去する。ここで、“ｆ×ｇ”は、関数ｆの出力値と関数ｇの出力値との積を返す関数である。また、“ｏｂｓｅｒｖｅ（ｘ）”は、“ｗｅｉｇｈｔ（ｃｈａｒ（ｘ））”の略記である。例えば、変換対象の行が“ｏｂｓｅｒｖｅ（ｚ０＜０）”であって、内部状態が“ｃｈａｒ（－１＜＝ｚ０＜＝２）”であるとき、当該変換規則は、当該行を消去し、内部状態を“ｃｈａｒ（（－１＜＝ｚ０＜＝２）∧（ｚ０＜０））＝ｃｈａｒ（－１＜＝ｚ０＜０）”に設定する。

　第４の変換規則として、変換対象の行が確率的代入命令“ｘ～Ｄｉｓｔ（ｅ）”であって、内部状態ｆにｘが現れないとき、図１０に示されるように、プログラム最適化部１２０は、当該命令及び内部状態を維持する。

　第５の変換規則として、変換対象の行が確率的代入命令“ｘ～Ｄｉｓｔ（ｅ）”であって、内部状態ｆにｘが現れるとき、図１０に示されるように、プログラム最適化部１２０は、内部状態ｆを“ｃｈａｒ（ψ）”に設定し、当該命令を維持すると共に“ｗｅｉｇｈｔ　ｆ”を追加する。ｘが内部状態ｆに関与するため、内部状態ｆは重み付けに使う必要がある（ｗｅｉｇｈｔ　ｆ）。ψは、

を充足する任意の論理式であってもよい。ただし、ψはファジー述語でなく、ブール値論理式でなければならない。

　ここで、ψの選び方として、論理式

をψとしてもよい。しかしながら、量化子∃は論理演算を非常に困難にする。また、ψをｔｒｕｅにしてもよい。しかしながら、情報量がなく、無駄なサンプルを省くという効果がなくなるので、以下の選び方が適用できない場合にのみＴｒｕｅを選ぶ。そこで、ｆ・＞０の真がｘに関して単調である、すなわち、ｆ・（ｘ１）＞０であって、ｘ１≦ｘ２であることがｆ・（ｘ２）＞０であることを意味し、さらに、

が上界ｘｓｕｐを有すると仮定したとき、ψをｆ・（ｘｓｕｐ）＞０と選ぶ。例えば、変換対象の行が“ｙ～ｂｅｔａ（１，１）”であって、内部状態が“ｃｈａｒ（０＜＝ｚ０＋ｙ）”であるとき、当該変換規則は、当該行を維持し、内部状態を“ｃｈａｒ（０＜＝ｚ０＋１）”に設定する。

　さらに、第５の変換規則の改良版として、変換対象の行が確率的代入命令“ｘ～Ｄｉｓｔ（ｅ）”であって、内部状態ｆにｘが現れるとき、領域制限という効率化が可能である。当該改良版が適用可能である場合、すなわち、後述するような条件を充足するξ，ψが見つかるとき、当該改良版を適用し、そうでない場合、上述した第５の変換規則を適用するようにしてもよい。論理式ξ，ψが、

の条件を充足するとき、図１０に示されるように、プログラム最適化部１２０は、内部状態ｆを“ｃｈａｒ（ψ）”に設定し、当該命令を“ｘ～（Ｄｉｓｔ（ｅ）｜ξ）に置き換えると共に、“ｗｅｉｇｈｔ（ｐ（ξ｜ｘ～Ｄｉｓｔ（ｅ））”及び“ｗｅｉｇｈｔ（ｆ）”を追加する。ここで、“Ｄｉｓｔ（ｅ）｜ξ”は、確率分布“Ｄｉｓｔ（ｅ）”をξの成立する領域に制限した確率分布であり、“ｐ（ξ｜ｘ～Ｄｉｓｔ（ｅ）”は、Ｄｉｓｔ（ｅ）に沿って選んだｘがξをｔｒｕｅにする確率である。

　例えば、プログラム最適化部１２０は、上述した変換規則を適用し、図１１に示されるように、制御フロー１の直列プログラムを最適化する。

　まず、プログラム最適化部１２０は、直列プログラムの最下位行“ｒｅｔｕｒｎ　ｚ”に対して第１の変換規則を適用し、内部状態を“ｃｏｎｓｔ（１）”に設定し、当該行を消去する。

　次に、プログラム最適化部１２０は、直列プログラムの“ｏｂｓｅｒｖｅ（０＜＝ｚ＜＝２）”に対して第３の変換規則を適用し、内部状態を“ｃｈａｒ（０＜＝ｚ＜＝２）”に設定し、当該行を消去する。

　次に、プログラム最適化部１２０は、直列プログラムの“ｚ：＝ｚ０＋ｙ”に対して第２の変換規則を適用し、内部状態を“ｃｈａｒ（０＜＝ｚ０＋ｙ＜＝２）”に設定し、当該行“ｚ：＝ｚ０＋ｙ”を維持する。

　次に、プログラム最適化部１２０は、直列プログラムの“ｙ～ｂｅｔａ（１，１）”に対して第５の変換規則を適用し、内部状態を“ｃｈａｒ（－１＜＝ｚ０＜＝２）”に設定し、当該行を“ｙ～ｂｅｔａ（１，１）”及び“ｏｂｓｅｒｖｅ（０＜＝ｚ０＋ｙ＜＝２）”に変換する。

　次に、プログラム最適化部１２０は、直列プログラムの“ｏｂｓｅｒｖｅ（ｚ０＜０）”に対して第３の変換規則を適用し、内部状態を“ｃｈａｒ（－１＜＝ｚ０＜０）”（＝ｃｈａｒ（（－１＜＝ｚ０＜＝２）∧（ｚ０＜０）））に設定し、当該行を消去する。

　最後に、プログラム最適化部１２０は、直列プログラム最上位行“ｚ０～ｕｎｉｆｏｒｍ（－４，４）”に対して第５の変換規則の改良版を適用し、内部状態を“ｃｏｎｓｔ（１）”に設定し、当該行を“ｚ０～ｕｎｉｆｏｒｍ（－１，０）”及び“ｗｅｉｇｈｔ（ｃｏｎｓｔ（１／８）”に変換する。上述した変換規則のψはＴｒｕｅであり、ｃｈａｒ（ψ）は常に１となり、すなわち、ｃｏｎｓｔ（１）である。また、変換規則のｘはｚ０に相当し、ξは－１＜＝ｚ０＜＝０に相当する。Ｄｉｓｔ（ｅ）はｕｎｉｆｏｒｍ（－４，４）であり、Ｄｉｓｔ（ｅ）｜ξ）はｕｎｉｆｏｒｍ（－１，０）であり、ｐ（ξ｜ｘ～Ｄｉｓｔ（ｅ））は、ｚ０をｕｎｉｆｏｒｍ（－４，４）から選んだ際に－１＜＝ｚ０＜＝０を充たす確率であり、１／８である。

　プログラム最適化部１２０は、最適化されたプログラムをサンプリング部１３０にわたす。

　サンプリング部１３０は、最適化したプログラムに従ってサンプルを生成する。具体的には、サンプリング部１３０は、選択された制御フローの直列プログラムの最適化されたプログラムに従って所定数のサンプルを生成する。生成されるサンプルは、直列プログラムの出力を算出するのに論理的に寄与しないサンプルを予め排除したものであり、サンプリング効率を向上させる。所定数のサンプルを生成すると、サンプリング部１３０は、制御フロー選択部１１０に次の制御フローを選択させる。例えば、次の制御フローは、ランダムに選択されてもよいし、あるいは、未選択の制御フローであってもよい。同様にして、プログラム最適化部１２０は、選択された制御フローの直列プログラムを最適化し、サンプリング部１３０は、最適化されたプログラムに従って所定数のサンプルを生成する。

　このようにしてプールされたサンプルに対して、サンプリング部１３０は、各制御フローに対して生成されたサンプルの尤度を算出し、算出した尤度をサンプリング結果として制御フロー選択部１１０に通知する。ここで、サンプルの尤度とは，当該サンプルが生成された際に通過した重み付け命令のそれぞれが付与する重みの積である。“ｏｂｓｅｒｖｅ（ｘ）”は、“ｗｅｉｇｈｔ（ｃｈａｒ（ｘ））”の略記であるため、当該サンプルが“ｏｂｓｅｒｖｅ（ｘ）”命令を通過した際に論理式ｘを充足しない場合、当該サンプルの尤度は０となる。制御フロー選択部１１０は、取得した尤度に基づき制御フローを選択してもよい。例えば、制御フロー選択部１１０は、相対的に高い尤度の制御フローを高い確率で選択し、相対的に低い尤度の制御フローを低い確率で選択してもよい。

　例えば、図１２に示されるように、シミュレーションによって、制御フロー１から生成されたサンプルの尤度は０．０６３であり、制御フロー２から生成されたサンプルの尤度は０．１３となった。制御フロー１，２から生成されたサンプルを重畳することによって、図示されるようなサンプルの分布を取得することができる。

　なお、上述した確率的プログラムでは、ｉｆ文に基づき制御フローが抽出された。しかしながら、本開示はこれに限定されず、分岐の制御構造としてｗｈｉｌｅ文に基づき制御フローが抽出されてもよい。例えば、本開示は、図１３に示されるような確率的プログラムに適用されてもよい。例えば、ｗｈｉｌｅループのループ回数に応じて制御フローが抽出されてもよい。すなわち、ｗｈｉｌｅループが１回実行される際の直列プログラム、ｗｈｉｌｅループが２回実行される際の直列プログラム、・・・、ｗｈｉｌｅループがｎ回実行される際の直列プログラムがそれぞれ抽出され、抽出された直列プログラムに対して上述したプログラム最適化及びサンプリング処理が実行される。
［サンプリング処理］
　次に、図１４を参照して、本開示の一実施例によるサンプリング処理を説明する。当該サンプリング処理は、上述したサンプリング装置１００によって実行され、例えば、サンプリング装置１００の１つ以上のメモリに格納されたプログラムを１つ以上のプロセッサが実行することによって実現されうる。図１４は、本開示の一実施例によるサンプリング処理を示すフローチャートである。

　図１４に示されるように、ステップＳ１０１において、サンプリング装置１００は、確率的プログラムを取得する。具体的には、サンプリング装置１００は、ベイズ推定を実現するための確率的プログラムを取得する。

　ステップＳ１０２において、サンプリング装置１００は、確率的プログラムの各分岐に対応する制御フローを選択する。具体的には、サンプリング装置１００は、取得した確率的プログラムのｉｆ文の各分岐に対応する制御フローを抽出し、抽出した制御フローから処理対象の制御フローを選択する。そして、サンプリング装置１００は、選択した制御フローに対応する直列プログラムを抽出する。

　ステップＳ１０３において、サンプリング装置１００は、選択した制御フローのプログラムに所定の変換規則を逆伝搬し、プログラムを最適化する。具体的には、サンプリング装置１００は、選択した制御フローの直列プログラムの処理順序と逆方向に各行に所定の変換規則を適用し、直列プログラムを変換する。最適化したプログラムは、直列プログラムの出力を算出するのに論理的に寄与しないサンプルを予め排除したものである。

　ステップＳ１０４において、サンプリング装置１００は、最適化したプログラムに従ってサンプルを生成する。具体的には、サンプリング装置１００は、最適化したプログラムを繰り返し実行し、所定数のサンプルを生成し、生成したサンプルを保存する。また、サンプリング装置１００は、保存しているサンプルに対して制御フロー毎の尤度を算出する。

　ステップＳ１０５において、サンプリング装置１００は、終了条件を充足したか判断する。終了条件としては、例えば、所定の繰り返し回数だけＳ１０１～Ｓ１０４を実行したことであってもよい。

　終了条件が充足された場合（Ｓ１０５：ＹＥＳ）、サンプリング装置１００は、当該サンプリング処理を終了する。他方、終了条件が充足されない場合（Ｓ１０５：ＮＯ）、サンプリング装置１００は、ステップＳ１０２に戻って、次の制御フローを選択する。

　上述したサンプリング装置１００及びサンプリング処理は、例えば、自動運転システムのテストのためのサンプリングに適用されてもよい。すなわち、事故等の事象は一般にはそれほど高い確率で生起するものでない。例えば、解析対象の“ｏｂｓｅｒｖｅ（Ｘ）”における事象Ｘも稀な事象であり、当該事象を解析するためのサンプリングで収集したサンプルの大部分は破棄される可能性が高い。本開示のサンプリング手法を利用することによって、当該事象Ｘが論理的に起こりえない範囲を予め排除することが可能であり、解析対象に適したサンプルを効率的に生成することが可能になる。

　以上、本発明の実施例について詳述したが、本発明は上述した特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。

　本国際出願は２０２０年１２月２８日に出願された日本国特許出願２０２０－２１８９０６号に基づく優先権を主張するものであり、２０２０－２１８９０６号の全内容をここに本国際出願に援用する。

１００　サンプリング装置
１１０　制御フロー選択部
１２０　プログラム最適化部
１３０　サンプリング部

Claims

　確率的プログラムの各分岐に対応する制御フローを選択する制御フロー選択部と、
　前記選択した制御フローのプログラムに所定の変換規則を逆伝搬によって適用し、前記プログラムを最適化するプログラム最適化部と、
　前記最適化したプログラムに従ってサンプルを生成するサンプリング部と、
を有するサンプリング装置。
　前記プログラム最適化部は、前記選択した制御フローのプログラムに、確率分布適用領域の制限を含む所定の変換規則を逆伝搬によって適用する、請求項１に記載のサンプリング装置。
　前記制御フロー選択部は、サンプリング結果に基づき前記制御フローを選択する、請求項１に記載のサンプリング装置。
　前記確率的プログラムは、ベイズ推定を実現するためのプログラムを含む、請求項１に記載のサンプリング装置。
　確率的プログラムの各分岐に対応する制御フローを選択するステップと、
　前記選択した制御フローのプログラムに所定の変換規則を逆伝搬によって適用し、前記プログラムを最適化するステップと、
　前記最適化したプログラムに従ってサンプルを生成するステップと、
をコンピュータが実行するサンプリング方法。
　前記プログラムを最適化するステップは、前記選択した制御フローのプログラムに、確率分布適用領域の制限を含む所定の変換規則を逆伝搬によって適用する、請求項５に記載のサンプリング方法。
　前記選択するステップは、サンプリング結果に基づき前記制御フローを選択する、請求項５に記載のサンプリング方法。
　前記確率的プログラムは、ベイズ推定を実現するためのプログラムを含む、請求項５に記載のサンプリング方法。