WO2021176674A1

WO2021176674A1 - モデル生成プログラム及び方法並びに情報処理装置

Info

Publication number: WO2021176674A1
Application number: PCT/JP2020/009534
Authority: WO
Inventors: 鈴木　浩史; 啓介後藤
Original assignee: 富士通株式会社
Priority date: 2020-03-05
Filing date: 2020-03-05
Publication date: 2021-09-10
Also published as: EP4116891A1; EP4116891A4; JPWO2021176674A1; CN115244550A; US20220414404A1

Abstract

情報処理装置は、線形モデルの生成に利用される訓練データセットを取得する。情報処理装置は、訓練データセットに含まれる各データ項目のそれぞれに関して、ユーザにとって解釈しやすいと仮定した第１の仮定において、データ項目が第１の仮定に反した各第１の状態について、訓練データセットを用いてデータ項目の解釈しやすさを損失の重みとして有する目的関数を最適化した各第１の値を算出し、データ項目がユーザにとって解釈にしくいと仮定した第２の仮定において、データ項目が前記第２の仮定に反した各第２の状態について、訓練データセットを用いて目的関数を最適化した各第２の値を算出する。情報処理装置は、各データ項目それぞれについての各第１の値および各第２の値に基づき、各データ項目の中から特定のデータ項目を選択し、特定のデータ項目に対するユーザの評価を用いて、線形モデルを生成する。

Description

[規則37.2に基づきISAが決定した発明の名称]　モデル生成プログラム及び方法並びに情報処理装置

　本発明は、モデル生成プログラム、モデル生成方法および情報処理装置に関する。

　ＡＩ（Artificial　Intelligence）技術が普及し、ブラックボックスなモデルの判断を鵜呑みにできない、人間にとって解釈可能な判断の根拠を示してほしいなど、説明可能な機械学習モデルの需要が増加している。このことから、ルールリスト、決定木、線形モデルなどのホワイトボックスモデルを予め用いることも行われるが、ホワイトボックスなモデルを単に用いるだけでは、人間にとって解釈可能なモデルとは限らない。

　そのため、近年では、モデル生成と人間へのフィードバックとを繰り返す対話型アプローチにより、人間が納得できて精度がよいモデルを生成することが行われている。例えば、「ある入力に対するモデルの出力を予測する」タスクをユーザに表示し、反応時間により解釈可能性を評価する。そして、評価にしたがって、モデルを最適化する際のパラメータを変更してモデルを更新する。このような処理を繰り返すことで、人間が納得できて精度がよいモデルを生成することが行われている。

Isaac　Lage，et　al．，"Human－in－the－loop　interpretability　prior"，In　proceedings　of　the　32nd　International　Conference　on　Neural　Information　Processing　Systems　（NIPS‘18），pages　10180－10189，2018

　しかしながら、上記技術は、決定木やルールリストなど、人間が分岐を追うことで出力を予測できるモデルが対象であり、線形モデルへの適用が困難である。例えば、１００個のデータ項目がモデルに出現する場合、ユーザが１００個のデータ項目すべてに目を通してモデルの予測値を概算するのは、ユーザにとって負担が大きく、非現実的である。

　また、線形モデルの解釈可能性は、出力の説明として提示されるデータ項目の解釈しやすさにより決まるので、上記タスクへの応答時間の長さからは解釈可能性を評価できない。

　一つの側面では、モデルの解釈のしやすさの向上を図ることができるモデル生成プログラム、モデル生成方法および情報処理装置を提供することを目的とする。

　第１の案では、モデル生成プログラムは、コンピュータに、線形モデルの生成に利用される訓練データセットを取得する処理を実行させる。モデル生成プログラムは、コンピュータに、前記訓練データセットに含まれる各データ項目のそれぞれに関して、ユーザにとって解釈しやすいと仮定した第１の仮定において、データ項目が前記第１の仮定に反した各第１の状態について、前記訓練データセットを用いて前記データ項目の解釈しやすさを損失の重みとして有する目的関数を最適化した各第１の値を算出し、前記データ項目が前記ユーザにとって解釈にしくいと仮定した第２の仮定において、前記データ項目が前記第２の仮定に反した各第２の状態について、前記訓練データセットを用いて前記目的関数を最適化した各第２の値を算出する処理を実行させる。モデル生成プログラムは、コンピュータに、前記各データ項目それぞれについての前記各第１の値および前記各第２の値に基づき、前記各データ項目の中から特定のデータ項目を選択し、前記特定のデータ項目に対するユーザの評価を用いて、前記線形モデルを生成する処理を実行させる。

　一実施形態によれば、モデルの解釈のしやすさの向上を図ることができる。

図１は、実施例１にかかる情報処理装置を説明する図である。図２は、一般技術の問題点を説明する図である。図３は、実施例１にかかる情報処理装置の機能構成を示す機能ブロック図である。図４は、訓練データセットの一例を説明する図である。図５は、ロス関数を説明する図である。図６は、データ項目の推薦を説明する図である。図７は、データ項目の推薦を説明する図である。図８は、具体例のループ１回目を説明する図である。図９は、上下界の差の算出を説明する図である。図１０は、問い合わせ画面例を説明する図である。図１１は、具体例のループ２回目を説明する図である。図１２は、具体例のループ２回目を説明する図である。図１３は、具体例のループ３回目を説明する図である。図１４は、具体例のループ３回目を説明する図である。図１５は、具体例のループ４回目を説明する図である。図１６は、具体例のループ４回目を説明する図である。図１７は、具体例のループ５回目を説明する図である。図１８は、処理の流れを示すフローチャートである。図１９は、ハードウェア構成例を説明する図である。

　以下に、本発明にかかるモデル生成プログラム、モデル生成方法および情報処理装置の実施例を図面に基づいて詳細に説明する。なお、この実施例によりこの発明が限定されるものではない。また、各実施例は、矛盾のない範囲内で適宜組み合わせることができる。

［情報処理装置の説明］
　図１は、実施例１にかかる情報処理装置１０を説明する図である。図１に示す情報処理装置１０は、解釈可能性の高い分類モデルを生成するコンピュータ装置である。この情報処理装置１０は、ユーザ（人間）との対話により、人間による評価のフィードバックとモデル生成を繰り返し、なるべく人間に手間をかけさせないで、人が納得できて精度良いモデルを生成する。実施例１にかかる情報処理装置１０は、説明可能な機械学習モデルとして、ホワイトボックスモデルの一例である線形モデルを例にして説明する。

　ここで、線形モデルの一例としては、式（１）に示すロス関数を最小化して得られる回帰式（式（２）参照）による分類モデル（学習モデル）が考えられる。なお、ロス関数は、訓練データと分類誤差と重みペナルティを含む目的関数の一例であり、回帰式は、データ項目がｄ個あると仮定した例を示している。回帰式は、ｍ（ｘ）＞０のとき正例、それ以外では負例と分類するモデルである。

　一般的に、学習された分類モデルにおいて、入力データに合致して重みが「０」でないデータ項目を説明としてユーザに提示する。例えば、分類モデルがｍ（ｘ）＝７ｘ_１－２ｘ_３－６ｘ_５であるときに、入力ｘ＝（０,１,１,０,１）を入力した場合、分類モデルによる予測値ｍ（ｘ）は「－８」となる。このとき、ｘ_３とｘ_５に起因して負例と分類されていることから、特に「ｘ_５」が重要としてユーザに提示することができる。このように、対話的アプローチにより学習が進むと、ロス関数内のペナルティの調整により重みが「０」のデータ項目が増えて簡潔な説明になるが、説明の簡潔さと分類精度はトレードオフの関係にある。

　図２は、一般技術の問題点を説明する図である。図２に示すように、データ項目を増やせば分類精度は向上するが、回帰式が長くなるので、ユーザによる「ある入力に対するモデルの出力を予測する」タスクにかかる時間が長くなる。つまり、ユーザが各データ項目について解釈可能か否かを判定し、ユーザによる評価を取得するまでの時間が長くなり、分類モデルの生成に時間がかかる。一方、回帰式を短くすると、ユーザが解釈することが難しいデータ項目ｘ_２、ｘ_５、ｘ_８（解釈しやすさ＝×）などが多く使用されることもあり、ユーザによるタスクの処理時間が短縮できるとも限らない。

　そこで、実施例１にかかる情報処理装置１０は、各データ項目の解釈しやすさを仮定した定式化の下で最適化を行い、ユーザに「１つのデータ項目を評価する」という平易なタスクを課し実際の解釈しやすさを得る。そして、情報処理装置１０は、最適値の上界や下界を管理することで、それに基づいてユーザに評価してもらうデータ項目を効果的に決定する。

　具体的には、情報処理装置１０は、各データ項目を含む訓練データセットを用いて学習された分類モデルを取得する。そして、情報処理装置１０は、訓練データセットに含まれる各データ項目のそれぞれに関して、データ項目が解釈しやすいと仮定した第１の仮定において、データ項目が解釈しやすさを損失の重みとして有するロス関数を、訓練データセットを用いて最適化した第１の値を算出する。同様に、情報処理装置１０は、データ項目が解釈しやすいと仮定した第２の仮定において、訓練データセットを用いて、ロス関数を最適化した第２の値を算出する。そして、情報処理装置１０は、各データ項目それぞれについての第１の値および２の値の変化に基づき、各データ項目の中から特定のデータ項目を選択し、特定のデータ項目に対するユーザの評価を用いて、分類モデルの再学習を実行する。

　例えば、図１に示すように、情報処理装置１０は、ロス関数の最適化により推薦するデータ項目を探索して、探索されたデータ項目をユーザに提案する。そして、情報処理装置１０は、提案されたデータ項目に対するユーザ評価を取得して、ユーザ評価を考慮して分類モデル（線形モデル）の再学習を実行し、ユーザに提示する。また、情報処理装置１０は、提案された分類モデルに対するユーザ評価を取得して、ユーザに提案するデータ項目の探索を再度実行する。

　つまり、情報処理装置１０は、学習履歴に基づいてデータ項目をユーザに推薦する際に、データ項目数を減らしてタスクを平易化し、ユーザ評価とその評価に基づく再学習を繰り返すことで、データ項目の解釈しやすさを考慮したモデル作成を実現する。このようにして、情報処理装置１０は、モデルの解釈のしやすさの向上を図ることができる。なお、本実施例で使用する「データ項目が解釈しやすい」とは、「モデルへの出現しやすさ」と同義である。

［機能構成］
　図３は、実施例１にかかる情報処理装置１０の機能構成を示す機能ブロック図である。図３に示すように、情報処理装置１０は、通信部１１、表示部１２、記憶部１３、制御部２０を有する。

　通信部１１は、他の装置との間の通信を制御する処理部であり、例えば通信インタフェースにより実現される。例えば、通信部１１は、管理者端末などから訓練データセットや処理開始などの各種指示を受信し、学習後の分類モデルを管理者端末に送信する。

　表示部１２は、制御部２０により生成される各種情報を出力する処理部であり、例えばディスプレイやタッチパネルなどにより実現される。

　記憶部１３は、各種データや制御部２０が実行するプログラムなどを記憶する記憶装置の一例であり、例えばメモリやハードディスクにより実現される。この記憶部１３は、訓練データセット１４と分類モデル１５を記憶する。

　訓練データセット１４は、分類モデル１５の学習に使用された訓練データである。図４は、訓練データセット１４の一例を説明する図である。図４に示すように、訓練データセット１４は、説明変数である複数のデータ項目と目的変数である正解情報（ラベル）とが対応付けられた複数の訓練データから構成される。

　具体的には、図４に示すように、データａ、ｂ、ｃ、ｄ、ｅ、ｆのそれぞれは、データ項目ｘ_ｉ（ｉ＝１から８）とラベルとから構成される。例えば、データａは、「データ項目ｘ_１，ｘ_２，ｘ_３，ｘ_４，ｘ_５，ｘ_６，ｘ_７，ｘ_８」として「１，０，０，０，０，０，１，１」が設定されており、ラベルとして「正例」が設定されている。

　分類モデル１５は、訓練データセット１４を用いて学習された学習済みのモデルである。例えば、分類モデル１５は、式（３）に示す線形モデルｍ（ｘ）であり、入力に対する予測値ｍ（ｘ）が０より大きければ「正例」、予測値ｍ（ｘ）が０以下であれば「負例」と分類される。なお、分類モデル１５は、後述する学習部２１によって学習される。

　制御部２０は、情報処理装置１０全体を司る処理部であり、例えばプロセッサなどにより実現される。この制御部２０は、学習部２１、対話処理部２２、出力部２６を有する。なお、学習部２１、対話処理部２２、出力部２６は、プロセッサなどの電子回路として実現することもでき、プロセッサが実行するプロセスとして実現することもできる。

　学習部２１は、分類モデル１５の学習を実行する処理部である。具体的には、学習部２１は、訓練データセット１４を用いて分類モデル１５を学習し、学習が完了すると、学習済みである分類モデル１５を記憶部１３に格納する。

　ここで、学習に使用するロス関数と分類モデルについて説明する。式（４）に示すロス関数Ｌは、分類誤差と重みペナルティとの和により定義される。ここで、Ｘは、訓練データの説明変数であり、ｙは、訓練データの目的変数（ラベル）である。また、ρは、予め設定する定数であり、ｗ_ｉは、人間にタスクを課すことで真の値が判明する値である。なお、データ項目ｉが解釈しやすい場合、ｗ_ｉ＝ｗ_－が設定され、データ項目ｉが解釈しにくい場合、ｗ_ｉ＝ｗ_＋が設定され、ｗ_－およびｗ_＋は、予め与える入力パラメータである。実施例１では、ｗ_－＝１．０、ｗ_＋＝１．５とする。

　図５は、ロス関数を説明する図である。図５に示すように、学習部２１は、ロス関数Ｌの「Ｘ」に、訓練データセット１４の各データの説明変数（データ項目）を行とする８行６列の行列が代入される。例えば、Ｘの１行目にデータａの「ｘ_１，ｘ_２，ｘ_３，ｘ_４，ｘ_５，ｘ_６，ｘ_７，ｘ_８＝１，０，０，０，０，０，１，１」、２行目にデータｂの「ｘ_１，ｘ_２，ｘ_３，ｘ_４，ｘ_５，ｘ_６，ｘ_７，ｘ_８＝１，１，１，１，０，０，１，１」、３行目にデータｃの「ｘ_１，ｘ_２，ｘ_３，ｘ_４，ｘ_５，ｘ_６，ｘ_７，ｘ_８＝０，０，０，０，１，１，１，１」、４行目にデータｄの「ｘ_１，ｘ_２，ｘ_３，ｘ_４，ｘ_５，ｘ_６，ｘ_７，ｘ_８＝１，１，１，１，０，０，０，０」、５行目にデータｅの「ｘ_１，ｘ_２，ｘ_３，ｘ_４，ｘ_５，ｘ_６，ｘ_７，ｘ_８＝０，１，１，１，１，１，０，０」、６行目にデータｆの「ｘ_１，ｘ_２，ｘ_３，ｘ_４，ｘ_５，ｘ_６，ｘ_７，ｘ_８＝０，１，１，１，１，１，１，１」が設定される。

　また、ロス関数Ｌの「ｙ」には、訓練データセット１４の各データのラベルを行とする１行６列の行列が代入される。例えば、ｙの１行目にデータａの「ラベル＝正例」、２行目にデータｂの「ラベル＝正例」、３行目にデータｃの「ラベル＝正例」、４行目にデータｄの「ラベル＝負例」、５行目にデータｅの「ラベル＝負例」、６行目にデータｆの「ラベル＝負例」が設定される。計算上、正例は「１」、負例は「０」に変換される。

　また、ｗ_ｉは、データ項目ごとに設定される値であり、各データ項目の解釈しやすさにより定義される。例えば、データ項目ｘ_１に対してｗ_１が設定され、データ項目ｘ_２に対してｗ_２が設定され、データ項目ｘ_３に対してｗ_３が設定され、データ項目ｘ_４に対してｗ_４が設定され、データ項目ｘ_５に対してｗ_５が設定され、データ項目ｘ_６に対してｗ_６が設定され、データ項目ｘ_７に対してｗ_７が設定され、データ項目ｘ_８に対してｗ_８が設定されて、ロス関数の最適化（最小化）が計算される。なお、学習部２１による学習時は、ｗ_ｉに対して任意の値を設定する。例えば、すべてのｗ_ｉに「１」を設定することもでき、各ｗ_ｉにランダムな値を設定することもできる。

　そして、学習部２１は、上述したように各変数に値を設定したロス関数Ｌの最適化を実行し、最適化して得られるβ_ｉを用いた、式（５）に示す分類モデルｍ（ｘ）を生成する。すなわち、学習部２１は、ロス関数Ｌを最小化して得られる回帰式による分類モデルを生成して、分類モデル１５として記憶部１３に格納する。なお、式（５）では、データ項目数がｄ個である例を示しているが、実施例１では、ｄ＝８となる。

　対話処理部２２は、推薦部２３、再学習部２４、画面表示部２５を有し、ユーザとの対話アプローチによるデータ項目に対するユーザ評価の取得、および、ユーザ評価を考慮した分類モデル１５の再学習を実行する処理部である。

　具体的には、対話処理部２２は、タスクを課していないデータ項目すべてについて「解釈しやすい」とする第１の仮定（以下では「下界」と記載する）と、タスクを課していないデータ項目すべてについて「解釈しにくい」とする第２の仮定（以下では「上界」と記載する）とを設定し、上界と下界のそれぞれについて、式（３）の最適解を管理する。

　そして、対話処理部２２は、データ項目が「解釈しやすい」と言われた場合と「解釈しにくい」と言われた場合それぞれの新たな下界と上界を考え、その結果として新たな下界による最適値と新たな上界による最適値の差が小さくなるデータ項目をユーザに推薦して、ユーザ評価をフィードバックする。この結果、対話処理部２２は、効果的にタスクを課すことで、少ないタスク回数で分類モデル１５の最適化を実現する。

　推薦部２３は、訓練データセットの各訓練データに含まれる複数のデータ項目から、ユーザに推薦する１つのデータ項目の探索を実行し、探索されたデータ項目をユーザに推薦する処理部である。

　具体的には、推薦部２３は、各データ項目が解釈しやすいと仮定された下界において、訓練データセットを用いて式（３）のロス関数を最適化した第１の最適値（第１の値）と、各データ項目が解釈しにくいと仮定された上界において、訓練データセットを用いて式（３）のロス関数を最適化した第２の最適値（第２の値）とを算出する。そして、推薦部２３は、各データ項目が下界および上界に反した場合の第１の最適値および２の最適値の変化に基づき、特定のデータ項目を推薦対象として選択する。

　ここで、データ項目の推薦について詳細に説明する。図６と図７は、データ項目の推薦を説明する図である。図６に示すように、推薦部２３は、学習済みの分類モデル「ｍ（ｘ）＝ｘ_１－２ｘ_２－ｘ_５＋２ｘ_８」の訓練データセット１４の各データ項目（ｘ_１からｘ_８）に対して、下界（ｗ_－＝１．０）と上界（ｗ_＋＝１．５）を設定する。なお、予測値は、各データ（例えばデータａ）を分類モデルｍ（ｘ）に入力したときの予測値である。

　そして、推薦部２３は、下界と上界のそれぞれについてロス関数の最適値（最小化）を算出する際に、各データ項目に矛盾（仮定に反した状態）を発生させて各最適値を算出する。

　具体的には、推薦部２３は、下界に対して、データ項目ｘ_１の下界にのみ矛盾を発生させたときの最適解、データ項目ｘ_２の下界にのみ矛盾を発生させたときの最適解、データ項目ｘ_３の下界にのみ矛盾を発生させたときの最適解、データ項目ｘ_４の下界にのみ矛盾を発生させたときの最適解、データ項目ｘ_５の下界にのみ矛盾を発生させたときの最適解、データ項目ｘ_６の下界にのみ矛盾を発生させたときの最適解、データ項目ｘ_７の下界にのみ矛盾を発生させたときの最適解、データ項目ｘ_８の下界にのみ矛盾を発生させたときの最適解をそれぞれ算出する。

　同様に、推薦部２３は、上界に対して、データ項目ｘ_１の上界にのみ矛盾を発生させたときの最適解、データ項目ｘ_２の上界にのみ矛盾を発生させたときの最適解、データ項目ｘ_３の上界にのみ矛盾を発生させたときの最適解、データ項目ｘ_４の上界に矛盾を発生させたときの最適解、データ項目ｘ_５の上界にのみ矛盾を発生させたときの最適解、データ項目ｘ_６の上界にのみ矛盾を発生させたときの最適解、データ項目ｘ_７の上界にのみ矛盾を発生させたときの最適解、データ項目ｘ_８の上界にのみ矛盾を発生させたときの最適解をそれぞれ算出する。

　このようにして、推薦部２３は、１６個の最適解（８個の上界と下界の最適解の組）を算出する。そして、図７に示すように、推薦部２３は、上界の最適値と下界の最適値の差が最も小さいデータ項目をユーザに推薦する。例えば、推薦部２３は、データ項目ｘ_３が仮定に反した場合の上界の最適値と下界の最適値との差が最も小さい場合、ユーザへ推薦するデータ項目を「ｘ_３」と決定する。

　つまり、推薦部２３は、仮定に反した状態で、影響力の小さいデータ項目を探索し、当該データ項目がモデルに出現する可能性が高いと判定して、そのデータ項目の解釈可能性をユーザに問い合わせることで、ユーザ評価を正確に機械学習にフィードバックさせる。

　再学習部２４は、推薦部２３により得られたユーザの評価を考慮して、分類モデル１５の再学習を実行する処理部である。具体的には、再学習部２４は、学習部２１と同様の手法により、訓練データセット１４と式（３）とを用いて、ロス関数Ｌを最小化して得られる回帰式による分類モデル１５を生成する。

　このとき、再学習部２４は、推薦部２３により取得されたユーザ評価を「ｗ_ｉ」に反映させて最小化を実行する。例えば、再学習部２４は、データ項目ｘ_３が「解釈しやすい」と評価された場合は「ｗ_３＝１．０」とするとともに、他のデータ項目の「ｗ_ｉ」についてはランダムな値を設定したロス関数の最小化を計算する。また、再学習部２４は、データ項目ｘ_３が「解釈しにくい」と評価された場合は「ｗ_３＝１．５」とするとともに、他のデータ項目の「ｗ_ｉ」についてはランダムな値を設定したロス関数の最小化を計算する。

　そして、再学習部２４は、ユーザ評価を「ｗ_ｉ」に反映させたロス関数を最小化して得られる回帰式による分類モデル１５をユーザに提示して、分類モデル１５そのものが解釈しやすいか否かを評価させる。

　ここで、分類モデル１５そのものが解釈しやすいと評価された場合は、そのときの分類モデル１５が最終的に得られた分類モデルと決定される。一方、分類モデル１５そのものが解釈しにくいと評価された場合は、推薦部２３によるデータ項目の探索および推薦と、再学習部２４による再学習とが再度実行される。

　画面表示部２５は、ユーザの評価を受け付けるための問い合わせ画面を生成してユーザに表示する処理部である。例えば、画面表示部２５は、推薦部２３により探索されたデータ項目が解釈しやすいか解釈しにくいかを問い合わせるための問い合わせ画面を生成してユーザに表示する。また、画面表示部２５は、再学習部２４により生成された分類モデル１５が解釈しやすいか解釈しにくいかを問い合わせるための問い合わせ画面を生成してユーザに表示する。

　なお、推薦部２３や再学習部２４は、画面表示部２５により生成される問い合わせ画面上でユーザ評価を受け付ける。また、画面表示部２５は、問い合わせ画面を情報処理装置１０の表示部１２に画面を表示することもでき、ユーザ端末に送信することもできる。

　出力部２６は、解釈しやすいと最終的に判定された分類モデル１５を出力する処理部である。例えば、出力部２６は、画面表示部２５により生成された問い合わせ画面上で、表示されている分類モデル１５が「解釈しやすい」と判定された場合、表示されている分類モデル１５を記憶部１３に格納したり、ユーザ端末に出力したり、任意の出力先に出力する。

［具体例］
　次に、図８から図１７を用いて、ユーザ評価を考慮した分類モデル１５の再学習の具体例を説明する。

（ループ１）
　図８は、具体例のループ１回目を説明する図である。図８に示すように、対話処理部２２は、学習部２１により学習された分類モデル１５「ｍ（ｘ）＝ｘ_１－２ｘ_２－ｘ_５＋２ｘ_８」の訓練データセット１４の各データ項目に下界と上界を設定する。ここで、具体例では、下界の「ｗ_－」を「１．０」、上界の「ｗ_＋」を「１．５」とする。なお、図８に示す「真のｗ」とは、各データ項目の潜在的な解釈のしやすさを表すものであり、具体例では説明を分かりやすくするために記載しているが、実際の処理においては不明な値である。

　そして、対話処理部２２は、下界と上界のそれぞれについてロス関数の最適値を算出する際に、各データ項目が仮定に反した状態を発生させて、１６個の最適解（８個の上界と下界の最適解の組）を算出し、上界の最適値と下界の最適値の差（新たな上下界の差）を算出する。

　図９は、上下界の差の算出を説明する図である。図９に示すように、データ項目ｘ_２に着目した場合、対話処理部２２は、下界と上界の値を入れ替えることで、データ項目ｘ_２が仮定に反した状態を生成する。したがって、対話処理部２２は、新しい仮定の下界について最適解を算出する際に、式（３）のロス関数の重みペナルティの「ｗ_ｉ」について「ｗ_２」のみ「１．５」として他の「ｗ」については「１．０」を入力して、式（３）を最小化する。

　このようにして、対話処理部２２は、各データ項目が仮定に反したときの新たな上界と下界とを生成し、それぞれについて最適解を算出することで、１６個の最適解（８個の上界と下界の最適解の組）を算出する。そして、対話処理部２２は、図８に示すように、データ項目「ｘ_１からｘ_８」の各新たな上下界の最適解の差を「１０，８，１１，９，１０，８，７，１０」と算出したとすると、差が最も小さいデータ項目「ｘ_７」を推薦対象に決定してユーザに推薦する。

　図１０は、問い合わせ画面例を説明する図である。図１０に示すように、対話処理部２２は、現在のモデルを示す領域５１と、データ項目の評価を受け付ける領域５２と、データ詳細の領域５３を有する問い合わせ画面５０を生成してユーザに表示する。

　具体的には、対話処理部２２は、現在のモデルを示す領域５１には、現時点での分類モデル１５（ｍ（ｘ））を表示するとともに、モデルを出力するか否かを選択させるボタンを表示する。また、対話処理部２２は、データ項目の評価を受け付ける領域５２には、推薦対象に決定された「データ項目」を表示するとともに、そのデータ項目が「解釈しやすい」か「解釈しにくいか」を選択させるボタン等を表示する。また、対話処理部２２は、データ詳細の領域５３には、訓練データセット１４を表示する。

　なお、この具体例においては、対話処理部２２は、推薦されたデータ項目「ｘ_７」に対して、ユーザから「解釈しやすい」との評価を取得したものとする。また、対話処理部２２は、分類モデル「ｍ（ｘ）＝ｘ_１－２ｘ_２－ｘ_５＋２ｘ_８」については、ユーザから「解釈しにくい」との評価を取得したものとする。

（ループ２）
　図１１と図１２は、具体例のループ２回目を説明する図である。図１１に示すように、対話処理部２２は、ループ１で「解釈しやすい」と評価されたデータ項目「ｘ_７」の下界と上界については「１．０」に固定する。そして、対話処理部２２は、図５で説明した同様の手法を用いて、式（３）のロス関数Ｌに訓練データセット１４を入力してロス関数の最適解を算出する際に、データ項目「ｘ_７」に対応する「ｗ_７＝１．０」を設定し、他の「ｗ」についてはランダムな値（１．０または１．５）を設定する。

　つまり、対話処理部２２は、データ項目「ｘ_７」についてのみユーザ評価「解釈しやすい」を反映させ、その他のデータ項目については評価が不明であるためにランダム値を設定した上で、分類モデルの再学習を実行する。ここで、再学習により、分類モデルが「ｍ（ｘ）＝ｘ_１－２ｘ_２－ｘ_５＋２ｘ_７」と生成されたとする。

　続いて、対話処理部２２は、再学習後の分類モデル「ｍ（ｘ）＝ｘ_１－２ｘ_２－ｘ_５＋２ｘ_７」を領域５１に表示させた問い合わせ画面５０を生成してユーザに表示する。ここで、対話処理部２２は、分類モデル「ｍ（ｘ）＝ｘ_１－２ｘ_２－ｘ_５＋２ｘ_７」に対してユーザ評価「解釈しにくい」を取得したために、推薦するデータ項目の探索を実行する。

　具体的には、図１２に示すように、対話処理部２２は、評価済みのデータ項目「ｘ_７」以外の他の各データ項目が仮定に反したときの新たな上界と下界とを生成し、それぞれについて最適解を算出することで、１４個の最適解（７個の上界と下界の最適解の組）を算出する。そして、対話処理部２２は、図１０に示すように、データ項目「ｘ_７」を除くデータ項目「ｘ_１からｘ_８」の各新たな上下界の最適解の差を「９，８，１１，６，１０，８，－，１０」と算出したとすると、差が最も小さいデータ項目「ｘ_４」を推薦対象に決定する。そして、対話処理部２２は、データ項目「ｘ_４」を領域５２に表示させた問い合わせ画面５０を生成してユーザに表示して、データ項目「ｘ_４」をユーザに推薦する。

　なお、この具体例においては、対話処理部２２は、推薦されたデータ項目「ｘ_４」に対して、ユーザから「解釈しやすい」との評価を取得したものとする。

（ループ３）
　図１３と図１４は、具体例のループ３回目を説明する図である。図１３に示すように、対話処理部２２は、ループ１で「解釈しやすい」と評価されたデータ項目「ｘ_７」およびループ２で「解釈しやすい」と評価されたデータ項目「ｘ_４」の下界と上界については「１．０」に固定する。そして、対話処理部２２は、図５で説明した同様の手法を用いて、式（３）のロス関数Ｌに訓練データセット１４を入力してロス関数の最適解を算出する際に、データ項目「ｘ_７」に対応する「ｗ_７＝１．０」およびデータ項目「ｘ_４」に対応する「ｗ_４＝１．０」を設定し、他の「ｗ」についてはランダムな値を設定する。

　つまり、対話処理部２２は、データ項目「ｘ_７」とデータ項目「ｘ_４」についてのみユーザ評価「解釈しやすい」を反映させ、その他のデータ項目については評価が不明であるためにランダム値を設定した上で、分類モデルの再学習を実行する。ここで、再学習により、分類モデルが「ｍ（ｘ）＝ｘ_１－２ｘ_４－ｘ_５＋２ｘ_７」と生成されたとする。

　続いて、対話処理部２２は、再学習後の分類モデル「ｍ（ｘ）＝ｘ_１－２ｘ_４－ｘ_５＋２ｘ_７」を領域５１に表示させた問い合わせ画面５０を生成してユーザに表示する。ここで、対話処理部２２は、分類モデル「ｍ（ｘ）＝ｘ_１－２ｘ_４－ｘ_５＋２ｘ_７」に対してユーザ評価「解釈しにくい」を取得したために、推薦するデータ項目の探索を実行する。

　具体的には、図１４に示すように、対話処理部２２は、評価済みのデータ項目「ｘ_７」と「ｘ_４」以外の他の各データ項目が仮定に反したときの新たな上界と下界とを生成し、それぞれについて最適解を算出することで、１２個の最適解（６個の上界と下界の最適解の組）を算出する。そして、対話処理部２２は、図１４に示すように、データ項目「ｘ_７」と「ｘ_４」を除くデータ項目「ｘ_１からｘ_８」の各新たな上下界の最適解の差を「９，８，９，－，６，８，－，８」と算出したとすると、差が最も小さいデータ項目「ｘ_５」を推薦対象に決定する。そして、対話処理部２２は、データ項目「ｘ_５」を領域５２に表示させた問い合わせ画面５０を生成してユーザに表示して、データ項目「ｘ_５」をユーザに推薦する。

　なお、この具体例においては、対話処理部２２は、推薦されたデータ項目「ｘ_５」に対して、ユーザから「解釈しにくい」との評価を取得したものとする。

（ループ４）
　図１５と図１６は、具体例のループ４回目を説明する図である。図１５に示すように、対話処理部２２は、ループ１で「解釈しやすい」と評価されたデータ項目「ｘ_７」およびループ２で「解釈しやすい」と評価されたデータ項目「ｘ_４」の下界と上界については「１．０」に固定し、ループ３で「解釈しにくい」と評価されたデータ項目「ｘ_５」の下界と上界については「１．５」に固定する。

　そして、対話処理部２２は、図５で説明した同様の手法を用いて、式（３）のロス関数Ｌに訓練データセット１４を入力してロス関数の最適解を算出する際に、データ項目「ｘ_７」に対応する「ｗ_７＝１．０」およびデータ項目「ｘ_４」に対応する「ｗ_４＝１．０」を設定するとともに、データ項目「ｘ_５」に対応する「ｗ_５＝１．５」を設定し、他の「ｗ」についてはランダムな値を設定する。

　つまり、対話処理部２２は、データ項目「ｘ_７」とデータ項目「ｘ_４」についてユーザ評価「解釈しやすい」を反映させ、データ項目「ｘ_５」についてユーザ評価「解釈しにくい」を反映させ、その他のデータ項目については評価が不明であるためにランダム値を設定した上で、分類モデルの再学習を実行する。ここで、再学習により、分類モデルが「ｍ（ｘ）＝ｘ_１－２ｘ_４－ｘ_５＋２ｘ_７」と生成されたとする。

　続いて、対話処理部２２は、再学習後の分類モデル１５「ｍ（ｘ）＝ｘ_１－２ｘ_４－ｘ_５＋２ｘ_７」を領域５１に表示させた問い合わせ画面５０を生成してユーザに表示する。ここで、対話処理部２２は、分類モデル「ｍ（ｘ）＝ｘ_１－２ｘ_４－ｘ_５＋２ｘ_７」に対してユーザ評価「解釈しにくい」を取得したために、推薦するデータ項目の探索を実行する。

　具体的には、図１６に示すように、対話処理部２２は、評価済みのデータ項目「ｘ_７」と「ｘ_４」と「ｘ_５」以外の他の各データ項目を矛盾させたときの新たな上界と下界とを生成し、それぞれについて最適解を算出することで、１０個の最適解（５個の上界と下界の最適解の組）を算出する。そして、対話処理部２２は、図１６に示すように、データ項目「ｘ_７」と「ｘ_４」と「ｘ_５」を除くデータ項目「ｘ_１からｘ_８」の各新たな上下界の最適解の差を「６，７，８，－，－，５，－，８」と算出したとすると、差が最も小さいデータ項目「ｘ_６」を推薦対象に決定する。そして、対話処理部２２は、データ項目「ｘ_６」を領域５２に表示させた問い合わせ画面５０を生成してユーザに表示して、データ項目「ｘ_６」をユーザに推薦する。

　なお、この具体例においては、対話処理部２２は、推薦されたデータ項目「ｘ_６」に対して、ユーザから「解釈しやすい」との評価を取得したものとする。

（ループ５）
　図１７は、具体例のループ５回目を説明する図である。図１７に示すように、対話処理部２２は、ループ１で「解釈しやすい」と評価されたデータ項目「ｘ_７」とループ２で「解釈しやすい」と評価されたデータ項目「ｘ_４」とループ４で「解釈しやすい」と評価されたデータ項目「ｘ_６」の下界と上界については「１．０」に固定し、ループ３で「解釈しにくい」と評価されたデータ項目「ｘ_５」の下界と上界については「１．５」に固定する。

　そして、対話処理部２２は、図５で説明した同様の手法を用いて、式（３）のロス関数Ｌに訓練データセット１４を入力してロス関数の最適解を算出する際に、データ項目「ｘ_７」に対応する「ｗ_７＝１．０」、データ項目「ｘ_４」に対応する「ｗ_４＝１．０」、データ項目「ｘ_６」に対応する「ｗ_６＝１．０」を設定するとともに、データ項目「ｘ_５」に対応する「ｗ_５＝１．５」を設定し、他の「ｗ」についてはランダムな値を設定する。

　つまり、対話処理部２２は、データ項目「ｘ_７」、「ｘ_４」、「ｘ_６」についてユーザ評価「解釈しやすい」を反映させ、データ項目「ｘ_５」についてユーザ評価「解釈しにくい」を反映させ、その他のデータ項目については評価が不明であるためにランダム値を設定した上で、分類モデルの再学習を実行する。ここで、再学習により、分類モデルが「ｍ（ｘ）＝ｘ_１－２ｘ_４－ｘ_６＋２ｘ_７」と生成されたとする。

　続いて、対話処理部２２は、再学習後の分類モデル「ｍ（ｘ）＝ｘ_１－２ｘ_４－ｘ_６＋２ｘ_７」を領域５１に表示させた問い合わせ画面５０を生成してユーザに表示する。ここで、対話処理部２２は、分類モデル「ｍ（ｘ）＝ｘ_１－２ｘ_４－ｘ_６＋２ｘ_７」に対してユーザ評価「解釈しやすい」を取得したとする。

　すると、対話処理部２２は、ユーザが解釈しやすい線形モデルが生成できたと判定して探索および再学習を終了し、現時点の分類モデル「ｍ（ｘ）＝ｘ_１－２ｘ_４－ｘ_６＋２ｘ_７」を、分類モデル１５として記憶部１３に出力する。

［処理の流れ］
　図１８は、処理の流れを示すフローチャートである。図１８に示すように、学習部２１は、モデル（分類モデル）の学習を実行して記憶部１３に格納する（Ｓ１０１）。続いて、対話処理部２２は、上界や下界を設定するなどの初期化を実行する（Ｓ１０２）。

　そして、対話処理部２２は、訓練データセット１４の各データ項目について、仮定に反した場合の上界の最適値と下界の最適値の差分を算出し（Ｓ１０３）、差分が最小のデータ項目をユーザに推薦する（Ｓ１０４）。

　その後、対話処理部２２は、推薦したデータ項目に対するユーザ評価を取得し（Ｓ１０５）、推薦したデータ項目にはユーザ評価を反映させ、未評価のデータ項目の解釈しやすさをランダムに仮定して、モデルを再学習する（Ｓ１０６）。

　そして、対話処理部２２は、再学習後のモデルを提示し（Ｓ１０７）、ユーザの条件を満たした場合（Ｓ１０８：Ｙｅｓ）、現モデルを出力する（Ｓ１０９）。一方、対話処理部２２は、ユーザの条件を満たしていない場合（Ｓ１０８：Ｎｏ）、Ｓ１０３以降を繰り返す。

［効果］
　上述したように、情報処理装置１０は、人間に「１つのデータ項目を評価する」という平易なタスクを課し実際の解釈しやすさを得ることができる。また、情報処理装置１０は、個々のデータ項目の出現頻度を調整しながらロス関数の最適化に基づく分類モデルを生成することができる。この結果、情報処理装置１０は、人間にとって少ない負担で、解釈可能性が高い分類モデルを生成することができる。

　さて、これまで本発明の実施例について説明したが、本発明は上述した実施例以外にも、種々の異なる形態にて実施されてよいものである。

［数値等］
　上記実施例で用いた数値例、ロス関数、データ項目数、訓練データ数等は、あくまで一例であり、任意に変更することができる。また、分類モデルの生成に用いるロス関数は、式（３）に示したものに限らず、「解釈しやすい」または「解釈しにくい」により変化する重みペナルティを含む他の目的関数を採用することもできる。また、処理の流れも矛盾のない範囲内で適宜変更することができる。また、学習部２１を実行する装置と、対話処理部２２および出力部２６を実行する装置とを別々の装置で実現することもできる。

［モデル等］
　上記実施例では、一度学習されたモデルに対して、ユーザ評価を反映させて再学習する例を説明したが、これに限定されるものではなく、学習前のモデルに対して、上記実施例の手法によりユーザ評価を反映させて学習することもできる。また、線形モデルの生成（再学習）を終了するタイミングは、ユーザ評価に限らず、所定回数実行した場合など任意に設定することができる。また、上記実施例では、目的関数の一例としてロス関数（損失関数）を用いた例で説明したが、これに限定されるものではなく、コスト関数など他の目的関数を採用することができる。

［システム］
　上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。なお、学習部２１は、取得部の一例であり、推薦部２３は、算出部と選択部の一例であり、再学習部２４は、生成部の一例である。

　また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散や統合の具体的形態は図示のものに限られない。つまり、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。

　さらに、各装置にて行なわれる各処理機能は、その全部または任意の一部が、ＣＰＵおよび当該ＣＰＵにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。

［ハードウェア］
　次に、情報処理装置１０のハードウェア構成例を説明する。図１９は、ハードウェア構成例を説明する図である。図１９に示すように、情報処理装置１０は、通信装置１０ａ、ＨＤＤ（Hard　Disk　Drive）１０ｂ、メモリ１０ｃ、プロセッサ１０ｄを有する。また、図１９に示した各部は、バス等で相互に接続される。

　通信装置１０ａは、ネットワークインタフェースカードなどであり、他のサーバとの通信を行う。ＨＤＤ１０ｂは、図３に示した機能を動作させるプログラムやＤＢを記憶する。

　プロセッサ１０ｄは、図３に示した各処理部と同様の処理を実行するプログラムをＨＤＤ１０ｂ等から読み出してメモリ１０ｃに展開することで、図３等で説明した各機能を実行するプロセスを動作させる。例えば、このプロセスは、情報処理装置１０が有する各処理部と同様の機能を実行する。具体的には、プロセッサ１０ｄは、学習部２１、対話処理部２２、出力部２６等と同様の機能を有するプログラムをＨＤＤ１０ｂ等から読み出す。そして、プロセッサ１０ｄは、学習部２１、対話処理部２２、出力部２６等と同様の処理を実行するプロセスを実行する。

　このように、情報処理装置１０は、プログラムを読み出して実行することでモデル生成方法を実行する情報処理装置として動作する。また、情報処理装置１０は、媒体読取装置によって記録媒体から上記プログラムを読み出し、読み出された上記プログラムを実行することで上記した実施例と同様の機能を実現することもできる。なお、この他の実施例でいうプログラムは、情報処理装置１０によって実行されることに限定されるものではない。例えば、他のコンピュータまたはサーバがプログラムを実行する場合や、これらが協働してプログラムを実行するような場合にも、本発明を同様に適用することができる。

　１０　情報処理装置
　１１　通信部
　１２　表示部
　１３　記憶部
　１４　訓練データセット
　１５　分類モデル
　２０　制御部
　２１　学習部
　２２　対話処理部
　２３　推薦部
　２４　再学習部
　２５　画面表示部
　２６　出力部

Claims

　コンピュータに、
　線形モデルの生成に利用される訓練データセットを取得し、
　前記訓練データセットに含まれる各データ項目のそれぞれに関して、ユーザにとって解釈しやすいと仮定した第１の仮定において、データ項目が前記第１の仮定に反した各第１の状態について、前記訓練データセットを用いて前記データ項目の解釈しやすさを損失の重みとして有する目的関数を最適化した各第１の値を算出し、前記データ項目が前記ユーザにとって解釈にしくいと仮定した第２の仮定において、前記データ項目が前記第２の仮定に反した各第２の状態について、前記訓練データセットを用いて前記目的関数を最適化した各第２の値を算出し、
　前記各データ項目それぞれについての前記各第１の値および前記各第２の値に基づき、前記各データ項目の中から特定のデータ項目を選択し、
　前記特定のデータ項目に対するユーザの評価を用いて、前記線形モデルを生成する
　処理を実行させることを特徴とするモデル生成プログラム。
　前記選択する処理は、前記各データ項目それぞれについて、前記データ項目が前記第１の状態である場合の前記第１の値と前記第２の状態である場合の前記第２の値との差を算出し、前記差が最も小さいデータ項目を前記特定のデータ項目として選択することを特徴とする請求項１に記載のモデル生成プログラム。
　前記生成する処理は、前記特定のデータ項目に対して前記ユーザが解釈しやすいまたは解釈しにくいと評価した評価結果を取得し、前記評価結果に基づき前記特定のデータ項目に対応する前記損失の重みを決定し、前記特定のデータ項目以外の他のデータ項目に対応する前記損失の重みを前記第１の仮定または前記第２の仮定のいずれかに決定し、決定した各損失の重みを設定した前記目的関数を最適化して得られる回帰式による前記線形モデルを生成することを特徴とする請求項２に記載のモデル生成プログラム。
　前記算出する処理は、所定の条件を満たす前記線形モデルが生成されるまで、前記ユーザによる評価が得られたデータ項目について前記損失の重みを確定させた状態で、前記ユーザによる評価が未評価である各データ項目に対する前記各第１の値および前記各第２の値を算出し、
　前記選択する処理は、前記特定のデータ項目を選択し、
　前記生成する処理は、前記各データ項目に対応する評価状況に基づき、前記各データ項目に対応する各損失の重みを設定した前記目的関数を最適化して得られる回帰式による前記線形モデルを生成することを特徴とする請求項３に記載のモデル生成プログラム。
　前記取得する処理は、前記各データ項目に対する各損失の重みがランダムに設定された前記目的関数と、前記訓練データセットとを用いて学習された学習済みの線形モデルを取得し、
　前記生成する処理は、前記学習済みの線形モデルに対して、前記各データ項目に対応する評価状況に基づき、前記各データ項目に対応する各損失の重みを設定した前記目的関数を用いて、前記線形モデルの再学習を実行することを特徴とする請求項４に記載のモデル生成プログラム。
　コンピュータが、
　線形モデルの生成に利用される訓練データセットを取得し、
　前記訓練データセットに含まれる各データ項目のそれぞれに関して、ユーザにとって解釈しやすいと仮定した第１の仮定において、データ項目が前記第１の仮定に反した各第１の状態について、前記訓練データセットを用いて前記データ項目の解釈しやすさを損失の重みとして有する目的関数を最適化した各第１の値を算出し、前記データ項目が前記ユーザにとって解釈にしくいと仮定した第２の仮定において、前記データ項目が前記第２の仮定に反した各第２の状態について、前記訓練データセットを用いて前記目的関数を最適化した各第２の値を算出し、
　前記各データ項目それぞれについての前記各第１の値および前記各第２の値に基づき、前記各データ項目の中から特定のデータ項目を選択し、
　前記特定のデータ項目に対するユーザの評価を用いて、前記線形モデルを生成する
　処理を実行することを特徴とするモデル生成方法。
　線形モデルの生成に利用される訓練データセットを取得する取得部と、
　前記訓練データセットに含まれる各データ項目のそれぞれに関して、ユーザにとって解釈しやすいと仮定した第１の仮定において、データ項目が前記第１の仮定に反した各第１の状態について、前記訓練データセットを用いて前記データ項目の解釈しやすさを損失の重みとして有する目的関数を最適化した各第１の値を算出し、前記データ項目が前記ユーザにとって解釈にしくいと仮定した第２の仮定において、前記データ項目が前記第２の仮定に反した各第２の状態について、前記訓練データセットを用いて前記目的関数を最適化した各第２の値を算出する算出部と、
　前記各データ項目それぞれについての前記各第１の値および前記各第２の値に基づき、前記各データ項目の中から特定のデータ項目を選択する選択部と、
　前記特定のデータ項目に対するユーザの評価を用いて、前記線形モデルを生成する生成部と
　を有することを特徴とする情報処理装置。