JP2010218319A

JP2010218319A - 債権ポートフォリオ制御装置、債権ポートフォリオ制御プログラム及び債権ポートフォリオ制御方法

Info

Publication number: JP2010218319A
Application number: JP2009065320A
Authority: JP
Inventors: Yasunari Maeda; 康成前田; Masakiyo Suzuki; 正清鈴木; Atsushi Nakagaki; 淳中垣; Koji Katsura; 耕史桂; Toshiki Kadoi; 俊機門井; Yoshiharu Kamuro; 吉晴加室
Original assignee: KANTEC CORP; Kitami Institute of Technology NUC
Current assignee: KANTEC CORP; Kitami Institute of Technology NUC
Priority date: 2009-03-17
Filing date: 2009-03-17
Publication date: 2010-09-30
Anticipated expiration: 2029-03-17
Also published as: JP4400837B1

Abstract

【課題】設定した融資限度額の大小や経済環境等の外部要因の状況を将来の信用格付の遷移確率に反映することが可能な、債権の制御において最適な政策を選択するために用いられる債権ポートフォリオ制御装置等を提供する。
【解決手段】債権の初期状態、外部要因の初期状態、及び制御期間長が与えられると、最適政策算出部が行動決定部と連携して、各時点の債権の各状態および外部要因の各状態における各行動のもとでの期待利得を用いて、制御期間の期待総利得を最大にすることが保証された最適政策を出力する。行動決定部では、債権の状態、外部要因の状態、及び時点が与えられると、当該時点の当該状態においてそれ以降の期待総利得を最大にする最適行動と期待総利得の最大値を出力する。
【選択図】図１

Description

本発明は、債権の制御に最適な政策を選択するために用いられる債権ポートフォリオ制御装置、債権ポートフォリオ制御プログラム及び債権ポートフォリオ制御方法に関するものである。

近年、金融工学の分野においても、金融資産のリスク管理等の目的で、様々な確率モデルが利用されるようになっている（例えば、特許文献１参照）。

例えば、金融機関が顧客企業への融資を決定する際の判断材料の一つとして、各企業の信用格付に関する情報が用いられているが、企業の信用格付を状態としてとらえ、信用格付の変化についてマルコフ連鎖を用いてモデル化して評価することが行なわれている（例えば、特許文献２参照）。また、各々の信用格付状態で得られる効用とマルコフ連鎖で評価される将来の各々の信用格付状態の確率から算出される期待効用や、効用の分散などを用いた融資の判断方法がある。

特開２００２−２３０２８０号公報、ｐ．１８

小野覚、「金融リスクマネジメント」、東洋経済新報社、２００２年６月、ｐ．１３７−１７５

ところで、上述した従来の融資判断方法は、金融機関が企業を対象にして融資の判断を行う際に用いられる方法であり、個人に対する融資限度額を設定する際に用いられているものではない。

個人への融資限度額を設定する際には、設定した融資限度額の大小によって、例えば、融資限度額を大きく設定したために債務が過大となって信用格付が低下するなど、将来の個人の信用格付状態への遷移確率が異なることが起こり得るものである。しかしながら、従来の企業に対する融資判断方法では、単に信用格付の状態遷移にマルコフ連鎖を仮定しているだけで、融資限度額の大小によって将来の信用格付状態への遷移確率が異なるようなモデル化は検討されていない。

また、経済環境等の外部要因の状況によって、例えば、経済環境が悪化した環境下では信用格付が低下しやすくなるなど、個人の信用格付状態の遷移確率が異なることが起こり得るものであるが、従来の企業に対する融資判断方法では、経済環境等の外部要因の状況によって遷移確率が異なるようなモデル化は行われていない。

本発明は、従来の企業に対する融資判断方法を、個人への融資限度額の設定に適用しようとする際に生じるこれらの問題点に対し、設定した融資限度額の大小や、経済環境等の外部要因の状況を、将来の信用格付の遷移確率に反映することが可能な、融資債権等の債権の制御において、融資限度額設定等の最適な政策を選択するために用いられる債権ポートフォリオ制御装置、債権ポートフォリオ制御プログラム及び債権ポートフォリオ制御方法を提供することを目的とするものである。

本発明にかかる課題を解決する第１の発明は、債権の制御に最適な政策を選択するために用いられる債権ポートフォリオ制御装置であって、債権の初期状態及び制御期間長の入力を受け付ける初期条件受付手段と、前記初期条件受付手段が入力を受け付けた債権の初期状態を起点にして、前記初期条件受付手段が入力を受け付けた制御期間長までの各時点における債権の状態の遷移を各々のノードに展開したＤＰグラフを作成するＤＰグラフ作成手段と、一の時点から次の時点において前記一の時点において選択された行動に応じて債権の状態が遷移する各々のパターンの遷移確率を記憶する遷移確率記憶手段と、債権の状態が遷移する各々のパターンにおいて選択する行動に対応する期待利得を記憶する期待利得記憶手段と、前記ＤＰグラフ作成手段が作成したＤＰグラフの各ノードにおける債権の状態、時点について、前記遷移確率記憶手段から前記時点における前記債権の状態が次の時点に遷移する各々のパターンの遷移確率を読み出し、かつ、前記各々のパターンにおける期待利得を前記期待利得記憶手段から読み出し、前記ノードにおいて選択し得る行動毎の期待総利得を、前記遷移確率記憶手段から読み出した遷移確率のうち各々の行動に対応するパターンの遷移確率と前記期待利得から算出して、期待総利得が最大となる行動を最適行動に決定する最適行動決定手段と、前記ＤＰグラフ作成手段が作成したＤＰグラフの全てのノードについて前記最適行動決定手段が決定した最適行動を、前記債権を制御するための最適政策として出力する最適政策出力手段と、を備えることを特徴とする債権ポートフォリオ制御装置である。

第１の発明においては、最適行動を決定する際に、一の時点において選択された行動に応じて債権の状態が遷移する各々のパターンの遷移確率を用いることによって、融資限度額の設定等の行動を将来の信用格付等の債権の状態の遷移確率に反映し、期待総利得が最大となるように債権を制御するための最適政策を出力することが可能になる。

本発明にかかる課題を解決する第２の発明は、債権の制御に最適な政策を選択するために用いられる債権ポートフォリオ制御装置であって、債権の初期状態、外部要因の初期状態、及び制御期間長の入力を受け付ける初期条件受付手段と、前記初期条件受付手段が入力を受け付けた債権の初期状態と外部要因の初期状態の組合せを起点にして、前記初期条件受付手段が入力を受け付けた制御期間長までの各時点における債権の状態と外部要因の状態の組合せの遷移を各々のノードに展開したＤＰグラフを作成するＤＰグラフ作成手段と、一の時点から次の時点において外部要因の状態に応じて債権の状態が遷移する各々のパターンの遷移確率を記憶する遷移確率記憶手段と、債権の状態が遷移する各々のパターンにおいて選択する行動に対応する期待利得を記憶する期待利得記憶手段と、前記ＤＰグラフ作成手段が作成したＤＰグラフの各ノードにおける債権の状態、外部要因の状態、及び時点について、前記遷移確率記憶手段から前記外部要因の状態において前記時点における前記債権の状態が次の時点に遷移する各々のパターンの遷移確率を読み出し、かつ、前記各々のパターンにおける期待利得を前記期待利得記憶手段から読み出し、前記遷移確率と前記期待利得から前記ノードにおいて選択し得る行動毎の期待総利得を算出して、期待総利得が最大となる行動を最適行動に決定する最適行動決定手段と、前記ＤＰグラフ作成手段が作成したＤＰグラフの全てのノードについて前記最適行動決定手段が決定した最適行動を、前記債権を制御するための最適政策として出力する最適政策出力手段と、を備えることを特徴とする債権ポートフォリオ制御装置である。

第２の発明においては、最適行動を決定する際に、一の時点から次の時点において外部要因の状態に応じて債権の状態が遷移する各々のパターンの遷移確率を用いることによって、経済環境等の外部要因の状況を将来の信用格付等の債権の状態の遷移確率に反映し、期待総利得が最大となるように債権を制御するための最適政策を出力することが可能になる。

また、第２の発明は、前記遷移確率記憶手段には、一の時点から次の時点において外部要因の状態に応じて債権の状態が遷移する各々のパターンの遷移確率が前記一の時点において選択された行動に応じてそれぞれ記憶されていて、前記最適行動決定手段は、前記ノードにおいて選択し得る行動毎の期待総利得を算出する際に、前記遷移確率記憶手段から読み出した遷移確率のうち、各々の行動に対応するパターンの遷移確率を用いることを特徴とすることもできる。

このように構成すると、融資限度額の設定等の行動と経済環境等の外部要因の状況の双方を将来の信用格付等の債権の状態の遷移確率に反映し、期待総利得が最大となるように債権を制御するための最適政策を出力することが可能になる。

さらに、本発明は、前記遷移確率記憶手段には、一の時点から次の時点において外部要因の状態が遷移する各々のパターンの遷移確率が記憶されていて、前記最適行動決定手段は、少なくとも一のノードについて、前記遷移確率記憶手段から前記時点における前記外部要因の状態が次の時点に遷移する各々のパターンの遷移確率を読み出し、前記遷移確率を反映した期待総利得を算出して、前記最適行動を決定することを特徴とすることもできる。

このように構成すると、経済環境等の外部要因の状況が遷移する確率を反映し、期待総利得が最大となるように債権を制御するための最適政策を出力することが可能になる。

さらに、本発明は、前記初期条件受付手段は、対象となる債権が新規債権か既存債権かを識別する債権識別情報の入力を受け付け、前記期待利得記憶手段には、新規債権についての債権の状態が遷移する各々のパターンにおいて選択する行動に対応する期待利得が既存債権についての期待利得とは別に記憶されていて、前記最適行動決定手段は、前記初期条件受付手段が新規債権を示す債権識別情報の入力を受け付けている場合には、最初の時点に対応するノードについて、前記期待利得記憶手段から新規債権についての期待利得を読み出し、前記期待利得を反映した期待総利得を算出して、前記最適行動を決定することを特徴とすることもできる。

このように構成すると、過去の実績を有しない新規債権について生じる固有の影響も考慮した、期待総利得が最大となるように債権を制御するための最適政策を出力することが可能になる。

本発明は、本発明にかかる債権ポートフォリオ制御装置に備えられる債権ポートフォリオ制御プログラムとして特定することもできる。

第１の発明に対応する債権ポートフォリオ制御プログラムは、債権の制御に最適な政策を選択するために用いられる債権ポートフォリオ制御プログラムであって、一の時点から次の時点において前記一の時点において選択された行動に応じて債権の状態が遷移する各々のパターンの遷移確率を記憶する遷移確率記憶手段と、債権の状態が遷移する各々のパターンにおいて選択する行動に対応する期待利得を記憶する期待利得記憶手段とを備えた債権ポートフォリオ制御装置に、債権の初期状態及び制御期間長の入力を受け付ける初期条件受付ステップと、前記初期条件受付ステップで入力を受け付けた債権の初期状態を起点にして、前記初期条件受付ステップで入力を受け付けた制御期間長までの各時点における債権の状態の遷移を各々のノードに展開したＤＰグラフを作成するＤＰグラフ作成ステップと、前記ＤＰグラフ作成ステップで作成したＤＰグラフの各ノードにおける債権の状態、時点について、前記遷移確率記憶手段から前記時点における前記債権の状態が次の時点に遷移する各々のパターンの遷移確率を読み出し、かつ、前記各々のパターンにおける期待利得を前記期待利得記憶手段から読み出し、前記ノードにおいて選択し得る行動毎の期待総利得を、前記遷移確率記憶手段から読み出した遷移確率のうち各々の行動に対応するパターンの遷移確率と前記期待利得から算出して、期待総利得が最大となる行動を最適行動に決定する最適行動決定ステップと、前記ＤＰグラフ作成ステップで作成したＤＰグラフの全てのノードについて前記最適行動決定ステップで決定した最適行動を、前記債権を制御するための最適政策として出力する最適政策出力ステップと、を実行させることを特徴とする債権ポートフォリオ制御プログラムである。

第２の発明に対応する債権ポートフォリオ制御プログラムは、債権の制御に最適な政策を選択するために用いられる債権ポートフォリオ制御プログラムであって、一の時点から次の時点において外部要因の状態に応じて債権の状態が遷移する各々のパターンの遷移確率を記憶する遷移確率記憶手段と、債権の状態が遷移する各々のパターンにおいて選択する行動に対応する期待利得を記憶する期待利得記憶手段とを備えた債権ポートフォリオ制御装置に、債権の初期状態、外部要因の初期状態、及び制御期間長の入力を受け付ける初期条件受付ステップと、前記初期条件受付ステップで入力を受け付けた債権の初期状態と外部要因の初期状態の組合せを起点にして、前記初期条件受付ステップで入力を受け付けた制御期間長までの各時点における債権の状態と外部要因の状態の組合せの遷移を各々のノードに展開したＤＰグラフを作成するＤＰグラフ作成ステップと、前記ＤＰグラフ作成ステップで作成したＤＰグラフの各ノードにおける債権の状態、外部要因の状態、及び時点について、前記遷移確率記憶手段から前記外部要因の状態において前記時点における前記債権の状態が次の時点に遷移する各々のパターンの遷移確率を読み出し、かつ、前記各々のパターンにおける期待利得を前記期待利得記憶手段から読み出し、前記遷移確率と前記期待利得から前記ノードにおいて選択し得る行動毎の期待総利得を算出して、期待総利得が最大となる行動を最適行動に決定する最適行動決定ステップと、前記ＤＰグラフ作成ステップで作成したＤＰグラフの全てのノードについて前記最適行動決定ステップで決定した最適行動を、前記債権を制御するための最適政策として出力する最適政策出力ステップと、を実行させることを特徴とする債権ポートフォリオ制御プログラムである。

また、第２の発明に対応する債権ポートフォリオ制御プログラムは、前記遷移確率記憶手段には、一の時点から次の時点において外部要因の状態に応じて債権の状態が遷移する各々のパターンの遷移確率が前記一の時点において選択された行動に応じてそれぞれ記憶されていて、前記最適行動決定ステップでは、前記ノードにおいて選択し得る行動毎の期待総利得を算出する際に、前記遷移確率記憶手段から読み出した遷移確率のうち、各々の行動に対応するパターンの遷移確率を用いることを特徴とすることもできる。

さらに、本発明に対応する債権ポートフォリオ制御プログラムは、前記遷移確率記憶手段には、一の時点から次の時点において外部要因の状態が遷移する各々のパターンの遷移確率が記憶されていて、前記最適行動決定ステップでは、少なくとも一のノードについて、前記遷移確率記憶手段から前記時点における前記外部要因の状態が次の時点に遷移する各々のパターンの遷移確率を読み出し、前記遷移確率を反映した期待総利得を算出して、前記最適行動を決定することを特徴とすることもできる。

さらに、本発明に対応する債権ポートフォリオ制御プログラムは、前記初期条件受付ステップでは、対象となる債権が新規債権か既存債権かを識別する債権識別情報の入力を受け付け、前記期待利得記憶手段には、新規債権についての債権の状態が遷移する各々のパターンにおいて選択する行動に対応する期待利得が既存債権についての期待利得とは別に記憶されていて、前記最適行動決定ステップでは、前記初期条件受付ステップで新規債権を示す債権識別情報の入力を受け付けている場合には、最初の時点に対応するノードについて、前記期待利得記憶手段から新規債権についての期待利得を読み出し、前記期待利得を反映した期待総利得を算出して、前記最適行動を決定することを特徴とすることもできる。

本発明は、本発明にかかる債権ポートフォリオ制御装置によって実行される、債権ポートフォリオ制御方法として特定することもできる。

第１の発明に対応する債権ポートフォリオ制御方法は、債権の制御に最適な政策を選択するために用いられる債権ポートフォリオ方法であって、一の時点から次の時点において前記一の時点において選択された行動に応じて債権の状態が遷移する各々のパターンの遷移確率を記憶する遷移確率記憶手段と、債権の状態が遷移する各々のパターンにおいて選択する行動に対応する期待利得を記憶する期待利得記憶手段とを備えた債権ポートフォリオ制御装置が、債権の初期状態及び制御期間長の入力を受け付ける初期条件受付ステップと、前記債権ポートフォリオ制御装置が、前記初期条件受付ステップで入力を受け付けた債権の初期状態を起点にして、前記初期条件受付ステップで入力を受け付けた制御期間長までの各時点における債権の状態の遷移を各々のノードに展開したＤＰグラフを作成するＤＰグラフ作成ステップと、前記債権ポートフォリオ制御装置が、前記ＤＰグラフ作成ステップで作成したＤＰグラフの各ノードにおける債権の状態、時点について、前記遷移確率記憶手段から前記時点における前記債権の状態が次の時点に遷移する各々のパターンの遷移確率を読み出し、かつ、前記各々のパターンにおける期待利得を前記期待利得記憶手段から読み出し、前記ノードにおいて選択し得る行動毎の期待総利得を、前記遷移確率記憶手段から読み出した遷移確率のうち各々の行動に対応するパターンの遷移確率と前記期待利得から算出して、期待総利得が最大となる行動を最適行動に決定する最適行動決定ステップと、前記債権ポートフォリオ制御装置が、前記ＤＰグラフ作成ステップで作成したＤＰグラフの全てのノードについて前記最適行動決定ステップで決定した最適行動を、前記債権を制御するための最適政策として出力する最適政策出力ステップと、を有することを特徴とする債権ポートフォリオ制御方法である。

第２の発明に対応する債権ポートフォリオ制御方法は、債権の制御に最適な政策を選択するために用いられる債権ポートフォリオ制御方法であって、一の時点から次の時点において外部要因の状態に応じて債権の状態が遷移する各々のパターンの遷移確率を記憶する遷移確率記憶手段と、債権の状態が遷移する各々のパターンにおいて選択する行動に対応する期待利得を記憶する期待利得記憶手段とを備えた債権ポートフォリオ制御装置が、債権の初期状態、外部要因の初期状態、及び制御期間長の入力を受け付ける初期条件受付ステップと、前記債権ポートフォリオ制御装置が、前記初期条件受付ステップで入力を受け付けた債権の初期状態と外部要因の初期状態の組合せを起点にして、前記初期条件受付ステップで入力を受け付けた制御期間長までの各時点における債権の状態と外部要因の状態の組合せの遷移を各々のノードに展開したＤＰグラフを作成するＤＰグラフ作成ステップと、前記債権ポートフォリオ制御装置が、前記ＤＰグラフ作成ステップで作成したＤＰグラフの各ノードにおける債権の状態、外部要因の状態、及び時点について、前記遷移確率記憶手段から前記外部要因の状態において前記時点における前記債権の状態が次の時点に遷移する各々のパターンの遷移確率を読み出し、かつ、前記各々のパターンにおける期待利得を前記期待利得記憶手段から読み出し、前記遷移確率と前記期待利得から前記ノードにおいて選択し得る行動毎の期待総利得を算出して、期待総利得が最大となる行動を最適行動に決定する最適行動決定ステップと、前記債権ポートフォリオ制御装置が、前記ＤＰグラフ作成ステップで作成したＤＰグラフの全てのノードについて前記最適行動決定ステップで決定した最適行動を、前記債権を制御するための最適政策として出力する最適政策出力ステップと、を有することを特徴とする債権ポートフォリオ制御方法である。

また、第２の発明に対応する債権ポートフォリオ制御方法は、前記遷移確率記憶手段には、一の時点から次の時点において外部要因の状態に応じて債権の状態が遷移する各々のパターンの遷移確率が前記一の時点において選択された行動に応じてそれぞれ記憶されていて、前記最適行動決定ステップでは、前記ノードにおいて選択し得る行動毎の期待総利得を算出する際に、前記遷移確率記憶手段から読み出した遷移確率のうち、各々の行動に対応するパターンの遷移確率を用いることを特徴とすることもできる。

さらに、本発明に対応する債権ポートフォリオ制御方法は、前記遷移確率記憶手段には、一の時点から次の時点において外部要因の状態が遷移する各々のパターンの遷移確率が記憶されていて、前記最適行動決定ステップでは、少なくとも一のノードについて、前記遷移確率記憶手段から前記時点における前記外部要因の状態が次の時点に遷移する各々のパターンの遷移確率を読み出し、前記遷移確率を反映した期待総利得を算出して、前記最適行動を決定することを特徴とすることもできる。

さらに、本発明に対応する債権ポートフォリオ制御方法は、前記初期条件受付ステップでは、対象となる債権が新規債権か既存債権かを識別する債権識別情報の入力を受け付け、前記期待利得記憶手段には、新規債権についての債権の状態が遷移する各々のパターンにおいて選択する行動に対応する期待利得が既存債権についての期待利得とは別に記憶されていて、前記最適行動決定ステップでは、前記初期条件受付ステップで新規債権を示す債権識別情報の入力を受け付けている場合には、最初の時点に対応するノードについて、前記期待利得記憶手段から新規債権についての期待利得を読み出し、前記期待利得を反映した期待総利得を算出して、前記最適行動を決定することを特徴とすることもできる。

本発明によって、融資債権等の債権の制御において、融資限度額設定等の最適な政策を選択する際に、設定した融資限度額の大小や経済環境等の外部要因の状況を、将来の信用格付の遷移確率に反映した行動を選択することが可能になる。これによって、従来の企業に対する融資判断において用いられているマルコフ連鎖を用いたモデルによる評価方法を、個人向けの融資にも好適なものとして適用することが可能になる。

本発明にかかる債権ポートフォリオ制御装置の原理構成図である。本発明にかかる債権ポートフォリオ制御装置による最適政策出力の原理を説明するフローチャートである。本発明にかかる債権ポートフォリオ制御装置の構成の一例を示すブロック図である。本発明にかかる債権ポートフォリオ制御装置の最適政策算出部の動作を示すフローチャートである。本発明にかかる債権ポートフォリオ制御装置の行動決定部の動作を示すフローチャートである。従来の債権ポートフォリオ制御において作成される、既存債権に関するＤＰグラフの一例を示す図である。本発明にかかる債権ポートフォリオ制御装置により作成される、既存債権に関するＤＰグラフの一例を示す図である。本発明にかかる債権ポートフォリオ制御装置により作成される、新規債権に関するＤＰグラフの一例を示す図である。従来の債権ポートフォリオ制御において、遷移確率テーブルに記憶される債権の状態の遷移確率の一例を示す図である。本発明にかかる債権ポートフォリオ制御装置の行動決定部の遷移確率テーブルに記憶された、債権の状態の遷移確率の一例を示す図である。本発明にかかる債権ポートフォリオ制御装置の行動決定部の遷移確率テーブルに記憶された、外部要因の状態の遷移確率の一例を示す図である。本発明にかかる債権ポートフォリオ制御装置の行動決定部の期待利得テーブルに記憶された、期待利得情報の一例を示す図である。本発明にかかる債権ポートフォリオ制御装置により、ＤＰグラフの各ノードについて選択された最適行動の一例を示す図である。

本発明を実施するための形態について、図面を用いて以下に詳細に説明する。尚、以下の説明は、本発明の実施形態の一例を示したものであって、本発明はかかる実施形態に限定されるものではない。例えば、以下の実施形態では、外部要因の状態と選択された行動のそれぞれの組み合わせに対応した状態遷移確率を用いることによって、経済環境等の外部要因による債権の状態の遷移確率と設定した融資限度額等の行動による債権の状態の遷移確率を反映して、最適行動を決定する方法について説明するが、状態遷移確率には、外部要因の状態又は選択された行動のいずれか一方のみの相違によるものを用いることによっても、それぞれ経済環境等の外部要因による債権の状態の遷移確率、又は設定した融資限度額等の行動による債権の状態の遷移確率を反映した最適行動を決定することが可能である。本発明は、融資先となる個人の信用格付を債権の状態、経済環境等の状況を外部要因の状態、金融機関の個人顧客に対する融資限度額の設定を行動、個人顧客への融資によって金融機関が得られる収益を期待利得として、本発明を金融機関の個人顧客への融資限度額の設定に用いると好適である。

図１は、本発明にかかる債権ポートフォリオ制御装置の原理構成を示している。本発明にかかる債権ポートフォリオ制御装置は、債権の初期状態、外部要因の初期状態、及び制御期間長が与えられると、各時点の債権の各状態および外部要因の各状態における各行動のもとでの期待利得を用いて、制御期間の期待総利得を最大にすることが保証された最適政策を出力する。

債権の初期状態、外部要因の初期状態、及び制御期間長が入力装置から入力されると、これを受け付けた最適政策算出部が、行動決定部と連携して制御期間における期待総利得を最大にする政策を出力する。行動決定部では、債権の状態、外部要因の状態、及び時点が与えられると、当該時点の当該状態においてそれ以降の期待総利得を最大にする最適行動と期待総利得の最大値を出力する。

図２のフローチャートは、本発明にかかる債権ポートフォリオ制御装置による最適政策出力の原理を示している。本発明にかかる債権ポートフォリオ制御装置による最適政策出力方法は、債権の初期状態、外部要因の初期状態、制御期間長を入力する段階（Ｓ１０）と、制御期間における期待総利得を最大にする政策を求めるために解く必要のある動的計画法（ＤＰ）の問題をＤＰグラフとして作成する段階（Ｓ２０）と、Ｓ２０において作成されたＤＰグラフに従って制御期間の最終年度から遡りながら動的計画法（ＤＰ）の問題を解いていく段階（Ｓ３０）と、Ｓ３０から与えられる各時点の債権の各状態及び外部要因の各状態において、当該時点以降の期待総利得を最大にする最適行動と期待総利得の最大値を出力する段階（Ｓ４０）と、Ｓ２０において作成されたＤＰグラフの動的計画法（ＤＰ）の問題を解き終わったかどうか判断する段階（Ｓ５０）と、制御期間における期待総利得を最大にすることが保証された最適政策を出力する段階（Ｓ６０）と、を有するものである。

以上によって、本発明にかかる債権ポートフォリオ制御装置による最適政策出力方法は、動的計画法（ＤＰ）を用いて各時点の債権の各状態および外部要因の各状態において当該時点以降の期待総利得を最大化し、最終的に制御期間における期待総利得を最大にすることが保証されている。

図３は、本発明にかかる債権ポートフォリオ制御装置のシステム構成の一例を示したものである。債権ポートフォリオ制御装置１００は、最適政策算出部１１０、行動決定部１２０を含んで構成されている。最適政策算出部１１０は、ＤＰグラフ作成器１１１と、ＤＰ実施器１１２とからなり、入力装置２００からデータの入力を受け付けて、出力装置３００に算出結果を出力する。行動決定部１２０は、行動決定器１２１と、遷移確率テーブル１２２と、期待利得テーブル１２３とからなる。

債権ポートフォリオ制御装置１００のハードウエアの構成は特に限定されるものではないが、ＣＰＵ、ＲＯＭ、ＲＡＭ、ＨＤＤを備えたコンピュータであって、ＨＤＤに格納されたアプリケーションプログラムによって所定の処理を実行するためには、ＲＯＭに記憶された入力制御や出力制御などのハードウエア制御のための基本的な各種プログラムを起動し、ＲＡＭをアプリケーションプログラムのワークエリアとして機能させながら、ＣＰＵが演算処理を行う。

最適政策算出部１１０と行動決定部１２０、すなわち、最適政策算出部１１０のＤＰグラフ作成器１１１とＤＰ実施器１１２、行動決定部１２０の行動決定器１２１は、いずれも機能的に特定されるものであって、これらの機能に対応するアプリケーションプログラムがＨＤＤからＲＡＭに読み出され、ＣＰＵで演算処理が実行されることによって、各々の機能が実現される。

また、行動決定部１２０の遷移確率テーブル１２２と期待利得テーブル１２３には、それぞれＨＤＤの所定の記憶領域が割り当てられる。入力装置２００にはキーボードやマウスなどが、出力装置３００にはディスプレイやプリンタが用いられる。

さらに、債権ポートフォリオ制御装置１００は１台のコンピュータからなるものであってもよいし、ネットワークで接続された複数のコンピュータによって構成されるものであってもよい。例えば、遷移確率テーブル１２２と期待利得テーブル１２３をデータベースサーバに備え、最適政策算出部１１０を備える端末からデータベースサーバにアクセスすることによって、両者が一体となって債権ポートフォリオ制御装置１００として動作することとしてもよい。

図４のフローチャートを用いて、債権ポートフォリオ制御装置１００の最適政策算出部１１０の動作について説明する。まず、ＤＰグラフ作成器１１１に、入力装置２００から債権の初期状態ｘ１と外部要因の初期状態ｚ１と制御期間長Ｔが入力される（Ｓ７０）。

ここで入力される値について、ｘ１は、対象となる債権が既存債権（既存の顧客）である場合には、既存債権の信用格付の状態集合
の要素である。対象となる債権が新規債権（新規の顧客）である場合には、新規債権の信用格付の状態集合
の要素である。ｚ１は、経済環境を示す指数等の外部要因の状態集合
の要素である。

債権の初期状態ｘ１と外部要因の初期状態ｚ１と制御期間長Ｔが入力されると、Ｔ年間の期待総利得を最大化するための動的計画法（ＤＰ）の問題を解くためのＤＰグラフを作成する（Ｓ７１）。例えば、既存債権に関する制御でｘ１＝ｓ１、ｚ１＝θ１、｜Ｓ｜＝２、｜Θ｜＝２の場合であれば、図７に示したようなＤＰグラフを作成する。

ここで作成されるＤＰグラフは、１年目が既存債権の初期状態と外部要因の初期状態からなるノードで表現され、２年目からＴ年目までの間は、既存債権の各状態と外部要因の各状態の組み合わせのパターンが各々のノードに展開されて、１年目からＴ年目までの間の既存債権の各状態と外部要因の各状態の組み合わせの遷移が表現されたグラフとなる。これは、末端のＴ年目のノードから遡りながら、動的計画法（ＤＰ）でＴ年間のマルコフ決定過程問題を解くことによって、Ｔ年間の期待総利得を最大化する最適政策を求めるための準備となるものである。

このＤＰグラフの特徴は、展開されたノードが債権の状態と外部要因の状態の組み合わせとなっており、各々のノードには外部要因の状態が反映されていることである。従来の企業に対する融資判断等に用いられる債権ポートフォリオ制御の考え方では、経済環境等の外部要因の状況によって信用格付の遷移確率が異なるようなモデル化は行われていないため、ここで作成されるＤＰグラフは図６の例のようになると考えられる。

一方、新規債権が対象になる場合であって、ｘ１＝ｓ´１、ｚ１＝θ１、｜Ｓ｜＝２、｜Θ｜＝２であるとすると、図８に示したようなＤＰグラフを作成する。新規の顧客への１年目となる新規債権については、融資限度額を抑えるなど既存債権とは異なる対応が行なわれることが多く、後に説明する期待利得テーブルでは既存債権と異なる値を用いることが望ましいため、１年目に既存債権とは異なる新規債権の状態と外部要因の状態の組み合わせによるノードを用いるものである。２年目以降については、新規債権も既存債権の扱いとなるため、図７と同様に既存債権の各状態と外部要因の各状態の組み合わせによるノードで表現される。

続いて、ＤＰ実施器１１２が、動的計画法でＴ年間のマルコフ決定過程問題を解くことによって、Ｔ年間の期待総利得を最大化する最適政策を求める処理を実行する。具体的には、ＤＰグラフの末端（Ｔ年目）の各ノードから順に、当該ノードでの最適行動（設定すべき融資限度額）と当該ノード以降の期待総利得の最大値を、行動決定器１２１と連携して求めるために、一のノード毎に、当該ノードの時点ｔ（何年目かという自然数）と、債権の状態ｘｔ（ｔ年目の債権の状態）と、外部要因の状態ｚｔ（ｔ年目の外部要因の状態）を行動決定器１２１に出力する（Ｓ７２）。

ＤＰ実施器１１２から、一のノード毎に、当該ノードの時点ｔ、債権の状態ｘｔ、外部要因の状態ｚｔを行動決定器１２１に出力すると、行動決定器１２１が当該ノードにおける最適行動（設定すべき融資限度額）を決定するので、ＤＰ実施器１１２は決定された最適行動を当該ノード以降の期待総利得の最大値とあわせて受け付ける（Ｓ７３）。

こうした一のノードについて最適行動と期待総利得の最大値を受け付けると、ＤＰグラフの1年目のノードまで、全てのノードについての処理が終了したかを判断し（Ｓ７４）、終了していない場合には、次のノードについて同様の処理を繰り返す。終了している場合には、ＤＰグラフの全ノードにおける最適行動（設定すべき融資限度額）と当該ノード以降の期待総利得の最大値を最適政策として出力する（Ｓ７５）。

最適政策の出力形式は特に限定されるものではないが、出力対象となる情報は、図１３の例に示したように、各々のノードについて決定された最適行動（設定すべき融資限度額）と当該ノード以降の期待総利得の最大値である。図１３の例では、最適行動（設定すべき融資限度額）の集合を
として、ｙ１＝ｇ１、｜Ｙ｜＝２であるとしている。これらの情報を一覧できる図表等の形式で出力することによって、融資限度額を設定する金融機関等は、各々の時点の顧客の信用格付と経済状態に応じて、最適行動としてどのように融資限度額を決定すればよいかを把握することが可能になる。

図５のフローチャートを用いて、債権ポートフォリオ制御装置１００の行動決定部１２０の動作について説明する。まず、行動決定部１２０の行動決定器１２１において、最適政策算出部１１０のＤＰ実施器１１２が図４のＳ７２において出力した、時点ｔ（何年目かという自然数）と、債権の状態ｘｔ（ｔ年目の債権の状態）と、外部要因の状態ｚｔ（ｔ年目の外部要因の状態）の入力を受け付ける（Ｓ８０）。

次に、債権の状態がｘｔで外部要因の状態がｚｔという条件のもとで、行動ｙｔを選択した場合に、次の年（時点）の債権の状態がｘｔ＋１になる状態遷移確率を、遷移確率テーブル１２２から読み出す（Ｓ８１）。

図１０は、ここで用いられる遷移確率テーブル１２２の一例を示したものである。債権の状態ｓ１が、次の年（時点）においてｓ１又はｓ２に遷移する確率を示したものであるが、従来の方法では、図９の例に示したように、外部要因の状態や選択された行動による状態遷移確率の相違は反映されていなかった。これに対し、図１０の例では、外部要因の状態がθ１である場合とθ２である場合、選択された行動がｇ１である場合とｇ２である場合のそれぞれの組み合わせに対応した状態遷移確率が記憶されているため、設定した融資限度額等の行動による債権の状態の遷移確率の相違や、経済環境等の外部要因による債権の状態の遷移確率の相違を反映して、最適行動を決定することが可能になる。

また、遷移確率テーブル１２２には、図１１の例に示したような、外部要因の状態の遷移確率も記憶されている。外部要因の状態遷移確率も、後に説明する部分最適解の再利用において用いられるため、ここで遷移確率テーブル１２２から読み出される。

次に、債権の状態ｘｔで行動ｙｔを選択したという条件のもとで、次の年（時点）の債権の状態がｘｔ＋１になった場合の期待利得を、期待利得テーブル１２３から読み出す（Ｓ８２）。

図１２は、ここで用いられる期待利得テーブル１２３の一例を示したものである。債権の状態が遷移するパターンに応じて、それぞれ行動としてｇ１又はｇ２のいずれかを選択した場合のそれぞれについて期待される利得が記憶されている。この期待利得にそれぞれ債権の状態の遷移確率を乗じることによって、それぞれの期待利得についてその利得が発生する確率を反映することが可能になる。

続いて、選択する行動毎（ｇ１又はｇ２）に期待総利得を算出し（Ｓ８３）、期待総利得が最大となる行動を、最適行動として決定する（Ｓ８４）。ここでの期待総利得の最大値を求めるための演算は、次のように求められる。

まず、入力を受け付けた時点ｔが、ｔ＝Ｔとなる期間の最終時点の場合については、次式によって当該ノード以降の期待総利得の最大値を求める。

ここで、ｙＴはＴ年目に選択する行動（設定すべき融資限度額）を示し、ｙＴは先に説明したとおり、行動集合
の要素である。
は、債権の状態がｘＴで、外部要因の状態がｚＴという条件のもとで行動ｙＴを選択した場合に、次の年の債権の状態がｘＴ＋１になる状態遷移確率で、遷移確率テーブル１２２から読み出したものである。
は、債権の状態ｘＴで行動ｙＴを選択したもとにおいて、次の年の債権の状態がｘＴ＋１になった場合の期待利得で、期待利得テーブル１２３から読み出したものである。

次に、入力を受け付けた時点ｔが、
となる時点である場合については、次式によって当該ノード以降の期待総利得の最大値を求める。

ただし、
は、外部要因の状態間での状態遷移確率で、遷移確率テーブル１２２から読み出したものであり、
は、時点ｔのノードについて求める以前に求めた、時点ｔ＋１において、債権の状態がｘ＋１で外部要因の状態がｚｔ＋１のノードにおける期待総利得の最大値である。本発明では動的計画法（ＤＰ）を利用しているので、このように部分最適解を再利用する。

このとき、ｔ＝Ｔの場合の当該ノードにおける最適な行動は、次式によって定義される。

また、
の場合の当該ノードにおける最適な行動は、次式によって定義される。

以上のように、ＤＰ実施器１１２から与えられた、時点ｔ（何年目かという自然数）、債権の状態ｘｔ（ｔ年目の債権の状態）、外部要因の状態ｚｔ（ｔ年目の外部要因の状態）について、期待総利得が最大となる最適行動と期待総利得の最大値が決定されると、これを最適政策算出部１１０のＤＰ実施器１１２に出力する（Ｓ８５）。ＤＰ実施器１１２では、図４のＳ７３でこれらを受け付ける処理を実行する。

１００債権ポートフォリオ制御装置
１１０最適政策算出部
１１１ＤＰグラフ作成器
１１２ＤＰ実施器
１２０行動決定部
１２１行動決定器
１２２遷移確率テーブル
１２３期待利得テーブル
２００入力装置
３００出力装置

本発明は、債権の制御に最適な政策を選択するために用いられる債権ポートフォリオ制御装置であって、債権の初期状態、外部要因の初期状態、及び制御期間長の入力を受け付ける初期条件受付手段と、前記初期条件受付手段が入力を受け付けた債権の初期状態と外部要因の初期状態の組合せを起点にして、前記初期条件受付手段が入力を受け付けた制御期間長までの各時点における債権の状態と外部要因の状態の組合せの遷移を各々のノードに展開したＤＰグラフを作成するＤＰグラフ作成手段と、一の時点から次の時点において、各々の外部要因の状態で前記一の時点において選択された行動に応じて債権の状態が遷移する各々のパターンの遷移確率である債権状態遷移確率を記憶する遷移確率記憶手段と、債権の状態が遷移する各々のパターンにおいて選択する行動に対応する期待利得を記憶する期待利得記憶手段と、前記ＤＰグラフ作成手段が作成したＤＰグラフの各ノードにおける債権の状態、外部要因の状態、及び時点について、前記遷移確率記憶手段から前記外部要因の状態において前記時点における前記債権の状態が次の時点に遷移する各々のパターンの債権状態遷移確率を読み出し、かつ、前記各々のパターンにおける期待利得を前記期待利得記憶手段から読み出し、前記ノードにおいて選択し得る行動毎の期待総利得を、前記遷移確率記憶手段から読み出した債権状態遷移確率のうち各々の行動に対応するパターンの債権状態遷移確率と前記期待利得から算出して、期待総利得が最大となる行動を最適行動に決定する最適行動決定手段と、前記ＤＰグラフ作成手段が作成したＤＰグラフの全てのノードについて前記最適行動決定手段が決定した最適行動を、前記債権を制御するための最適政策として出力する最適政策出力手段と、を備えていて、前記遷移確率記憶手段には、一の時点から次の時点において外部要因の状態が遷移する各々のパターンの遷移確率である外部要因遷移確率が記憶されていて、前記最適行動決定手段は、少なくとも一のノードについて、前記遷移確率記憶手段から前記時点における前記外部要因の状態が次の時点に遷移する各々のパターンの外部要因遷移確率を読み出し、前記外部要因遷移確率を反映した期待総利得を算出して、前記最適行動を決定することを特徴とする債権ポートフォリオ制御装置である。

本発明においては、最適行動を決定する際に、一の時点において選択された行動に応じて債権の状態が遷移する各々のパターンの遷移確率を用いることによって、融資限度額の設定等の行動を将来の信用格付等の債権の状態の遷移確率に反映し、期待総利得が最大となるように債権を制御するための最適政策を出力することが可能になる。

本発明においては、最適行動を決定する際に、一の時点から次の時点において外部要因の状態に応じて債権の状態が遷移する各々のパターンの遷移確率を用いることによって、経済環境等の外部要因の状況を将来の信用格付等の債権の状態の遷移確率に反映し、期待総利得が最大となるように債権を制御するための最適政策を出力することが可能になる。

本発明に対応する債権ポートフォリオ制御プログラムは、債権の制御に最適な政策を選択するために用いられる債権ポートフォリオ制御プログラムであって、一の時点から次の時点において、各々の外部要因の状態で前記一の時点において選択された行動に応じて債権の状態が遷移する各々のパターンの遷移確率である債権状態遷移確率を記憶する遷移確率記憶手段と、債権の状態が遷移する各々のパターンにおいて選択する行動に対応する期待利得を記憶する期待利得記憶手段とを備えた債権ポートフォリオ制御装置に、債権の初期状態、外部要因の初期状態、及び制御期間長の入力を受け付ける初期条件受付ステップと、前記初期条件受付ステップで入力を受け付けた債権の初期状態と外部要因の初期状態の組合せを起点にして、前記初期条件受付ステップで入力を受け付けた制御期間長までの各時点における債権の状態と外部要因の状態の組合せの遷移を各々のノードに展開したＤＰグラフを作成するＤＰグラフ作成ステップと、前記ＤＰグラフ作成ステップで作成したＤＰグラフの各ノードにおける債権の状態、外部要因の状態、及び時点について、前記遷移確率記憶手段から前記外部要因の状態において前記時点における前記債権の状態が次の時点に遷移する各々のパターンの債権状態遷移確率を読み出し、かつ、前記各々のパターンにおける期待利得を前記期待利得記憶手段から読み出し、前記ノードにおいて選択し得る行動毎の期待総利得を、前記遷移確率記憶手段から読み出した債権状態遷移確率のうち各々の行動に対応するパターンの債権状態遷移確率と前記期待利得から算出して、期待総利得が最大となる行動を最適行動に決定する最適行動決定ステップと、前記ＤＰグラフ作成ステップで作成したＤＰグラフの全てのノードについて前記最適行動決定ステップで決定した最適行動を、前記債権を制御するための最適政策として出力する最適政策出力ステップと、を実行させ、前記遷移確率記憶手段には、一の時点から次の時点において外部要因の状態が遷移する各々のパターンの遷移確率である外部要因遷移確率が記憶されていて、前記最適行動決定ステップでは、少なくとも一のノードについて、前記遷移確率記憶手段から前記時点における前記外部要因の状態が次の時点に遷移する各々のパターンの外部要因遷移確率を読み出し、前記外部要因遷移確率を反映した期待総利得を算出して、前記最適行動を決定することを特徴とする債権ポートフォリオ制御プログラムである。

本発明に対応する債権ポートフォリオ制御方法は、債権の制御に最適な政策を選択するために用いられる債権ポートフォリオ制御方法であって、一の時点から次の時点において、各々の外部要因の状態で前記一の時点において選択された行動に応じて債権の状態が遷移する各々のパターンの遷移確率である債権状態遷移確率を記憶する遷移確率記憶手段と、債権の状態が遷移する各々のパターンにおいて選択する行動に対応する期待利得を記憶する期待利得記憶手段とを備えた債権ポートフォリオ制御装置が、債権の初期状態、外部要因の初期状態、及び制御期間長の入力を受け付ける初期条件受付ステップと、前記債権ポートフォリオ制御装置が、前記初期条件受付ステップで入力を受け付けた債権の初期状態と外部要因の初期状態の組合せを起点にして、前記初期条件受付ステップで入力を受け付けた制御期間長までの各時点における債権の状態と外部要因の状態の組合せの遷移を各々のノードに展開したＤＰグラフを作成するＤＰグラフ作成ステップと、前記債権ポートフォリオ制御装置が、前記ＤＰグラフ作成ステップで作成したＤＰグラフの各ノードにおける債権の状態、外部要因の状態、及び時点について、前記遷移確率記憶手段から前記外部要因の状態において前記時点における前記債権の状態が次の時点に遷移する各々のパターンの債権状態遷移確率を読み出し、かつ、前記各々のパターンにおける期待利得を前記期待利得記憶手段から読み出し、前記ノードにおいて選択し得る行動毎の期待総利得を、前記遷移確率記憶手段から読み出した債権状態遷移確率のうち各々の行動に対応するパターンの債権状態遷移確率と前記期待利得から算出して、期待総利得が最大となる行動を最適行動に決定する最適行動決定ステップと、前記債権ポートフォリオ制御装置が、前記ＤＰグラフ作成ステップで作成したＤＰグラフの全てのノードについて前記最適行動決定ステップで決定した最適行動を、前記債権を制御するための最適政策として出力する最適政策出力ステップと、を有していて、前記遷移確率記憶手段には、一の時点から次の時点において外部要因の状態が遷移する各々のパターンの遷移確率である外部要因遷移確率が記憶されていて、前記債権ポートフォリオ制御装置は、前記最適行動決定ステップでは、少なくとも一のノードについて、前記遷移確率記憶手段から前記時点における前記外部要因の状態が次の時点に遷移する各々のパターンの外部要因遷移確率を読み出し、前記外部要因遷移確率を反映した期待総利得を算出して、前記最適行動を決定することを特徴とする債権ポートフォリオ制御方法である。

本発明は、債権の制御に最適な政策を選択するために用いられる債権ポートフォリオ制御装置であって、債権の初期状態ｘ _１、外部要因の初期状態ｚ _１、及び制御期間長Ｔの入力を受け付ける初期条件受付手段と、前記初期条件受付手段が入力を受け付けた債権の初期状態ｘ _１と外部要因の初期状態ｚ _１の組合せを起点にして、前記初期条件受付手段が入力を受け付けた制御期間長Ｔまでの各時点ｔ（１≦ｔ≦Ｔ）における債権の状態ｘ _ｔと外部要因の状態ｚ _ｔの組合せの遷移を各々のノードに展開したＤＰグラフを作成するＤＰグラフ作成手段と、一の時点ｔにおいて外部要因の状態ｚ _ｔで行動ｙ _ｔを選択した場合に、時点ｔにおける債権の状態ｘ _ｔが次の時点ｔ＋１において債権の状態ｘ _ｔ＋１へと遷移する遷移確率を、債権の状態ｘ _ｔと債権の状態ｘ _ｔ＋１と外部要因の状態ｚ _ｔと行動ｙ _ｔの組合せ毎に債権状態遷移確率として記憶し、かつ、一の時点ｔにおける外部要因の状態ｚ _ｔが次の時点ｔ＋１において外部要因の状態ｚ _ｔ＋１へと遷移する遷移確率を、外部要因の状態ｚ _ｔと外部要因の状態ｚ _ｔ＋１の組合せ毎に外部要因遷移確率として記憶する遷移確率記憶手段と、一の時点ｔにおいて行動ｙ _ｔを選択し、時点ｔにおける債権の状態ｘ _ｔが次の時点ｔ＋１において債権の状態ｘ _ｔ＋１へと遷移した場合に得られる期待利得を、債権の状態ｘ _ｔと債権の状態ｘ _ｔ＋１と行動ｙ _ｔの組合せ毎に記憶する期待利得記憶手段と、前記ＤＰグラフ作成手段が作成したＤＰグラフの各ノードにおける債権の状態ｘ _ｔと外部要因の状態ｚ _ｔの組合せに対して、前記遷移確率記憶手段から、時点ｔにおいて外部要因の状態ｚ _ｔで行動ｙ _ｔを選択した場合に、時点ｔにおける債権の状態ｘ _ｔが次の時点ｔ＋１において債権の状態ｘ _ｔ＋１へと遷移する債権状態遷移確率と、時点ｔにおける外部要因の状態ｚ _ｔが次の時点ｔ＋１において外部要因の状態ｚ _ｔ＋１へと遷移する外部要因遷移確率を読み出し、かつ、前記前記期待利得記憶手段から、時点ｔにおいて行動ｙ _ｔを選択し、時点ｔにおける債権の状態ｘ _ｔが次の時点ｔ＋１において債権の状態ｘ _ｔ＋１へと遷移した場合に得られる期待利得を読み出し、前記ＤＰグラフの末端（ｔ＝Ｔ）の各ノードから順に、各ノードにおいて選択し得る行動毎の期待総利得を、前記遷移確率記憶手段から読み出した各々の行動に対応する組合せの遷移確率と、前記期待利得記憶手段から読み出した各々の行動に対応する組合せの期待利得から算出して、期待総利得が最大となる行動を最適行動に決定する最適行動決定手段と、前記ＤＰグラフの全てのノードについて前記最適行動決定手段が決定した最適行動を、前記債権を制御するための最適政策として出力する最適政策出力手段と、を備え、前記最適行動決定手段は、ｔ＝Ｔとなる各ノードについては、選択可能な各々の行動ｙ _ｔについて、遷移可能な各々の債権の状態ｘ _ｔ＋１につき、該当する行動と債権の状態の組合せに対して読み出した前記期待利得に、該当する外部要因の状態と行動と債権の状態の組合せに対して読み出した前記債権状態遷移確率を乗算し、その総和である期待総利得を演算して、前記期待総利得が最大となる行動ｙ _ｔを最適行動に決定し、１≦ｔ≦Ｔ−１となる各ノードについては、選択可能な各々の行動ｙ _ｔについて、遷移可能な各々の債権の状態ｘ _ｔ＋１につき、該当する行動と債権の状態の組合せに対して読み出した前記期待利得と、遷移可能な各々の外部要因の状態ｚ _ｔ＋１についての該当するノードについて演算された前記期待総利得の最大値に読み出した前記外部要因遷移確率を乗じた値の総和とを加算した値に対して、該当する外部要因の状態と行動と債権の状態の組合せに対して読み出した前記債権状態遷移確率を乗算し、その総和である期待総利得を演算して、前記期待総利得が最大となる行動ｙ _ｔを最適行動に決定することを、ｔ＝１となる各ノードまで繰り返すことを特徴とする債権ポートフォリオ制御装置である。

さらに、本発明は、前記初期条件受付手段は、対象となる債権が新規債権か既存債権かを識別する債権識別情報の入力を受け付け、前記期待利得記憶手段には、新規債権を対象にした、最初の時点１において行動ｙ _１を選択し、時点１における債権の状態ｘ _１が次の時点２において債権の状態ｘ _２へと遷移した場合に得られる期待利得が、債権の状態ｘ _１と債権の状態ｘ _２と行動ｙ _１の組合せ毎に、既存債権についての期待利得とは別に記憶されていて、前記最適行動決定手段は、前記初期条件受付手段が新規債権を示す債権識別情報の入力を受け付けている場合には、ｔ＝１となるノードについては、前記期待利得記憶手段から新規債権についての期待利得を読み出し、前記期待利得を適用して期待総利得を演算し、前記最適行動を決定することを特徴とすることもできる。

本発明に対応する債権ポートフォリオ制御プログラムは、債権の制御に最適な政策を選択するために用いられる債権ポートフォリオ制御プログラムであって、一の時点ｔにおいて外部要因の状態ｚ _ｔで行動ｙ _ｔを選択した場合に、時点ｔにおける債権の状態ｘ _ｔが次の時点ｔ＋１において債権の状態ｘ _ｔ＋１へと遷移する遷移確率を、債権の状態ｘ _ｔと債権の状態ｘ _ｔ＋１と外部要因の状態ｚ _ｔと行動ｙ _ｔの組合せ毎に債権状態遷移確率として記憶し、かつ、一の時点ｔにおける外部要因の状態ｚ _ｔが次の時点ｔ＋１において外部要因の状態ｚ _ｔ＋１へと遷移する遷移確率を、外部要因の状態ｚ _ｔと外部要因の状態ｚ _ｔ＋１の組合せ毎に外部要因遷移確率として記憶する遷移確率記憶手段と、一の時点ｔにおいて行動ｙ _ｔを選択し、時点ｔにおける債権の状態ｘ _ｔが次の時点ｔ＋１において債権の状態ｘ _ｔ＋１へと遷移した場合に得られる期待利得を、債権の状態ｘ _ｔと債権の状態ｘ _ｔ＋１と行動ｙ _ｔの組合せ毎に記憶する期待利得記憶手段とを備えた債権ポートフォリオ制御装置に、債権の初期状態ｘ _１、外部要因の初期状態ｚ _１、及び制御期間長Ｔの入力を受け付ける初期条件受付ステップと、前記初期条件受付ステップで入力を受け付けた債権の初期状態ｘ _１と外部要因の初期状態ｚ _１の組合せを起点にして、前記初期条件受付ステップで入力を受け付けた制御期間長Ｔまでの各時点ｔ（１≦ｔ≦Ｔ）における債権の状態ｘ _ｔと外部要因の状態ｚ _ｔの組合せの遷移を各々のノードに展開したＤＰグラフを作成するＤＰグラフ作成ステップと、前記ＤＰグラフ作成ステップで作成したＤＰグラフの各ノードにおける債権の状態ｘ _ｔと外部要因の状態ｚ _ｔの組合せに対して、前記遷移確率記憶手段から、時点ｔにおいて外部要因の状態ｚ _ｔで行動ｙ _ｔを選択した場合に、時点ｔにおける債権の状態ｘ _ｔが次の時点ｔ＋１において債権の状態ｘ _ｔ＋１へと遷移する債権状態遷移確率と、時点ｔにおける外部要因の状態ｚ _ｔが次の時点ｔ＋１において外部要因の状態ｚ _ｔ＋１へと遷移する外部要因遷移確率を読み出し、かつ、前記前記期待利得記憶手段から、時点ｔにおいて行動ｙ _ｔを選択し、時点ｔにおける債権の状態ｘ _ｔが次の時点ｔ＋１において債権の状態ｘ _ｔ＋１へと遷移した場合に得られる期待利得を読み出し、前記ＤＰグラフの末端（ｔ＝Ｔ）の各ノードから順に、各ノードにおいて選択し得る行動毎の期待総利得を、前記遷移確率記憶手段から読み出した各々の行動に対応する組合せの遷移確率と、前記期待利得記憶手段から読み出した各々の行動に対応する組合せの期待利得から算出して、期待総利得が最大となる行動を最適行動に決定する最適行動決定ステップと、前記ＤＰグラフの全てのノードについて前記最適行動決定ステップで決定した最適行動を、前記債権を制御するための最適政策として出力する最適政策出力ステップと、を実行させ、前記最適行動決定ステップでは、ｔ＝Ｔとなる各ノードについては、選択可能な各々の行動ｙ _ｔについて、遷移可能な各々の債権の状態ｘ _ｔ＋１につき、該当する行動と債権の状態の組合せに対して読み出した前記期待利得に、該当する外部要因の状態と行動と債権の状態の組合せに対して読み出した前記債権状態遷移確率を乗算し、その総和である期待総利得を演算して、前記期待総利得が最大となる行動ｙ _ｔを最適行動に決定し、１≦ｔ≦Ｔ−１となる各ノードについては、選択可能な各々の行動ｙ _ｔについて、遷移可能な各々の債権の状態ｘ _ｔ＋１につき、該当する行動と債権の状態の組合せに対して読み出した前記期待利得と、遷移可能な各々の外部要因の状態ｚ _ｔ＋１についての該当するノードについて演算された前記期待総利得の最大値に読み出した前記外部要因遷移確率を乗じた値の総和とを加算した値に対して、該当する外部要因の状態と行動と債権の状態の組合せに対して読み出した前記債権状態遷移確率を乗算し、その総和である期待総利得を演算して、前記期待総利得が最大となる行動ｙ _ｔを最適行動に決定することを、ｔ＝１となる各ノードまで繰り返すことを特徴とする債権ポートフォリオ制御プログラムである。

さらに、本発明に対応する債権ポートフォリオ制御プログラムは、前記初期条件受付ステップでは、対象となる債権が新規債権か既存債権かを識別する債権識別情報の入力を受け付け、前記期待利得記憶手段には、新規債権を対象にした、最初の時点１において行動ｙ _１を選択し、時点１における債権の状態ｘ _１が次の時点２において債権の状態ｘ _２へと遷移した場合に得られる期待利得が、債権の状態ｘ _１と債権の状態ｘ _２と行動ｙ _１の組合せ毎に、既存債権についての期待利得とは別に記憶されていて、前記最適行動決定ステップでは、前記初期条件受付ステップで新規債権を示す債権識別情報の入力を受け付けている場合には、ｔ＝１となるノードについては、前記期待利得記憶手段から新規債権についての期待利得を読み出し、前記期待利得を適用して期待総利得を演算し、前記最適行動を決定することを特徴とすることもできる。

本発明に対応する債権ポートフォリオ制御方法は、債権の制御に最適な政策を選択するために用いられる債権ポートフォリオ制御方法であって、一の時点ｔにおいて外部要因の状態ｚ _ｔで行動ｙ _ｔを選択した場合に、時点ｔにおける債権の状態ｘ _ｔが次の時点ｔ＋１において債権の状態ｘ _ｔ＋１へと遷移する遷移確率を、債権の状態ｘ _ｔと債権の状態ｘ _ｔ＋１と外部要因の状態ｚ _ｔと行動ｙ _ｔの組合せ毎に債権状態遷移確率として記憶し、かつ、一の時点ｔにおける外部要因の状態ｚ _ｔが次の時点ｔ＋１において外部要因の状態ｚ _ｔ＋１へと遷移する遷移確率を、外部要因の状態ｚ _ｔと外部要因の状態ｚ _ｔ＋１の組合せ毎に外部要因遷移確率として記憶する遷移確率記憶手段と、一の時点ｔにおいて行動ｙ _ｔを選択し、時点ｔにおける債権の状態ｘ _ｔが次の時点ｔ＋１において債権の状態ｘ _ｔ＋１へと遷移した場合に得られる期待利得を、債権の状態ｘ _ｔと債権の状態ｘ _ｔ＋１と行動ｙ _ｔの組合せ毎に記憶する期待利得記憶手段とを備えた債権ポートフォリオ制御装置が、債権の初期状態ｘ _１、外部要因の初期状態ｚ _１、及び制御期間長Ｔの入力を受け付ける初期条件受付ステップと、前記債権ポートフォリオ制御装置が、前記初期条件受付ステップで入力を受け付けた債権の初期状態ｘ _１と外部要因の初期状態ｚ _１の組合せを起点にして、前記初期条件受付ステップで入力を受け付けた制御期間長Ｔまでの各時点ｔ（１≦ｔ≦Ｔ）における債権の状態ｘ _ｔと外部要因の状態ｚ _ｔの組合せの遷移を各々のノードに展開したＤＰグラフを作成するＤＰグラフ作成ステップと、前記債権ポートフォリオ制御装置が、前記ＤＰグラフ作成ステップで作成したＤＰグラフの各ノードにおける債権の状態ｘ _ｔと外部要因の状態ｚ _ｔの組合せに対して、前記遷移確率記憶手段から、時点ｔにおいて外部要因の状態ｚ _ｔで行動ｙ _ｔを選択した場合に、時点ｔにおける債権の状態ｘ _ｔが次の時点ｔ＋１において債権の状態ｘ _ｔ＋１へと遷移する債権状態遷移確率と、時点ｔにおける外部要因の状態ｚ _ｔが次の時点ｔ＋１において外部要因の状態ｚ _ｔ＋１へと遷移する外部要因遷移確率を読み出し、かつ、前記前記期待利得記憶手段から、時点ｔにおいて行動ｙ _ｔを選択し、時点ｔにおける債権の状態ｘ _ｔが次の時点ｔ＋１において債権の状態ｘ _ｔ＋１へと遷移した場合に得られる期待利得を読み出し、前記ＤＰグラフの末端（ｔ＝Ｔ）の各ノードから順に、各ノードにおいて選択し得る行動毎の期待総利得を、前記遷移確率記憶手段から読み出した各々の行動に対応する組合せの遷移確率と、前記期待利得記憶手段から読み出した各々の行動に対応する組合せの期待利得から算出して、期待総利得が最大となる行動を最適行動に決定する最適行動決定ステップと、前記債権ポートフォリオ制御装置が、前記ＤＰグラフの全てのノードについて前記最適行動決定ステップで決定した最適行動を、前記債権を制御するための最適政策として出力する最適政策出力ステップと、を有していて、前記最適行動決定ステップでは、ｔ＝Ｔとなる各ノードについては、選択可能な各々の行動ｙ _ｔについて、遷移可能な各々の債権の状態ｘ _ｔ＋１につき、該当する行動と債権の状態の組合せに対して読み出した前記期待利得に、該当する外部要因の状態と行動と債権の状態の組合せに対して読み出した前記債権状態遷移確率を乗算し、その総和である期待総利得を演算して、前記期待総利得が最大となる行動ｙ _ｔを最適行動に決定し、１≦ｔ≦Ｔ−１となる各ノードについては、選択可能な各々の行動ｙ _ｔについて、遷移可能な各々の債権の状態ｘ _ｔ＋１につき、該当する行動と債権の状態の組合せに対して読み出した前記期待利得と、遷移可能な各々の外部要因の状態ｚ _ｔ＋１についての該当するノードについて演算された前記期待総利得の最大値に読み出した前記外部要因遷移確率を乗じた値の総和とを加算した値に対して、該当する外部要因の状態と行動と債権の状態の組合せに対して読み出した前記債権状態遷移確率を乗算し、その総和である期待総利得を演算して、前記期待総利得が最大となる行動ｙ _ｔを最適行動に決定することを、ｔ＝１となる各ノードまで繰り返すことを特徴とする債権ポートフォリオ制御方法である。

さらに、本発明に対応する債権ポートフォリオ制御方法は、前記債権ポートフォリオ制御装置は、前記初期条件受付ステップでは、対象となる債権が新規債権か既存債権かを識別する債権識別情報の入力を受け付け、前記期待利得記憶手段には、新規債権を対象にした、最初の時点１において行動ｙ _１を選択し、時点１における債権の状態ｘ _１が次の時点２において債権の状態ｘ _２へと遷移した場合に得られる期待利得が、債権の状態ｘ _１と債権の状態ｘ _２と行動ｙ _１の組合せ毎に、既存債権についての期待利得とは別に記憶されていて、前記債権ポートフォリオ制御装置は、前記最適行動決定ステップでは、前記初期条件受付ステップで新規債権を示す債権識別情報の入力を受け付けている場合には、ｔ＝１となるノードについては、前記期待利得記憶手段から新規債権についての期待利得を読み出し、前記期待利得を適用して期待総利得を演算し、前記最適行動を決定することを特徴とすることもできる。

Claims

債権の制御に最適な政策を選択するために用いられる債権ポートフォリオ制御装置であって、
債権の初期状態及び制御期間長の入力を受け付ける初期条件受付手段と、
前記初期条件受付手段が入力を受け付けた債権の初期状態を起点にして、前記初期条件受付手段が入力を受け付けた制御期間長までの各時点における債権の状態の遷移を各々のノードに展開したＤＰグラフを作成するＤＰグラフ作成手段と、
一の時点から次の時点において前記一の時点において選択された行動に応じて債権の状態が遷移する各々のパターンの遷移確率を記憶する遷移確率記憶手段と、
債権の状態が遷移する各々のパターンにおいて選択する行動に対応する期待利得を記憶する期待利得記憶手段と、
前記ＤＰグラフ作成手段が作成したＤＰグラフの各ノードにおける債権の状態、時点について、前記遷移確率記憶手段から前記時点における前記債権の状態が次の時点に遷移する各々のパターンの遷移確率を読み出し、かつ、前記各々のパターンにおける期待利得を前記期待利得記憶手段から読み出し、前記ノードにおいて選択し得る行動毎の期待総利得を、前記遷移確率記憶手段から読み出した遷移確率のうち各々の行動に対応するパターンの遷移確率と前記期待利得から算出して、期待総利得が最大となる行動を最適行動に決定する最適行動決定手段と、
前記ＤＰグラフ作成手段が作成したＤＰグラフの全てのノードについて前記最適行動決定手段が決定した最適行動を、前記債権を制御するための最適政策として出力する最適政策出力手段と、
を備えることを特徴とする債権ポートフォリオ制御装置。
債権の制御に最適な政策を選択するために用いられる債権ポートフォリオ制御装置であって、
債権の初期状態、外部要因の初期状態、及び制御期間長の入力を受け付ける初期条件受付手段と、
前記初期条件受付手段が入力を受け付けた債権の初期状態と外部要因の初期状態の組合せを起点にして、前記初期条件受付手段が入力を受け付けた制御期間長までの各時点における債権の状態と外部要因の状態の組合せの遷移を各々のノードに展開したＤＰグラフを作成するＤＰグラフ作成手段と、
一の時点から次の時点において外部要因の状態に応じて債権の状態が遷移する各々のパターンの遷移確率を記憶する遷移確率記憶手段と、
債権の状態が遷移する各々のパターンにおいて選択する行動に対応する期待利得を記憶する期待利得記憶手段と、
前記ＤＰグラフ作成手段が作成したＤＰグラフの各ノードにおける債権の状態、外部要因の状態、及び時点について、前記遷移確率記憶手段から前記外部要因の状態において前記時点における前記債権の状態が次の時点に遷移する各々のパターンの遷移確率を読み出し、かつ、前記各々のパターンにおける期待利得を前記期待利得記憶手段から読み出し、前記遷移確率と前記期待利得から前記ノードにおいて選択し得る行動毎の期待総利得を算出して、期待総利得が最大となる行動を最適行動に決定する最適行動決定手段と、
前記ＤＰグラフ作成手段が作成したＤＰグラフの全てのノードについて前記最適行動決定手段が決定した最適行動を、前記債権を制御するための最適政策として出力する最適政策出力手段と、
を備えることを特徴とする債権ポートフォリオ制御装置。
前記遷移確率記憶手段には、一の時点から次の時点において外部要因の状態に応じて債権の状態が遷移する各々のパターンの遷移確率が前記一の時点において選択された行動に応じてそれぞれ記憶されていて、
前記最適行動決定手段は、前記ノードにおいて選択し得る行動毎の期待総利得を算出する際に、前記遷移確率記憶手段から読み出した遷移確率のうち、各々の行動に対応するパターンの遷移確率を用いること
を特徴とする請求項２記載の債権ポートフォリオ制御装置。
前記遷移確率記憶手段には、一の時点から次の時点において外部要因の状態が遷移する各々のパターンの遷移確率が記憶されていて、
前記最適行動決定手段は、少なくとも一のノードについて、前記遷移確率記憶手段から前記時点における前記外部要因の状態が次の時点に遷移する各々のパターンの遷移確率を読み出し、前記遷移確率を反映した期待総利得を算出して、前記最適行動を決定すること
を特徴とする請求項１乃至３いずれかに記載の債権ポートフォリオ制御装置。
前記初期条件受付手段は、対象となる債権が新規債権か既存債権かを識別する債権識別情報の入力を受け付け、
前記期待利得記憶手段には、新規債権についての債権の状態が遷移する各々のパターンにおいて選択する行動に対応する期待利得が既存債権についての期待利得とは別に記憶されていて、
前記最適行動決定手段は、前記初期条件受付手段が新規債権を示す債権識別情報の入力を受け付けている場合には、最初の時点に対応するノードについて、前記期待利得記憶手段から新規債権についての期待利得を読み出し、前記期待利得を反映した期待総利得を算出して、前記最適行動を決定すること
を特徴とする請求項１乃至４いずれかに記載の債権ポートフォリオ制御装置。
債権の制御に最適な政策を選択するために用いられる債権ポートフォリオ制御プログラムであって、
一の時点から次の時点において前記一の時点において選択された行動に応じて債権の状態が遷移する各々のパターンの遷移確率を記憶する遷移確率記憶手段と、債権の状態が遷移する各々のパターンにおいて選択する行動に対応する期待利得を記憶する期待利得記憶手段とを備えた債権ポートフォリオ制御装置に、
債権の初期状態及び制御期間長の入力を受け付ける初期条件受付ステップと、
前記初期条件受付ステップで入力を受け付けた債権の初期状態を起点にして、前記初期条件受付ステップで入力を受け付けた制御期間長までの各時点における債権の状態の遷移を各々のノードに展開したＤＰグラフを作成するＤＰグラフ作成ステップと、
前記ＤＰグラフ作成ステップで作成したＤＰグラフの各ノードにおける債権の状態、時点について、前記遷移確率記憶手段から前記時点における前記債権の状態が次の時点に遷移する各々のパターンの遷移確率を読み出し、かつ、前記各々のパターンにおける期待利得を前記期待利得記憶手段から読み出し、前記ノードにおいて選択し得る行動毎の期待総利得を、前記遷移確率記憶手段から読み出した遷移確率のうち各々の行動に対応するパターンの遷移確率と前記期待利得から算出して、期待総利得が最大となる行動を最適行動に決定する最適行動決定ステップと、
前記ＤＰグラフ作成ステップで作成したＤＰグラフの全てのノードについて前記最適行動決定ステップで決定した最適行動を、前記債権を制御するための最適政策として出力する最適政策出力ステップと、
を実行させることを特徴とする債権ポートフォリオ制御プログラム。
債権の制御に最適な政策を選択するために用いられる債権ポートフォリオ制御プログラムであって、
一の時点から次の時点において外部要因の状態に応じて債権の状態が遷移する各々のパターンの遷移確率を記憶する遷移確率記憶手段と、債権の状態が遷移する各々のパターンにおいて選択する行動に対応する期待利得を記憶する期待利得記憶手段とを備えた債権ポートフォリオ制御装置に、
債権の初期状態、外部要因の初期状態、及び制御期間長の入力を受け付ける初期条件受付ステップと、
前記初期条件受付ステップで入力を受け付けた債権の初期状態と外部要因の初期状態の組合せを起点にして、前記初期条件受付ステップで入力を受け付けた制御期間長までの各時点における債権の状態と外部要因の状態の組合せの遷移を各々のノードに展開したＤＰグラフを作成するＤＰグラフ作成ステップと、
前記ＤＰグラフ作成ステップで作成したＤＰグラフの各ノードにおける債権の状態、外部要因の状態、及び時点について、前記遷移確率記憶手段から前記外部要因の状態において前記時点における前記債権の状態が次の時点に遷移する各々のパターンの遷移確率を読み出し、かつ、前記各々のパターンにおける期待利得を前記期待利得記憶手段から読み出し、前記遷移確率と前記期待利得から前記ノードにおいて選択し得る行動毎の期待総利得を算出して、期待総利得が最大となる行動を最適行動に決定する最適行動決定ステップと、
前記ＤＰグラフ作成ステップで作成したＤＰグラフの全てのノードについて前記最適行動決定ステップで決定した最適行動を、前記債権を制御するための最適政策として出力する最適政策出力ステップと、
を実行させることを特徴とする債権ポートフォリオ制御プログラム。
前記遷移確率記憶手段には、一の時点から次の時点において外部要因の状態に応じて債権の状態が遷移する各々のパターンの遷移確率が前記一の時点において選択された行動に応じてそれぞれ記憶されていて、
前記最適行動決定ステップでは、前記ノードにおいて選択し得る行動毎の期待総利得を算出する際に、前記遷移確率記憶手段から読み出した遷移確率のうち、各々の行動に対応するパターンの遷移確率を用いること
を特徴とする請求項７記載の債権ポートフォリオ制御プログラム。
前記遷移確率記憶手段には、一の時点から次の時点において外部要因の状態が遷移する各々のパターンの遷移確率が記憶されていて、
前記最適行動決定ステップでは、少なくとも一のノードについて、前記遷移確率記憶手段から前記時点における前記外部要因の状態が次の時点に遷移する各々のパターンの遷移確率を読み出し、前記遷移確率を反映した期待総利得を算出して、前記最適行動を決定すること
を特徴とする請求項６乃至８いずれかに記載の債権ポートフォリオ制御プログラム。
前記初期条件受付ステップでは、対象となる債権が新規債権か既存債権かを識別する債権識別情報の入力を受け付け、
前記期待利得記憶手段には、新規債権についての債権の状態が遷移する各々のパターンにおいて選択する行動に対応する期待利得が既存債権についての期待利得とは別に記憶されていて、
前記最適行動決定ステップでは、前記初期条件受付ステップで新規債権を示す債権識別情報の入力を受け付けている場合には、最初の時点に対応するノードについて、前記期待利得記憶手段から新規債権についての期待利得を読み出し、前記期待利得を反映した期待総利得を算出して、前記最適行動を決定すること
を特徴とする請求項６乃至９いずれかに記載の債権ポートフォリオ制御プログラム。
債権の制御に最適な政策を選択するために用いられる債権ポートフォリオ方法であって、
一の時点から次の時点において前記一の時点において選択された行動に応じて債権の状態が遷移する各々のパターンの遷移確率を記憶する遷移確率記憶手段と、債権の状態が遷移する各々のパターンにおいて選択する行動に対応する期待利得を記憶する期待利得記憶手段とを備えた債権ポートフォリオ制御装置が、債権の初期状態及び制御期間長の入力を受け付ける初期条件受付ステップと、
前記債権ポートフォリオ制御装置が、前記初期条件受付ステップで入力を受け付けた債権の初期状態を起点にして、前記初期条件受付ステップで入力を受け付けた制御期間長までの各時点における債権の状態の遷移を各々のノードに展開したＤＰグラフを作成するＤＰグラフ作成ステップと、
前記債権ポートフォリオ制御装置が、前記ＤＰグラフ作成ステップで作成したＤＰグラフの各ノードにおける債権の状態、時点について、前記遷移確率記憶手段から前記時点における前記債権の状態が次の時点に遷移する各々のパターンの遷移確率を読み出し、かつ、前記各々のパターンにおける期待利得を前記期待利得記憶手段から読み出し、前記ノードにおいて選択し得る行動毎の期待総利得を、前記遷移確率記憶手段から読み出した遷移確率のうち各々の行動に対応するパターンの遷移確率と前記期待利得から算出して、期待総利得が最大となる行動を最適行動に決定する最適行動決定ステップと、
前記債権ポートフォリオ制御装置が、前記ＤＰグラフ作成ステップで作成したＤＰグラフの全てのノードについて前記最適行動決定ステップで決定した最適行動を、前記債権を制御するための最適政策として出力する最適政策出力ステップと、
を有することを特徴とする債権ポートフォリオ制御方法。
債権の制御に最適な政策を選択するために用いられる債権ポートフォリオ制御方法であって、
一の時点から次の時点において外部要因の状態に応じて債権の状態が遷移する各々のパターンの遷移確率を記憶する遷移確率記憶手段と、債権の状態が遷移する各々のパターンにおいて選択する行動に対応する期待利得を記憶する期待利得記憶手段とを備えた債権ポートフォリオ制御装置が、債権の初期状態、外部要因の初期状態、及び制御期間長の入力を受け付ける初期条件受付ステップと、
前記債権ポートフォリオ制御装置が、前記初期条件受付ステップで入力を受け付けた債権の初期状態と外部要因の初期状態の組合せを起点にして、前記初期条件受付ステップで入力を受け付けた制御期間長までの各時点における債権の状態と外部要因の状態の組合せの遷移を各々のノードに展開したＤＰグラフを作成するＤＰグラフ作成ステップと、
前記債権ポートフォリオ制御装置が、前記ＤＰグラフ作成ステップで作成したＤＰグラフの各ノードにおける債権の状態、外部要因の状態、及び時点について、前記遷移確率記憶手段から前記外部要因の状態において前記時点における前記債権の状態が次の時点に遷移する各々のパターンの遷移確率を読み出し、かつ、前記各々のパターンにおける期待利得を前記期待利得記憶手段から読み出し、前記遷移確率と前記期待利得から前記ノードにおいて選択し得る行動毎の期待総利得を算出して、期待総利得が最大となる行動を最適行動に決定する最適行動決定ステップと、
前記債権ポートフォリオ制御装置が、前記ＤＰグラフ作成ステップで作成したＤＰグラフの全てのノードについて前記最適行動決定ステップで決定した最適行動を、前記債権を制御するための最適政策として出力する最適政策出力ステップと、
を有することを特徴とする債権ポートフォリオ制御方法。