本発明は、債権の制御に最適な政策を選択するために用いられる債権ポートフォリオ制御装置、債権ポートフォリオ制御プログラム及び債権ポートフォリオ制御方法に関するものである。
近年、金融工学の分野においても、金融資産のリスク管理等の目的で、様々な確率モデルが利用されるようになっている(例えば、特許文献1参照)。
例えば、金融機関が顧客企業への融資を決定する際の判断材料の一つとして、各企業の信用格付に関する情報が用いられているが、企業の信用格付を状態としてとらえ、信用格付の変化についてマルコフ連鎖を用いてモデル化して評価することが行なわれている(例えば、特許文献2参照)。また、各々の信用格付状態で得られる効用とマルコフ連鎖で評価される将来の各々の信用格付状態の確率から算出される期待効用や、効用の分散などを用いた融資の判断方法がある。
小野覚、「金融リスクマネジメント」、東洋経済新報社、2002年6月、p.137−175
ところで、上述した従来の融資判断方法は、金融機関が企業を対象にして融資の判断を行う際に用いられる方法であり、個人に対する融資限度額を設定する際に用いられているものではない。
個人への融資限度額を設定する際には、設定した融資限度額の大小によって、例えば、融資限度額を大きく設定したために債務が過大となって信用格付が低下するなど、将来の個人の信用格付状態への遷移確率が異なることが起こり得るものである。しかしながら、従来の企業に対する融資判断方法では、単に信用格付の状態遷移にマルコフ連鎖を仮定しているだけで、融資限度額の大小によって将来の信用格付状態への遷移確率が異なるようなモデル化は検討されていない。
また、経済環境等の外部要因の状況によって、例えば、経済環境が悪化した環境下では信用格付が低下しやすくなるなど、個人の信用格付状態の遷移確率が異なることが起こり得るものであるが、従来の企業に対する融資判断方法では、経済環境等の外部要因の状況によって遷移確率が異なるようなモデル化は行われていない。
本発明は、従来の企業に対する融資判断方法を、個人への融資限度額の設定に適用しようとする際に生じるこれらの問題点に対し、設定した融資限度額の大小や、経済環境等の外部要因の状況を、将来の信用格付の遷移確率に反映することが可能な、融資債権等の債権の制御において、融資限度額設定等の最適な政策を選択するために用いられる債権ポートフォリオ制御装置、債権ポートフォリオ制御プログラム及び債権ポートフォリオ制御方法を提供することを目的とするものである。
本発明にかかる課題を解決する第1の発明は、債権の制御に最適な政策を選択するために用いられる債権ポートフォリオ制御装置であって、債権の初期状態及び制御期間長の入力を受け付ける初期条件受付手段と、前記初期条件受付手段が入力を受け付けた債権の初期状態を起点にして、前記初期条件受付手段が入力を受け付けた制御期間長までの各時点における債権の状態の遷移を各々のノードに展開したDPグラフを作成するDPグラフ作成手段と、一の時点から次の時点において前記一の時点において選択された行動に応じて債権の状態が遷移する各々のパターンの遷移確率を記憶する遷移確率記憶手段と、債権の状態が遷移する各々のパターンにおいて選択する行動に対応する期待利得を記憶する期待利得記憶手段と、前記DPグラフ作成手段が作成したDPグラフの各ノードにおける債権の状態、時点について、前記遷移確率記憶手段から前記時点における前記債権の状態が次の時点に遷移する各々のパターンの遷移確率を読み出し、かつ、前記各々のパターンにおける期待利得を前記期待利得記憶手段から読み出し、前記ノードにおいて選択し得る行動毎の期待総利得を、前記遷移確率記憶手段から読み出した遷移確率のうち各々の行動に対応するパターンの遷移確率と前記期待利得から算出して、期待総利得が最大となる行動を最適行動に決定する最適行動決定手段と、前記DPグラフ作成手段が作成したDPグラフの全てのノードについて前記最適行動決定手段が決定した最適行動を、前記債権を制御するための最適政策として出力する最適政策出力手段と、を備えることを特徴とする債権ポートフォリオ制御装置である。
第1の発明においては、最適行動を決定する際に、一の時点において選択された行動に応じて債権の状態が遷移する各々のパターンの遷移確率を用いることによって、融資限度額の設定等の行動を将来の信用格付等の債権の状態の遷移確率に反映し、期待総利得が最大となるように債権を制御するための最適政策を出力することが可能になる。
本発明にかかる課題を解決する第2の発明は、債権の制御に最適な政策を選択するために用いられる債権ポートフォリオ制御装置であって、債権の初期状態、外部要因の初期状態、及び制御期間長の入力を受け付ける初期条件受付手段と、前記初期条件受付手段が入力を受け付けた債権の初期状態と外部要因の初期状態の組合せを起点にして、前記初期条件受付手段が入力を受け付けた制御期間長までの各時点における債権の状態と外部要因の状態の組合せの遷移を各々のノードに展開したDPグラフを作成するDPグラフ作成手段と、一の時点から次の時点において外部要因の状態に応じて債権の状態が遷移する各々のパターンの遷移確率を記憶する遷移確率記憶手段と、債権の状態が遷移する各々のパターンにおいて選択する行動に対応する期待利得を記憶する期待利得記憶手段と、前記DPグラフ作成手段が作成したDPグラフの各ノードにおける債権の状態、外部要因の状態、及び時点について、前記遷移確率記憶手段から前記外部要因の状態において前記時点における前記債権の状態が次の時点に遷移する各々のパターンの遷移確率を読み出し、かつ、前記各々のパターンにおける期待利得を前記期待利得記憶手段から読み出し、前記遷移確率と前記期待利得から前記ノードにおいて選択し得る行動毎の期待総利得を算出して、期待総利得が最大となる行動を最適行動に決定する最適行動決定手段と、前記DPグラフ作成手段が作成したDPグラフの全てのノードについて前記最適行動決定手段が決定した最適行動を、前記債権を制御するための最適政策として出力する最適政策出力手段と、を備えることを特徴とする債権ポートフォリオ制御装置である。
第2の発明においては、最適行動を決定する際に、一の時点から次の時点において外部要因の状態に応じて債権の状態が遷移する各々のパターンの遷移確率を用いることによって、経済環境等の外部要因の状況を将来の信用格付等の債権の状態の遷移確率に反映し、期待総利得が最大となるように債権を制御するための最適政策を出力することが可能になる。
また、第2の発明は、前記遷移確率記憶手段には、一の時点から次の時点において外部要因の状態に応じて債権の状態が遷移する各々のパターンの遷移確率が前記一の時点において選択された行動に応じてそれぞれ記憶されていて、前記最適行動決定手段は、前記ノードにおいて選択し得る行動毎の期待総利得を算出する際に、前記遷移確率記憶手段から読み出した遷移確率のうち、各々の行動に対応するパターンの遷移確率を用いることを特徴とすることもできる。
このように構成すると、融資限度額の設定等の行動と経済環境等の外部要因の状況の双方を将来の信用格付等の債権の状態の遷移確率に反映し、期待総利得が最大となるように債権を制御するための最適政策を出力することが可能になる。
さらに、本発明は、前記遷移確率記憶手段には、一の時点から次の時点において外部要因の状態が遷移する各々のパターンの遷移確率が記憶されていて、前記最適行動決定手段は、少なくとも一のノードについて、前記遷移確率記憶手段から前記時点における前記外部要因の状態が次の時点に遷移する各々のパターンの遷移確率を読み出し、前記遷移確率を反映した期待総利得を算出して、前記最適行動を決定することを特徴とすることもできる。
このように構成すると、経済環境等の外部要因の状況が遷移する確率を反映し、期待総利得が最大となるように債権を制御するための最適政策を出力することが可能になる。
さらに、本発明は、前記初期条件受付手段は、対象となる債権が新規債権か既存債権かを識別する債権識別情報の入力を受け付け、前記期待利得記憶手段には、新規債権についての債権の状態が遷移する各々のパターンにおいて選択する行動に対応する期待利得が既存債権についての期待利得とは別に記憶されていて、前記最適行動決定手段は、前記初期条件受付手段が新規債権を示す債権識別情報の入力を受け付けている場合には、最初の時点に対応するノードについて、前記期待利得記憶手段から新規債権についての期待利得を読み出し、前記期待利得を反映した期待総利得を算出して、前記最適行動を決定することを特徴とすることもできる。
このように構成すると、過去の実績を有しない新規債権について生じる固有の影響も考慮した、期待総利得が最大となるように債権を制御するための最適政策を出力することが可能になる。
本発明は、本発明にかかる債権ポートフォリオ制御装置に備えられる債権ポートフォリオ制御プログラムとして特定することもできる。
第1の発明に対応する債権ポートフォリオ制御プログラムは、債権の制御に最適な政策を選択するために用いられる債権ポートフォリオ制御プログラムであって、一の時点から次の時点において前記一の時点において選択された行動に応じて債権の状態が遷移する各々のパターンの遷移確率を記憶する遷移確率記憶手段と、債権の状態が遷移する各々のパターンにおいて選択する行動に対応する期待利得を記憶する期待利得記憶手段とを備えた債権ポートフォリオ制御装置に、債権の初期状態及び制御期間長の入力を受け付ける初期条件受付ステップと、前記初期条件受付ステップで入力を受け付けた債権の初期状態を起点にして、前記初期条件受付ステップで入力を受け付けた制御期間長までの各時点における債権の状態の遷移を各々のノードに展開したDPグラフを作成するDPグラフ作成ステップと、前記DPグラフ作成ステップで作成したDPグラフの各ノードにおける債権の状態、時点について、前記遷移確率記憶手段から前記時点における前記債権の状態が次の時点に遷移する各々のパターンの遷移確率を読み出し、かつ、前記各々のパターンにおける期待利得を前記期待利得記憶手段から読み出し、前記ノードにおいて選択し得る行動毎の期待総利得を、前記遷移確率記憶手段から読み出した遷移確率のうち各々の行動に対応するパターンの遷移確率と前記期待利得から算出して、期待総利得が最大となる行動を最適行動に決定する最適行動決定ステップと、前記DPグラフ作成ステップで作成したDPグラフの全てのノードについて前記最適行動決定ステップで決定した最適行動を、前記債権を制御するための最適政策として出力する最適政策出力ステップと、を実行させることを特徴とする債権ポートフォリオ制御プログラムである。
第2の発明に対応する債権ポートフォリオ制御プログラムは、債権の制御に最適な政策を選択するために用いられる債権ポートフォリオ制御プログラムであって、一の時点から次の時点において外部要因の状態に応じて債権の状態が遷移する各々のパターンの遷移確率を記憶する遷移確率記憶手段と、債権の状態が遷移する各々のパターンにおいて選択する行動に対応する期待利得を記憶する期待利得記憶手段とを備えた債権ポートフォリオ制御装置に、債権の初期状態、外部要因の初期状態、及び制御期間長の入力を受け付ける初期条件受付ステップと、前記初期条件受付ステップで入力を受け付けた債権の初期状態と外部要因の初期状態の組合せを起点にして、前記初期条件受付ステップで入力を受け付けた制御期間長までの各時点における債権の状態と外部要因の状態の組合せの遷移を各々のノードに展開したDPグラフを作成するDPグラフ作成ステップと、前記DPグラフ作成ステップで作成したDPグラフの各ノードにおける債権の状態、外部要因の状態、及び時点について、前記遷移確率記憶手段から前記外部要因の状態において前記時点における前記債権の状態が次の時点に遷移する各々のパターンの遷移確率を読み出し、かつ、前記各々のパターンにおける期待利得を前記期待利得記憶手段から読み出し、前記遷移確率と前記期待利得から前記ノードにおいて選択し得る行動毎の期待総利得を算出して、期待総利得が最大となる行動を最適行動に決定する最適行動決定ステップと、前記DPグラフ作成ステップで作成したDPグラフの全てのノードについて前記最適行動決定ステップで決定した最適行動を、前記債権を制御するための最適政策として出力する最適政策出力ステップと、を実行させることを特徴とする債権ポートフォリオ制御プログラムである。
また、第2の発明に対応する債権ポートフォリオ制御プログラムは、前記遷移確率記憶手段には、一の時点から次の時点において外部要因の状態に応じて債権の状態が遷移する各々のパターンの遷移確率が前記一の時点において選択された行動に応じてそれぞれ記憶されていて、前記最適行動決定ステップでは、前記ノードにおいて選択し得る行動毎の期待総利得を算出する際に、前記遷移確率記憶手段から読み出した遷移確率のうち、各々の行動に対応するパターンの遷移確率を用いることを特徴とすることもできる。
さらに、本発明に対応する債権ポートフォリオ制御プログラムは、前記遷移確率記憶手段には、一の時点から次の時点において外部要因の状態が遷移する各々のパターンの遷移確率が記憶されていて、前記最適行動決定ステップでは、少なくとも一のノードについて、前記遷移確率記憶手段から前記時点における前記外部要因の状態が次の時点に遷移する各々のパターンの遷移確率を読み出し、前記遷移確率を反映した期待総利得を算出して、前記最適行動を決定することを特徴とすることもできる。
さらに、本発明に対応する債権ポートフォリオ制御プログラムは、前記初期条件受付ステップでは、対象となる債権が新規債権か既存債権かを識別する債権識別情報の入力を受け付け、前記期待利得記憶手段には、新規債権についての債権の状態が遷移する各々のパターンにおいて選択する行動に対応する期待利得が既存債権についての期待利得とは別に記憶されていて、前記最適行動決定ステップでは、前記初期条件受付ステップで新規債権を示す債権識別情報の入力を受け付けている場合には、最初の時点に対応するノードについて、前記期待利得記憶手段から新規債権についての期待利得を読み出し、前記期待利得を反映した期待総利得を算出して、前記最適行動を決定することを特徴とすることもできる。
本発明は、本発明にかかる債権ポートフォリオ制御装置によって実行される、債権ポートフォリオ制御方法として特定することもできる。
第1の発明に対応する債権ポートフォリオ制御方法は、債権の制御に最適な政策を選択するために用いられる債権ポートフォリオ方法であって、一の時点から次の時点において前記一の時点において選択された行動に応じて債権の状態が遷移する各々のパターンの遷移確率を記憶する遷移確率記憶手段と、債権の状態が遷移する各々のパターンにおいて選択する行動に対応する期待利得を記憶する期待利得記憶手段とを備えた債権ポートフォリオ制御装置が、債権の初期状態及び制御期間長の入力を受け付ける初期条件受付ステップと、前記債権ポートフォリオ制御装置が、前記初期条件受付ステップで入力を受け付けた債権の初期状態を起点にして、前記初期条件受付ステップで入力を受け付けた制御期間長までの各時点における債権の状態の遷移を各々のノードに展開したDPグラフを作成するDPグラフ作成ステップと、前記債権ポートフォリオ制御装置が、前記DPグラフ作成ステップで作成したDPグラフの各ノードにおける債権の状態、時点について、前記遷移確率記憶手段から前記時点における前記債権の状態が次の時点に遷移する各々のパターンの遷移確率を読み出し、かつ、前記各々のパターンにおける期待利得を前記期待利得記憶手段から読み出し、前記ノードにおいて選択し得る行動毎の期待総利得を、前記遷移確率記憶手段から読み出した遷移確率のうち各々の行動に対応するパターンの遷移確率と前記期待利得から算出して、期待総利得が最大となる行動を最適行動に決定する最適行動決定ステップと、前記債権ポートフォリオ制御装置が、前記DPグラフ作成ステップで作成したDPグラフの全てのノードについて前記最適行動決定ステップで決定した最適行動を、前記債権を制御するための最適政策として出力する最適政策出力ステップと、を有することを特徴とする債権ポートフォリオ制御方法である。
第2の発明に対応する債権ポートフォリオ制御方法は、債権の制御に最適な政策を選択するために用いられる債権ポートフォリオ制御方法であって、一の時点から次の時点において外部要因の状態に応じて債権の状態が遷移する各々のパターンの遷移確率を記憶する遷移確率記憶手段と、債権の状態が遷移する各々のパターンにおいて選択する行動に対応する期待利得を記憶する期待利得記憶手段とを備えた債権ポートフォリオ制御装置が、債権の初期状態、外部要因の初期状態、及び制御期間長の入力を受け付ける初期条件受付ステップと、前記債権ポートフォリオ制御装置が、前記初期条件受付ステップで入力を受け付けた債権の初期状態と外部要因の初期状態の組合せを起点にして、前記初期条件受付ステップで入力を受け付けた制御期間長までの各時点における債権の状態と外部要因の状態の組合せの遷移を各々のノードに展開したDPグラフを作成するDPグラフ作成ステップと、前記債権ポートフォリオ制御装置が、前記DPグラフ作成ステップで作成したDPグラフの各ノードにおける債権の状態、外部要因の状態、及び時点について、前記遷移確率記憶手段から前記外部要因の状態において前記時点における前記債権の状態が次の時点に遷移する各々のパターンの遷移確率を読み出し、かつ、前記各々のパターンにおける期待利得を前記期待利得記憶手段から読み出し、前記遷移確率と前記期待利得から前記ノードにおいて選択し得る行動毎の期待総利得を算出して、期待総利得が最大となる行動を最適行動に決定する最適行動決定ステップと、前記債権ポートフォリオ制御装置が、前記DPグラフ作成ステップで作成したDPグラフの全てのノードについて前記最適行動決定ステップで決定した最適行動を、前記債権を制御するための最適政策として出力する最適政策出力ステップと、を有することを特徴とする債権ポートフォリオ制御方法である。
また、第2の発明に対応する債権ポートフォリオ制御方法は、前記遷移確率記憶手段には、一の時点から次の時点において外部要因の状態に応じて債権の状態が遷移する各々のパターンの遷移確率が前記一の時点において選択された行動に応じてそれぞれ記憶されていて、前記最適行動決定ステップでは、前記ノードにおいて選択し得る行動毎の期待総利得を算出する際に、前記遷移確率記憶手段から読み出した遷移確率のうち、各々の行動に対応するパターンの遷移確率を用いることを特徴とすることもできる。
さらに、本発明に対応する債権ポートフォリオ制御方法は、前記遷移確率記憶手段には、一の時点から次の時点において外部要因の状態が遷移する各々のパターンの遷移確率が記憶されていて、前記最適行動決定ステップでは、少なくとも一のノードについて、前記遷移確率記憶手段から前記時点における前記外部要因の状態が次の時点に遷移する各々のパターンの遷移確率を読み出し、前記遷移確率を反映した期待総利得を算出して、前記最適行動を決定することを特徴とすることもできる。
さらに、本発明に対応する債権ポートフォリオ制御方法は、前記初期条件受付ステップでは、対象となる債権が新規債権か既存債権かを識別する債権識別情報の入力を受け付け、前記期待利得記憶手段には、新規債権についての債権の状態が遷移する各々のパターンにおいて選択する行動に対応する期待利得が既存債権についての期待利得とは別に記憶されていて、前記最適行動決定ステップでは、前記初期条件受付ステップで新規債権を示す債権識別情報の入力を受け付けている場合には、最初の時点に対応するノードについて、前記期待利得記憶手段から新規債権についての期待利得を読み出し、前記期待利得を反映した期待総利得を算出して、前記最適行動を決定することを特徴とすることもできる。
本発明によって、融資債権等の債権の制御において、融資限度額設定等の最適な政策を選択する際に、設定した融資限度額の大小や経済環境等の外部要因の状況を、将来の信用格付の遷移確率に反映した行動を選択することが可能になる。これによって、従来の企業に対する融資判断において用いられているマルコフ連鎖を用いたモデルによる評価方法を、個人向けの融資にも好適なものとして適用することが可能になる。
本発明にかかる債権ポートフォリオ制御装置の原理構成図である。
本発明にかかる債権ポートフォリオ制御装置による最適政策出力の原理を説明するフローチャートである。
本発明にかかる債権ポートフォリオ制御装置の構成の一例を示すブロック図である。
本発明にかかる債権ポートフォリオ制御装置の最適政策算出部の動作を示すフローチャートである。
本発明にかかる債権ポートフォリオ制御装置の行動決定部の動作を示すフローチャートである。
従来の債権ポートフォリオ制御において作成される、既存債権に関するDPグラフの一例を示す図である。
本発明にかかる債権ポートフォリオ制御装置により作成される、既存債権に関するDPグラフの一例を示す図である。
本発明にかかる債権ポートフォリオ制御装置により作成される、新規債権に関するDPグラフの一例を示す図である。
従来の債権ポートフォリオ制御において、遷移確率テーブルに記憶される債権の状態の遷移確率の一例を示す図である。
本発明にかかる債権ポートフォリオ制御装置の行動決定部の遷移確率テーブルに記憶された、債権の状態の遷移確率の一例を示す図である。
本発明にかかる債権ポートフォリオ制御装置の行動決定部の遷移確率テーブルに記憶された、外部要因の状態の遷移確率の一例を示す図である。
本発明にかかる債権ポートフォリオ制御装置の行動決定部の期待利得テーブルに記憶された、期待利得情報の一例を示す図である。
本発明にかかる債権ポートフォリオ制御装置により、DPグラフの各ノードについて選択された最適行動の一例を示す図である。
本発明を実施するための形態について、図面を用いて以下に詳細に説明する。尚、以下の説明は、本発明の実施形態の一例を示したものであって、本発明はかかる実施形態に限定されるものではない。例えば、以下の実施形態では、外部要因の状態と選択された行動のそれぞれの組み合わせに対応した状態遷移確率を用いることによって、経済環境等の外部要因による債権の状態の遷移確率と設定した融資限度額等の行動による債権の状態の遷移確率を反映して、最適行動を決定する方法について説明するが、状態遷移確率には、外部要因の状態又は選択された行動のいずれか一方のみの相違によるものを用いることによっても、それぞれ経済環境等の外部要因による債権の状態の遷移確率、又は設定した融資限度額等の行動による債権の状態の遷移確率を反映した最適行動を決定することが可能である。本発明は、融資先となる個人の信用格付を債権の状態、経済環境等の状況を外部要因の状態、金融機関の個人顧客に対する融資限度額の設定を行動、個人顧客への融資によって金融機関が得られる収益を期待利得として、本発明を金融機関の個人顧客への融資限度額の設定に用いると好適である。
図1は、本発明にかかる債権ポートフォリオ制御装置の原理構成を示している。本発明にかかる債権ポートフォリオ制御装置は、債権の初期状態、外部要因の初期状態、及び制御期間長が与えられると、各時点の債権の各状態および外部要因の各状態における各行動のもとでの期待利得を用いて、制御期間の期待総利得を最大にすることが保証された最適政策を出力する。
債権の初期状態、外部要因の初期状態、及び制御期間長が入力装置から入力されると、これを受け付けた最適政策算出部が、行動決定部と連携して制御期間における期待総利得を最大にする政策を出力する。行動決定部では、債権の状態、外部要因の状態、及び時点が与えられると、当該時点の当該状態においてそれ以降の期待総利得を最大にする最適行動と期待総利得の最大値を出力する。
図2のフローチャートは、本発明にかかる債権ポートフォリオ制御装置による最適政策出力の原理を示している。本発明にかかる債権ポートフォリオ制御装置による最適政策出力方法は、債権の初期状態、外部要因の初期状態、制御期間長を入力する段階(S10)と、制御期間における期待総利得を最大にする政策を求めるために解く必要のある動的計画法(DP)の問題をDPグラフとして作成する段階(S20)と、S20において作成されたDPグラフに従って制御期間の最終年度から遡りながら動的計画法(DP)の問題を解いていく段階(S30)と、S30から与えられる各時点の債権の各状態及び外部要因の各状態において、当該時点以降の期待総利得を最大にする最適行動と期待総利得の最大値を出力する段階(S40)と、S20において作成されたDPグラフの動的計画法(DP)の問題を解き終わったかどうか判断する段階(S50)と、制御期間における期待総利得を最大にすることが保証された最適政策を出力する段階(S60)と、を有するものである。
以上によって、本発明にかかる債権ポートフォリオ制御装置による最適政策出力方法は、動的計画法(DP)を用いて各時点の債権の各状態および外部要因の各状態において当該時点以降の期待総利得を最大化し、最終的に制御期間における期待総利得を最大にすることが保証されている。
図3は、本発明にかかる債権ポートフォリオ制御装置のシステム構成の一例を示したものである。債権ポートフォリオ制御装置100は、最適政策算出部110、行動決定部120を含んで構成されている。最適政策算出部110は、DPグラフ作成器111と、DP実施器112とからなり、入力装置200からデータの入力を受け付けて、出力装置300に算出結果を出力する。行動決定部120は、行動決定器121と、遷移確率テーブル122と、期待利得テーブル123とからなる。
債権ポートフォリオ制御装置100のハードウエアの構成は特に限定されるものではないが、CPU、ROM、RAM、HDDを備えたコンピュータであって、HDDに格納されたアプリケーションプログラムによって所定の処理を実行するためには、ROMに記憶された入力制御や出力制御などのハードウエア制御のための基本的な各種プログラムを起動し、RAMをアプリケーションプログラムのワークエリアとして機能させながら、CPUが演算処理を行う。
最適政策算出部110と行動決定部120、すなわち、最適政策算出部110のDPグラフ作成器111とDP実施器112、行動決定部120の行動決定器121は、いずれも機能的に特定されるものであって、これらの機能に対応するアプリケーションプログラムがHDDからRAMに読み出され、CPUで演算処理が実行されることによって、各々の機能が実現される。
また、行動決定部120の遷移確率テーブル122と期待利得テーブル123には、それぞれHDDの所定の記憶領域が割り当てられる。入力装置200にはキーボードやマウスなどが、出力装置300にはディスプレイやプリンタが用いられる。
さらに、債権ポートフォリオ制御装置100は1台のコンピュータからなるものであってもよいし、ネットワークで接続された複数のコンピュータによって構成されるものであってもよい。例えば、遷移確率テーブル122と期待利得テーブル123をデータベースサーバに備え、最適政策算出部110を備える端末からデータベースサーバにアクセスすることによって、両者が一体となって債権ポートフォリオ制御装置100として動作することとしてもよい。
図4のフローチャートを用いて、債権ポートフォリオ制御装置100の最適政策算出部110の動作について説明する。まず、DPグラフ作成器111に、入力装置200から債権の初期状態x1と外部要因の初期状態z1と制御期間長Tが入力される(S70)。
ここで入力される値について、x1は、対象となる債権が既存債権(既存の顧客)である場合には、既存債権の信用格付の状態集合
の要素である。対象となる債権が新規債権(新規の顧客)である場合には、新規債権の信用格付の状態集合
の要素である。z1は、経済環境を示す指数等の外部要因の状態集合
の要素である。
債権の初期状態x1と外部要因の初期状態z1と制御期間長Tが入力されると、T年間の期待総利得を最大化するための動的計画法(DP)の問題を解くためのDPグラフを作成する(S71)。例えば、既存債権に関する制御でx1=s1、z1=θ1、|S|=2、|Θ|=2の場合であれば、図7に示したようなDPグラフを作成する。
ここで作成されるDPグラフは、1年目が既存債権の初期状態と外部要因の初期状態からなるノードで表現され、2年目からT年目までの間は、既存債権の各状態と外部要因の各状態の組み合わせのパターンが各々のノードに展開されて、1年目からT年目までの間の既存債権の各状態と外部要因の各状態の組み合わせの遷移が表現されたグラフとなる。これは、末端のT年目のノードから遡りながら、動的計画法(DP)でT年間のマルコフ決定過程問題を解くことによって、T年間の期待総利得を最大化する最適政策を求めるための準備となるものである。
このDPグラフの特徴は、展開されたノードが債権の状態と外部要因の状態の組み合わせとなっており、各々のノードには外部要因の状態が反映されていることである。従来の企業に対する融資判断等に用いられる債権ポートフォリオ制御の考え方では、経済環境等の外部要因の状況によって信用格付の遷移確率が異なるようなモデル化は行われていないため、ここで作成されるDPグラフは図6の例のようになると考えられる。
一方、新規債権が対象になる場合であって、x1=s´1、z1=θ1、|S|=2、|Θ|=2であるとすると、図8に示したようなDPグラフを作成する。新規の顧客への1年目となる新規債権については、融資限度額を抑えるなど既存債権とは異なる対応が行なわれることが多く、後に説明する期待利得テーブルでは既存債権と異なる値を用いることが望ましいため、1年目に既存債権とは異なる新規債権の状態と外部要因の状態の組み合わせによるノードを用いるものである。2年目以降については、新規債権も既存債権の扱いとなるため、図7と同様に既存債権の各状態と外部要因の各状態の組み合わせによるノードで表現される。
続いて、DP実施器112が、動的計画法でT年間のマルコフ決定過程問題を解くことによって、T年間の期待総利得を最大化する最適政策を求める処理を実行する。具体的には、DPグラフの末端(T年目)の各ノードから順に、当該ノードでの最適行動(設定すべき融資限度額)と当該ノード以降の期待総利得の最大値を、行動決定器121と連携して求めるために、一のノード毎に、当該ノードの時点t(何年目かという自然数)と、債権の状態xt(t年目の債権の状態)と、外部要因の状態zt(t年目の外部要因の状態)を行動決定器121に出力する(S72)。
DP実施器112から、一のノード毎に、当該ノードの時点t、債権の状態xt、外部要因の状態ztを行動決定器121に出力すると、行動決定器121が当該ノードにおける最適行動(設定すべき融資限度額)を決定するので、DP実施器112は決定された最適行動を当該ノード以降の期待総利得の最大値とあわせて受け付ける(S73)。
こうした一のノードについて最適行動と期待総利得の最大値を受け付けると、DPグラフの1年目のノードまで、全てのノードについての処理が終了したかを判断し(S74)、終了していない場合には、次のノードについて同様の処理を繰り返す。終了している場合には、DPグラフの全ノードにおける最適行動(設定すべき融資限度額)と当該ノード以降の期待総利得の最大値を最適政策として出力する(S75)。
最適政策の出力形式は特に限定されるものではないが、出力対象となる情報は、図13の例に示したように、各々のノードについて決定された最適行動(設定すべき融資限度額)と当該ノード以降の期待総利得の最大値である。図13の例では、最適行動(設定すべき融資限度額)の集合を
として、y1=g1、|Y|=2であるとしている。これらの情報を一覧できる図表等の形式で出力することによって、融資限度額を設定する金融機関等は、各々の時点の顧客の信用格付と経済状態に応じて、最適行動としてどのように融資限度額を決定すればよいかを把握することが可能になる。
図5のフローチャートを用いて、債権ポートフォリオ制御装置100の行動決定部120の動作について説明する。まず、行動決定部120の行動決定器121において、最適政策算出部110のDP実施器112が図4のS72において出力した、時点t(何年目かという自然数)と、債権の状態xt(t年目の債権の状態)と、外部要因の状態zt(t年目の外部要因の状態)の入力を受け付ける(S80)。
次に、債権の状態がxtで外部要因の状態がztという条件のもとで、行動ytを選択した場合に、次の年(時点)の債権の状態がxt+1になる状態遷移確率を、遷移確率テーブル122から読み出す(S81)。
図10は、ここで用いられる遷移確率テーブル122の一例を示したものである。債権の状態s1が、次の年(時点)においてs1又はs2に遷移する確率を示したものであるが、従来の方法では、図9の例に示したように、外部要因の状態や選択された行動による状態遷移確率の相違は反映されていなかった。これに対し、図10の例では、外部要因の状態がθ1である場合とθ2である場合、選択された行動がg1である場合とg2である場合のそれぞれの組み合わせに対応した状態遷移確率が記憶されているため、設定した融資限度額等の行動による債権の状態の遷移確率の相違や、経済環境等の外部要因による債権の状態の遷移確率の相違を反映して、最適行動を決定することが可能になる。
また、遷移確率テーブル122には、図11の例に示したような、外部要因の状態の遷移確率も記憶されている。外部要因の状態遷移確率も、後に説明する部分最適解の再利用において用いられるため、ここで遷移確率テーブル122から読み出される。
次に、債権の状態xtで行動ytを選択したという条件のもとで、次の年(時点)の債権の状態がxt+1になった場合の期待利得を、期待利得テーブル123から読み出す(S82)。
図12は、ここで用いられる期待利得テーブル123の一例を示したものである。債権の状態が遷移するパターンに応じて、それぞれ行動としてg1又はg2のいずれかを選択した場合のそれぞれについて期待される利得が記憶されている。この期待利得にそれぞれ債権の状態の遷移確率を乗じることによって、それぞれの期待利得についてその利得が発生する確率を反映することが可能になる。
続いて、選択する行動毎(g1又はg2)に期待総利得を算出し(S83)、期待総利得が最大となる行動を、最適行動として決定する(S84)。ここでの期待総利得の最大値を求めるための演算は、次のように求められる。
まず、入力を受け付けた時点tが、t=Tとなる期間の最終時点の場合については、次式によって当該ノード以降の期待総利得の最大値を求める。
ここで、yTはT年目に選択する行動(設定すべき融資限度額)を示し、yTは先に説明したとおり、行動集合
の要素である。
は、債権の状態がxTで、外部要因の状態がzTという条件のもとで行動yTを選択した場合に、次の年の債権の状態がxT+1になる状態遷移確率で、遷移確率テーブル122から読み出したものである。
は、債権の状態xTで行動yTを選択したもとにおいて、次の年の債権の状態がxT+1になった場合の期待利得で、期待利得テーブル123から読み出したものである。
次に、入力を受け付けた時点tが、
となる時点である場合については、次式によって当該ノード以降の期待総利得の最大値を求める。
ただし、
は、外部要因の状態間での状態遷移確率で、遷移確率テーブル122から読み出したものであり、
は、時点tのノードについて求める以前に求めた、時点t+1において、債権の状態がx+1で外部要因の状態がzt+1のノードにおける期待総利得の最大値である。本発明では動的計画法(DP)を利用しているので、このように部分最適解を再利用する。
このとき、t=Tの場合の当該ノードにおける最適な行動は、次式によって定義される。
また、
の場合の当該ノードにおける最適な行動は、次式によって定義される。
以上のように、DP実施器112から与えられた、時点t(何年目かという自然数)、債権の状態xt(t年目の債権の状態)、外部要因の状態zt(t年目の外部要因の状態)について、期待総利得が最大となる最適行動と期待総利得の最大値が決定されると、これを最適政策算出部110のDP実施器112に出力する(S85)。DP実施器112では、図4のS73でこれらを受け付ける処理を実行する。
100 債権ポートフォリオ制御装置
110 最適政策算出部
111 DPグラフ作成器
112 DP実施器
120 行動決定部
121 行動決定器
122 遷移確率テーブル
123 期待利得テーブル
200 入力装置
300 出力装置
本発明は、債権の制御に最適な政策を選択するために用いられる債権ポートフォリオ制御装置であって、債権の初期状態、外部要因の初期状態、及び制御期間長の入力を受け付ける初期条件受付手段と、前記初期条件受付手段が入力を受け付けた債権の初期状態と外部要因の初期状態の組合せを起点にして、前記初期条件受付手段が入力を受け付けた制御期間長までの各時点における債権の状態と外部要因の状態の組合せの遷移を各々のノードに展開したDPグラフを作成するDPグラフ作成手段と、一の時点から次の時点において、各々の外部要因の状態で前記一の時点において選択された行動に応じて債権の状態が遷移する各々のパターンの遷移確率である債権状態遷移確率を記憶する遷移確率記憶手段と、債権の状態が遷移する各々のパターンにおいて選択する行動に対応する期待利得を記憶する期待利得記憶手段と、前記DPグラフ作成手段が作成したDPグラフの各ノードにおける債権の状態、外部要因の状態、及び時点について、前記遷移確率記憶手段から前記外部要因の状態において前記時点における前記債権の状態が次の時点に遷移する各々のパターンの債権状態遷移確率を読み出し、かつ、前記各々のパターンにおける期待利得を前記期待利得記憶手段から読み出し、前記ノードにおいて選択し得る行動毎の期待総利得を、前記遷移確率記憶手段から読み出した債権状態遷移確率のうち各々の行動に対応するパターンの債権状態遷移確率と前記期待利得から算出して、期待総利得が最大となる行動を最適行動に決定する最適行動決定手段と、前記DPグラフ作成手段が作成したDPグラフの全てのノードについて前記最適行動決定手段が決定した最適行動を、前記債権を制御するための最適政策として出力する最適政策出力手段と、を備えていて、前記遷移確率記憶手段には、一の時点から次の時点において外部要因の状態が遷移する各々のパターンの遷移確率である外部要因遷移確率が記憶されていて、前記最適行動決定手段は、少なくとも一のノードについて、前記遷移確率記憶手段から前記時点における前記外部要因の状態が次の時点に遷移する各々のパターンの外部要因遷移確率を読み出し、前記外部要因遷移確率を反映した期待総利得を算出して、前記最適行動を決定することを特徴とする債権ポートフォリオ制御装置である。
本発明においては、最適行動を決定する際に、一の時点において選択された行動に応じて債権の状態が遷移する各々のパターンの遷移確率を用いることによって、融資限度額の設定等の行動を将来の信用格付等の債権の状態の遷移確率に反映し、期待総利得が最大となるように債権を制御するための最適政策を出力することが可能になる。
本発明においては、最適行動を決定する際に、一の時点から次の時点において外部要因の状態に応じて債権の状態が遷移する各々のパターンの遷移確率を用いることによって、経済環境等の外部要因の状況を将来の信用格付等の債権の状態の遷移確率に反映し、期待総利得が最大となるように債権を制御するための最適政策を出力することが可能になる。
本発明に対応する債権ポートフォリオ制御プログラムは、債権の制御に最適な政策を選択するために用いられる債権ポートフォリオ制御プログラムであって、一の時点から次の時点において、各々の外部要因の状態で前記一の時点において選択された行動に応じて債権の状態が遷移する各々のパターンの遷移確率である債権状態遷移確率を記憶する遷移確率記憶手段と、債権の状態が遷移する各々のパターンにおいて選択する行動に対応する期待利得を記憶する期待利得記憶手段とを備えた債権ポートフォリオ制御装置に、債権の初期状態、外部要因の初期状態、及び制御期間長の入力を受け付ける初期条件受付ステップと、前記初期条件受付ステップで入力を受け付けた債権の初期状態と外部要因の初期状態の組合せを起点にして、前記初期条件受付ステップで入力を受け付けた制御期間長までの各時点における債権の状態と外部要因の状態の組合せの遷移を各々のノードに展開したDPグラフを作成するDPグラフ作成ステップと、前記DPグラフ作成ステップで作成したDPグラフの各ノードにおける債権の状態、外部要因の状態、及び時点について、前記遷移確率記憶手段から前記外部要因の状態において前記時点における前記債権の状態が次の時点に遷移する各々のパターンの債権状態遷移確率を読み出し、かつ、前記各々のパターンにおける期待利得を前記期待利得記憶手段から読み出し、前記ノードにおいて選択し得る行動毎の期待総利得を、前記遷移確率記憶手段から読み出した債権状態遷移確率のうち各々の行動に対応するパターンの債権状態遷移確率と前記期待利得から算出して、期待総利得が最大となる行動を最適行動に決定する最適行動決定ステップと、前記DPグラフ作成ステップで作成したDPグラフの全てのノードについて前記最適行動決定ステップで決定した最適行動を、前記債権を制御するための最適政策として出力する最適政策出力ステップと、を実行させ、前記遷移確率記憶手段には、一の時点から次の時点において外部要因の状態が遷移する各々のパターンの遷移確率である外部要因遷移確率が記憶されていて、前記最適行動決定ステップでは、少なくとも一のノードについて、前記遷移確率記憶手段から前記時点における前記外部要因の状態が次の時点に遷移する各々のパターンの外部要因遷移確率を読み出し、前記外部要因遷移確率を反映した期待総利得を算出して、前記最適行動を決定することを特徴とする債権ポートフォリオ制御プログラムである。
本発明に対応する債権ポートフォリオ制御方法は、債権の制御に最適な政策を選択するために用いられる債権ポートフォリオ制御方法であって、一の時点から次の時点において、各々の外部要因の状態で前記一の時点において選択された行動に応じて債権の状態が遷移する各々のパターンの遷移確率である債権状態遷移確率を記憶する遷移確率記憶手段と、債権の状態が遷移する各々のパターンにおいて選択する行動に対応する期待利得を記憶する期待利得記憶手段とを備えた債権ポートフォリオ制御装置が、債権の初期状態、外部要因の初期状態、及び制御期間長の入力を受け付ける初期条件受付ステップと、前記債権ポートフォリオ制御装置が、前記初期条件受付ステップで入力を受け付けた債権の初期状態と外部要因の初期状態の組合せを起点にして、前記初期条件受付ステップで入力を受け付けた制御期間長までの各時点における債権の状態と外部要因の状態の組合せの遷移を各々のノードに展開したDPグラフを作成するDPグラフ作成ステップと、前記債権ポートフォリオ制御装置が、前記DPグラフ作成ステップで作成したDPグラフの各ノードにおける債権の状態、外部要因の状態、及び時点について、前記遷移確率記憶手段から前記外部要因の状態において前記時点における前記債権の状態が次の時点に遷移する各々のパターンの債権状態遷移確率を読み出し、かつ、前記各々のパターンにおける期待利得を前記期待利得記憶手段から読み出し、前記ノードにおいて選択し得る行動毎の期待総利得を、前記遷移確率記憶手段から読み出した債権状態遷移確率のうち各々の行動に対応するパターンの債権状態遷移確率と前記期待利得から算出して、期待総利得が最大となる行動を最適行動に決定する最適行動決定ステップと、前記債権ポートフォリオ制御装置が、前記DPグラフ作成ステップで作成したDPグラフの全てのノードについて前記最適行動決定ステップで決定した最適行動を、前記債権を制御するための最適政策として出力する最適政策出力ステップと、を有していて、前記遷移確率記憶手段には、一の時点から次の時点において外部要因の状態が遷移する各々のパターンの遷移確率である外部要因遷移確率が記憶されていて、前記債権ポートフォリオ制御装置は、前記最適行動決定ステップでは、少なくとも一のノードについて、前記遷移確率記憶手段から前記時点における前記外部要因の状態が次の時点に遷移する各々のパターンの外部要因遷移確率を読み出し、前記外部要因遷移確率を反映した期待総利得を算出して、前記最適行動を決定することを特徴とする債権ポートフォリオ制御方法である。
本発明は、債権の制御に最適な政策を選択するために用いられる債権ポートフォリオ制御装置であって、債権の初期状態x 1 、外部要因の初期状態z 1 、及び制御期間長Tの入力を受け付ける初期条件受付手段と、前記初期条件受付手段が入力を受け付けた債権の初期状態x 1 と外部要因の初期状態z 1 の組合せを起点にして、前記初期条件受付手段が入力を受け付けた制御期間長Tまでの各時点t(1≦t≦T)における債権の状態x t と外部要因の状態z t の組合せの遷移を各々のノードに展開したDPグラフを作成するDPグラフ作成手段と、一の時点tにおいて外部要因の状態z t で行動y t を選択した場合に、時点tにおける債権の状態x t が次の時点t+1において債権の状態x t+1 へと遷移する遷移確率を、債権の状態x t と債権の状態x t+1 と外部要因の状態z t と行動y t の組合せ毎に債権状態遷移確率として記憶し、かつ、一の時点tにおける外部要因の状態z t が次の時点t+1において外部要因の状態z t+1 へと遷移する遷移確率を、外部要因の状態z t と外部要因の状態z t+1 の組合せ毎に外部要因遷移確率として記憶する遷移確率記憶手段と、一の時点tにおいて行動y t を選択し、時点tにおける債権の状態x t が次の時点t+1において債権の状態x t+1 へと遷移した場合に得られる期待利得を、債権の状態x t と債権の状態x t+1 と行動y t の組合せ毎に記憶する期待利得記憶手段と、前記DPグラフ作成手段が作成したDPグラフの各ノードにおける債権の状態x t と外部要因の状態z t の組合せに対して、前記遷移確率記憶手段から、時点tにおいて外部要因の状態z t で行動y t を選択した場合に、時点tにおける債権の状態x t が次の時点t+1において債権の状態x t+1 へと遷移する債権状態遷移確率と、時点tにおける外部要因の状態z t が次の時点t+1において外部要因の状態z t+1 へと遷移する外部要因遷移確率を読み出し、かつ、前記前記期待利得記憶手段から、時点tにおいて行動y t を選択し、時点tにおける債権の状態x t が次の時点t+1において債権の状態x t+1 へと遷移した場合に得られる期待利得を読み出し、前記DPグラフの末端(t=T)の各ノードから順に、各ノードにおいて選択し得る行動毎の期待総利得を、前記遷移確率記憶手段から読み出した各々の行動に対応する組合せの遷移確率と、前記期待利得記憶手段から読み出した各々の行動に対応する組合せの期待利得から算出して、期待総利得が最大となる行動を最適行動に決定する最適行動決定手段と、前記DPグラフの全てのノードについて前記最適行動決定手段が決定した最適行動を、前記債権を制御するための最適政策として出力する最適政策出力手段と、を備え、前記最適行動決定手段は、t=Tとなる各ノードについては、選択可能な各々の行動y t について、遷移可能な各々の債権の状態x t+1 につき、該当する行動と債権の状態の組合せに対して読み出した前記期待利得に、該当する外部要因の状態と行動と債権の状態の組合せに対して読み出した前記債権状態遷移確率を乗算し、その総和である期待総利得を演算して、前記期待総利得が最大となる行動y t を最適行動に決定し、1≦t≦T−1となる各ノードについては、選択可能な各々の行動y t について、遷移可能な各々の債権の状態x t+1 につき、該当する行動と債権の状態の組合せに対して読み出した前記期待利得と、遷移可能な各々の外部要因の状態z t+1 についての該当するノードについて演算された前記期待総利得の最大値に読み出した前記外部要因遷移確率を乗じた値の総和とを加算した値に対して、該当する外部要因の状態と行動と債権の状態の組合せに対して読み出した前記債権状態遷移確率を乗算し、その総和である期待総利得を演算して、前記期待総利得が最大となる行動y t を最適行動に決定することを、t=1となる各ノードまで繰り返すことを特徴とする債権ポートフォリオ制御装置である。
さらに、本発明は、前記初期条件受付手段は、対象となる債権が新規債権か既存債権かを識別する債権識別情報の入力を受け付け、前記期待利得記憶手段には、新規債権を対象にした、最初の時点1において行動y 1 を選択し、時点1における債権の状態x 1 が次の時点2において債権の状態x 2 へと遷移した場合に得られる期待利得が、債権の状態x 1 と債権の状態x 2 と行動y 1 の組合せ毎に、既存債権についての期待利得とは別に記憶されていて、前記最適行動決定手段は、前記初期条件受付手段が新規債権を示す債権識別情報の入力を受け付けている場合には、t=1となるノードについては、前記期待利得記憶手段から新規債権についての期待利得を読み出し、前記期待利得を適用して期待総利得を演算し、前記最適行動を決定することを特徴とすることもできる。
本発明に対応する債権ポートフォリオ制御プログラムは、債権の制御に最適な政策を選択するために用いられる債権ポートフォリオ制御プログラムであって、一の時点tにおいて外部要因の状態z t で行動y t を選択した場合に、時点tにおける債権の状態x t が次の時点t+1において債権の状態x t+1 へと遷移する遷移確率を、債権の状態x t と債権の状態x t+1 と外部要因の状態z t と行動y t の組合せ毎に債権状態遷移確率として記憶し、かつ、一の時点tにおける外部要因の状態z t が次の時点t+1において外部要因の状態z t+1 へと遷移する遷移確率を、外部要因の状態z t と外部要因の状態z t+1 の組合せ毎に外部要因遷移確率として記憶する遷移確率記憶手段と、一の時点tにおいて行動y t を選択し、時点tにおける債権の状態x t が次の時点t+1において債権の状態x t+1 へと遷移した場合に得られる期待利得を、債権の状態x t と債権の状態x t+1 と行動y t の組合せ毎に記憶する期待利得記憶手段とを備えた債権ポートフォリオ制御装置に、債権の初期状態x 1 、外部要因の初期状態z 1 、及び制御期間長Tの入力を受け付ける初期条件受付ステップと、前記初期条件受付ステップで入力を受け付けた債権の初期状態x 1 と外部要因の初期状態z 1 の組合せを起点にして、前記初期条件受付ステップで入力を受け付けた制御期間長Tまでの各時点t(1≦t≦T)における債権の状態x t と外部要因の状態z t の組合せの遷移を各々のノードに展開したDPグラフを作成するDPグラフ作成ステップと、前記DPグラフ作成ステップで作成したDPグラフの各ノードにおける債権の状態x t と外部要因の状態z t の組合せに対して、前記遷移確率記憶手段から、時点tにおいて外部要因の状態z t で行動y t を選択した場合に、時点tにおける債権の状態x t が次の時点t+1において債権の状態x t+1 へと遷移する債権状態遷移確率と、時点tにおける外部要因の状態z t が次の時点t+1において外部要因の状態z t+1 へと遷移する外部要因遷移確率を読み出し、かつ、前記前記期待利得記憶手段から、時点tにおいて行動y t を選択し、時点tにおける債権の状態x t が次の時点t+1において債権の状態x t+1 へと遷移した場合に得られる期待利得を読み出し、前記DPグラフの末端(t=T)の各ノードから順に、各ノードにおいて選択し得る行動毎の期待総利得を、前記遷移確率記憶手段から読み出した各々の行動に対応する組合せの遷移確率と、前記期待利得記憶手段から読み出した各々の行動に対応する組合せの期待利得から算出して、期待総利得が最大となる行動を最適行動に決定する最適行動決定ステップと、前記DPグラフの全てのノードについて前記最適行動決定ステップで決定した最適行動を、前記債権を制御するための最適政策として出力する最適政策出力ステップと、を実行させ、前記最適行動決定ステップでは、t=Tとなる各ノードについては、選択可能な各々の行動y t について、遷移可能な各々の債権の状態x t+1 につき、該当する行動と債権の状態の組合せに対して読み出した前記期待利得に、該当する外部要因の状態と行動と債権の状態の組合せに対して読み出した前記債権状態遷移確率を乗算し、その総和である期待総利得を演算して、前記期待総利得が最大となる行動y t を最適行動に決定し、1≦t≦T−1となる各ノードについては、選択可能な各々の行動y t について、遷移可能な各々の債権の状態x t+1 につき、該当する行動と債権の状態の組合せに対して読み出した前記期待利得と、遷移可能な各々の外部要因の状態z t+1 についての該当するノードについて演算された前記期待総利得の最大値に読み出した前記外部要因遷移確率を乗じた値の総和とを加算した値に対して、該当する外部要因の状態と行動と債権の状態の組合せに対して読み出した前記債権状態遷移確率を乗算し、その総和である期待総利得を演算して、前記期待総利得が最大となる行動y t を最適行動に決定することを、t=1となる各ノードまで繰り返すことを特徴とする債権ポートフォリオ制御プログラムである。
さらに、本発明に対応する債権ポートフォリオ制御プログラムは、前記初期条件受付ステップでは、対象となる債権が新規債権か既存債権かを識別する債権識別情報の入力を受け付け、前記期待利得記憶手段には、新規債権を対象にした、最初の時点1において行動y 1 を選択し、時点1における債権の状態x 1 が次の時点2において債権の状態x 2 へと遷移した場合に得られる期待利得が、債権の状態x 1 と債権の状態x 2 と行動y 1 の組合せ毎に、既存債権についての期待利得とは別に記憶されていて、前記最適行動決定ステップでは、前記初期条件受付ステップで新規債権を示す債権識別情報の入力を受け付けている場合には、t=1となるノードについては、前記期待利得記憶手段から新規債権についての期待利得を読み出し、前記期待利得を適用して期待総利得を演算し、前記最適行動を決定することを特徴とすることもできる。
本発明に対応する債権ポートフォリオ制御方法は、債権の制御に最適な政策を選択するために用いられる債権ポートフォリオ制御方法であって、一の時点tにおいて外部要因の状態z t で行動y t を選択した場合に、時点tにおける債権の状態x t が次の時点t+1において債権の状態x t+1 へと遷移する遷移確率を、債権の状態x t と債権の状態x t+1 と外部要因の状態z t と行動y t の組合せ毎に債権状態遷移確率として記憶し、かつ、一の時点tにおける外部要因の状態z t が次の時点t+1において外部要因の状態z t+1 へと遷移する遷移確率を、外部要因の状態z t と外部要因の状態z t+1 の組合せ毎に外部要因遷移確率として記憶する遷移確率記憶手段と、一の時点tにおいて行動y t を選択し、時点tにおける債権の状態x t が次の時点t+1において債権の状態x t+1 へと遷移した場合に得られる期待利得を、債権の状態x t と債権の状態x t+1 と行動y t の組合せ毎に記憶する期待利得記憶手段とを備えた債権ポートフォリオ制御装置が、債権の初期状態x 1 、外部要因の初期状態z 1 、及び制御期間長Tの入力を受け付ける初期条件受付ステップと、前記債権ポートフォリオ制御装置が、前記初期条件受付ステップで入力を受け付けた債権の初期状態x 1 と外部要因の初期状態z 1 の組合せを起点にして、前記初期条件受付ステップで入力を受け付けた制御期間長Tまでの各時点t(1≦t≦T)における債権の状態x t と外部要因の状態z t の組合せの遷移を各々のノードに展開したDPグラフを作成するDPグラフ作成ステップと、前記債権ポートフォリオ制御装置が、前記DPグラフ作成ステップで作成したDPグラフの各ノードにおける債権の状態x t と外部要因の状態z t の組合せに対して、前記遷移確率記憶手段から、時点tにおいて外部要因の状態z t で行動y t を選択した場合に、時点tにおける債権の状態x t が次の時点t+1において債権の状態x t+1 へと遷移する債権状態遷移確率と、時点tにおける外部要因の状態z t が次の時点t+1において外部要因の状態z t+1 へと遷移する外部要因遷移確率を読み出し、かつ、前記前記期待利得記憶手段から、時点tにおいて行動y t を選択し、時点tにおける債権の状態x t が次の時点t+1において債権の状態x t+1 へと遷移した場合に得られる期待利得を読み出し、前記DPグラフの末端(t=T)の各ノードから順に、各ノードにおいて選択し得る行動毎の期待総利得を、前記遷移確率記憶手段から読み出した各々の行動に対応する組合せの遷移確率と、前記期待利得記憶手段から読み出した各々の行動に対応する組合せの期待利得から算出して、期待総利得が最大となる行動を最適行動に決定する最適行動決定ステップと、前記債権ポートフォリオ制御装置が、前記DPグラフの全てのノードについて前記最適行動決定ステップで決定した最適行動を、前記債権を制御するための最適政策として出力する最適政策出力ステップと、を有していて、前記最適行動決定ステップでは、t=Tとなる各ノードについては、選択可能な各々の行動y t について、遷移可能な各々の債権の状態x t+1 につき、該当する行動と債権の状態の組合せに対して読み出した前記期待利得に、該当する外部要因の状態と行動と債権の状態の組合せに対して読み出した前記債権状態遷移確率を乗算し、その総和である期待総利得を演算して、前記期待総利得が最大となる行動y t を最適行動に決定し、1≦t≦T−1となる各ノードについては、選択可能な各々の行動y t について、遷移可能な各々の債権の状態x t+1 につき、該当する行動と債権の状態の組合せに対して読み出した前記期待利得と、遷移可能な各々の外部要因の状態z t+1 についての該当するノードについて演算された前記期待総利得の最大値に読み出した前記外部要因遷移確率を乗じた値の総和とを加算した値に対して、該当する外部要因の状態と行動と債権の状態の組合せに対して読み出した前記債権状態遷移確率を乗算し、その総和である期待総利得を演算して、前記期待総利得が最大となる行動y t を最適行動に決定することを、t=1となる各ノードまで繰り返すことを特徴とする債権ポートフォリオ制御方法である。
さらに、本発明に対応する債権ポートフォリオ制御方法は、前記債権ポートフォリオ制御装置は、前記初期条件受付ステップでは、対象となる債権が新規債権か既存債権かを識別する債権識別情報の入力を受け付け、前記期待利得記憶手段には、新規債権を対象にした、最初の時点1において行動y 1 を選択し、時点1における債権の状態x 1 が次の時点2において債権の状態x 2 へと遷移した場合に得られる期待利得が、債権の状態x 1 と債権の状態x 2 と行動y 1 の組合せ毎に、既存債権についての期待利得とは別に記憶されていて、前記債権ポートフォリオ制御装置は、前記最適行動決定ステップでは、前記初期条件受付ステップで新規債権を示す債権識別情報の入力を受け付けている場合には、t=1となるノードについては、前記期待利得記憶手段から新規債権についての期待利得を読み出し、前記期待利得を適用して期待総利得を演算し、前記最適行動を決定することを特徴とすることもできる。