JP2020173742A - 情報処理装置、情報処理方法及びプログラム - Google Patents

情報処理装置、情報処理方法及びプログラム Download PDF

Info

Publication number
JP2020173742A
JP2020173742A JP2019076761A JP2019076761A JP2020173742A JP 2020173742 A JP2020173742 A JP 2020173742A JP 2019076761 A JP2019076761 A JP 2019076761A JP 2019076761 A JP2019076761 A JP 2019076761A JP 2020173742 A JP2020173742 A JP 2020173742A
Authority
JP
Japan
Prior art keywords
model
discrimination
comprehensive
result
discrimination model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019076761A
Other languages
English (en)
Other versions
JP6875445B2 (ja
Inventor
智 市川
Satoshi Ichikawa
智 市川
彰男 堀
Akio Hori
彰男 堀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Research Institute Inc
Original Assignee
Mitsubishi Research Institute Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Research Institute Inc filed Critical Mitsubishi Research Institute Inc
Priority to JP2019076761A priority Critical patent/JP6875445B2/ja
Publication of JP2020173742A publication Critical patent/JP2020173742A/ja
Application granted granted Critical
Publication of JP6875445B2 publication Critical patent/JP6875445B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

【課題】モデルを利用してある結果を予測する場合において、その結果が出てきた理由を利用者が容易に理解できる情報処理装置、情報処理方法及びプログラムを提供する。【解決手段】情報処理装置は、複数の要素判別モデルを生成する要素判別モデル生成部11と、要素判別モデルのモデル要素を用いて総合判別モデルを生成する総合判別モデル生成部15と、要素判別モデルに対象顧客データを適用することで要素判別結果を出力し、モデル要素と当該モデル要素の要素判別結果とを総合判別モデルに適用することで総合判別結果を出力する出力部80と、を有する。【選択図】図1

Description

本発明は、モデルを利用してある結果を予測する情報処理装置、情報処理方法及びプログラムに関する。
従来から、人工知能機能の活用が試みられており、研究分野も多岐に及んでいる。一例として、特許文献1では、音声が入力される入力部と、入力部に入力された音声を解析する音声解析部と、音声解析部によって解析された音声に基づき、説明変数を生成し、該説明変数ごとに重み付けする重みを生成する人口知能機能を有するスコアリング最適化サーバであって、説明変数と重みとに基づき音声モデルを構築する算出生成部と、該算出生成部で構築された音声モデルを記憶するデータベースとを有するスコアリング最適化サーバが開示されている。
特開2018−194590号
人工知能機能を活用した場合には、説明変数と重みを最適化することで優れたモデルを生成でき、その結果として優れた予測結果を得ることができる。しかしながら、利用者としては、何が原因でそのような結果が出てきたのかを理解できない。
本発明は、モデルを利用してある結果を予測する場合において、その結果が出てきた理由を利用者が容易に理解できる情報処理装置等を提供する。
本発明による情報処理装置は、
複数の要素判別モデルを生成する要素判別モデル生成部と、
前記要素判別モデルのモデル要素と当該モデル要素の要素判別結果を用いて総合判別モデルを生成する総合判別モデル生成部と、
前記要素判別モデルに対象顧客データを適用することで要素判別結果を出力し、モデル要素と当該モデル要素の要素判別結果とを総合判別モデルに適用することで総合判別結果を出力する出力部と、
を備えてもよい。
本発明による情報処理装置において、
総合判別モデル生成部は、前記要素判別モデルのモデル要素と当該モデル要素の要素判別結果だけを用いて総合判別モデルを生成してもよい。
本発明による情報処理装置において、
要素判別結果は確率情報であり、
前記総合判別モデル生成部は、前記要素判別モデルのモデル要素と当該モデル要素に対する確率情報を用いて総合判別モデルを生成し、
前記出力部は、前記要素判別モデルのモデル要素と当該モデル要素における確率情報を総合判別モデルに適用することで総合判別結果を出力してもよい。
本発明による情報処理装置において、
前記要素判別モデルのモデル要素は複数の個別要素を含み、
前記モデル要素に含まれる個別要素のうち上位の個別要素を選択する選択部と、
前記選択部によって選択された個別要素と当該個別要素に対する係数とを用いて文章を作成する文書作成部と、
を備えてもよい。
本発明による情報処理装置において、
前記選択部は、予め定められた閾値以上の寄与度が認められるモデル要素に含まれる個別要素だけを選択してもよい。
本発明による情報処理装置において、
前記要素判別モデル及び前記総合判別モデルは融資に利用されるモデルであり、
前記出力部は、対象顧客データを各要素判別モデルに適用した融資に関する要素判別結果と、対象顧客データを総合判別モデルに適用した融資に関する総合判別結果とを出力してもよい。
本発明による情報処理装置において、
前記要素判別モデル生成部は人工知能機能を用いて前記要素判別モデルを生成し、
前記総合判別モデル生成部は統計モデルからなる総合判別モデルを生成してもよい。
本発明による情報処理方法は、
要素判別モデル生成部によって、複数の要素判別モデルを生成する工程と、
総合判別モデル生成部によって、前記要素判別モデルのモデル要素と当該モデル要素の要素判別結果を用いて総合判別モデルを生成する工程と、
前記要素判別モデルに対象顧客データを適用することで要素判別結果を出力部によって出力する工程と、
モデル要素と当該モデル要素の要素判別結果とを総合判別モデルに適用することで総合判別結果を出力部によって出力する工程と、
を備えてもよい。
本発明によるプログラムは、
情報処理装置にインストールされるプログラムであって、
前記プログラムがインストールされた情報処理装置は、
複数の要素判別モデルを生成する要素判別モデル生成部と、
前記要素判別モデルのモデル要素と当該モデル要素の要素判別結果を用いて総合判別モデルを生成する総合判別モデル生成部と、
前記要素判別モデルに対象顧客データを適用することで要素判別結果を出力し、モデル要素と当該モデル要素の要素判別結果とを総合判別モデルに適用することで総合判別結果を出力する出力部と、
を備えてもよい。
本発明の一態様によれば、総合判別結果が出された理由をモデル要素に分類して出力でき、利用者が当該理由を容易に理解できる。
本発明の第1の実施の形態による情報処理装置の概略ブロック図 本発明の第1の実施の形態による情報処理の流れの一例を示した図 本発明の第1の実施の形態による情報処理装置によって出力される内容の一例を示した図 本発明の第1の実施の形態による情報処理装置の一例を示した概略ブロック図 本発明の第1の実施の形態による情報処理装置の別の例を示した概略ブロック図 本発明の第1の実施の形態による情報処理装置のさらに別の例を示した概略ブロック図 本発明の第1の実施の形態におけるモデル構築過程の一例を示した図 本発明の第1の実施の形態におけるモデル適用過程の一例を示した図 本発明の第2の実施の形態による情報処理装置の概略ブロック図 本発明の第2の実施の形態におけるモデル構築過程の一例を示した図 本発明の第2の実施の形態におけるモデル適用過程の一例を示した図 本発明の第2の実施の形態において文書を作成する過程の一例を示した図
第1の実施の形態
《構成》
本実施の形態の情報処理装置はあらゆる分野で利用できる。本実施の形態では金融の分野を用いて説明するが、これに限られることはない。情報処理装置は金融機関に設置されてもよいし、金融機関以外の外部機関に設置されてもよい。本実施の形態の情報処理装置は、一つの装置から構成されてもよいし複数の装置から構成されてもよい。また、複数の装置から情報処理装置が構成される場合には、各装置が同じ部屋等の同じ空間に設けられる必要はなく、異なる部屋、異なる建物、異なる地域等に設けられてもよい。また、複数の装置から情報処理装置が構成される場合には、その一部を金融機関が所有及び/又は管理し、残りを外部機関が所有及び/又は管理してもよい。
図1に示すように、本実施の形態の情報処理装置は、複数の要素判別モデルを生成する要素判別モデル生成部11と、要素判別モデルのモデル要素と当該モデル要素の要素判別結果を用いて総合判別モデルを生成する総合判別モデル生成部15と、様々な情報を出力する出力部80と、を有してもよい。要素判別モデル生成部11及び総合判別モデル生成部15はモデル構築部10に含まれてもよい。出力部80は、要素判別モデルに対象顧客データを適用することで得られる要素判別結果を出力してもよい。出力部80は、対象顧客データに対するモデル要素及び当該モデル要素の要素判別結果を総合判別モデルに適用することで得られる総合判別結果を出力してもよい。
要素判別モデルは特定のモデル要素にどの程度合致するかを判別するためのモデルである。総合判別モデルはモデル要素の結果を用いて、総合的な観点から結果を判別するためのモデルである。一例としては、図2に示すように、情報を収集して形成された統合データに対して後述する要素判別モデル適用部31によって要素判別モデルを適用することで要素毎の要素判別結果を出力する。また、モデル要素及び当該モデル要素の要素判別結果に対して後述する総合判別モデル適用部32によって総合判別モデルを適用することで総合判別結果を出力する。
モデル要素の決定は、人間の専門家が経験的に分類して決めてもよいし、データに要因が明確に入力されている場合はそれをそのまま利用してもよい。既に取得されているデータに判別結果に対する理由やコメントが記入されている場合には、その文章を用いてカテゴリーに分類するようなクラスタ分析を行ってもよいし、得られるデータそのものからクラスタ分析を行ってもよい。情報処理装置にはパソコンの端末やタブレット等の入力部210(図1参照)から情報が入力されるようになってもよい。
総合判別モデル生成部15は全てのモデル要素を用いて総合判別モデルを生成してもよい。ただし、これに限られることはなく、総合判別モデル生成部15は一部のモデル要素を用いて総合判別モデルを生成してもよい。総合判別モデル生成部15は、要素判別モデルのモデル要素と当該モデル要素の要素判別結果だけを用いて総合判別モデルを生成してもよい。ただし、これに限られることはなく、要素判別モデルのモデル要素と当該モデル要素の要素判別結果に加えて、別の要素を用いて総合判別モデルを生成してもよい。この別の要素は予め把握されている特定要素に限定されてもよい。
要素判別結果は確率情報であってもよく、対象案件が各要素にどの程度当てはまるかを表す数値であってもよい。モデル要素と当該モデル要素における確率情報とを総合判別モデルに適用することで総合判別結果を出力するようにしてもよい。総合判別結果とは最終的な判別結果であり、その結果と結果の信頼度が出力してもよい。図3では、総合判定として「承認 92.3%」という結果が示され、その下に、モデル要素毎に、その確率が示されている。図3に示されている例では全体として高い要素がなく、要素7及び要素3が多少認められる程度であるが、その総合判定の結果として「承認」という結果が高い信頼性をもって判別されたことが示されている。モデル要素の各々は要素判別モデルに対応している。「承認」という結果を出すかどうかは予め定められた「判断基準値」と比較することで判断されてもよい。
対象案件ごとに識別情報(ID等)がつけられており、当該識別情報に基づいて対象案件を検索できるようになってもよい(図3参照)。
要素判別モデルのモデル要素は複数の個別要素を含んでもよい。後述する図12に示される態様では、モデル要素3の中に「過去X年間にU発生件数Z」「過去X年間での連続U発生月数Z」等といった個別要素が含まれていることが示されている。モデル要素に含まれる複数の個別要素の内容と結果に基づいて、要素判別モデルが生成されることになる。
要素判別モデル及び総合判別モデルは融資に利用されるモデルであってもよい。融資対象は個人であってもよいし法人であってもよい。この場合には、出力部80は、対象顧客データを各要素判別モデルに適用した融資に関する要素判別結果と、対象顧客データを総合判別モデルに適用した融資に関する総合判別結果とを出力するようにしてもよい。図3は融資判定結果を示したものであり、総合判定としては融資を「承認」することが示されている(なお「承認」しない場合には「否認」という結果が出力されてもよい。)。このように融資に関するモデルの場合には、入力される情報としては、氏名、住所、職業、勤務先区分、勤務先、勤務先業種、職種、年収、借入希望額等を含む「申込情報」、「信用情報」等を挙げることができ、モデル要素としては「審査対象外」、「人物疑義」、「事故延滞」、「返済負担」、「収入安定性」、「他社借入状況」等の要素を用いてもよい。「審査対象外」とは当該融資の対象外となっていないかの要素であり、「人物疑義」とは例えば返済予定がないのに融資を申し込んでいるかどうかという要素であり、「事故延滞」とは例えば延滞件数、延滞月数、延滞期間等のブラックリストへの該当性である。
要素判別モデル生成部11は人工知能機能を用いて要素判別モデルを生成してもよい。総合判別モデル生成部15は人工知能機能を用いて総合判別モデルを生成してもよい。ただし、これに限られることはなく、要素判別モデル生成部11及び総合判別モデル生成部15は統計モデルからなる総合判別モデルを用いてもよい。一例であるが、統計モデルを用いた場合には10程度の採用変数と採用変数に対する係数が利用されることになり、人工知能機能を用いたモデルでは100〜1000程度の採用変数と採用変数に対する係数が利用されることになる。
要素判別モデル生成部11では大量の情報を処理することから、機械学習を行う人工知能機能を用いることが有益である。他方、総合判別モデル生成部15では、限られた数のモデル要素を用いることから、情報量としてはそれほど大きなものとはならない。このため、高い正確性を実現しつつ比較的簡易な構成を採用するという観点からすると、要素判別モデル生成部11は人工知能機能を用いてモデルを生成するが、総合判別モデル生成部15は統計モデルを生成するようにしてもよい。
なお、統計モデルとしては、回帰分析手法(線形回帰分析及びロジスティック回帰分析を含む。)を利用してもよいし、決定木手法(CART、CHAID、ID3、C4.5といった学習アルゴリズム手法を含む。)を利用してもよい。人工知能機能を用いる場合には、ディープラーニング手法を用いてもよいし、ランダムフォレスト、SVMやGBDT等の多様な機械学習手法を用いてもよい。
図4における「入力」で示されるように、判別対象となる案件に関する判別に関連するデータが入力される。この際、書類から人間が入力してもよいし、他のシステムから電子的に入力データが入力されてもよいし、インターネット等のネットワーク経由で入力データが取得されてもよい。
入力された案件データが案件データベース61に記憶される。案件データベース61は、リレーショナルなデータベースではなくファイルシステムであってもよい。案件データベース61には、これから判断を行うために入力された新規の案件に加え、過去の判断で用いた過去の案件情報が保持されてもよい。
入力された案件に応じ、当該案件に関連する情報を他のデータベースから取得し、案件データベース61に記憶されてもよい。この他のデータベースは、内部関連情報データベース63を有してもよいし、外部情報データベース64を有してもよい。図1に示す記憶部60は、案件データベース61、後述する分析統合データベース62、内部関連情報データベース63及び外部情報データベース64を含んでもよい。
案件データベース61内の情報がモデル適用部30によって要素判別モデル及び総合判別モデルに適用され、その結果が出力部80によって出力される(図4の「出力」参照)。モデル適用部30による出力結果はディスプレイに表示されてもよいし、書類として印字されてもよいし、他のシステムに電子的に出力されてもよい。なお、モデル適用部30は、図1に示すように、要素判別モデルを適用する要素判別モデル適用部31と、総合判別モデルを適用する総合判別モデル適用部36とを有している。
図4の案件状態管理部90では、前述した、入力、案件データベース61への記憶、モデル適用、出力等の工程についてのデータの状態を管理してもよい。案件状態管理部90は、例えば、あるプロセスが終了すると次のプロセスにデータを渡すように、データの状態(ステータス)をワークフローとして管理してもよい。
案件データベース61の一定期間の過去のデータを取得し、分析統合データベース62としてもよい。分析統合データベース62は、案件データベース61からだけでなく、更に古いデータ等を保有する他のシステムからのデータも保有してもよい。この分析統合データベース62を用いてモデル構築部10が要素判別モデル及び総合判別モデルを構築してもよい。モデル構築部10によって構築された要素判別モデル及び総合判別モデルがモデル適用部30において適用されることになる。
図5に示すように、要素判別モデル及び総合判別モデルとは異なる第三判別モデルを適用する第三判別モデル適用部35が設けられてもよい。第三判別モデルは従前から用いられている統計モデルであってもよい。この場合には統計モデルに案件データが適用された結果が出力部80(図1参照)によって出力されてもよい。この第三判別モデル適用部35はモデル適用部60の一部を構成している。この態様を採用した場合には、従前から用いられている統計モデルによる結果と要素判別モデル及び総合判別モデルを用いた結果とを比較することができ、従前の結果との比較を行うことができる。運用の初期段階では、第三判別モデルと、要素判別モデル及び総合判別モデルの両方を用いてもよいが、ある程度時間が経過した時点で、第三判別モデルの利用を停止し、要素判別モデル及び総合判別モデルだけを利用するようにしてもよい。
なお、統計モデルを用いた場合の説明能力は人工知能機能を用いたモデルを用いた説明能力よりも低くなることが一般的であり、人工知能機能を用いたモデルの説明能力の基準値が例えば85〜90程度であるのに対して、統計モデルを用いた場合の説明能力の基準値は例えば70程度となる。
図6に示すように、案件データベース61の情報等がAPI送受信等を利用する送受信部を介して分析統合データベース62、モデル構築部10及びモデル適用部30に送信されてもよい。また、モデル構築部10及びモデル適用部30からの情報が送受信部を介して出力部80等によって受信されるようにしてもよい。この態様を採用した場合には、金融機関等に導入されている既存のシステムや業務に大幅な変更を加えず、外部に設けられたシステムを利用することで、モデル構築及びモデル適用を行うことができる。
《方法》
本実施の形態の情報処理装置を用いた情報処理方法について説明する。なお、上記と重複することになるので簡単に説明するに留めるが、上記「構成」で述べた全ての態様を「方法」において適用することができる。
図7に示す情報収集工程S1では、対象となる事象に関する過去の観測データを取得してもよい。一般的に対象となる事象に関する観測データは複数の種類のデータから構成される。場合によっては、対象となる事象に関するデータが無いようなデータ種類も存在するが、そのような場合でもデータが無いことが情報であるため、データが無いという状態でデータを取得してもよい。
結果取得工程S2では、対象となる事象の過去の判断結果データを取得してもよい。上記の観測データに判断結果を結合し、事象ごとに過去の観測データと判断結果が結合したデータを作成してもよい。
分析統合データ作成工程S3では、複数の種類の観測データと判断結果データを一つに統合しまとめてもよい。なお、本実施の形態では、この一つに統合されたデータを分析統合データと呼んでいる。
変数加工工程S4では、分析統合データに含まれている複数のデータ項目に対し、演算処理を行い説明変数としてもよい。例えば、年齢を10歳ごとに区切り年齢階層としたり、職業を定義されたカテゴリーに適用したりする等してもよい。後述するモデル評価の結果を受けて、モデル構築工程S4では変数加工も行われる。
判別モデル生成工程S5では、要素判別モデルと総合判別モデルがそれぞれ構築されてもよい。
モデル評価工程S6では、構築した統計判別モデルによって、過去の観測データがどの程度正しく判別結果を説明できているかに対し評価関数を計算し、当該モデルの評価を行ってもよい。
変数加工工程S4では、説明変数や係数を変更して、再度、要素判別モデル及び/又は総合判別モデルを構築してもよい。変数加工工程S4、判別モデル生成工程S5及びモデル評価工程S6が多数回繰り返して行われ、最適な要素判別モデル及び総合判別モデルを構築するようにしてもよい。
情報収集工程S51では、過去の観測データではなく、これから自動判別を行いたい観測データを取得してもよい。複数の種類の観測データが存在するため、すべての関連データを取得してもよい。
対象統合データ生成工程S52では、複数の種類の観測データを一つのデータに統合してもよい。本実施の形態では、このデータを対象統合データと呼ぶ。対象統合データは、一つの対象についての様々な観測データをひとまとまりにしたデータとなっている。
変数計算工程S53では、対象統合データに含まれている複数のデータ項目に対し、演算処理を行い説明変数としてもよい。
モデル適用工程S54では、当該対象に関わる説明変数に対して、要素判別モデル及び総合判別モデルを適用し、当該対象の判定値を算出してもよい。
モデル適用工程S55では、判定値と事前に設定されている「判断基準値」を比較し、その結果によって判別結果としてもよい。
モデル適用工程S56では、対象となる事象に対して、各要素判別結果とともに総合判別結果を出力してもよい。
《効果》
次に、上述した構成からなる本実施の形態による効果であって、未だ説明していないものを中心に説明する。
複数の要素判別モデルを生成し、要素判別モデルのモデル要素と当該モデル要素の要素判別結果とを用いて総合判別モデルを生成し、要素判別モデルに対象顧客データを適用することで要素判別結果を出力し、モデル要素と当該モデル要素の要素判別結果とを総合判別モデルに適用することで総合判別結果を出力する態様を採用する場合には、総合判別結果が出された理由をモデル要素に分類して出力できる。
例えば図3に示す態様では、7つの要素判別モデルが生成されており、7つの要素判別モデルに対象顧客データを適用することで各要素判別モデルにおける要素判別結果が出力されている。より具体的には「要素1:13.9%、要素2:14.4%、要素3:35.4%、要素4:11.3%、要素5:12.7%、要素6:25.5%、要素7:41.7%」という要素判別結果が出力されている。そして、次に7つのモデル要素と、当該モデル要素の7つの要素判別結果を総合判別モデルに適用することで「92.3%」という確率及び当該確率による「承認」という総合判別結果が出力されている。したがって、この態様によれば、ある対象者について「92.3%」という確率の結果、「承認」であるという結論に加え、要素1が13.9%で寄与し、要素2が14.4%で寄与し、要素3が35.4%で寄与し、要素4が11.3%で寄与し、要素5が12.7%で寄与し、要素6が25.5%で寄与し、要素7が41.7%で寄与しているというモデル要素の寄与具合も把握することができる。
AIを用いて結果だけを出力する態様では、以下のような不都合が生じ得る。
・モデル構築に利用するデータ(学習データ)が十分な数用意できない場合、過去に存在した特殊な事象が拡大解釈されて非現実的な判断が行われる可能性を払拭することが出来ず、判断の結果が現実的なものか非現実的なのかを判断理由によって確認することが出来ない。
・AIで作成したモデルが統計的に有意であっても、人間が個別案件単位に結果を見てAIの判別結果に納得することが出来ない特殊なケースがある。この時に判断の理由がわからないと、少数でも判断に誤りがあることを理由として、全体として安心して任せることが出来なくなり、システムが利用されなくなる。
・顧客や内外の関係者に対して、なぜその案件にその判別を行ったのか説明できない。この案件にはこのような特徴があるのに、それをきちんと見て判断したのか、と問われた時に、簡潔に判断の理由を説明できない。
・なぜその案件にその判別を行ったのか説明できないため、事後に内部・外部監査に対応が出来ない。または監査において判断の妥当性を証明できない。事故が発生した時の原因追及が不可能となる。
これらの不都合を解消するために(つまり結果を構成する理由を把握するために)、結果を出力するモデルとは別に理由ごとにモデルを構築し、当該モデルへの適用を見て結果を構成する理由を出力することも考えられる。しかしながら、この態様では、要素判別結果と総合判別結果とが独立して出力され、要素判別結果以外の外部要因も寄与することから、総合判別結果への要素判別結果の寄与度を確実には把握できない。他方、要素判別モデルのモデル要素と当該モデル要素の要素判別結果だけを用いて総合判別モデルを生成し、それ以外の要素を用いて総合判別モデルを生成しない場合には、外部要因が入る余地が存在せず、総合判別モデルがモデル要素に基づいて100%構築されることになる。この結果、総合判別結果を要素判別結果に基づいて出力でき、総合判別結果に至った理由を要素判別結果に正確に関連付けることができる。
全てのモデル要素(図3に示す態様では7つのモデル要素全て)を用いて総合判別モデルを生成する場合には、予め定めたモデル要素の全てを用いて総合判別結果を得ることができる。但し、状況に応じて、一部のモデル要素を用いて総合判別モデルを生成するようにしてもよい。また、全てのモデル要素を用いて総合判別モデルを生成するが、総合判別結果を得る段階では一部のモデル要素と当該モデル要素の結果だけを用いてもよい。この場合には、用いないモデル要素の要素判別結果は総合判別結果に反映されないこととなり、総合判別結果を構成するモデル要素の正確な寄与率(寄与の程度)を把握することはできないが、利用したモデル要素の相対的な寄与率(寄与の程度)を把握することはできる。
要素判別モデル及び総合判別モデルが融資に利用されるモデルである場合には、融資の場面で本実施の形態を利用することができる。融資を行う際に、ある人物に融資を行った理由が問題となることがあるが、従来から用いられている態様では、当該ある人物に融資を行った理由としてはモデル適用の結果が良かったためであるとしか回答できない。またモデルを構築するのは金融機関とは異なる外部機関であることが一般的であり、外部機関の生成するモデルを理由もなく100%信じることには問題がある。そのため、仮に人工知能機能を用いたモデルで融資審査を行っても、その結果を鵜呑みすることができず、金融機関の担当者が個別にも判断を行っているような実情がある。これに対して、本実施の形態によれば、モデル適用の結果が良かったということに加え、どの要素が影響して当該ある人物への融資が決定されたかを把握することができる。このため、金融機関での融資審査を効率的に行うことができる。
前述したように、要素判別モデル生成部11が人工知能機能を用いてモデルを生成しつつ、総合判別モデル生成部15が統計モデルを生成する態様を採用した場合には高い正確性を実現しつつ比較的簡易な構成を採用することができるが、利用される要素判別モデルの数の上限値を10〜20とする場合には、モデルの説明能力の基準値を85〜90程度とすることができ、人工知能機能だけを用いてモデルを構築した場合と同程度の正確性を実現できる。
第2の実施の形態
次に、本発明の第2の実施の形態について説明する。
本実施の形態では、図9に示すように、モデル要素に含まれる個別要素のうち上位の個別要素を選択する選択部110が設けられている。上位とは寄与している寄与度(寄与割合)の大きいことを意味し、例えば上位3〜10の個別要素を選択部110が選択してもよい。この選択は人為的に行われてもよいし、クラスタリング分析によって行われてもよい。選択部110によって選択された個別要素と当該個別要素に対する係数とを用いて文章を作成する文書作成部120が設けられている。文書作成部120は日本語で文書を作成してもよいが、これに限られることはなく、英語、中国語等の様々な言語で文書を作成してもよい。その他については、第1の実施の形態と同様であり、第1の実施の形態で採用したあらゆる構成を第2の実施の形態でも採用することができる。
図10に示される態様では、判別結果理由文章に関わるモデル構築工程S10、S11及びS12が設けられている。
理由取得工程S10では結果に至った理由に関する結果理由記述データが取得される。そして、分析統合データ作成工程S3において、当該結果理由記述データも含めた分析統合データが生成される。
文書モデル生成工程S11では文書作成部120において文書生成モデルが生成される。文書モデル評価工程S12では文書生成モデルを適用した結果の評価が行われる。文書モデル生成工程S11及び文書モデル評価工程S12は、精度の高い文書生成モデルが構築されるまで繰り返し行われてもよい。変数加工工程S4において変数加工が行われた場合には、その結果は、文書モデル生成工程S11において反映されることになる。
図11に示される態様では、判別結果理由文章に関わる文書生成モデル適用工程S60が設けられている。文書生成モデル適用工程S60では文書生成モデルに対象データを適用することで当該結果に行った理由を説明する文章が自動で作成されることとなる。
モデル要素に含まれる個別要素のうち上位の個別要素を選択し、選択された個別要素と当該個別要素に対する係数とを用いて文章を作成する態様を採用してもよい。この場合には、利用者は総合判別結果に至る理由をより容易に認識することができる。
図12では、一例として、要素3に含まれる個別要素として「過去X年間にU発生件数Z」「過去X年間での連続U発生月数Z」等といった内容が示されている。これらの結果を用いて、主要素による理由の文書生成モデルが生成される。そして、この文書生成モデルに対象案件を適用することで、「U要因あるが一時的で軽微」という文書が生成されたり、「過去重度W発生あり」という文書が生成されたりする。そして、複数のモデル要素に含まれる個別要素を用いて全体的な文書が作成され、図12では「年齢X属性X属性X問題なし、U要因あるが一時的で軽微、・・・、AA問題なし」という文書が生成される態様が示されている。融資モデルの場合には例えば「年齢X職業Yで年収Z問題なし、延滞あるが月超えのみ軽微、・・・、融資A円問題なし」という文書が生成される。
文書生成で用いられるモデル要素は閾値以上の寄与が認められるものに限定されてもよく、仮に寄与率25%以上のモデル要素を用いるという態様を採用した場合には、図12に示す態様では、要素3、要素6及び要素7に含まれる個別要素が利用されて全体的な文書が生成されることになる。このような態様を採用することで、寄与度の高いモデル要素だけを用いて文書が作成されることから、個別要素を抽出する処理を簡略化しつつも、精度の高い理由を用いた説明が可能となる。ただし、このような態様に限られることはなく、選択部110は、モデル要素に含まれる個別要素のうち寄与度の高い個別要素をモデル要素のカテゴライズとは無関係に選択してもよい。
過去の案件の判断理由が人間の専門家によって判断理由の記述がなされており、その記述データが案件及びその結果と照らし合わせて参照することが可能な場合には、文章生成モデルは、当該文章と、主要素データ及び/又は変数データから適切な結果理由記述を自然言語で生成できるようなモデルとなってもよい。
過去の案件の判断理由記述データが存在しない場合や判断理由記述データが不足している場合には、判断理由をパターン化してテンプレートとして登録し、データ条件によってテンプレートを選択し、テンプレート中の必要部位に数値や文字を当てはめることも可能である。
上述した各実施の形態の記載及び図面の開示は、特許請求の範囲に記載された発明を説明するための一例に過ぎず、上述した実施の形態の記載又は図面の開示によって特許請求の範囲に記載された発明が限定されることはない。
11 要素判別モデル生成部
15 総合判別モデル生成部
80 出力部
110 選択部
120 文書作成部

Claims (9)

  1. 複数の要素判別モデルを生成する要素判別モデル生成部と、
    前記要素判別モデルのモデル要素と当該モデル要素の要素判別結果を用いて総合判別モデルを生成する総合判別モデル生成部と、
    前記要素判別モデルに対象顧客データを適用することで要素判別結果を出力し、モデル要素と当該モデル要素の要素判別結果とを総合判別モデルに適用することで総合判別結果を出力する出力部と、
    を備える情報処理装置。
  2. 総合判別モデル生成部は、前記要素判別モデルのモデル要素と当該モデル要素の要素判別結果だけを用いて総合判別モデルを生成する、請求項1に記載の情報処理装置。
  3. 要素判別結果は確率情報であり、
    前記総合判別モデル生成部は、前記要素判別モデルのモデル要素と当該モデル要素に対する確率情報を用いて総合判別モデルを生成し、
    前記出力部は、前記要素判別モデルのモデル要素と当該モデル要素における確率情報を総合判別モデルに適用することで総合判別結果を出力する請求項1又は2のいずれかに記載の情報処理装置。
  4. 前記要素判別モデルのモデル要素は複数の個別要素を含み、
    前記モデル要素に含まれる個別要素のうち上位の個別要素を選択する選択部と、
    前記選択部によって選択された個別要素と当該個別要素に対する係数とを用いて文章を作成する文書作成部と、
    を備える請求項1乃至3のいずれか1項に記載の情報処理装置。
  5. 前記選択部は、予め定められた閾値以上の寄与度が認められるモデル要素に含まれる個別要素だけを選択する請求項4に記載の情報処理装置。
  6. 前記要素判別モデル及び前記総合判別モデルは融資に利用されるモデルであり、
    前記出力部は、対象顧客データを各要素判別モデルに適用した融資に関する要素判別結果と、対象顧客データを総合判別モデルに適用した融資に関する総合判別結果とを出力する請求項1乃至5のいずれか1項に記載の情報処理装置。
  7. 前記要素判別モデル生成部は人工知能機能を用いて前記要素判別モデルを生成し、
    前記総合判別モデル生成部は統計モデルからなる総合判別モデルを生成する請求項1乃至6のいずれか1項に記載の情報処理装置。
  8. 要素判別モデル生成部によって、複数の要素判別モデルを生成する工程と、
    総合判別モデル生成部によって、前記要素判別モデルのモデル要素と当該モデル要素の要素判別結果を用いて総合判別モデルを生成する工程と、
    前記要素判別モデルに対象顧客データを適用することで要素判別結果を出力部によって出力する工程と、
    モデル要素と当該モデル要素の要素判別結果とを総合判別モデルに適用することで総合判別結果を出力部によって出力する工程と、
    を備える情報処理方法。
  9. 情報処理装置にインストールされるプログラムであって、
    前記プログラムがインストールされた情報処理装置は、
    複数の要素判別モデルを生成する要素判別モデル生成部と、
    前記要素判別モデルのモデル要素と当該モデル要素の要素判別結果を用いて総合判別モデルを生成する総合判別モデル生成部と、
    前記要素判別モデルに対象顧客データを適用することで要素判別結果を出力し、モデル要素と当該モデル要素の要素判別結果とを総合判別モデルに適用することで総合判別結果を出力する出力部と、
    を備えるプログラム。
JP2019076761A 2019-04-15 2019-04-15 情報処理装置、情報処理方法及びプログラム Active JP6875445B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019076761A JP6875445B2 (ja) 2019-04-15 2019-04-15 情報処理装置、情報処理方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019076761A JP6875445B2 (ja) 2019-04-15 2019-04-15 情報処理装置、情報処理方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2020173742A true JP2020173742A (ja) 2020-10-22
JP6875445B2 JP6875445B2 (ja) 2021-05-26

Family

ID=72831661

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019076761A Active JP6875445B2 (ja) 2019-04-15 2019-04-15 情報処理装置、情報処理方法及びプログラム

Country Status (1)

Country Link
JP (1) JP6875445B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023047511A1 (ja) * 2021-09-24 2023-03-30 日本電気株式会社 解約予測システム、解約予測方法およびプログラム記録媒体
JP7396582B1 (ja) 2023-09-19 2023-12-12 ゼネリックソリューション株式会社 審査業務文書作成支援装置、審査業務文書作成支援方法、及び審査業務文書作成支援プログラム

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04288663A (ja) * 1991-02-12 1992-10-13 Mitsubishi Electric Corp 複合自己組織型パタ−ン分類システム
JP2011227838A (ja) * 2010-04-23 2011-11-10 Kyoto Univ 予測装置及びその学習装置並びにそれらのコンピュータプログラム
JP2013218725A (ja) * 2013-06-19 2013-10-24 Hitachi Ltd 異常検知方法及び異常検知システム
JP2016091306A (ja) * 2014-11-05 2016-05-23 株式会社東芝 予測モデル作成方法
WO2017109903A1 (ja) * 2015-12-24 2017-06-29 株式会社 東芝 異常原因推定装置及び異常原因推定方法
JP2018045412A (ja) * 2016-09-14 2018-03-22 ヤフー株式会社 生成装置、生成方法、及び生成プログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04288663A (ja) * 1991-02-12 1992-10-13 Mitsubishi Electric Corp 複合自己組織型パタ−ン分類システム
JP2011227838A (ja) * 2010-04-23 2011-11-10 Kyoto Univ 予測装置及びその学習装置並びにそれらのコンピュータプログラム
JP2013218725A (ja) * 2013-06-19 2013-10-24 Hitachi Ltd 異常検知方法及び異常検知システム
JP2016091306A (ja) * 2014-11-05 2016-05-23 株式会社東芝 予測モデル作成方法
WO2017109903A1 (ja) * 2015-12-24 2017-06-29 株式会社 東芝 異常原因推定装置及び異常原因推定方法
JP2018045412A (ja) * 2016-09-14 2018-03-22 ヤフー株式会社 生成装置、生成方法、及び生成プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023047511A1 (ja) * 2021-09-24 2023-03-30 日本電気株式会社 解約予測システム、解約予測方法およびプログラム記録媒体
JP7396582B1 (ja) 2023-09-19 2023-12-12 ゼネリックソリューション株式会社 審査業務文書作成支援装置、審査業務文書作成支援方法、及び審査業務文書作成支援プログラム

Also Published As

Publication number Publication date
JP6875445B2 (ja) 2021-05-26

Similar Documents

Publication Publication Date Title
Carneiro et al. A data mining based system for credit-card fraud detection in e-tail
US11720962B2 (en) Systems and methods for generating gradient-boosted models with improved fairness
US6988090B2 (en) Prediction analysis apparatus and program storage medium therefor
US9916584B2 (en) Method and system for automatic assignment of sales opportunities to human agents
US20200090268A1 (en) Method and apparatus for determining level of risk of user, and computer device
US7904397B2 (en) System and method for scalable cost-sensitive learning
US11854088B1 (en) Methods and systems for improving the underwriting process
JP2002092305A (ja) スコア算出方法及びスコア提供方法
CA3060678A1 (en) Systems and methods for determining credit worthiness of a borrower
US20180157661A1 (en) Fast automatic explanation of scored observations
JP2020013521A (ja) 改善された要求ハンドリング
CN112017040B (zh) 信用评分模型训练方法、评分方法及系统、设备及介质
US20220188923A1 (en) Method and Systems for Enhancing Modeling for Credit Risk Scores
US20220004923A1 (en) Systems and methods for model explanation
JP6875445B2 (ja) 情報処理装置、情報処理方法及びプログラム
CN110119980A (zh) 一种用于信贷的反欺诈方法、装置、系统和记录介质
Eddy et al. Credit scoring models: Techniques and issues
JP6587556B2 (ja) 情報処理装置及び情報処理方法
JP2004054954A (ja) リスク診断システム、リスクマップデータ生成方法及びプログラム
US20220156573A1 (en) Machine Learning Engine Providing Trained Request Approval Decisions
Manikonda et al. Explainable machine learning for credit lending
KR102607383B1 (ko) 자금세탁의심거래 파악 방법 및 그 장치
JP7488718B2 (ja) プロジェクト予兆検知装置及びプロジェクト予兆検知方法
Goodwin Supporting multiattribute decisions in scenario planning using a simple method based on ranks
Teles et al. Classification methods applied to credit scoring with collateral

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190415

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200825

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201023

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210330

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210422

R150 Certificate of patent or registration of utility model

Ref document number: 6875445

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE

Ref document number: 6875445

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250