TWM602677U

TWM602677U - 風險評估模型建立系統

Info

Publication number: TWM602677U
Application number: TW109206522U
Authority: TW
Inventors: 陳敏玲; 范揚耀; 張順展; 游振南
Original assignee: 臺灣銀行股份有限公司
Priority date: 2020-05-26
Filing date: 2020-05-26
Publication date: 2020-10-11

Abstract

為解決在短時間內快速且精準地計算借款者的還款違約機率，本新型提出一種風險評估模型建立系統，包括資料庫、第一分組裝置、第一排序裝置以及模型建立裝置。上述資料庫儲存違約資料。上述第一分組裝置分組違約資料以對應風險因子項目輸出第一分組資料。上述第一排序裝置計算第一分組資料並排列風險因子項目。上述模型建立裝置選取排序較前之部分風險因子項目以建立風險評估模型。因此，本新型能在短時間內有效地以影響較顯著的風險因子項目作為風險評估模型的決策節點，精準反映大量違約資料數據，而省去以往建模所需的時間、人力及財力。

Description

風險評估模型建立系統

本新型涉及一種風險評估模型的建立系統，特別是一種透過人工智慧分析大數據的即時風險評估模型建立系統。

銀行在提供借款業務時，需預先承擔借款者可能無法如期還款的財務風險壓力。但銀行仍不可避免須要提供借款業務的情況下，銀行本身如何將所需預先承擔的財務風險降到最低，即為一個重要的課題。通常，銀行須以信用風險評估模型來反映資產或是貸款質量，以直接或間接評估因辦理借款而可能發生的損失、借款者的違約機率或是發生違約時的貸款損失率等。

而這樣的信用風險評估模型，則常須高度倚賴具有高敏銳度、豐富建模或調模經驗的專業人員，才能順利進行。但差強人意的是，這樣透過專業人士的建模或調模過程相當複雜且耗時，在經過上述建模或調模過程後的信用風險評估模型，仍有高風險是不準確的，甚至無法隨著即時更新的違約資料而快速且精準地調校。

若使用一般的人工智慧進行學習式的建模或調模，常須使用建立隨機選取資料而作成大量的決策樹，並形成隨機森林(即風險評估模型)，再以多數決的投票方式形成隨機森林的最終決定結果。惟在作成大量決策樹的過程相當費時，且其係以隨機方式選取資料，而無法有效選擇到具有鑑別度及分類效度的資料，亦將因此降低最終投票結果的準確度。

因此，在建立信用風險評估模型時，如何能在短時間內完成以省下不必要的人力、財力及時間的情況下，同時又須結合人工智慧並分析大量不同借款者的違約資料，以充分且精準地反映整體違約資料(包括即時更新的違約資料)之事實數據，即成為所屬技術領域中有待解決的問題。

為解決上述問題，本新型發展出一種風險評估模型建立系統，並安裝於各種行動裝置、數位電子裝置或上述任意組合中。

上述風險評估模型建立系統，將大量的違約資料依據潛在的風險因子項目(例如年齡或性別等)進行人工智慧的分類及計算。在計算各風險因子項目的分類效度後，排序風險因子項目，並分別將排序較前位的風險因子排序，作為風險評估模型中判斷的分枝節點並建立風險評估模型。甚至，在產生風險評估模型後，更再次選取部分違約資料進行二次人工智慧的分類及計算，並在與驗證門檻值比較後確認是否須重新建模，以建立最佳評估模型。

具體而言，本新型提供一種風險評估模型建立系統，係安裝於行動裝置或數位電子裝置中，以用於計算借款者之還款違約機率。上述系統包括：資料庫、第一分組裝置、第一排序裝置以及模型建立裝置。

上述資料庫，係用以儲存違約資料。

上述第一分組裝置，連接資料庫以擷取違約資料，根據風險因子項目及分組門檻值分組違約資料，以分別對應風險因子項目輸出第一分組資料。

上述第一排序裝置，連接資料庫及第一分組裝置以擷取違約資料、第一分組資料及風險因子項目，計算違約資料及第一分組資料，以依計算結果排列風險因子項目並輸出風險因子排序。

上述模型建立裝置，連接資料庫及第一排序裝置以擷取風險因子排序及風險因子項目，選取風險因子排序較前之部分風險因子項目以作為權重因子項目，以根據權重因子項目之排序建立風險評估模型。

依據一實施例，上述系統更包括第二分組裝置，連接資料庫及模型建立裝置以擷取違約資料、權重因子項目及分組門檻值，根據校正抽樣比例選取部分之違約資料以作為校正資料，並根據至少二權重因子項目及分組門檻值分組校正資料，以分別對應至少二權重因子項目輸出第二分組資料。

依據另一實施例，上述系統更包括第二排序裝置，連接資料庫及第二分組裝置以擷取校正資料、第二分組資料及權重因子項目，計算校正資料及第二分組資料，以依計算結果排列權重因子項目，並根據權重因子項目校正風險評估模型

依據又一實施例，上述系統更包括驗證裝置，連接至資料庫及第二排序裝置以擷取違約資料、校正抽樣比例及風險評估模型，根據校正抽樣比例取得驗證抽樣比例，並根據驗證抽樣比例選取違約資料以作為驗證資料，計算並以驗證門檻值比較驗證資料，以更新風險評估模型並輸出最佳評估模型。

依據又一實施例，其中當驗證結果小於或等於驗證門檻值時，驗證裝置透過抽樣比例增量調整校正抽樣比例，以供第二分組裝置根據校正抽樣比例選取部分之違約資料以作為校正資料，並根據權重因子項目及分組門檻值分組校正資料，以分別對應權重因子項目輸出第二分組資料。當驗證結果大於驗證門檻值時，驗證裝置更新風險評估模型，並輸出最佳評估模型。

依據又一實施例，上述系統更包括介面裝置，上述介面裝置連接並提供指定資料條件至資料庫，以供第一分組裝置、第二分組裝置及驗證裝置選取符合指定資料條件的部分違約資料，並作為後續分析之違約資料。

依據又一實施例，上述系統更包括介面裝置，上述介面裝置連接並提供違約資料至資料庫。

依據又一實施例，上述系統更包括介面裝置，上述介面裝置連接並提供至少一指定因子項目至資料庫，以供模型建立裝置將至少一指定因子項目作為權重因子項目。

依據又一實施例，上述系統更包括介面裝置，上述介面裝置連接並提供指定因子序列至資料庫，以供模型建立裝置以指定因子序列全部或部分取代權重因子項目之排序。

根據上述，本新型因此可達成以下功效：

(1)能提供可反映大量的借款者違約資料數據，並根據下一借款者之背景資料，精準預測其可能的借款違約機率。

(2)在建立可更精準預測借款違約機率的風險評估模型的情況下，所須建立的程序步驟及時間更短，且不用再需要具有豐富經驗的專家人員進行建模及調模的涉入，而能減少投入多餘的人力及財力。

(3)同時，違約資料可隨時進行更新匯入，並即時在短時間內再次建立風險評估模型。

10:風險評估模型建立系統

20:介面裝置

30:資料庫

40:第一分組裝置

50:第一排序裝置

60:模型建立裝置

70:第二分組裝置

80:第二排序裝置

90:驗證裝置

U:操作者

S10-S80:步驟

S22、S24、S26:步驟

S52、S54:步驟

S82、S84、S86:步驟

為讓本新型之上述和其他目的、特徵、優點與實施例能更明顯易懂，所附附圖之說明如下：圖1所繪為依據本新型一實施例之一種風險評估模型建立系統的示意圖；圖2所繪為依據本新型一實施例之一種風險評估模型建立方法的流程示意圖。

有鑑於上述待克服的問題，本新型發展出一種風險評估模型建立系統，採用不同於傳統隨機森林的人工智慧決策方式，根據不同借款者的實際違約資料(包括風險因子項目，例如年齡、婚姻狀況或性別等)進行分組、分組效度的比較排序等過程，作出一棵決策樹(亦即所謂風險評估模型)。其中，這棵決策樹是選擇在排序後影響較顯著的風險因子項目作為分枝節點，因此，這棵決策樹的信效度亦將因而提升。據此，本新型即能省卻傳統隨機森林以隨機選取風險因子項目的方式，再進行隨機分組，因而所須花費在建立大量決策樹(例如500棵決策樹)的時間。

在取得下一位借款者的背景資料(亦即上述風險因子項目)時，輸入上述風險因子項目至上述風險評估模型，即可快速得到對應至此位借款者，且可靠度相當高的違約風險可能性。銀行或其他金融單位，即可根據計算求得的違約風險值，判斷後續是否可與此位借款者建立資金的借貸關係。

同時，在上述風險評估模型建立的過程中，甚至可多次再分組及驗證，以更精確驗證風險評估模型的準確值，直到風險評估模型的驗證結果落在相對高的信賴區間內，才據以輸出最佳評估模型，以充分反映整體數據的實際違約風險。

為更清楚說明本新型之實施方式，請參閱圖1-2，圖1所繪為依據本新型一實施例之一種風險評估模型建立系統的示意圖，圖2所繪為依據本新型一實施例之一種風險評估模型建立方法的流程示意圖。本新型提提供一種風險評估模型建立系統10，提供金融單位(例如銀行)將其用於計算借款者之還款違約機率，藉以判斷是否可借貸資金給借貸者。

上述系統10包括：資料庫30、第一分組裝置40、第一排序裝置50以及模型建立裝置60。其中，上述系統10、資料庫30、第一分組裝置40、第一排序裝置50以及模型建立裝置60皆得分別獨立為桌上型電腦、筆記型電腦、智慧型手機、平板電腦、數位相機或其他數位電子裝置，及其任意組合，或是安裝於上述各裝置之中。

操作者U(例如銀行行員)提供或更新違約資料至資料庫30，資料庫30即接收並儲存違約資料，以供上述系統10作後續使用。其中，違約資料包括可分別對應到各借貸者的背景資料，例如年齡、性別、婚姻狀況、教育程度、銀行往來家數或戶籍地等基本資料。

依據一實施例，上述系統10更包括介面裝置20，上述介面裝置20連接至資料庫30。因此，操作者U即可透過介面裝置20提供或更新違約資料至資料庫30，以供上述系統10作後續使用。其中，介面裝置20得獨立為桌上型電腦、筆記型電腦、智慧型手機、平板電腦、數位相機或其他數位電子裝置，及其任意組合，或是安裝於上述各裝置之中。

上述第一分組裝置40係連接至資料庫30以擷取違約資料。如步驟S10，第一分組裝置40擷取風險因子項目(可對應至上述背景資料，例如年齡、性別等)，並選擇對應至各違約資料內的背景資料，以透過風險因子項目將各違約資料進行分組。在上述分組過程中，第一分組裝置40係依據分組門檻值進行比較以完成分組，並分別對應風險因子項目輸出第一分組資料。

例如，如下表1，違約資料共計5筆(包括借貸者A-E)，風險因子項目共2項，包括性別及年齡。因此，第一分組裝置40須先擷取各違約資料中對應第一風險因子項目(例如性別)的性別欄位。接著，第一分組裝置40計算性別欄位的態樣數量。第一分組裝置40根據第一風險因子項目的態樣數量是否大於等於2，判斷是否須再針對第一風險因子項目進一步分組。例如此處性別的態樣數量為1(皆為男性)且小於2，因此不需再進一步分組。

接著，例如第一分組裝置40再擷取各違約資料中對應第二風險因子項目(例如年齡)的年齡欄位。接著，第一分組裝置40計算年齡欄位的態樣數量，例如此處年齡的態樣數量為5(分別為55、56、70、49及37歲)且大於2，因此需再進一步分組。分組係依照第二風險因子項目及分組門檻值將各違約資料進行分組。分組示例如下：

步驟1：計算對應至第二風險因子項目(年齡)之所有態樣的平均值。例如，第一分組裝置40計算求得共計5筆年齡欄位之態樣平均值為53.4歲。

步驟2：計算第一筆違約資料與態樣平均值之差值(取絕對值)。例如，第一分組裝置40計算求得第一筆資料(借貸者A)之年齡(55歲)與態樣平均值(53.4歲)的差值之差值，整理如下表2。

步驟3：將上述差值與分組門檻值進行比較，當差值小於或等於分組門檻值時，將借貸者A分為第一群組；當差值大於分組門檻值時，將借貸者A分為第二群組。例如，若第一分組裝置40擷取分組門檻值為10，借貸者A之差值(1.6歲)小於10，因此將借貸者A劃分為第一群組。

步驟4：計算各群組的分組平均值。例如，因目前僅有第一群組，故第一分組裝置40計算第一群組的平均值，即為55歲(第一群組僅包括借貸者A，55歲)。

步驟5：分別計算剩餘違約資料(扣除第一筆資料)與各群組平均值之差值。例如，第一分組裝置40分別計算扣除借款者A之剩餘借款者(包括借款者B、C、D及E，共4筆)的年齡與第一群組的平均值(55歲)之差值，整理如下表2。

步驟6：判斷各差值是否小於或等於分組門檻值。

步驟7A：若判斷結果為是(至少一差值小於或等於分組門檻值)，則選其中差值最小者，同樣將其分為第一群組。亦即，根據上表2，借貸者B及D之差值皆小於或等於分組門檻值，因此第一分組裝置40選擇其中差值最小的借貸者B(1歲)，並將借貸者B同樣分為第一群組。接著，再重複步驟4-6，可分別得到下表3-4。

步驟7B：若判斷結果為否(所有差值皆大於分組門檻值)，則選取差值最小者，並將其分為第二群組。亦即，根據上表4，借貸者C及E之差值皆大於分組門檻值，而差值最小者借貸者E(16.3歲)，因此第一分組裝置40選取並將借貸者E分為第二群組。接著，再重複步驟4-6，可得到下表5-6。

而由於重複步驟4-6獲得借款者C之年齡分別與第一及第二群組平均值之差值，皆大於分組門檻值，故第一分組裝置40將借款者C分類為第三群組。綜合以上，整理借款者A-E的分組情況如下表7。

接著，第一分組裝置40在完成各風險因子項目之分類後，分別輸出對應各風險因子項目之第一分組資料。例如，以年齡為例，第一分組裝置40即針對年齡欄位，輸出如上表7之第一分組資料。其他各風險因子項目則依此類推，因此不再詳加敘述。

依據一實施例，上述系統10更包括介面裝置20，上述介面裝置20連接至資料庫30。而操作者U可提供作為篩選違約資料的指定資料條件至資料庫30，以供第一分組裝置40(以及下述第二分組裝置70和驗證裝置90)選取符合指定資料條件的部分違約資料，並作為後續分析的違約資料。例如，介面裝置20選擇的指定資料條件是違約日期在2018-2020年的違約資料，則第一分組裝置40(以及下述第二分組裝置70和驗證裝置90)根據指定資料條件(違約日期)選擇2018-2020年的違約資料，而非將所有違約日期的違約資料都作為後續分析的違約資料。

上述第一排序裝置50係連接至資料庫30及第一分組裝置40。第一排序裝置50擷取違約資料、第一分組資料及風險因子項目。如步驟S20，第一排序裝置50根據違約資料，分別整合計算各風險因子項目及其對應之第一分組資料，以分別對應輸出分組效度。接著，如步驟S22，第一排序裝置50依計算結果(亦即總分組效度)的數值高低進行排列，並依序排列對應的風險因子項目，根據排列結果輸出風險因子排序。

例如，如下表8，違約資料共計30筆，風險因子項目為性別。第一排序裝置50根據此30筆違約資料，參照下式1-2計算求得風險因子項目為性別之分組效度(P_i)分別為男0.09、女0.36，以及總分類效度(P)為0.45。

表8

例如，如下表9，違約資料共計30筆，風險因子項目為婚姻狀態。第一排序裝置50根據此30筆違約資料，參照上式1-2計算求得風險因子項目為婚姻狀態之分組效度分別為已婚0.02、未婚0.02，以及總分類效度為0.04。

須注意的是，此處僅以兩個風險因子項目(性別及婚姻狀態)進行說例，並非僅限於兩個而應為複數個風險因子項目。因此，根據上表8-9之計算結果，第一排序裝置50比較分別對應至各風險因子項目之計算結果(總分組效度P)，得知性別(0.45)之總分組效度高於婚姻狀態(0.04)之總分組效度。第一排序裝置50將據此輸出第一順位為性別、第二順位為婚姻狀態之風險因子排序。

上述模型建立裝置60係連接資料庫30及第一排序裝置50。如步驟S24，模型建立裝置60擷取風險因子排序，以依風險因子排序較前者，選取對應之部分風險因子項目以作為權重因子項目，並如步驟S26，根據權重因子項目輸出風險評估模型。例如，根據第一排序裝置50排序共計20個風險因子項目，模型建立裝置60擷取20個風險因子項目，並依建模比例(例如前30%)選取總分組效度分數高而排序較前的風險因子項目(例如前6個風險因子項目)，並將排序較前的風險因子項目作為權重因子項目。模型建立裝置60即根據權重因子項目，並將其作為風險評估模型的決策分枝節點(亦即分組依據)，以建立風險評估模型。

依據另一實施例，上述系統10更包括介面裝置20，上述介面裝置20連接至資料庫30，並提供至少一指定因子項目至資料庫30，以供模型建立裝置60將至少一指定因子項目直接作為全部或部分之權重因子項目。例如，指定因子項目包括一項且為年收入，則模型建立裝置60可直接將其作為權重因子項目中的一項，例如將指定因子項目(年收入)作為共六項權重因子項目中的一項，剩餘五項的權重因子項目則交由上述系統10進行分析排序。又例如，指定因子項目包括二項且為教育程度及年收入，則模型建立裝置60可直接將其作為權重因子項目中的二項，例如分別將教育程度及年收入作為共六項權重因子項目中的二項，剩餘四項的權重因子項目則交由上述系統10進行分析排序。

依據又一實施例，上述系統10更包括介面裝置20，上述介面裝置20連接至資料庫30，並提供指定因子序列至資料庫30，以供模型建立裝置60以指定因子序列直接全部地或部分地取代權重因子項目之排序。例如，指定因子序列之第一至三順序分別為年收入、教育程度及居住地，則模型建立裝置60可直接將其作為風險因子排序中的第一至三順序，剩餘風險因子排序則交由上述系統10進行分析排序。又例如，指定因子序列之第一順序分別為年收入，則模型建立裝置60可直接將其作為風險因子排序中的第一順序，剩餘風險因子排序則交由上述系統10進行分析排序。

依據又一實施例，上述系統10更包括第二分組裝置70。第二分組裝置70連接資料庫30及模型建立裝置60以擷取違約資料、權重因子排序及分組門檻值。其中，第二分組裝置70得獨立為桌上型電腦、筆記型電腦、智慧型手機、平板電腦、數位相機或其他數位電子裝置，及其任意組合，或是安裝於上述各裝置之中。

如步驟S30，第二分組裝置70根據校正抽樣比例(例如80%)選取部分違約資料，以作為校正風險評估模型的校正資料。如步驟S40，第二分組裝置70根據至少二排序較前之權重因子項目及分組門檻值，分組校正資料(例如80%的違約資料)，以分別對應至少二權重因子項目輸出第二分組資料。其中，第二分組裝置70之分組方式大致同第一分組裝置40所述，惟第二分組裝置70與第一分組裝置40之分析對象不同，亦即二裝置所分析違約資料的樣本數不同。

第二分組裝置70與第一分組裝置40的不同處，詳述如下：第一分組裝置40在進行分組以輸出第一分組資料時，僅分別針對單一的風險因子項目進行分組，亦即每一分組的違約資料總數皆固定。例如違約資料共500筆，則分別依照例如性別、婚姻狀態等分組的違約資料加總皆例如為500筆。

相對而言，第二分組裝置70則是依照風險因子排序中，針對排序較前(亦即較具影響力)的至少二個風險因子項目進行分組。例如，首先依照第一順位(例如性別)分組並分為男性及女性，則男性分組(例如405筆)與女性分組(例如95筆)的違約資料加總例如為500筆。

接著，第二分組裝置70再進一步分別針對男性分組(例如405筆)與女性分組(例如95筆)的違約資料，進行例如第二順位(例如婚姻狀況)的分組。例如在男性分組之下，再分別細分為已婚及未婚，女性分組亦同。亦即，男性已婚分組(例如309筆)與男性未婚分組(例如96筆)的違約資料加總數量(例如405筆)，將等同於男性分組的加總數量(例如405筆)。同樣地，女性已婚分組(例如63筆)與女性未婚分組(例如32筆)的違約資料加總數量(例如95筆)，亦等同於女性分組的加總數量(例如95筆)。

接著，第二分組裝置70據此分別輸出對應各風險因子項目的第二分組資料。例如，第二分組裝置70針對第一順位(性別)結合第二順位(婚姻狀況)之分組輸出對應的第二分組資料，包括男性已婚分組(例如309筆)/男性未婚分組(例如96筆)分別之違約/非違約對應的違約資料統計數據，以及女性已婚分組(例如63筆)/女性未婚分組(例如32筆)分別之違約/非違約對應的違約資料統計數據。

依據又一實施例，上述系統10更包括第二排序裝置80，且第二排序裝置80連接資料庫30及第二分組裝置70。其中，第二排序裝置80得獨立為桌上型電腦、筆記型電腦、智慧型手機、平板電腦、數位相機或其他數位電子裝置，及其任意組合，或是安裝於上述各裝置之中。

第二排序裝置80擷取校正資料、第二分組資料及權重因子項目。如步驟S50，第二排序裝置80根據校正資料(例如80%的違約資料)，分別整合計算各至少二權重因子項目及其對應之第二分組資料，以分別對應輸出分組效度。接著，如步驟S52，第二排序裝置80依計算結果(亦即總分組效度)的數值高低進行排列，並依序排列對應的至少二權重因子項目，根據排列結果輸出至少二權重因子項目之排序。接著，如步驟S54，第二排序裝置80根據經校正的權重因子項目之排序及其對應的權重因子項目，並將其作為風險評估模型的決策分枝節點(亦即分組依據)，以輸出經校正之風險評估模型。

以下就又一實施例，更具體說明第二分組裝置70及第二排序裝置80：例如，第二分組裝置70選取10筆校正資料，如下表10。第二分組裝置70根據前3個權重因子項目進行排序(例如依序為性別、婚姻狀況及年齡)。亦即，首先將校正資料依據權重因子項目之排序中的第一順位(亦即性別分類)進行分類(細分為男性及女性)，並求得性別總分組效度為1.31，整理如下表11。

表10

接著，第二分組裝置70再依據權重因子項目之排序中的第二順位(亦即婚姻狀況)進行分類(再細分為已婚及未婚)，並求得二權重因子項目(亦即性別結合婚姻狀態)的總分組效度分別為0.51(男/已婚及男/未婚)及1.00(女/已婚及女/未婚)，整理如下表12。

表12

接著，第二分組裝置70再依據權重因子項目之排序中的第三順位(亦即年齡)進行分類(再細分為50歲以上及50歲以下)，並求得二權重因子項目(亦即性別結合年齡)的總分組效度分別為1.04(男/50歲以上及男/50歲以下)及1.00(女/50歲以上及女/50歲以下)，整理如下表13。

接著，第二排序裝置80比較二個根據二權重因子項目分組之總分類效度，亦即第一順位結合第二順位(性別結合婚姻狀況)與第一順位結合第三順位(性別結合年齡)的總分類效度，整理如下表14。而由下表14可知，第一順位(性別)被分為男性的分組中，若再以第三順位(年齡)分組的總分組效度(1.04)會較先以第一順位(性別)分組再以第二順位(婚姻狀況)分組者(0.51)為高。相對地，第一順位被分為女性的分組中，同樣會由再以第三順位分組的總分組效度(1.00)較再以第二順位分組者(0.00)為高。

綜合以上結果，第二排序裝置80將以「第一順位→第三順位→第二順位」(性別→年齡→婚姻狀況)的權重因子項目之排序，校正並取代原本的「第一順位→第二順位→第三順位」(性別→婚姻狀況→年齡)。接著，第二排序裝置80將經校正的權重因子項目之排序(亦即性別→年齡→婚姻狀況)作為風險評估模型的決策分枝節點，以輸出經校正之風險評估模型。

依據又一實施例，上述系統10更包括一驗證裝置90，上述驗證裝置90連接至資料庫30及第二排序裝置80。其中，驗證裝置90得獨立為桌上型電腦、筆記型電腦、智慧型手機、平板電腦、數位相機或其他數位電子裝置，及其任意組合，或是安裝於上述各裝置之中。

驗證裝置90擷取違約資料、校正抽樣比例及風險評估模型。如步驟S60，驗證裝置90根據校正抽樣比例取得驗證抽樣比例(例如校正抽樣比例與驗證抽樣比例相加為100%，亦即校正抽樣比例若為80%，則將未作為校正資料之違約資料作為驗證資料，因此驗證抽樣比例即為20%)。驗證裝置90並根據驗證抽樣比例(例如20%)選取違約資料中之20%以作為驗證資料。接著，如步驟S70，驗證裝置90計算驗證資料，以輸出驗證結果。如步驟S80，驗證裝置90並將驗證結果與驗證門檻值進行比較，以更新風險評估模型並藉以輸出最佳評估模型。

例如，以共10筆之驗證資料為例，下表15整理上述驗證資料經風險評估模型之預測違約結果，與驗證資料之實際違約結果的對照。驗證裝置90擷取此10筆驗證資料，並根據下表16之混淆矩陣(confusion matrix)判斷驗證資料之混淆情況，整理如下表17。接著，驗證裝置90根據混淆情況之數據，分別結合下式3及式4計算正確樣本數T(例如9)及錯誤樣本數F(例如1)。驗證裝置90再據以根據下式5計算求得驗證指標值(例如0.80)，以將計算結果(亦即驗證指標值，例如0.80)與驗證門檻值(例如 0.85)進行數值比較。其中，計算所得的驗證指標值最大為1.0(風險評估模組的驗證效果最佳)，最小為-1.0(風險評估模組的驗證結果最差)。

表17

正確樣本數T=TP+TN (式3)

錯誤樣本數F=FP+FN (式4)

依據又一實施例，如步驟S82，當驗證裝置90判斷驗證指標值(例如0.80)小於或等於驗證門檻值(例如0.85)時，驗證裝置90更透過抽樣比例增量(increment，例如增量5%)調整原本的校正抽樣比例(例如80%)為調整後的校正抽樣比例(例如85%)，以供第二分組裝置70再依照經調整之校正抽樣比例(例如85%)選取部分之違約資料以作為校正資料，並重新分組以輸出第二分組資料。其後續步驟同前述，直到求得最佳評估模型，因此不再詳加敘述。

其中，如步驟S84，經調整之校正抽樣比例一旦超過校正抽樣上限比例(例如95%)，則驗證裝置90不再繼續調整校正抽樣比例，而改為停止風險評估模型的建立作業，且不輸出風險評估模型或最佳評估模型。

而相反地，如步驟S86，當驗證裝置90判斷驗證指標值(例如0.90)大於驗證門檻值(例如0.85)時，驗證裝置90將判斷為維持原本的風險評估模型，並據以輸出最佳評估模型。

綜合以上風險評估模型建立系統及其建立方法，本新型在先行分組、排序並分析違約資料後，僅選取例如前30%、較具顯著影響的風險因子項目作為分組依據，並由這些風險因子項目作為風險評估模型的判斷決策節點，以有效且精確地分類違約資料。在此，本新型即與已知人工智慧的學習方法(例如隨機森林)有了相當大的不同。

具體而言，本新型係以分組及其分組效度，進行快速篩檢並判斷風險因子項目的影響力，接著據此結果僅建立一個鑑別度高且信效度亦高的風險評估模型(亦即1棵決策樹，不須形成決策森林)。相對而言，習知的隨機森林則為任意或隨機地選取風險因子項目，接著據此結果建立大量鑑別度及信效度皆未知的風險評估模型(亦即例如500棵決策樹，而形成決策森林)。因此，本新型即省卻習知技術在建立剩餘499棵影響力未知之決策樹的演算時間，故也因此省卻不必要的資金或人力的投入。

此外，為更提升本新型的評估預測準確度，本新型不但二次分組及排序驗證風險評估模型，更導入混淆矩陣以針對風險評估模型進行驗證及重新調校，故其準確度因此也較習知隨機森林(以各決策樹的預估預測結果進行投票，並以得票較多者作為最終是否違約的預測結果)來得更為準確。

再者，為反映現實中即時更新的違約資料，本新型可隨時導入更新的違約資料，並直接據以快速地重覆相同的分組、排序及驗證等，而能充分反映浮動更新的違約資料及其風險評估模型，以更精準地將金融單位所需承擔的借款風險降至最低。

本新型在本文中僅以較佳實施例揭露，然任何熟習本技術領域者應能理解的是，上述實施例僅用於描述本新型，並非用以限定本新型所主張之專利權利範圍。舉凡與上述實施例均等或等效之變化或置換，皆應解讀為涵蓋於本新型之精神或範疇內。因此，本新型之保護範圍應以下述之申請專利範圍所界定者為準。