TW201935342A - 風控規則生成方法和裝置 - Google Patents
風控規則生成方法和裝置 Download PDFInfo
- Publication number
- TW201935342A TW201935342A TW107146353A TW107146353A TW201935342A TW 201935342 A TW201935342 A TW 201935342A TW 107146353 A TW107146353 A TW 107146353A TW 107146353 A TW107146353 A TW 107146353A TW 201935342 A TW201935342 A TW 201935342A
- Authority
- TW
- Taiwan
- Prior art keywords
- sample data
- data set
- control rule
- preset
- risk control
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/01—Customer relationship services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2148—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Data Mining & Analysis (AREA)
- Entrepreneurship & Innovation (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Educational Administration (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Technology Law (AREA)
- Mathematical Optimization (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Algebra (AREA)
- Pure & Applied Mathematics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本申請公開了一種風控規則生成方法和裝置,所述方法包括:透過將源域與目標域進行資料結構對齊,得到包括源域樣本資料和目標域樣本資料的樣本資料集合,基於預設收斂閾值,對樣本資料集合進行多次迭代,得到樣本資料集合中每個樣本資料的權重分值,進而根據樣本資料集合中每個樣本資料的權重分值,確定預設風控規則生成條件中的特徵參數值,以及根據預設風控規則生成條件和預設風控規則生成條件中的特徵參數值,生成風控規則,從而使得可以利用源域對應的成熟業務場景積累的歷史資料,快速為目標域對應的新業務場景生成風控規則,有效提高風控規則的生成效率。
Description
本申請涉及風險控制領域,尤其涉及一種風控規則生成方法和裝置。
在金融、企業經營管理等經濟領域中,有效的風險控制是預防和打擊經濟犯罪的必要手段。隨著網際網路技術的發展,各種網路經濟活動迅速發展,例如,網路購物、網路交易等業務場景,因此,網路風險控制變得越來越重要。實際應用中,網路風險控制的方式是透過設置一些風控規則來判斷可信交易和風險交易,風控規則的生成依賴於大量的歷史交易資料。針對於新業務場景,由於積累交易資料需要較長時間,導致無法及時為新業務場景構建風控規則。因此,亟需提供一種效率更高的風控規則生成方法。
本申請實施例提供一種風控規則生成方法和裝置,能夠有效提高風控規則的生成效率。
本申請實施例提供一種風控規則生成方法,包括:
將源域與目標域進行資料結構對齊,得到樣本資料集合,其中,所述樣本資料集合中包括源域樣本資料和目標域樣本資料;
基於預設收斂閾值,對所述樣本資料集合進行多次迭代,得到所述樣本資料集合中每個樣本資料的權重分值;
根據所述樣本資料集合中每個樣本資料的權重分值,確定預設風控規則生成條件中的特徵參數值;
根據所述預設風控規則生成條件,以及所述預設風控規則生成條件中的特徵參數值,生成風控規則。
可選地,將源域與目標域進行資料結構對齊,得到樣本資料集合,包括:
將所述源域和所述目標域中,具有相同變量維度的變量資料,及/或,具有相同業務邏輯定義的變量資料,添加到所述樣本資料集合中。
可選地,基於預設收斂閾值,對所述樣本資料集合進行多次迭代,得到所述樣本資料集合中每個樣本資料的權重分值,包括:
基於預設算法和所述樣本資料集合,確定分類模型;
透過降低錯誤分類的所述源域樣本資料的權重,以及提高錯誤分類的所述目標域樣本資料的權重,對所述樣本資料集合進行多次迭代,直到所述分類模型的分類正確率滿足所述預設收斂閾值;
基於所述分類正確率滿足所述預設收斂閾值的所述分類模型,確定所述樣本資料集合中每個樣本資料的權重分值。
可選地,根據所述樣本資料集合中每個樣本資料的權重分值,確定預設風控規則生成條件中的特徵參數值,包括:
根據所述樣本資料集合中每個樣本資料的權重分值,採用加權決策樹算法,確定所述預設風控規則生成條件中的特徵參數值。
可選地,所述變量資料是客戶關係管理RFM變量資料,用於表示交易事件的風險相似性。
可選地,所述RFM變量資料包括:交易資訊變量、風險網路變量、用戶歷史行為變量。
本申請實施例還提供一種風控規則生成裝置,包括:
集合確定單元,將源域與目標域進行資料結構對齊,得到樣本資料集合,其中,所述樣本資料集合中包括源域樣本資料和目標域樣本資料;
權重確定單元,基於預設收斂閾值,對所述樣本資料集合進行多次迭代,得到所述樣本資料集合中每個樣本資料的權重分值;
特徵值確定單元,根據所述樣本資料集合中每個樣本資料的權重分值,確定預設風控規則生成條件中的特徵參數值;
規則生成單元,根據所述預設風控規則生成條件,以及所述預設風控規則生成條件中的特徵參數值,生成風控規則。
可選地,所述集合確定單元具體用於:
將所述源域和所述目標域中,具有相同變量維度的變量資料,及/或,具有相同業務邏輯定義的變量資料,添加到所述樣本資料集合中。
可選地,所述權重確定單元具體用於:
基於預設算法和所述樣本資料集合,確定分類模型;
透過降低錯誤分類的所述源域樣本資料的權重,以及提高錯誤分類的所述目標域樣本資料的權重,對所述樣本資料集合進行多次迭代,直到所述分類模型的分類正確率滿足所述預設收斂閾值;
基於所述分類正確率滿足所述預設收斂閾值的所述分類模型,確定所述樣本資料集合中每個樣本資料的權重分值。
可選地,所述特徵值確單元具體用於:
根據所述樣本資料集合中每個樣本資料的權重分值,採用加權決策樹算法,確定所述預設風控規則生成條件中的特徵參數值。
可選地,所述變量資料是客戶關係管理RFM變量資料,用於表示交易事件的風險相似性。
可選地,所述RFM變量資料包括:交易資訊變量、風險網路變量、用戶歷史行為變量。
本申請實施例還提供一種風控規則生成裝置,包括:
儲存器,存放程式;
處理器,執行所述儲存器儲存的程式,並具體執行:
將源域與目標域進行資料結構對齊,得到樣本資料集合,其中,所述樣本資料集合中包括源域樣本資料和目標域樣本資料;
基於預設收斂閾值,對所述樣本資料集合進行多次迭代,得到所述樣本資料集合中每個樣本資料的權重分值;
根據所述樣本資料集合中每個樣本資料的權重分值,確定預設風控規則生成條件中的特徵參數值;
根據所述預設風控規則生成條件,以及所述預設風控規則生成條件中的特徵參數值,生成風控規則。
本申請實施例還提供一種計算機可讀儲存媒體,所述計算機可讀儲存媒體儲存一個或多個程式,所述一個或多個程式當被包括多個應用程式的電子設備執行時,使得所述電子設備執行以下方法:
將源域與目標域進行資料結構對齊,得到樣本資料集合,其中,所述樣本資料集合中包括源域樣本資料和目標域樣本資料;
基於預設收斂閾值,對所述樣本資料集合進行多次迭代,得到所述樣本資料集合中每個樣本資料的權重分值;
根據所述樣本資料集合中每個樣本資料的權重分值,確定預設風控規則生成條件中的特徵參數值;
根據所述預設風控規則生成條件,以及所述預設風控規則生成條件中的特徵參數值,生成風控規則。
本申請實施例採用的上述至少一個技術方案能夠達到以下有益效果:
透過將源域與目標域進行資料結構對齊,得到包括源域樣本資料和目標域樣本資料的樣本資料集合,基於預設收斂閾值,對樣本資料集合進行多次迭代,得到樣本資料集合中每個樣本資料的權重分值,進而根據樣本資料集合中每個樣本資料的權重分值,確定預設風控規則生成條件中的特徵參數值,以及根據預設風控規則生成條件和預設風控規則生成條件中的特徵參數值,生成風控規則,從而使得可以利用源域對應的成熟業務場景積累的歷史資料,快速為目標域對應的新業務場景生成風控規則,有效提高風控規則的生成效率。
本申請實施例提供一種風控規則生成方法,包括:
將源域與目標域進行資料結構對齊,得到樣本資料集合,其中,所述樣本資料集合中包括源域樣本資料和目標域樣本資料;
基於預設收斂閾值,對所述樣本資料集合進行多次迭代,得到所述樣本資料集合中每個樣本資料的權重分值;
根據所述樣本資料集合中每個樣本資料的權重分值,確定預設風控規則生成條件中的特徵參數值;
根據所述預設風控規則生成條件,以及所述預設風控規則生成條件中的特徵參數值,生成風控規則。
可選地,將源域與目標域進行資料結構對齊,得到樣本資料集合,包括:
將所述源域和所述目標域中,具有相同變量維度的變量資料,及/或,具有相同業務邏輯定義的變量資料,添加到所述樣本資料集合中。
可選地,基於預設收斂閾值,對所述樣本資料集合進行多次迭代,得到所述樣本資料集合中每個樣本資料的權重分值,包括:
基於預設算法和所述樣本資料集合,確定分類模型;
透過降低錯誤分類的所述源域樣本資料的權重,以及提高錯誤分類的所述目標域樣本資料的權重,對所述樣本資料集合進行多次迭代,直到所述分類模型的分類正確率滿足所述預設收斂閾值;
基於所述分類正確率滿足所述預設收斂閾值的所述分類模型,確定所述樣本資料集合中每個樣本資料的權重分值。
可選地,根據所述樣本資料集合中每個樣本資料的權重分值,確定預設風控規則生成條件中的特徵參數值,包括:
根據所述樣本資料集合中每個樣本資料的權重分值,採用加權決策樹算法,確定所述預設風控規則生成條件中的特徵參數值。
可選地,所述變量資料是客戶關係管理RFM變量資料,用於表示交易事件的風險相似性。
可選地,所述RFM變量資料包括:交易資訊變量、風險網路變量、用戶歷史行為變量。
本申請實施例還提供一種風控規則生成裝置,包括:
集合確定單元,將源域與目標域進行資料結構對齊,得到樣本資料集合,其中,所述樣本資料集合中包括源域樣本資料和目標域樣本資料;
權重確定單元,基於預設收斂閾值,對所述樣本資料集合進行多次迭代,得到所述樣本資料集合中每個樣本資料的權重分值;
特徵值確定單元,根據所述樣本資料集合中每個樣本資料的權重分值,確定預設風控規則生成條件中的特徵參數值;
規則生成單元,根據所述預設風控規則生成條件,以及所述預設風控規則生成條件中的特徵參數值,生成風控規則。
可選地,所述集合確定單元具體用於:
將所述源域和所述目標域中,具有相同變量維度的變量資料,及/或,具有相同業務邏輯定義的變量資料,添加到所述樣本資料集合中。
可選地,所述權重確定單元具體用於:
基於預設算法和所述樣本資料集合,確定分類模型;
透過降低錯誤分類的所述源域樣本資料的權重,以及提高錯誤分類的所述目標域樣本資料的權重,對所述樣本資料集合進行多次迭代,直到所述分類模型的分類正確率滿足所述預設收斂閾值;
基於所述分類正確率滿足所述預設收斂閾值的所述分類模型,確定所述樣本資料集合中每個樣本資料的權重分值。
可選地,所述特徵值確單元具體用於:
根據所述樣本資料集合中每個樣本資料的權重分值,採用加權決策樹算法,確定所述預設風控規則生成條件中的特徵參數值。
可選地,所述變量資料是客戶關係管理RFM變量資料,用於表示交易事件的風險相似性。
可選地,所述RFM變量資料包括:交易資訊變量、風險網路變量、用戶歷史行為變量。
本申請實施例還提供一種風控規則生成裝置,包括:
儲存器,存放程式;
處理器,執行所述儲存器儲存的程式,並具體執行:
將源域與目標域進行資料結構對齊,得到樣本資料集合,其中,所述樣本資料集合中包括源域樣本資料和目標域樣本資料;
基於預設收斂閾值,對所述樣本資料集合進行多次迭代,得到所述樣本資料集合中每個樣本資料的權重分值;
根據所述樣本資料集合中每個樣本資料的權重分值,確定預設風控規則生成條件中的特徵參數值;
根據所述預設風控規則生成條件,以及所述預設風控規則生成條件中的特徵參數值,生成風控規則。
本申請實施例還提供一種計算機可讀儲存媒體,所述計算機可讀儲存媒體儲存一個或多個程式,所述一個或多個程式當被包括多個應用程式的電子設備執行時,使得所述電子設備執行以下方法:
將源域與目標域進行資料結構對齊,得到樣本資料集合,其中,所述樣本資料集合中包括源域樣本資料和目標域樣本資料;
基於預設收斂閾值,對所述樣本資料集合進行多次迭代,得到所述樣本資料集合中每個樣本資料的權重分值;
根據所述樣本資料集合中每個樣本資料的權重分值,確定預設風控規則生成條件中的特徵參數值;
根據所述預設風控規則生成條件,以及所述預設風控規則生成條件中的特徵參數值,生成風控規則。
本申請實施例採用的上述至少一個技術方案能夠達到以下有益效果:
透過將源域與目標域進行資料結構對齊,得到包括源域樣本資料和目標域樣本資料的樣本資料集合,基於預設收斂閾值,對樣本資料集合進行多次迭代,得到樣本資料集合中每個樣本資料的權重分值,進而根據樣本資料集合中每個樣本資料的權重分值,確定預設風控規則生成條件中的特徵參數值,以及根據預設風控規則生成條件和預設風控規則生成條件中的特徵參數值,生成風控規則,從而使得可以利用源域對應的成熟業務場景積累的歷史資料,快速為目標域對應的新業務場景生成風控規則,有效提高風控規則的生成效率。
網路風險控制的方式是透過設置一些風控規則來判斷可信交易和風險交易。目前,風控規則一般採用雙主體可信對,即判斷某兩個主體同時出現的交易為可信交易。例如,針對信用卡,當信用卡被盜但還使用原收貨地址的概率非常低,因此,可以根據歷史交易資料確定某信用卡+某收貨地址的交易為可信交易,即該信用卡+該收貨地址為雙主體可信對,當出現該信用卡+該收貨地址的交易時直接判斷為可信交易。常用的雙主體可信對包括:卡-設備可信、卡-IP地址可信、帳戶-設備可信等等。
實際應用中,預先設置風控規則生成條件,例如,預設風控規則:信用卡+收貨地址,預設風控規則生成條件可以為“使用信用卡+收貨地址次數超過X次,金額大於Y元,超過Z天內無風險交易”,根據大量的歷史交易資料,確定預設風控規則生成條件中的特徵參數值(X,Y,Z),則可以根據該預設風控規則生成條件以及該特徵參數值(X,Y,Z),生成風控規則:信用卡+收貨地址。
圖1為現有技術中風控規則生成方法的示意圖。
如圖1所示,透過歷史交易資料,確定預設風控規則,即可信名單。使得在實時交易時,根據實時交易資料,判斷該實時交易是否符合該可信名單,若是,則確定該實時交易可信;若否,則確定該實時交易不可信。
但是,針對新業務場景,例如,在一個新的市場中開拓業務時,由於歷史交易資料較少,無法快速確定預設風控規則生成條件中的特徵參數值,導致在新業務場景中無法快速生成風控規則。
為了實現本申請的目的,本申請實施例提供一種風控規則生成方法和裝置,所述方法包括:透過將源域與目標域進行資料結構對齊,得到包括源域樣本資料和目標域樣本資料的樣本資料集合,基於預設收斂閾值,對樣本資料集合進行多次迭代,得到樣本資料集合中每個樣本資料的權重分值,進而根據樣本資料集合中每個樣本資料的權重分值,確定預設風控規則生成條件中的特徵參數值,以及根據預設風控規則生成條件和預設風控規則生成條件中的特徵參數值,生成風控規則,從而使得可以利用源域對應的成熟業務場景積累的歷史資料,快速為目標域對應的新業務場景生成風控規則,有效提高風控規則的生成效率。
下面結合本申請具體實施例及相應的附圖對本申請技術方案進行清楚、完整地描述。顯然,所描述的實施例僅是本申請一部分實施例,而不是全部的實施例。基於本申請中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都屬於本申請保護的範圍。
以下結合附圖,詳細說明本申請各實施例提供的技術方案。
實施例1
圖2為本申請實施例提供的一種風控規則生成方法的流程示意圖。所述方法可以如下所示。
步驟202:將源域與目標域進行資料結構對齊,得到樣本資料集合,其中,樣本資料集合中包括源域樣本資料和目標域樣本資料。
需要說明的是,源域中包括的是成熟業務場景積累的第一歷史交易資料,目標域中包括的是新業務場景中積累的第二歷史交易資料,其中,第一歷史交易資料的資料量級大於第二歷史交易資料的資料量級。
利用源域中資料量較大的第一歷史交易資料,幫助目標域中資料量較小的第二歷史交易資料,為目標域生成風險控制規則,首先需要將源域與目標域進行資料結構對齊。
本申請實施例中,將源域與目標域進行資料結構對齊,得到樣本資料集合,包括:
將源域和目標域中,具有相同變量維度的變量資料,及/或,具有相同業務邏輯定義的變量資料,添加到樣本資料集合中。
其中,變量資料是客戶關係管理RFM變量資料,用於表示交易事件的風險相似性。
在源域和目標域中,由於變量資料大部分是基於交易行為相關的,用於標識交易事件風險相似性的業務理解定義的客戶關係管理RFM(Recency Frequency Monetary)變量資料,因此,對源域和目標域進行資料合併,將源域和目標域中具有相同變量維度的變量資料,及/或,具有相同業務邏輯定義的變量資料,添加到樣本資料集合中,其中,該樣本資料集合用於後續為目標域確定風控規則。
本申請實施例中,RFM變量資料包括:交易資訊變量、風險網路變量、用戶歷史行為變量。
需要說明的是,RFM變量資料除了可以是上述交易資訊變量、風險網路變量、用戶歷史行為變量之外,還可以根據實際情況是其他RFM變量,這裡不做具體限定。
圖3為本申請實施例提供的樣本資料集合中的變量資料的示意圖。如圖3所示,以信用卡為例,樣本資料集合中的變量資料可以包括實時交易資訊、卡相關歷史、帳戶相關歷史、風控拒絕率等變量資料。
步驟204:基於預設收斂閾值,對樣本資料集合進行多次迭代,得到樣本資料集合中每個樣本資料的權重分值。
在確定樣本資料集合之後,透過預先設置的收斂閾值,對樣本資料集合進行多次迭代,最終得到樣本資料集合中每個樣本資料的權重分值。
具體地,對樣本資料集合進行多次迭代,得到樣本資料集合中每個樣本資料的權重分值,包括:
基於預設算法和樣本資料集合,確定分類模型;
透過降低錯誤分類的源域樣本資料的權重,以及提高錯誤分類的目標域樣本資料的權重,對樣本資料集合進行多次迭代,直到分類模型的分類正確率滿足預設收斂閾值;
基於分類正確率滿足預設收斂閾值的分類模型,確定樣本資料集合中每個樣本資料的權重分值。
其中,預設算法為基於樣本的遷移學習對應的
TrAdaBoost算法。
圖4為本申請實施例提供的資料樣本的權重分值的確定方法的示意圖。
如圖4所示,在資料樣本集合中包括的源域樣本資料和目標域樣本資料均為帶標籤的樣本資料,基於
TrAdaBoost算法對該帶標籤的源域樣本資料和目標域樣本資料進行分類訓練,確定分類模型,進而根據該分類模型對目標域中不帶標籤的資料進行分類,確定分類模型的分類準確率。
其中,該分類準確率與源域樣本資料和目標域樣本資料是否錯誤分類有關。在分類訓練過程中,對於錯誤分類的源域樣本資料,表示該源域樣本資料與目標域樣本資料很不相同,因此,需要降低錯誤分類的源域樣本資料的權重,以使得減小該錯誤分類的源域樣本資料的權重;對於錯誤分類的目標域樣本資料,表示該目標域樣本資料是一個較難分類的樣本資料,因此,需要提高錯誤分類的目標域樣本資料的權重,以使得在下次分類訓練時,減小該目標域樣本資料被分錯的概率。
透過在每次分類訓練過程中降低錯誤分類的源域樣本資料的權重,以及提高錯誤分類的目標域樣本資料的權重,對樣本資料集合進行多次迭代,直到分類模型的分類正確率滿足預設收斂閾值,從而得到較優化的分類模型。
基於得到分類正確率滿足預設收斂閾值的分類模型,確定樣本資料集合中的各個樣本資料的權重,即將得到分類正確率滿足預設收斂閾值的分類模型的樣本資料集合中各個樣本資料的權重確定為該各個樣本資料的最終權重。
步驟206:根據樣本資料集合中每個樣本資料的權重分值,確定預設風控規則生成條件中的特徵參數值。
具體地,根據樣本資料集合中每個樣本資料的權重分值,確定預設風控規則生成條件中的特徵參數值,包括:
根據樣本資料集合中每個樣本資料的權重分值,採用加權決策樹算法,確定預設風控規則生成條件中的特徵參數值。
透過預先設置交易風險率,進而使得可以根據樣本資料集合中每個樣本資料的權重分值,基於加權決策樹算法,在預設交易風險率範圍內,確定預設風控規則生成條件中的特徵參數值。
針對信用卡,假設預設交易風險率為風險交易濃度低於萬分之一,即一萬件交易中存在風險交易的情況小於一件。進而根據樣本資料集合中每個樣本資料的權重分值,確定加權決策樹過程中的分支參數和分支閾值,直到確定滿足該風險交易濃度的特徵參數值。
圖5為本申請實施例提供的加權決策樹的示意圖。
如圖5所示,根據樣本資料集合中每個樣本資料的權重分值,在加權決策樹中確定第一層分支參數為交易頻率,分支閾值為交易頻率3;第二層分支參數為帳戶使用時長,分支閾值為帳戶使用時長60天;第三層分支參數為交易總金額,分支閾值為交易總金額300元,最終得到滿足風險交易濃度小於萬分之一的特徵參數值:交易數10k件。
根據資料樣本集合中各個樣本資料的權重,可以更加有效地利用源域對應的成熟業務場景積累的歷史資料,來快速為目標域對應的新業務場景確定預設風控規則生成條件中的特徵參數值,有效提高特徵參數值的準確性和最優化。
步驟208:根據預設風控規則生成條件,以及預設風控規則生成條件中的特徵參數值,生成風控規則。
在確定預設風控規則生成條件中的特徵參數值之後,可以為目標域生成風控規則。
例如,預設風控規則生成條件為“使用信用卡+收貨地址次數超過X次,金額大於Y元,超過Z天內無風險交易”,基於上述步驟202~204確定預設風控規則生成條件中的特徵參數值(X,Y,Z)為(3,300,60),則可以在目標域中的歷史交易資料符合“使用信用卡+收貨地址次數超過3次,金額大於300元,超過60天內無風險交易”時確定風控規則:雙主體可信對:信用卡+收貨地址。
本申請實施例記載的技術方案,透過將源域與目標域進行資料結構對齊,得到包括源域樣本資料和目標域樣本資料的樣本資料集合,基於預設收斂閾值,對樣本資料集合進行多次迭代,得到樣本資料集合中每個樣本資料的權重分值,進而根據樣本資料集合中每個樣本資料的權重分值,確定預設風控規則生成條件中的特徵參數值,以及根據預設風控規則生成條件和預設風控規則生成條件中的特徵參數值,生成風控規則,從而使得可以利用源域對應的成熟業務場景積累的歷史資料,快速為目標域對應的新業務場景生成風控規則,有效提高風控規則的生成效率。
實施例2
圖6為本申請實施例提供的一種電子設備的結構示意圖。如圖6所示,在硬體層面,該電子設備包括處理器,可選地還包括內部匯流排、網路介面、儲存器。其中,儲存器可能包含內存記憶體,例如高速隨機存取記憶體(Random-Access Memory,RAM),也可能還包括非揮發性記憶體(non-volatile memory),例如至少1個磁碟儲存器等。當然,該電子設備還可能包括其他業務所需要的硬體。
處理器、網路介面和儲存器可以透過內部匯流排相互連接,該內部匯流排可以是ISA(Industry Standard
Architecture,工業標準體系結構)匯流排、PCI(Peripheral Component Interconnect,外設部件互連標準)匯流排或EISA(Extended Industry Standard Architecture,擴展工業標準結構)匯流排等。所述匯流排可以分為地址匯流排、資料匯流排、控制匯流排等。為便於表示,圖6中僅用一個雙向箭頭表示,但並不表示僅有一根匯流排或一種類型的匯流排。
儲存器,用於存放程式。具體地,程式可以包括程式代碼,所述程式代碼包括計算機操作指令。儲存器可以包括內存記憶體和非揮發性儲存器,並向處理器提供指令和資料。
處理器從非揮發性儲存器中讀取對應的計算機程式到內存記憶體中然後運行,在邏輯層面上形成風控規則生成裝置。處理器,執行儲存器所存放的程式,並具體用於執行以下操作:
將源域與目標域進行資料結構對齊,得到樣本資料集合,其中,樣本資料集合中包括源域樣本資料和目標域樣本資料;
基於預設收斂閾值,對樣本資料集合進行多次迭代,得到樣本資料集合中每個樣本資料的權重分值;
根據樣本資料集合中每個樣本資料的權重分值,確定預設風控規則生成條件中的特徵參數值;
根據預設風控規則生成條件,以及預設風控規則生成條件中的特徵參數值,生成風控規則。
上述如本申請實施例1執行的方法可以應用於處理器中,或者由處理器實現。處理器可能是一種積體電路晶片,具有信號的處理能力。在實現過程中,上述方法的各步驟可以透過處理器中的硬體的積體邏輯電路或者軟體形式的指令完成。上述的處理器可以是通用處理器,包括中央處理器(Central Processing Unit,CPU)、網路處理器(Network Processor,NP)等;還可以是數位信號處理器(Digital Signal Processor,DSP)、專用積體電路(
Application Specific Integrated Circuit,ASIC)、現場可編程閘陣列(Field-Programmable Gate Array,FPGA)或者其他可編程邏輯器件、分立閘或者電晶體邏輯器件、分立硬體組件。可以實現或者執行本申請實施例中的公開的各方法、步驟及邏輯框圖。通用處理器可以是微處理器或者該處理器也可以是任何常規的處理器等。結合本申請實施例所公開的方法的步驟可以直接體現為硬體譯碼處理器執行完成,或者用譯碼處理器中的硬體及軟體模組組合執行完成。軟體模組可以位於隨機儲存器,閃存、只讀儲存器,可編程只讀儲存器或者電可擦寫可編程儲存器、寄存器等本領域成熟的儲存媒體中。該儲存媒體位於儲存器,處理器讀取儲存器中的資訊,結合其硬體完成上述方法的步驟。
該電子設備還可執行圖2執行的方法,並實現上述實施例1的功能,本申請實施例在此不再贅述。
本申請實施例還提出了一種計算機可讀儲存媒體,該計算機可讀儲存媒體儲存一個或多個程式,該一個或多個程式包括指令,該指令當被包括多個應用程式的電子設備執行時,能夠使該電子設備執行圖2所示實施例中的風控規則生成方法,並具體用於執行下述操作:
將源域與目標域進行資料結構對齊,得到樣本資料集合,其中,樣本資料集合中包括源域樣本資料和目標域樣本資料;
基於預設收斂閾值,對樣本資料集合進行多次迭代,得到樣本資料集合中每個樣本資料的權重分值;
根據樣本資料集合中每個樣本資料的權重分值,確定預設風控規則生成條件中的特徵參數值;
根據預設風控規則生成條件,以及預設風控規則生成條件中的特徵參數值,生成風控規則。
圖7為本申請實施例提供的一種風控規則生成裝置的結構示意圖。如圖7所示,裝置700包括:
集合確定單元701,將源域與目標域進行資料結構對齊,得到樣本資料集合,其中,樣本資料集合中包括源域樣本資料和目標域樣本資料;
權重確定單元702,基於預設收斂閾值,對樣本資料集合進行多次迭代,得到樣本資料集合中每個樣本資料的權重分值;
特徵值確定單元703,根據樣本資料集合中每個樣本資料的權重分值,確定預設風控規則生成條件中的特徵參數值;
規則生成單元704,根據預設風控規則生成條件,以及預設風控規則生成條件中的特徵參數值,生成風控規則。
可選地,集合確定單元701具體用於:
將源域和目標域中,具有相同變量維度的變量資料,及/或,具有相同業務邏輯定義的變量資料,添加到樣本資料集合中。
可選地,權重確定單元702具體用於:
基於預設算法和樣本資料集合,確定分類模型;
透過降低錯誤分類的源域樣本資料的權重,以及提高錯誤分類的目標域樣本資料的權重,對樣本資料集合進行多次迭代,直到分類模型的分類正確率滿足預設收斂閾值;
基於分類正確率滿足預設收斂閾值的分類模型,確定樣本資料集合中每個樣本資料的權重分值。
可選地,特徵值確單元703具體用於:
根據樣本資料集合中每個樣本資料的權重分值,採用加權決策樹算法,確定預設風控規則生成條件中的特徵參數值。
可選地,變量資料是客戶關係管理RFM變量資料,用於表示交易事件的風險相似性。
可選地, RFM變量資料包括:交易資訊變量、風險網路變量、用戶歷史行為變量。
根據風控規則生成裝置,集合確定單元將源域與目標域進行資料結構對齊,得到樣本資料集合,其中,樣本資料集合中包括源域樣本資料和目標域樣本資料;權重確定單元基於預設收斂閾值,對樣本資料集合進行多次迭代,得到樣本資料集合中每個樣本資料的權重分值;特徵值確定單元根據樣本資料集合中每個樣本資料的權重分值,確定預設風控規則生成條件中的特徵參數值;規則生成單元根據預設風控規則生成條件,以及預設風控規則生成條件中的特徵參數值,生成風控規則,從而使得可以利用源域對應的成熟業務場景積累的歷史資料,快速為目標域對應的新業務場景生成風控規則,有效提高風控規則的生成效率。
在20世紀90年代,對於一個技術的改進可以很明顯地區分是硬體上的改進(例如,對二極體、電晶體、開關等電路結構的改進)還是軟體上的改進(對於方法流程的改進)。然而,隨著技術的發展,當今的很多方法流程的改進已經可以視為硬體電路結構的直接改進。設計人員幾乎都透過將改進的方法流程編程到硬體電路中來得到相應的硬體電路結構。因此,不能說一個方法流程的改進就不能用硬體實體模組來實現。例如,可編程邏輯器件(
Programmable Logic Device, PLD)(例如現場可編程閘陣列(Field Programmable Gate Array,FPGA))就是這樣一種積體電路,其邏輯功能由用戶對器件編程來確定。由設計人員自行編程來把一個數位系統“集成”在一片PLD上,而不需要請晶片製造廠商來設計和製作專用的積體電路晶片。而且,如今,取代手工地製作積體電路晶片,這種編程也多半改用“邏輯編譯器(logic compiler)”軟體來實現,它與程式開發撰寫時所用的軟體編譯器相類似,而要編譯之前的原始代碼也得用特定的編程語言來撰寫,此稱之為硬體描述語言(Hardware Description Language,HDL),而HDL也並非僅有一種,而是有許多種,如ABEL(Advanced
Boolean Expression Language)、AHDL(Altera Hardware Description Language)、Confluence、CUPL(Cornell
University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(Ruby Hardware Description Language)等,目前最普遍使用的是VHDL(Very-High-Speed
Integrated Circuit Hardware Description Language)與
Verilog。本領域技術人員也應該清楚,只需要將方法流程用上述幾種硬體描述語言稍作邏輯編程並編程到積體電路中,就可以很容易得到實現該邏輯方法流程的硬體電路。
控制器可以按任何適當的方式實現,例如,控制器可以採取例如微處理器或處理器以及儲存可由該(微)處理器執行的計算機可讀程式代碼(例如軟體或韌體)的計算機可讀媒體、邏輯閘、開關、專用積體電路(Application
Specific Integrated Circuit,ASIC)、可編程邏輯控制器和嵌入微控制器的形式,控制器的例子包括但不限於以下微控制器:ARC 625D、Atmel AT91SAM、Microchip
PIC18F26K20 以及Silicone Labs C8051F320,儲存器控制器還可以被實現為儲存器的控制邏輯的一部分。本領域技術人員也知道,除了以純計算機可讀程式代碼方式實現控制器以外,完全可以透過將方法步驟進行邏輯編程來使得控制器以邏輯閘、開關、專用積體電路、可編程邏輯控制器和嵌入微控制器等的形式來實現相同功能。因此這種控制器可以被認為是一種硬體部件,而對其內包括的用於實現各種功能的裝置也可以視為硬體部件內的結構。或者甚至,可以將用於實現各種功能的裝置視為既可以是實現方法的軟體模組又可以是硬體部件內的結構。
上述實施例闡明的系統、裝置、模組或單元,具體可以由計算機晶片或實體實現,或者由具有某種功能的產品來實現。一種典型的實現設備為計算機。具體的,計算機例如可以為個人計算機、膝上型計算機、蜂巢式電話、相機電話、智慧電話、個人數位助理、媒體播放器、導航設備、電子郵件設備、遊戲控制台、平板計算機、可穿戴設備或者這些設備中的任何設備的組合。
為了描述的方便,描述以上裝置時以功能分為各種單元分別描述。當然,在實施本申請時可以把各單元的功能在同一個或多個軟體及/或硬體中實現。
本領域內的技術人員應明白,本發明的實施例可提供為方法、系統或計算機程式產品。因此,本發明可採用完全硬體實施例、完全軟體實施例、或結合軟體和硬體方面的實施例的形式。而且,本發明可採用在一個或多個其中包含有計算機可用程式代碼的計算機可用儲存媒體(包括但不限於磁碟儲存器、CD-ROM、光學儲存器等)上實施的計算機程式產品的形式。
本發明是參照根據本發明實施例的方法、設備(系統)、和計算機程式產品的流程圖及/或方塊圖來描述的。應理解可由計算機程式指令實現流程圖及/或方塊圖中的每一流程及/或方塊、以及流程圖及/或方塊圖中的流程及/或方塊的結合。可提供這些計算機程式指令到通用計算機、專用計算機、嵌入式處理機或其他可編程資料處理設備的處理器以產生一個機器,使得透過計算機或其他可編程資料處理設備的處理器執行的指令產生用於實現在流程圖一個流程或多個流程及/或方塊圖一個方塊或多個方塊中指定的功能的裝置。
這些計算機程式指令也可儲存在能引導計算機或其他可編程資料處理設備以特定方式工作的計算機可讀儲存器中,使得儲存在該計算機可讀儲存器中的指令產生包括指令裝置的製造品,該指令裝置實現在流程圖一個流程或多個流程及/或方塊圖一個方塊或多個方塊中指定的功能。
這些計算機程式指令也可裝載到計算機或其他可編程資料處理設備上,使得在計算機或其他可編程設備上執行一系列操作步驟以產生計算機實現的處理,從而在計算機或其他可編程設備上執行的指令提供用於實現在流程圖一個流程或多個流程及/或方塊圖一個方塊或多個方塊中指定的功能的步驟。
在一個典型的配置中,計算設備包括一個或多個處理器(CPU)、輸入/輸出介面、網路介面和內存記憶體。
內存記憶體可能包括計算機可讀媒體中的非永久性儲存器,隨機存取儲存器(RAM)及/或非揮發性內存記憶體等形式,如只讀儲存器(ROM)或快閃內存記憶體(flash RAM)。內存記憶體是計算機可讀媒體的示例。
計算機可讀媒體包括永久性和非永久性、可移動和非可移動媒體可以由任何方法或技術來實現資訊儲存。資訊可以是計算機可讀指令、資料結構、程式的模組或其他資料。計算機的儲存媒體的例子包括,但不限於相變內存記憶體(PRAM)、靜態隨機存取記憶體(SRAM)、動態隨機存取記憶體(DRAM)、其他類型的隨機存取記憶體(RAM)、唯讀記憶體(ROM)、電可擦除可編程唯讀記憶體
(EEPROM)、快閃記憶體或其他內存記憶體技術、唯讀光碟唯讀記憶體(CD-ROM)、數位多功能光碟(DVD)或其他光學儲存、磁盒式磁帶,磁帶磁磁碟儲存或其他磁性儲存設備或任何其他非傳輸媒體,可用於儲存可以被計算設備存取的資訊。按照本文中的界定,計算機可讀媒體不包括暫存電腦可讀媒體(transitory media),如調變的資料信號和載波。
還需要說明的是,術語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、商品或者設備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、商品或者設備所固有的要素。在沒有更多限制的情況下,由語句“包括一個……”限定的要素,並不排除在包括所述要素的過程、方法、商品或者設備中還存在另外的相同要素。
本申請可以在由計算機執行的計算機可執行指令的一般上下文中描述,例如程式模組。一般地,程式模組包括執行特定任務或實現特定抽象資料類型的例程、程式、物件、組件、資料結構等等。也可以在分布式計算環境中實踐本申請,在這些分布式計算環境中,由透過通信網路而被連接的遠程處理設備來執行任務。在分布式計算環境中,程式模組可以位於包括儲存設備在內的本地和遠程計算機儲存媒體中。
本說明書中的各個實施例均採用遞進的方式描述,各個實施例之間相同相似的部分互相參見即可,每個實施例重點說明的都是與其他實施例的不同之處。尤其,對於系統實施例而言,由於其基本相似於方法實施例,所以描述的比較簡單,相關之處參見方法實施例的部分說明即可。
以上所述僅為本申請的實施例而已,並不用於限制本申請。對於本領域技術人員來說,本申請可以有各種更改和變化。凡在本申請的精神和原理之內所作的任何修改、等同替換、改進等,均應包含在本申請的申請專利範圍的範圍之內。
實際應用中,預先設置風控規則生成條件,例如,預設風控規則:信用卡+收貨地址,預設風控規則生成條件可以為“使用信用卡+收貨地址次數超過X次,金額大於Y元,超過Z天內無風險交易”,根據大量的歷史交易資料,確定預設風控規則生成條件中的特徵參數值(X,Y,Z),則可以根據該預設風控規則生成條件以及該特徵參數值(X,Y,Z),生成風控規則:信用卡+收貨地址。
圖1為現有技術中風控規則生成方法的示意圖。
如圖1所示,透過歷史交易資料,確定預設風控規則,即可信名單。使得在實時交易時,根據實時交易資料,判斷該實時交易是否符合該可信名單,若是,則確定該實時交易可信;若否,則確定該實時交易不可信。
但是,針對新業務場景,例如,在一個新的市場中開拓業務時,由於歷史交易資料較少,無法快速確定預設風控規則生成條件中的特徵參數值,導致在新業務場景中無法快速生成風控規則。
為了實現本申請的目的,本申請實施例提供一種風控規則生成方法和裝置,所述方法包括:透過將源域與目標域進行資料結構對齊,得到包括源域樣本資料和目標域樣本資料的樣本資料集合,基於預設收斂閾值,對樣本資料集合進行多次迭代,得到樣本資料集合中每個樣本資料的權重分值,進而根據樣本資料集合中每個樣本資料的權重分值,確定預設風控規則生成條件中的特徵參數值,以及根據預設風控規則生成條件和預設風控規則生成條件中的特徵參數值,生成風控規則,從而使得可以利用源域對應的成熟業務場景積累的歷史資料,快速為目標域對應的新業務場景生成風控規則,有效提高風控規則的生成效率。
下面結合本申請具體實施例及相應的附圖對本申請技術方案進行清楚、完整地描述。顯然,所描述的實施例僅是本申請一部分實施例,而不是全部的實施例。基於本申請中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都屬於本申請保護的範圍。
以下結合附圖,詳細說明本申請各實施例提供的技術方案。
實施例1
圖2為本申請實施例提供的一種風控規則生成方法的流程示意圖。所述方法可以如下所示。
步驟202:將源域與目標域進行資料結構對齊,得到樣本資料集合,其中,樣本資料集合中包括源域樣本資料和目標域樣本資料。
需要說明的是,源域中包括的是成熟業務場景積累的第一歷史交易資料,目標域中包括的是新業務場景中積累的第二歷史交易資料,其中,第一歷史交易資料的資料量級大於第二歷史交易資料的資料量級。
利用源域中資料量較大的第一歷史交易資料,幫助目標域中資料量較小的第二歷史交易資料,為目標域生成風險控制規則,首先需要將源域與目標域進行資料結構對齊。
本申請實施例中,將源域與目標域進行資料結構對齊,得到樣本資料集合,包括:
將源域和目標域中,具有相同變量維度的變量資料,及/或,具有相同業務邏輯定義的變量資料,添加到樣本資料集合中。
其中,變量資料是客戶關係管理RFM變量資料,用於表示交易事件的風險相似性。
在源域和目標域中,由於變量資料大部分是基於交易行為相關的,用於標識交易事件風險相似性的業務理解定義的客戶關係管理RFM(Recency Frequency Monetary)變量資料,因此,對源域和目標域進行資料合併,將源域和目標域中具有相同變量維度的變量資料,及/或,具有相同業務邏輯定義的變量資料,添加到樣本資料集合中,其中,該樣本資料集合用於後續為目標域確定風控規則。
本申請實施例中,RFM變量資料包括:交易資訊變量、風險網路變量、用戶歷史行為變量。
需要說明的是,RFM變量資料除了可以是上述交易資訊變量、風險網路變量、用戶歷史行為變量之外,還可以根據實際情況是其他RFM變量,這裡不做具體限定。
圖3為本申請實施例提供的樣本資料集合中的變量資料的示意圖。如圖3所示,以信用卡為例,樣本資料集合中的變量資料可以包括實時交易資訊、卡相關歷史、帳戶相關歷史、風控拒絕率等變量資料。
步驟204:基於預設收斂閾值,對樣本資料集合進行多次迭代,得到樣本資料集合中每個樣本資料的權重分值。
在確定樣本資料集合之後,透過預先設置的收斂閾值,對樣本資料集合進行多次迭代,最終得到樣本資料集合中每個樣本資料的權重分值。
具體地,對樣本資料集合進行多次迭代,得到樣本資料集合中每個樣本資料的權重分值,包括:
基於預設算法和樣本資料集合,確定分類模型;
透過降低錯誤分類的源域樣本資料的權重,以及提高錯誤分類的目標域樣本資料的權重,對樣本資料集合進行多次迭代,直到分類模型的分類正確率滿足預設收斂閾值;
基於分類正確率滿足預設收斂閾值的分類模型,確定樣本資料集合中每個樣本資料的權重分值。
其中,預設算法為基於樣本的遷移學習對應的
TrAdaBoost算法。
圖4為本申請實施例提供的資料樣本的權重分值的確定方法的示意圖。
如圖4所示,在資料樣本集合中包括的源域樣本資料和目標域樣本資料均為帶標籤的樣本資料,基於
TrAdaBoost算法對該帶標籤的源域樣本資料和目標域樣本資料進行分類訓練,確定分類模型,進而根據該分類模型對目標域中不帶標籤的資料進行分類,確定分類模型的分類準確率。
其中,該分類準確率與源域樣本資料和目標域樣本資料是否錯誤分類有關。在分類訓練過程中,對於錯誤分類的源域樣本資料,表示該源域樣本資料與目標域樣本資料很不相同,因此,需要降低錯誤分類的源域樣本資料的權重,以使得減小該錯誤分類的源域樣本資料的權重;對於錯誤分類的目標域樣本資料,表示該目標域樣本資料是一個較難分類的樣本資料,因此,需要提高錯誤分類的目標域樣本資料的權重,以使得在下次分類訓練時,減小該目標域樣本資料被分錯的概率。
透過在每次分類訓練過程中降低錯誤分類的源域樣本資料的權重,以及提高錯誤分類的目標域樣本資料的權重,對樣本資料集合進行多次迭代,直到分類模型的分類正確率滿足預設收斂閾值,從而得到較優化的分類模型。
基於得到分類正確率滿足預設收斂閾值的分類模型,確定樣本資料集合中的各個樣本資料的權重,即將得到分類正確率滿足預設收斂閾值的分類模型的樣本資料集合中各個樣本資料的權重確定為該各個樣本資料的最終權重。
步驟206:根據樣本資料集合中每個樣本資料的權重分值,確定預設風控規則生成條件中的特徵參數值。
具體地,根據樣本資料集合中每個樣本資料的權重分值,確定預設風控規則生成條件中的特徵參數值,包括:
根據樣本資料集合中每個樣本資料的權重分值,採用加權決策樹算法,確定預設風控規則生成條件中的特徵參數值。
透過預先設置交易風險率,進而使得可以根據樣本資料集合中每個樣本資料的權重分值,基於加權決策樹算法,在預設交易風險率範圍內,確定預設風控規則生成條件中的特徵參數值。
針對信用卡,假設預設交易風險率為風險交易濃度低於萬分之一,即一萬件交易中存在風險交易的情況小於一件。進而根據樣本資料集合中每個樣本資料的權重分值,確定加權決策樹過程中的分支參數和分支閾值,直到確定滿足該風險交易濃度的特徵參數值。
圖5為本申請實施例提供的加權決策樹的示意圖。
如圖5所示,根據樣本資料集合中每個樣本資料的權重分值,在加權決策樹中確定第一層分支參數為交易頻率,分支閾值為交易頻率3;第二層分支參數為帳戶使用時長,分支閾值為帳戶使用時長60天;第三層分支參數為交易總金額,分支閾值為交易總金額300元,最終得到滿足風險交易濃度小於萬分之一的特徵參數值:交易數10k件。
根據資料樣本集合中各個樣本資料的權重,可以更加有效地利用源域對應的成熟業務場景積累的歷史資料,來快速為目標域對應的新業務場景確定預設風控規則生成條件中的特徵參數值,有效提高特徵參數值的準確性和最優化。
步驟208:根據預設風控規則生成條件,以及預設風控規則生成條件中的特徵參數值,生成風控規則。
在確定預設風控規則生成條件中的特徵參數值之後,可以為目標域生成風控規則。
例如,預設風控規則生成條件為“使用信用卡+收貨地址次數超過X次,金額大於Y元,超過Z天內無風險交易”,基於上述步驟202~204確定預設風控規則生成條件中的特徵參數值(X,Y,Z)為(3,300,60),則可以在目標域中的歷史交易資料符合“使用信用卡+收貨地址次數超過3次,金額大於300元,超過60天內無風險交易”時確定風控規則:雙主體可信對:信用卡+收貨地址。
本申請實施例記載的技術方案,透過將源域與目標域進行資料結構對齊,得到包括源域樣本資料和目標域樣本資料的樣本資料集合,基於預設收斂閾值,對樣本資料集合進行多次迭代,得到樣本資料集合中每個樣本資料的權重分值,進而根據樣本資料集合中每個樣本資料的權重分值,確定預設風控規則生成條件中的特徵參數值,以及根據預設風控規則生成條件和預設風控規則生成條件中的特徵參數值,生成風控規則,從而使得可以利用源域對應的成熟業務場景積累的歷史資料,快速為目標域對應的新業務場景生成風控規則,有效提高風控規則的生成效率。
實施例2
圖6為本申請實施例提供的一種電子設備的結構示意圖。如圖6所示,在硬體層面,該電子設備包括處理器,可選地還包括內部匯流排、網路介面、儲存器。其中,儲存器可能包含內存記憶體,例如高速隨機存取記憶體(Random-Access Memory,RAM),也可能還包括非揮發性記憶體(non-volatile memory),例如至少1個磁碟儲存器等。當然,該電子設備還可能包括其他業務所需要的硬體。
處理器、網路介面和儲存器可以透過內部匯流排相互連接,該內部匯流排可以是ISA(Industry Standard
Architecture,工業標準體系結構)匯流排、PCI(Peripheral Component Interconnect,外設部件互連標準)匯流排或EISA(Extended Industry Standard Architecture,擴展工業標準結構)匯流排等。所述匯流排可以分為地址匯流排、資料匯流排、控制匯流排等。為便於表示,圖6中僅用一個雙向箭頭表示,但並不表示僅有一根匯流排或一種類型的匯流排。
儲存器,用於存放程式。具體地,程式可以包括程式代碼,所述程式代碼包括計算機操作指令。儲存器可以包括內存記憶體和非揮發性儲存器,並向處理器提供指令和資料。
處理器從非揮發性儲存器中讀取對應的計算機程式到內存記憶體中然後運行,在邏輯層面上形成風控規則生成裝置。處理器,執行儲存器所存放的程式,並具體用於執行以下操作:
將源域與目標域進行資料結構對齊,得到樣本資料集合,其中,樣本資料集合中包括源域樣本資料和目標域樣本資料;
基於預設收斂閾值,對樣本資料集合進行多次迭代,得到樣本資料集合中每個樣本資料的權重分值;
根據樣本資料集合中每個樣本資料的權重分值,確定預設風控規則生成條件中的特徵參數值;
根據預設風控規則生成條件,以及預設風控規則生成條件中的特徵參數值,生成風控規則。
上述如本申請實施例1執行的方法可以應用於處理器中,或者由處理器實現。處理器可能是一種積體電路晶片,具有信號的處理能力。在實現過程中,上述方法的各步驟可以透過處理器中的硬體的積體邏輯電路或者軟體形式的指令完成。上述的處理器可以是通用處理器,包括中央處理器(Central Processing Unit,CPU)、網路處理器(Network Processor,NP)等;還可以是數位信號處理器(Digital Signal Processor,DSP)、專用積體電路(
Application Specific Integrated Circuit,ASIC)、現場可編程閘陣列(Field-Programmable Gate Array,FPGA)或者其他可編程邏輯器件、分立閘或者電晶體邏輯器件、分立硬體組件。可以實現或者執行本申請實施例中的公開的各方法、步驟及邏輯框圖。通用處理器可以是微處理器或者該處理器也可以是任何常規的處理器等。結合本申請實施例所公開的方法的步驟可以直接體現為硬體譯碼處理器執行完成,或者用譯碼處理器中的硬體及軟體模組組合執行完成。軟體模組可以位於隨機儲存器,閃存、只讀儲存器,可編程只讀儲存器或者電可擦寫可編程儲存器、寄存器等本領域成熟的儲存媒體中。該儲存媒體位於儲存器,處理器讀取儲存器中的資訊,結合其硬體完成上述方法的步驟。
該電子設備還可執行圖2執行的方法,並實現上述實施例1的功能,本申請實施例在此不再贅述。
本申請實施例還提出了一種計算機可讀儲存媒體,該計算機可讀儲存媒體儲存一個或多個程式,該一個或多個程式包括指令,該指令當被包括多個應用程式的電子設備執行時,能夠使該電子設備執行圖2所示實施例中的風控規則生成方法,並具體用於執行下述操作:
將源域與目標域進行資料結構對齊,得到樣本資料集合,其中,樣本資料集合中包括源域樣本資料和目標域樣本資料;
基於預設收斂閾值,對樣本資料集合進行多次迭代,得到樣本資料集合中每個樣本資料的權重分值;
根據樣本資料集合中每個樣本資料的權重分值,確定預設風控規則生成條件中的特徵參數值;
根據預設風控規則生成條件,以及預設風控規則生成條件中的特徵參數值,生成風控規則。
圖7為本申請實施例提供的一種風控規則生成裝置的結構示意圖。如圖7所示,裝置700包括:
集合確定單元701,將源域與目標域進行資料結構對齊,得到樣本資料集合,其中,樣本資料集合中包括源域樣本資料和目標域樣本資料;
權重確定單元702,基於預設收斂閾值,對樣本資料集合進行多次迭代,得到樣本資料集合中每個樣本資料的權重分值;
特徵值確定單元703,根據樣本資料集合中每個樣本資料的權重分值,確定預設風控規則生成條件中的特徵參數值;
規則生成單元704,根據預設風控規則生成條件,以及預設風控規則生成條件中的特徵參數值,生成風控規則。
可選地,集合確定單元701具體用於:
將源域和目標域中,具有相同變量維度的變量資料,及/或,具有相同業務邏輯定義的變量資料,添加到樣本資料集合中。
可選地,權重確定單元702具體用於:
基於預設算法和樣本資料集合,確定分類模型;
透過降低錯誤分類的源域樣本資料的權重,以及提高錯誤分類的目標域樣本資料的權重,對樣本資料集合進行多次迭代,直到分類模型的分類正確率滿足預設收斂閾值;
基於分類正確率滿足預設收斂閾值的分類模型,確定樣本資料集合中每個樣本資料的權重分值。
可選地,特徵值確單元703具體用於:
根據樣本資料集合中每個樣本資料的權重分值,採用加權決策樹算法,確定預設風控規則生成條件中的特徵參數值。
可選地,變量資料是客戶關係管理RFM變量資料,用於表示交易事件的風險相似性。
可選地, RFM變量資料包括:交易資訊變量、風險網路變量、用戶歷史行為變量。
根據風控規則生成裝置,集合確定單元將源域與目標域進行資料結構對齊,得到樣本資料集合,其中,樣本資料集合中包括源域樣本資料和目標域樣本資料;權重確定單元基於預設收斂閾值,對樣本資料集合進行多次迭代,得到樣本資料集合中每個樣本資料的權重分值;特徵值確定單元根據樣本資料集合中每個樣本資料的權重分值,確定預設風控規則生成條件中的特徵參數值;規則生成單元根據預設風控規則生成條件,以及預設風控規則生成條件中的特徵參數值,生成風控規則,從而使得可以利用源域對應的成熟業務場景積累的歷史資料,快速為目標域對應的新業務場景生成風控規則,有效提高風控規則的生成效率。
在20世紀90年代,對於一個技術的改進可以很明顯地區分是硬體上的改進(例如,對二極體、電晶體、開關等電路結構的改進)還是軟體上的改進(對於方法流程的改進)。然而,隨著技術的發展,當今的很多方法流程的改進已經可以視為硬體電路結構的直接改進。設計人員幾乎都透過將改進的方法流程編程到硬體電路中來得到相應的硬體電路結構。因此,不能說一個方法流程的改進就不能用硬體實體模組來實現。例如,可編程邏輯器件(
Programmable Logic Device, PLD)(例如現場可編程閘陣列(Field Programmable Gate Array,FPGA))就是這樣一種積體電路,其邏輯功能由用戶對器件編程來確定。由設計人員自行編程來把一個數位系統“集成”在一片PLD上,而不需要請晶片製造廠商來設計和製作專用的積體電路晶片。而且,如今,取代手工地製作積體電路晶片,這種編程也多半改用“邏輯編譯器(logic compiler)”軟體來實現,它與程式開發撰寫時所用的軟體編譯器相類似,而要編譯之前的原始代碼也得用特定的編程語言來撰寫,此稱之為硬體描述語言(Hardware Description Language,HDL),而HDL也並非僅有一種,而是有許多種,如ABEL(Advanced
Boolean Expression Language)、AHDL(Altera Hardware Description Language)、Confluence、CUPL(Cornell
University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(Ruby Hardware Description Language)等,目前最普遍使用的是VHDL(Very-High-Speed
Integrated Circuit Hardware Description Language)與
Verilog。本領域技術人員也應該清楚,只需要將方法流程用上述幾種硬體描述語言稍作邏輯編程並編程到積體電路中,就可以很容易得到實現該邏輯方法流程的硬體電路。
控制器可以按任何適當的方式實現,例如,控制器可以採取例如微處理器或處理器以及儲存可由該(微)處理器執行的計算機可讀程式代碼(例如軟體或韌體)的計算機可讀媒體、邏輯閘、開關、專用積體電路(Application
Specific Integrated Circuit,ASIC)、可編程邏輯控制器和嵌入微控制器的形式,控制器的例子包括但不限於以下微控制器:ARC 625D、Atmel AT91SAM、Microchip
PIC18F26K20 以及Silicone Labs C8051F320,儲存器控制器還可以被實現為儲存器的控制邏輯的一部分。本領域技術人員也知道,除了以純計算機可讀程式代碼方式實現控制器以外,完全可以透過將方法步驟進行邏輯編程來使得控制器以邏輯閘、開關、專用積體電路、可編程邏輯控制器和嵌入微控制器等的形式來實現相同功能。因此這種控制器可以被認為是一種硬體部件,而對其內包括的用於實現各種功能的裝置也可以視為硬體部件內的結構。或者甚至,可以將用於實現各種功能的裝置視為既可以是實現方法的軟體模組又可以是硬體部件內的結構。
上述實施例闡明的系統、裝置、模組或單元,具體可以由計算機晶片或實體實現,或者由具有某種功能的產品來實現。一種典型的實現設備為計算機。具體的,計算機例如可以為個人計算機、膝上型計算機、蜂巢式電話、相機電話、智慧電話、個人數位助理、媒體播放器、導航設備、電子郵件設備、遊戲控制台、平板計算機、可穿戴設備或者這些設備中的任何設備的組合。
為了描述的方便,描述以上裝置時以功能分為各種單元分別描述。當然,在實施本申請時可以把各單元的功能在同一個或多個軟體及/或硬體中實現。
本領域內的技術人員應明白,本發明的實施例可提供為方法、系統或計算機程式產品。因此,本發明可採用完全硬體實施例、完全軟體實施例、或結合軟體和硬體方面的實施例的形式。而且,本發明可採用在一個或多個其中包含有計算機可用程式代碼的計算機可用儲存媒體(包括但不限於磁碟儲存器、CD-ROM、光學儲存器等)上實施的計算機程式產品的形式。
本發明是參照根據本發明實施例的方法、設備(系統)、和計算機程式產品的流程圖及/或方塊圖來描述的。應理解可由計算機程式指令實現流程圖及/或方塊圖中的每一流程及/或方塊、以及流程圖及/或方塊圖中的流程及/或方塊的結合。可提供這些計算機程式指令到通用計算機、專用計算機、嵌入式處理機或其他可編程資料處理設備的處理器以產生一個機器,使得透過計算機或其他可編程資料處理設備的處理器執行的指令產生用於實現在流程圖一個流程或多個流程及/或方塊圖一個方塊或多個方塊中指定的功能的裝置。
這些計算機程式指令也可儲存在能引導計算機或其他可編程資料處理設備以特定方式工作的計算機可讀儲存器中,使得儲存在該計算機可讀儲存器中的指令產生包括指令裝置的製造品,該指令裝置實現在流程圖一個流程或多個流程及/或方塊圖一個方塊或多個方塊中指定的功能。
這些計算機程式指令也可裝載到計算機或其他可編程資料處理設備上,使得在計算機或其他可編程設備上執行一系列操作步驟以產生計算機實現的處理,從而在計算機或其他可編程設備上執行的指令提供用於實現在流程圖一個流程或多個流程及/或方塊圖一個方塊或多個方塊中指定的功能的步驟。
在一個典型的配置中,計算設備包括一個或多個處理器(CPU)、輸入/輸出介面、網路介面和內存記憶體。
內存記憶體可能包括計算機可讀媒體中的非永久性儲存器,隨機存取儲存器(RAM)及/或非揮發性內存記憶體等形式,如只讀儲存器(ROM)或快閃內存記憶體(flash RAM)。內存記憶體是計算機可讀媒體的示例。
計算機可讀媒體包括永久性和非永久性、可移動和非可移動媒體可以由任何方法或技術來實現資訊儲存。資訊可以是計算機可讀指令、資料結構、程式的模組或其他資料。計算機的儲存媒體的例子包括,但不限於相變內存記憶體(PRAM)、靜態隨機存取記憶體(SRAM)、動態隨機存取記憶體(DRAM)、其他類型的隨機存取記憶體(RAM)、唯讀記憶體(ROM)、電可擦除可編程唯讀記憶體
(EEPROM)、快閃記憶體或其他內存記憶體技術、唯讀光碟唯讀記憶體(CD-ROM)、數位多功能光碟(DVD)或其他光學儲存、磁盒式磁帶,磁帶磁磁碟儲存或其他磁性儲存設備或任何其他非傳輸媒體,可用於儲存可以被計算設備存取的資訊。按照本文中的界定,計算機可讀媒體不包括暫存電腦可讀媒體(transitory media),如調變的資料信號和載波。
還需要說明的是,術語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、商品或者設備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、商品或者設備所固有的要素。在沒有更多限制的情況下,由語句“包括一個……”限定的要素,並不排除在包括所述要素的過程、方法、商品或者設備中還存在另外的相同要素。
本申請可以在由計算機執行的計算機可執行指令的一般上下文中描述,例如程式模組。一般地,程式模組包括執行特定任務或實現特定抽象資料類型的例程、程式、物件、組件、資料結構等等。也可以在分布式計算環境中實踐本申請,在這些分布式計算環境中,由透過通信網路而被連接的遠程處理設備來執行任務。在分布式計算環境中,程式模組可以位於包括儲存設備在內的本地和遠程計算機儲存媒體中。
本說明書中的各個實施例均採用遞進的方式描述,各個實施例之間相同相似的部分互相參見即可,每個實施例重點說明的都是與其他實施例的不同之處。尤其,對於系統實施例而言,由於其基本相似於方法實施例,所以描述的比較簡單,相關之處參見方法實施例的部分說明即可。
以上所述僅為本申請的實施例而已,並不用於限制本申請。對於本領域技術人員來說,本申請可以有各種更改和變化。凡在本申請的精神和原理之內所作的任何修改、等同替換、改進等,均應包含在本申請的申請專利範圍的範圍之內。
700‧‧‧裝置
701‧‧‧集合確定單元
702‧‧‧權重確定單元
703‧‧‧特徵值確定單元
704‧‧‧規則生成單元
此處所說明的附圖用來提供對本申請的進一步理解,構成本申請的一部分,本申請的示意性實施例及其說明用於解釋本申請,並不構成對本申請的不當限定。在附圖中:
圖1為現有技術中風控規則生成方法的示意圖;
圖2為本申請實施例提供的一種風控規則生成方法的流程示意圖;
圖3為本申請實施例提供的樣本資料集合中的變量資料的示意圖;
圖4為本申請實施例提供的資料樣本的權重分值的確定方法的示意圖;
圖5為本申請實施例提供的加權決策樹的示意圖;
圖6為本申請實施例提供的一種電子設備的結構示意圖;
圖7為本申請實施例提供的一種風控規則生成裝置的結構示意圖。
Claims (14)
- 一種風控規則生成方法,包括: 將源域與目標域進行資料結構對齊,得到樣本資料集合,其中,該樣本資料集合中包括源域樣本資料和目標域樣本資料; 基於預設收斂閾值,對該樣本資料集合進行多次迭代,得到該樣本資料集合中每個樣本資料的權重分值; 根據該樣本資料集合中每個樣本資料的權重分值,確定預設風控規則生成條件中的特徵參數值; 根據該預設風控規則生成條件,以及該預設風控規則生成條件中的特徵參數值,生成風控規則。
- 如申請專利範圍第1項所述的方法,將源域與目標域進行資料結構對齊,得到樣本資料集合,包括: 將該源域和該目標域中,具有相同變量維度的變量資料,及/或,具有相同業務邏輯定義的變量資料,添加到該樣本資料集合中。
- 如申請專利範圍第2項所述的方法,基於預設收斂閾值,對該樣本資料集合進行多次迭代,得到該樣本資料集合中每個樣本資料的權重分值,包括: 基於預設算法和該樣本資料集合,確定分類模型; 透過降低錯誤分類的該源域樣本資料的權重,以及提高錯誤分類的該目標域樣本資料的權重,對該樣本資料集合進行多次迭代,直到該分類模型的分類正確率滿足該預設收斂閾值; 基於該分類正確率滿足該預設收斂閾值的該分類模型,確定該樣本資料集合中每個樣本資料的權重分值。
- 如申請專利範圍第3項所述的方法,根據該樣本資料集合中每個樣本資料的權重分值,確定預設風控規則生成條件中的特徵參數值,包括: 根據該樣本資料集合中每個樣本資料的權重分值,採用加權決策樹算法,確定該預設風控規則生成條件中的特徵參數值。
- 如申請專利範圍第2項所述的方法,該變量資料是客戶關係管理RFM變量資料,用於表示交易事件的風險相似性。
- 如申請專利範圍第5項所述的方法,該RFM變量資料包括:交易資訊變量、風險網路變量、用戶歷史行為變量。
- 一種風控規則生成裝置,包括: 集合確定單元,將源域與目標域進行資料結構對齊,得到樣本資料集合,其中,該樣本資料集合中包括源域樣本資料和目標域樣本資料; 權重確定單元,基於預設收斂閾值,對該樣本資料集合進行多次迭代,得到該樣本資料集合中每個樣本資料的權重分值; 特徵值確定單元,根據該樣本資料集合中每個樣本資料的權重分值,確定預設風控規則生成條件中的特徵參數值; 規則生成單元,根據該預設風控規則生成條件,以及該預設風控規則生成條件中的特徵參數值,生成風控規則。
- 如申請專利範圍第7項所述的裝置,該集合確定單元具體用於: 將該源域和該目標域中,具有相同變量維度的變量資料,及/或,具有相同業務邏輯定義的變量資料,添加到該樣本資料集合中。
- 如申請專利範圍第8項所述的裝置,該權重確定單元具體用於: 基於預設算法和該樣本資料集合,確定分類模型; 透過降低錯誤分類的該源域樣本資料的權重,以及提高錯誤分類的該目標域樣本資料的權重,對該樣本資料集合進行多次迭代,直到該分類模型的分類正確率滿足該預設收斂閾值; 基於該分類正確率滿足該預設收斂閾值的該分類模型,確定該樣本資料集合中每個樣本資料的權重分值。
- 如申請專利範圍第9項所述的裝置,該特徵值確單元具體用於: 根據該樣本資料集合中每個樣本資料的權重分值,採用加權決策樹算法,確定該預設風控規則生成條件中的特徵參數值。
- 如申請專利範圍第8項所述的裝置,該變量資料是客戶關係管理RFM變量資料,用於表示交易事件的風險相似性。
- 如申請專利範圍第11項所述的裝置,該RFM變量資料包括:交易資訊變量、風險網路變量、用戶歷史行為變量。
- 一種風控規則生成裝置,包括: 儲存器,存放程式; 處理器,執行該儲存器儲存的程式,並具體執行: 將源域與目標域進行資料結構對齊,得到樣本資料集合,其中,該樣本資料集合中包括源域樣本資料和目標域樣本資料; 基於預設收斂閾值,對該樣本資料集合進行多次迭代,得到該樣本資料集合中每個樣本資料的權重分值; 根據該樣本資料集合中每個樣本資料的權重分值,確定預設風控規則生成條件中的特徵參數值; 根據該預設風控規則生成條件,以及該預設風控規則生成條件中的特徵參數值,生成風控規則。
- 一種計算機可讀儲存媒體,該計算機可讀儲存媒體儲存一個或多個程式,該一個或多個程式當被包括多個應用程式的電子設備執行時,使得該電子設備執行以下方法: 將源域與目標域進行資料結構對齊,得到樣本資料集合,其中,該樣本資料集合中包括源域樣本資料和目標域樣本資料; 基於預設收斂閾值,對該樣本資料集合進行多次迭代,得到該樣本資料集合中每個樣本資料的權重分值; 根據該樣本資料集合中每個樣本資料的權重分值,確定預設風控規則生成條件中的特徵參數值; 根據該預設風控規則生成條件,以及該預設風控規則生成條件中的特徵參數值,生成風控規則。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810144812.1A CN108460523B (zh) | 2018-02-12 | 2018-02-12 | 一种风控规则生成方法和装置 |
??201810144812.1 | 2018-02-12 | ||
CN201810144812.1 | 2018-02-12 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201935342A true TW201935342A (zh) | 2019-09-01 |
TWI679592B TWI679592B (zh) | 2019-12-11 |
Family
ID=63217029
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW107146353A TWI679592B (zh) | 2018-02-12 | 2018-12-21 | 風控規則生成方法和裝置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20200372424A1 (zh) |
EP (1) | EP3754571A4 (zh) |
CN (1) | CN108460523B (zh) |
TW (1) | TWI679592B (zh) |
WO (1) | WO2019154162A1 (zh) |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108460523B (zh) * | 2018-02-12 | 2020-08-21 | 阿里巴巴集团控股有限公司 | 一种风控规则生成方法和装置 |
CN110875834A (zh) * | 2018-08-31 | 2020-03-10 | 马上消费金融股份有限公司 | 一种风控模型的创建方法、风控评估方法及相关装置 |
CN109636081A (zh) * | 2018-09-29 | 2019-04-16 | 阿里巴巴集团控股有限公司 | 一种用户安全意识检测方法和装置 |
CN109840838B (zh) * | 2018-12-26 | 2021-08-31 | 天翼数智科技(北京)有限公司 | 风控规则模型双引擎系统、控制方法及服务器 |
CN110021150B (zh) * | 2019-03-27 | 2021-03-19 | 创新先进技术有限公司 | 一种数据处理方法、装置及设备 |
CN110163662B (zh) * | 2019-04-26 | 2024-04-05 | 创新先进技术有限公司 | 一种业务模型训练方法、装置及设备 |
CN110262775A (zh) * | 2019-05-27 | 2019-09-20 | 阿里巴巴集团控股有限公司 | 业务规则生成方法及装置 |
CN110443618B (zh) * | 2019-07-10 | 2023-12-01 | 创新先进技术有限公司 | 风控策略的生成方法及装置 |
CN110738476B (zh) * | 2019-09-24 | 2021-06-29 | 支付宝(杭州)信息技术有限公司 | 一种样本迁移方法、装置及设备 |
CN110795622A (zh) * | 2019-10-08 | 2020-02-14 | 支付宝(杭州)信息技术有限公司 | 资源确定方法、装置、计算设备和存储介质 |
CN110942338A (zh) * | 2019-11-01 | 2020-03-31 | 支付宝(杭州)信息技术有限公司 | 一种营销赋能策略的推荐方法、装置和电子设备 |
CN111047220A (zh) * | 2019-12-27 | 2020-04-21 | 支付宝(杭州)信息技术有限公司 | 一种风控阈值条件确定方法、装置、设备和可读介质 |
CN111461892B (zh) * | 2020-03-31 | 2021-07-06 | 支付宝(杭州)信息技术有限公司 | 用于风险识别模型的衍生变量选择方法和装置 |
CN111598625B (zh) * | 2020-05-22 | 2024-03-29 | 北京明略昭辉科技有限公司 | 目标受众确定方法、装置及电子设备 |
CN111784119B (zh) * | 2020-06-12 | 2022-06-03 | 支付宝(杭州)信息技术有限公司 | 风控策略迁移方法、策略包生成方法及装置 |
CN112990337B (zh) * | 2021-03-31 | 2022-11-29 | 电子科技大学中山学院 | 一种面向目标识别的多阶段训练方法 |
CN113240259B (zh) * | 2021-04-30 | 2023-05-23 | 杭州顶象科技有限公司 | 规则策略组的生成方法、系统及电子设备 |
US12014429B2 (en) * | 2021-07-30 | 2024-06-18 | Intuit Inc. | Calibrated risk scoring and sampling |
CN113781052A (zh) * | 2021-09-07 | 2021-12-10 | 上海浦东发展银行股份有限公司 | 一种反洗钱监控方法、装置、设备及存储介质 |
CN113886182A (zh) * | 2021-09-29 | 2022-01-04 | 深圳市金蝶天燕云计算股份有限公司 | 一种告警收敛方法、装置及电子设备和存储介质 |
CN114625786B (zh) * | 2022-05-12 | 2022-08-09 | 杭银消费金融股份有限公司 | 一种基于风控技术的动态数据挖掘方法及系统 |
CN114998003B (zh) * | 2022-08-02 | 2022-11-11 | 湖南三湘银行股份有限公司 | 一种基于图深度卷积神经网络算法识别洗钱的方法和装置 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090132347A1 (en) * | 2003-08-12 | 2009-05-21 | Russell Wayne Anderson | Systems And Methods For Aggregating And Utilizing Retail Transaction Records At The Customer Level |
US7672884B2 (en) * | 2004-04-07 | 2010-03-02 | Simpliance, Inc. | Method and system for rule-base compliance, certification and risk mitigation |
US9113147B2 (en) * | 2005-09-27 | 2015-08-18 | Qualcomm Incorporated | Scalability techniques based on content information |
CN101950382B (zh) * | 2010-09-01 | 2013-03-06 | 燕山大学 | 一种带有风险控制的液压设备最优维修计算方法 |
US8856050B2 (en) * | 2011-01-13 | 2014-10-07 | International Business Machines Corporation | System and method for domain adaption with partial observation |
US9002060B2 (en) * | 2012-06-28 | 2015-04-07 | International Business Machines Corporation | Object retrieval in video data using complementary detectors |
CN103020711A (zh) * | 2012-12-25 | 2013-04-03 | 中国科学院深圳先进技术研究院 | 分类器训练方法及其系统 |
EP3822759A1 (en) * | 2013-09-03 | 2021-05-19 | Apple Inc. | User interface for manipulating user interface objects |
US20150106260A1 (en) * | 2013-10-11 | 2015-04-16 | G2 Web Services | System and methods for global boarding of merchants |
CN104731607B (zh) * | 2013-12-18 | 2018-10-30 | 华为技术有限公司 | 终端终生学习处理方法、装置和系统 |
CN106484682B (zh) * | 2015-08-25 | 2019-06-25 | 阿里巴巴集团控股有限公司 | 基于统计的机器翻译方法、装置及电子设备 |
CN106599922B (zh) * | 2016-12-16 | 2021-08-24 | 中国科学院计算技术研究所 | 用于大规模数据标定的迁移学习方法及系统 |
CN107067157A (zh) * | 2017-03-01 | 2017-08-18 | 北京奇艺世纪科技有限公司 | 业务风险评估方法、装置及风控系统 |
CN107316134A (zh) * | 2017-06-16 | 2017-11-03 | 深圳乐信软件技术有限公司 | 一种风险控制方法、装置、服务器及存储介质 |
CN107424069B (zh) * | 2017-08-17 | 2020-11-17 | 创新先进技术有限公司 | 一种风控特征的生成方法、风险监控方法及设备 |
CN107679856B (zh) * | 2017-09-15 | 2021-05-18 | 创新先进技术有限公司 | 基于交易的业务控制方法和装置 |
CN108460523B (zh) * | 2018-02-12 | 2020-08-21 | 阿里巴巴集团控股有限公司 | 一种风控规则生成方法和装置 |
-
2018
- 2018-02-12 CN CN201810144812.1A patent/CN108460523B/zh active Active
- 2018-12-21 TW TW107146353A patent/TWI679592B/zh active
-
2019
- 2019-01-29 WO PCT/CN2019/073565 patent/WO2019154162A1/zh unknown
- 2019-01-29 EP EP19750533.2A patent/EP3754571A4/en not_active Withdrawn
-
2020
- 2020-08-04 US US16/984,653 patent/US20200372424A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
WO2019154162A1 (zh) | 2019-08-15 |
EP3754571A1 (en) | 2020-12-23 |
US20200372424A1 (en) | 2020-11-26 |
CN108460523B (zh) | 2020-08-21 |
CN108460523A (zh) | 2018-08-28 |
EP3754571A4 (en) | 2021-11-17 |
TWI679592B (zh) | 2019-12-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI679592B (zh) | 風控規則生成方法和裝置 | |
TWI715880B (zh) | 基於圖結構模型的信用風險控制方法、裝置以及設備 | |
CN107424069B (zh) | 一种风控特征的生成方法、风险监控方法及设备 | |
KR102175226B1 (ko) | 데이터 위험을 제어하기 위한 방법 및 디바이스 | |
TWI709933B (zh) | 虛擬卡的開卡方法、系統和支付系統、發卡系統 | |
TWI769190B (zh) | 風險管控方法及裝置 | |
TW201935387A (zh) | 反洗錢方法、裝置及設備 | |
CN111080304B (zh) | 一种可信关系识别方法、装置及设备 | |
CN110119860B (zh) | 一种垃圾账号检测方法、装置以及设备 | |
CN110633989A (zh) | 一种风险行为生成模型的确定方法及装置 | |
CN111539811B (zh) | 风险账户的识别方法及装置 | |
CN111932273B (zh) | 一种交易风险识别方法、装置、设备及介质 | |
WO2021120845A1 (zh) | 一种同质风险单位特征集合生成方法、装置、设备及介质 | |
CN107566179B (zh) | 一种节点处理方法及装置 | |
US20190130406A1 (en) | Using Semi-Supervised Label Procreation to Train A Risk Determination Model | |
WO2024113932A1 (zh) | 一种模型优化的方法、装置、设备及存储介质 | |
CN109857984A (zh) | 一种锅炉负荷率-效能曲线的回归方法和装置 | |
TWI713019B (zh) | 資料標籤產生、模型訓練、事件識別方法和裝置 | |
CN114943307A (zh) | 一种模型训练的方法、装置、存储介质以及电子设备 | |
CN109345221A (zh) | 资源流转的核对方法及装置 | |
CN111582872A (zh) | 异常账号检测模型训练、异常账号检测方法、装置及设备 | |
CN109614415B (zh) | 一种数据挖掘、处理方法、装置、设备及介质 | |
CN110263816B (zh) | 一种企业的分类方法以及装置 | |
CN107392408B (zh) | 一种信用分数的提示信息输出方法及装置 | |
CN116363418A (zh) | 一种训练分类模型的方法、装置、存储介质及电子设备 |