TW201734844A - 機器學習模型的建模方法及裝置 - Google Patents
機器學習模型的建模方法及裝置 Download PDFInfo
- Publication number
- TW201734844A TW201734844A TW106103976A TW106103976A TW201734844A TW 201734844 A TW201734844 A TW 201734844A TW 106103976 A TW106103976 A TW 106103976A TW 106103976 A TW106103976 A TW 106103976A TW 201734844 A TW201734844 A TW 201734844A
- Authority
- TW
- Taiwan
- Prior art keywords
- machine learning
- variable
- initial target
- target
- target variable
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q20/00—Payment architectures, schemes or protocols
- G06Q20/38—Payment protocols; Details thereof
- G06Q20/40—Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
- G06Q20/401—Transaction verification
- G06Q20/4016—Transaction verification involving fraud or risk level assessment in transaction processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/11—Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16Z—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS, NOT OTHERWISE PROVIDED FOR
- G16Z99/00—Subject matter not provided for in other main groups of this subclass
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Business, Economics & Management (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Accounting & Taxation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Operations Research (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Computer Security & Cryptography (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Probability & Statistics with Applications (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本發明提供了機器學習模型的建模方法及裝置,通過針對每一個中間目標變量所對應的機器學習子模型進行訓練,獲得各機器學習子模型的機率值,進而將各機器學習子模型的機率值進行機率求和,基於求和所獲得的目標機率值以及用於描述交易行為的特徵變量建立用於判定目標行為的目標機器學習模型。在虛假交易判斷的應用場景中,目標行為即為虛假交易,從而每一個機器學習子模型用於判定對應的中間目標變量所指示的虛假交易類型,對各機器學習子模型的機率值進行機率求和就能夠獲得用於判定屬多種虛假交易類型中的至少一種的機率,基於這一機率值所構建的模型便能夠對於多種虛假交易類型進行判定,實現了節省成本,提高虛假交易的識別效率的目的。
Description
本發明關於計算機技術,尤其關於一種機器學習模型的建模方法及裝置。
在利用機器學習模型進行行為模式的判定時,往往採用針對同屬某一種目標行為的各種具體行為進行共性特徵提取,從而依據這些共性特徵構建機器學習模型。在判定某一個具體行為是否屬該目標行為時,所構建的機器學習模型依據其是否具有這些共性特徵,來確定是否為該目標行為。
以網路中的虛假交易為例,虛假交易是指賣方用戶和/或買方用戶通過虛構或隱瞞交易事實、規避或惡意利用信用記錄規則、干擾或妨害信用記錄秩序等不正當方式獲取虛假的商品銷量、店鋪評分、信用積分或商品評論等不當利益的行為。例如現在已經出現了刷單、炒信、套現和製造虛假訂單貸款等虛假交易類型,為了規範網路交易行為,需要對虛假交易這種行為模式進行判定。
由於虛假交易有著不同的類型,每一種類型的虛假交
易又有著多種具體的實現方式,同時各種類型虛假交易之間的交易行為差異較大,在現有技術中,無法採用提取共性特徵的方式構建用於判斷虛假交易的機器模型,因此,現有技術中採用了每一個機器學習模型針對某一種實現形式或者一個類型的虛假交易進行判定的方式。在利用機器學習模型識別虛假交易時,便需要建立多個模型,需要耗費大量成本,識別效率較低。
本發明提供一種機器學習模型的建模方法及裝置,用於構建一個能夠適用於在目標行為具有多種不同類型的實現形式時,對目標行為進行綜合判定的機器學習模型,從而節省成本,提高識別效率。
為達到上述目的,本發明的實施例採用如下技術方案:
第一方面,提供了一種機器學習模型的建模方法,包括:獲得互斥的各中間目標變量;其中,所述中間目標變量用於指示虛假交易的類型;分別對各中間目標變量對應的機器學習子模型進行訓練,獲得各機器學習子模型的機率值;其中,所述機器學習子模型用於根據描述交易行為的特徵變量判定對應中間目標變量指示的虛假交易類型;對各機器學習子模型的機率值進行機率求和,獲得目
標機率值;根據所述目標機率值和所述特徵變量,建立用於判定虛假交易的目標機器學習模型。
第二方面,提供了一種機器學習模型的建模裝置,包括:獲得模組,用於獲得互斥的各中間目標變量;其中,所述中間目標變量用於指示虛假交易的類型;訓練模組,用於分別對各中間目標變量對應的機器學習子模型進行訓練,獲得各機器學習子模型的機率值;其中,所述機器學習子模型用於根據描述交易行為的特徵變量判定對應中間目標變量指示的虛假交易類型;求和模組,用於對各機器學習子模型的機率值進行機率求和,獲得目標機率值;建模模組,用於根據所述目標機率值和所述特徵變量,建立用於判定虛假交易的目標機器學習模型。
本發明實施例提供的機器學習模型的建模方法及裝置,通過針對每一個中間目標變量所對應的機器學習子模型進行訓練,獲得各機器學習子模型的機率值,進而將各機器學習子模型的機率值進行機率求和,基於求和所獲得的目標機率值以及用於描述交易行為的特徵變量建立用於判定目標行為的目標機器學習模型。由於每一個機器學習子模型用於判定目標行為的某一特定類型,對各機器學習子模型的機率值進行機率求和,從而獲得樣本屬多種目標行為類型中的至少一種類型的機率,基於這一機率所構建
的機器學習模型可以用於對目標行為進行綜合判定。舉例來說,若將這種建模方法應用於虛假交易的應用場景中,所構建的模型便能夠對於虛假交易進行綜合判定,而無需現有技術中需要針對虛假交易的不同實現形式或類型構建多個模型,實現了節省成本,提高虛假交易的識別效率的目的。
上述說明僅是本發明技術方案的概述,為了能夠更清楚瞭解本發明的技術手段,而可依照說明書的內容予以實施,並且為了讓本發明的上述和其它目的、特徵和優點能夠更明顯易懂,以下特舉本發明的具體實施方式。
41‧‧‧訓練模組
42‧‧‧求和模組
43‧‧‧建模模組
44‧‧‧獲得模組
45‧‧‧協方差計算模組
46‧‧‧篩選模組
47‧‧‧計算模組
48‧‧‧複製模組
49‧‧‧樣本模組
441‧‧‧計算單元
442‧‧‧組合單元
443‧‧‧構建單元
444‧‧‧拆分單元
445‧‧‧合併單元
446‧‧‧確定單元
通過閱讀下文較佳實施方式的詳細描述,各種其他的優點和益處對於本領域普通技術人員將變得清楚明瞭。附圖僅用於示出較佳實施方式的目的,而並不認為是對本發明的限制。而且在整個附圖中,用相同的參考符號表示相同的部件。在附圖中:圖1為本發明實施例一提供的一種機器學習模型的建模方法的流程示意圖;圖2為本發明實施例二提供的一種機器學習模型的建模方法的流程示意圖;圖3為重構目標變量的流程示意圖;圖4為本發明實施例三提供的一種機器學習模型的建模裝置的結構示意圖;
圖5為本發明實施例四提供的一種機器學習模型的建模裝置的結構示意圖。
下面將參照圖式更詳細地描述本公開的示例性實施例。雖然圖式中顯示了本公開的示例性實施例,然而應當理解,可以以各種形式實現本公開而不應被這裡闡述的實施例所限制。相反,提供這些實施例是為了能夠更透徹地理解本公開,並且能夠將本公開的範圍完整的傳達給本領域的技術人員。
下面結合附圖對本發明實施例提供的機器學習模型的建模方法及裝置進行詳細描述。
實施例一
圖1為本發明實施例一提供的一種機器學習模型的建模方法的流程示意圖,本實施例所提供的方法,可以用於進行虛假交易的判斷中,也就是說,本實施例中所提及的目標行為可以為虛假交易,本實施例所提供的方法還可以用於其他異常交易中,本實施例中對此不做限定,如圖1所示,包括:
步驟101、分別對各中間目標變量對應的機器學習子模型進行訓練,獲得各機器學習子模型的機率值。
其中,機器學習子模型用於根據描述交易行為的特徵變量判定對應中間目標變量指示的目標行為類型。
具體地,目標行為有著多種實現形式,可以將交易行為相似的實現形式劃分為一種類型,從而使得在每一種類型的內部,交易行為是相似的,但每一種類型之間的交易行為往往具有較大的差異性。例如,在虛假交易判定的應用場景中,虛假交易有著多種實現形式,在刷單、套現、騙貸和炒信的實現形式中,炒信和刷單的交易行為相似性較高,可以劃分為一個類型,而套現和騙貸的交易行為則與之具有較大差異,可以分別作為一個類型。
在進行目標行為的類別劃分時,可以根據用於指示目標行為的具體實現形式的初始目標變量之間的相容或互斥狀態,對相容的初始目標變量進行合併,獲得相互之間為互斥狀態的中間目標變量。若不同實現形式的目標行為的交易行為差異性較大,則不同實現形式所對應的初始目標變量之間為相斥的;若不同實現形式的目標行為的交易行為差異性較小,則不同實現形式所對應的初始目標變量之間為相容的。
構建各中間目標變量對應的機器學習子模型,機器學習子模型是一個二分類模型,用於根據描述交易行為的特徵變量判定樣本是否屬對應中間目標變量指示的目標行為類型。利用訓練樣本,對各機器學習子模型進行訓練,獲得各機器學習子模型的機率值。
步驟102、對各機器學習子模型的機率值進行機率求和,獲得目標機率值。
由於每一個機器學習子模型用於判定對應的中間目標
變量所指示的目標行為類型,對各機器學習子模型的機率值進行機率求和就能夠獲得用於判定屬多種目標行為類型中的至少一種的機率,即目標機率值。
步驟103、根據目標機率值和特徵變量,建立用於判定目標行為的目標機器學習模型。
具體地,構建用於判定目標行為的目標機器學習模型,目標機器學習模型是一個二分類模型,目標機器學習模型的機率取目標機率值,目標機器學習模型的輸入為描述交易行為的特徵變量,輸出為用於指示是否為目標行為的目標變量,該目標變量的取值為0或1,當根據樣本的特徵變量判定出目標變量取值為1時,該樣本為正樣本,即屬目標行為,否則不為目標行為。
本實施例中,通過針對每一個中間目標變量所對應的機器學習子模型進行訓練,獲得各機器學習子模型的機率值,進而將各機器學習子模型的機率值進行機率求和,基於求和所獲得的目標機率值以及用於描述交易行為的特徵變量建立用於判定目標行為的目標機器學習模型。在虛假交易判斷的應用場景中,目標行為即為虛假交易,從而每一個機器學習子模型用於判定對應的中間目標變量所指示的虛假交易類型,對各機器學習子模型的機率值進行機率求和就能夠獲得用於判定屬多種虛假交易類型中的至少一種的機率,基於這一機率值所構建的模型便能夠對於多種虛假交易類型進行判定,實現了節省成本,提高虛假交易的識別效率的目的。
實施例二
圖2為本發明實施例二提供的一種機器學習模型的建模方法的流程示意圖,本實施例中,以構建對虛假交易進行綜合判定的機器學習模型為例,進一步說明本發明實施例的技術方案,如圖2所示,該方法包括:
步驟201、獲得預設的初始目標變量和特徵變量。
具體的,在歷史交易資料中記錄有歷史發生過的交易所形成的交易記錄,在每一條交易記錄中包括三個維度的交易資訊,分別為買家交易資訊、賣家交易資訊和商品交易資訊。另外,每一條交易記錄還包括是否屬各種虛假交易的具體實現形式的資訊,虛假交易具體實現形式包括但不限於刷單、套現、騙貸和炒信。
用戶可以從歷史交易資料中,提取用於描述交易資訊的參數,設定為特徵變量x,以及提取用於描述虛假交易類型的參數設定為初始特徵變量y。
例如:可以將刷單作為初始特徵變量y1,將套現作為初始特徵變量y2,將騙貸作為初始特徵變量y3,將炒信作為初始特徵變量y4。
由於歷史資訊中包含有大量的參數,在進行特徵變量設定時,用戶可以儘量多地提取用於描述交易資訊的參數作為特徵變量,通過提取完善的交易資訊,使得特徵變量所描述的交易行為也就更加準確。基於此所建立的機器學習模型在進行分類等分析運算時,所獲得的結果也就更加
準確。
步驟202、根據初始目標變量獲得互斥的中間目標變量。
具體地,確定初始目標變量之間的相容或互斥狀態,根據相容或互斥狀態,對相容的初始目標變量進行合併,獲得相互之間為互斥狀態的中間目標變量。
首先,根據公式確定初始目標變量之間的相容或互斥狀態,將存在互斥狀態的兩初始目標變量作為一個初始目標變量對。其中,Numij表示歷史交易資料中被初始目標變量yi和初始目標變量yj同時定義為正樣本的交易記錄的條數。Numi表示歷史交易資料中被初始目標變量yi定義為正樣本的交易記錄的條數,Numj表示歷史交易資料中被初始目標變量yj定義為正樣本的交易記錄的條數。i和j的取值範圍為:1iN,1jN。N為初始特徵變量的總數。H=1時兩初始目標變量之間為互斥,H=0時兩初始目標變量之間為相融。另外,上述公式中的0.2僅是一種較佳的閾值,在實際使用中,可以選擇其他取值,閾值的取值越小,則當H=1時所判定出的兩初始目標變量之間的互斥就更加嚴格,也就是說,一個初始目標變量對另一初始目標變量的取值所構成的影響越小。
需要說明的是,正樣本在這裡是指交易記錄屬初始目標變量所指示的虛假交易類型,反之為負樣本。互斥在這
裡是指一個初始目標變量的取值對另一個初始目標變量的取值構成影響小,而相融是指一個初始目標變量的取值對另一個初始目標變量的取值構成影響大。
其次,構建一個拆分集合,集合中包括全部的初始目標變量。進而,重複執行根據一個初始目標變量對,將拆分集合拆分為兩個下一級的拆分集合的步驟,其中,下一級的拆分集合用於根據下一個初始目標變量對進行拆分,直至全部的初始目標變量對執行完畢。在每一個拆分集合中包含有初始目標變量對中的一個初始目標變量,以及被拆分集合中除初始目標變量對之外的全部元素。對相互之間存在包含關係的拆分集合進行合併,獲得目標子集。將同一目標子集中的初始目標變量合併,作為中間目標變量Y。
例如:若初始目標變量為y1,y2,y3,y4,經過計算,若確定存在互斥關係的為初始目標變量對y1和y2、初始目標變量對y1和y4、初始目標變量對y2和y4、初始目標變量對y3和y4,則可以據此對拆分集合{y1,y2,y3,y4}執行進行拆分和合併的重構過程,圖3為重構目標變量的流程示意圖,如圖3所示,獲得的目標子集為{y1,y2}、{y2,y3}、{y4}。將y1和y2相合併為Y1,將y2和y3相合併為Y2,將y4作為Y3。
步驟203、構建各中間目標變量對應的機器學習子模型。
具體地,針對每一個中間目標變量構建一個二分類的
機器學習子模型,該中間目標變量的機器學習子模型用於確定樣本是否為該中間目標變量的正樣本。
在機器學習子模型為線性模型的基礎上,為了在對機器學習子模型進行訓練的過程中,提高機器學習子模型的性能,減少訓練噪聲,可以針對每一個中間目標變量的機器學習子模型,進行特徵變量的篩選,篩選後的每一個機器學習子模型的特徵變量有可能是不相同的,在每個機器學習子模型中僅保留同向的特徵變量,避免由於特徵變量的同向性不一致所導致的訓練噪聲。具體篩選過程為:計算各特徵變量與用於合併獲得該中間目標變量的各初始目標變量之間的協方差,篩選掉與這些初始目標變量之間的協方差正負向不一致的特徵變量。
例如:特徵變量包括X1、X2、…Xq…、Xn,其中,n為特徵變量的總個數,中間目標變量包括Y1、Y2、…Yv…、YN’,其中,N’為中間目標變量的總個數。
合併獲得中間目標變量Yv的各初始目標變量記為ys。在中間目標變量Yv的機器學習子模型中,依次針對
每一個特徵變量Xq,採用公式計算與各初始目標變量ys之間的協方差,若計算出的各協方差特徵變量Covq1,Covq2,……Covq S正負號相同,則保留該特徵變量Xq,否則篩選掉該特徵變量Xq。
其中,1qn,1sS,S為合併獲得該中間目標變量Yv的各初始目標變量ys的個數,Xqk為特徵變量Xq在歷史交易資料中第k條交易記錄中的取值,ysk為初始
目標變量ys在歷史交易資料中第k條交易記錄中的取值,為特徵變量Xq在歷史交易資料中的平均值,為各目標初始目標變量ys在歷史交易資料中的平均值。
構建中間目標變量Y的機器學習子模型M,機器學習子模型M的輸入為篩選後的特徵變量X,輸出為中間目標變量Y。
步驟204、對各中間目標變量對應的機器學習子模型進行訓練,獲得機器學習子模型的機率。
具體地,將歷史交易資料中的每一條交易記錄作為一個訓練樣本,利用歷史交易資料所構成的訓練樣本集,分別對各機器學習子模型進行訓練,獲得機器學習子模型的機率pv。
為了使得對於機器學習子模型進行訓練的模擬性更好,可以根據用於合併獲得機器學習子模型所對應的中間目標變量的各初始目標變量的權重,在歷史交易資料中,對每一條交易記錄進行複製,將複製後的歷史交易資料作為訓練樣本集。採用該方式,構建每個機器學習子模型的訓練樣本集。
由於權重是用於指示初始目標變量的嚴重程度,從而當初始目標變量越嚴重時,經過複製的操作後,在訓練樣本集中,該初始目標變量的正樣本的數量也就越多,從而在訓練過程中能夠提高訓練的模擬性。
例如:對於中間目標變量Yv的機器學習子模型構建訓練樣
本集時,預先確定合併獲得該中間目標變量Yv的各初始目標變量ys的權重分別為W1、W2、…Ws…WS。針對每一條交易記錄,將合併獲得該中間目標變量Yv的各初始目標變量ys的權重Ws,代入公式
若該訓練樣本為初始目標變量ys正樣本,則ys=1,若該訓練樣本為初始目標變量ys負樣本,則ys=0,獲得該樣本的複製份數CN。對每一條訓練樣本複製對應的CN份,從而構建一個訓練樣本集。
進而,利用該複製後的訓練樣本集分別對各中間目標變量對應的機器學習子模型進行訓練,獲得機器學習子模型的機率p1、p2、…pv…、pN’。
步驟205、對機器學習子模型的機率進行機率求和,獲得目標機率值。
具體地,將機器學習子模型的機率p1、p2、…pv…、
pN’代入公式計算獲得機器學習模型的機率P。
步驟206、構建機器學習模型。
具體地,該機器學習模型為二分類模型,機器學習模型機率為P,輸入為特徵變量x,輸出為用於指示是否為虛假交易的目標變量。所構建的機器學習模型用於判定輸入的特徵變量所描述的交易行為是否屬虛假交易。基於該機器學習模型對樣本進行判定,若判定出該樣本為正樣本則說明樣本所指示的交易為虛假交易的可能性很高,若判
定出該樣本為負樣本,則說明樣本所指示的交易為虛假交易的可能性很小。
實施例三
圖4為本發明實施例三提供的一種機器學習模型的建模裝置的結構示意圖,如圖4所示,包括:訓練模組41、求和模組42和建模模組43。
訓練模組41,用於分別對各中間目標變量對應的機器學習子模型進行訓練,獲得各機器學習子模型的機率值。
其中,機器學習子模型用於根據描述交易行為的特徵變量判定對應中間目標變量指示的目標行為類型。
求和模組42,用於對各機器學習子模型的機率值進行機率求和,獲得目標機率值。
具體地,求和模組42,具體用於將各機器學習子模
型的機率pv代入公式計算獲得機器學習模型的機率P。
其中,N’為機器學習子模型的個數。
建模模組43,用於根據目標機率值和特徵變量,建立用於判定是否為目標行為的目標機器學習模型。
本實施例中,通過針對每一個中間目標變量所對應的機器學習子模型進行訓練,獲得各機器學習子模型的機率值,進而將各機器學習子模型的機率值進行機率求和,基於求和所獲得的目標機率值以及用於描述交易行為的特徵
變量建立用於判定目標行為的目標機器學習模型。在虛假交易判斷的應用場景中,目標行為即為虛假交易,從而每一個機器學習子模型用於判定對應的中間目標變量所指示的虛假交易類型,對各機器學習子模型的機率值進行機率求和就能夠獲得用於判定屬多種虛假交易類型中的至少一種的機率,基於這一機率值所構建的模型便能夠對於多種虛假交易類型進行判定,實現了節省成本,提高虛假交易的識別效率的目的。
實施例四
圖5為本發明實施例四提供的一種機器學習模型的建模裝置的結構示意圖,如圖5所示,在圖4所提供的機器學習模型的建模裝置的基礎上,建模裝置還包括:獲得模組44。
獲得模組44,用於根據各初始目標變量之間的相容或互斥狀態,對相容的初始目標變量進行合併,獲得相互之間為互斥狀態的中間目標變量;其中,所述初始目標變量用於指示目標行為的實現形式。
具體地,圖5為本發明實施例四提供的另一種機器學習模型的建模裝置的結構示意圖,作為一種可能的實現形式,獲得模組44進一步包括:計算單元441、組合單元442、構建單元443、拆分單元444、合併單元445和確定單元446。
計算單元441,用於根據公式
確定初始目標變量之間的相容或互斥狀態。
其中,Numij表示歷史交易資料中初始目標變量yi和初始目標變量yj同時定義為正樣本的交易記錄的條數,Numi表示所述歷史交易資料中初始目標變量yi定義為正樣本的交易記錄的條數,Numj表示所述歷史交易資料中初始目標變量yj定義為正樣本的交易記錄的條數,1iN,1jN,N為初始特徵變量的總數,H=1時兩初始目標變量之間為互斥,H=0時兩初始目標變量之間為相融。
T1和T2為預設閾值,0<T1<1,0<T2<1。較佳的,T1=T2=0.2。
組合單元442,用於將兩兩之間為互斥狀態的初始目標變量組成初始目標變量對。
構建單元443,用於構建包括各初始目標變量的拆分集合。
拆分單元444,用於依次針對每一個初始目標變量對,執行根據所述初始目標變量對,將拆分集合拆分為兩個下一級的拆分集合,在每一個下一級的拆分集合中包含有所述初始目標變量對中的一個初始目標變量,以及被拆分的拆分集合中除所述初始目標變量對之外的全部元素的步驟。
其中,所述下一級的拆分集合用於根據下一個初始目標變量對進行拆分。
合併單元445,用於對相互之間存在包含關係的拆分集合進行合併,獲得目標子集。
確定單元446,用於將同一目標子集中的初始目標變量合併,作為所述中間目標變量。
進一步,機器學習子模型為線性模型,建模裝置,還包括:協方差計算模組45、篩選模組46、計算模組47、複製模組48和樣本模組49。
協方差計算模組45,用於針對每一個機器學習子模型,計算特徵變量Xq與各初始目標變量ys之間的協方差。
其中,所述初始目標變量ys用於合併獲得所述機器學習子模型所對應的中間目標變量。
篩選模組46,用於若所述特徵變量Xq與各初始目標變量ys之間的協方差正負號不相同,則篩選掉所述特徵變量Xq,否則,保留所述特徵變量Xq。
計算模組47,用於針對每一條交易記錄,將初始目標變量ys及所述初始目標變量ys的權重Ws,代入公式,獲得所述交易記錄的複製條數CN。
其中,所述交易記錄為所述初始目標變量ys正樣本時,ys=1,否則,ys=0;S為所述初始目標變量ys的個數。
複製模組48,用於針對每一個機器學習子模型,根據各初始目標變量ys權重Ws所確定出的交易記錄複製條數,對所述歷史交易資料中的交易記錄進行複製;其中,
所述初始目標變量ys用於合併獲得所述機器學習子模型所對應的中間目標變量;樣本模組49,用於將複製後的歷史交易資料作為所述機器學習子模型的訓練樣本。
本實施例所提供的裝置,用於執行如圖1和2所示的方法,各功能模組的描述請參見前述實施例,本實施例中不再贅述。
本實施例中,通過針對每一個中間目標變量所對應的機器學習子模型進行訓練,獲得各機器學習子模型的機率值,進而將各機器學習子模型的機率值進行機率求和,基於求和所獲得的目標機率值以及用於描述交易行為的特徵變量建立用於判定目標行為的目標機器學習模型。在虛假交易判斷的應用場景中,目標行為即為虛假交易,從而每一個機器學習子模型用於判定對應的中間目標變量所指示的虛假交易類型,對各機器學習子模型的機率值進行機率求和就能夠獲得用於判定屬多種虛假交易類型中的至少一種的機率,基於這一機率值所構建的模型便能夠對於多種虛假交易類型進行判定,實現了節省成本,提高虛假交易的識別效率的目的。
本領域普通技術人員可以理解:實現上述各方法實施例的全部或部分步驟可以通過程序指令相關的硬體來完成。前述的程序可以儲存於一計算機可讀取儲存媒體中。該程序在執行時,執行包括上述各方法實施例的步驟;而前述的儲存媒體包括:ROM、RAM、磁碟或者光碟等各
種可以儲存程序代碼的媒體。
最後應說明的是:以上各實施例僅用以說明本發明的技術方案,而非對其限制;儘管參照前述各實施例對本發明進行了詳細的說明,本領域的普通技術人員應當理解:其依然可以對前述各實施例所記載的技術方案進行修改,或者對其中部分或者全部技術特徵進行等同替換;而這些修改或者替換,並不使相應技術方案的本質脫離本發明各實施例技術方案的範圍。
Claims (18)
- 一種機器學習模型的建模方法,包括:分別對各中間目標變量對應的機器學習子模型進行訓練,獲得各機器學習子模型的機率值;其中,所述機器學習子模型用於根據描述交易行為的特徵變量判定對應中間目標變量指示的目標行為類型;對各機器學習子模型的機率值進行機率求和,獲得目標機率值;根據所述目標機率值和所述特徵變量,建立用於判定是否為目標行為的目標機器學習模型。
- 根據申請專利範圍第1項所述的建模方法,其中,所述分別對各中間目標變量對應的機器學習子模型進行訓練之前,包括:根據各初始目標變量之間的相容或互斥狀態,對相容的初始目標變量進行合併,獲得相互之間為互斥狀態的中間目標變量;其中,所述初始目標變量用於指示目標行為的實現形式。
- 根據申請專利範圍第2項所述的建模方法,其中,所述根據各初始目標變量之間的相容或互斥狀態,對相容的初始目標變量進行合併,獲得相互之間為互斥狀態的中間目標變量,包括:將兩兩之間為互斥狀態的初始目標變量組成初始目標變量對;構建包括各初始目標變量的拆分集合; 依次針對每一個初始目標變量對,執行根據所述初始目標變量對,將拆分集合拆分為兩個下一級的拆分集合的步驟,在每一個下一級的拆分集合中包含有所述初始目標變量對中的一個初始目標變量,以及被拆分的拆分集合中除所述初始目標變量對之外的全部元素;其中,所述下一級的拆分集合用於根據下一個初始目標變量對進行拆分;對相互之間存在包含關係的拆分集合進行合併,獲得目標子集;將同一目標子集中的初始目標變量合併,作為所述中間目標變量。
- 根據申請專利範圍第2項所述的建模方法,其中,所述根據各初始目標變量之間的相容或互斥狀態,對相容的初始目標變量進行合併,獲得相互之間為互斥狀態的中間目標變量之前,還包括: 根據公式確定初始目標變量之間的相容或互斥狀態;其中,Numij表示歷史交易資料中初始目標變量yi和初始目標變量yj同時定義為正樣本的交易記錄的條數,Numi表示所述歷史交易資料中初始目標變量yi定義為正樣本的交易記錄的條數,Numj表示所述歷史交易資料中初始目標變量yj定義為正樣本的交易記錄的條數,1iN,1jN,N為初始特徵變量的總數,H=1時兩初始目標變量之間為互斥,H=0時兩初始目標變量之間為相融,T1和T2為預設閾值,0 <T1<1,0<T2<1。
- 根據申請專利範圍第2項所述的建模方法,其中,所述機器學習子模型為線性模型,所述分別對各中間目標變量對應的機器學習子模型進行訓練,獲得各機器學習子模型的機率之前,還包括:針對每一個機器學習子模型,計算特徵變量Xq與各初始目標變量ys之間的協方差;其中,所述初始目標變量ys用於合併獲得所述機器學習子模型所對應的中間目標變量;若所述特徵變量Xq與各初始目標變量ys之間的協方差正負號不相同,則篩選掉所述特徵變量Xq,否則,保留所述特徵變量Xq。
- 根據申請專利範圍第2項所述的建模方法,其中,所述分別對各中間目標變量對應的機器學習子模型進行訓練,獲得各機器學習子模型的機率之前,還包括:針對每一個機器學習子模型,根據各初始目標變量ys權重Ws所確定出的交易記錄複製條數,對所述歷史交易資料中的交易記錄進行複製;其中,所述初始目標變量ys用於合併獲得所述機器學習子模型所對應的中間目標變量;將複製後的歷史交易資料作為所述機器學習子模型的訓練樣本。
- 根據申請專利範圍第6項所述的建模方法,其中,所述對所述歷史交易資料中的交易記錄進行複製之 前,還包括:針對每一條交易記錄,將初始目標變量ys及所述初 始目標變量ys的權重Ws,代入公式,獲得所述交易記錄的複製條數CN;其中,所述交易記錄為所述初始目標變量ys正樣本時,ys=1,否則,ys=0;S為所述初始目標變量ys的個數。
- 根據申請專利範圍第1項所述的建模方法,其中,所述對各機器學習子模型的機率值進行機率求和,獲得目標機率值,包括: 將各機器學習子模型的機率pv代入公式計算獲得機器學習模型的機率P;其中,N’為機器學習子模型的個數。
- 根據申請專利範圍第1-8項任一項所述的建模方法,其中,所述目標行為為虛假交易。
- 一種機器學習模型的建模裝置,包括:訓練模組,用於分別對各中間目標變量對應的機器學習子模型進行訓練,獲得各機器學習子模型的機率值;其中,所述機器學習子模型用於根據描述交易行為的特徵變量判定對應中間目標變量指示的目標行為類型;求和模組,用於對各機器學習子模型的機率值進行機率求和,獲得目標機率值;建模模組,用於根據所述目標機率值和所述特徵變量,建立用於判定是否為目標行為的目標機器學習模型。
- 根據申請專利範圍第10項所述的建模裝置,其中,所述裝置,還包括:獲得模組,用於根據各初始目標變量之間的相容或互斥狀態,對相容的初始目標變量進行合併,獲得相互之間為互斥狀態的中間目標變量;其中,所述初始目標變量用於指示目標行為的實現形式。
- 根據申請專利範圍第11項所述的建模裝置,其中,所述獲得模組,包括:組合單元,用於將兩兩之間為互斥狀態的初始目標變量組成初始目標變量對;構建單元,用於構建包括各初始目標變量的拆分集合;拆分單元,用於依次針對每一個初始目標變量對,執行根據所述初始目標變量對,將拆分集合拆分為兩個下一級的拆分集合,在每一個下一級的拆分集合中包含有所述初始目標變量對中的一個初始目標變量,以及被拆分的拆分集合中除所述初始目標變量對之外的全部元素的步驟;其中,所述下一級的拆分集合用於根據下一個初始目標變量對進行拆分;合併單元,用於對相互之間存在包含關係的拆分集合進行合併,獲得目標子集;確定單元,用於將同一目標子集中的初始目標變量合併,作為所述中間目標變量。
- 根據申請專利範圍第11項所述的建模裝置,其 中,所述獲得模組,還包括: 計算單元,用於根據公式確定初始目標變量之間的相容或互斥狀態;其中,Numij表示歷史交易資料中初始目標變量yi和初始目標變量yj同時定義為正樣本的交易記錄的條數,Numi表示所述歷史交易資料中初始目標變量yi定義為正樣本的交易記錄的條數,Numj表示所述歷史交易資料中初始目標變量yj定義為正樣本的交易記錄的條數,1iN,1jN,N為初始特徵變量的總數,H=1時兩初始目標變量之間為互斥,H=0時兩初始目標變量之間為相融,T1和T2為預設閾值,0<T1<1,0<T2<1。
- 根據申請專利範圍第11項所述的建模裝置,其中,所述機器學習子模型為線性模型,所述裝置,還包括:協方差計算模組,用於針對每一個機器學習子模型,計算特徵變量Xq與各初始目標變量ys之間的協方差;其中,所述初始目標變量ys用於合併獲得所述機器學習子模型所對應的中間目標變量;篩選模組,用於若所述特徵變量Xq與各初始目標變量ys之間的協方差正負號不相同,則篩選掉所述特徵變量Xq,否則,保留所述特徵變量Xq。
- 根據申請專利範圍第11項所述的建模裝置,其中,所述裝置,還包括: 複製模組,用於針對每一個機器學習子模型,根據各初始目標變量ys權重Ws所確定出的交易記錄複製條數,對所述歷史交易資料中的交易記錄進行複製;其中,所述初始目標變量ys用於合併獲得所述機器學習子模型所對應的中間目標變量;樣本模組,用於將複製後的歷史交易資料作為所述機器學習子模型的訓練樣本。
- 根據申請專利範圍第15項所述的建模裝置,其中,所述裝置,還包括:計算模組,用於針對每一條交易記錄,將初始目標變量ys及所述初始目標變量ys的權重Ws,代入公式 ,獲得所述交易記錄的複製條數CN;其中,所述交易記錄為所述初始目標變量ys正樣本時,ys=1,否則,ys=0;S為所述初始目標變量ys的個數。
- 根據申請專利範圍第10項所述的建模裝置,其中,所述求和模組,具體用於將各機器學習子模型的機率pv代入公式計算獲得機器學習模型的機率P;其中,N’為機器學習子模型的個數。
- 根據申請專利範圍第10-17項任一項所述的建模裝置,其中,所述目標行為為虛假交易。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610094664.8 | 2016-02-19 | ||
CN201610094664.8A CN107103171B (zh) | 2016-02-19 | 2016-02-19 | 机器学习模型的建模方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201734844A true TW201734844A (zh) | 2017-10-01 |
TWI789345B TWI789345B (zh) | 2023-01-11 |
Family
ID=59624727
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW106103976A TWI789345B (zh) | 2016-02-19 | 2017-02-07 | 機器學習模型的建模方法及裝置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20180374098A1 (zh) |
JP (1) | JP7102344B2 (zh) |
CN (1) | CN107103171B (zh) |
TW (1) | TWI789345B (zh) |
WO (1) | WO2017140222A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI706362B (zh) * | 2018-11-05 | 2020-10-01 | 香港商阿里巴巴集團服務有限公司 | 基於區塊鏈的資料處理方法、裝置和伺服器 |
TWI759562B (zh) * | 2017-11-23 | 2022-04-01 | 大陸商中國銀聯股份有限公司 | 用於識別異常交易社團的方法和裝置 |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11542247B2 (en) | 2015-09-23 | 2023-01-03 | Janssen Pharmaceutica Nv | Bi-heteroaryl substitute 1,4-benzodiazepines and uses thereof for the treatment of cancer |
BR112018005637B1 (pt) | 2015-09-23 | 2023-11-28 | Janssen Pharmaceutica Nv | Compostos derivados de quinoxalina, quinolina e quinazolinona,composições farmacêuticas que os compreende, e uso dos referidos compostos |
CN107103171B (zh) * | 2016-02-19 | 2020-09-25 | 阿里巴巴集团控股有限公司 | 机器学习模型的建模方法及装置 |
CN107423883B (zh) * | 2017-06-15 | 2020-04-07 | 创新先进技术有限公司 | 待处理业务的风险识别方法及装置、电子设备 |
CN109426701B (zh) * | 2017-08-30 | 2022-04-05 | 西门子(中国)有限公司 | 数据模型的运行方法、运行系统和存储介质 |
CN109165249B (zh) * | 2018-08-07 | 2020-08-04 | 阿里巴巴集团控股有限公司 | 数据处理模型构建方法、装置、服务器和用户端 |
US11567964B2 (en) * | 2018-08-31 | 2023-01-31 | Eligible, Inc. | Feature selection for artificial intelligence in healthcare management |
CN109325193B (zh) * | 2018-10-16 | 2021-02-26 | 杭州安恒信息技术股份有限公司 | 基于机器学习的waf正常流量建模方法以及装置 |
US20200159690A1 (en) * | 2018-11-16 | 2020-05-21 | Sap Se | Applying scoring systems using an auto-machine learning classification approach |
US11574360B2 (en) * | 2019-02-05 | 2023-02-07 | International Business Machines Corporation | Fraud detection based on community change analysis |
US11593811B2 (en) * | 2019-02-05 | 2023-02-28 | International Business Machines Corporation | Fraud detection based on community change analysis using a machine learning model |
JP2020140540A (ja) * | 2019-02-28 | 2020-09-03 | 富士通株式会社 | 判定プログラム、判定方法および情報処理装置 |
CN110263938B (zh) | 2019-06-19 | 2021-07-23 | 北京百度网讯科技有限公司 | 用于生成信息的方法和装置 |
CN110991650A (zh) * | 2019-11-25 | 2020-04-10 | 第四范式(北京)技术有限公司 | 训练养卡识别模型、识别养卡行为的方法及装置 |
CN111080360B (zh) * | 2019-12-13 | 2023-12-01 | 中诚信征信有限公司 | 行为预测方法、模型训练方法、装置、服务器及存储介质 |
CN111860865B (zh) * | 2020-07-23 | 2022-07-19 | 中国工商银行股份有限公司 | 模型构建和分析的方法、装置、电子设备和介质 |
CN112465626B (zh) * | 2020-11-24 | 2023-08-29 | 平安科技(深圳)有限公司 | 基于客户端分类聚合的联合风险评估方法及相关设备 |
CN113705824A (zh) * | 2021-01-23 | 2021-11-26 | 深圳市玄羽科技有限公司 | 一种用于构建机器学习建模过程的系统 |
CN113177597A (zh) * | 2021-04-30 | 2021-07-27 | 平安国际融资租赁有限公司 | 模型训练数据确定方法、检测模型训练方法、装置及设备 |
WO2022249266A1 (ja) * | 2021-05-25 | 2022-12-01 | 日本電気株式会社 | 不正検知システム、不正検知方法およびプログラム記録媒体 |
CN116205301A (zh) * | 2023-01-31 | 2023-06-02 | 苏州浪潮智能科技有限公司 | 基于量子机器学习的训练框架构建方法、装置、系统 |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4226754B2 (ja) | 2000-03-09 | 2009-02-18 | 富士電機システムズ株式会社 | ニューラルネットワークの最適化学習方法 |
KR100442835B1 (ko) | 2002-08-13 | 2004-08-02 | 삼성전자주식회사 | 인공 신경망을 이용한 얼굴 인식 방법 및 장치 |
JP2004265190A (ja) | 2003-03-03 | 2004-09-24 | Japan Energy Electronic Materials Inc | 階層型ニューラルネットワークの学習方法、そのプログラム及びそのプログラムを記録した記録媒体 |
JP5142135B2 (ja) | 2007-11-13 | 2013-02-13 | インターナショナル・ビジネス・マシーンズ・コーポレーション | データを分類する技術 |
JP5072102B2 (ja) | 2008-05-12 | 2012-11-14 | パナソニック株式会社 | 年齢推定方法及び年齢推定装置 |
CN102467726B (zh) * | 2010-11-04 | 2015-07-29 | 阿里巴巴集团控股有限公司 | 一种基于网上交易平台的数据处理方法和装置 |
US20160223554A1 (en) * | 2011-08-05 | 2016-08-04 | Nodality, Inc. | Methods for diagnosis, prognosis and methods of treatment |
US9916538B2 (en) * | 2012-09-15 | 2018-03-13 | Z Advanced Computing, Inc. | Method and system for feature detection |
JP5835802B2 (ja) | 2012-01-26 | 2015-12-24 | 日本電信電話株式会社 | 購買予測装置、方法、及びプログラム |
CN103106365B (zh) * | 2013-01-25 | 2015-11-25 | 中国科学院软件研究所 | 一种移动终端上的恶意应用软件的检测方法 |
CN103064987B (zh) * | 2013-01-31 | 2016-09-21 | 五八同城信息技术有限公司 | 一种虚假交易信息识别方法 |
US20140279745A1 (en) * | 2013-03-14 | 2014-09-18 | Sm4rt Predictive Systems | Classification based on prediction of accuracy of multiple data models |
US20140279379A1 (en) * | 2013-03-14 | 2014-09-18 | Rami Mahdi | First party fraud detection system |
CN104679777B (zh) * | 2013-12-02 | 2018-05-18 | 中国银联股份有限公司 | 一种用于检测欺诈交易的方法及系统 |
US20150363791A1 (en) * | 2014-01-10 | 2015-12-17 | Hybrid Application Security Ltd. | Business action based fraud detection system and method |
US20150242747A1 (en) * | 2014-02-26 | 2015-08-27 | Nancy Packes, Inc. | Real estate evaluating platform methods, apparatuses, and media |
CN104933053A (zh) * | 2014-03-18 | 2015-09-23 | 中国银联股份有限公司 | 非平衡类数据的分类 |
CN103914064B (zh) * | 2014-04-01 | 2016-06-08 | 浙江大学 | 基于多分类器和d-s证据融合的工业过程故障诊断方法 |
CN104636912A (zh) * | 2015-02-13 | 2015-05-20 | 银联智惠信息服务(上海)有限公司 | 信用卡套现识别方法和装置 |
CN104834918A (zh) * | 2015-05-20 | 2015-08-12 | 中国科学院上海高等研究院 | 一种基于高斯过程分类器的人体行为识别方法 |
CN105022845A (zh) * | 2015-08-26 | 2015-11-04 | 苏州大学张家港工业技术研究院 | 一种基于特征子空间的新闻分类方法及系统 |
US20170147941A1 (en) * | 2015-11-23 | 2017-05-25 | Alexander Bauer | Subspace projection of multi-dimensional unsupervised machine learning models |
CN107103171B (zh) * | 2016-02-19 | 2020-09-25 | 阿里巴巴集团控股有限公司 | 机器学习模型的建模方法及装置 |
-
2016
- 2016-02-19 CN CN201610094664.8A patent/CN107103171B/zh active Active
-
2017
- 2017-02-07 TW TW106103976A patent/TWI789345B/zh active
- 2017-02-07 WO PCT/CN2017/073023 patent/WO2017140222A1/zh active Application Filing
- 2017-02-07 JP JP2018542277A patent/JP7102344B2/ja active Active
-
2018
- 2018-08-17 US US15/999,073 patent/US20180374098A1/en active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI759562B (zh) * | 2017-11-23 | 2022-04-01 | 大陸商中國銀聯股份有限公司 | 用於識別異常交易社團的方法和裝置 |
TWI706362B (zh) * | 2018-11-05 | 2020-10-01 | 香港商阿里巴巴集團服務有限公司 | 基於區塊鏈的資料處理方法、裝置和伺服器 |
US11270004B2 (en) | 2018-11-05 | 2022-03-08 | Advanced New Technologies Co., Ltd. | Blockchain-based transaction privacy |
Also Published As
Publication number | Publication date |
---|---|
CN107103171A (zh) | 2017-08-29 |
CN107103171B (zh) | 2020-09-25 |
JP7102344B2 (ja) | 2022-07-19 |
WO2017140222A1 (zh) | 2017-08-24 |
JP2019511037A (ja) | 2019-04-18 |
TWI789345B (zh) | 2023-01-11 |
US20180374098A1 (en) | 2018-12-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TW201734844A (zh) | 機器學習模型的建模方法及裝置 | |
KR102061987B1 (ko) | 위험 평가 방법 및 시스템 | |
JP6749468B2 (ja) | 評価モデルのためのモデリング方法及び装置 | |
CN109300029A (zh) | 借贷欺诈检测模型训练方法、借贷欺诈检测方法及装置 | |
US11580560B2 (en) | Identity resolution for fraud ring detection | |
CN105809448B (zh) | 账户交易的聚类方法及其系统 | |
CN112927072B (zh) | 一种基于区块链的反洗钱仲裁方法、系统及相关装置 | |
CN107392217B (zh) | 计算机实现的信息处理方法及装置 | |
CN111325619A (zh) | 一种基于联合学习的信用卡欺诈检测模型更新方法及装置 | |
WO2015138272A1 (en) | Two stage risk model building and evaluation | |
CN110930038A (zh) | 一种贷款需求识别方法、装置、终端及存储介质 | |
Ruyu et al. | A comparison of credit rating classification models based on spark-evidence from lending-club | |
CN113762579A (zh) | 一种模型训练方法、装置、计算机存储介质及设备 | |
CN113781056A (zh) | 预测用户欺诈行为的方法及装置 | |
CN106874286B (zh) | 一种筛选用户特征的方法及装置 | |
CN112884480A (zh) | 异常交易识别模型的构造方法、装置、计算机设备和介质 | |
Kun et al. | Default identification of p2p lending based on stacking ensemble learning | |
Bui et al. | A clustering-based shrink autoencoder for detecting anomalies in intrusion detection systems | |
CN116805245A (zh) | 基于图神经网络与解耦表示学习的欺诈检测方法及系统 | |
CN108446907B (zh) | 安全校验方法及装置 | |
Caplescu et al. | Will they repay their debt? Identification of borrowers likely to be charged off | |
JP2021022199A5 (zh) | ||
CN105741114A (zh) | 计算机盗帐户识别方法及系统 | |
CN110782342B (zh) | 基于二分类模型验证新渠道特征工程正确性的方法及装置 | |
KR102414824B1 (ko) | 대출자 금융 데이터를 풀링하는 방법 및 이러한 방법을 수행하는 장치 |