TW201944305A - 確定業務請求事件的風險機率的方法及裝置 - Google Patents

確定業務請求事件的風險機率的方法及裝置

Info

Publication number
TW201944305A
TW201944305A TW108104899A TW108104899A TW201944305A TW 201944305 A TW201944305 A TW 201944305A TW 108104899 A TW108104899 A TW 108104899A TW 108104899 A TW108104899 A TW 108104899A TW 201944305 A TW201944305 A TW 201944305A
Authority
TW
Taiwan
Prior art keywords
user
relationship
event
crowd
service request
Prior art date
Application number
TW108104899A
Other languages
English (en)
Inventor
王修坤
陳岑
楊新星
Original Assignee
香港商阿里巴巴集團服務有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 香港商阿里巴巴集團服務有限公司 filed Critical 香港商阿里巴巴集團服務有限公司
Publication of TW201944305A publication Critical patent/TW201944305A/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/018Certifying business or products
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/02Banking, e.g. interest calculation or account maintenance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Technology Law (AREA)
  • Educational Administration (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本說明書實施例提供一種確定業務請求事件的風險機率的方法和裝置,方法包括,獲取業務請求事件的事件特徵,獲取該業務請求事件所涉及用戶的用戶個人特徵。並且,基於包含上述涉及用戶的特定人群的人群關係圖譜,確定涉及用戶的關係特徵。由此,基於上述的事件特徵、用戶個人特徵、以及用戶的關係特徵,確定該業務請求事件的風險機率。如此,可以對業務請求事件的風險進行全面的評估。

Description

確定業務請求事件的風險機率的方法及裝置
本說明書一個或多個實施例係有關電腦技術領域,尤其有關透過電腦確定業務請求事件的風險機率的方法和裝置。
隨著電腦和互聯網技術的發展,越來越多的業務透過計算平臺來實現,例如商品交易、錢款支付、金融借貸、保險理賠等等。然而,在許多業務的執行和處理中,如果不對業務請求人的背景,以及所請求的業務進行審核,就很可能帶來較大風險,例如一些不法分子可能利用電子平臺,實施金融詐騙,借貸套現、保險騙保等等。
在習知技術中,為了防止和降低上述風險,往往透過人工進行風險審核。在有些平臺中,也會設定一些簡單的規則,輔助人工進行判斷。然而,這樣的方式效率很低,難以滿足業務快速發展的需要;並且,識別高風險用戶和高風險事件的準確性有賴於人工審核的業務員的自身經驗,不同業務員的經驗的差異也會帶來操作性風險,使得審核準確度難以得到確保,常常出現遺漏。
因此,希望能有改進的方案,透過高效而準確地確定業務請求事件的風險機率,降低業務執行風險。
本說明書一個或多個實施例描述了一種方法和裝置,用以高效地確定業務請求事件的風險機率。
根據第一態樣,提供了一種確定業務請求事件的風險機率的方法,包括:
獲取業務請求事件的事件特徵;
獲取所述業務請求事件所涉及的至少一個用戶的用戶個人特徵;
基於特定人群的人群關係圖譜,確定所述至少一個用戶的關係特徵,其中,所述特定人群包含所述至少一個用戶;
根據所述事件特徵、所述至少一個用戶的用戶個人特徵、以及所述至少一個用戶的關係特徵,確定所述業務請求事件的風險機率。
在一個實施例中,上述事件特徵包括以下中的至少一項:請求業務金額、業務註冊時間、事件發生時間、業務註冊時間與事件發生時間的時間差、事件發生地點。
在一個實施例中,上述至少一個用戶包括所述業務請求事件的請求人、和業務請求的受益人。
在一個實施例中,上述用戶個人特徵包括以下中的一項或多項,用戶基本屬性特徵、用戶行為特徵、用戶位置特徵。
根據一種實施方式,確定上述至少一個用戶的關係特徵向量,具體包括:獲取包含所述至少一個用戶的所述特定人群;獲取所述特定人群的人群關係圖譜;以及基於所述人群關係圖譜,確定所述至少一個用戶的關係特徵。
在一個實施例中,獲取上述特定人群又包括,在預先劃分的多個用戶子集中,確定所述至少一個用戶所屬於的用戶子集,將該用戶子集作為上述特定人群;或者,將所述至少一個用戶添加到預先選擇的用戶集合中,將所述用戶集合作為所述特定人群。
在一個實施例中,獲取特定人群的人群關係圖譜進一步包括:獲取針對預先選擇的用戶集合建構的第一關係圖譜;獲取所述至少一個用戶與所述預先選擇的用戶集合中的用戶的關聯關係;將所述關聯關係添加到所述第一關係圖譜,作為所述特定人群的人群關係圖譜。
根據一種實施方式,上述特定人群的人群關係圖譜基於以下一種或多種關係而建立:交易關係、設備關係、資金關係、社交關係。
在一個實施例中,確定用戶的關係特徵包括,採用節點-向量網路結構特徵提取演算法,將關係圖譜轉換為向量因數,基於所述向量因數確定用戶的關係特徵向量。
在一個實施例中,採用預先訓練的評估模型來確定業務請求事件的風險機率,所述評估模型基於梯度提升決策樹演算法而訓練。
根據第二態樣,提供一種確定業務請求事件的風險機率的裝置,包括:
事件特徵獲取單元,配置成獲取業務請求事件的事件特徵;
個人特徵獲取單元,配置成獲取所述業務請求事件所涉及的至少一個用戶的用戶個人特徵;
關係特徵獲取單元,配置成基於特定人群的人群關係圖譜,確定所述至少一個用戶的關係特徵,其中,所述特定人群包含所述至少一個用戶;
風險確定單元,配置成根據所述事件特徵、所述至少一個用戶的用戶個人特徵、以及所述至少一個用戶的關係特徵,確定所述業務請求事件的風險機率。
根據第三態樣,提供了一種電腦可讀儲存媒體,其上儲存有電腦程式,當所述電腦程式在電腦中執行時,令電腦執行第一態樣的方法。
根據第四態樣,提供了一種計算設備,包括記憶體和處理器,其特徵在於,所述記憶體中儲存有可執行碼,所述處理器執行所述可執行碼時,實現第一態樣的方法。
透過本說明書實施例提供的方法和裝置,基於業務請求事件的事件特徵、所涉及用戶的用戶個人特徵、以及所涉及用戶的關係特徵,綜合確定業務請求事件的風險機率,從而使得風險確定更加高效而準確。
下面結合附圖,對本說明書提供的方案進行描述。
圖1為本說明書披露的一個實施例的實施場景示意圖。在該實施場景中,透過計算平臺來執行業務請求事件的風險審核。用戶可以向計算平臺發出業務請求事件,例如申請貸款、申請保險理賠等。計算平臺獲取到這樣的業務請求後,要獲取多方面的資訊,以對該事件的風險機率進行全面評估。這多方面的資訊包括,業務請求事件的事件資訊、以及業務請求事件所涉及用戶的用戶個人特徵。此外,計算平臺還將事件所涉及的用戶放入特定人群中,以獲得用戶在人群關係圖譜中的關係特徵。在此基礎上,根據上述事件特徵、用戶個人特徵、以及用戶的關係特徵,綜合全面地評估業務請求事件的風險機率。下面描述上述場景的具體執行過程。
圖2示出根據一個實施例的確定業務請求事件的風險機率的方法流程圖。該方法的執行主體可以是任何具有計算、處理能力的系統、設備、裝置、平臺或伺服器,例如圖1所示的計算平臺,更具體地,例如是需要對業務風險進行分析管控的各種後臺伺服器,比如支付寶伺服器、保險業務伺服器、金融審批伺服器等。如圖2所示,該方法包括以下步驟:步驟21,獲取業務請求事件的事件特徵;步驟22,獲取業務請求事件所涉及的至少一個用戶的用戶個人特徵;步驟23,基於特定人群的人群關係圖譜,確定所述至少一個用戶的關係特徵,其中,所述特定人群包含所述至少一個用戶;步驟24,根據所述事件特徵、所述至少一個用戶的用戶個人特徵、以及所述至少一個用戶的關係特徵,確定所述業務請求事件的風險機率。下面描述以上各個步驟的執行方式。
首先,在步驟21,獲取待評估的業務請求事件的事件特徵。可以理解,待評估的業務請求事件可以是針對各種有可能存在風險的業務進行請求的事件,例如,申請貸款、申請信用服務、申請保險理賠等。相應地,與業務請求事件相關的事件特徵可以包括以下中的一項或多項:請求的業務類型、請求金額、請求的發生時間、業務註冊時間、註冊時間與請求時間的時間差、事件發生地點等。更具體地,在一個具體例子中,上述業務請求事件為申請保險理賠的事件,相應地,事件特徵可以包括:請求的險種、請求理賠金額、申請理賠時間、投保時間、投保時間與理賠時間的時間差、發生地點等。在另一例子中,上述業務請求事件為申請貸款的事件,相應地,事件特徵可以包括:請求金額、申請時間、註冊時間、註冊時間與申請時間的時間差、發生地點等。
此外,在步驟22,還獲取業務請求事件所涉及的相關用戶的用戶個人特徵。在一個實施例中,業務請求事件所涉及的相關用戶即為業務請求人。在另一實施例中,業務請求事件所涉及的相關用戶還包括除請求人之外的其他利益相關人。例如,申請貸款業務的事件,涉及的相關用戶除了包括貸款請求人,還可以包括擔保人等。申請保險理賠的事件,涉及的相關用戶除了包括理賠請求人,還可以包括保險受益人等。因此,業務請求事件所涉及的相關用戶可以是多個用戶。對於所涉及的各個相關用戶,在步驟22,獲取這些用戶的用戶個人特徵。
在一個實施例中,用戶個人特徵包括用戶基本屬性特徵,例如:性別、年齡、註冊時長、聯繫方式等等基本資訊。
在一個實施例中,用戶個人特徵包括用戶行為特徵。更具體的,用戶行為特徵可以包括與用戶的歷史業務操作相關的行為資訊,例如,交易次數、平均交易金額、申請理賠次數、理賠獲批次數、平均理賠金額等等。
在一個實施例中,用戶個人特徵還包括用戶位置特徵,例如各項歷史業務操作發生的位置、位置改變的範圍、等等。
在更多實施例中,用戶個人特徵還可以包含更多方面的用戶特徵。可以理解,用戶個人特徵是僅依賴於某個用戶個體的一些特徵,刻畫該用戶自身的屬性特點、操作特點等。根據本說明書的實施例,除了獲取用戶個體的個人特徵之外,還將用戶放入一定的人群中,進而發掘出用戶在人群關係網絡中的關係特徵,以便基於該關係特徵進行更全面的分析和評估。
於是,在步驟23,對於步驟22中提及的各個相關用戶,基於特定人群的人群關係圖譜,確定各個用戶的關係特徵,其中,所述特定人群包含上述相關用戶。圖3示出根據一個實施例的確定相關用戶的關係特徵的步驟流程,即步驟23的子步驟。如圖3所示,為了確定各個相關用戶的關係特徵,在步驟31,獲取包含相關用戶的特定人群。
在一個實施例中,預先確定一個足夠大的用戶集合,使得該用戶集合包含待評估的業務請求事件的相關用戶,於是可以將該用戶集合作為特定人群。例如,在業務請求事件為申請保險理賠的情況下,可以將所有投保人員的集合作為上述特定人群。
在一個實施例中,根據用戶的某些特徵,將全量用戶的集合劃分為多個用戶子集。在步驟31,判斷業務請求事件所涉及的相關用戶所屬於的用戶子集,將該用戶子集作為上述特定人群。
在一個實施例中,預先選擇具有一定相似性或關聯性的部分用戶構成一個用戶集合。例如,在業務請求事件為申請保險理賠的情況下,可以預先選擇所有曾經申請理賠的用戶構成一個用戶集合。然後在步驟31,判斷目前事件的相關用戶是否在上述用戶集合中,如果不在,則將其添加到該用戶集合中,將添加之後的用戶集合作為所述特定人群。
還可以透過其他方式來獲取上述特定人群,只要使得該特定人群包含有待分析的相關用戶。
接著,在步驟32,獲取上述特定人群的人群關係圖譜。
在一個實施例中,該步驟包括,針對上述特定人群,重新建構人群關係圖譜。
在另一實施例中,上述特定人群選自預定的用戶集合,並且系統已經預先為該用戶集合建構了人群關係圖譜。例如,如前所述的例子中,特定人群可以選自全量用戶,或者基於全量用戶劃分的某個用戶子集,而系統可能預先為全量用戶建立了人群關係圖譜,或者針對各個用戶子集建立了人群關係圖譜。此時,在步驟32中,可以直接獲取預先建構的人群關係圖譜,或者從預先建構的、針對更大範圍用戶的人群關係圖譜中,提取出與上述特定人群相關的部分,作為針對該特定人群的人群關係圖譜。
在另一實施例中,上述特定人群是透過將相關用戶添加到預先選擇的用戶集合中而形成。如果系統已經針對該預先選擇的用戶集合建構了人群關係圖譜,那麼步驟32可以包括,首先獲取針對該預先選擇的用戶集合建構的關係圖譜;獲取上述相關用戶與該預先選擇的用戶集合中的用戶的關聯關係;然後,將上述關聯關係添加到上述關係圖譜中,作為所述特定人群的人群關係圖譜。
不管是預先建構,或者是現場重新建構,人群關係圖譜的建構可以基於多種關係。
在一個實施例中,人群關係圖譜基於人群的交易關係而建立。例如,兩個用戶之間達成商品購買交易,則在這兩個用戶之間建立交易關聯。可以透過獲取並分析大量用戶的交易記錄而確定用戶之間的交易關係,進而建立人群關係圖譜。
在一個實施例中,人群關係圖譜基於人群的設備關係而建立。例如,當兩個或多個用戶帳戶利用同一台終端設備進行登錄時,可以確定這兩個或多個用戶帳戶之間存在設備關聯。存在設備關聯的兩個或多個用戶帳戶,有可能是同一個實體用戶註冊的多個帳戶,也可以是存在緊密關聯(例如家人、同事等)的多個用戶所對應的帳戶。設備關係可以透過獲取用戶登錄其帳戶時所對應的實體終端資訊而確定。
在一個實施例中,人群關係圖譜基於資金關係而建立。例如,當兩個用戶之間存在轉帳、收款等資金轉移操作時,則在這兩個用戶之間建立資金關聯。可以透過獲取並分析用戶利用電子錢包進行資金操作的記錄而確定用戶之間的資金關係,進而基於資金關係來建立人群關係圖譜。
在一個實施例中,人群關係圖譜基於社交關係而建立。如今人們越來越多地使用社交應用來進行互動,例如,兩個用戶可以透過社交應用來進行聊天、發紅包、文件傳送等互動,那麼可以在這兩個用戶之間建立社交關聯。可以基於社交應用捕獲的大量社交互動來確定人群之間的社交關係,進而建立人群關係圖譜。
儘管以上給出了若干例子,但是可以理解,還可以基於更多種人群關聯關係來建立人群關係圖譜。並且,人群關係圖譜可以同時基於若干種人群關聯關係而建立。
在一個實施例中,人群關係圖譜可以形成為節點網路的形式。在該形式下,人群關係圖譜包括多個節點,每個節點對應一個用戶,存在關聯關係的節點之間會彼此連接。在一個實施例中,節點之間的連接可以具有多種屬性,例如連接類型、連接強度等,其中,連接類型又包括,例如資金連接(基於資金關係的連接)、社交連接(基於社互動動的連接等),連接強度又可以包括,例如強連接、弱連接等。
圖4示出根據一個實施例的人群關係圖譜的例子。如圖4所示,在該例子中,人群關係圖譜中包括多個節點,每個節點對應一個用戶。節點之間的連接表示用戶之間具有關聯關係。假定圖4的人群關係圖譜是基於人群的資金關係和社交關係而建立。相應地,節點之間的連接可以是資金連接或社交連接。在圖4的例子中,以不同的線型示出不同的連接類型,即以虛線示出節點之間的社交連接,以實線示出節點之間的資金連接。並且,以連接線的粗細示出連接的強度。例如,粗線示出強連接,細線示出弱連接。更具體地,粗實線可以示出較強的資金連接(例如資金互動超過一金額閾值,例如1萬元),細實線示出較弱的資金連接(例如資金互動不超過上述金額閾值);粗虛線可以示出較強的社交連接(例如,互動頻率超過一頻率閾值,例如每天10次),細虛線示出較弱的社交連接(例如,互動頻率不超過上述頻率閾值)。
可以理解,在更多實施例中,人群關係圖譜還可以表徵為其他形式,例如表格、圖形等形式。
回到圖3,在獲取針對特定人群而建構的人群關係圖譜的基礎上,在步驟33,基於該人群關係圖譜,確定目前事件所涉及的相關用戶的關係特徵。
如前所述,在人群關係圖譜中,存在關聯關係的用戶會彼此連接。相應地,在一個實施例中,對於某個用戶,可以從人群關係圖譜中,提取出與該用戶有關的連接的特徵,例如連接的數目、連接的類型、連接的強度、所連接到的其他用戶、等等,將這樣的連接特徵作為該用戶的關係特徵。
在另一實施例中,採用機器學習輔助方法,對人群關係圖譜進行分析和表徵。實際上,人群關係圖譜可以理解為一種網路,其中,包含了一定數目的節點(對應於用戶),以及節點之間的連接關係(用戶之間的關聯關係)。相較於文本和圖像,網路資訊更難被結構化為標準的資料,因此,難以應用於機器學習。近來,提出了幾種網路表示(network representation)學習演算法來表徵並分析網路結構。這些演算法的目標,是用低維度、稠密、實值的向量來表示網路中具有語義關係的節點,從而利於計算儲存,不用再手動提取特徵,並且可以將異質資訊投影到同一個低維度空間中,方便進行下游計算。
根據網路表示學習演算法,將網路嵌入到一個幾何空間中,將每個節點的空間座標視作該節點的特徵,從而放到神經網路中進行學習和訓練。相應地,對於人群關係圖譜,可以將該圖譜映射到幾何空間中,計算各個用戶節點的空間座標,作為其關係特徵向量。對於網路節點的空間座標的計算,可以採用多種演算法。
在一個實施例中,採用DeepWalk演算法來確定人群關係圖譜所對應的網路中各個節點的向量表示。根據DeepWalk演算法,在網路上釋放大量的隨機遊走粒子,這些粒子在給定的時間內就會走出一個節點構成的序列。如果將節點視作單詞,由此產生的序列就構成了句子,於是可以得到一種節點由序列構成的“語言”。然後,應用詞向量轉換(Word2Vec)演算法,就可以計算出每個節點“單詞”的向量表示。
在一個實施例中,採用節點-向量(node2vec)結構特徵提取演算法,將人群關係圖譜轉換為向量因數的形式。Node2vec節點-向量結構特徵提取演算法,改進了DeepWalk中隨機遊走的策略,在深度優先的搜尋(Depth-First Search,DFS)和廣度優先的搜尋(Breadth-First Search,BFS)之間達到一個平衡,同時考慮到局部和宏觀的資訊,從而最佳化向量產生方式。如此,可以將人群關係圖譜中的用戶節點轉換成向量表示的形式,從而可以確定目前事件所涉及的用戶在該人群關係圖譜中的向量表達,作為其關係特徵向量。
在其他實施例中,還可以採用更多種方式,從人群關係圖譜中獲取目前事件涉及用戶的關係特徵向量。根據人群關係圖譜的不同建構方式、不同表示方式,獲取的關係特徵向量的維度、元素也會有所不同。不過可以理解的是,關係特徵向量透過表徵用戶對應的節點在人群關係圖譜中的位置,以及與其他節點的連接關係,從而全面地表徵用戶在人群關係網中與其他用戶的關聯關係。
基於步驟21中獲取的事件特徵,步驟22獲取的用戶個人特徵,以及如上所述在步驟23獲取的用戶關係特徵,在步驟24,綜合以上各種特徵,確定業務請求事件的風險機率。
在一個具體實施例中,基於事件特徵,確定業務請求事件的第一評估分數;基於用戶個人特徵,確定業務請求事件的第二評估分數;基於用戶關係特徵,確定業務請求事件的第三評估分數;最後對第一、第二、第三評估分數進行加權求和,確定業務請求事件的風險機率分數。其中,確定第一、第二和第三評估分數的方式,可以透過預先訓練的模型演算法和模型參數來進行。
在另一個具體實施例中,用戶個人特徵和用戶關係特徵均表示為向量的形式。在步驟24,首先將用戶個人特徵的特徵向量和用戶關係特徵的特徵向量進行拼接,得到用戶綜合特徵。接著,可以基於用戶綜合特徵,確定業務請求事件的第一評估分數,基於業務請求事件的事件特徵,確定該事件的第二評估分數,最後基於第一和第二評估分數,確定業務請求事件的風險機率分數。其中,確定第一和第二評估分數的方式,可以透過預先訓練的模型演算法和模型參數來進行。
在另一實施例中,預先訓練一個評估模型,該評估模型直接基於事件特徵、用戶個人特徵以及用戶關係特徵,對業務請求事件的風險機率進行評估。可以理解,該評估模型基於已經標定的訓練資料集來進行訓練。實踐中,對於已知其風險機率的業務請求事件,例如人工審核確定為理賠騙保的負樣本事件,或者人工審核確定為正常理賠的正樣本事件,獲取事件的事件特徵,事件所涉及用戶的用戶個人特徵。此外,也將涉及用戶放入人群中,獲取用戶在人群關係圖譜中的關係特徵,特別是關係特徵向量。將以上資料加入訓練資料集。如此,可以採用一定的模型演算法和模型參數,基於訓練資料集中的事件特徵、用戶個人特徵和用戶關係特徵來確定事件的風險機率,得到某個事件的風險機率。然後,基於得到的風險機率與該事件實際的已知風險機率的比對(即損失函數),不斷最佳化模型演算法和模型參數,從而訓練得到上述評估模型。
上述評估模型可以採用多種具體的模型演算法。在一個實施例中,採用梯度提升決策樹GBDT(Gradient Boosting Decision Tree)方法訓練得到上述評估模型。
如本領域技術人員所知,梯度提升決策樹GBDT方法是一種有監督的整合學習的方法。在整合學習方法中,採用多個學習器分別對訓練樣本集進行學習,最終的模型是對上述多個學習器的綜合。整合學習最主要的兩種方法為Bagging和Boosting,其中,根據Boosting演算法,學習器之間存在先後順序,且具有不同的權重,同時也為每一個樣本分配權重。初始地,每一個樣本的權重相等,在利用某個學習器對訓練樣本進行學習之後,增大錯誤樣本的權重,減小正確樣本的權重,再利用後續的學習器對其進行學習。這樣,最終的預測結果為多個學習器結果的合併。在此基礎上,可以採用梯度傳遞的方式基於預測結果來最佳化模型函數,這樣的方法稱為梯度提升Gradient Boost方法。
在梯度提升Gradient Boost架構下,每個基學習器採用分類迴歸樹演算法,就構成了梯度提升決策樹GBDT模型。分類迴歸樹演算法是一種基於二元樹的機器學習演算法。在梯度提升決策樹GBDT演算法中,由於整合了多個這樣的分類迴歸樹作為學習器,使得模型的準確性和覆蓋率更加有效。
更具體地,根據GBDT演算法,可以針對各項特徵,包括事件特徵、用戶個人特徵和用戶關係特徵,訓練多個採用分類迴歸樹的學習器,從而形成上述評估模型。
在其他實施例中,上述評估模型也可以採用其他演算法訓練來實現,例如前述的整合學習中的bagging演算法,以及採用其他演算法的學習器等等。
在評估模型訓練完成之後,在步驟24,可以直接採用評估模型,確定目前的業務請求事件的風險機率。
如此,綜合一個業務請求事件的事件特徵、用戶個人特徵和用戶關係特徵,可以全面地對該業務請求事件的風險機率進行評估,從而更加高效、準確地把控業務執行風險。
根據另一態樣的實施例,還提供一種確定業務請求事件的風險機率的裝置。圖5示出根據一個實施例的風險確定裝置的示意性方塊圖。如圖5所示,該風險確定裝置500包括:事件特徵獲取單元510,配置成獲取業務請求事件的事件特徵;個人特徵獲取單元520,配置成獲取所述業務請求事件所涉及的至少一個用戶的用戶個人特徵;關係特徵獲取單元530,配置成基於特定人群的人群關係圖譜,確定所述至少一個用戶的關係特徵,其中,所述特定人群包含所述至少一個用戶;風險確定單元540,配置成根據所述事件特徵、所述至少一個用戶的用戶個人特徵、以及所述至少一個用戶的關係特徵,確定所述業務請求事件的風險機率。
在一個實施例中,上述事件特徵獲取單元510獲取的事件特徵包括以下中的至少一項:請求業務金額、業務註冊時間、事件發生時間、業務註冊時間與事件發生時間的時間差、事件發生地點。
根據一個實施例,業務請求事件所涉及的至少一個用戶包括業務請求事件的請求人、以及業務請求的受益人。
在一個實施例中,上述個人特徵獲取單元520所獲取的用戶個人特徵包括以下中的一項或多項,用戶基本屬性特徵、用戶行為特徵、用戶位置特徵。
根據一種實施方式,上述關係特徵獲取單元530包括:人群獲取模組531,配置成獲取包含所述至少一個用戶的特定人群;圖譜獲取模組532,配置程獲取所述特定人群的人群關係圖譜;特徵獲取模組533,配置成基於所述人群關係圖譜,確定所述至少一個用戶的關係特徵。
在一個實施例中,所述人群獲取模組531配置成,在預先劃分的多個用戶子集中,確定所述至少一個用戶所屬於的用戶子集,將該用戶子集作為上述特定人群。
在另一實施例中,所述人群獲取模組531配置成,將所述至少一個用戶添加到預先選擇的用戶集合中,將所述用戶集合作為所述特定人群。
進一步地,在一個實施例中,圖譜獲取模組532配置成:獲取針對所述預先選擇的用戶集合建構的第一關係圖譜;獲取所述至少一個用戶與所述預先選擇的用戶集合中的用戶的關聯關係;將所述關聯關係添加到所述第一關係圖譜,作為所述特定人群的人群關係圖譜。
根據一種實施方式,特定人群的人群關係圖譜基於以下一種或多種關係而建立:交易關係、設備關係、資金關係、社交關係。
在一個實施例中,上述關係特徵獲取單元530配置成,採用節點-向量網路結構特徵提取演算法,將所述關係圖譜轉換為向量因數,基於所述向量因數而確定所述至少一個用戶的關係特徵向量。
在一個實施例中,風險確定單元540配置成,採用預先訓練的評估模型來確定所述業務請求事件的風險機率,所述評估模型基於梯度提升決策樹演算法而訓練。
透過上述裝置,綜合一個業務請求事件的事件特徵、用戶個人特徵和用戶關係特徵,全面地對該業務請求事件的風險機率進行評估,從而更加高效、準確地把控業務執行風險
根據另一態樣的實施例,還提供一種電腦可讀儲存媒體,其上儲存有電腦程式,當所述電腦程式在電腦中執行時,令電腦執行結合圖2所描述的方法。
根據再一態樣的實施例,還提供一種計算設備,包括記憶體和處理器,所述記憶體中儲存有可執行碼,所述處理器執行所述可執行碼時,實現結合圖2所述的方法。
本領域技術人員應該可以意識到,在上述一個或多個示例中,本發明所描述的功能可以用硬體、軟體、韌體或它們的任意組合來實現。當使用軟體來實現時,可以將這些功能儲存在電腦可讀媒體中或者作為電腦可讀媒體上的一個或多個指令或碼來進行傳輸。
以上所述的具體實施方式,對本發明的目的、技術方案和有益效果進行了進一步詳細說明,所應理解的是,以上所述僅為本發明的具體實施方式而已,並不用來限定本發明的保護範圍,凡在本發明的技術方案的基礎之上,所做的任何修改、等同替換、改進等,均應包括在本發明的保護範圍之內。
500‧‧‧風險確定裝置
510‧‧‧事件特徵獲取單元
520‧‧‧個人特徵獲取單元
530‧‧‧關係特徵獲取單元
531‧‧‧人群獲取模組
532‧‧‧圖譜獲取模組
533‧‧‧特徵獲取模組
540‧‧‧風險確定單元
為了更清楚地說明本發明實施例的技術方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對於本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖而獲得其它的附圖。
圖1示出本說明書披露的一個實施例的實施場景示意圖;
圖2示出根據一個實施例的確定業務請求事件的風險機率的方法流程圖;
圖3示出根據一個實施例的確定相關用戶的關係特徵的步驟流程;
圖4示出根據一個實施例的人群關係圖譜的例子;
圖5示出根據一個實施例的風險確定裝置的示意性方塊圖。

Claims (24)

  1. 一種確定業務請求事件的風險機率的方法,該方法包括: 獲取業務請求事件的事件特徵; 獲取該業務請求事件所涉及的至少一個用戶的用戶個人特徵; 基於特定人群的人群關係圖譜,確定該至少一個用戶的關係特徵,其中,該特定人群包含該至少一個用戶;以及 根據該事件特徵、該至少一個用戶的用戶個人特徵、以及該至少一個用戶的關係特徵,確定該業務請求事件的風險機率。
  2. 根據請求項1所述的方法,其中,該事件特徵包括以下中的至少一項:請求業務金額、業務註冊時間、事件發生時間、業務註冊時間與事件發生時間的時間差、事件發生地點。
  3. 根據請求項1所述的方法,其中,該至少一個用戶包括該業務請求事件的請求人、以及業務請求的受益人。
  4. 根據請求項1所述的方法,其中,該用戶個人特徵包括以下中的一項或多項,用戶基本屬性特徵、用戶行為特徵、用戶位置特徵。
  5. 根據請求項1所述的方法,其中,基於特定人群的人群關係圖譜,確定該至少一個用戶的關係特徵向量,包括: 獲取包含該至少一個用戶的該特定人群; 獲取該特定人群的人群關係圖譜;以及 基於該人群關係圖譜,確定該至少一個用戶的關係特徵。
  6. 根據請求項5所述的方法,其中,獲取包含該至少一個用戶的該特定人群包括,在預先劃分的多個用戶子集中,確定該至少一個用戶所屬於的用戶子集,將該用戶子集作為上述特定人群。
  7. 根據請求項5所述的方法,其中,獲取包含該至少一個用戶的該特定人群包括,將該至少一個用戶添加到預先選擇的用戶集合中,將該用戶集合作為該特定人群。
  8. 根據請求項7所述的方法,其中,獲取該特定人群的人群關係圖譜包括: 獲取針對該預先選擇的用戶集合建構的第一關係圖譜; 獲取該至少一個用戶與該預先選擇的用戶集合中的用戶的關聯關係;以及 將該關聯關係添加到該第一關係圖譜,作為該特定人群的人群關係圖譜。
  9. 根據請求項1所述的方法,其中,該特定人群的人群關係圖譜基於以下一種或多種關係而建立:交易關係、設備關係、資金關係、社交關係。
  10. 根據請求項1所述的方法,其中,確定該至少一個用戶的關係特徵包括,採用節點-向量網路結構特徵提取演算法,將該關係圖譜轉換為向量因數,基於該向量因數確定該至少一個用戶的關係特徵向量。
  11. 根據請求項1所述的方法,其中,確定該業務請求事件的風險機率包括,採用預先訓練的評估模型來確定該業務請求事件的風險機率,該評估模型基於梯度提升決策樹演算法而訓練。
  12. 一種確定業務請求事件的風險機率的裝置,該裝置包括: 事件特徵獲取單元,配置成獲取業務請求事件的事件特徵; 個人特徵獲取單元,配置成獲取該業務請求事件所涉及的至少一個用戶的用戶個人特徵; 關係特徵獲取單元,配置成基於特定人群的人群關係圖譜,確定該至少一個用戶的關係特徵,其中,該特定人群包含該至少一個用戶;以及 風險確定單元,配置成根據該事件特徵、該至少一個用戶的用戶個人特徵、以及該至少一個用戶的關係特徵,確定該業務請求事件的風險機率。
  13. 根據請求項12所述的裝置,其中,該事件特徵包括以下中的至少一項:請求業務金額、業務註冊時間、事件發生時間、業務註冊時間與事件發生時間的時間差、事件發生地點。
  14. 根據請求項12所述的裝置,其中,該至少一個用戶包括該業務請求事件的請求人、以及業務請求的受益人。
  15. 根據請求項12所述的裝置,其中,該用戶個人特徵包括以下中的一項或多項,用戶基本屬性特徵、用戶行為特徵、用戶位置特徵。
  16. 根據請求項12所述的裝置,其中,該關係特徵獲取單元包括: 人群獲取模組,配置成獲取包含該至少一個用戶的該特定人群; 圖譜獲取模組,配置成獲取該特定人群的人群關係圖譜;以及 特徵獲取模組,配置成基於該人群關係圖譜,確定該至少一個用戶的關係特徵。
  17. 根據請求項16所述的裝置,其中,該人群獲取模組配置成,在預先劃分的多個用戶子集中,確定該至少一個用戶所屬於的用戶子集,將該用戶子集作為上述特定人群。
  18. 根據請求項16所述的裝置,其中,該人群獲取模組配置成,將該至少一個用戶添加到預先選擇的用戶集合中,將該用戶集合作為該特定人群。
  19. 根據請求項18所述的裝置,其中,該圖譜獲取模組配置成: 獲取針對該預先選擇的用戶集合建構的第一關係圖譜; 獲取該至少一個用戶與該預先選擇的用戶集合中的用戶的關聯關係;以及 將該關聯關係添加到該第一關係圖譜,作為該特定人群的人群關係圖譜。
  20. 根據請求項12所述的裝置,其中,該特定人群的人群關係圖譜基於以下一種或多種關係而建立:交易關係、設備關係、資金關係、社交關係。
  21. 根據請求項12所述的裝置,其中,該關係特徵獲取單元配置成,採用節點-向量網路結構特徵提取演算法,將該關係圖譜轉換為向量因數,基於該向量因數確定該至少一個用戶的關係特徵向量。
  22. 根據請求項12所述的裝置,其中,該風險確定單元配置成,採用預先訓練的評估模型來確定該業務請求事件的風險機率,該評估模型基於梯度提升決策樹演算法而訓練。
  23. 一種電腦可讀儲存媒體,其上儲存有電腦程式,當該電腦程式在電腦中執行時,令電腦執行根據請求項1至11中任一項所述的方法。
  24. 一種計算設備,包括記憶體和處理器,其特徵在於,該記憶體中儲存有可執行碼,該處理器執行該可執行碼時,實現根據請求項1至11中任一項所述的方法。
TW108104899A 2018-04-12 2019-02-14 確定業務請求事件的風險機率的方法及裝置 TW201944305A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
??201810327337.1 2018-04-12
CN201810327337.1A CN108399509A (zh) 2018-04-12 2018-04-12 确定业务请求事件的风险概率的方法及装置

Publications (1)

Publication Number Publication Date
TW201944305A true TW201944305A (zh) 2019-11-16

Family

ID=63100004

Family Applications (1)

Application Number Title Priority Date Filing Date
TW108104899A TW201944305A (zh) 2018-04-12 2019-02-14 確定業務請求事件的風險機率的方法及裝置

Country Status (3)

Country Link
CN (1) CN108399509A (zh)
TW (1) TW201944305A (zh)
WO (1) WO2019196546A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113837856A (zh) * 2020-06-08 2021-12-24 财团法人资讯工业策进会 风险检测系统与风险检测方法

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108399509A (zh) * 2018-04-12 2018-08-14 阿里巴巴集团控股有限公司 确定业务请求事件的风险概率的方法及装置
CN109377347B (zh) * 2018-09-27 2020-07-24 深圳先进技术研究院 基于特征选择的网络信用预警方法、系统及电子设备
CN109636564A (zh) * 2018-10-16 2019-04-16 平安科技(深圳)有限公司 用于风控的信息核实方法、装置、设备及存储介质
CN109636083A (zh) * 2018-10-16 2019-04-16 深圳壹账通智能科技有限公司 黑名单分析方法、装置、设备及计算机可读存储介质
CN109636565A (zh) * 2018-10-16 2019-04-16 深圳壹账通智能科技有限公司 风险数据的处理方法、装置、设备及计算机可读存储介质
CN109559192A (zh) * 2018-10-25 2019-04-02 深圳壹账通智能科技有限公司 基于关联图谱的风险检测方法、装置、设备及存储介质
CN110033151B (zh) * 2018-11-09 2024-01-19 创新先进技术有限公司 关系风险评价方法、装置、电子设备及计算机存储介质
CN109657917B (zh) * 2018-11-19 2022-04-29 平安科技(深圳)有限公司 评估对象的风险预警方法、装置、计算机设备和存储介质
CN109598513B (zh) * 2018-11-22 2023-06-20 创新先进技术有限公司 一种风险识别方法和装置
CN110046784A (zh) * 2018-12-14 2019-07-23 阿里巴巴集团控股有限公司 一种用户准入的风险确定方法及装置
CN109685647B (zh) * 2018-12-27 2021-08-10 阳光财产保险股份有限公司 信贷欺诈检测方法及其模型的训练方法、装置和服务器
CN109801077A (zh) * 2019-01-21 2019-05-24 北京邮电大学 一种套现用户检测方法、装置及设备
CN109919782A (zh) * 2019-01-24 2019-06-21 平安科技(深圳)有限公司 关联案件识别方法、电子装置及计算机可读存储介质
CN110009511A (zh) * 2019-01-29 2019-07-12 阿里巴巴集团控股有限公司 套利行为识别方法、套利行为识别模型训练方法及系统
CN110008349B (zh) * 2019-02-01 2020-11-10 创新先进技术有限公司 计算机执行的事件风险评估的方法及装置
CN110084468B (zh) * 2019-03-14 2020-09-01 阿里巴巴集团控股有限公司 一种风险识别方法及装置
CN110097450A (zh) * 2019-03-26 2019-08-06 中国人民财产保险股份有限公司 车贷风险评估方法、装置、设备和存储介质
CN110111195A (zh) * 2019-04-04 2019-08-09 平安科技(深圳)有限公司 基于数据分析的账款催收方法及装置、电子设备
CN110599329A (zh) * 2019-09-09 2019-12-20 腾讯科技(深圳)有限公司 信用评估方法、信用评估装置及电子设备
CN110544100A (zh) * 2019-09-10 2019-12-06 北京三快在线科技有限公司 基于机器学习的业务识别方法、装置及介质
CN111198967B (zh) * 2019-12-20 2024-03-08 北京淇瑀信息科技有限公司 基于关系图谱的用户分组方法、装置及电子设备
CN111291900A (zh) * 2020-03-05 2020-06-16 支付宝(杭州)信息技术有限公司 训练风险识别模型的方法及装置
CN111798092B (zh) * 2020-05-27 2024-03-12 深圳奇迹智慧网络有限公司 海关查验监控方法、装置、计算机设备和存储介质
CN114912717B (zh) * 2022-07-13 2022-10-25 成都秦川物联网科技股份有限公司 基于物联网的智慧城市保障住房申请风险评估方法和系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106469376B (zh) * 2015-08-20 2021-12-03 创新先进技术有限公司 一种风险控制方法和设备
CN107679686B (zh) * 2017-08-28 2024-03-29 创新先进技术有限公司 一种业务执行方法及装置
CN107741953B (zh) * 2017-09-14 2020-01-21 平安科技(深圳)有限公司 社交平台用户的现实关系匹配方法、装置及可读存储介质
CN107818513A (zh) * 2017-11-24 2018-03-20 泰康保险集团股份有限公司 风险评估方法及装置、存储介质、电子设备
CN108399509A (zh) * 2018-04-12 2018-08-14 阿里巴巴集团控股有限公司 确定业务请求事件的风险概率的方法及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113837856A (zh) * 2020-06-08 2021-12-24 财团法人资讯工业策进会 风险检测系统与风险检测方法

Also Published As

Publication number Publication date
CN108399509A (zh) 2018-08-14
WO2019196546A1 (zh) 2019-10-17

Similar Documents

Publication Publication Date Title
TW201944305A (zh) 確定業務請求事件的風險機率的方法及裝置
TWI712981B (zh) 風險辨識模型訓練方法、裝置及伺服器
TWI788529B (zh) 基於lstm模型的信用風險預測方法及裝置
CN109410036A (zh) 一种欺诈检测模型训练方法和装置及欺诈检测方法和装置
CN109345260A (zh) 一种欺诈检测模型训练方法和装置及欺诈检测方法和装置
WO2021155053A1 (en) Systems and methods for identifying synthetic identities
WO2023000794A1 (zh) 保护数据隐私的业务预测模型训练的方法及装置
CN108961032A (zh) 借贷处理方法、装置以及服务器
WO2021159735A1 (zh) 信贷风险评估方法、装置、计算机设备及存储介质
US11804302B2 (en) Supervised machine learning-based modeling of sensitivities to potential disruptions
CN113989019A (zh) 识别风险的方法、装置、设备及存储介质
CN113011884B (zh) 账户特征的提取方法、装置、设备及可读存储介质
CN111553701A (zh) 一种基于会话的风险交易确定方法和装置
US20230237583A1 (en) System and method for implementing a trust discretionary distribution tool
CN112016850A (zh) 业务评估方法以及装置
Zhou et al. Personal credit default prediction model based on convolution neural network
Li et al. A time attention based fraud transaction detection framework
CN113887214A (zh) 基于人工智能的意愿推测方法、及其相关设备
CN110288488A (zh) 医疗险欺诈预测方法、装置、设备和可读存储介质
CN117437020A (zh) 商户风险判定方法、装置、电子设备和介质
US20240161117A1 (en) Trigger-Based Electronic Fund Transfers
US20230088840A1 (en) Dynamic assessment of cryptocurrency transactions and technology adaptation metrics
CN110362981B (zh) 基于可信设备指纹判断异常行为的方法及系统
CN113886539A (zh) 话术推荐方法、装置、客服设备及存储介质
CN113256404A (zh) 数据处理方法及装置