TW201944306A - 確定高風險用戶的方法及裝置 - Google Patents

確定高風險用戶的方法及裝置

Info

Publication number
TW201944306A
TW201944306A TW108104910A TW108104910A TW201944306A TW 201944306 A TW201944306 A TW 201944306A TW 108104910 A TW108104910 A TW 108104910A TW 108104910 A TW108104910 A TW 108104910A TW 201944306 A TW201944306 A TW 201944306A
Authority
TW
Taiwan
Prior art keywords
user
risk
event
group
service request
Prior art date
Application number
TW108104910A
Other languages
English (en)
Other versions
TWI804575B (zh
Inventor
王修坤
Original Assignee
香港商阿里巴巴集團服務有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 香港商阿里巴巴集團服務有限公司 filed Critical 香港商阿里巴巴集團服務有限公司
Publication of TW201944306A publication Critical patent/TW201944306A/zh
Application granted granted Critical
Publication of TWI804575B publication Critical patent/TWI804575B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Educational Administration (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Storage Device Security (AREA)

Abstract

本說明書實施例提供一種確定高風險用戶的方法和裝置,根據該方法,首先基於異常規則集合,確定出高風險的業務請求事件,以及對應的具有高風險的第一用戶,然後基於人群關係圖譜進行風險擴散,將圖譜中與第一用戶存在特定關聯關係的第二用戶也作為高風險用戶,添加到高風險用戶集中。進一步地,可以基於高風險用戶集,更新異常規則集合。如此可以更高效地識別出高風險用戶。

Description

確定高風險用戶的方法及裝置
本說明書一個或多個實施例係有關電腦技術領域,尤其有關透過電腦確定高風險用戶的方法和裝置。
隨著電腦和互聯網技術的發展,越來越多的業務透過計算平臺來實現,例如商品交易、錢款支付、金融借貸、保險理賠等等。然而,在許多業務的執行和處理中,如果不對業務請求人的背景,以及所請求的業務進行審核,就很可能帶來較大風險,例如一些不法分子可能利用電子平臺,實施金融詐騙,借貸套現、保險騙保等等。
在習知技術中,為了防止和降低上述風險,往往透過人工進行風險審核。在有些平臺中,也會設定一些簡單的規則,輔助人工進行判斷。然而,這樣的方式效率很低,難以滿足業務快速發展的需要;並且,識別高風險用戶和高風險事件的準確性有賴於人工審核的業務員的自身經驗,準確度難以得到確保,常常出現遺漏。
因此,希望能有改進的方案,透過高效地識別和確定高風險用戶,降低業務風險。
本說明書一個或多個實施例描述了一種方法和裝置,可以基於人群關係圖譜,將確定的高風險用戶進行擴散,從而更加高效而準確地識別出高風險用戶。
根據第一態樣,提供了一種確定高風險用戶的方法,包括:
獲取待評估的業務請求事件的事件資訊,所述事件資訊包括,所述業務請求事件所涉及的第一用戶的用戶資訊;
至少基於異常規則集合和所述第一用戶的用戶資訊,判斷所述業務請求事件是否為高風險事件;
在確定所述業務請求事件為高風險事件的情況下,基於人群關係圖譜,確定與所述第一用戶存在特定關聯關係的第二用戶,將所述第一用戶和所述第二用戶添加到高風險用戶集;
基於所述高風險用戶集,更新所述異常規則集合。
根據一種可能的設計,上述異常規則集合包括多個用戶特徵,和針對所述多個用戶特徵設定的多個判定規則。
在一種可能的設計中,上述多個用戶特徵包括以下中的一項或多項:用戶基本屬性特徵、用戶行為特徵、用戶關係特徵、用戶位置特徵。
根據一種實施方式,基於異常規則集合判斷業務請求事件是否為高風險事件具體包括:將第一用戶的用戶資訊與所述多個判定規則進行比較;當比較結果符合預定條件的情況下,判斷所述業務請求事件為高風險事件。
在一種可能的設計中,判斷業務請求事件是否為高風險事件還包括:當進一步接收到第一核驗結果的情況下,確定所述業務請求事件為高風險事件,其中,所述第一核驗結果為將所述業務請求事件核驗為高風險事件的人工核驗結果。或者,當進一步接收到第二核驗結果的情況下,確定所述業務請求事件為非高風險事件,其中,所述第二核驗結果為將所述業務請求事件核驗為非高風險事件的人工核驗結果;在這樣的情況下,所述方法還包括,根據所述第二核驗結果,更新所述異常規則集合。
根據一種可能的設計,人群關係圖譜基於以下一種或多種關係而建立:交易關係、設備關係、資金關係、社交關係。
在一個實施例中,基於人群關係圖譜,確定與所述第一用戶存在特定關聯關係的第二用戶具體包括:
從人群關係圖譜中確定出包含所述第一用戶的至少一個群組;
根據各個群組的高風險用戶比例,從所述至少一個群組中確定出高風險群組,其中,各個群組的高風險用戶比例為,該群組與所述高風險用戶集的交集中的用戶數目M與該群組的用戶總數N的比例;
將所述高風險群組中的用戶確定為所述第二用戶。
在一種可能的設計中,所述方法還包括,基於所述人群關係圖譜,確定與所述第二用戶相關聯的第三用戶,將所述第三用戶添加到所述高風險用戶集中。
在一個實施例中,基於高風險用戶集更新異常規則集合具體包括:基於所述高風險用戶集中各個用戶的用戶特徵的統計,更新所述多個用戶特徵,和/或所述多個判定規則。
根據第二態樣,提供一種確定高風險用戶的裝置,包括:
事件獲取單元,配置成獲取待評估的業務請求事件的事件資訊,所述事件資訊包括,所述業務請求事件所涉及的第一用戶的用戶資訊;
事件判斷單元,配置成至少基於異常規則集合和所述第一用戶的用戶資訊,判斷所述業務請求事件是否為高風險事件;
用戶確定單元,配置成在確定所述業務請求事件為高風險事件的情況下,基於人群關係圖譜,確定與所述第一用戶存在特定關聯關係的第二用戶,將所述第一用戶和所述第二用戶添加到高風險用戶集;
第一更新單元,配置成基於所述高風險用戶集,更新所述異常規則集合。
根據第三態樣,提供了一種電腦可讀儲存媒體,其上儲存有電腦程式,當所述電腦程式在電腦中執行時,令電腦執行第一態樣的方法。
根據第四態樣,提供了一種計算設備,包括記憶體和處理器,其特徵在於,所述記憶體中儲存有可執行碼,所述處理器執行所述可執行碼時,實現第一態樣的方法。
透過本說明書實施例提供的方法和裝置,首先基於異常規則集合確定出高風險的業務請求事件和高風險用戶,然後基於人群關係圖譜,對高風險用戶進行擴散,如此,從單一的業務請求事件,可以確定出多個高風險用戶,極大提高識別效率。進一步地,在擴散到更多高風險用戶的情況下,用新識別的高風險用戶,來更新異常規則集合,從而對異常規則集合進行最佳化,使得異常規則集合在後續的判斷中,進一步提高判斷準確度。
下面結合圖式,對本說明書提供的方案進行描述。
圖1為本說明書披露的一個實施例的實施場景示意圖。在該實施場景中,某個用戶向計算平臺請求業務事件,例如申請保險理賠。計算平臺則針對本次事件,首先確定該用戶是否為高風險用戶,如果是的話,基於該用戶的關係網進行風險“擴散”,發掘出其他的高風險用戶。相應地,計算平臺中包含有異常規則引擎和擴散引擎,異常規則引擎根據預先設定的異常規則,對用戶的業務申請事件進行初步判斷。在一些情況下,還可以輔助以人工審核。一旦確定目前業務申請事件為高風險事件,也就將目前用戶確定為高風險用戶。進一步地,利用擴散引擎,基於目前用戶的關係網進行高風險用戶的擴散。這是基於這樣的觀察和統計:許多高風險事件都呈現“團夥”特徵,也就是,需要多人配合,共同完成。如此,在認定某個用戶為高風險用戶的情況下,可以對該用戶的關係網進行進一步分析,從中挖掘出具有“團夥”特徵的群體,從而確定出相關聯的其他高風險用戶。如此,從單一的業務請求事件,可以確定出多個高風險用戶,極大提高識別效率。進一步地,在擴散到更多高風險用戶的情況下,可以將新識別的高風險用戶,回饋到異常規則引擎,從而對異常規則引擎進行最佳化,使得異常規則引擎在後續的判斷中,進一步提高判斷準確度。下面描述上述場景的具體執行過程。
圖2示出根據一個實施例的確定高風險用戶的方法流程圖。該方法的執行主體可以是任何具有計算、處理能力的系統、設備、裝置、平臺或伺服器,例如圖1所示的計算平臺,更具體地,例如是需要對業務風險進行分析管控的各種後台伺服器,比如支付寶伺服器、保險業務伺服器、金融審批伺服器等。如圖2所示,該方法包括以下步驟:步驟21,獲取業務請求事件的相關資訊,所述相關資訊包括所述業務請求事件所涉及的第一用戶的用戶資訊;步驟22,至少基於異常規則集合和所述用戶資訊,判斷所述業務請求事件是否為高風險事件;步驟23,在確定所述業務請求事件為高風險事件的情況下,基於人群關係圖譜,確定與所述第一用戶存在特定關聯關係的第二用戶,將所述第一用戶和所述第二用戶添加到高風險用戶集;步驟24,基於所述高風險用戶集,更新所述異常規則集合。下面描述以上各個步驟的執行方式。
首先,在步驟21,獲取待評估的業務請求事件的相關資訊。可以理解,待評估的業務請求事件可以是針對各種有可能存在風險的業務進行請求的事件,例如,申請貸款、申請保險理賠等。為了清楚和區分起見,下文將該業務請求事件涉及的用戶稱為第一用戶。一般地,第一用戶可以是上述業務請求事件的請求人。
根據一個實施例,在步驟21中可以獲取與業務請求事件相關的各種資訊,包括與事件本身相關的事件資訊,以及與該業務請求事件所涉及的用戶(即第一用戶)相關的用戶資訊。上述事件資訊例如包括,請求的業務類型、請求金額、請求的發生時間、地點等,而用戶資訊可以進一步包括多方面的特徵。
在一個實施例中,用戶資訊包括用戶基本屬性特徵,例如:性別、年齡、註冊時長、聯繫方式等等基本資訊。
在一個實施例中,用戶資訊包括用戶行為特徵。更具體地,用戶行為特徵可以包括與用戶的業務操作相關的行為資訊,例如,交易次數、平均交易金額、申請理賠次數、理賠獲批次數、平均理賠金額等等。在一個實施例中,用戶行為特徵可以是動態改變的特徵,並且基於上述事件資訊而更新。例如,在第一用戶發出申請理賠的本次業務請求事件時,需要更新其用戶行為特徵,例如更新其中的申請理賠次數等參數。
在一個實施例中,用戶資訊還包括用戶關係特徵,例如,資金往來超過一定額度的連絡人的數目、交易頻率超過一定數目的連絡人名單等等。
在一個實施例中,用戶資訊還包括用戶位置特徵,例如各項交易發生的位置、位置改變的範圍、等等。
在更多實施例中,用戶資訊還可以包含更多方面的用戶特徵。
可以理解,相應地,在步驟21,可以獲取上述業務請求事件所涉及的第一用戶的用戶資訊,該用戶資訊包括上述各方面的用戶特徵中的一部分或全部。
接著,在步驟22,確定所述業務請求事件是否為高風險事件。確定的過程至少包括步驟221,在其中基於異常規則集合和上述第一用戶的用戶資訊,判斷上述業務請求事件是否為高風險事件。
異常規則集合是預先設定的規則集合,其中,包含若干條規則,這些規則用以對業務申請事件和/或涉及的用戶是否存在異常風險進行判斷。初始地,異常規則集合可以由業務人員根據實踐經驗而設定;隨著實施例的方法的推進,會不斷進行更新和調整。
一般地,異常規則集合包括多個用戶特徵和針對多個用戶特徵設定的多個判定規則。其中,與前述類似的,多個用戶特徵包括以下中的一項或多項:用戶基本屬性特徵、用戶行為特徵、用戶關係特徵、用戶位置特徵等。圖3示出異常規則集合的一個具體例子。如圖3所示,異常規則集合至少包括以下用戶特徵:年齡、註冊時長(這兩項特徵屬於用戶基本屬性特徵),平均理賠金額、申請理賠次數(這兩項特徵屬於用戶行為特徵),資金往來超過1000元的連絡人數目(該特徵屬於用戶關係特徵)等。針對上述用戶特徵,分別設定了判定規則。具體地,針對用戶特徵“年齡”,設定的判定規則為30至40歲;針對用戶特徵“註冊時長”,設定的判定規則為小於3個月;針對申請理賠次數,設定的判定規則為大於3次;針對平均理賠金額,設定的判定規則為大於1萬元;等等。
基於這樣的異常規則集合,可以對步驟21獲取的業務請求事件是否為高風險事件進行初步判斷。具體地,可以將第一用戶的用戶資訊中的各項對應用戶特徵與所述多個判定規則進行比較;當比較結果符合預定條件的情況下,判斷業務請求事件為高風險事件。上述預定條件例如可以是,異常規則集合包含的多個判定規則中,預定數目或預定比例的判定規則得到滿足。例如,在一個具體例子中,異常規則集合包含10條用戶特徵和相應的判定規則,那麼可以將預定條件設定為,當其中的任意8條判定規則得到滿足,就認為目前的用戶為高風險用戶,目前的業務請求事件是高風險事件。或者,上述預定條件可以被設定為更複雜的規則運算式,例如假定異常規則集合包含A,B,C,D,E至少5項判定規則,那麼預定條件可以為例如A AND(B OR C OR D)AND E的邏輯運算式。
在一個實施例中,直接基於步驟221中第一用戶的用戶資訊與異常規則集合的比較結果,來確定上述業務請求事件是否為高風險事件。
在另一實施例中,在步驟221基於異常規則集合對上述業務請求事件進行初步判斷之後,還包括步驟222(如圖2中虛線示出),在其中結合人工核驗結果,最終確定上述業務請求事件是否為高風險事件。也就是說,如果步驟221基於異常規則集合判斷上述業務請求事件為高風險事件,那麼將該事件發送到人工審核模組,並從人工審核模組接收針對該事件的核驗結果。在步驟222,如果接收到的核驗結果為,所述業務請求事件被人工核驗為高風險事件,那麼確定該業務請求事件為高風險事件。另一方面,如果接收到的核驗結果為,所述業務請求事件被人工核驗為非高風險事件,那麼,確定所述業務請求事件為非高風險事件,並且,在步驟223,根據這樣的核驗結果,更新異常規則集合。可以理解,出現步驟223的情況意味著,異常規則集合的判斷出現了偏差。因此,需要根據人工核驗結果,也就是人工矯正的結果,來更新異常規則集合,避免後續出現同樣的偏差。
在一個實施例中,對於基於異常規則集合被確定為高風險的業務請求事件,從中選擇一部分發送到人工審核模組,從而減輕人工審核的工作量。在一個實施例中,統計人工核驗結果與基於異常規則集合的判斷結果的一致性比例,根據該比例確定後續發送到人工審核模組進行核驗的事件比例。例如,人工核驗結果與基於異常規則集合的判斷結果的一致性越高,那麼可以將更少的業務請求事件發送到人工審核模組進行核驗。當人工核驗結果與基於異常規則集合的判斷結果的一致性達到一定高比例閾值,例如98%,那麼可以省略人工核驗,直接根據異常規則集合,確定業務請求事件是否為高風險事件。
綜合以上,在步驟22,至少基於異常規則集合(可選地,還基於人工核驗的覆核),確定步驟21獲取的業務請求事件是否為高風險事件。如果該事件被確定為高風險事件,那麼相應地,第一用戶會被確定為高風險用戶,於是,在步驟23,基於人群關係圖譜,確定與第一用戶存在特定關聯關係的第二用戶,並將第一用戶和第二用戶都添加到高風險用戶集。換言之,如果確定第一用戶為高風險用戶,則基於人群關係圖譜,對高風險用戶進行“擴散”,找到與第一用戶緊密關聯的其他潛在的高風險用戶。
以上高風險用戶的擴散要基於預先建立的人群關係圖譜來進行。人群關係圖譜可以採用多種方式來預先建立。
在一個實施例中,人群關係圖譜基於人群的交易關係而建立。例如,兩個用戶之間達成商品購買交易,則在這兩個用戶之間建立交易關聯。可以透過獲取並分析大量用戶的交易記錄而確定用戶之間的交易關係,進而建立人群關係圖譜。
在一個實施例中,人群關係圖譜基於人群的設備關係而建立。例如,當兩個或多個用戶帳戶利用同一台終端設備進行登錄時,可以確定這兩個或多個用戶帳戶之間存在設備關聯。存在設備關聯的兩個或多個用戶帳戶,有可能是同一個實體用戶註冊的多個帳戶,也可以是存在緊密關聯(例如家人、同事等)的多個用戶所對應的帳戶。設備關係可以透過獲取用戶登錄其帳戶時所對應的實體終端資訊而確定。
在一個實施例中,人群關係圖譜基於資金關係而建立。例如,當兩個用戶之間存在轉帳、收款等資金轉移操作時,則在這兩個用戶之間建立資金關聯。可以透過獲取並分析用戶利用電子錢包進行資金操作的記錄而確定用戶之間的資金關係,進而基於資金關係來建立人群關係圖譜。
在一個實施例中,人群關係圖譜基於社交關係而建立。如今人們越來越多地使用社交應用進行互動,例如,兩個用戶可以透過社交應用來進行聊天、發紅包、文件傳送等互動,那麼可以在這兩個用戶之間建立社交關聯。可以基於社交應用捕獲的大量社交互動來確定人群之間的社交關係,進而建立人群關係圖譜。
儘管以上給出了若干例子,但是可以理解,還可以基於更多種人群關聯關係來建立人群關係圖譜。並且,人群關係圖譜可以同時基於若干種人群關聯關係而建立。
在一個實施例中,人群關係圖譜可以形成為節點網路的形式。在該形式下,人群關係圖譜包括多個節點,每個節點對應一個用戶,存在關聯關係的節點之間會彼此連接。在一個實施例中,節點之間的連接可以具有多種屬性,例如連接類型,連接強度等,其中,連接類型又包括,例如資金連接(基於資金關係的連接),社交連接(基於社互動動的連接等),連接強度又可以包括,例如強連接,弱連接等。
圖4示出根據一個實施例的人群關係圖譜的例子。如圖4所示,在該例子中,人群關係圖譜中包括多個節點,每個節點對應一個用戶。節點之間的連接表示用戶之間具有關聯關係。假定圖4的人群關係圖譜是基於人群的資金關係和社交關係而建立。相應地,節點之間的連接可以是資金連接或社交連接。在圖4的例子中,以不同的線型示出不同的連接類型,即以虛線示出節點之間的社交連接,以實線示出節點之間的資金連接。並且,以連接線的粗細示出連接的強度。例如,粗線示出強連接,細線示出弱連接。更具體地,粗實線可以示出較強的資金連接(例如資金互動超過一金額閾值,例如1萬元),細實線示出較弱的資金連接(例如資金互動不超過上述金額閾值);粗虛線可以示出較強的社交連接(例如,互動頻率超過一頻率閾值,例如每天10次),細虛線示出較弱的社交連接(例如,互動頻率不超過上述頻率閾值)。
可以理解,人群關係圖譜還可以形成為其他形式,例如表格形式、圖表形式等。一張人群關係圖譜可以基於一種單一的人群關係而建立,也可以基於多種人群關係而建立(例如,圖4中基於兩種關係)。在此,對人群關係圖譜的形式、形成過程等均不作限定。
基於這樣的人群關係圖譜,在步驟23,在確定第一用戶為高風險用戶的情況下,在人群關係圖譜中確定與第一用戶存在特定關聯關係的第二用戶,將第二用戶也作為高風險用戶。
在一個實施例中,上述特定關聯關係包括,特定類型的關聯關係,例如,資金關聯關係。在一個實施例中,上述特定關聯關係包括特定強度的關聯關係,例如強關聯關係。當然,特定關聯關係還可以是,特定類型且特定強度的關聯關係。此外,本領域技術人員還可以基於對採集到的樣本中,高風險用戶之間的關係特點,對上述特定關聯關係進行其他限定。
在一個實施例中,考慮到在許多業務場景中,高風險用戶之間呈現出的“團夥”特徵,因此,首先從人群關係圖譜中提取出具有一定特徵的群組為高風險群組,將包含第一用戶的高風險群組中的其他用戶,確定為高風險的第二用戶。
圖5示出根據一個實施例的確定第二用戶的步驟流程,即步驟23的子步驟。如圖5所示,為了基於第一用戶將風險擴散到其他用戶,在步驟51,從人群關係圖譜中確定出包含第一用戶的至少一個群組。
在不同實施例中,群組可以具有不同的定義方式。例如,在社交應用中,一些用戶可以自主地形成社群。那麼在基於社交關係的人群圖譜中,可以基於用戶自主形成的社群確定出群組。在另一實施例中,可以將包含一定用戶數目,且用戶之間具有一定連接關係的多個用戶作為一個群組。例如,可以將群組設定為包含3至20個用戶,且這些用戶兩兩之間均具有關聯關係;或者,在另一例子中,將群組設定為兩兩之間具有強資金關聯關係的若干用戶。
可以理解,根據群組的定義方式的不同,同一個用戶可以歸屬於多個群組。在步驟51,從人群關係圖譜中,確定出具有高風險的第一用戶所歸屬的所有可能的群組。然而,這些群組並不必然都是高風險群組。因此,接下來,在步驟52,對步驟51確定出的群組進行進一步分析,從中選擇出高風險群組。
在一個實施例中,根據一個群組中高風險用戶的比例,來確定該群組是否為高風險群組。具體地,某個群組的高風險用戶比例為,該群組中已經被確定為高風險用戶的用戶數目M與該群組的用戶總數N的比例。實踐中,根據一個實施例,採用高風險用戶集來記錄已經確定出的高風險用戶。在這樣的情況下,上述用戶數目M即為,上述群組與高風險用戶集的交集中的用戶數目。在確定出群組中高風險用戶的比例的情況下,可以將該比例與預先設定的判定閾值,例如70%,來比較,根據比較結果而確定該群組是否為高風險群組,例如將高風險用戶的比例高於上述判定閾值的群組確定為高風險群組。
在此基礎上,在步驟53,將第一用戶所屬的高風險群組中的其他用戶確定為第二用戶,即高風險用戶,將第一用戶和第二用戶均添加到高風險用戶集中。
圖6示出基於人群關係圖譜從第一用戶擴散到第二用戶的具體例子的示意圖。如圖6所示,假定在步驟51,從人群關係圖譜中確定出第一用戶所屬的3個群組:群組A、群組B和群組C。接下來,在步驟52,確定這3個群組中各個群組的高風險用戶比例。在一個例子中,採用“染色”的方式,標記群組中之前已經確定的高風險用戶。換言之,在之前的處理中,一旦將某個用戶添加到高風險用戶集,同時在人群關係圖譜中對該用戶進行染色。如此,在步驟52,判斷各個群組中高風險用戶的比例,即判斷群組中被染色的用戶的濃度。在圖6的例子中,群組A包含10名用戶,只有第一用戶自身是已經確定為高風險的用戶,高風險用戶比例為10%。群組B包含8名用戶,其中,包含第一用戶在內有6名用戶被染色,高風險用戶比例為75%。群組C包含12名用戶,其中,被染色的用戶數為3名,高風險用戶比例為25%。如果比例閾值被設定為70%,那麼可以確定,群組B為高風險群組。接著,在步驟53,將群組B中的其他用戶,特別是尚未被染色(尚未被識別為高風險)的用戶,即用戶10和用戶20,確定為第二用戶。在確定出第二用戶的基礎上,將第一用戶和第二用戶均添加到高風險用戶集中。在一個例子中,在人群關係圖譜中對第一用戶和第二用戶進行染色,從而便於後續的擴散分析。
在一個實施例中,在基於高風險業務請求事件確定出第一用戶,然後基於第一用戶擴散到第二用戶之後,還基於第二用戶進行再次擴散。也就是說,在一個實施例中,在確定出第二用戶的基礎上,基於上述人群關係圖譜,確定與第二用戶存在特定關聯關係的第三用戶,將第三用戶也添加到高風險用戶集中。基於第二用戶,確定與之存在特定關聯關係的第三用戶的過程,與以上描述的基於第一用戶,確定第二用戶的過程一致,不再贅述其細節。
需要理解的是,上述擴散過程可以反復不斷進行,也就是,確定出第三用戶之後,再基於第三用戶尋找到與之關聯的第四用戶,等等,直到不再出現新的高風險用戶為止。
此時,高風險用戶集已經得到擴散和更新,除了包含經由步驟21的業務請求事件所確定的高風險的第一用戶之外,還包含了基於第一用戶擴散的其他高風險用戶,即第二用戶。因此,回到圖2,在步驟24,基於高風險用戶集,更新前述的異常規則集合。如前所述,異常規則集合可以包含多個用戶特徵,以及針對這些用戶特徵設定的多個判定規則。在一個實施例中,在步驟24,可以基於高風險用戶集中各個用戶的用戶特徵的統計,更新所述多個用戶特徵,和/或所述多個判定規則。
具體地,在一個例子中,原有的異常規則集合例如如圖3所示,其中,針對平均理賠金額設定的判定規則為大於1萬元。假定如圖6所示,基於第一用戶將高風險用戶擴散到了用戶10和用戶20,將用戶10和20都添加到了高風險用戶集中。新增的高風險用戶(用戶10和用戶20),對於該項用戶特徵,即平均理賠金額,的統計值為8000元。據此,可以將針對平均理賠金額的判定規則修改為大於8000元。
在另一例子中,原有的異常規則集合例如包含10項用戶特徵和對應判定規則。假定新增的高風險用戶在上述10項用戶特徵之外的某項用戶特徵上體現出較強的規律性,例如資金流動頻率超過一定閾值,那麼可以將該項用戶特徵,以及對應閾值,添加到異常規則集合中,從而更新異常規則集合。
在一個實施例中,對於擴散後的高風險用戶集,可以反過來採用異常規則集合與人工核驗結合的方式來進行抽樣檢測。例如選擇高風險用戶集中5%的高風險用戶,利用異常規則集合和人工核驗,確定其是否真的屬於高風險用戶。在抽樣檢測的準確率低於一定閾值的情況下,調整基於人群關係圖譜進行擴散的演算法過程,例如調整高風險群組的比例判定閾值等,使得高風險用戶的擴散過程更加準確。
回顧以上過程,首先基於異常規則集合確定出高風險的業務請求事件和高風險用戶,然後基於人群關係圖譜,對高風險用戶進行擴散,如此,從單一的業務請求事件,可以確定出多個高風險用戶,極大提高識別效率。進一步地,在擴散到更多高風險用戶的情況下,用新識別的高風險用戶來更新異常規則集合,從而對異常規則集合進行最佳化,使得異常規則集合在後續的判斷中,進一步提高判斷準確度。
根據另一態樣的實施例,還提供一種確定高風險用戶的裝置。圖7示出根據一個實施例的用以確定高風險用戶的裝置的示意性方塊圖。如圖7所示,用以確定高風險用戶的裝置700包括:事件獲取單元710,配置成獲取待評估的業務請求事件的事件資訊,所述事件資訊包括,所述業務請求事件所涉及的第一用戶的用戶資訊;事件判斷單元720,配置成至少基於異常規則集合和所述第一用戶的用戶資訊,判斷所述業務請求事件是否為高風險事件;用戶確定單元730,配置成在確定所述業務請求事件為高風險事件的情況下,基於人群關係圖譜,確定與所述第一用戶存在特定關聯關係的第二用戶,將所述第一用戶和所述第二用戶添加到高風險用戶集;第一更新單元740,配置成基於所述高風險用戶集,更新所述異常規則集合。
在一個實施例中,異常規則集合包括多個用戶特徵,和針對所述多個用戶特徵設定的多個判定規則。
進一步地,在一個實施例中,上述多個用戶特徵包括以下中的一項或多項:用戶基本屬性特徵、用戶行為特徵、用戶關係特徵、用戶位置特徵。
根據一種實施方式,事件判斷單元720配置成:將第一用戶的用戶資訊與上述多個判定規則進行比較;當比較結果符合預定條件的情況下,判斷所述業務請求事件為高風險事件。
進一步地,在一個實施例中,裝置700還包括人工審核單元(未示出),或者,與一外部的人工審核單元相連接。在這樣的情況下,事件判斷單元720還配置成,在基於異常規則集合,判斷所述業務請求事件為高風險事件的情況下,還將上述業務請求事件發送給人工審核單元,並從人工審核單元接收核驗結果。具體地,當事件判斷單元720進一步接收到第一核驗結果的情況下,確定所述業務請求事件為高風險事件,其中,所述第一核驗結果為將所述業務請求事件核驗為高風險事件的人工核驗結果。
另一方面,當事件判斷單元720進一步接收到第二核驗結果的情況下,確定所述業務請求事件為非高風險事件,其中,所述第二核驗結果為將所述業務請求事件核驗為非高風險事件的人工核驗結果。與此對應地,裝置700還包括第二更新單元750,配置成根據所述第二核驗結果,更新所述異常規則集合。
根據一種實施方式,用戶確定單元730所基於的人群關係圖譜是根據以下一種或多種關係而建立:交易關係、設備關係、資金關係、社交關係。
在一個實施例中,用戶確定單元730進一步包括:群組確定模組731,配置成從人群關係圖譜中確定出包含所述第一用戶的至少一個群組;群組選擇模組732,配置成根據各個群組的高風險用戶比例,從所述至少一個群組中選擇出高風險群組,其中,各個群組的高風險用戶比例為,該群組與所述高風險用戶集的交集中的用戶數目M與該群組的用戶總數N的比例;以及確定模組733,配置成將所述高風險群組中的用戶確定為所述第二用戶。
根據一個實施例,用戶確定單元730還配置成,基於所述人群關係圖譜,確定與所述第二用戶相關聯的第三用戶,將所述第三用戶添加到所述高風險用戶集中。
根據一種實施方式,第一更新單元740配置成:基於所述高風險用戶集中各個用戶的用戶特徵的統計,更新所述多個用戶特徵,和/或所述多個判定規則。
透過以上裝置,可以從單一的業務請求事件,確定出多個高風險用戶,極大提高識別效率。並且,還可以用新識別的高風險用戶,來更新和最佳化異常規則集合,使得異常規則集合在後續的判斷中,進一步提高判斷準確度。
根據另一態樣的實施例,還提供一種電腦可讀儲存媒體,其上儲存有電腦程式,當所述電腦程式在電腦中執行時,令電腦執行結合圖2所描述的方法。
根據再一態樣的實施例,還提供一種計算設備,包括記憶體和處理器,所述記憶體中儲存有可執行碼,所述處理器執行所述可執行碼時,實現結合圖2所述的方法。
本領域技術人員應該可以意識到,在上述一個或多個示例中,本發明所描述的功能可以用硬體、軟體、韌體或它們的任意組合來實現。當使用軟體來實現時,可以將這些功能儲存在電腦可讀媒體中或者作為電腦可讀媒體上的一個或多個指令或碼來進行傳輸。
以上所述的具體實施方式,對本發明的目的、技術方案和有益效果進行了進一步詳細說明,所應理解的是,以上所述僅為本發明的具體實施方式而已,並不用來限定本發明的保護範圍,凡在本發明的技術方案的基礎之上,所做的任何修改、等同替換、改進等,均應包括在本發明的保護範圍之內。
700‧‧‧用以確定高風險用戶的裝置
710‧‧‧事件獲取單元
720‧‧‧事件判斷單元
730‧‧‧用戶確定單元
731‧‧‧群組確定模組
732‧‧‧群組選擇模組
733‧‧‧確定模組
740‧‧‧第一更新單元
750‧‧‧第二更新單元
為了更清楚地說明本發明實施例的技術方案,下面將對實施例描述中所需要使用的圖式作簡單地介紹,顯而易見地,下面描述中的圖式僅僅是本發明的一些實施例,對於本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些圖式而獲得其它的圖式。
圖1示出本說明書披露的一個實施例的實施場景示意圖;
圖2示出根據一個實施例的確定高風險用戶的方法流程圖;
圖3示出異常規則集合的一個具體例子;
圖4示出根據一個實施例的人群關係圖譜的例子;
圖5示出根據一個實施例的確定第二用戶的步驟流程;
圖6示出基於人群關係圖譜從第一用戶擴散到第二用戶的具體例子的示意圖;
圖7示出根據一個實施例的用於確定高風險用戶的裝置的示意性方塊圖。

Claims (22)

  1. 一種確定高風險用戶的方法,該方法包括: 獲取待評估的業務請求事件的相關資訊,該相關資訊包括,該業務請求事件所涉及的第一用戶的用戶資訊; 至少基於異常規則集合和該第一用戶的用戶資訊,判斷該業務請求事件是否為高風險事件; 在確定該業務請求事件為高風險事件的情況下,基於人群關係圖譜,確定與該第一用戶存在特定關聯關係的第二用戶,將該第一用戶和該第二用戶添加到高風險用戶集;以及 基於該高風險用戶集,更新該異常規則集合。
  2. 根據請求項1所述的方法,其中,該異常規則集合包括多個用戶特徵,和針對該多個用戶特徵設定的多個判定規則。
  3. 根據請求項2所述的方法,其中,該多個用戶特徵包括以下中的一項或多項:用戶基本屬性特徵、用戶行為特徵、用戶關係特徵、用戶位置特徵。
  4. 根據請求項2所述的方法,其中,至少基於異常規則集合和該第一用戶的用戶資訊,判斷該業務請求事件是否為高風險事件包括: 將該第一用戶的用戶資訊與該多個判定規則進行比較;以及 當比較結果符合預定條件的情況下,判斷該業務請求事件為高風險事件。
  5. 根據請求項4所述的方法,其中,至少基於異常規則集合和該第一用戶的用戶資訊,判斷該業務請求事件是否為高風險事件還包括:當進一步接收到第一核驗結果的情況下,確定該業務請求事件為高風險事件,其中,該第一核驗結果為將該業務請求事件核驗為高風險事件的人工核驗結果。
  6. 根據請求項4所述的方法,其中,至少基於異常規則集合和該第一用戶的用戶資訊,判斷該業務請求事件是否為高風險事件還包括:當進一步接收到第二核驗結果的情況下,確定該業務請求事件為非高風險事件,其中,該第二核驗結果為將該業務請求事件核驗為非高風險事件的人工核驗結果; 該方法還包括,根據該第二核驗結果,更新該異常規則集合。
  7. 根據請求項1所述的方法,其中,該人群關係圖譜基於以下一種或多種關係而建立:交易關係、設備關係、資金關係、社交關係。
  8. 根據請求項1或7所述的方法,其中,該基於人群關係圖譜,確定與該第一用戶存在特定關聯關係的第二用戶包括: 從人群關係圖譜中確定出包含該第一用戶的至少一個群組; 根據各個群組的高風險用戶比例,從該至少一個群組中選擇出高風險群組,其中,各個群組的高風險用戶比例為,該群組與該高風險用戶集的交集中的用戶數目M與該群組的用戶總數N的比例;以及 將該高風險群組中的用戶確定為該第二用戶。
  9. 根據請求項1所述的方法,還包括,基於該人群關係圖譜,確定與該第二用戶相關聯的第三用戶,將該第三用戶添加到該高風險用戶集中。
  10. 根據請求項2所述的方法,其中,基於該高風險用戶集,更新該異常規則集合包括:基於該高風險用戶集中各個用戶的用戶特徵的統計,更新該多個用戶特徵,和/或該多個判定規則。
  11. 一種確定高風險用戶的裝置,該裝置包括: 事件獲取單元,配置成獲取待評估的業務請求事件的事件資訊,該事件資訊包括,該業務請求事件所涉及的第一用戶的用戶資訊; 事件判斷單元,配置成至少基於異常規則集合和該第一用戶的用戶資訊,判斷該業務請求事件是否為高風險事件; 用戶確定單元,配置成在確定該業務請求事件為高風險事件的情況下,基於人群關係圖譜,確定與該第一用戶存在特定關聯關係的第二用戶,將該第一用戶和該第二用戶添加到高風險用戶集;以及 第一更新單元,配置成基於該高風險用戶集,更新該異常規則集合。
  12. 根據請求項11所述的裝置,其中,該異常規則集合包括多個用戶特徵,和針對該多個用戶特徵設定的多個判定規則。
  13. 根據請求項12所述的裝置,其中,該多個用戶特徵包括以下中的一項或多項:用戶基本屬性特徵、用戶行為特徵、用戶關係特徵、用戶位置特徵。
  14. 根據請求項12所述的裝置,其中,該事件判斷單元配置成: 將該第一用戶的用戶資訊與該多個判定規則進行比較;以及 當比較結果符合預定條件的情況下,判斷該業務請求事件為高風險事件。
  15. 根據請求項14所述的裝置,其中,該事件判斷單元還配置成:當進一步接收到第一核驗結果的情況下,確定該業務請求事件為高風險事件,其中,該第一核驗結果為將該業務請求事件核驗為高風險事件的人工核驗結果。
  16. 根據請求項14所述的裝置,其中,該事件判斷單元還配置成:當進一步接收到第二核驗結果的情況下,確定該業務請求事件為非高風險事件,其中,該第二核驗結果為將該業務請求事件核驗為非高風險事件的人工核驗結果; 該裝置還包括第二更新單元,配置成根據該第二核驗結果,更新該異常規則集合。
  17. 根據請求項11所述的裝置,其中,該人群關係圖譜基於以下一種或多種關係而建立:交易關係、設備關係、資金關係、社交關係。
  18. 根據請求項11或17所述的裝置,其中,該用戶確定單元包括: 群組確定模組,配置成從人群關係圖譜中確定出包含該第一用戶的至少一個群組; 群組選擇模組,配置成根據各個群組的高風險用戶比例,從該至少一個群組中選擇出高風險群組,其中,各個群組的高風險用戶比例為,該群組與該高風險用戶集的交集中的用戶數目M與該群組的用戶總數N的比例;以及 確定模組,配置成將該高風險群組中的用戶確定為該第二用戶。
  19. 根據請求項11所述的裝置,該用戶確定單元還配置成,基於該人群關係圖譜,確定與該第二用戶相關聯的第三用戶,將該第三用戶添加到該高風險用戶集中。
  20. 根據請求項12所述的裝置,其中,該第一更新單元配置成:基於該高風險用戶集中各個用戶的用戶特徵的統計,更新該多個用戶特徵,和/或該多個判定規則。
  21. 一種電腦可讀儲存媒體,其上儲存有電腦程式,當該電腦程式在電腦中執行時,令電腦執行根據請求項1至10中任一項所述的方法。
  22. 一種計算設備,包括記憶體和處理器,其特徵在於,該記憶體中儲存有可執行碼,該處理器執行該可執行碼時,實現根據請求項1至10中任一項所述的方法。
TW108104910A 2018-04-12 2019-02-14 確定高風險用戶的方法及裝置、電腦可讀儲存媒體、和計算設備 TWI804575B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
??201810327338.6 2018-04-12
CN201810327338.6A CN108805391A (zh) 2018-04-12 2018-04-12 确定高风险用户的方法及装置
CN201810327338.6 2018-04-12

Publications (2)

Publication Number Publication Date
TW201944306A true TW201944306A (zh) 2019-11-16
TWI804575B TWI804575B (zh) 2023-06-11

Family

ID=64095609

Family Applications (1)

Application Number Title Priority Date Filing Date
TW108104910A TWI804575B (zh) 2018-04-12 2019-02-14 確定高風險用戶的方法及裝置、電腦可讀儲存媒體、和計算設備

Country Status (3)

Country Link
CN (1) CN108805391A (zh)
TW (1) TWI804575B (zh)
WO (1) WO2019196549A1 (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108805391A (zh) * 2018-04-12 2018-11-13 阿里巴巴集团控股有限公司 确定高风险用户的方法及装置
CN109816397B (zh) * 2018-12-03 2021-05-25 北京奇艺世纪科技有限公司 一种欺诈判别方法、装置及存储介质
CN110069923A (zh) * 2019-03-13 2019-07-30 咪咕文化科技有限公司 一种识别风险用户的方法及相关装置
CN111028083B (zh) * 2019-12-11 2024-05-17 北京知道创宇信息技术股份有限公司 一种区块链钱包地址的评估方法、装置、系统及存储介质
CN111127026A (zh) * 2019-12-13 2020-05-08 深圳中兴飞贷金融科技有限公司 确定用户欺诈行为的方法、装置、存储介质及电子设备
CN112231720B (zh) * 2020-09-18 2022-11-22 苏州浪潮智能科技有限公司 一种强制访问控制规则隐藏制定人的定位方法
CN112333085B (zh) * 2020-10-30 2023-02-03 维沃移动通信有限公司 社交方法和电子设备
CN113011887B (zh) * 2021-03-10 2023-11-24 腾讯科技(深圳)有限公司 数据处理方法、装置、计算机设备和存储介质
CN113222736A (zh) * 2021-05-24 2021-08-06 北京城市网邻信息技术有限公司 一种异常用户的检测方法、装置、电子设备及存储介质
CN113393244A (zh) * 2021-05-25 2021-09-14 中国银联股份有限公司 异常帐户识别方法、装置、设备及介质
CN113538051A (zh) * 2021-07-16 2021-10-22 广州电力交易中心有限责任公司 基于用户行为的电力交易平台安全预警方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101470887A (zh) * 2007-12-24 2009-07-01 阿里巴巴集团控股有限公司 一种贷中预警系统及方法
CN101388104A (zh) * 2008-10-15 2009-03-18 中国工商银行股份有限公司 基于客户间关系对融资风险进行评价的系统及方法
TWI521451B (zh) * 2009-07-29 2016-02-11 Danal Taiwan Co Ltd To assess the risk of online consumption of trading control methods, systems and online transactions to pay methods
CN101930585A (zh) * 2010-09-01 2010-12-29 中国建设银行股份有限公司 一种授信业务风险监测系统及其方法
CN105335855A (zh) * 2014-08-06 2016-02-17 阿里巴巴集团控股有限公司 一种交易风险识别方法及装置
CN105404947A (zh) * 2014-09-02 2016-03-16 阿里巴巴集团控股有限公司 用户质量侦测方法及装置
CN106355405A (zh) * 2015-07-14 2017-01-25 阿里巴巴集团控股有限公司 风险识别方法、装置及风险防控系统
CN107153847A (zh) * 2017-05-31 2017-09-12 北京知道创宇信息技术有限公司 预测用户是否存在恶意行为的方法和计算设备
CN107292424B (zh) * 2017-06-01 2020-01-21 四川新网银行股份有限公司 一种基于复杂社交网络的反欺诈和信用风险预测方法
CN108805391A (zh) * 2018-04-12 2018-11-13 阿里巴巴集团控股有限公司 确定高风险用户的方法及装置

Also Published As

Publication number Publication date
TWI804575B (zh) 2023-06-11
CN108805391A (zh) 2018-11-13
WO2019196549A1 (zh) 2019-10-17

Similar Documents

Publication Publication Date Title
TWI804575B (zh) 確定高風險用戶的方法及裝置、電腦可讀儲存媒體、和計算設備
US10783116B2 (en) Systems and methods for managing data
US20180033009A1 (en) Method and system for facilitating the identification and prevention of potentially fraudulent activity in a financial system
US20160071108A1 (en) Enhanced automated anti-fraud and anti-money-laundering payment system
JP2020522832A (ja) 信用力があると判定された消費者にローンを発行するシステムおよび方法
US20220414671A1 (en) Systems and methods of providing security in an electronic network
WO2021155053A1 (en) Systems and methods for identifying synthetic identities
CN110442712B (zh) 风险的确定方法、装置、服务器和文本审理系统
AU2012255037A1 (en) System and methods for producing a credit feedback loop
WO2021068635A1 (zh) 信息处理方法、装置及电子设备
US20200250675A1 (en) Fraud Detection Based on Community Change Analysis Using a Machine Learning Model
CN110135978B (zh) 用户金融风险评估方法、装置、电子设备和可读介质
US20200250743A1 (en) Fraud Detection Based on Community Change Analysis
WO2022257731A1 (zh) 针对隐私计算进行算法协商的方法、装置及系统
US11798006B1 (en) Automating content and information delivery
US10802948B2 (en) Integrated testing data provisioning and conditioning system for application development
CN111177653B (zh) 一种信用评估方法和装置
US20230012460A1 (en) Fraud Detection and Prevention System
US11348115B2 (en) Method and apparatus for identifying risky vertices
US10296882B2 (en) Multicomputer processing of client device request data using centralized event orchestrator and link discovery engine
US20150019401A1 (en) Integrated credit decision platform
US20240129309A1 (en) Distributed device trust determination
WO2020214175A1 (en) Method, system, and computer program product for controlling access in a network of servers
US11810118B2 (en) Sandbox based testing and updating of money laundering detection platform
US11899721B2 (en) Graph-based multi-threading group detection