WO2019137050A1 - 互联网信贷场景下的实时欺诈检测方法、装置及服务器 - Google Patents

互联网信贷场景下的实时欺诈检测方法、装置及服务器 Download PDF

Info

Publication number
WO2019137050A1
WO2019137050A1 PCT/CN2018/109729 CN2018109729W WO2019137050A1 WO 2019137050 A1 WO2019137050 A1 WO 2019137050A1 CN 2018109729 W CN2018109729 W CN 2018109729W WO 2019137050 A1 WO2019137050 A1 WO 2019137050A1
Authority
WO
WIPO (PCT)
Prior art keywords
target user
feature vector
data
behavior
fraud
Prior art date
Application number
PCT/CN2018/109729
Other languages
English (en)
French (fr)
Inventor
于皓
张�杰
李犇
张涧
张卓博
Original Assignee
阳光财产保险股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 阳光财产保险股份有限公司 filed Critical 阳光财产保险股份有限公司
Publication of WO2019137050A1 publication Critical patent/WO2019137050A1/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof

Definitions

  • the Internet credit industry has experienced rapid development in recent years, showing a situation of contending and arranging hundreds of flowers. With the development of the industry, the fraudulent black industry chain is constantly infiltrating into this field, and various novel fraud models are emerging one after another. The healthy development of the Internet credit industry has cast a shadow. According to incomplete statistics, the annual losses due to fraud are between 50 billion and 100 billion. The risk of fraud has become the top priority of the Internet credit industry.
  • the embodiment of the present application provides a real-time fraud detection method in an internet credit scenario, where the method includes:
  • the authorization data includes: device data of the target user, behavior data of the target user, social data of the target user, the target user Application business data;
  • a feature vector of the target user based on the authorization data, where the feature vector includes: a statistical feature vector, a relationship feature vector, and a behavior feature vector;
  • the fraud probability calculation is performed on the feature vector by the unsupervised anti-fraud machine learning model, and the fraud probability of the target user is obtained.
  • the behavior feature vector comprises: an input behavior feature vector, and an operation behavior feature vector.
  • the embodiment of the present application provides a second possible implementation manner of the first aspect, where the behavior data of the target user and the device data of the target user are calculated to obtain the statistical feature vector.
  • the target feature of the target user based on the behavior data of the target user and the device data of the target user, where the target features of the target user include: frequency of geographic information application, frequency of application of IP, proportion of power of the device , the average acceleration of the gyroscope;
  • the statistical feature vector is calculated based on a population distribution to which the target user belongs.
  • the embodiment of the present application provides a third possible implementation manner of the first aspect, where the social data of the target user, the application data of the target user, and the device data of the target user are performed. Calculating, obtaining the relationship feature vector includes:
  • the updated feature map is calculated by a random walk algorithm and node2vector to obtain the relationship feature vector.
  • the embodiment of the present application provides a fourth possible implementation manner of the first aspect, where the behavior data of the target user is calculated, and the behavior feature vector is obtained by:
  • the input is total time consuming, the input is time consuming, the average interval of the input characters is time consuming, and the variance is used as the input behavior feature vector of the target user;
  • the operation delay sequence is taken as the operation behavior feature vector.
  • the fraud probability calculation is performed on the group to which the target user belongs by using the unsupervised anti-fraud machine learning model, and the fraud probability of the group is obtained.
  • the embodiment of the present application provides a sixth possible implementation manner of the first aspect, wherein the method further includes:
  • the group is determined to be a fraud group with an incubation period.
  • the embodiment of the present application provides a seventh possible implementation manner of the first aspect, wherein the method further includes:
  • a feature vector of the training sample based on the plurality of the training samples, wherein the feature vector comprises: a statistical feature vector, a relationship feature vector, and a behavior feature vector;
  • the clustering training is performed according to the feature vector of the training sample by the K-MEANS algorithm, and the clustering result is marked to obtain the unsupervised anti-fraud machine learning model after training.
  • An obtaining module configured to obtain authorization data sent by the target user after being authorized by the Internet credit APP, where the authorization data includes: device data of the target user, behavior data of the target user, social data of the target user The application service data of the target user;
  • a constructing module configured to construct a feature vector of the target user based on the authorization data, where the feature vector includes: a statistical feature vector, a relationship feature vector, and a behavior feature vector;
  • the first fraud probability calculation module is configured to perform fraud probability calculation on the feature vector by using the unsupervised anti-fraud machine learning model to obtain a fraud probability of the target user.
  • a first calculating unit configured to calculate behavior data of the target user and device data of the target user, to obtain the statistical feature vector
  • the embodiment of the present application provides a second possible implementation manner of the second aspect, where the first calculating unit includes:
  • Obtaining a sub-unit configured to obtain a target feature range of the non-fraudulent crowd and a target feature range of the fraudulent crowd;
  • a first extraction subunit configured to extract a target feature of the target user based on behavior data of the target user and device data of the target user, where the target feature of the target user includes: frequency of geographic information application, IP The frequency of application, the proportion of equipment power, and the average acceleration of the gyroscope;
  • Determining a sub-unit configured to combine a target feature range of the non-fraudulent crowd, a target feature range of the fraudulent crowd, and a target feature of the target user to determine a population distribution to which the target user belongs;
  • a first computing subunit configured to calculate the statistical feature vector based on a population distribution to which the target user belongs.
  • the embodiment of the present application provides a third possible implementation manner of the second aspect, where the second calculating unit is specifically configured to: device data of the target user, social data of the target user And the application data of the target user is associated with a historical relationship map, where the historical relationship map is a relationship map obtained according to historical authorization data; and the historical relationship map is calculated by a community discovery algorithm to obtain the target user.
  • An affiliated social group updating the weight value of the edge in the historical relationship map by the fraud risk of the social group, to obtain an updated relationship map, wherein the fraud risk of the social group is obtained according to the historical authorization data
  • the relationship feature vector is obtained by calculating the updated relationship map by a random walk algorithm and node2vector.
  • the embodiment of the present application provides a fourth possible implementation manner of the second aspect, wherein the third calculating unit is specifically configured to extract input behavior data in the behavior data of the target user;
  • the input behavior data calculates the total input time of the input behavior, the average input time, the average interval time and the variance of the input characters, wherein the input behavior includes: the behavior of inputting the ID number, the behavior and input of the input mobile number
  • the input behavior characteristic vector of the user extracting operation behavior data in the behavior data of the target user; analyzing the operation behavior data to obtain an operation delay sequence of the operation behavior, wherein the operation behavior is an operation Describe the behavior of the Internet Credit APP; use the operation delay sequence as the operational behavior feature vector.
  • the embodiment of the present application provides a fifth possible implementation manner of the second aspect, wherein the acquiring module is further configured to acquire historical authorization data of multiple users as a training sample;
  • the building module is further configured to construct a feature vector of the training sample based on a plurality of the training samples, wherein the feature vector comprises: a statistical feature vector, a relationship feature vector, and a behavior feature vector;
  • the training module is further configured to perform clustering training according to the feature vector of the training sample by using a K-MEANS algorithm, and label the clustering result to obtain a trained unsupervised anti-fraud machine learning model.
  • an embodiment of the present application further provides a server, where the data processing device includes a machine readable storage medium and a processor, where the machine readable storage medium stores instructions executable by a machine, where the instructions are When the processor is executed, the server is caused to implement the real-time fraud detection method in the Internet credit scenario provided by the embodiment of the present application.
  • the embodiments of the present application provide at least the following beneficial effects:
  • the embodiment of the present application provides a real-time fraud detection method, apparatus, and server in an Internet credit scenario, the method includes: obtaining an authorization sent by a target user after being authorized by an Internet credit APP Data, wherein the authorization data includes: device data of the target user, behavior data of the target user, social data of the target user, application service data of the target user; and constructing a feature vector of the target user based on the authorization data, wherein the feature vector includes: Feature vector, relational feature vector, behavioral feature vector; the eigenvector is trained by K-MEANS algorithm to obtain unsupervised anti-fraud machine learning model; the unsupervised anti-fraud machine learning model is used to calculate the fraud probability of feature vector, and the target user is obtained. Probability of fraud.
  • the existing fraud detection methods based on the rule engine and the supervised machine learning model are models based on the existing fraud mode, which can only identify the existing fraud mode and cannot identify the new fraud mode in a short time.
  • the authorization data of the target user can be vectorized to obtain the target user.
  • the eigenvectors are trained by the K-MEANS algorithm to obtain the unsupervised anti-fraud machine learning model.
  • the unsupervised anti-fraud machine learning model is used to calculate the fraud probability of the target user's feature vector, so that the target user can be obtained. Probability of fraud.
  • the method makes full use of the authorization data of the target user. If the target user makes a credit application for the purpose of deliberate fraud, the clues of fraud will be hidden in the authorization data, and the authorization data is unstructured data, which cannot be used for the K-MEANS algorithm. Modeling, so vectorization is needed to obtain the feature vector of the target user, and then the unsupervised anti-fraud machine learning model is modeled. Finally, the unsupervised anti-fraud machine learning model is used to calculate the fraud probability of the feature vector, and the target user is obtained.
  • the probability of fraud this method can discover new fraud patterns in real time, help the Internet credit industry to effectively deal with fraud risks, and alleviate the technical problems that existing fraud detection methods can not identify new fraud patterns in a short time.
  • FIG. 1 is a schematic structural diagram of a hardware of a server according to an embodiment of the present application
  • FIG. 2 is a flowchart of a real-time fraud detection method in an internet credit scenario according to an embodiment of the present application
  • Step S102 Obtain authorization data sent by the target user after being authorized by the Internet credit APP, where the authorization data includes: device data of the target user, behavior data of the target user, social data of the target user, and application service data of the target user.
  • the execution subject of the real-time fraud detection method in the Internet credit scenario is a server, and the server 100 can obtain the authorization data sent by the APP through the communication unit 140.
  • the authorization data includes device data of the target user, behavior data of the target user, social data of the target user, and application service data of the target user.
  • the device data includes a mobile phone number, a GPS location data, a MAC address data, an IP address data, and the like.
  • the embodiment of the present application does not specifically limit the same.
  • Step S106 Training the feature vector by the K-MEANS algorithm to obtain an unsupervised anti-fraud machine learning model.
  • the processor 130 of the server 100 may train the unsupervised anti-fraud machine learning model based on the data of steps S102 and S104 to obtain an updated unsupervised anti-fraud machine learning model.
  • Step S202 Perform calculation on the social data of the target user, the application data of the target user, and the device data of the target user to obtain a relationship feature vector.
  • the behavior feature vector is calculated by the processor 130 according to the behavior data of the target user, and the process is described in detail below, and details are not described herein again.
  • the processor 130 calculates the updated relationship map by using a random walk algorithm and node2vector to obtain a relationship feature vector.
  • calculating behavior data of the target user, and obtaining the behavior feature vector includes:
  • Step S501 Extracting input behavior data in the behavior data of the target user.
  • Step S504 extracting operation behavior data in the behavior data of the target user.
  • clustering gets 100 groups, one of them is very different from other classes, there is one class that deviates from the other 99 classes. If there is a large difference between one group and other groups, it means that it is an abnormal point, fraud The probability is great.
  • the method further includes:
  • the first fraud probability calculation module 14 is configured to perform a fraud probability calculation on the feature vector through the unsupervised anti-fraud machine learning model to obtain a fraud probability of the target user.
  • Modeling so vectorization is needed to obtain the feature vector of the target user, and then the unsupervised anti-fraud machine learning model is modeled. Finally, the unsupervised anti-fraud machine learning model is used to calculate the fraud probability of the feature vector, and the target user is obtained.
  • the probability of fraud the device can discover new fraud patterns in real time, help the Internet credit industry to effectively deal with fraud risks, and alleviate the technical problems that existing fraud detection devices cannot identify new fraud patterns in a short period of time.
  • the building module includes:
  • a first calculating unit configured to calculate behavior data of the target user and device data of the target user to obtain a statistical feature vector
  • the third calculating unit is configured to calculate the behavior data of the target user to obtain a behavior feature vector, wherein the behavior feature vector comprises: an input behavior feature vector, and an operation behavior feature vector.
  • the first calculating unit comprises:
  • Obtaining a sub-unit configured to obtain a target feature range of the non-fraudulent crowd and a target feature range of the fraudulent crowd;
  • the first extraction subunit is configured to extract target features of the target user based on the behavior data of the target user and the device data of the target user, where the target characteristics of the target user include: frequency of geographic information application, frequency of application of IP, proportion of power of the device , the average acceleration of the gyroscope;
  • the first computing sub-unit is configured to calculate a statistical feature vector based on the population distribution to which the target user belongs.
  • the second calculating unit comprises:
  • Establishing an association sub-unit configured to associate the device data of the target user, the social data of the target user, and the application data of the target user with a historical relationship map, where the historical relationship map is a relationship map obtained according to the historical authorization data;
  • a second computing sub-unit configured to calculate a historical relationship map by using a community discovery algorithm to obtain a social group to which the target user belongs;
  • Updating the subunit configured to update the weight value of the edge in the historical relationship map by the fraud risk of the social group, to obtain the updated relationship map, wherein the fraud risk of the social group is obtained according to the historical authorization data;
  • the third calculating subunit is configured to calculate the updated relationship map by using a random walk algorithm and node2vector to obtain a relationship feature vector.
  • the third calculating unit comprises:
  • a second extraction subunit configured to extract input behavior data in behavior data of the target user
  • the first setting sub-unit is configured to input the total time-consuming, input the average time-consuming, the average interval of the input characters is time-consuming, and the variance is used as the input behavior feature vector of the target user;
  • a third extraction subunit configured to extract operation behavior data in the behavior data of the target user
  • the analysis subunit is configured to analyze the operation behavior data to obtain an operation delay sequence of the operation behavior, wherein the operation behavior is an operation of operating the internet credit APP;
  • the second setting subunit is configured to use the operation delay sequence as an operation behavior feature vector.
  • the device further includes:
  • the second fraud probability calculation module is configured to perform a fraud probability calculation on the group to which the target user belongs by using the unsupervised anti-fraud machine learning model, and obtain a fraud probability of the group.
  • the device further includes:
  • the calculation module is configured to calculate the operation behavior of the group to which the target user belongs by using a statistical analysis method, and obtain a behavior pattern vector of the group;
  • a real-time monitoring module configured to perform real-time monitoring of behavior pattern vectors
  • the second calculating unit is specifically configured to associate the device data of the target user, the social data of the target user, and the application data of the target user with a historical relationship map, wherein the historical relationship map is a relationship map obtained according to historical authorization data.
  • the community relationship map is calculated by the community discovery algorithm to obtain the social group to which the target user belongs; the weight value of the edge in the historical relationship map is updated by the fraud risk of the social group, and the updated relationship map is obtained, wherein the social group fraud risk Obtained according to historical authorization data; the relational feature vector is obtained by calculating the updated relationship map by random walk algorithm and node2vector.
  • the third calculating unit is specifically configured to extract the input behavior data in the behavior data of the target user; calculate the total input time of the input behavior, the average input time, the average interval time and variance of the input characters according to the input behavior data.
  • the input behavior includes: the behavior of inputting the ID number, the behavior of inputting the mobile phone number, and the behavior of inputting the bank card number, the variance is used to indicate the fluctuation of the input character interval; the total time consumption, the input average time consumption, and the input characters are input.
  • the average interval time-consuming and variance is used as the input user's input behavior feature vector; the operation behavior data is extracted from the target user's behavior data; the operation behavior data is analyzed to obtain the operation delay sequence of the operation behavior, wherein the operation behavior is operation The behavior of the Internet Credit APP; the operational delay sequence is used as the operational behavior feature vector.
  • the obtaining module 11 is further configured to acquire historical authorization data of the plurality of users as the training samples.
  • the building module 12 is further configured to construct a feature vector of the training sample based on the plurality of training samples, wherein the feature vector comprises: a statistical feature vector, a relationship feature vector, and a behavior feature vector.
  • the training module 13 is further configured to perform clustering training according to the feature vector of the training sample by the K-MEANS algorithm, and label the clustering result to obtain a trained unsupervised anti-fraud machine learning model.
  • the computer program product of the real-time fraud detection method and apparatus in the Internet credit scenario provided by the embodiment of the present application includes a computer readable storage medium storing program code, and the program code includes instructions for executing the foregoing method embodiment.
  • program code includes instructions for executing the foregoing method embodiment.
  • the real-time fraud detection method, device and server in the Internet credit scenario provided by the embodiment of the present invention can vectorize the authorization data of the target user to obtain the feature vector of the target user, and train the feature vector through the K-MEANS algorithm to obtain no
  • the anti-fraud machine learning model is supervised.
  • the fraud probability calculation of the target user's feature vector is performed by the unsupervised anti-fraud machine learning model, and the target user's fraud probability can be obtained.
  • the method makes full use of the authorization data of the target user. If the target user makes a credit application for the purpose of deliberate fraud, the clues of fraud will be hidden in the authorization data, and the authorization data is unstructured data, which cannot be used for the K-MEANS algorithm.

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供了一种互联网信贷场景下的实时欺诈检测方法及装置,该方法包括:获取目标用户通过互联网信贷APP授权后发送的授权数据;基于授权数据构建目标用户的特征向量;通过K-MEANS算法对特征向量进行训练,得到无监督反欺诈机器学习模型;通过无监督反欺诈机器学习模型对特征向量进行欺诈概率计算,得到目标用户的欺诈概率。该方法充分利用了目标用户的授权数据,对授权数据向量化得到特征向量,进而通过K-MEANS算法建模得到无监督反欺诈机器学习模型,无监督反欺诈机器学习模型再对特征向量进行欺诈概率计算,得到目标用户的欺诈概率,该方法能够实时发现新式的欺诈模式,缓解了现有的欺诈检测方法无法在较短时间内识别出新式的欺诈模式的技术问题。

Description

互联网信贷场景下的实时欺诈检测方法、装置及服务器
相关申请的交叉引用
本申请要求于2018年01月12日提交中国专利局的申请号为2018100336152、名称为“互联网信贷场景下的实时欺诈检测方法及装置”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
技术领域
本申请涉及互联网信贷风控的技术领域,尤其是涉及一种互联网信贷场景下的实时欺诈检测方法、装置及服务器。
背景技术
互联网信贷产业,近几年得到了飞速发展,呈现出百家争鸣、百花齐放的局面,伴随着产业的欣荣发展,欺诈黑色产业链也在不断地渗透到该领域,各种新颖的欺诈模式层出不穷,对互联网信贷产业的健康发展蒙上了一层阴影。据不完全统计,每年因欺诈导致的损失在500亿—1000亿,欺诈风险已成为互联网信贷产业风险的重中之重。
信贷产业防范欺诈的主要方法是基于规则引擎的方法和基于监督机器学习模型的方法,基于规则引擎的方法是通过将风控专家的经验知识转化为欺诈防范规则,通过规则引擎的方式进行匹配。基于监督机器学习模型的方法,通过将有欺诈行为的人群和没有欺诈行为的人群组合为样本数据,通过选取相应的特征,利用监督机器学习方法,构建模型,用以识别欺诈风险。
上述两种方法在传统的信贷行业中,效果较为明显,然而在互联网信贷场景下,在互联网的大背景下,创新业务发展迅速,因此,针对各种业务场景下的欺诈手段和技术也在不断更新,基于规则引擎和监督机器学习模型的方法都是根据现有的欺诈模式得到的模型,只能识别现有的欺诈模式,无法在较短时间内识别新式的欺诈模式。
综上,现有的信贷产业防范欺诈的方法无法在较短时间内识别出新式的欺诈模式。
发明内容
有鉴于此,本申请的目的包括,提供一种互联网信贷场景下的实时欺诈检测方法、装置及服务器,以至少缓解现有的信贷产业防范欺诈的方法无法在较短时间内识别出新式的欺诈模式的技术问题。
第一方面,本申请实施例提供了一种互联网信贷场景下的实时欺诈检测方法,所述方法包括:
获取目标用户通过互联网信贷APP授权后发送的授权数据,其中,所述授权数据包括:所 述目标用户的设备数据,所述目标用户的行为数据,所述目标用户的社交数据,所述目标用户的申请业务数据;
基于所述授权数据构建所述目标用户的特征向量,其中,所述特征向量包括:统计特征向量,关系特征向量,行为特征向量;
通过K-MEANS算法对所述特征向量进行训练,得到无监督反欺诈机器学习模型;
通过所述无监督反欺诈机器学习模型对所述特征向量进行欺诈概率计算,得到所述目标用户的欺诈概率。
结合第一方面,本申请实施例提供了第一方面的第一种可能的实施方式,其中,基于所述授权数据构建所述目标用户的特征向量包括:
对所述目标用户的行为数据和所述目标用户的设备数据进行计算,得到所述统计特征向量;
对所述目标用户的社交数据,所述目标用户的申请数据和所述目标用户的设备数据进行计算,得到所述关系特征向量;
对所述目标用户的行为数据进行计算,得到所述行为特征向量,其中,所述行为特征向量包括:输入行为特征向量,操作行为特征向量。
结合第一方面,本申请实施例提供了第一方面的第二种可能的实施方式,其中,对所述目标用户的行为数据和所述目标用户的设备数据进行计算,得到所述统计特征向量包括:
获取非欺诈人群的目标特征范围和欺诈人群的目标特征范围;
基于所述目标用户的行为数据和所述目标用户的设备数据提取所述目标用户的目标特征,其中,所述目标用户的目标特征包括:地理信息申请频次,IP的申请频次,设备电量占比,陀螺仪的平均加速度;
结合所述非欺诈人群的目标特征范围,所述欺诈人群的目标特征范围以及所述目标用户的目标特征,确定所述目标用户所属的人群分布;
基于所述目标用户所属的人群分布计算所述统计特征向量。
结合第一方面,本申请实施例提供了第一方面的第三种可能的实施方式,其中,对所述目标用户的社交数据,所述目标用户的申请数据和所述目标用户的设备数据进行计算,得到所述关系特征向量包括:
将所述目标用户的设备数据,所述目标用户的社交数据以及所述目标用户的申请数据与历史关系图谱建立关联,其中,所述历史关系图谱为根据历史授权数据得到的关系图谱;
通过社区发现算法对所述历史关系图谱进行计算,得到所述目标用户所属的社交群体;
通过所述社交群体的欺诈风险更新所述历史关系图谱中边的权重值,得到更新后的关系图谱,其中,所述社交群体的欺诈风险为根据所述历史授权数据获得的;
通过随机游走算法和node2vector对所述更新后的关系图谱进行计算,得到所述关系特征向量。
结合第一方面,本申请实施例提供了第一方面的第四种可能的实施方式,其中,对所述目标用户的行为数据进行计算,得到所述行为特征向量包括:
在所述目标用户的行为数据中提取输入行为数据;
根据所述输入行为数据计算输入行为的输入总耗时,输入平均耗时,输入字符的平均间隔耗时,方差,其中,所述输入行为包括:输入身份证号的行为,输入手机号的行为,输入银行卡号的行为,所述方差用于表示输入字符间隔的波动情况;
将所述输入总耗时,所述输入平均耗时,所述输入字符的平均间隔耗时,所述方差作为所述目标用户的所述输入行为特征向量;
在所述目标用户的行为数据中提取操作行为数据;
对所述操作行为数据进行分析,得到操作行为的操作时延序列,其中,所述操作行为为操作所述互联网信贷APP的行为;
将所述操作时延序列作为所述操作行为特征向量。
结合第一方面,本申请实施例提供了第一方面的第五种可能的实施方式,其中,所述方法还包括:
通过所述无监督反欺诈机器学习模型对所述目标用户所属的群体进行欺诈概率计算,得到所述群体的欺诈概率。
结合第一方面,本申请实施例提供了第一方面的第六种可能的实施方式,其中,所述方法还包括:
通过统计分析方法对所述目标用户所属的群体的操作行为进行计算,得到所述群体的行为模式向量;
对所述行为模式向量进行实时监控;
当所述行为模式向量出现显著变化时,确定所述群体为具有潜伏期的欺诈群体。
结合第一方面,本申请实施例提供了第一方面的第七种可能的实施方式,其中,所述方法还包括:
获取多个用户的历史授权数据作为训练样本;
基于多个所述训练样本构建所述训练样本的特征向量,其中,所述特征向量包括:统计特征向量、关系特征向量和行为特征向量;
通过K-MEANS算法根据所述训练样本的特征向量进行聚类训练,并对聚类结果进行标注得到训练后的无监督反欺诈机器学习模型。
第二方面,本申请实施例还提供了一种互联网信贷场景下的实时欺诈检测装置,所述装置包括:
获取模块,配置成获取目标用户通过互联网信贷APP授权后发送的授权数据,其中,所述授权数据包括:所述目标用户的设备数据,所述目标用户的行为数据,所述目标用户的社交数据,所述目标用户的申请业务数据;
构建模块,配置成基于所述授权数据构建所述目标用户的特征向量,其中,所述特征向量包括:统计特征向量,关系特征向量,行为特征向量;
训练模块,配置成通过K-MEANS算法对所述特征向量进行训练,得到无监督反欺诈机器学习模型;
第一欺诈概率计算模块,配置成通过所述无监督反欺诈机器学习模型对所述特征向量进行欺诈概率计算,得到所述目标用户的欺诈概率。
结合第二方面,本申请实施例提供了第二方面的第一种可能的实施方式,其中,所述构建模块包括:
第一计算单元,配置成对所述目标用户的行为数据和所述目标用户的设备数据进行计算,得到所述统计特征向量;
第二计算单元,配置成对所述目标用户的社交数据,所述目标用户的申请数据和所述目标用户的设备数据进行计算,得到所述关系特征向量;
第三计算单元,配置成对所述目标用户的行为数据进行计算,得到所述行为特征向量,其中,所述行为特征向量包括:输入行为特征向量,操作行为特征向量。
结合第二方面,本申请实施例提供了第二方面的第二种可能的实施方式,其中,所述第一计算单元包括:
获取子单元,配置成获取非欺诈人群的目标特征范围和欺诈人群的目标特征范围;
第一提取子单元,配置成基于所述目标用户的行为数据和所述目标用户的设备数据提取所述目标用户的目标特征,其中,所述目标用户的目标特征包括:地理信息申请频次,IP的申请频次,设备电量占比,陀螺仪的平均加速度;
确定子单元,配置成结合所述非欺诈人群的目标特征范围,所述欺诈人群的目标特征范围以及所述目标用户的目标特征,确定所述目标用户所属的人群分布;
第一计算子单元,配置成基于所述目标用户所属的人群分布计算所述统计特征向量。
结合第二方面,本申请实施例提供了第二方面的第三种可能的实施方式,其中,所述第二计算单元具体配置成将所述目标用户的设备数据,所述目标用户的社交数据以及所述目标用户的申请数据与历史关系图谱建立关联,其中,所述历史关系图谱为根据历史授权数据 得到的关系图谱;通过社区发现算法对所述历史关系图谱进行计算,得到所述目标用户所属的社交群体;通过所述社交群体的欺诈风险更新所述历史关系图谱中边的权重值,得到更新后的关系图谱,其中,所述社交群体的欺诈风险为根据所述历史授权数据获得的;通过随机游走算法和node2vector对所述更新后的关系图谱进行计算,得到所述关系特征向量。
结合第二方面,本申请实施例提供了第二方面的第四种可能的实施方式,其中,所述第三计算单元具体配置成在所述目标用户的行为数据中提取输入行为数据;根据所述输入行为数据计算输入行为的输入总耗时、输入平均耗时、输入字符的平均间隔耗时和方差,其中,所述输入行为包括:输入身份证号的行为、输入手机号的行为和输入银行卡号的行为,所述方差用于表示输入字符间隔的波动情况;将所述输入总耗时、所述输入平均耗时、所述输入字符的平均间隔耗时和所述方差作为所述目标用户的所述输入行为特征向量;在所述目标用户的行为数据中提取操作行为数据;对所述操作行为数据进行分析,得到操作行为的操作时延序列,其中,所述操作行为为操作所述互联网信贷APP的行为;将所述操作时延序列作为所述操作行为特征向量。
结合第二方面,本申请实施例提供了第二方面的第五种可能的实施方式,其中,所述获取模块还配置成获取多个用户的历史授权数据作为训练样本;
所述构建模块还配置成基于多个所述训练样本构建所述训练样本的特征向量,其中,所述特征向量包括:统计特征向量、关系特征向量和行为特征向量;
所述训练模块还配置成通过K-MEANS算法根据所述训练样本的特征向量进行聚类训练,并对聚类结果进行标注得到训练后的无监督反欺诈机器学习模型。
第三方面,本申请实施例还提供了一种服务器,所述数据处理设备包括机器可读存储介质及处理器,所述机器可读存储介质存储有机器可执行的指令,所述指令在被所述处理器执行时,促使所述服务器实现本申请实施例提供所述互联网信贷场景下的实时欺诈检测方法。
本申请实施例至少带来了以下有益效果:本申请实施例提供了一种互联网信贷场景下的实时欺诈检测方法、装置及服务器,该方法包括:获取目标用户通过互联网信贷APP授权后发送的授权数据,其中,授权数据包括:目标用户的设备数据,目标用户的行为数据,目标用户的社交数据,目标用户的申请业务数据;基于授权数据构建目标用户的特征向量,其中,特征向量包括:统计特征向量,关系特征向量,行为特征向量;通过K-MEANS算法对特征向量进行训练,得到无监督反欺诈机器学习模型;通过无监督反欺诈机器学习模型对特征向量进行欺诈概率计算,得到目标用户的欺诈概率。
现有的基于规则引擎和监督机器学习模型的欺诈检测方法都是根据现有的欺诈模式得到的模型,只能识别现有的欺诈模式,无法在较短时间内识别新式的欺诈模式。与现有的基于规则引擎和监督机器学习模型的欺诈检测方法相比,本申请实施例中的互联网信贷场景下的实时欺诈检测方法中,能够将目标用户的授权数据向量化,得到目标用户的特征向量,通过K-MEANS算法对特征向量进行训练,得到无监督反欺诈机器学习模型,最终,通过无监督反欺诈机器学习模型对目标用户的特征向量进行欺诈概率计算,便能够得到目标用户的欺诈概率。该方法充分利用了目标用户的授权数据,如果目标用户以蓄意欺诈的目的进行信贷申请,则欺诈的蛛丝马迹会隐藏于授权数据中,授权数据为非结构化数据,无法用于K-MEANS算法进行建模,所以需要进行向量化,得到目标用户的特征向量,进而建模得到无监督反欺诈机器学习模型,最终,通过无监督反欺诈机器学习模型对特征向量进行欺诈概率计算,得到目标用户的欺诈概率,该方法能够实时发现新式的欺诈模式,帮助互联网信贷产业有效应对欺诈风险,缓解了现有的欺诈检测方法无法在较短时间内识别出新式的欺诈模式的技术问题。
本申请的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种服务器的硬件结构示意图;
图2为本申请实施例提供的一种互联网信贷场景下的实时欺诈检测方法的流程图;
图3为本申请实施例提供的基于授权数据构建目标用户的特征向量的流程图;
图4为本申请实施例提供的对目标用户的行为数据和目标用户的设备数据进行计算,得到统计特征向量的流程图;
图5为本申请实施例提供的对目标用户的社交数据,目标用户的申请数据和目标用户的设备数据进行计算,得到关系特征向量的流程图;
图6为本申请实施例提供的对目标用户的行为数据进行计算,得到行为特征向量的流程图;
图7为本申请实施例提供的一种互联网信贷场景下的实时欺诈检测装置的示意图。
图标:
100-服务器;120-机器可读存储介质;130-处理器;140-通信单元;11-获取模块;12-构建模块;13-训练模块;14-第一欺诈概率计算模块。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合附图对本申请的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为便于对本实施例进行理解,首先对本申请实施例所公开的一种互联网信贷场景下的实时欺诈检测方法进行详细介绍。
请参照图1,图1为本实施例提供的一种服务器100的结构示意图,该服务器100包括机器可读存储介质120、处理器130、通信单元140。
机器可读存储介质120、处理器130以及通信单元140各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。
其中,机器可读存储介质120可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-Only Memory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。机器可读存储介质120配置成存储机器可执行指令,处理器130执行这些指令,促织服务器100实现本申请实施例提供的方法。
通信单元140配置成与客户端(如手机APP)进行交互以获取客户端发送的数据或向客户端发送指令。
请参照图2,本申请还提供一种互联网信贷场景下的实时欺诈检测方法,该方法包括:
步骤S102、获取目标用户通过互联网信贷APP授权后发送的授权数据,其中,授权数据包括:目标用户的设备数据、目标用户的行为数据、目标用户的社交数据和目标用户的申请业务数据。
在本申请实施例中,用户在进行信贷申请时,一般需要在手机端使用互联网信贷APP填写相关数据,填写完毕后,授权进行申请,所以,称之为授权数据。
该互联网信贷场景下的实时欺诈检测方法的执行主体为服务器,服务器100可以通过通信单元140获取APP发送的授权数据。具体的,授权数据包括目标用户的设备数据、目标用户的 行为数据、目标用户的社交数据和目标用户的申请业务数据。
设备数据包括手机号、GPS位置数据、MAC地址数据和IP地址数据等等,本申请实施例对其不做具体限制。
行为数据包括操作行为数据和输入行为数据。操作行为数据是指操作互联网信贷APP时的数据;输入行为数据是指输入身份证号、输入手机号和输入银行卡号等,本申请实施例对其不做具体限制。
步骤S104、基于授权数据构建目标用户的特征向量,其中,特征向量包括统计特征向量、关系特征向量和行为特征向量。
在得到授权数据后,由于设备数据、行为数据和社交数据为非结构化数据,无法用于后期的应用计算,服务器100的处理器130可以将这些非结构化数据进行结构化。具体的,基于授权数据构建目标用户的特征向量包括了统计特征向量、关系特征向量和行为特征向量。
步骤S106、通过K-MEANS算法对特征向量进行训练,得到无监督反欺诈机器学习模型。
在本申请实施例中,服务器100的处理器130可以基于步骤S102和S104的数据对无监督反欺诈机器学习模型进行训练,得到更新后的无监督反欺诈机器学习模型。
在得到目标用户的特征向量后,通过K-MEANS算法对特征向量进行训练,更新无监督反欺诈机器学习模型。K-MEANS算法为无监督机器学习算法中的一种,本申请中在使用K-MEANS算法时,其中的K是通过高斯函数对授权数据进行分析后得到的。
步骤S108、通过无监督反欺诈机器学习模型对特征向量进行欺诈概率计算,得到目标用户的欺诈概率。
服务器100的处理器130可以在得到无监督反欺诈机器学习模型后,通过无监督反欺诈机器学习模型对特征向量进行欺诈概率计算,就能够得到目标用户的欺诈概率。
具体的,在后台服务器100中,已经事先构建了无监督反欺诈机器学习模型。该无监督反欺诈机器学习模型为根据大量用户的历史授权数据作为训练样本,按照步骤S102至步骤S106的方式进行无监督训练,对历史授权数据进行特征提取及聚类分析,根据聚类结果得到划分用户群体,从而可以对具有相似欺诈行为的用户进行标注,使构建得到无监督反欺诈机器学习模型可以根据待识别用户对应的特征向量进行欺诈概率计算。
在无监督反欺诈机器学习模型为建立完成后,该模型进行在对目标用户进行识别的同时也可以在线实时学习,新来的授权数据进行步骤S102至步骤S108的计算,得到欺诈概率,并对该模型进行不断迭代优化。
现有的基于规则引擎和监督机器学习模型的欺诈检测方法都是根据现有的欺诈模式得到的模型,只能识别现有的欺诈模式,无法在较短时间内识别新式的欺诈模式。与现有的基于规则 引擎和监督机器学习模型的欺诈检测方法相比,本申请实施例中的互联网信贷场景下的实时欺诈检测方法中,能够将目标用户的授权数据向量化,得到目标用户的特征向量,通过K-MEANS算法对特征向量进行训练,得到无监督反欺诈机器学习模型,最终,通过无监督反欺诈机器学习模型对目标用户的特征向量进行欺诈概率计算,便能够得到目标用户的欺诈概率。该方法充分利用了目标用户的授权数据,如果目标用户以蓄意欺诈的目的进行信贷申请,则欺诈的蛛丝马迹会隐藏于授权数据中,授权数据为非结构化数据,无法用于K-MEANS算法进行建模,所以需要进行向量化,得到目标用户的特征向量,进而建模得到无监督反欺诈机器学习模型,最终,通过无监督反欺诈机器学习模型对特征向量进行欺诈概率计算,得到目标用户的欺诈概率,该方法能够实时发现新式的欺诈模式,帮助互联网信贷产业有效应对欺诈风险,缓解了现有的欺诈检测方法无法在较短时间内识别出新式的欺诈模式的技术问题。
上述内容对互联网信贷场景下的实时欺诈检测方法进行了简要描述,下面对其中涉及的具体内容进行详细描述。
可选地,参考图3,基于授权数据构建目标用户的特征向量包括:
步骤S201、对目标用户的行为数据和目标用户的设备数据进行计算,得到统计特征向量。
具体的,服务器100的处理器130可以统计特征向量是根据目标用户的行为数据和目标用户的设备数据计算得到的,下文中再对具体的计算过程进行详细描述,在此不再赘述。
步骤S202、对目标用户的社交数据、目标用户的申请数据和目标用户的设备数据进行计算,得到关系特征向量。
具体的,关系特征向量是处理器130根据目标用户的社交数据、目标用户的申请数据和目标用户的设备数据计算得到的,下文中再对具体的计算过程进行详细描述,在此不再赘述。
步骤S203、对目标用户的行为数据进行计算,得到行为特征向量,其中,行为特征向量包括:输入行为特征向量和操作行为特征向量。
具体的,行为特征向量是处理器130根据目标用户的行为数据计算得到的,同样下文中再对该过程进行详细描述,在此不再赘述。
可选地,参考图4,对目标用户的行为数据和目标用户的设备数据进行计算,得到统计特征向量包括:
步骤S301、获取非欺诈人群的目标特征范围和欺诈人群的目标特征范围;
在本申请实施例中,目标特征包括地理信息申请频次、IP的申请频次、设备电量占比和陀螺仪的平均加速度等。非欺诈人群存在目标特征范围,欺诈人群也存在目标特征范围,该范围的得出可以由专家或者经验得出。比如地理信息申请频次小于10次为非欺诈人群,地理信息申请频次大于等于10次为欺诈人群,该举例是为了更好的理解本申请的方案,不应作为对本申请 实施力的限制。
目标特征可以为上述特征的一个或者多个,也可以包含其它特征,本申请实施例对其不做具体限制。
下面对地理信息申请频次的含义进行举例说明:检测同一时间段,比如说在3分钟内某地(GPS定位得到)方圆10公里以内信贷申请次数是多少。因为很多人是属于集中式诈骗,某个地域来说地理信息可能是集中过来进行的信贷申请,这就属于危险的。
IP的申请频次是指一个人同时操作多少IP进行信贷申请。
设备电量占比是指用户的手机设备电量的波动情况,如果没有波动,会被认定为恶意操控。
陀螺仪的平均加速度为0或很小,说明不符合正常人的使用方式,会被认定为欺诈的嫌疑。
步骤S302、基于目标用户的行为数据和目标用户的设备数据提取目标用户的目标特征,其中,目标用户的目标特征包括:地理信息申请频次、IP的申请频次、设备电量占比和陀螺仪的平均加速度。
步骤S303、结合非欺诈人群的目标特征范围,欺诈人群的目标特征范围以及目标用户的目标特征,确定目标用户所属的人群分布。
具体的,处理器130在得到目标用户的目标特征后,判断目标用户的目标特征落在哪一个目标特征范围内,确定得到目标用户所属的人群。
步骤S304、基于目标用户所属的人群分布计算统计特征向量。
处理器130在得到目标用户所属的人群分布后,就能够得到统计特征向量。具体的,目标用户的目标特征在目标特征范围的位置不同,得到的数值也不同,便能得到统计特征向量。
可选地,参考图5,对目标用户的社交数据,目标用户的申请数据和目标用户的设备数据进行计算,得到关系特征向量包括:
步骤S401、将目标用户的设备数据,目标用户的社交数据以及目标用户的申请数据与历史关系图谱建立关联,其中,历史关系图谱为根据历史授权数据得到的关系图谱;
在本申请实施例中,服务器中存在历史授权数据,所以,对应的也存在历史关系图谱。处理器130在得到目标用户的设备数据,目标用户的社交数据以及目标用户的申请数据后,将该些数据与历史关系图谱建立关联,比如,历史关系图谱中,存在一个MAC地址为A,目标用户的设备数据中的MAC地址也为A,便能够建立目标用户的授权数据与历史关系图谱的关联。
步骤S402、通过社区发现算法对历史关系图谱进行计算,得到目标用户所属的社交群体。
处理器130在建立与历史关系图谱的关联后,通过社区发现算法对建立关联后的历史关系图谱进行计算,得到目标用户所属的社交群体。
步骤S403、通过社交群体的欺诈风险更新历史关系图谱中边的权重值,得到更新后的关系 图谱,其中,社交群体的欺诈风险为根据历史授权数据获得的。
处理器130通过社交群体的欺诈风险更新历史关系图谱中边的权重值,得到更新后的关系图谱。其中,社交群体的欺诈风险已知。
步骤S404、通过随机游走算法和node2vector对更新后的关系图谱进行计算,得到关系特征向量。
处理器130在得到更新后的关系图谱后,通过随机游走算法和node2vector对更新后的关系图谱进行计算,得到关系特征向量。
可选地,参考图6,对目标用户的行为数据进行计算,得到行为特征向量包括:
步骤S501、在目标用户的行为数据中提取输入行为数据。
步骤S502、根据输入行为数据计算输入行为的输入总耗时、输入平均耗时和输入字符的平均间隔耗时,方差,其中,输入行为包括:输入身份证号的行为、输入手机号的行为和输入银行卡号的行为,方差用于表示输入字符间隔的波动情况。
步骤S503、将输入总耗时,输入平均耗时,输入字符的平均间隔耗时,方差作为目标用户的输入行为特征向量。
步骤S504、在目标用户的行为数据中提取操作行为数据。
步骤S505、对操作行为数据进行分析,得到操作行为的操作时延序列,其中,操作行为为操作互联网信贷APP的行为。
具体的,操作互联网信贷APP时,如果操作步骤固定,每步之间存在一定的时延序列。
步骤S506、将操作时延序列作为操作行为特征向量。
可选地,该方法还包括:
通过无监督反欺诈机器学习模型对目标用户所属的群体进行欺诈概率计算,得到群体的欺诈概率。
通过无监督反欺诈机器学习模型发现目标用户所属的群体,通过关联性分析,识别是否为欺诈团伙。
假如说聚类得到100个群体,其中有一个类跟其它的类差别很大,存在一个类偏离了另外99个类,假如有一个群跟其它群体距离差别非常大,说明它就是异常点,欺诈概率就大。
在聚类的时候也是看个体是不是跟它其他个体有相似性,有相似性肯定就归为一个群体里面,如果他没有相似性,说明他在群体之外,他就是异常点,欺诈概率就大。
可选地,该方法还包括:
(1)通过统计分析方法对目标用户所属的群体的操作行为进行计算,得到群体的行为模式向量;
(2)对行为模式向量进行实时监控;
(3)当行为模式向量出现显著变化时,确定群体为具有潜伏期的欺诈群体。
本申请公开了一种互联网信贷场景下的实时欺诈检测方法及装置,对无监督机器学习模型的技术创新应用到互联网信贷的风控反欺诈检测中,通过对用户的行为数据和关系数据的向量化计算,结合其它结构化特征通过K-MEANS算法构建无监督反欺诈机器学习模型,可以实时识别新式的欺诈模式和潜伏式的欺诈模式,提高了互联网信贷风控反欺诈方法的时效性和应变性,有效降低互联网信贷场景中的欺诈风险。
在实际的互联网信贷场景下,通过手机端的APP,在用户授权的前提下,获取用户的手机设备数据、行为数据、关系数据,若该用户以蓄意欺诈的目的进行信贷申请,则欺诈的蛛丝马迹会隐藏于相应的数据中。由于非结构化的行为和关系数据,无法应用于机器学习算法进行建模,通过将关系数据和行为数据进行向量化计算,转换为结构化的数据特征,最后将用户的所有特征组合为特征向量,通过K-MEANS算法,计算用户是否属于信贷申请用户中的异常点,通过关联计算,判断用户是否属于欺诈团伙成员,提高了互联网信贷风控反欺诈方法的时效性和应变性,有效降低互联网信贷场景中的欺诈风险。
请参照图7,本实施例还提供一种互联网信贷场景下的实时欺诈检测装置,该装置包括:
获取模块11,配置成获取目标用户通过互联网信贷APP授权后发送的授权数据,其中,授权数据包括:目标用户的设备数据,目标用户的行为数据,目标用户的社交数据,目标用户的申请业务数据;
构建模块12,配置成基于授权数据构建目标用户的特征向量,其中,特征向量包括:统计特征向量,关系特征向量,行为特征向量;
训练模块13,配置成通过K-MEANS算法对特征向量进行训练,得到无监督反欺诈机器学习模型;
第一欺诈概率计算模块14,配置成通过无监督反欺诈机器学习模型对特征向量进行欺诈概率计算,得到目标用户的欺诈概率。
本申请实施例中的互联网信贷场景下的实时欺诈检测装置中,能够将目标用户的授权数据向量化,得到目标用户的特征向量,通过K-MEANS算法对特征向量进行训练,得到无监督反欺诈机器学习模型,最终,通过无监督反欺诈机器学习模型对目标用户的特征向量进行欺诈概率计算,便能够得到目标用户的欺诈概率。该装置充分利用了目标用户的授权数据,如果目标用户以蓄意欺诈的目的进行信贷申请,则欺诈的蛛丝马迹会隐藏于授权数据中,授权数据为非结构化数据,无法用于K-MEANS算法进行建模,所以需要进行向量化,得到目标用户的特征向量,进而建模得到无监督反欺诈机器学习模型,最终,通过无监督反欺诈机器学习模型对特 征向量进行欺诈概率计算,得到目标用户的欺诈概率,该装置能够实时发现新式的欺诈模式,帮助互联网信贷产业有效应对欺诈风险,缓解了现有的欺诈检测装置无法在较短时间内识别出新式的欺诈模式的技术问题。
可选地,构建模块包括:
第一计算单元,配置成对目标用户的行为数据和目标用户的设备数据进行计算,得到统计特征向量;
第二计算单元,配置成对目标用户的社交数据,目标用户的申请数据和目标用户的设备数据进行计算,得到关系特征向量;
第三计算单元,配置成对目标用户的行为数据进行计算,得到行为特征向量,其中,行为特征向量包括:输入行为特征向量,操作行为特征向量。
可选地,第一计算单元包括:
获取子单元,配置成获取非欺诈人群的目标特征范围和欺诈人群的目标特征范围;
第一提取子单元,配置成基于目标用户的行为数据和目标用户的设备数据提取目标用户的目标特征,其中,目标用户的目标特征包括:地理信息申请频次,IP的申请频次,设备电量占比,陀螺仪的平均加速度;
确定子单元,配置成结合非欺诈人群的目标特征范围,欺诈人群的目标特征范围以及目标用户的目标特征,确定目标用户所属的人群分布;
第一计算子单元,配置成基于目标用户所属的人群分布计算统计特征向量。
可选地,第二计算单元包括:
建立关联子单元,配置成将目标用户的设备数据,目标用户的社交数据以及目标用户的申请数据与历史关系图谱建立关联,其中,历史关系图谱为根据历史授权数据得到的关系图谱;
第二计算子单元,配置成通过社区发现算法对历史关系图谱进行计算,得到目标用户所属的社交群体;
更新子单元,配置成通过社交群体的欺诈风险更新历史关系图谱中边的权重值,得到更新后的关系图谱,其中,社交群体的欺诈风险为根据历史授权数据获得的;
第三计算子单元,配置成通过随机游走算法和node2vector对更新后的关系图谱进行计算,得到关系特征向量。
可选地,第三计算单元包括:
第二提取子单元,配置成在目标用户的行为数据中提取输入行为数据;
第四计算子单元,配置成根据输入行为数据计算输入行为的输入总耗时,输入平均耗时,输入字符的平均间隔耗时,方差,其中,输入行为包括:输入身份证号的行为,输入手机号的 行为,输入银行卡号的行为,方差用于表示输入字符间隔的波动情况;
第一设定子单元,配置成将输入总耗时,输入平均耗时,输入字符的平均间隔耗时,方差作为目标用户的输入行为特征向量;
第三提取子单元,配置成在目标用户的行为数据中提取操作行为数据;
分析子单元,配置成对操作行为数据进行分析,得到操作行为的操作时延序列,其中,操作行为为操作互联网信贷APP的行为;
第二设定子单元,配置成将操作时延序列作为操作行为特征向量。
可选地,该装置还包括:
第二欺诈概率计算模块,配置成通过无监督反欺诈机器学习模型对目标用户所属的群体进行欺诈概率计算,得到群体的欺诈概率。
可选地,该装置还包括:
计算模块,配置成通过统计分析方法对目标用户所属的群体的操作行为进行计算,得到群体的行为模式向量;
实时监控模块,配置成对行为模式向量进行实时监控;
确定模块,配置成当行为模式向量出现显著变化时,确定群体为具有潜伏期的欺诈群体。
可选地,第二计算单元具体配置成将目标用户的设备数据,目标用户的社交数据以及目标用户的申请数据与历史关系图谱建立关联,其中,历史关系图谱为根据历史授权数据得到的关系图谱;通过社区发现算法对历史关系图谱进行计算,得到目标用户所属的社交群体;通过社交群体的欺诈风险更新历史关系图谱中边的权重值,得到更新后的关系图谱,其中,社交群体的欺诈风险为根据历史授权数据获得的;通过随机游走算法和node2vector对更新后的关系图谱进行计算,得到关系特征向量。
可选地,第三计算单元具体配置成在目标用户的行为数据中提取输入行为数据;根据输入行为数据计算输入行为的输入总耗时、输入平均耗时、输入字符的平均间隔耗时和方差,其中,输入行为包括:输入身份证号的行为、输入手机号的行为和输入银行卡号的行为,方差用于表示输入字符间隔的波动情况;将输入总耗时、输入平均耗时、输入字符的平均间隔耗时和方差作为目标用户的输入行为特征向量;在目标用户的行为数据中提取操作行为数据;对操作行为数据进行分析,得到操作行为的操作时延序列,其中,操作行为为操作互联网信贷APP的行为;将操作时延序列作为操作行为特征向量。
可选地,获取模块11还配置成获取多个用户的历史授权数据作为训练样本。
构建模块12还配置成基于多个训练样本构建训练样本的特征向量,其中,特征向量包括:统计特征向量、关系特征向量和行为特征向量。
训练模块13还配置成通过K-MEANS算法根据训练样本的特征向量进行聚类训练,并对聚类结果进行标注得到训练后的无监督反欺诈机器学习模型。
该实施例二中的具体内容可以参考上述实施例一中的具体描述,在此不再赘述。
本申请实施例所提供的互联网信贷场景下的实时欺诈检测方法及装置的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
另外,在本申请实施例的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本申请中的具体含义。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在本申请的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本申请和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本申请的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请 的保护范围应所述以权利要求的保护范围为准。
工业实用性
本申请实施例提供的互联网信贷场景下的实时欺诈检测方法、装置及服务器,能够将目标用户的授权数据向量化,得到目标用户的特征向量,通过K-MEANS算法对特征向量进行训练,得到无监督反欺诈机器学习模型,最终,通过无监督反欺诈机器学习模型对目标用户的特征向量进行欺诈概率计算,便能够得到目标用户的欺诈概率。该方法充分利用了目标用户的授权数据,如果目标用户以蓄意欺诈的目的进行信贷申请,则欺诈的蛛丝马迹会隐藏于授权数据中,授权数据为非结构化数据,无法用于K-MEANS算法进行建模,所以需要进行向量化,得到目标用户的特征向量,进而建模得到无监督反欺诈机器学习模型,最终,通过无监督反欺诈机器学习模型对特征向量进行欺诈概率计算,得到目标用户的欺诈概率,该方法能够实时发现新式的欺诈模式,帮助互联网信贷产业有效应对欺诈风险,缓解了现有的欺诈检测方法无法在较短时间内识别出新式的欺诈模式的技术问题。

Claims (15)

  1. 一种互联网信贷场景下的实时欺诈检测方法,其特征在于,所述方法包括:
    获取目标用户通过互联网信贷APP授权后发送的授权数据,其中,所述授权数据包括:所述目标用户的设备数据、所述目标用户的行为数据、所述目标用户的社交数据和所述目标用户的申请业务数据;
    基于所述授权数据构建所述目标用户的特征向量,其中,所述特征向量包括:统计特征向量、关系特征向量和行为特征向量;
    通过K-MEANS算法对所述特征向量进行训练,得到无监督反欺诈机器学习模型;
    通过所述无监督反欺诈机器学习模型对所述特征向量进行欺诈概率计算,得到所述目标用户的欺诈概率。
  2. 根据权利要求1所述的方法,其特征在于,基于所述授权数据构建所述目标用户的特征向量包括:
    对所述目标用户的行为数据和所述目标用户的设备数据进行计算,得到所述统计特征向量;
    对所述目标用户的社交数据、所述目标用户的申请数据和所述目标用户的设备数据进行计算,得到所述关系特征向量;
    对所述目标用户的行为数据进行计算,得到所述行为特征向量,其中,所述行为特征向量包括:输入行为特征向量和操作行为特征向量。
  3. 根据权利要求2所述的方法,其特征在于,对所述目标用户的行为数据和所述目标用户的设备数据进行计算,得到所述统计特征向量包括:
    获取非欺诈人群的目标特征范围和欺诈人群的目标特征范围;
    基于所述目标用户的行为数据和所述目标用户的设备数据提取所述目标用户的目标特征,其中,所述目标用户的目标特征包括:地理信息申请频次、IP的申请频次、设备电量占比和陀螺仪的平均加速度;
    结合所述非欺诈人群的目标特征范围,所述欺诈人群的目标特征范围以及所述目标用户的目标特征,确定所述目标用户所属的人群分布;
    基于所述目标用户所属的人群分布计算所述统计特征向量。
  4. 根据权利要求2或3所述的方法,其特征在于,对所述目标用户的社交数据,所述目标用户的申请数据和所述目标用户的设备数据进行计算,得到所述关系特征向量包括:
    将所述目标用户的设备数据,所述目标用户的社交数据以及所述目标用户的申请数据 与历史关系图谱建立关联,其中,所述历史关系图谱为根据历史授权数据得到的关系图谱;
    通过社区发现算法对所述历史关系图谱进行计算,得到所述目标用户所属的社交群体;
    通过所述社交群体的欺诈风险更新所述历史关系图谱中边的权重值,得到更新后的关系图谱,其中,所述社交群体的欺诈风险为根据所述历史授权数据获得的;
    通过随机游走算法和node2vector对所述更新后的关系图谱进行计算,得到所述关系特征向量。
  5. 根据权利要求2-4中任一项所述的方法,其特征在于,对所述目标用户的行为数据进行计算,得到所述行为特征向量包括:
    在所述目标用户的行为数据中提取输入行为数据;
    根据所述输入行为数据计算输入行为的输入总耗时、输入平均耗时、输入字符的平均间隔耗时和方差,其中,所述输入行为包括:输入身份证号的行为、输入手机号的行为和输入银行卡号的行为,所述方差用于表示输入字符间隔的波动情况;
    将所述输入总耗时、所述输入平均耗时、所述输入字符的平均间隔耗时和所述方差作为所述目标用户的所述输入行为特征向量;
    在所述目标用户的行为数据中提取操作行为数据;
    对所述操作行为数据进行分析,得到操作行为的操作时延序列,其中,所述操作行为为操作所述互联网信贷APP的行为;
    将所述操作时延序列作为所述操作行为特征向量。
  6. 根据权利要求1-5中任一项所述的方法,其特征在于,所述方法还包括:
    通过所述无监督反欺诈机器学习模型对所述目标用户所属的群体进行欺诈概率计算,得到所述群体的欺诈概率。
  7. 根据权利要求1所述的方法,其特征在于,所述方法还包括:
    通过统计分析方法对所述目标用户所属的群体的操作行为进行计算,得到所述群体的行为模式向量;
    对所述行为模式向量进行实时监控;
    当所述行为模式向量出现显著变化时,确定所述群体为具有潜伏期的欺诈群体。
  8. 根据权利要求1-7中任一项所述的方法,其特征在于,所述方法还包括:
    获取多个用户的历史授权数据作为训练样本;
    基于多个所述训练样本构建所述训练样本的特征向量,其中,所述特征向量包括:统计特征向量、关系特征向量和行为特征向量;
    通过K-MEANS算法根据所述训练样本的特征向量进行聚类训练,并对聚类结果进行 标注得到训练后的无监督反欺诈机器学习模型。
  9. 一种互联网信贷场景下的实时欺诈检测装置,其特征在于,所述装置包括:
    获取模块,配置成获取目标用户通过互联网信贷APP授权后发送的授权数据,其中,所述授权数据包括:所述目标用户的设备数据、所述目标用户的行为数据、所述目标用户的社交数据和所述目标用户的申请业务数据;
    构建模块,配置成基于所述授权数据构建所述目标用户的特征向量,其中,所述特征向量包括:统计特征向量、关系特征向量和行为特征向量;
    训练模块,配置成通过K-MEANS算法对所述特征向量进行训练,得到无监督反欺诈机器学习模型;
    第一欺诈概率计算模块,配置成通过所述无监督反欺诈机器学习模型对所述特征向量进行欺诈概率计算,得到所述目标用户的欺诈概率。
  10. 根据权利要求9所述的装置,其特征在于,所述构建模块包括:
    第一计算单元,配置成对所述目标用户的行为数据和所述目标用户的设备数据进行计算,得到所述统计特征向量;
    第二计算单元,配置成对所述目标用户的社交数据,所述目标用户的申请数据和所述目标用户的设备数据进行计算,得到所述关系特征向量;
    第三计算单元,配置成对所述目标用户的行为数据进行计算,得到所述行为特征向量,其中,所述行为特征向量包括:输入行为特征向量和操作行为特征向量。
  11. 根据权利要求10所述的装置,其特征在于,所述第一计算单元包括:
    获取子单元,配置成获取非欺诈人群的目标特征范围和欺诈人群的目标特征范围;
    第一提取子单元,配置成基于所述目标用户的行为数据和所述目标用户的设备数据提取所述目标用户的目标特征,其中,所述目标用户的目标特征包括:地理信息申请频次、IP的申请频次、设备电量占比和陀螺仪的平均加速度;
    确定子单元,配置成结合所述非欺诈人群的目标特征范围,所述欺诈人群的目标特征范围以及所述目标用户的目标特征,确定所述目标用户所属的人群分布;
    第一计算子单元,配置成基于所述目标用户所属的人群分布计算所述统计特征向量。
  12. 根据权利要求10或11所述的装置,其特征在于,所述第二计算单元具体配置成将所述目标用户的设备数据,所述目标用户的社交数据以及所述目标用户的申请数据与历史关系图谱建立关联,其中,所述历史关系图谱为根据历史授权数据得到的关系图谱;通过社区发现算法对所述历史关系图谱进行计算,得到所述目标用户所属的社交群体;通过所述社交群体的欺诈风险更新所述历史关系图谱中边的权重值,得到更新后的关系图谱,其 中,所述社交群体的欺诈风险为根据所述历史授权数据获得的;通过随机游走算法和node2vector对所述更新后的关系图谱进行计算,得到所述关系特征向量。
  13. 根据权利要求10-12中任一项所述的方法,其特征在于,所述第三计算单元具体配置成在所述目标用户的行为数据中提取输入行为数据;根据所述输入行为数据计算输入行为的输入总耗时、输入平均耗时、输入字符的平均间隔耗时和方差,其中,所述输入行为包括:输入身份证号的行为、输入手机号的行为和输入银行卡号的行为,所述方差用于表示输入字符间隔的波动情况;将所述输入总耗时、所述输入平均耗时、所述输入字符的平均间隔耗时和所述方差作为所述目标用户的所述输入行为特征向量;在所述目标用户的行为数据中提取操作行为数据;对所述操作行为数据进行分析,得到操作行为的操作时延序列,其中,所述操作行为为操作所述互联网信贷APP的行为;将所述操作时延序列作为所述操作行为特征向量。
  14. 根据权利要求9-13中任一项所述的装置,其特征在于,
    所述获取模块还配置成获取多个用户的历史授权数据作为训练样本;
    所述构建模块还配置成基于多个所述训练样本构建所述训练样本的特征向量,其中,所述特征向量包括:统计特征向量、关系特征向量和行为特征向量;
    所述训练模块还配置成通过K-MEANS算法根据所述训练样本的特征向量进行聚类训练,并对聚类结果进行标注得到训练后的无监督反欺诈机器学习模型。
  15. 一种服务器,其特征在于,所述数据处理设备包括机器可读存储介质及处理器,所述机器可读存储介质存储有机器可执行的指令,所述指令在被所述处理器执行时,促使所述服务器实现权利要求1-8任意一项所述的方法。
PCT/CN2018/109729 2018-01-12 2018-10-10 互联网信贷场景下的实时欺诈检测方法、装置及服务器 WO2019137050A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201810033615.2A CN108564460B (zh) 2018-01-12 2018-01-12 互联网信贷场景下的实时欺诈检测方法及装置
CN201810033615.2 2018-01-12

Publications (1)

Publication Number Publication Date
WO2019137050A1 true WO2019137050A1 (zh) 2019-07-18

Family

ID=63529793

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2018/109729 WO2019137050A1 (zh) 2018-01-12 2018-10-10 互联网信贷场景下的实时欺诈检测方法、装置及服务器

Country Status (2)

Country Link
CN (1) CN108564460B (zh)
WO (1) WO2019137050A1 (zh)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110852761A (zh) * 2019-10-11 2020-02-28 支付宝(杭州)信息技术有限公司 制定反作弊策略的方法、装置及电子设备
CN111222976A (zh) * 2019-12-16 2020-06-02 北京淇瑀信息科技有限公司 一种基于双方网络图数据的风险预测方法、装置和电子设备
CN111309822A (zh) * 2020-02-11 2020-06-19 深圳众赢维融科技有限公司 用户身份识别方法及装置
CN111881991A (zh) * 2020-08-03 2020-11-03 联仁健康医疗大数据科技股份有限公司 一种识别欺诈的方法、装置及电子设备
CN112200583A (zh) * 2020-10-28 2021-01-08 交通银行股份有限公司 一种基于知识图谱的欺诈客户识别方法
CN112241549A (zh) * 2020-05-26 2021-01-19 中国银联股份有限公司 安全的隐私计算方法、服务器、系统以及存储介质
CN112860949A (zh) * 2019-11-27 2021-05-28 国网电子商务有限公司 一种图谱特征的提取方法和装置
CN113094506A (zh) * 2021-04-14 2021-07-09 每日互动股份有限公司 一种基于关系图谱的预警方法、计算机设备及存储介质
CN113610122A (zh) * 2021-07-22 2021-11-05 上海淇玥信息技术有限公司 一种用户设备认证方法、装置和计算机设备
US11182797B1 (en) * 2021-02-16 2021-11-23 Capital One Services, Llc Direct data share
CN113706176A (zh) * 2021-09-02 2021-11-26 赵琦 一种结合云计算的信息反欺诈处理方法及服务平台系统
CN113850665A (zh) * 2021-09-14 2021-12-28 江苏中交车旺科技有限公司 基于物流金融知识图谱的防控欺诈方法和系统
US11257083B1 (en) 2021-02-16 2022-02-22 Capital One Services, Llc Dynamic transaction metadata validation adjustment based on network conditions
US11288668B1 (en) 2021-02-16 2022-03-29 Capital One Services, Llc Enhanced feedback exposure for users based on transaction metadata
US11443312B2 (en) 2021-02-16 2022-09-13 Capital One Services, Llc Enhanced feedback exposure for merchants based on transaction metadata
CN115730831A (zh) * 2023-01-10 2023-03-03 北京迈道科技有限公司 施工作业组织行为的安全指数评估方法、装置和电子设备
CN115860751A (zh) * 2023-02-27 2023-03-28 天津金城银行股份有限公司 反欺诈的分析处理方法、装置和电子设备
CN116542673A (zh) * 2023-07-05 2023-08-04 成都乐超人科技有限公司 应用于机器学习的欺诈行为识别方法及系统

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108564460B (zh) * 2018-01-12 2020-10-30 阳光财产保险股份有限公司 互联网信贷场景下的实时欺诈检测方法及装置
CN109583782B (zh) * 2018-12-07 2021-07-06 厦门铅笔头信息科技有限公司 支持多数据源的汽车金融风控方法
CN110009174B (zh) * 2018-12-13 2020-11-06 创新先进技术有限公司 风险识别模型训练方法、装置及服务器
CN109840778A (zh) * 2018-12-21 2019-06-04 上海拍拍贷金融信息服务有限公司 欺诈用户的识别方法及装置、可读存储介质
CN109754258B (zh) * 2018-12-24 2023-05-12 同济大学 一种基于个体行为建模的面向线上交易欺诈检测方法
CN109685647B (zh) * 2018-12-27 2021-08-10 阳光财产保险股份有限公司 信贷欺诈检测方法及其模型的训练方法、装置和服务器
CN111385420B (zh) * 2018-12-29 2022-04-29 中兴通讯股份有限公司 用户的识别方法、装置、存储介质及电子装置
CN109992578B (zh) * 2019-01-07 2023-08-08 平安科技(深圳)有限公司 基于无监督学习的反欺诈方法、装置、计算机设备及存储介质
CN110148001A (zh) * 2019-04-29 2019-08-20 上海欣方智能系统有限公司 一种实现欺诈交易智能预警的系统及方法
CN110390465A (zh) * 2019-06-18 2019-10-29 深圳壹账通智能科技有限公司 业务数据的风控分析处理方法、装置和计算机设备
CN110363406A (zh) * 2019-06-27 2019-10-22 上海淇馥信息技术有限公司 一种客户中介风险的评估方法、装置和电子设备
CN110765117B (zh) * 2019-09-30 2023-09-26 建信金融科技有限责任公司 欺诈识别方法、装置、电子设备及计算机可读存储介质
CN111127185A (zh) * 2019-11-25 2020-05-08 北京明略软件系统有限公司 信贷欺诈识别模型构建方法及装置
CN111127026A (zh) * 2019-12-13 2020-05-08 深圳中兴飞贷金融科技有限公司 确定用户欺诈行为的方法、装置、存储介质及电子设备
CN111476653A (zh) * 2019-12-24 2020-07-31 马上消费金融股份有限公司 一种风险信息识别、确定、模型训练方法及装置
CN111222981A (zh) * 2020-01-16 2020-06-02 中国建设银行股份有限公司 可信度确定方法、装置、设备和存储介质
CN111639681A (zh) * 2020-05-09 2020-09-08 同济大学 基于教唆型欺诈的预警方法、系统、介质及设备
CN111932269B (zh) * 2020-08-11 2023-08-18 中国工商银行股份有限公司 设备信息处理方法及装置
CN112819611A (zh) * 2021-03-02 2021-05-18 成都新希望金融信息有限公司 欺诈识别方法、装置、电子设备和计算机可读存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105512938A (zh) * 2016-02-03 2016-04-20 宜人恒业科技发展(北京)有限公司 一种基于用户长期使用行为的在线信用风险评估方法
CN106529773A (zh) * 2016-10-31 2017-03-22 宜人恒业科技发展(北京)有限公司 一种基于验证码式问答的在线信用和欺诈风险评估方法
WO2017067153A1 (zh) * 2015-10-22 2017-04-27 腾讯科技(深圳)有限公司 基于文本分析的信用风险评估方法及装置、存储介质
CN107194803A (zh) * 2017-05-19 2017-09-22 南京工业大学 一种p2p网贷借款人信用风险评估的装置
CN108564460A (zh) * 2018-01-12 2018-09-21 阳光财产保险股份有限公司 互联网信贷场景下的实时欺诈检测方法及装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103279868B (zh) * 2013-05-22 2016-08-17 兰亭集势有限公司 一种自动识别欺诈订单的方法和装置
GB2547395A (en) * 2014-12-09 2017-08-16 Beijing Didi Infinity Tech And Dev Co Ltd User maintenance system and method
CN105516152B (zh) * 2015-12-15 2019-03-29 云南大学 异常行为检测方法
CN105894372B (zh) * 2016-06-13 2018-03-16 腾讯科技(深圳)有限公司 预测群体信用的方法和装置
CN106682985B (zh) * 2016-12-26 2020-03-27 深圳先进技术研究院 一种金融诈骗识别方法和系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017067153A1 (zh) * 2015-10-22 2017-04-27 腾讯科技(深圳)有限公司 基于文本分析的信用风险评估方法及装置、存储介质
CN105512938A (zh) * 2016-02-03 2016-04-20 宜人恒业科技发展(北京)有限公司 一种基于用户长期使用行为的在线信用风险评估方法
CN106529773A (zh) * 2016-10-31 2017-03-22 宜人恒业科技发展(北京)有限公司 一种基于验证码式问答的在线信用和欺诈风险评估方法
CN107194803A (zh) * 2017-05-19 2017-09-22 南京工业大学 一种p2p网贷借款人信用风险评估的装置
CN108564460A (zh) * 2018-01-12 2018-09-21 阳光财产保险股份有限公司 互联网信贷场景下的实时欺诈检测方法及装置

Cited By (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110852761A (zh) * 2019-10-11 2020-02-28 支付宝(杭州)信息技术有限公司 制定反作弊策略的方法、装置及电子设备
CN110852761B (zh) * 2019-10-11 2023-07-04 支付宝(杭州)信息技术有限公司 制定反作弊策略的方法、装置及电子设备
CN112860949A (zh) * 2019-11-27 2021-05-28 国网电子商务有限公司 一种图谱特征的提取方法和装置
CN111222976A (zh) * 2019-12-16 2020-06-02 北京淇瑀信息科技有限公司 一种基于双方网络图数据的风险预测方法、装置和电子设备
CN111222976B (zh) * 2019-12-16 2024-04-23 北京淇瑀信息科技有限公司 一种基于双方网络图数据的风险预测方法、装置和电子设备
CN111309822A (zh) * 2020-02-11 2020-06-19 深圳众赢维融科技有限公司 用户身份识别方法及装置
CN111309822B (zh) * 2020-02-11 2023-05-09 简链科技(广东)有限公司 用户身份识别方法及装置
CN112241549A (zh) * 2020-05-26 2021-01-19 中国银联股份有限公司 安全的隐私计算方法、服务器、系统以及存储介质
CN111881991A (zh) * 2020-08-03 2020-11-03 联仁健康医疗大数据科技股份有限公司 一种识别欺诈的方法、装置及电子设备
CN111881991B (zh) * 2020-08-03 2023-11-10 联仁健康医疗大数据科技股份有限公司 一种识别欺诈的方法、装置及电子设备
CN112200583B (zh) * 2020-10-28 2023-12-19 交通银行股份有限公司 一种基于知识图谱的欺诈客户识别方法
CN112200583A (zh) * 2020-10-28 2021-01-08 交通银行股份有限公司 一种基于知识图谱的欺诈客户识别方法
US11935047B2 (en) 2021-02-16 2024-03-19 Capital One Services, Llc Enhanced feedback exposure for merchants based on transaction metadata
US11288668B1 (en) 2021-02-16 2022-03-29 Capital One Services, Llc Enhanced feedback exposure for users based on transaction metadata
US11935038B2 (en) 2021-02-16 2024-03-19 Capital One Services, Llc Direct data share
US11443312B2 (en) 2021-02-16 2022-09-13 Capital One Services, Llc Enhanced feedback exposure for merchants based on transaction metadata
US11257083B1 (en) 2021-02-16 2022-02-22 Capital One Services, Llc Dynamic transaction metadata validation adjustment based on network conditions
US11645652B2 (en) 2021-02-16 2023-05-09 Capital One Services, Llc Enhanced feedback exposure for users based on transaction metadata
US11669838B2 (en) 2021-02-16 2023-06-06 Capital One Services, Llc Dynamic transmission metadata validation adjustment based on network conditions
US11182797B1 (en) * 2021-02-16 2021-11-23 Capital One Services, Llc Direct data share
US11710121B2 (en) 2021-02-16 2023-07-25 Capital One Services, Llc Transaction resolution data platform
CN113094506A (zh) * 2021-04-14 2021-07-09 每日互动股份有限公司 一种基于关系图谱的预警方法、计算机设备及存储介质
CN113094506B (zh) * 2021-04-14 2023-08-18 每日互动股份有限公司 一种基于关系图谱的预警方法、计算机设备及存储介质
CN113610122A (zh) * 2021-07-22 2021-11-05 上海淇玥信息技术有限公司 一种用户设备认证方法、装置和计算机设备
CN113706176B (zh) * 2021-09-02 2022-08-19 江西裕民银行股份有限公司 一种结合云计算的信息反欺诈处理方法及服务平台系统
CN113706176A (zh) * 2021-09-02 2021-11-26 赵琦 一种结合云计算的信息反欺诈处理方法及服务平台系统
CN113850665B (zh) * 2021-09-14 2023-09-12 江苏中交车旺科技有限公司 基于物流金融知识图谱的防控欺诈方法和系统
CN113850665A (zh) * 2021-09-14 2021-12-28 江苏中交车旺科技有限公司 基于物流金融知识图谱的防控欺诈方法和系统
CN115730831A (zh) * 2023-01-10 2023-03-03 北京迈道科技有限公司 施工作业组织行为的安全指数评估方法、装置和电子设备
CN115860751A (zh) * 2023-02-27 2023-03-28 天津金城银行股份有限公司 反欺诈的分析处理方法、装置和电子设备
CN116542673A (zh) * 2023-07-05 2023-08-04 成都乐超人科技有限公司 应用于机器学习的欺诈行为识别方法及系统
CN116542673B (zh) * 2023-07-05 2023-09-08 成都乐超人科技有限公司 应用于机器学习的欺诈行为识别方法及系统

Also Published As

Publication number Publication date
CN108564460A (zh) 2018-09-21
CN108564460B (zh) 2020-10-30

Similar Documents

Publication Publication Date Title
WO2019137050A1 (zh) 互联网信贷场景下的实时欺诈检测方法、装置及服务器
CN109922032B (zh) 用于确定登录账户的风险的方法、装置、设备及存储介质
CN110009174B (zh) 风险识别模型训练方法、装置及服务器
CN105376255B (zh) 一种基于K-means聚类的Android平台入侵检测方法
CN110473328B (zh) 社区门禁管理方法及装置、存储介质、电子设备
CN107566358A (zh) 一种风险预警提示方法、装置、介质及设备
CN108920947A (zh) 一种基于日志图建模的异常检测方法和装置
CN111309822B (zh) 用户身份识别方法及装置
CN106067088A (zh) 电子银行访问行为的检测方法和装置
CN112700252B (zh) 一种信息安全性检测方法、装置、电子设备和存储介质
CN112231570B (zh) 推荐系统托攻击检测方法、装置、设备及存储介质
EP3489878A1 (en) Transaction confirmation and authentication based on device sensor data
CN112132676B (zh) 联合训练目标模型的贡献度的确定方法、装置和终端设备
CN112801670B (zh) 针对支付操作的风险评估方法及装置
CN115310762A (zh) 基于异构图神经网络的目标服务确定方法和装置
CN110162958B (zh) 用于计算设备的综合信用分的方法、装置和记录介质
WO2022142903A1 (zh) 身份识别方法、装置、电子设备及相关产品
CN111127185A (zh) 信贷欺诈识别模型构建方法及装置
CN110874638B (zh) 面向行为分析的元知识联邦方法、装置、电子设备及系统
WO2021053647A1 (en) Detection of use of malicious tools on mobile devices
CN111783073A (zh) 黑产识别方法、装置及可读存储介质
CN111259167A (zh) 用户请求风险识别方法及装置
CN113793174A (zh) 数据关联方法、装置、计算机设备和存储介质
Hu et al. Method of informational and psychological influence evaluation in social networks based on fuzzy logic
CN109873836A (zh) 一种数据的风险评估方法及装置

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 18899597

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

32PN Ep: public notification in the ep bulletin as address of the adressee cannot be established

Free format text: NOTING OF LOSS OF RIGHTS PURSUANT TO RULE 112(1) EPC (EPO FORM 1205A DATED 24.11.2020)

122 Ep: pct application non-entry in european phase

Ref document number: 18899597

Country of ref document: EP

Kind code of ref document: A1