CN111932269A - 设备信息处理方法及装置 - Google Patents
设备信息处理方法及装置 Download PDFInfo
- Publication number
- CN111932269A CN111932269A CN202010799239.5A CN202010799239A CN111932269A CN 111932269 A CN111932269 A CN 111932269A CN 202010799239 A CN202010799239 A CN 202010799239A CN 111932269 A CN111932269 A CN 111932269A
- Authority
- CN
- China
- Prior art keywords
- information
- equipment
- risk
- normalized
- risk category
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q20/00—Payment architectures, schemes or protocols
- G06Q20/38—Payment protocols; Details thereof
- G06Q20/40—Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
- G06Q20/401—Transaction verification
- G06Q20/4016—Transaction verification involving fraud or risk level assessment in transaction processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24147—Distances to closest patterns, e.g. nearest neighbour classification
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Accounting & Taxation (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Finance (AREA)
- Computer Security & Cryptography (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种设备信息处理方法及装置,属于人工智能领域,其中,该方法包括:获取访问设备的设备信息,并对设备信息进行归一化处理以生成归一化设备信息,设备信息包括:设备属性信息和用户操作行为信息;将归一化设备信息输入至预先训练的反欺诈模型,以生成设备信息的风险类别,反欺诈模型基于分类算法根据设备属性信息和用户操作行为信息预测访问设备的风险类别;根据访问设备的风险类别对相应地用户操作行为进行干预处理。通过本发明,可以较好地判断设备的欺诈属性,进而可以有效地对欺诈行为进行风险防控。
Description
技术领域
本发明涉及人工智能领域,具体涉及一种设备信息处理方法及装置。
背景技术
随着互联网金融的快速发展,用户的金融行为习惯发生了巨大的变化,线上渠道金融业务得到了大力发展。科技金融的发展呈现营销获客渠道多样化、交易线上化、账户虚拟化、身份识别远程化、数据海量化及非结构化的趋势。线上渠道为客户带来了便捷,同时也为网络黑产打开了一扇大门,身份盗用、团伙欺诈、账户盗用、羊毛党等行为严重危害了业务发展。
线上交易行为呈现多样性和复杂性,仅依靠账户等传统交易信息已无法全面掌握用户的操作行为,更无法提前有效地判断设备的欺诈属性,进而也无法有效地在事前对用户行为进行欺诈行为风险防控。
发明内容
有鉴于此,本发明提供一种设备信息处理方法及装置,以解决上述提及的至少一个问题。
根据本发明的第一方面,提供一种设备信息处理方法,所述方法包括:
获取访问设备的设备信息,并对所述设备信息进行归一化处理以生成归一化设备信息,所述设备信息包括:设备属性信息和用户操作行为信息;
将所述归一化设备信息输入至预先训练的反欺诈模型,以生成所述设备信息的风险类别,所述反欺诈模型基于分类算法根据所述设备属性信息和用户操作行为信息预测所述访问设备的风险类别;
根据所述访问设备的风险类别对相应地用户操作行为进行干预处理。
根据本发明的第二方面,提供一种设备信息处理装置,所述装置包括:
设备信息获取单元,用于获取访问设备的设备信息,所述设备信息包括:设备属性信息和用户操作行为信息;
归一化单元,用于对所述设备信息进行归一化处理以生成归一化设备信息;
风险类别生成单元,用于将所述归一化设备信息输入至预先训练的反欺诈模型,以生成所述设备信息的风险类别,所述反欺诈模型基于分类算法预测所述访问设备的风险类别;
干预单元,用于根据所述访问设备的风险类别对相应地用户操作行为进行干预处理。
根据本发明的第三方面,提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述方法的步骤。
根据本发明的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述方法的步骤。
由上述技术方案可知,通过将获取的访问设备的设备信息进行归一化处理后输入至预先训练的反欺诈模型,生成设备信息的风险类别,之后根据风险类别对访问设备上的用户操作行为进行干预处理,如此,可以较好地判断设备的欺诈属性,进而可以有效地对欺诈行为进行风险防控。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的设备信息处理方法的流程图;
图2是根据本发明实施例的设备信息处理方法的另一流程图;
图3是根据本发明实施例的设备信息处理装置的结构框图;
图4是根据本发明实施例的设备信息处理装置的详细结构框图;
图5是根据本发明实施例的模型训练单元的结构框图;
图6是根据本发明实施例的风险类别生成单元的结构框图;
图7为本发明实施例的电子设备600的系统构成的示意框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
由于传统反欺诈技术无法有效掌握用户线上操作行为,因而也无法有效地判断设备的欺诈属性,也无法有效地对欺诈行为进行风险防控。基于此,本发明实施例提供一种设备信息处理方案,基于设备信息进行反欺诈判定,可以有效地对欺诈行为进行风险防控,该方案优选地属于人工智能领域。以下结合附图来详细描述本发明实施例。
图1是根据本发明实施例的设备信息处理方法的流程图,如图1所示,该方法包括:
步骤101,获取访问设备的设备信息,并对所述设备信息进行归一化处理以生成归一化设备信息,所述设备信息包括:设备属性信息(例如,IP地址等)和用户操作行为信息(例如,登录网址,登录时间,操作时间等)。
步骤102,将所述归一化设备信息输入至预先训练的反欺诈模型,以生成所述设备信息的风险类别,所述反欺诈模型基于分类算法根据所述设备属性信息和用户操作行为信息预测所述访问设备的风险类别。
这里的风险类别可以是:高风险、中风险、低风险。
步骤103,根据所述访问设备的风险类别对相应地用户操作行为进行干预处理。
例如,针对高风险设备上的用户操作行为,实行拒绝处理。针对中风险设备上的用户操作行为,采用怀疑方式处理,应用人工客服或者客户经理跟踪的方式处理。针对低风险设备上的用户操作行为,采用通过的方式处理。
通过将获取的访问设备的设备信息进行归一化处理后输入至预先训练的反欺诈模型,生成设备信息的风险类别,之后根据风险类别对访问设备上的用户操作行为进行干预处理,如此,可以较好地判断设备的欺诈属性,进而可以有效地对欺诈行为进行风险防控。
在一个实施例中,反欺诈模型可以基于KNN(K-NearestNeighbor,K最近邻)算法来预测设备的风险类别。
在具体实施过程中,可以通过如下步骤来训练基于KNN的反欺诈模型:
(1)获取多个历史设备信息,并将所述多个历史设备信息划分为训练数据集和测试数据集,所述历史设备信息包括:历史设备属性信息、历史用户操作行为信息和历史风险类别;
(2)将各训练数据中的历史设备属性信息和历史用户操作行为信息进行归一化处理后输入至所述反欺诈模型以预测风险类别,并根据各训练数据中的历史风险类别和预测的风险类别对所述反欺诈模型进行训练;
(3)响应于各测试数据输入至所述反欺诈模型,预测的风险类别的准确性达到预定值,则所述反欺诈模型训练完成,其中,训练完成的反欺诈模型具有最优超参数。
上述超参数是算法KNN运行时确定的参数,最优超参数就是让分类(即,预测风险类别)准确度最高的那个超参数。
在训练模型初期,可以根据预定规则(例如,实际操作中的设置初始值的规则)设置初始超参数、超参数阈值和风险类别预测阈值;之后,将各训练数据循环遍历所述反欺诈模型,并根据模型预测的风险类别的准确性调整初始超参数,当预测的风险类别的准确性达到风险类别预测阈值时,将此时的超参数确定为最优超参数,此时,最优超参数位于所述超参数阈值的预定位置(例如,阈值范围的中间位置)。
这里的风险类别预测阈值可以依据实际情况而定,例如,测试过程中的最大值,或者,98%等。
在一个实施例中,在生成归一化设备信息之后,还可以对所述归一化设备信息中的多个特征变量进行变量聚类处理,以生成新的特征变量,作为KNN算法的特征变量用于模型计算。如此,可以降低某一类型样本特征变量偏大或偏小造成的影响,去除特征变量间的共线性,减少冗余指标,从而可以提高模型预测的准确性。
在对访问设备预测风险类别之后,可以根据上述新的特征变量和预测的风险类别为访问设备进行设备画像操作。
对于上述步骤102,可以先根据所述反欺诈模型中的最优超参数确定与所述归一化设备信息相关的多个测试数据;之后根据所述归一化设备信息与多个测试数据之间的相关程度、以及所述多个测试数据的历史风险类别确定所述设备信息的风险类别。
在一个实施例中,可以基于马氏距离算法和相似度度量算法确定所述归一化设备信息与各测试数据的相关程度;随后,根据所述最优超参数以及所述归一化设备信息与各测试数据的相关程度确定所述多个测试数据。
例如,根据相关程度对各测试数据进行排序,根据最优超参数(例如,K),取排序为前位K个测试数据作为与归一化设备信息相关的测试数据。
这里的相关程度可以用两个向量之间的马氏距离和相似度距离来度量,即,归一化设备信息与测试数据之间的相关程度,可以用这两个向量之间的距离来表示。使用马氏距离和相似度距离,是为了防止单一计算距离的偏差。
之后,可以根据归一化设备信息与各测试数据之间的距离来设置归一化设备信息与各测试数据之间的权重。一般来说,距离越近权重越大。随后,根据归一化设备信息与各测试数据之间的权重、以及各测试数据的历史风险类别确定所述设备信息的风险类别。
图2是根据本发明实施例的设备信息处理方法的另一流程图,如图2所示,先采集设备信息和用户操作行为信息;对获取的信息进行归一化处理,优选地,还可以对归一化处理后的数据进行特征变量聚类处理,以生成新的特别变量;之后,将新的特别变量输入至基于KNN算法的反欺诈模型进行模型训练,在训练完成后对设备进行风险类别判断,并根据判定的设备风险类别对在该设备上进行的业务进行风险防控。
另外,根据设备信息及其相应的风险类别可以生成设备名单库;以及,对设备用户操作行为分析,结合生成的设备的新特征变量可以绘制设备风险画像。这样,根据设备名单库和设备风险画像也可以对设备上进行的业务进行风险防控。
为了更好地理解本发明实施例,以下描述基于设备信息的反欺诈判定示例流程,该示例流程具体包括六个部分,以下分别描述各部分。
1、采集获取设备信息。运用设备指纹技术获取上网设备(例如,PC、手机、PAD等)硬件、软件、网络、用户行为等多层次属性,作为反欺诈模型的信息输入。采用混合式设备探测技术生成设备ID(标识),该设备ID用于精准标识访问设备。同时,根据欺诈事件历史数据为每一设备ID生成一个大概率标记,作为设备风险分类信息,该风险分类包括:高风险、中风险和低风险。
2、构建、训练及应用反欺诈模型。上述采集的历史数据中的设备信息和设备分类信息,可以以设备ID为主键标记建立数据库。对于获取到的历史数据,随机选取80%数据作为训练数据集,20%作为测试数据集。训练数据集作为样本数据,构建反欺诈模型,测试数据集用于模型效果的评估(参见以下第6部分)。之后,将样本数据作用于有监督学习KNN算法,得到包含设备信息和用户行为信息的欺诈模型。具体的模型的构建、训练及应用可以包括如下七个步骤:
(1)确定KNN算法的计算维度向量(例如,IP地址、登录时间、操作时间等),对测试集数据进行归一化处理。对于非数值型数据采用映射方式将其映射为数值型。最终,应用Z-score(z分数)标准化方法通过如下公式将所有数据映射到[0,1]:
(2)对归一化处理后的样本数据的特征变量进行预处理。为了降低某一类型样本特征变量偏大或偏小造成的影响,去除特征变量间的共线性,减少冗余指标,本发明实施例采用特征变量聚类方法对样本的特征变量进行分类。
具体地,初始设定所有样本的特征变量都归为一类,计算样本特征变量的相关系数矩阵,选择拥有第二大特征值的样本归为一类,直到所有群组的第二大特征值都小于临界值,临界值定义为特征值的平均值。在每个拆分的群组内,将每个样本的主成分做正交旋转,将变量划分到有最大平方相关的一方当中,由此拆选出相应群组的新的特征变量。主成分定义为上述相关系数矩阵的特征向量×原始样本特征。该步骤输出项是各群组样本新的特征变量,作为KNN算法的特征变量用于模型计算。同时可以作为以下第四部分的描绘设备画像的输入项,可用于设备画像的搭建。
(3)在KNN算法中,需要计算任意两个样本间距离。为了防止单一计算距离的偏差,模型采用两种计算距离方式:马氏距离和相似度度量。其中:马氏距离利用Choleskytransformation(变换)消除样本不同维度特征之间的相关性,当马氏距离越小时说明样本间差异越小。相似度度量可以计算样本间的相似程度,当相似度越小时说明样本间差异越大。以下分别详细描述马氏距离算法和相似度度量算法。
其中,i,j,m为正整数。
(4)定义超参数K,初始值为1。该超参数的定义是算法KNN运行时决定的参数,例如K=3,则计算新样本设备信息与3个样本点之间的距离,从而得到新样本设备的分类基础信息,即,根据这3个样本点的分类信息来确定新样本设备的分类信息。
(5)迭代训练超参数K。即,采用循环遍历的方式寻找最优超参数,最优超参数就是让分类准确度最高的那个超参数。分类准确度定义为:将测试集的样本数据进行KNN算法预测得到predict(预测)值,用predict值和测试集样本值比对,预测成功为1,分类准确度=sum(预测成功总数量)/测试集样本总数量。
具体地,初始化分类准确度,定义K的范围为[a,b],将测试集的样本循环遍历运行KNN算法找到分类准确度最高时对应的K,此时K为最优超参数,该过程即为迭代训练超参数K。在一个实施例中,当遍历超参数阈值范围,得到的最优超参数在阈值边界值附近时,需要重新扩展超参数阈值范围再进行遍历计算,直到超参数存在于阈值之间。
例如,初始化分类准确度为0.0,初始化K=1,定义K的范围是[1,11],运行算法得到分类准确度最高时对应的K。若得到的最优超参数在K的范围区间内,例如K=6,则6为最优超参数,此时完成遍历。若得到的最优超参数为K=10,说明最优超参数可能在边界值11附近,意味着有可能有更好的值在边界外面,此时重新定义K的范围[8,20],重新循环去寻找,直到超参数不在边界值附近为止。
这里,K的范围可以依据实际情况而定。
(6)输入获取到的新设备信息,并运行模型,得到新设备信息与其距离最近的K个样本数据之间的距离(即,相关程度)。
具体地,运用上述(5)迭代训练出的超参数K,应用马氏距离和相似度距离进行KNN算法计算新设备信息与各测试样本数据之间的距离,当马氏距离和相似度距离计算结果一致时,则记录对应的测试样本数据,之后对记录的测试样本数据按照距离的从小到大依次排序,获取排在前位的K个测试样本数据,即,找到了与新设备信息距离最近的K个点,分别记录新设备信息与这K个点之间的距离。这里的输出项新设备信息与K个样本点的距离将作为以下步骤(7)判断新设备欺诈属性的输入项。
(7)判断新设备的欺诈属性。根据属性相近的K个点,判断新设备的欺诈属性,进而用于反欺诈事前判断。
具体地,应用步骤(6)新设备信息与K个样本的距离,考虑距离的倒数作为权重来判断,即距离越近权重越大。这样可以解决平票和某类样本较多无法比较的问题。
对于某类样本较多无法比较问题,例如,最优超参数K=3,新设备信息Y与A、B、C三个样本距离分别为1、3、4,其中A为高风险、B和C为低风险。考虑距离的权重时,新设备信息Y与高风险A的相关关系是:1,新设备信息Y与低风险B和C的关系是1/3+1/4=7/12,1>7/12,因而根据样本A的风险信息,将新设备信息Y判断为高风险欺诈设备。
对于平票问题,例如,最优超参数K=3,新设备信息Y与A、B、C三个样本距离分别为1,3,4,其中A为高风险、B为中风险、C为低风险。考虑距离的权重时,新设备信息Y与A的关系为:1,新设备信息Y与B的关系为1/3,新设备信息Y与C的关系为1/4,1>1/3>1/4,则根据样本A的风险信息,将新设备信息Y判断为高风险欺诈设备。
3、建立设备名单库。设备名单库以设备ID作为标识,根据上述预测的新设备的欺诈属性分类,建立黑名单库和灰名单库。其中,高风险设备进入黑名单库,中风险设备进入灰名单库。设备名单库将用于线上交易行为发生时的欺诈判断。在实际操作中,设备名单库会定期与存量样本做对比,按照高风险、中风险、低风险建立新增和退出机制,优化样本集分类。
4、构建设备画像。设备画像可以围绕设备ID,对设备进行行为画像描绘,出具设备画像报告。通过设备画像报告,可以发现设备欺诈事件的发展趋势,是重点防控的依据。
具体地,构建设备画像的流程包括:首先,输入设备的基础信息,通过上述第2部分步骤(2)的样本变量聚类的输出项,找到每个类别群组前两大类的特征,剔除掉冗余信息,避免模糊其他类别特征价值。按照各类群组特征相关维度的设备行为画像,例如,行为偏好、身份特征,交易场所、使用习惯、操作行为轨迹等。之后,通过不同类别(即,高风险、中风险和低风险)下每类特征的表现,做类间差别分析。特别是不同类别下,设备上用户操作特征描绘,包括访问地点、访问时间、访问频度等,以时间为轴描绘设备活跃轨迹。最后,分析不同类别下设备的欺诈行为表现,分析欺诈行为与各类特征关系,进而发现设备欺诈事件有关联的特征类别以及该类别下的具体特征,用于重点防控。
5、实现设备反欺诈的系统化部署。基于采集到的设备和用户操作行为信息,进行KNN算法的模型训练。当出现新设备信息时,通过反欺诈模型进行设备类别判断,实现设备的事前欺诈识别,对判断出欺诈属性的设备上的用户操作行为进行恰当干预。同时,针对采集信息进行分析,建立设备画像,出具设备画像报告,发现设备欺诈事件的发展趋势,及早做防控预警。
6、实现反欺诈模型效果评估。针对获取的设备和用户操作行为信息,作为样本数据,定期将这些样本数据打乱,随机选取80%数据作为训练数据集,20%作为测试数据集,其中,训练数据集用来进行模型训练,测试数据集的样本做模型效果评估。这样,反欺诈模型的预测效果可以更准确。
本发明实施例克服了传统反欺诈技术无法有效掌握用户线上操作行为的不足,基于设备信息和用户行为信息,建立了基于设备维度的欺诈判定方法,通过采集获取设备信息和用户行为信息、对反欺诈模型的构建和训练、构建设备画像和设备风险名单库,利用有监督机器学习算法对获取的设备信息进行迭代判断,从而可以有效地判定设备的欺诈属性和用户操作行为,进而可以有效地在事前对用户行为进行欺诈行为风险防控。
基于相似的发明构思,本发明实施例还提供一种设备信息处理装置,优选地,该装置用于实现上述方法实施例中的流程。
图3是根据本发明实施例的设备信息处理装置的结构框图,如图3所示,该装置包括:设备信息获取单元31、归一化单元32、风险类别生成单元33和干预单元34,其中:
设备信息获取单元31,用于获取访问设备的设备信息,所述设备信息包括:设备属性信息和用户操作行为信息。
归一化单元32,用于对所述设备信息进行归一化处理以生成归一化设备信息。
风险类别生成单元33,用于将所述归一化设备信息输入至预先训练的反欺诈模型,以生成所述设备信息的风险类别,所述反欺诈模型基于分类算法预测所述访问设备的风险类别。
干预单元34,用于根据所述访问设备的风险类别对相应地用户操作行为进行干预处理。
通过归一化单元32将设备信息获取单元31获取的访问设备的设备信息进行归一化处理,由风险类别生成单元33输入至预先训练的反欺诈模型,生成设备信息的风险类别,之后干预单元34根据风险类别对访问设备上的用户操作行为进行干预处理,如此,可以较好地判断设备的欺诈属性,进而可以有效地对欺诈行为进行风险防控。
在实际操作中,如图4所示,上述装置还可以包括:模型训练单元35,用于训练所述反欺诈模型。
具体地,如图5所示,该模型训练单元35包括:历史信息获取模块351、分类模块352和模型训练模块353,其中:
历史信息获取模块351,用于获取多个历史设备信息,所述历史设备信息包括:历史设备属性信息、历史用户操作行为信息和历史风险类别;
分类模块352,用于将所述多个历史设备信息划分为训练数据集和测试数据集;
模型训练模块353,用于将各训练数据中的历史设备属性信息和历史用户操作行为信息进行归一化处理后输入至所述反欺诈模型以预测风险类别,并根据各训练数据中的历史风险类别和预测的风险类别对所述反欺诈模型进行训练;响应于各测试数据输入至所述反欺诈模型,预测的风险类别的准确性达到预定值,则所述反欺诈模型训练完成,其中,所述反欺诈模型基于KNN算法,训练完成的反欺诈模型具有最优超参数。
在具体实施过程中,继续参见图5,上述模型训练单元35还可以包括:初始参数设置模块354和最优超参数确定模块355,其中:
初始参数设置模块354,用于根据预定规则设置初始超参数、超参数阈值和风险类别预测阈值;
最优超参数确定模块355,用于将各训练数据循环遍历输入所述反欺诈模型,并根据所述预测的风险类别的准确性调整所述初始超参数到所述最优超参数,以使所述预测的风险类别的准确性达到所述风险类别预测阈值,其中,所述最优超参数位于所述超参数阈值的预定位置。
如图6所示,上述风险类别生成单元33具体包括:相关测试数据确定模块331和风险类别确定模块332,其中:
相关测试数据确定模块,用于根据所述反欺诈模型中的最优超参数确定与所述归一化设备信息相关的多个测试数据;
风险类别确定模块,用于根据所述归一化设备信息与多个测试数据之间的相关程度、以及所述多个测试数据的历史风险类别确定所述设备信息的风险类别。
在一个实施例中,相关测试数据确定模块具体包括:数据相关程度确定子模块和相关测试数据确定子模块,其中:
数据相关程度确定子模块,用于基于马氏距离算法和相似度度量算法确定所述归一化设备信息与各测试数据的相关程度;
相关测试数据确定子模块,用于根据所述最优超参数以及所述归一化设备信息与各测试数据的相关程度确定所述多个测试数据。
在一个实施例中,相关程度可以通过距离信息表示。风险类别确定模块332可以根据所述归一化设备信息与各测试数据之间的距离信息设置所述归一化设备信息与各测试数据之间的权重;之后根据所述归一化设备信息与各测试数据之间的权重、以及各测试数据的历史风险类别确定所述设备信息的风险类别。
优选地,继续参见图4,上述装置还可以包括:
变量聚类单元36,用于对所述归一化设备信息中的多个特征变量进行变量聚类处理,以生成新的特征变量;
画像单元37,用于根据生成的新特征变量和预测的风险类别为所述访问设备进行设备画像操作。
在一个实施例中,上述装置还可以包括:名单库建立单元38,用于根据各访问设备的设备标识和风险类别建立设备名单库。
上述各单元、各模块、各子模块的具体执行过程,可以参见上述方法实施例中的描述,此处不再赘述。
在实际操作中,上述各单元、各模块、各子模块可以组合设置、也可以单一设置,本发明不限于此。
本实施例还提供一种电子设备,该电子设备可以是台式计算机、平板电脑及移动终端等,本实施例不限于此。在本实施例中,该电子设备可以参照上述方法实施例进行实施及设备信息处理装置的实施例进行实施,其内容被合并于此,重复之处不再赘述。
图7为本发明实施例的电子设备600的系统构成的示意框图。如图7所示,该电子设备600可以包括中央处理器100和存储器140;存储器140耦合到中央处理器100。值得注意的是,该图是示例性的;还可以使用其他类型的结构,来补充或代替该结构,以实现电信功能或其他功能。
一实施例中,设备信息处理功能可以被集成到中央处理器100中。其中,中央处理器100可以被配置为进行如下控制:
获取访问设备的设备信息,并对所述设备信息进行归一化处理以生成归一化设备信息,所述设备信息包括:设备属性信息和用户操作行为信息;
将所述归一化设备信息输入至预先训练的反欺诈模型,以生成所述设备信息的风险类别,所述反欺诈模型基于分类算法根据所述设备属性信息和用户操作行为信息预测所述访问设备的风险类别;
根据所述访问设备的风险类别对相应地用户操作行为进行干预处理。
从上述描述可知,本申请实施例提供的电子设备,通过将获取的访问设备的设备信息进行归一化处理后输入至预先训练的反欺诈模型,生成设备信息的风险类别,之后根据风险类别对访问设备上的用户操作行为进行干预处理,如此,可以较好地判断设备的欺诈属性,进而可以有效地对欺诈行为进行风险防控。
在另一个实施方式中,设备信息处理装置可以与中央处理器100分开配置,例如可以将设备信息处理装置配置为与中央处理器100连接的芯片,通过中央处理器的控制来实现设备信息处理功能。
如图7所示,该电子设备600还可以包括:通信模块110、输入单元120、音频处理单元130、显示器160、电源170。值得注意的是,电子设备600也并不是必须要包括图7中所示的所有部件;此外,电子设备600还可以包括图7中没有示出的部件,可以参考现有技术。
如图7所示,中央处理器100有时也称为控制器或操作控件,可以包括微处理器或其他处理器装置和/或逻辑装置,该中央处理器100接收输入并控制电子设备600的各个部件的操作。
其中,存储器140,例如可以是缓存器、闪存、硬驱、可移动介质、易失性存储器、非易失性存储器或其它合适装置中的一种或更多种。可储存上述与失败有关的信息,此外还可存储执行有关信息的程序。并且中央处理器100可执行该存储器140存储的该程序,以实现信息存储或处理等。
输入单元120向中央处理器100提供输入。该输入单元120例如为按键或触摸输入装置。电源170用于向电子设备600提供电力。显示器160用于进行图像和文字等显示对象的显示。该显示器例如可为LCD显示器,但并不限于此。
该存储器140可以是固态存储器,例如,只读存储器(ROM)、随机存取存储器(RAM)、SIM卡等。还可以是这样的存储器,其即使在断电时也保存信息,可被选择性地擦除且设有更多数据,该存储器的示例有时被称为EPROM等。存储器140还可以是某种其它类型的装置。存储器140包括缓冲存储器141(有时被称为缓冲器)。存储器140可以包括应用/功能存储部142,该应用/功能存储部142用于存储应用程序和功能程序或用于通过中央处理器100执行电子设备600的操作的流程。
存储器140还可以包括数据存储部143,该数据存储部143用于存储数据,例如联系人、数字数据、图片、声音和/或任何其他由电子设备使用的数据。存储器140的驱动程序存储部144可以包括电子设备的用于通信功能和/或用于执行电子设备的其他功能(如消息传送应用、通讯录应用等)的各种驱动程序。
通信模块110即为经由天线111发送和接收信号的发送机/接收机110。通信模块(发送机/接收机)110耦合到中央处理器100,以提供输入信号和接收输出信号,这可以和常规移动通信终端的情况相同。
基于不同的通信技术,在同一电子设备中,可以设置有多个通信模块110,如蜂窝网络模块、蓝牙模块和/或无线局域网模块等。通信模块(发送机/接收机)110还经由音频处理器130耦合到扬声器131和麦克风132,以经由扬声器131提供音频输出,并接收来自麦克风132的音频输入,从而实现通常的电信功能。音频处理器130可以包括任何合适的缓冲器、解码器、放大器等。另外,音频处理器130还耦合到中央处理器100,从而使得可以通过麦克风132能够在本机上录音,且使得可以通过扬声器131来播放本机上存储的声音。
本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时以实现上述设备信息处理方法的步骤。
综上所述,本发明实施例采集多层次的设备信息,丰富了反欺诈的数据应用场景;通过建立基于设备信息的反欺诈模型,实现了设备的事前欺诈判断;通过反欺诈模型过程中输出的特征属性,可用于描绘设备画像;根据反欺诈模型对设备类别的预测结果,可用于建立设备黑灰名单;通过测试样本集进行模型效果评估,实现了模型的自我优化。本发明实施例提供的基于设备信息的反欺诈判定方法,可以帮助金融机构完成用户线上操作行为的监督,实现了设备欺诈特性的事前判断,帮助金融机构了解风险场景,进一步落实管控方法。
以上参照附图描述了本发明的优选实施方式。这些实施方式的许多特征和优点根据该详细的说明书是清楚的,因此权利要求旨在覆盖这些实施方式的落入其真实精神和范围内的所有这些特征和优点。此外,由于本领域的技术人员容易想到很多修改和改变,因此不是要将本发明的实施方式限于所例示和描述的精确结构和操作,而是可以涵盖落入其范围内的所有合适修改和等同物。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (12)
1.一种设备信息处理方法,其特征在于,所述方法包括:
获取访问设备的设备信息,并对所述设备信息进行归一化处理以生成归一化设备信息,所述设备信息包括:设备属性信息和用户操作行为信息;
将所述归一化设备信息输入至预先训练的反欺诈模型,以生成所述设备信息的风险类别,所述反欺诈模型基于分类算法根据所述设备属性信息和用户操作行为信息预测所述访问设备的风险类别;
根据所述访问设备的风险类别对相应地用户操作行为进行干预处理。
2.根据权利要求1所述的方法,其特征在于,所述反欺诈模型基于KNN算法,通过如下方式训练所述反欺诈模型:
获取多个历史设备信息,并将所述多个历史设备信息划分为训练数据集和测试数据集,所述历史设备信息包括:历史设备属性信息、历史用户操作行为信息和历史风险类别;
将各训练数据中的历史设备属性信息和历史用户操作行为信息进行归一化处理后输入至所述反欺诈模型以预测风险类别,并根据各训练数据中的历史风险类别和预测的风险类别对所述反欺诈模型进行训练;
响应于各测试数据输入至所述反欺诈模型,预测的风险类别的准确性达到预定值,则所述反欺诈模型训练完成,其中,训练完成的反欺诈模型具有最优超参数。
3.根据权利要求2所述的方法,其特征在于,通过如下方式确定最优超参数:
根据预定规则设置初始超参数、超参数阈值和风险类别预测阈值;
将各训练数据循环遍历输入所述反欺诈模型,并根据所述预测的风险类别的准确性调整所述初始超参数到所述最优超参数,以使所述预测的风险类别的准确性达到所述风险类别预测阈值,其中,所述最优超参数位于所述超参数阈值的预定位置。
4.根据权利要求2所述的方法,其特征在于,将所述归一化设备信息输入至预先训练的反欺诈模型,以生成所述设备信息的风险类别包括:
根据所述反欺诈模型中的最优超参数确定与所述归一化设备信息相关的多个测试数据;
根据所述归一化设备信息与多个测试数据之间的相关程度、以及所述多个测试数据的历史风险类别确定所述设备信息的风险类别。
5.根据权利要求4所述的方法,其特征在于,根据所述反欺诈模型中的最优超参数确定与所述归一化设备信息相关的多个测试数据包括:
基于马氏距离算法和相似度度量算法确定所述归一化设备信息与各测试数据的相关程度;
根据所述最优超参数以及所述归一化设备信息与各测试数据的相关程度确定所述多个测试数据。
6.根据权利要求5所述的方法,其特征在于,所述相关程度通过距离信息表示,根据所述归一化设备信息与多个测试数据之间的相关程度、以及所述多个测试数据的历史风险类别确定所述设备信息的风险类别包括:
根据所述归一化设备信息与各测试数据之间的距离信息设置所述归一化设备信息与各测试数据之间的权重;
根据所述归一化设备信息与各测试数据之间的权重、以及各测试数据的历史风险类别确定所述设备信息的风险类别。
7.根据权利要求1至6中任一项所述的方法,其特征在于,生成归一化设备信息之后,所述方法还包括:对所述归一化设备信息中的多个特征变量进行变量聚类处理,以生成新的特征变量。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
根据生成的新特征变量和预测的风险类别为所述访问设备进行设备画像操作。
9.根据权利要求1至6中任一项所述的方法,其特征在于,所述方法还包括:
根据各访问设备的设备标识和风险类别建立设备名单库。
10.一种设备信息处理装置,其特征在于,所述装置包括:
设备信息获取单元,用于获取访问设备的设备信息,所述设备信息包括:设备属性信息和用户操作行为信息;
归一化单元,用于对所述设备信息进行归一化处理以生成归一化设备信息;
风险类别生成单元,用于将所述归一化设备信息输入至预先训练的反欺诈模型,以生成所述设备信息的风险类别,所述反欺诈模型基于分类算法预测所述访问设备的风险类别;
干预单元,用于根据所述访问设备的风险类别对相应地用户操作行为进行干预处理。
11.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至9中任一项所述方法的步骤。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至9中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010799239.5A CN111932269B (zh) | 2020-08-11 | 2020-08-11 | 设备信息处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010799239.5A CN111932269B (zh) | 2020-08-11 | 2020-08-11 | 设备信息处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111932269A true CN111932269A (zh) | 2020-11-13 |
CN111932269B CN111932269B (zh) | 2023-08-18 |
Family
ID=73308161
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010799239.5A Active CN111932269B (zh) | 2020-08-11 | 2020-08-11 | 设备信息处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111932269B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112488863A (zh) * | 2020-12-01 | 2021-03-12 | 中国人寿保险股份有限公司 | 一种在用户冷启动场景下的险种推荐方法及相关设备 |
CN112766681A (zh) * | 2021-01-11 | 2021-05-07 | 杭州迪普科技股份有限公司 | 设备分类管理方法及装置 |
CN112926045A (zh) * | 2021-02-24 | 2021-06-08 | 北京通付盾人工智能技术有限公司 | 一种基于逻辑回归模型的群控设备识别方法 |
CN113095807A (zh) * | 2021-04-09 | 2021-07-09 | 中国工商银行股份有限公司 | 信息处理方法、装置、计算机系统和计算机可读存储介质 |
CN113570222A (zh) * | 2021-07-15 | 2021-10-29 | 北京淇瑀信息科技有限公司 | 一种用户设备鉴别方法、装置和计算机设备 |
CN113610132A (zh) * | 2021-07-29 | 2021-11-05 | 上海淇玥信息技术有限公司 | 一种用户设备鉴别方法、装置和计算机设备 |
CN113610122A (zh) * | 2021-07-22 | 2021-11-05 | 上海淇玥信息技术有限公司 | 一种用户设备认证方法、装置和计算机设备 |
CN115860751A (zh) * | 2023-02-27 | 2023-03-28 | 天津金城银行股份有限公司 | 反欺诈的分析处理方法、装置和电子设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108564460A (zh) * | 2018-01-12 | 2018-09-21 | 阳光财产保险股份有限公司 | 互联网信贷场景下的实时欺诈检测方法及装置 |
CN109035003A (zh) * | 2018-07-04 | 2018-12-18 | 北京玖富普惠信息技术有限公司 | 基于机器学习的反欺诈模型建模方法和反欺诈监控方法 |
CN109657805A (zh) * | 2018-12-07 | 2019-04-19 | 泰康保险集团股份有限公司 | 超参数确定方法、装置、电子设备及计算机可读介质 |
CN110782333A (zh) * | 2019-08-26 | 2020-02-11 | 腾讯科技(深圳)有限公司 | 一种设备风险控制方法、装置、设备及介质 |
CN110969285A (zh) * | 2019-10-29 | 2020-04-07 | 京东方科技集团股份有限公司 | 预测模型训练方法、预测方法、装置、设备及介质 |
CN111275546A (zh) * | 2020-02-24 | 2020-06-12 | 中国工商银行股份有限公司 | 金融客户欺诈风险识别方法及装置 |
-
2020
- 2020-08-11 CN CN202010799239.5A patent/CN111932269B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108564460A (zh) * | 2018-01-12 | 2018-09-21 | 阳光财产保险股份有限公司 | 互联网信贷场景下的实时欺诈检测方法及装置 |
CN109035003A (zh) * | 2018-07-04 | 2018-12-18 | 北京玖富普惠信息技术有限公司 | 基于机器学习的反欺诈模型建模方法和反欺诈监控方法 |
CN109657805A (zh) * | 2018-12-07 | 2019-04-19 | 泰康保险集团股份有限公司 | 超参数确定方法、装置、电子设备及计算机可读介质 |
CN110782333A (zh) * | 2019-08-26 | 2020-02-11 | 腾讯科技(深圳)有限公司 | 一种设备风险控制方法、装置、设备及介质 |
CN110969285A (zh) * | 2019-10-29 | 2020-04-07 | 京东方科技集团股份有限公司 | 预测模型训练方法、预测方法、装置、设备及介质 |
CN111275546A (zh) * | 2020-02-24 | 2020-06-12 | 中国工商银行股份有限公司 | 金融客户欺诈风险识别方法及装置 |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112488863A (zh) * | 2020-12-01 | 2021-03-12 | 中国人寿保险股份有限公司 | 一种在用户冷启动场景下的险种推荐方法及相关设备 |
CN112488863B (zh) * | 2020-12-01 | 2024-05-28 | 中国人寿保险股份有限公司 | 一种在用户冷启动场景下的险种推荐方法及相关设备 |
CN112766681A (zh) * | 2021-01-11 | 2021-05-07 | 杭州迪普科技股份有限公司 | 设备分类管理方法及装置 |
CN112926045A (zh) * | 2021-02-24 | 2021-06-08 | 北京通付盾人工智能技术有限公司 | 一种基于逻辑回归模型的群控设备识别方法 |
CN112926045B (zh) * | 2021-02-24 | 2023-12-26 | 北京通付盾人工智能技术有限公司 | 一种基于逻辑回归模型的群控设备识别方法 |
CN113095807A (zh) * | 2021-04-09 | 2021-07-09 | 中国工商银行股份有限公司 | 信息处理方法、装置、计算机系统和计算机可读存储介质 |
CN113570222A (zh) * | 2021-07-15 | 2021-10-29 | 北京淇瑀信息科技有限公司 | 一种用户设备鉴别方法、装置和计算机设备 |
CN113610122A (zh) * | 2021-07-22 | 2021-11-05 | 上海淇玥信息技术有限公司 | 一种用户设备认证方法、装置和计算机设备 |
CN113610122B (zh) * | 2021-07-22 | 2024-08-20 | 上海淇玥信息技术有限公司 | 一种用户设备认证方法、装置和计算机设备 |
CN113610132A (zh) * | 2021-07-29 | 2021-11-05 | 上海淇玥信息技术有限公司 | 一种用户设备鉴别方法、装置和计算机设备 |
CN115860751A (zh) * | 2023-02-27 | 2023-03-28 | 天津金城银行股份有限公司 | 反欺诈的分析处理方法、装置和电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN111932269B (zh) | 2023-08-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111932269A (zh) | 设备信息处理方法及装置 | |
CN110222170B (zh) | 一种识别敏感数据的方法、装置、存储介质及计算机设备 | |
Bahnsen et al. | A novel cost-sensitive framework for customer churn predictive modeling | |
US11481707B2 (en) | Risk prediction system and operation method thereof | |
CN111612039A (zh) | 异常用户识别的方法及装置、存储介质、电子设备 | |
CN112785086A (zh) | 信贷逾期风险预测方法及装置 | |
CN112215702A (zh) | 信用风险的评估方法、移动终端及计算机存储介质 | |
CN111292008A (zh) | 一种基于知识图谱的隐私保护数据发布风险评估方法 | |
Bueff et al. | Machine learning interpretability for a stress scenario generation in credit scoring based on counterfactuals | |
CN109685104B (zh) | 一种识别模型的确定方法和装置 | |
Zhao et al. | Ensemble classification based on feature selection for environmental sound recognition | |
CN114298176A (zh) | 一种欺诈用户检测方法、装置、介质及电子设备 | |
CN111090807A (zh) | 一种基于知识图谱的用户识别方法及装置 | |
CN111611390B (zh) | 一种数据处理方法及装置 | |
CN115130536A (zh) | 特征提取模型的训练方法、数据处理方法、装置及设备 | |
CN110717509A (zh) | 基于树分裂算法的数据样本分析方法及装置 | |
CN113762579A (zh) | 一种模型训练方法、装置、计算机存储介质及设备 | |
CN113554228A (zh) | 还款率预测模型的训练方法及还款率的预测方法 | |
CN115964496A (zh) | 交流平台的敏感文本智能检测方法和装置 | |
Kozodoi et al. | Shallow self-learning for reject inference in credit scoring | |
CN115577357A (zh) | 一种基于堆叠集成技术的Android恶意软件检测方法 | |
CN117151855A (zh) | 欺诈风险预测方法、装置、计算机设备和可读存储介质 | |
Lejeune et al. | Optimization for simulation: LAD accelerator | |
CN116245630A (zh) | 一种反欺诈检测方法、装置、电子设备及介质 | |
CN110990164B (zh) | 账户检测方法和装置、账户检测模型的训练方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |