CN117151819A - 基于数据分析的交易用户风险推荐方法 - Google Patents
基于数据分析的交易用户风险推荐方法 Download PDFInfo
- Publication number
- CN117151819A CN117151819A CN202311134214.3A CN202311134214A CN117151819A CN 117151819 A CN117151819 A CN 117151819A CN 202311134214 A CN202311134214 A CN 202311134214A CN 117151819 A CN117151819 A CN 117151819A
- Authority
- CN
- China
- Prior art keywords
- user
- product
- risk
- products
- recommended
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 238000007405 data analysis Methods 0.000 title claims abstract description 22
- 239000013598 vector Substances 0.000 claims abstract description 63
- 238000012216 screening Methods 0.000 claims abstract description 6
- 239000000047 product Substances 0.000 claims description 414
- 238000013528 artificial neural network Methods 0.000 claims description 44
- 238000012549 training Methods 0.000 claims description 12
- 238000002372 labelling Methods 0.000 claims description 6
- 239000006227 byproduct Substances 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 abstract description 2
- 230000006399 behavior Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- XCWPUUGSGHNIDZ-UHFFFAOYSA-N Oxypertine Chemical compound C1=2C=C(OC)C(OC)=CC=2NC(C)=C1CCN(CC1)CCN1C1=CC=CC=C1 XCWPUUGSGHNIDZ-UHFFFAOYSA-N 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000010485 coping Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Human Resources & Organizations (AREA)
- General Engineering & Computer Science (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Entrepreneurship & Innovation (AREA)
- Finance (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Educational Administration (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Tourism & Hospitality (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及数据处理技术领域,具体涉及基于数据分析的交易用户风险推荐方法,包括:将每个用户的信息构成每个用户的特征向量,根据每个用户的特征向量获取每个用户的风险等级、相似用户以及风险产品,根据每个用户的风险等级获取每个用户的所有兴趣产品,进而获取每个用户的每个相似用户的置信度,根据置信度对相似用户进行筛选,得到每个用户的绝对相似用户,根据兴趣产品获取每个用户的风险产品的推荐权重,获取每个用户的推荐产品,根据每个用户的风险产品的推荐权重获取每个推荐产品的推荐值,根据推荐值进行产品推荐。本发明综合考虑用户自身的风险承受能力以及个人偏好,对用户进行产品推荐,降低了商家与用户双方的相关风险。
Description
技术领域
本发明涉及数据处理技术领域,具体涉及基于数据分析的交易用户风险推荐方法。
背景技术
随着数据相关科学和人工智能技术的进步,越来越多的行业尝试利用大数据和先进的数据分析方法来提供更准确和个性化的用户风险推荐和服务,以提升用户体验。通过分析大量的交易数据、用户行为数据和其他相关数据,可识别、评估用户的风险水平,并为用户其提供个性化的风险推荐和服务,降低对于相关商家以及用户自身的相关风险。
目前通常利用协调过滤算法对用户进行个性化的推荐服务,协同过滤算法主要根据用户之间的相似性进行推荐,而在交易用户风险推荐中,用户的个性化需求和风险承受能力是关键因素。只基于用户的相似性推荐算法难以充分考虑用户的个性化特征和风险偏好,无法提供准确的个性化推荐。
发明内容
为了解决上述问题,本发明提供基于数据分析的交易用户风险推荐方法。
本发明的基于数据分析的交易用户风险推荐方法采用如下技术方案:
本发明一个实施例提供了基于数据分析的交易用户风险推荐方法,该方法包括以下步骤:
采集每个用户的信息,将每个用户的信息构成每个用户的特征向量;根据每个用户的特征向量,获取每个用户的风险等级;
根据每个用户与其余用户的特征向量之间的相似度获取每个用户的相似用户;根据每个用户的风险等级获取每个用户的所有兴趣产品;
根据每个用户的兴趣产品获取每个用户的每个相似用户的置信度,根据置信度对相似用户进行筛选,得到每个用户的绝对相似用户;
根据每个用户的特征向量获取每个用户的风险产品;根据每个用户的兴趣产品以及绝对相似用户的兴趣产品获取每个用户的风险产品的推荐权重;根据每个用户的兴趣产品和风险产品获取每个用户的推荐产品,根据每个用户的风险产品的推荐权重获取每个推荐产品的推荐值;
根据每个用户的每个推荐产品的推荐值对每个用户进行产品推荐。
优选的,所述根据每个用户的特征向量,获取每个用户的风险等级,包括的具体步骤如下:
利用神经网络进行用户的风险等级评估,包括:
神经网络的输入为用户的特征向量,输出为用户的风险等级;神经网络为全连接神经网络,神经网络的训练集为存在历史交易的用户的特征向量构成的训练集,标签为用户的风险等级,包括低风险、中风险和高风险三个风险等级;标签标注的过程为:由专业人员根据存在历史交易的用户注册交易平台时填写的用户信息,结合专业人员的经验为存在历史交易的用户设置风险等级的标签,当风险等级为低风险时,标注1,当风险等级为中风险时,标注2,当风险等级为高风险时,标注3;神经网络的损失函数为交叉熵损失;
将每个用户的特征向量输入到训练好的神经网络中,输出每个用户的风险等级。
优选的,所述根据每个用户与其余用户的特征向量之间的相似度获取每个用户的相似用户,包括的具体步骤如下:
将任意一个用户作为当前用户,获取当前用户的特征向量与其余每个用户的特征向量的相似度,作为当前用户和其余每个用户的相似度;
获取当前用户和其余每个用户的相似度的平均值μ以及标准差σ;预设倍数阈值τ,将与当前用户的相似度大于μ-τ×σ的用户作为当前用户的相似用户。
优选的,所述根据每个用户的风险等级获取每个用户的所有兴趣产品,包括的具体步骤如下:
将每个用户的风险等级对应的产品展示给每个用户,由每个用户进行预选择,将每个用户预选择的产品作为每个用户的兴趣产品。
优选的,所述根据每个用户的兴趣产品获取每个用户的每个相似用户的置信度,包括的具体步骤如下:
将当前用户的所有兴趣产品构成当前用户的兴趣产品集合;
根据当前用户的兴趣产品集合获取当前用户的每个相似用户的置信度:
其中,Ci为当前用户的第i个相似用户的置信度;Bi为当前用户的第i个相似用户的兴趣产品集合;Bj为当前用户的第j个相似用户的兴趣产品集合,且j≠i;N(Bi∩Bj)表示当前用户的第i个相似用户的兴趣产品集合和当前用户的第j个相似用户的兴趣产品集合的交集中元素个数;N(Bi∪Bj)表示当前用户的第i个相似用户的兴趣产品集合和当前用户的第j个相似用户的兴趣产品集合的并集中元素个数;n表示当前用户的相似用户数量;Li表示当前用户的第i个相似用户的兴趣产品集合中包含的兴趣产品的数量;mi表示当前用户的第i个相似用户的已购买次数;[]表示艾佛森括号;exp()表示以自然常数为底的指数函数。
优选的,所述根据置信度对相似用户进行筛选,得到每个用户的绝对相似用户,包括的具体步骤如下:
预设比例阈值Q,对每个用户的所有相似用户按照置信度从大到小的顺序排列,将得到的序列中前Q的相似用户作为每个用户的绝对相似用户。
优选的,所述根据每个用户的特征向量获取每个用户的风险产品,包括的具体步骤如下:
利用神经网络获取用户的合适产品,包括:
神经网络的输入为用户的特征向量,输出为用户的合适产品;神经网络为全连接神经网络,神经网络的训练集为存在历史交易的用户的特征向量构成的训练集,标签为用户的合适产品向量;标签标注的过程为:由专业人员根据存在历史交易的用户注册交易平台时填写的用户信息,结合经验判断适合用户的产品,将适合用户的产品作为用户的合适产品,将用户的所有合适产品的产品ID构成的向量作为用户的合适产品向量,将合适产品向量作为标签;神经网络的损失函数为均方差损失;
将每个用户的特征向量输入到训练好的神经网络中,输出每个用户的合适产品,将每个用户的合适产品称为每个用户的风险产品。
优选的,所述根据每个用户的兴趣产品以及绝对相似用户的兴趣产品获取每个用户的风险产品的推荐权重,包括的具体步骤如下:
其中,w表示当前用户的风险产品的推荐权重;Li表示当前用户的第i个相似用户的兴趣产品集合中包含的兴趣产品的数量;B′为当前用户的兴趣产品集合;Bs ′为当前用户的第s个绝对相似用户的兴趣产品集合;N(B′∩Bs ′)表示当前用户的兴趣产品集合和当前用户的第s个绝对相似用户的兴趣产品集合的交集中元素个数,用于表示当前用户和第s个绝对相似用户相同的兴趣产品;α为超参数;n′表示当前用户的绝对相似用户数量;tanh()表示双曲正切函数。
优选的,所述根据每个用户的兴趣产品和风险产品获取每个用户的推荐产品,根据每个用户的风险产品的推荐权重获取每个推荐产品的推荐值,包括的具体步骤如下:
将每个用户的所有风险产品构成一个集合,作为每个用户的风险产品集合;获取每个用户的兴趣产品集合和风险产品集合的并集,作为每个用户的推荐产品集合,将每个用户的推荐产品集合中每个元素分别作为每个用户的一个推荐产品;
根据每个用户的风险产品的推荐权重、每个用户的风险产品集合以及兴趣产品集合获取每个推荐产品的推荐值:
其中,Sk表示当前用户的第k个推荐产品的推荐值;pk表示当前用户的第k个推荐产品;B′表示当前用户的兴趣产品集合;D′表示当前用户的风险产品集合;w表示当前用户的风险产品的推荐权重;fk表示当前用户的第k个推荐产品在当前用户的所有绝对相似用户的兴趣产品集合中出现的次数;Fk表示当前用户的第k个推荐产品在当前用户的所有绝对相似用户的风险产品集合中出现的次数。
优选的,所述根据每个用户的每个推荐产品的推荐值对每个用户进行产品推荐,包括的具体步骤如下:
对当前用户的所有推荐产品,根据推荐值从大到小的顺序进行排序,得到一个推荐序列;预设间隔阈值γ;
依次对推荐序列中的每个推荐产品进行判断,包括:
若当前推荐产品不为风险产品且当前推荐产品在推荐序列中的下一个推荐产品也不为风险产品时,获取推荐序列中当前推荐产品之后的γ个推荐产品,作为当前推荐产品的候选顺位产品,若γ个候选顺位产品中存在风险产品时,将γ个候选顺位产品中第一个风险产品作为当前推荐产品的顺位产品,将推荐序列中当前推荐产品的顺位产品挪动到当前推荐产品之后,实现推荐序列的更新;
将每个推荐产品在最终得到的推荐序列中的序号作为每个推荐产品的最终推荐顺序;按照每个推荐产品的最终推荐顺序,在当前用户的交易平台的页面上进行推荐产品的展示。
本发明的技术方案的有益效果是:本发明将每个用户的信息构成每个用户的特征向量,根据每个用户的特征向量获取每个用户的风险等级、相似用户以及风险产品,根据每个用户的风险等级获取每个用户的所有兴趣产品,进而获取每个用户的每个相似用户的置信度,根据置信度对相似用户进行筛选,得到每个用户的绝对相似用户,根据兴趣产品获取每个用户的风险产品的推荐权重,获取每个用户的推荐产品,根据每个用户的风险产品的推荐权重获取每个推荐产品的推荐值,根据推荐值进行产品推荐。本发明综合考虑用户自身的风险承受能力以及个人偏好,对用户进行产品推荐,降低了商家与用户双方的相关风险。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的基于数据分析的交易用户风险推荐方法的步骤流程图;
图2为风险等级示意图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的基于数据分析的交易用户风险推荐方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的基于数据分析的交易用户风险推荐方法的具体方案。
请参阅图1,其示出了本发明一个实施例提供的基于数据分析的交易用户风险推荐方法的步骤流程图,该方法包括以下步骤:
S001.采集用户信息,构建用户的特征向量,进行用户的风险等级评估。
需要说明的是,用户在注册交易平台时,需要填写用户信息,包括用户的年龄信息、地域信息、通讯信息、信用信息、工作信息、收入信息等。为了对用户进行风险等级评估,根据风险等级进行产品推荐,需要采集用户信息。
在本发明实施例中,采集每个用户注册交易平台时填写的用户信息,包括用户的年龄信息、地域信息、通讯信息、信用信息、工作信息、收入信息等多个维度的信息,将每个用户所有维度的信息构成每个用户的特征向量。
利用神经网络进行用户的风险等级评估,神经网络的具体内容如下:
神经网络的输入为用户的特征向量,输出为用户的风险等级。神经网络为全连接神经网络,神经网络的训练集为存在历史交易的用户的特征向量构成的训练集,标签为用户的风险等级,包括低风险、中风险和高风险三个风险等级。标签标注的过程为:由专业人员根据存在历史交易的用户注册交易平台时填写的用户信息,结合经验为存在历史交易的用户设置风险等级的标签,当风险等级为低风险时,标注1,当风险等级为中风险时,标注2,当风险等级为高风险时,标注3。神经网络的损失函数为交叉熵损失。
将每个用户的特征向量输入到训练好的神经网络中,输出每个用户的风险等级。将用户的风险等级告知用户,这样可以使用户了解自身的风险水平,以便当风险到来时存在应对能力。
至此,获取了每个用户的特征向量以及风险等级。
需要说明的是,获取每个用户的风险等级,可避免提供过高风险的产品给不具备相应承受能力的用户,减少潜在的风险。告知用户其风险等级,有助于提高用户的风险意识,让用户了解自身的风险承受能力,使得在决策过程中能够更加理性地考虑风险因素。
S002.根据所有用户的特征向量之间的相似性以及每个用户的兴趣产品获取每个用户的绝对相似用户。
将任意一个用户作为当前用户,获取当前用户的特征向量与其余每个用户的特征向量的相似度,作为当前用户和其余每个用户的相似度,在本发明实施例中,采用余弦相似度计算当前用户的特征向量与其余每个用户的特征向量的相似度,对于相似度计算方法具体不做限定,实施人员可根据实际实施情况设置相似度计算方法。
获取当前用户和其余每个用户的相似度的平均值μ以及标准差σ。预设一个倍数阈值τ,本发明实施例以τ=1为例进行叙述,具体不做限定,实施人员可根据实际实施情况设置τ。将与当前用户的相似度大于μ-τ×σ的用户作为当前用户的相似用户。
同理,获取每个用户的所有相似用户。
需要说明的是,由于用户的风险等级分为低风险、中风险和高风险三个风险等级,不同的风险等级对应不同的产品,在对用户进行产品推荐之前,需要了解用户的喜好。
在本发明实施例中,将当前用户的风险等级对应的产品展示给当前用户,由当前用户进行预选择,将当前用户预选择的产品作为当前用户的兴趣产品,将当前用户的所有兴趣产品构成当前用户的兴趣产品集合。
同理,获取每个用户的兴趣产品集合。
需要说明的是,当前用户进行预选择时,在当前用户的线下终端进行,预选择不受其他用户干扰,每个用户之间是相互独立的。通过预选择增加了用户的参与感,同时也保证了用户选择的兴趣产品在自身对应风险等级的风险管理框架内,避免用户选择过度风险或不适合的产品。
需要进一步说明的是,每一个用户都有多个相似用户,每个用户的相似用户也有自己的兴趣产品集合,相似用户包括存在真正购买行为的用户以及还未购买的用户,可根据相似用户的兴趣产品集合以及购买行为对相似用户的置信度进行量化,以便后续根据置信度对相似用户进行筛选,只保留对当前用户参考程度的相似用户。
在本发明实施例中,获取当前用户的每个相似用户的置信度:
其中,Ci为当前用户的第i个相似用户的置信度;Bi为当前用户的第i个相似用户的兴趣产品集合;Bj为当前用户的第j个相似用户的兴趣产品集合,且j≠i;N(Bi∩Bj)表示当前用户的第i个相似用户的兴趣产品集合和当前用户的第j个相似用户的兴趣产品集合的交集中元素个数,用于表示当前用户的第i个相似用户和第j个相似用户相同的兴趣产品;N(Bi∪Bj)表示当前用户的第i个相似用户的兴趣产品集合和当前用户的第j个相似用户的兴趣产品集合的并集中元素个数;n表示当前用户的相似用户数量;Li表示当前用户的第i个相似用户的兴趣产品集合中包含的兴趣产品的数量;mi表示当前用户的第i个相似用户的已购买次数;[]表示艾佛森括号,当括号内条件成立时,结果为1,否则为0;exp()表示以自然常数为底的指数函数。
需要说明的是,表示当前用户的第i个相似用户的兴趣产品集合和当前用户的第j个相似用户的兴趣产品集合的交集中元素在并集中的占比,当占比越大,当前用户的第i个相似用户的兴趣产品和第j个相似用户的兴趣产品越相似,/>表示当前用户的第i个相似用户的兴趣产品和其余相似用户的兴趣产品的相似程度,当越大,当前用户的第i个相似用户与其他相似用户之间存在共同的兴趣点或偏好越多,此时当前用户的第i个相似用户的兴趣产品更可信,此时当前用户的第i个相似用户的置信度就越大;当Li越大时,相似性用户选择的兴趣产品越多,那么以该相似性用户的兴趣产品进行推荐时其实参考意义并不大,过多的兴趣产品选择可能导致无法提供具体、个性化的推荐建议,使推荐结果变得模糊或不明确,因此若当前用户的第i个相似用户的兴趣产品集合中包含的兴趣产品的数量Li越少时,当前用户的第i个相似用户的置信度就越大,利用Li+1是为了避免分母为0;有过购买行为的相似用户相较于没有购买行为的相似用户的置信度更高,因此当mi≥1时,对于当前用户的第i个相似用户的置信度进一步提升。
至此,获取了当前用户的每个相似用户的置信度。
在本发明实施例中,预设一个比例阈值Q,本发明实施例以Q=25%为例进行叙述,具体不做限定,实施人员可根据具体实施情况设置比例阈值。对当前用户的所有相似用户按照置信度从大到小的顺序排列,将得到的序列中前Q的相似用户作为当前用户的绝对相似用户。
同理,获取每个用户的绝对相似用户。
S003.根据每个用户的特征向量获取每个用户的风险产品。
需要说明的是,在后续进行产品推荐时,对于不同风险等级的用户仅推荐该用户所属风险等级的产品,如此可确保当风险来临时,用户可承受风险。但在同一个风险等级中,不同产品自身对于用户的真正对应的适合程度也是不同的,图2为风险等级示意图,图2中下方的矩形表示不同的风险等级,图2中上方的每个方格表示中风险对应的不同的产品,对于同一个风险等级内的用户,其适合的产品可能不同,例如图2中用户1和用户2的风险等级均为中风险,但适合的产品不同。因此,需要根据用户的信息为用户推荐合适的产品。
在本发明实施例中,利用神经网络获取用户的合适产品,神经网络的具体内容如下:
神经网络的输入为用户的特征向量,输出为用户的合适产品。神经网络为全连接神经网络,神经网络的训练集为存在历史交易的用户的特征向量构成的训练集,标签为用户的合适产品向量。标签标注的过程为:由专业人员根据存在历史交易的用户注册交易平台时填写的用户信息,结合市场趋势、用户反馈等因素,判断哪些产品适合用户,将适合用户的产品作为用户的合适产品,将用户的所有合适产品的产品ID构成的向量作为用户的合适产品向量,将合适产品向量作为标签。神经网络的损失函数为均方差损失。
将每个用户的特征向量输入到训练好的神经网络中,输出每个用户的合适产品。每个用户的合适产品为适合每个用户的风险承受能力的产品,因此将每个用户的合适产品称为每个用户的风险产品。将每个用户的所有风险产品构成一个集合,作为每个用户的风险产品集合。
至此,获取了每个用户的风险产品集合。
S004.根据每个用户的兴趣产品和风险产品获取每个用户的推荐产品以及推荐产品的推荐值。
需要说明的是,用户的兴趣产品是用户偏好的表达,而对于商家来说更倾向于根据用户的个人信息与风险承受能力进行个性化推荐,当用户的偏好表达较少时,应侧重于让商家的判断结果去影响对产品的推荐,因为作为商家需要确保推荐的产品符合用户的风险承受能力。为了对用户进行兴趣产品和风险产品的顺序推荐,需要根据用户以及其绝对相似用户的兴趣产品获取用户的风险产品的推荐权重。
获取当前用户的风险产品的推荐权重:
其中,w表示当前用户的风险产品的推荐权重;Li表示当前用户的第i个相似用户的兴趣产品集合中包含的兴趣产品的数量;B′为当前用户的兴趣产品集合;Bs ′为当前用户的第s个绝对相似用户的兴趣产品集合;N(B′∩Bs ′)表示当前用户的兴趣产品集合和当前用户的第s个绝对相似用户的兴趣产品集合的交集中元素个数,用于表示当前用户和第s个绝对相似用户相同的兴趣产品;α为超参数,在本法实施例中α=5,在其他实施例中,实施人员可根据实际实施情况设置α的值;n′表示当前用户的绝对相似用户数量;tanh()表示双曲正切函数,用于对进行归一化,需要说明的是,本实施例中所用的tanh()模型仅用于约束模型输出的结果处于[0,1)区间内,具体实施时可替换成具有同样目的的其他模型,本实施例只是以tanh()模型为例进行叙述,不对做具体限定;当N(B′∩Bs ′)越小,当前用户与其绝对相似用户的相同的兴趣产品越少,同时当前用户的兴趣产品数量越少时,用户的偏好表达较少,应侧重于让商家的判断结果去影响对产品的推荐,即当前用户的风险产品的推荐权重应较大。若当前用户的兴趣产品的数量为0时,即Li=0时,当前用户的风险产品的推荐权重达到最大,最大为1。
至此,获取了当前用户的风险产品的推荐权重。
需要说明的是,获取当前用户的风险产品的推荐权重后,在对当前用户进行产品推荐时,可根据风险产品的推荐权重对产品的推荐值的量化做出影响。可对当前用户的兴趣产品和绝对相似性用户的兴趣产品进行分析,以当前用户的兴趣产品为主,通过决定相似性用户的兴趣产品结合当前用户的风险产品的推荐权重对向当前用户进行产品推荐时的若干产品的推荐值进行量化。
需要进一步说明的是,当前用户的兴趣产品是个性化推荐的基础,而绝对相似性用户的兴趣产品的置信度大,绝对相似性用户的共同爱好接近当前用户,对当前用户的兴趣产品排名可做出参考。当前用户的风险产品是商家基于用户的风险承受能力进行推荐的,因此需要结合当前用户的个人偏好、共同喜好以及风险承受能力,对推荐给当前用户的产品进行排名。
在本发明实施例中,获取当前用户的兴趣产品集合和风险产品集合的并集,作为当前用户的推荐产品集合,将当前用户的推荐产品集合中每个元素分别作为当前用户的一个推荐产品。
根据当前用户的风险产品的推荐权重计算每个推荐产品的推荐值:
其中,Sk表示当前用户的第k个推荐产品的推荐值;pk表示当前用户的第k个推荐产品;B′表示当前用户的兴趣产品集合;D′表示当前用户的风险产品集合;w表示当前用户的风险产品的推荐权重,则(1-w)表示当前用户的兴趣产品的推荐权重;fk表示当前用户的第k个推荐产品在当前用户的所有绝对相似用户的兴趣产品集合中出现的次数;Fk表示当前用户的第k个推荐产品在当前用户的所有绝对相似用户的风险产品集合中出现的次数;若当前用户的第k个推荐产品仅为当前用户的兴趣产品,即当前用户的第k个推荐产品属于当前用户的兴趣产品集合而不属于当前用户的风险产品集合时,当前用户的第k个推荐产品的推荐值只与该推荐产品在当前用户的绝对相似用户的兴趣产品集合中出现的次数有关,出现次数越大时,推荐值越高,同理,若当前用户的第k个推荐产品仅为当前用户的风险产品时,当前用户的第k个推荐产品的推荐值只与该推荐产品在当前用户的绝对相似用户的风险产品集合中出现的次数有关,出现此时越大时,当前用户的第k个推荐产品的推荐值越高;若当前用户的第k个推荐产品同时属于当前用户的兴趣产品集合和风险产品集合时,则根据当前用户的风险产品的推荐权重w和兴趣产品的推荐权重(1-w)对当前用户的第k个推荐产品在绝对相似用户的风险产品集合以及兴趣产品集合中出现的次数进行加权,得到当前用户的第k个推荐产品的推荐值。
同理,获取每个用户的推荐产品的推荐值。
S005.根据推荐产品的推荐值对用户进行产品推荐。
对当前用户的所有推荐产品,根据推荐值从大到小的顺序进行排序,得到一个推荐序列,每个推荐产品在推荐序列中的序号即为每个推荐产品的初始推荐顺序,在交易平台的页面上向用户展示推荐产品时,将兴趣产品和风险产品交叉展示,具体为:
预设一个间隔阈值γ,本发明实施例以γ=3为例进行叙述,具体不做限定,实施人员可根据具体实施情况设置γ的值。
依次对推荐序列中的每个推荐产品进行判断:若当前推荐产品不为风险产品(即不属于当前用户的风险产品集合),且当前推荐产品在推荐序列中的下一个推荐产品也不为风险产品时,获取推荐序列中当前推荐产品之后的γ个推荐产品,作为当前推荐产品的候选顺位产品,若γ个候选顺位产品中存在风险产品时,将γ个候选顺位产品中第一个风险产品作为当前推荐产品的顺位产品,将推荐序列中当前推荐产品的顺位产品挪动到当前推荐产品之后,实现推荐序列的更新,此时继续对更新后的推荐序列中当前推荐产品的下一个推荐产品进行判断。若γ个候选顺位产品中不存在风险产品时,则不对推荐序列进行更新,此时继续对推荐序列中当前推荐产品的下一个推荐产品进行判断。
将每个推荐产品在最终得到的推荐序列中的序号作为每个推荐产品的最终推荐顺序。按照每个推荐产品的最终推荐顺序,在当前用户的交易平台的页面上进行推荐产品的展示。
需要说明的是,在页面上向用户展示推荐产品时,对兴趣产品和风险产品进行交叉展示,可以增加产品推荐的多样性和平衡性,提升用户对风险产品的关注度,并提升兴趣产品和风险产品在最终的推荐序列中平衡出现的机会,为用户提供更全面的选择。
通过以上步骤,完成了交易用户的风险推荐。
本发明实施例通过将每个用户的信息构成每个用户的特征向量,根据每个用户的特征向量获取每个用户的风险等级、相似用户以及风险产品,根据每个用户的风险等级获取每个用户的所有兴趣产品,进而获取每个用户的每个相似用户的置信度,根据置信度对相似用户进行筛选,得到每个用户的绝对相似用户,根据兴趣产品获取每个用户的风险产品的推荐权重,获取每个用户的推荐产品,根据每个用户的风险产品的推荐权重获取每个推荐产品的推荐值,根据推荐值进行产品推荐。本发明实施例综合考虑用户自身的风险承受能力以及个人偏好,对用户进行产品推荐,降低了商家与用户双方的相关风险。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.基于数据分析的交易用户风险推荐方法,其特征在于,该方法包括以下步骤:
采集每个用户的信息,将每个用户的信息构成每个用户的特征向量;根据每个用户的特征向量,获取每个用户的风险等级;
根据每个用户与其余用户的特征向量之间的相似度获取每个用户的相似用户;根据每个用户的风险等级获取每个用户的所有兴趣产品;
根据每个用户的兴趣产品获取每个用户的每个相似用户的置信度,根据置信度对相似用户进行筛选,得到每个用户的绝对相似用户;
根据每个用户的特征向量获取每个用户的风险产品;根据每个用户的兴趣产品以及绝对相似用户的兴趣产品获取每个用户的风险产品的推荐权重;根据每个用户的兴趣产品和风险产品获取每个用户的推荐产品,根据每个用户的风险产品的推荐权重获取每个推荐产品的推荐值;
根据每个用户的每个推荐产品的推荐值对每个用户进行产品推荐。
2.根据权利要求1所述的基于数据分析的交易用户风险推荐方法,其特征在于,所述根据每个用户的特征向量,获取每个用户的风险等级,包括的具体步骤如下:
利用神经网络进行用户的风险等级评估,包括:
神经网络的输入为用户的特征向量,输出为用户的风险等级;神经网络为全连接神经网络,神经网络的训练集为存在历史交易的用户的特征向量构成的训练集,标签为用户的风险等级,包括低风险、中风险和高风险三个风险等级;标签标注的过程为:由专业人员根据存在历史交易的用户注册交易平台时填写的用户信息,结合专业人员的经验为存在历史交易的用户设置风险等级的标签,当风险等级为低风险时,标注1,当风险等级为中风险时,标注2,当风险等级为高风险时,标注3;神经网络的损失函数为交叉熵损失;
将每个用户的特征向量输入到训练好的神经网络中,输出每个用户的风险等级。
3.根据权利要求1所述的基于数据分析的交易用户风险推荐方法,其特征在于,所述根据每个用户与其余用户的特征向量之间的相似度获取每个用户的相似用户,包括的具体步骤如下:
将任意一个用户作为当前用户,获取当前用户的特征向量与其余每个用户的特征向量的相似度,作为当前用户和其余每个用户的相似度;
获取当前用户和其余每个用户的相似度的平均值μ以及标准差σ;预设倍数阈值τ,将与当前用户的相似度大于μ-τ×σ的用户作为当前用户的相似用户。
4.根据权利要求1所述的基于数据分析的交易用户风险推荐方法,其特征在于,所述根据每个用户的风险等级获取每个用户的所有兴趣产品,包括的具体步骤如下:
将每个用户的风险等级对应的产品展示给每个用户,由每个用户进行预选择,将每个用户预选择的产品作为每个用户的兴趣产品。
5.根据权利要求3所述的基于数据分析的交易用户风险推荐方法,其特征在于,所述根据每个用户的兴趣产品获取每个用户的每个相似用户的置信度,包括的具体步骤如下:
将当前用户的所有兴趣产品构成当前用户的兴趣产品集合;
根据当前用户的兴趣产品集合获取当前用户的每个相似用户的置信度:
其中,Ci为当前用户的第i个相似用户的置信度;Bi为当前用户的第i个相似用户的兴趣产品集合;Bj为当前用户的第j个相似用户的兴趣产品集合,且j≠i;N(Bi∩Bj)表示当前用户的第i个相似用户的兴趣产品集合和当前用户的第j个相似用户的兴趣产品集合的交集中元素个数;N(Bi∪Bj)表示当前用户的第i个相似用户的兴趣产品集合和当前用户的第j个相似用户的兴趣产品集合的并集中元素个数;n表示当前用户的相似用户数量;Li表示当前用户的第i个相似用户的兴趣产品集合中包含的兴趣产品的数量;mi表示当前用户的第i个相似用户的已购买次数;[]表示艾佛森括号;exp()表示以自然常数为底的指数函数。
6.根据权利要求1所述的基于数据分析的交易用户风险推荐方法,其特征在于,所述根据置信度对相似用户进行筛选,得到每个用户的绝对相似用户,包括的具体步骤如下:
预设比例阈值Q,对每个用户的所有相似用户按照置信度从大到小的顺序排列,将得到的序列中前Q的相似用户作为每个用户的绝对相似用户。
7.根据权利要求1所述的基于数据分析的交易用户风险推荐方法,其特征在于,所述根据每个用户的特征向量获取每个用户的风险产品,包括的具体步骤如下:
利用神经网络获取用户的合适产品,包括:
神经网络的输入为用户的特征向量,输出为用户的合适产品;神经网络为全连接神经网络,神经网络的训练集为存在历史交易的用户的特征向量构成的训练集,标签为用户的合适产品向量;标签标注的过程为:由专业人员根据存在历史交易的用户注册交易平台时填写的用户信息,结合专业人员的经验判断适合用户的产品,将适合用户的产品作为用户的合适产品,将用户的所有合适产品的产品ID构成的向量作为用户的合适产品向量,将合适产品向量作为标签;神经网络的损失函数为均方差损失;
将每个用户的特征向量输入到训练好的神经网络中,输出每个用户的合适产品,将每个用户的合适产品称为每个用户的风险产品。
8.根据权利要求5所述的基于数据分析的交易用户风险推荐方法,其特征在于,所述根据每个用户的兴趣产品以及绝对相似用户的兴趣产品获取每个用户的风险产品的推荐权重,包括的具体步骤如下:
其中,w表示当前用户的风险产品的推荐权重;Li表示当前用户的第i个相似用户的兴趣产品集合中包含的兴趣产品的数量;B′为当前用户的兴趣产品集合;B′s为当前用户的第s个绝对相似用户的兴趣产品集合;N(B′∩B′s)表示当前用户的兴趣产品集合和当前用户的第s个绝对相似用户的兴趣产品集合的交集中元素个数,用于表示当前用户和第s个绝对相似用户相同的兴趣产品;α为超参数;n′表示当前用户的绝对相似用户数量;tanh()表示双曲正切函数。
9.根据权利要求5所述的基于数据分析的交易用户风险推荐方法,其特征在于,所述根据每个用户的兴趣产品和风险产品获取每个用户的推荐产品,根据每个用户的风险产品的推荐权重获取每个推荐产品的推荐值,包括的具体步骤如下:
将每个用户的所有风险产品构成一个集合,作为每个用户的风险产品集合;获取每个用户的兴趣产品集合和风险产品集合的并集,作为每个用户的推荐产品集合,将每个用户的推荐产品集合中每个元素分别作为每个用户的一个推荐产品;
根据每个用户的风险产品的推荐权重、每个用户的风险产品集合以及兴趣产品集合获取每个推荐产品的推荐值:
其中,Sk表示当前用户的第k个推荐产品的推荐值;pk表示当前用户的第k个推荐产品;B′表示当前用户的兴趣产品集合;D′表示当前用户的风险产品集合;w表示当前用户的风险产品的推荐权重;fk表示当前用户的第k个推荐产品在当前用户的所有绝对相似用户的兴趣产品集合中出现的次数;Fk表示当前用户的第k个推荐产品在当前用户的所有绝对相似用户的风险产品集合中出现的次数。
10.根据权利要求9所述的基于数据分析的交易用户风险推荐方法,其特征在于,所述根据每个用户的每个推荐产品的推荐值对每个用户进行产品推荐,包括的具体步骤如下:
对当前用户的所有推荐产品,根据推荐值从大到小的顺序进行排序,得到一个推荐序列;预设间隔阈值γ;
依次对推荐序列中的每个推荐产品进行判断,包括:
若当前推荐产品不为风险产品且当前推荐产品在推荐序列中的下一个推荐产品也不为风险产品时,获取推荐序列中当前推荐产品之后的y个推荐产品,作为当前推荐产品的候选顺位产品,若γ个候选顺位产品中存在风险产品时,将γ个候选顺位产品中第一个风险产品作为当前推荐产品的顺位产品,将推荐序列中当前推荐产品的顺位产品挪动到当前推荐产品之后,实现推荐序列的更新;
将每个推荐产品在最终得到的推荐序列中的序号作为每个推荐产品的最终推荐顺序;按照每个推荐产品的最终推荐顺序,在当前用户的交易平台的页面上进行推荐产品的展示。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311134214.3A CN117151819A (zh) | 2023-09-04 | 2023-09-04 | 基于数据分析的交易用户风险推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311134214.3A CN117151819A (zh) | 2023-09-04 | 2023-09-04 | 基于数据分析的交易用户风险推荐方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117151819A true CN117151819A (zh) | 2023-12-01 |
Family
ID=88886535
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311134214.3A Pending CN117151819A (zh) | 2023-09-04 | 2023-09-04 | 基于数据分析的交易用户风险推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117151819A (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105376649A (zh) * | 2015-11-24 | 2016-03-02 | 江苏有线技术研究院有限公司 | 实现精准组合推荐的机顶盒盲操作方法和系统 |
CN109191240A (zh) * | 2018-08-14 | 2019-01-11 | 北京九狐时代智能科技有限公司 | 一种进行商品推荐的方法和装置 |
CN111582984A (zh) * | 2020-05-08 | 2020-08-25 | 广州探途网络技术有限公司 | 一种商品推荐方法、装置及计算设备 |
US20210297743A1 (en) * | 2020-03-17 | 2021-09-23 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Method, apparatus for content recommendation, electronic device and storage medium |
CN113590948A (zh) * | 2021-07-28 | 2021-11-02 | 咪咕数字传媒有限公司 | 信息推荐方法、装置、设备以及计算机存储介质 |
CN113643103A (zh) * | 2021-08-31 | 2021-11-12 | 平安医疗健康管理股份有限公司 | 基于用户相似度的产品推荐方法、装置、设备及存储介质 |
CN116308599A (zh) * | 2022-11-22 | 2023-06-23 | 平安银行股份有限公司 | 基于产品标签与客户标签的理财产品智能推荐方法和装置 |
CN116630054A (zh) * | 2023-05-26 | 2023-08-22 | 中国银行股份有限公司 | 理财产品推荐方法、设备和介质 |
-
2023
- 2023-09-04 CN CN202311134214.3A patent/CN117151819A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105376649A (zh) * | 2015-11-24 | 2016-03-02 | 江苏有线技术研究院有限公司 | 实现精准组合推荐的机顶盒盲操作方法和系统 |
CN109191240A (zh) * | 2018-08-14 | 2019-01-11 | 北京九狐时代智能科技有限公司 | 一种进行商品推荐的方法和装置 |
US20210297743A1 (en) * | 2020-03-17 | 2021-09-23 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Method, apparatus for content recommendation, electronic device and storage medium |
CN111582984A (zh) * | 2020-05-08 | 2020-08-25 | 广州探途网络技术有限公司 | 一种商品推荐方法、装置及计算设备 |
CN113590948A (zh) * | 2021-07-28 | 2021-11-02 | 咪咕数字传媒有限公司 | 信息推荐方法、装置、设备以及计算机存储介质 |
CN113643103A (zh) * | 2021-08-31 | 2021-11-12 | 平安医疗健康管理股份有限公司 | 基于用户相似度的产品推荐方法、装置、设备及存储介质 |
CN116308599A (zh) * | 2022-11-22 | 2023-06-23 | 平安银行股份有限公司 | 基于产品标签与客户标签的理财产品智能推荐方法和装置 |
CN116630054A (zh) * | 2023-05-26 | 2023-08-22 | 中国银行股份有限公司 | 理财产品推荐方法、设备和介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108648049B (zh) | 一种基于用户行为区别建模的序列推荐方法 | |
CN106485562B (zh) | 一种基于用户历史行为的商品信息推荐方法及系统 | |
CN107220217A (zh) | 基于逻辑回归的特征系数训练方法和装置 | |
CN110647696B (zh) | 一种业务对象的排序方法及装置 | |
CN109816438B (zh) | 信息推送方法及装置 | |
CN107766929A (zh) | 模型分析方法及装置 | |
CN111797321A (zh) | 一种面向不同场景的个性化知识推荐方法及系统 | |
CN110008397B (zh) | 一种推荐模型训练方法及装置 | |
CN107886241B (zh) | 资源分析方法、装置、介质和电子设备 | |
CN110069699B (zh) | 排序模型训练方法和装置 | |
CN110874787A (zh) | 推荐模型的效果评测方法和相关装置 | |
CN110321473B (zh) | 基于多模态注意力的多样性偏好信息推送方法、系统、介质及设备 | |
CN112417294A (zh) | 一种基于神经网络挖掘模型的业务智能推荐方法 | |
CN112015996B (zh) | 业务资源推荐方法、装置、计算机设备及存储介质 | |
CN111581529A (zh) | 一种结合学生适合度和课程搭配度的课程推荐方法及装置 | |
CN110852785A (zh) | 用户分级方法、装置及计算机可读存储介质 | |
CN111797320A (zh) | 数据处理方法、装置、设备及存储介质 | |
CN110222254A (zh) | 课程推荐方法、装置、设备及计算机可读存储介质 | |
CN111582912A (zh) | 一种基于深度嵌入聚类算法的画像建模方法 | |
CN113536105A (zh) | 推荐模型训练方法和装置 | |
CN107885754B (zh) | 基于lda模型从交易数据中提取信用变量的方法和装置 | |
CN109146667B (zh) | 一种基于量化统计的外部接口综合应用模型的构建方法 | |
CN107729424B (zh) | 一种数据可视化方法及设备 | |
CN117151819A (zh) | 基于数据分析的交易用户风险推荐方法 | |
CN112884513A (zh) | 基于深度因子分解机的营销活动预测模型结构和预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |