CN117372132B - 用户信用评分的生成方法、装置、计算机设备和存储介质 - Google Patents
用户信用评分的生成方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN117372132B CN117372132B CN202311678901.1A CN202311678901A CN117372132B CN 117372132 B CN117372132 B CN 117372132B CN 202311678901 A CN202311678901 A CN 202311678901A CN 117372132 B CN117372132 B CN 117372132B
- Authority
- CN
- China
- Prior art keywords
- data
- credit
- sample
- machine learning
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 66
- 238000003860 storage Methods 0.000 title claims abstract description 13
- 238000010801 machine learning Methods 0.000 claims abstract description 145
- 239000002131 composite material Substances 0.000 claims abstract description 32
- 238000012545 processing Methods 0.000 claims abstract description 19
- 238000012549 training Methods 0.000 claims description 53
- 238000004590 computer program Methods 0.000 claims description 21
- 230000008569 process Effects 0.000 claims description 17
- 238000004422 calculation algorithm Methods 0.000 claims description 16
- 238000007637 random forest analysis Methods 0.000 claims description 11
- 238000007477 logistic regression Methods 0.000 claims description 9
- 238000003066 decision tree Methods 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 5
- 230000000875 corresponding effect Effects 0.000 description 48
- 238000011156 evaluation Methods 0.000 description 21
- 230000000694 effects Effects 0.000 description 15
- 238000005457 optimization Methods 0.000 description 10
- 238000012360 testing method Methods 0.000 description 8
- 230000006399 behavior Effects 0.000 description 7
- 230000010354 integration Effects 0.000 description 7
- 230000008901 benefit Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000013475 authorization Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 238000013136 deep learning model Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 238000007726 management method Methods 0.000 description 4
- 238000000513 principal component analysis Methods 0.000 description 4
- 238000012795 verification Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 239000000306 component Substances 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000012797 qualification Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000002787 reinforcement Effects 0.000 description 3
- 238000012954 risk control Methods 0.000 description 3
- 238000010200 validation analysis Methods 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000013145 classification model Methods 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000013210 evaluation model Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000011273 social behavior Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 206010000117 Abnormal behaviour Diseases 0.000 description 1
- 235000002198 Annona diversifolia Nutrition 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 241000282842 Lama glama Species 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000013329 compounding Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 239000008358 core component Substances 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000003997 social interaction Effects 0.000 description 1
- 230000036642 wellbeing Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0609—Buyer or seller confidence or verification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/27—Regression, e.g. linear or logistic regression
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Business, Economics & Management (AREA)
- Software Systems (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Strategic Management (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Mathematical Physics (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本申请涉及一种用户信用评分的生成方法、装置、计算机设备和存储介质。所述方法包括:获取待评分用户账号的待处理商圈数据,待处理商圈数据包括与待评分用户账号对应的账号信用数据、商家信用数据和商圈场景数据;将待处理商圈数据输入至信用评分复合模型,信用评分复合模型集成有大语言模型和多个机器学习模型;通过大语言模型对待处理商圈数据进行特征处理,得到待评分用户账号的目标语义特征;将目标语义特征输入至各个机器学习模型,得到与各个机器学习模型对应的信用评分;根据各个机器学习模型对应的信用评分,生成待评分用户账号的信用评分。采用本方法能够数字商圈场景下用户信用评分的预测准确性。
Description
技术领域
本申请涉及计算机技术领域,特别是涉及一种用户信用评分的生成方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术
商圈是指集中了大量商业、服务、文化等资源的地区,为人们提供了购物、娱乐、社交等多种需求的满足。随着移动互联网和数智互联网的迅速发展,商圈逐渐向数字化转型,数字商圈成为人们购物消费的主要方式。
在数字商圈的场景下,目前通常采用单个基准模型基于用户的个人信息和历史信用记录进行用户信用评分的预测,单个基准模型可以为机器学习模型、深度学习模型等。而商圈场景具有复杂性和多样性,使得采用目前的方式用户信用评分准确性难以得到保证。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提升数字商圈场景下的用户信用评分准确性的用户信用评分的生成方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种用户信用评分的生成方法,包括:
获取待评分用户账号的待处理商圈数据,所述待处理商圈数据包括与所述待评分用户账号对应的账号信用数据、商家信用数据和商圈场景数据;
将所述待处理商圈数据输入至信用评分复合模型,所述信用评分复合模型集成有大语言模型和多个机器学习模型;
通过所述大语言模型对所述待处理商圈数据进行特征处理,得到所述待评分用户账号的目标语义特征;
将所述目标语义特征输入至各个所述机器学习模型,得到与各个所述机器学习模型对应的信用评分;
根据各个所述机器学习模型对应的信用评分,生成所述待评分用户账号的信用评分。
在其中一个实施例中,所述大语言模型的训练方式,包括:
从样本商圈数据中提取得到微调数据集,所述样本商圈数据包括样本账号信用数据、样本商家信用数据和样本商圈场景数据;
以预测信用评分为微调目标,采用所述微调数据集对预训练过的大语言模型进行微调,得到所述大语言模型。
在其中一个实施例中,多个所述机器学习模型的训练方式,包括:
获取第一训练集,所述第一训练集包括已标注信用评分标签的多个样本用户账号的样本语义特征,各个所述样本语义特征是所述大语言模型对用户账号对应的第一样本商圈数据进行特征提取得到的,所述第一样本商圈数据包括与样本用户账户对应的样本账号信用数据、样本商家信用数据和样本商圈场景数据;
通过所述大语言模型对各个所述第一样本商圈数据进行特征处理,得到各个所述样本用户账号的样本语义特征;
将所述样本语义特征输入至各个初始机器学习模型,得到各个初始机器学习模型对应的信用评分;
根据各个所述初始机器学习模型的预测信用评分和所述信用评分标签,调整各个所述初始机器学习模型的模型参数,得到各个所述机器学习模型。
在其中一个实施例中,所述根据各个所述初始机器学习模型的预测信用评分和所述信用评分标签,调整各个所述初始机器学习模型的模型参数,得到各个所述机器学习模型,包括:
在对多个所述机器学习模型的训练过程中,针对输入的各个所述样本用户账号的样本语义特征,采用贝叶斯算法生成各个所述初始机器学习模型对应的权重;
对各个所述初始机器学习模型对应的权重以及预测信用评分进行加权求和,得到所述样本用户账号的预测信用评分;
根据所述预测信用评分和所述信用评分标签,调整各个所述初始机器学习模型的模型参数,直至满足迭代停止条件,得到各个所述机器学习模型。
在其中一个实施例中,所述根据各个所述机器学习模型对应的信用评分,生成所述待评分用户账号的信用评分,包括:
对各个所述机器学习模型对应的目标权重以及信用评分进行加权求和,得到所述待评分用户账号的信用评分,所述目标权重是训练过程中使所述信用评分复合模型表现最优的权重。
在其中一个实施例中,所述方法还包括:
在确定商圈数据存在满足预设条件的更新内容的情况下,获取第二样本商圈数据;
根据所述第二样本商圈数据生成第二训练集;
采用所述第二训练集对所述大语言模型和/或多个所述机器学习模型进行在线增量更新。
在其中一个实施例中,多个所述机器学习模型包括决策树模型、逻辑回归模型、随机森林模型中的至少两个。
第二方面,本申请还提供了一种用户信用评分的生成装置,包括:
获取模块,用于获取待评分用户账号的待处理商圈数据,所述待处理商圈数据包括与所述待评分用户账号对应的账号信用数据、商家信用数据和商圈场景数据;
输入模块,用于将所述待处理商圈数据输入至信用评分复合模型,所述信用评分复合模型集成有大语言模型和多个机器学习模型;
特征生成模块,用于通过所述大语言模型对所述待处理商圈数据进行特征处理,得到所述待评分用户账号的目标语义特征;
信用评分预测模块,用于将所述目标语义特征输入至各个所述机器学习模型,得到与各个所述机器学习模型对应的信用评分;
信用评分生成模块,用于根据各个所述机器学习模型对应的信用评分,生成所述用户账号的信用评分。
第三方面,本申请还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以上任一个实施例所述的用户信用评分的生成方法。
第四方面,本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以上任一个实施例所述的用户信用评分的生成方法。
第五方面,本申请还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以上任一个实施例所述的用户信用评分的生成方法下。
上述用户信用评分的生成方法、装置、计算机设备、存储介质和计算机程序产品,采用大语言模型和多个机器学习模型的集成方法,综合考虑不同模型的预测结果,可以实现以较低的计算复杂度在较短时间内完成信用评分计算,为数字商圈提供更准确、可靠的信用评估,提升商圈的信用管理和风险控制能力,推动商圈的可持续发展。通过综合考虑商圈中的账号信用数据、商家信用数据和商圈场景数据,将这些信息纳入信用评估复合模型中,可以提升信用评估的准确度。
附图说明
为了更清楚地说明本申请实施例或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为一个实施例中用户信用评分的生成方法的应用环境图;
图2为一个实施例中用户信用评分的生成方法的流程示意图;
图3为一个实施例中多个机器学习模型的训练过程的流程示意图;
图4为另一个实施例中用户信用评分的生成方法的流程示意图;
图5为一个实施例中用户信用评分的生成装置的结构框图;
图6为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在数字商圈的场景下,传统的信用评估模型一般采用单个基准模型,例如,集成学习算法或深度学习模型。传统的集成学习算法,如随机森林(Random Forest)和梯度提升树(Gradient Boosting Tree),通过组合多个弱分类器来形成强分类器,以提高整体预测性能。这些算法可以综合多个模型的预测结果,并通过投票、加权平均等方式得到最终的信用评分。深度学习模型,如人工神经网络或深度神经网络具有强大的非线性建模能力,可以处理复杂的特征和关系。通过训练深度神经网络,可以学习到商圈中的高级特征表示,并用于信用评估任务。
采用传统的方式存在以下不足:
1、场景逻辑信息利用不足:传统的信用评估模型主要关注个人信息和历史信用记录,使用的数据维度偏少,导致评估结果不够准确。
2、单个基准模型的局限性:现有的信用评估模型采用单个基准模型,如决策树、支持向量机等,这些模型可能在某些情况下表现良好,但在其他场景下可能不适用。单个基准模型的局限性限制了评估的准确性和可靠性。
3、缺乏模型集成方法:现有技术往往没有探索有效的模型集成方法,无法充分利用不同模型的优势。
4、评估准确性不高:由于以上问题的存在,传统技术在商圈信用评估的准确性方面仍有提升空间。评估结果可能存在误差,无法精确预测用户的信用水平和风险。
为了解决上述技术问题,本申请实施例提供一种用户信用评分的生成方法,可以应用于如图1所示的数字商圈系统中。其中,该数字商圈系统包括多个终端102和服务器104。多个终端102和服务器104通过网络进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他网络服务器上。多个终端102包括个人用户所持终端、商家所持终端等。个人用户和商家可以通过终端102中安装的客户端执行与商圈有关的活动,以产生商圈数据,例如,注册账号、上传资质证书、发送评价信息、参与商圈活动等。服务器104获取并存储商圈数据。在需要评估用户账号的信用评分时,获取该用户账号对应的待处理商圈数据,将待处理商圈数据输入至预先部署的已训练好的信用评估复合模型中,得到用户账号的信用评分。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
以下对本申请收集用户数据的一些方式进行说明:
收集用户数据时,数字商圈平台遵循相关法律法规和隐私政策,确保数据的合法性和隐私保护。同时,数字商圈平台也向用户充分告知数据的收集和使用情况,并获得用户的授权。
可以采用以下方式收集用户数据:
1、通过用户授权的方式获取用户数据:在用户注册或使用商圈服务时,明确告知用户需要提供哪些个人信息,并明确告知数字商圈平台如何使用这些数据。同时,提供用户自行选择是否授权的选项,充分尊重用户的隐私权。
2、通过埋点方式收集用户授权的行为数据:在应用程序(APP)埋点前向用户明确告知埋点的目的和方式,并获得用户的授权。同时,在埋点过程中采取适当的加密和技术措施,确保数据的隐私安全。
3、通过与第三方数据要素流通平台和合规数据提供商合作获取用户数据,数字商圈平台会选择可信赖的第三方数据提供商,并签订明确的数据使用协议。同时,要确保第三方数据提供商在使用用户数据时遵循相关法律法规和隐私政策,确保数据的合法性和隐私保护。
4. 通过数据共享的方式获取用户数据,数字商圈平台与商家签订明确的数据共享协议,规定数据的使用范围和目的。同时,要确保数据的隐私安全,避免数据泄露和滥用。
以下对本申请中的技术术语进行解释:
数字商圈:通过互联网平台实现的线上商业活动,包括电子商务、在线零售、在线服务等。
信用评分:对用户或实体的信用水平进行评估和量化的过程,通常通过算法模型将用户的个人信息、行为数据等转化为一个信用分数。
场景逻辑:数字商圈中的特定情境和交互关系,包括用户在不同商家之间的转化率、购买频率等信息。
复合模型:通过综合多个基础模型的预测结果来进行信用评估的模型,以提高准确性和稳定性。
大语言模型:在机器学习中使用的一种大型语言模型,具备处理大规模数据集和高效训练预测的能力。
优化算法:用于调整模型参数或搜索最佳解的算法,如遗传算法、粒子群算法等。
强化学习:一类机器学习的方法,通过与环境的交互学习最优策略,如Q-learning(一种无模型的时序差分学习方法)、深度强化学习等。
模型优化:通过调整模型参数、选择合适的优化算法等方法,提高模型性能和准确度。
在一个示例性的实施例中,如图2所示,提供了一种用户信用评分的生成方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤S210至步骤S250。其中:
步骤S210,获取待评分用户账号的待处理商圈数据。
其中,待评分用户账号是指需要评估信用评分的用户账号。待处理商圈数据包括多维度的商圈数据,可以但不限于是与待评分用户账号对应的账号信用数据、商家信用数据和商圈场景数据。
账号信用数据可以包括:用户信息类数据,例如姓名、表征身份特征的唯一性标识等。交易行为类数据,例如订单数量、优惠券使用情况、积分消费情况等。用户行为类数据,例如用户的登录频率、参与活动情况、评价行为等。社会好人类数据,例如用户参与公益和志愿服务情况、相关荣誉或称号。社交关系类数据,例如用户的好友数量、关注者数量、粉丝数量等。
商家信用数据可以包括:商家基本信息类数据,例如商家的名称、类型、地址、联系方式等。用户评价和投诉类数据,例如用户对商家的评价数量和质量,投诉情况和解决率等。客服类数据,例如商家的客服响应速度和满意度等。行业数据类数据,例如商家的资质证书、认证证书、许可证等。公共数据类数据,例如商家的行政处罚记录、慈善捐助、志愿服务等。司法风险类数据,例如商家的贷款履约率、涉诉次数、信贷类罚款金额等。经营风险类数据,例如商家经营者的资信状况、行为异常次数、行政处罚次数等。经营信息类数据,例如商家的年度报告披露情况、行政许可信息、资产状况等。知识产权类数据,例如商家的专利信息、商标信息、著作权信息、域名信息等。企业发展类数据,例如商家的注册资本、股东信息、高管信息、投资信息等。
商圈场景数据可以包括:商圈活动参与情况:商家和用户在商圈活动中的参与数据,包括参与活动的频率、活动类型和参与人数等。商圈优惠券使用情况:商家和用户在商圈中的优惠券使用数据,包括优惠券领取数量、核销数量和使用频率等。商圈积分消费情况:商家和用户在商圈中的积分消费数据,包括积分获取途径、积分消费频率和积分兑换礼品等。商圈评论和评价情况:商家和用户对商圈的评论和评价数据,包括评价数量、好评率、差评原因和评价内容等。商圈客流量:商圈的客流量数据,包括每日客流量、客流峰值时间段和客流趋势等,用于评估商圈的繁忙程度和吸引力。商圈品牌影响力:商圈内知名品牌的影响力指标,如品牌知名度、市场份额和消费者忠诚度等,用于评估商圈的品牌价值和影响力。商圈停车情况:例如商圈的停车位数量、停车费用和停车服务质量等数据,用于评估商圈的停车便利性和用户满意度。商圈社交媒体对象,例如商圈在社交媒体平台上的关注度、互动量和用户评价等数据,用于评估商圈在社交媒体上的曝光度和口碑情况。
具体地,服务器在满足预设条件时对数字商圈平台中的用户账号发起信用评分评估。预设条件可以是周期性地、特定场景下(例如用户账号发起免密请求)等。从已收集的商圈数据中筛选得到与待评分用户账号对应的待处理商圈数据。
步骤S220,将待处理商圈数据输入至信用评分复合模型。
其中,信用评分复合模型集成有大语言模型和多个机器学习模型。大语言模型是指使用大量文本数据训练的深度学习模型,可以生成自然语言文本或理解语言文本的含义,可以采用ChatGPT、GPT-4、LLaMA等。机器学习模型可以采用逻辑回归模型、决策树模型、支持向量机、神经网络模型等。
步骤S230,通过大语言模型对待处理商圈数据进行特征处理,得到待评分用户账号的目标语义特征。
具体地,服务器将待处理商圈数据,即与待评分用户账号对应的账号信用数据、商家信用数据和商圈场景数据输入至信用评分复合模型,通过信用评分复合模型中的大语言模型学习待处理商圈数据中的语义特征,得到待评分用户账号的目标语义特征。
步骤S240,将目标语义特征输入至各个机器学习模型,得到与各个机器学习模型对应的信用评分。
具体地,在得到待评分用户账号的目标语义特征后,将该目标语义特征作为各个机器学习模型的输入数据,分别输入至各个机器学习模型,由各个机器学习模型分别基于目标语义特征输出信用评分。
一个实施例中,多个机器学习模型包括决策树模型、逻辑回归模型、随机森林模型中的至少两个。
一个实施例中,大语言模型可以采用ChatGLM2-13B。多个机器学习模型包括XGBoost(eXtreme Gradient Boosting,极致梯度提升树模型)、LightGBM(LightGradientBoosting Machine,轻量级梯度提升机器学习模型)、逻辑回归模型和随机森林模型。XGBoost实现简单、计算效率高、对不平衡数据的拟合能力强。LightGBM是一个高效的树模型,将其引入集成可以增加模型的多样性。逻辑回归模型是线性分类模型,表达能力有限,引入ChatGLM2-13B输出的语义特征可以为其增强表达。随机森林模型本身特征工程能力较弱,ChatGLM2-13B输出的语义特征可以丰富其分叉条件,使随机森林模型可以从语义特征中学习到商圈场景知识,丰富了随机森林模型的分类能力。
在该实施例中,信用评分复合模型以ChatGLM2-13B为核心组件。ChatGLM2-13B负责学习待处理商圈数据中的非结构化数据,提取得到目标语义特征。ChatGLM2-13B输出的目标语义特征连接到各个机器学习模型的输入层,为各个机器学习模型提供统一的特征增强服务,使各个机器学习模型输出各自对应的信用评分。
步骤S250,根据各个机器学习模型对应的信用评分,生成待评分用户账号的信用评分。
具体地,在得到各个机器学习模型输出的信用评分后,对所得到的多个信用评分进行进一步加工,生成待评分用户账号的信用评分。加工的方式可以采用加权求和、取平均等。
上述用户信用评分的生成方法中,采用大语言模型和多个机器学习模型的集成方法,综合考虑不同模型的预测结果,可以以较低的计算复杂度在较短时间内完成信用评分计算,为数字商圈提供更准确、可靠的信用评估,提升商圈的信用管理和风险控制能力,推动商圈的可持续发展。通过综合考虑商圈中的账号信用数据、商家信用数据和商圈场景数据,深入分析商圈中的交易行为、用户行为、社会好人属性和社交关系等因素,充分利用商圈环境和地方政策环境,考虑了诸如商家资质证书、行业协会证书、社会公益、许可证类、慈善捐助和社交关系等因素,将这些信息纳入信用评估复合模型中,可以提升信用评估的准确度,增强商圈运营的可信度,为用户提供更好的消费体验。
在一个示例性的实施例中,大语言模型的训练方式,包括:从样本商圈数据中提取得到微调数据集;以预测信用评分为微调目标,采用微调数据集对预训练过的大语言模型进行微调,得到大语言模型。
其中,样本商圈数据包括样本账号信用数据、样本商家信用数据和样本商圈场景数据。样本商圈数据的收集方式和包含的内容可以参照上述待处理商圈数据。本实施例中待训练的大语言模型已经使用大规模的语料库预训练完成,使用样本商圈数据继续对预训练过的大语言模型进行微调(Fine-tuning),使大语言模型能更好地适应数字商圈领域的任务,从而获得一个融合了商圈场景知识的模型,进而使用该模型学习潜在的语义特征。
具体地,大语言模型的微调可以通过以下步骤实现:
提取数据:从收集的样本商圈场景数据中提取文本、表格等数据构建微调用数据集。所需提取的文本、表格等数据依实际使用场景而定。
设置微调目标:使大语言模型适应商圈信用评分场景的微调目标,本实施例中设置微调目标为预测用户账号的信用得分,可以通过将微调数据集中的特征输入到模型中,输出一个预测信用得分来实现。例如预测用户-场景的匹配程度,该匹配程度是指模型对于特定用户在特定场景下的信用得分进行预测的准确程度。
设置微调的超参数:超参数可以但不限于包括epochs(练轮数)、batch size(批量大小)、学习率等。微调的学习率通常比预训练时的小一些。一个示例中,微调学习率可以设置为5e-7到5e-8;epochs可以设置为4-6轮,正则化参数设置为0.01。
模型微调:使用微调数据集对预训练的大语言模型进行进一步训练,更新模型参数。
评估效果:评估微调前后大语言模型对场景理解的提升效果,例如,比较微调前后用户-场景的匹配任务的性能指标。
保存微调模型:在确定提升效果符合期望后,便可根据更新后的模型参数设置大语言模型,得到适应商圈场景的大语言模型,将该模型用于后续的语义特征提取。
一个实施例中,上述提到的用户-场景的匹配程度可以包括以下至少一种:
(1)用户特征与商圈的匹配程度:模型可以评估用户特征与商圈特点的匹配程度,例如用户的消费习惯、购买偏好与商圈的产品类型、价格水平等是否匹配。
(2)用户历史信用记录与商圈的匹配程度:模型可以评估用户的信用历史记录与商圈的匹配程度,例如用户过往的欺诈行为、信用评分值、强规则未归档等与商圈的信用要求、风险控制等是否匹配。
(3)用户社交行为与商圈的匹配程度:模型可以评估用户的社交行为与商圈的匹配程度,例如用户在商圈中的互动情况、参与度等与商圈的社交特点、活跃程度等是否匹配。
本实施例中,在预训练的大语言模型基础上微调得到大语言模型,可以通过最小化微调参数的数量和计算复杂度,提高预训练的大语言模型在商圈场景任务上的性能,从而缓解大语言模型的训练成本。
在一个示例性的实施例中,多个机器学习模型的训练方式可以通过步骤S310~步骤S330实现。其中:
步骤S310,获取第一训练集,第一训练集包括已标注信用评分标签的多个样本用户账号的样本语义特征,各个样本语义特征是大语言模型对用户账号对应的第一样本商圈数据进行特征提取得到的,第一样本商圈数据包括与样本用户账户对应的样本账号信用数据、样本商家信用数据和样本商圈场景数据。
具体地,在收集得到样本商圈数据后,对样本商圈数据进行清洗、补全、标准化等预处理,得到结构化数据集。该结构化数据集包括样本用户账号和第一样本商圈数据之间的对应关系,第一样本商圈数据包括与样本用户账户对应的样本账号信用数据、样本商家信用数据和样本商圈场景数据。
将结构化数据集中文本输入转化为索引序列,输入至大语言模型,由大语言模型自动处理该序列,得到每个token(词语)的向量表示。从大语言模型的隐层中提取输入序列对应位置的语义特征。对提取的用户、商家和商圈多维度语义特征进行规范化处理,将这些语义特征映射到同一数值范围。将规范化后的语义特征进行整合,构成综合的场景特征表示。基于综合的场景特征表示,对样本用户账号的语义特征进行特征聚合,为每个样本用户账号构建得到对应的样本语义特征,从而形成特征矩阵数据集。该特征矩阵数据集中每行为一个样本。其中,聚合可以采用拼接、相乘等方式实现。将该特征矩阵数据集按比例划分,得到第一训练集、验证集和测试集,例如,80%作为第一训练集,10%作为验证集,10%作为测试集。
一个实施例中,可以采用CSV(Comma-Separated Values,一种文件格式)等格式存储特征矩阵数据集,以便于读取使用。
一个实施例中,可以提供特征矩阵数据集的统计信息,包括样本量大小、特征字段释义等重要元信息。
步骤S320,将样本语义特征输入至各个初始机器学习模型,得到各个初始机器学习模型对应的信用评分。
步骤S330,根据各个初始机器学习模型的预测信用评分和信用评分标签,调整各个初始机器学习模型的模型参数,得到各个机器学习模型。
其中,初始机器学习模型是指还未经训练的机器学习模型。
具体地,将各个样本用户账号的样本语义特征作为各个初始机器学习模型的输入数据,分别输入至各个初始机器学习模型,由各个机器学习模型分别基于样本语义特征输出预测信用评分。对所得到的多个预测信用评分进行进一步加工,生成样本用户账号的预测信用评分。基于预测信用评分和信用评分标签调整各个初始机器学习模型的模型参数,直至达到迭代停止条件,得到训练好的多个机器学习模型。其中,迭代停止条件可以是迭代轮达到预设轮,准确率达到预设值等。
本实施例中,通过将多个不同类型的机器学习模型进行组合,可以实现对信用评分的多角度预测。同时,将用户账号的特征与数字商圈场景进行结合,可以进一步提高信用评分的准确性。
在一个示例性的实施例中,步骤S330,根据各个初始机器学习模型的预测信用评分和信用评分标签,调整各个初始机器学习模型的模型参数,得到各个机器学习模型,具体可以通过以下内容实现:
预先构建集成策略优化模块,在对多个机器学习模型的训练过程中,针对输入的各个样本用户账号的样本语义特征,采用贝叶斯优化算法动态优化各个初始机器学习模型的权重。具体实现中,可以预先配置多个初始机器学习模型的权重的先验分布,针对第一个输入的样本语义特征,从先验分布中获取各个初始机器学习模型的权重。对各个初始机器学习模型对应的权重以及预测信用评分进行加权求和,得到第一个样本用户账号的预测信用评分;根据预测信用评分和信用评分标签,调整各个初始机器学习模型的模型参数。使用该权重更新后验分布,得到第二个样本语义特征对应的权重,重复上述步骤,直至满足迭代停止条件(例如,找到最优配置),得到各个机器学习模型。将最优配置对应的权重作为目标权重,即目标权重是指训练过程中使信用评分复合模型表现最优的权重。
在本实施例中,步骤S250,根据各个机器学习模型对应的信用评分,生成待评分用户账号的信用评分,包括:对各个所述机器学习模型对应的目标权重以及信用评分进行加权求和,得到待评分用户账号的信用评分。
本实施例中,通过采用贝叶斯优化算法优化得到权重配置,提高了信用评估的精度和鲁棒性。
在一个示例性的实施例中,样本商圈数据的预处理可以通过以下步骤实现:
步骤1,数据清洗:检测并处理缺失值、重复记录、异常噪声数据等,修正错误数据。
步骤2,数据整合:将不同来源的数据整合到统一格式,例如对用户信用数据、商家信用数据等进行联合。
步骤3,数据转换:将行格式转换、规范化,使不同类型数据可统一处理。例如文本转化为向量。
步骤4,数据筛选:根据分析需求,筛选出相关的字段作为特征。例如对文本进行关键词提取。
步骤5,数据缩放:对连续数值特征进行缩放,例如标准化到0-1范围。
步骤6,数据编码:对类别特征进行onehot(独热)编码,转为模型可用的输入格式。
步骤7,数据构建:构建样本用户账号和第一样本商圈数据的结构化数据表,作为后续特征学习的输入。
在一个示例性的实施例中,在大语言模型对结构化数据表进行特征提取之后,还可以对提取到的语义特征进行特征分析,从中选择对信用评分的预测任务影响显著的特征。一个示例中,可以采用PCA(主成分分析法)来进行特征选择和维度约简,具体可以通过以下步骤实现:
步骤1,特征相关性分析。计算各语义特征之间的相关系数,识别出高度相关的特征对,例如用户年龄和购买力的相关性。
步骤2,特征重要性分析。基于PCA分析各语义特征对目标任务的贡献,识别出对预测结果影响显著的关键特征,例如用户社交活跃度与违约风险相关。
步骤3,特征选择。根据上述分析,选择对任务贡献大的特征,去除冗余相关性高的特征,得到精简的特征子集。
步骤4,特征降维。使用PCA等方法对特征子集进行降维,将高维语义特征投影到低维,减少特征冗余和维度灾难。
在一个示例性的实施例中,信用评分复合模型为动态集成策略网络,可以通过强化学习自适应地调整不同模型的权重,以实现对商圈变化的动态响应。所述方法还包括:在确定商圈数据存在满足预设条件的更新内容的情况下,获取第二样本商圈数据;根据第二样本商圈数据生成第二训练集;采用第二训练集对大语言模型和/或多个机器学习模型进行在线增量更新。
其中,满足预设条件的更新内容可以是指增加了新的商圈信息(例如,用户属性信息、商品属性信息、商品信息等),或者存在足够多的新的样本商圈数据。具体地,预先构建增量学习模块,在确定商圈数据存在满足预设条件的更新内容的情况,获取第二样本商圈数据。可以理解的是,第二样本商圈数据和第一样本商圈数据不同。根据第二样本商圈数据生成第二训练集,具体的生成方式可以参照上述第一训练集。采用小批量随机梯度下降,采用第二训练集迭代优化大语言模型和/或多个机器学习模型的模型参数,以对大语言模型和/或多个机器学习模型进行增量更新。
本实施例中,通过加入了增量学习机制,使系统可以持续吸收新样本进行模型更新,以保证其对最新商圈变化的适应性。通过构建基于异构集成与增量学习的框架,有效结合了语言模型、机器学习与集成学习的优势,实现了对复杂动态商圈场景的自适应建模和持续优化。
在一个示例性的实施例中,如图4所示,提供了一种用户信用评分的生成方法,在本实施例中,大语言模型采用ChatGLM2-13B,多个机器学习模型包括XGBoost、LightGBM、逻辑回归模型和随机森林模型。该方法包括以下步骤S402至步骤S416。其中:
步骤S402,获取样本商圈数据,样本商圈数据包括样本账号信用数据、样本商家信用数据和样本商圈场景数据。
步骤S404,从样本商圈数据中提取得到微调数据集,以预测信用评分为微调目标,采用微调数据集对预训练过的ChatGLM2-13B进行微调,得到大语言模型。
步骤S406,对样本商圈数据进行预处理,得到结构化数据集,结构化数据集中包括与多个样本用户账户各自对应的样本账号信用数据、样本商家信用数据和样本商圈场景数据。
步骤S408,将结构化数据集输入至ChatGLM2-13B,得到多个样本用户账号的样本语义特征,根据各个样本账号的样本语义特征和信用评分标签,得到第一训练集、测试集和验证集。
步骤S410,采用第一训练集对各个初始机器学习模型进行训练,得到各个机器学习模型。
具体地,将样本语义特征输入至各个初始机器学习模型,得到各个初始机器学习模型对应的信用评分。在对多个机器学习模型的训练过程中,针对输入的各个样本用户账号的样本语义特征,采用贝叶斯算法生成各个初始机器学习模型对应的权重。对各个初始机器学习模型对应的权重以及预测信用评分进行加权求和,得到样本用户账号的预测信用评分。根据预测信用评分和信用评分标签,调整各个初始机器学习模型的模型参数,直至满足迭代停止条件,得到多个机器学习模型。采用验证集选择最优模型超参的样本集合。采用测试集对在验证集上表现最好的模型进行测试。
进一步地,还可以对多个机器学习模型进行AB测试,比较各个单个基准模型和多个机器学习模型之间的预测精度。
步骤S412,获取待评分用户账号的待处理商圈数据,待处理商圈数据包括与待评分用户账号对应的账号信用数据、商家信用数据和商圈场景数据。
步骤S414,将待处理商圈数据输入至信用评分复合模型,通过信用评分复合模型中的ChatGLM2-13B对待处理商圈数据进行特征处理,得到待评分用户账号的目标语义特征;将目标语义特征输入至信用评分复合模型中的各个机器学习模型,得到与各个机器学习模型对应的信用评分。
步骤S416,对各个机器学习模型对应的目标权重以及信用评分进行加权求和,得到待评分用户账号的信用评分。目标权重是训练过程中基于贝叶斯优化算法使信用评分复合模型表现最优的权重。
进一步地,从多个维度量化评估模型的效果,在模型评估部分,给出了具体的效果指标数据,来量化模型的效果,具体如下:
(1)在测试集上,优化后的融合模型(即多个机器学习模型)准确率可达87%,单个基准模型的准确率为77%,相比单个基准模型提升了10%。召回率可达86%,特别是对信用较差样本的识别召回率由71%提高到了78%。AUC(Area Under Curve,曲线下面积)指标从0.82提升到0.88,表明模型的预测能力得到增强。在商圈真实用户数据上的离线评估,优化模型的F1分数(用来衡量二分类模型精确度的一种指标)达到了0.82。
(2)模型比较:与逻辑回归基准模型相比,准确率提升超过8个百分点。召回率的增益可达10%,特别是对负样本的检出提升明显。T-检验表明两模型在85%置信度下,信用评分复合模型显著超越基准模型。
(3)场景驱动验证:在商圈实际场景数据上,信用评分复合模型的F1分数达到0.83。使用商圈场景特征后,模型对特定客户群的预测精度提高了11%。A/B测试证明,场景特征可以有效提升模型在真实环境中的效果。
(4)模型优点:ChatGLM2-13B提取语义特征后,准确率较单个基准模型提升12%。融合多个机器学习模型进行互补,AUC指标达到0.89,超过当前最好水平。ChatGLM2-13B对场景特征的学习能力超过传统模型30%以上,结合自动超参数优化,模型稳定性和鲁棒性优于单个基准模型。可见,ChatGLM2-13B显著增强了模型的商圈场景适应性。本实施例证明了融合语言模型的有效性,为商圈及其他领域的智能信用评分提供了新的思路。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的用户信用评分的生成方法的用户信用评分的生成装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个用户信用评分的生成装置实施例中的具体限定可以参见上文中对于用户信用评分的生成方法的限定,在此不再赘述。
在一个示例性的实施例中,如图5所示,提供了一种用户信用评分的生成装置500,包括:获取模块502、输入模块504、特征生成模块506、信用评分预测模块508和信用评分生成模块510,其中:
获取模块502,用于获取待评分用户账号的待处理商圈数据,待处理商圈数据包括与待评分用户账号对应的账号信用数据、商家信用数据和商圈场景数据;
输入模块504,用于将待处理商圈数据输入至信用评分复合模型,信用评分复合模型集成有大语言模型和多个机器学习模型;
特征生成模块506,用于通过大语言模型对待处理商圈数据进行特征处理,得到待评分用户账号的目标语义特征;
信用评分预测模块508,用于将目标语义特征输入至各个机器学习模型,得到与各个机器学习模型对应的信用评分;
信用评分生成模块510,用于根据各个机器学习模型对应的信用评分,生成用户账号的信用评分。
在一个实施例中,装置500还包括:提取模块,用于从样本商圈数据中提取得到微调数据集,样本商圈数据包括样本账号信用数据、样本商家信用数据和样本商圈场景数据;微调模块,用于以预测信用评分为微调目标,采用微调数据集对预训练过的大语言模型进行微调,得到大语言模型。
在一个实施例中,装置500还包括:训练模块,用于获取第一训练集,第一训练集包括已标注信用评分标签的多个样本用户账号的样本语义特征,各个样本语义特征是大语言模型对用户账号对应的第一样本商圈数据进行特征提取得到的,第一样本商圈数据包括与样本用户账户对应的样本账号信用数据、样本商家信用数据和样本商圈场景数据;将样本语义特征输入至各个初始机器学习模型,得到各个初始机器学习模型对应的信用评分;根据各个初始机器学习模型的预测信用评分和信用评分标签,调整各个初始机器学习模型的模型参数,得到各个机器学习模型。
在一个实施例中,训练模块,具体用于在对多个机器学习模型的训练过程中,针对输入的各个样本用户账号的样本语义特征,采用贝叶斯算法生成各个初始机器学习模型对应的权重;对各个初始机器学习模型对应的权重以及预测信用评分进行加权求和,得到样本用户账号的预测信用评分;根据预测信用评分和信用评分标签,调整各个初始机器学习模型的模型参数,直至满足迭代停止条件,得到各个机器学习模型。
在一个实施例中,信用评分生成模块510,用于对各个机器学习模型对应的目标权重以及信用评分进行加权求和,得到待评分用户账号的信用评分,目标权重是训练过程中使信用评分复合模型表现最优的权重。
在一个实施例中,装置500还包括:增量更新模块,包括:在确定商圈数据存在满足预设条件的更新内容的情况下,获取第二样本商圈数据;根据第二样本商圈数据生成第二训练集;采用第二训练集对大语言模型和/或多个机器学习模型进行在线增量更新。
在一个实施例中,多个机器学习模型包括决策树模型、逻辑回归模型、随机森林模型中的至少两个。
上述用户信用评分的生成装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个示例性的实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output,简称I/O)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储和商圈关联的数据。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种用户信用评分的生成方法。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个示例性的实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以上任一实施例所述的用户信用评分的生成方法。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以上任一实施例所述的用户信用评分的生成方法。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以上任一实施例所述的用户信用评分的生成方法。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和商圈数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要符合相关规定。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random AccessMemory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (9)
1.一种用户信用评分的生成方法,其特征在于,所述方法包括:
获取待评分用户账号的待处理商圈数据,所述待处理商圈数据包括与所述待评分用户账号对应的账号信用数据、商家信用数据和商圈场景数据;
将所述待处理商圈数据输入至信用评分复合模型,所述信用评分复合模型集成有大语言模型和多个机器学习模型;
通过所述大语言模型对所述待处理商圈数据进行特征处理,得到所述待评分用户账号的目标语义特征;
将所述目标语义特征输入至各个所述机器学习模型,得到与各个所述机器学习模型对应的信用评分;
根据各个所述机器学习模型对应的信用评分,生成所述待评分用户账号的信用评分;
所述大语言模型的训练方式,包括:
从样本商圈数据中提取得到微调数据集,所述样本商圈数据包括样本账号信用数据、样本商家信用数据和样本商圈场景数据;
以预测信用评分为微调目标,采用所述微调数据集对预训练过的大语言模型进行微调,得到所述大语言模型;多个所述机器学习模型的训练方式,包括:
获取第一训练集,所述第一训练集包括已标注信用评分标签的多个样本用户账号的样本语义特征,各个所述样本语义特征是所述大语言模型对用户账号对应的第一样本商圈数据进行特征提取得到的,所述第一样本商圈数据包括与样本用户账户对应的样本账号信用数据、样本商家信用数据和样本商圈场景数据;
将所述样本语义特征输入至各个初始机器学习模型,得到各个初始机器学习模型对应的信用评分;
在对多个所述机器学习模型的训练过程中,针对输入的各个所述样本用户账号的样本语义特征,采用贝叶斯算法生成各个所述初始机器学习模型对应的权重;
对各个所述初始机器学习模型对应的权重以及预测信用评分进行加权求和,得到所述样本用户账号的预测信用评分;
根据所述预测信用评分和所述信用评分标签,调整各个所述初始机器学习模型的模型参数,直至满足迭代停止条件,得到各个所述机器学习模型。
2.根据权利要求1所述的方法,其特征在于,所述根据各个所述机器学习模型对应的信用评分,生成所述待评分用户账号的信用评分,包括:
对各个所述机器学习模型对应的目标权重以及信用评分进行加权求和,得到所述待评分用户账号的信用评分,所述目标权重是训练过程中使所述信用评分复合模型表现最优的权重。
3.根据权利要求1~2任一项所述的方法,其特征在于,所述方法还包括:
在确定商圈数据存在满足预设条件的更新内容的情况下,获取第二样本商圈数据;
根据所述第二样本商圈数据生成第二训练集;
采用所述第二训练集对所述大语言模型和/或多个所述机器学习模型进行在线增量更新。
4.根据权利要求1~2任一项所述的方法,其特征在于,多个所述机器学习模型包括决策树模型、逻辑回归模型、随机森林模型中的至少两个。
5.一种用户信用评分的生成装置,其特征在于,所述装置包括:
获取模块,用于获取待评分用户账号的待处理商圈数据,所述待处理商圈数据包括与所述待评分用户账号对应的账号信用数据、商家信用数据和商圈场景数据;
输入模块,用于将所述待处理商圈数据输入至信用评分复合模型,所述信用评分复合模型集成有大语言模型和多个机器学习模型;
特征生成模块,用于通过所述大语言模型对所述待处理商圈数据进行特征处理,得到所述待评分用户账号的目标语义特征;
信用评分预测模块,用于将所述目标语义特征输入至各个所述机器学习模型,得到与各个所述机器学习模型对应的信用评分;
信用评分生成模块,用于根据各个所述机器学习模型对应的信用评分,生成所述用户账号的信用评分;
提取模块,用于从样本商圈数据中提取得到微调数据集,所述样本商圈数据包括样本账号信用数据、样本商家信用数据和样本商圈场景数据;
微调模块,用于以预测信用评分为微调目标,采用所述微调数据集对预训练过的大语言模型进行微调,得到所述大语言模型;
训练模块,用于获取第一训练集,所述第一训练集包括已标注信用评分标签的多个样本用户账号的样本语义特征,各个所述样本语义特征是所述大语言模型对用户账号对应的第一样本商圈数据进行特征提取得到的,所述第一样本商圈数据包括与样本用户账户对应的样本账号信用数据、样本商家信用数据和样本商圈场景数据;将所述样本语义特征输入至各个初始机器学习模型,得到各个初始机器学习模型对应的信用评分;在对多个所述机器学习模型的训练过程中,针对输入的各个所述样本用户账号的样本语义特征,采用贝叶斯算法生成各个所述初始机器学习模型对应的权重;对各个所述初始机器学习模型对应的权重以及预测信用评分进行加权求和,得到所述样本用户账号的预测信用评分;根据所述预测信用评分和所述信用评分标签,调整各个所述初始机器学习模型的模型参数,直至满足迭代停止条件,得到各个所述机器学习模型。
6.根据权利要求5所述的装置,其特征在于,所述信用评分生成模块,用于对各个所述机器学习模型对应的目标权重以及信用评分进行加权求和,得到所述待评分用户账号的信用评分,所述目标权重是训练过程中使所述信用评分复合模型表现最优的权重。
7.根据权利要求5~6任一项所述的装置,其特征在于,所述装置还包括:
增量更新模块,用于在确定商圈数据存在满足预设条件的更新内容的情况下,获取第二样本商圈数据;根据所述第二样本商圈数据生成第二训练集;采用所述第二训练集对所述大语言模型和/或多个所述机器学习模型进行在线增量更新。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至4中任一项所述的方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至4中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311678901.1A CN117372132B (zh) | 2023-12-08 | 2023-12-08 | 用户信用评分的生成方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311678901.1A CN117372132B (zh) | 2023-12-08 | 2023-12-08 | 用户信用评分的生成方法、装置、计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117372132A CN117372132A (zh) | 2024-01-09 |
CN117372132B true CN117372132B (zh) | 2024-02-23 |
Family
ID=89396976
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311678901.1A Active CN117372132B (zh) | 2023-12-08 | 2023-12-08 | 用户信用评分的生成方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117372132B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116485552A (zh) * | 2023-05-08 | 2023-07-25 | 卓旭东 | 一种基金投资风控方法、装置、介质及终端 |
CN116701662A (zh) * | 2023-08-07 | 2023-09-05 | 国网浙江浙电招标咨询有限公司 | 基于知识图谱的供应链数据管理方法、装置、设备及介质 |
CN116976640A (zh) * | 2023-08-30 | 2023-10-31 | 中电科东方通信集团有限公司 | 自动化业务生成方法、装置、计算机设备及存储介质 |
CN116994694A (zh) * | 2023-09-27 | 2023-11-03 | 之江实验室 | 基于信息提取的患者病历数据筛选方法、装置和介质 |
CN117076655A (zh) * | 2023-07-24 | 2023-11-17 | 上海联影智能医疗科技有限公司 | 一种手术规划方案生成方法、系统、装置和介质 |
-
2023
- 2023-12-08 CN CN202311678901.1A patent/CN117372132B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116485552A (zh) * | 2023-05-08 | 2023-07-25 | 卓旭东 | 一种基金投资风控方法、装置、介质及终端 |
CN117076655A (zh) * | 2023-07-24 | 2023-11-17 | 上海联影智能医疗科技有限公司 | 一种手术规划方案生成方法、系统、装置和介质 |
CN116701662A (zh) * | 2023-08-07 | 2023-09-05 | 国网浙江浙电招标咨询有限公司 | 基于知识图谱的供应链数据管理方法、装置、设备及介质 |
CN116976640A (zh) * | 2023-08-30 | 2023-10-31 | 中电科东方通信集团有限公司 | 自动化业务生成方法、装置、计算机设备及存储介质 |
CN116994694A (zh) * | 2023-09-27 | 2023-11-03 | 之江实验室 | 基于信息提取的患者病历数据筛选方法、装置和介质 |
Also Published As
Publication number | Publication date |
---|---|
CN117372132A (zh) | 2024-01-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | Spam review detection with graph convolutional networks | |
US11710071B2 (en) | Data analysis and rendering | |
CN109977151B (zh) | 一种数据分析方法及系统 | |
JP6913241B2 (ja) | 信用力があると判定された消費者にローンを発行するシステムおよび方法 | |
Adebayo | FairML: ToolBox for diagnosing bias in predictive modeling | |
Ballings et al. | CRM in social media: Predicting increases in Facebook usage frequency | |
CA3045736A1 (en) | Digital banking platform and architecture | |
US20150066738A1 (en) | System amd method for detecting short sale fraud | |
Tsai et al. | Customer segmentation issues and strategies for an automobile dealership with two clustering techniques | |
CN110147925B (zh) | 一种风险决策方法、装置、设备及系统 | |
CN112862298B (zh) | 一种针对用户画像的信用评估方法 | |
Golder | Social science with social media | |
CN111275503B (zh) | 一种获取流失用户召回成功率的数据处理方法及装置 | |
CN111639690A (zh) | 基于关系图谱学习的欺诈分析方法、系统、介质及设备 | |
Rao et al. | Credit risk assessment mechanism of personal auto loan based on PSO-XGBoost Model | |
CN112232950A (zh) | 针对借贷风险的评估方法及装置、设备、计算机可读存储介质 | |
Zhou | Data mining for individual consumer credit default prediction under e-commence context: a comparative study | |
Jurgovsky | Context-aware credit card fraud detection | |
CN117372132B (zh) | 用户信用评分的生成方法、装置、计算机设备和存储介质 | |
Urkup et al. | Customer mobility signatures and financial indicators as predictors in product recommendation | |
Leventhal | Predictive Analytics for Marketers: Using Data Mining for Business Advantage | |
Wang | A dynamic CGE model for consumer trust mechanism within an e-commerce market | |
Wang et al. | A novel collective matrix factorization model for recommendation with fine‐grained social trust prediction | |
Qi et al. | Recommendations based on social relationships in mobile services | |
Hoang et al. | Federated artificial intelligence for unified credit assessment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |