CN116862659A - 面审题组的生成方法、装置、设备及介质 - Google Patents
面审题组的生成方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN116862659A CN116862659A CN202310884380.9A CN202310884380A CN116862659A CN 116862659 A CN116862659 A CN 116862659A CN 202310884380 A CN202310884380 A CN 202310884380A CN 116862659 A CN116862659 A CN 116862659A
- Authority
- CN
- China
- Prior art keywords
- examination
- user
- question
- history
- face
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 230000002265 prevention Effects 0.000 claims abstract description 40
- 238000012549 training Methods 0.000 claims abstract description 23
- 238000005516 engineering process Methods 0.000 claims abstract description 12
- 238000012552 review Methods 0.000 claims description 60
- 239000011159 matrix material Substances 0.000 claims description 12
- 238000001914 filtration Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 7
- 238000009795 derivation Methods 0.000 claims description 6
- 238000013136 deep learning model Methods 0.000 claims description 5
- 238000013473 artificial intelligence Methods 0.000 abstract description 4
- 230000000875 corresponding effect Effects 0.000 description 25
- 238000007689 inspection Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 7
- 230000002159 abnormal effect Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000013527 convolutional neural network Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000003313 weakening effect Effects 0.000 description 2
- RWSOTUBLDIXVET-UHFFFAOYSA-N Dihydrogen sulfide Chemical compound S RWSOTUBLDIXVET-UHFFFAOYSA-N 0.000 description 1
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000013058 risk prediction model Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/29—Graphical models, e.g. Bayesian networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Business, Economics & Management (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Biology (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了面审题组的生成方法、装置、设备及介质,涉及人工智能技术领域及金融科技技术领域,能够结合客户画像实现针对性出题,导致潜在欺诈风险的客户通过预判面审问题,逃避面审审核,识别风险客户的效力不足的技术问题。其中方法包括:根据历史面审用户的业务关联信息,对所述业务关联信息进行特征分析,得到不同面审用户群体维度下的历史面审用户的个人画像;根据所述不同面审用户群体维度下的历史面审用户的个人画像和面审问题库,训练得到防欺诈出题模型;通过获取当前面审用户画像,利用所述防欺诈出题模型确定当前面审用户的目标面审题组。本申请适用于各类面审场景下对抗欺诈用户的智能出题。
Description
技术领域
本申请涉及人工智能技术领域及金融科技技术领域,尤其是涉及到面审题组的生成方法、装置、设备及介质。
背景技术
随着互联网技术和AI技术的发展,各类金融机构推出的金融信贷等业务从线下已逐渐走向线上,并且很多场景都已经实现机器来代替人工服务。为提升金融机构的智能化,通过人工智能技术,部分金融场景已落地智能人机面审服务,为用户提供更加方便快捷的信审业务办理,但同时也面临更大的风控风险。在金融科技领域,例如,租赁汽车金融领域的智能人机面审服务中,如何有效识别出欺诈客户,以控制和规避线上人机面审的风险,也是当前極需解决的重要问题。
当前汽车金融业务中,现有人机面审方案主要通过构建面审题库,实时采集作答信息集,及面审过程中审核人的面部、微表情等信息,输入预设多模态风险预估模型,以获取客户的预警风险值。其中,构建的面审题库多为一套固定的题组或者几套固定题组随机分配来进行提问,面对所有客户都是通用性题目,导致潜在欺诈客户通过多次尝试就能够推测出出题逻辑及具体题目,从而减弱人机面审方案中通过智能问答来排查欺诈风险的力度。现有技术存在的不足为,没有考虑客户画像,因此无法对面审客户进行细分,以实现针对性出题。
发明内容
有鉴于此,本申请提供了面审题组的生成方法、装置、设备及介质,主要目的在于解决现有固定题组方式,未结合客户画像实现针对性出题,导致潜在欺诈风险的客户通过预判面审问题,逃避面审审核,识别风险客户的效力不足的技术问题。
根据本申请的一个方面,提供了一种面审题组的生成方法,该方法包括:
根据历史面审用户的业务关联信息,对所述业务关联信息进行特征分析,得到不同面审用户群体维度下的历史面审用户的个人画像;
根据所述不同面审用户群体维度下的历史面审用户的个人画像和面审问题库,训练得到防欺诈出题模型;
通过获取当前面审用户画像,利用所述防欺诈出题模型确定当前面审用户的目标面审题组。
根据本申请的另一方面,提供了一种面审题组的生成装置,该装置包括:
画像生成模块,用于根据历史面审用户的业务关联信息,对所述业务关联信息进行特征分析,得到不同面审用户群体维度下的历史面审用户的个人画像;
训练模型,用于根据所述不同面审用户群体维度下的历史面审用户的个人画像和面审问题库,训练得到防欺诈出题模型;
题组生成模块,用于通过获取当前面审用户画像,利用所述防欺诈出题模型确定当前面审用户的目标面审题组。
依据本申请又一个方面,提供了一种计算机存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述面审题组的生成方法。
依据本申请再一个方面,提供了一种计算机设备,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述面审题组的生成方法。
借由上述技术方案,本申请提供的面审题组的生成方法、装置、设备及介质,与现有固定题组方式,未结合客户画像实现针对性出题的技术方案相比,本申请根据历史面审用户的业务关联信息,对所述业务关联信息进行特征分析,得到不同面审用户群体维度下的历史面审用户的个人画像,根据所述不同面审用户群体维度下的历史面审用户的个人画像和面审问题库,训练得到防欺诈出题模型,以便在进行面审出题时,能够通过获取当前面审用户画像,利用所述防欺诈出题模型确定当前面审用户的目标面审题组。可见,基于历史面审用户的个人画像训练防欺诈出题模型,同时基于历史面审用户的个人画像实现对当前面审用户的个人画像,从而针对不同的当前面审用户的个人画像,针对性预测相应的面审题组,以避免潜在欺诈客户通过多次尝试推测出出题逻辑及具体题目,从而减弱人机面审方案中通过智能问答来排查欺诈风险的力度等问题。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1示出了本申请实施例提供的一种面审题组的生成方法的流程示意图;
图2示出了本申请实施例提供的另一种面审题组的生成方法的流程示意图;
图3示出了本申请实施例提供的一种面审题组的生成装置的结构示意图;
图4示出了本申请实施例提供的另一种面审题组的生成装置的结构示意图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本申请。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
针对现有构建的面审题库多为一套固定的题组或者几套固定题组随机分配来进行提问,面对所有客户都是通用性题目,导致潜在欺诈客户通过多次尝试就能够推测出出题逻辑及具体题目,从而减弱人机面审方案中通过智能问答来排查欺诈风险力度等技术问题。本实施例提供了一种面审题组的生成方法,能够基于历史面审用户的个人画像训练防欺诈出题模型,同时基于历史面审用户的个人画像实现对当前面审用户的个人画像,从而针对不同的当前面审用户的个人画像,针对性预测相应的面审题组。如图1所示,以该方法应用于服务器等计算机设备为例进行说明,其中,服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(CDN:Content Delivery Network)、以及大数据和人工智能平台等基础云计算服务的云服务器,如金融系统、保险系统、数字业务平台等。上述方法包括以下步骤:
步骤101、根据历史面审用户的业务关联信息,对所述业务关联信息进行特征分析,得到不同面审用户群体维度下的历史面审用户的个人画像。
在本实施例中,获取金融系统中用户的基本信息,并根据基本信息获取相应的业务关联信息,根据实际应用场景的需求,业务关联信息包括融资金额、信用评分、风险等级、身份信息等,风险等级进一步包括历史面审次数、历史是否逾期及逾期特点等,通过对业务关联信息进行聚类或者枚举处理,为不同的历史面审用户群体进行标签化处理,归类汇总得到不同历史面审用户群体的群体标签,例如,低融资额低风险用户、高信用评分低风险用户、高融资额高风险用户等。进一步地,通过搭建Hadoop集群,采用特征派生技术从历史面审用户的业务关联信息进行特征分析,确定历史面审用户特征,并基于历史面审用户特征,利用贝叶斯网络技术输出针对每个历史面审用户群体中各历史面审用户的个人画像。
步骤102、根据所述不同面审用户群体维度下的历史面审用户的个人画像和面审问题库,训练得到防欺诈出题模型。
在本实施例中,基于卷积神经网络(CNN:Convolutional Neural Networks)的深度学习训练得到防欺诈出题模型,从而建立目标面审用户画像与反欺诈出题结果之间的强关联,即针对不同用户画像对应的面审用户,选择不同类别的面审题组。具体地,根据所述历史面审用户的个人画像、所述面审问题库中所有面审题目编号和所述历史面审用户被提问的历史面审题组编号,对深度学习模型进行训练,并针对历史面审用户,以历史面审用户被提问的历史面审题组编号为预测目标,训练得到防欺诈出题模型。
步骤103、通过获取当前面审用户画像,利用所述防欺诈出题模型确定当前面审用户的目标面审题组。
在本实施例中,依照步骤101的方式获取当前面审用户画像,为保证防欺诈出题模型能够输出较为准确的面审题组,在输入防欺诈出题模型之前,根据历史面审用户的个人画像、历史面审用户对应的历史面审题组,建立面审用户相似度矩阵,并根据面审用户相似度矩阵,确定与当前面审用户匹配的初始面审题组,进而以当前面审用户画像和初始面审题组作为输入数据,利用训练好的防欺诈出题模型预测某个面审题目是否需要被提问,从而输出该当前面审用户需要被提问的目标面审题组编号,以得到当前面审用户的目标面审题组。
对于本实施例可以按照上述方案,根据历史面审用户的业务关联信息,对所述业务关联信息进行特征分析,得到不同面审用户群体维度下的历史面审用户的个人画像,根据所述不同面审用户群体维度下的历史面审用户的个人画像和面审问题库,训练得到防欺诈出题模型,以便在进行面审出题时,能够通过获取当前面审用户画像,利用所述防欺诈出题模型确定当前面审用户的目标面审题组,与现有固定题组方式,未结合客户画像实现针对性出题的技术方案相比,本实施例能够基于基于历史面审用户的个人画像训练防欺诈出题模型,同时基于历史面审用户的个人画像实现对当前面审用户的个人画像,从而针对不同的当前面审用户的个人画像,针对性预测相应的面审题组,以避免潜在欺诈客户通过多次尝试推测出出题逻辑及具体题目,从而减弱人机面审方案中通过智能问答来排查欺诈风险的力度等问题。
进一步的,作为上述实施例具体实施方式的细化和扩展,为了完整说明本实施例的具体实施过程,提供了另一种面审题组的生成方法,本实施例能够应用在租赁汽车金融的人机面审问答环节,能够提高识别面审用户欺诈风险上的预警能力,降低风控风险。本实施例在人机面审方案的智能问答环节中,基于AI扩充面审问题库中的面审问题,并且能够根据面审用户画像,以及人机面审过程中的实时问答结果,利用防欺诈出题模型实时为面审用户智能生成或调整面审题组,以达到人机面审中通过智能问答来协助欺诈风险判断的作用,同时有效提升欺诈用户识别力度。如图2所示,该方法包括:
步骤201、对所述历史面审用户的业务关联信息进行聚类处理,确定多个历史面审用户群体,并得到所述历史面审用户与所述历史面审用户群体的对应关系。
为了说明步骤201的具体实施方式,作为一种优选实施例,步骤201具体包括:根据所述历史面审用户的业务关联信息,针对融资金额、信用评分和风险等级三个维度进行聚类处理,确定多个历史面审用户群体;其中,所述历史面审用户的业务关联信息包括融资金额、信用评分和风险等级,所述风险等级包括历史面审次数和历史逾期信息。
实施中,针对融资金额、信用评分和风险等级三个维度进行聚类处理,历史面审用户群体可以包括低融资额低风险客户、高信用评分低风险客户、高融资额高风险客户等。根据实际应用场景的需要,可以增加有直接或者间接影响因素的指标信息,以丰富历史面审用户群体的种类,此处不对历史面审用户群体的种类进行具体限定。
步骤202、基于搭建的Hadoop集群,利用特征派生技术对所述业务关联信息进行特征扩展,得到所述历史面审用户的历史面审用户特征。
步骤203、根据所述历史面审用户的历史面审用户特征,结合所述历史面审用户对应的历史面审用户群体确定所述历史面审用户的个人画像。
为了说明步骤203的具体实施方式,作为一种优选实施例,步骤203具体包括:计算不同历史面审用户群体的标签值;根据所述历史面审用户的历史面审用户特征,以及所述历史面审用户对应的历史面审用户群体的标签值,利用贝叶斯网络计算出每个所述历史面审用户的个人画像。
实施中,基于历史面审用户群体的种类,对各种类中的指标信息进行量化处理,得到相应的标签值,具体为,针对融资金额指标,可以分为4个等级,分别是:(0-6)、[6,12)、[12,18)、[18,+∞);针对信用评分指标,可以分为5个等级,分别是:I、II、III、IV、V;针对风险等级指标中的历史面审次数指标,可以分为4个等级,分别是:0次、1次、2次、≥3次。因此,针对一类历史面审用户群体的标签值可以表示为,历史面审用户群体A,融资金额<6万,信用评分为V级,历史面审次数为0次。
因此,基于搭建的Hadoop集群,利用特征派生技术对业务关联信息进行特征派生,得到扩展后的历史面审用户的历史面审用户特征,进而根据历史面审用户的历史面审用户特征,以及所述历史面审用户对应的历史面审用户群体的标签值,利用贝叶斯网络计算出每个历史面审用户的个人画像。
步骤204、对历史面审问题进行扩展处理,构建面审问题库。
为了说明步骤204的具体实施方式,作为一种优选实施例,步骤204具体包括:利用协同过滤算法对所述历史面审问题进行聚类处理,确定多个面审题目类别;利用词嵌入算法对多个所述面审题目类别进行面审问题扩展,得到面审问题库。
实施中,获取历史面审客户的历史面审问题,利用协同过滤算法计算历史面审问题之间的相似度,并结合防欺诈维度对历史面审问题进行聚类处理,得到不同防欺诈维度的问题子库,根据实际应用场景的需求,依照不同的防欺诈维度可以分为核身问题子库、场景问题子库、融资问题子库、车辆问题子库、购车使用人问题子库、还款问题子库、信用问题子库等。
进一步地,将各问题子库中的历史面审问题作为已有种子问题,通过词嵌入算法Word-Embeddings进行词汇替换,实现对已有种子问题的问题扩充,替换已有种子问题中的某一部分,自动生成含义相近的扩展问题,以丰富各问题子库,从而得到最终的面审问题库,实现面审问题库的智能生成,从而提升面审问题生成效率,解放人力,以避免现有面审问题库题目数量有限的问题。
步骤205、根据所述不同面审用户群体维度下的历史面审用户的个人画像和面审问题库,训练得到防欺诈出题模型。
步骤206、根据所述历史面审用户的个人画像、所述历史面审用户对应的历史面审题组,建立面审用户相似度矩阵。
步骤207、根据所述面审用户相似度矩阵,确定与所述当前面审用户匹配的初始面审题组。
实施中,根据不同面审用户群体维度下的历史面审用户的个人画像,以及历史面审用户对应的历史面审题组,建立面审用户相似度矩阵,基于所建立的面审用户相似度矩阵不仅能够进一步确定与相似面审用户匹配的初始面审题组,以保证后续防欺诈出题模型能够输出较为准确的面审题组,并且能够进一步优化上述提及的协同过滤算法(协同过滤系统)。其中,在利用相似度算法建立面审用户相似度矩阵的过程中,考虑到不同面审用户群体的打分体系标准并不统一,相似度算法采用皮尔逊相关度评价,并规定相关系数的分类,例如,0.8-1.0为极强相关;0.6-0.8为强相关;0.4-0.6为中等程度相关;0.2-0.4为弱相关;0.0-0.2为极弱相关或无相关。
因此,根据面审用户相似度矩阵,获取与当前面审用户存在极强相关关系的历史面审用户对应的历史面审题组,并进一步利用优化后的协同过滤算法,确定与当前面审用户匹配的初始面审题组,以便后续根据当前面审用户画像和所确定的初始面审题组,利用深度学习训练得到的防欺诈出题模型确定当前面审用户的目标面审题组,确定当前面审用户应该被提问的面审题目类别,从而精准确定面审问题库中的哪些面审问题需要被提问。可见,本实施例将深度学习模型与协同过滤算法相结合,以提升对防欺诈题目的精准预测。
步骤208、根据获取到的当前面审用户画像和所述初始面审题组,利用所述防欺诈出题模型确定当前面审用户的目标面审题组。其中,根据所述历史面审用户的个人画像、所述面审问题库中所有面审题目编号和所述历史面审用户被提问的历史面审题组编号,对深度学习模型进行训练,得到防欺诈出题模型。
为了说明步骤208的具体实施方式,作为一种优选实施例,步骤208之后还包括:在当前面审用户进行人机问答的过程中,实时更新当前面审用户画像,并利用防欺诈出题模型调整目标面审题组,生成调整后的面审问题,直至问答结束。
实施中,为了进一步提升目标面审题组的准确率,根据实际应用场景的需求,可以对所生成的目标面审题组进行实时调整,在当前面审用户根据所生成的目标面审题组进行人机问答时,判断问答是否结束。如果结束,则将回答错误的面审问题生成异常标签,输入预设的多模态风险模型,以便输出异常异常标签的类别,例如,核身问题异常、场景问题异常、融资问题异常等;如果未结束,则实时分析每轮问答结果,更新当前面审用户画像,根据更新的当前面审用户画像,利用防欺诈出题模型智能调整目标面审题组,根据调整后的目标面审题组进行新一轮的人机问答,并再次判断问答是否结束,直至人机问答结束。可见,通过在当前面审用户进行人机问答的过程中,实时更新当前面审用户画像,利用防欺诈出题模型动态调整出题策略,从而生成相应的对抗优化问题,即更加准确的面审问题,直至问答结束。
此外,为了保证防欺诈出题模型的不断完善,可以进一步对防欺诈出题模型进行校正处理,具体为,后续继续追踪当前面审用户的每期还款情况,判断当前面审用户是否为逾期用户。如果未逾期,则归档处理;如果存在逾期情况,则收集逾期用户的相关数据,进一步优化面审用户画像算法,以及对防欺诈出题模型进行训练、优化,逐步优化防欺诈出题模型。可见,在进一步提升防欺诈问题考察的力度,以提高识别欺诈用户的灵敏度,减少错误判断的同时,还能够通过后续跟进面审用户是否逾期,实现防欺诈出题模型的优化闭环,提高模型准确率,以解决现有无法对实时采集的面审用户回答结果进行判断分析,进而动态灵活调整后续出题策略的问题。
通过应用本实施例的技术方案,根据历史面审用户的业务关联信息,对所述业务关联信息进行特征分析,得到不同面审用户群体维度下的历史面审用户的个人画像,根据所述不同面审用户群体维度下的历史面审用户的个人画像和面审问题库,训练得到防欺诈出题模型,以便在进行面审出题时,能够通过获取当前面审用户画像,利用所述防欺诈出题模型确定当前面审用户的目标面审题组,以及在当前面审用户进行人机问答的过程中,实时更新当前面审用户画像,并利用防欺诈出题模型调整目标面审题组,生成调整后的面审问题,直至问答结束。可见,与现有固定题组方式,未结合客户画像及答题情况实现针对性出题的技术方案相比,本实施例能够基于基于历史面审用户的个人画像训练防欺诈出题模型,同时基于历史面审用户的个人画像实现对当前面审用户的个人画像,从而针对不同的当前面审用户的个人画像,针对性预测相应的面审题组,提高识别面审用户欺诈性的准确性,以避免潜在欺诈客户通过多次尝试推测出出题逻辑及具体题目,从而减弱人机面审方案中通过智能问答来排查欺诈风险的力度等问题。
进一步的,作为图1方法的具体实现,本申请实施例提供了一种面审题组的生成装置,如图3所示,该装置包括:画像生成模块31、训练模型33、题组生成模块35。
画像生成模块31,用于根据历史面审用户的业务关联信息,对所述业务关联信息进行特征分析,得到不同面审用户群体维度下的历史面审用户的个人画像。
训练模型33,用于根据所述不同面审用户群体维度下的历史面审用户的个人画像和面审问题库,训练得到防欺诈出题模型。
题组生成模块35,用于通过获取当前面审用户画像,利用所述防欺诈出题模型确定当前面审用户的目标面审题组。
在具体的应用场景中,如图4所示,画像生成模块31包括:聚类单元311、扩展单元312、结合单元313。
聚类单元311,可以用于对所述历史面审用户的业务关联信息进行聚类处理,确定多个历史面审用户群体,并得到所述历史面审用户与所述历史面审用户群体的对应关系。
扩展单元312,可以用于基于搭建的Hadoop集群,利用特征派生技术对所述业务关联信息进行特征扩展,得到所述历史面审用户的历史面审用户特征。
结合单元313,可以用于根据所述历史面审用户的历史面审用户特征,结合所述历史面审用户对应的历史面审用户群体确定所述历史面审用户的个人画像。
在具体的应用场景中,所述聚类单元311具体用于根据所述历史面审用户的业务关联信息,针对融资金额、信用评分和风险等级三个维度进行聚类处理,确定多个历史面审用户群体;其中,所述历史面审用户的业务关联信息包括融资金额、信用评分和风险等级,所述风险等级包括历史面审次数和历史逾期信息。
在具体的应用场景中,所述确定单元313具体用于计算不同历史面审用户群体的标签值;根据所述历史面审用户的历史面审用户特征,以及所述历史面审用户对应的历史面审用户群体的标签值,利用贝叶斯网络计算出每个所述历史面审用户的个人画像。
在具体的应用场景中,该装置还包括:构建模块32,用于对历史面审问题进行扩展处理,构建面审问题库。
所述构建模块32,具体用于利用协同过滤算法对所述历史面审问题进行聚类处理,确定多个面审题目类别;利用词嵌入算法对多个所述面审题目类别进行面审问题扩展,得到面审问题库。
在具体的应用场景中,该装置还包括:确定模块34,用于根据所述历史面审用户的个人画像、所述历史面审用户对应的历史面审题组,建立面审用户相似度矩阵;根据所述面审用户相似度矩阵,确定与所述当前面审用户匹配的初始面审题组。
在具体的应用场景中,题组生成模块35具体用于根据获取到的当前面审用户画像和所述初始面审题组,利用所述防欺诈出题模型确定当前面审用户的目标面审题组;其中,根据所述历史面审用户的个人画像、所述面审问题库中所有面审题目编号和所述历史面审用户被提问的历史面审题组编号,对深度学习模型进行训练,得到防欺诈出题模型。
需要说明的是,本申请实施例提供的一种面审题组的生成装置所涉及各功能单元的其他相应描述,可以参考图1和图2中的对应描述,在此不再赘述。
基于上述如图1和图2所示方法,相应的,本申请实施例还提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述如图1和图2所示的面审题组的生成方法。
基于这样的理解,本申请的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施场景所述的方法。
基于上述如图1、图2所示的方法,以及图3所示的虚拟装置实施例,为了实现上述目的,本申请实施例还提供了一种计算机设备,具体可以为个人计算机、服务器、网络设备等,该实体设备包括存储介质和处理器;存储介质,用于存储计算机程序;处理器,用于执行计算机程序以实现上述如图1和图2所示的面审题组的生成方法。
可选的,该计算机设备还可以包括用户接口、网络接口、摄像头、射频(RadioFrequency,RF)电路,传感器、音频电路、WI-FI模块等等。用户接口可以包括显示屏(Display)、输入单元比如键盘(Keyboard)等,可选用户接口还可以包括USB接口、读卡器接口等。网络接口可选的可以包括标准的有线接口、无线接口(如蓝牙接口、WI-FI接口)等。
本领域技术人员可以理解,本实施例提供的一种计算机设备结构并不构成对该实体设备的限定,可以包括更多或更少的部件,或者组合某些部件,或者不同的部件布置。
存储介质中还可以包括操作系统、网络通信模块。操作系统是管理计算机设备硬件和软件资源的程序,支持信息处理程序以及其它软件和/或程序的运行。网络通信模块用于实现存储介质内部各组件之间的通信,以及与该实体设备中其它硬件和软件之间通信。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本申请可以借助软件加必要的通用硬件平台的方式来实现,也可以通过硬件实现。通过应用本申请的技术方案,与现有固定题组方式,未结合客户画像及答题情况实现针对性出题的技术方案相比,本实施例能够基于基于历史面审用户的个人画像训练防欺诈出题模型,同时基于历史面审用户的个人画像实现对当前面审用户的个人画像,从而针对不同的当前面审用户的个人画像,针对性预测相应的面审题组,提高识别面审用户欺诈性的准确性,以避免潜在欺诈客户通过多次尝试推测出出题逻辑及具体题目,从而减弱人机面审方案中通过智能问答来排查欺诈风险的力度等问题。
本领域技术人员可以理解附图只是一个优选实施场景的示意图,附图中的模块或流程并不一定是实施本申请所必须的。本领域技术人员可以理解实施场景中的装置中的模块可以按照实施场景描述进行分布于实施场景的装置中,也可以进行相应变化位于不同于本实施场景的一个或多个装置中。上述实施场景的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
上述本申请序号仅仅为了描述,不代表实施场景的优劣。以上公开的仅为本申请的几个具体实施场景,但是,本申请并非局限于此,任何本领域的技术人员能思之的变化都应落入本申请的保护范围。
Claims (10)
1.一种面审题组的生成方法,其特征在于,包括:
根据历史面审用户的业务关联信息,对所述业务关联信息进行特征分析,得到不同面审用户群体维度下的历史面审用户的个人画像;
根据所述不同面审用户群体维度下的历史面审用户的个人画像和面审问题库,训练得到防欺诈出题模型;
通过获取当前面审用户画像,利用所述防欺诈出题模型确定当前面审用户的目标面审题组。
2.根据权利要求1所述的方法,其特征在于,所述根据历史面审用户的业务关联信息,对所述业务关联信息进行特征分析,得到不同面审用户群体维度下的历史面审用户的个人画像步骤,包括:
对所述历史面审用户的业务关联信息进行聚类处理,确定多个历史面审用户群体,并得到所述历史面审用户与所述历史面审用户群体的对应关系;
基于搭建的Hadoop集群,利用特征派生技术对所述业务关联信息进行特征扩展,得到所述历史面审用户的历史面审用户特征;
根据所述历史面审用户的历史面审用户特征,结合所述历史面审用户对应的历史面审用户群体确定所述历史面审用户的个人画像。
3.根据权利要求2所述的方法,其特征在于,所述对所述历史面审用户的业务关联信息进行聚类处理,确定多个历史面审用户群体步骤,具体包括:
根据所述历史面审用户的业务关联信息,针对融资金额、信用评分和风险等级三个维度进行聚类处理,确定多个历史面审用户群体;
其中,所述历史面审用户的业务关联信息包括融资金额、信用评分和风险等级,所述风险等级包括历史面审次数和历史逾期信息。
4.根据权利要求2或3所述的方法,其特征在于,所述根据所述历史面审用户的历史面审用户特征,结合所述历史面审用户对应的历史面审用户群体确定所述历史面审用户的个人画像步骤,具体包括:
计算不同历史面审用户群体的标签值;
根据所述历史面审用户的历史面审用户特征,以及所述历史面审用户对应的历史面审用户群体的标签值,利用贝叶斯网络计算出每个所述历史面审用户的个人画像。
5.根据权利要求1所述的方法,其特征在于,所述根据所述不同面审用户群体维度下的历史面审用户的个人画像和面审问题库,训练得到防欺诈出题模型步骤之前,还包括:对历史面审问题进行扩展处理,构建面审问题库;
所述对历史面审问题进行扩展处理,得到面审问题库的步骤,具体包括:
利用协同过滤算法对所述历史面审问题进行聚类处理,确定多个面审题目类别;
利用词嵌入算法对多个所述面审题目类别进行面审问题扩展,得到面审问题库。
6.根据权利要求1所述的方法,其特征在于,所述通过获取当前面审用户画像,利用所述防欺诈出题模型确定当前面审用户的面审题组步骤之前,还包括:
根据所述历史面审用户的个人画像、所述历史面审用户对应的历史面审题组,建立面审用户相似度矩阵;
根据所述面审用户相似度矩阵,确定与所述当前面审用户匹配的初始面审题组。
7.根据权利要求6所述的方法,其特征在于,所述通过获取当前面审用户画像,利用所述防欺诈出题模型确定当前面审用户的目标面审题组步骤,包括:
根据获取到的当前面审用户画像和所述初始面审题组,利用所述防欺诈出题模型确定当前面审用户的目标面审题组;
其中,根据所述历史面审用户的个人画像、所述面审问题库中所有面审题目编号和所述历史面审用户被提问的历史面审题组编号,对深度学习模型进行训练,得到防欺诈出题模型。
8.一种面审题组的生成装置,其特征在于,包括:
画像生成模块,用于根据历史面审用户的业务关联信息,对所述业务关联信息进行特征分析,得到不同面审用户群体维度下的历史面审用户的个人画像;
训练模型,用于根据所述不同面审用户群体维度下的历史面审用户的个人画像和面审问题库,训练得到防欺诈出题模型;
题组生成模块,用于通过获取当前面审用户画像,利用所述防欺诈出题模型确定当前面审用户的目标面审题组。
9.一种计算机存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1至7中任一项所述面审题组的生成方法。
10.一种计算机设备,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至7中任一项所述的面审题组的生成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310884380.9A CN116862659A (zh) | 2023-07-18 | 2023-07-18 | 面审题组的生成方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310884380.9A CN116862659A (zh) | 2023-07-18 | 2023-07-18 | 面审题组的生成方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116862659A true CN116862659A (zh) | 2023-10-10 |
Family
ID=88221343
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310884380.9A Pending CN116862659A (zh) | 2023-07-18 | 2023-07-18 | 面审题组的生成方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116862659A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117132391A (zh) * | 2023-10-16 | 2023-11-28 | 杭银消费金融股份有限公司 | 一种基于人机交互的授信审批方法与系统 |
-
2023
- 2023-07-18 CN CN202310884380.9A patent/CN116862659A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117132391A (zh) * | 2023-10-16 | 2023-11-28 | 杭银消费金融股份有限公司 | 一种基于人机交互的授信审批方法与系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108648074B (zh) | 基于支持向量机的贷款评估方法、装置及设备 | |
CN110147823B (zh) | 一种风控模型训练方法、装置及设备 | |
EP3494575B1 (en) | Devices and methods for evaluating speech quality | |
CN111681091B (zh) | 基于时间域信息的金融风险预测方法、装置及存储介质 | |
US20150142446A1 (en) | Credit Risk Decision Management System And Method Using Voice Analytics | |
CN109376766B (zh) | 一种画像预测分类方法、装置及设备 | |
CN113014566B (zh) | 恶意注册的检测方法、装置、计算机可读介质及电子设备 | |
Ramos et al. | From biometric scores to forensic likelihood ratios | |
Pallathadka et al. | Investigating the impact of artificial intelligence in education sector by predicting student performance | |
CN116862659A (zh) | 面审题组的生成方法、装置、设备及介质 | |
Nguyen | Is a bit more experience bad? The role of entrepreneurial experience on investment rate | |
Sun | The incremental informativeness of the sentiment of conference calls for internal control material weaknesses | |
WO2024124957A1 (zh) | 针对智能感知系统的测试方法、系统、电子设备 | |
CN113723774A (zh) | 答题评分方法、装置、计算机设备和存储介质 | |
CN111476657B (zh) | 信息推送方法、装置及系统 | |
EP3879418B1 (en) | Identity verification method and device | |
CN111582757A (zh) | 欺诈风险的分析方法、装置、设备及计算机可读存储介质 | |
CN112465632A (zh) | 一种新金融ai智能风控决策方法和系统 | |
CN117196630A (zh) | 交易风险预测方法、装置、终端设备以及存储介质 | |
CN117132383A (zh) | 一种信贷数据处理方法、装置、设备及可读存储介质 | |
CN115630147A (zh) | 应答方法、装置、电子设备及存储介质 | |
CN115423597A (zh) | 一种货车etc金融数智风控决策大数据系统及方法 | |
CN116911313B (zh) | 一种语义漂移文本的识别方法及装置 | |
CN116112273B (zh) | 反欺诈人机识别方法及系统 | |
CN117172789A (zh) | 用于可疑交易监测的风险评估模型构建方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |