CN112116356B - 资产特征信息处理方法及装置 - Google Patents
资产特征信息处理方法及装置 Download PDFInfo
- Publication number
- CN112116356B CN112116356B CN202011038418.3A CN202011038418A CN112116356B CN 112116356 B CN112116356 B CN 112116356B CN 202011038418 A CN202011038418 A CN 202011038418A CN 112116356 B CN112116356 B CN 112116356B
- Authority
- CN
- China
- Prior art keywords
- information
- relationship information
- client
- relationship
- colleague
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 16
- 238000003672 processing method Methods 0.000 title claims abstract description 9
- 238000000034 method Methods 0.000 claims abstract description 26
- 230000006399 behavior Effects 0.000 claims description 42
- 230000006870 function Effects 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 16
- 238000004364 calculation method Methods 0.000 claims description 10
- 230000006866 deterioration Effects 0.000 abstract description 4
- 238000012545 processing Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 9
- 239000013598 vector Substances 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000007418 data mining Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 208000001613 Gambling Diseases 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 238000011049 filling Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q20/00—Payment architectures, schemes or protocols
- G06Q20/38—Payment protocols; Details thereof
- G06Q20/40—Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
- G06Q20/401—Transaction verification
- G06Q20/4016—Transaction verification involving fraud or risk level assessment in transaction processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/02—Banking, e.g. interest calculation or account maintenance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Physics & Mathematics (AREA)
- Finance (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Primary Health Care (AREA)
- Human Resources & Organizations (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Development Economics (AREA)
- Technology Law (AREA)
- Computer Security & Cryptography (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种资产特征信息处理方法及装置,该方法包括:根据自银行系统中采集的第一客户的基础数据和行为数据,获取第一客户的家庭关系信息、亲属关系信息、同事关系信息和社区关系信息并确定第二客户;根据第一客户和第二客户的基础数据和行为数据,分别获取家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重;根据家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重与各个关系信息中第二客户的资产特征信息,获取第一客户的资产特征信息。本发明可以保证能够准确识别出伪造信息、伪装成好客户的欺诈分子,获取到客户资产状况恶化的先兆,同时,即使第一客户为新用户,也便于获取其资产特征和行为特征。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种资产特征信息处理方法及装置。
背景技术
一个人的社会关系网络往往能够体现他的资产状况和信用状况,在反欺诈和风控领域有着显著的作用。一个拥有正常社会关系的客户几乎不可能是诈骗份子;一个家庭成员有严重逾期行为的客户有较大可能资产状况恶化。当一个新客户进入系统时,我们能得到的特征是很少的,且大部分都是个人基础信息,资产、信用、消费等信息几乎为空。显然,如果能利用该客户的家庭成员、同事等社会关系人的信息如收入、资产等,反映该客户的资产及信用状态,是可以接受的,且有一定参考意义。
但现有技术目前并没有使用个人社会关系网络的相关技术,无法识别伪造信息、伪装成好客户的欺诈分子,也没办法获取到客户资产状况恶化的先兆,同时,难以获取新用户的资产特征和行为特征。
发明内容
本发明实施例提供一种资产特征信息处理方法,用以保证能够准确识别出伪造信息、伪装成好客户的欺诈分子,获取到客户资产状况恶化的先兆,同时,即使第一客户为新用户,也便于获取其资产特征和行为特征,该方法包括:
根据自银行系统中采集的第一客户的基础数据和行为数据,获取第一客户的家庭关系信息、亲属关系信息、同事关系信息和社区关系信息,并确定第二客户,所述第二客户为在家庭关系信息、亲属关系信息、同事关系信息和社区关系信息中与第一客户相关的客户;
根据第一客户和第二客户的基础数据和行为数据,分别获取家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重;
根据家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重与各个关系信息中第二客户的资产特征信息,获取第一客户的资产特征信息。
可选的,根据第一客户和第二客户的基础数据和行为数据,分别获取家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重,包括:
根据第一客户和第二客户的基础数据和行为数据,计算第一客户和第二客户的余弦相似度;
利用Softmax函数分别对家庭关系信息、亲属关系信息、同事关系信息和社区关系信息中的第一客户和第二客户的余弦相似度进行计算,以分别获取家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重。
可选的,根据第一客户和第二客户的基础数据和行为数据,分别获取家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重,包括:
根据第一客户和第二客户的基础数据和行为数据,计算第一客户和第二客户的指定特征数据的皮尔逊相关系数;
利用Softmax函数分别对家庭关系信息、亲属关系信息、同事关系信息和社区关系信息中的第一客户和第二客户的指定特征数据的皮尔逊相关系数进行计算,以分别获取家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重。
可选的,根据家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重与各个关系信息中第二客户的资产特征信息,获取第一客户的资产特征信息,包括:
分别获取家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重与各自对应的关系信息中第二客户的资产特征信息的均值数据;
分别将家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重和各自对应的关系信息中第二客户资产特征信息的均值数据相乘,以分别得到家庭关系信息、亲属关系信息、同事关系信息和社区关系信息中的乘积数据;
对家庭关系信息、亲属关系信息、同事关系信息和社区关系信息中的乘积数据进行求和,以获取第一客户的资产特征信息。
本发明实施例还提供一种资产特征信息处理装置,用以保证能够准确识别出伪造信息、伪装成好客户的欺诈分子,获取到客户资产状况恶化的先兆,同时,即使第一客户为新用户,也便于获取其资产特征和行为特征,该装置包括:
信息采集模块,用于根据自银行系统中采集的第一客户的基础数据和行为数据,获取第一客户的家庭关系信息、亲属关系信息、同事关系信息和社区关系信息,并确定第二客户,所述第二客户为在家庭关系信息、亲属关系信息、同事关系信息和社区关系信息中与第一客户相关的客户;
权重计算模块,用于根据第一客户和第二客户的基础数据和行为数据,分别获取家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重;
资产特征信息获取模块,用于根据家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重与各个关系信息中第二客户的资产特征信息,获取第一客户的资产特征信息。
可选的,权重计算模块进一步用于:
根据第一客户和第二客户的基础数据和行为数据,计算第一客户和第二客户的余弦相似度;
利用Softmax函数分别对家庭关系信息、亲属关系信息、同事关系信息和社区关系信息中的第一客户和第二客户的余弦相似度进行计算,以分别获取家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重。
可选的,权重计算模块进一步用于:
根据第一客户和第二客户的基础数据和行为数据,计算第一客户和第二客户的指定特征数据的皮尔逊相关系数;
利用Softmax函数分别对家庭关系信息、亲属关系信息、同事关系信息和社区关系信息中的第一客户和第二客户的指定特征数据的皮尔逊相关系数进行计算,以分别获取家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重。
可选的,资产特征信息获取模块进一步用于:
分别获取家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重与各自对应的关系信息中第二客户的资产特征信息的均值数据;
分别将家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重和各自对应的关系信息中第二客户资产特征信息的均值数据相乘,以分别得到家庭关系信息、亲属关系信息、同事关系信息和社区关系信息中的乘积数据;
对家庭关系信息、亲属关系信息、同事关系信息和社区关系信息中的乘积数据进行求和,以获取第一客户的资产特征信息。
本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述方法的计算机程序。
本发明实施例中,通过根据自银行系统中采集的第一客户的基础数据和行为数据,获取第一客户的家庭关系信息、亲属关系信息、同事关系信息和社区关系信息,并确定第二客户,所述第二客户为在家庭关系信息、亲属关系信息、同事关系信息和社区关系信息中与第一客户相关的客户,有效利用了第一客户的家庭关系、亲属关系、同事关系和社区关系,为后续获取第一客户的资产特征信息奠定了基础,通过根据第一客户和第二客户的基础数据和行为数据,分别获取家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重,再根据家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重与各个关系信息中第二客户的资产特征信息,即可获取第一客户的资产特征信息,以保证能够准确识别出伪造信息、伪装成好客户的欺诈分子,获取到客户资产状况恶化的先兆,同时,即使第一客户为新用户,也便于获取其资产特征和行为特征。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本发明实施例中资产特征信息处理方法的流程图;
图2为本发明实施例中计算第一客户和第二客户关系权重的流程图;
图3为本发明实施例中计算第一客户和第二客户关系权重的又一流程图;
图4为本发明实施例中资产特征信息处理装置的结构示意图;
图5为本发明实施例计算机设备示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。
下面对本申请中涉及的名词进行说明:
余弦相似度:用向量空间中两个向量夹角的余弦值作为衡量两个个体之间的差异。余弦值越接近1,代表两个向量夹角越接近0度,则两个向量越相似。
皮尔逊相关系数:用于度量两个变量之间相关性(线性相关),值介于-1与1之间。越接近1,正相关性越强,越接近-1,负相关性越强。
Softmax:将输入(多个值)映射到[0,1]之间的实数,并且归一化保证和为1。
图1为本发明实施例提供的一种资产特征信息处理方法的流程图,如图1所示,该方法包括:
步骤101、根据自银行系统中采集的第一客户的基础数据和行为数据,获取第一客户的家庭关系信息、亲属关系信息、同事关系信息和社区关系信息,并确定第二客户,所述第二客户为在家庭关系信息、亲属关系信息、同事关系信息和社区关系信息中与第一客户相关的客户。
在实施例中,基础数据包括:家庭电话、家庭地址、公司名称以及工作地址等,行为数据包括:个人的代发薪数据、卡交易数据、信贷数据。
对于家庭关系信息:相同的家庭电话或家庭地址的两个客户(即第一客户和第二客户)被视为拥有家庭关系,该家庭关系信息可以通过银行系统中的信贷子系统中获得,例如,该担保人类型为直系亲属,则可以确定两者属于家庭关系,进而得到三元组(第一客户-家庭关系-第二客户)。
对于亲属关系信息:可以根据上述家庭关系信息加工获取亲属关系信息,例如,第一客户和第二客户拥有家庭关系,第二客户、第三客户拥有家庭关系,推断第一客户、第三客户拥有亲属关系。得到三元组(第一客户-亲属关系-第二客户)。此外,通过银行系统中的信贷子系统也可获得该亲属关系信息,具体地,可以将信贷子系统中担保人关系类型为非直系亲属的信息加工为亲属关系信息。
对于同事关系信息:拥有相同公司名称或工作地址的两个客户(即第一客户和第二客户)被视为拥有同事关系,银行系统中代发薪子系统同一个商户号代发的客户也被视为同事关系,进而得到三元组(第一客户-同事关系-第二客户)。
对于社区关系信息:从家庭地址和工作地址中提取出街道地址或小区名称,相同街道地址或小区的人被视为拥有社区关系,此外,从卡交易数据获取客户较频繁消费的商户,拥有多个相同频繁消费商户的客户之间也视为社区关系,进而得到三元组(第一客户-社区关系-第二客户)。
其中,家庭关系信息、亲属关系信息、同事关系信息和社区关系信息构成了社会关系网络,便于后续进行权重计算操作。
具体实施时,可以每隔预设时间重新采集全量客户的基础数据和行为数据,并对新增客户进行挖掘。举例来说,可以每半年重新采集全量客户数据执行一次,然后每月仅对新增客户进行挖掘。
步骤102、根据第一客户和第二客户的基础数据和行为数据,分别获取家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重。
具体实施时,根据第一客户和第二客户的基础数据和行为数据,分别获取家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重的方法可以有多种,举例来说:
作为一种示例,如图2所示,根据第一客户和第二客户的基础数据和行为数据,分别获取家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重,包括:
步骤201、根据第一客户和第二客户的基础数据和行为数据,计算第一客户和第二客户的余弦相似度。
步骤202、利用Softmax函数分别对家庭关系信息、亲属关系信息、同事关系信息和社区关系信息中的第一客户和第二客户的余弦相似度进行计算,以分别获取家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重。
具体地,基于上述家庭关系信息、亲属关系信息、同事关系信息和社区关系信息构成的社会关系网络,计算不同关系下第一客户与第二客户的相似度,以家庭关系为例,从家庭关系的三元组(第一客户-家庭关系-第二客户)中抽出所有客户组合(第一客户,第二客户),计算第一客户、第二客户特征的余弦相似度。从所有家庭关系客户组合的余弦相似度取中位数,记为对亲属关系、同事关系、社区关系重复同样的操作。最后对四种社会关系的/>进行Softmax操作得到cr,这就是基于余弦相似度求得的关系权重,具体公式及信息取值范围如下所示:
其中,a为第一客户的特征,b为第二客户的特征,r为关系特征(以家庭关系为例,r为家庭关系特征)。对于第一客户的特征和第二客户的特征,举例来说,在处理信贷业务时,客户的信用等级即可作为客户的特征,如第一客户的信用等级为3级,则a为3。
作为另一种示例,如图3所示,根据第一客户和第二客户的基础数据和行为数据,分别获取家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重,包括:
步骤301、根据第一客户和第二客户的基础数据和行为数据,计算第一客户和第二客户的指定特征数据的皮尔逊相关系数;
步骤302、利用Softmax函数分别对家庭关系信息、亲属关系信息、同事关系信息和社区关系信息中的第一客户和第二客户的指定特征数据的皮尔逊相关系数进行计算,以分别获取家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重。
具体地,基于上述家庭关系信息、亲属关系信息、同事关系信息和社区关系信息构成的社会关系网络,计算第一客户和第二客户的指定特征数据的皮尔逊相关系数。以家庭关系为例,从家庭关系的三元组(第一客户-家庭关系-第二客户)中抽出所有客户组合(第一客户,第二客户),计算他们指定特征数据的皮尔逊相关系数,记为对亲属关系、同事关系、社区关系重复同样的操作。最后对四种关系的/>进行Softmax操作得到pr。这就是基于相关系数求得的关系权重,具体公式及信息取值范围如下所示:
-X是第一列a的label,Y是第二列b的label
其中,a为第一客户的特征,b为第二客户的特征,r为关系特征(以家庭关系为例,r为家庭关系特征)。对于第一客户的特征和第二客户的特征,举例来说,在处理信贷业务时,客户的信用等级即可作为客户的特征,如第一客户的信用等级为3级,则a为3。label为指定特征数据,例如,数据挖掘和模型的目的是判断客户是否会逾期,那么是否逾期就是客户的label。
步骤103、根据家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重与各个关系信息中第二客户的资产特征信息,获取第一客户的资产特征信息。
在实施例中,根据家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重与各个关系信息中第二客户的资产特征信息,获取第一客户的资产特征信息,包括:
分别获取家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重与各自对应的关系信息中第二客户的资产特征信息的均值数据;
分别将家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重和各自对应的关系信息中第二客户资产特征信息的均值数据相乘,以分别得到家庭关系信息、亲属关系信息、同事关系信息和社区关系信息中的乘积数据;
对家庭关系信息、亲属关系信息、同事关系信息和社区关系信息中的乘积数据进行求和,以获取第一客户的资产特征信息。
具体地,对每个客户,找出所有与其有家庭关系、亲属关系、同事关系和社区关系的客户,称为邻居节点。按照不同社会关系的权重对所有邻居的特征进行加权平均,得到新的特征。这里使用的权重可以是基于余弦相似度,可以是基于指定特征数据相关系数的,还可以有由业务人员凭经验设定。具体使用哪些特征加工新特征,可以由业务根据经验选择,资产、消费、逾期情况、客户年限都可以尝试。具体公式及信息取值范围如下所示:
wr是关系r对应的权重
Nr是和客户j有关系r的所有客户集合
具体地,举例来说,对于资产特征,业务人员经分析后设定家庭关系、亲属关系、同事关系和社区关系的权重分别为0.5,0.2,0.2,0.1,则第一客户的新资产特征f1计算方式如下:
f1=0.5×mean(所有与第一客户有家庭关系的个体的资产特征f)+0.2×mean(所有与第一客户有亲属关系的个体的资产特征f)+0.2×mean(所有与第一客户有同事关系的个体的资产特征f)+0.1×mean(所有与第一客户有社区关系的个体的资产特征f);
该第一客户的资产特征信息后续可被应用到空值填充、数据挖掘或模型训练中。
在此过程中,可以由业务人员或开发人员根据需要,对不同特征、不同指定特征数据反复迭代,直到获得满意的结果。
由图1可知,本发明实施例提供的资产特征信息处理方法,通过根据自银行系统中采集的第一客户的基础数据和行为数据,获取第一客户的家庭关系信息、亲属关系信息、同事关系信息和社区关系信息,并确定第二客户,所述第二客户为在家庭关系信息、亲属关系信息、同事关系信息和社区关系信息中与第一客户相关的客户,有效利用了第一客户的家庭关系、亲属关系、同事关系和社区关系,为后续获取第一客户的资产特征信息奠定了基础,通过根据第一客户和第二客户的基础数据和行为数据,分别获取家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重,再根据家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重与各个关系信息中第二客户的资产特征信息,即可获取第一客户的资产特征信息,以保证能够准确识别出伪造信息、伪装成好客户的欺诈分子,获取到客户资产状况恶化的先兆,同时,即使第一客户为新用户,也便于获取其资产特征和行为特征。
基于同一发明构思,本发明实施例中还提供了一种资产特征信息处理装置,如下面的实施例所述。由于资产特征信息处理装置解决问题的原理与资产特征信息处理方法相似,因此,资产特征信息处理装置的实施可以参见资产特征信息处理方法的实施,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图4为本发明实施例提供的一种资产特征信息处理装置的结构示意图,如图4所示,该装置包括:
信息采集模块401,用于根据自银行系统中采集的第一客户的基础数据和行为数据,获取第一客户的家庭关系信息、亲属关系信息、同事关系信息和社区关系信息,并确定第二客户,所述第二客户为在家庭关系信息、亲属关系信息、同事关系信息和社区关系信息中与第一客户相关的客户。
权重计算模块402,用于根据第一客户和第二客户的基础数据和行为数据,分别获取家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重。
资产特征信息获取模块403,用于根据家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重与各个关系信息中第二客户的资产特征信息,获取第一客户的资产特征信息。
在本发明实施例中,权重计算模块402进一步用于:
根据第一客户和第二客户的基础数据和行为数据,计算第一客户和第二客户的余弦相似度;
利用Softmax函数分别对家庭关系信息、亲属关系信息、同事关系信息和社区关系信息中的第一客户和第二客户的余弦相似度进行计算,以分别获取家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重。
在本发明实施例中,权重计算模块402进一步用于:
根据第一客户和第二客户的基础数据和行为数据,计算第一客户和第二客户的指定特征数据的皮尔逊相关系数;
利用Softmax函数分别对家庭关系信息、亲属关系信息、同事关系信息和社区关系信息中的第一客户和第二客户的指定特征数据的皮尔逊相关系数进行计算,以分别获取家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重。
在本发明实施例中,资产特征信息获取模块403进一步用于:
分别获取家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重与各自对应的关系信息中第二客户的资产特征信息的均值数据;
分别将家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重和各自对应的关系信息中第二客户资产特征信息的均值数据相乘,以分别得到家庭关系信息、亲属关系信息、同事关系信息和社区关系信息中的乘积数据;
对家庭关系信息、亲属关系信息、同事关系信息和社区关系信息中的乘积数据进行求和,以获取第一客户的资产特征信息。
为了实现上述目的,根据本申请的另一方面,还提供了一种计算机设备。如图5所示,该计算机设备包括存储器、处理器、通信接口以及通信总线,在存储器上存储有可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述实施例方法中的步骤。
处理器可以为中央处理器(Central Processing Unit,CPU)。处理器还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及单元,如本发明上述方法实施例中对应的程序单元。处理器通过运行存储在存储器中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及作品数据处理,即实现上述方法实施例中的方法。
存储器可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储处理器所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
所述一个或者多个单元存储在所述存储器中,当被所述处理器执行时,执行上述实施例中的方法。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述方法的计算机程序。
综上所述,本发明通过根据自银行系统中采集的第一客户的基础数据和行为数据,获取第一客户的家庭关系信息、亲属关系信息、同事关系信息和社区关系信息,并确定第二客户,所述第二客户为在家庭关系信息、亲属关系信息、同事关系信息和社区关系信息中与第一客户相关的客户,有效利用了第一客户的家庭关系、亲属关系、同事关系和社区关系,为后续获取第一客户的资产特征信息奠定了基础,通过根据第一客户和第二客户的基础数据和行为数据,分别获取家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重,再根据家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重与各个关系信息中第二客户的资产特征信息,即可获取第一客户的资产特征信息,以保证能够准确识别出伪造信息、伪装成好客户的欺诈分子,获取到客户资产状况恶化的先兆,同时,即使第一客户为新用户,也便于获取其资产特征和行为特征。
此外,通过把客户的社会关系网络信息融入特征加工中,使新特征能反映客户的社会信息,这些特征解释性强,可辅助业务人员进行决策。例如某客户的关系人成为银行客户的年限加权平均越长,则该客户越可能成为忠实客户;反而如果平均年限不大于一年,则存在欺诈的可能性。通过在传统的特征加工中融入了个人的社会关系网络信息。通过统计关系人的信息,那些伪造信息进入银行系统的欺诈分子或投机分子就能与其他正常客户区分开来;同时那些资产状况和信用状况良好但不活跃的中间客层也能被识别出来,协助业务人员进行营销活动;对于那些新进入银行的客户,也可以提供更多的指综合标评估他的经济实力,给出更合理的额度或信用评分。个人的社会关系网络信息对银行业务人员做决策有重要参考意义,但大多数情况下,直接提供客户的所有关系的所有信息是冗余的且浪费的。这时候提供隐含了个人的社会关系网络信息的特征,是更便捷、更合理且可行的方法。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (6)
1.一种资产特征信息处理方法,其特征在于,包括:
根据自银行系统中采集的第一客户的基础数据和行为数据,获取第一客户的家庭关系信息、亲属关系信息、同事关系信息和社区关系信息,并确定第二客户,所述第二客户为在家庭关系信息、亲属关系信息、同事关系信息和社区关系信息中与第一客户相关的客户;
根据第一客户和第二客户的基础数据和行为数据,分别获取家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重;
根据家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重与各个关系信息中第二客户的资产特征信息,获取第一客户的资产特征信息;
根据第一客户和第二客户的基础数据和行为数据,分别获取家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重,包括:
根据第一客户和第二客户的基础数据和行为数据,计算第一客户和第二客户的余弦相似度;
利用Softmax函数分别对家庭关系信息、亲属关系信息、同事关系信息和社区关系信息中的第一客户和第二客户的余弦相似度进行计算,以分别获取家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重;公式如下:
其中,a为第一客户的特征,b为第二客户的特征,r为关系特征,为余弦相似度取中位数;cr为基于余弦相似度求得的关系权重;
根据第一客户和第二客户的基础数据和行为数据,分别获取家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重,包括:
根据第一客户和第二客户的基础数据和行为数据,计算第一客户和第二客户的指定特征数据的皮尔逊相关系数;
利用Softmax函数分别对家庭关系信息、亲属关系信息、同事关系信息和社区关系信息中的第一客户和第二客户的指定特征数据的皮尔逊相关系数进行计算,以分别获取家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重;公式如下:
X是第一列a的label,Y是第二列b的label,
其中,a为第一客户的特征,b为第二客户的特征,r为关系特征;为指定特征数据的皮尔逊相关系数;label为指定特征数据;pr为基于皮尔逊相关系数求得的关系权重。
2.如权利要求1所述的方法,其特征在于,根据家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重与各个关系信息中第二客户的资产特征信息,获取第一客户的资产特征信息,包括:
分别获取家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重与各自对应的关系信息中第二客户的资产特征信息的均值数据;
分别将家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重和各自对应的关系信息中第二客户资产特征信息的均值数据相乘,以分别得到家庭关系信息、亲属关系信息、同事关系信息和社区关系信息中的乘积数据;
对家庭关系信息、亲属关系信息、同事关系信息和社区关系信息中的乘积数据进行求和,以获取第一客户的资产特征信息。
3.一种资产特征信息处理装置,其特征在于,包括:
信息采集模块,用于根据自银行系统中采集的第一客户的基础数据和行为数据,获取第一客户的家庭关系信息、亲属关系信息、同事关系信息和社区关系信息,并确定第二客户,所述第二客户为在家庭关系信息、亲属关系信息、同事关系信息和社区关系信息中与第一客户相关的客户;
权重计算模块,用于根据第一客户和第二客户的基础数据和行为数据,分别获取家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重;
资产特征信息获取模块,用于根据家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重与各个关系信息中第二客户的资产特征信息,获取第一客户的资产特征信息;
权重计算模块进一步用于:根据第一客户和第二客户的基础数据和行为数据,计算第一客户和第二客户的余弦相似度;利用Softmax函数分别对家庭关系信息、亲属关系信息、同事关系信息和社区关系信息中的第一客户和第二客户的余弦相似度进行计算,以分别获取家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重;公式如下:
其中,a为第一客户的特征,b为第二客户的特征,r为关系特征,为余弦相似度取中位数;cr为基于余弦相似度求得的关系权重;
权重计算模块进一步用于:根据第一客户和第二客户的基础数据和行为数据,计算第一客户和第二客户的指定特征数据的皮尔逊相关系数;利用Softmax函数分别对家庭关系信息、亲属关系信息、同事关系信息和社区关系信息中的第一客户和第二客户的指定特征数据的皮尔逊相关系数进行计算,以分别获取家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重;公式如下:
X是第一列a的label,Y是第二列b的label,
其中,a为第一客户的特征,b为第二客户的特征,r为关系特征;为指定特征数据的皮尔逊相关系数;label为指定特征数据;pr为基于皮尔逊相关系数求得的关系权重。
4.如权利要求3所述的装置,其特征在于,资产特征信息获取模块进一步用于:
分别获取家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重与各自对应的关系信息中第二客户的资产特征信息的均值数据;
分别将家庭关系信息、亲属关系信息、同事关系信息和社区关系信息的关系权重和各自对应的关系信息中第二客户资产特征信息的均值数据相乘,以分别得到家庭关系信息、亲属关系信息、同事关系信息和社区关系信息中的乘积数据;
对家庭关系信息、亲属关系信息、同事关系信息和社区关系信息中的乘积数据进行求和,以获取第一客户的资产特征信息。
5.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至2任一所述方法。
6.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有执行权利要求1至2任一所述方法的计算机程序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011038418.3A CN112116356B (zh) | 2020-09-28 | 2020-09-28 | 资产特征信息处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011038418.3A CN112116356B (zh) | 2020-09-28 | 2020-09-28 | 资产特征信息处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112116356A CN112116356A (zh) | 2020-12-22 |
CN112116356B true CN112116356B (zh) | 2023-11-21 |
Family
ID=73797900
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011038418.3A Active CN112116356B (zh) | 2020-09-28 | 2020-09-28 | 资产特征信息处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112116356B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108416677A (zh) * | 2017-03-13 | 2018-08-17 | 平安科技(深圳)有限公司 | 理赔调查的方法及装置 |
CN110009474A (zh) * | 2019-01-31 | 2019-07-12 | 阿里巴巴集团控股有限公司 | 一种信用风险评估方法、装置和电子设备 |
CN111127185A (zh) * | 2019-11-25 | 2020-05-08 | 北京明略软件系统有限公司 | 信贷欺诈识别模型构建方法及装置 |
-
2020
- 2020-09-28 CN CN202011038418.3A patent/CN112116356B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108416677A (zh) * | 2017-03-13 | 2018-08-17 | 平安科技(深圳)有限公司 | 理赔调查的方法及装置 |
CN110009474A (zh) * | 2019-01-31 | 2019-07-12 | 阿里巴巴集团控股有限公司 | 一种信用风险评估方法、装置和电子设备 |
CN111127185A (zh) * | 2019-11-25 | 2020-05-08 | 北京明略软件系统有限公司 | 信贷欺诈识别模型构建方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN112116356A (zh) | 2020-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110009174B (zh) | 风险识别模型训练方法、装置及服务器 | |
CN104321794B (zh) | 一种使用多维评级来确定一实体的未来商业可行性的系统和方法 | |
CN109472626B (zh) | 一种面向手机租赁业务的智能金融风险控制方法及系统 | |
CN111932268B (zh) | 企业风险识别方法及装置 | |
CN113989019A (zh) | 识别风险的方法、装置、设备及存储介质 | |
CN110796539A (zh) | 一种征信评估方法及装置 | |
CN109118316A (zh) | 线上店铺真实性的识别方法和装置 | |
CN111428217A (zh) | 欺诈团伙识别方法、装置、电子设备及计算机可读存储介质 | |
CN109767225A (zh) | 一种基于自学习滑动时间窗口的网络支付欺诈检测方法 | |
CN112232950A (zh) | 针对借贷风险的评估方法及装置、设备、计算机可读存储介质 | |
CN115545886A (zh) | 逾期风险识别方法、装置、设备及存储介质 | |
Chukwu et al. | Effects of digital banking on the performance of commercial banks in Nigeria 2010-2019 | |
Chen et al. | Mixed credit scoring model of logistic regression and evidence weight in the background of big data | |
CN112581291B (zh) | 风险测评异动检测方法、装置、设备及存储介质 | |
CN113408627A (zh) | 目标对象的确定方法、装置和服务器 | |
CN110619564B (zh) | 一种反欺诈特征生成方法和装置 | |
CN112116356B (zh) | 资产特征信息处理方法及装置 | |
CN110297948A (zh) | 关系网络构建方法以及装置 | |
CN114331463A (zh) | 基于线性回归模型的风险识别方法及其相关设备 | |
CN113807943A (zh) | 一种不良资产的多因子估值方法及系统、介质、设备 | |
CN115345727A (zh) | 一种识别欺诈贷款申请的方法及装置 | |
CN113379465A (zh) | 基于区块链的网点选址方法、装置、设备和存储介质 | |
CN110570301B (zh) | 风险识别方法、装置、设备及介质 | |
Garin et al. | Machine learning in classifying bitcoin addresses | |
CN107423982A (zh) | 基于账户的业务实现方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |