CN115689711A - 一种业务场景下人与人之间关系强度的计算方法 - Google Patents
一种业务场景下人与人之间关系强度的计算方法 Download PDFInfo
- Publication number
- CN115689711A CN115689711A CN202211379628.8A CN202211379628A CN115689711A CN 115689711 A CN115689711 A CN 115689711A CN 202211379628 A CN202211379628 A CN 202211379628A CN 115689711 A CN115689711 A CN 115689711A
- Authority
- CN
- China
- Prior art keywords
- relationship
- intimacy
- model
- strength
- sub
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及数字金融及大数据技术领域,具体涉及一种业务场景下人与人之间关系强度的计算方法,包括:S1、按照形式将人人关系分为直接关系和间接关系,按照属性把直接关系分为静态属性关系和动态行为关系;S2、根据属性类型和业务场景构建多类别子关系;S3、对不同类别的子关系设定相应的权重,对不同类别的子关系设定相应的要求;S4、将满足设定要求的子关系判定为强关系,将不满足设定要求的子关系判定为弱关系;S5、对强关系直接定义为强亲密度,所述强亲密度的关系强度为1,对弱关系通过预测模型得到关系强度。本发明区分强关系和弱关系,对强关系直接判定为强亲密度,对弱关系通过模型进行预测,解决了关系强度准确性低的技术问题。
Description
技术领域
本发明涉及数字金融及大数据技术领域,具体涉及一种业务场景下人与人之间关系强度的计算方法。
背景技术
在信贷领域中,如果两个人之间存在较为亲密的关系,那么一个人的行为表现是很可能影响到另外一个人的。比如说,对于两个关系亲密的人来说,他们的生活习惯、消费习惯、储蓄习惯以及信贷习惯都可能会相互影响,也即是“近朱者赤近墨者黑”,如果其中一个人已经逾期,另外一个与之关系亲密的人来借款,其未来逾期的可能性也会更高。在具体的业务场景中,两个关系亲密的人之间可能产生各种关系,这些关系有的是事实关系,比如说共用设备、相同户籍地址等,有的则需要通过事实关系进行推理才能挖掘出其背后隐藏的真实关系。目前,在图谱领域基本都是基于人-物-人的异质关系网络分析,中间包含了大量的物品节点,这种网络是基于事实构建的,而没有归结到人与人层面,导致所得到的人与人之间关系强度准确性低,难以为信贷业务提供有效的参考依据。
发明内容
本发明提供一种业务场景下人与人之间关系强度的计算方法,解决了现有技术所得到的人与人之间关系强度准确性低的技术问题。
本发明提供的基础方案为:一种业务场景下人与人之间关系强度的计算方法,包括:
S1、按照形式将人人关系分为直接关系和间接关系,按照属性把直接关系分为静态属性关系和动态行为关系;
S2、根据属性类型和业务场景构建多类别子关系;
S3、对不同类别的子关系设定相应的权重,对不同类别的子关系设定相应的要求;
S4、将满足设定要求的子关系判定为强关系,将不满足设定要求的子关系判定为弱关系;
S5、对强关系直接定义为强亲密度,所述强亲密度的关系强度为1,对弱关系通过预测模型得到关系强度。
本发明的工作原理及优点在于:在本方案中,首先,将人人关系按照形式分为直接关系和间接关系,这样可以把直接关系按照关系属性分为静态属性关系和动态行为关系,从而便于根据属性类型和业务场景构建多类子关系;其次,不同类别的子关系拥有不同的权重,对不同类别的子关系设定不同的要求,满足设定要求的判定为强关系,不满足的判定为弱关系;然后,对于强关系直接判定为强亲密度,对于弱关系,由于多个弱关系组合可能形成较强关系,通过预测模型得到关系强度。通过这样的方式,区分强关系和弱关系,充分利用了关系数据,得到的关系强度也使人人之间的关系得到准确量化,提高了人与人之间关系强度的精确性,与此同时,由于子关系多可以基于业务场景产生,使得业务解释性强,各类子关系的构建可以随着不同业务场景进行灵活变动,使得可塑性和拓展性强。
本发明区分强关系和弱关系,对强关系直接判定为强亲密度,对弱关系通过模型进行预测,充分利用关系数据,解决了现有技术所得到的人与人之间关系强度准确性低的技术问题。
进一步,S5中,对弱关系通过预测模型得到关系强度,包括建立户籍亲密度关系模型,具体步骤如下:
定义模型类型及标签:模型为二分类模型,同户籍地用户对为目标1,非同户籍地用户对为目标0;模型算法选择:采用lightgbm算法;模型入模特征:用户关系对的子关系分数,以及计算各子关系的特征变量;划分训练集和测试集,在训练集上进行交叉验证,获取最好一组参数重新训练模型,并在测试集上进行测试,调整模型使泛化误差最小;输出各用户对为同户籍地的概率。
有益效果在于:采用lightgbm算法精确性高,在大数据量下计算速度快。
进一步,S5中,对弱关系通过预测模型得到关系强度,包括建立共用资料亲密关系模型,具体步骤如下:
定义模型类型及标签:模型为二分类模型,有共用隐私资料为目标1,未共用隐私资料为目标0;模型算法选择:采用lightgbm算法;模型入模特征:用户关系对的子关系分数,以及计算各子关系的特征变量;划分训练集和测试集,在训练集上进行交叉验证,获取最好一组参数重新训练模型,并在测试集上进行测试,调整模型使泛化误差最小;输出各用户对为共用隐私资料的概率。
有益效果在于:采用lightgbm算法精确性高,在大数据量下计算速度快。
进一步,S5中,对弱关系通过预测模型得到关系强度,包括:通过户籍亲密度关系模型输出关系对的同户籍地概率P1,通过共用资料亲密度关系模型输出关系对的共用隐私资料概率P2;取P1和P2的最大值,作为关系对之间最终的亲密关系概率P;将亲密关系概率P进行分数转换,得到关系强度。
有益效果在于:这样综合考量了户籍亲密度与共用资料亲密度,有利于提高关系强度计算的精确性。
进一步,S5中,将亲密关系概率P进行分数转换,得到关系强度,包括:设定初始odds为50,score=600;设定pdo=20,亲密关系概率每增加一倍时,关系强度的分数增加20分;设定亲密关系概率和关系强度的分数之间为正向关系,亲密关系概率越高关系强度的分数越高;通过公式Score=A+B*log(p/1-p)计算关系强度的分数,其中,B=pdo/log(2),A=600-B*log(50)。
有益效果在于:亲密关系概率越大,关系强度的分数越大,便于查看与分析。
进一步,S4中,将满足设定要求的子关系判定为强关系,具体如下:命中以下任意一条即为强关系,人人之间同户籍地、人人之间共用隐私资料,人人之间共用设备强度大于等于0.3,人人之间社交关系大于0.3。
有益效果在于:可以快速准确地判定强关系,有利于提高判定效率。
进一步,S2中,所述子关系包括:户籍地址亲密度、金融申请亲密度、共用资料亲密度、共用设备亲密度、社交关系亲密度、共用三方支付账号亲密度、交易关系亲密度、共用车牌亲密度与共用wifi亲密度。
附图说明
图1为本发明一种业务场景下人与人之间关系强度的计算方法实施例的流程图。
具体实施方式
下面通过具体实施方式进一步详细的说明:
实施例1
实施例基本如附图1所示,包括:
S1、按照形式将人人关系分为直接关系和间接关系,按照属性把直接关系分为静态属性关系和动态行为关系;
S2、根据属性类型和业务场景构建多类别子关系;例如说,子关系包括:户籍地址亲密度、金融申请亲密度、共用资料亲密度、共用设备亲密度、社交关系亲密度、共用三方支付账号亲密度、交易关系亲密度、共用车牌亲密度与共用wifi亲密度;
S3、对不同类别的子关系设定相应的权重,对不同类别的子关系设定相应的要求;
S4、将满足设定要求的子关系判定为强关系,将不满足设定要求的子关系判定为弱关系;
S5、对强关系直接定义为强亲密度,所述强亲密度的关系强度为1,对弱关系通过预测模型得到关系强度。
作为方案的优选:S5中,对弱关系通过预测模型得到关系强度,具体步骤如下:
(1)建立户籍亲密度关系模型
定义模型类型及标签:模型为二分类模型,同户籍地用户对为目标1,非同户籍地用户对为目标0;模型算法选择:采用lightgbm算法;模型入模特征:用户关系对的子关系分数,以及计算各子关系的特征变量;划分训练集和测试集,在训练集上进行交叉验证,获取最好一组参数重新训练模型,并在测试集上进行测试,调整模型使泛化误差最小;输出各用户对为同户籍地的概率。
(2)建立共用资料亲密关系模型
定义模型类型及标签:模型为二分类模型,有共用隐私资料为目标1,未共用隐私资料为目标0;模型算法选择:采用lightgbm算法;模型入模特征:用户关系对的子关系分数,以及计算各子关系的特征变量;划分训练集和测试集,在训练集上进行交叉验证,获取最好一组参数重新训练模型,并在测试集上进行测试,调整模型使泛化误差最小;输出各用户对为共用隐私资料的概率。
(3)计算关系强度
在本实施例中,通过户籍亲密度关系模型输出关系对的同户籍地概率P1,通过共用资料亲密度关系模型输出关系对的共用隐私资料概率P2;取P1和P2的最大值,作为关系对之间最终的亲密关系概率P;将亲密关系概率P进行分数转换,得到关系强度。例如说:设定初始odds为50,score=600;设定pdo=20,使得亲密关系概率每增加一倍时,关系强度的分数增加20分;设定亲密关系概率和关系强度的分数之间为正向(正比例)关系,使得亲密关系概率越高关系强度的分数越高;通过公式Score=A+B*log(p/1-p)计算关系强度的分数,其中,B=pdo/log(2),A=600-B*log(50)。
在本实施例中,首先,将人人关系按照形式分为直接关系和间接关系,这样可以把直接关系按照关系属性分为静态属性关系和动态行为关系,从而便于根据属性类型和业务场景构建多类子关系;其次,不同类别的子关系拥有不同的权重,对不同类别的子关系设定不同的要求,满足设定要求的判定为强关系,不满足的判定为弱关系;然后,对于强关系直接判定为强亲密度,对于弱关系,由于多个弱关系组合可能形成较强关系,通过预测模型得到关系强度。通过这样的方式,区分强关系和弱关系,充分利用了关系数据,得到的关系强度也使人人之间的关系得到准确量化,提高了人与人之间关系强度的精确性,与此同时,由于子关系多可以基于业务场景产生,使得业务解释性强,各类子关系的构建可以随着不同业务场景进行灵活变动,使得可塑性和拓展性强。
实施例2
与实施例1不同之处仅在于,S4中,将满足设定要求的子关系判定为强关系,具体如下:命中以下任意一条即为强关系,人人之间同户籍地、人人之间共用隐私资料,人人之间共用设备强度大于等于0.3,人人之间社交关系大于0.3,这样可以快速准确地判定强关系,有利于提高判定效率。
以上所述的仅是本发明的实施例,方案中公知的具体结构及特性等常识在此未作过多描述,所属领域普通技术人员知晓申请日或者优先权日之前发明所属技术领域所有的普通技术知识,能够获知该领域中所有的现有技术,并且具有应用该日期之前常规实验手段的能力,所属领域普通技术人员可以在本申请给出的启示下,结合自身能力完善并实施本方案,一些典型的公知结构或者公知方法不应当成为所属领域普通技术人员实施本申请的障碍。应当指出,对于本领域的技术人员来说,在不脱离本发明结构的前提下,还可以作出若干变形和改进,这些也应该视为本发明的保护范围,这些都不会影响本发明实施的效果和专利的实用性。本申请要求的保护范围应当以其权利要求的内容为准,说明书中的具体实施方式等记载可以用于解释权利要求的内容。
Claims (7)
1.一种业务场景下人与人之间关系强度的计算方法,其特征在于,包括:
S1、按照形式将人人关系分为直接关系和间接关系,按照属性把直接关系分为静态属性关系和动态行为关系;
S2、根据属性类型和业务场景构建多类别子关系;
S3、对不同类别的子关系设定相应的权重,对不同类别的子关系设定相应的要求;
S4、将满足设定要求的子关系判定为强关系,将不满足设定要求的子关系判定为弱关系;
S5、对强关系直接定义为强亲密度,所述强亲密度的关系强度为1,对弱关系通过预测模型得到关系强度。
2.如权利要求1所述的一种业务场景下人与人之间关系强度的计算方法,其特征在于,S5中,对弱关系通过预测模型得到关系强度,包括建立户籍亲密度关系模型,具体步骤如下:
定义模型类型及标签:模型为二分类模型,同户籍地用户对为目标1,非同户籍地用户对为目标0;模型算法选择:采用lightgbm算法;模型入模特征:用户关系对的子关系分数,以及计算各子关系的特征变量;划分训练集和测试集,在训练集上进行交叉验证,获取最好一组参数重新训练模型,并在测试集上进行测试,调整模型使泛化误差最小;输出各用户对为同户籍地的概率。
3.如权利要求2所述的一种业务场景下人与人之间关系强度的计算方法,其特征在于,S5中,对弱关系通过预测模型得到关系强度,包括建立共用资料亲密关系模型,具体步骤如下:
定义模型类型及标签:模型为二分类模型,有共用隐私资料为目标1,未共用隐私资料为目标0;模型算法选择:采用lightgbm算法;模型入模特征:用户关系对的子关系分数,以及计算各子关系的特征变量;划分训练集和测试集,在训练集上进行交叉验证,获取最好一组参数重新训练模型,并在测试集上进行测试,调整模型使泛化误差最小;输出各用户对为共用隐私资料的概率。
4.如权利要求3所述的一种业务场景下人与人之间关系强度的计算方法,其特征在于,S5中,对弱关系通过预测模型得到关系强度,包括:通过户籍亲密度关系模型输出关系对的同户籍地概率P1,通过共用资料亲密度关系模型输出关系对的共用隐私资料概率P2;取P1和P2的最大值,作为关系对之间最终的亲密关系概率P;将亲密关系概率P进行分数转换,得到关系强度。
5.如权利要求4所述的一种业务场景下人与人之间关系强度的计算方法,其特征在于,S5中,将亲密关系概率P进行分数转换,得到关系强度,包括:设定初始odds为50,score=600;设定pdo=20,亲密关系概率每增加一倍时,关系强度的分数增加20分;设定亲密关系概率和关系强度的分数之间为正向关系,亲密关系概率越高关系强度的分数越高;通过公式Score=A+B*log(p/1-p)计算关系强度的分数,其中,B=pdo/log(2),A=600-B*log(50)。
6.如权利要求1-5任一项所述的一种业务场景下人与人之间关系强度的计算方法,其特征在于,S4中,将满足设定要求的子关系判定为强关系,具体如下:命中以下任意一条即为强关系,人人之间同户籍地、人人之间共用隐私资料,人人之间共用设备强度大于等于0.3,人人之间社交关系大于0.3。
7.如权利要求6所述的一种业务场景下人与人之间关系强度的计算方法,其特征在于,S2中,所述子关系包括:户籍地址亲密度、金融申请亲密度、共用资料亲密度、共用设备亲密度、社交关系亲密度、共用三方支付账号亲密度、交易关系亲密度、共用车牌亲密度与共用wifi亲密度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211379628.8A CN115689711A (zh) | 2022-11-04 | 2022-11-04 | 一种业务场景下人与人之间关系强度的计算方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211379628.8A CN115689711A (zh) | 2022-11-04 | 2022-11-04 | 一种业务场景下人与人之间关系强度的计算方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115689711A true CN115689711A (zh) | 2023-02-03 |
Family
ID=85049976
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211379628.8A Pending CN115689711A (zh) | 2022-11-04 | 2022-11-04 | 一种业务场景下人与人之间关系强度的计算方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115689711A (zh) |
-
2022
- 2022-11-04 CN CN202211379628.8A patent/CN115689711A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Datta et al. | Algorithmic transparency via quantitative input influence: Theory and experiments with learning systems | |
Paredes et al. | Machine learning or discrete choice models for car ownership demand estimation and prediction? | |
Zhou et al. | A generalized belief entropy with nonspecificity and structural conflict | |
CN108280644B (zh) | 群组成员关系数据可视化方法及系统 | |
CN112560105B (zh) | 保护多方数据隐私的联合建模方法及装置 | |
CN103577876A (zh) | 基于前馈神经网络的可信与不可信用户识别方法 | |
CN111639690A (zh) | 基于关系图谱学习的欺诈分析方法、系统、介质及设备 | |
CN111951104A (zh) | 一种基于关联图谱的风险传导预警方法 | |
US20190220924A1 (en) | Method and device for determining key variable in model | |
CN111415167B (zh) | 网络欺诈交易检测方法及装置、计算机存储介质和终端 | |
CN115545103A (zh) | 异常数据识别、标签识别方法和异常数据识别装置 | |
Liu et al. | Assessing Membership Leakages via Task-Aligned Divergent Shadow Datasets in Vehicular Road Cooperation | |
CN115689711A (zh) | 一种业务场景下人与人之间关系强度的计算方法 | |
CN108629506A (zh) | 风控模型的建模方法、装置、计算机设备和存储介质 | |
CN115293783A (zh) | 风险用户识别方法、装置、计算机设备和存储介质 | |
CN105787497A (zh) | 盗账户案件分析方法和装置 | |
CN115310606A (zh) | 基于数据集敏感属性重构的深度学习模型去偏方法及装置 | |
CN114092216A (zh) | 企业信贷评级方法、装置、计算机设备和存储介质 | |
CN114187104A (zh) | 交易风险检测方法、装置、计算机设备和存储介质 | |
Ghosh et al. | A Generalized Estimating Equation Approach to Network Regression | |
Kumar et al. | An Adaptive Deep Learning Model to Forecast Crimes | |
Zhang et al. | Community detection based on structural balance in signed networks | |
CN117131509A (zh) | 调用方间数据串通风险预测方法、装置、设备及存储介质 | |
Ng et al. | Tiny-BotBuster: Identifying Automated Political Coordination in Digital Campaigns | |
CN111681041A (zh) | 一种电子劵发放方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |