CN113763167A - 一种基于复杂网络的黑名单挖掘方法 - Google Patents
一种基于复杂网络的黑名单挖掘方法 Download PDFInfo
- Publication number
- CN113763167A CN113763167A CN202110918735.2A CN202110918735A CN113763167A CN 113763167 A CN113763167 A CN 113763167A CN 202110918735 A CN202110918735 A CN 202110918735A CN 113763167 A CN113763167 A CN 113763167A
- Authority
- CN
- China
- Prior art keywords
- nodes
- original network
- node
- iteration
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 19
- 238000005065 mining Methods 0.000 title claims abstract description 9
- 239000011159 matrix material Substances 0.000 claims abstract description 19
- 230000007704 transition Effects 0.000 claims abstract description 9
- 238000004422 calculation algorithm Methods 0.000 abstract description 9
- 238000012954 risk control Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004900 laundering Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000005295 random walk Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Marketing (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Technology Law (AREA)
- Educational Administration (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于复杂网络的黑名单挖掘方法。本发明步骤如下:1、根据借贷和消费场景下的有效信息维度构建原始网络;2、根据原始网络的邻接矩阵,求得原始网络的转移概率矩阵;3、初始向量R,如果原始网络G中节点i对应的是种子节点,则向量R的第i行的值是1/|S|,否则0;4、根据迭代公式Rn=DRn‑1,求得第n次迭代的排序值;5、迭代最终收敛或者达到预先指定的迭代次数后,根据排序值,输出头部M个非种子节点,输出的非种子节点是最有可能的潜在黑名单节点。本发明通过数据关联关系网络,将已知的风险通过PageRank算法传播到整个网络节点,量化每个节点的风险程度。具有记录内容详细,运算简便等优点。
Description
技术领域
本发明涉及复杂网络黑名单挖掘技术领域,具体涉及一种基于复杂网络的黑名单挖掘方法,应用于借贷和消费贷场景下的复杂网络。
背景技术
随着社会经济的快速发展和时代的进步,人们的生活水平也在不断的提高,对借贷和消费贷等超前消费观念有了更多的需求。在资金方,风险控制直接影响盈利能力,是最为重要的技术之一,因此随之而来的风险控制的需求也越来越多。黑名单是最为常用的风控技术,因此,黑名单发掘成为广大资金方追捧的技术之一。
现有的黑名单主要来源于政府机构的失信人,或者机构内部积累的失信人信息,然而,在很多案例中,“白名单”用户仍然存在很大的概率成为失信人,并且,内部积累失信人的过程本身对机构造成了严重的经济损失。因此,仅仅依赖于已知失信人信息无法涵盖所有的黑名单用户。传统的机器学习模型广泛应用于违约预测任务,这个过程采用了用户年龄、性别、学历、工作状况等维度的信息,通过机器学习模型对未知个体逾期可能性进行预测,但是这类方法仅仅考虑单一个体的信息,而忽略了个体之间的关联关系。因此,效果往往不够理想。
PageRank算法是由拉里·佩奇(Larry Page)和谢尔盖·布林 (Sergey Brin)提出的网页排序算法。算法核心在于给网页一个全局分值,利用分值排序网页的重要性,为搜索用户甄选出优质相关的网页,以提高使用搜索引擎寻找网页的体验舒适度。PageRank算法基于随机游走模型,它以其优良的数学理论基础和计算速度,成为计算机网络研究人员一直追捧至今的优秀算法之一。
PageRank算法及其扩展算法被广泛的应用于各种网络模型中,例如社交网络、疾病传播网络、论文引用网络、信任网络、影响力分析、推荐系统、偏好与声望排名、信息传播检测等。
发明内容
本发明的目的是针对现有技术的不足,提供一种基于复杂网络的黑名单挖掘方法。本发明应用于借贷和消费贷场景下的复杂网络。基于已知黑名单用户(种子),在网络中进行风险传播,从而对潜在的黑名单用户进行挖掘。
为解决上述技术问题,本发明采用以下技术方案予以实现:
一种基于复杂网络的黑名单挖掘方法,包括如下步骤:
步骤S1:根据借贷和消费场景下的有效信息维度构建原始网络 G;
步骤S2:根据原始网络G的邻接矩阵D,求得原始网络G的转移概率矩阵P;
步骤S3:初始向量R,如果原始网络G中节点i对应的是种子节点,则向量R的第i行的值是1/|S|,否则0;其中,S是种子节点集合;
步骤S4:根据迭代公式Rn=DRn-1,求得第n次迭代的排序值;其中Rn是第n次迭代的排序值,Rn-1是第n-1次迭代的排序值,D是邻接矩阵;
步骤S5:迭代最终收敛或者达到预先指定的迭代次数后,根据排序值,输出头部M个非种子节点,输出的非种子节点是最有可能的潜在黑名单节点。
进一步的,步骤S1所述的有效信息维度包括借贷人的唯一ID、设备ID、手机号码和银行卡,将有效信息维度作为节点;在节点之间建立无向边,并根据同一条边出现的次数计算边的权重;如果节点i和j之间存在边,则Dij=w,否则Dij=0;Dij是原始网络G的邻接矩阵D中的元素。
进一步的,步骤S2所述的转移概率矩阵P,计算公式如下:
其中,Pij表示转移概率矩阵P的元素。
与现有技术相比,本申请提供的技术方案,具有的技术效果或优点是:本发明通过数据关联关系网络,将已知的风险通过 PageRank算法传播到整个网络节点,量化每个节点的风险程度。具有记录内容详细,运算简便等优点,在风险控制、反洗钱等方面有着广泛的应用前景。
具体实施方式
下面结合实施例对本发明作进一步说明。
一种基于复杂网络的黑名单挖掘方法,包括步骤如下:
步骤S1:根据借贷和消费场景下的有效信息维度构建原始网络 G,其中有效信息维度包括借贷人的唯一ID、设备ID、手机号码和银行卡等,并将有效信息维度作为节点;在节点之间建立无向边,并根据同一条边出现的次数计算边的权重w;如果节点i和j之间存在边,则Dij=w,否则Dij=0;Dij是原始网络G的邻接矩阵D中的元素。
步骤S2:根据邻接矩阵D,求得原始网络G的转移概率矩阵P,计算公式如下:
其中,Pij表示转移概率矩阵P的元素;
步骤S3:初始向量R,如果i对应的是种子节点,所述向量R的第i行的值是1/|S|,否则0。这里,S是种子节点集合;
步骤S4:根据迭代公式Rn=DRn-1,求得第n次迭代的排序值;其中Rn是第n次迭代的排序值,Rn-1是第n-1次迭代的排序值,D是邻接矩阵。
步骤S5:迭代最终收敛或者达到预先指定的迭代次数后,根据排序值,输出头部M个非种子节点,这些节点是最有可能的潜在黑名单节点。
Claims (3)
1.一种基于复杂网络的黑名单挖掘方法,其特征在于包括如下步骤:
步骤S1:根据借贷和消费场景下的有效信息维度构建原始网络G;
步骤S2:根据原始网络G的邻接矩阵D,求得原始网络G的转移概率矩阵P;
步骤S3:初始向量R,如果原始网络G中节点i对应的是种子节点,则向量R的第i行的值是1/|S|,否则0;其中,S是种子节点集合;
步骤S4:根据迭代公式Rn=DRn-1,求得第n次迭代的排序值;其中Rn是第n次迭代的排序值,Rn-1是第n-1次迭代的排序值,D是邻接矩阵;
步骤S5:迭代最终收敛或者达到预先指定的迭代次数后,根据排序值,输出头部M个非种子节点,输出的非种子节点是最有可能的潜在黑名单节点。
2.根据权利要求1所述的一种基于复杂网络的黑名单挖掘方法,其特征在于步骤S1所述的有效信息维度包括借贷人的唯一ID、设备ID、手机号码和银行卡,将有效信息维度作为节点;在节点之间建立无向边,并根据同一条边出现的次数计算边的权重;如果节点i和j之间存在边,则Dij=w,否则Dij=0;Dij是原始网络G的邻接矩阵D中的元素。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110918735.2A CN113763167B (zh) | 2021-08-11 | 2021-08-11 | 一种基于复杂网络的黑名单挖掘方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110918735.2A CN113763167B (zh) | 2021-08-11 | 2021-08-11 | 一种基于复杂网络的黑名单挖掘方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113763167A true CN113763167A (zh) | 2021-12-07 |
CN113763167B CN113763167B (zh) | 2023-11-17 |
Family
ID=78788959
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110918735.2A Active CN113763167B (zh) | 2021-08-11 | 2021-08-11 | 一种基于复杂网络的黑名单挖掘方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113763167B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101499098A (zh) * | 2009-03-04 | 2009-08-05 | 阿里巴巴集团控股有限公司 | 一种网页评估值的确定及运用的方法、系统 |
US20090234711A1 (en) * | 2005-09-14 | 2009-09-17 | Jorey Ramer | Aggregation of behavioral profile data using a monetization platform |
US20140317736A1 (en) * | 2013-04-23 | 2014-10-23 | Telefonica Digital Espana, S.L.U. | Method and system for detecting fake accounts in online social networks |
CN104504251A (zh) * | 2014-12-10 | 2015-04-08 | 沈阳航空航天大学 | 一种基于PageRank算法的社区划分方法 |
CN108053256A (zh) * | 2017-12-27 | 2018-05-18 | 上海银橙文化传媒股份有限公司 | 一种基于PageRank的反作弊方法 |
CN109299811A (zh) * | 2018-08-20 | 2019-02-01 | 众安在线财产保险股份有限公司 | 一种基于复杂网络的欺诈团伙识别和风险传播预测的方法 |
CN109325814A (zh) * | 2017-07-31 | 2019-02-12 | 上海诺悦智能科技有限公司 | 一种用于发现可疑交易网络的方法 |
CN110136016A (zh) * | 2019-04-04 | 2019-08-16 | 中国科学院信息工程研究所 | 一种基于隐式关联的多标签传播方法及系统 |
CN113094558A (zh) * | 2021-04-08 | 2021-07-09 | 电子科技大学 | 一种基于局部结构的网络节点影响力排序方法 |
-
2021
- 2021-08-11 CN CN202110918735.2A patent/CN113763167B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090234711A1 (en) * | 2005-09-14 | 2009-09-17 | Jorey Ramer | Aggregation of behavioral profile data using a monetization platform |
CN101499098A (zh) * | 2009-03-04 | 2009-08-05 | 阿里巴巴集团控股有限公司 | 一种网页评估值的确定及运用的方法、系统 |
US20140317736A1 (en) * | 2013-04-23 | 2014-10-23 | Telefonica Digital Espana, S.L.U. | Method and system for detecting fake accounts in online social networks |
CN104504251A (zh) * | 2014-12-10 | 2015-04-08 | 沈阳航空航天大学 | 一种基于PageRank算法的社区划分方法 |
CN109325814A (zh) * | 2017-07-31 | 2019-02-12 | 上海诺悦智能科技有限公司 | 一种用于发现可疑交易网络的方法 |
CN108053256A (zh) * | 2017-12-27 | 2018-05-18 | 上海银橙文化传媒股份有限公司 | 一种基于PageRank的反作弊方法 |
CN109299811A (zh) * | 2018-08-20 | 2019-02-01 | 众安在线财产保险股份有限公司 | 一种基于复杂网络的欺诈团伙识别和风险传播预测的方法 |
CN110136016A (zh) * | 2019-04-04 | 2019-08-16 | 中国科学院信息工程研究所 | 一种基于隐式关联的多标签传播方法及系统 |
CN113094558A (zh) * | 2021-04-08 | 2021-07-09 | 电子科技大学 | 一种基于局部结构的网络节点影响力排序方法 |
Non-Patent Citations (2)
Title |
---|
ABDULHAMIT SUBASIEMIR KREMIC: "Comparison of Adaboost with MultiBoosting for Phishing Website Detection", 《PROCEDIA COMPUTER SCIENCE》 * |
王洪伟等: "基于链接分析的网络搜索排名的反作弊研究", 《系统管理学报》 * |
Also Published As
Publication number | Publication date |
---|---|
CN113763167B (zh) | 2023-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108647736B (zh) | 一种基于感知损失和匹配注意力机制的图像分类方法 | |
CN111737551B (zh) | 一种基于异构图注意力神经网络的暗网线索检测方法 | |
CN111339818B (zh) | 一种人脸多属性识别系统 | |
CN113297936B (zh) | 一种基于局部图卷积网络的排球群体行为识别方法 | |
CN107507073A (zh) | 基于信任扩展和列表级排序学习的服务推荐方法 | |
CN113268669B (zh) | 基于联合神经网络的面向关系挖掘的兴趣点推荐方法 | |
CN111400615B (zh) | 一种资源推荐方法、装置、设备及存储介质 | |
CN114741599B (zh) | 基于知识增强和注意力机制的新闻推荐方法及系统 | |
CN107368499B (zh) | 一种客户标签建模及推荐方法及装置 | |
CN110932962A (zh) | 一种基于矩阵分解的网络结构去匿名化系统及方法 | |
CN111859454A (zh) | 防御基于图神经网络链路预测的隐私保护方法 | |
CN110569355A (zh) | 一种基于词块的观点目标抽取和目标情感分类联合方法及系统 | |
CN114973350B (zh) | 一种源域数据无关的跨域人脸表情识别方法 | |
CN108415926B (zh) | 一种消除原始评分数据评分噪声的协同过滤推荐方法 | |
CN118013135A (zh) | 基于关系图卷积神经网络的图对比学习推荐方法 | |
CN116543237B (zh) | 无源域无监督域适应的图像分类方法、系统、设备及介质 | |
CN112559877A (zh) | 基于跨平台异构数据及行为上下文的ctr预估方法及系统 | |
CN115905617B (zh) | 一种基于深度神经网络与双正则化的视频评分预测方法 | |
CN113763167B (zh) | 一种基于复杂网络的黑名单挖掘方法 | |
CN105447013A (zh) | 一种新闻推荐系统 | |
CN116957678A (zh) | 一种数据处理方法和相关装置 | |
CN116756391A (zh) | 一种基于图数据增强的不平衡图节点神经网络分类方法 | |
CN114722896B (zh) | 融合近邻标题图的新闻话题发现方法 | |
CN115861930A (zh) | 一种基于层级差异特征聚合的人群计数网络建模方法 | |
CN113256024A (zh) | 一种融合群体行为的用户行为预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |