CN104915879A - 基于金融数据的社会关系挖掘的方法及装置 - Google Patents

基于金融数据的社会关系挖掘的方法及装置 Download PDF

Info

Publication number
CN104915879A
CN104915879A CN201410085416.8A CN201410085416A CN104915879A CN 104915879 A CN104915879 A CN 104915879A CN 201410085416 A CN201410085416 A CN 201410085416A CN 104915879 A CN104915879 A CN 104915879A
Authority
CN
China
Prior art keywords
client user
network
financial transaction
data
attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410085416.8A
Other languages
English (en)
Other versions
CN104915879B (zh
Inventor
罗军
王靓伟
胡楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201410085416.8A priority Critical patent/CN104915879B/zh
Priority to PCT/CN2014/089034 priority patent/WO2015135321A1/zh
Publication of CN104915879A publication Critical patent/CN104915879A/zh
Priority to US15/251,000 priority patent/US20160371792A1/en
Application granted granted Critical
Publication of CN104915879B publication Critical patent/CN104915879B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Tourism & Hospitality (AREA)
  • Primary Health Care (AREA)
  • Human Resources & Organizations (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Technology Law (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例提供一种基于金融数据的社会关系挖掘的方法及装置。本发明基于金融数据的社会关系挖掘的方法,包括:获取客户端用户的金融交易数据,根据所述金融交易数据确定金融交易网络;根据所述金融交易网络确定所述客户端用户的网络拓扑属性以及所述客户端用户的非网络拓扑属性;根据所述金融交易网络的拓扑属性和非网络拓扑属性,确定所述客户端用户所对应的社会关系。本发明实施例解决了现有技术中对于客户端用户之间的社会关系判断效率低,以及对于客户端用户的社会关系发现得不够全面的问题。

Description

基于金融数据的社会关系挖掘的方法及装置
技术领域
本发明实施例涉及计算机科学技术领域,尤其涉及一种基于金融数据的社会关系挖掘的方法及装置。
背景技术
目前的银行业竞争非常残酷,实现客户量的持续增长是银行生存的必由之路。随着互联网金融的蓬勃发展,对传统银行造成很大冲击。比如余额宝上线仅18天,就募集了57亿元,三个月已超过500亿。如何挽留现有客户、吸引新客户、辨别优质客户是提升银行利润的关键。
传统的银行客户之间社会关系的发现主要依靠客户在办理的银行卡时所填写申请表格里的内容,比如:通过代收工资人发现同事关系。通过信用卡主附卡或者贷款担保发现家庭关系。
但是,这种通过该方法判断银行客户之间的社会关系效率太低。
发明内容
本发明实施例提供一种社会关系数据处理基于金融数据的社会关系挖掘的方法及装置,以克服现有技术中基于简单的规则来识别银行客户之间的社会关系效率低的问题。
本发明的第一方面提供一种社会关系数据处理方法,包括:
获取客户端用户的金融交易数据;
根据所述金融交易数据确定金融交易网络;
根据所述金融交易网络确定所述客户端用户的网络拓扑属性以及所述客户端用户的非网络拓扑属性;
根据所述金融交易网络的拓扑属性和非网络拓扑属性,确定所述客户端用户所对应的社会关系。
结合第一方面,在第一方面的第一种可能的实现方式中,所述客户端用户的金融交易数据包括所述客户端用户属性、客户端用户交易行为、客户端用户资金流向、客户端用户资金额、客户端用户的交易时间、类型和备注;
所述根据所述金融交易数据确定金融交易网络,包括:
根据所述客户端用户确定所述金融交易网络的节点,根据所述客户端用户属性确定所述金融交易网络的节点属性,根据所述客户端用户的交易行为确定所述金融交易网络的边,所述节点通过所述边连接,根据所述客户端用户资金流向确定所述边的方向,根据所述客户端用户的资金额确定所述金融交易网络边的权重,根据所述客户端用户的交易时间、类型和备注确定所述金融交易网络的边的属性。
结合第一方面或第一方面的第一种可能实现方式,在第一方面的第二种可能的实现方式中,所述金融交易数据包括第一数据和第二数据,所述第一数据是指已标注社会关系的客户端用户,所述第二数据是指未标注社会关系的客户端用户;
所述根据所述金融交易网络的拓扑属性和非网络拓扑属性确定所述客户端用户所对应的社会关系,包括:
根据所述第一数据的网络拓扑属性和非网络拓扑属性确定分类模型;
根据所述分类模型获取所述第二数据所对应的客户端用户的社会关系。
结合第一方面的第二种可能的实现方式,在第一方面的第三种可能的实现方式中,所述根据所述第一数据所对应的网络拓扑属性和非网络拓扑属性确定分类模型,包括:
根据金融交易网络的网络拓扑属性和非网络拓扑属性选择属性;
根据第一数据确定训练数据集合和测试数据集合;
根据所述训练数据集合以及所述属性,利用数据挖掘分类算法构建分类模型;
根据所述测试数据集合测试所述分类模型是否通过模型评估。
结合第一方面的第四种可能的实现方式,在第一方面的第三种可能的实现方式中,通过所述分类模型,获取所述测试数据集合数据的社会关系;计算所述获取的所述测试数据集合中数据的社会关系与所述测试数据集合中数据的标注的社会关系的匹配率;
若所述匹配率高于所述第一阈值,则确定所述分类模型通过模型评估;
若所述匹配率不高于所述第一阈值,则继续对所述分类模型进行训练。
结合第一方面至第一方面的第四种任一种可能实现的方式,在第一方面的第五种可能实现的方式中,所述根据所述金融交易网络的拓扑属性和非网络拓扑属性,确定所述客户端所对应的社会关系包括;
根据所述金融交易网络的拓扑属性和非网络拓扑属性进行网络聚类获取所述客户端用户的社会关系。
本发明的第二方面提供一种基于金融数据的社会关系挖掘的装置,包括:
获取模块,用于获取客户端用户的金融交易数据;
第一确定模块,用于根据所述获取模块所获取的金融交易数据确定金融交易网络;
第二确定模块,用于根据所述第一确定模块确定的所述金融交易网络确定所述客户端用户的网络拓扑属性以及所述客户端用户的非网络拓扑属性;
第三确定模块,用于根据第二确定模块确定的所述金融交易网络的拓扑属性和非网络拓扑属性,确定所述客户端用户所对应的社会关系。
在第二方面的第一种可能的实现方式中,所述第一确定模块,具体用于:
所述客户端用户的金融交易数据包括所述客户端用户属性、客户端用户交易行为、客户端用户资金流向、客户端用户资金额、客户端用户的交易时间、类型和备注;
根据所述客户端用户确定所述金融交易网络的节点,根据所述客户端用户属性确定所述金融交易网络的节点属性,根据所述客户端用户的交易行为确定所述金融交易网络的边,所述节点通过所述边连接,根据所述客户端用户资金流向确定所述边的方向,根据所述客户端用户的资金额确定所述金融交易网络边的权重,根据所述客户端用户的交易时间、类型和备注确定所述金融交易网络的边的属性。
结合第二方面或第二方面第一种可能的实现方式,在第二方面的第二种可能的实现方式中,所述金融交易数据包括第一数据和第二数据,所述第一数据是指已标注社会关系的客户端用户,所述第二数据是指未标注社会关系的客户端用户;
所述第三确定模块,包括确定模型单元和确定关系单元,
所述确定模型单元,用于根据所述第一数据的网络拓扑属性和非网络拓扑属性确定分类模型;
所述确定关系单元,用于根据所述确定模型单元确定的所述分类模型获取所述第二数据所对应的客户端用户的社会关系。
结合第二方面的第二种可能的实现方式,在第二方面的第三种可能的实现方式中,所述确定模型单元,具体用于:
根据金融交易网络的网络拓扑属性和非网络拓扑属性选择属性;
根据第一数据确定训练数据集合和测试数据集合;
根据所述训练数据集合以及所述属性,利用数据挖掘分类算法构建分类模型;
根据所述测试数据集合测试所述分类模型是否通过模型评估。
结合第二方面的第三种可能的实现方式,在第二方面的第四种可能的实现方式中,所述确定模型单元,具体用于:
通过所述分类模型,获取所述测试数据集合数据的社会关系;计算所述获取的所述测试数据集合中数据的社会关系与所述测试数据集合中数据的标注的社会关系的匹配率;
若所述匹配率高于所述第一阈值,则确定所述分类模型通过模型评估;
若所述匹配率不高于所述第一阈值,则继续对所述分类模型进行训练。
结合第二方面至第二方面的第四种任一种可能实现的方式,在第二方面的第五种可能实现的方式中,所述第三确定模块,具体用于:
根据所述金融交易网络的拓扑属性和非网络拓扑属性进行网络聚类获取所述客户端用户的社会关系。
本发明实施例基于金融数据的社会关系挖掘的方法及装置,通过金融交易数据构建金融交易网络,根据所述金融交易网络确定客户端用户的网络拓扑属性以及所述客户端用户的非网络拓扑属性,并根据所述网络拓扑属性和非网络拓扑属性构建分类模型,用所述分类模型确定所述客户端所对应的同事非同事、家庭非家庭关系,对所述网络拓扑属性和非网络拓扑属性的计算结果进行聚类分析,确定所述客户端用户所对应的朋友关系,解决了现有技术中对于客户端用户之间的社会关系判断效率低,以及对于客户端用户的社会关系发现得不够全面的问题。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明基于金融数据的社会关系挖掘的方法实施例一的流程图;
图2为本发明整体架构图;
图3为本发明网络拓扑属性计算流程图;
图4为本发明分类模型的构建和测试流程图;
图5为本发明基于金融数据的社会关系挖掘的装置实施例一的结构示意图;
图6为本发明基于金融数据的社会关系挖掘的装置实施例二的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和有益效果更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明基于金融数据的社会关系挖掘的方法实施例一的流程图,如图1所示,本实施例的方法可以包括:
步骤101、获取客户端用户的金融交易数据;
具体来说,从客户端用户的交易记录中获取客户端用户的金融交易数据,该交易记录可以是客户端用户的转账交易,也可以是客户端用户的消费交易等。从该交易记录中所获取的金融交易数据不仅包括了本次交易的时间,还包括交易的地点,以及交易的金额等交易属性。并且该交易记录还记录对应本次交易的客户端用户个人信息。该金融交易数据中包含已经标注有客户端用户的同事或家庭等社会关系的金融交易数据和未标注社会关系的金融交易数据。
步骤102、根据所述金融交易数据确定金融交易网络;
具体来说,服务器根据所述金融交易数据构建金融交易网络的整体流程主要包括以下几个步骤:一、大数据数据库的存储,将大规模的交易记录存储到数据库Hive中;二、客户端用户的地址映射,该地址可以为客户端用户的网络ID或外部ID,根据Hive数据对客户端用户ID进行二次映射,确保了构建网络中过程中对应的客户端用户ID的唯一性,同时降低了网络文件的占用空间;三、特征选择,根据金融交易数据进行特征选择,确定构建网络的时间区间,以及需要在网络上体现的属性信息;四、权值计算,根据特征选择的计算结果,确定金融交易网络中边的权值计算,举例说明,若选择交易次数作为权值,则通过数据库Hive统计相同交易次数的客户端用户的交易记录;五、通过Hive数据完成外部ID的排序,并将完成排序的数据作为网络构建的数据输入,通过网络构建程序,实现通用网络构建文件.net的构建。将排序号的数据作为网络构建的输入文件进行网络构建,能够降低构建过程的时间复杂度。针对于数据量大的网络构建时间长的问题,本实施例中是基于大数据的数据库完成网络构建的排序和映射,提高了整体的构建效率。
步骤103、根据所述金融交易网络确定所述客户端用户的网络拓扑属性以及所述客户端用户的非网络拓扑属性;
具体来说,所述金融交易网络中的网络数据能够很好的反应客户端用户之间的关系和紧密程度,不同的关系在金融交易网络上的网络拓扑属性也是明显的不同。举例说明:同事关系的节点之间都会存在着一个共同的邻居节点,家庭关系的节点之间的方向和权重会和一般的交易记录有明显的区别等,这些都可以通过网络属性得到体现。本实施例计算的网络拓扑属性主要包括:两节点之间共同邻居的度信息AdamicAdar、共同邻居CommonNeighbor、聚类系数ClusteringCoefficient、距离Distance、度Degree、指数PageRank、量Volume、亚加达系数JaccardCoefficient等。网络拓扑属性计算流程如图3所示。
所述金融交易网络对应的客户端用户之间的非网络拓扑属性主要是从交易属性的角度出发,根据金融交易数据的特点进行非网络属性的设计和计算。主要包括有:时间维度、空间维度、交易金额和交易流向等。对于时间维度主要划分为两个部分:周规律和天规律。具体来说,周规律,是指每周七天的交易次数对应形成七个非网络属性特征;天规律,是根据每天24小时的交易次数进行计算,形成的24个非网络属性特征。对于空间维度是对两个发生交易的客户端用户的活动地点的重合度进行统计。交易金额所指的就是两个客户端用户之间交易所涉及的金额,可包括:一年总的交易金额、月平均交易金额或者是支出收入差值等度量。交易流向是对两个客户端用户之间交易记录中的资金流向次数统计,举例说明:客户端用户A向客户端用户B转账5次,客户端用户B向客户端用户A转账1次,则客户端用户A和客户端用户B之间的交易流向属性值为4次。
本实施例的非网络拓扑属性对于背景相似的客户端用户具有很好的聚合作用,对于背景不同的客户端用户具有很好的区分作用。例如,对于交易地点而言,同一区域的客户端用户大多数会选择去附近相同的网店进行交易,对于交易时间而言,上班时间发生交易的客户端用户主要为上班族。
步骤104、根据所述金融交易网络的拓扑属性和非网络拓扑属性,确定所述客户端用户所对应的社会关系。
本实施例中,所述服务器根据所述金融交易网络的拓扑属性和非网络拓扑属性确定所述客户端所对应的社会关系方法有两种:
所述金融交易数据包括第一数据和第二数据,所述第一数据是指已标注用户社会关系的数据,所述第二数据是指未标注用户的社会关系的数据;
可选地,所述根据所述金融交易网络的拓扑属性和非网络拓扑属性确定所述客户端用户所对应的社会关系,包括:
根据所述第一数据的网络拓扑属性和非网络拓扑属性确定分类模型;
根据所述分类模型获取所述第二数据所对应的客户端用户的社会关系。
可选地,所述根据所述金融交易网络的拓扑属性和非网络拓扑属性,确定所述客户端所对应的社会关系包括;
根据所述金融交易网络的拓扑属性和非网络拓扑属性进行网络聚类获取所述客户端用户的社会关系。
进一步地,所述服务器根据第一数据所对应的网络拓扑属性和非网络拓扑属性确定分类模型,包括:
根据金融交易网络的网络拓扑属性和非网络拓扑属性选择属性;
根据第一数据确定训练数据集合和测试数据集合;
根据所述训练数据集合以及所述属性,利用数据挖掘分类算法构建分类模型;其中,常见的数据挖掘分类算法包括决策树算法、随机森林算法等。
根据所述测试数据集合测试所述分类模型是否通过模型评估。
进一步地,所述服务器根据所述测试数据集合测试所述分类模型是否通过模型评估,包括:
通过所述分类模型,获取所述测试数据集合数据的社会关系;计算所述获取的所述测试数据集合中数据的社会关系与所述测试数据集合中数据的标注的社会关系的匹配率;
若所述匹配率高于所述第一阈值,则确定所述分类模型通过模型评估;
若所述匹配率不高于所述第一阈值,则继续对所述分类模型进行训练。
具体来说,服务器根据金融交易网络的拓扑属性和非网络拓扑属性的计算结果,用分类模型来确定所述客户端所对应的同事非同事关系、家庭非家庭关系;用网络聚类获取客户端用户的朋友关系。所述分类模型是根据完成金融交易网络的网络拓扑属性以及非网络拓扑属性计算的数据集合确定的。本实施例分类模型的构建流程如图4所示,首先,对于金融交易网络的网络拓扑属性和非网络拓扑属性计算的数据集合进行属性选择,例如选择交易属性中的交易地点,再将对应于交易地点的交易数据集合划分为训练数据集合和测试数据集合两部分,其中,训练数据集合用于训练分类模型,测试数据集合用于测试分类模型是否通过模型评估,设定第一阈值,通过所述分类模型,获取所述测试数据集合数据的社会关系;计算所述获取的所述测试数据集合中数据的社会关系与所述测试数据集合中数据的标注的社会关系的匹配率,若所述匹配率高于所述第一阈值,则确定所述分类模型通过模型评估,输出所述分类模型;若所述匹配率不高于所述第一阈值,则对所述分类模型进行修整后再输出。该模型评估是判断测试数据集合中全部已标注客户端用户社会关系的测试数据与训练数据集合中通过分类模型计算出的客户端用户社会关系是否一致。本实施例主要采用了随机森林和决策树的分类方法构建分类模型。
所述网络聚类方法即社区发现方法。社区现象是复杂网络中的一种普遍现象,表达了多个个体具有的共同体特性。社区发现方法是用于挖掘所述多个个体具有的共同体特性的一种方法。首先通过构建的金融交易网络作为发现社区计算模型的输入。然后,服务器应用大规模网络分析软件进行处理和社区的初步聚类。最后,对初步聚类结果进行二次分析,获取客户端用户的社区结构,该社区结构即为该客户端用户的朋友圈,并根据该朋友圈对客户端用户之间的朋友关系进行标注。
进一步地,所述服务器根据所述金融交易数据确定金融交易网络,包括:
根据所述客户端用户确定所述金融交易网络的节点,根据所述客户端用户属性确定所述金融交易网络的节点属性,根据所述客户端用户的交易行为确定所述金融交易网络的边,所述节点通过所述边连接,根据所述客户端用户资金流向确定所述边的方向,根据所述客户端用户的资金额确定所述金融交易网络边的权重,根据所述客户端用户的交易时间、类型和备注确定所述金融交易网络的边的属性。
本实施例用金融交易数据进行实验,构建客户端用户同事非同事分类预测模型和家庭关系模型,其实验结果如表1所示:
表1
本实施例,通过根据金融交易数据构建金融交易网络,根据所述金融交易网络确定客户端用户的网络拓扑属性以及所述客户端用户的非网络拓扑属性,并根据所述网络拓扑属性和非网络拓扑属性构建分类模型,用所述分类模型确定所述客户端所对应的同事非同事、家庭非家庭关系,对所述网络拓扑属性和非网络拓扑属性的计算结果进行聚类分析,确定所述客户端用户所对应的朋友关系,解决了现有技术中对于客户端用户之间的社会关系判断效率低,以及对于客户端用户的社会关系发现得不够全面的问题。
图5为本发明基于金融数据的社会关系挖掘的装置实施例一的结构示意图,如图5所示,本实施例的装置可以包括:
获取模块101,用于获取客户端用户的金融交易数据;
第一确定模块102,用于根据获取模块101所获取的金融交易数据确定金融交易网络;
第二确定模块103,用于根据第一确定模块102确定的所述金融交易网络确定所述客户端用户的网络拓扑属性以及所述客户端用户的非网络拓扑属性;
第三确定模块104,用于根据第二确定模块103确定的所述金融交易网络的拓扑属性和非网络拓扑属性,确定所述客户端用户所对应的社会关系。
上述实施例中,所述金融交易数据包括第一数据和第二数据,所述第一数据是指已标注社会关系的客户端用户,所述第二数据是指未标注社会关系的客户端用户;
所述第三确定模块,包括:
确定模型单元105,用于根据所述第一数据的网络拓扑属性和非网络拓扑属性确定分类模型;
确定关系单元106,用于根据所述确定模型单元确定的所述分类模型获取所述第二数据所对应的客户端用户的社会关系。
确定模型单元105,具体用于:
根据金融交易网络的网络拓扑属性和非网络拓扑属性选择属性;
根据第一数据确定训练数据集合和测试数据集合;
根据所述训练数据集合以及所述属性,利用数据挖掘分类算法构建分类模型;
根据所述测试数据集合测试所述分类模型是否通过模型评估。
确定模型单元105,具体用于:
通过所述分类模型,获取所述测试数据集合数据的社会关系;计算所述获取的所述测试数据集合中数据的社会关系与所述测试数据集合中数据的标注的社会关系的匹配率;
若所述匹配率高于所述第一阈值,则确定所述分类模型通过模型评估;
若所述匹配率不高于所述第一阈值,则继续对所述分类模型进行训练。
第三确定模块104,具体用于:根据所述金融交易网络的拓扑属性和非网络拓扑属性进行网络聚类获取所述客户端用户的社会关系。
所述客户端用户的金融交易数据包括所述客户端用户属性、客户端用户交易行为、客户端用户资金流向、客户端用户资金额、客户端用户的交易时间、类型和备注;
第一确定模块102,具体用于:
根据所述客户端用户确定所述金融交易网络的节点,根据所述客户端用户属性确定所述金融交易网络的节点属性,根据所述客户端用户的交易行为确定所述金融交易网络的边,所述节点通过所述边连接,根据所述客户端用户资金流向确定所述边的方向,根据所述客户端用户的资金额确定所述金融交易网络边的权重,根据所述客户端用户的交易时间、类型和备注确定所述金融交易网络的边的属性。
本实施例的装置,可以用于执行图1所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
图6为本发明基于金融数据的社会关系挖掘的装置实施例二的结构示意图,如图6所示,本实施例的网络设备,包括:处理器201和接口电路202,图中还示出了存储器203和总线204,该处理器201、接口电路202和存储器203通过总线204连接并完成相互间的通信。
该总线204可以是工业标准架构(英文:Industry Standard Architecture,简称:ISA)总线、外部设备互连(英文:Peripheral Component Interconnect,简称:PCI)总线或内部整合电路(英文:Inter-Integrated Circuit,简称:I2C)总线等。该总线204可以分为地址总线、数据总线、控制总线等。为便于表示,图6中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器203用于存储可执行程序代码,该程序代码包括计算机操作指令。存储器203可以是易失性存储器(英文:volatile memory),例如随机存储器(英文:random-access memory,简称:RAM),也可以是非易失性存储器(英文:non-volatile memory,简称:NVM),例如只读存储器(英文:read-onlymemory,简称ROM),快闪存储器(英文:flash memory),硬盘(英文:hard disk drive,简称HDD)或固态硬盘(英文:solid-state drive,简称SSD)。
处理器201可以是中央处理器(英文:central processing unit,简称:CPU)。
其中,处理器201可以调用存储器203中存储的操作指令或者程序代码,来执行本发明实施例提供的虚拟局域网接口的处理方法,所述方法包括:
处理器201获取客户端用户的金融交易数据;
处理器201根据所述金融交易数据确定金融交易网络;
处理器201根据所述金融交易网络确定所述客户端用户的网络拓扑属性以及所述客户端用户的非网络拓扑属性;
处理器201根据所述金融交易网络的拓扑属性和非网络拓扑属性,确定所述客户端用户所对应的社会关系。
处理器201根据所述客户端用户确定所述金融交易网络的节点,根据所述客户端用户属性确定所述金融交易网络的节点属性,根据所述客户端用户的交易行为确定所述金融交易网络的边,所述节点通过所述边连接,根据所述客户端用户资金流向确定所述边的方向,根据所述客户端用户的资金额确定所述金融交易网络边的权重,根据所述客户端用户的交易时间、类型和备注确定所述金融交易网络的边的属性。
处理器201根据所述第一数据的网络拓扑属性和非网络拓扑属性确定分类模型;
处理器201根据所述分类模型获取所述第二数据所对应的客户端用户的社会关系。
处理器201根据金融交易网络的网络拓扑属性和非网络拓扑属性选择属性;
处理器201根据第一数据确定训练数据集合和测试数据集合;
处理器201根据所述训练数据集合以及所述属性,利用数据挖掘分类算法构建分类模型;
处理器201根据所述测试数据集合测试所述分类模型是否通过模型评估。
处理器201通过所述分类模型,获取所述测试数据集合数据的社会关系;计算所述获取的所述测试数据集合中数据的社会关系与所述存储器203中所存储的测试数据集合中数据的标注的社会关系的匹配率;
若所述匹配率高于所述第一阈值,则确定所述分类模型通过模型评估;
若所述匹配率不高于所述第一阈值,则继续对所述分类模型进行训练。
处理器201根据所述金融交易网络的拓扑属性和非网络拓扑属性进行网络聚类获取所述客户端用户的社会关系。
本实施例的装置,可以用于执行图1所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:只读存储器(英文:read-only memory,简称ROM)、随机存储器(英文:random-access memory,简称:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (12)

1.一种基于金融数据的社会关系挖掘的方法,其特征在于,包括:
获取客户端用户的金融交易数据;
根据所述金融交易数据确定金融交易网络;
根据所述金融交易网络确定所述客户端用户的网络拓扑属性以及所述客户端用户的非网络拓扑属性;
根据所述金融交易网络的拓扑属性和非网络拓扑属性,确定所述客户端用户所对应的社会关系。
2.根据权利要求1所述的方法,其特征在于,所述客户端用户的金融交易数据包括所述客户端用户属性、客户端用户交易行为、客户端用户资金流向、客户端用户资金额、客户端用户的交易时间、类型和备注;
所述根据所述金融交易数据确定金融交易网络,包括:
根据所述客户端用户确定所述金融交易网络的节点,根据所述客户端用户属性确定所述金融交易网络的节点属性,根据所述客户端用户的交易行为确定所述金融交易网络的边,所述节点通过所述边连接,根据所述客户端用户资金流向确定所述边的方向,根据所述客户端用户的资金额确定所述金融交易网络边的权重,根据所述客户端用户的交易时间、类型和备注确定所述金融交易网络的边的属性。
3.根据权利要求1或2所述的方法,其特征在于,所述金融交易数据包括第一数据和第二数据,所述第一数据是指已标注社会关系的客户端用户,所述第二数据是指未标注社会关系的客户端用户;
所述根据所述金融交易网络的拓扑属性和非网络拓扑属性确定所述客户端用户所对应的社会关系,包括:
根据所述第一数据的网络拓扑属性和非网络拓扑属性确定分类模型;
根据所述分类模型获取所述第二数据所对应的客户端用户的社会关系。
4.根据权利要求3所述的方法,其特征在于,所述根据所述第一数据所对应的网络拓扑属性和非网络拓扑属性确定分类模型,包括:
根据金融交易网络的网络拓扑属性和非网络拓扑属性选择属性;
根据第一数据确定训练数据集合和测试数据集合;
根据所述训练数据集合以及所述属性,利用数据挖掘分类算法构建分类模型;
根据所述测试数据集合测试所述分类模型是否通过模型评估。
5.根据权利要求4所述的方法,其特征在于,所述根据所述测试数据集合测试所述分类模型是否通过模型评估,包括:
通过所述分类模型,获取所述测试数据集合数据的社会关系;计算所述获取的所述测试数据集合中数据的社会关系与所述测试数据集合中数据的标注的社会关系的匹配率;
若所述匹配率高于所述第一阈值,则确定所述分类模型通过模型评估;
若所述匹配率不高于所述第一阈值,则继续对所述分类模型进行训练。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述根据所述金融交易网络的拓扑属性和非网络拓扑属性,确定所述客户端所对应的社会关系包括;
根据所述金融交易网络的拓扑属性和非网络拓扑属性进行网络聚类获取所述客户端用户的社会关系。
7.一种基于金融数据的社会关系挖掘的装置,其特征在于,包括:
获取模块,用于获取客户端用户的金融交易数据;
第一确定模块,用于根据所述获取模块所获取的金融交易数据确定金融交易网络;
第二确定模块,用于根据所述第一确定模块确定的所述金融交易网络确定所述客户端用户的网络拓扑属性以及所述客户端用户的非网络拓扑属性;
第三确定模块,用于根据第二确定模块确定的所述金融交易网络的拓扑属性和非网络拓扑属性,确定所述客户端用户所对应的社会关系。
8.根据权利要求7所述的装置,其特征在于,所述第一确定模块,具体用于:
所述客户端用户的金融交易数据包括所述客户端用户属性、客户端用户交易行为、客户端用户资金流向、客户端用户资金额、客户端用户的交易时间、类型和备注;
根据所述客户端用户确定所述金融交易网络的节点,根据所述客户端用户属性确定所述金融交易网络的节点属性,根据所述客户端用户的交易行为确定所述金融交易网络的边,所述节点通过所述边连接,根据所述客户端用户资金流向确定所述边的方向,根据所述客户端用户的资金额确定所述金融交易网络边的权重,根据所述客户端用户的交易时间、类型和备注确定所述金融交易网络的边的属性。
9.根据权利要求7或8所述的装置,其特征在于,所述金融交易数据包括第一数据和第二数据,所述第一数据是指已标注社会关系的客户端用户,所述第二数据是指未标注社会关系的客户端用户;
所述第三确定模块,包括确定模型单元和确定关系单元,
所述确定模型单元,用于根据所述第一数据的网络拓扑属性和非网络拓扑属性确定分类模型;
所述确定关系单元,用于根据所述确定模型单元确定的所述分类模型获取所述第二数据所对应的客户端用户的社会关系。
10.根据权利要求9所述的装置,其特征在于,所述确定模型单元,具体用于:
根据金融交易网络的网络拓扑属性和非网络拓扑属性选择属性;
根据第一数据确定训练数据集合和测试数据集合;
根据所述训练数据集合以及所述属性,利用数据挖掘分类算法构建分类模型;
根据所述测试数据集合测试所述分类模型是否通过模型评估。
11.根据权利要求10所述的装置,其特征在于,所述确定模型单元,具体用于:
通过所述分类模型,获取所述测试数据集合数据的社会关系;计算所述获取的所述测试数据集合中数据的社会关系与所述测试数据集合中数据的标注的社会关系的匹配率;
若所述匹配率高于所述第一阈值,则确定所述分类模型通过模型评估;
若所述匹配率不高于所述第一阈值,则继续对所述分类模型进行训练。
12.根据权利要求7至11任一项所述的装置,其特征在于,所述第三确定模块,具体用于:
根据所述金融交易网络的拓扑属性和非网络拓扑属性进行网络聚类获取所述客户端用户的社会关系。
CN201410085416.8A 2014-03-10 2014-03-10 基于金融数据的社会关系挖掘的方法及装置 Active CN104915879B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201410085416.8A CN104915879B (zh) 2014-03-10 2014-03-10 基于金融数据的社会关系挖掘的方法及装置
PCT/CN2014/089034 WO2015135321A1 (zh) 2014-03-10 2014-10-21 基于金融数据的社会关系挖掘的方法及装置
US15/251,000 US20160371792A1 (en) 2014-03-10 2016-08-30 Method and Apparatus for Mining Social Relationship Based on Financial Data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410085416.8A CN104915879B (zh) 2014-03-10 2014-03-10 基于金融数据的社会关系挖掘的方法及装置

Publications (2)

Publication Number Publication Date
CN104915879A true CN104915879A (zh) 2015-09-16
CN104915879B CN104915879B (zh) 2019-08-13

Family

ID=54070878

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410085416.8A Active CN104915879B (zh) 2014-03-10 2014-03-10 基于金融数据的社会关系挖掘的方法及装置

Country Status (3)

Country Link
US (1) US20160371792A1 (zh)
CN (1) CN104915879B (zh)
WO (1) WO2015135321A1 (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105677801A (zh) * 2015-12-31 2016-06-15 中国银联股份有限公司 一种基于图的数据处理方法和系统
CN105678323A (zh) * 2015-12-31 2016-06-15 中国银联股份有限公司 基于图的分析用户的方法和系统
CN105913235A (zh) * 2016-04-21 2016-08-31 中国农业银行股份有限公司 一种客户转账关系分析方法及系统
CN106022595A (zh) * 2016-05-16 2016-10-12 山东大学 基于采购数据的企业自我网络关系圈划分方法及服务器
CN106776897A (zh) * 2016-11-29 2017-05-31 中国农业银行股份有限公司 一种用户画像标签确定方法及装置
CN107730262A (zh) * 2017-10-23 2018-02-23 阿里巴巴集团控股有限公司 一种欺诈识别方法和装置
CN109829485A (zh) * 2019-01-08 2019-05-31 科大国创软件股份有限公司 一种基于移动通信数据的用户关系挖掘方法及系统
CN110209826A (zh) * 2018-02-06 2019-09-06 武汉观图信息科技有限公司 一种面向银行风险控制的金融图谱构建与分析方法
CN110895760A (zh) * 2018-09-05 2020-03-20 北京京东金融科技控股有限公司 数据处理方法和装置
CN111177188A (zh) * 2019-12-30 2020-05-19 浙江邦盛科技有限公司 一种基于聚合边与时序聚合边的快速海量时序数据处理方法
CN112163625A (zh) * 2020-10-06 2021-01-01 翁海坤 基于人工智能和云计算的大数据挖掘方法及云端服务中心
CN112395492A (zh) * 2019-08-16 2021-02-23 华为技术有限公司 一种节点识别方法、装置以及设备
WO2021116850A1 (en) * 2019-12-11 2021-06-17 International Business Machines Corporation Grouping users of a mobile network
TWI786378B (zh) * 2020-03-02 2022-12-11 第一商業銀行股份有限公司 基於家庭關係的家庭戶網絡管理方法及系統

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10269078B2 (en) * 2016-02-15 2019-04-23 Accenture Global Solutions Limited Network analysis of transaction data for target identification
US10475125B1 (en) * 2016-04-29 2019-11-12 Intuit Inc. Utilizing financial data of a user to identify a life event affecting the user
US10652096B2 (en) 2017-02-22 2020-05-12 University Of Notre Dame Du Lac Methods and systems for inferring network structure from cascades
CN108985309B (zh) * 2017-05-31 2022-11-29 腾讯科技(深圳)有限公司 一种数据处理方法以及装置
CN107871277B (zh) * 2017-07-25 2021-04-13 平安普惠企业管理有限公司 服务器、客户关系挖掘的方法及计算机可读存储介质
CN111465953B (zh) * 2017-12-07 2023-09-26 幣即特株式会社 基于交易分类账的账户间社会关系导出装置及方法
CN108073699B (zh) * 2017-12-12 2020-06-16 中国联合网络通信集团有限公司 大数据聚合分析方法及装置
CN111626459B (zh) * 2019-02-27 2024-04-30 深圳电蚂蚁数据技术有限公司 一种区域充电网络拓扑关系确认方法、装置和系统
CN110399533A (zh) * 2019-07-29 2019-11-01 中国工商银行股份有限公司 资金流向查询方法及装置
CN110990718B (zh) * 2019-11-27 2024-03-01 国网能源研究院有限公司 一种公司形象提升系统的社会网络模型构建模块
US11216730B2 (en) * 2020-03-10 2022-01-04 Capital One Services, Llc Utilizing machine learning to perform a merger and optimization operation
CN111882054B (zh) * 2020-05-27 2024-04-12 杭州中奥科技有限公司 对双方加密关系网络数据交叉训练的方法及相关设备
CN111652451B (zh) * 2020-08-06 2020-12-01 腾讯科技(深圳)有限公司 社交关系的获取方法和装置及存储介质
US11381467B2 (en) * 2020-09-16 2022-07-05 Financial Network Analytics Ltd Method and system for generating synthetic data from aggregate dataset
US11830064B2 (en) * 2020-12-31 2023-11-28 Beijing Trusfort Technology Co., Ltd. Method and system for credit risk identification
CN115760200B (zh) * 2023-01-06 2023-07-04 万链指数(青岛)信息科技有限公司 基于金融交易数据的用户画像构建方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102087730A (zh) * 2009-12-08 2011-06-08 深圳市腾讯计算机系统有限公司 一种产品用户网络构建方法和装置
CN102195899A (zh) * 2011-05-30 2011-09-21 中国人民解放军总参谋部第五十四研究所 通信网络的信息挖掘方法与系统
CN102956023A (zh) * 2012-08-30 2013-03-06 南京信息工程大学 一种基于贝叶斯分类的传统气象数据与感知数据融合的方法
CN103023714A (zh) * 2012-11-21 2013-04-03 上海交通大学 基于网络话题的活跃度与集群结构分析系统及方法
CN103455593A (zh) * 2013-09-01 2013-12-18 北京航空航天大学 一种基于社交网络的服务竞争性实现系统及方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX2012003721A (es) * 2009-09-30 2012-06-28 Evan V Chrapko Sistemas y metodos para analitica de datos graficos sociales para determinar conectividad dentro de una comunidad.
CN102339430B (zh) * 2010-07-26 2016-03-16 阿里巴巴集团控股有限公司 一种发起建立社会性网络服务关系的方法和设备
US20130297471A1 (en) * 2012-05-02 2013-11-07 SmartyPig, L.L.C., d.b.a. Social Money Method of generating social network notification within a goal based financial account
CN103383767B (zh) * 2013-07-12 2015-03-04 西安交通大学 基于纳税人利益关联网络模型的偷漏税关联企业识别方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102087730A (zh) * 2009-12-08 2011-06-08 深圳市腾讯计算机系统有限公司 一种产品用户网络构建方法和装置
CN102195899A (zh) * 2011-05-30 2011-09-21 中国人民解放军总参谋部第五十四研究所 通信网络的信息挖掘方法与系统
CN102956023A (zh) * 2012-08-30 2013-03-06 南京信息工程大学 一种基于贝叶斯分类的传统气象数据与感知数据融合的方法
CN103023714A (zh) * 2012-11-21 2013-04-03 上海交通大学 基于网络话题的活跃度与集群结构分析系统及方法
CN103455593A (zh) * 2013-09-01 2013-12-18 北京航空航天大学 一种基于社交网络的服务竞争性实现系统及方法

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105678323A (zh) * 2015-12-31 2016-06-15 中国银联股份有限公司 基于图的分析用户的方法和系统
CN105677801A (zh) * 2015-12-31 2016-06-15 中国银联股份有限公司 一种基于图的数据处理方法和系统
CN105677801B (zh) * 2015-12-31 2021-06-08 中国银联股份有限公司 一种基于图的数据处理方法和系统
CN105913235A (zh) * 2016-04-21 2016-08-31 中国农业银行股份有限公司 一种客户转账关系分析方法及系统
CN106022595B (zh) * 2016-05-16 2019-10-01 山东大学 基于采购数据的企业自我网络关系圈划分方法及服务器
CN106022595A (zh) * 2016-05-16 2016-10-12 山东大学 基于采购数据的企业自我网络关系圈划分方法及服务器
CN106776897A (zh) * 2016-11-29 2017-05-31 中国农业银行股份有限公司 一种用户画像标签确定方法及装置
CN106776897B (zh) * 2016-11-29 2020-04-03 中国农业银行股份有限公司 一种用户画像标签确定方法及装置
CN107730262A (zh) * 2017-10-23 2018-02-23 阿里巴巴集团控股有限公司 一种欺诈识别方法和装置
CN107730262B (zh) * 2017-10-23 2021-09-24 创新先进技术有限公司 一种欺诈识别方法和装置
CN110209826A (zh) * 2018-02-06 2019-09-06 武汉观图信息科技有限公司 一种面向银行风险控制的金融图谱构建与分析方法
CN110895760A (zh) * 2018-09-05 2020-03-20 北京京东金融科技控股有限公司 数据处理方法和装置
CN109829485A (zh) * 2019-01-08 2019-05-31 科大国创软件股份有限公司 一种基于移动通信数据的用户关系挖掘方法及系统
CN112395492A (zh) * 2019-08-16 2021-02-23 华为技术有限公司 一种节点识别方法、装置以及设备
CN112395492B (zh) * 2019-08-16 2022-04-05 华为技术有限公司 一种节点识别方法、装置以及设备
WO2021116850A1 (en) * 2019-12-11 2021-06-17 International Business Machines Corporation Grouping users of a mobile network
US11361009B2 (en) 2019-12-11 2022-06-14 International Business Machines Corporation Grouping users of a mobile network
CN111177188A (zh) * 2019-12-30 2020-05-19 浙江邦盛科技有限公司 一种基于聚合边与时序聚合边的快速海量时序数据处理方法
TWI786378B (zh) * 2020-03-02 2022-12-11 第一商業銀行股份有限公司 基於家庭關係的家庭戶網絡管理方法及系統
CN112163625A (zh) * 2020-10-06 2021-01-01 翁海坤 基于人工智能和云计算的大数据挖掘方法及云端服务中心

Also Published As

Publication number Publication date
CN104915879B (zh) 2019-08-13
WO2015135321A1 (zh) 2015-09-17
US20160371792A1 (en) 2016-12-22

Similar Documents

Publication Publication Date Title
CN104915879A (zh) 基于金融数据的社会关系挖掘的方法及装置
TWI712981B (zh) 風險辨識模型訓練方法、裝置及伺服器
CN109657894A (zh) 企业信用风险预警方法、装置、设备及存储介质
WO2017140222A1 (zh) 机器学习模型的建模方法及装置
CN108665159A (zh) 一种风险评估方法、装置、终端设备及存储介质
CN108763277B (zh) 一种数据分析方法、计算机可读存储介质及终端设备
CN111754345B (zh) 一种基于改进随机森林的比特币地址分类方法
CN110310191A (zh) 用于数据分析、风险管理和自动合规的分布式计算机框架
CN108596495A (zh) 一种零售信贷业务评分系统及方法
CN109635007B (zh) 一种行为评估方法、装置及相关设备
CN106897930A (zh) 一种信用评估的方法及装置
CN109389494A (zh) 借贷欺诈检测模型训练方法、借贷欺诈检测方法及装置
CN114265967B (zh) 一种敏感数据安全等级标注方法及装置
CN110175850A (zh) 一种交易信息的处理方法及装置
CN111325619A (zh) 一种基于联合学习的信用卡欺诈检测模型更新方法及装置
CN112541817A (zh) 一种个人消费贷款潜在客户的营销响应处理方法及系统
CN110796539A (zh) 一种征信评估方法及装置
CN108647714A (zh) 负面标签权重的获取方法、终端设备及介质
Zarutska Structural-functional analysis of the Ukraine banking system
CN110516713A (zh) 一种目标群体识别方法、装置及设备
Pritam et al. A novel methodology for perception-based portfolio management
CN116503158A (zh) 基于数据驱动的企业破产风险预警方法、系统及装置
Majumder et al. Limitation of ARIMA in extremely collapsed market: A proposed method
CN110097460A (zh) 一种信用风险评估方法
CN109767333A (zh) 选基方法、装置、电子设备及计算机可读存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant