CN113946690A - 潜在客户挖掘方法、装置、电子设备及存储介质 - Google Patents
潜在客户挖掘方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN113946690A CN113946690A CN202111261056.9A CN202111261056A CN113946690A CN 113946690 A CN113946690 A CN 113946690A CN 202111261056 A CN202111261056 A CN 202111261056A CN 113946690 A CN113946690 A CN 113946690A
- Authority
- CN
- China
- Prior art keywords
- customer
- data
- node
- client
- nodes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000005065 mining Methods 0.000 title claims abstract description 44
- 238000000034 method Methods 0.000 title claims abstract description 43
- 239000013598 vector Substances 0.000 claims description 43
- 230000004927 fusion Effects 0.000 claims description 11
- 230000006870 function Effects 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 8
- 238000010276 construction Methods 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 230000008030 elimination Effects 0.000 claims description 3
- 238000003379 elimination reaction Methods 0.000 claims description 3
- 230000004931 aggregating effect Effects 0.000 claims description 2
- 238000005516 engineering process Methods 0.000 abstract description 6
- 238000007405 data analysis Methods 0.000 abstract description 2
- 238000007726 management method Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 230000007306 turnover Effects 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Animal Behavior & Ethology (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Technology Law (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及数据分析技术,揭露一种潜在客户挖掘方法,包括:构建不同预设经营关系条件对应的客户知识图谱,将所述客户知识图谱进行融合,融合后的知识图谱包括客户节点及客户属性信息,根据每个所述客户节点的客户属性信息,计算所述客户节点之间的差异度,标注已发生预设业务的客户节点为参考节点,分别统计所述参考节点以及与所述参考节点相连的客户节点之间的最短路径,根据所述最短路径及所述差异度,计算每个客户节点的所述预设业务的发生概率值,根据所述发生概率值确定潜在客户。本发明还提出一种潜在客户挖掘装置、设备以及介质。本发明可以提升识别潜在客户的准确率。
Description
技术领域
本发明涉及数据分析技术领域,尤其涉及一种潜在客户挖掘方法、装置、电子设备及计算机可读存储介质。
背景技术
当今小微企业数量庞大,遍布于人们生活中的方方面面。它们具有经营灵活、转型快等优势,但是同时也面临抗风险能力差,资金周转困难的问题。
如何更好的助力小微企业的发展。当前主要存在两种方式:
一种方式,借助小微企业的熟人圈,由人工推荐识别潜在的需要贷款的小微企业。这种识别方式比较被动且识别的范围非常有限。
另一种方式,借助知识图谱技术,在小微企业的经营事实数据的基础上、通过梳理企业之间的关联关系,形成小微企业的知识图谱,通过分析小微企业的知识图谱,识别潜在的存在贷款需求的小微企业,这种方式,受小微企业数据量的限制、以及受设计人员知识储备的影响,导致识别潜在的贷款企业的准确性比较低。
发明内容
本发明提供一种潜在客户挖掘方法、装置及计算机可读存储介质,其主要目的在于提升识别潜在客户的准确率。
为实现上述目的,本发明提供的一种潜在客户挖掘方法,包括:
获取客户数据,根据所述客户数据,构建不同预设经营关系条件对应的知识图谱,得到多张客户知识图谱,其中,所述客户知识图谱包括客户节点,每个所述客户节点包含客户属性信息;
将所述多张客户知识图谱进行融合,得到融合知识图谱;
在所述融合知识图谱中,根据每个所述客户节点的客户属性信息,计算所述客户节点之间的差异度;
标注已发生预设业务的客户节点为参考节点,分别统计所述参考节点以及与所述参考节点相连的客户节点之间的最短路径;
根据所述最短路径、所述参考节点以及与所述参考节点相连的客户节点之间的差异度,计算每个客户节点的所述预设业务的发生概率值,根据所述预设业务的发生概率值确定潜在客户。
可选地,所述根据所述客户数据,构建不同预设经营关系条件对应的知识图谱,得到多张客户知识图谱,其中,所述客户知识图谱包括客户节点,每个所述客户节点包含客户属性信息,包括:
对所述客户数据进行数据标准化处理,得到标准化数据;
对所述标准化数据进行实体抽取得到实体数据,对所述标准化数据进行属性抽取得到属性数据;
利用预设关系条件、所述实体数据及所述属性数据,构建多个三元组,其中每个所述三元组包括客户节点及客户属性信息;
将所有所述三元组转换为图谱数据,得到所述不同预设条件对应的客户知识图谱。
可选地,所述对所述客户数据进行数据标准化处理,得到标准化数据,包括:
识别所述客户数据中的结构化数据,按照预设的数据格式标准,对所述结构化数据执行数据格式统一、数据补全及无效数据剔除的操作,得到第一标准化数据;
识别所述客户数据中的非结构化数据,将所述非结构化数据转换为文本信息;
对所述文本信息进行数据抽取,按照预设的数据格式标准,对抽取得到的文本数据进行转换,得到第二标准化数据;
汇总所述第一标准化数据及所述第二标准化数据为标准化数据。
可选地,所述将所述多张客户知识图谱进行融合,得到融合知识图谱,包括:
遍历所有所述客户知识图谱中的每个客户节点,对每个所述客户节点执行实体对齐及其对应的客户属性信息对齐的操作;
利用图数据库的节点添加功能,将对齐后的所有客户知识图谱进行合并,得到融合知识图谱。
可选地,所述在所述融合知识图谱中,根据每个所述客户节点的客户属性信息,计算所述客户节点之间的差异度,包括:
对每个所述客户节点的客户属性信息进行词向量转换;
将每个所述客户节点转换得到的词向量进行拼接,得到每个所述客户节点对应的数据向量;
计算每个所述客户节点的数据向量之间的距离值,将所述距离值作为每个所述客户节点之间的差异度。
可选地,所述计算每个所述客户节点的数据向量之间的距离值,包括:
随机从所述数据向量中选取K个数据向量,作为K个簇;
从未被选取的数据向量中任意选取一个数据向量作为目标数据向量,分别计算所述目标数据向量与K个簇之间的距离值。
可选地,所述根据所述最短路径、所述参考节点以及与所述参考节点相连的客户节点之间的差异度,计算每个客户节点的所述预设业务的发生概率值,根据所述预设业务的发生概率值确定潜在客户,包括:
根据所述最短路径、所述参考节点以及与所述参考节点相连的客户节点之间的差异度,利用预设概率公式计算得到每个客户节点的所述预设业务的发生概率值;
选择预设业务的发生概率值大于预设概率阈值对应的相连的客户节点为潜在客户。
为了解决上述问题,本发明还提供一种潜在客户挖掘装置,所述装置包括:
基础知识图谱构建模块,用于获取客户数据,根据所述客户数据,构建不同预设经营关系条件对应的知识图谱,得到多张客户知识图谱,其中,所述客户知识图谱包括客户节点,每个所述客户节点包含客户属性信息;
融合知识图谱构建模块,用于将所述多张客户知识图谱进行融合,得到融合知识图谱;
潜在客户挖掘条件生成模块,用于在所述融合知识图谱中,根据每个所述客户节点的客户属性信息,计算所述客户节点之间的差异度;标注已发生预设业务的客户节点为参考节点,分别统计所述参考节点以及与所述参考节点相连的客户节点之间的最短路径;
潜在客户识别模块,用于根据所述最短路径、所述参考节点以及与所述参考节点相连的客户节点之间的差异度,计算每个客户节点的所述预设业务的发生概率值,根据所述预设业务的发生概率值确定潜在客户。
为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
存储器,存储至少一个计算机程序;及
处理器,执行所述存储器中存储的程序以实现上述所述的潜在客户挖掘方法。
为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个计算机程序,所述至少一个计算机程序被电子设备中的处理器执行以实现上述所述的潜在客户挖掘方法。
本发明申请通过融合不同预设经营关系条件的客户知识图谱,得到更加全面的反映客户关联关系的融合知识图谱,在融合知识图谱的基础上,借助反映客户相似度的差异度,以及反映客户关联程度的最短路径,对与发生预设业务的参考节点相连的客户节点进行预设业务的发生概率值的计算,通过所述预设业务的发生概率值获取潜在客户,提升了识别潜在客户的准确率。
附图说明
图1为本发明一实施例提供的潜在客户挖掘方法的流程示意图;
图2为图1所示潜在客户挖掘方法中其中一个步骤的详细实施流程示意图;
图3为图1所示潜在客户挖掘方法中其中一个步骤的详细实施流程示意图;
图4为图1所示潜在客户挖掘方法中其中一个步骤的详细实施流程示意图;
图5为本发明一实施例提供的潜在客户挖掘装置的功能模块图;
图6为本发明一实施例提供的实现所述潜在客户挖掘方法的电子设备的结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本申请实施例提供一种潜在客户挖掘方法。所述潜在客户挖掘方法的执行主体包括但不限于服务端、终端等能够被配置为执行本申请实施例提供的该方法的电子设备中的至少一种。换言之,所述潜在客户挖掘方法可以由安装在终端设备或服务端设备的软件或硬件来执行,所述软件可以是区块链平台。所述服务端可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(ContentDelivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
参照图1所示,为本发明一实施例提供的潜在客户挖掘方法的流程示意图。在本实施例中,所述潜在客户挖掘方法包括:
S1、获取客户数据,根据所述客户数据,构建不同预设经营关系条件对应的知识图谱,得到多张客户知识图谱,其中,所述客户知识图谱包括客户节点,每个所述客户节点包含客户属性信息;
本发明申请中,所述客户主要包括企业或个人用户,本发明实施例以企业客户为例说明所述潜在客户挖掘方法。所述客户数据是指与企业经营相关的经营数据,例如,企业的营业额、纳税规模、企业的注册资金、企业的投资控股数据等。
详细地,本发明实施例中,可以通过预设的数据库接口或通过数据爬取技术获取不同数据来源的客户数据。
本发明实施例中,所述预设经营关系条件,包括但不限于投资关系、隶属关系、供应关系、交易关系、法人关系、担保关系等以客户为核心的能够直观立体的展现客户经营关联关系的条件。以小微企业为例,小微企业的数量庞大,企业之间的往来关系也相应的比较多样,单一的关系条件不能全面的掌握小微企业之间的关联关系,因此,本发明申请采用多个不同的预设关系构建多层客户知识图谱。
本发明实施例中,所述客户知识图谱是用图的形式表达客户之间的关联关系。所述客户知识图谱由客户节点、客户属性及客户关系组成,其中每个客户节点对应现实世界中真实存在的一个客户实体,通过客户关系将相应的两个客户节点相连,例如,客户A与客户B之间存在同一法人关系,则客户A与客户B之间存在一条相互连接的边,其中所述同一法人关系为所述客户A及所述客户B之间对应的客户关系。
本发明实施例种,所述客户属性包括但不限于客户所属行业、客户主营产品、客户注册资产、客户营业额、客户债务记录、客户发货地、客户所在城市、客户信用等信息。
详细地,参阅图2所示,所述S1,包括:
S11、对所述客户数据进行数据标准化处理,得到标准化数据;
S12、对所述标准化数据进行实体抽取得到实体数据,对所述标准化数据进行属性抽取得到属性数据;
S13、利用预设关系条件、所述实体数据及所述属性数据,构建多个三元组,其中每个所述三元组包括客户节点及客户属性信息;
S14、将所有所述三元组转换为图谱数据,得到所述不同预设条件对应的客户知识图谱。
本发明实施例中,可以从不同的数据源获取所述客户数据,例如,金融客户内部的数据库、网络上公开的数据,可以理解的是,不同数据来源的客户数据存在数据命名、数据类型、数据取值范围等信息不一致的情况,为了便于后续的操作,需要对不同数据来源的客户数据进行数据标准化处理。
详细地,参阅图3所示,所述S11,包括:
S111、识别所述客户数据中的结构化数据,按照预设的数据格式标准,对所述结构化数据执行数据格式统一、数据补全及无效数据剔除的操作,得到第一标准化数据;
S112、识别所述客户数据中的非结构化数据,将所述非结构化数据转换为文本信息;
S113、对所述文本信息进行数据抽取,按照预设的数据格式标准,对抽取得到的文本数据进行转换,得到第二标准化数据;
S114、汇总所述第一标准化数据及所述第二标准化数据为标准化数据。
本发明实施例中,通常客户内部的数据库存储的数据多为结构化的数据,数据以字段及数据表的形式存在,字段类型、字段取值范围有统一的规范,而网络上公开的数据通常是以网页的形式存在,属于非结构化数据,例如,图片、表格、文本或超连接等非结构化数据,进一步地,需要借助自然语言处理技术从非结构化数据中提取出结构化信息。
本发明实施例中,通过所述客户数据的标准化处理。可以使处理后的数据按照统一的数据格式进行存储和排列,方便后续操作。
本发明实施例中,将所述实体数据、预设关系条件、属性数据进行融合处理后得到多个三元组,根据所述三元组得到所述客户知识图谱。所述三元组为“实体+关系=实体”的信息表现形式,例如:客户A的母公司为客户B,用三元组表示为“客户A+隶属关系=客户B”。
本发明实施例中,根据客户的经营数据构建客户知识图谱,可直观地反映出所述客户知识图谱中多个客户实体之间的关联关系,提高了利用所述客户知识图谱进行贷款分析的效率。
S2、将所述多张客户知识图谱进行融合,得到融合知识图谱;
本发明实施例中,每个所述客户知识图谱是基于一种预设关系条件构建的,反映了单一关系条件对应的客户知识图谱,例如,反映客户间的隶属关系的知识图谱、反映客户间的供应关系的知识图谱。为了便于更系统、更全面的掌握客户之间的经营往来的关系,需要对多个所述客户知识图谱进行融合。
本发明实施例中,在所述融合知识图谱中,包含多种关系条件,每个客户节点存在与之直接相连的客户节点,也存在与之间接相连的客户节点,同时每个客户节点和直接相连的客户节点之间可能存在多条边,例如,客户A的母公司是客户C,客户C同时也是客户A的供应商,因此客户A与客户C之间存在两条直接相连的边,一条边代表隶属关系,另一条边代表供应关系。客户A的产品销售到客户B,而客户B的产品又销售到客户D,则客户A通过客户B与客户D间接相连,客户A到客户D的路径为两条边。
详细地,所述将所述多张客户知识图谱进行融合,得到融合知识图谱,包括:遍历所有所述客户知识图谱中的每个客户节点,对每个所述客户节点执行实体对齐及其对应的客户属性信息对齐的操作;利用图数据库的节点添加功能,将对齐后的所有客户知识图谱进行合并,得到融合知识图谱。
本发明实施例中,所述实体对齐、属性对齐操作包括数据补齐以及数据冲突消解两部分操作。可以理解的客户数据取自不同的数据源,虽然对不同数据来源的客户数据进行了标准化处理,客户数据符合同一的标准,但是由于数据来源不一致,不同数据来源的同一客户数据所携带的客户属性存在不同或冲突、客户实体名称不同等情况,例如,从税务网站获取的客户数据更多的涉及客户的营业额、交易数据等信息,从工商管理网站获取到的客户数据更多的涉及客户法人信息、客户诚信数据、客户违规记录等信息。
本发明实施例中,通过对客户知识图谱中的每个客户节点执行实体对齐及属性对齐操作,可以确保客户实体的唯一性,同时可以实现同一客户实体的客户属性信息相同,以便提升根据所述融合知识图谱进行相关知识计算的准确性及有效性。
本发明实施例中,通常知识图谱有两种存储方式,一种是基于RDF(ResourceDescription Framework,资源描述框架)的存储,一种是基于图数据库的存储,利用RDF存储数据,易于知识图谱的发布及共享。利用图数据库存储数据,则可以高效的进行知识图谱的查询和搜索。
本发明实施例中,较佳地,可以采用图数据库的方式,存储和展示所述融合知识图谱,这样可以统一查询入口,便于全面掌握客户信息,避免由于系统、数据孤立、信息不一致造成数据重复使用、信息不完整等问题。
S3、在所述融合知识图谱中,根据每个所述客户节点的客户属性信息,计算所述客户节点之间的差异度;
本发明实施例中,所述客户属性为多个词条数据,例如,客户规模、客户主营产品、客户纳税额等数据。可以理解的是,客户间的客户属性重叠程度越高,表明客户之间的经营状况也就越接近,例如,同一行业,同一销售产品,同等资金规模、销售金额接近的多家客户,在同一商业经营大环境下,可能会面临相同的资金周转问题。
详细地,参阅图4所示,所述S3,包括:
S31、对每个所述客户节点的客户属性信息进行词向量转换;
S32、将每个所述客户节点转换得到的词向量进行拼接,得到每个所述客户节点对应的数据向量;
S33、计算每个所述客户节点的数据向量之间的距离值,将所述距离值作为每个所述客户节点之间的差异度。
本发明实施例中,可以利用word2vec等词向量转换工具对每个所述客户节点的客户属性进行词向量转换。
本发明实施例中,可以利用如下计算公式,生成每个所述客户节点对应的数据向量:
其中senvec表示所述数据向量,m表示每个所述客户节点对应的客户属性个数,veci表示每个所述客户节点对应的词向量个数。
详细地,所述计算每个所述客户节点的数据向量之间的距离值,包括:随机从所述数据向量中选取K个数据向量,作为K个簇;从未被选取的数据向量中任意选取一个数据向量作为目标数据向量,分别计算所述目标数据向量与K个簇之间的距离值。
本发明实施例中,可以采用欧式距离公式计算所述目标数据向量与K个簇之间的距离值,所述欧式距离公式包括:
其中,d(x,y)2是指所述未被选取到的数据向量到K簇的距离,x为K簇,y为未被选取的数据向量,j是指未被选取的数据向量的个数。
本发明实施例中,每个所述客户节点的数据向量之间的距离值越大,相应的客户节点之间的差异度也就越大。
S4、标注已发生预设业务的客户节点为参考节点,分别统计所述参考节点以及与所述参考节点相连的客户节点之间的最短路径;
本发明实施例中,可以理解的是,在所述融合知识图谱中,客户节点之间因为关系条件相互连接,每个所述客户节点存在与其直接相连的客户节点,以及与其间接相连的客户节点,其中,每个所述客户节点与其直接相连的客户节点之间的最短路径为1,若两个客户节点之间的最短路径越小,表明两个客户之间的关联程度越高,当其中一个客户发生预设业务,例如,贷款业务时,相应的与之关联程度越高的客户,存在潜在贷款需求的可能性也就越高。
本发明实施例中,可以采用Floyd或Dijkstra等最短路径算法计算得到所述参考节点与其相连客户节点之间的最短路径。
S5、根据所述最短路径、所述参考节点以及与所述参考节点相连的客户节点之间的差异度,计算每个客户节点的所述预设业务的发生概率值,根据所述预设业务的发生概率值确定潜在客户。
本发明实施例中,可以理解的是,所述参考节点与每个所述的相连客户节点之间的差役度越小,最短路径越小,则表示两者之间的关联程度越高,对应的相连的客户节点的同一所述预设业务发生的概率值也就越高。
详细地,所述根据所述最短路径、所述参考节点以及与所述参考节点相连的客户节点之间的差异度,计算每个客户节点的所述预设业务的发生概率值,根据所述预设业务的发生概率值确定潜在客户,包括:根据所述最短路径、所述参考节点以及与所述参考节点相连的客户节点之间的差异度,利用预设概率公式计算得到每个与所述参考节点相连的客户节点的所述预设业务的发生概率值;选择预设业务的发生概率值大于预设概率阈值对应的所述相连客户节点为潜在客户。
本发明实施例中,所述预设概率公式包括:
其中,x表示所述参考节点,i表示与所述参考节点相连的第i个客户节点,p(x,i)表示所述第i个客户节点的预设业务的发生概率值,α、β分别为调参参数,根据实际调试结果设置取值,ri表示所述第i个客户节点与所述参考节点之间的最短路径,di表示所述第i个客户节点与所述参考节点之间的差异度。
本发明实施例通过融合不同预设经营关系条件的客户知识图谱,得到更加全面的反映客户关联关系的融合知识图谱,在融合知识图谱的基础上,借助反映客户相似度的差异度,以及反映客户关联程度的最短路径,对与发生预设业务的参考节点相连的客户节点进行预设业务的发生概率值的计算,通过所述预设业务的发生概率值获取潜在客户,提升了识别潜在客户的准确率。
如图5所示,是本发明一实施例提供的潜在客户挖掘装置的功能模块图。
本发明所述潜在客户挖掘装置100可以安装于电子设备中。根据实现的功能,所述潜在客户挖掘装置100可以包括基础知识图谱构建模块101、融合知识图谱构建模块102、潜在客户挖掘条件生成模块103及潜在客户识别模块104。本发明所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
在本实施例中,关于各模块/单元的功能如下:
所述基础知识图谱构建模块101,用于获取客户数据,根据所述客户数据,构建不同预设经营关系条件对应的知识图谱,得到多张客户知识图谱,其中,所述客户知识图谱包括客户节点,每个所述客户节点包含客户属性信息;
所述融合知识图谱构建模块102,用于将所述多张客户知识图谱进行融合,得到融合知识图谱;
所述潜在客户挖掘条件生成模块103,用于在所述融合知识图谱中,根据每个所述客户节点的客户属性信息,计算所述客户节点之间的差异度;标注已发生预设业务的客户节点为参考节点,分别统计所述参考节点以及与所述参考节点相连的客户节点之间的最短路径;
所述潜在客户识别模块104,用于根据所述最短路径、所述参考节点以及与所述参考节点相连的客户节点之间的差异度,计算每个客户节点的所述预设业务的发生概率值,根据所述预设业务的发生概率值确定潜在客户。
详细地,本发明实施例中所述潜在客户挖掘装置100中的各个模块在使用时采用与上述的图1至图4中所述的潜在客户挖掘方法一样的技术手段,并能够产生相同的技术效果,这里不再赘述。
如图6所示,是本发明一实施例提供的实现潜在客户挖掘方法的电子设备的结构示意图。
所述电子设备1可以包括处理器10、存储器11和总线,还可以包括存储在所述存储器11中并可在所述处理器10上运行的计算机程序,如潜在客户挖掘程序。
其中,所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。所述存储器11在一些实施例中可以是电子设备1的内部存储单元,例如该电子设备1的移动硬盘。所述存储器11在另一些实施例中也可以是电子设备1的外部存储设备,例如电子设备1上配备的插接式移动硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(SecureDigital,SD)卡、闪存卡(Flash Card)等。进一步地,所述存储器11还可以既包括电子设备1的内部存储单元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备1的应用软件及各类数据,例如潜在客户挖掘程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
所述处理器10在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器10是所述电子设备的控制核心(Control Unit),利用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器11内的程序或者模块(例如潜在客户挖掘程序等),以及调用存储在所述存储器11内的数据,以执行电子设备1的各种功能和处理数据。
所述总线可以是外设部件互连标准(peripheral component interconnect,简称PCI)总线或扩展工业标准结构(extended industry standard architecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。
图6仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图6示出的结构并不构成对所述电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
例如,尽管未示出,所述电子设备1还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器10逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备1还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
进一步地,所述电子设备1还可以包括网络接口,可选地,所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该电子设备1与其他电子设备之间建立通信连接。
可选地,该电子设备1还可以包括用户接口,用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
所述电子设备1中的所述存储器11存储的潜在客户挖掘程序是多个指令的组合,在所述处理器10中运行时,可以实现:
获取客户数据,根据所述客户数据,构建不同预设经营关系条件对应的知识图谱,得到多张客户知识图谱,其中,所述客户知识图谱包括客户节点,每个所述客户节点包含客户属性信息;
将所述多张客户知识图谱进行融合,得到融合知识图谱;
在所述融合知识图谱中,根据每个所述客户节点的客户属性信息,计算所述客户节点之间的差异度;
标注已发生预设业务的客户节点为参考节点,分别统计所述参考节点以及与所述参考节点相连的客户节点之间的最短路径;
根据所述最短路径、所述参考节点以及与所述参考节点相连的客户节点之间的差异度,计算每个客户节点的所述预设业务的发生概率值,根据所述预设业务的发生概率值确定潜在客户。
具体地,所述处理器10对上述指令的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。
进一步地,所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。所述计算机可读存储介质可以是易失性的,也可以是非易失性的。例如,所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)。
本发明还提供一种计算机可读存储介质,所述可读存储介质存储有计算机程序,所述计算机程序在被电子设备的处理器所执行时,可以实现:
获取客户数据,根据所述客户数据,构建不同预设经营关系条件对应的知识图谱,得到多张客户知识图谱,其中,所述客户知识图谱包括客户节点,每个所述客户节点包含客户属性信息;
将所述多张客户知识图谱进行融合,得到融合知识图谱;
在所述融合知识图谱中,根据每个所述客户节点的客户属性信息,计算所述客户节点之间的差异度;
标注已发生预设业务的客户节点为参考节点,分别统计所述参考节点以及与所述参考节点相连的客户节点之间的最短路径;
根据所述最短路径、所述参考节点以及与所述参考节点相连的客户节点之间的差异度,计算每个客户节点的所述预设业务的发生概率值,根据所述预设业务的发生概率值确定潜在客户。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
Claims (10)
1.一种潜在客户挖掘方法,其特征在于,所述方法包括:
获取客户数据,根据所述客户数据,构建不同预设经营关系条件对应的知识图谱,得到多张客户知识图谱,其中,所述客户知识图谱包括客户节点,每个所述客户节点包含客户属性信息;
将所述多张客户知识图谱进行融合,得到融合知识图谱;
在所述融合知识图谱中,根据每个所述客户节点的客户属性信息,计算所述客户节点之间的差异度;
标注已发生预设业务的客户节点为参考节点,分别统计所述参考节点以及与所述参考节点相连的客户节点之间的最短路径;
根据所述最短路径、所述参考节点以及与所述参考节点相连的客户节点之间的差异度,计算每个客户节点的所述预设业务的发生概率值,根据所述预设业务的发生概率值确定潜在客户。
2.如权利要求1所述的潜在客户挖掘方法,其特征在于,所述根据所述客户数据,构建不同预设经营关系条件对应的知识图谱,得到多张客户知识图谱,其中,所述客户知识图谱包括客户节点,每个所述客户节点包含客户属性信息,包括:
对所述客户数据进行数据标准化处理,得到标准化数据;
对所述标准化数据进行实体抽取得到实体数据,对所述标准化数据进行属性抽取得到属性数据;
利用预设关系条件、所述实体数据及所述属性数据,构建多个三元组,其中每个所述三元组包括客户节点及客户属性信息;
将所有所述三元组转换为图谱数据,得到所述不同预设条件对应的客户知识图谱。
3.如权利要求2所述的潜在客户挖掘方法,其特征在于,所述对所述客户数据进行数据标准化处理,得到标准化数据,包括:
识别所述客户数据中的结构化数据,按照预设的数据格式标准,对所述结构化数据执行数据格式统一、数据补全及无效数据剔除的操作,得到第一标准化数据;
识别所述客户数据中的非结构化数据,将所述非结构化数据转换为文本信息;
对所述文本信息进行数据抽取,按照预设的数据格式标准,对抽取得到的文本数据进行转换,得到第二标准化数据;
汇总所述第一标准化数据及所述第二标准化数据为标准化数据。
4.如权利要求1所述的潜在客户挖掘方法,其特征在于,所述将所述多张客户知识图谱进行融合,得到融合知识图谱,包括:
遍历所有所述客户知识图谱中的每个客户节点,对每个所述客户节点执行实体对齐及其对应的客户属性信息对齐的操作;
利用图数据库的节点添加功能,将对齐后的所有客户知识图谱进行合并,得到融合知识图谱。
5.如权利要求1所述的潜在客户挖掘方法,其特征在于,所述在所述融合知识图谱中,根据每个所述客户节点的客户属性信息,计算所述客户节点之间的差异度,包括:
对每个所述客户节点的客户属性信息进行词向量转换;
将每个所述客户节点转换得到的词向量进行拼接,得到每个所述客户节点对应的数据向量;
计算每个所述客户节点的数据向量之间的距离值,将所述距离值作为每个所述客户节点之间的差异度。
6.如权利要求5所述的潜在客户挖掘方法,其特征在于,所述计算每个所述客户节点的数据向量之间的距离值,包括:
随机从所述数据向量中选取K个数据向量,作为K个簇;
从未被选取的数据向量中任意选取一个数据向量作为目标数据向量,分别计算所述目标数据向量与K个簇之间的距离值。
7.如权利要求1所述的潜在客户挖掘方法,其特征在于,所述根据所述最短路径、所述参考节点以及与所述参考节点相连的客户节点之间的差异度,计算每个客户节点的所述预设业务的发生概率值,根据所述预设业务的发生概率值确定潜在客户,包括:
根据所述最短路径、所述参考节点以及与所述参考节点相连的客户节点之间的差异度,利用预设概率公式计算得到每个与所述参考节点相连的客户节点的所述预设业务的发生概率值;
选择预设业务的发生概率值大于预设概率阈值对应的相连的客户节点为潜在客户。
8.一种潜在客户挖掘装置,其特征在于,所述装置包括:
基础知识图谱构建模块,用于获取客户数据,根据所述客户数据,构建不同预设经营关系条件对应的知识图谱,得到多张客户知识图谱,其中,所述客户知识图谱包括客户节点,每个所述客户节点包含客户属性信息;
融合知识图谱构建模块,用于将所述多张客户知识图谱进行融合,得到融合知识图谱;
潜在客户挖掘条件生成模块,用于在所述融合知识图谱中,根据每个所述客户节点的客户属性信息,计算所述客户节点之间的差异度;标注已发生预设业务的客户节点为参考节点,分别统计所述参考节点以及与所述参考节点相连的客户节点之间的最短路径;
潜在客户识别模块,用于根据所述最短路径、所述参考节点以及与所述参考节点相连的客户节点之间的差异度,计算每个客户节点的所述预设业务的发生概率值,根据所述预设业务的发生概率值确定潜在客户。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至7中任意一项所述的潜在客户挖掘方法。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任意一项所述的潜在客户挖掘方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111261056.9A CN113946690A (zh) | 2021-10-28 | 2021-10-28 | 潜在客户挖掘方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111261056.9A CN113946690A (zh) | 2021-10-28 | 2021-10-28 | 潜在客户挖掘方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113946690A true CN113946690A (zh) | 2022-01-18 |
Family
ID=79336827
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111261056.9A Pending CN113946690A (zh) | 2021-10-28 | 2021-10-28 | 潜在客户挖掘方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113946690A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114612018A (zh) * | 2022-05-11 | 2022-06-10 | 中国南方电网有限责任公司 | 一种内控风险监测方法、系统和可读存储介质 |
CN115147161A (zh) * | 2022-07-20 | 2022-10-04 | 平安科技(深圳)有限公司 | 基于存量客户的行业指引方法、装置、电子设备及介质 |
CN115391414A (zh) * | 2022-10-28 | 2022-11-25 | 北京双赢天下管理咨询有限公司 | 一种基于大数据的银行市场拓展系统及方法 |
CN116188049A (zh) * | 2023-02-21 | 2023-05-30 | 广东八块钱网络科技有限公司 | 基于链式分析的潜在用户挖掘方法及装置 |
CN116453141A (zh) * | 2023-06-13 | 2023-07-18 | 平安银行股份有限公司 | 票据潜客的识别方法、装置和电子设备 |
CN116702899A (zh) * | 2023-08-07 | 2023-09-05 | 上海银行股份有限公司 | 一种适用于公私联动场景的实体融合方法 |
CN118469679A (zh) * | 2024-07-12 | 2024-08-09 | 暗物智能科技(广州)有限公司 | 一种金融产品推荐方法及装置 |
-
2021
- 2021-10-28 CN CN202111261056.9A patent/CN113946690A/zh active Pending
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114612018A (zh) * | 2022-05-11 | 2022-06-10 | 中国南方电网有限责任公司 | 一种内控风险监测方法、系统和可读存储介质 |
CN115147161A (zh) * | 2022-07-20 | 2022-10-04 | 平安科技(深圳)有限公司 | 基于存量客户的行业指引方法、装置、电子设备及介质 |
CN115391414A (zh) * | 2022-10-28 | 2022-11-25 | 北京双赢天下管理咨询有限公司 | 一种基于大数据的银行市场拓展系统及方法 |
CN116188049A (zh) * | 2023-02-21 | 2023-05-30 | 广东八块钱网络科技有限公司 | 基于链式分析的潜在用户挖掘方法及装置 |
CN116188049B (zh) * | 2023-02-21 | 2023-09-29 | 广东八块钱网络科技有限公司 | 基于链式分析的潜在用户挖掘方法及装置 |
CN116453141A (zh) * | 2023-06-13 | 2023-07-18 | 平安银行股份有限公司 | 票据潜客的识别方法、装置和电子设备 |
CN116453141B (zh) * | 2023-06-13 | 2023-10-13 | 平安银行股份有限公司 | 票据潜客的识别方法、装置和电子设备 |
CN116702899A (zh) * | 2023-08-07 | 2023-09-05 | 上海银行股份有限公司 | 一种适用于公私联动场景的实体融合方法 |
CN116702899B (zh) * | 2023-08-07 | 2023-11-28 | 上海银行股份有限公司 | 一种适用于公私联动场景的实体融合方法 |
CN118469679A (zh) * | 2024-07-12 | 2024-08-09 | 暗物智能科技(广州)有限公司 | 一种金融产品推荐方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113946690A (zh) | 潜在客户挖掘方法、装置、电子设备及存储介质 | |
CN114663198A (zh) | 基于用户画像的产品推荐方法、装置、设备及存储介质 | |
CN112364107A (zh) | 系统分析可视化方法、装置、电子设备及计算机可读存储介质 | |
CN115002200A (zh) | 基于用户画像的消息推送方法、装置、设备及存储介质 | |
CN114997263B (zh) | 基于机器学习的结训率分析方法、装置、设备及存储介质 | |
CN115081538A (zh) | 基于机器学习的客户关系识别方法、装置、设备及介质 | |
CN112528616A (zh) | 业务表单生成方法、装置、电子设备及计算机存储介质 | |
CN114781832A (zh) | 课程推荐方法、装置、电子设备及存储介质 | |
CN114881616A (zh) | 业务流程执行方法、装置、电子设备及存储介质 | |
WO2023272862A1 (zh) | 基于网络行为数据的风控识别方法、装置、电子设备及介质 | |
CN114386509A (zh) | 数据融合方法、装置、电子设备及存储介质 | |
CN114612194A (zh) | 产品推荐方法、装置、电子设备及存储介质 | |
CN114519084A (zh) | 基于区块链的医疗数据检查方法、装置、设备及介质 | |
CN114547696A (zh) | 文件脱敏方法、装置、电子设备及存储介质 | |
CN113434542A (zh) | 数据关系识别方法、装置、电子设备及存储介质 | |
CN116823141A (zh) | 付款数据处理方法、装置、设备及介质 | |
CN115238179A (zh) | 项目推送方法、装置、电子设备及计算机可读存储介质 | |
CN114840388A (zh) | 数据监控方法、装置、电子设备及存储介质 | |
CN114518993A (zh) | 基于业务特征的系统性能监控方法、装置、设备及介质 | |
CN114708073A (zh) | 一种围标串标智能检测方法、装置、电子设备及存储介质 | |
CN113157890A (zh) | 智能问答方法、装置、电子设备及可读存储介质 | |
CN114036174B (zh) | 数据更新方法、装置、设备及存储介质 | |
CN114912818B (zh) | 资产指标分析方法、装置、设备及存储介质 | |
CN112966013B (zh) | 知识展示方法、装置、设备及可读存储介质 | |
CN115221286A (zh) | 产品推荐辅助方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |