CN114820001A - 一种目标客户筛选方法、装置、设备及介质 - Google Patents
一种目标客户筛选方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN114820001A CN114820001A CN202210593136.2A CN202210593136A CN114820001A CN 114820001 A CN114820001 A CN 114820001A CN 202210593136 A CN202210593136 A CN 202210593136A CN 114820001 A CN114820001 A CN 114820001A
- Authority
- CN
- China
- Prior art keywords
- node
- target
- graph
- client
- customer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 62
- 238000012216 screening Methods 0.000 title claims abstract description 27
- 238000003062 neural network model Methods 0.000 claims abstract description 113
- 238000007477 logistic regression Methods 0.000 claims abstract description 75
- 238000012545 processing Methods 0.000 claims abstract description 23
- 239000013598 vector Substances 0.000 claims description 278
- 238000004590 computer program Methods 0.000 claims description 25
- 238000012549 training Methods 0.000 claims description 22
- 238000004422 calculation algorithm Methods 0.000 claims description 12
- 238000010276 construction Methods 0.000 claims description 8
- 238000005516 engineering process Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 20
- 238000004891 communication Methods 0.000 description 9
- 238000012546 transfer Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000013500 data storage Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/01—Customer relationship services
- G06Q30/015—Providing customer assistance, e.g. assisting a customer within a business location or via helpdesk
- G06Q30/016—After-sales
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Finance (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Animal Behavior & Ethology (AREA)
- Databases & Information Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及数据处理技术领域,尤其涉及一种目标客户筛选方法、装置、设备及介质。用以解决现有技术中从已有客户中识别目标客户时效率低,且不准确的问题。该方法中服务器根据已保存的每个客户的每个交易数据,构建知识图谱,并在知识图谱中标记出待识别客户对应的目标节点,服务器基于该知识图谱,识别该待识别客户是否为目标客户。由于服务器在确定待识别客户是否为目标客户时基于交易数据,也就是在识别待识别客户是否为目标客户时使用的数据范围更广更全面,并且在本申请实施例中基于图神经网络模型和逻辑回归模型,识别待识别客户是否为目标客户,不依赖专家经验,提高了目标客户识别的效率和准确率。
Description
技术领域
本申请涉及数据处理技术领域,尤其涉及一种目标客户筛选方法、装置、设备及介质。
背景技术
在现有技术中,可以对目标客户的行为进行分析与预测,以及对目标客户进行分类,进而确定目标客户的可拉伸的资产空间及预测企业的可经营路径。并且,可以根据对目标客户的分析结果,有针对性、有方向的投放更多经营资源,开展个性化服务,提高客户的满意度,进而提升企业的经营水平。
但是,针对企业海量的已有客户,现有技术中还没有一个有效可行的方法从海量的已有客户中定位出潜在的被企业需要的目标客户。现有技术在确定已有客户中的目标客户时,主要基于专家经验制定业务规则,依赖业务人员个体的经验来确定,这种确定目标客户的方法导致确定目标客户的效率低,且不准确。
发明内容
本申请提供了一种目标客户筛选方法、装置、设备及介质,用以解决现有技术中从已有客户中识别目标客户时效率低,且不准确的问题。
本申请实施例提供了一种目标客户筛选方法,所述方法包括:
获取每个客户的每个交易数据,并根据所述每个客户的每个交易数据构建知识图谱,其中,所述知识图谱中包含客户对应的第一节点和交易对象对应的第二节点,存在交易关系的客户对应的第一节点与交易对象对应的第二节点之间连接;
根据携带有待识别客户对应的目标节点的知识图谱及预先训练完成的图神经网络模型,确定所述目标节点对应的目标特征向量;
将所述目标特征向量输入到预先训练完成的逻辑回归模型中,获取所述逻辑回归模型输出的所述目标节点对应的待识别客户是否为目标客户的判断结果。
进一步地,所述根据所述每个客户的每个交易数据构建知识图谱包括:
针对每个交易数据,确定该交易数据对应的客户和交易对象;若当前知识图谱中不存在所述客户对应的第一节点或不存在所述交易对象对应的第二节点,则在所述知识图谱中创建所述客户对应的第一节点或所述交易对象对应第二节点,并连接所述第一节点和第二节点;
接收输入的每个节点对应的每个权重,并将该每个权重保存到对应的节点中。
进一步地,若所述交易对象为非客户,确定当前知识图谱中不存在所述交易对象对应的第二节点包括:
根据预先配置的交易对象类别,确定所述交易对象对应的目标交易对象类别;
若当前知识图谱中不存在所述目标交易对象类别对应的节点,则确定不存在所述交易对象对应的第二节点;
所述在所述知识图谱中创建所述交易对象对应第二节点包括:
创建所述目标交易对象类别对应的节点,将创建的所述节点作为所述交易对象对应的第二节点。
进一步地,所述根据携带有待识别客户对应的目标节点的知识图谱及预先训练完成的图神经网络模型,确定所述目标节点对应的目标特征向量包括:
将所述携带有待识别客户对应的目标节点的知识图谱输入到所述图神经网络模型中;
所述图神经网络模型为所述知识图谱中的每个节点随机分配对应的特征向量;确定所述知识图谱中与所述目标节点直接或间接连接的预设数量个目标候选节点;针对每个目标候选节点,从该目标候选节点中获取该目标候选节点对应的权重;根据所述目标节点对应的特征向量、每个目标候选节点对应的每个权重及特征向量,对目标节点对应的目标特征向量进行更新。
进一步地,所述确定与所述目标节点直接或间接连接的预设数量个目标候选节点包括:
确定所述知识图谱中与该目标节点直接连接,以及与所述目标节点通过一个节点间接连接的每个候选节点;
采用随机算法从所述候选节点中选择所述预设数量个目标候选节点。
进一步地,所述根据所述目标节点对应的特征向量、每个目标候选节点对应的每个权重及特征向量,对目标节点对应的目标特征向量进行更新包括:
根据所述知识图谱中携带的每个节点对应的权重,确定每个目标候选节点对应的每个权重;
确定每个目标候选节点的特征向量与对应的权重的每个乘积;
将所述每个乘积与所述目标节点对应的目标特征向量的和向量确定为更新后的目标特征向量。
进一步地,所述逻辑回归模型的训练过程包括:
获取保存的样本特征向量集,其中所述样本特征向量集中包含多个样本特征向量,并且所述样本特征向量集中保存有每个样本特征向量对应的客户是否为目标客户的标识信息;
将所述样本特征向量集中的每个样本特征向量输入到待训练的逻辑回归模型中,获取所述逻辑回归模型输出的每个样本特征向量对应的客户是否为目标客户的预测结果;
针对每个样本特征向量,根据该样本特征向量中携带的该样本特征向量对应的客户是否为目标客户的标识信息,以及所述逻辑回归模型输出的该样本特征向量对应的预测结果,对所述逻辑回归模型的参数进行调整。
进一步地,所述图神经网络模型的训练过程包括:
获取保存的每个样本知识图谱;
将所述每个样本知识图谱输入到待训练的图神经网络模型中,获取该图神经网络模型输出的每个客户对应的样本节点的每个样本目标特征向量;
根据所述每个样本目标特征向量对所述待训练的图神经网络模型进行优化。
本申请实施例还提供了一种目标客户筛选装置,所述装置包括:
知识图谱构建模块,用于获取每个客户的每个交易数据,并根据所述每个客户的每个交易数据构建知识图谱,其中,所述知识图谱中包含客户对应的第一节点和交易对象对应的第二节点,存在交易关系的客户对应的第一节点与交易对象对应的第二节点之间连接;
处理模块,用于根据携带有待识别客户对应的目标节点的知识图谱及预先训练完成的图神经网络模型,确定所述目标节点对应的目标特征向量;
识别模块,用于将所述目标特征向量输入到预先训练完成的逻辑回归模型中,获取所述逻辑回归模型输出的所述目标节点对应的待识别客户是否为目标客户的判断结果。
进一步地,所述知识图谱构建模块,具体用于针对每个交易数据,确定该交易数据对应的客户和交易对象;若当前知识图谱中不存在所述客户对应的第一节点或不存在所述交易对象对应的第二节点,则在所述知识图谱中创建所述客户对应的第一节点或所述交易对象对应第二节点,并连接所述第一节点和第二节点;接收输入的每个节点对应的每个权重,并将该每个权重保存到对应的节点中。
进一步地,所述知识图谱构建模块,具体用于若所述交易对象为非客户,则根据预先配置的交易对象类别,确定所述交易对象对应的目标交易对象类别;若当前知识图谱中不存在所述目标交易对象类别对应的节点,则确定不存在所述交易对象对应的第二节点;创建所述目标交易对象类别对应的节点,将创建的所述节点作为所述交易对象对应的第二节点。
进一步地,所述处理模块,具体用于将所述携带有待识别客户对应的目标节点的知识图谱输入到所述图神经网络模型中;所述图神经网络模型为所述知识图谱中的每个节点随机分配对应的特征向量;确定所述知识图谱中与所述目标节点直接或间接连接的预设数量个目标候选节点;针对每个目标候选节点,从该目标候选节点中获取该目标候选节点对应的权重;根据所述目标节点对应的特征向量、每个目标候选节点对应的每个权重及特征向量,对目标节点对应的目标特征向量进行更新。
进一步地,所述处理模块,具体用于确定所述知识图谱中与该目标节点直接连接,以及与所述目标节点通过一个节点间接连接的每个候选节点;采用随机算法从所述候选节点中选择所述预设数量个目标候选节点。
进一步地,所述处理模块,具体用于根据所述知识图谱中携带的每个节点对应的权重,确定每个目标候选节点对应的每个权重;确定每个目标候选节点的特征向量与对应的权重的每个乘积;将所述每个乘积与所述目标节点对应的目标特征向量的和向量确定为更新后的目标特征向量。
进一步地,所述装置还包括:
第一训练模块,用于获取保存的样本特征向量集,其中所述样本特征向量集中包含多个样本特征向量,并且所述样本特征向量集中保存有每个样本特征向量对应的客户是否为目标客户的标识信息;将所述样本特征向量集中的每个样本特征向量输入到待训练的逻辑回归模型中,获取所述逻辑回归模型输出的每个样本特征向量对应的客户是否为目标客户的预测结果;针对每个样本特征向量,根据该样本特征向量中携带的该样本特征向量对应的客户是否为目标客户的标识信息,以及所述逻辑回归模型输出的该样本特征向量对应的预测结果,对所述逻辑回归模型的参数进行调整。
进一步地,所述装置还包括:
第二训练模块,用于获取保存的每个样本知识图谱;将所述每个样本知识图谱输入到待训练的图神经网络模型中,获取该图神经网络模型输出的每个客户对应的样本节点的每个样本目标特征向量;根据所述每个样本目标特征向量对所述待训练的图神经网络模型进行优化。
本申请实施例还提供了一种电子设备,所述电子设备包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如上述任一所述目标客户筛选方法的步骤。
本申请实施例还提供了一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时实现如上述中任一所述目标客户筛选方法的步骤。
本申请实施例还提供了一种计算机程序产品,所述计算机程序产品包括:计算机程序代码,当所述计算机程序代码在计算机上运行时,使得计算机执行上述如上述中任一所述目标客户筛选方法的步骤。
在本申请实施例中,获取每个客户的每个交易数据,并根据该每个客户的每个交易数据构建知识图谱,其中,该知识图谱中包含客户对应的第一节点和交易对象对应的第二节点,存在交易关系的客户对应的第一节点与交易对象对应的第二节点之间连接,根据携带有待识别客户对应的目标节点的知识图谱及预先训练完成的图神经网络模型,确定该目标节点对应的目标特征向量,将该目标特征向量输入到预先训练完成的逻辑回归模型中,获取该逻辑回归模型输出的该目标节点对应的客户是否为目标客户的判断结果。即在本申请实施例中,服务器根据已保存的每个客户的每个交易数据,构建知识图谱,并基于该知识图谱,识别待识别客户是否为目标客户。基于此,本申请实施例,在确定待识别客户是否为目标客户时,可以根据每个交易数据进行识别,也就是在识别待识别客户是否为目标客户时使用的数据范围更广更全面,并且在本申请实施例中还通过图神经网络模型和逻辑回归模型,识别待识别客户是否为目标客户,不依赖专家经验,提高了目标客户筛选的效率和准确率。
附图说明
为了更清楚地说明本申请的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种目标客户筛选过程示意图;
图2为本申请实施例的知识图谱的构建示意图;
图3为本申请实施例提供的在知识图谱中判断是否存在交易对象对应的第二节点的过程示意图;
图4为本申请实施例提供的图神经网络模型确定目标节点对应的目标特征向量的过程示意图;
图5为本申请实施例提供的一种风险数据存储装置结构示意图;
图6为本申请实施例提供的一种电子设备结构示意图。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
为了确定已有客户中的目标客户,提高目标客户筛选过程的准确率和效率,本申请实施例提供了一种目标客户筛选方法、装置、设备及介质。
在本申请实施例中,获取每个客户的每个交易数据,并根据该每个客户的每个交易数据构建知识图谱,其中,该知识图谱中包含客户对应的第一节点和交易对象对应的第二节点,存在交易关系的客户对应的第一节点与交易对象对应的第二节点之间连接,根据携带有待识别客户对应的目标节点的知识图谱及预先训练完成的图神经网络模型,确定该目标节点对应的目标特征向量,将该目标特征向量输入到预先训练完成的逻辑回归模型中,获取该逻辑回归模型输出的该目标节点对应的客户是否为目标客户的判断结果。
本申请各技术方案中对数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。
实施例1:
图1为本申请实施例提供的一种目标客户筛选过程示意图,该过程包括:
S101:获取每个客户的每个交易数据,并根据所述每个客户的每个交易数据构建知识图谱,其中,所述知识图谱中包含客户对应的第一节点和交易对象对应的第二节点,存在交易关系的客户对应的第一节点与交易对象对应的第二节点之间连接。
本申请实施例提供的一种目标客户筛选方法应用于服务器。
在本申请实施例中,服务器从本地的数据库中,以及与该服务器进行通信的其他服务器的数据库中,获取每个客户的每个交易数据,其中该交易数据可以是客户购买金融产品的数据、或者是客户的转账记录的数据等等。
服务器在获取到每个客户的每个交易数据之后,该服务器可以基于该每个客户的每个交易数据构建知识图谱,使得构建完成的知识图谱可以准确的体现出每个客户的交易情况。
其中,该知识图谱中包含客户对应的第一节点以及交易对象对应的第二节点,并且存在交易关系的客户对应的第一节点与交易对象对应的第二节点之间通过边连接。
具体的,在本申请实施例中,针对每个交易数据,服务器识别该交易数据中的客户和交易对象,其中该交易对象是交易数据中记载的与客户有关联的对象。例如,若该交易数据为客户购买金融产品的数据,则该交易对象为已购买的金融产品;若该交易数据为客户的转账记录,则该交易对象为接收转账的客户等。该服务器识别到该交易数据中的客户和交易对象之后,在已有的知识图谱中查找该客户对应的第一节点和该交易对象对应的第二节点。若该知识图谱中存在该第一节点也存在该第二节点,并且该第一节点和第二节点连接,则针对该交易数据的处理过程结束,获取下一交易数据继续进行判断,若第一节点和第二节点未连接,则连接该第一节点和第二节点。若该知识图谱中不存在该第一节点,但是存在第二节点,则在该知识图谱中创建第一节点,并连接该第一节点和第二节点;若该知识图谱中存在第一节点,但是不存在第二节点,则在该知识图谱中创建第二节点,并连接该第一节点和第二节点;若该知识图谱中既不存在第一节点,也不存在第二节点,则在该知识图谱中创建第一节点和第二节点,并连接该第一节点和第二节点。
其中,在本申请实施例中,针对每个交易数据,在知识图谱中连接了该交易数据中的客户对应的第一节点和交易对象对应的第二节点之后,服务器还可以将该交易数据中的具体内容保存到该客户对应的第一节点中。例如,若该交易数据为转账记录,则服务器可以将转账金额、转账时间和该交易对象对应保存到该第一节点中;若该交易数据为购买金融产品,则服务器可以将购买时间、产品金额和该交易对象保存到该第一节点中。
S102:根据携带有待识别客户对应的目标节点的知识图谱及预先训练完成的图神经网络模型,确定所述目标节点对应的目标特征向量。
具体的,当技术人员有识别客户是否为目标客户的需求时,可以在服务器中保存的知识图谱中标识出待识别客户对应的目标节点。服务器将该携带有待识别客户对应的目标节点的知识图谱输入到预先训练完成的图神经网络模型中。该图神经网络模型接收到知识图谱后,该图神经网络模型针对待识别客户对应的目标节点,可以根据与该目标节点存在关联关系的其他节点,确定并输出该目标节点对应的目标特征向量。
S103:将所述目标特征向量输入到预先训练完成的逻辑回归模型中,获取所述逻辑回归模型输出的所述目标节点对应的待识别客户是否为目标客户的判断结果。
在本申请实施例中,服务器在获取到目标节点对应的目标特征向量之后,该服务器会根据该目标特征向量,识别该目标节点对应的待识别客户是否为目标客户。
具体的,在本申请实施例中,服务器将该目标特征向量输入到训练完成的逻辑回归模型中,并获取该逻辑回归模型输出的该目标节点对应的待识别客户是否为目标客户的判断结果。
其中,在本申请实施例中,该逻辑回归模型输出的判断结果为该待识别客户是否为目标客户的标识信息,服务器中保存有每个标识信息代表的含义,使得该服务器可以根据逻辑回归模型输出的标识信息确定该待识别客户是否为目标客户。例如,若逻辑回归模型确定该待识别客户为目标客户,则逻辑回归模型输出的判断结果为1;若该逻辑回归模型确定该待识别客户不是目标客户,则该逻辑回归模型输出的判断结果为0。
在本申请实施例中,服务器根据已保存的每个客户的每个交易数据,构建知识图谱,并基于该知识图谱,识别待识别客户是否为目标客户。基于此,本申请实施例,在确定待识别客户是否为目标客户时,可以根据每个交易数据进行识别,也就是在识别待识别客户是否为目标客户时使用的数据范围更广更全面,并且还通过图神经网络模型和逻辑回归模型,识别待识别客户是否为目标客户,不依赖专家经验,提高了识别目标客户的效率和准确率。
实施例2:
为了基于每个客户的每个交易数据,构建全面的知识图谱,使得在确定待识别客户是否为目标客户时使用的数据范围更广更全面,在上述实施例的基础上,在本申请实施例中,所述根据所述每个客户的每个交易数据构建知识图谱包括:
针对每个交易数据,确定该交易数据对应的客户和交易对象;若当前知识图谱中不存在所述客户对应的第一节点或不存在所述交易对象对应的第二节点,则在所述知识图谱中创建所述客户对应的第一节点或所述交易对象对应第二节点,并连接所述第一节点和第二节点;
接收输入的每个节点对应的每个权重,并将该每个权重保存到对应的节点中。
在本申请实施例中,服务器在基于每个客户的每个交易数据构建知识图谱时,针对每个交易数据,该服务器确定该交易数据对应的客户和交易对象,并在知识图谱中查找该客户对应的第一节点和该交易对象对应的第二节点。
例如,若该服务器确定知识图谱中不存在该第一节点,但是存在第二节点,则在该知识图谱中创建第一节点,并连接该第一节点和第二节点;若该服务器确定该知识图谱中存在第一节点,但是不存在第二节点,则在该知识图谱中创建第二节点,并连接该第一节点和第二节点;若该服务器确定该知识图谱中既不存在第一节点,也不存在第二节点,则该知识图谱中创建第一节点和第二节点,并连接该第一节点和第二节点。
此外,在本申请实施例中,服务器在构建知识图谱的过程中,技术人员还会向服务器输入每个节点对应的每个权重,使得后续在基于知识图谱确定待识别客户对应的目标特征向量时,可以基于每个节点对应的每个权重进行确定,提高确定目标客户的识别结果的准确度。服务器接收到输入的每个节点对应的每个权重之后,将该每个权重保存到对应的节点中。
其中,在本申请实施例中,技术人员在确定每个节点的每个权重时,可以知道每个客户是否为目标客户。针对已知是目标客户的客户对应的节点,在确定该节点对应的权重时,将该节点的权重设置的大一些。针对已知不是目标客户的客户对应的节点,在确定该节点对应的权重时,可以将该节点的权重设置的小一些。此外,若该节点为交易对象对应的节点,且该交易对象非客户,则技术人员可以根据该交易对象的类型为该节点分配权重。例如,若该交易对象对应的交易类型为大保额保险,则将该交易对象对应的权重值设置的大一点,若该交易对象对应的交易类型为借贷产品,则将该交易对象对应的权重设置的小一点。
图2为本申请实施例的知识图谱的构建示意图,如该图2所示,该过程包括:
S201:针对每个交易数据,确定该交易数据对应的客户和交易对象。
S202:在当前知识图谱中查找该客户对应的第一节点和该交易对象对应的第二节点;若不存在第一节点,但存在第二节点,则执行S203;若存在第一节点,但不存在第二节点,则执行S204;若第一节点和第二节点都不存在,则执行S205。
S203:在知识图谱中创建第一节点,并执行S206。
S204:在知识图谱中创建第二节点,并执行S206。
S205:在知识图谱中创建第一节点和第二节点,并执行S206。
S206:连接该第一节点和第二节点。
实施例3:
为了基于每个客户的每个交易数据,构建全面的知识图谱,使得在确定待识别客户是否为目标客户时使用的数据范围更广更全面,在上述各实施例的基础上,在本申请实施例中,若所述交易对象为非客户,确定当前知识图谱中不存在所述交易对象对应的第二节点包括:
根据预先配置的交易对象类别,确定所述产品对应的目标交易对象类别;
若当前知识图谱中不存在所述目标交易对象类别对应的节点,则确定不存在所述交易对象对应的第二节点;
所述在所述知识图谱中创建所述交易对象对应第二节点包括:
创建所述目标交易对象类型对应的节点,将创建的所述节点作为所述交易对象对应的第二节点。
在本申请实施例中,在基于每个交易数据构建知识图谱时,由于交易数据的数量较多,并且每个交易数据对应的交易对象也各不相同,若是针对每个交易对象都在知识图谱中创建该交易对象对应的第二节点,则最后得到的知识图谱中的节点数量过多,导致最终得到的知识图谱过于复杂。并且后续服务器在基于知识图谱识别待识别客户是否为目标客户时,工作量较大,增加了服务器的负载压力。
基于此,在本申请实施例中,在构建知识图谱时,会对非客户的交易对象进行分类,所属类别相同的交易对象在该知识图谱中共用一个第二节点,大大减少了知识图谱中的节点数量。
具体的,在本申请实施例中,针对每个交易数据,服务器确定该交易数据对应的客户和交易对象,并确定该交易对象是否为客户。若服务器确定该交易对象为非客户,则该服务器根据预先配置的交易对象类别,确定该交易对象对应的目标交易对象类别,并在当前知识图谱中查找该目标交易对象类别对应的节点。若该服务器未在当前知识图谱上查找到该目标交易对象类别对应的节点,则确定当前知识图谱中不存在该交易对象对应的第二节点。服务器在当前知识图谱中创建该目标交易对象类别对应的节点,并将创建的该节点确定为该交易对象对应的第二节点。
其中,在本申请实施例中,在确定交易对象对应的交易对象类别时,先识别该交易对象的具体内容,即服务器识别该交易对象是客户还是非客户,再根据识别到的具体内容对该交易对象进行分类。其中,在本申请实施例,识别该交易对象的具体内容的过程为现有技术,在此不再进行赘述。例如,若交易对象为非客户,则该交易对象可能为金融产品、金融咨询、消费门店等等。其中,若交易对象为金融产品,则服务器根据产品类型、产品金额和产品风险等对该交易对象进行分类,如服务器将产品类型为债券,产品金额大于预设产品金额且产品风险低的交易对象分为一类;若交易对象为金融咨询,则服务器根据资讯领域类型、资讯时效性、资讯情绪度、资讯长度、资讯产品类型、资讯产品风险和资讯产品金额等对交易对象进行分类,如服务器将资讯领域类型为申请新卡,资讯时效性为一天、资讯长度为十句话以内、资讯产品类型为信用卡、资讯产品风险为低、以及资讯产品金额高于预设资讯产品金额的交易对象分为一类;若交易对象为消费门店,则服务器根据消费金额大小、消费类型、消费区域等对交易对象进行分类,如服务器将消费金额超过预设消费金额、消费类型为线下支付、消费区域为预设消费区域的交易对象分为一类。
此外,在本申请实施例中,针对每个交易数据,对该交易数据中客户对应的第一节点和交易对象对应的第二节点在进行连接时,针对连接该第一节点和第二节点的边可以保存该第一节点与第二节点的关系,如转账、购买、浏览、分享、关注等。并且,该客户对应的第一节点中,还可以保存客户的基础数据、资产等级、负债水平、消费偏好、金融产品偏好等。
图3为本申请实施例提供的在知识图谱中判断是否存在交易对象对应的第二节点的过程示意图,如该图3所示,该过程包括:
S301:根据预先配置的交易对象类别,确定该产品对应的目标交易对象类别。
S302:判断当前知识图谱中是否存在该目标交易对象类别对应的节点,若是,则执行S303,若否,则执行S304。
S303:将该目标交易对象类别对应的节点确定为该交易对象对应的第二节点。
S304:在知识图谱中创建该目标交易对象类别对应的节点。
S305:将创建的该节点作为该交易对象对应的第二节点。
实施例4:
为了确定待识别客户对应的目标节点的目标特征向量,使得服务器可以基于该目标特征向量准确地判断该待识别客户是否为目标客户,在上述各实施例的基础上,在本申请实施例中,所述根据携带有待识别客户对应的目标节点的知识图谱及预先训练完成的图神经网络模型,确定所述目标节点对应的目标特征向量包括:
将所述携带有待识别客户对应的目标节点的知识图谱输入到所述图神经网络模型中;
所述图神经网络模型为所述知识图谱中的每个节点随机分配对应的特征向量;确定所述知识图谱中与所述目标节点直接或间接连接的预设数量个目标候选节点;针对每个目标候选节点,从该目标候选节点中获取该目标候选节点对应的权重;根据所述目标节点对应的特征向量、每个目标候选节点对应的每个权重及特征向量,对目标节点对应的目标特征向量进行更新。
在本申请实施例中,服务器将携带有待识别客户对应的目标节点的知识图谱输入到训练完成的图神经网络模型中,由该图神经网络模型确定并输出该目标节点对应的目标特征向量。
具体的,图神经网络模型接收到输入的知识图谱后,该图神经网络模型为该知识图谱中的每个节点随机分配对应的特征向量。其中,在本申请实施例中,每个节点对应的特征向量为图神经网络模型随机生成的,并且每个节点对应的特征向量的维度相同。
需要说明的是,图神经网络模型在为知识图谱中的每个节点随机分配对应的特征向量时,该图神经网络模型也会为该目标节点随机分配特征向量,在本申请实施例中,将该目标节点对应的特征向量称为目标特征向量。但是,由于此时的目标特征向量是图神经网络模型随机分配的,该目标特征向量中并没有携带有该目标节点对应的待识别客户的交易数据,所以该目标特征向量不能直接用于判断待识别客户是否为目标客户。因此,在本申请实施例中,图神经网络模型需要对该目标节点对应的目标特征向量进行更新。
具体的,在本申请实施例中,图神经网络模型在为目标节点随机分配目标特征向量之后,该图神经网络模型确定该知识图谱中与该目标节点直接或间接连接的预设数量个目标候选节点,并根据该每个目标候选节点对应的特征向量及该目标特征向量,对该目标节点对应的目标特征向量进行更新。
在本申请实施例中,知识图谱的每个节点中还保存有每个节点对应的每个权重。图神经网络模型在基于每个目标候选节点对应的特征向量,对目标节点对应的目标特征向量进行更新时,可以根据该目标节点对应的目标特征向量、每个目标候选节点对应的每个权重及特征向量,对该目标节点对应的目标特征向量进行更新。
为了确定目标候选节点,并基于该目标候选节点对应的特征向量对目标节点的目标特征向量进行更新,使得服务器可以基于该目标特征向量准确地判断该待识别客户是否为目标客户,在上述各实施例的基础上,在本申请实施例中,所述确定与所述目标节点直接或间接连接的预设数量个目标候选节点包括:
确定所述知识图谱中与该目标节点直接连接,以及与所述目标节点通过一个节点间接连接的每个候选节点;
采用随机算法从所述候选节点中选择所述预设数量个目标候选节点。
在本申请实施例中,图神经网络模型在确定与目标节点直接连接或间接连接的预设数量个目标候选节点时,该图神经网络模型先确定与该目标节点直接连接或间接连接的每个候选节点,再从该每个候选节点中选择出预设数量个候选节点作为目标候选节点。
具体的,在本申请实施例中,图神经网络模型确定知识图谱中与该目标节点直接连接,以及与该目标节点通过一个节点间接连接的每个候选节点,再采用随机算法从该候选节点中选择该预设数量个目标候选节点。其中,在本申请实施例中,针对每个节点,若该节点与其他节点连接,目标节点也与该其他节点连接,则确定该节点为与该目标节点通过一个节点间接连接的候选节点。例如,节点a与节点b连接,节点b与目标节点连接,则确定该节点a为与该目标节点通过一个节点间接连接的候选节点。
其中,在本申请实施例中,该每个候选节点的数量可能小于该预设数量,该每个候选节点的数量也可能等于该预设数量,该每个候选节点的数量还可能低于该预设数量。因此,在基于每个候选节点确定目标候选节点时,可以采用以下至少一种方式进行确定:
方式一:若每个候选节点的数量大于该预设数量,则采用不放回的随机算法,从该每个候选节点中选择目标候选节点。即,图神经网络模型首次从每个候选节点中随机选择一个候选节点作为目标候选节点,再从不包含该目标候选节点的每个候选节点中随机选择一个候选节点,往后依次类推,直至选择出的目标候选节点的数量达到预设数量个。
例如,在本申请实施例中,共有六个候选节点,分别为候选节点1、候选节点2、候选节点3、候选节点4、候选节点5和候选节点6,目标候选节点的预设数量为三个。首先,图神经网络模型从该六个候选节点中随机选择一个候选节点3作为目标候选节点;其次,图神经网络模型从候选节点1、候选节点2、候选节点4、候选节点5和候选节点6这五个候选节点中随机选择一个候选节点5作为目标候选节点;最后,图神经网络模型从候选节点1、候选节点2、候选节点4和候选节点6这五个候选节点中随机选择一个候选节点2作为目标候选节点。即,图神经网络模型确定的目标候选节点为候选节点3、候选节点5和候选节点2。
方式二:若每个候选节点的数量等于该预设数量,则图神经网络模型将该每个候选节点作为目标候选节点。
例如,在本申请实施例中,共有三个候选节点,分别为候选节点1、候选节点2和候选节点3,目标候选节点的预设数量为三个,则图神经网络模型将候选节点1、候选节点2和候选节点3作为目标候选节点。
方式三:若每个候选节点的数量小于该预设数量,则采用有放回的随机算法,从该每个候选节点中选择目标候选节点。即,图神经网络模型首次从每个候选节点中随机选择一个候选节点作为目标候选节点,再从包含该目标候选节点的每个候选节点中随机选择一个候选节点,往后依次类推,直至选择出的目标候选节点的数量达到预设数量。也就是每次图神经网络模型随机选择时,待选择的候选节点的数量都是初始确定的数量。
在本申请实施例中,当候选节点的数量小于预设数量时,会存在候选节点被选择了至少两次的情况,则后续在基于目标候选节点对应的特征向量对目标节点对应的目标特征进行更新时,该至少被选择了两次的候选节点参与计算的次数与被选择的次数相同。
例如,在本申请实施例中,共有两个候选节点,分别为候选节点1和候选节点2,目标候选节点的预设数量为三个。首先,图神经网络模型从该两个候选节点中随机选择一个候选节点2作为目标候选节点;其次,图神经网络模型再从该两个候选节点中随机选择一个候选节点1作为目标候选节点;最后,图神经网络模型再从该两个候选节点中随机选择一个候选节点1作为目标候选节点。即,图神经网络模型确定的目标候选节点为候选节点2、候选节点2和候选节点1。
为了确定待识别客户对应的目标节点的目标特征向量,使得服务器可以基于该目标特征向量准确地判断该待识别客户是否为目标客户,在上述各实施例的基础上,在本申请实施例中,所述根据所述目标节点对应的特征向量、每个目标候选节点对应的每个权重及特征向量,对目标节点对应的目标特征向量进行更新包括:
根据所述知识图谱中携带的每个节点对应的权重,确定每个目标候选节点对应的每个权重;
确定每个目标候选节点的特征向量与对应的权重的每个乘积;
将所述每个乘积与所述目标节点对应的目标特征向量的和向量确定为更新后的目标特征向量。
在本申请实施例中,知识图谱的每个节点中还保存有每个节点对应的每个权重。图神经网络模型在基于每个目标候选节点对应的特征向量,对目标节点对应的目标特征向量进行更新时,可以根据该目标节点对应的特征向量、每个目标候选节点对应的每个权重及特征向量,对该目标节点对应的目标特征向量进行更新。
具体的,在本申请实施例中,图神经网络模型根据知识图谱中携带的每个节点对应的权重,确定每个目标候选节点对应的每个权重,并计算每个目标候选节点的特征向量与对应的权重的每个乘积,确定每个乘积与该目标节点对应的目标特征向量的和向量,将该和向量确定为更新后的目标特征向量。
图4为本申请实施例提供的图神经网络模型确定目标节点对应的目标特征向量的过程示意图,如该图4所示,该过程包括:
S401:图神经网络模型接收输入的携带有待识别客户对应的目标节点的知识图谱。
S402:图神经网络模型为该知识图谱中的每个节点随机分配对应的特征向量。
S403:图神经网络模型确定该知识图谱中与该目标节点直接连接,以及与该目标节点通过一个节点间接连接的每个候选节点。
S404:图神经网络模型采用随机算法从该候选节点中选择该预设数量个目标候选节点。
S405:针对每个目标候选节点,从该目标候选节点中获取该目标候选节点对应的权重。
S406:根据该目标节点对应的特征向量、每个目标候选节点对应的每个权重及特征向量,对目标节点对应的目标特征向量进行更新,并输出更新后的目标特征向量。
实施例7:
为了得到训练完成的逻辑回归模型,使得服务器可以基于该逻辑回归模型更加精确地待识别客户是否为目标客户,在上述各实施例的基础上,在本申请实施例中,所述逻辑回归模型的训练过程包括:
获取保存的样本特征向量集,其中所述样本特征向量集中包含多个样本特征向量,并且所述样本特征向量集保存有每个样本特征向量对应的客户是否为目标客户的标识信息;
将所述样本特征向量集中的每个样本特征向量输入到待训练的逻辑回归模型中,获取所述逻辑回归模型输出的每个样本特征向量对应的客户是否为目标客户的预测结果;
针对每个样本特征向量,根据该样本特征向量中携带的该样本特征向量对应的客户是否为目标客户的标识信息,以及所述逻辑回归模型输出的该样本特征向量对应的预测结果,对所述逻辑回归模型的参数进行调整。
在本申请实施例中,服务器中预先保存有样本特征向量集,用于对逻辑回归模型进行训练,其中,该样本特征向量集中保存有每个样本特征向量对应的客户是否为目标客户的标识信息,服务器可以根据每个样本特征向量对应的客户是否为目标客户的标识信息将样本特征向量分为正样本和负样本。
具体的,服务器在对逻辑回归模型进行训练时,该服务器可以将保存的样本特征向量集中的每个样本特征向量输入到待训练的逻辑回归模型中,获取该逻辑回归模型输出的每个样本特征向量对应的客户是否为目标客户的预测结果;针对每个样本特征向量,根据该样本特征向量中携带的该样本特征向量对应的客户是否为目标客户的标识信息,以及该逻辑回归模型输出的该样本特征向量对应的预测结果,对该逻辑回归模型的参数进行调整。
实施例8:
为了得到训练完成的图神经网络模型,使得服务器可以基于该图神经网络模型更加精确地待识别客户是否为目标客户,在上述各实施例的基础上,在本申请实施例中,所述图神经网络模型的训练过程包括:
获取保存的每个样本知识图谱;
将所述每个样本知识图谱输入到待训练的图神经网络模型中,获取该图神经网络模型输出的每个客户对应的节点的样本目标特征向量;
根据所述每个样本目标特征向量,对所述待训练的图神经网络模型进行优化。
在本申请实施例中,服务器中预先保存有样本知识图谱集,用于对图神经网络模型进行训练,其中,该样本知识图谱集中包含至少一个样本知识图谱,并且每个样本知识图谱中携带有至少一个客户对应的样本节点。
具体的,服务器在对图神经网络模型进行训练时,该服务器可以将保存的样本知识图谱集中的每个样本知识图谱输入到待训练的图神经网络模型中,获取该图神经网络模型输出每个样本目标特征向量。在本申请实施例中,根据每个样本目标特征向量,对该待训练的图神经网络模型的参数进行优化。
具体的,在对图神经网络模型进行优化时,图神经网络模型针对每个样本知识图谱,依次输出该样本知识图谱中每个样本节点的样本特征向量,并在输出一个样本特征向量之后,该图神经网络模型就对自身的参数进行调整。当生成的样本目标特征向量的数达到预设的阈值,即图神经网络模型对自身的参数的调整次数达到预设的阈值,则认为该图神经网络模型训练完成,则停止生成样本目标特征向量。
实施例9:
图5为本申请实施例提供的一种风险数据存储装置结构示意图,该装置包括:
知识图谱构建模块501,用于获取每个客户的每个交易数据,并根据所述每个客户的每个交易数据构建知识图谱,其中,所述知识图谱中包含客户对应的第一节点和交易对象对应的第二节点,存在交易关系的客户对应的第一节点与交易对象对应的第二节点之间连接;
处理模块502,用于根据携带有待识别客户对应的目标节点的知识图谱及预先训练完成的图神经网络模型,确定所述目标节点对应的目标特征向量;
识别模块503,用于将所述目标特征向量输入到预先训练完成的逻辑回归模型中,获取所述逻辑回归模型输出的所述目标节点对应的待识别客户是否为目标客户的判断结果。
在一种可能的实施方式中,所述知识图谱构建模块501,具体用于针对每个交易数据,确定该交易数据对应的客户和交易对象;若当前知识图谱中不存在所述客户对应的第一节点或不存在所述交易对象对应的第二节点,则在所述知识图谱中创建所述客户对应的第一节点或所述交易对象对应第二节点,并连接所述第一节点和第二节点;接收输入的每个节点对应的每个权重,并将该每个权重保存到对应的节点中。
在一种可能的实施方式中,所述知识图谱构建模块501,具体用于若所述交易对象为非客户,则根据预先配置的交易对象类别,确定所述交易对象对应的目标交易对象类别;若当前知识图谱中不存在所述目标交易对象类别对应的节点,则确定不存在所述交易对象对应的第二节点;创建所述目标交易对象类别对应的节点,将创建的所述节点作为所述交易对象对应的第二节点。
在一种可能的实施方式中,所述处理模块502,具体用于将所述携带有待识别客户对应的目标节点的知识图谱输入到所述图神经网络模型中;所述图神经网络模型为所述知识图谱中的每个节点随机分配对应的特征向量;确定所述知识图谱中与所述目标节点直接或间接连接的预设数量个目标候选节点;针对每个目标候选节点,从该目标候选节点中获取该目标候选节点对应的权重;根据所述目标节点对应的特征向量、每个目标候选节点对应的每个权重及特征向量,对目标节点对应的目标特征向量进行更新。
在一种可能的实施方式中,所述处理模块502,具体用于确定所述知识图谱中与该目标节点直接连接,以及与所述目标节点通过一个节点间接连接的每个候选节点;采用随机算法从所述候选节点中选择所述预设数量个目标候选节点。
在一种可能的实施方式中,所述处理模块502,具体用于根据所述知识图谱中携带的每个节点对应的权重,确定每个目标候选节点对应的每个权重;确定每个目标候选节点的特征向量与对应的权重的每个乘积;将所述每个乘积与所述目标节点对应的目标特征向量的和向量确定为更新后的目标特征向量。
在一种可能的实施方式中,所述装置还包括:
第一训练模块504,用于获取保存的样本特征向量集,其中所述样本特征向量集中包含多个样本特征向量,并且所述样本特征向量集中保存有每个样本特征向量对应的客户是否为目标客户的标识信息;将所述样本特征向量集中的每个样本特征向量输入到待训练的逻辑回归模型中,获取所述逻辑回归模型输出的每个样本特征向量对应的客户是否为目标客户的预测结果;针对每个样本特征向量,根据该样本特征向量中携带的该样本特征向量对应的客户是否为目标客户的标识信息,以及所述逻辑回归模型输出的该样本特征向量对应的预测结果,对所述逻辑回归模型的参数进行调整。
在一种可能的实施方式中,所述装置还包括:
第二训练模块505,用于获取保存的每个样本知识图谱;将所述每个样本知识图谱输入到待训练的图神经网络模型中,获取该图神经网络模型输出的每个客户对应的样本节点的每个样本目标特征向量;根据所述每个样本目标特征向量对所述待训练的图神经网络模型进行优化。
实施例10:
在上述实施例的基础上,本申请实施例还提供了一种电子设备,图6为本申请实施例提供的一种电子设备结构示意图,如图6所示,包括:处理器61、通信接口62、存储器63和通信总线64,其中,处理器61,通信接口62,存储器63通过通信总线64完成相互间的通信;
存储器63中存储有计算机程序,当程序被处理器61执行时,使得处理器61执行如下步骤:
获取每个客户的每个交易数据,并根据所述每个客户的每个交易数据构建知识图谱,其中,所述知识图谱中包含客户对应的第一节点和交易对象对应的第二节点,存在交易关系的客户对应的第一节点与交易对象对应的第二节点之间连接;
根据携带有待识别客户对应的目标节点的知识图谱及预先训练完成的图神经网络模型,确定所述目标节点对应的目标特征向量;
将所述目标特征向量输入到预先训练完成的逻辑回归模型中,获取所述逻辑回归模型输出的所述目标节点对应的待识别客户是否为目标客户的判断结果。
在一种可能的实施方式中,所述处理器还用于:
针对每个交易数据,确定该交易数据对应的客户和交易对象;若当前知识图谱中不存在所述客户对应的第一节点或不存在所述交易对象对应的第二节点,则在所述知识图谱中创建所述客户对应的第一节点或所述交易对象对应第二节点,并连接所述第一节点和第二节点;
接收输入的每个节点对应的每个权重,并将该每个权重保存到对应的节点中。
在一种可能的实施方式中,所述处理器还用于:
根据预先配置的交易对象类别,确定所述交易对象对应的目标交易对象类别;
若当前知识图谱中不存在所述目标交易对象类别对应的节点,则确定不存在所述交易对象对应的第二节点;
所述在所述知识图谱中创建所述交易对象对应第二节点包括:
创建所述目标交易对象类别对应的节点,将创建的所述节点作为所述交易对象对应的第二节点。
在一种可能的实施方式中,所述处理器还用于:
将所述携带有待识别客户对应的目标节点的知识图谱输入到所述图神经网络模型中;
所述图神经网络模型为所述知识图谱中的每个节点随机分配对应的特征向量;确定所述知识图谱中与所述目标节点直接或间接连接的预设数量个目标候选节点;针对每个目标候选节点,从该目标候选节点中获取该目标候选节点对应的权重;根据所述目标节点对应的特征向量、每个目标候选节点对应的每个权重及特征向量,对目标节点对应的目标特征向量进行更新。
在一种可能的实施方式中,所述处理器还用于:
确定所述知识图谱中与该目标节点直接连接,以及与所述目标节点通过一个节点间接连接的每个候选节点;
采用随机算法从所述候选节点中选择所述预设数量个目标候选节点。
在一种可能的实施方式中,所述处理器还用于:
根据所述知识图谱中携带的每个节点对应的权重,确定每个目标候选节点对应的每个权重;
确定每个目标候选节点的特征向量与对应的权重的每个乘积;
将所述每个乘积与所述目标节点对应的目标特征向量的和向量确定为更新后的目标特征向量。
在一种可能的实施方式中,所述处理器还用于:
获取保存的样本特征向量集,其中所述样本特征向量集中包含多个样本特征向量,并且所述样本特征向量集中保存有每个样本特征向量对应的客户是否为目标客户的标识信息;
将所述样本特征向量集中的每个样本特征向量输入到待训练的逻辑回归模型中,获取所述逻辑回归模型输出的每个样本特征向量对应的客户是否为目标客户的预测结果;
针对每个样本特征向量,根据该样本特征向量中携带的该样本特征向量对应的客户是否为目标客户的标识信息,以及所述逻辑回归模型输出的该样本特征向量对应的预测结果,对所述逻辑回归模型的参数进行调整。
在一种可能的实施方式中,所述处理器还用于:
获取保存的每个样本知识图谱;
将所述每个样本知识图谱输入到待训练的图神经网络模型中,获取该图神经网络模型输出的每个客户对应的样本节点的每个样本目标特征向量;
根据所述每个样本目标特征向量对所述待训练的图神经网络模型进行优化。
由于上述电子设备解决问题的原理与目标客户筛选方法相似,因此上述电子设备的实施可以参见方法的实施例,重复之处不再赘述。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。通信接口62用于上述电子设备与其他设备之间的通信。存储器可以包括随机存取存储器(RandomAccess Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选地,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述处理器可以是通用处理器,包括中央处理器、网络处理器(NetworkProcessor,NP)等;还可以是数字指令处理器(Digital Signal Processing,DSP)、专用集成电路、现场可编程门陈列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。
实施例11:
在上述各实施例的基础上,本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质内存储有可由处理器执行的计算机程序,当程序在处理器上运行时,使得处理器执行时实现如下步骤:
获取每个客户的每个交易数据,并根据所述每个客户的每个交易数据构建知识图谱,其中,所述知识图谱中包含客户对应的第一节点和交易对象对应的第二节点,存在交易关系的客户对应的第一节点与交易对象对应的第二节点之间连接;
根据携带有待识别客户对应的目标节点的知识图谱及预先训练完成的图神经网络模型,确定所述目标节点对应的目标特征向量;
将所述目标特征向量输入到预先训练完成的逻辑回归模型中,获取所述逻辑回归模型输出的所述目标节点对应的待识别客户是否为目标客户的判断结果。
在一种可能的实施方式中,所述根据所述每个客户的每个交易数据构建知识图谱包括:
针对每个交易数据,确定该交易数据对应的客户和交易对象;若当前知识图谱中不存在所述客户对应的第一节点或不存在所述交易对象对应的第二节点,则在所述知识图谱中创建所述客户对应的第一节点或所述交易对象对应第二节点,并连接所述第一节点和第二节点;
接收输入的每个节点对应的每个权重,并将该每个权重保存到对应的节点中。
在一种可能的实施方式中,若所述交易对象为非客户,确定当前知识图谱中不存在所述交易对象对应的第二节点包括:
根据预先配置的交易对象类别,确定所述交易对象对应的目标交易对象类别;
若当前知识图谱中不存在所述目标交易对象类别对应的节点,则确定不存在所述交易对象对应的第二节点;
所述在所述知识图谱中创建所述交易对象对应第二节点包括:
创建所述目标交易对象类别对应的节点,将创建的所述节点作为所述交易对象对应的第二节点。
在一种可能的实施方式中,所述根据携带有待识别客户对应的目标节点的知识图谱及预先训练完成的图神经网络模型,确定所述目标节点对应的目标特征向量包括:
将所述携带有待识别客户对应的目标节点的知识图谱输入到所述图神经网络模型中;
所述图神经网络模型为所述知识图谱中的每个节点随机分配对应的特征向量;确定所述知识图谱中与所述目标节点直接或间接连接的预设数量个目标候选节点;针对每个目标候选节点,从该目标候选节点中获取该目标候选节点对应的权重;根据所述目标节点对应的特征向量、每个目标候选节点对应的每个权重及特征向量,对目标节点对应的目标特征向量进行更新。
在一种可能的实施方式中,所述确定与所述目标节点直接或间接连接的预设数量个目标候选节点包括:
确定所述知识图谱中与该目标节点直接连接,以及与所述目标节点通过一个节点间接连接的每个候选节点;
采用随机算法从所述候选节点中选择所述预设数量个目标候选节点。
在一种可能的实施方式中,所述根据所述目标节点对应的特征向量、每个目标候选节点对应的每个权重及特征向量,对目标节点对应的目标特征向量进行更新包括:
根据所述知识图谱中携带的每个节点对应的权重,确定每个目标候选节点对应的每个权重;
确定每个目标候选节点的特征向量与对应的权重的每个乘积;
将所述每个乘积与所述目标节点对应的目标特征向量的和向量确定为更新后的目标特征向量。
在一种可能的实施方式中,所述逻辑回归模型的训练过程包括:
获取保存的样本特征向量集,其中所述样本特征向量集中包含多个样本特征向量,并且所述样本特征向量集中保存有每个样本特征向量对应的客户是否为目标客户的标识信息;
将所述样本特征向量集中的每个样本特征向量输入到待训练的逻辑回归模型中,获取所述逻辑回归模型输出的每个样本特征向量对应的客户是否为目标客户的预测结果;
针对每个样本特征向量,根据该样本特征向量中携带的该样本特征向量对应的客户是否为目标客户的标识信息,以及所述逻辑回归模型输出的该样本特征向量对应的预测结果,对所述逻辑回归模型的参数进行调整。
在一种可能的实施方式中,所述图神经网络模型的训练过程包括:
获取保存的每个样本知识图谱;
将所述每个样本知识图谱输入到待训练的图神经网络模型中,获取该图神经网络模型输出的每个客户对应的样本节点的每个样本目标特征向量;
根据所述每个样本目标特征向量对所述待训练的图神经网络模型进行优化。
由于上述计算机可读存储介质解决问题的原理与目标客户筛选方法相似,因此上述计算机可读存储介质的实施可以参见方法的实施例,重复之处不再赘述。
实施例12:
本申请实施例还提供了一种计算机程序产品,该计算机程序产品被计算机执行时实现上述应用于电子设备的任一方法实施例所述的目标客户筛选方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令,在计算机上加载和执行所述计算机指令时,全部或部分地产生按照本申请实施例所述的流程或功能。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (19)
1.一种目标客户筛选方法,其特征在于,所述方法包括:
获取每个客户的每个交易数据,并根据所述每个客户的每个交易数据构建知识图谱,其中,所述知识图谱中包含客户对应的第一节点和交易对象对应的第二节点,存在交易关系的客户对应的第一节点与交易对象对应的第二节点之间连接;
根据携带有待识别客户对应的目标节点的知识图谱及预先训练完成的图神经网络模型,确定所述目标节点对应的目标特征向量;
将所述目标特征向量输入到预先训练完成的逻辑回归模型中,获取所述逻辑回归模型输出的所述目标节点对应的待识别客户是否为目标客户的判断结果。
2.根据权利要求1所述的方法,其特征在于,所述根据所述每个客户的每个交易数据构建知识图谱包括:
针对每个交易数据,确定该交易数据对应的客户和交易对象;若当前知识图谱中不存在所述客户对应的第一节点或不存在所述交易对象对应的第二节点,则在所述知识图谱中创建所述客户对应的第一节点或所述交易对象对应第二节点,并连接所述第一节点和第二节点;
接收输入的每个节点对应的每个权重,并将该每个权重保存到对应的节点中。
3.根据权利要求2所述的方法,其特征在于,若所述交易对象为非客户,确定当前知识图谱中不存在所述交易对象对应的第二节点包括:
根据预先配置的交易对象类别,确定所述交易对象对应的目标交易对象类别;
若当前知识图谱中不存在所述目标交易对象类别对应的节点,则确定不存在所述交易对象对应的第二节点;
所述在所述知识图谱中创建所述交易对象对应第二节点包括:
创建所述目标交易对象类别对应的节点,将创建的所述节点作为所述交易对象对应的第二节点。
4.根据权利要求1所述的方法,其特征在于,所述根据携带有待识别客户对应的目标节点的知识图谱及预先训练完成的图神经网络模型,确定所述目标节点对应的目标特征向量包括:
将所述携带有待识别客户对应的目标节点的知识图谱输入到所述图神经网络模型中;
所述图神经网络模型为所述知识图谱中的每个节点随机分配对应的特征向量;确定所述知识图谱中与所述目标节点直接或间接连接的预设数量个目标候选节点;针对每个目标候选节点,从该目标候选节点中获取该目标候选节点对应的权重;根据所述目标节点对应的特征向量、每个目标候选节点对应的每个权重及特征向量,对目标节点对应的目标特征向量进行更新。
5.根据权利要求4所述的方法,其特征在于,所述确定与所述目标节点直接或间接连接的预设数量个目标候选节点包括:
确定所述知识图谱中与该目标节点直接连接,以及与所述目标节点通过一个节点间接连接的每个候选节点;
采用随机算法从所述候选节点中选择所述预设数量个目标候选节点。
6.根据权利要求4所述的方法,其特征在于,所述根据所述目标节点对应的特征向量、每个目标候选节点对应的每个权重及特征向量,对目标节点对应的目标特征向量进行更新包括:
根据所述知识图谱中携带的每个节点对应的权重,确定每个目标候选节点对应的每个权重;
确定每个目标候选节点的特征向量与对应的权重的每个乘积;
将所述每个乘积与所述目标节点对应的目标特征向量的和向量确定为更新后的目标特征向量。
7.根据权利要求1所述的方法,其特征在于,所述逻辑回归模型的训练过程包括:
获取保存的样本特征向量集,其中所述样本特征向量集中包含多个样本特征向量,并且所述样本特征向量集中保存有每个样本特征向量对应的客户是否为目标客户的标识信息;
将所述样本特征向量集中的每个样本特征向量输入到待训练的逻辑回归模型中,获取所述逻辑回归模型输出的每个样本特征向量对应的客户是否为目标客户的预测结果;
针对每个样本特征向量,根据该样本特征向量中携带的该样本特征向量对应的客户是否为目标客户的标识信息,以及所述逻辑回归模型输出的该样本特征向量对应的预测结果,对所述逻辑回归模型的参数进行调整。
8.根据权利要求1所述的方法,其特征在于,所述图神经网络模型的训练过程包括:
获取保存的每个样本知识图谱;
将所述每个样本知识图谱输入到待训练的图神经网络模型中,获取该图神经网络模型输出的每个客户对应的样本节点的每个样本目标特征向量;
根据所述每个样本目标特征向量对所述待训练的图神经网络模型进行优化。
9.一种目标客户筛选装置,其特征在于,所述装置包括:
知识图谱构建模块,用于获取每个客户的每个交易数据,并根据所述每个客户的每个交易数据构建知识图谱,其中,所述知识图谱中包含客户对应的第一节点和交易对象对应的第二节点,存在交易关系的客户对应的第一节点与交易对象对应的第二节点之间连接;
处理模块,用于根据携带有待识别客户对应的目标节点的知识图谱及预先训练完成的图神经网络模型,确定所述目标节点对应的目标特征向量;
识别模块,用于将所述目标特征向量输入到预先训练完成的逻辑回归模型中,获取所述逻辑回归模型输出的所述目标节点对应的待识别客户是否为目标客户的判断结果。
10.根据权利要求9所述的装置,其特征在于,所述知识图谱构建模块,具体用于针对每个交易数据,确定该交易数据对应的客户和交易对象;若当前知识图谱中不存在所述客户对应的第一节点或不存在所述交易对象对应的第二节点,则在所述知识图谱中创建所述客户对应的第一节点或所述交易对象对应第二节点,并连接所述第一节点和第二节点;接收输入的每个节点对应的每个权重,并将该每个权重保存到对应的节点中。
11.根据权利要求10所述的装置,其特征在于,所述知识图谱构建模块,具体用于若所述交易对象为非客户,则根据预先配置的交易对象类别,确定所述交易对象对应的目标交易对象类别;若当前知识图谱中不存在所述目标交易对象类别对应的节点,则确定不存在所述交易对象对应的第二节点;创建所述目标交易对象类别对应的节点,将创建的所述节点作为所述交易对象对应的第二节点。
12.根据权利要求9所述的装置,其特征在于,所述处理模块,具体用于将所述携带有待识别客户对应的目标节点的知识图谱输入到所述图神经网络模型中;所述图神经网络模型为所述知识图谱中的每个节点随机分配对应的特征向量;确定所述知识图谱中与所述目标节点直接或间接连接的预设数量个目标候选节点;针对每个目标候选节点,从该目标候选节点中获取该目标候选节点对应的权重;根据所述目标节点对应的特征向量、每个目标候选节点对应的每个权重及特征向量,对目标节点对应的目标特征向量进行更新。
13.根据权利要求12所述的装置,其特征在于,所述处理模块,具体用于确定所述知识图谱中与该目标节点直接连接,以及与所述目标节点通过一个节点间接连接的每个候选节点;采用随机算法从所述候选节点中选择所述预设数量个目标候选节点。
14.根据权利要求12所述的装置,其特征在于,所述处理模块,具体用于根据所述知识图谱中携带的每个节点对应的权重,确定每个目标候选节点对应的每个权重;确定每个目标候选节点的特征向量与对应的权重的每个乘积;将所述每个乘积与所述目标节点对应的目标特征向量的和向量确定为更新后的目标特征向量。
15.根据权利要求9所述的装置,其特征在于,所述装置还包括:
第一训练模块,用于获取保存的样本特征向量集,其中所述样本特征向量集中包含多个样本特征向量,并且所述样本特征向量集中保存有每个样本特征向量对应的客户是否为目标客户的标识信息;将所述样本特征向量集中的每个样本特征向量输入到待训练的逻辑回归模型中,获取所述逻辑回归模型输出的每个样本特征向量对应的客户是否为目标客户的预测结果;针对每个样本特征向量,根据该样本特征向量中携带的该样本特征向量对应的客户是否为目标客户的标识信息,以及所述逻辑回归模型输出的该样本特征向量对应的预测结果,对所述逻辑回归模型的参数进行调整。
16.根据权利要求9所述的装置,其特征在于,所述装置还包括:
第二训练模块,用于获取保存的每个样本知识图谱;将所述每个样本知识图谱输入到待训练的图神经网络模型中,获取该图神经网络模型输出的每个客户对应的样本节点的每个样本目标特征向量;根据所述每个样本目标特征向量对所述待训练的图神经网络模型进行优化。
17.一种电子设备,其特征在于,所述电子设备包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1-8任一所述目标客户筛选方法的步骤。
18.一种计算机可读存储介质,其特征在于,其存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-8中任一所述目标客户筛选方法的步骤。
19.一种计算机程序产品,其特征在于,所述计算机程序产品包括:计算机程序代码,当所述计算机程序代码在计算机上运行时,使得计算机执行上述如权利要求1-8中任一所述目标客户筛选方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210593136.2A CN114820001A (zh) | 2022-05-27 | 2022-05-27 | 一种目标客户筛选方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210593136.2A CN114820001A (zh) | 2022-05-27 | 2022-05-27 | 一种目标客户筛选方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114820001A true CN114820001A (zh) | 2022-07-29 |
Family
ID=82518956
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210593136.2A Pending CN114820001A (zh) | 2022-05-27 | 2022-05-27 | 一种目标客户筛选方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114820001A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111090807A (zh) * | 2019-12-16 | 2020-05-01 | 秒针信息技术有限公司 | 一种基于知识图谱的用户识别方法及装置 |
CN112215500A (zh) * | 2020-10-15 | 2021-01-12 | 支付宝(杭州)信息技术有限公司 | 账号关系识别方法及装置 |
WO2021254027A1 (zh) * | 2020-06-16 | 2021-12-23 | 银联商务股份有限公司 | 一种可疑社团的识别方法、装置、存储介质和计算机设备 |
CN113869904A (zh) * | 2021-08-16 | 2021-12-31 | 工银科技有限公司 | 可疑数据识别方法、装置、电子设备、介质和计算机程序 |
-
2022
- 2022-05-27 CN CN202210593136.2A patent/CN114820001A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111090807A (zh) * | 2019-12-16 | 2020-05-01 | 秒针信息技术有限公司 | 一种基于知识图谱的用户识别方法及装置 |
WO2021254027A1 (zh) * | 2020-06-16 | 2021-12-23 | 银联商务股份有限公司 | 一种可疑社团的识别方法、装置、存储介质和计算机设备 |
CN112215500A (zh) * | 2020-10-15 | 2021-01-12 | 支付宝(杭州)信息技术有限公司 | 账号关系识别方法及装置 |
CN113869904A (zh) * | 2021-08-16 | 2021-12-31 | 工银科技有限公司 | 可疑数据识别方法、装置、电子设备、介质和计算机程序 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2019037202A1 (zh) | 目标客户的识别方法、装置、电子设备及介质 | |
US20210103858A1 (en) | Method and system for model auto-selection using an ensemble of machine learning models | |
US20070124236A1 (en) | Credit risk profiling method and system | |
CN112598472B (zh) | 产品推荐方法、装置、系统、介质和程序产品 | |
US20220351207A1 (en) | System and method for optimization of fraud detection model | |
CN110930038A (zh) | 一种贷款需求识别方法、装置、终端及存储介质 | |
TW202020781A (zh) | 外匯交易量預測方法和裝置 | |
CN116450951A (zh) | 业务推荐方法、装置、存储介质及电子设备 | |
Byanjankar et al. | Data‐driven optimization of peer‐to‐peer lending portfolios based on the expected value framework | |
CN115545886A (zh) | 逾期风险识别方法、装置、设备及存储介质 | |
CN112926090A (zh) | 基于差分隐私的业务分析方法及装置 | |
CN116664306A (zh) | 风控规则的智能推荐方法、装置、电子设备及介质 | |
CN110910241A (zh) | 现金流评估方法、装置、服务器设备及存储介质 | |
CN115983902A (zh) | 基于用户实时事件的信息推送方法及系统 | |
CN114820001A (zh) | 一种目标客户筛选方法、装置、设备及介质 | |
CN115269085A (zh) | 手机银行页面展示方法及装置 | |
CN114897607A (zh) | 产品资源的数据处理方法及装置、电子设备、存储介质 | |
CN113159926A (zh) | 贷款业务的还款日期确定方法及装置 | |
CN112288475A (zh) | 产品推荐方法、装置及电子设备 | |
CN113094589B (zh) | 智能服务推荐方法及装置 | |
CN114219315A (zh) | 营销效果的评价方法、装置、计算机设备以及存储介质 | |
CN116362895A (zh) | 理财产品推荐方法、装置及存储介质 | |
JP2004094662A (ja) | 信用リスク管理の最適化モデル適用方法及び装置 | |
CN117764685A (zh) | 数据处理方法、装置、存储介质及电子设备 | |
CA3116479A1 (en) | System and method for optimization of fraud detection model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |