CN116453141B - 票据潜客的识别方法、装置和电子设备 - Google Patents

票据潜客的识别方法、装置和电子设备 Download PDF

Info

Publication number
CN116453141B
CN116453141B CN202310693184.3A CN202310693184A CN116453141B CN 116453141 B CN116453141 B CN 116453141B CN 202310693184 A CN202310693184 A CN 202310693184A CN 116453141 B CN116453141 B CN 116453141B
Authority
CN
China
Prior art keywords
bill
identified
enterprise client
latent
enterprise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310693184.3A
Other languages
English (en)
Other versions
CN116453141A (zh
Inventor
蔡凡华
毛佩芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Bank Co Ltd
Original Assignee
Ping An Bank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Bank Co Ltd filed Critical Ping An Bank Co Ltd
Priority to CN202310693184.3A priority Critical patent/CN116453141B/zh
Publication of CN116453141A publication Critical patent/CN116453141A/zh
Application granted granted Critical
Publication of CN116453141B publication Critical patent/CN116453141B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19173Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/42Document-oriented image-based pattern recognition based on the type of document

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种票据潜客的识别方法、装置和电子设备,属于数据处理的技术领域,该方法中,图特征提取模型能够提取企业客户的历史票据交易数据的网络结构图的图特征向量,在对待识别企业客户进行票据潜客识别时,将待识别企业客户的画像特征向量和图特征向量拼接后输入票据潜客分类模型,进而得到待识别企业客户是否为票据潜客的分类结果,上述票据潜客的识别方法是由票据潜客分类模型基于图特征提取模型的输出结果和待识别企业客户的画像特征向量自动实现的,提高了识别效率,并且识别时结合了图特征提取模型挖掘的图特征向量,得到的票据潜客的分类结果准确性好,大大提高了后期营销的成交率,且大大提升了客户体验。

Description

票据潜客的识别方法、装置和电子设备
技术领域
本发明涉及数据处理的技术领域,尤其是涉及一种票据潜客的识别方法、装置和电子设备。
背景技术
票据业务成为商业银行提高经济效益和改善资产结构的重要手段。银行承兑汇票是票据市场中最主要的交易工具,银行信用作为付款担保有效地保证了按期承付,商业银行也将其视为国债和其它货币市场工具的替代品,并且由于收益率较高,不少银行已将其列为重要的资产业务。票据的流转也扩大了这些参加者的社会影响,增加了其无形资产,并且这些影响、无形资产有可能转化为财富。因此,商业银行如何识别一批票据潜客显得尤为重要。
目前,商业银行在进行票据潜客的识别时,一般采用电话营销的形式。客户经理通过高频的电话呼出进行票据营销,从而识别需要购买票据的客户(即票据潜客)。上述票据潜客的识别方式效率低下、成交率低、且客户体验差,缺乏针对性。
综上,现有的票据潜客的识别方法存在效率低下、成交率低、客户体验差的技术问题。
发明内容
有鉴于此,本发明的目的在于提供一种票据潜客的识别方法、装置和电子设备,以缓解现有的票据潜客的识别方法效率低下、成交率低、客户体验差的技术问题。
第一方面,本发明实施例提供了一种票据潜客的识别方法,包括:
获取待识别企业客户的画像数据,并对所述待识别企业客户的画像数据进行编码处理,得到待识别企业客户的画像特征向量;
调用图特征提取模型基于企业客户的历史票据交易数据输出的图特征向量,其中,所述图特征向量为对所述企业客户的历史票据交易数据进行图网络结构构建后,通过训练好的所述图特征提取模型对构建的网络结构图进行特征提取后得到的;
将所述待识别企业客户的画像特征向量和所述图特征向量进行拼接,并采用票据潜客分类模型对所述待识别企业客户的拼接后的特征向量进行票据潜客分类,进而根据票据潜客分类结果确定所述待识别企业客户是否为票据潜客。
进一步的,所述待识别企业客户的画像数据至少包括:成立年限、行业、年华EVA、存贷款信息和贴现年日均余额,对所述待识别企业客户的画像数据进行编码处理,包括:
对所述待识别企业客户的画像数据进行embedding编码处理,得到所述待识别企业客户的画像特征向量。
进一步的,将所述待识别企业客户的画像特征向量和所述图特征向量进行拼接,包括:
采用torch.cat函数将所述待识别企业客户的画像特征向量和所述图特征向量进行拼接;
所述票据潜客分类结果包括:所述待识别企业客户为票据潜客的概率,根据票据潜客分类结果确定所述待识别企业客户是否为票据潜客,包括:
若所述待识别企业客户为票据潜客的概率大于预设概率阈值,则确定所述待识别企业客户为票据潜客。
进一步的,所述方法还包括:
获取所述企业客户的历史票据交易数据,其中,所述历史票据交易数据至少包括:交易双方的企业名称、企业客户的ID和票据交易金额;
将所述企业客户的历史票据交易数据输入至networkx,得到所述网络结构图,其中,所述网络结构图包括:节点和边,节点表示企业客户,边表示企业客户之间的票据交易;
对初始图特征提取模型进行超参数设置,并采用所述网络结构图对所述初始图特征提取模型进行训练,得到训练好的图特征提取模型,进而得到训练好的所述图特征提取模型对所述网络结构图进行特征提取后输出的图特征向量,其中,所述图特征提取模型包括:GCN图卷积神经网络和relu激活函数层;
获取所述企业客户的画像数据,并对所述企业客户的画像数据进行编码处理,得到企业客户的画像特征向量;
将所述企业客户的画像特征向量和所述图特征向量进行拼接,得到所述企业客户的拼接后的特征向量;
采用所述企业客户的拼接后的特征向量对原始票据潜客分类模型进行训练,得到所述票据潜客分类模型,其中,所述票据潜客分类模型包括LightGBM模型。
进一步的,对初始图特征提取模型进行超参数设置,包括:
设置输入特征维度in_feats的数值为50,隐藏层的特征维度n_hidden的值为20,类别数n_classes的值为2,网络层数n_layers的值为2,activation激活函数为relu。
进一步的,若确定所述待识别企业客户为票据潜客之后,所述方法还包括:
向所述票据潜客推荐票据产品。
第二方面,本发明实施例还提供了一种票据潜客的识别装置,包括:
获取和编码处理单元,用于获取待识别企业客户的画像数据,并对所述待识别企业客户的画像数据进行编码处理,得到待识别企业客户的画像特征向量;
调用单元,用于调用图特征提取模型基于企业客户的历史票据交易数据输出的图特征向量,其中,所述图特征向量为对所述企业客户的历史票据交易数据进行图网络结构构建后,通过训练好的所述图特征提取模型对构建的网络结构图进行特征提取后得到的;
拼接和分类单元,用于将所述待识别企业客户的画像特征向量和所述图特征向量进行拼接,并采用票据潜客分类模型对所述待识别企业客户的拼接后的特征向量进行票据潜客分类,进而根据票据潜客分类结果确定所述待识别企业客户是否为票据潜客。
进一步的,所述待识别企业客户的画像数据至少包括:成立年限、行业、年华EVA、存贷款信息和贴现年日均余额,所述获取和编码处理单元还用于:
对所述待识别企业客户的画像数据进行embedding编码处理,得到所述待识别企业客户的画像特征向量。
第三方面,本发明实施例还提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面任一项所述的方法的步骤。
第四方面,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有机器可运行指令,所述机器可运行指令在被处理器调用和运行时,所述机器可运行指令促使所述处理器运行上述第一方面任一项所述的方法。
在本发明实施例中,提供了一种票据潜客的识别方法,包括:获取待识别企业客户的画像数据,并对待识别企业客户的画像数据进行编码处理,得到待识别企业客户的画像特征向量;调用图特征提取模型基于企业客户的历史票据交易数据输出的图特征向量,其中,图特征向量为对企业客户的历史票据交易数据进行图网络结构构建后,通过训练好的图特征提取模型对构建的网络结构图进行特征提取后得到的;将待识别企业客户的画像特征向量和图特征向量进行拼接,并采用票据潜客分类模型对待识别企业客户的拼接后的特征向量进行票据潜客分类,进而根据票据潜客分类结果确定待识别企业客户是否为票据潜客。通过上述描述可知,本发明的票据潜客的识别方法中,图特征提取模型能够提取企业客户的历史票据交易数据的网络结构图的图特征向量,在对待识别企业客户进行票据潜客识别时,将待识别企业客户的画像特征向量和图特征向量拼接后输入票据潜客分类模型,进而得到待识别企业客户是否为票据潜客的分类结果,上述票据潜客的识别方法是由票据潜客分类模型基于图特征提取模型的输出结果和待识别企业客户的画像特征向量自动实现的,提高了识别效率,并且识别时结合了图特征提取模型挖掘的图特征向量,得到的票据潜客的分类结果准确性好,大大提高了后期营销的成交率,且能根据票据潜客的分类结果进行针对性的营销,大大提升了客户体验,避免了过多的无效电话营销带来的客户体验差的技术问题,缓解了现有的票据潜客的识别方法效率低下、成交率低、客户体验差的技术问题。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种票据潜客的识别方法的流程图;
图2为本发明实施例提供的一种票据潜客的识别装置的示意图;
图3为本发明实施例提供的一种电子设备的示意图。
具体实施方式
下面将结合实施例对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
传统的票据潜客的识别方法效率低下、成交率低、客户体验差。
基于此,本发明的票据潜客的识别方法中,图特征提取模型能够提取企业客户的历史票据交易数据的网络结构图的图特征向量,在对待识别企业客户进行票据潜客识别时,将待识别企业客户的画像特征向量和图特征向量拼接后输入票据潜客分类模型,进而得到待识别企业客户是否为票据潜客的分类结果,上述票据潜客的识别方法是由票据潜客分类模型基于图特征提取模型的输出结果和待识别企业客户的画像特征向量自动实现的,提高了识别效率,并且识别时结合了图特征提取模型挖掘的图特征向量,得到的票据潜客的分类结果准确性好,大大提高了后期营销的成交率,且能根据票据潜客的分类结果进行针对性的营销,大大提升了客户体验,避免了过多的无效电话营销带来的客户体验差的技术问题。
为便于对本实施例进行理解,首先对本发明实施例所公开的一种票据潜客的识别方法进行详细介绍。
实施例一:
根据本发明实施例,提供了一种票据潜客的识别方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的一种票据潜客的识别方法的流程图,如图1所示,该方法包括如下步骤:
步骤S102,获取待识别企业客户的画像数据,并对待识别企业客户的画像数据进行编码处理,得到待识别企业客户的画像特征向量;
在本发明实施例中,画像数据至少包括:成立年限、行业、年华EVA、存贷款信息和贴现年日均余额,下文中再对编码处理的过程进行详细描述。
步骤S104,调用图特征提取模型基于企业客户的历史票据交易数据输出的图特征向量,其中,图特征向量为对企业客户的历史票据交易数据进行图网络结构构建后,通过训练好的图特征提取模型对构建的网络结构图进行特征提取后得到的;
具体的,企业客户的历史票据交易数据为历史票据在银行和企业客户之间进行交易的数据,例如,企业客户A需要融资,将其将从银行购买的票据低价卖给了企业客户B,企业客户B后来也需要融资,又将其从企业客户A购买的票据低价卖给了企业客户C,如此,票据在银行和不同的企业客户之间进行交易得到的数据,即为企业客户的历史票据交易数据,可见,企业客户的历史票据交易数据具有明显的图结构特征,因此,为了挖掘企业客户的历史票据交易数据的更深入的特征,采用了训练好的图特征提取模型对企业客户的历史票据交易数据进行图网络结构构建后得到的网络结构图进行特征提取,从而得到网络结构图的图特征向量,便于后续基于该更深入的图特征向量进行票据潜客分类,这样得到的票据潜客分类结果才会更加准确。
步骤S106,将待识别企业客户的画像特征向量和图特征向量进行拼接,并采用票据潜客分类模型对待识别企业客户的拼接后的特征向量进行票据潜客分类,进而根据票据潜客分类结果确定待识别企业客户是否为票据潜客。
具体的,将待识别企业客户的拼接后的特征向量输入至票据潜客分类模型,输出得到票据潜客分类结果,进而根据票据潜客分类结果确定待识别企业客户是否为票据潜客。
在本发明实施例中,提供了一种票据潜客的识别方法,包括:获取待识别企业客户的画像数据,并对待识别企业客户的画像数据进行编码处理,得到待识别企业客户的画像特征向量;调用图特征提取模型基于企业客户的历史票据交易数据输出的图特征向量,其中,图特征向量为对企业客户的历史票据交易数据进行图网络结构构建后,通过训练好的图特征提取模型对构建的网络结构图进行特征提取后得到的;将待识别企业客户的画像特征向量和图特征向量进行拼接,并采用票据潜客分类模型对待识别企业客户的拼接后的特征向量进行票据潜客分类,进而根据票据潜客分类结果确定待识别企业客户是否为票据潜客。通过上述描述可知,本发明的票据潜客的识别方法中,图特征提取模型能够提取企业客户的历史票据交易数据的网络结构图的图特征向量,在对待识别企业客户进行票据潜客识别时,将待识别企业客户的画像特征向量和图特征向量拼接后输入票据潜客分类模型,进而得到待识别企业客户是否为票据潜客的分类结果,上述票据潜客的识别方法是由票据潜客分类模型基于图特征提取模型的输出结果和待识别企业客户的画像特征向量自动实现的,提高了识别效率,并且识别时结合了图特征提取模型挖掘的图特征向量,得到的票据潜客的分类结果准确性好,大大提高了后期营销的成交率,且能根据票据潜客的分类结果进行针对性的营销,大大提升了客户体验,避免了过多的无效电话营销带来的客户体验差的技术问题,缓解了现有的票据潜客的识别方法效率低下、成交率低、客户体验差的技术问题。
上述内容对本发明的票据潜客的识别方法进行了简要介绍,下面对其中涉及到的具体内容进行详细描述。
在本发明的一个可选实施例中,待识别企业客户的画像数据至少包括:成立年限、行业、年华EVA、存贷款信息和贴现年日均余额,对待识别企业客户的画像数据进行编码处理,具体包括如下步骤:
对待识别企业客户的画像数据进行embedding编码处理,得到待识别企业客户的画像特征向量。
具体的,获取画像数据,至少包括:成立年限、行业、年华EVA、存贷款信息和贴现年日均余额,分别进行embedding编码处理,得到企业属性特征、行业特征、年化EVA特征、存款特征、贷款特征、贴现特征等各维度的待识别企业客户的画像特征向量。
在本发明的一个可选实施例中,将待识别企业客户的画像特征向量和图特征向量进行拼接,具体包括如下步骤:
采用torch.cat函数将待识别企业客户的画像特征向量和图特征向量进行拼接;
具体的,将图特征向量和每个待识别企业客户的画像特征向量利用torch.cat函数进行向量拼接,得到待识别企业客户的拼接后的特征向量。
票据潜客分类结果包括:待识别企业客户为票据潜客的概率,根据票据潜客分类结果确定待识别企业客户是否为票据潜客,具体包括如下步骤:
若待识别企业客户为票据潜客的概率大于预设概率阈值,则确定待识别企业客户为票据潜客,否则,待识别企业客户为非票据潜客。
具体的,上述预设概率阈值可以为0.5,本发明实施例对该预设概率阈值不进行具体限制。
在本发明的一个可选实施例中,该方法还包括如下步骤:
(1)获取企业客户的历史票据交易数据,其中,历史票据交易数据至少包括:交易双方的企业名称、企业客户的ID和票据交易金额;
(2)将企业客户的历史票据交易数据输入至networkx,得到网络结构图,其中,网络结构图包括:节点和边,节点表示企业客户,边表示企业客户之间的票据交易;
(3)对初始图特征提取模型进行超参数设置,并采用网络结构图对初始图特征提取模型进行训练,得到训练好的图特征提取模型,进而得到训练好的图特征提取模型对网络结构图进行特征提取后输出的图特征向量,其中,图特征提取模型包括:GCN图卷积神经网络和relu激活函数层;
具体的,对初始图特征提取模型进行超参数设置,具体包括:设置输入特征维度in_feats的数值为50,隐藏层的特征维度n_hidden的值为20,类别数n_classes的值为2,网络层数n_layers的值为2,activation激活函数为relu。
进而,引入图神经网络库DGL,将第网络结构图和设置的超参数,输入到函数GraphConv(in_feats, n_hidden, activation = activation )中,在GCN图卷积神经网络层后,接入一层relu激活函数层,得到GCN图神经网络模型(即初始图特征提取模型)。
将网络结构图输入到初始图特征提取模型对初始图特征提取模型进行训练,得到初始图特征提取模型预测的各企业客户节点之间是否有边连接的预测结果,而网络结构图本身就包含各企业客户节点之间是否有边连接的真值,进而根据预测结果和真值进行有监督训练,如此,便能得到训练好的图特征提取模型,进而得到训练好的图特征提取模型对网络结构图进行特征提取后输出的图特征向量(即各企业客户节点之间是否有边连接的预测结果)。
在训练时,可以将网络结构图中的节点进行编号,0-1000为训练节点,1001-2000为验证节点,2001-3000为测试节点,如此,完成图特征提取模型的训练、验证和测试,得到训练好的图特征提取模型。
GCN是图卷积神经网络,实际上跟CNN(卷积神经网络)的作用一样,本质上就是一个特征提取器,只不过它的对象是图。GCN可以从图结构数据中提取出网络拓扑结构间的隐藏特征,即其可以挖掘图结构的隐藏特征,更适用于本发明中的票据交易数据的结构。
(4)获取企业客户的画像数据,并对企业客户的画像数据进行编码处理,得到企业客户的画像特征向量;
该过程与上述步骤S102的过程相似,可参考前述相关内容的描述,在此不再赘述。
(5)将企业客户的画像特征向量和图特征向量进行拼接,得到企业客户的拼接后的特征向量;
具体的,拼接时,采用torch.cat函数。
(6)采用企业客户的拼接后的特征向量对原始票据潜客分类模型进行训练,得到票据潜客分类模型,其中,票据潜客分类模型包括LightGBM模型。
具体的,企业客户之间是否有票据交易的真值是已知的(企业客户的历史票据交易数据中包含),基于该真值对原始票据潜客分类模型进行监督训练,从而得到票据潜客分类模型,训练时,企业客户的拼接后的特征向量中80%作为训练集,20%作为测试集。
LightGBM(Light Gradient Boosting Machine)是一个实现GBDT算法思想的框架,它设计的初衷是并行与高效。它具有训练速度快,内存使用少,对类别特征能做特殊处理,支持并行训练,大大加快了训练速度,也有更好的模型精度。
本发明的方案能很好的结合两个模型的优点,图卷积神经网络能提取网络拓扑结构间的隐藏特征,LightGBM能做分类概率预测,结合起来使用就能挖掘出票据业务的潜在客户,帮助银行获客。
在本发明的一个可选实施例中,若确定待识别企业客户为票据潜客之后,该方法还包括:
向票据潜客推荐票据产品,以使票据潜客购买票据产品。
本发明的方法完全继承了基于GCN的自动特征提取和基于LightGBM模型的性能准确预测的优点。其中图卷积神经网络GCN是一类特殊的神经网络,能够处理以图形结构表示的网络拓扑数据,这些网络很大程度上受到卷积神经网络 (CNN)和图嵌入的推动。CNN 无法处理图数据,因为图中的节点没有按任何顺序表示,而且两个节点之间的依赖信息由边表示。极限梯度提升算法(LightGBM)是梯度提升策略的有效实现,用于分类和回归,通过L2正则化改进了传统的梯度提升策略,从而保证了分类的准确性。
实施例二:
本发明实施例还提供了一种票据潜客的识别装置,该票据潜客的识别装置主要用于执行本发明实施例一中所提供的票据潜客的识别方法,以下对本发明实施例提供的票据潜客的识别装置做具体介绍。
图2是根据本发明实施例的一种票据潜客的识别装置的示意图,如图2所示,该装置主要包括:获取和编码处理单元10、调用单元20、拼接和分类单元30,其中:
获取和编码处理单元,用于获取待识别企业客户的画像数据,并对待识别企业客户的画像数据进行编码处理,得到待识别企业客户的画像特征向量;
调用单元,用于调用图特征提取模型基于企业客户的历史票据交易数据输出的图特征向量,其中,图特征向量为对企业客户的历史票据交易数据进行图网络结构构建后,通过训练好的图特征提取模型对构建的网络结构图进行特征提取后得到的;
拼接和分类单元,用于将待识别企业客户的画像特征向量和图特征向量进行拼接,并采用票据潜客分类模型对待识别企业客户的拼接后的特征向量进行票据潜客分类,进而根据票据潜客分类结果确定待识别企业客户是否为票据潜客。
在本发明实施例中,提供了一种票据潜客的识别装置,包括:获取待识别企业客户的画像数据,并对待识别企业客户的画像数据进行编码处理,得到待识别企业客户的画像特征向量;调用图特征提取模型基于企业客户的历史票据交易数据输出的图特征向量,其中,图特征向量为对企业客户的历史票据交易数据进行图网络结构构建后,通过训练好的图特征提取模型对构建的网络结构图进行特征提取后得到的;将待识别企业客户的画像特征向量和图特征向量进行拼接,并采用票据潜客分类模型对待识别企业客户的拼接后的特征向量进行票据潜客分类,进而根据票据潜客分类结果确定待识别企业客户是否为票据潜客。通过上述描述可知,本发明的票据潜客的识别装置中,图特征提取模型能够提取企业客户的历史票据交易数据的网络结构图的图特征向量,在对待识别企业客户进行票据潜客识别时,将待识别企业客户的画像特征向量和图特征向量拼接后输入票据潜客分类模型,进而得到待识别企业客户是否为票据潜客的分类结果,上述票据潜客的识别方法是由票据潜客分类模型基于图特征提取模型的输出结果和待识别企业客户的画像特征向量自动实现的,提高了识别效率,并且识别时结合了图特征提取模型挖掘的图特征向量,得到的票据潜客的分类结果准确性好,大大提高了后期营销的成交率,且能根据票据潜客的分类结果进行针对性的营销,大大提升了客户体验,避免了过多的无效电话营销带来的客户体验差的技术问题,缓解了现有的票据潜客的识别方法效率低下、成交率低、客户体验差的技术问题。
可选地,待识别企业客户的画像数据至少包括:成立年限、行业、年华EVA、存贷款信息和贴现年日均余额,获取和编码处理单元还用于:对待识别企业客户的画像数据进行embedding编码处理,得到待识别企业客户的画像特征向量。
可选地,拼接和分类单元还用于:采用torch.cat函数将待识别企业客户的画像特征向量和图特征向量进行拼接;票据潜客分类结果包括:待识别企业客户为票据潜客的概率,拼接和分类单元还用于:若待识别企业客户为票据潜客的概率大于预设概率阈值,则确定待识别企业客户为票据潜客。
可选地,该装置还用于:获取企业客户的历史票据交易数据,其中,历史票据交易数据至少包括:交易双方的企业名称、企业客户的ID和票据交易金额;将企业客户的历史票据交易数据输入至networkx,得到网络结构图,其中,网络结构图包括:节点和边,节点表示企业客户,边表示企业客户之间的票据交易;对初始图特征提取模型进行超参数设置,并采用网络结构图对初始图特征提取模型进行训练,得到训练好的图特征提取模型,进而得到训练好的图特征提取模型对网络结构图进行特征提取后输出的图特征向量,其中,图特征提取模型包括:GCN图卷积神经网络和relu激活函数层;获取企业客户的画像数据,并对企业客户的画像数据进行编码处理,得到企业客户的画像特征向量;将企业客户的画像特征向量和图特征向量进行拼接,得到企业客户的拼接后的特征向量;采用企业客户的拼接后的特征向量对原始票据潜客分类模型进行训练,得到票据潜客分类模型,其中,票据潜客分类模型包括LightGBM模型。
可选地,该装置还用于:设置输入特征维度in_feats的数值为50,隐藏层的特征维度n_hidden的值为20,类别数n_classes的值为2,网络层数n_layers的值为2,activation激活函数为relu。
可选地,该装置还用于:向票据潜客推荐票据产品。
本发明实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。
如图3所示,本申请实施例提供的一种电子设备600,包括:处理器601、存储器602和总线,所述存储器602存储有所述处理器601可执行的机器可读指令,当电子设备运行时,所述处理器601与所述存储器602之间通过总线通信,所述处理器601执行所述机器可读指令,以执行如上述票据潜客的识别方法的步骤。
具体地,上述存储器602和处理器601能够为通用的存储器和处理器,这里不做具体限定,当处理器601运行存储器602存储的计算机程序时,能够执行上述票据潜客的识别方法。
处理器601可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器601中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器601可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(DigitalSignal Processing,简称DSP)、专用集成电路(Application Specific IntegratedCircuit,简称ASIC)、现成可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器602,处理器601读取存储器602中的信息,结合其硬件完成上述方法的步骤。
对应于上述票据潜客的识别方法,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有机器可运行指令,所述计算机可运行指令在被处理器调用和运行时,所述计算机可运行指令促使所述处理器运行上述票据潜客的识别方法的步骤。
本申请实施例所提供的票据潜客的识别装置可以为设备上的特定硬件或者安装于设备上的软件或固件等。本申请实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,前述描述的系统、装置和单元的具体工作过程,均可以参考上述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
再例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请提供的实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台电子设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述车辆标记方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释,此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的范围。都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (9)

1.一种票据潜客的识别方法,其特征在于,包括:
获取待识别企业客户的画像数据,并对所述待识别企业客户的画像数据进行编码处理,得到待识别企业客户的画像特征向量;
调用图特征提取模型基于企业客户的历史票据交易数据输出的图特征向量,其中,所述图特征向量为对所述企业客户的历史票据交易数据进行图网络结构构建后,通过训练好的所述图特征提取模型对构建的网络结构图进行特征提取后得到的;
将所述待识别企业客户的画像特征向量和所述图特征向量进行拼接,并采用票据潜客分类模型对所述待识别企业客户的拼接后的特征向量进行票据潜客分类,进而根据票据潜客分类结果确定所述待识别企业客户是否为票据潜客;
所述方法还包括:
获取所述企业客户的历史票据交易数据,其中,所述历史票据交易数据至少包括:交易双方的企业名称、企业客户的ID和票据交易金额;
将所述企业客户的历史票据交易数据输入至networkx,得到所述网络结构图,其中,所述网络结构图包括:节点和边,节点表示企业客户,边表示企业客户之间的票据交易;
对初始图特征提取模型进行超参数设置,并采用所述网络结构图对所述初始图特征提取模型进行训练,得到训练好的图特征提取模型,进而得到训练好的所述图特征提取模型对所述网络结构图进行特征提取后输出的图特征向量,其中,所述图特征提取模型包括:GCN图卷积神经网络和relu激活函数层;
获取所述企业客户的画像数据,并对所述企业客户的画像数据进行编码处理,得到企业客户的画像特征向量;
将所述企业客户的画像特征向量和所述图特征向量进行拼接,得到所述企业客户的拼接后的特征向量;
采用所述企业客户的拼接后的特征向量对原始票据潜客分类模型进行训练,得到所述票据潜客分类模型,其中,所述票据潜客分类模型包括LightGBM模型。
2.根据权利要求1所述的方法,其特征在于,所述待识别企业客户的画像数据至少包括:成立年限、行业、年华EVA、存贷款信息和贴现年日均余额,对所述待识别企业客户的画像数据进行编码处理,包括:
对所述待识别企业客户的画像数据进行embedding编码处理,得到所述待识别企业客户的画像特征向量。
3.根据权利要求1所述的方法,其特征在于,将所述待识别企业客户的画像特征向量和所述图特征向量进行拼接,包括:
采用torch.cat函数将所述待识别企业客户的画像特征向量和所述图特征向量进行拼接;
所述票据潜客分类结果包括:所述待识别企业客户为票据潜客的概率,根据票据潜客分类结果确定所述待识别企业客户是否为票据潜客,包括:
若所述待识别企业客户为票据潜客的概率大于预设概率阈值,则确定所述待识别企业客户为票据潜客。
4.根据权利要求1所述的方法,其特征在于,对初始图特征提取模型进行超参数设置,包括:
设置输入特征维度in_feats的数值为50,隐藏层的特征维度n_hidden的值为20,类别数n_classes的值为2,网络层数n_layers的值为2,activation激活函数为relu。
5.根据权利要求1所述的方法,其特征在于,若确定所述待识别企业客户为票据潜客之后,所述方法还包括:
向所述票据潜客推荐票据产品。
6.一种票据潜客的识别装置,其特征在于,包括:
获取和编码处理单元,用于获取待识别企业客户的画像数据,并对所述待识别企业客户的画像数据进行编码处理,得到待识别企业客户的画像特征向量;
调用单元,用于调用图特征提取模型基于企业客户的历史票据交易数据输出的图特征向量,其中,所述图特征向量为对所述企业客户的历史票据交易数据进行图网络结构构建后,通过训练好的所述图特征提取模型对构建的网络结构图进行特征提取后得到的;
拼接和分类单元,用于将所述待识别企业客户的画像特征向量和所述图特征向量进行拼接,并采用票据潜客分类模型对所述待识别企业客户的拼接后的特征向量进行票据潜客分类,进而根据票据潜客分类结果确定所述待识别企业客户是否为票据潜客;
所述装置还用于:获取所述企业客户的历史票据交易数据,其中,所述历史票据交易数据至少包括:交易双方的企业名称、企业客户的ID和票据交易金额;将所述企业客户的历史票据交易数据输入至networkx,得到所述网络结构图,其中,所述网络结构图包括:节点和边,节点表示企业客户,边表示企业客户之间的票据交易;对初始图特征提取模型进行超参数设置,并采用所述网络结构图对所述初始图特征提取模型进行训练,得到训练好的图特征提取模型,进而得到训练好的所述图特征提取模型对所述网络结构图进行特征提取后输出的图特征向量,其中,所述图特征提取模型包括:GCN图卷积神经网络和relu激活函数层;获取所述企业客户的画像数据,并对所述企业客户的画像数据进行编码处理,得到企业客户的画像特征向量;将所述企业客户的画像特征向量和所述图特征向量进行拼接,得到所述企业客户的拼接后的特征向量;采用所述企业客户的拼接后的特征向量对原始票据潜客分类模型进行训练,得到所述票据潜客分类模型,其中,所述票据潜客分类模型包括LightGBM模型。
7.根据权利要求6所述的装置,其特征在于,所述待识别企业客户的画像数据至少包括:成立年限、行业、年华EVA、存贷款信息和贴现年日均余额,所述获取和编码处理单元还用于:
对所述待识别企业客户的画像数据进行embedding编码处理,得到所述待识别企业客户的画像特征向量。
8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1至5中任一项所述的方法的步骤。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有机器可运行指令,所述机器可运行指令在被处理器调用和运行时,所述机器可运行指令促使所述处理器运行上述权利要求1至5中任一项所述的方法。
CN202310693184.3A 2023-06-13 2023-06-13 票据潜客的识别方法、装置和电子设备 Active CN116453141B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310693184.3A CN116453141B (zh) 2023-06-13 2023-06-13 票据潜客的识别方法、装置和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310693184.3A CN116453141B (zh) 2023-06-13 2023-06-13 票据潜客的识别方法、装置和电子设备

Publications (2)

Publication Number Publication Date
CN116453141A CN116453141A (zh) 2023-07-18
CN116453141B true CN116453141B (zh) 2023-10-13

Family

ID=87130498

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310693184.3A Active CN116453141B (zh) 2023-06-13 2023-06-13 票据潜客的识别方法、装置和电子设备

Country Status (1)

Country Link
CN (1) CN116453141B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110458592A (zh) * 2019-06-18 2019-11-15 北京海致星图科技有限公司 基于知识图谱和机器学习算法挖掘银行潜在授信客户方法
CN111695719A (zh) * 2020-04-20 2020-09-22 清华大学 一种用户价值预测方法及系统
CN111951052A (zh) * 2020-08-14 2020-11-17 中国工商银行股份有限公司 基于知识图谱的获取潜在客户方法及装置
CN111967972A (zh) * 2020-08-18 2020-11-20 中国银行股份有限公司 理财产品推荐方法及装置
CN112381547A (zh) * 2020-12-02 2021-02-19 天翼电子商务有限公司 一种基于异构图卷积神经网络的营销作弊监测方法
CN113946690A (zh) * 2021-10-28 2022-01-18 平安科技(深圳)有限公司 潜在客户挖掘方法、装置、电子设备及存储介质
CN114943559A (zh) * 2022-05-30 2022-08-26 中国银行股份有限公司 一种客户价值建模方法和系统、电子设备、存储介质
CN115730147A (zh) * 2022-11-30 2023-03-03 中国银行股份有限公司 客户挖掘方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7941339B2 (en) * 2004-12-23 2011-05-10 International Business Machines Corporation Method and system for managing customer network value

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110458592A (zh) * 2019-06-18 2019-11-15 北京海致星图科技有限公司 基于知识图谱和机器学习算法挖掘银行潜在授信客户方法
CN111695719A (zh) * 2020-04-20 2020-09-22 清华大学 一种用户价值预测方法及系统
CN111951052A (zh) * 2020-08-14 2020-11-17 中国工商银行股份有限公司 基于知识图谱的获取潜在客户方法及装置
CN111967972A (zh) * 2020-08-18 2020-11-20 中国银行股份有限公司 理财产品推荐方法及装置
CN112381547A (zh) * 2020-12-02 2021-02-19 天翼电子商务有限公司 一种基于异构图卷积神经网络的营销作弊监测方法
CN113946690A (zh) * 2021-10-28 2022-01-18 平安科技(深圳)有限公司 潜在客户挖掘方法、装置、电子设备及存储介质
CN114943559A (zh) * 2022-05-30 2022-08-26 中国银行股份有限公司 一种客户价值建模方法和系统、电子设备、存储介质
CN115730147A (zh) * 2022-11-30 2023-03-03 中国银行股份有限公司 客户挖掘方法及装置

Also Published As

Publication number Publication date
CN116453141A (zh) 2023-07-18

Similar Documents

Publication Publication Date Title
CN109978538B (zh) 确定欺诈用户、训练模型、识别欺诈风险的方法及装置
CN110009174B (zh) 风险识别模型训练方法、装置及服务器
CN111291816B (zh) 针对用户分类模型进行特征处理的方法及装置
CN107133865B (zh) 一种信用分的获取、特征向量值的输出方法及其装置
CN110704730A (zh) 基于大数据的产品数据推送方法、系统及计算机设备
CN108550065B (zh) 评论数据处理方法、装置及设备
CN110503564B (zh) 基于大数据的保全案件处理方法、系统、设备及存储介质
CN111428217B (zh) 欺诈团伙识别方法、装置、电子设备及计算机可读存储介质
CN109299954B (zh) 一种违规商户识别方法和装置
CN111325248A (zh) 降低贷前业务风险的方法及系统
CN111260189B (zh) 一种风险控制方法、装置、计算机系统及可读存储介质
CN112434884A (zh) 一种供应商分类画像的建立方法及装置
CN111091408A (zh) 用户识别模型创建方法、装置与识别方法、装置
CN114584601A (zh) 用户流失识别及干预方法、系统、终端及介质
US11593622B1 (en) Artificial intelligence system employing graph convolutional networks for analyzing multi-entity-type multi-relational data
CN110796379B (zh) 业务渠道的风险评估方法、装置、设备及存储介质
CN116453141B (zh) 票据潜客的识别方法、装置和电子设备
CN115345727B (zh) 一种识别欺诈贷款申请的方法及装置
CN110570301B (zh) 风险识别方法、装置、设备及介质
CN114723554A (zh) 异常账户识别方法及装置
CN114092225A (zh) 银行网点提供金融服务的方法及装置
CN112330373A (zh) 用户行为分析方法、装置及计算机可读存储介质
CN113706258A (zh) 基于组合模型的产品推荐方法、装置、设备及存储介质
CN111932131A (zh) 业务数据处理方法及装置
CN110598125A (zh) 一种评估关键意见领袖投入的方法及装置、存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant