CN117034094B - 一种账户类型预测方法及账户类型预测装置 - Google Patents

一种账户类型预测方法及账户类型预测装置 Download PDF

Info

Publication number
CN117034094B
CN117034094B CN202311307264.7A CN202311307264A CN117034094B CN 117034094 B CN117034094 B CN 117034094B CN 202311307264 A CN202311307264 A CN 202311307264A CN 117034094 B CN117034094 B CN 117034094B
Authority
CN
China
Prior art keywords
graph
interaction
account
prediction
business
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311307264.7A
Other languages
English (en)
Other versions
CN117034094A (zh
Inventor
王愚
侯兴翠
王化楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lianlian Hangzhou Information Technology Co ltd
Lianlian Yintong Electronic Payment Co ltd
Original Assignee
Lianlian Hangzhou Information Technology Co ltd
Lianlian Yintong Electronic Payment Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lianlian Hangzhou Information Technology Co ltd, Lianlian Yintong Electronic Payment Co ltd filed Critical Lianlian Hangzhou Information Technology Co ltd
Priority to CN202311307264.7A priority Critical patent/CN117034094B/zh
Publication of CN117034094A publication Critical patent/CN117034094A/zh
Application granted granted Critical
Publication of CN117034094B publication Critical patent/CN117034094B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开涉及账户类型预测方法及账户类型预测装置,该方法包括:获取业务数据,该业务数据包括至少两个账户和多个信息交互记录,任一信息交互记录的双方均属于该至少两个账户;基于该业务数据构建初始业务交互图,该初始业务交互图中的任一节点对应至少两个账户中的一个账户,该初始业务交互图中的任一边指示任一边相关的两个账户之间的信息交互关系;将该初始业务交互图输入图预测模型,得到目标账户对应的账户类型,该目标账户为该两个账户中的任一账户;其中,该图预测模型为对输入的业务交互图进行图预测和基于图预测结果的图提示学习训练得到。本公开可以在账户数据完备性或者与标签账户相似性不足的情况下,依然保证高账户类别识别准确度。

Description

一种账户类型预测方法及账户类型预测装置
技术领域
本公开涉及计算机技术领域,尤其涉及一种账户类型预测方法及账户类型预测装置。
背景技术
目前在很多对目标账户识别分类的场景中,识别分类的准确度受限于多方面因素,包括目标账户的数据完整性和目标账户与标签账户的相似性,当目标账户缺失账户交互信息时,目标账户与标签账户的信息维度不一致,将会导致难以识别分类,进而导致识别分类不准。
发明内容
为了解决上述提出的至少一个技术问题,本公开提出了一种账户类型预测方法及账户类型预测装置。
根据本公开的一些实施例中,提供了一种账户类型预测方法,所述方法包括:获取业务数据,所述业务数据包括至少两个账户和多个信息交互记录,任一所述信息交互记录的双方均属于所述至少两个账户;基于所述业务数据构建初始业务交互图,所述初始业务交互图中的任一节点对应所述至少两个账户中的一个账户,所述初始业务交互图中的任一边指示所述任一边相关的两个账户之间的信息交互关系;将所述初始业务交互图输入图预测模型,得到目标账户对应的账户类型,所述目标账户为所述两个账户中的任一账户;其中,所述图预测模型为对输入的业务交互图进行图预测和基于图预测结果的图提示学习训练得到。
基于上述方案,可以在业务数据量较少以至于难以识别目标账户类型的情况下,通过预训练的图预测模型进行图预测以补充业务数据,再基于补充的业务数据即可识别目标账户的账户类型,降低账户类型的识别难度。
在一些可能的实施方式中,所述将所述初始业务交互图输入图预测模型,得到目标账户对应的账户类型,包括基于所述图预测模型执行下述操作:对所述初始业务交互图进行图预测,得到中间业务交互图,所述中间业务交互图相较于所述初始业务交互图包括至少一个新增节点和至少一个新增边;融合所述中间业务交互图和所述初始业务交互图,得到目标业务交互图;基于所述目标业务交互图预测所述目标账户对应的账户类型。
基于上述方案,可以实现对初始业务交互图的修正,既可以补全目标账户的邻居账户以及目标账户与邻居账户的信息交互关系,也可以将目标账户与已知账户关联起来,从而提高对目标账户的账户类型识别的准确度。
在一些可能的实施方式中,所述融合所述中间业务交互图和所述初始业务交互图,得到目标业务交互图,包括:对所述中间业务交互图进行聚合处理,得到每一账户类型对应的业务交互子图;将各所述业务交互子图分别与所述初始业务交互图进行图融合,得到所述目标业务交互图。
基于上述方案,可以将聚合处理后的业务交互子图作为提示图的基础,每个业务交互子图对应一种账户类型,将业务交互子图融合进初始业务交互图中,对目标账户预测账户类型时,识别目标账户对应的业务交互子图,即可得到目标账户的账户类型,降低对目标账户的账户类型识别的难度。
在一些可能的实施方式中,所述将各所述业务交互子图分别与所述初始业务交互图进行图融合,得到所述目标业务交互图,包括:对各所述业务交互子图分别进行图特征提取,得到各所述业务交互子图分别对应的图特征;提取所述初始业务交互图中各个节点分别对应的点特征;基于各所述点特征和各所述图特征,确定所述初始业务交互图与各所述业务交互子图之间的相似关系;基于所述相似关系,所述业务交互子图与各所述初始业务交互图进行图融合,得到所述目标业务交互图。
基于上述方案,针对每个初始业务交互图的节点匹配相似的业务交互子图,从而将相似的业务交互子图与对应的节点融合,业务交互子图作为提示图,提高对目标账户的账户类型识别的速度。
在一些可能的实施方式中,所述相似关系包括所述初始业务交互图中每一节点相对于每一所述业务交互子图对应的图特征/>的相似度/>,所述基于所述相似关系,所述业务交互子图与各所述初始业务交互图进行图融合,得到所述业务交互图,包括:针对所述初始业务交互图中每一节点/>以及每一业务交互子图,基于图特征/>以及相似度/>,确定所述节点/>与所述业务交互子图的节点融合结果;对所述节点/>以及各所述节点融合结果进行特征融合,得到融合节点;基于各所述融合节点,得到所述目标业务交互图。
基于上述方案,通过融合节点的方式对初始业务交互图中的节点进行更新,更新后的节点特征包括原始节点特征和新增特征,新增特征为多个业务交互子图按照相似度权重分配的融合特征,即更新后的节点特征信息包含目标节点和邻居节点的信息,对应的目标账户补充了缺失的账户交互信息,从而使目标账户的信息维度达到识别分类的要求。
在一些可能的实施方式中,所述图预测模型基于下述方法训练得到:获取样本业务数据,所述样本业务数据包括至少两个样本账户和多个样本信息交互记录,所述至少两个业务账户中的目标样本账户存在对应的账户类型标签;基于所述样本业务数据构建样本业务交互图;对所述样本业务交互图部分信息隐藏处理,得到模拟业务交互图,所述模拟业务交互图相比于所述样本业务交互图,隐藏至少一个节点和至少一个边;将所述模拟业务交互图输入预设模型,得到所述目标样本账户对应的账户类型预测结果;基于所述账户类型预测结果和所述账户类型标签之间的差异,调整所述预设模型的参数,得到所述图预测模型。
基于上述方案,通过对已知的样本业务交互图部分信息隐藏处理,可以模拟初始业务交互图中缺失账户交互信息的账户,基于已知的样本业务交互图先部分信息隐藏处理再预测恢复,可以确保图预测模型的预测数据的准确。
在一些可能的实施方式中,所述预设模型包括图学习模型和分类模型,所述将所述模拟业务交互图输入预设模型,得到所述目标样本账户对应的账户类型预测结果,包括:将所述模拟业务交互图输入所述图学习模型,得到业务交互预测图;将所述业务交互预测图输入所述分类模型,得到所述目标样本账户对应的账户类型预测结果。
基于上述方案,图学习模型和分类模型按照账户类型预测方法的顺序进行训练,可以提高账户类型预测的速度,且分类模型的训练基于图学习模型的训练数据进行,可以减少训练两个不同模型的训练数据需求量,并减少模型的训练时间。
在一些可能的实施方式中,所述将所述模拟业务交互图输入所述图学习模型,得到业务交互预测图,包括:对所述模拟业务交互图进行图预测,得到中间业务交互预测图;融合所述中间业务交互预测图和所述模拟业务交互图,得到所述业务交互预测图;所述基于所述账户类型预测结果和所述账户类型标签之间的差异,调整所述预设模型的参数,得到所述图预测模型之前,所述方法还包括:基于所述中间业务交互预测图和所述样本业务交互图之间的差异,调整所述图学习模型的参数;所述基于所述账户类型预测结果和所述账户类型标签之间的差异,调整所述预设模型的参数,得到所述图预测模型,包括:在冻结所述图学习模型的参数的基础上,基于所述账户类型预测结果和所述账户类型标签之间的差异,调整所述预设模型的参数,得到所述图预测模型。
基于上述方案,通过设置合理的自监督任务,可以确保图预测模型能够预测准确,同时图预测模型的训练速度快。
在一些可能的实施方式中,所述对所述模拟业务交互图进行图预测,得到中间业务交互预测图,包括:基于所述模拟业务交互图进行节点预测,得到节点预测图,所述节点预测图相较于所述模拟业务交互图新增至少一个节点;基于所述节点预测图的新增节点,进行边生成,得到所述中间业务交互预测图。
基于上述方案,图预测模型在进行图预测的过程与之前对样本业务交互图部分信息隐藏处理的过程对应,从而提高预测的准确性。
根据本公开的另一些实施例中,提供了一种账户类型预测装置,所述装置包括:数据获取模块,用于获取样本业务数据和待分类的业务数据;训练模块,用于对所述样本业务数据训练得到图预测模型;预测模块,用于对所述待分类的业务数据预测处理,得到所述业务数据中目标账户对应的账户类型。
根据本公开的另一些实施例中,提供了一种客户审核系统,包括上述实施例中所述的一种账户类型预测装置,还包括审核装置,所述审核装置根据所述账户类型预测装置输出的目标账户的账户类型,得到所述目标账户的账户类型对应的目标客户的审核结果。
根据本公开的另一些实施例中,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条指令或至少一段程序,所述至少一条指令或至少一段程序由处理器加载并执行以实现上述一些实施例中所述的一种目标账户标签分类预测方法。
根据本公开的另一些实施例中,提供了一种电子设备,包括至少一个处理器,以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述至少一个处理器通过执行所述存储器存储的指令实现上述一些实施例中所述的一种目标账户标签分类预测方法。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,而非限制本公开。
根据下面参考附图对示例性实施例的详细说明,本公开的其它特征及方面将变得清楚。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本说明书的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1示出根据本公开实施例的一种账户类型预测方法的流程图;
图2示出根据本公开实施例的图预测模型执行的操作流程图;
图3示出根据本公开实施例的融合中间业务交互图和初始业务交互图的方法步骤流程图;
图4示出根据本公开实施例的将各业务交互子图分别与初始业务交互图进行图融合的方法过程流程图;
图5示出根据本公开实施例的图预测模型的训练方法的步骤流程图;
图6示出根据本公开实施例的一种账户类型预测装置的结构框图;
图7示出根据本公开实施例的一种电子设备的框图;
图8示出根据本公开实施例的另一种电子设备的框图。
具体实施方式
下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。
在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括A、B、C中的至少一种,可以表示包括从A、B和C构成的集合中选择的任意一个或多个元素。
另外,为了更好地说明本公开,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本公开同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本公开的主旨。
值得说明的是,本公开实施例中所获取到的全部数据均为经过相关用户或者主体进行过充分授权之后获取到的数据。
目前在很多对目标账户识别分类的场景中,识别分类的准确度受限于多方面因素,一方面,账户的总体数量少,导致聚类特征不明显,聚合后的类别过多或过少,最终导致分类识别不准;另一方面,已有的标签账户少,目标账户与已有的标签账户的相似度小,关联程度差,识别分类精度不高;再一方面,目标账户的信息维度少,目标账户与已有的标签账户的信息维度不一致,进而使识别分类的难度加大。
以支付场景为例,随着电子支付技术的不断发展,对电子支付的合法性和安全性要求不断升高,其中在跨境支付业务中,需要为账户类型进行准确的分类,但是由于业务数据的缺失,账户类型的分类准确度难以保证。如果基于相关技术中的人工智能的方式,通过预训练模型实现账户分类下游任务,由于预训练任务和下游任务共享一些共同的内在任务子空间,使得预训练知识可以迁移到其他下游任务中,但又由于图相关的任务相似性低,又容易产生信息泄露和泛化难的问题。
为了解决上述的技术问题,本公开实施例提供一种账户类型预测方法,该方法的基本原理是,首先获取已有的账户以及账户间的信息交互关系作为训练数据,并对训练数据进行随机信息隐藏(删除),再对训练数据进行预测恢复,最终训练得到一个图预测模型并冻结;在对目标账户进行识别分类时,将目标账户输入该图预测模型中,得到预测后的目标账户与其他账户之间的信息交互关系,并基于预测结果生成提示图,对目标账户的分类工作基于该提示图完成。
图1示出根据本公开实施例的一种账户类型预测方法的流程图,如图1所示,上述方法包括:
S101:获取业务数据,业务数据包括至少两个账户和多个信息交互记录,任一信息交互记录的双方均属于至少两个账户。
本公开实施例不限定账户的具体定义,比如,账户可以是指业务主体,也可以是指数据变量,也可以是指计算机语言中的结构体定义;本公开实施例对账户与账户之间的信息交互记录(及信息交互关系)不做限定,具体的说,不限定表现形式,即信息交互记录可以包括数字、文本、图像、声音以及其他信息载体中的一种或多种的组合;也不限定对应关系,即信息交互记录可以是一对一、一对多或多对一的关系;也不限定内容,即信息交互记录可以是实际传输内容,如文档、数据等,也可以仅是账户之间的关系,如对应关系、相似关系、关联关系等,也可以是包含多种不同信息的综合性记录。
在本公开实施例中,业务数据是指与待分类账户的预测分类业务相关的数据信息,即,对待分类账户进行识别分类,需要获取的待分类账户的信息、与待分类账户产生信息交互的其他账户、以及账户与账户之间的信息交互记录。本公开实施例不限定业务数据包括的待分类账户的数量,也就是说,业务数据可以包括多个待分类账户。
在上述实施例中,可以将待分类账户视为主体账户,则与待分类账户产生信息交互的其他账户包括待分类账户的属性账户、其他主体账户和其他主体账户的属性账户。应当理解的是,上述的主体账户和属性账户均为人为定义的,在实际的账户识别分类过程中,主体账户和属性账户的定义不是固定的,也不是必须的,本公开实施例使用主体账户和属性账户的概念定义是为了更好得解释方案,从而便于读者理解本公开实施例的方法。
在一个具体的实施例中,在电子支付场景里,需要审核客户A的风险类型,此时业务数据中的账户包括客户A、客户A的银行卡、客户A的店铺、客户A的登录设备、客户B、客户C、客户D、客户D的银行卡,客户B、客户C、客户D均为客户A的店铺的会员,客户D的银行卡与客户A的银行卡存在交易记录。基于上述信息可知,客户A为待分类账户,客户A也是主体账户,客户A的银行卡、客户A的店铺、客户A的登录设备均为客户A的属性账户,客户A的银行卡、客户A的店铺、客户A的登录设备分别与客户A对应;客户B、客户C、客户D则均属于其他主体账户,而客户D的银行卡属于客户D的属性账户;客户B、客户C、客户D分别与客户A的店铺存在信息交互记录,客户D的银行卡与客户A的银行卡之间存在信息交互记录。
在另一个具体的实施例中,在智能配电网的场景里,需要对用电主体进行识别分类,此时业务数据中的账户包括用电主体、用电类型、用电时段、用电量、发电主体、发电类型、发电量,其中用电主体为待分类账户,用电主体也是主体账户,用电类型、用电时段、用电量均为用电主体的属性账户,用电主体与用电类型、用电时段、用电量为一一对应关系;发电主体为其他主体账户,发电类型、发电量则是发电主体的属性账户,发电主体与发电类型、发电量为一一对应关系;用电主体与发电主体之间的信息交互关系为,用电主体向发电主体提出用电需求,发电主体向用电主体提供电力服务。
S102:基于业务数据构建初始业务交互图,初始业务交互图中的任一节点对应至少两个账户中的一个账户,初始业务交互图中的任一边指示任一边相关的两个账户之间的信息交互关系。
本公开实施例将业务数据转化为图数据,进而生成初始业务交互图,在后续的操作过程都是基于对图数据的操作实现。本公开实施例不限定图的具体表达形式,图可以通过节点特征矩阵和邻接矩阵表示,其中节点特征矩阵表示包含每个节点的数据信息,邻接矩阵则表示节点与节点之间的边的信息;图也可以直接通过全局向量矩阵表示;图也可以通过其他的信息形式表示。应当理解的是,本公开实施例的方法的重点在于对图数据处理的实质原理,而不是图数据的具体运算过程,基于本公开的方法原理,相关人员可以合理选择合适的实施方式。
S103:将初始业务交互图输入图预测模型,得到目标账户对应的账户类型,目标账户为两个账户中的任一账户;其中,图预测模型为对输入的业务交互图进行图预测和基于图预测结果的图提示学习训练得到。
在本公开实施例中,目标账户为两个账户中的任一账户,即目标账户不限定为待分类账户,也就是说,对业务数据中的一个账户进行分类时,该账户为待分类账户,此时可以选取该账户作为目标账户,即可直接获取该账户的账户类型,进而完成对该账户的识别分类;或者,也可以选取其他账户作为目标账户,根据其他账户的类型,间接完成对该账户的识别分类。上述步骤对应的图数据处理原理是,对初始业务交互图的一个选定节点识别分类时,可以获取初始业务交互图的任一节点作为目标节点,对目标节点进行识别分类,再得到选定节点的分类。基于上述配置,可以避免账户的基础属性差异过大导致的识别难度高,此时可以从易识别的账户得到难识别的账户的账户类型。
在本公开实施例中,设置图预测模型的目的在于,一方面,上述业务数据中的信息量少,信息量少的表现包括,待分类账户的信息少、与待分类账户产生信息交互的其他账户少、业务数据中的账户与账户之间的信息交互记录少、待分类账户与已有账户的信息交互记录少等,也就是说,待分类账户的信息维度不足,无法直接通过业务数据准确地得到目标账户的账户类型;另一方面,对待分类账户识别分类时,需要基于已有的标签样本数据实现,当待分类账户与样本标签账户的信息维度不一致时,无法直接比较得出待分类账户的账户类型,从图数据的角度说明,即待分类账户对应的图数据结构与样本标签账户对应的图数据结构不一致,上述图数据结构不一致可以理解为图数据结构包含的节点数量、边数量不相同,也可以理解为图数据结构包含的节点的属性不同。
在一个具体的实施例中,在跨境支付业务场景中,一个新入网的用户发起跨境付款的请求,此时需要获取该用户的基本信息并识别该用户的风险类别,由于该新入网的用户的基本信息仅包含客户(名称)、银行卡和手机号,其中客户(名称)为待分类账户,银行卡和手机号分别是与待分类账户一一对应的账户,已知这三个账户与其他用户的账户之间没有关联信息,那么待分类账户对应的图数据结构仅包括三个节点和两个边,显然该待分类账户的信息维度不足,因此,需要对该新入网的用户的基本信息进行预测和补全,一方面增加待分类账户关联的属性账户,如增加店铺、登录设备、登录ip等;另一方面,增加待分类账户关联的主体账户;以及,基于增加的账户,增加不同账户之间的信息交互关系,如该用户的银行卡与其他用户的银行卡交易,直至待分类账户的信息维度满足识别分类的要求。
在一些实施例中,将初始业务交互图输入图预测模型,得到目标账户对应的账户类型,都是基于图预测模型执行实现,图2示出本公开实施例的图预测模型执行的操作流程图,上述操作包括:
S201.对初始业务交互图进行图预测,得到中间业务交互图,中间业务交互图相较于初始业务交互图包括至少一个新增节点和至少一个新增边。
本公开实施例中,初始业务交互图中的节点代表原始账户,中间业务交互图相较于初始业务交互图的新增节点代表预测账户,预测账户代表可能会与原始账户产生信息交互关系的账户,结合上述的实施例中可知,预测账户包括属性账户或主体账户,而中间业务交互图相较于初始业务交互图的新增边则代表账户之间新增的信息交互关系。基于上述配置,对初始业务交互图新增节点和新增边的意义在于,可以预测主体账户的属性账户发展情况,以及属于不同主体账户的账户之间可能的信息交互关系。
S202.融合中间业务交互图和初始业务交互图,得到目标业务交互图。
S203.基于目标业务交互图预测目标账户对应的账户类型。
在本公开实施例中,融合中间业务交互图和初始业务交互图的意义在于,对初始业务交互图的图结构进行修正。结合上述实施例可知,待分类账户与样本标签账户可能存在信息维度不一致的问题,对应的,待分类账户所在的初始业务交互图与样本标签账户所在的预训练图的图结构也会不一致,此时无法直接使用初始业务交互图实现账户识别分类,需要将初始业务交互图与预训练图的图结构保持一致。可以理解的是,上述图结构是根据识别分类的要求灵活设定的,不限定为具体的图形状结构,在一些可能的实施例中,图结构可以理解为使下游任务图和预训练任务图的图特征矩阵的维度保持一致,在一些可能的实施例中,图结构也可以理解为使下游任务图和预训练任务图中的节点的特征向量的维度保持一致。
在上述实施例中,由于中间业务交互图是基于初始业务交互图的至少一次图预测处理后的结果,融合中间业务交互图和初始业务交互图可以理解为,将图预测的结果作为提示图加入到初始业务交互图中,在对目标账户识别分类时,可以参考提示图数据,达到快速分类的效果。此外,在对初始业务交互图进行图预测时,也会修改初始业务交互图中的原始节点之间的边,也就是原始账户之间的信息交互关系,将中间业务交互图和初始业务交互图融合,能够避免图预测后得到的中间业务交互图和初始业务交互图差异过大进而导致目标账户的识别分类不准的问题。
在上述实施例中,不限定中间业务交互图和初始业务交互图的具体的融合步骤。在一些可能的实施方式中,可以先将中间业务交互图和初始业务交互图分别转换为图形表示并融合,即可得到目标业务交互图的图形表示,再转换为对应的节点特征矩阵和邻接矩阵。在一些可能的实施方式中,可以直接通过数学运算实现对中间业务交互图和初始业务交互图的融合。
基于上述实施例,由于中间业务交互图可以作为提示图融合到初始业务交互图中,为了进一步提高提示图的提示效果,在中间业务交互图和初始业务交互图的融合中增加对中间业务交互图的处理。图3示出了本公开实施例融合中间业务交互图和初始业务交互图的方法步骤,上述方法包括:
S301.对中间业务交互图进行聚合处理,得到每一账户类型对应的业务交互子图。
本公开实施例基于中间业务交互图中的节点间距离,将距离相近的节点进行聚合划分,聚合的节点及节点之间的边组成业务交互子图,业务交互子图中的节点对应的账户,视为相同账户类型的账户。在本公开实施例中,业务交互子图聚合的数量对应账户类型的数量,比如,当账户类型包括三种,则中间业务交互图聚合成为三个子图;当账户类型包括六种,则中间业务交互图聚合成为六个子图。基于上述配置,由于中间业务交互图聚合形成的业务交互子图对应不同的账户类型,则业务交互子图可以作为提示图,在对目标账户预测分类时,可以根据目标账户与业务交互子图的对应关系(如业务交互子图包含目标账户、或者目标账户与业务交互子图距离近等),通过业务交互子图提供的提示图能够先给出一个账户类型的预测值,再根据融合后的目标业务交互图进行验证,从而提高审核的速度和准确度。
在一个具体的实施方式中,对中间业务交互图进行聚合处理,具体的选择是社区发现算法,社区发现算法的原理是:
步骤1.将图中的每个节点看成一个独立的社区,初始社区的数目与节点个数相同;
步骤2.对每个节点i,依次尝试把节点i分配到其每个邻居节点所在的社区,计算分配前与分配后的模块度变化ΔQ,并记录ΔQ最大的那个邻居节点,如果maxΔQ>0,则把节点i分配ΔQ最大的那个邻居节点所在的社区,否则保持不变;
步骤3.重复步骤2,直到所有节点的所属社区不再变化;
步骤4.对图进行压缩,将所有在同一个社区的节点压缩成一个新节点,社区内节点之间的边的权重转化为新节点的环的权重,社区间的边权重转化为新节点间的边权重;
步骤5.重复步骤1直到整个图的模块度不再发生变化。
在另一个具体的实施方式中,对中间业务交互图进行聚合处理,具体的选择是K-hop算法,K-hop算法的原理是选取目标节点的k格长度的节点形成目标节点的感应图,该感应图作为聚合后的子图。
应当理解的是,本公开实施例的聚合处理不限定为上述实施方式中的聚合方法,而上述实施方式中的聚合方法的具体参数也是根据实际的目标账户的分类要求灵活调整配置的,本公开实施例对此不做具体阐述。
在一些实施例中,对中间业务交互图进行聚合处理后,也会对聚合后的业务交互子图进行修改。由上述实施例中可知,中间业务交互图是基于初始业务交互图的图预测结果,而业务交互子图是由中间业务交互图聚合处理得到,即业务交互子图相对于初始业务交互图会有新增边,新增便对应的是账户之间的信息交互关系,信息交互关系可以反应两个账号之间的关联程度。当两个账号之间关联程度较小时,对应的信息交互关系也越小,即新增边越小,此时应当剔除该新增边。此外,业务交互子图的聚合方法是以节点为划分,会存在节点与节点距离近,节点之间的边过小的情况,即对应的账户之间相似性过高,此时这两个节点之间的边也应该剔除。因此,为了应对上述的两种情况,可以设置一个阈值,用于评估节点与节点之间的边情况,剔除小于阈值的边,从而减少数据的冗余程度,降低相似的账户或关联程度小的账户对账户识别分类的精度影响。
S302.将各业务交互子图分别与初始业务交互图进行图融合,得到目标业务交互图。
本公开实施例不限定初始业务交互图同时与各业务交互子图融合,也就是说,目标业务交互图可以是由初始业务交互图融合了多个业务交互子图得到,也可以是由初始业务交互图融合了单个业务交互子图得到。比如,当业务数据中的待分类的账户数量较多时,且不同待分类的账户之间的信息交互关系较少,对应的,由中间业务交互图聚合形成的业务交互子图之间没有交叉边,也就是说其他业务交互子图对分类结果没影响,此时,对目标账户进行识别分类时,可以仅将目标账户对应节点所在的业务交互子图融合进初始业务交互图中,从而达到快速识别账户类型的效果。相对的,在业务数据中的待分类的账户数量较少,或者不同待分类的账户之间信息交互关系复杂时,对应的,由中间业务交互图聚合形成的业务交互子图之间存在交叉边,也就是说其他业务交互子图对分类结果影响较大,此时,对目标账户进行识别分类时,需要将所有业务交互子图融合进初始业务交互图中,从而达到准确识别账户类型的要求。
本公开实施例将各业务交互子图分别与初始业务交互图进行图融合,得到的目标业务交互图包括原始的边、子图内生成的新增边、以及子图之间的交叉边,上述的三种边信息可以理解为:原始的边对应账户的基础信息,新增边和交叉边都是对账户的预测信息,其中交叉边可以理解成目标账户与不同类型的账户之间产生交互关系。显然,业务交互子图之间的交叉边不是必需项,即目标业务交互图可以只包括原始的边和子图内生成的新增边。同理,当账户的基础信息足够多时,账户的信息维度足够,则目标业务交互图可以只包括原始的边,业务交互子图中没有新增边。
图4示出本公开实施例中将各业务交互子图分别与初始业务交互图进行图融合的方法过程,上述方法包括:
S401.对各业务交互子图分别进行图特征提取,得到各业务交互子图分别对应的图特征。
S402.提取初始业务交互图中各个节点分别对应的点特征。
S403.基于各点特征和各图特征,确定初始业务交互图与各业务交互子图之间的相似关系。
本公开实施例中基于各点特征和各图特征,确定初始业务交互图与各业务交互子图之间的相似关系,可以理解为,将初始业务交互图中的每个节点的特征向量提取出来,再将节点的特征向量与每个业务交互子图的图特征向量建立匹配关系,也就是说,每个节点都可以由多个业务交互子图按照特定的权重分配后计算得出,节点与一个业务交互子图里的节点越相似,该业务交互子图的权重分配则越大。基于上述配置,从账户的角度理解是,对于初始业务交互图中的每个账户,都可以与不同类型的账户产生信息交互关系,两个账户之间信息交互关系越多,关联程度越紧,其账户类型也越接近。
在本公开实施例中,相似关系包括上述初始业务交互图中每一节点相对于每一上述业务交互子图对应的图特征/>的相似度/>,具体的,相似度/>由每一节点的节点向量与业务交互子图的图向量(即图特征/>)做内积得到。
S404.基于相似关系,业务交互子图与各初始业务交互图进行图融合,得到目标业务交互图。
本公开实施例中业务交互子图与各初始业务交互图进行图融合的过程可以包括以下步骤:
S501.针对初始业务交互图中每一节点以及每一业务交互子图,基于图特征/>以及相似度/>,确定节点/>与业务交互子图的节点融合结果。
本公开实施例中的节点融合结果可以理解为节点更新后相对于原始节点新增的部分特征数据(即预测数据),由于业务交互子图是基于初始业务交互图进行图预测和聚合处理的产物,且在上述的实施例中,已经获取了初始业务交互图中每一节点相对于每一上述业务交互子图对应的图特征/>的相似度/>,相似度/>作为权重,则预测数据可以直接由每个业务交互子图输出得到,转化为公式/>,式中,/>为预测数据,n为子图的数量。
S502.对节点以及各节点融合结果进行特征融合,得到融合节点。
本公开实施例中对节点以及各节点融合结果进行特征融合,得到融合节点,特征融合可以理解为对节点更新,对节点更新即代表对账户进行预测。更新后的节点应当包括原始的节点和预测数据,根据上一步骤的结果,不难得到融合节点的更新公式为:,式中,/>为融合节点,/>为原始节点,n为子图的数量。
基于上述实施例,上述更新公式也可以理解为,对初始业务交互图进行图预测后的中间业务交互图中的每个节点进行特征提取,提取的节点特征信息聚合了目标节点和邻居节点的信息。
S503.基于各融合节点,得到目标业务交互图。
根据上一步骤得到的融合节点的特征表示,合并所有融合节点即可得到目标业务交互图。
基于上述的多个实施例,可以实现账户类型的识别分类工作。需要说明的是,本公开实施例中的核心在于,基于少量业务数据预测生成补全账户的信息维度,以及通过插入提示图协助对账户类型的判断。应当理解的是,本公开实施例不限定提示图为由中间业务交互图聚合的子图得到,也就是说,在一些可能的实施例中,提示图也可以基于其他的先验知识得到。
在本公开的一些实施例中,由于先验知识(即预训练任务中的数据)与业务数据维度差异大,共有的账户少,无法直接用先验知识转移到上述的初始业务交互图中,也就是说,先验知识中一种账户类型对应的账户数据与初始业务交互图中的数据差异大,初始业务交互图的数据不能直接参考先验知识。在该情况下,提示图选择基于对初始业务交互图进行图预测和子图聚合后得到,其效果在于,由于提示图的形成经过图预测和子图聚合,能够弥合预训练策略与下游任务之间的差距,即图结构经过多次调整与预训练时的图结构保持一致,从而适配于预训练得到的图预测模型,基于上述效果,又进一步缓解将先验知识转移到不同领域的困难及缓解数据分布不一致时出现过拟合的问题。
在上述实施例中,对初始业务交互图的图数据处理基于图预测模型实现,本公开实施例的图预测模型为预训练模型,用于实现对业务数据的预测和对目标账户的分类,图5示出本公开实施例中的图预测模型的训练方法的步骤,上述训练方法包括:
S601.获取样本业务数据,样本业务数据包括至少两个样本账户和多个样本信息交互记录,至少两个业务账户中的目标样本账户存在对应的账户类型标签。
本公开实施例的样本业务数据为已知的业务数据,由于样本业务数据是为了训练图预测模型的数据,因此样本业务数据中至少有一个样本账户存在账户类型标签。
S602.基于样本业务数据构建样本业务交互图。
S603.对样本业务交互图部分信息隐藏处理,得到模拟业务交互图,模拟业务交互图相比于样本业务交互图,隐藏至少一个节点和至少一个边。
本公开实施例不限定对样本业务交互图部分信息隐藏处理的具体方式,也就是说,对样本业务交互图的部分信息隐藏处理时,可以采取随机采样删除的形式,也可以按照一定的规则进行,例如,设置特定的数据采样步骤,或者,使用MASK掩码算法等。
在本公开的一些实施例中,对样本业务交互图部分信息隐藏处理遵从以下规则:对样本业务交互图中的每个节点进行赋值排序,随后掩码隐藏序号值大于预设值的节点,以及与上述序号值大于预设值的节点连接的边。基于上述配置,可以理解成,预设值的大小对应的是初始业务交互图中一个节点对应的账户的基础信息量的多少,账户的基础信息量越少,预设值越小,掩码隐藏的节点越多,保留的节点也就越少,通过保留的节点和边的数据,预测被掩码的节点和边的数据,对应训练得到的模型即可在业务数据的账户基础信息量少情况下,预测生成补全账户的信息维度。
S604.将模拟业务交互图输入预设模型,得到目标样本账户对应的账户类型预测结果。
S605.基于账户类型预测结果和账户类型标签之间的差异,调整预设模型的参数,得到图预测模型。
本公开实施例不限定预设模型的数量,也就是说,预设模型可以是单个模型,也可以是多个不同的模型,在预设模型包括多个不同的模型的情况下,多个不同的模型可以是关联或嵌套式,多个不同的模型也可以是各自独立的,而上述得到目标样本账户对应的账户类型预测结果可以是由多个不同的模型共同处理后得到的结果,也可以是由多个不同的模型中的一个模型单独处理得到的结果。
在本公开的一些实施例中,上述预设模型包括图学习模型和分类模型,这两个模型在功能上彼此独立,其中,图学习模型的功能为图预测,图学习模型根据输入的图数据进行预测,生成节点和/或边;分类模型的功能为账户分类,分类模型根据输入的目标账户的图数据,输出目标账户的账户类型。基于上述实施例,将模拟业务交互图输入预设模型,得到目标样本账户对应的账户类型预测结果,包括:将模拟业务交互图输入图学习模型,得到业务交互预测图;将业务交互预测图输入分类模型,得到目标样本账户对应的账户类型预测结果。应当理解的是,上述分类模型使用了图学习模型的输出结果(业务交互预测图)作为输入,其目的在于能够减少训练模型用到的数据量,从而减少模型训练的时间,也就是说,图学习模型和分类模型是可以分别独立训练的。
本公开实施例中的图学习模型用于预测目标账户的可能的更新结果,因此,将模拟业务交互图输入图学习模型后,期待的输出结果应当为样本业务交互图,即图学习模型的输出结果越接近于样本业务交互图,则该图学习模型的预测越准确。为了实现上述目的,本公开的一些实施例中的图学习模型选择基于图神经算法模型(GNN模型,Graph NeuralNetworks)实现,需要说明的是,上述图神经算法模型应当做广义的理解,也就是说,上述图神经算法模型可以是GCN模型(Graph Convolution Networks)、GAT模型(Graph AttentionNetworks)、GraphSAGE模型(Graph Sample and Aggregate)、GAE模型(Graph Auto-Encoder)、DiffPool模型或其他的图神经算法模型。
本公开的一个实施例中,将模拟业务交互图输入图学习模型,得到业务交互预测图,包括:对模拟业务交互图进行图预测,得到中间业务交互预测图;融合中间业务交互预测图和模拟业务交互图,得到业务交互预测图。基于上述配置,首先根据掩码后的模拟业务交互图预测被掩码的数据,即上述中间业务交互预测图,接着再将中间业务交互预测图和模拟业务交互图融合,得到业务交互预测图,可以理解的是,上述中间业务交互预测图和模拟业务交互图融合的步骤,是为了配合下游任务图与提示图的融合设置,也就是说,在对图学习模型训练时,可以直接将中间业务交互预测图作为业务交互预测图;也可以对中间业务交互预测图进行修正,然后和模拟业务交互图融合得到业务交互预测图。
在一个具体的实施例中,上述对模拟业务交互图进行图预测,得到中间业务交互预测图,包括:基于模拟业务交互图进行节点预测,得到节点预测图,节点预测图相较于模拟业务交互图新增至少一个节点;基于节点预测图的新增节点,进行边生成,得到中间业务交互预测图。基于上述配置,图预测的过程与上述实施例中掩码处理的过程保持对应,由于掩码处理是基于掩码的节点删除其连接的边,故在图预测时,首先预测新增节点,在根据预测的新增节点,得到预测的新增边,从而提高预测的准确度。
在本公开实施例中,对图学习模型的训练应当同时满足预测准确度高和训练过程效率高,为了满足上述要求,对图学习模型的训练应当设置合理的训练终止条件。因此,在基于账户类型预测结果和账户类型标签之间的差异,调整预设模型的参数,得到图预测模型之前,需要基于中间业务交互预测图和样本业务交互图之间的差异,调整图学习模型的参数。在一些可能的实施方式中,可以通过计算中间业务交互预测图和样本业务交互图的最大化似然概率,设置训练终止条件。在对图学习模型的训练完成后,图学习模型应当冻结,即图学习模型的参数不再做调整,直接应用于下游任务的预测中。
在本公开实施例中,分类模型是根据输入的图数据,获取目标节点的分类,其最终应用于下游任务中预测获取目标账户的账户分类,故对分类模型的训练的要求为响应快和准确度高。因此,基于账户类型预测结果和账户类型标签之间的差异,调整预设模型的参数,得到图预测模型,包括:在冻结图学习模型的参数的基础上,基于账户类型预测结果和账户类型标签之间的差异,调整预设模型的参数,得到图预测模型。此处调整的预设模型的参数对应的分类模型的参数。
本公开实施例不限定分类模型的输入数据的表现形式,也就是说,分类模型的输入数据可以是节点特征向量、图特征矩阵、图全局向量或图结构等。另一方面,本公开实施例也不限定分类模型的具体配置方案,即分类模型可以是对数据操作的分类模型,也可以是对图操作的分类模型;或者,分类模型可以是基于欧式距离实现的算法模型,也可以不是基于欧式距离实现的算法模型,或者,分类模型可以是分步式算法模型等。在一些可能的实施例中,分类模型可以采用多层感知机模型(MLP,Multilayer Perceptron),也叫人工神经网络(ANN,Artificial Neural Network),由于本公开实施例最后步骤是预测获取目标账户的账户类型,即分类模型的输入值是目标账户,也就是目标业务交互图中的目标节点,又因为节点可以表示为向量或者矩阵,即节点对应的参数包含多个,因此采用上述的多层感知机模型/人工神经网络模型可以有效处理多输入多输出的问题,达到预测时响应快和准确度高的要求。
为了更加直观得说明本公开实施例的账户类型预测方法,本公开提供一个具体的实施例,该实施例以跨境支付业务为背景,基于上述账户类型预测方法实现对新入网客户的审核以及对历史客户的动态实时审核,本实施例将按照预训练任务至下游任务的顺序进行解释说明,
其中,预训练任务对应上述方法中的图预测模型的训练方法,具体实施步骤包括:
进入GPU服务器,安装所依赖的环境,包括通过Anaconda安装python3.7环境、安装GPU版本Pytorch和Tensorflow等相关依赖模块;
抽取跨境收款、付款、收单、金融等多个业务场景客户和交易数据并做整合,首先确定客户相关节点信息,比如客户号、店铺id、虚拟卡、银行卡、ip地址等实体,节点信息即上述方法中的账户;其次确定客户边关系信息,比如绑定店铺、登录ip,登录设备指纹等关系,即上述方法中的账户之间的信息交互记录;
构建客户大规模网络图,并基于交易数据计算各类节点特征,比如,近30天客户入账、付款、提现金额等,将图数据转化为节点特征矩阵和邻接矩阵,得到样本业务交互图;
确定上一步中所构图的节点排列顺序,然后随机选择目标节点的一部分边作为观察边,将剩余的节点及边掩码删除掉,得到修改后的邻接矩阵,即模拟业务交互图;
将模拟业务交互图导入预设的图预测模型中,预测节点和边,得到业务交互预测图,将业务交互预测图与样本业务交互图对比,通过最大化图的似然概率来训练调整图预测模型中的图生成模型,最后冻结图生成模型;
上述实施例中,下游任务的步骤包括:
基于待审核的客户相关节点信息构建下游任务图,下游任务图即上述方法的初始业务交互图,随后将下游任务图输入图生成模型中得到中间业务交互图;
将中间业务交互图聚合为六个业务交互子图,然后评估每个子图内节点与节点的连接情况,计算点与点之间的相似性剔除阈值较小的边,阈值为预先设定的值,比如0.01;
接下来将提示图加入下游任务图,得到下游任务提示图,即上述方法的目标业务交互图;
将下游任务提示图输入图预测模型中的分类模型中,预测节点的分类,即上述方法中目标账户的账户类型,也即客户风险级别(高高、高中、中高、中中、中低、低);
基于模型输出的结果,业务可以直接基于此结果做客户审核,比如对应通过、整改,拒绝等。
本公开的一些实施例还提供一种账户类型预测装置,如图6所示,装置包括:
数据获取模块101,用于获取样本业务数据和待分类的业务数据;
训练模块102,用于对样本业务数据训练得到图预测模型;
预测模块103,用于对待分类的业务数据预测处理,得到业务数据中目标账户对应的账户类型。
本公开的一些实施例还提供一种客户审核系统,包括上述实施例所述的一种账户类型预测装置,还包括审核装置,所述审核装置根据所述账户类型预测装置输出的目标账户的账户类型,得到所述目标账户的账户类型对应的目标客户的审核结果。在上述系统中目标账户的账户类型(风险等级分类),可以设置的审核结果为通过、整改、拒绝等。此外,基于上述系统,可以对现新入网客户或者历史客户动态实时审核,即系统设置额外的自启动任务、循环监测任务以及预警任务,以应对不同的业务需求,进一步减少人工审核操作的工作量,达到智能审核和预警监测的效果。
在一些实施例中,本公开实施例提供的装置具有的功能或包含的模块可以用于执行上文方法实施例描述的方法,其具体实现可以参照上文方法实施例的描述,为了简洁,这里不再赘述。
本公开实施例还提出一种计算机可读存储介质,上述计算机可读存储介质中存储有至少一条指令或至少一段程序,上述至少一条指令或至少一段程序由处理器加载并执行时实现上述方法。计算机可读存储介质可以是非易失性计算机可读存储介质。
本公开实施例还提出一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,上述处理器被配置为上述方法。
电子设备可以被提供为终端、服务器或其它形态的设备。
图7示出根据本公开实施例的一种电子设备的框图。例如,电子设备800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等终端。
参照图7,电子设备800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(I/O)的接口812,传感器组件814,以及通信组件816。
处理组件802通常控制电子设备800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在电子设备800的操作。这些数据的示例包括用于在电子设备800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件806为电子设备800的各种组件提供电力。电源组件806可以包括电源管理系统,一个或多个电源,及其他与为电子设备800生成、管理和分配电力相关联的组件。
多媒体组件808包括在上述电子设备800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。上述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与上述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当电子设备800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当电子设备800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为电子设备800提供各个方面的状态评估。例如,传感器组件814可以检测到电子设备800的打开/关闭状态,组件的相对定位,例如上述组件为电子设备800的显示器和小键盘,传感器组件814还可以检测电子设备800或电子设备800一个组件的位置改变,用户与电子设备800接触的存在或不存在,电子设备800方位或加速/减速和电子设备800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于电子设备800和其他设备之间有线或无线方式的通信。电子设备800可以接入基于通信标准的无线网络,如WiFi,2G、3G、4G、5G或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,上述通信组件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,电子设备800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种非易失性计算机可读存储介质,例如包括计算机程序指令的存储器804,上述计算机程序指令可由电子设备800的处理器820执行以完成上述方法。
图8示出根据本公开实施例的另一种电子设备的框图。例如,电子设备1900可以被提供为一服务器。参照图8,电子设备1900包括处理组件1922,其进一步包括一个或多个处理器,以及由存储器1932所代表的存储器资源,用于存储可由处理组件1922的执行的指令,例如应用程序。存储器1932中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件1922被配置为执行指令,以执行上述方法。
电子设备1900还可以包括一个电源组件1926被配置为执行电子设备1900的电源管理,一个有线或无线网络接口1950被配置为将电子设备1900连接到网络,和一个输入输出(I/O)接口1958。电子设备1900可以操作基于存储在存储器1932的操作系统,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
在示例性实施例中,还提供了一种非易失性计算机可读存储介质,例如包括计算机程序指令的存储器1932,上述计算机程序指令可由电子设备1900的处理组件1922执行以完成上述方法。
本公开可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本公开的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,上述编程语言包括面向对象的编程语言—诸如Smalltalk、C+等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,上述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标准的功能也可以以不同于附图中所标准的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims (6)

1.一种账户类型预测方法,其特征在于,所述方法包括:
获取业务数据,所述业务数据包括至少两个账户和多个信息交互记录,任一所述信息交互记录的双方均属于所述至少两个账户;
基于所述业务数据构建初始业务交互图,所述初始业务交互图中的任一节点对应所述至少两个账户中的一个账户,所述初始业务交互图中的任一边指示所述任一边相关的两个账户之间的信息交互关系;
将所述初始业务交互图输入图预测模型,得到目标账户对应的账户类型,所述目标账户为所述两个账户中的任一账户,包括基于所述图预测模型执行下述操作:
对所述初始业务交互图进行图预测,得到中间业务交互图,所述中间业务交互图相较于所述初始业务交互图包括至少一个新增节点和至少一个新增边;
融合所述中间业务交互图和所述初始业务交互图,得到目标业务交互图;
基于所述目标业务交互图预测所述目标账户对应的账户类型;
其中,所述图预测模型基于下述方法训练得到:
获取样本业务数据,所述样本业务数据包括至少两个样本账户和多个样本信息交互记录,所述至少两个业务账户中的目标样本账户存在对应的账户类型标签;
基于所述样本业务数据构建样本业务交互图;
对所述样本业务交互图部分信息隐藏处理,得到模拟业务交互图,所述模拟业务交互图相比于所述样本业务交互图,隐藏至少一个节点和至少一个边;
将所述模拟业务交互图输入预设模型,所述预设模型包括图学习模型和分类模型,将所述模拟业务交互图输入所述图学习模型,基于所述模拟业务交互图进行节点预测,得到节点预测图,所述节点预测图相较于所述模拟业务交互图新增至少一个节点;
基于所述节点预测图的新增节点,进行边生成,得到中间业务交互预测图;
融合所述中间业务交互预测图和所述模拟业务交互图,得到业务交互预测图;
将所述业务交互预测图输入所述分类模型,得到所述目标样本账户对应的账户类型预测结果;
基于所述账户类型预测结果和所述账户类型标签之间的差异,调整所述预设模型的参数,得到所述图预测模型。
2.根据权利要求1所述的方法,其特征在于,所述融合所述中间业务交互图和所述初始业务交互图,得到目标业务交互图,包括:
对所述中间业务交互图进行聚合处理,得到每一账户类型对应的业务交互子图;
将各所述业务交互子图分别与所述初始业务交互图进行图融合,得到所述目标业务交互图。
3.根据权利要求2所述的方法,其特征在于,所述将各所述业务交互子图分别与所述初始业务交互图进行图融合,得到所述目标业务交互图,包括:
对各所述业务交互子图分别进行图特征提取,得到各所述业务交互子图分别对应的图特征;
提取所述初始业务交互图中各个节点分别对应的点特征;
基于各所述点特征和各所述图特征,确定所述初始业务交互图与各所述业务交互子图之间的相似关系;
基于所述相似关系,所述业务交互子图与各所述初始业务交互图进行图融合,得到所述目标业务交互图。
4.根据权利要求3所述的方法,其特征在于,所述相似关系包括所述初始业务交互图中每一节点相对于每一所述业务交互子图对应的图特征/>的相似度/>,所述基于所述相似关系,所述业务交互子图与各所述初始业务交互图进行图融合,得到所述业务交互图,包括:
针对所述初始业务交互图中每一节点以及每一业务交互子图,基于图特征/>以及相似度/>,确定所述节点/>与所述业务交互子图的节点融合结果;
对所述节点以及各所述节点融合结果进行特征融合,得到融合节点;
基于各所述融合节点,得到所述目标业务交互图。
5.根据权利要求1所述的方法,其特征在于,所述基于所述账户类型预测结果和所述账户类型标签之间的差异,调整所述预设模型的参数,得到所述图预测模型之前,所述方法还包括:
基于所述中间业务交互预测图和所述样本业务交互图之间的差异,调整所述图学习模型的参数;
所述基于所述账户类型预测结果和所述账户类型标签之间的差异,调整所述预设模型的参数,得到所述图预测模型,包括:在冻结所述图学习模型的参数的基础上,基于所述账户类型预测结果和所述账户类型标签之间的差异,调整所述预设模型的参数,得到所述图预测模型。
6.一种账户类型预测装置,用于使用权利要求1-5中任一项所述的方法,其特征在于,所述装置包括:
数据获取模块,用于获取样本业务数据和待分类的业务数据;
训练模块,用于对所述样本业务数据训练得到图预测模型;
预测模块,用于对所述待分类的业务数据预测处理,得到所述业务数据中目标账户对应的账户类型。
CN202311307264.7A 2023-10-10 2023-10-10 一种账户类型预测方法及账户类型预测装置 Active CN117034094B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311307264.7A CN117034094B (zh) 2023-10-10 2023-10-10 一种账户类型预测方法及账户类型预测装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311307264.7A CN117034094B (zh) 2023-10-10 2023-10-10 一种账户类型预测方法及账户类型预测装置

Publications (2)

Publication Number Publication Date
CN117034094A CN117034094A (zh) 2023-11-10
CN117034094B true CN117034094B (zh) 2024-03-12

Family

ID=88602775

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311307264.7A Active CN117034094B (zh) 2023-10-10 2023-10-10 一种账户类型预测方法及账户类型预测装置

Country Status (1)

Country Link
CN (1) CN117034094B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111104495A (zh) * 2019-11-19 2020-05-05 深圳追一科技有限公司 基于意图识别的信息交互方法、装置、设备和存储介质
CN111383097A (zh) * 2020-03-24 2020-07-07 中国建设银行股份有限公司 挖掘个人疑似账户的方法和装置
CN112765287A (zh) * 2021-02-05 2021-05-07 中国人民解放军国防科技大学 基于知识图谱嵌入的挖掘人物关系的方法、装置以及介质
CN114265982A (zh) * 2021-12-22 2022-04-01 北京中科闻歌科技股份有限公司 一种基于知识图谱的智能推荐方法
CN114723554A (zh) * 2022-06-09 2022-07-08 中国工商银行股份有限公司 异常账户识别方法及装置
CN115309813A (zh) * 2022-08-07 2022-11-08 复旦大学 基于用户语义、属性和邻域信息的社交机器人检测算法
CN115660592A (zh) * 2022-10-31 2023-01-31 苏州贝瑞斯曼信息科技有限公司 一种对接图文数据智能优化管理方法及系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050038721A1 (en) * 2003-08-11 2005-02-17 Websourceit, Llc Integrated utility accounting, materials management, work management and regulatory reporting software
US20230019180A1 (en) * 2021-07-08 2023-01-19 Bugcrowd Inc. Automated Prediction Of Cybersecurity Vulnerabilities

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111104495A (zh) * 2019-11-19 2020-05-05 深圳追一科技有限公司 基于意图识别的信息交互方法、装置、设备和存储介质
CN111383097A (zh) * 2020-03-24 2020-07-07 中国建设银行股份有限公司 挖掘个人疑似账户的方法和装置
CN112765287A (zh) * 2021-02-05 2021-05-07 中国人民解放军国防科技大学 基于知识图谱嵌入的挖掘人物关系的方法、装置以及介质
CN114265982A (zh) * 2021-12-22 2022-04-01 北京中科闻歌科技股份有限公司 一种基于知识图谱的智能推荐方法
CN114723554A (zh) * 2022-06-09 2022-07-08 中国工商银行股份有限公司 异常账户识别方法及装置
CN115309813A (zh) * 2022-08-07 2022-11-08 复旦大学 基于用户语义、属性和邻域信息的社交机器人检测算法
CN115660592A (zh) * 2022-10-31 2023-01-31 苏州贝瑞斯曼信息科技有限公司 一种对接图文数据智能优化管理方法及系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
受控账户检测技术研究;宋晨;王远;王利明;;计算机系统应用(第11期);1-13 *
基于北斗RDSS的核辐射监测应急通讯方法;王廷银;林明贵;陈达;吴允平;;计算机系统应用(第12期);252-256 *
基于多信息融合表示学习的关联用户挖掘算法;韩忠明;郑晨烨;段大高;董健;;计算机科学(第04期);83-88 *
基于微信的高校财务服务系统探微;吴胜;刘礼明;苏琴;;财会月刊(第10期);19-21 *

Also Published As

Publication number Publication date
CN117034094A (zh) 2023-11-10

Similar Documents

Publication Publication Date Title
CN109829433B (zh) 人脸图像识别方法、装置、电子设备及存储介质
CN113743535B (zh) 神经网络训练方法及装置以及图像处理方法及装置
CN106202330B (zh) 垃圾信息的判断方法及装置
US11443438B2 (en) Network module and distribution method and apparatus, electronic device, and storage medium
CN110598504B (zh) 图像识别方法及装置、电子设备和存储介质
CN110909815B (zh) 神经网络训练、图像处理方法、装置及电子设备
KR20220009965A (ko) 네트워크 트레이닝 방법 및 장치, 타깃 검출 방법 및 장치와 전자 기기
CN109165738B (zh) 神经网络模型的优化方法及装置、电子设备和存储介质
US20190244115A1 (en) Invitation behavior prediction method and apparatus, and storage medium
CN111259967A (zh) 图像分类及神经网络训练方法、装置、设备及存储介质
CN115100472A (zh) 展示对象识别模型的训练方法、装置和电子设备
CN108171222B (zh) 一种基于多流神经网络的实时视频分类方法及装置
CN112884040B (zh) 训练样本数据的优化方法、系统、存储介质及电子设备
CN113722546B (zh) 异常用户账户获取方法及装置、电子设备、存储介质
CN109447258B (zh) 神经网络模型的优化方法及装置、电子设备和存储介质
CN109165722A (zh) 模型扩展方法及装置、电子设备和存储介质
CN117034094B (zh) 一种账户类型预测方法及账户类型预测装置
CN111428806A (zh) 图像标签确定方法、装置、电子设备及存储介质
CN116127353A (zh) 分类方法、分类模型训练方法、设备及介质
CN116010646A (zh) 视频推荐方法、装置、电子设备及存储介质
CN113486829B (zh) 人脸活体检测方法、装置、电子设备及存储介质
CN114943336A (zh) 模型剪枝方法、装置、设备和存储介质
CN109711386B (zh) 获取识别模型的方法、装置、电子设备及存储介质
CN113053454A (zh) 分类方法及装置、电子设备和存储介质
CN111723715B (zh) 一种视频显著性检测方法及装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant