CN112559310A - 一种基于动态图的对象识别方法及装置 - Google Patents

一种基于动态图的对象识别方法及装置 Download PDF

Info

Publication number
CN112559310A
CN112559310A CN202110207196.1A CN202110207196A CN112559310A CN 112559310 A CN112559310 A CN 112559310A CN 202110207196 A CN202110207196 A CN 202110207196A CN 112559310 A CN112559310 A CN 112559310A
Authority
CN
China
Prior art keywords
identified
identification
determining
information
dimension
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110207196.1A
Other languages
English (en)
Other versions
CN112559310B (zh
Inventor
郭豪
蔡准
孙悦
郭晓鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Trusfort Technology Co ltd
Original Assignee
Beijing Trusfort Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Trusfort Technology Co ltd filed Critical Beijing Trusfort Technology Co ltd
Priority to CN202110207196.1A priority Critical patent/CN112559310B/zh
Publication of CN112559310A publication Critical patent/CN112559310A/zh
Application granted granted Critical
Publication of CN112559310B publication Critical patent/CN112559310B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3438Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment monitoring of user actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Probability & Statistics with Applications (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于动态图的对象识别方法及装置,方法包括:获得第一识别信息,第一识别信息包含待识别对象和与待识别对象对应的第一交互信息;根据预设时间窗口对第一识别信息进行划分,获得多个第二识别信息,第二识别信息包含待识别对象和与待识别对象对应的第二交互信息;根据待识别对象和第二交互信息确定与待识别对象对应的识别向量集,识别向量集包含与每一个第二识别信息对应的识别向量;通过信息识别模型对识别向量集进行识别,确定与待识别对象对应的身份类型,应用本方法获得的识别向量集,能够充分表征待识别对象在不同时间段内动态变化情况,有助于模型识别出与待识别对象对应的身份类型。

Description

一种基于动态图的对象识别方法及装置
技术领域
本发明涉及神经网络技术领域,尤其涉及一种基于动态图的对象识别方法及装置。
背景技术
近年来,神经网络被大量应用在概率预测领域,通常,为了提升概率预测的准确性,除了利用到特征原始空间域的信息之外,还要高效地挖掘这些特征之间的交互信息。并通过特征交互信息作为依据,通过模型对特征交互信息进行识别以确定与待识别对象对应的身份类型,然而当身份类型所对应的特征信息较为复杂的情况下,仅通过特征交互信息仍然很难提高识别模型对于待识别对象身份识别的准确率。
发明内容
本发明实施例提供了一种基于动态图的对象识别方法及装置,准确对待识别对象进行身份识别。
本发明实施例一方面提供一种基于动态图的对象识别方法,所述方法包括:获得第一识别信息,所述第一识别信息包含待识别对象和与所述待识别对象对应的第一交互信息;根据预设时间窗口对所述第一识别信息进行划分,获得多个第二识别信息,所述第二识别信息包含所述待识别对象和与所述待识别对象对应的第二交互信息;根据所述待识别对象和所述第二交互信息确定与每一个第二识别信息对应的第一拓扑图;根据所述第一拓扑图确定与所述待识别对象对应的识别向量集,所述识别向量集包含与每一个第二识别信息对应的识别向量;通过信息识别模型对所述识别向量集进行识别,确定与所述待识别对象对应的身份类型。
在一可实施方式中,所述根据所述待识别对象和所述第二交互信息确定与每一个第二识别信息对应的第一拓扑图,包括:根据预设维度对所述第二交互信息进行多维度特征提取,获得多维度特征集,所述多维度特征集包含多个维度特征;根据待识别对象和所述维度特征,确定与每一个维度特征对应的第二拓扑图;根据所述第二拓扑图,确定与第二识别信息对应的第一拓扑图。
在一可实施方式中,所述维度特征集包含如下维度特征至少之一:用于表征所述待识别对象与其他对象数据交互频率的第一维度特征,用于表征待识别对象与其他对象网络地址关系的第二维度特征,用于表征所述待识别对象与其他对象对应的设备标识关系的第三维度特征。
在一可实施方式中,根据待识别对象和所述维度特征,确定与每一个维度特征对应的第二拓扑图,包括:根据所述第二交互信息确定与所述待识别对象信息交互的其他对象,根据所述其他对象和所述待识别对象确定拓扑节点;根据所述维度特征确定用于连接所述拓扑节点的连接边;根据所述拓扑节点和连接边获得第二拓扑图。
在一可实施方式中,所述根据所述第一拓扑图确定与所述待识别对象对应的识别向量集,包括:根据所述连接边确定与所述待识别对象的拓扑节点连接的邻居节点;所述邻居节点为所述拓扑节点中的至少之一;对与所述邻居节点对应的其他对象进行向量编码,获得编码向量;根据所述维度特征确定与所述连接边对应的权值;对所述权值和所述编码向量进行整合,获得与所述待识别对象对应的维度向量;对所述维度向量进行融合,获得与所述第一拓扑图对应的识别向量。
在一可实施方式中,所述根据所述维度特征确定与所述连接边对应的权值,包括:根据所述维度特征确定与所述连接边对应的特征频率;根据所述特征频率确定与所述连接边对应的权值。
在一可实施方式中,所述方法还包括:获得与所述识别向量集对应的样本向量集;通过所述样本向量集对循环神经网络进行训练,获得信息识别模型,其中,所述信息识别模型用于识别与所述待识别对象对应的身份类型。
本发明实施例另一方面提供一种基于动态图的对象识别装置,所述装置包括:获得模块,用于获得第一识别信息,所述第一识别信息包含待识别对象和与所述待识别对象对应的第一交互信息;划分模块,用于根据预设时间窗口对所述第一识别信息进行划分,获得多个第二识别信息,所述第二识别信息包含所述待识别对象和与所述待识别对象对应的第二交互信息;确定模块,用于根据所述待识别对象和所述第二交互信息确定与每一个第二识别信息对应的第一拓扑图;所述确定模块,还用于根据所述第一拓扑图确定与所述待识别对象对应的识别向量集,所述识别向量集包含与每一个第二识别信息对应的识别向量;识别模块,用于通过信息识别模型对所述识别向量集进行识别,确定与所述待识别对象对应的身份类型。
在一可实施方式中,所述确定模块,包括:提取子模块,用于根据预设维度对所述第二交互信息进行多维度特征提取,获得多维度特征集,所述多维度特征集包含多个维度特征;确定子模块,用于根据待识别对象和所述维度特征,确定与每一个维度特征对应的第二拓扑图;所述确定子模块,还用于根据所述第二拓扑图,确定与第二识别信息对应的第一拓扑图。
在一可实施方式中,所述维度特征集包含如下维度特征至少之一:用于表征所述待识别对象与其他对象数据交互频率的第一维度特征,用于表征待识别对象与其他对象网络地址关系的第二维度特征,用于表征所述待识别对象与其他对象对应的设备标识关系的第三维度特征。
在一可实施方式中,所述确定子模块,包括:根据所述第二交互信息确定与所述待识别对象信息交互的其他对象,根据所述其他对象和所述待识别对象确定拓扑节点;根据所述维度特征确定用于连接所述拓扑节点的连接边;根据所述拓扑节点和连接边获得第二拓扑图。
在一可实施方式中,所述确定模块,包括:所述确定子模块,还用于根据所述连接边确定与所述待识别对象的拓扑节点连接的邻居节点;所述邻居节点为所述拓扑节点中的至少之一;编码子模块,用于对与所述邻居节点对应的其他对象进行向量编码,获得编码向量;所述确定子模块,还用于根据所述维度特征确定与所述连接边对应的权值;整合子模块,用于对所述权值和所述编码向量进行整合,获得与所述待识别对象对应的维度向量;融合子模块,用于对所述维度向量进行融合,获得与所述第一拓扑图对应的识别向量。
在一可实施方式中,所述确定子模块,包括:根据所述维度特征确定与所述连接边对应的特征频率;根据所述特征频率确定与所述连接边对应的权值。
在一可实施方式中,所述装置还包括:所述获得模块,还用于获得与所述识别向量集对应的样本向量集;训练模块,用于通过所述样本向量集对循环神经网络进行训练,获得信息识别模型,其中,所述信息识别模型用于识别与所述待识别对象对应的身份类型。
本发明实施例提供的一种基于动态图的对象识别方法及装置,通过预设时间窗口对第一识别信息进行划分,以获得多个对应不同时间段内的第二识别信息,通过确定与每一个第二识别信息的识别向量,由此可获得包含对应不同时间段的识别向量的识别向量集,通过识别向量集能够充分表征待识别对象在不同时间段内动态变化情况,通过信息识别模型对识别向量集,有助于模型挖掘出待识别基于时间的动态变化,有助于模型识别出与待识别对象对应的身份类型。
附图说明
通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中:
在附图中,相同或对应的标号表示相同或对应的部分。
图1为本发明实施例一种基于动态图的对象识别方法的实现流程示意图;
图2a示出了本发明实施例一种基于动态图的对象识别方法确定t1时段确定拓扑图的实现场景示意图;
图2b示出了本发明实施例一种基于动态图的对象识别方法确定t2时段确定拓扑图的实现场景示意图;
图3为本发明实施例一种基于动态图的对象识别方法确定第二拓扑图的实现流程示意图;
图4示出了本发明实施例一种基于动态图的对象识别方法确定第二拓扑图的实现场景示意图;
图5为本发明实施例一种基于动态图的对象识别方法确定识别向量的实现流程示意图;
图6为本发明实施例一种基于动态图的对象识别方法信息识别模型的信息提取结构图;
图7为本发明实施例一种基于动态图的对象识别装置的实现模块示意图。
具体实施方式
为使本发明的目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而非全部实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例一种基于动态图的对象识别方法的实现流程示意图。
参见图1,本发明实施例一方面提供一种基于动态图的对象识别方法,方法包括:操作101,获得第一识别信息,第一识别信息包含待识别对象和与待识别对象对应的第一交互信息;操作102,根据预设时间窗口对第一识别信息进行划分,获得多个第二识别信息,第二识别信息包含待识别对象和与待识别对象对应的第二交互信息;操作103,根据待识别对象和第二交互信息确定与每一个第二识别信息对应的第一拓扑图;操作104,根据第一拓扑图确定与待识别对象对应的识别向量集,识别向量集包含与每一个第二识别信息对应的识别向量;操作105,通过信息识别模型对识别向量集进行识别,确定与待识别对象对应的身份类型。
本发明实施例提供的基于动态图的对象识别方法,根据预设时间窗口对第一识别信息进行划分,以获得多个对应不同时间段内的第二识别信息,通过确定与每一个第二识别信息对应的第一拓扑图,并根据第一拓扑图确定识别向量,由此可获得包含对应不同时间段的识别向量的识别向量集,通过识别向量集能够充分表征待识别对象在不同时间段内动态变化情况,通过信息识别模型对识别向量集,有助于模型挖掘出待识别基于时间的动态变化,有助于模型识别出与待识别对象对应的身份类型。具体的,本方法中身份类别特指具有随着时间变化识别信息会动态变化的身份类型,身份类别如线下黑产对象、线上黑产对象、电信诈骗者等。
在操作101中,待识别对象为需要进行身份类型识别的对象,在第一识别信息中,待识别对象可以为多个,也可以为一个,指定对象可以是人,也可以是账号信息。第一交互信息为随着时间变化动态变化的交互信息,交互信息包括但不限于,银行转账交互信息、通讯交互信息、网络地址信息等。第一交互信息为待识别对象与其他对象之间的交互信息,上述的其他对象可以是待识别对象,也可以为非待识别对象。第一识别信息的获得方式可以来自网络数据库,具体的数据库类型可以根据需要识别的身份类型进行确定。例如,当需要识别的身份类型为黑产账号时,数据库可以为银行流水数据库。
在操作102,预设时间窗口可以根据第一识别信息涉及的总时间长度进行确定,预设时间窗口也可以根据与需要识别的身份类型在时间性上的相关性进行确定。例如,当第一识别信息为一年期的银行流水时,预设时间窗口的时长可以设置为三天、一周、半个月、一个月、两个月等,可以理解的是,预设时间窗口越短,对第一识别信息涉及的总时间长度划分越多,根据获得的第二识别信息所对应的识别向量集所表征的动态变化越精细。由于第一识别信息包含有多个待识别对象,可以理解的是,在不同的预设时间窗口内待识别对象的数量可以相同或不相同。例如,第一识别信息为一年期或其他时间段内的银行流水,设时间窗口的时长设置一个月,而部分待识别对象在1-6个月无银行流水,在7-12个月出现银行流水,则在1-6个月的待识别对象中,不包含无银行流水的待识别对象。第二交互信息为第一交互信息根据预设时间窗口进行划分后得到的交互信息,其与第一交互信息的区别具有不同的预设时间窗口。
在根据预设时间窗口对第一识别信息进行划分的情况下,由预设时间窗口划分的第二识别信息在时间段上可以具有重叠的时间段,也可以不具有重叠的时间段。例如,预设时间窗口为一个月对一年期的银行流水进行划分,当预设时间窗口对第一识别信息进行划分不具有重叠的时间段时,可以划分为与12个月中每一个月对应的12个第二识别信息。当预设时间窗口对第一识别信息进行划分具有重叠的时间段时,以划分为13个或13个以上的第二识别信息。
在操作103中,根据待识别对象和第二交互信息确定与每一个第二识别信息对应的第一拓扑图。可以将待识别对象作为第一拓扑图的节点,根据第二交互信息对节点的连接边,例如,当第二识别信息为某一个时间段下的银行转账流水信息,在构建第一拓扑图时,可以将流水中出现的用户账号作为第一拓扑图的拓扑节点,即每一个拓扑节点对应位一个待识别对象,然后根据用户账号之间的转账情况及其他交互情况构建节点之间的连接边,从而获得第一拓扑图。例如,如果两个用户账号之间如果有转账关系,那么就确定与两个用户账号对应的两个节点之间形成有连接边。根据银行转账流水信息确定与所有节点对应的连接边,获得第一拓扑图。
图2a示出了本发明实施例一种基于动态图的对象识别方法确定t1时段确定拓扑图的实现场景示意图;图2b示出了本发明实施例一种基于动态图的对象识别方法确定t2时段确定拓扑图的实现场景示意图;
参见图2a和图2b,当根据用户账号的网络关系构建第一拓扑图时,首先,将用户网络关系划分为t1时段和t2时段,其中,t1时段和t2时段在时间上没有重叠的时间范围。且t1时段的尾时间戳和t2时段的头时间戳是连续的,且t1时段早于t2时段。图中,V1、V2…V6即为与每一个用户对应的拓扑节点,用于连接拓扑节点的连接边用于表征用户之间是否具有网络关系,连接边上的W12、W13……W46用于表征网络连接关系的具体内容。
在操作104中,由于每一个第二交互信息均对应有第一拓扑图,对每一张第一拓扑图进行向量转换,即可获得与每一个第二交互信息对应的识别向量,根据所有识别向量确定识别向量集。
在操作105中,通过信息识别模型对识别向量集进行识别,确定与待识别对象对应的身份类型。其中,身份类型可以包括具有特定身份和不具有特定身份两种类型。即,识别待识别对象是否属于特定身份类型,特定身份类型可以是黑产身份类型、诈骗身份类型、正常身份类型中的一项或多项。
可以理解的是,在操作101-操作104中,识别信息和交互信息均为该特定身份相关的信息。例如,当需要判断用户账号的身份类型为是否为黑产账号的时候,对应的交互信息可以为用户账号对应的转账流水。信息识别模型为循环神经网络GRU模型,由于识别向量集中每一个识别向量在时间段上具有差异性,能够刻画待识别用户在第一识别信息对应的时间段内的动态变化,当身份类型对应的交互信息在随时间变化具有变化规律的情况下,利用该信息识别模型对识别向量集进行挖掘,能够挖掘出待识别用户时间的变化规律,有助于识别该类身份类型。
图3为本发明实施例一种基于动态图的对象识别方法确定第二拓扑图的实现流程示意图。
参见图3,在一可实施方式中,操作103,根据待识别对象和第二交互信息确定与每一个第二识别信息对应的第一拓扑图,包括:操作1031,根据预设维度对第二交互信息进行多维度特征提取,获得多维度特征集,多维度特征集包含多个维度特征;操作1032,根据待识别对象和维度特征,确定与每一个维度特征对应的第二拓扑图;操作1033,根据第二拓扑图,确定与第二识别信息对应的第一拓扑图。
可以理解的是,在交互信息中,可以至少一个交互维度,例如,在银行流水中,能够获得的交互维度包括与账户对应的不同业务维度、与账户对应的转账情况维度、与账户对应的网络地址维度、与账户对应的设备标识维度等。在构建第一拓扑图的情况下,可以根据与每一交互维度对应的维度特征构建一个第二拓扑图,然后整合所有第二拓扑图确定第一拓扑图。即,第二拓扑图为第一拓扑图的子图。
具体的,在操作1031中,预设维度可以是与身份类型相关的维度,例如,当身份类型为黑产账号或黑产身份的情况下,预设维度可以为转账维度、业务维度、共享IP维度、设备数量维度、设备标识维度等。根据预设维度对第二交互信息进行多维度特征提取,即可获得与每一个维度对应的维度特征,根据所有提取的维度特征确定多维度特征集,预设维度的数量、维度特征集中的维度数量、与所构建的第二拓扑图的数量一致。
在操作1032中,根据待识别对象和维度特征,确定与每一个维度特征对应的第二拓扑图。然后,根据待识别对象和每一维度特征进行拓扑图的构建,获得与第二拓扑图,具体的,可以以待识别对象为拓扑图的节点,由维度特征确定连接拓扑图节点的连接边,进一步的,在构建第二拓扑图时,待识别对象的数量可以和第二交互信息中待识别对象的数量保持一致。
图4示出了本发明实施例一种基于动态图的对象识别方法确定第二拓扑图的实现场景示意图。
结合图2a和图4,例如,第二交互信息中待识别对象包括V1-V6,当对第二交互信息的预设维度B进行维度特征提取时,获得的维度特征只能用于表征V1、V2、V3、V4、V6之间存在交互关系,那么在构建第二拓扑图时,仍然以V1-V6确定拓扑节点,然后仅构建V1、V2、V3、V4、V6的连接边,V5与V1、V2、V3、V4、V6之间无连接边,但V5仍然需要展示在第二拓扑图中。
在操作1033中,根据第二拓扑图,确定与第二识别信息对应的第一拓扑图。即根据所有第二拓扑图所构建的第二拓扑图集,即为第一拓扑图,可以理解的是,当维度特征只有一个维度的情况下,提取到的第二拓扑图为一张,此时,第二拓扑图即可作为第一拓扑图使用。
在一可实施方式中,操作1032,根据待识别对象和维度特征,确定与每一个维度特征对应的第二拓扑图,包括:首先,根据第二交互信息确定与待识别对象信息交互的其他对象,根据其他对象和待识别对象确定拓扑节点;然后,根据维度特征确定用于连接拓扑节点的连接边;再后,根据拓扑节点和连接边获得第二拓扑图,维度特征集包含如下维度特征至少之一:用于表征待识别对象与其他对象数据交互频率的第一维度特征,用于表征待识别对象与其他对象网络地址关系的第二维度特征,用于表征所述待识别对象与其他对象对应的设备标识关系的第三维度特征。
当第一交互信息为银行流水信息时,第一特征维度可以为待识别账号之间的转账频率,第二特征维度可以为待识别对象与其他对象是否存在共享网络地址。
具体的,根据第一维度特征构建第二拓扑图的策略为:对银行流水信息根据预设时间窗口进行截取后,获得截取流水信息;确定截取流水信息中所有出现的用户账号,将用户账号确定为拓扑节点;对截取流水信息进行转账关系的提取,确定用户账号之间的转账信息;两个其中两个用户账号之间存在转账关系,则在该两个用户账号之间形成连接边,进一步的,可以根据转账次数和转账金额中的一项或多项确定与该连接边对应的权值;
根据第二维度特征构建第二拓扑图的策略为:对银行流水信息根据预设时间窗口进行截取后,获得截取流水信息;确定截取流水信息中所有出现的用户账号,将用户账号确定为拓扑节点;对用户账号在操作时的网络地址进行提取,确定用户账号在操作时的网络地址;如果两个用户账号在操作时共享了同一网络地址,则在该两个用户账号之间形成连接边,进一步的,可以根据共享同一网络地址时的转账次数和转账金额中的一项或多项确定与该连接边对应的权值。
根据第三维度特征构建第二拓扑图的策略为:对银行流水信息根据预设时间窗口进行截取后,获得截取流水信息;确定截取流水信息中所有出现的用户账号,将用户账号确定为拓扑节点;对用户账号在操作时的设备标识进行提取,确定用户账号在操作时的设备标识;如果两个用户账号在操作时使用了同一设备标识,则在该两个用户账号之间形成连接边,进一步的,可以根据使用了同一设备标识时的转账次数、转账金额、使用同一设备标识的数量中的一项或多项确定与该连接边对应的权值。
图5为本发明实施例一种基于动态图的对象识别方法确定识别向量的实现流程示意图。
参见图5,在一可实施方式中,操作104,根据第一拓扑图确定与待识别对象对应的识别向量集,包括:操作1041,根据连接边确定与待识别对象的拓扑节点连接的邻居节点;邻居节点为拓扑节点中的至少之一;操作1042,对与邻居节点对应的其他对象进行向量编码,获得编码向量;操作1043,根据维度特征确定与连接边对应的权值;操作1044,对权值和编码向量进行整合,获得与待识别对象对应的维度向量;操作1045,对维度向量进行融合,获得与第一拓扑图对应的识别向量。
当第一拓扑图为第二拓扑图集的情况下,操作104需要根据每一张第二拓扑图确定与待识别对象对应的维度向量,然后对维度向量进行融合,以确定与第一拓扑图对应的识别向量,进一步的,由于每一张第一拓扑图均对应一个时间段,获得与所有第一拓扑图对应的识别向量,即可确定识别向量集,根据识别向量集,可以表征待识别对象在与第一识别信息对应的时间段内的第一交互信息的动态变化。
具体的,以对其中一张第二拓扑图进行向量化为例,在操作1041中,首先从该第二拓扑图中确定与待识别对象对应的拓扑节点,根据与该拓扑节点连接的连接边确定与该拓扑节点连接的邻居节点,可以理解的是,邻居节点也是第二拓扑图中其中至少一个拓扑节点。
在操作1042中,根据与邻居节点对应的对象信息进行向量编码,即可获得与邻居节点对应的编码向量,例如,当每一个拓扑节点表征一个用户账号,即对用户账号进行向量编码,获得编码向量。具体的,可以通过Embedding向量化对用户账号进行编码。可以理解的是,待识别对象同样需要通过Embedding向量化进行编码,以获得编码向量。
在操作1043中,可以理解的是,连接边用于表征拓扑节点之间存在有交互关系,而待识别对象与其他对象之间的交互关系是不同的,例如在银行流水中,待识别对象与其他对象之间的转账金额是不同的,基于此,为了能够对连接边所对应交互关系进行具体表征,本方法可以通过维度特征的具体内容确定与连接边对应的权值;例如,根据转账的次数或总金额确定权值的大小,还可以根据总金额的正负确定权值的正负。
在操作1044中,根据权值和编码向量进行与维度向量函数构建,根据函数确定在该第二拓扑图中与待识别对象对应的维度向量。在维度向量函数还可以包含待识别对象的编码向量。
在一种具体实施情况下,维度向量函数可以表征为:
Figure 192333DEST_PATH_IMAGE001
其中,
Figure 922523DEST_PATH_IMAGE002
表征与待识别对象对应的维度向量,下标i标识对应的拓扑节点,T代 表由预设时间窗口划分获得的时间段,M代表维度;
Figure 171102DEST_PATH_IMAGE003
表征与待识别对象对应的编码向量,
Figure 159786DEST_PATH_IMAGE004
表征与待识别对象对应的邻居节点集合的编码向量;
Figure 443000DEST_PATH_IMAGE005
表征待识别对象与邻居节点之 间连接边的权值。
根据上述方式,可以得到待识别对象所对应的拓扑节点在每一个维度下的维度向 量
Figure 609671DEST_PATH_IMAGE006
在操作1045中,确定与每一张第二拓扑图对应的维度向量,然后对所有维度向量进行融合,即可获得与第一拓扑图对应的识别向量。其中,维度向量的融合可以采用向量拼接的方式进行融合,在一种具体实施方式下,其具体公式可以为:
Figure 611125DEST_PATH_IMAGE007
根据上述方式,可以得到待识别对象所对应的拓扑节点在每一个预设时间窗口下 的识别向量
Figure 137921DEST_PATH_IMAGE008
在一可实施方式中,操作1043,根据维度特征确定与连接边对应的权值,包括:首先,根据维度特征确定与连接边对应的特征频率;然后,根据特征频率确定与连接边对应的权值。
在一种具体实施方式中,连接边对应的权值可以通过与连接边对应的维度特征的特征频率进行确定,例如,维度特征为转账时,特征频率可以为转账次数。需要说明的是,不同第二拓扑图的权值可以独立构建。
在一可实施方式中,方法还包括:首先,获得与识别向量集对应的样本向量集;然后,通过样本向量集对循环神经网络进行训练,获得信息识别模型,其中,信息识别模型用于识别与待识别对象对应的身份类型。
本方法在对循环神经网络进行训练过程中,采用的训练样本的预处理方式与上述识别向量集的构建方式相同,通过对训练样本进行第一拓扑图和第二拓扑图的构建,可获得与训练样本对应的样本向量集,然后可以按照时间段的前后顺序将样本向量集中每一个样本向量输入到循环神经网络GRU模型中进行训练,可以获得信息识别模型。
图6为本发明实施例一种基于动态图的对象识别方法信息识别模型的信息提取结构图。
参见图6,本方法的信息识别模型为循环神经网络GRU模型,通过将识别特征集输入到循环神经网络GRU模型中,然后将GRU模型在最后一时刻的输出向量作为整个GRU模型的输出值,将输出值输入给一个全连接神经网络,最后接一个分类输出层,根据分类输出层的输出值即可确定与待识别对象对应的身份类型的分类。根据需要分类输出层可以为二分类或二分类以上的多分类输出层。
为方便上述实施方式的进一步理解,以下提供一种具体实施场景,在该具体实施场景中,本方法应用于银行领域,对银行账户中的黑产账户进行识别。
本方法首先获得训练样本,训练样本为银行两年期的交易流水信息,训练样本中标注有黑产账号。然后根据预设时间窗口对交易流水信息进行划分,预设时间窗口为一个月,划分规则为每一个划分获得的时段流水信息在时间段内没有重叠。获得24个时段流水信息。确定时段流水信息中的账号信息,将账号信息确定为拓扑节点,然后对时段流水信息进行维度特征提取,确定维度特征,根据维度特征构建拓扑节点的连接边,获得与该维度特征对应的拓扑子图,整合所有维度特征对应的拓扑子图,获得与该时段流水信息对应的拓扑图。对拓扑子图的拓扑节点进行向量样本编码,获得编码向量样本,根据拓扑子图的连接边确定权值,根据拓扑节点及其邻居节点和连接边对应的权值确定与该拓扑节点对应的维度向量样本;对拓扑节点对应的所有维度向量样本进行拼接,获得识别向量样本。根据每一个时段流水信息确定识别向量样本,获得与该拓扑节点对应的识别向量样本集。应用相同方式,获得与每一个拓扑节点对应的识别向量样本集。
通过与每一个拓扑节点对应的识别向量样本集对循环神经网络GRU模型进行训练,获得能够对是否属于黑产账号进行分类的对象识别模型。
当需要对指定用户识别是否属于黑产账号的情况下,获得与指定用户对应的识别信息,然后对识别信息进行第一拓扑图和第二拓扑图的构建,根据第一拓扑图和第二拓扑图确定与识别信息对应的识别向量集,将识别向量集输入对象识别模型进行识别,根据对象识别模型的输出值即可确定指定用户是否属于黑产账号。进一步的,根据模型训练过程中的参数设置,输出值还可以为确定指定用户属于黑产账号的概率。
图7为本发明实施例一种基于动态图的对象识别装置的实现模块示意图。
参见图7,本发明实施例另一方面提供一种基于动态图的对象识别装置,装置包括:获得模块701,用于获得第一识别信息,第一识别信息包含待识别对象和与待识别对象对应的第一交互信息;划分模块702,用于根据预设时间窗口对第一识别信息进行划分,获得多个第二识别信息,第二识别信息包含待识别对象和与待识别对象对应的第二交互信息;确定模块703,用于根据待识别对象和第二交互信息确定与每一个第二识别信息对应的第一拓扑图;确定模块703,还用于根据第一拓扑图确定与待识别对象对应的识别向量集,识别向量集包含与每一个第二识别信息对应的识别向量;识别模块704,用于通过信息识别模型对识别向量集进行识别,确定与待识别对象对应的身份类型。
在一可实施方式中,确定模块703,包括:提取子模块7031,用于根据预设维度对第二交互信息进行多维度特征提取,获得多维度特征集,多维度特征集包含多个维度特征;确定子模块7032,用于根据待识别对象和维度特征,确定与每一个维度特征对应的第二拓扑图;确定子模块7032,还用于根据第二拓扑图,确定与第二识别信息对应的第一拓扑图。
在一可实施方式中,维度特征集包含如下维度特征至少之一:用于表征待识别对象与其他对象数据交互频率的第一维度特征,用于表征待识别对象与其他对象网络地址关系的第二维度特征,用于表征所述待识别对象与其他对象对应的设备标识关系的第三维度特征。
在一可实施方式中,确定子模块7032,包括:根据第二交互信息确定与待识别对象信息交互的其他对象,根据其他对象和待识别对象确定拓扑节点;根据维度特征确定用于连接拓扑节点的连接边;根据拓扑节点和连接边获得第二拓扑图。
在一可实施方式中,确定模块703,包括:确定子模块7032,还用于根据连接边确定与待识别对象的拓扑节点连接的邻居节点;邻居节点为拓扑节点中的至少之一;编码子模块7033,用于对与邻居节点对应的其他对象进行向量编码,获得编码向量;确定子模块7032,还用于根据维度特征确定与连接边对应的权值;整合子模块7034,用于对权值和编码向量进行整合,获得与待识别对象对应的维度向量;融合子模块7035,用于对维度向量进行融合,获得与第一拓扑图对应的识别向量。
在一可实施方式中,确定子模块7032,包括:根据维度特征确定与连接边对应的特征频率;根据特征频率确定与连接边对应的权值。
在一可实施方式中,装置还包括:获得模块701,还用于获得与识别向量集对应的样本向量集;训练模块705,用于通过样本向量集对循环神经网络进行训练,获得信息识别模型,其中,信息识别模型用于识别与待识别对象对应的身份类型。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种基于动态图的对象识别方法,其特征在于,所述方法包括:
获得第一识别信息,所述第一识别信息包含待识别对象和与所述待识别对象对应的第一交互信息;
根据预设时间窗口对所述第一识别信息进行划分,获得多个第二识别信息,所述第二识别信息包含所述待识别对象和与所述待识别对象对应的第二交互信息;
根据所述待识别对象和所述第二交互信息确定与每一个第二识别信息对应的第一拓扑图;
根据所述第一拓扑图确定与所述待识别对象对应的识别向量集,所述识别向量集包含与每一个第二识别信息对应的识别向量;
通过信息识别模型对所述识别向量集进行识别,确定与所述待识别对象对应的身份类型。
2.根据权利要求1所述的方法,其特征在于,所述根据所述待识别对象和所述第二交互信息确定与每一个第二识别信息对应的第一拓扑图,包括:
根据预设维度对所述第二交互信息进行多维度特征提取,获得多维度特征集,所述多维度特征集包含多个维度特征;
根据待识别对象和所述维度特征,确定与每一个维度特征对应的第二拓扑图;
根据所述第二拓扑图,确定与第二识别信息对应的第一拓扑图。
3.根据权利要求2所述的方法,其特征在于,所述多维度特征集包含如下维度特征至少之一:用于表征所述待识别对象与其他对象数据交互频率的第一维度特征,用于表征待识别对象与其他对象网络地址关系的第二维度特征,用于表征所述待识别对象与其他对象对应的设备标识关系的第三维度特征。
4.根据权利要求2所述的方法,其特征在于,根据待识别对象和所述维度特征,确定与每一个维度特征对应的第二拓扑图,包括:
根据所述第二交互信息确定与所述待识别对象信息交互的其他对象,根据所述其他对象和所述待识别对象确定拓扑节点;
根据所述维度特征确定用于连接所述拓扑节点的连接边;
根据所述拓扑节点和连接边获得第二拓扑图。
5.根据权利要求4所述的方法,其特征在于,所述根据所述第一拓扑图确定与所述待识别对象对应的识别向量集,包括:
根据所述连接边确定与所述待识别对象的拓扑节点连接的邻居节点;所述邻居节点为所述拓扑节点中的至少之一;
对与所述邻居节点对应的其他对象进行向量编码,获得编码向量;
根据所述维度特征确定与所述连接边对应的权值;
对所述权值和所述编码向量进行整合,获得与所述待识别对象对应的维度向量;
对所述维度向量进行融合,获得与所述第一拓扑图对应的识别向量。
6.根据权利要求5所述的方法,其特征在于,所述根据所述维度特征确定与所述连接边对应的权值,包括:
根据所述维度特征确定与所述连接边对应的特征频率;
根据所述特征频率确定与所述连接边对应的权值。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获得与所述识别向量集对应的样本向量集;
通过所述样本向量集对循环神经网络进行训练,获得信息识别模型,其中,所述信息识别模型用于识别与所述待识别对象对应的身份类型。
8.一种基于动态图的对象识别装置,其特征在于,所述装置包括:
获得模块,用于获得第一识别信息,所述第一识别信息包含待识别对象和与所述待识别对象对应的第一交互信息;
划分模块,用于根据预设时间窗口对所述第一识别信息进行划分,获得多个第二识别信息,所述第二识别信息包含所述待识别对象和与所述待识别对象对应的第二交互信息;
确定模块,用于根据所述待识别对象和所述第二交互信息确定与每一个第二识别信息对应的第一拓扑图;
所述确定模块,还用于根据所述第一拓扑图确定与所述待识别对象对应的识别向量集,所述识别向量集包含与每一个第二识别信息对应的识别向量;
识别模块,用于通过信息识别模型对所述识别向量集进行识别,确定与所述待识别对象对应的身份类型。
9.根据权利要求8所述的装置,其特征在于,所述确定模块,包括:
提取子模块,用于根据预设维度对所述第二交互信息进行多维度特征提取,获得多维度特征集,所述多维度特征集包含多个维度特征;
确定子模块,用于根据待识别对象和所述维度特征,确定与每一个维度特征对应的第二拓扑图;
所述确定子模块,还用于根据所述第二拓扑图,确定与第二识别信息对应的第一拓扑图。
10.根据权利要求9所述的装置,其特征在于,所述维度特征集包含如下维度特征至少之一:用于表征所述待识别对象与其他对象数据交互频率的第一维度特征,用于表征待识别对象与其他对象网络地址关系的第二维度特征,用于表征所述待识别对象与其他对象对应的设备标识关系的第三维度特征。
CN202110207196.1A 2021-02-25 2021-02-25 一种基于动态图的对象识别方法及装置 Active CN112559310B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110207196.1A CN112559310B (zh) 2021-02-25 2021-02-25 一种基于动态图的对象识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110207196.1A CN112559310B (zh) 2021-02-25 2021-02-25 一种基于动态图的对象识别方法及装置

Publications (2)

Publication Number Publication Date
CN112559310A true CN112559310A (zh) 2021-03-26
CN112559310B CN112559310B (zh) 2021-06-08

Family

ID=75034631

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110207196.1A Active CN112559310B (zh) 2021-02-25 2021-02-25 一种基于动态图的对象识别方法及装置

Country Status (1)

Country Link
CN (1) CN112559310B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108985309A (zh) * 2017-05-31 2018-12-11 腾讯科技(深圳)有限公司 一种数据处理方法以及装置
CN109784013A (zh) * 2017-11-14 2019-05-21 阿里巴巴集团控股有限公司 一种信息识别的方法、装置以及设备
WO2019143360A1 (en) * 2018-01-19 2019-07-25 Visa International Service Association Data security using graph communities
CN110619261A (zh) * 2019-03-05 2019-12-27 北方工业大学 基于多特征融合的人体交互行为识别方法、系统及装置
CN110990718A (zh) * 2019-11-27 2020-04-10 国网能源研究院有限公司 一种公司形象提升系统的社会网络模型构建模块
CN111753266A (zh) * 2019-03-29 2020-10-09 阿里巴巴集团控股有限公司 用户认证方法、多媒体内容的推送方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108985309A (zh) * 2017-05-31 2018-12-11 腾讯科技(深圳)有限公司 一种数据处理方法以及装置
CN109784013A (zh) * 2017-11-14 2019-05-21 阿里巴巴集团控股有限公司 一种信息识别的方法、装置以及设备
WO2019143360A1 (en) * 2018-01-19 2019-07-25 Visa International Service Association Data security using graph communities
CN110619261A (zh) * 2019-03-05 2019-12-27 北方工业大学 基于多特征融合的人体交互行为识别方法、系统及装置
CN111753266A (zh) * 2019-03-29 2020-10-09 阿里巴巴集团控股有限公司 用户认证方法、多媒体内容的推送方法及装置
CN110990718A (zh) * 2019-11-27 2020-04-10 国网能源研究院有限公司 一种公司形象提升系统的社会网络模型构建模块

Also Published As

Publication number Publication date
CN112559310B (zh) 2021-06-08

Similar Documents

Publication Publication Date Title
CN108009915B (zh) 一种欺诈用户社区的标记方法及相关装置
CN111932130B (zh) 业务类型识别方法及装置
CN110443120A (zh) 一种人脸识别方法及设备
CN110046297B (zh) 运维违规操作的识别方法、装置和存储介质
CN112989059A (zh) 潜在客户识别方法及装置、设备及可读计算机存储介质
CN111652732A (zh) 一种基于交易图匹配的比特币异常交易实体识别方法
CN106878242B (zh) 一种确定用户身份类别的方法及装置
CN113939831A (zh) 理解深度学习模型
CN115456093A (zh) 一种基于注意力图神经网络的高性能图聚类方法
CN111460315A (zh) 社群画像构建方法、装置、设备及存储介质
CN112925899B (zh) 排序模型建立方法、案件线索推荐方法、装置及介质
CN112559310B (zh) 一种基于动态图的对象识别方法及装置
CN110222187B (zh) 保护用户隐私的共同活动检测与数据共享方法
CN114723554B (zh) 异常账户识别方法及装置
CN113239127B (zh) 科技服务关联网络的构建、依赖关系的识别方法及计算机产品
CN112632219B (zh) 一种垃圾短信的拦截方法和拦截装置
CN114817557A (zh) 基于企业征信大数据知识图谱的企业风险检测方法和装置
Muhuri et al. An edge contribution-based approach to identify influential nodes from online social networks
CN108564380B (zh) 一种基于迭代决策树的电信用户分类方法
CN111523034A (zh) 一种应用程序的处理方法、装置、设备及介质
CN115907770B (zh) 一种基于时序特征融合的以太坊钓鱼欺诈识别与预警方法
CN107766422A (zh) 一种签到数据的映射方法及设备
CN113723522B (zh) 异常用户的识别方法、装置、电子设备以及存储介质
Wang Revisiting network sampling
CN117131460A (zh) 一种电信欺诈账户识别模型训练方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant