CN114241206A - 目标对象的特征提取方法、装置、电子设备及存储介质 - Google Patents
目标对象的特征提取方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN114241206A CN114241206A CN202111432978.1A CN202111432978A CN114241206A CN 114241206 A CN114241206 A CN 114241206A CN 202111432978 A CN202111432978 A CN 202111432978A CN 114241206 A CN114241206 A CN 114241206A
- Authority
- CN
- China
- Prior art keywords
- nodes
- node
- target
- target node
- objects
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例提供的目标对象的特征提取方法、装置、电子设备及存储介质,应用于信息技术领域,可以获取待处理图数据,其中,所述待处理图数据包括多个对象中各所述对象对应的节点,各所述节点的节点信息为各所述节点对应的对象的维度特征,节点之间的边表示两个对象之间的行为特征;根据所述待处理图数据中的边,识别目标节点的邻居节点,其中,所述目标节点为所述多个对象中目标对象对应的节点;提取所述目标节点和所述目标节点的邻居节点的维度特征和行为特征。可以通过待处理图数据,识别目标节点的邻居节点,从而提取目标节点和目标节点的邻居节点的维度特征和行为特征,从而实现通过图数据实现目标对象的特征的获取。
Description
技术领域
本发明涉及信息技术领域,特别是涉及一种目标对象的特征提取方法、装置、电子设备及存储介质。
背景技术
目前,机器学习应用场景已经越来越广泛。在机器学习的多个环节中,而特征提取是整个机器学习流程中最为关键的一环,随着数据的多样性和丰富性,数据库中往往包含多种类型数据集,维度数据、序列型数据、图数据,其中维度数据即维度表,序列数据也即事件表,而图数据即为关系表。
然而,目前在进行特征提取时,一般仅仅是使用图数据、维度表、事件表等都是以单表形式进行特征提取,所提取的特征也较为单一。
发明内容
本发明实施例的目的在于提供一种目标对象的特征提取方法、装置、电子设备及存储介质,以实现提取多表之间的关联特征的目的。具体技术方案如下:
本申请实施例的第一方面,首先提供了一种目标对象的特征提取方法,包括:
获取待处理图数据,其中,所述待处理图数据包括多个对象中各所述对象对应的节点,各所述节点的节点信息为各所述节点对应的对象的维度特征,节点之间的边表示两个对象之间的行为特征;
根据所述待处理图数据中的边,识别目标节点的邻居节点,其中,所述目标节点为所述多个对象中目标对象对应的节点;
提取所述目标节点和所述目标节点的邻居节点的维度特征和行为特征。
可选的,所述获取待处理图数据,包括:
获取维度表、事件表和关系表,其中,所述维度表包括多个对象的维度特征,所述事件表包括所述多个对象的行为特征,所述关系表包括所述多个对象之间的关联关系;
根据所述维度表、事件表和关系表,生成所述待处理图数据。
可选的,所述提取所述目标节点和所述目标节点的邻居节点的维度特征和行为特征之后,所述方法还包括:
根据所述目标节点和所述目标节点的邻居节点的维度特征及行为特征对所述目标节点进行分类得到对应的分类结果。
可选的,所述根据所述待处理图数据中的边,识别目标节点的邻居节点,其中,所述目标节点为所述多个对象中目标对象对应的节点之后,所述方法还包括:
统计所述目标节点的邻居节点的数量和边的数量;
根据统计得到的邻居节点的数量和边的数量,计算得到基础图特征。
可选的,所述提取所述目标节点和所述目标节点的邻居节点的维度特征和行为特征,包括:
根据各节点的节点信息提取所述目标节点和所述目标节点的邻居节点的维度特征;
根据各节点之间的边信息提取所述目标节点和所述目标节点的邻居节点的行为特征。
可选的,所述根据各节点的节点信息提取所述目标节点和所述目标节点的邻居节点的维度特征,包括:
获取所述目标节点的邻居节点的维度特征;
对所述目标节点的邻居节点的维度特征进行聚合,得到所述目标节点的维度特征。
可选的,所述根据各节点之间的边信息提取所述目标节点和所述目标节点的邻居节点的行为特征,包括:
通过多个预设时间窗口对各节点之间的边信息进行统计,得到所述目标节点的邻居节点的行为特征;
对所述目标节点的邻居节点的行为特征进行聚合,得到所述目标节点的行为特征。
本申请实施例的第二方面,提供了一种目标对象的特征提取装置,包括:
数据获取模块,用于获取待处理图数据,其中,所述待处理图数据包括多个对象中各所述对象对应的节点,各所述节点的节点信息为各所述节点对应的对象的维度特征,节点之间的边表示两个对象之间的行为特征;
节点识别模块,用于根据所述待处理图数据中的边,识别目标节点的邻居节点,其中,所述目标节点为所述多个对象中目标对象对应的节点;
特征提取模块,用于提取所述目标节点和所述目标节点的邻居节点的维度特征和行为特征。
可选的,所述数据获取模块,包括:
表数据获取子模块,用于获取维度表、事件表和关系表,其中,所述维度表包括多个对象的维度特征,所述事件表包括所述多个对象的行为特征,所述关系表包括所述多个对象之间的关联关系;
图数据生成子模块,用于根据所述维度表、事件表和关系表,生成所述待处理图数据。
可选的,所述装置还包括:
节点分类模块,用于根据所述目标节点和所述目标节点的邻居节点的维度特征及行为特征对所述目标节点进行分类得到对应的分类结果。
可选的,所述装置还包括:
数量统计模块,用于统计所述目标节点的邻居节点的数量和边的数量;
特征计算模块,用于根据统计得到的邻居节点的数量和边的数量,计算得到基础图特征。
可选的,所述特征提取模块,包括:
维度特征提取子模块,用于根据各节点的节点信息提取所述目标节点和所述目标节点的邻居节点的维度特征;
行为特征提取子模块,用于根据各节点之间的边信息提取所述目标节点和所述目标节点的邻居节点的行为特征。
可选的,所述维度特征提取子模块,包括:
邻居维度特征提取单元,用于获取所述目标节点的邻居节点的维度特征;
邻居维度特征聚合单元,用于对所述目标节点的邻居节点的维度特征进行聚合,得到所述目标节点的维度特征。
可选的,所述行为特征提取子模块,包括:
行为特征统计单元,用于通过多个预设时间窗口对各节点之间的边信息进行统计,得到所述目标节点的邻居节点的行为特征;
行为特征聚合单元,用于对所述目标节点的邻居节点的行为特征进行聚合,得到所述目标节点的行为特征。
本申请实施例的另一方面,还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述任一目标对象的特征提取方法步骤。
本申请实施例的另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一目标对象的特征提取方法步骤。
本申请实施例的另一方面,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一目标对象的特征提取方法步骤。
本发明实施例有益效果:
本发明实施例提供的一种数据的特征提取方法、装置、电子设备及存储介质,可以获取待处理图数据,其中,所述待处理图数据包括多个对象中各所述对象对应的节点,各所述节点的节点信息为各所述节点对应的对象的维度特征,节点之间的边表示两个对象之间的行为特征;根据所述待处理图数据中的边,识别目标节点的邻居节点,其中,所述目标节点为所述多个对象中目标对象对应的节点;提取所述目标节点和所述目标节点的邻居节点的维度特征和行为特征。可见,通过本申请实施例的方法,可以通过待处理图数据,识别目标节点的邻居节点,从而提取目标节点和目标节点的邻居节点的维度特征和行为特征,从而实现通过图数据实现目标对象的特征的获取。
当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的实施例。
图1为本申请实施例提供的目标对象的特征提取方法的一种流程示意图;
图2为本申请实施例提供的获取基础图特征的一种流程示意图;
图3为本申请实施例提供的获取维度特征和行为特征的一种流程示意图;
图4为本申请实施例提供的获取目标节点的维度特征的一种流程示意图;
图5为本申请实施例提供的获取目标节点的行为特征的一种流程示意图;
图6为本申请实施例提供的目标对象的特征提取装置的一种结构示意图;
图7为本申请实施例提供的电子设备的一种结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员基于本申请所获得的所有其他实施例,都属于本发明保护的范围。
首先,对本申请实施例中可能用到的专业名词进行解释:
图数据:即由点和边构成的图,通常表现为节点与节点通过边连接起来,而边带有或者不带有权重,多个节点连接在一起形成图,而图数据则是表示这样一种数据存储情况,类似于序列数据,以序列的形式存在;
特征工程:主要包含特征构建与特征选择,主要是将原始数据经过一定的加工,形成较为规整或较为有区分度的特征,在模型效果上起到较为关键的作用。
本申请实施例的第一方面,首先提供了一种目标对象的特征提取方法,包括:
获取待处理图数据,其中,待处理图数据包括多个对象中各对象对应的节点,各节点的节点信息为各节点对应的对象的维度特征,节点之间的边表示两个对象之间的行为特征;
根据待处理图数据中的边,识别目标节点的邻居节点,其中,目标节点为多个对象中目标对象对应的节点;
提取目标节点和目标节点的邻居节点的维度特征和行为特征。
可见,通过本申请实施例的方法,可以通过待处理图数据,识别目标节点的邻居节点,从而提取目标节点和目标节点的邻居节点的维度特征和行为特征,从而实现通过图数据实现目标对象的特征的获取。
具体的,参见图1,图1为本申请实施例提供的目标对象的特征提取方法的一种流程示意图,包括:
步骤S11,获取待处理图数据。
其中,待处理图数据包括多个对象中各对象对应的节点,各节点的节点信息为各节点对应的对象的维度特征,节点之间的边表示两个对象之间的行为特征。其中,维度特征可以是指各个对象的属性信息,如,学历、住址、所在公司等,两个对象之间的行为特征可以是指交易行为等行为的特征。
其中,本申请实施例中的对象可以是指人也可以其他类型的对象。例如,可以人物、公司等。当目标对象为某一目标人物时,该目标对象的关联对象可以是与目标人物存在关联关系的人或其他对象,例如,可以是该目标认为的同事、朋友、同学等,也可以是该目标人物就职的公司、所属的社团等。
本申请实施例中的待处理图数据可以是通过维度表、事件表和关系表生成的图数据。可选的,获取待处理图数据,包括:获取维度表、事件表和关系表,其中,维度表包括多个对象的维度特征,事件表包括多个对象的行为特征,关系表包括多个对象之间的关联关系;根据维度表、事件表和关系表,生成待处理图数据。在获取某一对象和该对象的关联对象的维度表和行为表时,针对获取该对象的维度表,可以获取多种属性信息,如,学历、住址、所在公司等,组成的维度表,针对获取某一对象的行为表时,可以获取历史交易行为、交易金额等组成的行为表。然后根据获取的维度表和行为表生成对应的图数据,其中,本申请实施例中的待处理图数据可以为由节点和边构成的图,可以表现为节点与节点通过边连接起来,而边带有或者不带有权重,通过多个节点连接在一起形成图数据。通过该图数据表示的数据存储情况,可以为序列数据,以序列的形式存在。
本申请实施例的方法应用于智能终端,可以通过智能终端实施,具体的,该智能终端可以是电脑、手机或服务器等。
步骤S12,根据待处理图数据中的边,识别目标节点的邻居节点。
其中,目标节点可以为多个对象中目标对象对应的节点。根据待处理图数据中的边,识别目标节点的邻居节点,可以识别图数据中目标节点的一阶和二阶邻居节点。由于图数据中边可以表示节点对应的对象之间的关联关系,通过识别到的目标节点的一阶和二阶邻居节点,根据一阶和二阶邻居节点进行进一步的节点信息的提取,而无需针对每一节点均进行节点信息的提取,从而可以减小计算量,提高计算效率。
步骤S13,提取目标节点和目标节点的邻居节点的维度特征和行为特征。
在提取目标节点和目标节点的邻居节点的维度特征和行为特征时,可以获取目标节点和目标节点的多个邻居节点的多种类型的信息。例如,目标节点和邻居节点均是人时,可以获取目标节点和目标节点的邻居节点的学历、收入、住址等信息。再例如,目标节点是人,而邻居节点是就职的公司时,可以获取目标节点的学历、收入、住址等信息,以及邻居节点的就职人员的数量、公司地址、经营现状、所属行业等信息。
可选的,提取目标节点和目标节点的邻居节点的维度特征和行为特征之后,上述方法还包括:根据目标节点和目标节点的邻居节点的维度特征及行为特征对目标节点进行分类得到对应的分类结果。其中,根据目标节点和目标节点的邻居节点的维度特征及行为特征对目标节点进行分类,可以统计每一类别的节点的数量,以及该类别的节点占邻居节点总数量的比例。例如,针对各个节点的对应的对象的学历,统计本科以上人员对应的节点的数量,以及本科以上人员占邻居节点对应邻居节点中所有人员总数量的比例。
在实际使用过程中,本申请实施例的方法还可以应用于模型的训练等领域,例如,可以将提取到的目标对象对应的特征输入到待训练的网络模型,进行模型的训练。
可见,通过本申请实施例的方法,可以通过待处理图数据,识别目标节点的邻居节点,从而提取目标节点和目标节点的邻居节点的维度特征和行为特征,从而实现通过图数据实现目标对象的特征的获取。
可选的,参见图2,根据待处理图数据中的边,识别目标节点的邻居节点之后,上述方法还包括:
步骤S21,统计目标节点的邻居节点的数量和边的数量;
步骤S22,根据统计得到的邻居节点的数量和边的数量,计算得到基础图特征。
其中,根据统计得到的邻居节点的数量和边的数量,计算得到基础图特征,可以根据预设属性类别对目标节点和邻居节点的节点信息进行分类,获取对应的邻居节点的数量。例如,可以获取:目标人员以及同事、朋友等的学历、收入、住址等信息,以及就职公司的就职人员的数量、公司地址、经营现状、所属行业等信息。在根据预设属性类别对目标节点和邻居节点的节点信息进行分类,可以预先设定多种类别,如:学历、行业、收入等,然后根据预设指标对邻居节点进行分类,得到每一类别对应的对象的数量、占总的对象的比例等信息。例如,针对学历,统计邻居节点中本科以上学历的人员的数量和占邻居节点的比例,再例如,针对行业,统计邻居节点中从事金融行业的人员的数量和占邻居节点中所有人员的比例。
由于现实中,一个对象特征往往与该对象的关联对象的特征相似。例如,高学历人员的同学、朋友、同事等,也往往是高学历人员,一个坏人节点,周围坏人也会比较多。因此,可以通过目标对象对应的目标节点的邻居节点的节点信息进行聚合得到目标对象的特征。
可选的,参见图3,提取目标节点和目标节点的邻居节点的维度特征和行为特征,包括:
步骤S31,根据各节点的节点信息提取目标节点和目标节点的邻居节点的维度特征;
步骤S32,根据各节点之间的边信息提取目标节点和目标节点的邻居节点的行为特征。
可选的,参见图4,步骤S31根据各节点的节点信息提取目标节点和目标节点的邻居节点的维度特征,包括:
步骤S311,获取目标节点的邻居节点的维度特征;
步骤S312,对目标节点的邻居节点的维度特征进行聚合,得到目标节点的维度特征。
本申请实施例中,当维度特征为不可以进行量化的信息,例如,学历、是否未婚等。对目标节点的邻居节点的维度特征进行聚合,可以对维度特征中各个指定标签进行聚合,例如,当维度特征为学历时,指定标签可以是本科及以上人员。在针对指定标签,根据多个邻居属性信息,识别标注有指定标签的对象的数量时,可以识别目标节点的邻居节点的节点信息中,包括标签类型的信息的节点中,符合该指定标签的节点的数量。在计算标注有指定标签的对象的数量占多个对象的总数量的比例时,可以通过目标节点的邻居节点的节点信息中包括标签类型的信息的节点中,符合该指定标签的节点的数量除以目标节点的邻居节点的节点信息中包括标签类型的信息的节点的数量。例如,针对各个节点的对应的对象的学历,统计本科以上人员对应的节点的数量,然后统计邻居节点中人员的总数量,最后通过计算本科以上人员对应的节点的数量占邻居节点中所有人员总数量的比例。
由于目标节点的邻居节点中存在于该节点不同类型的节点,如目标节点为人时,邻居节点可以是该人员就职的公司,而在计算对应的比例时,计算该节点无意义,因此,通过识别目标节点的邻居节点的节点信息中包括标签类型的信息的节点可以提高计算的效率和数据的有效性。
可选的,参见图5,步骤S32根据各节点之间的边信息提取目标节点和目标节点的邻居节点的行为特征,包括:
步骤S321,通过多个预设时间窗口对各节点之间的边信息进行统计,得到目标节点的邻居节点的行为特征;
步骤S322,对目标节点的邻居节点的行为特征进行聚合,得到目标节点的行为特征。
其中,通过多个预设时间窗口对各节点之间的边信息进行统计,得到目标节点的邻居节点的行为特征,对目标节点的邻居节点的行为特征进行聚合,可以通过设定时间窗口进行信息的切分,然后进行聚合。具体的,可以进行滚动切分,切成多份,分别获取每一份对应的节点的统计特征。具体的,本申请实施例中的将序列滚动切分,可以是进行分段截取,也可以是全序列截取。例如,可以将序列进行滚动切分,切成x份,获得节点的统计特征。例如,针对目标对象的交易行为,可以设定时间窗口,如,前一周交易行为,然后进行统计,得到前一周的花销作为统计结果。
可见,通过本申请实施例的方法,可以通过对象之间的关联关系确定目标对象对应的邻居节点,从而通过获取目标对象的邻居节点的节点信息并进行聚合计算得到多个聚合信息,并将该多个聚合信息作为目标对象对应的特征,从而实现通过图数据直接进行目标对象的特征的获取。
为了说明本申请实施例的方法,以下结合具体实施例进行说明,包括:
1)基础图特征提取,对基础的图数据集上的特征进行提取。
2)维度表特征在图上聚合,将邻居节点的各种属性进行聚合计算。
3)行为表特征在图上聚合,将序列滚动切分,获得节点的统计特征:选择某个窗口时间截面内数据进行特征构建,计算一阶、二阶邻居的行为数据的统计分布特征;对所有邻居总交易次数进行聚合,并获取关于每个时间unit的统计分布特征。
本申请实施例的第二方面,提供了一种目标对象的特征提取装置,参见图6,包括:
数据获取模块601,用于获取待处理图数据,其中,待处理图数据包括多个对象中各对象对应的节点,各节点的节点信息为各节点对应的对象的维度特征,节点之间的边表示两个对象之间的行为特征;
节点识别模块602,用于根据待处理图数据中的边,识别目标节点的邻居节点,其中,目标节点为多个对象中目标对象对应的节点;
特征提取模块603,用于提取目标节点和目标节点的邻居节点的维度特征和行为特征。
可选的,数据获取模块601,包括:
表数据获取子模块,用于获取维度表、事件表和关系表,其中,维度表包括多个对象的维度特征,事件表包括多个对象的行为特征,关系表包括多个对象之间的关联关系;
图数据生成子模块,用于根据维度表、事件表和关系表,生成待处理图数据。
可选的,上述装置还包括:
节点分类模块,用于根据目标节点和目标节点的邻居节点的维度特征及行为特征对目标节点进行分类得到对应的分类结果。
可选的,上述装置还包括:
数量统计模块,用于统计目标节点的邻居节点的数量和边的数量;
特征计算模块,用于根据统计得到的邻居节点的数量和边的数量,计算得到基础图特征。
可选的,特征提取模块603,包括:
维度特征提取子模块,用于根据各节点的节点信息提取目标节点和目标节点的邻居节点的维度特征;
行为特征提取子模块,用于根据各节点之间的边信息提取目标节点和目标节点的邻居节点的行为特征。
可选的,维度特征提取子模块,包括:
邻居维度特征提取单元,用于获取目标节点的邻居节点的维度特征;
邻居维度特征聚合单元,用于对目标节点的邻居节点的维度特征进行聚合,得到目标节点的维度特征。
可选的,行为特征提取子模块,包括:
行为特征统计单元,用于通过多个预设时间窗口对各节点之间的边信息进行统计,得到目标节点的邻居节点的行为特征;
行为特征聚合单元,用于对目标节点的邻居节点的行为特征进行聚合,得到目标节点的行为特征。
可见,通过本申请实施例的装置,可以通过待处理图数据,识别目标节点的邻居节点,从而提取目标节点和目标节点的邻居节点的维度特征和行为特征,从而实现通过图数据实现目标对象的特征的获取。
本发明实施例还提供了一种电子设备,如图7所示,包括处理器701、通信接口702、存储器703和通信总线704,其中,处理器701,通信接口702,存储器703通过通信总线704完成相互间的通信,
存储器703,用于存放计算机程序;
处理器701,用于执行存储器703上所存放的程序时,实现如下步骤:
获取待处理图数据,其中,待处理图数据包括多个对象中各对象对应的节点,各节点的节点信息为各节点对应的对象的维度特征,节点之间的边表示两个对象之间的行为特征;
根据待处理图数据中的边,识别目标节点的邻居节点,其中,目标节点为多个对象中目标对象对应的节点;
提取目标节点和目标节点的邻居节点的维度特征和行为特征。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一目标对象的特征提取方法的步骤。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一目标对象的特征提取方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备、存储介质及计算机程序产品实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
Claims (11)
1.一种目标对象的特征提取方法,其特征在于,包括:
获取待处理图数据,其中,所述待处理图数据包括多个对象中各所述对象对应的节点,各所述节点的节点信息为各所述节点对应的对象的维度特征,节点之间的边表示两个对象之间的行为特征;
根据所述待处理图数据中的边,识别目标节点的邻居节点,其中,所述目标节点为所述多个对象中目标对象对应的节点;
提取所述目标节点和所述目标节点的邻居节点的维度特征和行为特征。
2.根据权利要求1所述的方法,其特征在于,所述获取待处理图数据,包括:
获取维度表、事件表和关系表,其中,所述维度表包括多个对象的维度特征,所述事件表包括所述多个对象的行为特征,所述关系表包括所述多个对象之间的关联关系;
根据所述维度表、事件表和关系表,生成所述待处理图数据。
3.根据权利要求1所述的方法,其特征在于,所述提取所述目标节点和所述目标节点的邻居节点的维度特征和行为特征之后,所述方法还包括:
根据所述目标节点和所述目标节点的邻居节点的维度特征及行为特征对所述目标节点进行分类得到对应的分类结果。
4.根据权利要求1所述的方法,其特征在于,所述根据所述待处理图数据中的边,识别目标节点的邻居节点,其中,所述目标节点为所述多个对象中目标对象对应的节点之后,所述方法还包括:
统计所述目标节点的邻居节点的数量和边的数量;
根据统计得到的邻居节点的数量和边的数量,计算得到基础图特征。
5.根据权利要求1所述的方法,其特征在于,所述提取所述目标节点和所述目标节点的邻居节点的维度特征和行为特征,包括:
根据各节点的节点信息提取所述目标节点和所述目标节点的邻居节点的维度特征;
根据各节点之间的边信息提取所述目标节点和所述目标节点的邻居节点的行为特征。
6.根据权利要求5所述的方法,其特征在于,所述根据各节点的节点信息提取所述目标节点和所述目标节点的邻居节点的维度特征,包括:
获取所述目标节点的邻居节点的维度特征;
对所述目标节点的邻居节点的维度特征进行聚合,得到所述目标节点的维度特征。
7.根据权利要求5所述的方法,其特征在于,所述根据各节点之间的边信息提取所述目标节点和所述目标节点的邻居节点的行为特征,包括:
通过多个预设时间窗口对各节点之间的边信息进行统计,得到所述目标节点的邻居节点的行为特征;
对所述目标节点的邻居节点的行为特征进行聚合,得到所述目标节点的行为特征。
8.一种目标对象的特征提取装置,其特征在于,包括:
数据获取模块,用于获取待处理图数据,其中,所述待处理图数据包括多个对象中各所述对象对应的节点,各所述节点的节点信息为各所述节点对应的对象的维度特征,节点之间的边表示两个对象之间的行为特征;
节点识别模块,用于根据所述待处理图数据中的边,识别目标节点的邻居节点,其中,所述目标节点为所述多个对象中目标对象对应的节点;
特征提取模块,用于提取所述目标节点和所述目标节点的邻居节点的维度特征和行为特征。
9.根据权利要求8所述的装置,其特征在于,所述数据获取模块,包括:
表数据获取子模块,用于获取维度表、事件表和关系表,其中,所述维度表包括多个对象的维度特征,所述事件表包括所述多个对象的行为特征,所述关系表包括所述多个对象之间的关联关系;
图数据生成子模块,用于根据所述维度表、事件表和关系表,生成所述待处理图数据。
10.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-7任一所述的方法步骤。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-7任一所述的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111432978.1A CN114241206A (zh) | 2021-11-29 | 2021-11-29 | 目标对象的特征提取方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111432978.1A CN114241206A (zh) | 2021-11-29 | 2021-11-29 | 目标对象的特征提取方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114241206A true CN114241206A (zh) | 2022-03-25 |
Family
ID=80751766
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111432978.1A Pending CN114241206A (zh) | 2021-11-29 | 2021-11-29 | 目标对象的特征提取方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114241206A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116979540A (zh) * | 2023-09-25 | 2023-10-31 | 南方电网数字电网研究院有限公司 | 基于图技术的换流站潮流估计方法、装置、设备和介质 |
-
2021
- 2021-11-29 CN CN202111432978.1A patent/CN114241206A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116979540A (zh) * | 2023-09-25 | 2023-10-31 | 南方电网数字电网研究院有限公司 | 基于图技术的换流站潮流估计方法、装置、设备和介质 |
CN116979540B (zh) * | 2023-09-25 | 2024-02-27 | 南方电网数字电网研究院有限公司 | 基于图技术的换流站潮流估计方法、装置、设备和介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Pacheco et al. | Uncovering coordinated networks on social media | |
CN110188198B (zh) | 一种基于知识图谱的反欺诈方法及装置 | |
CN107168854B (zh) | 互联网广告异常点击检测方法、装置、设备及可读存储介质 | |
CN105824813B (zh) | 一种挖掘核心用户的方法及装置 | |
US8756071B2 (en) | Methods and apparatus for queue-based cluster analysis | |
CN111858928B (zh) | 一种基于图结构对抗学习的社交媒体谣言检测方法及装置 | |
CN107392022A (zh) | 爬虫识别、处理方法及相关装置 | |
US20200090058A1 (en) | Model variable candidate generation device and method | |
CN111639696A (zh) | 一种用户分类方法及装置 | |
CN112287039A (zh) | 一种团伙识别方法及相关装置 | |
CN114241206A (zh) | 目标对象的特征提取方法、装置、电子设备及存储介质 | |
CN111914542A (zh) | 疑似非法集资市场主体识别方法、装置、终端及存储介质 | |
CN111831817B (zh) | 问卷生成分析方法、装置、计算机设备及可读存储介质 | |
Sureka | Kernel based sequential data anomaly detection in business process event logs | |
CN114817377B (zh) | 基于用户画像的数据风险检测方法、装置、设备及介质 | |
CN107402984B (zh) | 一种基于主题的分类方法及装置 | |
CN111428041A (zh) | 案件摘要生成方法、装置、系统和存储介质 | |
CN115936748A (zh) | 一种商业大数据分析方法及系统 | |
CN110570301B (zh) | 风险识别方法、装置、设备及介质 | |
CN110399399B (zh) | 用户分析的方法、装置、电子设备和存储介质 | |
CN112699659A (zh) | 房源虚假信息识别方法、装置、电子设备及存储介质 | |
CN112712270A (zh) | 信息处理方法、装置、设备及存储介质 | |
CN112347102A (zh) | 多表拼接方法和多表拼接装置 | |
CN113077292A (zh) | 一种用户分类方法、装置、存储介质及电子设备 | |
CN111882415A (zh) | 一种质量检测模型的训练方法和相关装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |