CN110472680B - 目标分类方法、装置和计算机可读存储介质 - Google Patents

目标分类方法、装置和计算机可读存储介质 Download PDF

Info

Publication number
CN110472680B
CN110472680B CN201910730878.3A CN201910730878A CN110472680B CN 110472680 B CN110472680 B CN 110472680B CN 201910730878 A CN201910730878 A CN 201910730878A CN 110472680 B CN110472680 B CN 110472680B
Authority
CN
China
Prior art keywords
target
feature vector
fusion
targets
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910730878.3A
Other languages
English (en)
Other versions
CN110472680A (zh
Inventor
何源
王新左
尹泽夏
张钧波
郑宇�
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jingdong City Beijing Digital Technology Co Ltd
Original Assignee
Jingdong City Beijing Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jingdong City Beijing Digital Technology Co Ltd filed Critical Jingdong City Beijing Digital Technology Co Ltd
Priority to CN201910730878.3A priority Critical patent/CN110472680B/zh
Publication of CN110472680A publication Critical patent/CN110472680A/zh
Application granted granted Critical
Publication of CN110472680B publication Critical patent/CN110472680B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features

Abstract

本公开涉及一种目标分类方法、装置和计算机可读存储介质,涉及人工智能技术领域。该方法包括:根据各目标的相关数据,确定各目标的特征向量;根据各目标之间的关联关系,确定各目标的关联目标;对目标的特征向量及其关联目标的特征向量进行数据融合处理,确定该目标的融合特征向量;根据各目标的融合特征向量,利用机器学习模型对各目标进行分类。本公开的技术方案能够提高目标分类的准确性。

Description

目标分类方法、装置和计算机可读存储介质
技术领域
本公开涉及人工智能技术领域,特别涉及一种目标分类方法、目标分类装置和计算机可读存储介质。
背景技术
随着数据处理技术和人工智能技术的发展,能够根据提取的目标特征向量对目标进行分类。
在相关技术中,分别对各目标进行特征向量提取,根据目标各自的特征向量进行分类。
发明内容
本公开的发明人发现上述相关技术中存在如下问题:孤立地考虑目标特征,使得目标的特征描述不准确,从而导致目标分类不准确。
鉴于此,本公开提出了一种目标分类技术方案,能够提高目标分类的准确性。
根据本公开的一些实施例,提供了一种目标分类方法,包括:根据各目标的相关数据,确定所述各目标的特征向量;根据所述各目标之间的关联关系,确定所述各目标的关联目标;对目标的特征向量及其关联目标的特征向量进行数据融合处理,确定该目标的融合特征向量;根据所述各目标的融合特征向量,利用机器学习模型对所述各目标进行分类。
在一些实施例中,所述对目标的特征向量及其关联目标的特征向量进行数据融合处理,确定该目标的融合特征向量包括:对目标的特征向量及其关联目标的特征向量进行非线性融合处理,确定该目标的融合特征向量。
在一些实施例中,所述对目标的特征向量及其关联目标的特征向量进行非线性融合处理包括:利用非线性聚合函数对目标的特征向量及其关联目标的特征向量进行融合处理。
在一些实施例中,所述对目标的特征向量及其关联目标的特征向量进行数据融合处理,确定该目标的融合特征向量包括:将所述各目标的融合特征向量分别作为所述各目标新的特征向量;根据目标的新的特征向量及其关联目标的新的特征向量,确定该目标的新的融合特征向量;重复上述迭代过程,直到满足迭代停止条件。
在一些实施例中,所述对目标的特征向量及其关联目标的特征向量进行非线性融合处理包括:对目标的特征向量及其关联目标的特征向量的加权和进行非线性融合处理。
在一些实施例中,目标的特征向量的权值根据该目标的所述相关数据确定,该目标的关联目标的特征向量的权值和该目标与该关联目标之间的关联强度正相关。
在一些实施例中,所述目标的第一特征向量的权值及其关联目标的权值利用所述机器学习模型通过学习进行更新。
在一些实施例中,所述的目标分类方法还包括:在目标的所述特征向量的分量缺少当前时刻数据的情况下,根据关于该分量的历史数据确定该分量的当前时刻数据。
在一些实施例中,所根据关于该分量的历史数据确定该分量的当前时刻数据包括:将该目标关于该分量的任一历史数据作为该分量的当前数据;或者根据该目标的各关联目标关于该分量的数据均值或中位数,确定该目标的该分量的当前数据。
根据本公开的另一些实施例,提供一种目标分类装置,包括:特征确定单元,用于根据各目标的相关数据,确定所述各目标的特征向量;关联确定单元,用于根据所述各目标之间的关联关系,确定所述各目标的关联目标;融合单元,用于对目标的特征向量及其关联目标的特征向量进行数据融合处理,确定该目标的融合特征向量;分类单元,用于根据所述各目标的融合特征向量,利用机器学习模型对所述各目标进行分类。
根据本公开的又一些实施例,提供一种目标分类装置,包括:存储器;和耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器装置中的指令,执行上述任一个实施例中的目标分类方法。
根据本公开的再一些实施例,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一个实施例中的目标分类方法。
在上述实施例中,将目标及其关联目标的特征向量进行融合,生成包含目标关联关系的融合特征向量。由于融合特征向量能够更准确地对目标进行描述,因此依据融合特征向量对目标进行分类能够提高目标分类的准确性。
附图说明
构成说明书的一部分的附图描述了本公开的实施例,并且连同说明书一起用于解释本公开的原理。
参照附图,根据下面的详细描述,可以更加清楚地理解本公开,其中:
图1示出本公开的目标分类方法的一些实施例的流程图;
图2示出本公开的目标分类方法的一些实施例的示意图;
图3示出图1中步骤130的一些实施例的流程图;
图4示出本公开的目标分类装置的一些实施例的框图;
图5示出本公开的目标分类装置的另一些实施例的框图;
图6示出本公开的目标分类的又一些实施例的框图。
具体实施方式
现在将参照附图来详细描述本公开的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。
同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为授权说明书的一部分。
在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
图1示出本公开的目标分类方法的一些实施例的流程图。
如图1所示,该方法包括:步骤110,确定特征向量;步骤120,确定关联目标;步骤130,确定融合特征向量;和步骤140,对各目标进行分类。
在步骤110中,根据各目标的相关数据,确定各目标的特征向量。例如,待分类的目标可以是人、物品或者团体等。可以将提取的相关数据作为各分量以生成多维的特征向量。
在一些实施例中,目标可以是人,相关数据可以是能够表征个人特点的各种基本信息。例如,可以从官方渠道获取个人的各种注册信息,如性别、姓名、住址、身份等等。注册信息不易被篡改,可以作为对人进行分类进而进行评估等处理的可靠依据。
另外,也可以从互联网上抓取个人的上网数据、行为数据等,从中抽取个人的属性信息作为相关数据。例如,人的爱好、消费情况、常去的地点等等。这类信息可以进一步提高分类模型的分析准确率。
在一些实施例中,目标可以是团体,如企业,相关数据可以是能够表征团体特点的各种基本信息。例如,可以从国家企业信用信息公示系统抓取的各种注册信息,如注册金额、法人变更次数、注册地等等。注册信息不易被篡改,可以作为对企业进行分类进而进行评估等处理的可靠依据。
另外,也可以从征信系统获取企业近期的财报数据作为相关数据。例如,净销售收入、销售成本、税前收益、净利润等等。这类信息可以进一步提高分类模型的分析准确率。
在一些实施例中,可以根据提取的相关数据确定相应的字段,将这些字段作为特征向量的分量,将相应的相关数据作为分量的分量值。
在一些实施例中,某些字段可能缺少具体的相关数据。例如,个人的注册信息不完整,会导致人的特征向量某些维度的分量缺少分量值。在这种情况下,可以通过对特征向量进行预处理进行填充。
在一些实施例中,在目标的特征向量的分量缺少当前时刻数据的情况下,根据关于该分量的历史数据确定该分量的当前时刻数据。
例如,可以将该目标关于该分量的任一历史数据作为该分量的当前数据。这种预处理方法适用于随时间变化较小的相关数据,如人的身高、常去地点、企业的人数、注册金额等。
例如,可以根据该目标关于该分量的历史数据均值,确定该分量的当前数据。
例如,可以根据该目标的各关联目标关于该分量的数据均值或中位数,确定该目标的该分量的当前数据。这种预处理方法可以利用总体样本均值填充缺失字段的数值,即计算样本全集的均值作为填补值。这种预处理方法使用于变换较频繁的相关数据,如人的活动范围、通话次数,或者企业相关的行业通用指标,如法人变更频率、企业违约次数等。
在步骤120中,根据各目标之间的关联关系,确定各目标的关联目标。
在一些实施例中,在目标是人的情况下,可以根据人之间的互动确定人之间的关联关系。例如,可以根据人之间通讯关系确定人之间的关联关系进而建立关联网络,通信次数越高关系强度越强。
在一些实施例中,有的人与任何人都没有通讯关系,这使得这个人成为关联网络中的孤立点。在这种情况下,可以根据这个人的相关数据确定与这个人有关系的其他人作为扩展目标,如这个人的亲属或朋友等;然后将与该扩展目标有通讯关系的人作为这个人的关联目标,从而消除孤立点对算法执行带来的影响。
在一些实施例中,在目标是企业的情况下,可以根据企业之间的投资关系确定企业之间的关联关系。例如,可以根据企业的股东信息确定企业之间的关联关系进而建立关联网络,投资金额越大关系强度越强。
例如,部分企业既没有股东,也并非其他企业股东,即企业与任何企业都没有投资关系,这使得该企业成为关联网络中孤立点。在这种情况下,可以将该企业的负责人,如法人或高管等,涉及的其他企业作为该企业的关联目标,从而消除孤立点对算法执行带来的影响。
在一些实施例中,可以根据图2的方式构建关联关系。
图2示出本公开的目标分类方法的一些实施例的示意图。
如图2所示,存在目标A、目标B、目标C、目标D共4个目标。可以确定各目标的特征向量为FA、FB、FC、FD。根据这4个目标之间的关联关系可以建立图2中的关联网络。
在一些实施例中,在目标是人的情况下,关联网络中的各节点为待分类的人,连接两个节点的无向边表示两个人之间存在的通讯关系。
在一些实施例中,在目标是企业的情况下,关联网络中的各节点为待分类的企业,连接两个节点的无向边表示两个企业之间存在的投资关系。
建立了关联网络,可以将各目标关联起来。相比于孤立地对目标进行特征描述,根据关联关系可以提高目标特征描述的准确性。基于该关联网络,可以继续利用图1中的步骤进行分类处理。
在步骤130中,对目标的特征向量及其关联目标的特征向量进行数据融合处理,确定该目标的融合特征向量。
在一些实施例中,对目标的特征向量及其关联目标的特征向量进行非线性融合处理,确定该目标的融合特征向量。例如,可以利用非线性聚合函数对目标的特征向量及其关联目标的特征向量进行融合处理。非线性融合可以使得分类模型更加贴近实际情况,从而提高分类准确性。
在一些实施例中,基于图2中的关联网络,可以对各目标的特征向量为FA、FB、FC、FD进行融合。例如,目标A的关联目标为目标B和目标C,则可以确定目标A的融合特征向量为:
F′A=σ(FA、FB、FC)=Relu(FA、FB、FC)
σ(·)为非线性聚合函数,Relu(·)为激活函数(线性整流函数)。类似地,可以确定目标B、目标C和目标D的融合特征向量分别为:
F′B=σ(FB、FA)、F′C=σ(FC、FA、FD)、F′D=σ(FD、FC)。
可以看出,融合特征向量中不但包含了目标自身的特征信息还融合了与目标有关联的目标的特征信息,从而能够更加准确地表征目标的特征,提高分类的准确性。
在一些实施例中,可以对目标的特征向量及其关联目标的特征向量的加权和进行非线性融合处理。例如,可以确定目标A的融合特征向量为:
Figure BDA0002160530400000071
FA的权值
Figure BDA0002160530400000072
可以根据目标A的相关数据确定。例如,目标A为一个人,可以根据这个人的基本信息确定,也可以根据机器学习方法根据后面的分类结果进行训练来确定。各权重的取值范围可以是[0,1]。
FB、FC作为关联目标的特征向量,权值
Figure BDA0002160530400000073
Figure BDA0002160530400000074
分别和目标A与关联目标B和C之间的关联强度正相关。例如,目标为人,则可以根据目标A与目标B之间的通讯次数确定
Figure BDA0002160530400000075
目标维切也,则可以根据目标A与目标B之间的投资金额确定
Figure BDA0002160530400000076
这样,当目标A的直接关联目标,如目标B的情况发生变化时,目标B的特征向量中隐含的与分类有关的信息就会传播到目标A,从而提高对目标A的分类准确性。而且,还可以根据权重调节隐含信息传播带来的影响大小,进一步提高分类准确性。
而且,目标的相关数据由于来源不同,导致无统一格式且可信度不足,通过融合方法能够使得各目标的相关数据互相补充,从而提高分类准确性。
在一些实施例中,可以通过图3中的实施例迭代执行步骤130,将目标的间接关联目标的信息传播给该目标,从而进一步提高分类准确性。
图3示出图1中步骤130的一些实施例的流程图。
如图3所示,步骤130包括:步骤1310,更新特征向量;步骤1320,更新融合特征向量;步骤1330,判断是否满足迭代停止条件;和步骤1340,确定融合特征向量。
在步骤1310中,将各目标的融合特征向量分别作为各目标新的特征向量。例如,将各目标的融合特征向量F′A、F′B、F′C、F′D作为各目标的新的特征向量,即作为新一轮融合的处理对象。
在步骤1320中,根据目标的新的特征向量及其关联目标的新的特征向量,确定该目标的新的融合特征向量。例如,基于图2中的关联关系,对特征向量F′A、F′B、F′C、F′D进行融合,得到新的融合特征向量。目标A的新的融合特征向量为:
F″A=σ(F′A、F′B、F′C)=σ(σ(FA、FB、FC)、σ(FB、FA)、σ(FC、FA、FD))
可以看出,经过第二轮融合后得到的目标A的融合特征向量中包含了与目标A间接相关的目标D的特征信息。类似地,可以得到目标B、目标C和目标D的第二轮融合后的融合特征向量F″A、F″B、F″C、F″D
在一些实施例中,不同轮的融合过程中,用到的各权值可以进行调整。例如,可以通过机器学习方法进行调整。
在步骤1330中,判断是否满足迭代停止条件。例如,迭代停止条件可以是迭代的次数,迭代的次数越多,得到的融合特征向量中的信息传播的越远。如果未满足迭代停止条件,重复执行步骤1310,即将各目标的融合特征向量F″A、F″B、F″C、F″D作为各目标的新的特征向量,即作为新一轮融合的处理对象;如果满足迭代停止条件,执行步骤1340。
在步骤1340中,将该轮融合结果确定为融合特征向量。
通过上述实施例,可以将目标的间接关联目标的信息传播给该目标,在关联目标的属性发生变化的情况下,及时预测目标的潜在分类变化,从而提高了预测的实时性,且进一步提高分类准确性。
在一些实施例中,得到了融合特征向量后,就可以继续通过图1中的步骤进行分类处理了。
在步骤140中,根据各目标的融合特征向量,利用机器学习模型对各目标进行分类。例如,机器学习模型可以是深度神经网络模型或者梯度提升决策树模型等分类模型。
在一些实施例中,在目标为人的情况下,可以将融合特征向量作为对人的描述信息,基于描述信息得到的分类结果可以对人进行识别、分析等进一步处理。例如,可以基于人属于各分类的概率生成对人的身份画像用于身份分析、兴趣识别等。
在一些实施例中,在目标为企业的情况下,可以将融合特征向量作为对企业的描述信息,基于描述信息得到的分类结果对企业的状况进行分析评估等进一步处理。例如,可以通过分类模型得到企业属于有风险企业的概率,从而对企业进行分析。
在一些实施例中,在得到各分类的概率后,可以进一步进行可视化处理,以得到更形象直观的结果展示,便于后续分析。可视化可以采用柱状图模式,例如风险越高的企业对应的立柱越高,颜色越深,所有企业按照风险从高到低顺序排列。用户可根据需求,选择对应企业,得到其详细的经营状况与股东数据,从总体到细节的掌握企业可能发生风险的分析结果。
在上述实施例中,将目标及其关联目标的特征向量进行融合,生成包含目标关联关系的融合特征向量。由于融合特征向量能够更准确地对目标进行描述,因此依据融合特征向量对目标进行分类能够提高目标分类的准确性。
图4示出本公开的目标分类装置的一些实施例的框图。
如图4所示,目标分类装置4包括特征确定单元41、关联确定单元42、融合单元43和分类单元44。
特征确定单元41根据各目标的相关数据,确定各目标的特征向量。例如,特征确定单元41在目标的特征向量的分量缺少当前时刻数据的情况下,根据关于该分量的历史数据确定该分量的当前时刻数据。特征确定单元41可以将该目标关于该分量的任一历史数据作为该分量的当前数据。特征确定单元41或者可以根据该目标的各关联目标关于该分量的数据均值或中位数,确定该目标的该分量的当前数据。特征确定单元41或者可以根据该目标关于该分量的历史数据均值,确定该分量的当前数据。
关联确定单元42根据各目标之间的关联关系,确定各目标的关联目标。融合单元43对目标的特征向量及其关联目标的特征向量进行数据融合处理,确定该目标的融合特征向量。分类单元44根据各目标的融合特征向量,利用机器学习模型对各目标进行分类。
在一些实施例中,融合单元43对目标的特征向量及其关联目标的特征向量进行非线性融合处理,确定该目标的融合特征向量。例如,可以利用非线性聚合函数对目标的特征向量及其关联目标的特征向量进行融合处理。
在一些实施例中,融合单元43可以对目标的特征向量及其关联目标的特征向量的加权和进行非线性融合处理。例如,目标的特征向量的权值可以根据该目标的相关数据确定,该目标的关联目标的特征向量的权值和该目标与该关联目标之间的关联强度正相关。目标的第一特征向量的权值及其关联目标的权值可以利用机器学习模型通过学习进行更新。
在一些实施例中,融合单元43将各目标的融合特征向量分别作为各目标新的特征向量;融合单元43根据目标的新的特征向量及其关联目标的新的特征向量,确定该目标的新的融合特征向量;融合单元43重复上述过程,直到满足迭代停止条件。
在上述实施例中,将目标及其关联目标的特征向量进行融合,生成包含目标关联关系的融合特征向量。由于融合特征向量能够更准确地对目标进行描述,因此依据融合特征向量对目标进行分类能够提高目标分类的准确性。
图5示出本公开的目标分类装置的另一些实施例的框图。
如图5所示,该实施例的目标分类装置5包括:存储器51以及耦接至该存储器51的处理器52,处理器52被配置为基于存储在存储器51中的指令,执行本公开中任意一个实施例中的目标分类方法。
其中,存储器51例如可以包括系统存储器、固定非易失性存储介质等。系统存储器例如存储有操作系统、应用程序、引导装载程序(Boot Loader)、数据库以及其他程序等。
图6示出本公开的目标分类的又一些实施例的框图。
如图6所示,该实施例的目标分类装置6包括:存储器610以及耦接至该存储器610的处理器620,处理器620被配置为基于存储在存储器610中的指令,执行前述任意一个实施例中的目标分类方法。
存储器610例如可以包括系统存储器、固定非易失性存储介质等。系统存储器例如存储有操作系统、应用程序、引导装载程序(Boot Loader)以及其他程序等。
目标分类装置6还可以包括输入输出接口630、网络接口640、存储接口650等。这些接口630、640、650以及存储器610和处理器620之间例如可以通过总线660连接。其中,输入输出接口630为显示器、鼠标、键盘、触摸屏等输入输出设备提供连接接口。网络接口640为各种联网设备提供连接接口。存储接口650为SD卡、U盘等外置存储设备提供连接接口。
本领域内的技术人员应当明白,本公开的实施例可提供为方法、系统、或计算机程序产品。因此,本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用非瞬时性存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
至此,已经详细描述了根据本公开的目标分类方法、目标分类装置和计算机可读存储介质。为了避免遮蔽本公开的构思,没有描述本领域所公知的一些细节。本领域技术人员根据上面的描述,完全可以明白如何实施这里公开的技术方案。
可能以许多方式来实现本公开的方法和系统。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本公开的方法和系统。用于所述方法的步骤的上述顺序仅是为了进行说明,本公开的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本公开实施为记录在记录介质中的程序,这些程序包括用于实现根据本公开的方法的机器可读指令。因而,本公开还覆盖存储用于执行根据本公开的方法的程序的记录介质。
虽然已经通过示例对本公开的一些特定实施例进行了详细说明,但是本领域的技术人员应该理解,以上示例仅是为了进行说明,而不是为了限制本公开的范围。本领域的技术人员应该理解,可在不脱离本公开的范围和精神的情况下,对以上实施例进行修改。本公开的范围由所附权利要求来限定。

Claims (11)

1.一种目标分类方法,包括:
根据各目标的相关数据,确定所述各目标的特征向量,在需要确定所述各目标的身份画像的情况下,所述相关数据包括能够表征所述各目标特点的基本信息、行为信息,在需要确定所述各目标的状况评估结果的情况下,所述相关数据包括能够表征所述各目标特点的基本信息、征信信息;
根据所述各目标之间的关联关系,确定所述各目标的关联目标;
对目标的特征向量及其关联目标的特征向量进行数据融合处理,确定该目标的融合特征向量;
根据所述各目标的融合特征向量,利用机器学习模型对所述各目标进行分类,以确定所述各目标的身份画像或状况评估结果;
其中,所述确定所述各目标的关联目标包括:
在所述各目标为人的情况下,根据人之间的互动关系确定所述关联关系;
在所述各目标为团体的情况下,根据团体之间的投资关系确定所述关联关系;
所述对目标的特征向量及其关联目标的特征向量进行数据融合处理,确定该目标的融合特征向量包括:
将所述各目标的融合特征向量分别作为所述各目标新的特征向量;
根据目标的新的特征向量及其关联目标的新的特征向量,确定该目标的新的融合特征向量;
重复上述过程,直到满足迭代停止条件。
2.根据权利要求1所述的目标分类方法,其中,所述对目标的特征向量及其关联目标的特征向量进行数据融合处理,确定该目标的融合特征向量包括:
对目标的特征向量及其关联目标的特征向量进行非线性融合处理,确定该目标的融合特征向量。
3.根据权利要求2所述的目标分类方法,其中,所述对目标的特征向量及其关联目标的特征向量进行非线性融合处理包括:
利用非线性聚合函数对目标的特征向量及其关联目标的特征向量进行融合处理。
4.根据权利要求2所述的目标分类方法,其中,所述对目标的特征向量及其关联目标的特征向量进行非线性融合处理包括:
对目标的特征向量及其关联目标的特征向量的加权和进行非线性融合处理。
5.根据权利要求4所述的目标分类方法,其中,
目标的特征向量的权值根据该目标的所述相关数据确定,该目标的关联目标的特征向量的权值和该目标与该关联目标之间的关联强度正相关。
6.根据权利要求4所述的目标分类方法,其中,
所述目标的特征向量的权值及其关联目标的特征向量的权值利用所述机器学习模型通过学习进行更新。
7.根据权利要求1-6任一项所述的目标分类方法,还包括:
在目标的所述特征向量的分量缺少当前时刻数据的情况下,根据关于该分量的历史数据确定该分量的当前时刻数据。
8.根据权利要求7所述的目标分类方法,其中,所述根据关于该分量的历史数据确定该分量的当前时刻数据包括:
将该目标关于该分量的任一历史数据作为该分量的当前数据;或者
根据该目标的各关联目标关于该分量的数据均值或中位数,确定该目标的该分量的当前数据。
9.一种目标分类装置,包括:
特征确定单元,用于根据各目标的相关数据,确定所述各目标的特征向量,在需要确定所述各目标的身份画像的情况下,所述相关数据包括能够表征所述各目标特点的基本信息、行为信息,在需要确定所述各目标的状况评估结果的情况下,所述相关数据包括能够表征所述各目标特点的基本信息、征信信息;
关联确定单元,用于根据所述各目标之间的关联关系,确定所述各目标的关联目标;
融合单元,用于对目标的特征向量及其关联目标的特征向量进行数据融合处理,确定该目标的融合特征向量;
分类单元,用于根据所述各目标的融合特征向量,利用机器学习模型对所述各目标进行分类,以确定所述各目标的身份画像或状况评估结果;
在所述各目标为人的情况下,所述关联确定单元根据人之间的互动关系确定所述关联关系;
在所述各目标为团体的情况下,所述关联确定单元根据团体之间的投资关系确定所述关联关系;
所述融合单元将所述各目标的融合特征向量分别作为所述各目标新的特征向量,根据目标的新的特征向量及其关联目标的新的特征向量,确定该目标的新的融合特征向量,重复上述过程,直到满足迭代停止条件。
10.一种目标分类装置,包括:
存储器;和
耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器装置中的指令,执行权利要求1-8任一项所述的目标分类方法。
11.一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现权利要求1-8任一项所述的目标分类方法。
CN201910730878.3A 2019-08-08 2019-08-08 目标分类方法、装置和计算机可读存储介质 Active CN110472680B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910730878.3A CN110472680B (zh) 2019-08-08 2019-08-08 目标分类方法、装置和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910730878.3A CN110472680B (zh) 2019-08-08 2019-08-08 目标分类方法、装置和计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN110472680A CN110472680A (zh) 2019-11-19
CN110472680B true CN110472680B (zh) 2021-05-25

Family

ID=68510493

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910730878.3A Active CN110472680B (zh) 2019-08-08 2019-08-08 目标分类方法、装置和计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN110472680B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114913986B (zh) * 2022-07-15 2022-10-14 四川大学华西医院 一种医疗对象聚类方法、装置、电子设备及存储介质

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101819572A (zh) * 2009-09-15 2010-09-01 电子科技大学 一种用户兴趣模型的建立方法
CN105183728A (zh) * 2014-05-30 2015-12-23 广州市邦富软件有限公司 一种微博中人物关联关系分析方法
GB201511334D0 (en) * 2015-06-29 2015-08-12 Nokia Technologies Oy A method, apparatus, computer and system for image analysis
CN106651427B (zh) * 2016-10-13 2020-02-11 中国工商银行股份有限公司 基于用户行为的数据关联方法
CN108268547A (zh) * 2016-12-29 2018-07-10 北京国双科技有限公司 用户画像生成方法和装置
CN108572967B (zh) * 2017-03-09 2022-03-15 神州数码系统集成服务有限公司 一种创建企业画像的方法及装置
CN107464037A (zh) * 2017-07-05 2017-12-12 九次方大数据信息集团有限公司 基于多指标维度模型的企业画像方法及系统
CN107506786B (zh) * 2017-07-21 2020-06-02 华中科技大学 一种基于深度学习的属性分类识别方法
CN108021670A (zh) * 2017-12-06 2018-05-11 中国南方航空股份有限公司 多源异构数据融合系统及方法
CN110019563B (zh) * 2018-08-09 2022-12-09 北京首钢自动化信息技术有限公司 一种基于多维数据的肖像建模方法和装置
CN109409677A (zh) * 2018-09-27 2019-03-01 深圳壹账通智能科技有限公司 企业信用风险评估方法、装置、设备及存储介质
CN109740620B (zh) * 2018-11-12 2023-09-26 平安科技(深圳)有限公司 人群画像分类模型的建立方法、装置、设备和存储介质
CN109739820A (zh) * 2018-12-29 2019-05-10 科技谷(厦门)信息技术有限公司 一种基于大数据分析的电子政务信息服务系统
CN109948067A (zh) * 2019-02-22 2019-06-28 哈尔滨工业大学(深圳) 一种融合信任用户隐语义lr模型的信息推送方法及系统
CN109948913A (zh) * 2019-03-01 2019-06-28 长沙理工大学 一种基于双层的xgboost算法的多源特征电力用户综合画像系统
CN110097278B (zh) * 2019-04-28 2021-06-08 广东省科技基础条件平台中心 一种科技资源智能共享融合训练系统和应用系统
CN110097472B (zh) * 2019-05-08 2022-12-27 腾讯科技(深圳)有限公司 一种社团属性识别方法及相关设备

Also Published As

Publication number Publication date
CN110472680A (zh) 2019-11-19

Similar Documents

Publication Publication Date Title
US20230013306A1 (en) Sensitive Data Classification
US20120136812A1 (en) Method and system for machine-learning based optimization and customization of document similarities calculation
CN108985929B (zh) 训练方法、业务数据分类处理方法及装置、电子设备
CN104573130B (zh) 基于群体计算的实体解析方法及装置
US11562262B2 (en) Model variable candidate generation device and method
CN109840413B (zh) 一种钓鱼网站检测方法及装置
CN111475613A (zh) 案件分类方法、装置、计算机设备及存储介质
CN112329816A (zh) 数据分类方法、装置、电子设备和可读存储介质
US20190392295A1 (en) Information processing device, method, and program that use deep learning
CN113656558B (zh) 基于机器学习对关联规则进行评估的方法及装置
CN110930017A (zh) 数据处理的方法及装置
WO2022142903A1 (zh) 身份识别方法、装置、电子设备及相关产品
CN112819024B (zh) 模型处理方法、用户数据处理方法及装置、计算机设备
CN110634060A (zh) 一种用户信用风险的评估方法、系统、装置及存储介质
Sasank et al. Credit card fraud detection using various classification and sampling techniques: a comparative study
CN115545103A (zh) 异常数据识别、标签识别方法和异常数据识别装置
CN113656699B (zh) 用户特征向量确定方法、相关设备及介质
CN114971294A (zh) 数据采集方法、装置、设备及存储介质
CN110472680B (zh) 目标分类方法、装置和计算机可读存储介质
CN113472860A (zh) 大数据和数字化环境下的业务资源分配方法及服务器
JP2015035172A (ja) 表情解析装置及び表情解析プログラム
US20220172271A1 (en) Method, device and system for recommending information, and storage medium
CN115619245A (zh) 一种基于数据降维方法的画像构建和分类方法及系统
CN115482084A (zh) 用于生成风控规则集的方法及装置
CN115310606A (zh) 基于数据集敏感属性重构的深度学习模型去偏方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant