CN107633022A - 人员画像分析方法、装置及存储介质 - Google Patents
人员画像分析方法、装置及存储介质 Download PDFInfo
- Publication number
- CN107633022A CN107633022A CN201710738678.3A CN201710738678A CN107633022A CN 107633022 A CN107633022 A CN 107633022A CN 201710738678 A CN201710738678 A CN 201710738678A CN 107633022 A CN107633022 A CN 107633022A
- Authority
- CN
- China
- Prior art keywords
- label
- personnel
- sample
- portrait
- personal information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种人员画像分析方法,所述方法包括:接收用户的操作指令,从所述操作指令中提取基础标签和所述基础标签对应的标签规则;获取样本人员的样本人员信息,所述样本人员信息为反映所述样本人员个人特征的信息;将所述样本人员信息与各标签规则进行匹配,将匹配成功的标签规则对应的基础标签作为所述样本人员的人员标签;根据所述人员标签构建所述样本人员的人员画像。本发明还公开了一种人员画像分析装置及存储介质。由于预设了标签规则,将样本人员信息与标签规则直接进行匹配,可以在基础标签中快速得出符合样本人员的标签,简单快速。
Description
技术领域
本发明涉及人员画像技术领域,尤其涉及一种人员画像分析方法、装置及存储介质。
背景技术
如今,互联网已进入了“大数据时代”,人们聚焦于如何挖掘大数据的潜在价值,而在公安领域如何通过有效的技术手段对人员进行管理,并提供快速检索的机制来查找涉案嫌疑人是一大难题。因此大数据使得公安部门能够通过互联网便利地获取人员更为广泛的个人信息,为进一步精准、快速地分析人员行为习惯、涉案情形等重要信息,提供了足够的数据基础。伴随着对大数据的利用逐渐深入,悄然兴起了人员画像的概念,通过人员的个人信息为人员赋予标签,这些标签即构成人员的人员画像,人员画像包括个人的基本属性(如年龄、性别等)和一系列标签(如涉毒人员),即抽象出了个人的信息,从而实现利用大数据提取出人员画像进行人员管理。
目前在公安领域分析得出人员画像的方法一般是通过多个渠道,比如户籍信息渠道、水电信息渠道,获取人员的个人信息,再针对个人信息进行数据加载、数据清洗、数据合并、数据转换过程提取关键词作为用户的标签,由于人员信息获取的渠道多样化,需对个人信息进行多维处理,导致生成人员标签的效率低,分析得出人员画像的效率低。因此,需要一种高效率生成人员画像的方法。
发明内容
本发明的主要目的在于提供一种人员画像分析方法、装置及存储介质,旨在解决现有技术中生成人员画像效率低的技术问题。
为实现上述目的,本发明提供一种人员画像分析方法,所述方法包括以下步骤:
接收用户的操作指令,从所述操作指令中提取基础标签和所述基础标签对应的标签规则;
获取样本人员的样本人员信息,所述样本人员信息为反映所述样本人员个人特征的信息;
将所述样本人员信息与各标签规则进行匹配,将匹配成功的标签规则对应的基础标签作为所述样本人员的人员标签;
根据所述人员标签构建所述样本人员的人员画像。
优选地,
优选地,所述获取样本人员的样本人员信息的步骤,具体包括:
获取所述样本人员的结构化信息;
对所述结构化信息依次进行数据清洗、数据转换和数据集成,得到第一人员信息;
将所述第一人员信息作为所述样本人员信息。
优选地,所述获取样本人员的样本人员信息的步骤,还包括:
获取所述样本人员的非结构化信息,提取所述非结构化信息中的第二人员信息;
相应地,所述将所述第一人员信息作为所述样本人员信息,具体包括:
将所述第一人员信息和所述第二人员信息作为所述样本人员信息。
优选地,所述根据所述人员标签构建所述样本人员的人员画像,具体包括:
根据所述人员标签构建所述样本人员的微观画像,所述微观画像为反映所述样本人员的全部特征的人员标签集合;
在所述人员标签中查找最高级别的标签,根据查找到的标签构建所述样本人员的宏观画像,所述宏观画像为反映所述样本人员的部分特征的人员标签集合;
将所述微观画像和所述宏观画像作为所述样本人员的人员画像,并将所述人员画像保存于预设画像库中。
优选地,所述将所述人员画像保存于预设画像库中之后,所述方法还包括:
接收用户输入的查询指令,在预设索引表中查找所述查询指令中的待查询标签;
在查找到所述待查询标签时,获得与所述待查询标签对应的人员标识;
根据所述人员标识在所述预设画像库中查找所述人员标识对应的人员画像。
优选地,所述接收用户的操作指令,根据所述操作指令获取基础标签和所述基础标签对应的标签规则的步骤之后,所述方法还包括:
对所述基础标签进行分类,得到标签类别和各基础标签的第一对应关系,并根据所述第一对应关系建立第一标签索引表;
相应地,所述在预设索引表中查找所述查询指令中的待查询标签的步骤,具体包括:
获取所述查询指令中的待查询标签的标签类别,并根据所述待查询标签的标签类别在所述第一标签索引表中查找所述待查询标签。
优选地,所述接收用户的操作指令,根据所述操作指令获取基础标签和所述基础标签对应的标签规则的步骤之后,所述方法还包括:
对所述基础标签进行分级,得到标签级别和各基础标签的第二对应关系,并根据所述第二对应关系建立第二标签索引表;
优选地,所述根据所述人员标识在所述预设画像库中查找所述人员标识对应的人员画像之后,所述方法还包括:
获取所述人员标签的准确率,在所述准确率低于阈值时,重新获取样本人员的样本人员信息,并返回所述将所述样本人员信息与各标签规则进行匹配,将匹配成功的标签规则对应的基础标签作为所述样本人员的人员标签的步骤。
此外,为实现上述目的,本发明还提供一种人员画像分析装置,所述人员画像分析装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的人员画像分析程序,所述人员画像分析程序被所述处理器执行时实现所述人员画像分析方法的步骤。
此外,为实现上述目的,本发明还提供一种存储介质,所述存储介质上存储有人员画像分析程序,所述人员画像分析程序被处理器执行时实现所述人员画像分析方法的步骤。
在本发明中,通过接收用户的操作指令,从所述操作指令中提取基础标签和所述基础标签对应的标签规则;获取样本人员的样本人员信息,所述样本人员信息为反映所述样本人员个人特征的信息;将所述样本人员信息与各标签规则进行匹配,将匹配成功的标签规则对应的基础标签作为所述样本人员的人员标签;根据所述人员标签构建所述样本人员的人员画像。由于预设了标签规则,将样本人员信息与标签规则直接进行匹配,可以在基础标签中快速得出符合样本人员的标签,简单快速。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的人员画像分析装置结构示意图;
图2为本发明人员画像分析方法第一实施例的流程示意图;
图3为本发明人员画像分析方法第二实施例的流程示意图;
图4为本发明人员画像分析方法第三实施例的流程示意图;
图5为本发明人员画像分析方法第四实施例的流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
参照图1,图1为本发明实施例方案涉及的硬件运行环境的人员画像分析装置结构示意图。
如图1所示,所述人员画像分析装置可以包括:处理器1001,例如CPU,通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
所述人员画像分析装置可为服务器或其他与网络连接的物理设备。
本领域技术人员可以理解,图1中示出的结构并不构成对所述人员画像分析装置的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及人员画像分析程序。
在图1所示的装置中,网络接口1004主要用于连接其他服务器,与所述其他服务器进行数据通信;用户接口1003主要用于连接用户终端,与用户终端进行数据通信;所述装置通过处理器1001调用存储器1005中存储的人员画像分析程序,并执行以下操作:
接收用户的操作指令,从所述操作指令中提取基础标签和所述基础标签对应的标签规则;
获取样本人员的样本人员信息,所述样本人员信息为反映所述样本人员个人特征的信息;
将所述样本人员信息与各标签规则进行匹配,将匹配成功的标签规则对应的基础标签作为所述样本人员的人员标签;
根据所述人员标签构建所述样本人员的人员画像。
进一步地,处理器1001可以调用存储器1005中存储的人员画像分析程序,还执行以下操作:
获取所述样本人员的结构化信息;
对所述结构化信息依次进行数据清洗、数据转换和数据集成,得到第一人员信息;
将所述第一人员信息作为所述样本人员信息。
进一步地,处理器1001可以调用存储器1005中存储的人员画像分析程序,还执行以下操作:
获取所述样本人员的非结构化信息,提取所述非结构化信息中的第二人员信息;
相应地,所述将所述第一人员信息作为所述样本人员信息,具体包括:
将所述第一人员信息和所述第二人员信息作为所述样本人员信息。
进一步地,处理器1001可以调用存储器1005中存储的人员画像分析程序,还执行以下操作:
根据所述人员标签构建所述样本人员的微观画像,所述微观画像为反映所述样本人员的全部特征的人员标签集合;
在所述人员标签中查找最高级别的标签,根据查找到的标签构建所述样本人员的宏观画像,所述宏观画像为反映所述样本人员的部分特征的人员标签集合;
将所述微观画像和所述宏观画像作为所述样本人员的人员画像,并将所述人员画像保存于预设画像库中。
进一步地,处理器1001可以调用存储器1005中存储的人员画像分析程序,还执行以下操作:
接收用户输入的查询指令,在预设索引表中查找所述查询指令中的待查询标签;
在查找到所述待查询标签时,获得与所述待查询标签对应的人员标识;
根据所述人员标识在所述预设画像库中查找所述人员标识对应的人员画像。
进一步地,处理器1001可以调用存储器1005中存储的人员画像分析程序,还执行以下操作:
对所述基础标签进行分类,得到标签类别和各基础标签的第一对应关系,并根据所述第一对应关系建立第一标签索引表;
相应地,所述在预设索引表中查找所述查询指令中的待查询标签的步骤,具体包括:
获取所述查询指令中的待查询标签的标签类别,并根据所述待查询标签的标签类别在所述第一标签索引表中查找所述待查询标签。
进一步地,处理器1001可以调用存储器1005中存储的人员画像分析程序,还执行以下操作:
对所述基础标签进行分级,得到标签级别和各基础标签的第二对应关系,并根据所述第二对应关系建立第二标签索引表;
相应地,所述在预设索引表中查找所述查询指令中的待查询标签的步骤,具体包括:
获取所述查询指令中的待查询标签的标签级别,并根据所述待查询标签的标签级别在所述第二标签索引表中查找所述待查询标签。
进一步地,处理器1001可以调用存储器1005中存储的人员画像分析程序,还执行以下操作:
获取所述人员标签的准确率,在所述准确率低于阈值时,重新获取样本人员的样本人员信息,并返回所述将所述样本人员信息与各标签规则进行匹配,将匹配成功的标签规则对应的基础标签作为所述样本人员的人员标签的步骤。
在本实施例中,通过接收用户的操作指令,从所述操作指令中提取基础标签和所述基础标签对应的标签规则;获取样本人员的样本人员信息,所述样本人员信息为反映所述样本人员个人特征的信息;将所述样本人员信息与各标签规则进行匹配,将匹配成功的标签规则对应的基础标签作为所述样本人员的人员标签;根据所述人员标签构建所述样本人员的人员画像。由于预设了标签规则,将样本人员信息与标签规则直接进行匹配,可以在基础标签中快速得出符合样本人员的标签,简单快速。
基于上述硬件结构,提出本发明人员画像分析方法的实施例。
参照图2,图2为本发明人员画像分析方法第一实施例的流程示意图。
在第一实施例中,所述人员画像分析方法包括以下步骤:
步骤S10:接收用户的操作指令,从所述操作指令中提取基础标签和所述基础标签对应的标签规则;
可以理解的是,由用户自定义基础标签及标签规则,满足所述标签规则的人员才能赋予对应的基础标签。因此将接收用户的操作指令,从所述操作指令中提取基础标签和所述基础标签对应的标签规则。所述基础标签为能够涵盖所有人员特征的全部标签,每个人员的人员标签均在所述基础标签范围内。用户自定义确定基础标签的名称,并根据所述基础标签名称指代的涵义对各基础标签设定标签规则,满足所述标签规则的人员才能赋予对应的基础标签。例如,对于“涉毒人员”的基础标签,设置标签规则为:(1)手机记录中出现涉毒关键字(比如神水等),(2)通讯录中包括涉毒重点人员,(3)旅业信息中显示频繁入住酒店,或频繁与涉毒重点人员聚集。
步骤S20:获取样本人员的样本人员信息,所述样本人员信息为反映所述样本人员个人特征的信息;
可以理解的是,为了给样本人员赋予人员标签,将判断所述样本人员是否拥有人员标签对应的标签规则,而判断之前,将获取所述样本人员的样本人员信息,并通过将所述样本人员信息与标签规则进行匹配,来判断是否为样本人员赋予人员标签。
需要说明的是,所述样本人员信息为反映所述样本人员个人特征的信息,包括样本人员的户籍信息、学习信息、工作信息、人际交往信息和违法犯罪信息等信息,通过获取所述样本人员信息,能够全面地了解所述样本人员的特征,并为所述样本人员全面地赋予各类标签。
进一步地,所述获取样本人员的样本人员信息,具体包括:
获取所述样本人员的结构化信息;
对所述结构化信息依次进行数据清洗、数据转换和数据集成,得到第一人员信息;
获取所述样本人员的非结构化信息,提取所述非结构化信息中的第二人员信息;
将所述第一人员信息和所述第二人员信息作为所述样本人员信息。
需要说明的是,所述样本人员信息由于其来源不同,格式不同,内容不同,进行数据处理的方式也不一致,所述结构化信息可以由各信息源桥接而来,本实施例对此方式不加以限制,对所述结构化信息进行数据清洗,可以删除重复、错误的信息,对所述结构化信息进行数据转换,可以将清洗后的信息转化为适应本方案的格式,对所述结构化信息进行数据集成,可以将分散的信息合并成统一的信息。对于非结构化信息,所述非结构化信息为文本、音频、视频等形式的信息,提取其中的第二人员信息。在进行数据处理之后,对所述第一人员信息和所述第二人员信息共同作为所述样本人员信息。
可以理解的是,为了提高对所述结构化信息和非结构化信息进行数据处理的效率,本实施例采用多台计算机通过集群对多项信息进行单一事件操作,以实现同时处理多项数据;使用多台计算机的分布式计算将单一事件拆分,以实现快速完成单一事件,通过集群和分布式计算的结合,能最大限度地提高数据处理效率。
步骤S30:将所述样本人员信息与各标签规则进行匹配,将匹配成功的标签规则对应的基础标签作为所述样本人员的人员标签;
应当理解的是,在获取所述样本人员信息之后,将所述样本人员信息与各标签规则进行匹配,即判断所述样本人员信息是否满足所述标签规则的条件,当所述样本人员信息满足所述条件时,认定所述样本人员信息与所述标签规则匹配成功,匹配成功即相当于所述样本人员满足该基础标签的标签规则,将该基础标签作为所述样本人员的人员标签。
步骤S40:根据所述人员标签构建所述样本人员的人员画像。
需要说明的是,在所述样本人员信息与所有标签规则进行匹配之后,所述样本人员获得若干个人员标签,通过所述人员标签即可构建所述样本人员的人员画像。获取其他样本人员的样本人员信息,即可构建更多样本人员的人员画像,将全部的人员画像保存于所述预设画像库中,以供用户查询。
进一步地,所述根据所述人员标签构建所述样本人员的人员画像,具体包括:
根据所述人员标签构建所述样本人员的微观画像,所述微观画像为反映所述样本人员的全部特征的人员标签集合;
在所述人员标签中查找最高级别的标签,根据查找到的标签构建所述样本人员的宏观画像,所述宏观画像为反映所述样本人员的部分特征的人员标签集合;
将所述微观画像和所述宏观画像作为所述样本人员的人员画像,并将所述人员画像保存于预设画像库中。
可以理解的是,用户通过本方法进行查询时,可以根据用户自身需求查询微观画像或者查询宏观画像,通过查询宏观画像了解人员的整体特征,通过查询微观画像了解人员的全部特征。
在本实施例中,通过接收用户的操作指令,从所述操作指令中提取基础标签和所述基础标签对应的标签规则;获取样本人员的样本人员信息,所述样本人员信息为反映所述样本人员个人特征的信息;将所述样本人员信息与各标签规则进行匹配,将匹配成功的标签规则对应的基础标签作为所述样本人员的人员标签;根据所述人员标签构建所述样本人员的人员画像。由于预设了标签规则,将样本人员信息与标签规则直接进行匹配,可以在基础标签中快速得出符合样本人员的标签,简单快速。
参照图3,图3为本发明人员画像分析方法第二实施例的流程示意图,基于上述图2所示的实施例,提出本发明人员画像分析方法的第二实施例。
在第二实施例中,所述步骤S40之后,所述方法还包括:
步骤S50:接收用户输入的查询指令,在预设索引表中查找所述查询指令中的待查询标签;
需要说明的是,本发明一般查询情形是公安人员查询市民信息,用户即指的是公安人员,在用户输入查询指令时,所述查询指令中包含待查询标签,即用户需要查询拥有所述待查询标签的目标人员的人员画像,所述待查询标签可以是个人姓名、身份证号等,以查询一个人员的人员画像,所述待查询标签还可以是基础标签,以查询拥有所述基础标签的一类人的人员画像。
目前查找所述待查询标签的方法一般采用遍历全部标签的方式查找到待查询标签,再根据所述待查询标签进行查询人员画像。但是,采用遍历方式的缺点很明显,尤其是标签数量庞大时,需要耗费大量资源和时间。为了克服该缺点,本实施例将预先建立预设索引表,所述预设索引表中包含标签和标签类别的对应关系,可以根据待查询标签的标签类别,在预设索引表中快速查找到所述待查询标签,只需要查找所述标签类别这一类的标签,而无需遍历全部标签,从而在很大程度上节约了时间和资源。
步骤S60:在查找到所述待查询标签时,获得与所述待查询标签对应的人员标识;
可以理解的是,为了根据所述待查询标签得到拥有所述待查询标签的目标人员的人员画像,将通过所述待查询标签获取所述待查询标签对应的目标人员的人员标识。所述人员标识是每位人员的身份识别标志,每位人员有且仅有一个人员标识,在给人员赋予标签前配置,给拥有人员标识的人员赋予标签时,即可得出标签和人员标识的对应关系。
应当理解的是,在查找到所述待查询标签后,可在所述标签和人员标识的对应关系中查找到所述待查询标签对应的人员标识。所述人员标识的个数可能是一个,即拥有所述待查询标签的人员个数为一;也可能是多个,即拥有所述待查询标签的人员个数为多个。
步骤S70:根据所述人员标识在预设画像库中查找所述人员标识对应的人员画像。
应当理解的是,当每位人员的全部标签组成人员画像时,即可得出人员标识和人员画像的对应关系,并将所述人员标识和人员画像的对应关系保存于预设画像库中。因此,在获得人员标识后,将所述人员标识与所述预设画像库中的人员标识进行对比,得到对比结果一致的人员标识,从而获得所述人员标识对应的人员画像。
进一步地,所述步骤S70之后,所述方法还包括:
步骤S80:获取所述人员标签的准确率,在所述准确率低于阈值时,重新获取样本人员的样本人员信息,并返回所述将所述样本人员信息与各标签规则进行匹配,将匹配成功的标签规则对应的基础标签作为所述样本人员的人员标签的步骤。
需要说明的是,用户在查看包含所述待查询标签的人员画像之后,可以对所述人员画像中的人员标签进行打分,统计历史打分结果,得出各人员标签的准确率,在所述准确率低于阈值时,说明所述人员标签的可取性很低,需要重新对样本人员进行打标签,故重新获取样本人员的样本人员信息,并返回所述将所述样本人员信息与各标签规则进行匹配,将匹配成功的标签规则对应的基础标签作为所述样本人员的人员标签的步骤,以实现对所述样本人员重新赋予标签。
可以理解的是,在用户给所述人员标签打分后,分值越高,说明所述人员标签的价值越高,为了充分发挥所述人员标签的价值,将所述人员标签置顶,提高所述人员标签的使用率。
在本实施例中,通过接收用户输入的查询指令,在预设索引表中查找所述查询指令中的待查询标签;在查找到所述待查询标签时,获得与所述待查询标签对应的人员标识;根据所述人员标识在预设画像库中查找所述人员标识对应的人员画像。由于无需遍历全部标签,便能在预设索引表中快速查找到所述待查询标签,并且通过所述待查询标签在预设画像库中快速查找到拥有所述待查询标签的人员画像,从而在很大程度上节约了时间和资源。
参照图4,图4为本发明人员画像分析方法第三实施例的流程示意图,基于上述图3所示的实施例,提出本发明人员画像分析方法的第三实施例。
在第三实施例中,所述步骤S10之后,所述方法还包括:
步骤S101:对所述基础标签进行分类,得到标签类别和各基础标签的第一对应关系,并根据所述第一对应关系建立第一标签索引表;
相应地,所述在预设索引表中查找所述查询指令中的待查询标签的步骤,具体包括:
步骤S501:获取所述查询指令中的待查询标签的标签类别,并根据所述待查询标签的标签类别在所述第一标签索引表中查找所述待查询标签。
可以理解的是,为了在预设索引表中快速查找所述待查询标签,在本实施例中提出一种建立索引表的方式。通过对所述基础标签进行分类,由于基础标签数量众多,单层分类并不能满足快速查找的目的,因此,采用多层分类,形成一个以标签类别为索引的多层次索引表。在使用所述第一标签索引表时,依次获取所述查询指令中的待查询标签的标签类别、标签子类别,直至某一类别中包含所述待查询标签,即在所述第一标签索引表中查找到所述待查询标签。在查找到所述待查询标签之后,即可获取所述待查询标签对应的人员标识,并通过所述人员标识在预设画像库中查找所述人员标识对应的人员画像。
需要说明的是,以上为所述待查询标签为单个标签的查询情形,当所述待查询标签包含多个基础标签时,将所述待查询标签称为组合标签,对于组合标签,查询方法包括:
对所述组合标签进行分词,得到若干个基础标签,在所述第一标签索引表中分别查找各个基础标签;
根据各个基础标签查找各个基础标签对应的人员标识;
将各个基础标签对应的人员标识做交集,最终得到每个基础标签都对应的人员标识;
在预设画像库中查找最终的人员标识对应的人员画像。
在本实施例中,通过分类建立第一标签索引表,根据所述待查询标签的标签类别在所述第一标签索引表中查找所述待查询标签。由于建立了所述第一标签索引表,能够快速查找到所述待查询标签,无需遍历全部标签,从而在很大程度上节约了时间和资源。
参照图5,图5为本发明人员画像分析方法第四实施例的流程示意图,基于上述图3所示的实施例,提出本发明人员画像分析方法的第四实施例。
在第四实施例中,所述步骤S10之后,所述方法还包括:
步骤S102:对所述基础标签进行分级,得到标签级别和各基础标签的第二对应关系,并根据所述第二对应关系建立第二标签索引表;
相应地,所述在预设索引表中查找所述查询指令中的待查询标签的步骤,具体包括:
步骤S502:获取所述查询指令中的待查询标签的标签类别,并根据所述待查询标签的标签级别在所述第二标签索引表中查找所述待查询标签。
可以理解的是,为了在预设索引表中快速查找所述待查询标签,在本实施例中提出另一种建立索引表的方式。通过对所述基础标签进行分级,形成一个以标签级别为索引的多级别索引表。在使用所述第二标签索引表时,先获取所述查询指令中的待查询标签的标签级别,根据所述标签级别在所述第二标签索引表中查找所述待查询标签。在查找到所述待查询标签之后,即可获取所述待查询标签对应的人员标识,并通过所述人员标识在预设画像库中查找所述人员标识对应的人员画像。
需要说明的是,以上为所述待查询标签为单个标签的查询情形,当所述待查询标签包含多个基础标签时,将所述待查询标签称为组合标签,对于组合标签,查询方法包括:
对所述组合标签进行分词,得到若干个基础标签,在所述第二标签索引表中分别查找各个基础标签;
根据各个基础标签查找各个基础标签对应的人员标识;
将各个基础标签对应的人员标识做交集,最终得到每个基础标签都对应的人员标识;
在预设画像库中查找最终的人员标识对应的人员画像。
在本实施例中,通过分级建立第二标签索引表,根据所述待查询标签的标签级别在所述第二标签索引表中查找所述待查询标签。由于建立了所述第二标签索引表,能够快速查找到所述待查询标签,无需遍历全部标签,从而在很大程度上节约了时间和资源。
此外,本发明实施例还提出一种存储介质,所述存储介质上存储有人员画像分析程序,所述人员画像分析程序被处理器执行时实现如下操作:
接收用户的操作指令,从所述操作指令中提取基础标签和所述基础标签对应的标签规则;
获取样本人员的样本人员信息,所述样本人员信息为反映所述样本人员个人特征的信息;
将所述样本人员信息与各标签规则进行匹配,将匹配成功的标签规则对应的基础标签作为所述样本人员的人员标签;
根据所述人员标签构建所述样本人员的人员画像。
进一步地,所述人员画像分析程序被处理器执行时还实现如下操作:
获取所述样本人员的结构化信息;
对所述结构化信息依次进行数据清洗、数据转换和数据集成,得到第一人员信息;
将所述第一人员信息作为所述样本人员信息。
进一步地,所述人员画像分析程序被处理器执行时还实现如下操作:
获取所述样本人员的非结构化信息,提取所述非结构化信息中的第二人员信息;
相应地,所述将所述第一人员信息作为所述样本人员信息,具体包括:
将所述第一人员信息和所述第二人员信息作为所述样本人员信息。
进一步地,所述人员画像分析程序被处理器执行时还实现如下操作:
根据所述人员标签构建所述样本人员的微观画像,所述微观画像为反映所述样本人员的全部特征的人员标签集合;
在所述人员标签中查找最高级别的标签,根据查找到的标签构建所述样本人员的宏观画像,所述宏观画像为反映所述样本人员的部分特征的人员标签集合;
将所述微观画像和所述宏观画像作为所述样本人员的人员画像,并将所述人员画像保存于预设画像库中。
进一步地,所述人员画像分析程序被处理器执行时还实现如下操作:
接收用户输入的查询指令,在预设索引表中查找所述查询指令中的待查询标签;
在查找到所述待查询标签时,获得与所述待查询标签对应的人员标识;
根据所述人员标识在所述预设画像库中查找所述人员标识对应的人员画像。
进一步地,所述人员画像分析程序被处理器执行时还实现如下操作:
对所述基础标签进行分类,得到标签类别和各基础标签的第一对应关系,并根据所述第一对应关系建立第一标签索引表;
相应地,所述在预设索引表中查找所述查询指令中的待查询标签的步骤,具体包括:
获取所述查询指令中的待查询标签的标签类别,并根据所述待查询标签的标签类别在所述第一标签索引表中查找所述待查询标签。
进一步地,所述人员画像分析程序被处理器执行时还实现如下操作:
对所述基础标签进行分级,得到标签级别和各基础标签的第二对应关系,并根据所述第二对应关系建立第二标签索引表;
相应地,所述在预设索引表中查找所述查询指令中的待查询标签的步骤,具体包括:
获取所述查询指令中的待查询标签的标签级别,并根据所述待查询标签的标签级别在所述第二标签索引表中查找所述待查询标签。
进一步地,所述人员画像分析程序被处理器执行时还实现如下操作:
获取所述人员标签的准确率,在所述准确率低于阈值时,重新获取样本人员的样本人员信息,并返回所述将所述样本人员信息与各标签规则进行匹配,将匹配成功的标签规则对应的基础标签作为所述样本人员的人员标签的步骤。
在本实施例中,通过接收用户的操作指令,从所述操作指令中提取基础标签和所述基础标签对应的标签规则;获取样本人员的样本人员信息,所述样本人员信息为反映所述样本人员个人特征的信息;将所述样本人员信息与各标签规则进行匹配,将匹配成功的标签规则对应的基础标签作为所述样本人员的人员标签;根据所述人员标签构建所述样本人员的人员画像。由于预设了标签规则,将样本人员信息与标签规则直接进行匹配,可以在基础标签中快速得出符合样本人员的标签,简单快速。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
单词第一、第二、以及第三等的使用不表示任何顺序,可将这些单词解释为名称。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种人员画像分析方法,其特征在于,所述方法包括以下步骤:
接收用户的操作指令,从所述操作指令中提取基础标签和所述基础标签对应的标签规则;
获取样本人员的样本人员信息,所述样本人员信息为反映所述样本人员个人特征的信息;
将所述样本人员信息与各标签规则进行匹配,将匹配成功的标签规则对应的基础标签作为所述样本人员的人员标签;
根据所述人员标签构建所述样本人员的人员画像。
2.如权利要求1所述的方法,其特征在于,所述获取样本人员的样本人员信息的步骤,具体包括:
获取所述样本人员的结构化信息;
对所述结构化信息依次进行数据清洗、数据转换和数据集成,得到第一人员信息;
将所述第一人员信息作为所述样本人员信息。
3.如权利要求2所述的方法,其特征在于,所述获取样本人员的样本人员信息的步骤,还包括:
获取所述样本人员的非结构化信息,提取所述非结构化信息中的第二人员信息;
相应地,所述将所述第一人员信息作为所述样本人员信息,具体包括:
将所述第一人员信息和所述第二人员信息作为所述样本人员信息。
4.如权利要求1所述的方法,其特征在于,所述根据所述人员标签构建所述样本人员的人员画像,具体包括:
根据所述人员标签构建所述样本人员的微观画像,所述微观画像为反映所述样本人员的全部特征的人员标签集合;
在所述人员标签中查找最高级别的标签,根据查找到的标签构建所述样本人员的宏观画像,所述宏观画像为反映所述样本人员的部分特征的人员标签集合;
将所述微观画像和所述宏观画像作为所述样本人员的人员画像,并将所述人员画像保存于预设画像库中。
5.如权利要求4所述的方法,其特征在于,所述将所述人员画像保存于预设画像库中之后,所述方法还包括:
接收用户输入的查询指令,在预设索引表中查找所述查询指令中的待查询标签;
在查找到所述待查询标签时,获得与所述待查询标签对应的人员标识;
根据所述人员标识在所述预设画像库中查找所述人员标识对应的人员画像。
6.如权利要求5所述的方法,其特征在于,所述接收用户的操作指令,根据所述操作指令获取基础标签和所述基础标签对应的标签规则的步骤之后,所述方法还包括:
对所述基础标签进行分类,得到标签类别和各基础标签的第一对应关系,并根据所述第一对应关系建立第一标签索引表;
相应地,所述在预设索引表中查找所述查询指令中的待查询标签的步骤,具体包括:
获取所述查询指令中的待查询标签的标签类别,并根据所述待查询标签的标签类别在所述第一标签索引表中查找所述待查询标签。
7.如权利要求5所述的方法,其特征在于,所述接收用户的操作指令,根据所述操作指令获取基础标签和所述基础标签对应的标签规则的步骤之后,所述方法还包括:
对所述基础标签进行分级,得到标签级别和各基础标签的第二对应关系,并根据所述第二对应关系建立第二标签索引表;
相应地,所述在预设索引表中查找所述查询指令中的待查询标签的步骤,具体包括:
获取所述查询指令中的待查询标签的标签级别,并根据所述待查询标签的标签级别在所述第二标签索引表中查找所述待查询标签。
8.如权利要求5所述的方法,其特征在于,所述根据所述人员标识在所述预设画像库中查找所述人员标识对应的人员画像之后,所述方法还包括:
获取所述人员标签的准确率,在所述准确率低于阈值时,重新获取样本人员的样本人员信息,并返回所述将所述样本人员信息与各标签规则进行匹配,将匹配成功的标签规则对应的基础标签作为所述样本人员的人员标签的步骤。
9.一种人员画像分析装置,其特征在于,所述装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的人员画像分析程序,所述人员画像分析程序被所述处理器执行时实现如权利要求1至8中任一项所述的人员画像分析方法的步骤。
10.一种存储介质,其特征在于,所述存储介质上存储有人员画像分析程序,所述人员画像分析程序被处理器执行时实现如权利要求1至8中任一项所述的人员画像分析方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710738678.3A CN107633022A (zh) | 2017-08-24 | 2017-08-24 | 人员画像分析方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710738678.3A CN107633022A (zh) | 2017-08-24 | 2017-08-24 | 人员画像分析方法、装置及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107633022A true CN107633022A (zh) | 2018-01-26 |
Family
ID=61101565
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710738678.3A Pending CN107633022A (zh) | 2017-08-24 | 2017-08-24 | 人员画像分析方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107633022A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109062947A (zh) * | 2018-06-21 | 2018-12-21 | 深圳市彬讯科技有限公司 | 用户画像标签查询方法、设备及计算机可读存储介质 |
CN109062970A (zh) * | 2018-06-28 | 2018-12-21 | 深圳市彬讯科技有限公司 | 用户画像的生成方法、生成设备及计算机可读存储介质 |
CN109767182A (zh) * | 2018-12-29 | 2019-05-17 | 金现代信息产业股份有限公司 | 一种基于规则库的干部调整方法及系统 |
CN110322274A (zh) * | 2019-05-30 | 2019-10-11 | 深圳壹账通智能科技有限公司 | 基于数据分析的人群画像生成方法、装置和计算机设备 |
CN110796354A (zh) * | 2019-10-21 | 2020-02-14 | 国网湖南省电力有限公司 | 一种企业电费回收风险画像方法及系统 |
CN111915366A (zh) * | 2020-07-20 | 2020-11-10 | 上海燕汐软件信息科技有限公司 | 一种用户画像构建方法、装置、计算机设备及存储介质 |
CN112052270A (zh) * | 2020-08-26 | 2020-12-08 | 南京越扬科技有限公司 | 一种通过大数据进行用户画像深度分析的方法及系统 |
CN112286927A (zh) * | 2019-07-25 | 2021-01-29 | 北京中关村科金技术有限公司 | 查询用户数据的方法、装置及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105893407A (zh) * | 2015-11-12 | 2016-08-24 | 乐视云计算有限公司 | 个体用户画像方法和系统 |
CN106354755A (zh) * | 2016-08-17 | 2017-01-25 | 洑云龙 | 一种用户画像优化处理方法 |
CN106354519A (zh) * | 2016-09-30 | 2017-01-25 | 乐视控股(北京)有限公司 | 一种用户画像的标签生成方法和装置 |
-
2017
- 2017-08-24 CN CN201710738678.3A patent/CN107633022A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105893407A (zh) * | 2015-11-12 | 2016-08-24 | 乐视云计算有限公司 | 个体用户画像方法和系统 |
CN106354755A (zh) * | 2016-08-17 | 2017-01-25 | 洑云龙 | 一种用户画像优化处理方法 |
CN106354519A (zh) * | 2016-09-30 | 2017-01-25 | 乐视控股(北京)有限公司 | 一种用户画像的标签生成方法和装置 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109062947A (zh) * | 2018-06-21 | 2018-12-21 | 深圳市彬讯科技有限公司 | 用户画像标签查询方法、设备及计算机可读存储介质 |
CN109062970A (zh) * | 2018-06-28 | 2018-12-21 | 深圳市彬讯科技有限公司 | 用户画像的生成方法、生成设备及计算机可读存储介质 |
CN109062970B (zh) * | 2018-06-28 | 2022-07-12 | 土巴兔集团股份有限公司 | 用户画像的生成方法、生成设备及计算机可读存储介质 |
CN109767182A (zh) * | 2018-12-29 | 2019-05-17 | 金现代信息产业股份有限公司 | 一种基于规则库的干部调整方法及系统 |
CN110322274A (zh) * | 2019-05-30 | 2019-10-11 | 深圳壹账通智能科技有限公司 | 基于数据分析的人群画像生成方法、装置和计算机设备 |
CN112286927A (zh) * | 2019-07-25 | 2021-01-29 | 北京中关村科金技术有限公司 | 查询用户数据的方法、装置及存储介质 |
CN110796354A (zh) * | 2019-10-21 | 2020-02-14 | 国网湖南省电力有限公司 | 一种企业电费回收风险画像方法及系统 |
CN111915366A (zh) * | 2020-07-20 | 2020-11-10 | 上海燕汐软件信息科技有限公司 | 一种用户画像构建方法、装置、计算机设备及存储介质 |
CN111915366B (zh) * | 2020-07-20 | 2024-01-12 | 上海燕汐软件信息科技有限公司 | 一种用户画像构建方法、装置、计算机设备及存储介质 |
CN112052270A (zh) * | 2020-08-26 | 2020-12-08 | 南京越扬科技有限公司 | 一种通过大数据进行用户画像深度分析的方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107633022A (zh) | 人员画像分析方法、装置及存储介质 | |
US11704342B2 (en) | Similarity sharding | |
JP6894534B2 (ja) | 情報処理方法及び端末、コンピュータ記憶媒体 | |
US20130297661A1 (en) | System and method for mapping source columns to target columns | |
CN107784051A (zh) | 在线客服应答系统及方法 | |
CN102945269A (zh) | 上下文感知加标签接口 | |
CN110929125A (zh) | 搜索召回方法、装置、设备及其存储介质 | |
KR20150096295A (ko) | 문답 데이터베이스 구축 시스템 및 방법, 그리고 이를 이용한 검색 시스템 및 방법 | |
CN111966866A (zh) | 一种数据资产管理的方法和装置 | |
CN112258254B (zh) | 基于大数据架构的互联网广告风险监测方法及系统 | |
CN106650783A (zh) | 用于移动终端数据分类、生成、匹配的方法、装置及系统 | |
CN111563382A (zh) | 文本信息的获取方法、装置、存储介质及计算机设备 | |
US20140244641A1 (en) | Holistic customer record linkage via profile fingerprints | |
CN114385609A (zh) | 基于标签的政务事件处理系统、方法、设备及存储介质 | |
CN117150138B (zh) | 一种基于高维空间映射的科技资源组织方法及系统 | |
CN114491010A (zh) | 信息抽取模型的训练方法及装置 | |
CN113934764A (zh) | 事件信息的处理方法、装置及电子设备 | |
CN116595149A (zh) | 一种人机对话生成方法、装置、设备及存储介质 | |
CN110062112A (zh) | 数据处理方法、装置、设备及计算机可读存储介质 | |
CN115935958A (zh) | 简历处理方法、装置和存储介质及电子设备 | |
KR20110125905A (ko) | 패턴분석을 이용한 댓글 관리 방법, 그 시스템, 및 웹 서버 | |
CN111523034B (zh) | 一种应用程序的处理方法、装置、设备及介质 | |
Li et al. | Enterprise precision marketing effectiveness model based on data mining technology | |
CN114443920A (zh) | 地址信息解析方法、装置、电子设备和计算机可读介质 | |
CN114706948A (zh) | 新闻处理方法、装置、存储介质以及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180126 |