CN109003027A - 一种画像标签的管理方法及系统 - Google Patents

一种画像标签的管理方法及系统 Download PDF

Info

Publication number
CN109003027A
CN109003027A CN201810780152.6A CN201810780152A CN109003027A CN 109003027 A CN109003027 A CN 109003027A CN 201810780152 A CN201810780152 A CN 201810780152A CN 109003027 A CN109003027 A CN 109003027A
Authority
CN
China
Prior art keywords
label
portrait
data
entity
cleaning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810780152.6A
Other languages
English (en)
Inventor
李大学
成殿伟
王辉
李华民
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Manyun Software Technology Co Ltd
Original Assignee
Jiangsu Manyun Software Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Manyun Software Technology Co Ltd filed Critical Jiangsu Manyun Software Technology Co Ltd
Priority to CN201810780152.6A priority Critical patent/CN109003027A/zh
Publication of CN109003027A publication Critical patent/CN109003027A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06QDATA PROCESSING SYSTEMS OR METHODS, SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL, SUPERVISORY OR FORECASTING PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL, SUPERVISORY OR FORECASTING PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading, distribution or shipping; Inventory or stock management, e.g. order filling, procurement or balancing against orders
    • G06Q10/083Shipping

Abstract

本发明公开了一种画像标签的管理方法及系统,该方法包括:采集原始数据,原始数据包括:业务数据、行为数据和回流数据;对所述原始数据按照预设清洗条件进行数据清洗,得到清洗后数据;根据清洗后的数据,为每类主体建立对应的画像模型;根据所述清洗后数据和画像模型,生成每个画像模型对应的各个实体的画像标签。本发明提供了画像标签筛选和可视化分析功能,并且标签的使用效果数据可以回流到系统,帮助系统运维人员合理更新、增加、删除标签,提高标签的准确性和标签的使用效率。

Description

一种画像标签的管理方法及系统
技术领域
[0001]本发明涉及互联网领域,尤其涉及一种画像标签的管理方法及系统。
背景技术
[0002]车货匹配平台让货主和司机可以在线上下订单实现货物的运输,网络之间的数据 交互使车货匹配平台融合了大量的司机货主用户数据,为方便用户的管理,会为司机建立 画像标签。
[0003]但是,现有的画像标签仅针对司机,无法抽象到除司机以外的线路、货物、企业等 实体;且在建立画像标签时仅使用了系统内的业务数据,无法根据已建立画像标签的使用 情况形成闭环。
发明内容
[0004]本发明的目的是提供一种画像标签的管理方法及系统,为每类实体建立画像标 签,且使用了回流数据,形成闭环控制。
[0005] 本发明提供的技术方案如下:
[0006] 一种画像标签的管理方法,包括:采集原始数据,所述原始数据包括:业务数据、行 为数据和回流数据;对所述原始数据按照预设清洗条件进行数据清洗,得到清洗后数据;根 据所述清洗后数据,为每类主体建立对应的画像模型;根据所述清洗后数据和每个所述画 像模型,生成每个所述画像模型对应的主体下各个实体的画像标签。
[0007] 在上述技术方案中,在画像模型建立时引入了回流数据,使画像模型的定义更精 确,且不同类别的主体都有其各自的画像模型,对不同类别下的各实体生成对应的画像标 签,应用于后续的管理、分析、风险控制等,大大提高了画像标签的利用率。
[0008] 进一步,所述回流数据包括:所述画像标签的使用频率数据和使用效果数据。
[0009] 在上述技术方案中,进一步完善画像模型中各标签体系下的画像标签的定义,驱 动画像标签的迭代,满足实际使用需求。
[0010] 进一步,所述根据清洗后数据,为每类主体建立对应的画像模型具体为:根据清洗 后数据,为每类主体建立对应的画像模型中不同的标签体系;其中,所述标签体系包括:事 实标签体系、规则标签体系和挖掘标签体系;所述根据清洗后数据和每个所述画像模型,生 成每个所述画像模型对应的主体下各个实体的画像标签具体为:根据所述清洗后数据和每 个所述画像模型,生成每个所述画像模型对应的主体下各个实体的不同标签体系的画像标 签。
[0011] 在上述技术方案中,不同标签体系的画像标签给予了分析人员更多的选择和监 控。
[0012] 进一步,还包括:将属于实时数据的各个实体的画像标签存储至实时存储服务器; 将属于离线数据的各个实体的画像标签存储至离线存储服务器。
[0013] 在上述技术方案中,属于实时数据的画像标签的实时动态更新,让使用者看到最 新的数据,使用时提高准确率。
[0014] 进一步,还包括:当接收到自定义标签指令时,为自定义标签指令对应的实体添加 所述自定义标签指令对应的自定义画像标签。
[0015] 在上述技术方案中,自定义画像标签的建立给了数据分析者更多筛选数据的选 择,无需大工程地改变画像模型即可得到想要画像标签,操作简单、方便。
[0016] 进一步,还包括:显不所述画像标签。
[0017] 在上述技术方案中,通过可视化组件进行显示,方便数据分析人员对各个实体的 画像标签进行分析、研究。
[0018]本发明还提供一种画像标签的管理系统,包括:数据采集模块,用于采集原始数 据,所述原始数据包括:业务数据、行为数据和回流数据;数据清洗模块,用于对所述原始数 据按照预设清洗条件进行数据清洗,得到清洗后数据;模型建立模块,用于根据所述清洗后 数据,为每类主体建立对应的画像模型;标签生成模块,用于根据所述清洗后数据和每个所 述画像模型,生成每个所述画像模型对应的主体下各个实体的画像标签。
[0019] 在上述技术方案中,在画像模型建立时引入了回流数据,使画像模型的定义更精 确,且不同类别的主体都有其各自的画像模型,对不同类别下的各实体生成对应的画像标 签,应用于后续的管理、分析、风险控制等,大大提高了画像标签的利用率。
[0020] 进一步,所述模型建立模块,用于根据所述清洗后数据,为每类主体建立对应的画 像模型具体为:所述模型建立模块,根据清洗后数据,为每类主体建立对应的画像模型中不 同的标签体系;其中,所述标签体系包括:事实标签体系、规则标签体系和挖掘标签体系;所 述标签生成模块,用于根据所述清洗后数据和每个所述画像模型,生成每个所述画像模型 对应的主体下各个实体的画像标签具体为:所述标签生成模块,用于根据所述清洗后数据 和每个所述画像模型,生成每个所述画像模型对应的主体下各个实体的不同标签体系的画 像标签。
[0021] 进一步,还包括:存储模块,用于将属于实时数据的各个实体的画像标签存储至实 时存储服务器;以及,用于将属于离线数据的各个实体的画像标签存储至离线存储服务器。
[0022] 进一步,还包括:标签添加模块,用于当接收到自定义标签指令时,为自定义标签 指令对应的实体添加所述自定义标签指令对应的自定义画像标签。
[0023] 与现有技术相比,本发明的画像标签的管理方法及系统有益效果在于:
[0024] 本发明不同的主体都有各自的画像模型;实时数据和离线数据采用不同方式存 储,让实时数据的画像标签及时得到更新;不同的标签体系为各实体打上了多样化的画像 标签,给予了更多的分析依据;且使用了回流数据进行闭环控制,提高了画像标签的更新频 率,帮助系统运维人员合理更新、增加、删除标签,提高标签的准确性和标签的使用效率,更 符合实际应用需求。
附图说明
[0025]下面将以明确易懂的方式,结合附图说明优选实施方式,对一种画像标签的管理 方法及系统的上述特性、技术特征、优点及其实现方式予以进一步说明。
[0026]图1是本发明画像标签的管理方法一个实施例的流程图;
[0027]图2是本发明画像标签的管理方法另一个实施例的流程图;
[0028]图3是本发明将离线数据推送至ES的一个实施例的结构示意图;
[0029]图4是本发明画像标签的管理系统一个实施例的结构示意图;
[0030]图5是本发明画像标签的管理系统另一个实施例的结构示意图。
[0031]附图标号说明:
[0032] 10 •数据采集模块,2〇 •数据清洗模块,30 •模型建立模块,40 •标签生成模块,50.标 签添加模块,60 •存储模块,70.显示模块。
具体实施方式
[0033]为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对照附图说明 本发明的具体实施方式。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于 本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他 的附图,并获得其他的实施方式。
[0034]为使图面简洁,各图中只示意性地表示出了与本发明相关的部分,它们并不代表 其作为产品的实际结构。另外,以使图面简洁便于理解,在有些图中具有相同结构或功能的 部件,仅示意性地绘示了其中的一个,或仅标出了其中的一个。在本文中,“一个”不仅表示 “仅此一个”,也可以表示“多于一个”的情形。
[0035]在本发明的一个实施例中,如图1所示,一种画像标签的管理方法,包括:
[0036] S101采集原始数据,原始数据包括:业务数据、行为数据和回流数据。
[0037]具体的,业务数据是指在车货匹配平台上进行业务交易的数据,例如:发货表、订 单表、加油表等。
[0038]行为数据是指司机或货主的行为数据,例如:定位日志、行为日志(指在车货匹配 平台上的操作日志)。
[0039]回流数据是指已经建立的画像标签的使用情况。可选地,回流数据包括:画像标签 的使用频率数据和使用效果数据。将画像标签的使用频率数据和使用效果数据作为回流数 据,供画像模型和各实体的画像标签的更新。使各实体对应的画像标签更精准。
[0040] Sl〇2对原始数据按照预设清洗条件进行数据清洗,得到清洗后数据。
[0041 ]具体的,考虑到每种数据的格式不同,而使用时又对格式有一定要求,因此,会对 原始数据按照预设清洗条件进行数据清洗。
[0042]预设清洗条件根据实际需求设置,例如:TXT文件格式,将原有原始数据的格式变 为T)(T文件格式,若不行,则剔除。
[0043] S103根据清洗后数据,为每类主体建立对应的画像模型。
[0044]具体的,不同类别的主体有:司机、货主(个人和企业)、货物、线路等。在为每个类 别建立其对应的画像模型时,因每个类别有自己的特征,因此,即使用了相同的清洗后数 据,但是每个画像模型仍然是不同的。
[0045] S104根据清洗后数据和每个画像模型,生成每个画像模型对应的主体下各个实体 的画像标签。
[0046]具体的,以司机这个主体为例,其对应的每个实体就是每个司机账号。而货主对应 每个实体就是每个货主账号。货物对应的每个实体就是具体的不同的货物,例如:苹果、纸 巾、吸尘器等。线路对应的每个实体就是具体的运行线路,例如:上海—北京、天津-南京、河 南-新疆等。
[0047]每个实体的画像标签会根据其对应的画像模型和收集的清洗后数据生成。而运营 人员、风控人员等就可以根据各个实体的画像标签对实体进行筛选,进行风险控制、活动策 划、分析数据等。
[0048]本实施例在画像模型建立时引入了回流数据,使画像模型的定义更精确,为每个 实体生成的画像标签更能反映其实际情况;且不同类别的主体都有其各自的画像模型,对 不同类别下的各实体生成对应的画像标签,应用于后续的管理、分析、风险控制等,大大提 尚了画像标签的利用率。
[0049]在本发明的另一个实施例中,如图2所示,一种画像标签的管理方法,包括:
[0050] S210采集原始数据,原始数据包括:业务数据、行为数据和回流数据。
[0051] S220对原始数据按照预设清洗条件进行数据清洗,得到清洗后数据。
[0052] SMO根据清洗后数据,为每类主体建立对应的画像模型。其中,S230具体为:
[0053] SU1根据清洗后数据,为每类主体建立对应的画像模型中不同的标签体系;其中, 标签体系包括:事实标签体系、规则标签体系和挖掘标签体系。
[0054] SM0根据清洗后数据和每个画像模型,生成每个画像模型对应的主体下各个实体 的画像标签。其中,S240具体为:
[0055] SM1根据清洗后数据和每个画像模型,生成每个画像模型对应的主体下各个实体 的不同标签体系的画像标签。
[0056]具体的,每一个主体对应的画像模型都有3个标签体系,每个标签体系下都有若干 个不同定义的画像标签。
[0057]事实标签体系是指固有属性。以司机的画像模型中的事实标签体系为例,有男、 女、三个月内的成交次数、年龄等不同定义的画像标签。后续会根据每个司机账号的实际情 况,生成对应的事实标签体系下的画像标签。例如:根据清洗后数据和司机类别对应的画像 模型,司机A事实标签体系下的画像标签有男、35岁、三个月内的成交次数为1〇。
[0058]_规则标签体系是指通过分析数据、进行规则组合得到的。以司机的画像模型中的 规则标签体系为例,不同定义的画像标签有:一周成交3次为高活跃度,一个月成交;L次及以 下为低活跃度,近3个月未登录为沉默用户。后续会根据每个司机账号的实际情况,生成对 应的规则标签体系下的画像标签,例如:司机B规则标签体系下的画像标签有高活跃度。 [0059]挖掘标签体系是指根据数据分析进行预测得到的,会采用到聚类、分类算法等进 行预测。以货主的画像模型中的挖掘标签体系为例,不同定义的画像标签有:是否为黄牛、 是否为有可能购f会员的潜在会员。后续会根据每个货主账号的实际情况,生成对应的挖 掘标签体系下的画像标签,例如:货主A挖掘标签体系下的画像标签有潜在会员。
[0060]优选地,回流数据包括:画像标签的使用频率数据和使用效果数据。 W〇61]使用频率数据就是指画像标签的使用次数,可以对使用次数少的画像标签对应的 画像模型中的定义进行调整或删除。
[00,62] 一使用效果数据理解为,画像标签是否达到了其想要的效果。例如:一个为“潜在会 员”的画像标签,根据清洗后数据给某些司机和货主打上这个标签,使用一段时间后发现这 些人并不会购^会员,则说明这个画像标签的定义有问题,在下次画像模型建立(或者说更 新)时,需要对画像标签对应的定义进行调整或删除。
[0063]画像模型不同标签体系下的各画像标签的定义就是为每个实体生成对应的画像 标签的依据,而画像标签的使用频率数据和使用效果数据作为回流数据进一步完善画像模 型中各标签体系下的画像标签的定义,驱动画像标签的迭代,满足实际使用需求。
[0064] 可选地,还包括:S250当接收到自定义标签指令时,为自定义标签指令对应的实体 添加自定义标签指令对应的自定义画像标签。
[0065]具体的,除了通过画像模型来为每个实体自动生成画像标签外,也可以手动为实 体自行添加自定义画像标签,当基于某些实际需求时,就可以给需要的某些实体手动打标。 其与画像模型生成画像标签属于两条并行线,无先后关系。
[0066] 例如:运营人员想要为货主A、货主B、货主C打上“大客户”的画像标签,但是画像模 型中没有这个画像标签的定义,其可以同时选中货A、货主B和货主C,并创建一个“大客户” 画像标签,为三个货主统一打上这个画像标签。假设本来货主A通过画像模型得到的画像标 签为高活跃度、男;现在进行人工手动打标后变为高活跃度、男、大客户。
[0067] 再比如:运营人员想选一批司机组织一场活动,其可以选择100个符合他要求的司 机,添加“101活动”这个画像标签,为这100个司机统一打标。
[0068]需要注意的是,自定义画像标签和画像模型没有关系,因此,自定义画像标签的回 流数据不会影响画像模型的更新。
[0069]可选地,还包括:S260将属于实时数据的各个实体的画像标签存储至实时存储服 务器;S270将属于离线数据的各个实体的画像标签存储至离线存储服务器。
[0070] 具体的,S260和S270可以并行运行,也可以先270、再260,或先260、再270,对顺序 不作要求。
[0071] 根据实际需求,设置每个主体的实时数据要求和离线数据要求,在得到每个实体 的画像标签后,将符合对应的主体的实时数据要求和符合对应的主体的离线数据要求的各 个实体的画像标签存储到不同的存储服务器。
[00721实时数据主要是指当天的相关数据,例如:当天的上线时间、当天的成交量、当天 是否有这个货物/线路等。离线数据主要是指非实时数据以外的所有数据。
[0073]之所以将两者存储到不同的存储服务器,是为了保证属于实时数据的画像标签的 实时动态更新,让使用者看到最新的数据,使用时提高准确率。
[0074]实际存储的例子如下:
[0075]将属于实时数据的各个实体的画像标签存储至Redis;将属于离线数据的各个实 体的幽像标签通过Flume、Kafka、Logs tash推送到ES。
[0076] Redis是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日 志型、Key-Value数据库。Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量 日志采集、聚合和传输的系统。Kafka是由Apache软件基金会开发的一个开源流处理平台。 Logstash是一个开源工具,对日志进行收集、分析,并将其存储供以后使用。ES为 ElasticSearch的缩写,是一个基于Lucene的个分布式多用户能力的全文搜索引擎。
[0077]将属于离线数据的各个实体的画像标签这些文件推送到ES时需要注意以下几点: 1)将原有的Flume读写同时进行的方式调整为先从Hive下载到Linux本地,之后对文件 Split分割,再通过Flume写入到Kafka,如图3所示,该技术方案解决了 Flume在HDFS文件下 载到Linux过程中读写同时进行造成的数据丢失问题。2)将Logstash由单条写入ES调整为 批量写入,提高数据存储效率,适应大数据的存储。
[0078] 优选地,还包括:S280显示画像标签。
[0079]具体的,各个实体的画像标签(不管是通过画像模型得到,还是人工打标得到)都 可以通过可视化组件进行显示,方便数据分析人员对各个实体的画像标签进行分析、研究。 [0080]另外,各个实体的画像标签所属的数据可以通过调用接口供第三方系统提供其他 服务。
[0081] 本实施例多种主体的各个实体都能得到对应的画像标签,丰富了画像标签的使用 范围;对于实时数据和离线数据采用不同方式存储,让实时数据的画像标签及时得到更新; 不同的标签体系为各实体打上了多样化的画像标签,给予了更多的分析依据;且使用了回 流数据进行闭环控制,提高了画像标签的更新频率,更符合实际应用需求。
[0082] 在本发明的另一个实施例中,如图4所示,一种画像标签的管理系统,包括:
[0083]数据采集模块10,用于采集原始数据,原始数据包括:业务数据、行为数据和回流 数据。
[0084]具体的,业务数据是指在车货匹配平台上进行业务交易的数据,例如:发货表、订 单表、加油表等。
[0085]行为数据是指司机或货主的行为数据,例如:定位日志、行为日志(指在车货匹配 平台上的操作日志)。
[0086]回流数据是指已经建立的画像标签的使用情况。可选地,回流数据包括:画像标签 的使用频率数据和使用效果数据。将画像标签的使用频率数据和使用效果数据作为回流数 据,供画像模型和各实体的画像标签的更新。使各实体对应的画像标签更精准。
[0087]数据清洗模块20,与数据采集模块10电连接,用于对原始数据按照预设清洗条件 进行数据清洗,得到清洗后数据。
[0088]具体的,考虑到每种数据的格式不同,而使用时又对格式有一定要求,因此,会对 原始数据按照预设清洗条件进行数据清洗。
[0089]预设清洗条件根据实际需求设置,例如:TXT文件格式,将原有原始数据的格式变 为TXT文件格式,若不行,则剔除。
[0090]模型建立模块30,与数据清洗模块20电连接,用于根据清洗后数据,为每类主体建 立对应的画像模型。
[0091]具体的,不同类别的主体有:司机、货主(个人和企业)、货物、线路等。在为每个类 别建立其对应的画像模型时,因每个类别有自己的特征,因此,即使用了相同的清洗后数 据,但是每个画像模型仍然是不同的。
[0092]标签生成模块40,与模型建立模块30电连接,用于根据清洗后数据和每个画像模 型,生成每个画像模型对应的主体下各个实体的画像标签。
[0093]具体的,以司机这个主体为例,其对应的每个实体就是每个司机账号。而货主对应 每个实体就是每个货主账号。货物对应的每个实体就是具体的不同的货物,例如:苹果、纸 巾、吸尘器等。线路对应的每个实体就是具体的运行线路,例如:上海-北京、天:津_南京、河 南-新疆等。
[0094]每个实体的画像标签会根据其对应的画像模型和收集的清洗后数据生成。而运营 人员、风控人员等就可以根据各个实体的画像标签进行风险控制、活动策划、分析数据等^
[0095]本实施例在画像模型建立时引入了回流数据,使画像模型的定义更精确,为每个 实体生成的画像标签更能反映其实际情况;且不同类别的主体都有其各自的画像模型,对 不同类别下的各实体生成对应的画像标签,应用于后续的管理、分析、风险控制等,大大提 高了画像标签的利用率。
[0096]在本发明的另一个实施例中,如图5所示,一种画像标签的管理系统,包括:
[0097]数据采集模块10,用于采集原始数据,原始数据包括:业务数据、行为数据和回流 数据;
[0098]数据清洗模块20,与数据采集模块1〇电连接,用于对原始数据按照预设清洗条件 进行数据清洗,得到清洗后数据;
[00"]模型建立模块30,与数据清洗模块20电连接,用于根据清洗后数据,为每类主体建 立对应的画像模型;
[0100]标签生成模块40,与模型建立模块30电连接,用于根据清洗后数据和每个画像模 型,生成每个画像模型对应的主体下各个实体的画像标签。
[0101]模型建立模块3〇,用于根据清洗后数据,为每类主体建立对应的画像模型具体为: [0102]模型建立模块30,根据清洗后数据,为每类主体建立对应的画像模型中不同的标 签体系;其中,标签体系包括:事实标签体系、规则标签体系和挖掘标签体系。
[0103]标签生成模块40,用于根据清洗后数据和每个画像模型,生成每个画像模型对应 的主体下各个实体的画像标签具体为:
[0104]标签生成模块40,用于根据清洗后数据和每个画像模型,生成每个画像模型对应 的主体下各个实体的不同标签体系的画像标签。
[0105]具体的,每一个主体对应的画像模型都有3个标签体系,每个标签体系下都有若千 个不同定义的画像标签。
[0106]事实标签体系是指固有属性。以司机的画像模型中的事实标签体系为例,有男、 女、三个月内的成交次数、年龄等不同定义的画像标签。后续会根据每个司机账号的实际情 况,生成对应的事实标签体系下的画像标签。例如:根据清洗后数据和司机类别对应的画像 模型,司机A事实标签体系下的画像标签有女、30岁、三个月内的成交次数为12。
[0107]规则标签体系是指通过分析数据、进行规则组合得到的。以司机的画像模型中的 规则标签体系为例,不同定义的画像标签有:一周成交3次为高活跃度,一个月成交i次及以 下为低活跃度,购买过ETC的为增值。后续会根据每个司机账号的实际情况,生成对应的规 则标签体系下的画像标签,例如:司机B规则标签体系下的画像标签有高活跃度、增值。 ⑼〇8]挖掘标签体系是指根据数据分析进行预测得到的,会采用到聚类、分类算法等进 行预测。以货主的画像模型中的挖掘标签体系为例,不同定义的画像标签有:是否为黄牛、 是否为有可能购买会员的潜在会员。后续会根据每个货主账号的实际情况,生成对应的挖 掘标签体系下的画像标签,例如:货主A挖掘标签体系下的画像标签有潜在会员。
[0109]优选地,回流数据包括:画像标签的使用频率数据和使用效果数据。
[0110]使用频率数据就是指画像标签的使用次数,可以对使用次数少的画像标签对应的 画像模型中的定义进行调整或删除。 使用效果数据理解为,画像标签是否达到了其想要的效果。例如:一个为“潜在会 员”的画像标签,根据清洗后数据给某些司机和货主打上这个标签,使用一段时间后发现这 些人并不会购买会员,则说明这个画像标签的定义有问题,在下次画像模型建立(或者说更 新)时,需要对画像标签对应的定义进行调整或删除。
[0112]画像模型不同标签体系下的各画像标签的定义就是为每个实体生成对应的画像 标签的依据,而画像标签的使用频率数据和使用效果数据作为回流数据进一步完善画像模 型中各标签体系下的画像标签的定义,驱动画像标签的迭代,满足实际使用需求。
[0113] 可选地,还包括:标签添加模块50,用于当接收到自定义标签指令时,为自定义标 签指令对应的实体添加自定义标签指令对应的自定义画像标签。
[0114] 具体的,除了通过画像模型来为每个实体自动生成画像标签外,也可以手动为实 体自行添加自定义画像标签,当基于某些实际需求时,就可以给需要的某些实体手动打标。 具体的例子请参见对应的方法实施例,在此不作赘述。
[0115] 需要注意的是,自定义画像标签和画像模型没有关系,因此,自定义画像标签的回 流数据不会影响画像模型的更新。
[0116] 可选地,还包括:存储模块60,与标签添加模块50和标签生成模块40电连接,用于 将属于实时数据的各个实体的画像标签存储至实时存储服务器;以及,用于将属于离线数 据的各个实体的画像标签存储至离线存储服务器。
[0117]具体的,根据实际需求,设置每个主体的实时数据要求和离线数据要求,在得到每 个实体的画像标签后,将符合对应的主体的实时数据要求和符合对应的主体的离线数据要 求的各个实体的画像标签存储到不同的存储服务器。
[0118]实时数据主要是指当天的相关数据,例如:当天的上线时间、当天的成交量、当天 是否有这个货物/线路等。离线数据主要是指非实际数据以外的所有数据。
[0119]之所以将两者存储到不同的存储服务器,是为了保证属于实时数据的画像标签的 实时动态更新,让使用者看到最新的数据,使用时提高准确率。具体的例子请参见对应的方 法实施例,在此作不赘述。
[0120]优选地,还包括:存储模块70,与存储模块60电连接,用于显示画像标签。
[0121]具体的,各个实体的画像标签(不管是通过画像模型得到,还是人工打标得到)都 可以通过可视化组件进行显示,方便数据分析人员对各个实体的画像标签进行分析、研究。 [0122]另外,各个实体的画像标签所属的数据可以通过调用接口供第三方系统提供其他 服务。
[0123]本实施例多种主体的各个实体都能得到对应的画像标签,丰富了画像标签的使用 范围;对于实时数据和离线数据采用不同方式存储,让实时数据的画像标签及时得到更新; 不同的标签体系为各实体打上了多样化的画像标签,给予了更多的分析依据;且使用了回 流数据进行闭环控制,提高了画像标签的更新频率,更符合实际应用需求。
[0124]应当说明的是,上述实施例均可根据需要自由组合。以上仅是本发明的优选实施 方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还 可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1. 一种画像标签的管理方法,其特征在于,包括: 采集原始数据,所述原始数据包括:业务数据、行为数据和回流数据; 对所述原始数据按照预设清洗条件进行数据清洗,得到清洗后数据; 根据所述清洗后数据,为每类主体建立对应的画像模型; 根据所述清洗后数据和每个所述画像模型,生成每个所述画像模型对应的主体下各个 实体的画像标签。
2.如权利要求1所述的画像标签的管理方法,其特征在于,所述回流数据包括:所述画 像标签的使用频率数据和使用效果数据。
3.如权利要求1所述的画像标签的管理方法,其特征在于: 所述根据清洗后数据,为每类主体建立对应的画像模型具体为: 根据清洗后数据,为每类主体建立对应的画像模型中不同的标签体系;其中,所述标签 体系包括:事实标签体系、规则标签体系和挖掘标签体系; 所述根据清洗后数据和每个所述画像模型,生成每个所述画像模型对应的主体下各个 实体的画像标签具体为: 根据所述清洗后数据和每个所述画像模型,生成每个所述画像模型对应的主体下各个 实体的不同标签体系的画像标签。
4.如权利要求1-3任意一项所述的画像标签的管理方法,其特征在于,还包括: 将属于实时数据的各个实体的画像标签存储至实时存储服务器; 将属于离线数据的各个实体的画像标签存储至离线存储服务器。
5.如权利要求1-3任意一项所述的画像标签的管理方法,其特征在于,还包括: 当接收到自定义标签指令时,为自定义标签指令对应的实体添加所述自定义标签指令 对应的自定义画像标签。
6.如权利要求1-3任意一项所述的画像标签的管理方法,其特征在于,还包括:显示所 述画像标签。
7. —种画像标签的管理系统,其特征在于,包括: 数据采集模块,用于采集原始数据,所述原始数据包括:业务数据、行为数据和回流数 据; 数据清洗模块,用于对所述原始数据按照预设清洗条件进行数据清洗,得到清洗后数 据; 模型建立模块,用于根据所述清洗后数据,为每类主体建立对应的画像模型; 标签生成模块,用于根据所述清洗后数据和每个所述画像模型,生成每个所述画像模 型对应的主体下各个实体的画像标签。
8. 如权利要求7所述的画像标签的管理系统,其特征在于: 所述模型建立模块,用于根据所述清洗后数据,为每类主体建立对应的画像模型具体 为: 所述模型建立模块,根据清洗后数据,为每类主体建立对应的画像模型中不同的标签 体系;其中,所述标签体系包括:事实标签体系、规则标签体系和挖掘标签体系; 所述标签生成模块,用于根据所述清洗后数据和每个所述画像模型,生成每个所述画 像模型对应的主体下各个实体的画像标签具体为: 所述标签生成模块,用于根据所述清洗后数据和每个所述画像模型,生成每个所 像模型对应的主体下各个实体的不同标签体系的画像标签。
9. 如权利要求8或7所述的画像标签的管理系统,其特征在于,还包括: 存储模块,用于将属于实时数据的各个实体的画像标签存储至实时存储服务器;以及, 用于将属于离线数据的各个实体的画像标签存储至离线存储服务器。
10. 如权利要求8或7所述的画像标签的管理系统,其特征在于,还包^括: 标签添加模块,用于当接收到自定义标签指令时,为所述自定义标签指令对应的实体 添加所述自定义标签指令对应的自定义画像标签。
CN201810780152.6A 2018-07-16 2018-07-16 一种画像标签的管理方法及系统 Pending CN109003027A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810780152.6A CN109003027A (zh) 2018-07-16 2018-07-16 一种画像标签的管理方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810780152.6A CN109003027A (zh) 2018-07-16 2018-07-16 一种画像标签的管理方法及系统

Publications (1)

Publication Number Publication Date
CN109003027A true CN109003027A (zh) 2018-12-14

Family

ID=64598452

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810780152.6A Pending CN109003027A (zh) 2018-07-16 2018-07-16 一种画像标签的管理方法及系统

Country Status (1)

Country Link
CN (1) CN109003027A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110555076A (zh) * 2019-08-22 2019-12-10 上海数禾信息科技有限公司 数据打标方法、处理方法以及装置
CN112052972A (zh) * 2020-09-11 2020-12-08 广州宸祺出行科技有限公司 一种网约车司机行为可视化的方法和系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105069025A (zh) * 2015-07-17 2015-11-18 浪潮通信信息系统有限公司 一种大数据的智能聚合可视化与管控系统
CN106156350A (zh) * 2016-07-25 2016-11-23 恒安嘉新(北京)科技有限公司 一种可视化大数据分析方法及系统
CN106296445A (zh) * 2016-08-01 2017-01-04 国网浙江省电力公司 一种电力客户标签构建方法
CN106599060A (zh) * 2016-11-16 2017-04-26 竹间智能科技(上海)有限公司 获取用户画像的方法及系统
CN106909686A (zh) * 2017-03-06 2017-06-30 吉林省盛创科技有限公司 一种人机交互构建用户画像聚类计算方法
CN106980663A (zh) * 2017-03-21 2017-07-25 上海星红桉数据科技有限公司 基于海量跨屏行为数据的用户画像方法
CN108021929A (zh) * 2017-11-16 2018-05-11 华南理工大学 基于大数据的移动端电商用户画像建立与分析方法及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105069025A (zh) * 2015-07-17 2015-11-18 浪潮通信信息系统有限公司 一种大数据的智能聚合可视化与管控系统
CN106156350A (zh) * 2016-07-25 2016-11-23 恒安嘉新(北京)科技有限公司 一种可视化大数据分析方法及系统
CN106296445A (zh) * 2016-08-01 2017-01-04 国网浙江省电力公司 一种电力客户标签构建方法
CN106599060A (zh) * 2016-11-16 2017-04-26 竹间智能科技(上海)有限公司 获取用户画像的方法及系统
CN106909686A (zh) * 2017-03-06 2017-06-30 吉林省盛创科技有限公司 一种人机交互构建用户画像聚类计算方法
CN106980663A (zh) * 2017-03-21 2017-07-25 上海星红桉数据科技有限公司 基于海量跨屏行为数据的用户画像方法
CN108021929A (zh) * 2017-11-16 2018-05-11 华南理工大学 基于大数据的移动端电商用户画像建立与分析方法及系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110555076A (zh) * 2019-08-22 2019-12-10 上海数禾信息科技有限公司 数据打标方法、处理方法以及装置
CN112052972A (zh) * 2020-09-11 2020-12-08 广州宸祺出行科技有限公司 一种网约车司机行为可视化的方法和系统
CN112052972B (zh) * 2020-09-11 2021-05-18 广州宸祺出行科技有限公司 一种网约车司机行为可视化的方法和系统

Similar Documents

Publication Publication Date Title
CN108491266A (zh) 基于区块链的数据处理方法、装置及电子设备
CN109003027A (zh) 一种画像标签的管理方法及系统
US20080256099A1 (en) Method and System For Managing Data and Organizational Constraints
CN107016103A (zh) 一种构建用户画像的方法及装置
CN101588392A (zh) 信息处理设备、信息处理方法以及程序
Zeleti et al. Open data value capability architecture
Flatberg et al. Dynamic and stochastic vehicle routing in practice
US20200057918A1 (en) Systems and methods for training artificial intelligence to predict utilization of resources
Munezero et al. Partitioning microservices: A domain engineering approach
CN106897832B (zh) 生产线的生产排程方法、生产线的生产排程系统
Lannez et al. A railroad maintenance problem solved with a cut and column generation matheuristic
Igbaria et al. The impact and benefits of a DSS: The case of FleetManager
Hu Information lifecycle modeling framework for construction project lifecycle management
CN104572835B (zh) 一种过程元模型构建方法及装置
Amiama et al. Spatial decision support system for the route management for milk collection from dairy farms
US20120053964A1 (en) Systems and methods for online insurance financial planning
Paulson Jr Man-computer concepts for planning and scheduling
Reichelt et al. Towards an infrastructure for energy model computation and linkage
Hassan Simulating information flow to assist building design management
CN110383268A (zh) 对用于处理带键网络数据流的参数化应用的动态执行
Guillen et al. Europcar integrates forecasting, simulation, and optimization techniques in a capacity and revenue management system
CN102289746A (zh) 一种计落考管理规划实施与经验转化的方法和系统
Mohamed et al. Quantifying the time and cost associated with the request for information (RFI) process in construction
Ginsawat et al. Applying Knowledge Management System Architecture in Software Maintenance Environment.
RU131219U1 (ru) Система организации решения управленческих задач на основе электронного документооборота

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination