CN110737693A - 数据挖掘处理方法、装置、设备及计算机可读存储介质 - Google Patents

数据挖掘处理方法、装置、设备及计算机可读存储介质 Download PDF

Info

Publication number
CN110737693A
CN110737693A CN201910846567.3A CN201910846567A CN110737693A CN 110737693 A CN110737693 A CN 110737693A CN 201910846567 A CN201910846567 A CN 201910846567A CN 110737693 A CN110737693 A CN 110737693A
Authority
CN
China
Prior art keywords
crowd
target
portrait
data
behavior
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910846567.3A
Other languages
English (en)
Inventor
路一迪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Urban Construction Technology Shenzhen Co Ltd
Original Assignee
Ping An Urban Construction Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Urban Construction Technology Shenzhen Co Ltd filed Critical Ping An Urban Construction Technology Shenzhen Co Ltd
Priority to CN201910846567.3A priority Critical patent/CN110737693A/zh
Publication of CN110737693A publication Critical patent/CN110737693A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种数据挖掘处理方法,涉及数据分析领域,该方法包括:在接收到人群画像生成指令时,根据所述人群画像生成指令获取目标人群ID、人群画像类型和聚合维度信息;基于所述目标人群ID和所述人群画像类型从预设数据库中获取对应的目标人群的数据,并根据所述人群画像类型确定对应的人群画像生成策略;基于所述人群画像生成策略、所述目标人群的数据和所述聚合维度信息对所述目标人群进行分析,得到目标人群的人群画像。本发明还提供一种数据挖掘处理装置、设备及计算机可读存储介质。本发明能实现针对人群进行人群画像,从而有利于后续根据人群画像进行信息推送,提高信息推送的准确率。

Description

数据挖掘处理方法、装置、设备及计算机可读存储介质
技术领域
本发明涉及数据分析领域,尤其涉及一种数据挖掘处理方法、装置、设备及计算机可读存储介质。
背景技术
随着计算机技术的快速发展,数据挖掘对于各个行业而言都尤为重要。随着大数据处理的兴起,对海量数据进行分析,可以有效地进行数据挖掘。通过对数据进行画像分析,能够有效地对目标数据进行挖掘和分析,因此出现了目标数据挖掘和用户画像分析等技术。目前,主要是针对单个用户进行用户画像,以了解目标消费者,进而进行信息推送。然而单个用户的用户画像并不具有普遍性,无法体现出大众的偏好或者需求,在基于用户画像进行信息推送时,会存在信息推送准确率较低的问题。因此,如何针对人群进行人群画像是亟待解决的问题。
发明内容
本发明的主要目的在于提供一种数据挖掘处理方法、装置、设备及计算机可读存储介质,旨在实现针对人群进行人群画像,从而有利于后续根据人群画像进行信息推送,提高信息推送的准确率。
为实现上述目的,本发明提供一种数据挖掘处理方法,所述数据挖掘处理方法包括:
在接收到人群画像生成指令时,根据所述人群画像生成指令获取目标人群ID、人群画像类型和聚合维度信息;
基于所述目标人群ID和所述人群画像类型从预设数据库中获取对应的目标人群的数据,并根据所述人群画像类型确定对应的人群画像生成策略;
基于所述人群画像生成策略、所述目标人群的数据和所述聚合维度信息对所述目标人群进行分析,得到目标人群的人群画像,所述人群画像生成策略包括基于标签的人群画像生成策略和基于行为的人群画像生成策略,所述基于标签的人群画像生成策略用于通过所述目标人群的各标签数量得到人群画像,所述基于行为的人群画像生成策略用于根据所述目标人群中用户各类行为的次数获得人群画像。
可选地,所述基于所述目标人群ID和所述人群画像类型从预设数据库中获取对应的目标人群的数据,并根据所述人群画像类型确定对应的人群画像生成策略的步骤包括:
若所述人群画像类型为基于标签的人群画像,则基于所述目标人群ID和所述人群画像类型从预设数据库中获取对应的目标人群的标签数据,并确定对应的人群画像生成策略为基于标签的人群画像生成策略;
所述基于所述人群画像生成策略、所述目标人群的数据和所述聚合维度信息对所述目标人群进行分析,得到目标人群的人群画像的步骤包括:
根据所述聚合维度信息对所述目标人群的标签数据进行聚合,得到各标签的数量;
根据所述各标签的数量和所述目标人群的数量计算各标签在所述目标人群中的占比,记为标签占比;
获取各标签的全局占比,根据所述全局占比、所述标签占比和第一预设计算公式计算各标签的目标群体指数,并基于所述各标签的目标群体指数和所述标签占比得到目标人群的人群画像。
可选地,所述第一预设计算公式为:
TGIi1=ai/bi*100%;
其中,TGIi1为标签i对应的目标群体指数,ai为标签i对应的标签占比,bi为标签i对应的全局占比。
可选地,所述基于所述目标人群ID和所述人群画像类型从预设数据库中获取对应的目标人群的数据,并根据所述人群画像类型确定对应的人群画像生成策略的步骤还包括:
若所述人群画像类型为基于行为的人群画像,则基于所述目标人群ID和所述人群画像类型从预设数据库中获取对应的目标人群的行为数据,并确定对应的人群画像生成策略为基于行为的人群画像生成策略;
所述基于所述人群画像生成策略、所述目标人群的数据和所述聚合维度信息对所述目标人群进行分析,得到目标人群的人群画像的步骤还包括:
根据所述聚合维度信息对所述目标人群的行为数据进行聚合,得到所述目标人群中各用户的各类行为的次数;
基于所述目标人群中各用户的各类行为的次数按预设规则计算各类行为的目标群体指数,并基于所述目标群体指数得到目标人群的人群画像。
可选地,所述基于所述目标人群中各用户的各类行为的次数按预设规则计算各类行为的目标群体指数,并基于所述目标群体指数得到目标人群的人群画像的步骤包括:
对所述目标人群中各用户的各类行为的次数按行为类型进行相加,根据相加结果和所述目标人群的数量计算所述目标人群中各类行为的平均次数,记为人群平均次数;
根据所述聚合维度信息对所述预设数据库中的全量数据进行聚合,并对聚合后的行为数据按行为类型进行统计,得到所述全量数据中各类行为的总次数;
根据所述全量数据中各类行为的总次数和所述全量数据中的用户数量计算得到所述全量数据中各类行为的平均次数,记为全局平均次数;
根据所述人群平均次数、所述全局平均次数和第二预设计算公式计算各类行为的目标群体指数,并基于所述各类行为的目标群体指数和所述人群平均次数得到目标人群的人群画像;
其中,所述第二预设计算公式为:
TGIj2=cj/dj*100%;
其中,TGIj2为行为类型j对应的目标群体指数,cj为行为类型j对应的人群平均次数,dj为行为类型j对应的全局平均次数。
可选地,所述基于所述目标人群中各用户的各类行为的次数按预设规则计算各类行为的目标群体指数,并基于所述目标群体指数得到目标人群的人群画像的步骤还包括:
对所述目标人群中各用户的各类行为的次数按行为类型和行为次数进行统计,得到各类行为的人群次数分布情况;
根据所述聚合维度信息对所述预设数据库中的全量数据进行聚合,并对聚合后的行为数据按行为类型和行为次数进行统计,得到所述全量数据中各类行为的全局次数分布情况;
基于所述人群次数分布情况和所述全局次数分布情况计算各类行为的各行为次数对应的目标群体指数,并基于所述各类行为的各行为次数对应的目标群体指数和所述人群次数分布情况得到目标人群的人群画像。
可选地,所述在接收到人群画像生成指令时,根据所述人群画像生成指令获取目标人群ID、人群画像类型和聚合维度信息的步骤包括:
在接收到人群画像生成指令时,根据所述人群画像生成指令获取人群ID列表、人群画像类型和聚合维度信息;
检测所述人群ID列表中的人群ID的类型是否为目标ID类型;
若是,则确定所述人群ID列表中的人群ID为目标人群ID;
若否,则根据预设ID信息关联表对所述人群ID列表中的人群ID进行转换,得到目标人群ID。
此外,为实现上述目的,本发明还提供一种数据挖掘处理装置,所述数据挖掘处理装置包括:
信息获取模块,用于在接收到人群画像生成指令时,根据所述人群画像生成指令获取目标人群ID、人群画像类型和聚合维度信息;
策略确定模块,用于基于所述目标人群ID和所述人群画像类型从预设数据库中获取对应的目标人群的数据,并根据所述人群画像类型确定对应的人群画像生成策略;
画像生成模块,用于基于所述人群画像生成策略、所述目标人群的数据和所述聚合维度信息对所述目标人群进行分析,得到目标人群的人群画像,所述人群画像生成策略包括基于标签的人群画像生成策略和基于行为的人群画像生成策略,所述基于标签的人群画像生成策略用于通过所述目标人群的各标签数量得到人群画像,所述基于行为的人群画像生成策略用于根据所述目标人群中用户各类行为的次数获得人群画像。
此外,为实现上述目的,本发明还提供一种数据挖掘处理设备,所述数据挖掘处理设备包括存储器、处理器以及存储在所述存储器上并可被所述处理器执行的数据挖掘处理程序,其中所述数据挖掘处理程序被所述处理器执行时,实现如上所述的数据挖掘处理方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有数据挖掘处理程序,其中所述数据挖掘处理程序被处理器执行时,实现如上所述的数据挖掘处理方法的步骤。
本发明提供一种数据挖掘处理方法、装置、设备及计算机可读存储介质,在接收到人群画像生成指令时,根据人群画像生成指令获取目标人群ID、人群画像类型和聚合维度信息;进而基于目标人群ID和人群画像类型从预设数据库中获取对应的目标人群的数据,并根据人群画像类型确定对应的人群画像生成策略;最后,基于人群画像生成策略、目标人群的数据和聚合维度信息对目标人群进行分析,得到目标人群的人群画像。通过上述方式,本发明能实现针对人群进行人群画像,从而有利于后续根据人群画像进行信息推送,提高信息推送的准确率。
附图说明
图1为本发明实施例方案涉及的硬件运行环境的设备结构示意图;
图2为本发明数据挖掘处理方法第一实施例的流程示意图;
图3为本发明数据挖掘处理方法第二实施例的流程示意图;
图4为本发明数据挖掘处理方法第三实施例的流程示意图;
图5为本发明数据挖掘处理装置第一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
参照图1,图1为本发明实施例方案涉及的硬件运行环境的设备结构示意图。
本发明实施例涉及的数据挖掘处理设备可以是PC(Personal Computer,个人计算机)、笔记本电脑、服务器等具有显示和处理功能的终端设备。
如图1所示,该数据挖掘处理设备可以包括:处理器1001,例如CPU(CentralProcessing Unit,中央处理器),通信总线1002,用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信;用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真Wireless-Fidelity,Wi-Fi接口);存储器1005可以是高速随机存取存储器(random accessmemory,RAM),也可以是稳定的存储器(non-volatile memory),例如磁盘存储器,存储器1005可选的还可以是独立于前述处理器1001的存储装置。本领域技术人员可以理解,图1中示出的数据挖掘处理设备结构并不构成对数据挖掘处理设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
继续参照图1,图1中作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块以及数据挖掘处理程序。在图1中,网络通信模块可用于连接服务器,与服务器进行数据通信;而处理器1001可以用于调用存储器1005中存储的数据挖掘处理程序,并执行本发明实施例提供的数据挖掘处理方法。
基于上述硬件结构,提出本发明数据挖掘处理方法的各个实施例。
本发明提供一种数据挖掘处理方法。
请参照图2,图2为本发明数据挖掘处理方法第一实施例的流程示意图。
在本实施例中,该数据挖掘处理方法包括:
步骤S10,在接收到人群画像生成指令时,根据所述人群画像生成指令获取目标人群ID、人群画像类型和聚合维度信息;
随着计算机技术的快速发展,数据挖掘对于各个行业而言都尤为重要。随着大数据处理的兴起,对海量数据进行分析,可以有效地进行数据挖掘。通过对数据进行画像分析,能够有效地对目标数据进行挖掘和分析,因此出现了目标数据挖掘和用户画像分析等技术。目前,主要是针对单个用户进行用户画像,以了解目标消费者,进而进行信息推送。目前,主要是针对单个用户进行用户画像,以了解目标消费者,进而进行信息推送。然而单个用户的用户画像并不具有普遍性,无法体现出大众的偏好或者需求,在基于用户画像进行信息推送时,会存在信息推送准确率较低的问题。对此,本实施例提出一种数据挖掘处理方法,通过先获取目标人群ID、人群画像类型和聚合维度信息,进而获取对应的目标人群的数据,按对应的人群画像生成策略和聚合维度信息进行聚合分析,从而得到目标人群的人群画像,实现了针对人群进行人群画像,可更加精准分析目标人群特征,有利于后续根据人群画像进行信息推送,提高信息推送的准确率。
在本实施例中,该数据挖掘处理方法由数据挖掘处理设备实现,该数据挖掘处理设备可以是PC、笔记本电脑、服务器等设备,该数据挖掘处理设备以服务器为例进行说明。
在本实施例中,工作人员或客户想要对某一特定人群进行人群画像时,可以先通过工作终端(如智能手机、PC)触发人群画像生成指令,具体的,通过登录对应的APP(Application,应用程序)或软件,在点击人群画像生成选项后,可显示对应的人群ID和人群画像生成规则填写界面,该界面中包括人群ID列表、人群画像类型的选择与聚合维度的规则填写,工作人员可在人群ID列表中输入需要进行画像的人群的ID,其中,ID的类型可以包括UID(注册用户唯一标识)、phone(用户手机号)、device ID(设备ID,包括GUID(web和h5用户cookie的唯一标识)、IMEI(Android移动设备标识码)、IDFA(iOS移动设备标识码)和Open UDID(设备上第一个使用Open UDID方案的应用的唯一标识码))。然后,选择人群画像类型,人群画像类型包括基于标签的人群画像和基于行为的人群画像,再填写聚合维度,其中,当选择基于标签的人群画像时,其聚合维度可以为标签维度,当选择基于行为的人群画像时,其聚合维度信息可以包括时间维度、行为类型和行为对象等,最后,工作人员输入完成并确认之后,即可触发人群画像生成指令。
此时,服务器在接收到人群画像生成指令时,根据人群画像生成指令获取目标人群ID、人群画像类型和聚合维度信息。
具体的,步骤S10包括:
步骤a1,在接收到人群画像生成指令时,根据所述人群画像生成指令获取人群ID列表、人群画像类型和聚合维度信息;
为获取到用户在不同业务系统的用户数据,将分散在多方的用户数据进行整合归纳,打通多方的用户数据,本发明事先对用户的各种类型的ID进行了关联,并以UID来定义一个用户,即预设数据库中的用户数据是以UID这一ID类型来进行检索查询的,而工作人员在填写人群ID时,可能并不是以UID这一ID类型(即目标ID类型)来进行填写,因此,在获取到人群ID列表后,需检测人群列表中的人群ID是否为目标ID类型,若不是,则需要进行转换。具体的,在接收到人群画像生成指令时,根据人群画像生成指令获取人群ID列表、人群画像类型和聚合维度信息。
步骤a2,检测所述人群ID列表中的人群ID的类型是否为目标ID类型;
若是,则执行步骤a3:确定所述人群ID列表中的人群ID为目标人群ID;
若否,则执行步骤a4:根据预设ID信息关联表对所述人群ID列表中的人群ID进行转换,得到目标人群ID。
然后,检测该人群ID列表中的人群ID的类型是否为目标ID类型,若该人群ID列表中的人群ID的类型为目标ID类型,则无需进行转换,直接确定该人群ID列表中的人群ID为目标人群ID;若该人群ID列表中的人群ID的类型不为目标ID类型,则根据预设ID信息关联表对人群ID列表中的人群ID进行转换,得到目标人群ID。其中,预设ID信息关联表中包括UID与其他类型的ID(如phone、device ID中的GUID、IMEI、IDFA和Open UDID)之间的对应关系。
步骤S20,基于所述目标人群ID和所述人群画像类型从预设数据库中获取对应的目标人群的数据,并根据所述人群画像类型确定对应的人群画像生成策略;
在获取到目标人群ID、人群画像类型和聚合维度信息之后,基于目标人群ID和人群画像类型从预设数据库中获取对应的目标人群的数据,并根据人群画像类型确定对应的人群画像生成策略。其中,人群画像类型包括基于标签的人群画像和基于行为的人群画像,对应的,目标人群的数据包括目标人群的标签数据和行为数据,人群画像生成策略包括标签的人群画像生成策略和基于行为的人群画像生成策略。
步骤S30,基于所述人群画像生成策略、所述目标人群的数据和所述聚合维度信息对所述目标人群进行分析,得到目标人群的人群画像,所述人群画像生成策略包括基于标签的人群画像生成策略和基于行为的人群画像生成策略,所述基于标签的人群画像生成策略用于通过所述目标人群的各标签数量得到人群画像,所述基于行为的人群画像生成策略用于根据所述目标人群中用户各类行为的次数获得人群画像。
最后,基于人群画像生成策略、目标人群的数据和聚合维度信息对目标人群进行分析,得到目标人群的人群画像,其中,人群画像生成策略包括基于标签的人群画像生成策略和基于行为的人群画像生成策略,基于标签的人群画像生成策略用于通过目标人群的各标签数量得到人群画像,基于行为的人群画像生成策略用于根据目标人群中用户各类行为的次数获得人群画像。具体的,若人群画像类型为基于标签的人群画像时,则根据聚合维度信息(即标签维度)对目标人群的标签数据进行聚合,得到各标签的数量,然后根据各标签的数量和目标人群的数量计算各标签在目标人群中的占比,记为标签占比,进而获取各标签的全局占比,根据全局占比、标签占比计算各标签的目标群体指数,并基于各标签的目标群体指数和标签占比得到目标人群的人群画像;若人群画像类型为基于行为的人群画像时,则根据聚合维度信息(包括时间维度、行为类型和行为对象等)对目标人群的行为数据进行聚合,得到目标人群中各用户的各类行为的次数,然后基于目标人群中各用户的各类行为的次数按预设规则计算各类行为的目标群体指数,并基于目标群体指数得到目标人群的人群画像。具体的人群画像的生成方法可参照下述第二实施例和第三实施例,此处不作赘述。
本发明提供一种数据挖掘处理方法,在接收到人群画像生成指令时,根据人群画像生成指令获取目标人群ID、人群画像类型和聚合维度信息;进而基于目标人群ID和人群画像类型从预设数据库中获取对应的目标人群的数据,并根据人群画像类型确定对应的人群画像生成策略;最后,基于人群画像生成策略、目标人群的数据和聚合维度信息对目标人群进行分析,得到目标人群的人群画像。通过上述方式,本发明能实现针对人群进行人群画像,从而有利于后续根据人群画像进行信息推送,提高信息推送的准确率。
进一步的,参照图3,图3为本发明数据挖掘处理方法第二实施例的流程示意图。
基于上述图2所示的第一实施例,本实施例中,步骤S20可以包括:
步骤S210,若所述人群画像类型为基于标签的人群画像,则基于所述目标人群ID和所述人群画像类型从预设数据库中获取对应的目标人群的标签数据,并确定对应的人群画像生成策略为基于标签的人群画像生成策略;
在本实施例中,介绍了其中一种数据挖掘处理方法——基于标签的数据挖掘处理方法。若人群画像类型为基于标签的人群画像,则基于目标人群ID和人群画像类型从预设数据库中获取对应的目标人群的标签数据,并确定对应的人群画像生成策略为基于标签的人群画像生成策略。
此时,步骤S30包括:
步骤S310,根据所述聚合维度信息对所述目标人群的标签数据进行聚合,得到各标签的数量;
根据聚合维度信息对目标人群的标签数据进行聚合,得到各标签的数量。当人群画像类型为基于标签的人群画像时,其对应的聚合维度信息一般为标签维度,例如表1中,当ID包括10个,获取到目标人群的标签数据中包括性别、年龄和爱好3类标签,具体包括性别-男、性别-女、年龄-青年、年龄-中年、年龄-老年、爱好-电影、爱好-音乐和爱好-体育这8种标签,进而聚合得到各标签的数量,即性别-男7个,性别-女3个、年龄-青年2个、年龄-中年7个、年龄-老年1个、爱好-电影8个、爱好-音乐5个和爱好-体育4个。
表1目标人群的标签数据、相关聚合和计算结果
Figure BDA0002194021620000101
Figure BDA0002194021620000111
步骤S311,根据所述各标签的数量和所述目标人群的数量计算各标签在所述目标人群中的占比,记为标签占比;
然后,根据各标签的数量和目标人群的数量计算各标签在目标人群中的占比,记为标签占比。对于表1中的标签数据,由于其目标人群的数量为10,其对应的标签占比的计算结果如上表1所示。
步骤S312,获取各标签的全局占比,根据所述全局占比、所述标签占比和第一预设计算公式计算各标签的目标群体指数,并基于所述各标签的目标群体指数和所述标签占比得到目标人群的人群画像。
最后,获取各标签的全局占比,即各标签在该预设数据库中的所有用户的标签数据中的占比,进而根据全局占比、标签占比和第一预设计算公式计算各标签的目标群体指数(Target Group Index,TGI)。其中,第一预设计算公式为:
TGIi1=ai/bi*100%;
其中,TGIi1为标签i对应的目标群体指数,ai为标签i对应的标签占比,bi为标签i对应的全局占比。
例如,表1中,对于标签性别-男,其标签占比为70%,全局占比为50%时,其对应的目标群体指数为70%/50%*100%=140。TGIi1大于100则表示该人群在这个标签上表现突出(数字越大越突出),小于100则表示该人群在这个标签上表现不突出。
在计算得到各标签的目标群体指数后,基于各标签的目标群体指数和标签占比得到目标人群的人群画像,即基于标签的人群画像由标签占比和各标签的目标群体指数TGIi1两个指标构成。
通过上述方式,本发明可实现基于标签的方式,对目标人群进行人群画像,有利于后续工作人员可通过标签占比和各标签的目标群体指数两个指标来共同分析目标人群的特征,进而根据目标人群的特征分析结果来推送信息,可提高信息推送的准确性。
进一步的,请参照图4,图4为本发明数据挖掘处理方法第三实施例的流程示意图。
基于上述图2所示的第一实施例,本实施例中,步骤S20还可以包括:
步骤S220,若所述人群画像类型为基于行为的人群画像,则基于所述目标人群ID和所述人群画像类型从预设数据库中获取对应的目标人群的行为数据,并确定对应的人群画像生成策略为基于行为的人群画像生成策略;
在本实施例中,介绍了另一种数据挖掘处理方法——基于行为的数据挖掘处理方法。若人群画像类型为基于行为的人群画像,则基于目标人群ID和人群画像类型从预设数据库中获取对应的目标人群的行为数据,并确定对应的人群画像生成策略为基于行为的人群画像生成策略。
此时,步骤S30还包括:
步骤S320,根据所述聚合维度信息对所述目标人群的行为数据进行聚合,得到所述目标人群中各用户的各类行为的次数;
根据聚合维度信息对目标人群的行为数据进行聚合,得到目标人群中各用户的各类行为的次数。当人群画像类型为基于行为的人群画像时,其对应的聚合维度信息一般包括时间维度、行为类型和行为对象等信息,此时,则根据时间维度、行为类型和行为对象对目标人群的行为数据进行筛选聚合。需要说明的是,聚合维度信息可以包括一种或多种行为类型,对应的,当聚合维度信息中只包括一种行为类型时,则在聚合后,只会得到目标人群中各用户的该类行为的次数;当聚合维度信息中包括多种行为类型时,则在聚合后,会得到目标人群中各用户的各类行为的次数。在下述实施例中,以包括多种行为类型为例进行说明。
步骤S321,基于所述目标人群中各用户的各类行为的次数按预设规则计算各类行为的目标群体指数,并基于所述目标群体指数得到目标人群的人群画像。
然后,基于目标人群中各用户的各类行为的次数按预设规则计算各类行为的目标群体指数,并基于目标群体指数得到目标人群的人群画像。作为其中一种基于行为的人群画像生成方式,步骤S321可以包括:
步骤b11,对所述目标人群中各用户的各类行为的次数按行为类型进行相加,根据相加结果和所述目标人群的数量计算所述目标人群中各类行为的平均次数,记为人群平均次数;
作为其中一种基于行为的人群画像生成方式,在本实施例中,在得到目标人群中各用户的各类行为的次数之后,可先对所述目标人群中各用户的各类行为的次数按行为类型进行相加,根据相加结果和目标人群的数量计算目标人群中各类行为的平均次数,记为人群平均次数,其中,对于行为类型j的人群平均次数=行为类型j的相加结果/目标人群的数量。例如,下表2中,对于行为类型1,目标人群的总行为次数是8次,目标人群的数量为6人,可计算得到人群平均次数为8/6=1.33。
表1目标人群的标签数据、相关聚合和计算结果
ID 行为类型1 行为类型2 行为类型3 行为类型4
001 1 1 2
002 3 2 1
003 2 1 1
004 1 2
005 2 2 3
006 2 1
人群平均次数 1.33 1.00 0.67 1.50
全局平均次数 0.75 1.63 1.20 0.82
各类行为的目标群体指数 178 61 56 183
步骤b12,根据所述聚合维度信息对所述预设数据库中的全量数据进行聚合,并对聚合后的行为数据按行为类型进行统计,得到所述全量数据中各类行为的总次数;
步骤b13,根据所述全量数据中各类行为的总次数和所述全量数据中的用户数量计算得到所述全量数据中各类行为的平均次数,记为全局平均次数;
根据聚合维度信息(包括时间维度、行为类型和行为对象等)对预设数据库中的全量数据(即所有用户的行为数据)进行聚合,并对聚合后的行为数据按行为类型进行统计,得到全量数据中各类行为的总次数。进而根据全量数据中各类行为的总次数和全量数据中的用户数量计算得到全量数据中各类行为的平均次数,记为全局平均次数。其中,对于行为类型j的全局平均次数=全量数据中行为类型j的总次数/全量数据中的用户数量。
步骤b14,根据所述人群平均次数、所述全局平均次数和第二预设计算公式计算各类行为的目标群体指数,并基于所述各类行为的目标群体指数和所述人群平均次数得到目标人群的人群画像;
在计算得到人群平均次数和全局平均次数之后,根据人群平均次数、全局平均次数和第二预设计算公式计算各类行为的目标群体指数。其中,第二预设计算公式为:
TGIj2=cj/dj*100%;
其中,TGIj2为行为类型j对应的目标群体指数,cj为行为类型j对应的人群平均次数,dj为行为类型j对应的全局平均次数。
例如,表2中,对于行为类型1,其人群平均次数为1.33,全局平均次数为0.75,其对应的目标群里指数为1.33/0.75*100%=140。
在计算得到各类行为的目标群体指数后,基于各类行为的目标群体指数和人群平均次数得到目标人群的人群画像,即基于行为的人群画像由人群平均次数和各类行为的目标群体指数两个指标构成。
此外,作为另一种基于行为的人群画像生成方式,步骤S321还可以包括:
步骤b21,对所述目标人群中各用户的各类行为的次数按行为类型和行为次数进行统计,得到各类行为的人群次数分布情况;
作为另一种基于行为的人群画像生成方式,在本实施例中,在得到目标人群中各用户的各类行为的次数之后,还可先对目标人群中各用户的各类行为的次数按行为类型和行为次数进行统计,得到各类行为的人群次数分布情况。例如,在目标人群中,对于行为类型1,行为次数为1次的有m1人,占目标人群总数的a1%,行为次数为2次的有n1人,占目标人群总数的b1%;……;对于行为类型2,行为次数为1次的有m2人,占目标人群总数的a2%,行为次数为2次的有n2人,占目标人群总数的b2%;……。
步骤b22,根据所述聚合维度信息对所述预设数据库中的全量数据进行聚合,并对聚合后的行为数据按行为类型和行为次数进行统计,得到所述全量数据中各类行为的全局次数分布情况;
然后根据聚合维度信息(包括时间维度、行为类型和行为对象等)对预设数据库中的全量数据(即所有用户的行为数据)进行聚合,并对聚合后的行为数据按行为类型和行为次数进行统计,得到全量数据中各类行为的全局次数分布情况。例如,在全量数据中,对于行为类型1,行为次数为1次的有m1’人,占目标人群总数的a1’%,行为次数为2次的有n1’人,占目标人群总数的b1’%;……;对于行为类型2,行为次数为1次的有m2’人,占目标人群总数的a2’%,行为次数为2次的有n2’人,占目标人群总数的b2’%;……。
步骤b23,基于所述人群次数分布情况和所述全局次数分布情况计算各类行为的各行为次数对应的目标群体指数,并基于所述各类行为的各行为次数对应的目标群体指数和所述人群次数分布情况得到目标人群的人群画像。
最后,基于人群次数分布情况和全局次数分布情况计算各类行为的各行为次数对应的目标群体指数,例如,上述例中,对于行为类型1,行为次数为1次的目标群体指数为a1/a1’*100%;而对于行为类型1,行为次数为2次的目标群体指数为b1/b1’*100%。
在得到各类行为的各行为次数对应的目标群体指数后,基于各类行为的各行为次数对应的目标群体指数和人群次数分布情况得到目标人群的人群画像,即基于行为的人群画像可由各类行为的人群次数分布情况和各类行为的各行为次数对应的目标群体指数两个指标构成。
本发明还提供一种数据挖掘处理装置。
参照图5,图5为本发明数据挖掘处理装置第一实施例的功能模块示意图。
在本实施例中,所述数据挖掘处理装置包括:
信息获取模块10,用于在接收到人群画像生成指令时,根据所述人群画像生成指令获取目标人群ID、人群画像类型和聚合维度信息;
策略确定模块20,用于基于所述目标人群ID和所述人群画像类型从预设数据库中获取对应的目标人群的数据,并根据所述人群画像类型确定对应的人群画像生成策略;
画像生成模块30,用于基于所述人群画像生成策略、所述目标人群的数据和所述聚合维度信息对所述目标人群进行分析,得到目标人群的人群画像,所述人群画像生成策略包括基于标签的人群画像生成策略和基于行为的人群画像生成策略,所述基于标签的人群画像生成策略用于通过所述目标人群的各标签数量得到人群画像,所述基于行为的人群画像生成策略用于根据所述目标人群中用户各类行为的次数获得人群画像。
其中,上述数据挖掘处理装置的各虚拟功能模块存储于图1所示数据挖掘处理设备的存储器1005中,用于实现数据挖掘处理程序的所有功能;各模块被处理器1001执行时,可实现针对人群进行人群画像的功能。
进一步的,所述策略确定模块20包括:
第一策略确定单元,用于若所述人群画像类型为基于标签的人群画像,则基于所述目标人群ID和所述人群画像类型从预设数据库中获取对应的目标人群的标签数据,并确定对应的人群画像生成策略为基于标签的人群画像生成策略;
所述画像生成模块30包括:
第一聚合单元,用于根据所述聚合维度信息对所述目标人群的标签数据进行聚合,得到各标签的数量;
标签占比计算单元,用于根据所述各标签的数量和所述目标人群的数量计算各标签在所述目标人群中的占比,记为标签占比;
第一画像生成单元,用于获取各标签的全局占比,根据所述全局占比、所述标签占比和第一预设计算公式计算各标签的目标群体指数,并基于所述各标签的目标群体指数和所述标签占比得到目标人群的人群画像;
进一步的,所述第一预设计算公式为:
TGIi1=ai/bi*100%;
其中,TGIi1为标签i对应的目标群体指数,ai为标签i对应的标签占比,bi为标签i对应的全局占比。
进一步的,所述策略确定模块20还包括:
第二策略确定单元,用于若所述人群画像类型为基于行为的人群画像,则基于所述目标人群ID和所述人群画像类型从预设数据库中获取对应的目标人群的行为数据,并确定对应的人群画像生成策略为基于行为的人群画像生成策略;
所述画像生成模块30还包括:
第二聚合单元,用于根据所述聚合维度信息对所述目标人群的行为数据进行聚合,得到所述目标人群中各用户的各类行为的次数;
第二画像生成单元,基于所述目标人群中各用户的各类行为的次数按预设规则计算各类行为的目标群体指数,并基于所述目标群体指数得到目标人群的人群画像。
进一步的,所述第二画像生成单元包括:
第一计算子单元,用于对所述目标人群中各用户的各类行为的次数按行为类型进行相加,根据相加结果和所述目标人群的数量计算所述目标人群中各类行为的平均次数,记为人群平均次数;
第一统计子单元,用于根据所述聚合维度信息对所述预设数据库中的全量数据进行聚合,并对聚合后的行为数据按行为类型进行统计,得到所述全量数据中各类行为的总次数;
第二计算子单元,用于根据所述全量数据中各类行为的总次数和所述全量数据中的用户数量计算得到所述全量数据中各类行为的平均次数,记为全局平均次数;
第一画像生成子单元,用于根据所述人群平均次数、所述全局平均次数和第二预设计算公式计算各类行为的目标群体指数,并基于所述各类行为的目标群体指数和所述人群平均次数得到目标人群的人群画像;
其中,所述第二预设计算公式为:
TGIj2=cj/dj*100%;
其中,TGIj2为行为类型j对应的目标群体指数,cj为行为类型j对应的人群平均次数,dj为行为类型j对应的全局平均次数。
进一步的,所述第二画像生成单元还包括:
第二统计子单元,用于对所述目标人群中各用户的各类行为的次数按行为类型和行为次数进行统计,得到各类行为的人群次数分布情况;
第三统计子单元,用于根据所述聚合维度信息对所述预设数据库中的全量数据进行聚合,并对聚合后的行为数据按行为类型和行为次数进行统计,得到所述全量数据中各类行为的全局次数分布情况;
第二画像生成子单元,用于基于所述人群次数分布情况和所述全局次数分布情况计算各类行为的各行为次数对应的目标群体指数,并基于所述各类行为的各行为次数对应的目标群体指数和所述人群次数分布情况得到目标人群的人群画像。
进一步的,信息获取模块10包括:
信息获取单元,用于在接收到人群画像生成指令时,根据所述人群画像生成指令获取人群ID列表、人群画像类型和聚合维度信息;
ID检测单元,用于检测所述人群ID列表中的人群ID的类型是否为目标ID类型;
ID确定单元,用于若所述人群ID列表中的人群ID的类型为目标ID类型,则确定所述人群ID列表中的人群ID为目标人群ID;
ID转换单元,用于若所述人群ID列表中的人群ID的类型不为目标ID类型,则根据预设ID信息关联表对所述人群ID列表中的人群ID进行转换,得到目标人群ID。
其中,上述数据挖掘处理装置中各个模块的功能实现与上述数据挖掘处理方法实施例中各步骤相对应,其功能和实现过程在此处不再一一赘述。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质上存储有数据挖掘处理程序,所述数据挖掘处理程序被处理器执行时实现如以上任一项实施例所述的数据挖掘处理方法的步骤。
本发明计算机可读存储介质的具体实施例与上述数据挖掘处理方法各实施例基本相同,在此不作赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种数据挖掘处理方法,其特征在于,所述数据挖掘处理方法包括以下步骤:
在接收到人群画像生成指令时,根据所述人群画像生成指令获取目标人群ID、人群画像类型和聚合维度信息;
基于所述目标人群ID和所述人群画像类型从预设数据库中获取对应的目标人群的数据,并根据所述人群画像类型确定对应的人群画像生成策略;
基于所述人群画像生成策略、所述目标人群的数据和所述聚合维度信息对所述目标人群进行分析,得到目标人群的人群画像,所述人群画像生成策略包括基于标签的人群画像生成策略和基于行为的人群画像生成策略,所述基于标签的人群画像生成策略用于通过所述目标人群的各标签数量得到人群画像,所述基于行为的人群画像生成策略用于根据所述目标人群中用户各类行为的次数获得人群画像。
2.如权利要求1所述的数据挖掘处理方法,其特征在于,所述基于所述目标人群ID和所述人群画像类型从预设数据库中获取对应的目标人群的数据,并根据所述人群画像类型确定对应的人群画像生成策略的步骤包括:
若所述人群画像类型为基于标签的人群画像,则基于所述目标人群ID和所述人群画像类型从预设数据库中获取对应的目标人群的标签数据,并确定对应的人群画像生成策略为基于标签的人群画像生成策略;
所述基于所述人群画像生成策略、所述目标人群的数据和所述聚合维度信息对所述目标人群进行分析,得到目标人群的人群画像的步骤包括:
根据所述聚合维度信息对所述目标人群的标签数据进行聚合,得到各标签的数量;
根据所述各标签的数量和所述目标人群的数量计算各标签在所述目标人群中的占比,记为标签占比;
获取各标签的全局占比,根据所述全局占比、所述标签占比和第一预设计算公式计算各标签的目标群体指数,并基于所述各标签的目标群体指数和所述标签占比得到目标人群的人群画像。
3.如权利要求2所述的数据挖掘处理方法,其特征在于,所述第一预设计算公式为:
TGIi1=ai/bi*100%;
其中,TGIi1为标签i对应的目标群体指数,ai为标签i对应的标签占比,bi为标签i对应的全局占比。
4.如权利要求1所述的数据挖掘处理方法,其特征在于,所述基于所述目标人群ID和所述人群画像类型从预设数据库中获取对应的目标人群的数据,并根据所述人群画像类型确定对应的人群画像生成策略的步骤还包括:
若所述人群画像类型为基于行为的人群画像,则基于所述目标人群ID和所述人群画像类型从预设数据库中获取对应的目标人群的行为数据,并确定对应的人群画像生成策略为基于行为的人群画像生成策略;
所述基于所述人群画像生成策略、所述目标人群的数据和所述聚合维度信息对所述目标人群进行分析,得到目标人群的人群画像的步骤还包括:
根据所述聚合维度信息对所述目标人群的行为数据进行聚合,得到所述目标人群中各用户的各类行为的次数;
基于所述目标人群中各用户的各类行为的次数按预设规则计算各类行为的目标群体指数,并基于所述目标群体指数得到目标人群的人群画像。
5.如权利要求4所述的数据挖掘处理方法,其特征在于,所述基于所述目标人群中各用户的各类行为的次数按预设规则计算各类行为的目标群体指数,并基于所述目标群体指数得到目标人群的人群画像的步骤包括:
对所述目标人群中各用户的各类行为的次数按行为类型进行相加,根据相加结果和所述目标人群的数量计算所述目标人群中各类行为的平均次数,记为人群平均次数;
根据所述聚合维度信息对所述预设数据库中的全量数据进行聚合,并对聚合后的行为数据按行为类型进行统计,得到所述全量数据中各类行为的总次数;
根据所述全量数据中各类行为的总次数和所述全量数据中的用户数量计算得到所述全量数据中各类行为的平均次数,记为全局平均次数;
根据所述人群平均次数、所述全局平均次数和第二预设计算公式计算各类行为的目标群体指数,并基于所述各类行为的目标群体指数和所述人群平均次数得到目标人群的人群画像;
其中,所述第二预设计算公式为:
TGIj2=cj/dj*100%;
其中,TGIj2为行为类型j对应的目标群体指数,cj为行为类型j对应的人群平均次数,dj为行为类型j对应的全局平均次数。
6.如权利要求4所述的数据挖掘处理方法,其特征在于,所述基于所述目标人群中各用户的各类行为的次数按预设规则计算各类行为的目标群体指数,并基于所述目标群体指数得到目标人群的人群画像的步骤还包括:
对所述目标人群中各用户的各类行为的次数按行为类型和行为次数进行统计,得到各类行为的人群次数分布情况;
根据所述聚合维度信息对所述预设数据库中的全量数据进行聚合,并对聚合后的行为数据按行为类型和行为次数进行统计,得到所述全量数据中各类行为的全局次数分布情况;
基于所述人群次数分布情况和所述全局次数分布情况计算各类行为的各行为次数对应的目标群体指数,并基于所述各类行为的各行为次数对应的目标群体指数和所述人群次数分布情况得到目标人群的人群画像。
7.如权利要求1所述的数据挖掘处理方法,其特征在于,所述在接收到人群画像生成指令时,根据所述人群画像生成指令获取目标人群ID、人群画像类型和聚合维度信息的步骤包括:
在接收到人群画像生成指令时,根据所述人群画像生成指令获取人群ID列表、人群画像类型和聚合维度信息;
检测所述人群ID列表中的人群ID的类型是否为目标ID类型;
若是,则确定所述人群ID列表中的人群ID为目标人群ID;
若否,则根据预设ID信息关联表对所述人群ID列表中的人群ID进行转换,得到目标人群ID。
8.一种数据挖掘处理装置,其特征在于,所述数据挖掘处理装置包括:
信息获取模块,用于在接收到人群画像生成指令时,根据所述人群画像生成指令获取目标人群ID、人群画像类型和聚合维度信息;
策略确定模块,用于基于所述目标人群ID和所述人群画像类型从预设数据库中获取对应的目标人群的数据,并根据所述人群画像类型确定对应的人群画像生成策略;
画像生成模块,用于基于所述人群画像生成策略、所述目标人群的数据和所述聚合维度信息对所述目标人群进行分析,得到目标人群的人群画像,所述人群画像生成策略包括基于标签的人群画像生成策略和基于行为的人群画像生成策略,所述基于标签的人群画像生成策略用于通过所述目标人群的各标签数量得到人群画像,所述基于行为的人群画像生成策略用于根据所述目标人群中用户各类行为的次数获得人群画像。
9.一种数据挖掘处理设备,其特征在于,所述数据挖掘处理设备包括存储器、处理器以及存储在所述存储器上并可被所述处理器执行的数据挖掘处理程序,其中所述数据挖掘处理程序被所述处理器执行时,实现如权利要求1至7中任一项所述的数据挖掘处理方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有数据挖掘处理程序,其中所述数据挖掘处理程序被处理器执行时,实现如权利要求1至7中任一项所述的数据挖掘处理方法的步骤。
CN201910846567.3A 2019-09-06 2019-09-06 数据挖掘处理方法、装置、设备及计算机可读存储介质 Pending CN110737693A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910846567.3A CN110737693A (zh) 2019-09-06 2019-09-06 数据挖掘处理方法、装置、设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910846567.3A CN110737693A (zh) 2019-09-06 2019-09-06 数据挖掘处理方法、装置、设备及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN110737693A true CN110737693A (zh) 2020-01-31

Family

ID=69267510

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910846567.3A Pending CN110737693A (zh) 2019-09-06 2019-09-06 数据挖掘处理方法、装置、设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN110737693A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112949746A (zh) * 2021-03-23 2021-06-11 耿赛 应用于用户行为分析的大数据处理方法及人工智能服务器

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108415978A (zh) * 2018-02-09 2018-08-17 北京腾云天下科技有限公司 用户标签存储方法、用户画像计算方法及计算设备
CN109377261A (zh) * 2018-09-17 2019-02-22 平安科技(深圳)有限公司 群组用户画像创建方法、装置、计算机可读存储介质
CN109658478A (zh) * 2017-10-10 2019-04-19 爱信诺征信有限公司 一种提供企业画像的方法及系统
CN109886719A (zh) * 2018-12-20 2019-06-14 平安科技(深圳)有限公司 基于网格的数据挖掘处理方法、装置和计算机设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109658478A (zh) * 2017-10-10 2019-04-19 爱信诺征信有限公司 一种提供企业画像的方法及系统
CN108415978A (zh) * 2018-02-09 2018-08-17 北京腾云天下科技有限公司 用户标签存储方法、用户画像计算方法及计算设备
CN109377261A (zh) * 2018-09-17 2019-02-22 平安科技(深圳)有限公司 群组用户画像创建方法、装置、计算机可读存储介质
CN109886719A (zh) * 2018-12-20 2019-06-14 平安科技(深圳)有限公司 基于网格的数据挖掘处理方法、装置和计算机设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112949746A (zh) * 2021-03-23 2021-06-11 耿赛 应用于用户行为分析的大数据处理方法及人工智能服务器

Similar Documents

Publication Publication Date Title
CN107391538B (zh) 点击数据采集、处理和展示方法、装置、设备及存储介质
JP6592474B2 (ja) アプリケーションごとのリソース使用情報の提供
US10360257B2 (en) System and method for image annotation
CN107944481B (zh) 用于生成信息的方法和装置
US20180260667A1 (en) Systems and methods for inferential sharing of photos
US11507580B2 (en) Methods and apparatus to partition data
CN106709318B (zh) 一种用户设备唯一性的识别方法、装置和计算设备
CN109446837B (zh) 基于敏感信息的文本审核方法、设备及可读存储介质
CN107633257B (zh) 数据质量评估方法及装置、计算机可读存储介质、终端
WO2019179030A1 (zh) 产品购买预测方法、服务器及存储介质
JP2018077821A (ja) ユーザによって訪問される施設のカテゴリの予測モデルを生成する方法、プログラム、サーバ装置、及び処理装置
CN109800340A (zh) 商标注册推荐方法及系统
CN113076416A (zh) 信息热度评估方法、装置和电子设备
CN106294406B (zh) 一种用于处理应用访问数据的方法与设备
CN106910135A (zh) 用户推荐方法及装置
CN110245684B (zh) 数据处理方法、电子设备和介质
CN111831708A (zh) 基于缺失数据的样本分析方法、装置、电子设备及介质
CN111626767A (zh) 资源数据的发放方法、装置及设备
CN109697155B (zh) It系统性能评估方法、装置、设备及可读存储介质
CN113205130B (zh) 一种数据审核方法、装置、电子设备及存储介质
CN114692889A (zh) 用于机器学习算法的元特征训练模型
CN111292108A (zh) 订单统计方法、装置、设备及计算机可读存储介质
CN110737693A (zh) 数据挖掘处理方法、装置、设备及计算机可读存储介质
CN110110197B (zh) 信息获取方法和装置
CN112035736B (zh) 信息推送方法、装置及服务器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20200131

WD01 Invention patent application deemed withdrawn after publication