CN116402534A - 一种人群特征确定方法、装置、设备及存储介质 - Google Patents

一种人群特征确定方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN116402534A
CN116402534A CN202310376735.3A CN202310376735A CN116402534A CN 116402534 A CN116402534 A CN 116402534A CN 202310376735 A CN202310376735 A CN 202310376735A CN 116402534 A CN116402534 A CN 116402534A
Authority
CN
China
Prior art keywords
reference date
behavior
data
determining
industry
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310376735.3A
Other languages
English (en)
Inventor
蔺萍
叶玮彬
刘涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu com Times Technology Beijing Co Ltd
Original Assignee
Baidu com Times Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baidu com Times Technology Beijing Co Ltd filed Critical Baidu com Times Technology Beijing Co Ltd
Priority to CN202310376735.3A priority Critical patent/CN116402534A/zh
Publication of CN116402534A publication Critical patent/CN116402534A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本公开提供了一种人群特征确定方法、装置、设备及存储介质,涉及数据处理技术领域,尤其涉及大数据技术领域。具体实现方案为:获取基准日期对应的行为明细数据、所述基准日期对应的历史行业特征数据和历史品牌特征数据;根据所述行为明细数据、所述历史行业特征数据和所述历史品牌特征数据,确定基准日期对应的人群特征数据。通过上述技术方案,能够提高人群特征数据的确定效率。

Description

一种人群特征确定方法、装置、设备及存储介质
技术领域
本公开涉及数据处理技术领域,尤其涉及大数据技术领域。
背景技术
随着互联网技术的发展,各行各业每天都会产生大量的网络行为数据。在不同行业的品牌方如何快速高效地从海量网络行为数据中分析行为方(如消费者)的人群阶段,对于品牌方精细化运营至关重要。而这其中,如何快速且准确确定不同行为方的人群特征对于确定人群阶段也至关重要。
发明内容
本公开提供了一种人群特征确定方法、装置、设备及存储介质。
根据本公开的一方面,提供了一种人群特征确定方法,该方法包括:
获取基准日期对应的行为明细数据、所述基准日期对应的历史行业特征数据和历史品牌特征数据;
根据所述行为明细数据、所述历史行业特征数据和所述历史品牌特征数据,确定基准日期对应的人群特征数据。
根据本公开的另一方面,提供了一种人群特征确定装置,包括:
数据获取模块,用于获取基准日期对应的行为明细数据、所述基准日期对应的历史行业特征数据和历史品牌特征数据;
人群特征确定模块,用于根据所述行为明细数据、所述历史行业特征数据和所述历史品牌特征数据,确定基准日期对应的人群特征数据。
根据本公开的另一方面,提供了一种电子设备,该电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开任一实施例所述人群特征确定方法。
根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使计算机执行本公开任一实施例所述的人群特征确定方法。
根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据本公开任一实施例所述的人群特征确定方法。
根据本公开的技术,能够提高人群特征的确定效率。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是根据本公开实施例提供的一种人群特征确定方法的流程图;
图2是根据本公开实施例提供的另一种人群特征确定方法的流程图;
图3是根据本公开实施例提供的又一种人群特征确定方法的流程图;
图4根据本公开实施例提供的一种人群特征确定装置的结构示意图;
图5是用来实现本公开实施例的人群特征确定方法的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“历史”、“目标”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
此外,还需要说明的是,本发明的技术方案中,所涉及的行为明细数据、行业特征数据和品牌特征数据等相关数据的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
从海量的用户行为日志中,实现O-AIIA人群的快速圈选和高效更新,以赋能品牌精细化运营。在O-AIIA人群资产经营方法论中,品牌方的人群资产被分为两个部分:O(Opportunity)机会人群:用于控制人群资产的总量;AIIA品牌资产人群:用于控制人群资产的结构。根据消费者和品牌方关系的远近关系定义为了解人群(aware)、兴趣人群(interest)、意向人群(intent)、转化人群(act)。
目前实现O-AIIA人群传统做法为:(1)各行业人群定制化建设。各品牌方由于产品性质不同,对应的用户行为也不尽相同,不同人群的圈选逻辑多样,涉及到维护圈定规则、识别触点类型、判定人群阶段等过程,每个步骤都仅与当前品牌相关,实现定制化开发。(2)基于用户行为明细数据圈定人群。AIIA人群判定是依据不同时间段的用户某类行为次数来判断。该方案对于上游各种来源的用户行为明细数据保存时间有比较严格的要求,计算过程中需要读入连续多天的数据,join操作涉及shuffle,shuffle操作需要大量的网络IO操作,任务计算时间长。(3)按需更新人群数据。由于计算成本较大,人群数据并非按天例行更新,大多是按月或按需进行更新。以机会人群为例:会一次性从多种来源的所有用户行为日志中筛选出与该品牌所在行业相关的用户id,作为机会人群,后续分析人群流转等场景都使用同一份数据。
传统方法存在以下缺点:(1)定制化开发维护成本大。不同行业人群圈定步骤基本相同,开发过程中相似代码逻辑会维护在多个地方。如果需要更改共用的代码,需要改动多次,没有良好的拓展性。(2)计算资源和存储资源存在双重浪费。人群圈定各行业类似,需要依据用户某类行为在某段时间的次数是否达标,时间长度并不统一,少则需要近30天,多则长达365天甚至更长时间。如果通过明细数据直接圈定人群,一是读入的数据量会非常大,计算会额外消耗很多计算资源,而是对明细数据的存储时长提出了要求,至少需要存储1年,对存储资源也会造成浪费。(3)数据更新不及时无法快速反哺业务。机会人群应当是持续挖掘和扩展的过程,既要有进场策略(例如近一段周期产生行为或符合用户特征),也要有退场策略(例如历史上符合行为特征,但有较长时间未产生相关行为)。机会人群应该同行业共享,AIIA人群应该是机会人群的子集。在上述方案中,机会人群长时间不更新,一是会冗余已失效的人群、二是会遗漏最近发生过行为的人群,不利于真实体现各阶段人群流转情况。
图1是根据本公开实施例提供的一种人群特征确定方法的流程图。本实施例适用于如何进行人群特征确定的情况。该方法可以由人群特征确定装置来执行,该装置可以采用软件和/或硬件的方式实现,并可集成于承载人群特征确定功能的电子设备中,比如服务器中。如图1所示,本实施例的人群特征确定方法可以包括:
S101,获取基准日期对应的行为明细数据、基准日期对应的历史行业特征数据和历史品牌特征数据。
本实施例中,基准日期是指需要进行人群特征分析确定的日期,例如可以是当天或者是当天之前的任一天。
所谓行为明细数据是指行为方在基准日期对某行业中某品牌涉及的推广产品中的网络行为数据,例如信息流文章点击、××产品搜索、××小程序到访、信息流文章内容互动、××小程序关注等。其中,行为方是指产生行为明细数据的一方,例如可以是某行业中线上消费者等。
所谓行业特征数据是指每个行业中设定时间跨度(比如近设定天数)的行为方信息,其中,设定时间跨度可以由本领域技术人员根据实际需求设定,例如可以是30天;可选的,行业特征数据可以包括行业信息和行为方信息;其中,行业信息可以包括但不限于一级行业名称和二级行业名称等;行为方信息可以包括但不限于行为方标识(行为方ID)和行为方新增日期;行为方新增日期是指行为方标识添加至行业特征数据中的日期。示例性的,行业特征数据可以以行业特征表形式存储,如下表所示:
Figure BDA0004171112040000051
所谓历史行业特征数据是指基准日期(记为T)之前对行为明细数据进行分析处理得到的行业特征数据,例如基准日期前一天(记为T-1)对应的行业特征数据。
所谓品牌特征数据是指行业中品牌相关的行为方的行为统计数据以及人群所属阶段数据;可选的,品牌特征数据可以包括行业信息、品牌信息、行为方信息和行为触点统计信息;其中,行业信息可以包括但不限于一级行业名称和二级行业名称等;行为方信息可以包括但不限于行为方标识(行为方ID);品牌信息可以包括但不限于品牌标识(品牌ID)和品牌名称;行为触点统计信息可以包括但不限于某行为触点(比如点击)近1天的触达次数、某行为触点近M(比如M=30,M=365)天的触达次数,以及行为方所属人群阶段。其中,行为触点是指对行为方明细数据进行分类后的结果,可以包括但不限于一级触点类别,一级触点类别下包括二级触点类别;例如,一级触点类别为商业点击,其下包括的二级触点类别有信息流推广点击、搜索点击、品专点击和开屏点击等。示例性的,品牌特征数据可以以品牌特征表形式存储,如下表所示:
Figure BDA0004171112040000061
所谓历史品牌特征数据是指基准日期之前对用户行为明细数据进行分析处理后得到的品牌特征数据,例如基准日期前一天对应的品牌特征数据、基准日期前M天对应的品牌特征数据(比如T-30的品牌特征数据或T-365的品牌特征数据)等,其中,M为大于1的自然数。
S102,根据行为明细数据、历史行业特征数据和历史品牌特征数据,确定基准日期对应的人群特征数据。
本实施例中,人群特征数据是指用于表征在基准日期对应的某行业中某品牌相关的某一类人群的特征数据。
具体的,可以根据基准日期对应的行为明细数据,来更新历史行业特征数据和历史品牌特征数据,得到更新后的行业特征数据和更新后的品牌特征数据,进而将更新后的行业特征数据和更新后的品牌特征数据,作为基准日期对应的人群特征数据。
本公开实施例提供的技术方案,获取基准日期对应的行为明细数据、基准日期对应的历史行业特征数据和历史品牌特征数据,之后根据行为明细数据、历史行业特征数据和历史品牌特征数据,确定基准日期对应的人群特征数据。上述技术方案,相比于现有基于行为方的基准日期及其之前的行为明细数据,来确定基准日期的人群特征数据的方案,该方案会对不同日期行为明细数据中相同部分进行重复计算且需要大量存储空间的方案,本公开基于基准日期的行为明细数据和历史行业特征和历史品牌特征数据来确定人群特征数据,可以避免对行为明细数据的重复计算,节省了存储和计算资源,提升了人群特征数据的确定效率。
在上述实施例的基础上,作为本公开的一种可选方式,根据行为明细数据、历史行业特征数据和历史品牌特征数据,确定基准日期对应的人群特征数据可以是,根据行为明细数据和历史行业特征数据,确定基准日期对应的目标行业特征数据;根据行为明细数据和历史品牌特征数据,确定基准日期对应的目标品牌特征数据;根据目标行业特征数据和目标品牌特征数据,确定基准日期对应的人群特征数据。
其中,历史行业特征数据包括基准日期前一天对应的行业特征数据;历史品牌特征数据包括基准日期前一天对应的品牌特征数据和基准日期前M天对应的品牌特征数据;M为大于1的自然数。目标行业特征数据是指基准日期对应的行业特征数据。目标品牌特征数据是指基准日期对应的品牌特征数据。
具体的,可以从行为明细数据中获取行业相关数据,并对该行业相关数据和历史行业特征数据(基准日期前一天对应的行业特征数据)进行整合,得到基准日期对应的目标行业特征数据。同时,还可以行为明细数据中获取品牌相关数据,并对该品牌相关数据和历史品牌特征数据(基准日期前一天对应的品牌特征数据和基准日期前M天对应的品牌特征数据)进行整合,得到基准日期对应的目标品牌特征数据。进而,将目标行业特征数据和目标品牌特征数据作为基准日期对应的人群特征数据。
可以理解的是,相比于现有技术中由于数据量庞大而对人群数据每隔一段时间更新的方案,本公开中基于基准日期前一天的行业特征数据和品牌特征数据,能够实现对人群特征数据进行每天更新,提升了更新频率,从而可以及时反哺业务。
图2是根据本公开实施例提供的另一种人群特征确定方法的流程图。本实施例在上述实施例的基础上,对“根据行为明细数据和历史行业特征数据,确定基准日期对应的目标行业特征数据”进一步优化,提供一种可选实施方案。如图2所示,本实施例的人群特征确定方法可以包括:
S201,获取基准日期对应的行为明细数据、基准日期对应的历史行业特征数据和历史品牌特征数据。
S202,从行为明细数据中筛选出基准日期对应的行业数据。
本实施例中,行业数据包括基准日期的行业信息和行为方信息。
具体的,可以读取基准日期的行为明细数据,从行为明细数据中筛选出所有行业数据,之后对所有行业数据进行去重处理,得到基准日期对应的行业数据,也即基准日期新增的行业数据(行业名词和行为方标识等)。
S203,从基准日期前一天对应的行业特征数据中,选择出在固定时间跨度内日期最靠前的新增行为方数据,并删除新增行为方数据,得到处理后的历史行业特征数据。
本实施例中,新增行为方数据是指在对应日期新增加的行为方信息。
具体的,可以从基准日期前一天对应的行业特征数据中,筛选出在行业特征数据中新增日期最靠前(即固定时间跨度内日期最靠前)的新增行为方数据,并将该新增行为方数据删除,得到处理后的历史行业特征数据,也就是说,此时处理后的历史行业特征数据的时间跨度少一天。例如,行业特征数据为固定时间跨度为30天的数据,历史行业特征数据为T-1对应的行业特征数据,即包含经过分析处理的T-30~T-1中每天新增的行业数据,从T-1对应的行业特征数据中删除T-30新增的行业数据,得到处理后的历史行业特征数据,即时间跨度为29天的行业数据。
S204,根据处理后的历史行业特征数据和基准日期对应的行业数据,确定基准日期对应的目标行业特征数据。
具体的,可以对处理后的历史行业特征数据和基准日期对应的行业数据进行合并,例如可以按照行业名词和行为方标识进行聚合,将合并后的数据作为基准日期对应的目标行业特征数据。
S205,根据行为明细数据和历史品牌特征数据,确定基准日期对应的目标品牌特征数据。
其中,历史品牌特征数据包括基准日期前一天对应的品牌特征数据和基准日期前M天对应的品牌特征数据;M为大于1的自然数;
S206,根据目标行业特征数据和目标品牌特征数据,确定基准日期对应的人群特征数据。
本公开实施例提供的技术方案,通过从行为明细数据中筛选出基准日期对应的行业数据,并从基准日期前一天对应的行业特征数据中,选择出在固定时间跨度内日期最靠前的新增行为方数据,并删除新增行为方数据,得到处理后的历史行业特征数据,之后根据处理后的历史行业特征数据和基准日期对应的行业数据,确定基准日期对应的目标行业特征数据,进而根据行为明细数据和历史品牌特征数据,确定基准日期对应的目标品牌特征数据,最后根据目标行业特征数据和目标品牌特征数据,确定基准日期对应的人群特征数据。上述技术方案,通过基准日期的行为明细数据和基准日期前一天的行业特征数据,来更新基准日期对应的行业特征数据,实现了对行业特征数据的日更新,从而提高人群特征数据的更新频率。
图3是根据本公开实施例提供的又一种人群特征确定方法的流程图。本实施例在上述实施例的基础上,对“根据行为明细数据和历史品牌特征数据,确定基准日期对应的目标品牌特征数据”进一步优化,提供一种可选实施方案。如图3所示,本实施例的人群特征确定方法可以包括:
S301,获取基准日期对应的行为明细数据、基准日期对应的历史行业特征数据和历史品牌特征数据。
S302,根据行为明细数据和历史行业特征数据,确定基准日期对应的目标行业特征数据。
其中,历史行业特征数据包括基准日期前一天对应的行业特征数据。
S303,根据行为明细数据和基准日期前一天对应的品牌特征数据,确定基准日期对应行为触点近一天的触达次数。
本实施例中,触达次数是指行为触点在一段时间内被触发的次数,例如内容互动触点中信息流文章互动2次等。
具体的,可以基于full join方式,对基准日期对应的行为明细数据和基准日期前一天对应的品牌特征数据进行连接,得到基准日期对应的各行为触点近一天的触达次数。
S304,根据基准日期对应行为触点近一天的触达次数、基准日期前一天对应的品牌特征数据中行为触点近M天的触达次数和基准日期前M天对应的品牌特征数据中行为触点近一天的触达次数,确定基准日期对应行为触点近M天的触达次数。
一种可选方式,可以基于触点次数确定模型,根据基准日期对应行为触点近一天的触达次数、基准日期天一天对应的品牌特征数据中行为触点近M天的触达次数和基准日期前M天对应的品牌特征数据中行为触点近一天的触达次数,确定基准日期对应行为触点近M提案的触达次数。其中,触达次数确定模型可以是基于机器学习和统计学习算法预先训练得到的模型。
又一种可选方式,根据基准日期前一天对应的品牌特征数据中行为触点近M天的触达次数和基准日期前M天对应的品牌特征数据中行为触点近一天的触达次数,确定基准日期对应行为触点近M-1天的触达次数;根据基准日期对应行为触点近一天的触达次数和基准日期对应行为触点近M-1天的触达次数,确定基准日期对应行为触点近M天的触达次数。
具体的,对于每一行为触点,可以将基准日期前一天(T-1)对应的品牌特征数据中该行为触点近M天的触达次数减去基准日期前M天(T-M)对于品牌特征数据中该行为触点近一天的触达次数,得到基准日期(T)对于该行为触点近M-1天的触达次数。之后将基准日期对应该行为触点近一天的触达次数和基准日期对应该行为触点近M-1天的触达次数,得到基准日期对应该行为触点近M天的触达次数。
可以理解的是,提供一种可以固定时间跨度来更新品牌特征数据中的行为触点的触达次数的方式,能够减少数据运算量和存储量,并提高数据更新效率。
S305,根据基准日期对应行为触点近一天的触达次数、基准日期对应行为触点近M天的触达次数,确定行为触点对应行为方所属的目标人群阶段。
本实施例中,人群阶段是指用于控制人群资产结构而对人群进行分类后的结果;可选的,可以基于行为方(比如消费者)与品牌方关系远近分为了解人群(aware)、兴趣人群(interest)、意向人群(intent)和转化人群(act),可以记为AIIA人群。需要说明的是,不同行业的人群阶段的确定规则不同,可以将不同行业的圈选逻辑抽象成同一种数据结构维护,可以支持通过行业名称来查找对应的规则列表。通过提供全行业通用人群圈选方案,无需各个行业定制化开发,只需简单的配置即可上线,可拓展性好,提升了产品迭代速度;
一种可选方式,根据基准日期对应的行为触点近一天的触达次数和基准日期对应的行为触点近M天的触达次数,确定基准日期的行为统计数据;去除基准日期的行为统计数据中的无效数据,得到处理后的行为统计数据;基于预设人群阶段判断模型,根据处理后的行为统计数据,确定行为触点对应行为方所属的目标人群阶段。
本实施例中,目标人群阶段是指基准日期中某一行为方所属的人群阶段。
具体的,可以将基准提取对应的行为触点近一天的触达次数和基准日期对应的行为触点近M天对应的触达次数,作为基准日期对应的行为统计数据,之后去除点基准日期的行为统计数据中无效数据(例如为0的数据),得到处理后的行为统计数据,进而可以将处理后的行为统计数据输入预设人群阶段判断模型,得到行为触点对应行为方所属的目标人群阶段。其中,预设人群阶段判断模型可以可理解成一种函数,输入参数是品牌特征数据中的一行数据(包括行业信息、品牌信息、行为方ID、各触点的实际触达次数),输出为人群阶段。该装置首先会依据行业名称,拉取人群圈选规则;其次根据实际触点的触达次数与人群圈选逻辑(口径)对比,如果满足规则,则判断为对应阶段;最后,取触达最深阶段作为人群阶段。该模型可以保证同一个行为方ID只会划分到唯一的人群阶段,该模型可以满足各行业人群阶段判断,具有通用性。
可以理解的是,通过通用人群阶段判断模型可以快速且准确得到不同行业中不同品牌下的行为方(消费者)所属人群阶段,可以及时反哺业务,能够品牌方及时了解不同分层人群的总量、结构以及转化率情况,及时调整品牌营销战略。
S306,根据基准日期对应的触点近一天的触达次数、基准日期对应的触点近一天的触达次数和行为触点对应行为方所属的目标人群阶段,确定基准日期对应的目标品牌特征数据。
具体的,可以基于预设数据整合规则,将基准日期对应的触点近一天的触达次数、基准日期对应的触点近一天的触达次数和行为触点对应行为方所属的目标人群阶段进行整合,例如按照对应字段生成数据表格,得到基准日期对应的目标品牌特征数据。
S307,根据目标行业特征数据和目标品牌特征数据,确定基准日期对应的人群特征数据。
本公开实施例提供的技术方案,通过根据行为明细数据和历史行业特征数据,确定基准日期对应的目标行业特征数据,之后根据行为明细数据和基准日期前一天对应的品牌特征数据,确定基准日期对应行为触点近一天的触达次数,并根据基准日期对应行为触点近一天的触达次数、基准日期前一天对应的品牌特征数据中行为触点近M天的触达次数和基准日期前M天对应的品牌特征数据中行为触点近一天的触达次数,确定基准日期对应行为触点近M天的触达次数,接着根据基准日期对应行为触点近一天的触达次数、基准日期对应行为触点近M天的触达次数,确定行为触点对应行为方所属的目标人群阶段,进而根据基准日期对应的触点近一天的触达次数、基准日期对应的触点近一天的触达次数和行为触点对应行为方所属的目标人群阶段,确定基准日期对应的目标品牌特征数据,最后根据目标行业特征数据和目标品牌特征数据,确定基准日期对应的人群特征数据。上述技术方案,通过基准日期的行为明细数据和基准日期前一天以及前M天的品牌特征数据,来更新基准日期对应的品牌特征数据,实现了对品牌特征数据的日更新,从而提高人群特征数据的更新频率。
图4根据本公开实施例提供的一种人群特征确定装置的结构示意图。本实施例适用于如何进行人群特征确定的情况。该方法可以由人群特征确定装置来执行,该装置可以采用软件和/或硬件的方式实现,并可集成于承载人群特征确定功能的电子设备中,比如服务器中。如图4所示,本实施例的人群特征确定装置400可以包括:
数据获取模块401,用于获取基准日期对应的行为明细数据、基准日期对应的历史行业特征数据和历史品牌特征数据;
人群特征确定模块402,用于根据行为明细数据、历史行业特征数据和历史品牌特征数据,确定基准日期对应的人群特征数据。
本公开实施例提供的技术方案,获取基准日期对应的行为明细数据、基准日期对应的历史行业特征数据和历史品牌特征数据,之后根据行为明细数据、历史行业特征数据和历史品牌特征数据,确定基准日期对应的人群特征数据。上述技术方案,相比于现有基于行为方的基准日期及其之前的行为明细数据,来确定基准日期的人群特征数据的方案,该方案会对不同日期行为明细数据中相同部分进行重复计算且需要大量存储空间的方案,本公开基于基准日期的行为明细数据和历史行业特征和历史品牌特征数据来确定人群特征数据,可以避免对行为明细数据的重复计算,节省了存储和计算资源,提升了人群特征数据的确定效率。
进一步地,人群特征确定模块,包括:
行业特征确定单元,用于根据行为明细数据和历史行业特征数据,确定基准日期对应的目标行业特征数据;其中,历史行业特征数据包括基准日期前一天对应的行业特征数据;
品牌特征确定单元,用于根据行为明细数据和历史品牌特征数据,确定基准日期对应的目标品牌特征数据;其中,历史品牌特征数据包括基准日期前一天对应的品牌特征数据和基准日期前M天对应的品牌特征数据;M为大于1的自然数;
人群特征确定单元,用于根据目标行业特征数据和目标品牌特征数据,确定基准日期对应的人群特征数据。
进一步地,行业特征确定单元具体用于:
从行为明细数据中筛选出基准日期对应的行业数据;其中,行业数据包括基准日期的行业信息和行为方信息;
从基准日期前一天对应的行业特征数据中,选择出在固定时间跨度内日期最靠前的新增行为方数据,并删除新增行为方数据,得到处理后的历史行业特征数据;
根据处理后的历史行业特征数据和基准日期对应的行业数据,确定基准日期对应的目标行业特征数据。
进一步地,品牌特征确定单元,包括:
第一触达次数确定子单元,用于根据行为明细数据和基准日期前一天对应的品牌特征数据,确定基准日期对应行为触点近一天的触达次数;
第二触达次数确定子单元,用于根据基准日期对应行为触点近一天的触达次数、基准日期前一天对应的品牌特征数据中行为触点近M天的触达次数和基准日期前M天对应的品牌特征数据中行为触点近一天的触达次数,确定基准日期对应行为触点近M天的触达次数;
人群阶段确定子单元,用于根据基准日期对应行为触点近一天的触达次数、基准日期对应行为触点近M天的触达次数,确定行为触点对应行为方所属的目标人群阶段;
品牌特征确定子单元,用于根据基准日期对应的触点近一天的触达次数、基准日期对应的触点近一天的触达次数和行为触点对应行为方所属的目标人群阶段,确定基准日期对应的目标品牌特征数据。
进一步地,第二触达次数确定子单元具体用于:
根据基准日期前一天对应的品牌特征数据中行为触点近M天的触达次数和基准日期前M天对应的品牌特征数据中行为触点近一天的触达次数,确定基准日期对应行为触点近M-1天的触达次数;
根据基准日期对应行为触点近一天的触达次数和基准日期对应行为触点近M-1天的触达次数,确定基准日期对应行为触点近M天的触达次数。
进一步地,人群阶段确定子单元具体用于:
根据基准日期对应的行为触点近一天的触达次数和基准日期对应的行为触点近M天的触达次数,确定基准日期的行为统计数据;
去除基准日期的行为统计数据中的无效数据,得到处理后的行为统计数据;
基于预设人群阶段判断模型,根据处理后的行为统计数据,确定行为触点对应行为方所属的目标人群阶段。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图5是用来实现本公开实施例的人群特征确定方法的电子设备的框图。图5示出了可以用来实施本公开的实施例的示例电子设备500的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图5所示,电子设备500包括计算单元501,其可以根据存储在只读存储器(ROM)502中的计算机程序或者从存储单元508加载到随机访问存储器(RAM)503中的计算机程序,来执行各种适当的动作和处理。在RAM 503中,还可存储电子设备500操作所需的各种程序和数据。计算单元501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
电子设备500中的多个部件连接至I/O接口505,包括:输入单元506,例如键盘、鼠标等;输出单元507,例如各种类型的显示器、扬声器等;存储单元508,例如磁盘、光盘等;以及通信单元509,例如网卡、调制解调器、无线通信收发机等。通信单元509允许电子设备500通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元501可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元501的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元501执行上文所描述的各个方法和处理,例如人群特征确定方法。例如,在一些实施例中,人群特征确定方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元508。在一些实施例中,计算机程序的部分或者全部可以经由ROM 502和/或通信单元509而被载入和/或安装到电子设备500上。当计算机程序加载到RAM 503并由计算单元501执行时,可以执行上文描述的人群特征确定方法的一个或多个步骤。备选地,在其他实施例中,计算单元501可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行人群特征确定方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术;人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术及机器学习/深度学习技术、大数据处理技术、知识图谱技术等几大方向。
云计算(cloud computing),指的是通过网络接入弹性可扩展的共享物理或虚拟资源池,资源可以包括服务器、操作系统、网络、软件、应用和存储设备等,并可以按需、自服务的方式对资源进行部署和管理的技术体系。通过云计算技术,可以为人工智能、区块链等技术应用、模型训练提供高效强大的数据处理能力。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (15)

1.一种人群特征确定方法,包括:
获取基准日期对应的行为明细数据、所述基准日期对应的历史行业特征数据和历史品牌特征数据;
根据所述行为明细数据、所述历史行业特征数据和所述历史品牌特征数据,确定基准日期对应的人群特征数据。
2.根据权利要求1所述的方法,其中,所述根据所述行为明细数据、所述历史行业特征数据和所述历史品牌特征数据,确定基准日期对应的人群特征数据,包括:
根据所述行为明细数据和所述历史行业特征数据,确定基准日期对应的目标行业特征数据;其中,所述历史行业特征数据包括基准日期前一天对应的行业特征数据;
根据所述行为明细数据和所述历史品牌特征数据,确定基准日期对应的目标品牌特征数据;其中,所述历史品牌特征数据包括基准日期前一天对应的品牌特征数据和基准日期前M天对应的品牌特征数据;M为大于1的自然数;
根据所述目标行业特征数据和所述目标品牌特征数据,确定基准日期对应的人群特征数据。
3.根据权利要求2所述的方法,其中,所述根据所述行为明细数据和所述历史行业特征数据,确定基准日期对应的目标行业特征数据,包括:
从所述行为明细数据中筛选出基准日期对应的行业数据;其中,所述行业数据包括基准日期的行业信息和行为方信息;
从基准日期前一天对应的行业特征数据中,选择出在固定时间跨度内日期最靠前的新增行为方数据,并删除所述新增行为方数据,得到处理后的历史行业特征数据;
根据处理后的历史行业特征数据和所述基准日期对应的行业数据,确定基准日期对应的目标行业特征数据。
4.根据权利要求2所述的方法,其中,所述根据所述行为明细数据和所述历史品牌特征数据,确定基准日期对应的目标品牌特征数据,包括:
根据所述行为明细数据和基准日期前一天对应的品牌特征数据,确定基准日期对应行为触点近一天的触达次数;
根据基准日期对应行为触点近一天的触达次数、基准日期前一天对应的品牌特征数据中行为触点近M天的触达次数和基准日期前M天对应的品牌特征数据中行为触点近一天的触达次数,确定基准日期对应行为触点近M天的触达次数;
根据基准日期对应行为触点近一天的触达次数、基准日期对应行为触点近M天的触达次数,确定行为触点对应行为方所属的目标人群阶段;
根据基准日期对应的触点近一天的触达次数、基准日期对应的触点近一天的触达次数和行为触点对应行为方所属的目标人群阶段,确定基准日期对应的目标品牌特征数据。
5.根据权利要求4所述的方法,其中,所述根据基准日期对应的行为触点近一天的触达次数、基准日期前一天对应的品牌特征数据中行为触点近M天的触达次数和基准日期前M天对应的品牌特征数据中行为触点近一天的触达次数,确定基准日期对应的行为触点近M天的触达次数,包括:
根据基准日期前一天对应的品牌特征数据中行为触点近M天的触达次数和基准日期前M天对应的品牌特征数据中行为触点近一天的触达次数,确定基准日期对应行为触点近M-1天的触达次数;
根据基准日期对应行为触点近一天的触达次数和基准日期对应行为触点近M-1天的触达次数,确定基准日期对应行为触点近M天的触达次数。
6.根据权利要求4所述的方法,其中,所述根据基准日期对应的行为触点近一天的触达次数、基准日期对应的行为触点近M天的触达次数,确定行为触点对应行为方所属的目标人群阶段,包括:
根据基准日期对应的行为触点近一天的触达次数和基准日期对应的行为触点近M天的触达次数,确定基准日期的行为统计数据;
去除基准日期的行为统计数据中的无效数据,得到处理后的行为统计数据;
基于预设人群阶段判断模型,根据处理后的行为统计数据,确定行为触点对应行为方所属的目标人群阶段。
7.一种人群特征确定装置,包括:
数据获取模块,用于获取基准日期对应的行为明细数据、所述基准日期对应的历史行业特征数据和历史品牌特征数据;
人群特征确定模块,用于根据所述行为明细数据、所述历史行业特征数据和所述历史品牌特征数据,确定基准日期对应的人群特征数据。
8.根据权利要求7所述的装置,其中,所述人群特征确定模块,包括:
行业特征确定单元,用于根据所述行为明细数据和所述历史行业特征数据,确定基准日期对应的目标行业特征数据;其中,所述历史行业特征数据包括基准日期前一天对应的行业特征数据;
品牌特征确定单元,用于根据所述行为明细数据和所述历史品牌特征数据,确定基准日期对应的目标品牌特征数据;其中,所述历史品牌特征数据包括基准日期前一天对应的品牌特征数据和基准日期前M天对应的品牌特征数据;M为大于1的自然数;
人群特征确定单元,用于根据所述目标行业特征数据和所述目标品牌特征数据,确定基准日期对应的人群特征数据。
9.根据权利要求8所述的装置,其中,所述行业特征确定单元具体用于:
从所述行为明细数据中筛选出基准日期对应的行业数据;其中,所述行业数据包括基准日期的行业信息和行为方信息;
从基准日期前一天对应的行业特征数据中,选择出在固定时间跨度内日期最靠前的新增行为方数据,并删除所述新增行为方数据,得到处理后的历史行业特征数据;
根据处理后的历史行业特征数据和所述基准日期对应的行业数据,确定基准日期对应的目标行业特征数据。
10.根据权利要求8所述的装置,其中,所述品牌特征确定单元,包括:
第一触达次数确定子单元,用于根据所述行为明细数据和基准日期前一天对应的品牌特征数据,确定基准日期对应行为触点近一天的触达次数;
第二触达次数确定子单元,用于根据基准日期对应行为触点近一天的触达次数、基准日期前一天对应的品牌特征数据中行为触点近M天的触达次数和基准日期前M天对应的品牌特征数据中行为触点近一天的触达次数,确定基准日期对应行为触点近M天的触达次数;
人群阶段确定子单元,用于根据基准日期对应行为触点近一天的触达次数、基准日期对应行为触点近M天的触达次数,确定行为触点对应行为方所属的目标人群阶段;
品牌特征确定子单元,用于根据基准日期对应的触点近一天的触达次数、基准日期对应的触点近一天的触达次数和行为触点对应行为方所属的目标人群阶段,确定基准日期对应的目标品牌特征数据。
11.根据权利要求10所述的装置,其中,所述第二触达次数确定子单元具体用于:
根据基准日期前一天对应的品牌特征数据中行为触点近M天的触达次数和基准日期前M天对应的品牌特征数据中行为触点近一天的触达次数,确定基准日期对应行为触点近M-1天的触达次数;
根据基准日期对应行为触点近一天的触达次数和基准日期对应行为触点近M-1天的触达次数,确定基准日期对应行为触点近M天的触达次数。
12.根据权利要求10所述的装置,其中,所述人群阶段确定子单元具体用于:
根据基准日期对应的行为触点近一天的触达次数和基准日期对应的行为触点近M天的触达次数,确定基准日期的行为统计数据;
去除基准日期的行为统计数据中的无效数据,得到处理后的行为统计数据;
基于预设人群阶段判断模型,根据处理后的行为统计数据,确定行为触点对应行为方所属的目标人群阶段。
13.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-6中任一项所述的人群特征确定方法。
14.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使计算机执行根据权利要求1-6中任一项所述的人群特征确定方法。
15.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-6中任一项所述的人群特征确定方法。
CN202310376735.3A 2023-04-10 2023-04-10 一种人群特征确定方法、装置、设备及存储介质 Pending CN116402534A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310376735.3A CN116402534A (zh) 2023-04-10 2023-04-10 一种人群特征确定方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310376735.3A CN116402534A (zh) 2023-04-10 2023-04-10 一种人群特征确定方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN116402534A true CN116402534A (zh) 2023-07-07

Family

ID=87013840

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310376735.3A Pending CN116402534A (zh) 2023-04-10 2023-04-10 一种人群特征确定方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN116402534A (zh)

Similar Documents

Publication Publication Date Title
CN112148987B (zh) 基于目标对象活跃度的消息推送方法及相关设备
CN107871166B (zh) 针对机器学习的特征处理方法及特征处理系统
KR20140131327A (ko) 소셜 미디어 데이터 분석 시스템 및 방법
CN111369344B (zh) 一种动态生成预警规则的方法和装置
CN111723292A (zh) 基于图神经网络的推荐方法、系统、电子设备及存储介质
CN112507098B (zh) 问题处理方法、装置、电子设备、存储介质及程序产品
CN111861596B (zh) 一种文本分类方法和装置
CN112818230A (zh) 内容推荐方法、装置、电子设备和存储介质
CN114090601B (zh) 一种数据筛选方法、装置、设备以及存储介质
CN112231299B (zh) 一种特征库动态调整的方法和装置
CN114037059A (zh) 预训练模型、模型的生成方法、数据处理方法及装置
CN113392920A (zh) 生成作弊预测模型的方法、装置、设备、介质及程序产品
CN117271884A (zh) 确定推荐内容的方法、装置、电子设备及存储介质
US20230419195A1 (en) System and Method for Hierarchical Factor-based Forecasting
CN116432069A (zh) 信息处理方法、服务提供方法、装置、设备及介质
CN116402534A (zh) 一种人群特征确定方法、装置、设备及存储介质
CN114118937A (zh) 基于任务的信息推荐方法、装置、电子设备及存储介质
CN114661918A (zh) 知识图谱构建方法、装置、存储介质及电子设备
CN113722593A (zh) 事件数据处理方法、装置、电子设备和介质
CN113704494A (zh) 基于知识图谱的实体检索方法、装置、设备以及存储介质
CN114118420A (zh) 一种因果关系确定方法、装置、电子设备及存储介质
CN113590774A (zh) 事件查询方法、装置以及存储介质
CN113010782A (zh) 需求量获取方法、装置、电子设备以及计算机可读介质
CN116627760B (zh) 一种基于用户行为信息的匹配度确定方法、装置及介质
CN112541335B (zh) 生成解读文本的方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination