CN111694925A - 行为数据的处理方法及装置、存储介质、终端 - Google Patents
行为数据的处理方法及装置、存储介质、终端 Download PDFInfo
- Publication number
- CN111694925A CN111694925A CN201910189913.5A CN201910189913A CN111694925A CN 111694925 A CN111694925 A CN 111694925A CN 201910189913 A CN201910189913 A CN 201910189913A CN 111694925 A CN111694925 A CN 111694925A
- Authority
- CN
- China
- Prior art keywords
- processed
- behavior data
- dimension
- attribute information
- auxiliary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种行为数据的处理方法及装置、存储介质、终端,所述方法包括:获取待处理的行为数据列表;对于每一待处理的行为数据,从关联的属性信息中提取辅待处理维度;对于所述待处理的行为数据列表中的所有主待处理维度和所有提取到的辅待处理维度中的每一待处理维度,查找预设知识库,以得到与所述待处理维度相关联的标准属性信息;将查找得到的所述主待处理维度关联的标准属性信息,和/或所述辅待处理维度关联的标准属性信息填充至关联的待处理的行为数据,以得到处理后的行为数据。通过本发明提供的方案能够实现对行为数据的多重翻译,优化通过知识库对行为数据进行维度补充时的处理逻辑。
Description
技术领域
本发明涉及数据处理技术领域,具体地涉及一种行为数据的处理方法及装置、存储介质、终端。
背景技术
在现有数据管理平台(Data Management Platform,简称DMP)的设计中,翻译的工作是依靠键值(key)来完成的,经过识别后的行为(activity)数据,其键值与知识库的键值匹配时,会将知识库中记录的数据覆盖到该键值所在的行为数据中。其中,所述键值可以理解为所述行为数据的一个维度。例如,所述行为数据的键值可以包括姓名、年龄、店铺等。
设计行为数据结构的用意在于表示一个用户的一个行为,DMP的使用者希望行为数据能够反映尽可能多的信息,因而需要基于知识库对采集到的行为数据进行维度扩充。
而在单个行为数据中,需要藉由知识库进行维度补充的键值可能不止一个。但是,现有的行为数据处理方案对于同一行为数据只能进行一次翻译,且每次只能对一个维度进行翻译,这显然不适用于包含多个待翻译维度的行为数据。
发明内容
本发明解决的技术问题是如何优化通过知识库对行为数据进行维度补充时的处理逻辑,实现对行为数据的多重翻译。
为解决上述技术问题,本发明实施例提供一种行为数据的处理方法,包括:获取待处理的行为数据列表,其中,所述待处理的行为数据列表包括至少一个待处理的行为数据,所述待处理的行为数据包括主待处理维度及关联的至少一个属性信息;对于每一待处理的行为数据,从关联的属性信息中提取辅待处理维度;对于所述待处理的行为数据列表中的所有主待处理维度和所有提取到的辅待处理维度中的每一待处理维度,查找预设知识库,以得到与所述待处理维度相关联的标准属性信息,其中,所述预设知识库记录有待处理维度和标准属性信息的关联关系;将查找得到的所述主待处理维度关联的标准属性信息,和/或所述辅待处理维度关联的标准属性信息填充至关联的待处理的行为数据,以得到处理后的行为数据。
可选的,所述从关联的属性信息中提取辅待处理维度包括:逐一比对所述属性信息和所述预设知识库中记录的待处理维度是否匹配;将比对结果为匹配的属性信息确定为所述辅待处理维度。
可选的,对于关联于同一待处理的行为数据的主待处理维度和辅待处理维度,所述主待处理维度与所述待处理的行为数据的时间戳相关联,所述辅待处理维度与所述时间戳无关。
可选的,所述将查找得到的所述主待处理维度关联的标准属性信息,和/或所述辅待处理维度关联的标准属性信息填充至关联的待处理的行为数据,以得到处理后的行为数据包括:对于所述待处理的行为数据列表中的所有主待处理维度和所有提取到的辅待处理维度中的每一待处理维度,根据所述待处理维度是否关联时间戳来判断所述待处理维度是否为主待处理维度;当判断结果表明所述待处理维度为主待处理维度时,确定主待处理维度相匹配的待处理的行为数据,将查找得到的所述主待处理维度关联的标准属性信息填充至所述待处理的行为数据。
可选的,所述将查找得到的所述主待处理维度关联的标准属性信息,和/或所述辅待处理维度关联的标准属性信息填充至关联的待处理的行为数据,以得到处理后的行为数据包括:当判断结果表明所述待处理维度为辅待处理维度时,确定辅待处理维度相匹配的待处理的行为数据,将查找得到的所述辅待处理维度关联的标准属性信息填充至所述待处理的行为数据。
可选的,所述将查找得到的所述辅待处理维度关联的标准属性信息填充至所述待处理的行为数据包括:当所述辅待处理维度关联的标准属性信息与所述待处理的行为数据所包含的属性信息存在重复的属性信息时,在重复的属性信息中保留所述待处理的行为数据所包含的属性信息。
可选的,所述将查找得到的所述辅待处理维度关联的标准属性信息填充至所述待处理的行为数据包括:当关联于同一待处理的行为数据的多个辅待处理维度各自关联的标准属性信息中存在重复的标准属性信息时,随机保留重复的标准属性信息中的任一标准属性信息。
为解决上述技术问题,本发明实施例还提供一种行为数据的处理装置,包括:获取模块,用于获取待处理的行为数据列表,其中,所述待处理的行为数据列表包括至少一个待处理的行为数据,所述待处理的行为数据包括主待处理维度及关联的至少一个属性信息;提取模块,对于每一待处理的行为数据,从关联的属性信息中提取辅待处理维度;查找模块,对于所述待处理的行为数据列表中的所有主待处理维度和所有提取到的辅待处理维度中的每一待处理维度,查找预设知识库,以得到与所述待处理维度相关联的标准属性信息,其中,所述预设知识库记录有待处理维度和标准属性信息的关联关系;填充模块,用于将查找得到的所述主待处理维度关联的标准属性信息,和/或所述辅待处理维度关联的标准属性信息填充至关联的待处理的行为数据,以得到处理后的行为数据。
为解决上述技术问题,本发明实施例还提供一种存储介质,其上存储有计算机指令,所述计算机指令运行时执行上述方法的步骤。
为解决上述技术问题,本发明实施例还提供一种终端,包括存储器和处理器,所述存储器上存储有能够在所述处理器上运行的计算机指令,所述处理器运行所述计算机指令时执行上述方法的步骤。
与现有技术相比,本发明实施例的技术方案具有以下有益效果:
本发明实施例提供一种行为数据的处理方法,包括:获取待处理的行为数据列表,其中,所述待处理的行为数据列表包括至少一个待处理的行为数据,所述待处理的行为数据包括主待处理维度及关联的至少一个属性信息;对于每一待处理的行为数据,从关联的属性信息中提取辅待处理维度;对于所述待处理的行为数据列表中的所有主待处理维度和所有提取到的辅待处理维度中的每一待处理维度,查找预设知识库,以得到与所述待处理维度相关联的标准属性信息,其中,所述预设知识库记录有待处理维度和标准属性信息的关联关系;将查找得到的所述主待处理维度关联的标准属性信息,和/或所述辅待处理维度关联的标准属性信息填充至关联的待处理的行为数据,以得到处理后的行为数据。较之现有只能对行为数据进行单重翻译的技术方案,采用本实施例的方案能够实现对行为数据的多重翻译,优化通过知识库对行为数据进行维度补充时的处理逻辑。具体而言,在主待处理维度的基础上,进一步从所述行为数据的属性信息中提取辅待处理维度,并通过预设知识库对所述主待处理维度和辅待处理维度进行翻译。由于所述主待处理维度和辅待处理维度在翻译期间并未被分离成独立的行为数据,因而翻译得到的标准属性信息可以准确地、相关联地填充至所述行为数据。
进一步,所述从关联的属性信息中提取辅待处理维度包括:逐一比对所述属性信息和所述预设知识库中记录的待处理维度是否匹配;将比对结果为匹配的属性信息确定为所述辅待处理维度。由此,除主待处理维度之外,本发明实施例的方案还可以从行为数据的属性信息中进一步提取出需要翻译的辅待处理维度,从而实现对同一行为数据的多个维度的翻译扩充。
附图说明
图1是本发明实施例的一种行为数据的处理方法的流程图;
图2是图1中步骤S104的一个具体实施方式的流程图;
图3是本发明实施例的一种行为数据的处理装置的结构示意图。
具体实施方式
如背景技术所言,现有的行为数据处理方案对于同一行为数据只能进行一次翻译,且每次只能对一个维度进行翻译。
换言之,现有技术只能对行为数据进行单重翻译。当需要对行为数据的多个维度进行翻译时,只能将所述多个维度拆分成多个独立的行为数据,分别对这些行为数据进行翻译后再汇聚。
但是,拆分后的多个行为数据之间是相互独立、没有联系的,这就导致现有技术在对行为数据列表中的多个行为数据进行批量翻译和汇聚时无法有效识别其中哪些行为数据是存在关联的,也就无法将拆分后的行为数据重新汇聚成原始的行为数据,导致翻译处理后的行为数据的维度发生缺省。
以下述待处理的行为数据结构为例:
这段待处理的行为数据结构表示,用户在时间戳(timestamps)1532333445、1532333448和1532333726分别进行了同一个行为,该行为可以描述成:用户在前述三个时间戳指代的时刻购买了产品ID(product_id)为7763923的商品A。所述商品A关联有属性信息(properties):数量(amount)、价格(price)以及所属店铺ID(store_id),其中每一属性信息都具有对应的数值(value)。这些属性信息都是原始采集到的行为数据中自带的信息。
所述行为数据的键值为产品ID,在翻译过程中,如果在知识库中发现了一条键值同样为kbKey=product_id#7763923的记录,例如:
product_id#7763923{"product_name":"巨无霸","category":"主食"}
那么知识库中的产品名称(product_name)和类别(category)就会被覆盖到所述行为数据的属性信息中,形成如下处理后的行为数据结构:
基于前述方案,虽然能够对行为数据中的键值进行翻译,但是,如果该键值关联的属性信息中还存在需要翻译的键值,如前述待处理的行为数据中的店铺ID,则基于现有方案无法同时通过知识库一并进行翻译。
本申请发明人经过分析发现,基于现有技术,当出现这种情况时,只能将用户对店铺的行为分拆到另一个行为数据中单独进行翻译。但对于DMP而言,拆分后的行为数据与原始的待处理的行为数据是相互独立的两个行为数据,导致在翻译完成后的汇聚过程中,针对店铺的维度扩充结果无法汇聚至以产品为键值的行为数据的属性信息中。
换言之,基于现有技术,当同一行为数据中包含多个待处理维度时,只能对其中某一待处理维度进行翻译处理,其他待处理维度只能被丢弃。
另一方面,比较前述例举的待处理的行为数据结构和处理后的行为数据结构,不难发现,原始的待处理的行为数据中的属性信息,如价格和数量,完全被知识库覆盖了,在处理后的行为数据中没有保留。这不利于对行为数据的多维度描述。
为解决上述技术问题,本发明实施例提供一种行为数据的处理方法,包括:获取待处理的行为数据列表,其中,所述待处理的行为数据列表包括至少一个待处理的行为数据,所述待处理的行为数据包括主待处理维度及关联的至少一个属性信息;对于每一待处理的行为数据,从关联的属性信息中提取辅待处理维度;对于所述待处理的行为数据列表中的所有主待处理维度和所有提取到的辅待处理维度中的每一待处理维度,查找预设知识库,以得到与所述待处理维度相关联的标准属性信息,其中,所述预设知识库记录有待处理维度和标准属性信息的关联关系;将查找得到的所述主待处理维度关联的标准属性信息,和/或所述辅待处理维度关联的标准属性信息填充至关联的待处理的行为数据,以得到处理后的行为数据。
较之现有只能对行为数据进行单重翻译的技术方案,采用本实施例的方案能够实现对行为数据的多重翻译,优化通过知识库对行为数据进行维度补充时的处理逻辑。具体而言,在主待处理维度的基础上,进一步从所述行为数据的属性信息中提取辅待处理维度,并通过预设知识库对所述主待处理维度和辅待处理维度进行翻译。由于所述主待处理维度和辅待处理维度在翻译期间并未被分离成独立的行为数据,因而翻译得到的标准属性信息可以准确地、相关联地填充至所述行为数据。
为使本发明的上述目的、特征和有益效果能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
图1是本发明实施例的一种行为数据的处理方法的流程图。本实施例所述方案可以由DMP执行,如由维持所述DMP的一个或多个服务器节点执行。
具体地,参考图1,本实施例所述行为数据的处理方法可以包括如下步骤:
步骤S101,获取待处理的行为数据列表,其中,所述待处理的行为数据列表包括至少一个待处理的行为数据,所述待处理的行为数据包括主待处理维度及关联的至少一个属性信息;
步骤S102,对于每一待处理的行为数据,从关联的属性信息中提取辅待处理维度;
步骤S103,对于所述待处理的行为数据列表中的所有主待处理维度和所有提取到的辅待处理维度中的每一待处理维度,查找预设知识库,以得到与所述待处理维度相关联的标准属性信息,其中,所述预设知识库记录有待处理维度和标准属性信息的关联关系;
步骤S104,将查找得到的所述主待处理维度关联的标准属性信息,和/或所述辅待处理维度关联的标准属性信息填充至关联的待处理的行为数据,以得到处理后的行为数据。
更为具体地,所述待处理的行为数据可以是:用户在历史预设时间段内的至少一个行为产生的行为数据。其中,在所述历史预设时间段内的不同时刻,用户的同一行为可以汇总为同一行为数据,通过所述行为数据关联的时间戳来指示具体产生该行为的时刻。
进一步地,同一用户在所述历史预设时间段内的各种行为所产生的行为数据可以汇总至同一待处理的行为数据列表。
在一个实施例中,所述主待处理维度可以是原始获取的所述行为数据中自带的,也即,由所述待处理的行为数据的提供方或抓取方定义的维度。
在一个变化例中,所述主待处理维度(对应前述待处理的行为数据结构中的kbKey)也可以是执行本实施例所述方案的服务器节点通过预设规则确定的,其中,所述预设规则可以用于指示所述行为数据中的哪些字段需要作为待处理维度进行后续翻译。进一步地,所述预设规则还定义有各待处理维度的权重,其中,提取出的权重最高的待处理维度即为所述待处理的行为数据的主待处理维度。
例如,所述预设规则可以通过预设规则引擎定义。
在一个实施例中,在所述步骤S101中,可以先根据所述预设规则从所述行为数据中提取出所述主待处理维度,所述行为数据的其他字段则作为所述主待处理维度关联的属性信息(对应前述待处理的行为数据结构中的properties)。
与现有技术的区别之一在于,本实施例所述方案通过执行所述步骤S102,可以从所述主待处理维度关联的属性信息中进一步提取出至少一个辅待处理维度,以实现对所述待处理的行为数据的多重翻译。
在一个实施例中,所述步骤S102可以包括步骤:逐一比对所述属性信息和所述预设知识库中记录的待处理维度是否匹配;将比对结果为匹配的属性信息确定为所述辅待处理维度。由此,除主待处理维度之外,本发明实施例的方案还可以从行为数据的属性信息中进一步提取出需要翻译的辅待处理维度,从而实现对同一行为数据的多个维度的翻译扩充。
具体地,对于所述属性信息中被提取为待处理维度的字段,可以对该字段进行标记(flag),以将其与属性信息中无需进行翻译处理的字段相区分。
以如下经过步骤S101和步骤S102处理后的待处理的行为数据结构为例:
其中,符号“#”为标记,用于指示包含该符号的字段为待处理维度。在后续翻译阶段,所有被打上“#”标记的字段都需要通过预设知识库进行翻译处理。
进一步地,当包含“#”的字段属于键值时,表明该字段为主待处理维度;当包含“#”的字段属于属性信息时,表明该字段为辅待处理维度。
在一个实施例中,在所述步骤S103中,可以遍历所述待处理的行为数据,并根据所述“#”标记来识别需要进行翻译处理的主待处理维度和辅待处理维度。
对于识别获得的每一辅待处理维度,可以将所述辅待处理维度拆分成一个独立的临时行为数据,以对其进行翻译处理。与现有技术相比,本实施例所述方案中临时分拆获得的临时行为数据与原始的待处理的行为数据之间存在关联性,因而,不会发生后续无法汇聚的情形。其中,所述关联性是通过所述标记“#”来实现的。
在一个实施例中,对于关联于同一待处理的行为数据的主待处理维度和辅待处理维度,所述主待处理维度与所述待处理的行为数据的时间戳相关联,所述辅待处理维度与所述时间戳无关。
换言之,自所述待处理的行为数据拆分出来的临时行为数据是不携带时间戳信息的。由此,可以有效区分独立行为和非独立行为。
参考图2,所述步骤S104可以包括如下步骤:
步骤S1041,对于所述待处理的行为数据列表中的所有主待处理维度和所有提取到的辅待处理维度中的每一待处理维度,根据所述待处理维度是否关联时间戳来判断所述待处理维度是否为主待处理维度;
步骤S1042,当所述步骤S1041的判断结果表明所述待处理维度为主待处理维度时,确定主待处理维度相匹配的待处理的行为数据,将查找得到的所述主待处理维度关联的标准属性信息填充至所述待处理的行为数据;
步骤S1043,当所述步骤S1041的判断结果表明所述待处理维度为辅待处理维度时,确定辅待处理维度相匹配的待处理的行为数据,将查找得到的所述辅待处理维度关联的标准属性信息填充至所述待处理的行为数据。
例如,存在这样的可能性,待处理的行为数据列表中包括两个待处理的行为数据(记作待处理的行为数据1和待处理的行为数据2),其中,待处理的行为数据1包括主待处理维度(记作字段A)和两个辅待处理维度(字段B和字段C),待处理的行为数据2仅包括主待处理维度(记作字段B)。
当对所述待处理的行为数据1进行翻译操作时,会先将待处理的行为数据1的两个辅待处理维度拆分成两个临时行为数据,分别记作临时行为数据1(主待处理维度为字段B)和临时行为数据2(主待处理维度为字段C)。
在分别对待处理的行为数据1的主待处理维度(即字段A)、临时行为数据1的主待处理维度(即字段B)、临时行为数据2的主待处理维度(即字段C)以及待处理的行为数据2的主待处理维度(即字段B)分别进行翻译处理后,需要进行汇聚操作。
进一步地,在进行汇聚操作时,由于临时行为数据1的主待处理维度和待处理的行为数据2的主待处理维度都是字段B,因而,可以通过是否携带有时间戳来区分该行为数据在原始的待处理的兴起数据列表中是否为独立的行为数据。
进一步地,由于所述临时行为数据1不会携带时间戳,而待处理的行为数据2是携带有时间戳的,因而,可以确定所述待处理的行为数据2是独立行为,而临时行为数据1需要与其他行为数据汇聚。
进一步地,根据临时行为数据1的主待处理维度以及待处理的行为数据1的属性信息中被打上标记的字段,当两者匹配时,可以确定需要将临时行为数据1的翻译结果汇聚至待处理的行为数据1的翻译结果中。
类似的,根据临时行为数据2的主待处理维度以及待处理的行为数据1的属性信息中被打上标记的字段,当两者匹配时,可以确定需要将临时行为数据2的翻译结果汇聚至待处理的行为数据1的翻译结果中。
在一个实施例中,所述步骤S1042可以包括步骤:当所述辅待处理维度关联的标准属性信息与所述待处理的行为数据所包含的属性信息存在重复的属性信息时,在重复的属性信息中保留所述待处理的行为数据所包含的属性信息。
由于辅待处理维度关联的标准属性信息是获取自所述预设知识库的,而所述待处理的行为数据所包含的属性信息是初始产生所述行为数据时自带的。因而,通过本实施例的方案,可以优先保留在获取所述待处理的行为数据时得到的原始信息,确保处理后的行为数据的属性信息是最新的,提高数据准确性。
在一个实施例中,所述步骤S1042可以包括:当关联于同一待处理的行为数据的多个辅待处理维度各自关联的标准属性信息中存在重复的标准属性信息时,随机保留重复的标准属性信息中的任一标准属性信息。由此,可以确保同一待处理的行为数据中的属性信息不相重复或冲突。
进一步地,在所述步骤S104中,所述主待处理维度和辅待处理维度的标准属性信息是填充至待处理的行为数据的属性信息中的,而非现有技术中采用的覆盖方式。
以下示出采用本实施例所述方案获得的处理后的行为数据结构:
较之现有技术中将价格和数量直接覆盖掉的方式,本实施例所述方案能够在将预设知识库中的标准属性信息填充至对应的行为数据中的同时,保留原始属性信息中已有的未重复的属性信息,从而在真正意义上实现维度的扩充。
由此,采用本实施例的方案,能够实现对行为数据的多重翻译,优化通过知识库对行为数据进行维度补充时的处理逻辑。具体而言,在主待处理维度的基础上,进一步从所述行为数据的属性信息中提取辅待处理维度,并通过预设知识库对所述主待处理维度和辅待处理维度进行翻译。由于所述主待处理维度和辅待处理维度在翻译期间并未被分离成独立的行为数据,因而翻译得到的标准属性信息可以准确地、相关联地填充至所述行为数据。
在本实施例的一个变化例中,在执行所述步骤S103中,还可以包括预处理步骤,以构建所述预设知识库,达到提高数据处理效率的效果。
具体而言,在所述预处理步骤中,可以统计所述待处理的行为数据列表中相同的主待处理维度和辅待处理维度的数量,这一数量可以理解为翻译次数。
进一步地,当所述翻译次数小于预设阈值时,可以确定在所述步骤S103中采用离线翻译的形式进行;否则,也即当所述翻译次数大于所述预设阈值时,可以确定在所述步骤S103中采用内存翻译的形式进行。
换言之,本实施例的方案通过将需要高频调用的预设知识库预先读取到内存中进行后续翻译处理,将低频调用的预设知识库以离线方式存储,能够有效提高后续翻译处理过程中的数据处理效率。
进一步地,在所述步骤S103中,可以先去内存中查找是否存储有所述预设知识库,若没有找到,再离线查找。
图3是本发明实施例的一种行为数据的处理装置的结构示意图。本领域技术人员理解,本实施例所述行为数据的处理装置(以下简称为处理装置3)可以用于实施上述图1和图2所示实施例中所述的方法技术方案。
具体地,参考图3,本实施例所述处理装置3可以包括:获取模块31,用于获取待处理的行为数据列表,其中,所述待处理的行为数据列表包括至少一个待处理的行为数据,所述待处理的行为数据包括主待处理维度及关联的至少一个属性信息;提取模块32,对于每一待处理的行为数据,从关联的属性信息中提取辅待处理维度;查找模块33,对于所述待处理的行为数据列表中的所有主待处理维度和所有提取到的辅待处理维度中的每一待处理维度,查找预设知识库,以得到与所述待处理维度相关联的标准属性信息,其中,所述预设知识库记录有待处理维度和标准属性信息的关联关系;填充模块34,用于将查找得到的所述主待处理维度关联的标准属性信息,和/或所述辅待处理维度关联的标准属性信息填充至关联的待处理的行为数据,以得到处理后的行为数据。
在一个实施例中,所述提取模块32可以包括:比对子模块321,用于逐一比对所述属性信息和所述预设知识库中记录的待处理维度是否匹配;确定子模块322,用于将比对结果为匹配的属性信息确定为所述辅待处理维度。
在一个实施例中,对于关联于同一待处理的行为数据的主待处理维度和辅待处理维度,所述主待处理维度与所述待处理的行为数据的时间戳相关联,所述辅待处理维度与所述时间戳无关。
在一个实施例中,所述填充模块34可以包括:判断子模块341,对于所述待处理的行为数据列表中的所有主待处理维度和所有提取到的辅待处理维度中的每一待处理维度,根据所述待处理维度是否关联时间戳来判断所述待处理维度是否为主待处理维度;第一填充子模块342,当判断结果表明所述待处理维度为主待处理维度时,确定主待处理维度相匹配的待处理的行为数据,将查找得到的所述主待处理维度关联的标准属性信息填充至所述待处理的行为数据。
进一步地,所述填充模块34可以包括:第二填充子模块343,当判断结果表明所述待处理维度为辅待处理维度时,确定辅待处理维度相匹配的待处理的行为数据,将查找得到的所述辅待处理维度关联的标准属性信息填充至所述待处理的行为数据。
在一个实施例中,所述第二填充子模块343可以包括:第一保留单元3431,当所述辅待处理维度关联的标准属性信息与所述待处理的行为数据所包含的属性信息存在重复的属性信息时,在重复的属性信息中保留所述待处理的行为数据所包含的属性信息。
在一个实施例中,所述第二填充子模块343可以包括:第二保留单元3432,当关联于同一待处理的行为数据的多个辅待处理维度各自关联的标准属性信息中存在重复的标准属性信息时,随机保留重复的标准属性信息中的任一标准属性信息。
关于所述处理装置3的工作原理、工作方式的更多内容,可以参照图1和图2中的相关描述,这里不再赘述。
进一步地,本发明实施例还公开一种存储介质,其上存储有计算机指令,所述计算机指令运行时执行上述图1和图2所示实施例中所述的方法技术方案。优选地,所述存储介质可以包括计算机可读存储介质。所述存储介质可以包括ROM、RAM、磁盘或光盘等。
进一步地,本发明实施例还公开一种终端,包括存储器和处理器,所述存储器上存储有能够在所述处理器上运行的计算机指令,所述处理器运行所述计算机指令时执行上述图1和图2所示实施例中所述的方法技术方案。例如,所述终端可以为DMP的服务器节点。
虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。
Claims (10)
1.一种行为数据的处理方法,其特征在于,包括:
获取待处理的行为数据列表,其中,所述待处理的行为数据列表包括至少一个待处理的行为数据,所述待处理的行为数据包括主待处理维度及关联的至少一个属性信息;
对于每一待处理的行为数据,从关联的属性信息中提取辅待处理维度;
对于所述待处理的行为数据列表中的所有主待处理维度和所有提取到的辅待处理维度中的每一待处理维度,查找预设知识库,以得到与所述待处理维度相关联的标准属性信息,其中,所述预设知识库记录有待处理维度和标准属性信息的关联关系;
将查找得到的所述主待处理维度关联的标准属性信息,和/或所述辅待处理维度关联的标准属性信息填充至关联的待处理的行为数据,以得到处理后的行为数据。
2.根据权利要求1所述的处理方法,其特征在于,所述从关联的属性信息中提取辅待处理维度包括:
逐一比对所述属性信息和所述预设知识库中记录的待处理维度是否匹配;
将比对结果为匹配的属性信息确定为所述辅待处理维度。
3.根据权利要求1所述的处理方法,其特征在于,对于关联于同一待处理的行为数据的主待处理维度和辅待处理维度,所述主待处理维度与所述待处理的行为数据的时间戳相关联,所述辅待处理维度与所述时间戳无关。
4.根据权利要求3所述的处理方法,其特征在于,所述将查找得到的所述主待处理维度关联的标准属性信息,和/或所述辅待处理维度关联的标准属性信息填充至关联的待处理的行为数据,以得到处理后的行为数据包括:
对于所述待处理的行为数据列表中的所有主待处理维度和所有提取到的辅待处理维度中的每一待处理维度,根据所述待处理维度是否关联时间戳来判断所述待处理维度是否为主待处理维度;
当判断结果表明所述待处理维度为主待处理维度时,确定主待处理维度相匹配的待处理的行为数据,将查找得到的所述主待处理维度关联的标准属性信息填充至所述待处理的行为数据。
5.根据权利要求4所述的处理方法,其特征在于,所述将查找得到的所述主待处理维度关联的标准属性信息,和/或所述辅待处理维度关联的标准属性信息填充至关联的待处理的行为数据,以得到处理后的行为数据包括:
当判断结果表明所述待处理维度为辅待处理维度时,确定辅待处理维度相匹配的待处理的行为数据,将查找得到的所述辅待处理维度关联的标准属性信息填充至所述待处理的行为数据。
6.根据权利要求5所述的处理方法,其特征在于,所述将查找得到的所述辅待处理维度关联的标准属性信息填充至所述待处理的行为数据包括:
当所述辅待处理维度关联的标准属性信息与所述待处理的行为数据所包含的属性信息存在重复的属性信息时,在重复的属性信息中保留所述待处理的行为数据所包含的属性信息。
7.根据权利要求5所述的处理方法,其特征在于,所述将查找得到的所述辅待处理维度关联的标准属性信息填充至所述待处理的行为数据包括:
当关联于同一待处理的行为数据的多个辅待处理维度各自关联的标准属性信息中存在重复的标准属性信息时,随机保留重复的标准属性信息中的任一标准属性信息。
8.一种行为数据的处理装置,其特征在于,包括:
获取模块,用于获取待处理的行为数据列表,其中,所述待处理的行为数据列表包括至少一个待处理的行为数据,所述待处理的行为数据包括主待处理维度及关联的至少一个属性信息;
提取模块,对于每一待处理的行为数据,从关联的属性信息中提取辅待处理维度;
查找模块,对于所述待处理的行为数据列表中的所有主待处理维度和所有提取到的辅待处理维度中的每一待处理维度,查找预设知识库,以得到与所述待处理维度相关联的标准属性信息,其中,所述预设知识库记录有待处理维度和标准属性信息的关联关系;
填充模块,用于将查找得到的所述主待处理维度关联的标准属性信息,和/或所述辅待处理维度关联的标准属性信息填充至关联的待处理的行为数据,以得到处理后的行为数据。
9.一种存储介质,其上存储有计算机指令,其特征在于,所述计算机指令运行时执行权利要求1至7任一项所述方法的步骤。
10.一种终端,包括存储器和处理器,所述存储器上存储有能够在所述处理器上运行的计算机指令,其特征在于,所述处理器运行所述计算机指令时执行权利要求1至7任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910189913.5A CN111694925B (zh) | 2019-03-13 | 2019-03-13 | 行为数据的处理方法及装置、存储介质、终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910189913.5A CN111694925B (zh) | 2019-03-13 | 2019-03-13 | 行为数据的处理方法及装置、存储介质、终端 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111694925A true CN111694925A (zh) | 2020-09-22 |
CN111694925B CN111694925B (zh) | 2023-06-09 |
Family
ID=72474574
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910189913.5A Active CN111694925B (zh) | 2019-03-13 | 2019-03-13 | 行为数据的处理方法及装置、存储介质、终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111694925B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120013619A1 (en) * | 2010-07-14 | 2012-01-19 | Richard Brath | System and method for visualizing multi-dimensional data using shape attributes |
CN102508839A (zh) * | 2011-09-22 | 2012-06-20 | 用友软件股份有限公司 | 数据处理装置和方法 |
CN109167805A (zh) * | 2018-07-09 | 2019-01-08 | 同济大学 | 基于城市场景中车联网时空数据的分析处理方法 |
-
2019
- 2019-03-13 CN CN201910189913.5A patent/CN111694925B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120013619A1 (en) * | 2010-07-14 | 2012-01-19 | Richard Brath | System and method for visualizing multi-dimensional data using shape attributes |
CN102508839A (zh) * | 2011-09-22 | 2012-06-20 | 用友软件股份有限公司 | 数据处理装置和方法 |
CN109167805A (zh) * | 2018-07-09 | 2019-01-08 | 同济大学 | 基于城市场景中车联网时空数据的分析处理方法 |
Non-Patent Citations (1)
Title |
---|
侯伟超;刘英博;黄向东;: "大数据环境下并行数据流预测及优化方法" * |
Also Published As
Publication number | Publication date |
---|---|
CN111694925B (zh) | 2023-06-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2686590C1 (ru) | Способ и устройство для сравнения схожих элементов высокоразмерных признаков изображений | |
US8209318B2 (en) | Product searching system and method using search logic according to each category | |
CN102341800B (zh) | 检索处理方法以及装置 | |
EP2840515A1 (en) | Method, device and computer storage media for user preferences information collection | |
CN104331446B (zh) | 一种基于内存映射的海量数据预处理方法 | |
US8930376B2 (en) | Search result abstract quality using community metadata | |
US11907659B2 (en) | Item recall method and system, electronic device and readable storage medium | |
EP2045731A1 (en) | Automatic generation of ontologies using word affinities | |
CN103136228A (zh) | 一种图片搜索方法以及图片搜索装置 | |
JP2013531289A5 (zh) | ||
US9244919B2 (en) | Organizing books by series | |
CN104268216A (zh) | 一种基于互联网信息的数据清洗系统 | |
US8290925B1 (en) | Locating product references in content pages | |
KR20200121744A (ko) | 사용자 페르소나를 처리하는 방법, 장치, 서버 및 저장 매체 | |
CN111125298A (zh) | 重建ntfs文件目录树的方法、设备及存储介质 | |
CN102227723B (zh) | 辅助误译的检测的装置及方法 | |
CN114116762A (zh) | 一种离线数据模糊搜索方法、装置、设备和介质 | |
CN110765325A (zh) | 一种ceph分布式存储系统的运维分析方法及系统 | |
CN109739854A (zh) | 一种数据存储方法及装置 | |
CN107590233B (zh) | 一种文件管理方法及装置 | |
CN113128213A (zh) | 日志模板提取方法及装置 | |
CN111694925A (zh) | 行为数据的处理方法及装置、存储介质、终端 | |
CN109213972A (zh) | 确定文档相似度的方法、装置、设备和计算机存储介质 | |
CN114036256B (zh) | 基于Solr的非结构化文件检索方法、装置、设备及存储介质 | |
CN106469086B (zh) | 事件处理方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |