CN109993587A - 一种数据分类方法、装置、设备和介质 - Google Patents
一种数据分类方法、装置、设备和介质 Download PDFInfo
- Publication number
- CN109993587A CN109993587A CN201910286200.0A CN201910286200A CN109993587A CN 109993587 A CN109993587 A CN 109993587A CN 201910286200 A CN201910286200 A CN 201910286200A CN 109993587 A CN109993587 A CN 109993587A
- Authority
- CN
- China
- Prior art keywords
- data
- classification
- pending
- user information
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0242—Determining effectiveness of advertisements
- G06Q30/0245—Surveys
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种数据分类方法、装置、设备和介质,涉及数据处理的技术领域,本申请实施例可以根据获取待处理数据,进行确定与待处理数据所属数据分类对应的分类时间区间;然后基于所述分类时间区间,从所述待处理数据中,确定具有预定分类属性对应的数据,从而可以对获取到的待处理数据进行分类时,根据待处理数据的分类时间区间对数据精确分类,提高对数据进行分类的准确度。
Description
技术领域
本申请涉及数据处理技术领域,尤其是涉及一种数据分类方法、装置、设备和介质。
背景技术
目前,现有技术中用户会通过不同的渠道了解并访问网站,例如,通过公交站站牌的广告投放、商场中屏幕的广告投放或是手机推送的消息访问所相应的网站。在统计网站访问量时,用户访问网站的时间间隔会比较长,现有技术在统计网站访问量时,一般是根据该用户第一次访问网站的时间以及最后一次访问网站的时间对用户的数据进行分类,当用户第一次访问网站时间距离当前时间比较久远时,采用上述方法进行分类后的数据的准确度比较差,进而也降低了分类后的数据的应用准确度。
发明内容
有鉴于此,本申请的目的在于提供一种数据分类方法、装置、设备和介质,以提高对数据进行分类时的准确度。
第一方面,本发明实施例提供了一种数据分类方法,包括:
获取待处理数据;
确定与所述待处理数据所属数据分类对应的分类时间区间;
基于所述分类时间区间,从所述待处理数据中,确定具有预定分类属性对应的数据。
可选的,所述基于所述分类时间区间,从所述待处理数据中,确定具有预定分类属性对应的数据,包括:
根据所述待处理数据中的获取时间,从所述待处理数据中,筛选属于所述分类时间区间的第一数据;
从预设的分类数据表中,查询与所述第一数据的用户信息对应的用户信息,所述分类数据表存储有所述用户信息以及数字标识符;
若所述分类数据表中查询到所述第一数据中的第二数据的用户信息,则将该第二数据确定为具有所述预定分类属性对应的数据。
可选的,还包括:
若所述分类数据表中未查询到所述第一数据中除第二数据外的数据的用户信息,从所述分类数据表中,查询与所述第一数据中除第二数据外的数据的数字标识符对应的所述数字标识符;
将查询到的所述数字标识符对应的数据确定为具有所述预定分类属性对应的数据。
可选的,在所述从所述分类数据表中,查询与所述第一数据中除第二数据外的数据的数字标识符对应的所述数字标识符之前,还包括:
从所述第一数据中除第二数据外的数据中,获取不存在数字标识符的第三数据;
基于所述第三数据的用户信息,确定所述第三数据的数字标识符。
可选的,不同的所述待处理数据所属数据分类对应不同的分类时间区间。
第二方面,本发明实施例提供了一种数据分类装置,包括:
获取模块,用于获取待处理数据;
第一确定模块,用于确定与所述待处理数据所属数据分类对应的分类时间区间;
第二确定模块,用于基于所述分类时间区间,从所述待处理数据中,确定具有预定分类属性对应的数据。
可选的,所述第二确定模块,具体用于:
根据所述待处理数据中的获取时间,从所述待处理数据中,筛选属于所述分类时间区间的第一数据;
从预设的分类数据表中,查询与所述第一数据的用户信息对应的用户信息,其中,所述分类数据表存储有所述用户信息以及数字标识符;
若所述分类数据表中查询到所述第一数据中的第二数据的用户信息,则将该第二数据确定为具有所述预定分类属性对应的数据。
可选的,所述第二确定模块,还用于:
若所述分类数据表中未查询到所述第一数据中除第二数据外的数据的用户信息,从所述分类数据表中,查询与所述第一数据中除第二数据外的数据的数字标识符对应的所述数字标识符;
将查询到的所述数字标识符对应的数据确定为具有所述预定分类属性对应的数据。
第三方面,本申请实施例提供了一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面,或第一方面的任一种可能的实施方式中的步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述第一方面,或第一方面的任一种可能的实施方式中的步骤。
本申请实施例提供了一种数据分类方法,根据获取待处理数据,确定与待处理数据所属数据分类对应的分类时间区间;然后基于分类时间区间,从待处理数据中,确定具有预定分类属性对应的数据,从而对获取到的待处理数据进行分类时,根据待处理数据的分类时间区间对数据进行精确的分类,提高对数据进行分类时的准确度。
本申请的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种数据分类方法的流程示意图;
图2为本申请实施例提供的另一种数据分类方法的流程示意图;
图3为本申请实施例提供的一种数据分类装置的结构示意图;
图4为本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合附图对本申请的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
现有技术在统计网站访问量时,一般是根据该用户第一次访问网站的时间以及最后一次访问网站的时间对用户的数据进行分类,当用户第一次访问网站时间距离当前时间比较久远时,采用上述方法进行分类后的数据的准确度比较差,基于此,本申请实施例提供的一种数据分类方法、装置、设备和介质,可以根据待处理数据的分类时间区间对数据进行精确的分类,提高对数据进行分类的准确度。
为便于对本实施例进行理解,首先对本申请实施例所公开的一种数据分类方法进行详细介绍,图1为本申请实施例提供的一种数据分类方法的流程图,如图1所示,该方法包括如下步骤:
步骤101,获取待处理数据;
具体的,待处理数据可以为二手车数据和新车数据,待处理数据包括多个数据条目,数据条目为待处理数据中的最小数据单元,每个数据条目包括数据产生时间、用户标识、用户联系方式、数字标识符等,其中,数字标识符是根据用户的访问渠道生成的唯一标识,访问渠道可以为但不限于电脑端网页、移动端应用程序或者移动端网页等。
例如,用户可以通过公交站站牌的广告信息、商场中屏幕的广告信息或是手机推送的消息进行访问相应网站,通过网站中不同广告信息进行登录网站的用户都属于根据市场渠道可以统计到的用户,在进行统计用户数据时,此类数据信息会有设定渠道标识,其中,设定渠道的标识包括:“app”,“bd”,“cpr”,“dh”,“pz”,“tg”,“sp”,“sem”,“seo”。
用户也可以是通过其它用户介绍后访问相应的网站,这种情况属于非设定渠道可以统计到的用户,在进行统计用户数据时,该类数据不会携带有设定渠道标识,通过根据市场渠道统计到的用户数据设定为预定分类属性,对统计到不存在设定渠道标识的用户数据进行分类,针对预设的分类数据表中信息比对,判断不存在设定渠道标识的用户数据中是否可以归类到市场渠道统计的用户数据中。
步骤102,确定与所述待处理数据所属数据分类对应的分类时间区间;
这里,数据分类包括二手车数据和新车数据,不同的数据分类对应不同的分类时间区间,例如,二手车数据对应的分类时间区间为当前时间到当前时间前3个月时间,新车数据对应的分类时间区间为当前时间到当前时间之前9个月的时间。
用户在访问网站的间隔时间可能比较长,直接根据该用户访问网站第一次访问时间或最后一次访问时间进行数据分类时不能真实反映数据分类,因此,本申请针对二手车和新车的情况确定获取待处理数据的分类时间区间。
在具体实施中,根据待处理数据的所属数据分类,确定待处理数据对应的获取时间段,根据待处理数据的获取时间,以及确定的获取时间段,确定待处理数据对应的分类时间区间。
例如,在待处理数据为二手车数据时,当前待处理数据的获取时间为2018年12月25日,二手车数据对应的获取时间段为3个月,而对于二手车业务而言,用户第一次访问网站后,用户会不定期的再次登录网站查看车辆行情,距离当前获取时间较远的数据对于分类时数据准确度的贡献比较低,因此,二手车数据的分类时间区间确定为2018年9月25号-2018年12月25号。
又如,在待处理数据为新车数据时,当前待处理数据的获取时间为2018年12月25日,新车数据对应的获取时间段为6个月,而对于新车业务而言,用户第一次访问网站后后,用户会不定期的再次登录网站查看车辆行情,距离当前获取时间较远的数据对于分类时数据准确度的贡献比较低,因此,新车数据的分类时间区间确定为2018年6月25号-2018年12月25号。
步骤103,基于所述分类时间区间,从所述待处理数据中,确定具有预定分类属性对应的数据。
在执行步骤103时,如图2所示,包括以下步骤:
步骤201,根据所述待处理数据中的获取时间,从所述待处理数据中,筛选属于所述分类时间区间的第一数据;
这里,获取时间为获取待处理数据的时间。
在具体实施中,基于待处理数据中每个数据条目的获取时间,统计落入待处理数据对应的分类时间区间的数据条目,将统计的数据条目作为第一数据。
例如,待处理数据为二手车数据,待处理数据对应的分类时间区间为T0-Tf,二手车数据对应的待处理数据中包括三个数据条目A、B、C,数据条目A的产生时间为T1,数据条目B的产生时间为T2,数据条目C的产生时间为T3,若数据条目A和B的产生时间落入到T0-Tf中,则确定数目条目A和B为第一数据。
步骤202,从预设的分类数据表中,查询与所述第一数据的用户信息对应的用户信息;
这里,分类数据表用于存储用户信息以及数字标识符,具体的,分类数据表中包括用于存储用户标识和用户联系方式的用户信息线索表、用于存储用户访问渠道生成的数字标识符的数字标识符渠道表以及用于存储用户联系方式和对应的用户访问渠道生成的数字标识符的数字标识符电话表。
示例性的,判断统计的不存在设定渠道标识的第一用户数据,是否可以归类到市场渠道统计的用户数据的方法可以是,先通过用户信息线索表对第一用户数据进行比对,确定部分第一用户数据属于市场渠道统计到的用户数据,然后将第一用户数据中剩余的用户数据通过数字标识符电话表进行比对,确定第一用户数据剩余的用户数据中都具有数字标识符,再通过数字标识符渠道表对上述剩余的用户数据进行比对,判断上述剩余的用户数据是否可以归类到市场渠道统计的用户数据。
步骤203,若所述分类数据表中查询到所述第一数据中的第二数据的用户信息,则将该第二数据确定为具有所述预定分类属性对应的数据。
在具体实施中,在得到第一数据后,针对第一数据中的每个数据条目,比对该数据条目中的用户信息与分类数据表中的用户信息,若第一数据中存在数据条目中的用户信息与分类数据表中的用户信息一致,则将与分类数据表中的用户信息一致的数据条目确定为第二数据,也就是,属于预定分类属性的数据。若分类数据表中未查询到第一数据中除第二数据外的其它数据的用户信息,则对其它数据进行后续的分类操作。
例如,待处理数据为二手车数据,二手车数据中包括三个用户,用户标识分别为A、B、C,A的联系方式为T1,B的联系方式为T2,C的联系方式为T3,对各用户的用户标识和联系方式与分类数据表进行比对,若分类数据表中的用户标识、用户联系方式与用户标识为A的联系方式T1相同,则将A对应的数据条目确定为第二数据。
分类数据表中不存在第一数据中除第二数据外的其它数据的用户信息的原因,很大可能是因为待处理数据在获取时丢失导致的,但是,其它数据中可能存在预定分类属性对应的数据,此时,可以通过数据的数字标识符对其它数据进行分类。
针对第一数据中除第二数据外的其它数据而言,可以通过以下步骤确定属于预定分类属性对应的数据:
若所述分类数据表中未查询到所述第一数据中除第二数据外的其它数据的用户信息,从所述分类数据表中,查询与所述第一数据中除第二数据外的其它数据的数字标识符对应的标识符;
将查询到的标识符对应的其它数据确定为具有所述预定分类属性对应的数据。
在从所述分类数据表中,查询与所述第一数据中除第二数据外的其它数据的数字标识符对应的标识符之前,还包括以下步骤:
从所述第一数据中除第二数据外的其它数据中,获取不存在数字标识符的第三数据;
基于所述第三数据的用户信息,确定所述第三数据的数字标识符。
这里,数字标识符又可以称为全局唯一标识符,是一种由算法生成的二进制长度为128的数字标识符。数字标识符主要用于在拥有多个节点、多台计算机的网络或系统中,而且数字标志识符是一个随机数,一般情况下,任何计算机和计算机集群不会生成两个相同的数字标识符,在生成一些节点的时候需要通过用户的唯一身份标识号进行标记。
其中,数字标识符的随机性有两方面的特性,一方面是空间,对于网络中的计算机,通常是选取网络适配器的地址值,没有网络适配器的机器用其他随机数生成算法产生;另一方面是时间值,同一机器在不同时候产生的标识符是不同的。
在具体实施过程中,从第一数据中除第二数据外的其它数据中,获取不存在数字标识符的数据条目,也就是说,数据条目中数字标识符为空,将不存在数字标识符的数据条目作为第三数据,查询与第三数据中的数据条目中的用户标识对应的历史访问记录,若存在历史访问记录,则将历史访问记录中的历史数字标识符,确定为当前数据条目的数字标识符,若不存在历史访问记录或对应的历史访问记录中不存在历史数字标识符,则丢弃当前条数据条目,若当前数据条目中存在用户信息缺失情况,则丢弃该当前数据条目。
例如,用户A在2018年2月通过其它用户介绍后给网站人工客服致电了解网站发布信息,这时根据电话信息记录,仅能得到该用户A的联系方式,通过该用户A的联系方式,查询该用户的历史访问记录,若存在用户A的历史访问记录,历史访问记录中显示:用户A在2018年1月1日通过网站访问后,历史访问记录中具有用户的历史数字标识符AAAAA,该历史数字标识符是通过用户A预留的联系方式以及历史访问渠道(网站),通过预设算法生成的,则将用户历史访问记录中的历史数字标识符AAAAA,确定该用户A的当前数字标识符AAAAA,若不存在用户A的历史访问记录,则丢弃用户A的数据条目。其中,预设算法为哈希算法、非对称加密算法等等,本申请对此不予限制。
在补全其它数据的数字标识符后,从预设的分类数据表中,查询与其它数据中的数据条目中的数字标识符对应的标识符,若其它数据中存在数据条目中的数字标识符与分类数据表中的标识符一致,则将与分类数据表中的标识符一致的数据条目确定为属于预定分类属性的数据。
例如,待处理数据为二手车数据,二手车数据中包括三个用户,分别为D、E、F,D的数字标识符为guid1,E的数字标识符为guid2,F的数字标识符为guid3,对各用户的数字标识符与分类数据表进行比对,若分类数据表中的标识符与D的数字标识符为guid1相同,则将D对应的数据条目确定为预定分类属性对应的数据。
不过应当注意,待处理数据为新车数据的情况与二手车数据的示例相同,本申请不针对新车数据进行展开说明。
在一种实施例中,待处理数据与分类数据表在比对过程中,可能待处理数据包括同一用户的三个数据条目的用户信息与分类数据表中的用户信息相同,待处理数据的获取时间为2018年12月25号,不同的数据条目具有不同产生时间,三个数据条目分别为:2018年10月1号对应的预定分类属性为“app”设定渠道数据,2018年10月20号对应的预定分类属性为“tg”设定渠道数据,2018年11月20号对应的预定分类属性为“cpr”设定渠道数据,由于“cpr”设定渠道数据的产生时间距离待处理数据的获取时间最近,因此,将该用户对应的“cpr”设定渠道数据的数据条目归类为具有“cpr”的预定分类属性的数据,其它两条数据条目可以丢弃。
用户与预设分类的数据在比对过程中也可能有一个匹配的信息,假设匹配信息是2018年10月20号的“tg”设定市场渠道数据,那么将该用户归类为2018年10月20号的“tg”设定市场渠道数据信息。
在一种实施例中,当根据联系方式和用户标识没有匹配到相同信息时,则进行数字标识符的匹配。待处理数据与分类数据表在比对数字标识符的过程中,可能待处理数据包括同一用户的三个数据条目的用户信息与分类数据表中的用户信息相同,待处理数据的获取时间为2018年12月25号,不同的数据条目具有不同产生时间,三个数据条目分别为:2018年10月11号对应的预定分类属性为“bd”设定渠道数据,2018年10月21号对应的预定分类属性为“tg”设定渠道数据,2018年11月25号对应的预定分类属性为“cpr”设定渠道数据,由于“cpr”设定渠道数据的产生时间距离待处理数据的获取时间最近,因此,将该用户对应的“cpr”设定渠道数据的数据条目归类为具有“cpr”的预定分类属性的数据,其它两条数据条目可以丢弃。
本申请实施例提供了一种数据分类方法,根据获取待处理数据,确定与待处理数据所属数据分类对应的分类时间区间;然后基于分类时间区间,从待处理数据中,确定具有预定分类属性对应的数据,从而可以对获取到的待处理数据进行分类时,根据待处理数据的分类时间区间对数据进行精确的分类,提高对数据进行分类时的准确度。
本申请实施例提供了一种数据分类装置,如图3所示,该装置包括以下模块:
获取模块301,用于获取待处理数据;
第一确定模块302,用于确定与所述待处理数据所属数据分类对应的分类时间区间;
第二确定模块303,用于基于所述分类时间区间,从所述待处理数据中,确定具有预定分类属性对应的数据。
可选地,第二确定模块303,具体用于:
根据所述待处理数据中的获取时间,从所述待处理数据中,筛选属于所述分类时间区间的第一数据;
从预设的分类数据表中,查询与所述第一数据的用户信息对应的用户信息;
若所述分类数据表中查询到所述第一数据中的第二数据的用户信息,则将该第二数据确定为具有所述预定分类属性对应的数据。
可选地,第二确定模块303,具体还用于:
若所述分类数据表中未查询到所述第一数据中除第二数据外的其它数据的用户信息,从所述分类数据表中,查询与所述第一数据中除第二数据外的其它数据的数字标识符对应的标识符;
将查询到的标识符对应的其它数据确定为具有所述预定分类属性对应的数据。
可选地,在第二确定模块303中,所述从所述分类数据表中,查询与所述第一数据中除第二数据外的数据的数字标识符对应的标识符之前,具体用于:
从所述第一数据中除第二数据外的数据中,获取不存在数字标识符的第三数据;
基于所述第三数据的用户信息,确定所述第三数据的数字标识符。
可选地,所述装置中,不同的所述待处理数据所属数据分类对应不同的分类时间区间。
对应于图1中的数据分类方法,本申请实施例还提供了一种计算机设备400,如图4所示,该设备包括存储器401、处理器402及存储在该存储器401上并可在该处理器402上运行的计算机程序,其中,上述处理器402执行上述计算机程序时实现上述数据分类方法。
具体地,上述存储器401和处理器402能够为通用的存储器和处理器,这里不做具体限定,当处理器402运行存储器401存储的计算机程序时,能够执行上述数据分类方法,解决现有技术中数据分类不准确的问题,其中,本申请通过获取待处理数据后,确定与待处理数据所属分类对应的分类时间区间;且所属分类可以是二手车和新车,其中二手车对应分类时间区间为90天,新车对应分类时间区间为180天,基于分类时间区间和待处理数据的属性信息,属性信息可以包括用户的联系方式和数字标识符,从待处理数据中,确定属于预设分类的数据,因此,通过对待处理数据的分类时间区间对数据进行精确的分类,可以提高数据分类的准确度。
对应于图1中的数据分类方法,本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述数据分类方法的步骤。
具体地,该存储介质能够为通用的存储介质,如移动磁盘、硬盘等,该存储介质上的计算机程序被运行时,能够执行上述数据分类方法,解决现有技术中数据分类不准确的问题,其中,本申请通过获取待处理数据后,确定与待处理数据所属分类对应的分类时间区间;且所属分类可以是二手车和新车,其中二手车对应分类时间区间为90天,新车对应分类时间区间为180天,基于分类时间区间和待处理数据的属性信息,属性信息可以包括用户的联系方式和数字标识符,从待处理数据中,确定属于预设分类的数据,因此,通过对待处理数据的分类时间区间对数据进行精确的分类,可以提高数据分类的准确度。
本申请实施例所提供的进行数据分类方法的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
本申请实施例所提供的数据分类装置可以为设备上的特定硬件或者安装于设备上的软件或固件等。本申请实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,前述描述的系统、装置和单元的具体工作过程,均可以参考上述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请提供的实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释,此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。
Claims (10)
1.一种数据分类方法,其特征在于,包括:
获取待处理数据;
确定与所述待处理数据所属数据分类对应的分类时间区间;
基于所述分类时间区间,从所述待处理数据中,确定具有预定分类属性对应的数据。
2.如权利要求1所述的数据分类方法,其特征在于,所述基于所述分类时间区间,从所述待处理数据中,确定具有预定分类属性对应的数据,包括:
根据所述待处理数据中的获取时间,从所述待处理数据中,筛选属于所述分类时间区间的第一数据;
从预设的分类数据表中,查询与所述第一数据的用户信息对应的用户信息,其中,所述分类数据表存储有所述用户信息以及数字标识符;
若所述分类数据表中查询到所述第一数据中的第二数据的用户信息,则将该第二数据确定为具有所述预定分类属性对应的数据。
3.如权利要求2所述的数据分类方法,其特征在于,还包括:
若所述分类数据表中未查询到所述第一数据中除第二数据外的数据的用户信息,从所述分类数据表中,查询与所述第一数据中除第二数据外的数据的数字标识符对应的所述数字标识符;
将查询到的所述数字标识符对应的数据确定为具有所述预定分类属性对应的数据。
4.如权利要求3所述的数据分类方法,其特征在于,在所述从所述分类数据表中,查询与所述第一数据中除第二数据外的数据的数字标识符对应的所述数字标识符之前,还包括:
从所述第一数据中除第二数据外的数据中,获取不存在数字标识符的第三数据;
基于所述第三数据的用户信息,确定所述第三数据的数字标识符。
5.如权利要求1所述的数据分类方法,其特征在于,不同的所述待处理数据所属数据分类对应不同的分类时间区间。
6.一种数据分类装置,其特征在于,包括:
获取模块,用于获取待处理数据;
第一确定模块,用于确定与所述待处理数据所属数据分类对应的分类时间区间;
第二确定模块,用于基于所述分类时间区间,从所述待处理数据中,确定具有预定分类属性对应的数据。
7.根据权利要求6所述的数据分类装置,其特征在于,所述第二确定模块,具体用于:
根据所述待处理数据中的获取时间,从所述待处理数据中,筛选属于所述分类时间区间的第一数据;
从预设的分类数据表中,查询与所述第一数据的用户信息对应的用户信息,其中,所述分类数据表存储有所述用户信息以及数字标识符;
若所述分类数据表中查询到所述第一数据中的第二数据的用户信息,则将该第二数据确定为具有所述预定分类属性对应的数据。
8.根据权利要求7所述的数据分类装置,其特征在于,所述第二确定模块,还用于:
若所述分类数据表中未查询到所述第一数据中除第二数据外的数据的用户信息,从所述分类数据表中,查询与所述第一数据中除第二数据外的数据的数字标识符对应的所述数字标识符;
将查询到的所述数字标识符对应的数据确定为具有所述预定分类属性对应的数据。
9.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1-5中任一项所述的数据分类的方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器运行时执行上述权利要求1-5中任一项所述的数据分类的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910286200.0A CN109993587B (zh) | 2019-04-10 | 2019-04-10 | 一种数据分类方法、装置、设备和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910286200.0A CN109993587B (zh) | 2019-04-10 | 2019-04-10 | 一种数据分类方法、装置、设备和介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109993587A true CN109993587A (zh) | 2019-07-09 |
CN109993587B CN109993587B (zh) | 2022-06-03 |
Family
ID=67133028
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910286200.0A Active CN109993587B (zh) | 2019-04-10 | 2019-04-10 | 一种数据分类方法、装置、设备和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109993587B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103678417A (zh) * | 2012-09-25 | 2014-03-26 | 华为技术有限公司 | 人机交互数据处理方法和装置 |
CN103870512A (zh) * | 2012-12-18 | 2014-06-18 | 腾讯科技(深圳)有限公司 | 一种生成用户兴趣标签的方法及装置 |
CN104091276A (zh) * | 2013-12-10 | 2014-10-08 | 深圳市腾讯计算机系统有限公司 | 在线分析点击流数据的方法和相关装置及系统 |
CN105578306A (zh) * | 2015-12-24 | 2016-05-11 | 深圳创维-Rgb电子有限公司 | 一种老人智能电视的控制方法、系统及智能电视 |
CN106446115A (zh) * | 2016-09-18 | 2017-02-22 | 成都九鼎瑞信科技股份有限公司 | 移动上网用户分类方法及装置 |
CN109144999A (zh) * | 2018-08-02 | 2019-01-04 | 东软集团股份有限公司 | 一种数据定位方法、装置及存储介质、程序产品 |
CN109408508A (zh) * | 2018-09-30 | 2019-03-01 | 广州恩业电子科技有限公司 | 监测数据的存储和查询方法、装置和计算机设备 |
-
2019
- 2019-04-10 CN CN201910286200.0A patent/CN109993587B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103678417A (zh) * | 2012-09-25 | 2014-03-26 | 华为技术有限公司 | 人机交互数据处理方法和装置 |
CN103870512A (zh) * | 2012-12-18 | 2014-06-18 | 腾讯科技(深圳)有限公司 | 一种生成用户兴趣标签的方法及装置 |
CN104091276A (zh) * | 2013-12-10 | 2014-10-08 | 深圳市腾讯计算机系统有限公司 | 在线分析点击流数据的方法和相关装置及系统 |
CN105578306A (zh) * | 2015-12-24 | 2016-05-11 | 深圳创维-Rgb电子有限公司 | 一种老人智能电视的控制方法、系统及智能电视 |
CN106446115A (zh) * | 2016-09-18 | 2017-02-22 | 成都九鼎瑞信科技股份有限公司 | 移动上网用户分类方法及装置 |
CN109144999A (zh) * | 2018-08-02 | 2019-01-04 | 东软集团股份有限公司 | 一种数据定位方法、装置及存储介质、程序产品 |
CN109408508A (zh) * | 2018-09-30 | 2019-03-01 | 广州恩业电子科技有限公司 | 监测数据的存储和查询方法、装置和计算机设备 |
Non-Patent Citations (1)
Title |
---|
张昶等: "Web数据挖掘在移动电子商务领域的应用研究", 《价值工程》 * |
Also Published As
Publication number | Publication date |
---|---|
CN109993587B (zh) | 2022-06-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11586673B2 (en) | Data writing and reading method and apparatus, and cloud storage system | |
CN108319598B (zh) | 数据缓存方法、装置和系统 | |
US11250166B2 (en) | Fingerprint-based configuration typing and classification | |
CN105162875B (zh) | 大数据群体任务分配方法及装置 | |
CN107092645B (zh) | 一种图书资源管理方法及装置 | |
CN110390584A (zh) | 一种异常用户的识别方法、识别装置及可读存储介质 | |
CN105550175A (zh) | 恶意账户识别方法及装置 | |
JP2015530666A (ja) | データインデックス化方法及び装置 | |
CN104750760A (zh) | 一种推荐应用软件的实现方法及装置 | |
CN104468107A (zh) | 校验数据处理方法及装置 | |
CN105207881A (zh) | 一种消息发送方法和设备 | |
CN104484600B (zh) | 一种基于改进密度聚类的入侵检测方法及装置 | |
CN105045911A (zh) | 一种用于用户进行标记的标签生成方法及设备 | |
CN104468207A (zh) | 终端管理的方法、装置及系统 | |
CN115757406A (zh) | 数据存储方法、装置、电子设备及存储介质 | |
CN108876314B (zh) | 一种职业生涯专业能力可追溯方法及平台 | |
CN112217657A (zh) | 基于sd-wan系统的数据传输方法、数据处理方法、设备和介质 | |
CN106095511A (zh) | 一种服务器升级方法和装置 | |
WO2012036598A1 (en) | Method and arrangement for segmentation of telecommunication customers | |
US6996577B1 (en) | Method and system for automatically grouping objects in a directory system based on their access patterns | |
CN109993587A (zh) | 一种数据分类方法、装置、设备和介质 | |
CN109428774B (zh) | 一种dpi设备的数据处理方法及相关的dpi设备 | |
CN109582829A (zh) | 一种处理方法、装置、设备及可读存储介质 | |
CN104954496A (zh) | 云资源的分配方法及装置 | |
CN101799803B (zh) | 信息处理方法、模块及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |