CN109257764A - 用户画像数据处理方法及装置 - Google Patents

用户画像数据处理方法及装置 Download PDF

Info

Publication number
CN109257764A
CN109257764A CN201811244682.5A CN201811244682A CN109257764A CN 109257764 A CN109257764 A CN 109257764A CN 201811244682 A CN201811244682 A CN 201811244682A CN 109257764 A CN109257764 A CN 109257764A
Authority
CN
China
Prior art keywords
imeimd5
user
imei
representation data
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811244682.5A
Other languages
English (en)
Other versions
CN109257764B (zh
Inventor
钱佳
曹文博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xiaomi Mobile Software Co Ltd
Original Assignee
Beijing Xiaomi Mobile Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Xiaomi Mobile Software Co Ltd filed Critical Beijing Xiaomi Mobile Software Co Ltd
Priority to CN201811244682.5A priority Critical patent/CN109257764B/zh
Publication of CN109257764A publication Critical patent/CN109257764A/zh
Application granted granted Critical
Publication of CN109257764B publication Critical patent/CN109257764B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/08Testing, supervising or monitoring using real traffic

Abstract

本公开是关于用户画像数据处理方法及装置。方法包括:根据预先确定的至少两个TAC,批量生成基于各TAC的imei;将各imei加密后与以设备标签为关键字第一用户画像数据中的imeiMD5进行匹配,建立各imei与第一用户画像数据中imeiMD5的映射关系;搜索出第一用户画像数据中已关联单个imeiMD5的设备标签;根据双卡双待设备的两个imei的SNR最后一位为连号关系的特性及映射关系,确定第一用户画像数据中与第一imeiMD5关联同一个设备的目标imeiMD5,并将目标imeiMD5与第一imeiMD5关联至同一个设备标签。本公开能够提高数据质量,提高信息推送的准确性和可靠性。

Description

用户画像数据处理方法及装置
技术领域
本公开涉及数据处理技术领域,尤其涉及用户画像数据处理方法及装置。
背景技术
目前在数据统计领域,因为统计的维度不同,一定会涉及到用户标识(id)和设备id这两种id的关联,推送面对海量的用户id数据和复杂的统计逻辑,需要在数据清洗和数据分析层面对不同id进行映射整合。
相关技术中,通过将各类用户id和设备id进行关联映射和聚合,以提升数据质量。
发明内容
为克服相关技术中存在的问题,本公开实施例提供一种用户画像数据处理方法及装置。所述技术方案如下:
根据本公开实施例的第一方面,提供一种用户画像数据处理方法,方法包括:
根据预先确定的至少两个型号核准号码TAC,批量生成基于各所述TAC的国际移动设备识别码imei;
将各所述imei加密后与以设备标签为关键字第一用户画像数据中的国际移动设备识别码信息-摘要算法5imeiMD5进行匹配,建立各所述imei与所述第一用户画像数据中imeiMD5的映射关系;
搜索出所述第一用户画像数据中已关联单个imeiMD5的设备标签,所述单个imeiMD5记为第一imeiMD5;
根据双卡双待设备的两个imei的生产顺序号SNR最后一位为连号关系的特性及所述映射关系,确定所述第一用户画像数据中与所述第一imeiMD5关联同一个设备的目标imeiMD5,并将所述目标imeiMD5与所述第一imeiMD5关联至同一个设备标签。
本公开的实施例提供的技术方案可以包括以下有益效果:该技术方案根据批量生成的各imei与第一用户画像数据中imeiMD5的映射关系,利用双卡双待设备的两个imei的SNR最后一位为连号关系的特性,搜索到第一用户画像数据中与第一imeiMD5关联同一个设备的目标imeiMD5,将第一imeiMD5和目标imeiMD5确定为同一双卡双待设备的两个imei所对应的imeiMD5并进行关联,从而达到数据聚合的目的,能够提高数据质量,如此,能够提高信息推送的准确性和可靠性。
在一个实施例中,所述根据双卡双待设备的两个imei的SNR最后一位为连号关系的特性及所述映射关系,确定所述第一用户画像数据中与所述第一imeiMD5关联同一个设备的目标imeiMD5,包括:
根据所述映射关系,确定各所述imei中与所述第一imeiMD5对应的第一imei、及与所述第一imei的SNR最后一位为连号关系的第二imei和第三imei;
根据所述映射关系,确定所述第一用户画像数据中与所述第二imei和第三imei对应的第二imeiMD5和第三imeiMD5;
确定所述第一用户画像数据中所述第一imeiMD5、第二imeiMD5和第三imeiMD5分别关联的第一用户标识、第二用户标识和第三用户标识;
将所述第二用户标识和第三用户标识中与所述第一用户标识相同的用户标识所关联的imeiMD5确定为所述目标imeiMD5。
在一个实施例中,所述方法还包括:
搜索出所述第一用户画像数据中已关联两个imeiMD5的设备标签;
根据所述映射关系,确定各所述imei中与所述两个imeiMD5分别对应的两个imei;
当所述两个imei的SNR最后一位不是连号关系时,将所述两个imeiMD5确定为脏数据;
将所述脏数据从所述第一用户画像数据中过滤,得到第二用户画像数据。
在一个实施例中,在所述将各imei加密后与以设备标签为关键字第一用户画像数据中的imeiMD5进行匹配之前,所述方法还包括:
获取以用户标识为关键字的待处理用户画像数据;所述待处理用户画像数据包括所述用户标识及加密后的设备标识;
将所述待处理用户画像数据的每个维度都单独拆分并重新聚合,生成以设备标签为关键字的所述第一用户画像数据;所述设备标签对应于具有相同值的加密后的设备标识。
在一个实施例中,所述加密后的设备标识,包括:imeiMD5、加密后的移动设备识别码meid MD5、及MacMD5。
根据本公开实施例的第二方面,提供一种用户画像数据处理装置,装置包括:
第一生成模块,用于根据预先确定的至少两个型号核准号码TAC,批量生成基于各所述TAC的国际移动设备识别码imei;
映射模块,用于将各所述imei加密后与以设备标签为关键字第一用户画像数据中的国际移动设备识别码信息-摘要算法5imeiMD5进行匹配,建立各所述imei与所述第一用户画像数据中imeiMD5的映射关系;
第一搜索模块,用于搜索出所述第一用户画像数据中已关联单个imeiMD5的设备标签,所述单个imeiMD5记为第一imeiMD5;
关联模块,用于根据双卡双待设备的两个imei的生产顺序号SNR最后一位为连号关系的特性及所述映射关系,确定所述第一用户画像数据中与所述第一imeiMD5关联同一个设备的目标imeiMD5,并将所述目标imeiMD5与所述第一imeiMD5关联至同一个设备标签。
在一个实施例中,所述关联模块,包括:
第一确定子模块,用于根据所述映射关系,确定各所述imei中与所述第一imeiMD5对应的第一imei、及与所述第一imei的SNR最后一位为连号关系的第二imei和第三imei;
第二确定子模块,用于根据所述映射关系,确定所述第一用户画像数据中与所述第二imei和第三imei对应的第二imeiMD5和第三imeiMD5;
第三确定子模块,用于确定所述第一用户画像数据中所述第一imeiMD5、第二imeiMD5和第三imeiMD5分别关联的第一用户标识、第二用户标识和第三用户标识;
第四确定子模块,用于将所述第二用户标识和第三用户标识中与所述第一用户标识相同的用户标识所关联的imeiMD5确定为所述目标imeiMD5。
在一个实施例中,所述装置还包括:
第二搜索模块,用于搜索出所述第一用户画像数据中已关联两个imeiMD5的设备标签;
确定模块,用于根据所述映射关系,确定各所述imei中与所述两个imeiMD5分别对应的两个imei;
过滤模块,用于当所述两个imei的SNR最后一位不是连号关系时,将所述两个imeiMD5确定为脏数据,及将所述脏数据从所述第一用户画像数据中过滤,得到第二用户画像数据。
在一个实施例中,所述装置还包括:
获取模块,用于获取以用户标识为关键字的待处理用户画像数据;所述待处理用户画像数据包括所述用户标识及加密后的设备标识;
第二生成模块,用于将所述待处理用户画像数据的每个维度都单独拆分并重新聚合,生成以设备标签为关键字的所述第一用户画像数据;所述设备标签对应于具有相同值的加密后的设备标识。
根据本公开实施例的第三方面,提供一种用户画像数据处理装置,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
根据预先确定的至少两个型号核准号码TAC,批量生成基于各所述TAC的国际移动设备识别码imei;
将各所述imei加密后与以设备标签为关键字第一用户画像数据中的国际移动设备识别码信息-摘要算法5imeiMD5进行匹配,建立各所述imei与所述第一用户画像数据中imeiMD5的映射关系;
搜索出所述第一用户画像数据中已关联单个imeiMD5的设备标签,所述单个imeiMD5记为第一imeiMD5;
根据双卡双待设备的两个imei的生产顺序号SNR最后一位为连号关系的特性及所述映射关系,确定所述第一用户画像数据中与所述第一imeiMD5关联同一个设备的目标imeiMD5,并将所述目标imeiMD5与所述第一imeiMD5关联至同一个设备标签。
根据本公开实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机指令,该指令被处理器执行时实现上述第一方面中任意一项所述方法实施例的步骤。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是根据一示例性实施例示出的用户画像数据处理方法的流程图。
图2是根据一示例性实施例示出的用户画像数据处理方法的流程图。
图3是根据一示例性实施例示出的用户画像数据处理方法的流程图。
图4是根据一示例性实施例示出的用户画像数据处理装置的框图。
图5是根据一示例性实施例示出的用户画像数据处理装置的框图。
图6是根据一示例性实施例示出的用户画像数据处理装置的框图。
图7是根据一示例性实施例示出的用户画像数据处理装置的框图。
图8是根据一示例性实施例示出的用户画像数据处理装置的框图。
图9是根据一示例性实施例示出的装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
相关技术中,通过将各类用户id和设备id进行关联映射和聚合,以此提升数据质量。但是,同一台双卡双待设备一般有两个国际移动设备识别码(imei,InternationalMobile Equipment Identification Number)并对应两个imei信息-摘要算法5(MD5,Message-Digest Algorithm 5),而在数据采集阶段,由于上报机制或者上报漏洞,导致设备每次连接后台的服务器时只上传一个imeiMd5,因此针对同一台设备在服务器中就会记录两个用户标识及imeiMd5,即同一台设备被当做了两台设备,这就导致统计结果虚高,严重降低数据质量,导致上层业务没有办法明确知晓哪些id代表同一台设备,从而为业务发展带来隐患,造成信息推送的准确性和可靠性较差。
为了解决上述问题,本公开实施例提供了一种用户画像数据处理方法,方法包括:根据预先确定的至少两个型号核准号码(TAC),批量生成基于各TAC的imei;将各imei加密后与以设备标签为关键字第一用户画像数据中的imeiMD5进行匹配,建立各imei与第一用户画像数据中imeiMD5的映射关系;搜索出第一用户画像数据中已关联单个imeiMD5的设备标签,单个imeiMD5记为第一imeiMD5;根据双卡双待设备的两个imei的生产顺序号(SNR)最后一位为连号关系的特性及映射关系,确定第一用户画像数据中与第一imeiMD5关联同一个设备的目标imeiMD5,并将目标imeiMD5与第一imeiMD5关联至同一个设备标签。本公开实施例根据批量生成的各imei与第一用户画像数据中imeiMD5的映射关系,利用双卡双待设备的两个imei的SNR最后一位为连号关系的特性,搜索到第一用户画像数据中与第一imeiMD5关联同一个设备的目标imeiMD5,将第一imeiMD5和目标imeiMD5确定为同一双卡双待设备的两个imei所对应的imeiMD5并进行关联,从而达到数据聚合的目的,能够提高数据质量,提高信息推送的准确性和可靠性。
在上述分析的基础上,下面介绍本公开方法实施例。
图1是根据一示例性实施例示出的一种用户画像数据处理方法的流程图;该方法的执行主体可以为服务器;如图1所示,该方法包括以下步骤101-104:
在步骤101中,根据预先确定的至少两个TAC,批量生成基于各TAC的imei。
示例的,对于市面上的设备,由于前十大品牌占据了新增设备量的绝大多数份额,因此通过有效清洗前十大品牌的设备所对应的数据,即可大幅度提高数据质量。由于数据采集的时候通常也会采集设备的机型,因此可以在第一用户画像数据中通过imeiMd5找到关联的机型、品牌等信息。同时,IMEI是由TAC、SNR、SP等组成,其中TAC为前8位数字,可以唯一标识一类机型;SNR为后6位数字,可以标识生产顺序号;SP为预留备用。通过分析公开渠道获取的IMEI可以获知这些IMEI对应的TAC,进而获知市面杀青都有哪些TAC存在,将这些TAC作为预先确定的至少两个不同机型的TAC。根据这些TAC,批量生成基于各TAC的两个以上的imei。
在步骤102中,将各imei加密后与以设备标签为关键字第一用户画像数据中的imeiMD5进行匹配,建立各imei与第一用户画像数据中imeiMD5的映射关系。
示例的,在第一用户画像数据中搜索与各imei对应的第一imeiMD5。例如,将各imei分别加密得到分别与各imei对应的第二imeiMD5;将第二imeiMD5与第一用户画像数据中imeiMD5进行匹配;将第一用户画像数据中与第二imeiMD5匹配的imeiMD5,确定为第一用户画像数据中与各imei对应的第一imeiMD5;建立各imei与第一imeiMD5的映射关系。
示例的,在将各imei加密后与以设备标签为关键字第一用户画像数据中的imeiMD5进行匹配之前,获取以用户标识为关键字的待处理用户画像数据;待处理用户画像数据包括用户标识及加密后的设备标识;将待处理用户画像数据的每个维度都单独拆分并重新聚合,生成以设备标签为关键字的第一用户画像数据;设备标签对应于具有相同值的加密后的设备标识。
示例的,待处理用户画像数据包括:新增的用户画像数据、及历史的用户画像数据。例如,可以每天将日志中新增的用户画像数据按照用户标识(UUID)为key存储起来,接着和历史的用户画像数据组合起来形成全部的以UUID为key的待处理用户画像,待处理用户画像数据包括UUID、imeiMd5、移动设备识别码(meid,Mobile Station EquipmentIdentifier)及macMd5。可选的,待处理用户画像数据还可以包括国际移动用户识别码(IMSI,International Mobile Subscriber Identification Number)。需要说明的是,处于用户隐私保护的原因,服务器不能直接采集设备的imei,只能采集加密的imei然后存储,例如imeiMd5。可选的,加密后的设备标识包括:imeiMD5、meidMD5、及MacMD5。
示例的,待处理用户画像数据的维度可以包括UUID、imeiMD5、meidMD5、及MacMD5。示例的,分别以各加密后的设备标识为关键字对待处理用户画像数据进行拆分并重新聚合;将上述拆分并重新聚合的步骤迭代执行两次,得到各加密后的设备标识各自对应的值;根据各加密后的设备标识各自对应的值,生成以设备标签为关键字的第一用户画像数据;设备标签对应于具有相同值的加密后的设备标识。经过三轮的打散及聚合处理之后,各加密后的设备标识都有了聚合之后的值,而设备标签与具有相同值的加密后的设备标识建立一对多的映射关系;从而通过将待处理用户画像数据拆分并重新聚合,迭代三次后生成以设备标签为关键字的第一用户画像数据。需要说明的是,通常双卡双待设备可能会有2个imeiMd5和1个meidMd5,因此,最多只需3轮聚合即可实现用户画像数据的数据存储形式的转变。
在步骤103中,搜索出第一用户画像数据中已关联单个imeiMD5的设备标签,单个imeiMD5记为第一imeiMD5。
在步骤104中,根据双卡双待设备的两个imei的SNR最后一位为连号关系的特性及映射关系,确定第一用户画像数据中与第一imeiMD5关联同一个设备的目标imeiMD5,并将目标imeiMD5与第一imeiMD5关联至同一个设备标签。
示例的,根据映射关系,确定各imei中与第一imeiMD5对应的第一imei、及与第一imei的SNR最后一位为连号关系的第二imei和第三imei;根据映射关系,确定第一用户画像数据中与第二imei和第三imei对应的第二imeiMD5和第三imeiMD5;确定第一用户画像数据中第一imeiMD5、第二imeiMD5和第三imeiMD5分别关联的第一用户标识、第二用户标识和第三用户标识;将第二用户标识和第三用户标识中与第一用户标识相同的用户标识所关联的imeiMD5确定为目标imeiMD5。目标imeiMD5与第一imeiMD5所对应的目标imei和第一imei的SNR最后一位为连号关系,即目标imei和第一imei为连号第一imei;将两个连号imei所对应的imeiMd5进行关联,关联至同一个设备标签。
本公开实施例提供的技术方案,根据批量生成的各imei与第一用户画像数据中imeiMD5的映射关系,利用双卡双待设备的两个imei的SNR最后一位为连号关系的特性,搜索到第一用户画像数据中与第一imeiMD5关联同一个设备的目标imeiMD5,将第一imeiMD5和目标imeiMD5确定为同一双卡双待设备的两个连号imei所对应的imeiMD5并进行关联,从而达到数据聚合的目的,能够提高数据质量,如此,能够提高信息推送的准确性和可靠性。
图2是根据一示例性实施例示出的一种用户画像数据处理方法的流程图。如图2所示,在图1所示实施例的基础上,本公开涉及的用户画像数据处理方法可以包括以下步骤201-207:
在步骤201中,根据预先确定的至少两个TAC,批量生成基于各TAC的imei。
在步骤202中,将各imei加密后与以设备标签为关键字第一用户画像数据中的imeiMD5进行匹配,建立各imei与第一用户画像数据中imeiMD5的映射关系。
在步骤203中,搜索出第一用户画像数据中已关联单个imeiMD5的设备标签,单个imeiMD5记为第一imeiMD5。
在步骤204中,根据双卡双待设备的两个imei的SNR最后一位为连号关系的特性及映射关系,确定第一用户画像数据中与第一imeiMD5关联同一个设备的目标imeiMD5,并将目标imeiMD5与第一imeiMD5关联至同一个设备标签。
在步骤205中,搜索出第一用户画像数据中已关联两个imeiMD5的设备标签。
在步骤206中,根据映射关系,确定各imei中与两个imeiMD5分别对应的两个imei。
示例的,针对第一用户画像数据中已经关联了两个imeiMD5的设备标签,若各imei中与上述两个imeiMD5分别对应的两个imei的SNR最后一位是连号关系,则说明该关联了上述两个imeiMD5的设备标签的关联关系是正确的;若各imei中与上述两个imeiMD5分别对应的两个imei的SNR最后一位不是连号关系,则说明该关联了上述两个imeiMD5的设备标签的关联关系是错误的,上述两个imeiMD5并不能聚合成一个deviceID,需要将设备标签作为脏数据进行清洗处理,将脏数据从第一用户画像数据中过滤。
在步骤207中,当两个imei的SNR最后一位不是连号关系时,将两个imeiMD5确定为脏数据;将脏数据从第一用户画像数据中过滤,得到第二用户画像数据。
本公开实施例提供的技术方案,通过对于已经关联两个imeiMD5的设备标签进行分析,若各imei中与上述两个imeiMD5分别对应的两个imei的SNR最后一位不是连号关系,则说明该关联了上述两个imeiMD5的设备标签的关联关系是错误的,上述两个imeiMD5并不能聚合成一个deviceID,需要将设备标签作为脏数据进行清洗处理,将脏数据从第一用户画像数据中过滤,提高数据质量,提高信息推送的准确性和可靠性。
图3是根据一示例性实施例示出的一种用户画像数据处理方法的流程图。如图3所示,在图1所示实施例的基础上,本公开涉及的用户画像数据处理方法可以包括以下步骤301-308:
在步骤301中,根据预先确定的至少两个TAC,批量生成基于各TAC的imei。
在步骤302中,将各imei加密后与以设备标签为关键字第一用户画像数据中的imeiMD5进行匹配,建立各imei与第一用户画像数据中imeiMD5的映射关系。
在步骤303中,搜索出第一用户画像数据中已关联单个imeiMD5的设备标签,单个imeiMD5记为第一imeiMD5。
在步骤304中,根据映射关系,确定各imei中与第一imeiMD5对应的第一imei、及与第一imei的SNR最后一位为连号关系的第二imei和第三imei。
在步骤305中,根据映射关系,确定第一用户画像数据中与第二imei和第三imei对应的第二imeiMD5和第三imeiMD5。
在步骤306中,确定第一用户画像数据中第一imeiMD5、第二imeiMD5和第三imeiMD5分别关联的第一用户标识、第二用户标识和第三用户标识。
在步骤307中,将第二用户标识和第三用户标识中与第一用户标识相同的用户标识所关联的imeiMD5确定为目标imeiMD5。
在步骤308中,将目标imeiMD5与第一imeiMD5关联至同一个设备标签。
示例的,为了将第一用户画像数据中属于同一双卡双待设备的两个imei所对应的imeiMD5尽可能地关联,可以迭代执行步骤303至步骤308的方案,例如将步骤303至步骤308的方案迭代执行15轮。
至此优化后的设备标签新增了一些imeiMd5、UUID以及macMd5的映射关系,再将这些映射打散,以imeiMd5和macMd5为key重新进行3轮迭代,生成最新的设备标签。
本公开实施例提供的技术方案,根据双卡双待设备的两个imei的SNR最后一位为连号关系的特性,搜索第一用户画像数据中与第一imeiMD5关联同一个设备的目标imeiMD5,将第一imeiMD5和目标imeiMD5进行关联,以达到数据聚合的目的,能够提高数据质量,如此,能够提高信息推送的准确性和可靠性。
下述为本公开装置实施例,可以用于执行本公开方法实施例。
图4是根据一示例性实施例示出的一种用户画像数据处理装置的框图;该装置可以采用各种方式来实施,例如在服务器中实施装置的全部组件,或者,在服务器侧以耦合的方式实施装置中的组件;该装置可以通过软件、硬件或者两者的结合实现上述本公开涉及的方法;
如图4所示,该用户画像数据处理装置包括:第一生成模块401、映射模块402、第一搜索模块403及关联模块404,其中:
第一生成模块401被配置为根据预先确定的至少两个TAC,批量生成基于各TAC的imei;
映射模块402被配置为将各imei加密后与以设备标签为关键字第一用户画像数据中的imeiMD5进行匹配,建立各imei与第一用户画像数据中imeiMD5的映射关系;
第一搜索模块403被配置为搜索出第一用户画像数据中已关联单个imeiMD5的设备标签,单个imeiMD5记为第一imeiMD5;
关联模块404被配置为根据双卡双待设备的两个imei的SNR最后一位为连号关系的特性及映射关系,确定第一用户画像数据中与第一imeiMD5关联同一个设备的目标imeiMD5,并将目标imeiMD5与第一imeiMD5关联至同一个设备标签。
本公开实施例提供的装置能够用于执行图1所示实施例的技术方案,其执行方式和有益效果类似,此处不再赘述。
在一种可能的实施方式中,如图5所示,图4示出的用户画像数据处理装置还可以包括把关联模块404配置成包括:第一确定子模块501、第二确定子模块502、第三确定子模块503及第四确定子模块504,其中:
第一确定子模块501被配置为根据映射关系,确定各imei中与第一imeiMD5对应的第一imei、及与第一imei的SNR最后一位为连号关系的第二imei和第三imei;
第二确定子模块502被配置为根据映射关系,确定第一用户画像数据中与第二imei和第三imei对应的第二imeiMD5和第三imeiMD5;
第三确定子模块503被配置为确定第一用户画像数据中第一imeiMD5、第二imeiMD5和第三imeiMD5分别关联的第一用户标识、第二用户标识和第三用户标识;
第四确定子模块504被配置为将第二用户标识和第三用户标识中与第一用户标识相同的用户标识所关联的imeiMD5确定为目标imeiMD5。
在一种可能的实施方式中,如图6所示,图4示出的用户画像数据处理装置还可以包括:第二搜索模块601、确定模块602及过滤模块603,其中:
第二搜索模块601被配置为搜索出第一用户画像数据中已关联两个imeiMD5的设备标签;
确定模块602被配置为根据映射关系,确定各imei中与两个imeiMD5分别对应的两个imei;
过滤模块603被配置为当两个imei的SNR最后一位不是连号关系时,将两个imeiMD5确定为脏数据,及将脏数据从第一用户画像数据中过滤,得到第二用户画像数据。
在一种可能的实施方式中,如图7所示,图4示出的用户画像数据处理装置还可以包括:获取模块701及第二生成模块702,其中:
获取模块701被配置为获取以用户标识为关键字的待处理用户画像数据;待处理用户画像数据包括用户标识及加密后的设备标识;
第二生成模块702被配置为将待处理用户画像数据的每个维度都单独拆分并重新聚合,生成以设备标签为关键字的第一用户画像数据;设备标签对应于具有相同值的加密后的设备标识。
图8是根据一示例性实施例示出的一种用户画像数据处理装置800的框图,用户画像数据处理装置800适用于服务器,用户画像数据处理装置800包括:
处理器801;
用于存储处理器可执行指令的存储器802;
其中,处理器801被配置为:
根据预先确定的至少两个TAC,批量生成基于各TAC的imei;
将各imei加密后与以设备标签为关键字第一用户画像数据中的imeiMD5进行匹配,建立各imei与第一用户画像数据中imeiMD5的映射关系;
搜索出第一用户画像数据中已关联单个imeiMD5的设备标签,单个imeiMD5记为第一imeiMD5;
根据双卡双待设备的两个imei的SNR最后一位为连号关系的特性及映射关系,确定第一用户画像数据中与第一imeiMD5关联同一个设备的目标imeiMD5,并将目标imeiMD5与第一imeiMD5关联至同一个设备标签。
在一个实施例中,上述处理器801还可被配置为:
根据映射关系,确定各imei中与第一imeiMD5对应的第一imei、及与第一imei的SNR最后一位为连号关系的第二imei和第三imei;
根据映射关系,确定第一用户画像数据中与第二imei和第三imei对应的第二imeiMD5和第三imeiMD5;
确定第一用户画像数据中第一imeiMD5、第二imeiMD5和第三imeiMD5分别关联的第一用户标识、第二用户标识和第三用户标识;
将第二用户标识和第三用户标识中与第一用户标识相同的用户标识所关联的imeiMD5确定为目标imeiMD5。
在一个实施例中,上述处理器801还可被配置为:
搜索出第一用户画像数据中已关联两个imeiMD5的设备标签;
根据映射关系,确定各imei中与两个imeiMD5分别对应的两个imei;
当两个imei的SNR最后一位不是连号关系时,将两个imeiMD5确定为脏数据;
将脏数据从第一用户画像数据中过滤,得到第二用户画像数据。
在一个实施例中,上述处理器801还可被配置为:
获取以用户标识为关键字的待处理用户画像数据;待处理用户画像数据包括用户标识及加密后的设备标识;
将待处理用户画像数据的每个维度都单独拆分并重新聚合,生成以设备标签为关键字的第一用户画像数据;设备标签对应于具有相同值的加密后的设备标识。
在一个实施例中,加密后的设备标识,包括:imeiMD5、加密后的移动设备识别码meid MD5、及MacMD5。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图9是根据一示例性实施例示出的一种装置的框图。例如,装置900可以被提供为一服务器。装置900包括处理组件902,其进一步包括一个或多个处理器,以及由存储器903所代表的存储器资源,用于存储可由处理组件902的执行的指令,例如应用程序。存储器903中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件902被配置为执行指令,以执行上述方法。
装置900还可以包括一个电源组件906被配置为执行装置900的电源管理,一个有线或无线网络接口905被配置为将装置900连接到网络,和一个输入输出(I/O)接口908。装置900可以操作基于存储在存储器903的操作系统,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
一种非临时性计算机可读存储介质,当存储介质中的指令由装置900的处理器执行时,使得装置900能够执行如下方法:
根据预先确定的至少两个TAC,批量生成基于各TAC的imei;
将各imei加密后与以设备标签为关键字第一用户画像数据中的imeiMD5进行匹配,建立各imei与第一用户画像数据中imeiMD5的映射关系;
搜索出第一用户画像数据中已关联单个imeiMD5的设备标签,单个imeiMD5记为第一imeiMD5;
根据双卡双待设备的两个imei的SNR最后一位为连号关系的特性及映射关系,确定第一用户画像数据中与第一imeiMD5关联同一个设备的目标imeiMD5,并将目标imeiMD5与第一imeiMD5关联至同一个设备标签。
在一个实施例中,根据双卡双待设备的两个imei的SNR最后一位为连号关系的特性及映射关系,确定第一用户画像数据中与第一imeiMD5关联同一个设备的目标imeiMD5,包括:
根据映射关系,确定各imei中与第一imeiMD5对应的第一imei、及与第一imei的SNR最后一位为连号关系的第二imei和第三imei;
根据映射关系,确定第一用户画像数据中与第二imei和第三imei对应的第二imeiMD5和第三imeiMD5;
确定第一用户画像数据中第一imeiMD5、第二imeiMD5和第三imeiMD5分别关联的第一用户标识、第二用户标识和第三用户标识;
将第二用户标识和第三用户标识中与第一用户标识相同的用户标识所关联的imeiMD5确定为目标imeiMD5。
在一个实施例中,方法还包括:
搜索出第一用户画像数据中已关联两个imeiMD5的设备标签;
根据映射关系,确定各imei中与两个imeiMD5分别对应的两个imei;
当两个imei的SNR最后一位不是连号关系时,将两个imeiMD5确定为脏数据;
将脏数据从第一用户画像数据中过滤,得到第二用户画像数据。
在一个实施例中,在将各imei加密后与以设备标签为关键字第一用户画像数据中的imeiMD5进行匹配之前,方法还包括:
获取以用户标识为关键字的待处理用户画像数据;待处理用户画像数据包括用户标识及加密后的设备标识;
将待处理用户画像数据的每个维度都单独拆分并重新聚合,生成以设备标签为关键字的第一用户画像数据;设备标签对应于具有相同值的加密后的设备标识。
在一个实施例中,加密后的设备标识,包括:imeiMD5、meid MD5、及MacMD5。
本领域技术人员在考虑说明书及实践这里公开的公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (11)

1.一种用户画像数据处理方法,其特征在于,包括:
根据预先确定的至少两个型号核准号码TAC,批量生成基于各所述TAC的国际移动设备识别码imei;
将各所述imei加密后与以设备标签为关键字第一用户画像数据中的国际移动设备识别码信息-摘要算法5imeiMD5进行匹配,建立各所述imei与所述第一用户画像数据中imeiMD5的映射关系;
搜索出所述第一用户画像数据中已关联单个imeiMD5的设备标签,所述单个imeiMD5记为第一imeiMD5;
根据双卡双待设备的两个imei的生产顺序号SNR最后一位为连号关系的特性及所述映射关系,确定所述第一用户画像数据中与所述第一imeiMD5关联同一个设备的目标imeiMD5,并将所述目标imeiMD5与所述第一imeiMD5关联至同一个设备标签。
2.根据权利要求1所述的方法,其特征在于,所述根据双卡双待设备的两个imei的SNR最后一位为连号关系的特性及所述映射关系,确定所述第一用户画像数据中与所述第一imeiMD5关联同一个设备的目标imeiMD5,包括:
根据所述映射关系,确定各所述imei中与所述第一imeiMD5对应的第一imei、及与所述第一imei的SNR最后一位为连号关系的第二imei和第三imei;
根据所述映射关系,确定所述第一用户画像数据中与所述第二imei和第三imei对应的第二imeiMD5和第三imeiMD5;
确定所述第一用户画像数据中所述第一imeiMD5、第二imeiMD5和第三imeiMD5分别关联的第一用户标识、第二用户标识和第三用户标识;
将所述第二用户标识和第三用户标识中与所述第一用户标识相同的用户标识所关联的imeiMD5确定为所述目标imeiMD5。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
搜索出所述第一用户画像数据中已关联两个imeiMD5的设备标签;
根据所述映射关系,确定各所述imei中与所述两个imeiMD5分别对应的两个imei;
当所述两个imei的SNR最后一位不是连号关系时,将所述两个imeiMD5确定为脏数据;
将所述脏数据从所述第一用户画像数据中过滤,得到第二用户画像数据。
4.根据权利要求1所述的方法,其特征在于,在所述将各imei加密后与以设备标签为关键字第一用户画像数据中的imeiMD5进行匹配之前,所述方法还包括:
获取以用户标识为关键字的待处理用户画像数据;所述待处理用户画像数据包括所述用户标识及加密后的设备标识;
将所述待处理用户画像数据的每个维度都单独拆分并重新聚合,生成以设备标签为关键字的所述第一用户画像数据;所述设备标签对应于具有相同值的加密后的设备标识。
5.根据权利要求4所述的方法,其特征在于,所述加密后的设备标识,包括:imeiMD5、加密后的移动设备识别码meid MD5、及MacMD5。
6.一种用户画像数据处理装置,其特征在于,包括:
第一生成模块,用于根据预先确定的至少两个型号核准号码TAC,批量生成基于各所述TAC的国际移动设备识别码imei;
映射模块,用于将各所述imei加密后与以设备标签为关键字第一用户画像数据中的国际移动设备识别码信息-摘要算法5imeiMD5进行匹配,建立各所述imei与所述第一用户画像数据中imeiMD5的映射关系;
第一搜索模块,用于搜索出所述第一用户画像数据中已关联单个imeiMD5的设备标签,所述单个imeiMD5记为第一imeiMD5;
关联模块,用于根据双卡双待设备的两个imei的生产顺序号SNR最后一位为连号关系的特性及所述映射关系,确定所述第一用户画像数据中与所述第一imeiMD5关联同一个设备的目标imeiMD5,并将所述目标imeiMD5与所述第一imeiMD5关联至同一个设备标签。
7.根据权利要求6所述的装置,其特征在于,所述关联模块,包括:
第一确定子模块,用于根据所述映射关系,确定各所述imei中与所述第一imeiMD5对应的第一imei、及与所述第一imei的SNR最后一位为连号关系的第二imei和第三imei;
第二确定子模块,用于根据所述映射关系,确定所述第一用户画像数据中与所述第二imei和第三imei对应的第二imeiMD5和第三imeiMD5;
第三确定子模块,用于确定所述第一用户画像数据中所述第一imeiMD5、第二imeiMD5和第三imeiMD5分别关联的第一用户标识、第二用户标识和第三用户标识;
第四确定子模块,用于将所述第二用户标识和第三用户标识中与所述第一用户标识相同的用户标识所关联的imeiMD5确定为所述目标imeiMD5。
8.根据权利要求6所述的装置,其特征在于,所述装置还包括:
第二搜索模块,用于搜索出所述第一用户画像数据中已关联两个imeiMD5的设备标签;
确定模块,用于根据所述映射关系,确定各所述imei中与所述两个imeiMD5分别对应的两个imei;
过滤模块,用于当所述两个imei的SNR最后一位不是连号关系时,将所述两个imeiMD5确定为脏数据,及将所述脏数据从所述第一用户画像数据中过滤,得到第二用户画像数据。
9.根据权利要求6所述的装置,其特征在于,所述装置还包括:
获取模块,用于获取以用户标识为关键字的待处理用户画像数据;所述待处理用户画像数据包括所述用户标识及加密后的设备标识;
第二生成模块,用于将所述待处理用户画像数据的每个维度都单独拆分并重新聚合,生成以设备标签为关键字的所述第一用户画像数据;所述设备标签对应于具有相同值的加密后的设备标识。
10.一种用户画像数据处理装置,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
根据预先确定的至少两个型号核准号码TAC,批量生成基于各所述TAC的国际移动设备识别码imei;
将各所述imei加密后与以设备标签为关键字第一用户画像数据中的国际移动设备识别码信息-摘要算法5imeiMD5进行匹配,建立各所述imei与所述第一用户画像数据中imeiMD5的映射关系;
搜索出所述第一用户画像数据中已关联单个imeiMD5的设备标签,所述单个imeiMD5记为第一imeiMD5;
根据双卡双待设备的两个imei的生产顺序号SNR最后一位为连号关系的特性及所述映射关系,确定所述第一用户画像数据中与所述第一imeiMD5关联同一个设备的目标imeiMD5,并将所述目标imeiMD5与所述第一imeiMD5关联至同一个设备标签。
11.一种计算机可读存储介质,其上存储有计算机指令,其特征在于,该指令被处理器执行时实现权利要求1-5中任一项所述方法的步骤。
CN201811244682.5A 2018-10-24 2018-10-24 用户画像数据处理方法及装置 Active CN109257764B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811244682.5A CN109257764B (zh) 2018-10-24 2018-10-24 用户画像数据处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811244682.5A CN109257764B (zh) 2018-10-24 2018-10-24 用户画像数据处理方法及装置

Publications (2)

Publication Number Publication Date
CN109257764A true CN109257764A (zh) 2019-01-22
CN109257764B CN109257764B (zh) 2022-02-22

Family

ID=65045764

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811244682.5A Active CN109257764B (zh) 2018-10-24 2018-10-24 用户画像数据处理方法及装置

Country Status (1)

Country Link
CN (1) CN109257764B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110502538A (zh) * 2019-07-05 2019-11-26 中国平安人寿保险股份有限公司 画像标签生成逻辑映射的方法、系统、设备及存储介质
CN110888871A (zh) * 2019-10-12 2020-03-17 中国平安财产保险股份有限公司 基于嵌套对象的数据存储方法、装置及计算机设备
CN111177481A (zh) * 2019-12-30 2020-05-19 北京友信科技有限公司 用户标识映射方法及装置
WO2021081920A1 (zh) * 2019-10-31 2021-05-06 深圳市欢太科技有限公司 信息推送方法、装置、服务器及存储介质
CN114630314A (zh) * 2020-12-10 2022-06-14 中移(苏州)软件技术有限公司 终端信息库的更新方法、装置、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105657003A (zh) * 2015-12-28 2016-06-08 腾讯科技(深圳)有限公司 一种信息处理方法和服务器
CN106202117A (zh) * 2015-05-07 2016-12-07 深圳市腾讯计算机系统有限公司 数据处理方法、装置和服务器
US20170185670A1 (en) * 2015-12-28 2017-06-29 Google Inc. Generating labels for images associated with a user
CN107169094A (zh) * 2017-05-12 2017-09-15 北京小米移动软件有限公司 信息聚合方法及装置
CN107295067A (zh) * 2017-05-26 2017-10-24 北京京东尚科信息技术有限公司 跨屏识别用户的方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106202117A (zh) * 2015-05-07 2016-12-07 深圳市腾讯计算机系统有限公司 数据处理方法、装置和服务器
CN105657003A (zh) * 2015-12-28 2016-06-08 腾讯科技(深圳)有限公司 一种信息处理方法和服务器
US20170185670A1 (en) * 2015-12-28 2017-06-29 Google Inc. Generating labels for images associated with a user
CN107169094A (zh) * 2017-05-12 2017-09-15 北京小米移动软件有限公司 信息聚合方法及装置
CN107295067A (zh) * 2017-05-26 2017-10-24 北京京东尚科信息技术有限公司 跨屏识别用户的方法和装置

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110502538A (zh) * 2019-07-05 2019-11-26 中国平安人寿保险股份有限公司 画像标签生成逻辑映射的方法、系统、设备及存储介质
CN110502538B (zh) * 2019-07-05 2023-10-13 中国平安人寿保险股份有限公司 画像标签生成逻辑映射的方法、系统、设备及存储介质
CN110888871A (zh) * 2019-10-12 2020-03-17 中国平安财产保险股份有限公司 基于嵌套对象的数据存储方法、装置及计算机设备
CN110888871B (zh) * 2019-10-12 2023-09-19 中国平安财产保险股份有限公司 基于嵌套对象的数据存储方法、装置及计算机设备
WO2021081920A1 (zh) * 2019-10-31 2021-05-06 深圳市欢太科技有限公司 信息推送方法、装置、服务器及存储介质
CN114208135A (zh) * 2019-10-31 2022-03-18 深圳市欢太科技有限公司 信息推送方法、装置、服务器及存储介质
CN114208135B (zh) * 2019-10-31 2023-08-29 深圳市欢太科技有限公司 信息推送方法、装置、服务器及存储介质
CN111177481A (zh) * 2019-12-30 2020-05-19 北京友信科技有限公司 用户标识映射方法及装置
CN111177481B (zh) * 2019-12-30 2023-12-19 北京友信科技有限公司 用户标识映射方法及装置
CN114630314A (zh) * 2020-12-10 2022-06-14 中移(苏州)软件技术有限公司 终端信息库的更新方法、装置、设备及存储介质
CN114630314B (zh) * 2020-12-10 2023-09-05 中移(苏州)软件技术有限公司 终端信息库的更新方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN109257764B (zh) 2022-02-22

Similar Documents

Publication Publication Date Title
CN109257764A (zh) 用户画像数据处理方法及装置
CN105100032B (zh) 一种防止资源盗取的方法及装置
CN107169094B (zh) 信息聚合方法及装置
CN105187392A (zh) 基于网络接入点的移动终端恶意软件检测方法及其系统
CN106251114B (zh) 应用中实现审批的方法和装置
CN110224859B (zh) 用于识别团伙的方法和系统
CN112532605B (zh) 一种网络攻击溯源方法及系统、存储介质、电子设备
CN111177481B (zh) 用户标识映射方法及装置
CN111478986A (zh) 设备指纹的生成方法、装置、设备及存储介质
WO2018010480A1 (zh) eSIM卡锁网方法、终端及锁网认证服务器
US11770458B1 (en) Systems for exchanging data using intermediate devices
US11838311B2 (en) Systems and methods for automated quantitative risk and threat calculation and remediation
CN111353136B (zh) 一种操作请求的处理方法和装置
KR20180089479A (ko) 사용자 데이터 공유 방법 및 디바이스
CN110362585B (zh) 数据分析方法、装置,存储介质及电子设备
CN113709740A (zh) 一种在授权登录页面显示账号信息的方法及系统
CN116567609A (zh) 用户信息关联回填方法、装置、设备及存储介质
CN108540471B (zh) 移动应用网络流量聚类方法、计算机可读存储介质和终端
CN115865739A (zh) 一种网络资产探测方法、装置、电子设备及存储介质
CN113254989B (zh) 目标数据的融合方法、装置和服务器
CN110489568B (zh) 生成事件图的方法、装置、存储介质和电子设备
US11128540B1 (en) Augmented reality electronic equipment maintenance user interface
CN106341861B (zh) 一种识别无线接入点的方法、服务器及系统
CN114567678A (zh) 一种云安全服务的资源调用方法、装置及电子设备
CN109299084B (zh) 用户画像数据过滤方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant