CN110929173A - 同人识别方法、装置、设备及介质 - Google Patents

同人识别方法、装置、设备及介质 Download PDF

Info

Publication number
CN110929173A
CN110929173A CN201911235559.1A CN201911235559A CN110929173A CN 110929173 A CN110929173 A CN 110929173A CN 201911235559 A CN201911235559 A CN 201911235559A CN 110929173 A CN110929173 A CN 110929173A
Authority
CN
China
Prior art keywords
relation
chain
unique user
target
user identification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911235559.1A
Other languages
English (en)
Inventor
邹楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WeBank Co Ltd
Original Assignee
WeBank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WeBank Co Ltd filed Critical WeBank Co Ltd
Priority to CN201911235559.1A priority Critical patent/CN110929173A/zh
Publication of CN110929173A publication Critical patent/CN110929173A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/254Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种同人识别方法、装置、设备及介质,涉及金融科技(Fintech)技术领域,该方法包括:在接收到同人识别指令时,获取对应的目标ID对数据;根据所述目标ID对数据确定是否能从预设识别工具中获取对应目标用户的唯一用户识别号;其中,在所述预设识别工具中,根据多个ID关系链生成对应多个唯一用户识别号,根据从同一用户对应ID对数据中提取的ID对之间的关联关系加工生成所述ID关系链;若能从预设识别工具中获取所述同人识别指令对应目标用户的唯一用户识别号,则确定所述唯一用户识别号对应的用户与所述目标用户为同一个人。本发明解决现有同人识别过程中识别复杂,识别可扩展性弱的技术问题。

Description

同人识别方法、装置、设备及介质
技术领域
本发明涉及金融科技(Fintech)技术领域,尤其涉及一种同人识别方法、装置、设备及介质。
背景技术
随着计算机技术的发展,越来越多的技术应用在金融领域,传统金融业正在逐步向金融科技(Fintech)转变,同人识别技术也不例外,但由于金融行业的安全性、实时性要求,也对技术提出的更高的要求。
目前,各银行等金融机构常常需要进行同人识别,以针对通过不同账号进行阅读的用户进行针对性推荐等,现有技术中,采用机器学习方式即根据用户行为特征等数据判断,或者采用图计算的方式打通用户之间的ID数据等判断,以确定通过不同账号进行阅读的用户是否为同人,其中,采用图计算的方式计算过程复杂,可扩展性弱,且干扰数据对计算结果影响明显,而采用机器学习的方式需要采集用户行为特征等数据,再进行学习训练,过程繁琐,实现方式复杂,门槛高,也即现有同人识别过程中,存在识别成本高、过程复杂,可扩展性弱等技术问题,后续无法实现高效、低成本的信息推荐。
发明内容
本发明的主要目的在于提供一种同人识别方法、装置、设备及介质,旨在解决现有同人识别过程中识别成本高、识别复杂,识别可扩展性弱的技术问题。
为实现上述目的,本发明实施例提供一种同人识别方法,所述同人识别方法包括:
在接收到同人识别指令时,获取所述同人识别指令对应的目标ID对数据;
根据所述目标ID对数据确定是否能从预设识别工具中获取所述同人识别指令对应目标用户的唯一用户识别号;
其中,在所述预设识别工具中,根据多个ID关系链生成对应多个唯一用户识别号,根据从同一用户对应ID对数据中提取的ID对之间的关联关系加工生成所述ID关系链;
若能从预设识别工具中获取所述同人识别指令对应目标用户的唯一用户识别号,则确定所述唯一用户识别号对应的用户与所述目标用户为同一个人。
可选地,所述根据从同一用户对应ID对数据中提取的ID对之间的关联关系加工生成所述ID关系链步骤包括:
每间隔预设时间段获取同一用户对应ID对数据,根据预设的正则校验规则对所述ID对数据进行数据清洗,得到清洗ID对数据;
获取预设的各个ID的优先级顺序;
根据所述优先级顺序,对所述清洗ID对数据中多个ID对以共同ID为间接关联做关系补充加工,以生成多元ID关系;
根据所述多元ID关系对所述清洗ID对数据中各个ID对继续做关系补充加工,直到各个ID对以及ID都在加工中被使用,以生成所述清洗ID对数据中不同ID组成的长短不一的ID关系链。
可选地,所述获取预设的各个ID的优先级顺序步骤之后包括:
根据所述优先级顺序,获取优先级最高的ID的第一map链,以得到第一类ID关系链,其中,任一ID的map链为以该ID为优先级最高并以该ID为起始对应形成的多元ID关系;
根据所述优先级顺序,持续获取其他优先级次序ID的第二map链,并为所述第二map链寻找优先级高于所述其他优先级次序ID的ID,以得到第二类ID关系链;
根据所述第一类ID关系链以及所述第二类ID关系链,将所述清洗ID对数据的所有ID关系对加工成ID关系链。
可选地,所述根据所述第一类ID关系链以及所述第二类ID关系链,将所述清洗ID对数据的所有ID关系对加工成ID关系链步骤之后包括:
获取每一条ID关系链中优先级最高的ID,设所述优先级最高的ID为种子,对所述种子使用预设加密函数加密,以对应生成所述ID关系链中唯一标识UID;
根据优先级最低ID在不同的ID关系链中时,对应ID关系链的唯一标识UID的等级,以及所述优先级最低ID在不同的ID关系链中的出现时间以及出现次数,确定在不同的ID关系链中的所述优先级最低ID对应的最终UID;
获取所述优先级最低ID外的其他各个ID的最终UID,将所有ID关联起来,组成最终的ID关系链。
可选地,所述唯一用户识别号包括最新的唯一用户识别号,在所述预设识别工具中包括多个历史唯一用户识别号,所述根据多个ID关系链生成对应多个唯一用户识别号步骤包括:
根据任一ID关系链上各个ID的优先级,有序确定该ID关系链上各个ID能否从所述多个历史唯一用户识别号中寻找已关联的目标历史唯一用户识别号;
若确定该ID关系链上各个ID都不能从所述多个历史唯一用户识别号中寻找已关联的目标历史唯一用户识别号,则根据预设的生成规则生成最新的唯一用户识别号,以得到所述多个ID关系链对应的多个最新的唯一用户识别号。
可选地,所述根据任一ID关系链上各个ID的优先级,有序确定该ID关系链上各个ID能否从所述多个历史唯一用户识别号中寻找已关联的目标历史唯一用户识别号步骤之后包括:
若确定该ID关系链上各个ID有从所述多个历史唯一用户识别号中寻找已关联的目标历史唯一用户识别号,获取所述目标历史唯一用户识别号关联的目标ID;
获取所述目标ID的优先级,以及所述目标ID关联的目标历史唯一用户识别号中关联的各个ID的优先级,以及所述ID关系链上各个ID的优先级,根据所述目标ID的优先级,以及所述目标ID关联的目标历史唯一用户识别号中关联的各个ID的优先级,以及所述ID关系链上各个ID的优先级,确定对应ID关系链的最新的唯一用户识别号。
可选地,所述若确定该ID关系链上各个ID有从所述多个历史唯一用户识别号中寻找已关联的目标历史唯一用户识别号,获取所述目标历史唯一用户识别号关联的目标ID步骤之后包括:
根据ID关系链上出现的各个ID对所述ID关系链进行预设编码,得到第一编码号;
对所述历史唯一用户识别号所对应的ID关系链进行预设编码,得到第二编码号;
加和处理所述第一编码号与所述第二编码号,得到编码链;
获取比所述目标ID优先级高的其他ID的编码位;
若所述比所述目标ID优先级高的其他ID的编码位大于等于编码链上对应编码数值时,确定对应多个唯一用户识别号。
本发明还提供一种同人识别装置,所述同人识别装置包括:
第一获取模块,用于在接收到同人识别指令时,获取所述同人识别指令对应的目标ID对数据;
第一确定模块,用于根据所述目标ID对数据确定是否能从预设识别工具中获取所述同人识别指令对应目标用户的唯一用户识别号;
其中,在所述预设识别工具中,根据多个ID关系链生成对应多个唯一用户识别号,根据从同一用户对应ID对数据中提取的ID对之间的关联关系加工生成所述ID关系链;
第二确定模块,用于若能从预设识别工具中获取所述同人识别指令对应目标用户的唯一用户识别号,则确定所述唯一用户识别号对应的用户与所述目标用户为同一个人。
可选地,所述第一确定模块包括:
第一获取单元,用于每间隔预设时间段获取同一用户对应ID对数据,根据预设的正则校验规则对所述ID对数据进行数据清洗,得到清洗ID对数据;
第二获取单元,用于获取预设的各个ID的优先级顺序;
第一关系补充单元,用于根据所述优先级顺序,对所述清洗ID对数据中多个ID对以共同ID为间接关联做关系补充加工,以生成多元ID关系;
第二关系补充单元,用于根据所述多元ID关系对所述清洗ID对数据中各个ID对继续做关系补充加工,直到各个ID对以及ID都在加工中被使用,以生成所述清洗ID对数据中不同ID组成的长短不一的ID关系链。
可选地,所述同人识别装置还包括:
第二获取模块,用于根据所述优先级顺序,获取优先级最高的ID的第一map链,以得到第一类ID关系链,其中,任一ID的map链为以该ID为优先级最高并以该ID为起始对应形成的多元ID关系;
第三获取模块,用于根据所述优先级顺序,持续获取其他优先级次序ID的第二map链,并为所述第二map链寻找优先级高于所述其他优先级次序ID的ID,以得到第二类ID关系链;
加工模块,用于根据所述第一类ID关系链以及所述第二类ID关系链,将所述清洗ID对数据的所有ID关系对加工成ID关系链。
可选地,所述同人识别装置还包括:
第四获取模块,用于获取每一条ID关系链中优先级最高的ID,设所述优先级最高的ID为种子,对所述种子使用预设加密函数加密,以对应生成所述ID关系链中唯一标识UID;
第三确定模块,用于根据优先级最低ID在不同的ID关系链中时,对应ID关系链的唯一标识UID的等级,以及所述优先级最低ID在不同的ID关系链中的出现时间以及出现次数,确定在不同的ID关系链中的所述优先级最低ID对应的最终UID;
第五获取模块,用于获取所述优先级最低ID外的其他各个ID的最终UID,将所有ID关联起来,组成最终的ID关系链。
可选地,所述唯一用户识别号包括最新的唯一用户识别号,在所述预设识别工具中包括多个历史唯一用户识别号,所述第一确定模块包括:
第一确定单元,用于根据任一ID关系链上各个ID的优先级,有序确定该ID关系链上各个ID能否从所述多个历史唯一用户识别号中寻找已关联的目标历史唯一用户识别号;
第二确定单元,用于若确定该ID关系链上各个ID都不能从所述多个历史唯一用户识别号中寻找已关联的目标历史唯一用户识别号,则根据预设的生成规则生成最新的唯一用户识别号,以得到所述多个ID关系链对应的多个最新的唯一用户识别号。
可选地,所述同人识别装置还包括:
第六获取模块,用于若确定该ID关系链上各个ID有从所述多个历史唯一用户识别号中寻找已关联的目标历史唯一用户识别号,获取所述目标历史唯一用户识别号关联的目标ID;
第七获取模块,用于获取所述目标ID的优先级,以及所述目标ID关联的目标历史唯一用户识别号中关联的各个ID的优先级,以及所述ID关系链上各个ID的优先级,根据所述目标ID的优先级,以及所述目标ID关联的目标历史唯一用户识别号中关联的各个ID的优先级,以及所述ID关系链上各个ID的优先级,确定对应ID关系链的最新的唯一用户识别号。
可选地,所述同人识别装置还包括:
第一编码模块,用于根据ID关系链上出现的各个ID对所述ID关系链进行预设编码,得到第一编码号;
第二编码模块,用于对所述历史唯一用户识别号所对应的ID关系链进行预设编码,得到第二编码号;
加和模块,用于加和处理所述第一编码号与所述第二编码号,得到编码链;
第八获取模块,用于获取比所述目标ID优先级高的其他ID的编码位;
第四确定模块,用于若所述比所述目标ID优先级高的其他ID的编码位大于等于编码链上对应编码数值时,确定对应多个唯一用户识别号。
本发明还提供一种介质,所述介质上存储有同人识别程序,所述同人识别程序被处理器执行时实现如上述的同人识别方法的步骤。
本发明在接收到同人识别指令时,首先获取所述同人识别指令对应的目标ID对数据;根据所述目标ID对数据确定是否能从预设识别工具中获取所述同人识别指令对应目标用户的唯一用户识别号,若能从预设识别工具中获取所述同人识别指令对应目标用户的唯一用户识别号,则确定所述唯一用户识别号对应的用户与所述目标用户为同一个人,即是在本申请中,只要确定同人识别指令中的目标ID对数据与目标用户的唯一用户识别号是否一致即可进行同人识别,同人识别过程简单,且目标ID对数据不做限定,即ID对数据是可扩展的,因而,本申请同人识别过程可扩展性强,而只要确定同人识别指令中的目标ID对数据与目标用户的唯一用户识别号是否一致即可进行同人识别是因为:根据多个ID关系链生成对应多个唯一用户识别号,即对每个用户对设置有唯一用户识别号,且在所述预设识别工具中,所述ID关系链是根据从同一用户对应ID对数据中提取的ID对之间的关联关系加工生成的,即是本申请的预设识别工具中,已经是获取用户ID对之间的关联关系进行加工生成ID关系链,或者是已经将之前获取ID对数据进行抽取转换加载生成ID关系链,以确保同一用户的不同ID使用同一唯一用户识别号,即已经通过唯一用户识别号将各个ID关联起来而不是割裂开来,因而,若能从预设识别工具中获取所述同人识别指令对应目标用户的唯一用户识别号,则确定所述唯一用户识别号对应的用户与所述目标用户为同一个人。相对图计算方式和机器学习方式,本发明降低了识别成本,同人识别过程中更为简单,可扩展性性强,以便于后续实现高效、低成本的信息推荐。
附图说明
图1为本发明同人识别方法第一实施例的流程示意图;
图2为本发明同人识别方法第二实施例中基于所述全部文件内容得到待处理节点步骤的细化流程示意图;
图3是本发明实施例方法涉及的硬件运行环境的设备结构示意图。
图4为本发明同人识别方法中的第一场景示意图;
图5为本发明同人识别方法中的第二场景示意图;
图6为本发明同人识别方法中的第三场景示意图;
图7为本发明同人识别方法中的第四场景示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供一种同人识别方法,在同人识别方法一实施例中,参照图1,所述同人识别方法包括:
步骤S10,在接收到同人识别指令时,获取所述同人识别指令对应的目标ID对数据;
步骤S20,根据所述目标ID对数据确定是否能从预设识别工具中获取所述同人识别指令对应目标用户的唯一用户识别号;
其中,在所述预设识别工具中,根据多个ID关系链生成对应多个唯一用户识别号,根据从同一用户对应ID对数据中提取的ID对之间的关联关系加工生成所述ID关系链;
步骤S30,若能从预设识别工具中获取所述同人识别指令对应目标用户的唯一用户识别号,则确定所述唯一用户识别号对应的用户与所述目标用户为同一个人。
具体步骤如下:
步骤S10,在接收到同人识别指令时,获取所述同人识别指令对应的目标ID对数据;
需要说明的是,在本实施例中,同人识别方法应用于同人识别系统,该同人识别系统从属于同人识别设备,在该同人识别系统中,每次检测到用户登录或者是进入时,即是触发同人识别指令,同人识别系统在触发并接收同人识别指令时,获取所述同人识别指令对应的目标ID对数据(一般形式)或者目标ID数据,其中,在得到目标ID数据,根据映射关系对应生成目标ID对数据,具体地,通过采用Hive(一种分布式大数据仓库)-ETL(extract-Transform-Load,数据的抽取转换加载)的方式加工处理不同ID之间的映射关系,Hive-ETL具体是通过将不同ID数据转换加载(如将不同ID数据都通过电话号码进行转换加载)进而得到不同ID之间的映射关系,在本实施例中,ID对指的是包含两个ID的一组映射关系,而ID链指的是包含两个及以上ID的一组映射关系,将ID对可以加工成为ID链,需要说明的是,ID对加工为ID链的方式可以使用手动编程或者使用图计算实现,但是实现方式复杂,出现错误后必须清洗数据并从头开始重新计算,比较费时,而在本实施例中,中间过程是使用Hive-ETL的方式一步一步拆解,若中间过程出现错误,可以从出错的地方开始继续任务,因而,提升了扩展性,另外,在本实施例中,新增用户ID时,还可以在ID对加工为ID链过程中实现。
获取所述同人识别指令对应的目标ID对数据,即是在接收到同人识别指令时,从同人识别指令中获取所述同人识别指令对应的目标ID对数据,或者从同人识别指令所指向的大数据系统中或者大数据仓库中获取所述同人识别指令对应的目标ID对数据,该目标ID对数据可以是由预设常规ID构成的ID对数据,预设常规ID(可以简称为常规ID)包括客户号(ecifno)、身份证号(idno)、电话号码(telephone)、微信ID(unionid)和设备号(imei/idfa),其中,微信ID(unionid)指的是微信识别ID,同一个微信开发平台帐号下的应用用户的unionid是唯一的,设备号(imei/idfa)指的是移动设备的唯一标识ID,其中,安卓设备的设备号为imei,IOS设备的设备号为idfa,预设常规ID之间可以加工补充ID间关联关系,例如ID对<idno:telephone>和ID对<telephone:unionid>通过中间IDtelephone关联就可以补充<idno:unionid>之间的关系,ID对<ecifno:unionid>和ID对<unionid:imei/idfa>通过unionid关联就可以补充<ecifno:imei/idfa>之间的关系,另外,该各个预设常规ID之间具有优先级,优先级顺序可以为:ecifno>idno>telephone>unionid>设备号(imei/idfa),当然,优先级顺序还可以为其他的,但是在本实施例中,以优先级顺序为ecifno>idno>telephone>unionid>设备号(imei/idfa)为例进行具体说明,需要说明的是,在本实施例中,该目标ID对数据还可以是非预设常规ID构成,即该目标ID对数据可以由扩展类ID构成,扩展类ID可包括QQ号、E-mail等,由于目标ID对数据还可以是非预设常规ID构成,在本实施例中,在检测到非预设常规ID时,可以加工该非预设常规ID与预设常规ID之间的映射关系,具体地,通过采用Hive(一种分布式大数据仓库)-ETL(extract-Transform-Load,数据的抽取转换加载)的方式加工处理非预设常规ID与预设常规ID之间的映射关系,即将非预设常规ID通过数据的抽取转换加载后,以实现用户ID的可扩展性。
步骤S20,根据所述目标ID对数据确定是否能从预设识别工具中获取所述同人识别指令对应目标用户的唯一用户识别号;
其中,在所述预设识别工具中,根据多个ID关系链生成对应多个唯一用户识别号,根据从同一用户对应ID对数据中提取的ID对之间的关联关系加工生成所述ID关系链;
根据所述目标ID对数据确定是否能从预设识别工具中获取所述同人识别指令对应目标用户的唯一用户识别号包括两种情况:确定能从预设识别工具中获取所述同人识别指令对应目标用户的唯一用户识别号,或者确定不能从预设识别工具中获取所述同人识别指令对应目标用户的唯一用户识别号,在不能的情况下,则生成所述同人识别指令对应的目标用户的唯一用户识别号,具体如何生成在后续说明。
其中,在所述预设识别工具中,根据多个ID关系链生成对应多个唯一用户识别号,根据从同一用户对应ID对数据中提取的ID对之间的关联关系加工生成所述ID关系链,即是在本实施例中,只要确定同人识别指令中的目标ID对数据与目标用户的唯一用户识别号是否一致即可进行同人识别,同人识别过程简单,且目标ID对数据是可随机扩展的且不需要改变系统的结果等,因而,本申请同人识别过程可扩展性强,而只要确定同人识别指令中的目标ID对数据与目标用户的唯一用户识别号是否一致即可进行同人识别是因为:根据多个ID关系链生成对应多个唯一用户识别号,即对每个用户对设置有唯一用户识别号,且在所述预设识别工具中,所述ID关系链是根据从同一用户对应ID对数据中提取的ID对之间的关联关系加工生成的,即是本实施例中的预设识别工具中,已经是获取用户ID对之间的关联关系进行加工生成ID关系链,或者是已经将之前获取ID对数据进行抽取转换加载生成ID关系链,以确保同一用户的不同ID使用同一唯一用户识别号,即已经通过唯一用户识别号将各个ID关联起来而不是割裂开来。
具体地,参照图2,所述根据从同一用户对应ID对数据中提取的ID对之间的关联关系加工生成所述ID关系链步骤包括:
步骤S21,每间隔预设时间段获取同一用户对应ID对数据,根据预设的正则校验规则对所述ID对数据进行数据清洗,得到清洗ID对数据;
在本实施例中,每间隔预设时间段获取同一用户对应ID对数据,即每间隔预设时间段基于从大数据库中获取的不同数据表中获取ID关系对(至少包含2个以上ID)数据,分别清洗过滤不符合编码规则或者预设正则校验规则的ID对,其中,编码规则或者校验规则可以包括字符长度规则以及字符组成规则,即是确定idno是否符合预设的第一字符长度规则以及第一字符组成规则,确定telphone是否符合预设的第二字符长度规则以及第二字符组成规则,确定unionid是否符合预设的第三字符长度规则以及第三字符组成规则,确定idfa是否符合预设的第四字符长度规则以及第四字符组成规则,确定imei是否符合预设的第五字符长度规则以及第五字符组成规则等,即根据预设的正则校验规则对所述ID对数据进行数据清洗,得到清洗ID对数据。
具体地,idno的正则校验规则为:
(^[1-9]\d{5}(18|19|([23]\d))\d{2}((0[1-9])|(10|11|12))(([0-2][1-9])|10|20|30|31)\d{3}[0-9Xx]$)|(^[1-9]\d{5}\d{2}((0[1-9])|(10|11|12))(([0-2][1-9])|10|20|30|31)\d{2}$)。
telphone的正则校验规则为:(^1(3|4|5|6|7|8|9)\d{9}$)。
unionid的正则校验规则为:([\\\x00-\\\xff]+),长度为28-29位。
idfa的正则校验规则为:长度为32-36位数字或字母。
imei的正则校验规则为:长度为15-18位纯数字。
具体地,例如,对telphone进行清洗,首先根据第二字符组成规则确定telphone是否全部为数字构成,若确定不是全部由数字构成,则对该telphone进行过滤处理,若确定全部由数字构成,继续根据第二字符组成规则确定telphone每位上的数字是否符合该规则,例如,确定telphone首位是否为1,若不确定telphone首位为1,则对该telphone进行过滤处理,若确定telphone首位为1,然后进行telphone其他位的识别处理,直至确定该telphone符合第二字符组成规则,不符合则进行过滤处理,在确定该telphone符合第二字符组成规则后,然后根据第二字符长度规则确定telphone的字符长度是否符合要求,若符合要求,则确定保留该telphone。
步骤S22,获取预设的各个ID的优先级顺序;
在得到清洗ID对数据后,获取预设的各个ID的优先级顺序,具体地,获取的优先级顺序为ecifno>idno>telephone>unionid>设备号(imei/idfa)。
步骤S23,根据所述优先级顺序,对所述清洗ID对数据中多个ID对以共同ID为间接关联做关系补充加工,以生成多元ID关系;
步骤S24,根据所述多元ID关系对所述清洗ID对数据中各个ID对继续做关系补充加工,直到各个ID对以及ID都在加工中被使用,以生成所述清洗ID对数据中不同ID组成的长短不一的ID关系链。
为充分利用ID之间的映射关系,将ID对加工为ID链,具体加工方式为:根据所述优先级顺序,对所述清洗ID对数据中多个ID对以共同ID为间接关联做关系补充加工,以生成多元ID关系,具体地,将ID对两两组合并利用每一个ID的做间接关联,例如ID对<ecifno,idno>与<idno,telephone>使用idno做间接关联就可以生成ID链<ecifno,idno,telephone>,根据所述多元ID关系对所述清洗ID对数据中各个ID对继续做关系补充加工,直到各个ID对以及ID都在加工中被使用,以生成所述清洗ID对数据中不同ID组成的长短不一的ID关系链,其中,即同时每两个ID对之间都需要间接关联一次,以此类推直到每一个ID对、ID都在关系链的加工中被使用,以生成所述清洗ID对数据中不同ID组成的长短不一的ID关系链。
例如对于得到的ID对数据是如下两类:
LINK1:<ecifno,idno,telephone,unionid,imei,idfa>
LINK2:<NULL,idno,telephone,unionid,imei,idfa>
同人识别设备首先是将LINK1与LINK2分别拆解成多个ID对:<ecifno:idno>、<ecifno:telephoe>、<idno:telephone>等,然后将ID对两两组合生成<ecifno:idno:telephone>、<ecifno:telephone:unionid等三元关系对,再使用三元关系对两两组合生成四元关系对,依次类推直至最终将所有ID组成ID链。
需要说明的是,上述得到ID关系链的过程中,关系对可能会被反复使用,例如,6类ID组成的ID对有15种,根据该15种ID对还需要继续生成对应的三元关系等,因而存在过程烦琐复杂且效率低的问题。
所述获取预设的各个ID的优先级顺序步骤之后包括:
步骤S25,根据所述优先级顺序,获取优先级最高的ID的第一map链,以得到第一类ID关系链,其中,任一ID的map链为以该ID为优先级最高并以该ID为起始对应形成的多元ID关系;
步骤S26,根据所述优先级顺序,持续获取其他优先级次序ID的第二map链,并为所述第二map链寻找优先级高于所述其他优先级次序ID的ID,以得到第二类ID关系链;
步骤S27,根据所述第一类ID关系链以及所述第二类ID关系链,将所述清洗ID对数据的所有ID关系对加工成ID关系链。
本实施例中,还提供另一种ID链的加工关联方式,以解决ID关系链生成过程中存在的过程烦琐复杂且效率低的问题,具体地,在本实施例中,在该ID链的加工关联方式中,不会将已有的ID关系链拆分成关系对即以关系对做关联,而是直接基于ID关系链或者map链做关联,例如对上述于ID对数据LINK1与LINK2,直接使用它们共有的ID关系链做关联,即将共有的ID:idno、unionid、telephone、imei/idfa做关联,通过共有的IDidno、unionid、telephone、imei/idfa做关联(具体关联在后续详细说明),一共关联了4次即可,相比于拆解成ID对之后再做两两关联,完全保留了原有的ID关系,并提升了ID链的生成效率。
在本实施例中,ID链的加工步骤具体如图4所示,需要说明的是,图中的IDidno_map,telephone_map等不再是简单的ID对,而是Map链,其中Map链结构为<ID1,ID2,ID3...IDn>,其中n<=5(ID的种类),也即,任一ID的map链为以该ID为优先级最高并以该ID为起始对应形成的多元ID关系,如ecifno的map链可以包括<ecifno,telephone,imei/idfa>,或者<ecifno,telephone>或者<ecifno,imei/idfa>等,加工ID链的过程其实就是为ID寻找优先级更高的ID,并将优先级低的ID关联到尽量关联到优先级高的ID上。
在本实施例中,根据所述优先级顺序,获取优先级最高的ID的第一map链,以得到第一类ID关系链,根据所述优先级顺序,持续获取其他优先级次序ID的第二map链,并为所述第二map链寻找优先级高于所述其他优先级次序ID的ID,以得到第二类ID关系链;根据第一类ID关系链以及所述第二类ID关系链,将所述清洗ID对数据的所有ID关系对加工成ID关系链。
具体地,首先获取优先级最高的ID的第一map链如获取ecifno的第一map链,在获取ecifno的第一map链后,获取其他优先级次序ID如idno的第二map链,为所述第二map链寻找优先级高于所述其他优先级次序ID的ID,以得到第二类ID关系链包括:为包含idno的Map链寻找优先级更高的ecifno,以得到第二类ID关系链即生成至少包含ecifno或者idno的ID链;以及为包含telephone的Map链寻找优先级更高的ecifno、idno,以得到第二类ID关系链即生成至少包含ecifno、idno或者telephone的ID链;以及为包含unionid的Map链寻找优先级更高的ecifno、idno、unionid,以得到第二类ID关系链即生成至少包含ecifno、idno、telephone或者unionid的ID链;以及为包含设备号(imei/idfa)的Map链寻找优先级更高的ecifno、idno、telephone或者unioni,以得到第二类ID关系链即生成包括所有用户ID组成的ID关系链。
根据第一类ID关系链以及所述第二类ID关系链,将所述清洗ID对数据的所有ID关系对加工成ID关系链的加工逻辑可以为:加工过程使用所有ID进行加工,例如,ecifno的Map链中可能有idno、telephone、unionid或设备号这4类ID,关联时需依次使用idno、telephone、unionid、设备号去与其他Map链做关联,以加工成ID关系链。在本实施例中,很显然通过idno、telephone、unionid、设备号关联4次即可。
在上述所有关联过程中,若遇到一对多的ID关系对(例如ecifno:telephone为1:N),可以取优先级最高的某一ID关系对(优先级通过一对多的ID关系对的时间或者出现次数确定)用来做关联,进而将所有的ID关系对加工成ID关系链。
在本实施例中,在ID关系链加工完成后,预设识别工具根据多个ID关系链生成对应多个唯一用户识别号。
步骤S30,若能从预设识别工具中获取所述同人识别指令对应目标用户的唯一用户识别号,则确定所述唯一用户识别号对应的用户与所述目标用户为同一个人。
在得到同人识别指令后,若能从预设识别工具中获取所述同人识别指令对应目标用户的唯一用户识别号CMID(Cdvd-Master-Id),则确定所述唯一用户识别号对应的用户与所述目标用户为同一个人,若不能从预设识别工具中获取所述同人识别指令对应目标用户的唯一用户识别号,则确定所述唯一用户识别号对应的用户与所述目标用户不是同一个人。
本发明在接收到同人识别指令时,首先获取所述同人识别指令对应的目标ID对数据;根据所述目标ID对数据确定是否能从预设识别工具中获取所述同人识别指令对应目标用户的唯一用户识别号,若能从预设识别工具中获取所述同人识别指令对应目标用户的唯一用户识别号,则确定所述唯一用户识别号对应的用户与所述目标用户为同一个人,即是在本申请中,只要确定同人识别指令中的目标ID对数据与目标用户的唯一用户识别号是否一致即可进行同人识别,同人识别过程简单,且目标ID对数据不做限定,即ID对数据是可扩展的,因而,本申请同人识别过程可扩展性强,而只要确定同人识别指令中的目标ID对数据与目标用户的唯一用户识别号是否一致即可进行同人识别是因为:根据多个ID关系链生成对应多个唯一用户识别号,即对每个用户对设置有唯一用户识别号,且在所述预设识别工具中,所述ID关系链是根据从同一用户对应ID对数据中提取的ID对之间的关联关系加工生成的,即是本申请的预设识别工具中,已经是获取用户ID对之间的关联关系进行加工生成ID关系链,或者是已经将之前获取ID对数据进行抽取转换加载生成ID关系链,以确保同一用户的不同ID使用同一唯一用户识别号,即已经通过唯一用户识别号将各个ID关联起来而不是割裂开来,因而,若能从预设识别工具中获取所述同人识别指令对应目标用户的唯一用户识别号,则确定所述唯一用户识别号对应的用户与所述目标用户为同一个人。相对图计算方式和机器学习方式,本发明降低了识别成本,同人识别过程中更为简单,可扩展性性强,以便于后续实现高效、低成本的信息推荐。
进一步地,在上述实施例的基础上,在本发明提供同人识别方法另一实施例,在该实施例中,所述根据所述第一类ID关系链以及所述第二类ID关系链,将所述清洗ID对数据的所有ID关系对加工成ID关系链步骤之后包括:
步骤A1,获取每一条ID关系链中优先级最高的ID,设所述优先级最高的ID为种子,对所述种子使用预设加密函数加密,以对应生成所述ID关系链中唯一标识UID;
在本实施例中,通过上述方式生成的ID关系链(可以简称为ID链)可能不是最终的ID链,即是因为源数据层中可能包括一对多的ID关系对如ecifno:telephone为1:N等,在加工ID关系链时该一对多的ID关系对可能得到保留,并导致某个ID同属于多个关系链中,因而,可以对已经生成的ID关系链加工生成最终的ID链,具体过程如图5所示,获取每一条ID关系链中优先级最高的ID,设所述优先级最高的ID为种子,对所述种子使用预设加密函数(可选为MD5算法)加密,以对应生成所述ID关系链中唯一标识UID,即在本实施例中为ID关系链的中每一条关系链生成一个唯一ID,如果ID链中优先级最高的ID是idno,则可以对idno做MD5生成UID,如果优先级最高的ID是telephone,则对telephone做MD5生成UID,即在本实施例中选择ID链中优先级最高的ID作为种子,对种子使用加密函数保证唯一性即可。
步骤A2,根据优先级最低ID在不同的ID关系链中时,对应ID关系链的唯一标识UID的等级,以及所述优先级最低ID在不同的ID关系链中的出现时间以及出现次数,确定在不同的ID关系链中的所述优先级最低ID对应的最终UID;
步骤A3,获取所述优先级最低ID外的其他各个ID的最终UID,将所有ID关联起来,组成最终的ID关系链。
根据优先级最低ID在不同的ID关系链中时,对应ID关系链的唯一标识UID的等级,以及所述优先级最低ID在不同的ID关系链中的出现时间以及出现次数,确定在不同的ID关系链中的所述优先级最低ID对应的最终UID,获取所述优先级最低ID外的其他各个ID的最终UID,将所有ID关联起来,组成最终的ID关系链,具体地,为优先级最高的ecifno关联上所属关系链的UID,并为idno关联上UID,关联方法为:如果idno有关联的ecifno,则使用上一步中ecifno关联的UID作为idno的UID,如果该idno没有ecifno,则使用该ID关系链的UID,通过该方法后面依次给telephone、unionid和设备号关联上UID,关联方法为idno关联UID方式一致,即在本实施例中按照优先级依次使用ecifno、idno、telephone、unionid以及关系链关联的UID。
在给所有ID都关联上UID后,获取所述优先级最低ID在不同的ID关系链中的出现时间以及出现次数(其中,时间越近,优先级越高,时间在对应UID考量中权重占比为第一占比),并获取所述优先级最低ID在不同的ID关系链中的出现次数(次数越多,优先级越高,出现次数在对应UID考量中权重占比为第二占比),根据该出现时间,出现次数,以及第一占比和第二占比,获取优先级最低ID对应的目标ID关系链,获取优先级最低ID对应的目标ID关系链对应的最高UID作为该ID的最终UID,最后使用UID将所有ID关联起来,组成最终的ID链。
在本实施例中,通过获取每一条ID关系链中优先级最高的ID,设所述优先级最高的ID为种子,对所述种子使用预设加密函数加密,以对应生成所述ID关系链中唯一标识UID;根据优先级最低ID在不同的ID关系链中时,对应ID关系链的唯一标识UID的等级,以及所述优先级最低ID在不同的ID关系链中的出现时间以及出现次数,确定在不同的ID关系链中的所述优先级最低ID对应的最终UID;获取所述优先级最低ID外的其他各个ID的最终UID,将所有ID关联起来,组成最终的ID关系链。在本实施例中,实现准确生成最终的ID关系链。
进一步地,在上述实施例的基础上,在本发明提供同人识别方法另一实施例,在该实施例中,所述唯一用户识别号包括最新的唯一用户识别号,在所述预设识别工具中包括多个历史唯一用户识别号,所述根据多个ID关系链生成对应多个唯一用户识别号步骤包括:
步骤S31,根据任一ID关系链上各个ID的优先级,有序确定该ID关系链上各个ID能否从所述多个历史唯一用户识别号中寻找已关联的目标历史唯一用户识别号;
在本实施例中,在生成ID关系链后,可以根据预设的生成规则(生成规则可以为确保每个ID关系链对应生成的CMID是唯一的,生成规则可以是函数或者正则表达式)与ID关系链(则使用ID关系链UID作为种子)生成用户的CMID,具体地,例如,以ID关系链的UID作为种子,使用MD5加密函数对该ID关系链进行加密,得到该ID关系链的MD5值作为对应的CMID,为了保证用户唯一识别号CMID的稳定性,以及用户唯一识别号CMID的唯一性和终生性,具体地,在生成ID关系链之后需要结合历史CMID数据进行进一步确认是需要采纳基于ID关系链生成对应的CMID,还是直接采用对应历史CMID(历史唯一用户识别号)作为同人识别指令对应的唯一用户识别号,具体地,在本实施例中,还根据任一ID关系链上各个ID的优先级,有序确定该ID关系链上各个ID能否从所述多个历史唯一用户识别号中寻找已关联的目标历史唯一用户识别号,具体地,根据ID链上ID优先级的顺序,依次使用ecifno、idno、telephone、unionid、设备号去CMID历史数据中寻找各个ID已关联的历史唯一用户识别号即历史CMID。
步骤S32,若确定该ID关系链上各个ID都不能从所述多个历史唯一用户识别号中寻找已关联的目标历史唯一用户识别号,则根据预设的生成规则生成最新的唯一用户识别号,以得到所述多个ID关系链对应的多个最新的唯一用户识别号。
若确定该ID关系链上各个ID都不能从所述多个历史唯一用户识别号中寻找已关联的目标历史唯一用户识别号,则根据预设的生成规则生成最新的唯一用户识别号,以得到所述多个ID关系链对应的多个最新的唯一用户识别号,将该最新的唯一用户识别号保存在预设识别工具中,并将该最新的唯一用户识别号作为同人识别指令对应的唯一用户识别号。
若确定该ID关系链上各个ID能从所述多个历史唯一用户识别号中寻找已关联的目标历史唯一用户识别号,则可能会导致同人识别指令关联上错误的CMID,即可能会导致高优先级ID关联上错误的CMID。
具体地,如图6,图7所示,本应该使用基于ID关系链的UID生成的新的CMID,作为同人识别指令对应的唯一用户识别号,但是因为telephone关联上了历史CMID1,所以可能采用历史CMID1作为同人识别指令对应的唯一用户识别号,这主要是因为低优先级ID的属主发生变更造成的,因而导致同人识别指令对应的用户本应该属于新增用户,却判断为已有用户,需要说明的是,并不是所有高优先级ID关联上低优先级ID已有的历史CMID都是错误的,例如,如果图7中的CMID历史数据中的telephone:001只是单独的(该telephone关联的历史CMID下并没有ecifno、idno时,这说明系统已经获取到用telephone,但是没有其他数据),直接使用CMID历史数据中的历史CMID即是正确的。
为了解决上述同人识别指令关联上错误的CMID的问题,在本实施例中,所述根据任一ID关系链上各个ID的优先级,有序确定该ID关系链上各个ID能否从所述多个历史唯一用户识别号中寻找已关联的目标历史唯一用户识别号步骤之后包括:
步骤B1,若确定该ID关系链上各个ID有从所述多个历史唯一用户识别号中寻找已关联的目标历史唯一用户识别号,获取所述目标历史唯一用户识别号关联的目标ID;
步骤B2,获取所述目标ID的优先级,以及所述目标ID关联的目标历史唯一用户识别号中关联的各个ID的优先级,以及所述ID关系链上各个ID的优先级,根据所述目标ID的优先级,以及所述目标ID关联的目标历史唯一用户识别号中关联的各个ID的优先级,以及所述ID关系链上各个ID的优先级,确定对应ID关系链的最新的唯一用户识别号。
本实施例中,具体地,获取所述目标ID的优先级,以及所述目标ID关联的目标历史唯一用户识别号中关联的各个ID的优先级,以及所述ID关系链上各个ID的优先级,根据所述目标ID的优先级,以及所述目标ID关联的目标历史唯一用户识别号中关联的各个ID的优先级,以及所述ID关系链上各个ID的优先级,确定对应ID关系链的最新的唯一用户识别号。具体地,获取所述目标ID的优先级,如优先级可以为ecifno>idno>telephone>unionid>设备号(imei/idfa)。在此优先级基础上,若使用ecifno关联到历史CMID数据中的历史CMID,则使用ecifno关联的历史CMID作为ID链的最新CMID;
若使用idno关联到历史CMID数据中的历史CMID(历史唯一用户识别号),则需要分情况,具体地,若在历史CMID数据中没关联的ecifno:使用idno关联的历史CMID作为所述ID关系链的CMID,若历史CMID数据中有关联ecifno:如果ID关系链上有ecifno,则使用基于ID关系链UID生成的CMID作为ID关系链的最新CMID,如果ID关系链上没有ecifno,则使用idno关联的历史CMID作为ID关系链的最新CMID,
若使用telephone关联到历史CMID数据中的历史CMID,则需要分情况,具体地,若历史CMID没有ecifno、idno:使用telephone关联的历史CMID作为ID链的最新CMID,若历史CMID没有ecifno,有idno:如果ID关系链上没有idno,使用telephone关联的历史CMID作为ID关系链的最新CMID,否则使用基于ID链UID生成的CMID作为ID链的最新CMID;如果历史CMID没有idno,有ecifno:如果ID关系链上没有ecifno,使用telephone关联的历史CMID作为ID关系链的最新CMID,否则使用基于ID关系链的UID生成CMID作为ID链的最新CMID;如果历史CMID有ecifno、idno:使用基于ID关系链UID生成CMID作为ID链的最新CMID。
在本实施例中,通过若确定该ID关系链上各个ID有从所述多个历史唯一用户识别号中寻找已关联的目标历史唯一用户识别号,获取所述目标历史唯一用户识别号关联的目标ID;获取所述目标ID的优先级,以及所述目标ID关联的目标历史唯一用户识别号中关联的各个ID的优先级,以及所述ID关系链上各个ID的优先级,根据所述目标ID的优先级,以及所述目标ID关联的目标历史唯一用户识别号中关联的各个ID的优先级,以及所述ID关系链上各个ID的优先级,确定对应ID关系链的最新的唯一用户识别号。在本实施例中,实现准确获取ID链的最新CMID。
进一步地,在上述实施例的基础上,在本发明提供同人识别方法另一实施例,在该实施例中,所述若确定该ID关系链上各个ID有从所述多个历史唯一用户识别号中寻找已关联的目标历史唯一用户识别号,获取所述目标历史唯一用户识别号关联的目标ID步骤之后包括:
步骤C1,根据ID关系链上出现的各个ID对所述ID关系链进行预设编码,得到第一编码号;
步骤C2,对所述历史唯一用户识别号所对应的ID关系链进行预设编码,得到第二编码号;
步骤C3,加和处理所述第一编码号与所述第二编码号,得到编码链;
步骤C4,获取比所述目标ID优先级高的其他ID的编码位;
步骤C5,若所述比所述目标ID优先级高的其他ID的编码位大于等于编码链上对应编码数值时,确定对应多个唯一用户识别号。
为了解决实现准确获取ID链的最新CMID过程中存在的繁琐问题,在本实施例中,提供一种新的处理方式即提供预设编码方式,在该预设编码方式中,根据ID是否出现进行编码,出现则编码位1,不出现则编码为0,具体地,根据ID关系链上出现的各个ID对所述ID关系链进行预设编码,得到第一编码号,对所述历史唯一用户识别号所对应的ID关系链进行预设编码,得到第二编码号,加和处理所述第一编码号与所述第二编码号,得到编码链;获取比所述目标ID优先级高的其他ID的编码位;若所述比所述目标ID优先级高的其他ID的编码位大于等于编码链上对应编码数值时,确定对应多个唯一用户识别号。其核心在于:使用基于ID关系链中的ID关联历史CMID时,如果历史CMID已经关联的高优先级ID与ID链中的高优先级ID冲突时(ID编码位的数值大于1),说明ID属主发生变更,此时不能直接使用历史CMID,应该生成新的CMID作为最新CMID。
具体地,若存在如下ID关系链<NULL,idno,telephone,unionid,imei/idfa>,在进行预设编码后可以表示为<01111>;而CMID<ecifno,idno,telephone,unionid,imei/idfa>,在进行预设编码后可以表示为<11111>;加和处理所述第一编码号与所述第二编码号,得到编码链为<01111>+<11111>=<12222>,这里需要考虑ecifno(因为ecifno优先级大于idno),ecifno的编码为1<2,说明不存在不同CMID的冲突,但是如果使用telephone关联(因为ecifno,idno优先级大于telephone),则需要考虑ecifno和idno的编码位,其中idno的编码为2=2,此时说明存在冲突,由于使用不同ID关联时只需要考虑优先级高的ID位的编码是否出现2,可以提升识别效率,在本实施例中,生成最新的用户ID与CMID的关系数据之后,就可以实现其他扩充ID与CMID的关系,例如根据<telephone,QQ>的ID对数据,例如,可以使用<CMID:telephone>数据快速生成<CMID,QQ>数据,最终构建成<CMID,用户ID(包括ecifno、idno、telephone、unionid、设备ID、QQ等)>,这样使用任意用户ID,我们都能根据CMID找到该用户的其他ID,快速判断出不同种类的用户ID是否属于同一人。
在本实施例中,通过根据ID关系链上出现的各个ID对所述ID关系链进行预设编码,得到第一编码号;对所述历史唯一用户识别号所对应的ID关系链进行预设编码,得到第二编码号;加和处理所述第一编码号与所述第二编码号,得到编码链;获取比所述目标ID优先级高的其他ID的编码位;若所述比所述目标ID优先级高的其他ID的编码位大于等于编码链上对应编码数值时,确定对应多个唯一用户识别号。在本实施例中,提升生成唯一用户识别号的生成效率。
参照图3,图3是本发明实施例方案涉及的硬件运行环境的设备结构示意图。
本发明实施例同人识别设备可以是PC,也可以是智能手机、平板电脑、便携计算机等终端设备。
如图3所示,该同人识别设备可以包括:处理器1001,例如CPU,存储器1005,通信总线1002。其中,通信总线1002用于实现处理器1001和存储器1005之间的连接通信。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储设备。
可选地,该同人识别设备还可以包括目标用户接口、网络接口、摄像头、RF(RadioFrequency,射频)电路,传感器、音频电路、WiFi模块等等。目标用户接口可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选目标用户接口还可以包括标准的有线接口、无线接口。网络接口可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。
本领域技术人员可以理解,图3中示出的同人识别设备结构并不构成对同人识别设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图3所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块以及同人识别程序。操作系统是管理和控制同人识别设备硬件和软件资源的程序,支持同人识别程序以及其它软件和/或程序的运行。网络通信模块用于实现存储器1005内部各组件之间的通信,以及与同人识别设备中其它硬件和软件之间通信。
在图3所示的同人识别设备中,处理器1001用于执行存储器1005中存储的同人识别程序,实现上述任一项所述的同人识别方法的步骤。
本发明同人识别设备具体实施方式与上述同人识别方法各实施例基本相同,在此不再赘述。
此外,本发明实施例还提出一种同人识别装置,所述同人识别装置应用于第一单位,所述同人识别装置包括:
第一获取模块,用于在接收到同人识别指令时,获取所述同人识别指令对应的目标ID对数据;
第一确定模块,用于根据所述目标ID对数据确定是否能从预设识别工具中获取所述同人识别指令对应目标用户的唯一用户识别号;
其中,在所述预设识别工具中,根据多个ID关系链生成对应多个唯一用户识别号,根据从同一用户对应ID对数据中提取的ID对之间的关联关系加工生成所述ID关系链;
第二确定模块,用于若能从预设识别工具中获取所述同人识别指令对应目标用户的唯一用户识别号,则确定所述唯一用户识别号对应的用户与所述目标用户为同一个人。
可选地,所述第一确定模块包括:
第一获取单元,用于每间隔预设时间段获取同一用户对应ID对数据,根据预设的正则校验规则对所述ID对数据进行数据清洗,得到清洗ID对数据;
第二获取单元,用于获取预设的各个ID的优先级顺序;
第一关系补充单元,用于根据所述优先级顺序,对所述清洗ID对数据中多个ID对以共同ID为间接关联做关系补充加工,以生成多元ID关系;
第二关系补充单元,用于根据所述多元ID关系对所述清洗ID对数据中各个ID对继续做关系补充加工,直到各个ID对以及ID都在加工中被使用,以生成所述清洗ID对数据中不同ID组成的长短不一的ID关系链。
可选地,所述同人识别装置还包括:
第二获取模块,用于根据所述优先级顺序,获取优先级最高的ID的第一map链,以得到第一类ID关系链,其中,任一ID的map链为以该ID为优先级最高并以该ID为起始对应形成的多元ID关系;
第三获取模块,用于根据所述优先级顺序,持续获取其他优先级次序ID的第二map链,并为所述第二map链寻找优先级高于所述其他优先级次序ID的ID,以得到第二类ID关系链;
加工模块,用于根据所述第一类ID关系链以及所述第二类ID关系链,将所述清洗ID对数据的所有ID关系对加工成ID关系链。
可选地,所述同人识别装置还包括:
第四获取模块,用于获取每一条ID关系链中优先级最高的ID,设所述优先级最高的ID为种子,对所述种子使用预设加密函数加密,以对应生成所述ID关系链中唯一标识UID;
第三确定模块,用于根据优先级最低ID在不同的ID关系链中时,对应ID关系链的唯一标识UID的等级,以及所述优先级最低ID在不同的ID关系链中的出现时间以及出现次数,确定在不同的ID关系链中的所述优先级最低ID对应的最终UID;
第五获取模块,用于获取所述优先级最低ID外的其他各个ID的最终UID,将所有ID关联起来,组成最终的ID关系链。
可选地,所述唯一用户识别号包括最新的唯一用户识别号,在所述预设识别工具中包括多个历史唯一用户识别号,所述第一确定模块包括:
第一确定单元,用于根据任一ID关系链上各个ID的优先级,有序确定该ID关系链上各个ID能否从所述多个历史唯一用户识别号中寻找已关联的目标历史唯一用户识别号;
第二确定单元,用于若确定该ID关系链上各个ID都不能从所述多个历史唯一用户识别号中寻找已关联的目标历史唯一用户识别号,则根据预设的生成规则生成最新的唯一用户识别号,以得到所述多个ID关系链对应的多个最新的唯一用户识别号。
可选地,所述同人识别装置还包括:
第六获取模块,用于若确定该ID关系链上各个ID有从所述多个历史唯一用户识别号中寻找已关联的目标历史唯一用户识别号,获取所述目标历史唯一用户识别号关联的目标ID;
第七获取模块,用于获取所述目标ID的优先级,以及所述目标ID关联的目标历史唯一用户识别号中关联的各个ID的优先级,以及所述ID关系链上各个ID的优先级,根据所述目标ID的优先级,以及所述目标ID关联的目标历史唯一用户识别号中关联的各个ID的优先级,以及所述ID关系链上各个ID的优先级,确定对应ID关系链的最新的唯一用户识别号。
可选地,所述同人识别装置还包括:
第一编码模块,用于根据ID关系链上出现的各个ID对所述ID关系链进行预设编码,得到第一编码号;
第二编码模块,用于对所述历史唯一用户识别号所对应的ID关系链进行预设编码,得到第二编码号;
加和模块,用于加和处理所述第一编码号与所述第二编码号,得到编码链;
第八获取模块,用于获取比所述目标ID优先级高的其他ID的编码位;
第四确定模块,用于若所述比所述目标ID优先级高的其他ID的编码位大于等于编码链上对应编码数值时,确定对应多个唯一用户识别号。
所述同人识别装置具体实施方式与上述同人识别方法各实施例基本相同,在此不再赘述。
此外,本发明还提供了一种计算机介质,所述计算机介质存储有一个或者一个以上程序,所述一个或者一个以上程序还可被一个或者一个以上的处理器执行以用于实现上述同人识别方法各实施例的步骤。
本发明介质(即计算机可读介质)的具体实施方式的拓展内容与上述同人识别方法各实施例基本相同,在此不做赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。

Claims (10)

1.一种同人识别方法,其特征在于,所述同人识别方法包括:
在接收到同人识别指令时,获取所述同人识别指令对应的目标ID对数据;
根据所述目标ID对数据确定是否能从预设识别工具中获取所述同人识别指令对应目标用户的唯一用户识别号;
其中,在所述预设识别工具中,根据多个ID关系链生成对应多个唯一用户识别号,根据从同一用户对应ID对数据中提取的ID对之间的关联关系加工生成所述ID关系链;
若能从预设识别工具中获取所述同人识别指令对应目标用户的唯一用户识别号,则确定所述唯一用户识别号对应的用户与所述目标用户为同一个人。
2.如权利要求1所述的同人识别方法,其特征在于,所述根据从同一用户对应ID对数据中提取的ID对之间的关联关系加工生成所述ID关系链步骤包括:
每间隔预设时间段获取同一用户对应ID对数据,根据预设的正则校验规则对所述ID对数据进行数据清洗,得到清洗ID对数据;
获取预设的各个ID的优先级顺序;
根据所述优先级顺序,对所述清洗ID对数据中多个ID对以共同ID为间接关联做关系补充加工,以生成多元ID关系;
根据所述多元ID关系对所述清洗ID对数据中各个ID对继续做关系补充加工,直到各个ID对以及ID都在加工中被使用,以生成所述清洗ID对数据中不同ID组成的长短不一的ID关系链。
3.如权利要求2所述的同人识别方法,其特征在于,所述获取预设的各个ID的优先级顺序步骤之后包括:
根据所述优先级顺序,获取优先级最高的ID的第一map链,以得到第一类ID关系链,其中,任一ID的map链为以该ID为优先级最高并以该ID为起始对应形成的多元ID关系;
根据所述优先级顺序,持续获取其他优先级次序ID的第二map链,并为所述第二map链寻找优先级高于所述其他优先级次序ID的ID,以得到第二类ID关系链;
根据所述第一类ID关系链以及所述第二类ID关系链,将所述清洗ID对数据的所有ID关系对加工成ID关系链。
4.如权利要求3所述的同人识别方法,其特征在于,所述根据所述第一类ID关系链以及所述第二类ID关系链,将所述清洗ID对数据的所有ID关系对加工成ID关系链步骤之后包括:
获取每一条ID关系链中优先级最高的ID,设所述优先级最高的ID为种子,对所述种子使用预设加密函数加密,以对应生成所述ID关系链中唯一标识UID;
根据优先级最低ID在不同的ID关系链中时,对应ID关系链的唯一标识UID的等级,以及所述优先级最低ID在不同的ID关系链中的出现时间以及出现次数,确定在不同的ID关系链中的所述优先级最低ID对应的最终UID;
获取所述优先级最低ID外的其他各个ID的最终UID,将所有ID关联起来,组成最终的ID关系链。
5.如权利要求1-4任一项所述的同人识别方法,其特征在于,所述唯一用户识别号包括最新的唯一用户识别号,在所述预设识别工具中包括多个历史唯一用户识别号,所述根据多个ID关系链生成对应多个唯一用户识别号步骤包括:
根据任一ID关系链上各个ID的优先级,有序确定该ID关系链上各个ID能否从所述多个历史唯一用户识别号中寻找已关联的目标历史唯一用户识别号;
若确定该ID关系链上各个ID都不能从所述多个历史唯一用户识别号中寻找已关联的目标历史唯一用户识别号,则根据预设的生成规则生成最新的唯一用户识别号,以得到所述多个ID关系链对应的多个最新的唯一用户识别号。
6.如权利要求5所述的同人识别方法,其特征在于,所述根据任一ID关系链上各个ID的优先级,有序确定该ID关系链上各个ID能否从所述多个历史唯一用户识别号中寻找已关联的目标历史唯一用户识别号步骤之后包括:
若确定该ID关系链上各个ID有从所述多个历史唯一用户识别号中寻找已关联的目标历史唯一用户识别号,获取所述目标历史唯一用户识别号关联的目标ID;
获取所述目标ID的优先级,以及所述目标ID关联的目标历史唯一用户识别号中关联的各个ID的优先级,以及所述ID关系链上各个ID的优先级,根据所述目标ID的优先级,以及所述目标ID关联的目标历史唯一用户识别号中关联的各个ID的优先级,以及所述ID关系链上各个ID的优先级,确定对应ID关系链的最新的唯一用户识别号。
7.如权利要求6所述的同人识别方法,其特征在于,所述若确定该ID关系链上各个ID有从所述多个历史唯一用户识别号中寻找已关联的目标历史唯一用户识别号,获取所述目标历史唯一用户识别号关联的目标ID步骤之后包括:
根据ID关系链上出现的各个ID对所述ID关系链进行预设编码,得到第一编码号;
对所述历史唯一用户识别号所对应的ID关系链进行预设编码,得到第二编码号;
加和处理所述第一编码号与所述第二编码号,得到编码链;
获取比所述目标ID优先级高的其他ID的编码位;
若所述比所述目标ID优先级高的其他ID的编码位大于等于编码链上对应编码数值时,确定对应多个唯一用户识别号。
8.一种同人识别装置,其特征在于,所述同人识别方法包括:
第一获取模块,用于在接收到同人识别指令时,获取所述同人识别指令对应的目标ID对数据;
第一确定模块,用于根据所述目标ID对数据确定是否能从预设识别工具中获取所述同人识别指令对应目标用户的唯一用户识别号;
其中,在所述预设识别工具中,根据多个ID关系链生成对应多个唯一用户识别号,根据从同一用户对应ID对数据中提取的ID对之间的关联关系加工生成所述ID关系链;
第二确定模块,用于若能从预设识别工具中获取所述同人识别指令对应目标用户的唯一用户识别号,则确定所述唯一用户识别号对应的用户与所述目标用户为同一个人。
9.一种同人识别设备,其特征在于,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的同人识别程序,所述同人识别程序被所述处理器执行时实现如权利要求1至7中任一项所述的同人识别方法的步骤。
10.一种介质,其特征在于,所述介质上存储有同人识别程序,所述同人识别程序被处理器执行时实现如权利要求1至7中任一项所述的同人识别方法的步骤。
CN201911235559.1A 2019-12-05 2019-12-05 同人识别方法、装置、设备及介质 Pending CN110929173A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911235559.1A CN110929173A (zh) 2019-12-05 2019-12-05 同人识别方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911235559.1A CN110929173A (zh) 2019-12-05 2019-12-05 同人识别方法、装置、设备及介质

Publications (1)

Publication Number Publication Date
CN110929173A true CN110929173A (zh) 2020-03-27

Family

ID=69857134

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911235559.1A Pending CN110929173A (zh) 2019-12-05 2019-12-05 同人识别方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN110929173A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112148981A (zh) * 2020-09-29 2020-12-29 广州小鹏自动驾驶科技有限公司 同人识别方法、装置、设备和存储介质
CN113704566A (zh) * 2021-10-29 2021-11-26 贝壳技术有限公司 识别号主体识别方法、存储介质和电子设备
CN115550311A (zh) * 2022-11-28 2022-12-30 永联智慧能源科技(常熟)有限公司 基于can通讯的地址自识别方法、装置、介质及电子设备

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112148981A (zh) * 2020-09-29 2020-12-29 广州小鹏自动驾驶科技有限公司 同人识别方法、装置、设备和存储介质
CN113704566A (zh) * 2021-10-29 2021-11-26 贝壳技术有限公司 识别号主体识别方法、存储介质和电子设备
CN115550311A (zh) * 2022-11-28 2022-12-30 永联智慧能源科技(常熟)有限公司 基于can通讯的地址自识别方法、装置、介质及电子设备

Similar Documents

Publication Publication Date Title
CN110929173A (zh) 同人识别方法、装置、设备及介质
CN105099729B (zh) 一种识别用户身份标识的方法和装置
CN110276060B (zh) 数据处理的方法以及装置
CN111027656B (zh) 二维码生成及识别方法、装置、电子设备、存储介质
CN107862047B (zh) 基于多个数据源的自然人数据处理方法和系统
CN107240029B (zh) 一种数据处理方法及装置
CN106656998B (zh) 服务器通信方法及装置
WO2016101811A1 (zh) 一种信息排序方法及装置
US20210084574A1 (en) Method for identifying a type of a wireless hotspot and a network device thereof
JP6629973B2 (ja) 携帯電話番号を変更するためのサービス要求を認識する方法及び装置
CN104750872A (zh) 一种业务对象的查询方法及装置
EP2779520A1 (en) A process for obtaining candidate data from a remote storage server for comparison to a data to be identified
CN110554877A (zh) 一种json数据解析方法、装置、设备及储存介质
CN105989457A (zh) 一种信息查询方法及装置
CN105786941B (zh) 一种信息挖掘方法和装置
CN114791927A (zh) 一种数据分析方法和装置
CN111310224B (zh) 日志脱敏方法、装置、计算机设备及计算机可读存储介质
KR101743731B1 (ko) 분산된 데이터를 통합하여 생성한 온톨로지를 기반으로 쿼리를 처리하는 방법 및 장치
CN115827280A (zh) 消息处理方法、装置、电子设备及存储介质
CN105141673A (zh) 智能终端及其处理用户信息的方法
CN110248354A (zh) 一种基于动态配置的数据处理方法及其应用
CN111723122A (zh) 数据间关联规则的确定方法、装置、设备及可读存储介质
CN110750561A (zh) 一种关联应用程序挖掘的方法及装置
CN111782684B (zh) 一种配网电子化移交信息匹配方法及装置
CN109284268A (zh) 一种快速解析日志的方法、系统及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination