CN110704498A - 数据提取方法、装置、设备及计算机可读存储介质 - Google Patents

数据提取方法、装置、设备及计算机可读存储介质 Download PDF

Info

Publication number
CN110704498A
CN110704498A CN201910847221.5A CN201910847221A CN110704498A CN 110704498 A CN110704498 A CN 110704498A CN 201910847221 A CN201910847221 A CN 201910847221A CN 110704498 A CN110704498 A CN 110704498A
Authority
CN
China
Prior art keywords
association
user
sub
identifier
exist
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910847221.5A
Other languages
English (en)
Inventor
路一迪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Urban Construction Technology Shenzhen Co Ltd
Original Assignee
Ping An Urban Construction Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Urban Construction Technology Shenzhen Co Ltd filed Critical Ping An Urban Construction Technology Shenzhen Co Ltd
Priority to CN201910847221.5A priority Critical patent/CN110704498A/zh
Publication of CN110704498A publication Critical patent/CN110704498A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/254Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开一种数据提取方法、装置、设备及计算机可读存储介质,所述方法包括:当侦测到数据提取请求时,获取用户在各预设系统的设备端标识和用户标识,并根据数据提取请求中关联条件的类型,处理设备端标识对应的第一编号和用户标识对应的第二编号,生成关联编号;根据关联编号,在设备端标识和用户标识之间建立映射关系;在接收到登录请求并登录成功后,根据登录请求中携带的目标关联标识,确定具有映射关系的目标预设系统,并从其中抓取与目标关联标识对应的用户数据。本方案基于大数据处理技术生成关联编号,通过关联编号所建立的映射关系来实现各预设系统之间的关联,实现用户在各预设系统之间行为数据的共享,方便了用户行为数据的取得。

Description

数据提取方法、装置、设备及计算机可读存储介质
技术领域
本发明主要涉及数据处理技术领域,具体地说,涉及一种数据提取方法、装置、设备及计算机可读存储介质。
背景技术
目前,大多数公司的系统的后台数据都是分库存储的,且不同的系统对用户的注册规则具有差异性,即便同一用户使用相同的账号进行注册,在各系统的后台所记录的账号也存在不同,各系统之间缺少关联性。如此一来,当同一个用户在不同的系统之间都发生用户行为时,各系统之间也因不能识别该用户为同一用户而无法获知该用户在其他系统的行为数据;当需要获取用户在其他系统的行为数据,则需要通过先登录不同的系统,再从不同的系统进行用户识别来获取,对用户行为数据获取的效率低。
发明内容
本发明的主要目的是提供一种数据提取方法、装置、设备及计算机可读存储介质,旨在解决现有技术中各系统之间因缺少关联性而不利于用户行为数据取得的问题。
为实现上述目的,本发明提供一种数据提取方法,所述数据提取方法包括以下步骤:
当侦测到数据提取请求时,获取用户在各预设系统的设备端标识和用户标识,并读取所述数据提取请求中携带的关联条件;
根据所述关联条件的类型,对所述设备端标识对应的第一编号以及所述用户标识对应的第二编号进行处理,生成关联编号;
根据所述关联编号,在所述设备端标识以及所述用户标识之间建立映射关系,将关联编号添加到各预设系统的设备端标识,以及添加到各预设系统的账户标识中,以对所述用户在各所述预设系统的标识进行关联;
在接收到登录请求并登录成功后,读取所述登录请求中携带的目标关联标识;
根据所述目标关联标识,确定具有映射关系的目标预设系统,并从所述目标预设系统中抓取与所述目标关联标识对应的用户数据。
优选地,所述根据所述关联条件的类型,对所述设备端标识对应的第一编号以及所述用户标识对应的第二编号进行处理,生成关联编号的步骤包括:
当所述关联条件的类型为第一类型时,判断所述设备端标识对应的第一编号以及所述用户标识对应的第二编号是否均存在;
若所述第一编号和所述第二编号均存在,则判断所述第一编号和所述第二编号是否相同,若所述第一编号和所述第二编号相同,则将所述第一编号或所述第二编号确定为关联编号,若所述第一编号和所述第二编号不相同,则将所述第二编号确定为关联编号,并将所述第一编号更改为所述第二编号;
若所述第一编号和所述第二编号均不存在,则根据与所述用户标识对应的手机号,生成关联编号;
若所述第一编号和所述第二编号中任意一项不存在,则根据所述第一编号和所述第二编号,以及与所述用户标识对应的手机号,生成关联编号。
优选地,所述若所述第一编号和所述第二编号均不存在,则根据与所述用户标识对应的手机号,生成关联编号的步骤包括:
当所述第一编号和所述第二编号均不存在时,则查找与所述用户标识对应的手机号,并判断所述手机号是否存在对应的第三编号;
若所述手机号存在对应的第三编号,则将所述第三编号生成为关联编号,并将所述第一编号和所述第二编号均变更为所述第三编号;
若所述手机号不存在对应的第三编号,则基于预设规则生成关联编号,并将所述第一编号、所述第二编号和所述第三编号均变更为所述关联编号。
优选地,所述若所述第一编号和所述第二编号中任意一项不存在,则根据所述第一编号和所述第二编号,以及与所述用户标识对应的手机号,生成关联编号的步骤包括:
当所述第一编号存在,所述第二编号不存在时,查找与所述用户标识对应的手机号,并判断所述手机号是否存在对应的第三编号;
若所述手机号存在对应的第三编号,则将所述第三编号生成为关联编号,并将所述第一编号和所述第二编号均变更为所述第三编号;
若所述手机号不存在对应的第三编号,则判断所述第一编号是否具有对应的设备用户标识,若具有所述设备用户标识,则基于预设规则生成关联编号,并将所述第一编号、所述第二编号和所述第三编号均变更为所述关联编号;
若所述第一编号不具有对应的设备用户标识,则将所述第一编号生成为关联编号,并将所述第二编号变更为所述第一编号;
当各所述第一编号不存在,所述第二编号存在时,将所述第二编号生成为关联编号,并将所述第一编号变更为所述第二编号。
优选地,所述根据所述关联条件的类型,对所述设备端标识对应的第一编号以及所述用户标识对应的第二编号进行处理,生成关联编号的步骤包括:
当所述关联条件的类型为第二类型时,读取所述设备端标识对应的第一编号,并将所述第一编号划分为第一子编号和第二子编号,判断所述第一子编号、第二子编号以及所述用户标识对应的第二编号是否存在且均相同;
若所述第一子编号、第二子编号以及所述用户标识对应的第二编号存在且均相同,则将所述第一子编号、第二子编号和所述第二编号中的任意一项生成为关联编号;
当所述第二编号存在,所述第一子编号或第二子编号不存在时,或者当所述第二编号、所述第一子编号以及所述第二子编号存在,所述第一子编号或第二子编号与所述第二编号不相同时,则将所述第二编号生成为关联编号,并将所述第一子编号和第二子编号均变更为所述第二编号;
若所述第二编号不存在,则查找与所述用户标识对应的手机号,并判断所述手机号是否存在对应的第三编号,若存在所述第三编号,则所述第三编号生成为关联编号,并将所述第二编号、所述第一子编号和所述第二子编号均变更为所述第三编号;
当不存在所述第三编号,且所述第一子编号和所述第二子编号均不存在时,则基于预设规则生成关联编号,并将所述关联编号分别设为所述第一子编号、所述第二子编号和所述第二编号;
当不存在所述第三编号,且所述第一子编号和/或所述第二子编号均存在时,则根据所述第一子编号和所述第二子编号的优先级确定关联编号,并将所述第一子编号、所述第二子编号和所述第二编号均变更为所述关联编号。
优选地,所述根据所述关联条件的类型,对所述设备端标识对应的第一编号以及所述用户标识对应的第二编号进行处理,生成关联编号的步骤包括:
当所述关联条件的类型为第三类型时,将与所述设备端标识对应的第一编号和所述用户标识对应的第二编号屏蔽,并查找与所述用户标识对应的手机号;
判断所述手机号是否存在对应的第三编号,若存在所述第三编号,则将所述第三编号生成为关联编号,若不存在所述第三编号,则基于预设规则生成关联编号;
当所述关联条件的类型为第四类型时,将与所述设备端标识对应的第一编号屏蔽,并读取与所述用户标识对应的第二编号,以及与所述用户标识对应手机号的第三编号,判断所述第二编号和所述第三编号是否存在且一致;
若所述第二编号和所述第三编号存在且一致,则将所述第二编号或所述第三编号生成为关联编号;
当所述第二编号存在,所述第三编号不存在时,将所述第二编号生成为关联编号,并将所述第三编号变更为所述第二编号;
当所述第二编号不存在,所述第三编号存在时,将所述第三编号生成为关联编号,并将所述第二编号变更为所述第三编号;
若所述第二编号和所述第三编号存在且不一致,则将所述第二编号生成为关联编号,并将所述第三编号变更为所述第二编号;
若所述第二编号和所述第三编号均不存在,则基于预设规则生成关联编号,并将所述第二编号和所述第三编号均变更为所述关联编号。
此外,为实现上述目的,本发明还提出一种数据提取装置,所述数据提取装置包括:
获取模块,用于当侦测到数据提取请求时,获取用户在各预设系统的设备端标识和用户标识,并读取所述数据提取请求中携带的关联条件;
生成模块,用于根据所述关联条件的类型,对所述设备端标识对应的第一编号以及所述用户标识对应的第二编号进行处理,生成关联编号;
关联模块,用于根据所述关联编号,在所述设备端标识以及所述用户标识之间建立映射关系,将关联编号添加到各预设系统的设备端标识,以及添加到各预设系统的账户标识中,以对所述用户在各所述预设系统的标识进行关联;
读取模块,用于在接收到登录请求并登录成功后,读取所述登录请求中携带的目标关联标识;
抓取模块,用于根据所述目标关联标识,确定具有映射关系的目标预设系统,并从所述目标预设系统中抓取与所述目标关联标识对应的用户数据。
此外,为实现上述目的,本发明还提出一种数据提取设备,所述数据提取设备包括:存储器、处理器、通信总线以及存储在所述存储器上的数据提取程序;
所述通信总线用于实现处理器和存储器之间的连接通信;
所述处理器用于执行所述数据提取程序,以实现以下步骤:
当侦测到数据提取请求时,获取用户在各预设系统的设备端标识和用户标识,并读取所述数据提取请求中携带的关联条件;
根据所述关联条件的类型,对所述设备端标识对应的第一编号以及所述用户标识对应的第二编号进行处理,生成关联编号;
根据所述关联编号,在所述设备端标识以及所述用户标识之间建立映射关系,将关联编号添加到各预设系统的设备端标识,以及添加到各预设系统的账户标识中,以对所述用户在各所述预设系统的标识进行关联;
在接收到登录请求并登录成功后,读取所述登录请求中携带的目标关联标识;
根据所述目标关联标识,确定具有映射关系的目标预设系统,并从所述目标预设系统中抓取与所述目标关联标识对应的用户数据。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者一个以上程序,所述一个或者一个以上程序可被一个或者一个以上的处理器执行以用于:
当侦测到数据提取请求时,获取用户在各预设系统的设备端标识和用户标识,并读取所述数据提取请求中携带的关联条件;
根据所述关联条件的类型,对所述设备端标识对应的第一编号以及所述用户标识对应的第二编号进行处理,生成关联编号;
根据所述关联编号,在所述设备端标识以及所述用户标识之间建立映射关系,将关联编号添加到各预设系统的设备端标识,以及添加到各预设系统的账户标识中,以对所述用户在各所述预设系统的标识进行关联;
在接收到登录请求并登录成功后,读取所述登录请求中携带的目标关联标识;
根据所述目标关联标识,确定具有映射关系的目标预设系统,并从所述目标预设系统中抓取与所述目标关联标识对应的用户数据。
本实施例的数据提取方法,当侦测到数据提取请求时,先对用户在各预设系统对应的设备端标识和用户标识进行获取,再依据关联请求中所携带关联条件的类型,对各设备端标识对应的第一编号以及各用户标识对应的第二编号进行处理,生成关联编号;进而依据该关联编号,在各设备端标识和各用户标识之间建立映射关系,将关联编号添加到各预设系统的设备端标识,以及添加到各预设系统的账户标识中,实现对用户在各预设系统的标识进行关联;此后当接收到登录请求并登录成功时,对登录请求中携带的目标关联标识进行读取,并依据该目标关联标识,确定相互之间具有映射关系的目标预设系统,以从目标预设系统中抓取与目标关联标识对应的用户数据。通过关联编号所建立的映射关系来实现各预设系统之间的关联,使得用户在任意一个预设系统中所进行的用户行为,其他各预设系统均可获知该行为所对应的行为数据,方便了从各预设系统来取得用户的行为数据,提高了用户行为数据获取的效率。
附图说明
图1是本发明的数据提取方法第一实施例的流程示意图;
图2是本发明的数据提取装置第一实施例的功能模块示意图;
图3是本发明实施例方法涉及的硬件运行环境的设备结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供一种数据提取方法。
请参照图1,图1为本发明数据提取方法第一实施例的流程示意图。在本实施例中,所述数据提取方法包括:
步骤S10,当侦测到数据提取请求时,获取用户在各预设系统的设备端标识和用户标识,并读取所述数据提取请求中携带的关联条件;
本发明数据提取方法应用于服务器,适用于通过服务器将各用户登录账号和设备号做关联;即如果有一个或多个账号登录过多个设备或浏览器,将这些有关联的设备号、账号以及账号对应的手机号均关联起来,用来定义同一个用户。其中设备号至少包括以下任一种:web(World Wide Web,全球广域网)和h5(html 5)用户cookie(储存在用户本地终端上的数据)的唯一标识码,用GUID(Globally Unique Identifier,全局唯一标识符)表征;Android(安卓)移动设备端标识码,用IMEI(International Mobile Equipment Identity,国际移动设备识别码)表征;iOS移动设备端标识码,用IDFA(Identifier ForAdvertising,广告标识符)表征;设备上第一个使用OpenUDID(Open Unique DeviceIdentifier,开放的唯一设备识别符)方案的应用的唯一标识码,用OpenUDID表征。考虑到用户进行登录的场景多种多样,如通过Android移动设备端登录APP、web网页、h5页面的第一场景,通过IOS移动设备端登录APP(Application,应用程序)、web网页、h5页面的第二场景,企业用户通过其移动设备端向企业请求数据的第三场景以及初始化用户手机信息的第四场景。
本实施例中针对不同的场景设置有不同的关联机制,具体地,将登录的系统或浏览器预先设定为预设系统,服务器在侦测到数据提取请求时,获取用户在各预设系统的设备端标识以及用户标识。其中数据提取请求通过上述任一登录场景进行触发,如当检测到Android移动设备端登录APP,则自动触发数据提取请求;设备端标识为用于登录到各预设系统的移动设备端所具有的标识码,用户标识为用户所注册用于登录各预设系统的用户账户。如用户通过其安卓手机登录到微信,则获取到的设备端标识为安卓手机的IMEI,用户标识为微信账号。同时,服务器还对数据提取请求中所携带的关联条件进行读取,关联条件为用于对设备端标识和用户标识进行关联的条件,且根据登录场景的不同关联条件的类型不相同。其中,对应第一场景,关联条件的类型为第一类型;对应第二场景,关联条件的类型为第二类型;对应第三场景,关联条件的类型为第三类型;对应第四场景,关联条件的类型为第四类型。
步骤S20,根据所述关联条件的类型,对所述设备端标识对应的第一编号以及所述用户标识对应的第二编号进行处理,生成关联编号;
进一步地,在读取到数据提取请求中携带的关联条件后,根据该关联条件中所携带类型标识符表征的类型,对设备端标识对应的第一编号和用户标识对应的第二编号进行处理,生成为关联编号。其中设备端标识对应的第一编号为表征设备端用户唯一性的编号,用户标识对应的第二编号为表征账户用户唯一性的编号;第一编号和第二编号之间的处理其实质为依据不同的登录场景判断第一编码和第二编号是否存在且唯一,在不存在或不唯一时对第一编号和第二编号的配置过程;以此生成关联编号,来表征设备端用户和账户用户之间的一致性。
步骤S30,根据所述关联编号,在所述设备端标识以及所述用户标识之间建立映射关系,以对所述用户在各所述预设系统的标识进行关联。
更进一步地,服务器在生成关联编号后,依据该关联编号,在设备端标识和用户标识之间建立映射关系;即将关联编号添加到用于登录各预设系统的各设备端的设备标识中,以及将关联编号添加到用于登录各预设系统的各用户账户的账户标识中;通过关联标识,实现用户在各预设系统中的不同标识之间的关联。后续只要用户使用具有关联编号的设备端或者使用具有关联编号的用户账户在各预设系统中的任意系统进行登录,即识别为同一用户;进而可从各预设系统中获取该用户此前登录行为所生成的数据进行数据共享,以更好的预测用户需求,进行精准的产品推荐或者服务提供。
步骤S40,在接收到登录请求并登录成功后,读取所述登录请求中携带的目标关联标识;
本实施例中,在将用户在各预设系统中的不同数据提取之后,服务器若接收到用户在任意场景下对任意预设系统进行登录操作的登录请求并登录成功后,对发起该登录请求的设备端的设备端标识进行读取,并判断设备端标识中是否携带有关联标识;若携带有关联标识则将其读取为目标关联标识,若不携带有关联标识则触发数据提取请求,以对用户在各预设系统之间的不同标识进行关联。
步骤S50,根据所述目标关联标识,确定具有映射关系的目标预设系统,并从所述目标预设系统中抓取与所述目标关联标识对应的用户数据。
更进一步地,服务器依据所读取的目标关联标识,确定具有映射关系的目标预设系统,即具有该目标关联标识的预设系统;进而依据目标关联标识从各目标预设系统中抓取用户数据,对具有该目标关联标识的用户账户或设备端在目标预设系统中所生成的用户数据进行抓取,以通过该抓取的用户在各个方面的数据来反映用户需求,更好的服务用户。
本实施例的数据提取方法,当侦测到数据提取请求时,先对用户在各预设系统对应的设备端标识和用户标识进行获取,再依据关联请求中所携带关联条件的类型,对各设备端标识对应的第一编号以及各用户标识对应的第二编号进行处理,生成关联编号;进而依据该关联编号,在各设备端标识和各用户标识之间建立映射关系,将关联编号添加到各预设系统的设备端标识,以及添加到各预设系统的账户标识中,实现对用户在各预设系统的标识进行关联;此后当接收到登录请求并登录成功时,对登录请求中携带的目标关联标识进行读取,并依据该目标关联标识,确定相互之间具有映射关系的目标预设系统,以从目标预设系统中抓取与目标关联标识对应的用户数据。通过关联编号所建立的映射关系来实现各预设系统之间的关联,使得用户在任意一个预设系统中所进行的用户行为,其他各预设系统均可获知该行为所对应的行为数据,方便了从各预设系统来取得用户的行为数据,提高了用户行为数据获取的效率。
进一步地,基于本发明数据提取方法第一实施例,提出本发明数据提取方法的第二实时例,在第二实施例中,所述根据所述关联条件的类型,对所述设备端标识对应的第一编号以及所述用户标识对应的第二编号进行处理,生成关联编号的步骤包括:
步骤b1,当所述关联条件的类型为第一类型时,判断所述设备端标识对应的第一编号以及所述用户标识对应的第二编号是否均存在;
本实施例针对通过Android移动设备端登录APP、web网页、h5页面的第一场景进行说明,该场景下设备端标识可用DeviceID(Device Identification,设备编码)表征,用户标识可用UID(User Identification,用户身份编码)表征,第一编码可用CustID1(Customer Identification 1,客户身份编码1)表征,第二编码可用CustID2(CustomerIdentification 2,客户身份编码2)表征,关联编码可用CustID(CustomerIdentification1,客户身份编码)表征。当依据关联条件中所携带的类型标识符确定关联条件的类型为第一类型时,则先判断设备端标识对应的第一编号以及用户标识对应的第二编号是否均存在;即判断设备端标识中是否存在表征设备端用户唯一性的编号,以及判断用户标识中是否存在表征账户用户唯一性的编号。
步骤b2,若所述第一编号和所述第二编号均存在,则判断所述第一编号和所述第二编号是否相同,若所述第一编号和所述第二编号相同,则将所述第一编号或所述第二编号确定为关联编号,若所述第一编号和所述第二编号不相同,则将所述第二编号确定为关联编号,并将所述第一编号更改为所述第二编号;
在判断出设备端标识中存在表征设备端用户唯一性的编号,且用户标识中存在表征账户用户唯一性的编号,即第一编号和第二编号均存在后,将第一编号和第二编号对比,判断两者之间是否相同,若相同,则将第一编号或第二编号确定为关联编号。若两者之间不相同,因账户用户的唯一性相对于设备端用户的唯一性来说,账户用户更能准确表征用户的唯一性,即第二编号的优先级高于第一编号,从而将第二编号确定为关联编号;同时将第一编号也更改为第二编号,以通过作为关联编号的第二编号来实现设备端与用户账户之间的关联。
步骤b3,若所述第一编号和所述第二编号均不存在,则根据与所述用户标识对应的手机号,生成关联编号;
进一步地,若经判断确定第一编号和第二编号均不存在,则依据用户标识对应的手机号,来生成关联编号。具体地,步骤b3包括:
步骤b31,当所述第一编号和所述第二编号均不存在时,则查找与所述用户标识对应的手机号,并判断所述手机号是否存在对应的第三编号;
服务器在判断出第一编号和第二编号均不存在后,则对与用户标识对应的手机号进行查找,与用户标识对应的手机号为用户在注册其用户账户时所填写的手机号。此后服务器判断该手机号是否对应存在表征手机号用户唯一性的编号,即判断手机号是否存在对应的第三编号。
步骤b32,若所述手机号存在对应的第三编号,则将所述第三编号生成为关联编号,并将所述第一编号和所述第二编号均变更为所述第三编号;
进一步地,服务器若判断出手机号存在对应的第三编号,则将该第三编号确定为关联编号,并将第一编号和第二编号均变更为第三编号。由第三编号作为设备端标识中表征设备端用户唯一性的编号,并由第三编号作为用户标识中表征账户用户唯一性的编号;通过作为关联编号的第三编号来实现设备端与用户账户之间的关联。
步骤b33,若所述手机号不存在对应的第三编号,则基于预设规则生成关联编号,并将所述第一编号、所述第二编号和所述第三编号均变更为所述关联编号。
更进一步地,服务器中预先设定有用于生成关联编号的预设规则,在判断出手机号不存在对应的第三编号后,调用该预设规则对关联编号进行生成,并将第一编号、第二编号和第三编号均变更为生成的该关联编号。通过所生成的关联编号来实现设备端与用户账户之间的关联,将具有第一编号的设备端用户,具有第二编号的账户用户以及具有第三编号的手机号用户定义为同一用户。
其中,关联编号可以是数字、字母或者两者的组合,预设规则为递增规则;在需要生成关联编号时,根据该递增规则对数字、字母或者两者的组合进行递增处理;例如,若前一次生成的关联编号为100,则当前在此基础上生成的关联编号标识为101。当然,预设规则也可以根据需求设定其他类型的规则,在此不做赘述。
步骤b4,若所述第一编号和所述第二编号中任意一项不存在,则根据所述第一编号和所述第二编号,以及与所述用户标识对应的手机号,生成关联编号。
进一步地,若判断出第一编号或第二编号不存在,服务器则结合第一编号和第二编号,以及与用户标识对应的手机号,一并来生成关联编号。具体地,步骤b4包括:
步骤b41,当所述第一编号存在,所述第二编号不存在时,查找与所述用户标识对应的手机号,并判断所述手机号是否存在对应的第三编号;
当第一编号和第二编号中表征设备端用户唯一性的编号,即第一编号存在,而表征账户用户唯一性的编号,即第二编号不存在时,服务器对与用户标识对应的手机号进行查找,并判断该手机号是否存在对应的第三编号。
步骤b42,若所述手机号存在对应的第三编号,则将所述第三编号生成为关联编号,并将所述第一编号和所述第二编号均变更为所述第三编号;
若经判断确定手机号存在对应的第三编号,此时虽然第一编号存在,但是手机号用户的唯一性相对于设备端用户的唯一性来说,手机号用户更能准确表征用户的唯一性,即第三编号的优先级高于第一编号。从而服务器将该第三编号确定为关联编号,并将第一编号和第二编号均变更为第三编号。由第三编号作为设备端标识中表征设备端用户唯一性的编号,并由第三编号作为用户标识中表征账户用户唯一性的编号;通过作为关联编号的第三编号来实现设备端与用户账户之间的关联。
步骤b43,若所述手机号不存在对应的第三编号,则判断所述第一编号是否具有对应的设备用户标识,若具有所述设备用户标识,则基于预设规则生成关联编号,并将所述第一编号、所述第二编号和所述第三编号均变更为所述关联编号;
若经判断手机号不存在对应的第三编号,则服务器对第一编号是否具有对应的设备用户标识进行判断,该设备用户标识为表征对设备端进行使用的用户唯一性的标识。若具有该设备用户标识,则说明该设备端的用户经过认证为唯一。调用预设规则生成关联编号,并将第一编号、第二编号和第三编号均变更为该生成的关联编号。通过所生成的关联编号来实现设备端与用户账户之间的关联,将具有第一编号的设备端用户,具有第二编号的账户用户以及具有第三编号的手机号用户定义为同一用户。
步骤b44,若所述第一编号不具有对应的设备用户标识,则将所述第一编号生成为关联编号,并将所述第二编号变更为所述第一编号;
进一步地,若第一编号不具有对应的设备用户标号,则将第一编号生成为关联编号,并将第二编号变更为第一编号,由第一编号来作为用户标识中表征账户用户唯一性的编号。通过作为关联编号的第一编号来实现设备端与用户账户之间的关联,定义用户的同一性。
步骤b45,当各所述第一编号不存在,所述第二编号存在时,将所述第二编号生成为关联编号,并将所述第一编号变更为所述第二编号。
针对第一编号和第二编号中表征设备端用户唯一性的编号,即第一编号不存在,而表征账户用户唯一性的编号,即第二编号存在时,考虑到账户用户相可准确表征用户的唯一性,在第二编号存在时,直接将第二编号作为关联编号。同时将第一编号变更为第二编号,由第二编号来作为设备端标识中表征设备端用户唯一性的编号。通过作为关联编号的第二编号来实现设备端与用户账户之间的关联,定义用户的同一性。
本实施例针对通过Android移动设备端登录APP、web网页、h5页面的第一场景,根据与设备端标识对应的第一编号和与用户标识对应的第二编号之间的一致性关系,来生成关联编号;实现设备端与用户账户之间的关联,定义用户的同一性,以便于具有关联编号的用户账户以及设备端之间的数据共享,方便用户多方数据的取得。
进一步地,基于本发明数据提取方法第一实施例,提出本发明数据提取方法的第三实时例,在第三实施例中,所述根据所述关联条件的类型,对所述设备端标识对应的第一编号以及所述用户标识对应的第二编号进行处理,生成关联编号的步骤包括:
步骤c1,当所述关联条件的类型为第二类型时,读取所述设备端标识对应的第一编号,并将所述第一编号划分为第一子编号和第二子编号,判断所述第一子编号、第二子编号以及所述用户标识对应的第二编号是否存在且均相同;
本实施例针对通过IOS移动设备端登录APP、web网页、h5页面的第二场景进行说明,该场景下设备端的设备端标识包括两类,一类用DeviceID表征,一类用IDFA表征;其中IDFA是跟Device相关的唯一标识符,可以用来打通不同app之间的广告。比如用户在淘宝里搜索了某个商品A之后,用户在使用浏览器去浏览网页的时候,网页的广告就会给用户展示相应的商品A的广告。针对设备标识的两个类型,对应的第一编号也是两个类型;当依据关联条件中所携带的类型标识符确定关联条件的类型为第一类型时,则对设备标识对应的第一编号进行读取,并将其划分为与DeviceID对应的第一子编号,以及与IDFA对应的第二子编号。此后判断该所划分的第一子编号和第二子编号是否为空值,以及用户标识对应的第二编号是否为空值,通过空值的判断来确定第一子编号、第二子编号以及第三编号是否存在。若第一子编号、第二子编号以及第二编号不为空值,则判定第一子编号、第二子编号以及第二编号均存在;进而在第一子编号、第二子编号以及第二编号之间对比,判断第一子编号、第二子编号以及第二编号之间的数值是否相同。
步骤c2,若所述第一子编号、第二子编号以及所述用户标识对应的第二编号存在且均相同,则将所述第一子编号、第二子编号和所述第二编号中的任意一项生成为关联编号;
进一步地,当经判断确定第一子编号、第二子编号和第二编号均不为空值,表征第一子编号、第二子编号和第二编号均存在,且经对比确定第一子编号、第二子编号和第二编号之间的数值均相同时,则将第一子编号、第二子编号以及第二编号中的任意一项生成为关联编号。
步骤c3,当所述第二编号存在,所述第一子编号或第二子编号不存在时,或者当所述第二编号、所述第一子编号以及所述第二子编号存在,所述第一子编号或第二子编号与所述第二编号不相同时,则将所述第二编号生成为关联编号,并将所述第一子编号和第二子编号均变更为所述第二编号;
更进一步地,若经确定第二编号不为空值,而第一子编号或第二子编号为空值,即第二编号存在,第一子编号或第二子编号不存在时,或者第二编号、第一子编号以及第二子编号均存在,但第一子编号或第二子编号与第二编号之间不相同,即第一子编号、第二子编号与第二编号之间的数值不相同时,同样因账户用户的唯一性相对于设备端用户的唯一性来说,账户用户更能准确表征用户的唯一性,即第二编号的优先级相对高于第一编号,而将第二编号生成为关联编号,并将第一子编号和第二子编号均变更为第二编号。步骤c4,若所述第二编号不存在,则查找与所述用户标识对应的手机号,并判断所述手机号是否存在对应的第三编号,若存在所述第三编号,则所述所述第三编号生成为关联编号,并将所述第二编号、所述第一子编号和所述第二子编号均变更为所述第三编号;
进一步地,若经判断确定第二编号不存在,因生成第一子编号和第二子编号的第一编号的优先级相对第二编号较低,此时无论是否存在第一子编号和第二子编号,均对与用户标识对应的手机号进行查找,并判断手机号是否存在对应的第三编号。若存在第三编号,同样的因第三编号的优先级高于第一编号,更能表征用户的唯一性;从而服务器将该第三编号确定为关联编号,并将第二编号、第一子编号和第二子编号均变更为该第三编号。由第三编号作为设备端标识中表征设备端用户唯一性的编号,并由第三编号作为用户标识中表征账户用户唯一性的编号;以通过作为关联编号的第三编号来实现设备端与用户账户之间的关联。
步骤c5,当不存在所述第三编号,且所述第一子编号和所述第二子编号均不存在时,则基于预设规则生成关联编号,并将所述关联编号分别设为所述第一子编号、所述第二子编号和所述第二编号;
更进一步地,当经查找确定手机号不存在对应的第三编号,且第一子编号和第二子编号均不存在时,则调用预设规则生成关联编号,并将生成的关联编号分别作为第一子编号、第二子编号和第二编号。通过所生成的关联编号来实现设备端与用户账户之间的关联,将具有第一子编号或第二子编号的设备端用户,与具有第二编号的账户用户一并定义为同一用户。
步骤c6,当不存在所述第三编号,且所述第一子编号和/或所述第二子编号均存在时,则根据所述第一子编号和所述第二子编号的优先级确定关联编号,并将所述第一子编号、所述第二子编号和所述第二编号均变更为所述关联编号。
当经查找确定手机号不存在对应的第三编号,且第一子编号和第二子编号之间存在任一项或者两者均存在时,依据第一子编号和第二子编号的优先级来确定关联编号。在第一子编号和第二子编号均存在时,将第一子编号的优先级设定为低于第二子编号的优先级,而将第二子编号设定为关联编号;在第一子编号和第二子编号仅存在一项时,将所存在的项作为关联编号。在确定关联编号后,将第一子编号、第二子编号和第二编号均变更为该关联编号。通过关联编号来实现设备端与用户账户之间的关联,将具有第一子编号或第二子编号的设备端用户,与具有第二编号的账户用户一并定义为同一用户。
本实施例针对第二场景依据设备标识对应的第一子编号、第二子编号以及用户标识对应的第二编号之间的存在和一致性关系,来生成关联编号;以此实现用户同一性的定义,以便于依据关联编号实现用户行为数据的共享,方便用户多方数据的取得。
进一步地,基于本发明数据提取方法第一实施例,提出本发明数据提取方法的第四实时例,在第四实施例中,所述根据所述关联条件的类型,对所述设备端标识对应的第一编号以及所述用户标识对应的第二编号进行处理,生成关联编号的步骤包括:
步骤d1,当所述关联条件的类型为第三类型时,将与所述设备端标识对应的第一编号和所述用户标识对应的第二编号屏蔽,并查找与所述用户标识对应的手机号;
进一步地,当依据关联条件中所携带的类型标识符确定关联条件的类型为第三类型时,则说明登录场景为企业用户通过其移动设备端向企业请求数据的第三场景。此时,直接将获取的与设备端标识对应的第一编号和与用户标识对应的第二编号进行屏蔽处理,不将第一编号和第二编号作为生成关联编号的依据。同时服务器对与用户标识对应的手机号进行查找,以通过手机号来生成关联编号。
步骤d2,判断所述手机号是否存在对应的第三编号,若存在所述第三编号,则将所述第三编号生成为关联编号,若不存在所述第三编号,则基于预设规则生成关联编号;
服务器对手机号是否存在对应的第三编号进行判断,若存在则将第三编号生成为关联编号;若手机号不存在对应的第三编号,则调用预设规则生成关联编号,以通过关联账户来定义各次向企业请求数据的移动设备端所对应的设备端用户为同一用户。
步骤d3,当所述关联条件的类型为第四类型时,将与所述设备端标识对应的第一编号屏蔽,并读取与所述用户标识对应的第二编号,以及与所述用户标识对应手机号的第三编号,判断所述第二编号和所述第三编号是否存在且一致;
更进一步地,当依据关联条件中所携带的类型标识符确定关联条件的类型为第四类型时,则说明登录场景为初始化用户手机信息的第四场景。此时对与设备端标识对应的第一编号进行屏蔽处理,并读取与用户标识对应的第二编号;同时对用户标识对应的手机号进行查找,并读取手机号对应的第三编号。判断第二编号和第三编号是否为空值,若两者均为空值或者两者中存在任意一项为空值,则判定第二编号和第三编号均不存在或者两者中存在某一项不存在;若两者者均不为空值,则将两者进行对比,判断两者之间的一致性。
步骤d4,若所述第二编号和所述第三编号存在且一致,则将所述第二编号或所述第三编号生成为关联编号;
若第二编号和第三编号均存在,且两者均对比一致,则将第二编号和第三编号中的任意一项生成为关联编号,以通过关联编号将账户用户和手机号用户定义为同一用户。
步骤d5,当所述第二编号存在,所述第三编号不存在时,将所述第二编号生成为关联编号,并将所述第三编号变更为所述第二编号;
若读取到的第二编号不为空值,而第三编号为空值,即第二编号存在,第三编号不存在时,将第二编号生成为关联编号,并将第三编号变更为第二编号,以通过关联编号将账户用户和手机号用户定义为同一用户。
步骤d6,当所述第二编号不存在,所述第三编号存在时,将所述第三编号生成为关联编号,并将所述第二编号变更为所述第三编号;
若读取到的第二编号为空值,而第三编号不为空值,即第二编号不存在,第三编号存在时,将第三编号生成为关联编号,并将第二编号变更为第三编号,以通过关联编号将账户用户和手机号用户定义为同一用户。
步骤d7,若所述第二编号和所述第三编号存在且不一致,则将所述第二编号生成为关联编号,并将所述第三编号变更为所述第二编号;
若读取到的第二编号不为空值,且第三编号也不为空值,即第二编号和第三编号均存在,但是第二编号和第三编号之间的数值大小不一致;此时,因账户用户更能准确表征用户的唯一性,而以第二编号为优先,将第二编号生成为关联编号,并将第三编号变更为第二编号,以通过关联编号将账户用户和手机号用户定义为同一用户。
步骤d8,若所述第二编号和所述第三编号均不存在,则基于预设规则生成关联编号,并将所述第二编号和所述第三编号均变更为所述关联编号。
若读取到的第二编号和第二编号均为空值,即第二编号和第三编号均为不存在时,调用预设规则生成关联编号,并将第二编号和第三编号均变更为关联编号,以通过关联编号将账户用户和手机号用户定义为同一用户。
本实施例针对第三场景依据手机号对应的第三编号来生成关联编码,而针对第四场景则依据用户标识对应的第二编号以及手机号对应的第三编号之间的一致性关系,来生成关联编号;以此实现用户同一性的定义,以便于依据关联编号实现用户行为数据的共享,方便用户多方数据的取得。
此外,请参照图2,本发明提供一种数据提取装置,在本发明数据提取装置第一实施例中,所述数据提取装置包括:
获取模块10,用于当侦测到数据提取请求时,获取用户在各预设系统的设备端标识和用户标识,并读取所述数据提取请求中携带的关联条件;
生成模块20,用于根据所述关联条件的类型,对所述设备端标识对应的第一编号以及所述用户标识对应的第二编号进行处理,生成关联编号;
关联模块30,用于根据所述关联编号,在所述设备端标识以及所述用户标识之间建立映射关系,将关联编号添加到各预设系统的设备端标识,以及添加到各预设系统的账户标识中,以对所述用户在各所述预设系统的标识进行关联;
读取模块40,用于在接收到登录请求并登录成功后,读取所述登录请求中携带的目标关联标识;
抓取模块50,用于根据所述目标关联标识,确定具有映射关系的目标预设系统,并从所述目标预设系统中抓取与所述目标关联标识对应的用户数据。
本实施例的数据提取装置,当侦测到数据提取请求时,获取模块10先对用户在各预设系统对应的设备端标识和用户标识进行获取,生成模块20再依据关联请求中所携带关联条件的类型,对各设备端标识对应的第一编号以及各用户标识对应的第二编号进行处理,生成关联编号;关联模块30进而依据该关联编号,在各设备端标识和各用户标识之间建立映射关系,将关联编号添加到各预设系统的设备端标识,以及添加到各预设系统的账户标识中,实现对用户在各预设系统的标识进行关联;此后当接收到登录请求并登录成功时,读取模块40对登录请求中携带的目标关联标识进行读取,并由抓取模块50依据该目标关联标识,确定相互之间具有映射关系的目标预设系统,以从目标预设系统中抓取与目标关联标识对应的用户数据。通过关联编号所建立的映射关系来实现各预设系统之间的关联,使得用户在任意一个预设系统中所进行的用户行为,其他各预设系统均可获知该行为所对应的行为数据,方便了从各预设系统来取得用户的行为数据,提高了用户行为数据获取的效率。
进一步地,在本发明数据提取装置另一实施例中,所述生成模块还用于:
当所述关联条件的类型为第一类型时,判断所述设备端标识对应的第一编号以及所述用户标识对应的第二编号是否均存在;
若所述第一编号和所述第二编号均存在,则判断所述第一编号和所述第二编号是否相同,若所述第一编号和所述第二编号相同,则将所述第一编号或所述第二编号确定为关联编号,若所述第一编号和所述第二编号不相同,则将所述第二编号确定为关联编号,并将所述第一编号更改为所述第二编号;
若所述第一编号和所述第二编号均不存在,则根据与所述用户标识对应的手机号,生成关联编号;
若所述第一编号和所述第二编号中任意一项不存在,则根据所述第一编号和所述第二编号,以及与所述用户标识对应的手机号,生成关联编号。
进一步地,在本发明数据提取装置另一实施例中,所述数据提取装置还用于:
当所述第一编号和所述第二编号均不存在时,则查找与所述用户标识对应的手机号,并判断所述手机号是否存在对应的第三编号;
若所述手机号存在对应的第三编号,则将所述第三编号生成为关联编号,并将所述第一编号和所述第二编号均变更为所述第三编号;
若所述手机号不存在对应的第三编号,则基于预设规则生成关联编号,并将所述第一编号、所述第二编号和所述第三编号均变更为所述关联编号。
进一步地,在本发明数据提取装置另一实施例中,所述生成模块还用于:
当所述第一编号存在,所述第二编号不存在时,查找与所述用户标识对应的手机号,并判断所述手机号是否存在对应的第三编号;
若所述手机号存在对应的第三编号,则将所述第三编号生成为关联编号,并将所述第一编号和所述第二编号均变更为所述第三编号;
若所述手机号不存在对应的第三编号,则判断所述第一编号是否具有对应的设备用户标识,若具有所述设备用户标识,则基于预设规则生成关联编号,并将所述第一编号、所述第二编号和所述第三编号均变更为所述关联编号;
若所述第一编号不具有对应的设备用户标识,则将所述第一编号生成为关联编号,并将所述第二编号变更为所述第一编号;
当各所述第一编号不存在,所述第二编号存在时,将所述第二编号生成为关联编号,并将所述第一编号变更为所述第二编号。
进一步地,在本发明数据提取装置另一实施例中,所述生成模块还用于:
当所述关联条件的类型为第二类型时,读取所述设备端标识对应的第一编号,并将所述第一编号划分为第一子编号和第二子编号,判断所述第一子编号、第二子编号以及所述用户标识对应的第二编号是否存在且均相同;
若所述第一子编号、第二子编号以及所述用户标识对应的第二编号存在且均相同,则将所述第一子编号、第二子编号和所述第二编号中的任意一项生成为关联编号;
当所述第二编号存在,所述第一子编号或第二子编号不存在时,或者当所述第二编号、所述第一子编号以及所述第二子编号存在,所述第一子编号或第二子编号与所述第二编号不相同时,则将所述第二编号生成为关联编号,并将所述第一子编号和第二子编号均变更为所述第二编号;
若所述第二编号不存在,则查找与所述用户标识对应的手机号,并判断所述手机号是否存在对应的第三编号,若存在所述第三编号,则所述第三编号生成为关联编号,并将所述第二编号、所述第一子编号和所述第二子编号均变更为所述第三编号;
当不存在所述第三编号,且所述第一子编号和所述第二子编号均不存在时,则基于预设规则生成关联编号,并将所述关联编号分别设为所述第一子编号、所述第二子编号和所述第二编号;
当不存在所述第三编号,且所述第一子编号和/或所述第二子编号均存在时,则根据所述第一子编号和所述第二子编号的优先级确定关联编号,并将所述第一子编号、所述第二子编号和所述第二编号均变更为所述关联编号。
进一步地,在本发明数据提取装置另一实施例中,所述生成模块还用于:
当所述关联条件的类型为第三类型时,将与所述设备端标识对应的第一编号和所述用户标识对应的第二编号屏蔽,并查找与所述用户标识对应的手机号;
判断所述手机号是否存在对应的第三编号,若存在所述第三编号,则将所述第三编号生成为关联编号,若不存在所述第三编号,则基于预设规则生成关联编号;
当所述关联条件的类型为第四类型时,将与所述设备端标识对应的第一编号屏蔽,并读取与所述用户标识对应的第二编号,以及与所述用户标识对应手机号的第三编号,判断所述第二编号和所述第三编号是否存在且一致;
若所述第二编号和所述第三编号存在且一致,则将所述第二编号或所述第三编号生成为关联编号;
当所述第二编号存在,所述第三编号不存在时,将所述第二编号生成为关联编号,并将所述第三编号变更为所述第二编号;
当所述第二编号不存在,所述第三编号存在时,将所述第三编号生成为关联编号,并将所述第二编号变更为所述第三编号;
若所述第二编号和所述第三编号存在且不一致,则将所述第二编号生成为关联编号,并将所述第三编号变更为所述第二编号;
若所述第二编号和所述第三编号均不存在,则基于预设规则生成关联编号,并将所述第二编号和所述第三编号均变更为所述关联编号。
其中,上述数据提取装置的各虚拟功能模块存储于图3所示数据提取设备的存储器1005中,处理器1001执行数据提取程序时,实现图2所示实施例中各个模块的功能。
参照图3,图3是本发明实施例方法涉及的硬件运行环境的设备结构示意图。
本发明实施例数据提取设备可以是PC(personal computer,个人计算机),也可以是智能手机、平板电脑、电子书阅读器、便携计算机等终端设备。
如图3所示,该数据提取设备可以包括:处理器1001,例如CPU(CentralProcessing Unit,中央处理器),存储器1005,通信总线1002。其中,通信总线1002用于实现处理器1001和存储器1005之间的连接通信。存储器1005可以是高速RAM(random accessmemory,随机存取存储器),也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
可选地,该数据提取设备还可以包括用户接口、网络接口、摄像头、RF(RadioFrequency,射频)电路,传感器、音频电路、WiFi(Wireless Fidelity,无线宽带)模块等等。用户接口可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口还可以包括标准的有线接口、无线接口。网络接口可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。
本领域技术人员可以理解,图3中示出的数据提取设备结构并不构成对数据提取设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图3所示,作为一种计算机可读存储介质的存储器1005中可以包括操作系统、网络通信模块以及数据提取程序。操作系统是管理和控制数据提取设备硬件和软件资源的程序,支持数据提取程序以及其它软件和/或程序的运行。网络通信模块用于实现存储器1005内部各组件之间的通信,以及与数据提取设备中其它硬件和软件之间通信。
在图3所示的数据提取设备中,处理器1001用于执行存储器1005中存储的数据提取程序,实现上述数据提取方法各实施例中的步骤。
本发明提供了一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者一个以上程序,所述一个或者一个以上程序还可被一个或者一个以上的处理器执行以用于实现上述数据提取方法各实施例中的步骤。
还需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个计算机可读存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是在本发明的构思下,利用本发明说明书及附图内容所作的等效结构变换,或直接/间接运用在其他相关的技术领域均包括在本发明的专利保护范围内。

Claims (9)

1.一种数据提取方法,其特征在于,所述数据提取方法包括以下步骤:
当侦测到数据提取请求时,获取用户在各预设系统的设备端标识和用户标识,并读取所述数据提取请求中携带的关联条件;
根据所述关联条件的类型,对所述设备端标识对应的第一编号以及所述用户标识对应的第二编号进行处理,生成关联编号;
根据所述关联编号,在所述设备端标识以及所述用户标识之间建立映射关系,将关联编号添加到各预设系统的设备端标识,以及添加到各预设系统的账户标识中,以对所述用户在各所述预设系统的标识进行关联;
在接收到登录请求并登录成功后,读取所述登录请求中携带的目标关联标识;
根据所述目标关联标识,确定具有映射关系的目标预设系统,并从所述目标预设系统中抓取与所述目标关联标识对应的用户数据。
2.如权利要求1所述的数据提取方法,其特征在于,所述根据所述关联条件的类型,对所述设备端标识对应的第一编号以及所述用户标识对应的第二编号进行处理,生成关联编号的步骤包括:
当所述关联条件的类型为第一类型时,判断所述设备端标识对应的第一编号以及所述用户标识对应的第二编号是否均存在;
若所述第一编号和所述第二编号均存在,则判断所述第一编号和所述第二编号是否相同,若所述第一编号和所述第二编号相同,则将所述第一编号或所述第二编号确定为关联编号,若所述第一编号和所述第二编号不相同,则将所述第二编号确定为关联编号,并将所述第一编号更改为所述第二编号;
若所述第一编号和所述第二编号均不存在,则根据与所述用户标识对应的手机号,生成关联编号;
若所述第一编号和所述第二编号中任意一项不存在,则根据所述第一编号和所述第二编号,以及与所述用户标识对应的手机号,生成关联编号。
3.如权利要求2所述的数据提取方法,其特征在于,所述若所述第一编号和所述第二编号均不存在,则根据与所述用户标识对应的手机号,生成关联编号的步骤包括:
当所述第一编号和所述第二编号均不存在时,则查找与所述用户标识对应的手机号,并判断所述手机号是否存在对应的第三编号;
若所述手机号存在对应的第三编号,则将所述第三编号生成为关联编号,并将所述第一编号和所述第二编号均变更为所述第三编号;
若所述手机号不存在对应的第三编号,则基于预设规则生成关联编号,并将所述第一编号、所述第二编号和所述第三编号均变更为所述关联编号。
4.如权利要求2所述的数据提取方法,其特征在于,所述若所述第一编号和所述第二编号中任意一项不存在,则根据所述第一编号和所述第二编号,以及与所述用户标识对应的手机号,生成关联编号的步骤包括:
当所述第一编号存在,所述第二编号不存在时,查找与所述用户标识对应的手机号,并判断所述手机号是否存在对应的第三编号;
若所述手机号存在对应的第三编号,则将所述第三编号生成为关联编号,并将所述第一编号和所述第二编号均变更为所述第三编号;
若所述手机号不存在对应的第三编号,则判断所述第一编号是否具有对应的设备用户标识,若具有所述设备用户标识,则基于预设规则生成关联编号,并将所述第一编号、所述第二编号和所述第三编号均变更为所述关联编号;
若所述第一编号不具有对应的设备用户标识,则将所述第一编号生成为关联编号,并将所述第二编号变更为所述第一编号;
当各所述第一编号不存在,所述第二编号存在时,将所述第二编号生成为关联编号,并将所述第一编号变更为所述第二编号。
5.如权利要求1所述的数据提取方法,其特征在于,所述根据所述关联条件的类型,对所述设备端标识对应的第一编号以及所述用户标识对应的第二编号进行处理,生成关联编号的步骤包括:
当所述关联条件的类型为第二类型时,读取所述设备端标识对应的第一编号,并将所述第一编号划分为第一子编号和第二子编号,判断所述第一子编号、第二子编号以及所述用户标识对应的第二编号是否存在且均相同;
若所述第一子编号、第二子编号以及所述用户标识对应的第二编号存在且均相同,则将所述第一子编号、第二子编号和所述第二编号中的任意一项生成为关联编号;
当所述第二编号存在,所述第一子编号或第二子编号不存在时,或者当所述第二编号、所述第一子编号以及所述第二子编号存在,所述第一子编号或第二子编号与所述第二编号不相同时,则将所述第二编号生成为关联编号,并将所述第一子编号和第二子编号均变更为所述第二编号;
若所述第二编号不存在,则查找与所述用户标识对应的手机号,并判断所述手机号是否存在对应的第三编号,若存在所述第三编号,则所述第三编号生成为关联编号,并将所述第二编号、所述第一子编号和所述第二子编号均变更为所述第三编号;
当不存在所述第三编号,且所述第一子编号和所述第二子编号均不存在时,则基于预设规则生成关联编号,并将所述关联编号分别设为所述第一子编号、所述第二子编号和所述第二编号;
当不存在所述第三编号,且所述第一子编号和/或所述第二子编号均存在时,则根据所述第一子编号和所述第二子编号的优先级确定关联编号,并将所述第一子编号、所述第二子编号和所述第二编号均变更为所述关联编号。
6.如权利要求1所述的数据提取方法,其特征在于,所述根据所述关联条件的类型,对所述设备端标识对应的第一编号以及所述用户标识对应的第二编号进行处理,生成关联编号的步骤包括:
当所述关联条件的类型为第三类型时,将与所述设备端标识对应的第一编号和所述用户标识对应的第二编号屏蔽,并查找与所述用户标识对应的手机号;
判断所述手机号是否存在对应的第三编号,若存在所述第三编号,则将所述第三编号生成为关联编号,若不存在所述第三编号,则基于预设规则生成关联编号;
当所述关联条件的类型为第四类型时,将与所述设备端标识对应的第一编号屏蔽,并读取与所述用户标识对应的第二编号,以及与所述用户标识对应手机号的第三编号,判断所述第二编号和所述第三编号是否存在且一致;
若所述第二编号和所述第三编号存在且一致,则将所述第二编号或所述第三编号生成为关联编号;
当所述第二编号存在,所述第三编号不存在时,将所述第二编号生成为关联编号,并将所述第三编号变更为所述第二编号;
当所述第二编号不存在,所述第三编号存在时,将所述第三编号生成为关联编号,并将所述第二编号变更为所述第三编号;
若所述第二编号和所述第三编号存在且不一致,则将所述第二编号生成为关联编号,并将所述第三编号变更为所述第二编号;
若所述第二编号和所述第三编号均不存在,则基于预设规则生成关联编号,并将所述第二编号和所述第三编号均变更为所述关联编号。
7.一种数据提取装置,其特征在于,所述数据提取装置包括:
获取模块,用于当侦测到数据提取请求时,获取用户在各预设系统的设备端标识和用户标识,并读取所述数据提取请求中携带的关联条件;
生成模块,用于根据所述关联条件的类型,对所述设备端标识对应的第一编号以及所述用户标识对应的第二编号进行处理,生成关联编号;
关联模块,用于根据所述关联编号,在所述设备端标识以及所述用户标识之间建立映射关系,将关联编号添加到各预设系统的设备端标识,以及添加到各预设系统的账户标识中,以对所述用户在各所述预设系统的标识进行关联;
读取模块,用于在接收到登录请求并登录成功后,读取所述登录请求中携带的目标关联标识;
抓取模块,用于根据所述目标关联标识,确定具有映射关系的目标预设系统,并从所述目标预设系统中抓取与所述目标关联标识对应的用户数据。
8.一种数据提取设备,其特征在于,所述数据提取设备包括:存储器、处理器、通信总线以及存储在所述存储器上的数据提取程序;
所述通信总线用于实现处理器和存储器之间的连接通信;
所述处理器用于执行所述数据提取程序,以实现如权利要求1-6中任一项所述的数据提取方法的步骤。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有数据提取程序,所述数据提取程序被处理器执行时实现如权利要求1-6中任一项所述的数据提取方法的步骤。
CN201910847221.5A 2019-09-06 2019-09-06 数据提取方法、装置、设备及计算机可读存储介质 Pending CN110704498A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910847221.5A CN110704498A (zh) 2019-09-06 2019-09-06 数据提取方法、装置、设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910847221.5A CN110704498A (zh) 2019-09-06 2019-09-06 数据提取方法、装置、设备及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN110704498A true CN110704498A (zh) 2020-01-17

Family

ID=69196166

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910847221.5A Pending CN110704498A (zh) 2019-09-06 2019-09-06 数据提取方法、装置、设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN110704498A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111291136A (zh) * 2020-01-21 2020-06-16 上海风秩科技有限公司 标识关联关系处理方法、装置、计算机设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106888200A (zh) * 2016-06-01 2017-06-23 阿里巴巴集团控股有限公司 标识关联方法、信息发送方法及装置
US20170286525A1 (en) * 2016-03-31 2017-10-05 Splunk Inc. Field Extraction Rules from Clustered Data Samples
CN107277036A (zh) * 2017-07-05 2017-10-20 云南撇捺势信息技术有限公司 基于多站点数据的登录验证方法、验证设备及存储介质
CN108965480A (zh) * 2018-09-07 2018-12-07 平安科技(深圳)有限公司 云桌面登录管控方法、装置及计算机可读存储介质
CN109684799A (zh) * 2018-08-21 2019-04-26 平安普惠企业管理有限公司 账户登录方法、登录装置、账户登录设备及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170286525A1 (en) * 2016-03-31 2017-10-05 Splunk Inc. Field Extraction Rules from Clustered Data Samples
CN106888200A (zh) * 2016-06-01 2017-06-23 阿里巴巴集团控股有限公司 标识关联方法、信息发送方法及装置
CN107277036A (zh) * 2017-07-05 2017-10-20 云南撇捺势信息技术有限公司 基于多站点数据的登录验证方法、验证设备及存储介质
CN109684799A (zh) * 2018-08-21 2019-04-26 平安普惠企业管理有限公司 账户登录方法、登录装置、账户登录设备及存储介质
CN108965480A (zh) * 2018-09-07 2018-12-07 平安科技(深圳)有限公司 云桌面登录管控方法、装置及计算机可读存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111291136A (zh) * 2020-01-21 2020-06-16 上海风秩科技有限公司 标识关联关系处理方法、装置、计算机设备和存储介质

Similar Documents

Publication Publication Date Title
CN109743315B (zh) 针对网站的行为识别方法、装置、设备及可读存储介质
CN107908485B (zh) 接口参数传递方法、装置、设备及计算机可读存储介质
US10212179B2 (en) Method and system for checking security of URL for mobile terminal
CN106534268B (zh) 一种数据共享方法及装置
CN104253686A (zh) 账号登陆的方法、设备及系统
CN106649446B (zh) 信息推送方法和装置
US11244153B2 (en) Method and apparatus for processing information
CN105515887B (zh) 应用测试方法、服务器及系统
CN105122760A (zh) 页面操作处理方法、装置及终端
CN104618388B (zh) 快速注册登录方法及对应的重置服务器、信息服务器
WO2018121266A1 (zh) 一种应用程序获取方法和装置以及一种终端设备
CN105577651A (zh) 服务提供方法及装置
CN112929224A (zh) 设备的配网方法、装置、服务器和计算机可读存储介质
CN104679824A (zh) 网络平台的网页生成方法及系统
CN108667768B (zh) 一种网络应用指纹的识别方法及装置
CN109688096B (zh) Ip地址的识别方法、装置、设备及计算机可读存储介质
CN110704498A (zh) 数据提取方法、装置、设备及计算机可读存储介质
CN109951549B (zh) 网络页面的访问方法、装置及计算机可读存储介质
CN112395020B (zh) 内网的安全防护方法、客户端、目标服务器及存储介质
CN111209325A (zh) 业务系统接口识别方法、装置及存储介质
CN110633432A (zh) 一种获取数据的方法、装置、终端设备及介质
CN116304403A (zh) 网页访问方法、装置、计算机设备及存储介质
CN106411891B (zh) 文件处理方法、装置、服务端和设备
CN111756916A (zh) 应用处理方法、装置、电子设备及计算机存储介质
CN108737350B (zh) 一种信息处理方法及客户端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20200117

WD01 Invention patent application deemed withdrawn after publication