CN110727885A - 一种互联网全局统一标识符生成系统及其生成方法 - Google Patents
一种互联网全局统一标识符生成系统及其生成方法 Download PDFInfo
- Publication number
- CN110727885A CN110727885A CN201810687789.0A CN201810687789A CN110727885A CN 110727885 A CN110727885 A CN 110727885A CN 201810687789 A CN201810687789 A CN 201810687789A CN 110727885 A CN110727885 A CN 110727885A
- Authority
- CN
- China
- Prior art keywords
- data
- module
- party
- internet
- global
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 15
- 235000014510 cooky Nutrition 0.000 claims abstract description 26
- 230000000694 effects Effects 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 9
- 238000012423 maintenance Methods 0.000 claims description 5
- 238000004140 cleaning Methods 0.000 claims description 3
- 238000007639 printing Methods 0.000 claims description 3
- 238000011017 operating method Methods 0.000 claims 2
- 238000013480 data collection Methods 0.000 claims 1
- 230000006399 behavior Effects 0.000 abstract description 2
- 230000004888 barrier function Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000007418 data mining Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000001550 time effect Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明公开了一种互联网全局统一标识符生成系统及其生成方法,系统包括用户身份标识采集模块、全局统一ID分配模块、应用层模块。本发明基于与各家第三方互联网服务提供商的商务合作,通过第三方互联网服务提供商提供的公开接口,在保留互联网用户在实际网络行为中的匿名性的前提下,通过Cookie、移动设备ID、第三方提供的用户标识等各种公认的统一标识方式,建立生命周期更长且跨屏跨平台的全局统一标识符数据库,有效地解决现有同类产品在数据公开性、数据有效性及数据稳定性方面的问题。本发明相比现有技术来说具有体量更大、数据精度更高、数据生命周期更长、数据开放度更大的优点。
Description
技术领域
本发明涉及互联网应用技术领域,具体涉及一种应用于互联网数字营销行业、大数据挖掘及分析行业、物联网行业等一系列与互联网相关行业的互联网全局统一标识符生成系统及其生成方法。
背景技术
根据中国互联网络信息中心(CNNIC)于今年1月31日发布的第41次《中国互联网络发展状况统计报告》,截至2017年12月,我国的网民规模已经达到了7.72亿,全年新增网民有4074万人,网民规模保持着稳定的增长。其中手机网民规模更是达7.53亿,占总体网民规模有97.5%,同时电视上网的网民规模也呈现提升的趋势,达到了28.2%。
在如此庞大的网民规模下,在网络上准确定位一个自然人是具有相当难度的:在现今的通信设备及互联网基础设施高速发展的情形下,每一个互联网民至少拥有2台能够连接网络的设备,甚至更多。同时因为应用需求不同,大多数网民在网络上的虚拟身份也有多种,例如同一个自然人,可以使用爱奇艺视频的会员身份观看喜欢的电影,同时也可以使用淘宝的会员身份进行网上购物,甚至可以通过新浪微博的用户身份发布一条有关之前观影或购物的博文。若可以通过一种统一标识的方式将这些设备的部分信息及用户账号体系串联起来,就可以使得数字营销更加精准,也能使得数据挖掘更加高效。
目前我国互联网服务提供商在常规情况下,仅通过技术是不可能准确定位到使用网络服务的自然人的,但是可以通过互联网服务提供商公认的统一设备标识,进行相对准确的定位,诸如PC(Personal Computer,个人电脑)端通常会用到的cookie(某些网站为了辨别PC用户身份而储存在用户本地终端上的小型文本文件);移动端设备通常用到的IDFA(Identifier for Advertising,苹果公司开发的用于商家监测广告效果的广告标识符)、IMEI(International Mobile Equipment Identity,国际移动设备识别码即通常所说的手机序列号)、AndroidID(安卓系统为开发者提供的用于标识手机设备的串号);互联网电视端通常用到的MAC地址(Media Access Control Address,一种用来确认网络设备位置的地址);所有接入互联网的设备都通用的IP地址(Internet Protocol Address,网际协议地址)。
以上各种设备标识都可以在局部条件下,进行互联网用户的甄别及一定时期内的定位追踪。但是都存在各自的问题:
1、Cookie的生成是由PC浏览器客户端生成的,各个浏览器生成该标识的原理各不相同,那么若同一网络访客在同一IP地址下,使用多种浏览器浏览同一域名下的网页,则会被认作多个访客,以至于有些PC广告效果难以被准确定性。同时Cookie还存在生命周期较短的问题,不利于数字广告服务提供商观察长期广告投放的效果;
2、IDFA、IMEI、AndroidID相比Cookie的生命周期稳定许多,但是传统产品无法有效将这些移动设备标识与个人电脑设备标识之间进行强关联,因此在跨屏的广告投放实例中很难进行更精准的频次控制以及监测广告投放人群触达的效果。
3、由于各互联网服务提供商的垂直业务及商业模式不同,往往同类产品无法打通不同域名及不同APP下的网络访客体系,从而也就很难做到跨平台的设备关联,使得广告在各种网域及APP中频繁出现,使得访客浏览体验降低。
发明内容
本发明针对上述现有技术的不足,提供了一种互联网全局统一标识符生成系统及其生成方法,其技术时效长、联屏效果好、平台联通率高。
为解决现有技术中存在的问题,采用的具体技术方案是:
一种互联网全局统一标识符生成系统,其包括用户身份标识采集模块、全局统一ID分配模块、应用层模块;其中,所述用户身份标识采集模块包括依次相连的需方平台数据服务模块、源数据采集模块和源数据处理模块,所述源数据采集模块实时收集需方平台数据服务模块中的实时数据,并将数据导入源数据处理模块,实现数据落地并生成打印相关日志;所述全局统一ID分配模块中包含有核心运算模块、核心数据库和有效性及生命周期管理模块,核心运算模块用于将从原数据处理模块中获取的数据行新增分配和合并信息,按照规定的数据结构导入核心数据库,所述有效性及生命周期管理模块针对统一ID的生命周期分多个数据区块进行维护更新;所述应用层模块包括应用接口端,用于通过应用接口端将相关数据开放给各互联网业务产品使用。
优选的方案,所述源数据采集模块是通过需方平台数据服务模块的实时出价、赢价信息和点击来实时收集数据。
进一步优选的方案,所述全局统一ID分配模块针对统一ID的生命周期进行分三个数据区块进行维护更新。
本发明还提供了一种互联网全局统一标识符生成方法,其包括以下步骤:
S1、首先通过第三方的请求数据流采集用户标识数据,并生成标志对;
S2、根据共现过相同特征的全局统一标识符进行合并;若在库中无法找到任何一条已有的记录,则对这条标识对分配一个新的全局统一标识,并保留其关系组;
S3、根据相同特征的全局统一标识符的更新时间进行定期清理,保留活跃度更高、数据更齐全、跨屏跨平台延伸性更强的访客信息。
步骤S1中,通过第三方互联网服务提供商提供的接口,获取到大量的原始数据;所述接口包含各个互联网服务商提供的IP地址、第三方ID、cookie值、IDFA(Identifier ForAdvertising,跟device相关的唯一标识符,可以用来打通不同app之间的广告)、IMEI(International Mobile Equipment Identity,苹果公司IOS系统专用的国际移动设备识别码)、AndroidID(系统会随机生成一个64位的数字,并把这个数字以16进制字符串的形式保存下来)、MAC地址(Media Access Control即硬件物理地址),将其按照第三方互联网服务商进行分类且转化为用户标识对。
步骤S2中,标识符合并的方法为:在某一家服务商提供过来的一批数据请求中,某个请求包含了某个网络访客的第三方ID、IP地址、cookie值,将其拼接成用户标识对{第三方ID、cookie}。同时在全局统一标识符库中已经有一条记录为A={第三方ID、IDFA}。若上述两个标识对中的第三方ID相同,则判断为同一访客信息,该用户标识对可以与A的记录进行合并,更新为A={第三方ID、IDFA、cookie}。
通过采用上述方案,本发明的一种互联网全局统一标识符生成系统及其生成方法与现有技术相比,其技术效果在于:
1、本发明相比现有技术,其体量更大、数据精度更高、数据生命周期更长、数据开放度更大。
2、本发明能够在原始数据的基础上进行跨屏跨平台的数据联纵以及信息更新,突破了现有技术时效短、联屏效果低、平台联通率低的瓶颈,打造了更有效更可靠的数据库。
3、本发明使用全局统一标识符,不仅可以解决PC端Cookie各浏览器之间的屏障,又可以解决其时效短的问题,即使Cookie有变化,也可以通过其他共有特征进行AdsameID自更新,以延长其数据的时效性。并且也可以基于全局统一标识符,打通各第三方互联网服务提供商数据之间的壁垒,为他们提供更加完整的访客识别信息。同时也可以有效地跨屏控制广告的曝光次数,提升了访客的浏览体验。
附图说明
图1为本发明一种互联网全局统一标识符生成方法的标识符生成流程图;
图2为本发明一种互联网全局统一标识符生成系统的系统模块示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明了,下面结合具体实例并参照附图,对本发明进一步详细说明。应该理解,这些描述只是示例性的,而并非要限制本发明的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本发明的概念。
本发明主要基于我方与各家第三方互联网服务提供商的商务合作,通过第三方互联网服务提供商提供的公开接口,在保留互联网用户在实际网络行为中的匿名性的前提下,通过前述的Cookie、移动设备ID、第三方提供的用户标识等各种公认的统一标识方式,建立生命周期更长且跨屏跨平台的全局统一标识符数据库,有效地解决了现有同类产品在数据公开性、数据有效性及数据稳定性方面的问题。
本发明一种互联网全局统一标识符生成系统,其模块图如图2所示,其主要分为三个模块:
用户身份标识采集模块:由传漾DSP(Demand-Side Platform,需求方平台)中的Bidder(实时出价)、Winnotice(赢价信息)、Click(点击)服务进行实时数据收集,经过Collector(原数据采集端)导入Kafka(原数据处理模块)实现数据落地并生成打印相关日志。
全局统一ID分配模块:从Kafka中获取数据通过Uniform Manager Serve(核心运算器)进行新增分配和合并信息之后,按照规定的数据结构导入Vedis Cluster(核心数据库),同时针对统一ID的生命周期分三个数据区块,进行维护更新。
应用层模块:通过Uniform Client(应用接口)将相关数据开放给传漾各个互联网业务产品使用。
本发明互联网全局统一标识符生成流程如图1所示:
首先,通过第三方的请求数据流采集用户标识数据并生成标志对:通过第三方互联网服务提供商提供的接口,获取到大量的原始数据,其中会包含各个互联网服务商提供的IP地址、第三方ID、cookie值、IDFA、IMEI、AndroidID、MAC。将其按照第三方互联网服务商进行分类且转化为用户标识对。
其次,根据共现过相同特征的全局统一标识符进行合并:例如在某一家服务商提供过来的一批数据请求中,某个请求包含了某个网络访客的第三方ID、IP地址、cookie值,则会将其拼接成用户标识对{第三方ID、cookie}。同时在全局统一标识符库中已经有一条记录为A={第三方ID、IDFA}。若标识对中的第三方ID相同,则判断为同一访客信息,该用户标识对可以与A的记录进行合并,更新为A={第三方ID、IDFA、cookie}。若在库中无法找到任何一条已有的记录,则对这条标识对分配一个新的全局统一标识,并保留其关系组。
最后,将会根据AdsameID的更新时间进行定期清理,以尽量保留活跃度更高、数据更齐全、跨屏跨平台延伸性更强的访客信息。
本发明的工作原理主要是:基于与我方合作的各家互联网服务提供商提供的第三方数据并基于长年的运营经验及数据积累,通过互联网访客相对稳定的共有特征,进行相对准确的访客识别。从而能够在原始数据的基础上进行跨屏跨平台的数据联纵以及信息更新,突破了现有技术时效短、联屏效果低、平台联通率低的瓶颈,打造更有效更可靠的数据库。
本发明使用全局统一标识符,不仅可以解决PC端Cookie各浏览器之间的屏障,又可以解决其时效短的问题,即使Cookie有变化,也可以通过其他共有特征进行AdsameID自更新,以延长其数据的时效性。并且也可以基于全局统一标识符,打通各第三方互联网服务提供商数据之间的壁垒,为他们提供更加完整的访客识别信息。同时也可以有效地跨屏控制广告的曝光次数,提升访客的浏览体验。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明的保护范围,凡在本发明的精神和原则之内,所作的任何修改、等同替换、均包含在本发明的保护范围之内。
Claims (6)
1.一种互联网全局统一标识符生成系统,其特征在于,其包括用户身份标识采集模块、全局统一ID分配模块、应用层模块;其中,所述用户身份标识采集模块包括依次相连的需方平台数据服务模块、源数据采集模块和源数据处理模块,所述源数据采集模块实时收集需方平台数据服务模块中的实时数据,并将数据导入源数据处理模块,实现数据落地并生成打印相关日志;所述全局统一ID分配模块中包含有核心运算模块、核心数据库和有效性及生命周期管理模块,核心运算模块用于将从原数据处理模块中获取的数据行新增分配和合并信息,按照规定的数据结构导入核心数据库,所述有效性及生命周期管理模块针对统一ID的生命周期分多个数据区块进行维护更新;所述应用层模块包括应用接口端,用于通过应用接口端将相关数据开放给各互联网业务产品使用。
2.根据权利要求1所述的一种互联网全局统一标识符生成系统,其特征在于,所述源数据采集模块是通过需方平台数据服务模块的实时出价、赢价信息和点击来实时收集数据。
3.根据权利要求1所述的一种互联网全局统一标识符生成系统,其特征在于,所述全局统一ID分配模块针对统一ID的生命周期进行分三个数据区块进行维护更新。
4.一种互联网全局统一标识符生成方法,其特征在于,其包括以下步骤:
S1、首先通过第三方的请求数据流采集用户标识数据,并生成标志对;
S2、根据共现过相同特征的全局统一标识符进行合并;若在库中无法找到任何一条已有的记录,则对这条标识对分配一个新的全局统一标识,并保留其关系组;
S3、根据相同特征的全局统一标识符的更新时间进行定期清理,保留活跃度更高、数据更齐全、跨屏跨平台延伸性更强的访客信息。
5.根据权利要求4所述的一种互联网全局统一标识符生成系统的工作方法,其特征在于,步骤S1中,通过第三方互联网服务提供商提供的接口,获取到大量的原始数据;所述接口包含各个互联网服务商提供的IP地址、第三方ID、cookie值、IDFA、IMEI、AndroidID、MAC,将其按照第三方互联网服务商进行分类且转化为用户标识对。
6.根据权利要求4所述的一种互联网全局统一标识符生成系统的工作方法,其特征在于,步骤S2中,对全局统一标识符进行合并的方法为:在某一家服务商提供过来的一批数据请求中,某个请求包含了某个网络访客的第三方ID、IP地址、cookie值,将其拼接成用户标识对{第三方ID、cookie};同时如在全局统一标识符库中已经有一条记录为A={第三方ID、IDFA},若上述两个标识对中的第三方ID相同,则判断为同一访客信息,该用户标识对可以与A的记录进行合并,更新为A={第三方ID、IDFA、cookie}。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810687789.0A CN110727885A (zh) | 2018-06-28 | 2018-06-28 | 一种互联网全局统一标识符生成系统及其生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810687789.0A CN110727885A (zh) | 2018-06-28 | 2018-06-28 | 一种互联网全局统一标识符生成系统及其生成方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110727885A true CN110727885A (zh) | 2020-01-24 |
Family
ID=69217194
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810687789.0A Pending CN110727885A (zh) | 2018-06-28 | 2018-06-28 | 一种互联网全局统一标识符生成系统及其生成方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110727885A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111984946A (zh) * | 2020-08-13 | 2020-11-24 | 深圳市奇虎智能科技有限公司 | 用户标识方法、装置、设备及存储介质 |
CN114116863A (zh) * | 2021-10-28 | 2022-03-01 | 上海欣兆阳信息科技有限公司 | 一种实时融合跨渠道消费者身份的方法和系统 |
CN116208671A (zh) * | 2023-05-05 | 2023-06-02 | 公安部信息通信中心 | 一种异构平台间知识传输方法、设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5797006A (en) * | 1995-07-21 | 1998-08-18 | Bull S.A. | Application integration architecture for a data processing platform |
CN103533530A (zh) * | 2013-09-26 | 2014-01-22 | 林毅 | 一种跨设备的用户对应及用户追踪方法、系统 |
CN104394118A (zh) * | 2014-07-29 | 2015-03-04 | 焦点科技股份有限公司 | 一种用户身份识别方法及系统 |
-
2018
- 2018-06-28 CN CN201810687789.0A patent/CN110727885A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5797006A (en) * | 1995-07-21 | 1998-08-18 | Bull S.A. | Application integration architecture for a data processing platform |
CN103533530A (zh) * | 2013-09-26 | 2014-01-22 | 林毅 | 一种跨设备的用户对应及用户追踪方法、系统 |
CN104394118A (zh) * | 2014-07-29 | 2015-03-04 | 焦点科技股份有限公司 | 一种用户身份识别方法及系统 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111984946A (zh) * | 2020-08-13 | 2020-11-24 | 深圳市奇虎智能科技有限公司 | 用户标识方法、装置、设备及存储介质 |
CN114116863A (zh) * | 2021-10-28 | 2022-03-01 | 上海欣兆阳信息科技有限公司 | 一种实时融合跨渠道消费者身份的方法和系统 |
CN114116863B (zh) * | 2021-10-28 | 2023-07-25 | 上海欣兆阳信息科技有限公司 | 一种实时融合跨渠道消费者身份的方法和系统 |
CN116208671A (zh) * | 2023-05-05 | 2023-06-02 | 公安部信息通信中心 | 一种异构平台间知识传输方法、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6612949B2 (ja) | オンラインメディアインプレッションデータを共有するための方法、装置及び記憶媒体 | |
WO2017080169A1 (zh) | 视频平台监控分析系统 | |
CN105960656B (zh) | 用于创建用于向多个事件分配归因得分的数据驱动归因模型的方法和系统 | |
US10616782B2 (en) | Cross-channel user tracking systems, methods and devices | |
US20170142482A1 (en) | Video platform monitoring and analyzing system | |
US20220358541A1 (en) | Systems and methods for cross-browser advertising id synchronization | |
US20190075344A1 (en) | Protecting user privacy during collection of demographics census data | |
CN110300084B (zh) | 基于ip地址的画像方法和装置,电子设备,可读介质 | |
US20140279045A1 (en) | Cross-domain id synchronization in online advertisement | |
US11930085B2 (en) | Matching and attribution of user device events | |
US8751303B2 (en) | Systems and methods of tracking online advertisement exposure | |
WO2012024316A4 (en) | Unified data management platform | |
CN103119565A (zh) | 利用分布式人口统计信息确定印象的方法和装置 | |
WO2021093423A1 (zh) | 一种标记用户的方法和装置 | |
CN107835132B (zh) | 一种流量来源跟踪的方法及装置 | |
US20150242885A1 (en) | Invitational content attribution | |
CN110727885A (zh) | 一种互联网全局统一标识符生成系统及其生成方法 | |
CN103136685A (zh) | 一种基于移动终端的用户属性进行定向广告的方法和系统 | |
US20150245110A1 (en) | Management of invitational content during broadcasting of media streams | |
CN106228391A (zh) | 广告监测的方法及系统 | |
US9306958B2 (en) | Methods, systems and media for detecting non-intended traffic using co-visitation information | |
CN104641389A (zh) | 增强广告服务度量确定 | |
CN110674426A (zh) | 网页行为上报方法和装置 | |
CN105630918A (zh) | 全网用户标签融合及用户标识统一方法 | |
KR100373988B1 (ko) | 로그파일 분석방법과 분석시스템 및 이 방법을 기록한컴퓨터로 읽을 수 있는 기록매체 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20200124 |
|
WD01 | Invention patent application deemed withdrawn after publication |