CN105190595A - 唯一地识别网络连接实体 - Google Patents

唯一地识别网络连接实体 Download PDF

Info

Publication number
CN105190595A
CN105190595A CN201380045933.6A CN201380045933A CN105190595A CN 105190595 A CN105190595 A CN 105190595A CN 201380045933 A CN201380045933 A CN 201380045933A CN 105190595 A CN105190595 A CN 105190595A
Authority
CN
China
Prior art keywords
entity
data
equipment
user
application
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201380045933.6A
Other languages
English (en)
Inventor
王长风
蒲旭东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Adelphic Inc
Original Assignee
Adelphic Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Adelphic Inc filed Critical Adelphic Inc
Publication of CN105190595A publication Critical patent/CN105190595A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/2866Architectures; Arrangements
    • H04L67/30Profiles
    • H04L67/306User profiles

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Transfer Between Computers (AREA)
  • Stored Programmes (AREA)

Abstract

跨越多个设备、用法和应用域,识别实体(设备、一个设备或设备集合的用户、设备上的一个或多个应用的用户等)。实体被分配有唯一实体身份,唯一实体身份从对实体建模的特征数据集合生成。特征数据通常包括确定性数据、设备和系统专用特征数据、以及用法特征数据。通过将识别使用哪个特征数据来生成实体身份的一个或多个规则应用至特征数据,生成身份。规则包括至少一个确定性规则、以及至少一个概率规则。周期性地,通过应用规则,身份被合并到被找到的一个或多个实体身份中,以表示相同实体。

Description

唯一地识别网络连接实体
技术领域
本公开主要涉及跨越多个设备、用法和应用域唯一地识别实体。
背景技术
通信网络日益变为连接现代社会中的社会结构的骨干。今天广泛使用的网络连接设备的类型不同于桌上型个人计算机、膝上型计算机、移动电话、平板设备、基于互联网的TV等,并且更多互联网连接设备被引入和/或设计。虽然这些设备提供对基于互联网的内容和应用的有准备访问,但是一直不容易确定与作出访问请求的设备相关联的个人或实体的身份。众所周知,唯一识别设备、用户或用户组(例如,家庭)的能力通常在很多应用中被要求,诸如,广告和行销、个性化内容或服务传送、裂纹检测、追踪互联网犯罪,并且与来自不同通信信道的用户数据集成到一起。在广告中,例如,广告商和销售人员通常希望跨越不同媒体内容(例如,网站、移动应用等)接洽相同用户(例如,作为目标和/或作为新目标),并且跨越所有这些媒体信道跟踪用户交互和响应、以及活动有效性。
对于移动应用,通常诸如iOSTM设备中的UDID和AndroidTMOS设备中的Android_ID的设备标识符被用于识别设备。该类型的标识符的主要优点在于,它们对于设备是唯一的,并且设备访问的所有应用理论上都共享相同标识符。然而,该相同优点产生私密性和安全性问题,并且这些问题阻碍用于识别目的的这样的标识符的使用。实际上,在一些情况下,使得这些设备标识符对于开发者不可访问。诸如MAC地址、IMEI和ESN的其他唯一设备标识符被建议为代替品。这些替代存在与UDID存在的那些相同的问题,但是因为不存在访问它们的清楚限定方式,所以它们很难使用。另一种方法是使用应用生成标识的问题。通过诸如openUDID、SecureUDID、以及ODIN的主动性可用的这些方法克服了设备专用方法的很多不足。然而,因为这些标识符由应用分配,所以它们仅对于允许访问它们的应用可访问。
从用法监控的观点看,设备专用和应用生成方法的另一种公共限制在于,它们不处理或解决识别使用不同设备(诸如,移动电话和平板电脑)访问相同内容的实体的问题。
HTTPcookie一直为用于识别web上的唯一用户的事实(defacto)标准。然而,基于cookie的技术存在的多个问题在于,它们不能在非基于浏览器的应用中被容易地使用,其现在解释大多数移动应用。而且,cookie是设备和浏览器专用的;相同设备上的两个浏览器(或者不同浏览器实例)从相同域接收两个不同cookie。相反地,当它们拜访特定域时,相同设备和浏览器的不同用户接收相同cookie。而且,在基于移动设备的浏览器中的cookie支持(support)不稳定,并且通常,该方法通过移动应用不很好地工作。甚至当cookie支持工作时,不同设备由不同cookie识别。而且,因为cookie被存储在客户端上,所以它们经受阻塞和删除。而且,因为私密性问题,浏览器通常实现使得日益容易地将它们禁用和删除的功能。
对于移动web,除了cookie之外的很多技术都被尝试用于设备标识。这些包括而不限于分组测错、网络信标、HTTP报头信息、IP地址等。这些变量仅通常不足以用作永久性设备标识符。这些方法可以与用于固定网络设备的基于指纹的设备标识方法相组合,但是结果具有变量可靠性。因为很少用户和设备级定制可用于用作区别特征,所以当被应用至移动web浏览器时,例如与固定web很好地合作的浏览器指纹变得不可靠。另外,相对于设备的用户,这样的信息仅与设备相关联。
现有技术的这些和其他缺点由本公开解决。
发明内容
本公开描述用于跨越多个设备、用法和应用域识别实体的方法、系统和计算机程序。如在此使用的,“实体”是以下之一:设备、一个设备或设备集合的用户、设备上的一个或多个应用的用户、以及所述设备或所述设备集合的一组用户(诸如,家庭)。
特别是,通过分配从对实体建模的特征数据集合生成的唯一实体身份,跨越多个设备-、用法-和应用-域识别实体。特征数据通常包括确定性数据、设备和系统专用特征数据、以及用法特征数据。通过将识别使用哪个特征数据来生成实体身份的一个或多个规则应用至特征数据,生成标识。规则包括至少一个确定性规则、和至少一个概率规则。周期性地,通过应用规则,身份被合并到被找到的一个或多个实体身份中,以表示相同实体。
根据一个实施例,用于识别实体的方法开始于生成用于实体的唯一实体身份。从对实体建模的特征数据集合,生成实体身份。特征数据通常包括与从特征数据类型集合选择的特征数据“类型”相关联的数据,该特征数据集合类型是以下一个或多个:确定性数据、设备和系统专用特征数据、以及用法特征数据。确定性数据是由提供商分配给用户的数据(例如,cookie、设备标识符、MSISDN、电话号码、电子邮件地址、诸如OpenId的用户标识符等)。设备和系统专用特征数据可以被彻底改变,并且通常是以下之一:操作系统(OS)类型、OS版本、系统时钟值、执行速度、最后安装的时间、最后引导的时间、系统默认语言、系统本地时间、时区偏移、定向、显示度量、全局唯一标识符(GUID)、模型、商标、以及构造版本。用法特征数据也可以被彻底改变,并且通常是以下之一:HTTP报头、用法代理信息、用户询问数据、应用发起时间、应用退出时间、网络类型、页加载时间、页卸载时间、访问的日期和时间、星期几、时刻、引用页、插件数据、地理数据、位置数据、URL查看数据、键入频率数据、以及手势数据。在该方法中,通过将选自规则集合中的一个或多个规则应用至特征数据,生成实体身份,一个或多个规则识别使用哪个特征数据来生成实体身份,其中,一个或多个规则包括至少一个确定性规则、以及至少一个概率规则。周期性地,通过应用规则,唯一实体身份被合并到一个或多个实体身份中,以表示相同实体。
在优选实施例中,通过对用法特征数据应用至少一个概率匹配规则,生成实体身份。在特定实施例中,概率匹配函数被应用至用法特征数据和编码特征属性集合之间的亲密度测量(例如,从距离度量得到)。以该方式生成的唯一实体身份保持在可由一个或多个应用访问的数据库(其他这样的唯一实体身份)中,诸如,广告(ad)引擎、产品推荐引擎、裂纹检测引擎、变换跟踪引擎、数据库程序等。从而,在一次使用情况下,应用是提供签名的广告引擎。然后,作出签名是否对应于由数据库中的唯一实体身份表示的实体的确定。确定步骤可以对签名编码,以生成编码后的签名,并且然后一个或多个规则被应用至编码后的签名,以确定结果是否对应于数据库中的唯一实体身份。如果是,则唯一实体身份被返回,其身份然后可用于由应用使用,以生成定制内容(或专用于唯一实体身份的其他内容)。然而,如果签名不对应于由数据库中的唯一实体身份表示的实体,则结果(其表示新的唯一实体身份)被添加至数据库。在实际实现中,根据实时规则处理结果,新实体身份到数据库的实际添加可以实时地作出,或者其可以在批处理模式下被添加。
在此描述的方法和标识机制对于识别通过一个或多个设备连接至通信网络的实体,并且作为响应将定制内容传递到实体,跟踪用户交互是有用的,并且对广告作出响应,甚至在没有预定义标识符存在(例如,在移动广告交易时)的情况下,基于另一个上下文中的交互(例如,在线)将一个媒体上下文(例如,移动)中的用户、以及来自不相交通信网络(诸如,在线和移动网络)的用户数据的集成作为目标并且作为新目标。如上所述,实体可以是用户、以及用户的子集,诸如,家庭内的个人。在简单实施例中,实体仅是物理设备本身。在典型设置中,并且当实体是用户或用户组时,实体通过诸如移动电话、平板电脑、桌上型或膝上型计算机、以及其他被连接设备的多个设备,访问网络。标识机制还使得能够标识使用一个或多个设备访问相同内容的实体。诸如,当家庭成员通过共享计算机访问相同内容时,其还可以用于识别使用相同设备访问内容的不同实体。当然,这些使用情况仅是示例性的。
以上概述了所公开主题的更多相关特征中的一些。这些特征应该被解释为仅是说明性的。很多其他有益结果可以通过以不同方式应用所公开的发明或者通过修改本发明获得,如将描述的。
附图说明
为了更彻底地理解本发明及其优点,现在结合附图对以下说明作出参考,在附图中:
图1图示了实体标识机制的代表性实现;
图2是图示用于创建和更新实体身份数据库的技术的流程图;以及
图3是图示针对实体身份数据库的查找的运行时处理的流程图。
具体实施方式
根据本公开,优选地,用户和它们的设备通过一个或多个特征的集合被识别,但是不是所有这些特征都需要同时被呈现。根据特征的性质,单个特征可能足以唯一地识别实体。从而,例如,当实体是使用单个设备的单个用户,并且特征是设备ID时,ID本身足以是标识符。另一方面,当设备ID不可用时,或者当相同用户使用多个设备访问内容时,该类型的单个标识符通常不可用于识别用户。实际上,并且如以下将看出的,当很多这些特征被组合(或者聚合)时,它们可以用于链接至相同实体。
从而,根据本公开的一方面,特征集合(或其子集)被关联到一起,以识别实体。优选地,规则集合用于选择特征集合(或特征的子集),以在识别实体时使用。在优选实施例中,规则包括一个或多个专家规则的集合、以及一个或多个概率(基于归纳的)规则的集合,其规则被应用至特征集合,以唯一地识别实体(从这样的实体标识符的现有数据库),或者生成新的这样的身份。在优选(但是非限制)实施例中,专家和归纳规则的组合提供用于通信网络中的实体标识的显著优点。将将看出的,这允许调节用于跨设备实体标识的签名信息。而且,该方法提供在使用情况下的显著优点,其中,期望使用用于将移动用户作为目标的在线数据源,但是不存在已知数据属性(诸如,电话号码、电子邮件地址等),以链接移动和在线标识符。
优选地,系统将特征签名的特定子集作为输入,并且检验排序规则的集合,以找到唯一标识符,优选实时地。还将看出,因为实体可以开始使用其特征集合和用法图案还未被识别的新设备或者其他原因,因为特征集合可能改变,通常不是所有特征都可以容易实时地链接至相同标识符。为此,并且根据本公开的另一方面,系统优选地具有常规地合并参考相同身份的标识符的离线处理,并且从而更新数据库。
在不意味限制的情况下,优选地,标识系统和功能驻留在服务器侧架构上或者与服务器侧架构结合,服务器侧架构包括例如简单n层架构、web门户、联合系统、应用服务器、基于云的架构等。这与实现在连接至网络的客户端设备内的功能相反。因此,当实体利用诸如移动电话、平板电脑、膝上型计算机等的多个设备,通过异构通信网络访问服务器时,相同标识符优选通过关联置信水平,可以链接至实体。如将描述的,对于移动设备,唯一标识符被用于web浏览器以及不同应用。
在一种(非限制)使用情况下,标识系统包括移动广告平台的组件。该类型的平台包括计算资源(系统、子系统、机器、程序、处理、数据库、接口、API等),以连接销售人/广告商与出版社/应用开发者。平台可以被用于创建移动广告交易,该移动广告交易允许广告商和出版社购买和出售移动广告印象,在每个印象之后都更加智能。当广告商对印象投标时,平台使得能够给广告商提供关于用户、设备、上下文和位置的信息(并且特别是实体身份),使得广告商可以作出更好的购买决定。移动广告平台创建用于购买和出售移动库存的更有效的市场,同时增加用于广告商的投资报酬率(通过帮助他们仅购买执行库存),以及增加用于出版社的eCPM(通过利用所包括的相关联听众信息,帮助他们出售他们的库存)。出版社提供能够访问他们的库存的广告平台(以使得平台能够将其出售),并且平台可以与出版社共享所得到的收入。广告平台还通过例如经由他们的拍卖处理购买印象,获得对第三方交易库存的访问,并且平台通过使用实时竞价拍卖,以目标方式将它们的库存出售给广告商和代理商,获得广告收入。移动广告平台还可以与第三方平台和服务集成,第三方平台和服务包括但不限于为广告商工作以以目标方式放置它们的广告的需求方平台、聚集将被用于以DSP为目标并且出售给DSP的听众数据的数据管理平台(DMP)、以及与出版社合作以聚集库存并且经由试图获得用于每个印象的最佳价格的交易出售其的供应方平台。
关于本公开的实体表示功能,移动广告平台使用标识机制,以通常经由HTTP(或SOAP或RESTful呼叫)接收(从呼叫应用)请求,并且作为响应,返回实体身份。优选地,然后使用实体身份检索对应数据属性,诸如,人口统计信息、心理图案、行为数据、以及意向数据。
图1中示出标识系统的组件。这些组件被分离示出,仅用于说明和解释的目的。组件可以或可能被分离地实现或者作为集成系统,并且一个或多个组件可以被共同定位或者相互远离。通常,一个或多个组件在计算机硬件中执行的计算机软件中被实现,优选地,在一个或多个机器、服务器、程序、处理、执行线程等中。机制还包括优选地由数据库管理系统管理的数据库和关联数据结构。
参考图1,标识系统100包括多个逻辑和/或功能子系统。第一子系统是将原始签名数据翻译为在系统中使用以定位和提取标识符的特征集合编码的签名提取子系统102。优选地,由唯一地识别实体的字符串属性ID和作为或者可以单独或一起使用以唯一地限定ID的值的模型参数集合来识别每个实体。该模型参数集合对实体建模,并且一起包括实体的唯一表示。该唯一表示在此被称为实体签名104。第二子系统是实时标识服务106及其关联实体数据库108。实体数据库108是包含要求用于通常基于传入属性的不同子集检索实体身份的模型参数的中心数据库。标识服务106通过使用被输入为询问参数集合的传入特征属性搜索数据库,识别数据库中的实体(假设存在一个)。搜索处理应用规则集合(如以下更详细描述的),并且计算匹配得分,导致从数据库108检索实体身份,或者创建(并且在其中存储)新实体身份。系统100还包括用于实体数据库108的维护和更新的第三子系统110。第四子系统112更新决定规则和功能。数据库108优选被连续地更新,例如,以添加新实体身份,更新用于每个实体身份的动态特征属性,删除复制实体身份(即,参考相同实体的身份),以及解析表示相同实体的一个或多个身份。
标识服务根据规则操作。这些规则包括应用至确定性(关键字)数据的专家规则103、以及应用至用法特征(动态)数据的概率规则105。规则优选地遵循(follow)规则定义接口107。
一个或多个客户端101通过作出对内容的请求,访问标识服务。对内容的请求通常与同网络连接实体相关联的确定性数据和/或用法特征数据相关联。根据本公开,当对内容的请求与诸如用法特征数据的非关键字数据(以下更详细地描述)相关联时,概率匹配函数(在规则105之一中限定)被应用至用法特征数据和编码特征属性集合之间的亲密度测量(例如,从距离度量得到),以确定与该请求相关联的实体身份是否已经存在于数据库108中。如果是,则使用实体身份,以便于对所述对内容的请求的响应。所请求的内容可以是任何一种类型,并且用法特征数据可以以任何方式与请求相关联。虽然客户端可以是移动设备,但是这不是限制。客户端可以是任何机器、系统、应用、或者不管协议、传输或请求语义如何,向系统作出请求的其他计算资源。如上所述,用于识别实体的方法开始于生成用于实体的唯一实体身份。从对实体建模的特征数据集合生成实体身份。特征数据通常包括与选自特征数据类型集合的特征数据“类型”相关联的数据,所述特征数据类型集合是以下一个或多个:确定性数据、设备和系统专用特征数据、以及用法特征数据。确定性数据有时被称为“关键字”数据,但是其他类型的数据有时被称为“非关键字”数据。
确定性数据是由提供商分配给用户的数据(例如,cookie、设备标识符、MSISDN、电话号码、电子邮件地址、用户标识符等)。设备和系统专用特征数据可以被彻底改变,并且通常是以下之一:操作系统(OS)类型、OS版本、系统时钟值、执行速度、最后安装的时间、最后引导的时间、系统默认语言、系统本地时间、时区偏移、定向、显示度量、全局唯一标识符(GUID)、模型、商标、以及构造版本。用法特征数据也可以被彻底改变,并且通常是以下之一:HTTP报头、用法代理信息、用户询问数据、应用发起时间、应用退出时间、网络类型、页加载时间、页卸载时间、访问的日期和时间、星期几、时刻、引用页、插件数据、地理数据、位置数据、URL查看数据、键入频率数据、以及手势数据。在该方法中,实体身份通过将选自规则集合中的一个或多个规则应用至手势数据生成,一个或多个规则识别使用哪个特征数据来生成实体身份,其中,一个或多个规则包括至少一个确定性规则、以及至少一个概率规则。周期性地,通过应用规则,唯一实体身份被合并到被找到的一个或多个实体身份中,以表示相同实体。
图2是图示如何引导并且更新实体数据库108的处理流程。
例程开始于步骤200,记录收集。优选地,在会话级组织事务数据,并且检索特征属性。通常通过预处理,识别关键字字段。在步骤202处,执行关键字到标识符处理。对于具有关键字(诸如但不限于:设备id、cookie、电子邮件地址、MAC、ESN、域专用标识符,诸如,出版社签约标识)的记录,使用key2id函数填充初始id字段。该函数可以使用诸如MD5、SHA-1等的散列函数、数学变换等实现。关键字到标识符处理还通过用所生成的标识符填充部分记录,更新数据库表。结果,数据库的一些部分包含具有统一标识符的记录,同时剩余记录具有还未填充的ID字段。然后,包括统一标识符的记录被表示为LinkedSet1。在步骤204处,对剩余记录应用概率匹配规则(ProbRule),并且使用来自非关键字字段的数据。优选地,在步骤202之后,对剩余的记录运行规则,以创建LinkedSet2。LinkedSet1和LinkedSet2的联合包括数据库中的所有记录的集合。在步骤206,执行跨设备链接。在该步骤中,LinkedSet1的子集针对已知关键字(诸如,电子邮件地址、电话号码等)被交叉参考,以优选地通过将所有生成的标识符设置为任何可应用记录中的第一个,同时删除其他,结合来自不同设备的记录。然后,受影响的数据记录被合并并且表示为LinkedSet3。在步骤208处,使用LinkedSet3创建用于跨设备链接的概率规则,作为具有标记实例的训练数据,并且其余作为未标记实例。然后,规则被应用至LinkedSet3的补充,以结合来自属于相同实体的不同设备的记录。
优选地,数据库的属性值还周期性地被更新,以反映值随着时间的改变。对于数值,与正常范围的偏差被计算用于即将到来的记录。当偏差超过特定阈值时,值被更新为新值,其中给定速率为Ht+1(F_i,)=θ*Ht(F_i,)(1-θ)*偏差,θ是范围[0,1]内的可调节参数。
图3是图示由用于从数据库的标识符查找的运行时间处理采取的步骤、以及引导和更新数据库时的更详细步骤的处理流程。该处理采用签名作为输入,并且执行一系列操作。这些操作开始于步骤300,首先标准化签名。在步骤302处,优选地,使用用于一个或多个特征中的每个的不同编码函数{H(F_i):I=1,2,...,n},对签名编码。然后,例程在步骤304处继续,以执行实体检测。优选地,检测通过对签名数据的逻辑决定处理完成,逻辑涉及一个或多个专家规则的集合、以及一个或多个概率规则。因此,在步骤306处,确定性关键字被检验用于查找,以找到匹配。该步骤可以经由散列查找等,通过关键字值查找执行。如果找到匹配,则在步骤308处,返回与关键字相关联的标识符。与步骤306同时,在步骤310处检验概率规则,具有多个可能结果之一。如果应用规则返回已知标识符,则在步骤312处,返回该标识符。如果应用规则不返回已知标识符,则新标识符被生成,并且然后在步骤314处被添加至数据库。在步骤316处,将新标识符返回到客户端。如果不进行标识,则在步骤318处,实体被登记用于进一步检验。优选地,步骤306和310并行地完成,但是这不是必要条件。
以下提供关于被估计以生成唯一实体身份的数据库和规则的附加详情。
如上所述,优选地,数据库中的每个实体通过唯一地识别实体的字符串属性ID与可以被单独或一起使用以唯一地限定ID的值的特征集合一起被识别。第一子系统通过应用一个或多个签名提取器以提供对由客户端或结合客户端提供的对特征数据之一或集合编码的特征集合,来创建实体签名104(在图1中)。根据特征的类型,以不同格式对不同特征编码。因此,在一个示例实施例中,通过变换集合,即,从特征空间F={ID,Fi,Timestamp:i=1,2,...,n}到表示空间H={ID,H(Fi):I=1,2,...,n},完成编码。变换H()可以是简单变换、包括一个或多个值的标量或矢量诸如:值、近因、频率、概率分布、分布的一个或多个参数等。
如上所述,一种类型的确定性标识符可以是(或包括)“关键字”。关键字是可以用于唯一地查找实体的ID的单个属性。关键字通常是由提供商分配给用户的标识符(例如,cookie、设备标识符、MSISDN、电话号码、电子邮件地址、用户标识符等)。关键字通常采用字符串格式。为了快速访问,变换可以使用诸如MD5、SHA-1等的散列函数实现。在该情况下,散列函数可以用于对原始关键字编码。例如,以下规则可以用于产生新关键字。从而,例如,使HASH(SEED)是散列函数(诸如,SHA1、MD5),产生具有关键字值“SEED(种子)”的字符串散列。然后,函数HASH(SEED)被用作新值。在不限于以上的情况下,以下种子关键字可以由默认值使用,用于特定流行移动设备OS,这导致ODNI-1等效关键字:用于iOS的MAC/UUID,用于Android的Anddroid_ID,以及用于基于Windows的电话的DeviceUniqueId。如果关键字不可用,则作为代替,可以生成并且使用随机种子。根据应用环境,应用数据传输机制的一些形式(诸如,iOS中的UIPasteboard)被用于发射散列值,以确保所有应用都使用相同ID。除了散列关键字之外,关于如何生成散列值的信息(例如,诸如MAC、IMEI等的关键字类型)还可以被发射至系统,以便于处理。
通过很多客户端设备,通常从单个设备同时使用多个应用并且甚至web浏览器实例。如在此描述的,特征收集的主要目标在于,生成可以用于将所有应用和web用法链接至相同用户(或所限定用户组)的统一标识符。对于web浏览器,通常cookie被用作默认关键字。为了将散列ID链接至浏览器cookie,可以从具有到服务器的URL的应用打开浏览器,然后如果其还未退出,则设置cookie。在处理中,散列关键字使用已知机制(例如,URL装饰机制)与cookie一起被发送至服务器。在移动设备中,诸如用于iOS的UDID的设备ID、以及MAC、MEID、IMEI、以及ESN可以被用作这样的关键字。
转到非关键字数据,优选地,诸如访问持续时间、时区偏移等的数值特征变量被编码为数值,并且特别是为数值属性的格式。诸如设备模型的种类特征被用作这样的数据,并且优选地被编码为字符串或整数种类编码。另一种编码类型是范围,诸如,星期几、时刻、以及呼叫持续时间。种类特征还可以被分组为集合,集合优选地被用作单个特征实体。诸如访问图案的其他特征可以以概率分布的形式表示。一个这样的属性可以是以下之一:典型访问图案、应用的使用持续时间、以及网站内容。概率分布可以被参数表示,或者变量可以被分组,并且使用累积分布。特征集合可以包括通过一个或多个变换的以上属性的直接编码。而且,还可以包括诸如用户到行为种类的分类、社会团体和家庭的推断属性。
当相同实体使用不同设备访问相同内容时,来自不同设备的标识符可以使用诸如电子邮件的共享关键字或其他关键字匹配,或者联合通过用法和其他外部特征,链接至相同实体。优选地,并且如在以下更详细描述的,这通过查找步骤完成,查找步骤包括对所选特征子集应用包括专家规则和概率规则的规则集合。
如图1中所示,标识服务子系统使用现在描述的标识规则集合。实时地或者作为后端处理,优选使用一个或多个距离度量的集合,以测量每个编码特征属性H(Fi)与输入属性的亲密度。根据属性的类型,以下类型的距离度量可以被使用:数值距离(欧几里得距离)、种类距离、字符串距离(包括基于令牌环的距离,诸如TF-IDF)、集合成员、以及概率距离(用于与诸如访问持续时间、时刻等的属性一起使用)。
有利地,在单个架构中一起使用多个距离度量。从而,例如,可以对设备模型和用户代理商使用字符串度量;可以对上下文种类和一些典型人口统计属性使用种类度量。可以对访问时间、行为特征等使用概率距离。特别是,期望限定关于距离度量的规则集合,其然后使用专家和概率规则被混合,以识别并且检索唯一实体身份。
例如,在移动广告的情况下,可以由具有或不具有诸如cookie、设备ID、客户端IP地址、纬度或经度等的确定性数据的系统,接收对广告的请求(“广告请求”)、以及指示内容的URL。可以存在多个专家规则,诸如:对诸如cookie、设备ID、或电子邮件地址的确定性数据使用快速字符串匹配;对诸如经度和纬度等的其他类型的确定性数据使用距离匹配(例如,使用数值距离度量)。以上可以生成一个或多个候选实体身份。优选地,还存在至少一个概率性匹配规则,其然后被应用以过滤进一步跨越数据库中的窄搜索窗口的实体身份(并且以更细粒度方式)。一个这样的概率规则可以是:计算关于包括以下一个或多个的用法的联合分布的匹配:内容类型、时刻、使用持续时间等。针对数据库或者针对从数据库返回的结果,可以存在一个或很多通道(pass)。在以此方式应用专家和概率规则之后,返回对广告请求的响应。该响应可以是实体身份或者基于从数据库搜索返回的实体身份选择的给定内容(例如,广告)。
在不限制的情况下,结合规则使用的距离度量可以是二进制匹配距离。最简单规则是关于关键字值的二进制匹配。在该情况下,如果并且只有两个属性的编码准确地匹配,则Distance(H(FKey),H(Skey)=0。传统上,二进制匹配得分被用于具有字符串属性的记录链接。该方法可以使用距离度量扩展至其他类型的属性。通常,为每个特征属性,设置阈值。如果属性高于阈值,则规则匹配得分被设置为1(不匹配)和0(其他)。这允许子系统将二进制匹配规则扩展至任何类型的属性,并且得出同时涉及更多属性的实际概率规则。例如,并且使用对关于集合的距离的二进制规则,如果传入属性是集合成员,则考虑匹配(值0),否则考虑不匹配(值1)。作为另一个实例,二进制得分可以扩展至概率分布。从而,当属性是概率分布时,二进制规则被用于优选地通过置信度,描述特征属性是否来自分布函数。
更通常情况是分配表示匹配度的标量得分(例如,[0,1]之间的连续变量)。使用得分来通过建模限定规则。匹配规则确定如何使用签名数据识别唯一实体身份。对于每个输入特征集合{Si,1<=I<=n},系统针对数据库中的候选匹配记录的子集,计算每个特征的距离。匹配规则将该距离作为输入,并且作出特征是否被映射至数据库中的现有实体身份的决定。
确定性规则是返回一个或多个实体身份(每个都与标识符相关联)的规则:
规则:{DistanceOf(H(Fi),H(Si)):1<=I<=n}→ID。
简单实例是当输入特征Si是cookie时。在这样的情况下,DistanceOf函数然后使用准确字符串匹配规则,采用为1(其中,不存在匹配)和0(当存在匹配时)的值估计。在另一个实例中,使用IP地址和位置参数,专家规则可以规定设备模型被一起使用;当参数返回DistanceOf=0时,找到匹配。当然,这些实例仅是代表性的。
然而,当不存在将被用作用于查找标识符的关键字的特征时,优选地使用一个或多个概率规则。优选方法实现记录链接定向调节的概念。记录链接(RL)是指找到数据集合中的记录的任务,数据集合中的记录是指跨越不同数据源(例如,数据文件、书、网站、数据库)的相同实体。当基于可能或可能不共享公共标识符的实体,结合数据集合时,记录链接是必须的。该类型的数学理论在由Fellegi和Sunter作出的名为“Atheoryforrecordlinkage”的文章和由其他人作出的随后工作中描述。一种类型的记录链接是基于确定性或规则的记录链接,其基于在可用数据集合之间匹配的各个标识符的数量生成链接。更复杂方法、概率记录链接考虑更广泛范围的可能标识符,基于正确识别匹配或不匹配的其估计能力,计算用于每个标识符的权重,并且使用这些权重计算两个给定记录是指相同实体的概率。在该方法中,具有超过特定阈值的概率的记录对被认为匹配,而具有低于另一个阈值的概率的记录对被认为不匹配;落在这两个阈值之间的概率对被认为“可能匹配”,并且可能或可能不被链接。本公开的技术优选利用该记录链接定向调节,优选地结合专家规则。
当永久存储的标识符(诸如,cookie或来自客户端侧的设备标识符)对于系统不可用时,这样的方法是有利的。使用概率规则的另一种情况是便于跨设备关键字链接。还有的另一种用法是在单独用户和/或用户组(诸如家庭)识别中创建和/或检索实体身份。多半时间,相同用户使用多个设备。虽然存在确定性关键字(诸如,用于每个设备的设备id或cookie)可能发生,但是不存在将两个关键字链接至设备的相同用户的数据。本公开解决该使用情况。
作为上述RL技术的一般化,概率规则是基于具有关于匹配和失配的置信度(ConfidenceMatch>ConfidenceUnmatch>=0)的匹配的评级(rankscore)作出决定的规则
RankScore(ID|(Fi,Si):1<=I<=n)=
RankScore(γ=Kernel(DistanceOf(H(Fi),H(Si))<Thresholdi):1<=I<=n),
以上,Kernel()是预定义函数,测量匹配度,并且Thresholdi是预定义参数。当Kernel()是指示符函数时,值1指示特征属性的匹配,并且值0表示没有匹配。通常,核函数可以被用于更好地测量匹配度。不同核函数可以根据特征属性的类型被使用。
Rule:
IfRankScore(γ)>ConfidenceMatchthenIDisamatch
ElseIfRankScore(γ)<ConfidenceUnmatchIDisnotamatch
ElseInvestigate
优选地,从数据库中的历史数据生成概率规则,如以下描述的。
如上所述,本公开的技术使得签名数据能够与专家规则和概率规则的应用一起,通过签名集合编码识别唯一实体。这通过以下形式的规则集合:
Rule(Si,t:1<=i<=n)→ID。
优选地,规则被排序和排列{Rule_k:k=1,..,m}。一个或多个准则可以被用于排列,其中,排列的详情取决于数据分布。在一个实施例中,默认规则排列遵循以下顺序。首先,选择具有确定性关键字的特征集合。第二,基于出现的频率,按照降序排列特征集合,得到关键字集合Skey1>Skey2>...>Skeyn。然后,确定性规则被检验,Rule(Skey)按照出现的顺序被检验,并且返回找到ID的第一时间。最后,如果没有找到具有确定性关键字的ID,则检验概率规则。
如在Felligi-Sunter方法中描述的,优选地从历史数据集合生成(学习)概率规则。学习的目标在于得到可以用于匹配和排列到识别数据库中的那些的输入实体的得分函数。即,期望学习评级函数,使得对于每个匹配矢量γ,计算得分RankScore(γ)。多个方法可以被实现用于此目的,例如,基于无监督学习的方法,以及基于监督学习的其他方法。在无监督学习设定中,采用记录链接架构。在该架构中,使用两个概率计算评级得分为
RankScore(γ)=Prob(γ|Matched)/Prob(γ|Unmatched)
其中,Matched和Unmatched分别是从输入流到数据库的对的匹配集合和不匹配子集。
计算得分的一种方式是计算概率Prob(γ|Matched)和Prob(γ|Unmatched)、以及Prob(Matched)和Prob(Unmatched)。二进制距离函数的使用大大简化了处理。当涉及更多字符串属性时,可以使用以下更一般公式表示:
Prob(γ|C)=f(∑iWiKernel(γi,θi),
其中f是诸如分对数函数的函数,C是种类(Matched或Unmatched),以及Wi和θi是将被学习的参数。
以下是机器学习算法(例如,EM)如何被用于计算概率的实例。另一种方法是使用分类规则用于该目的。优选地,通过关于交易数据(例如,跨越给定周期的所有交易)的固定滑动窗口,周期性地更新概率。特定窗口尺寸优选地取决于成交额和数据的复杂性。可以使用引导数据库计算概率,以基于来自时间窗的数据计算匹配得分,其中,Tb=短移动窗口(取决于特定维度的小时或天),并且Ta=数据库中的使用的时间窗口。为了创建引导数据库,可以实现以下步骤。首先,获取具有已知ID的记录的子集。然后选择唯一关键字Skey和非重叠时间间隔Ta<Tb。接下来,然后选择具有关键字Skey的足够大子集的记录:
i.A={ID,Fkey,H(Fi),t:Fi是非关键字属性,t在Ta中}以及
ii.B={ID,Fkey,H(Fi),t:Fi是非关键字属性,t在Tb中}
此后,形成笛卡儿AxB,其中,Match是结果中的对的子集,使得ID匹配,并且使剩余对不匹配。然后,程序计算概率P(Match)和P(Unmatch)。然后,程序通过估计每个维度H(Fi)的边际分布,最大化对数似然。然后,重复至少两个步骤,直到概率会聚到所计算的概率为止。然后,使用以上概率生成用于没有已知ID的记录的ID。然后,由完全数据库代替引导数据库,并且以上步骤开始于形成笛卡儿,并且继续被重复,以校准新概率分布。
用于本主题的使用情况可以改变,但是典型情形如下。该技术可以在具有与其相关联的数据库的运行时平台中实现。平台对通常经由http等接收的请求进行响应,查找数据库以识别实体身份,检索该实体身份,使用检索的实体身份处理请求,并且然后返回响应。可以从出版社、广告网络、广告交易(出售媒体的所有实体)接收请求,或者可以从广告商等(设法购买媒体的实体)接收该请求。可以分布数据库。对平台的请求可以响应于一些其他请求发生,诸如,移动设备的用户向出版社网站作出请求。该情形下的目标在于将目标广告返回给移动设备用户。为此,运行时平台执行实体身份确定,并且可选地,广告选择函数。特别是,平台针对广告的存货与输入请求匹配,并且试图响应于该请求,找到最佳广告以返回。
广告请求可以到达具有与确定性数据关键字相关联的数据的平台,在该情况下,数据通常被用于实体身份查找(基于一个或多个确定性(专家)规则)。如上所述,这样的确定性数据通常是cookie、设备ID(例如,UDID、ODIN、OpenUDID、Android_ID等)、电子邮件地址、电话号码等。在应用距离度量(通常是数值字符串距离)等之前,确定性数据可以被编码(例如,使用字符串编码),以识别实体数据库中的可能匹配。在更感兴趣的情形下,不存在确定性数据,这样的数据(如果存在请求)的请求或估计不从数据库生成实体身份,在该情况下,则必须使用可用动态(非关键字)数据(和一个或多个概率规则)确定实体身份。如上所述,该特征数据可以为多种类型:IP地址、用户代理、位置、上下文、一些行为数据等。如上所述,在该方法中,生成一个或多个特征集合属性的编码H(Fi)。在对数据库查找期间,使用距离度量测量每个编码特征属性(或这样的属性集合)到传入属性的亲密度。距离度量可以是数值距离、种类距离、字符串距离、集合成员、或者概率距离。然后,应用概率函数,以计算关于数据库中的实体身份的匹配。优选地,与移动广告平台交互的移动设备是智能电话或平板电脑,诸如,、基于AndroidTM的移动设备等。这样的设备通常包括诸如,任何基于Intel或AMD的芯片的CPU(中央处理单元)、诸如RAM的计算机存储器、以及驱动器。设备软件包括操作系统(例如,AppleiOS、Android等)、以及一般支持应用和工具。设备还可以包括图形处理单元(GPU)。触敏设备或接口(例如,触摸屏)被配置成从用户的触摸接收输入。触敏设备识别触摸、以及触摸在触敏表面上的位置、动作和幅度(手势)。
一般地,移动设备可以是通信网络上的任何联网设备,诸如蜂窝电话、寻呼机、个人数字助理(PDA,例如,具有GPRSNIC)的有线或无线客户端设备、具有智能电话客户端的移动计算机等。可以实现该技术的其他移动设备包括能够使用无线协议以无线方式发送和接收数据的任何访问协议-使能设备(例如,设备、基于AndroidTM的设备等)。典型无线协议是:WiFi、GSM/GPRS、CDMA或WiMax。这些协议实现ISO/OSI物理和数据链路层(层1&2),传统连网堆栈基于其被建立,连同IP、TCP、SSL/TLS和HTTP。
在代表性实施例中,移动设备是基于GPRS(通用无线分组业务)操作的蜂窝电话,其是用于GSM网络的数据技术。除了传统语音通信之外,给定移动设备可以经由很多不同类型的消息传输技术与另一个这样的设备通信,包括SMS(短消息服务)、增强SMS(EMS)、多媒体消息(MMS)、电子邮件、WAP、寻呼、或其他已知或随后开发的无线数据格式。一般地,如在此使用的移动设备是3G(或下一代)兼容设备,包括订户身份模块(SIM),其是承载订户专用信息的智能卡、移动设备(例如,无线电和关联信号处理设备)、人机接口(MMI)、以及到外部设备的一个或多个接口(例如,计算机、PDA等)。在此公开的技术不限于用于与使用特定访问协议的移动设备一起使用。移动设备通常还支持用于无线局域网(WLAN)技术,诸如,Wi-Fi。WLAN基于IEEE802.11标准。
一般地,实现移动广告标识系统的机器通常包括商用硬件和软件、存储器(例如,硬盘、硬盘阵列等)以及存储器(RAM、ROM等)。在系统中使用的特定机器不是所公开技术的限制。给定机器包括网络接口和软件,以便以普通方式将机器连接至网络。主题可以使用连接或可连接至一个或多个网络的机器集合被实现为独立产品或者管理服务。更通常地,使用一个或多个计算相关联实体(系统、机器、处理、程序、库、函数等)的集合,提供产品或服务,一个或多个计算相关联实体一起便于或提供上述发明功能。在典型实现中,服务包括一个或多个计算机的集合。代表性机器是运行商用(例如,Pentium-class)硬件的基于网络的服务器、操作系统(例如,Linux、Windows、OS-X等)、应用运行时环境(例如,Java、.ASP)、以及应用或处理集合(例如,AJAX技术、Java程序或小服务程序、可链接库、本机代码等,取决于平台)的基于网络的服务器,其提供给定系统或子系统的功能。显示器可以用于提供可视输出。如上所述,产品或服务可以在独立服务器中或者跨越机器的分布式集合被实现。当使用软件和服务(SaaS)时,可以承载一个或多个功能。通常,根据期望实现环境,服务器连接至公开可路由互联网、内联网、专用网、或其任何组合。
实现上述功能的服务提供商架构包括机器、系统、子系统、应用、数据库、接口和其他计算和通信资源。在一个实施例中,预测数据服务提供商架构包括IP交换机、一个或多个web服务器机器的集合、一个或多个应用服务器机器的集合、数据库管理系统、以及一个或多个管理机器的集合。代表性web服务器包括商用硬件(例如,基于Intel)、诸如Linux的操作系统、以及诸如Apache2.x的web服务器。代表性应用服务器机器包括商用硬件、Linux、以及诸如Tomcat、JBoss或WebLogic9.2(或随后)的应用服务器。数据库管理系统可以被实现为在Linux上运行的Oracle(或等效)数据库管理分组。基础结构可以包括名称服务、FTP服务器、MRCP(媒体资源控制协议)服务器、负载均衡装置、其他交换机等。每个机器通常包括足够的硬盘和存储器、以及输入和输出设备。如果以Java编写控制程序,则每个机器上的软件环境包括Java虚拟机(JVM)。通常,web服务器处理传入http请求,并且它们输出界面作为网页集合。应用服务器管理上述基本功能。管理服务器处理管理功能,包括但不限于登记、记账、报告等。虽然以上描述了由本发明的特定实施例执行的特定顺序的操作,但是应该理解,这样的顺序是示例性的,作为替代实施例,可以以不同顺序执行操作,组合特定操作,使特定操作重叠等。在说明书中对给定实施例的参考指示所描述的实施例可以包括特定特征、结构、或特性,但是每一个实施例都可能不一定包括特定特征、结构或特性。
虽然所公开的主题已在方法或处理的上下文中描述,但是本公开还涉及用于在此执行操作的装置。该装置可以被特别构造用于所要求的目的,或者其可以包括被选择性地激活或者由存储在计算机中的计算机程序重新配置的通用计算机。这样的计算机程序可以被存储在计算机可读存储介质中,诸如但不限于任何类型的硬盘,包括光盘、CD-ROM、以及磁光盘、只读存储器(ROM)、随机存取存储器(RAM)、磁或光卡、或适用于存储电子指令的任何类型的媒体,并且每个都耦合至计算机系统总线。
虽然已经单独描述了系统的给定组件,但是本领域普通技术人员将想到,一些功能可以在给定指令、程序序列、代码部分等中被组合或共享。
已经描述了本发明,我们现在要求如下。

Claims (20)

1.一种计算机程序产品,包括存储程序的非暂时性机器可读介质,所述程序由机器执行,以执行跨越多个设备-、用法-域和应用-域来识别网络连接实体的方法,所述方法包括:
响应于对内容的请求,将概率匹配函数应用至用法特征数据与编码特征属性集合之间的亲密度测量,所述请求具有与之关联的所述用法特征数据,所述用法特征数据与所述网络连接实体相关联;
作为应用所述概率匹配函数的结果,确定所述请求是否被识别为源自实体身份被存储在数据库中的实体;
如果所述请求被识别为源自实体身份被存储在所述数据库中的实体,则使用所述实体身份来构造对所述对内容的所述请求的响应;
如果所述请求没有被识别为源自实体身份没有被存储在所述数据库中的实体,则将所述结果作为实体身份存储在所述数据库中。
2.根据权利要求1所述的计算机程序产品,其中,从距离度量得到所述亲密度测量。
3.根据权利要求2所述的计算机程序产品,其中,所述距离度量是以下之一:数值距离、种类距离、字符串距离、集合成员、概率距离、及其组合。
4.根据权利要求1所述的计算机程序产品,其中,所述请求具有与之关联的确定性数据,所述确定性数据与所述实体对所述设备的使用相关联,并且进一步包括:将专家匹配函数应用至所述确定性数据与编码特征属性集合之间的亲密度测量。
5.根据权利要求1所述的计算机程序产品,其中,所述设备是网络连接计算设备,并且所述用法域是在线。
6.根据权利要求1所述的计算机程序产品,其中,所述实体是与家庭相关联的用户集合。
7.根据权利要求1所述的计算机程序产品,其中,所述用法特征数据与多个设备相关联。
8.根据权利要求1所述的计算机程序产品,进一步包括:将被找到的一个或多个实体身份周期性地合并到唯一实体身份中,以表示相同实体。
9.根据权利要求1所述的计算机程序产品,其中,所述实体是以下之一:设备、一个设备或设备集合的用户、设备上的一个或多个应用的用户、以及所述设备或所述设备集合的一组用户。
10.根据权利要求1所述的计算机程序,其中,所述用法特征数据是以下之一:HTTP报头、用法代理信息、用户询问数据、应用发起时间、应用退出时间、网络类型、页加载时间、页卸载时间、访问的日期和时间、星期几、时刻、引用页、插件数据、地理数据、位置数据、URL查看数据、键入频率数据、以及手势数据。
11.一种装置,包括:
至少一个硬件元件;以及
计算机存储器,所述计算机存储器保持计算机程序指令,当所述计算机程序指令被执行时,执行跨越多个设备-、用法-域和应用-域来识别网络连接实体的方法,所述方法包括:
响应于对内容的请求,将概率匹配函数应用至用法特征数据与编码特征属性集合之间的亲密度测量,所述请求具有与之关联的所述用法特征数据,所述用法特征数据与所述网络连接实体相关联;
作为应用所述概率匹配函数的结果,确定所述请求是否被识别为源自实体身份被存储在数据库中的实体;以及
如果所述请求被识别为源自实体身份被存储在所述数据库中的实体,则使用所述实体身份来构造对所述对内容的所述请求的响应。
12.根据权利要求11所述的装置,其中,从距离度量得到所述亲密度测量。
13.根据权利要求12所述的装置,其中,所述距离度量是以下之一:数值距离、种类距离、字符串距离、集合成员、概率距离、及其组合。
14.根据权利要求13所述的装置,其中,使用一个或多个距离度量,将所述概率匹配函数计算为核函数。
15.根据权利要求11所述的装置,其中,所述请求具有与之关联的确定性数据,所述确定性数据与所述实体对所述设备的使用相关联,并且进一步包括:将专家匹配函数应用至所述确定性数据与编码特征属性集合之间的亲密度测量。
16.根据权利要求11所述的装置,其中,所述设备是网络连接计算设备,并且所述用法域是在线。
17.根据权利要求11所述的装置,其中,所述实体是与家庭相关联的用户集合。
18.根据权利要求11所述的装置,其中,所述方法进一步包括:将被找到的一个或多个实体身份周期性地合并到唯一实体身份中,以表示相同实体。
19.根据权利要求11所述的装置,其中,所述实体是以下之一:设备、一个设备或设备集合的用户、设备上的一个或多个应用的用户、以及所述设备或所述设备集合的一组用户。
20.根据权利要求11所述的装置,其中,所述用法特征数据是以下之一:HTTP报头、用法代理信息、用户询问数据、应用发起时间、应用退出时间、网络类型、页加载时间、页卸载时间、访问的日期和时间、星期几、时刻、引用页、插件数据、地理数据、位置数据、URL查看数据、键入频率数据、以及手势数据。
CN201380045933.6A 2012-07-30 2013-07-30 唯一地识别网络连接实体 Pending CN105190595A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13/562,065 2012-07-30
US13/562,065 US8438184B1 (en) 2012-07-30 2012-07-30 Uniquely identifying a network-connected entity
PCT/US2013/052605 WO2014022327A1 (en) 2012-07-30 2013-07-30 Uniquely identifying a network-connected entity

Publications (1)

Publication Number Publication Date
CN105190595A true CN105190595A (zh) 2015-12-23

Family

ID=48183346

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201380045933.6A Pending CN105190595A (zh) 2012-07-30 2013-07-30 唯一地识别网络连接实体

Country Status (5)

Country Link
US (1) US8438184B1 (zh)
EP (1) EP2880553B1 (zh)
CN (1) CN105190595A (zh)
IN (1) IN2015KN00515A (zh)
WO (1) WO2014022327A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110825717A (zh) * 2019-10-10 2020-02-21 厦门市美亚柏科信息股份有限公司 一种身份识别的数据归一方法、装置及介质

Families Citing this family (78)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9412123B2 (en) 2003-07-01 2016-08-09 The 41St Parameter, Inc. Keystroke analysis
US10999298B2 (en) 2004-03-02 2021-05-04 The 41St Parameter, Inc. Method and system for identifying users and detecting fraud by use of the internet
US11301585B2 (en) 2005-12-16 2022-04-12 The 41St Parameter, Inc. Methods and apparatus for securely displaying digital images
US8938671B2 (en) 2005-12-16 2015-01-20 The 41St Parameter, Inc. Methods and apparatus for securely displaying digital images
US8151327B2 (en) 2006-03-31 2012-04-03 The 41St Parameter, Inc. Systems and methods for detection of session tampering and fraud prevention
US9112850B1 (en) 2009-03-25 2015-08-18 The 41St Parameter, Inc. Systems and methods of sharing information through a tag-based consortium
US20140046777A1 (en) * 2009-08-14 2014-02-13 Dataxu, Inc. Methods and systems for using consumer aliases and identifiers
GB2485241A (en) * 2010-11-05 2012-05-09 Bluecava Inc Incremental browser-based fingerprinting of a computing device
US10007925B2 (en) * 2011-03-02 2018-06-26 Genband Us Llp Local advertisement insertion through web request redirection
US9547727B2 (en) * 2011-07-25 2017-01-17 Scientiamobile, Inc. System and method for using a device description repository
US10290017B2 (en) * 2011-11-15 2019-05-14 Tapad, Inc. Managing associations between device identifiers
US10754913B2 (en) * 2011-11-15 2020-08-25 Tapad, Inc. System and method for analyzing user device information
US9633201B1 (en) 2012-03-01 2017-04-25 The 41St Parameter, Inc. Methods and systems for fraud containment
US9521551B2 (en) 2012-03-22 2016-12-13 The 41St Parameter, Inc. Methods and systems for persistent cross-application mobile device identification
US9129313B1 (en) * 2012-04-06 2015-09-08 MaxPoint Interactive, Inc. System and method for optimizing real-time bidding on online advertisement placements utilizing mixed probability methods
US10282758B1 (en) 2012-04-06 2019-05-07 MaxPoint Interactive, Inc. Pricing control in a real-time network-based bidding environment
US8978158B2 (en) * 2012-04-27 2015-03-10 Google Inc. Privacy management across multiple devices
US9881301B2 (en) * 2012-04-27 2018-01-30 Google Llc Conversion tracking of a user across multiple devices
US9514446B1 (en) * 2012-04-27 2016-12-06 Google Inc. Remarketing content to a user associated with multiple devices
US9258279B1 (en) 2012-04-27 2016-02-09 Google Inc. Bookmarking content for users associated with multiple devices
EP2880619A1 (en) 2012-08-02 2015-06-10 The 41st Parameter, Inc. Systems and methods for accessing records via derivative locators
US9373080B1 (en) * 2012-09-25 2016-06-21 Symantec Corporation Using historical accuracy of user decision making to improve accuracy of predictive modeling based automatic classification
US9202039B2 (en) * 2012-10-05 2015-12-01 Microsoft Technology Licensing, Llc Secure identification of computing device and secure identification methods
WO2014078569A1 (en) 2012-11-14 2014-05-22 The 41St Parameter, Inc. Systems and methods of global identification
US9584578B2 (en) * 2013-05-13 2017-02-28 BloomReach Inc. Cross platform user joining
US10482506B2 (en) * 2013-06-14 2019-11-19 Blue Kai, Inc. Client caching identification tracking
US10650412B2 (en) * 2013-06-14 2020-05-12 Blue Kai, Inc. Multi-profile tracking identification of a mobile user
US20150006384A1 (en) * 2013-06-28 2015-01-01 Zahid Nasiruddin Shaikh Device fingerprinting
US20150026330A1 (en) * 2013-07-16 2015-01-22 Cellco Partnership D/B/A Verizon Wireless Generating unique identifiers for mobile devices
US10614490B2 (en) 2013-08-15 2020-04-07 OpenX Technologies, Inc. Integrated architecture for performing online advertising allocation
US9990656B2 (en) 2013-08-16 2018-06-05 OpenX Technolgoies, Inc. System architecture and methods for facilitating client-side real-time auctions of advertising inventory
US11276088B1 (en) * 2013-08-16 2022-03-15 OpenX Technologies, Inc. System architecture and methods for online real-time auctions of advertising inventory
US10902327B1 (en) 2013-08-30 2021-01-26 The 41St Parameter, Inc. System and method for device identification and uniqueness
US10123063B1 (en) * 2013-09-23 2018-11-06 Comscore, Inc. Protecting user privacy during collection of demographics census data
WO2015077586A1 (en) * 2013-11-21 2015-05-28 AppNexus Inc. Methods and methods apparatus for statistical mobile device identification
US9686276B2 (en) * 2013-12-30 2017-06-20 AdMobius, Inc. Cookieless management translation and resolving of multiple device identities for multiple networks
US20150235275A1 (en) * 2014-02-20 2015-08-20 Turn Inc. Cross-device profile data management and targeting
US20150235258A1 (en) * 2014-02-20 2015-08-20 Turn Inc. Cross-device reporting and analytics
US10769644B2 (en) * 2014-03-11 2020-09-08 Adobe Inc. Cross-domain identity service
US20150271273A1 (en) * 2014-03-18 2015-09-24 CafeX Communications Inc. System for Using a Device as a Side Car
US20150287091A1 (en) 2014-04-08 2015-10-08 Turn Inc. User similarity groups for on-line marketing
US9910880B2 (en) * 2014-07-16 2018-03-06 Wipro Limited System and method for managing enterprise user group
US10592781B2 (en) * 2014-07-18 2020-03-17 The Boeing Company Devices and method for scoring data to quickly identify relevant attributes for instant classification
US9356914B2 (en) * 2014-07-30 2016-05-31 Gracenote, Inc. Content-based association of device to user
US10460098B1 (en) 2014-08-20 2019-10-29 Google Llc Linking devices using encrypted account identifiers
US10057240B2 (en) * 2014-08-25 2018-08-21 Sap Se Single sign-on to web applications from mobile devices
US10091312B1 (en) * 2014-10-14 2018-10-02 The 41St Parameter, Inc. Data structures for intelligently resolving deterministic and probabilistic device identifiers to device profiles and/or groups
US10482075B2 (en) * 2014-10-14 2019-11-19 Nec Corporation Information processing device, information processing method, and recording medium
CN105678127A (zh) 2014-11-21 2016-06-15 阿里巴巴集团控股有限公司 一种身份信息的验证方法和装置
US20160162937A1 (en) * 2014-12-05 2016-06-09 Hitesh Chawla Method and system for identifying users across multiple communication devices
US20160182657A1 (en) * 2014-12-17 2016-06-23 Sharethis, Inc. Apparatus and method of user identification across multiple devices
CN105989079B (zh) * 2015-02-11 2019-10-08 阿里巴巴集团控股有限公司 获取设备指纹的方法及装置
CN106033510B (zh) 2015-03-13 2018-12-21 阿里巴巴集团控股有限公司 一种用户设备识别方法及系统
US10404532B2 (en) * 2015-04-10 2019-09-03 Comcast Cable Commnications, LLC Virtual gateway control and management
WO2017157536A1 (en) * 2016-03-18 2017-09-21 Adbrain Ltd Data communication systems and methods of operating data communication systems
US10346871B2 (en) * 2016-04-22 2019-07-09 Facebook, Inc. Automatic targeting of content by clustering based on user feedback data
RU2656731C2 (ru) * 2016-06-08 2018-06-06 Федеральное государственное бюджетное образовательное учреждение высшего образования "Сибирский государственный университет телекоммуникаций и информатики" (СибГУТИ) Способ контроля работоспособности систем массового обслуживания с шинной организацией обмена данных стандарта can по точно известной передаваемой последовательности кодов с использованием однонаправленного устройства сопряжения
US10032116B2 (en) * 2016-07-05 2018-07-24 Ca, Inc. Identifying computer devices based on machine effective speed calibration
US10452732B2 (en) * 2016-11-18 2019-10-22 Adobe Inc. Device-keyed filtering for data cooperative access
US10455362B1 (en) 2016-12-30 2019-10-22 Amazon Technologies, Inc. Contextual presence
US10846745B1 (en) * 2016-12-30 2020-11-24 Amazon Technologies, Inc. Contextual presence
US11194829B2 (en) 2017-03-24 2021-12-07 Experian Health, Inc. Methods and system for entity matching
US10817966B2 (en) * 2017-03-30 2020-10-27 Experian Health, Inc. Expanded data processing for entity matching
US10581980B2 (en) 2017-06-01 2020-03-03 Xandr Inc. Device identification techniques using shared device graph
US20190012697A1 (en) * 2017-07-07 2019-01-10 Facebook, Inc. Ranking client engagement tools
US11232488B2 (en) 2017-08-10 2022-01-25 Nextroll, Inc. System, devices and methods for identifying mobile devices and other computer devices
CN113204532A (zh) * 2017-10-04 2021-08-03 邓白氏公司 跨全异的不可变分布式账本网络进行身份解析的系统和方法
US11042810B2 (en) 2017-11-15 2021-06-22 Target Brands, Inc. Similarity learning-based device attribution
US11716375B2 (en) 2017-11-22 2023-08-01 Nextroll, Inc. System, devices and methods for identifying mobile devices and other computer devices
US11196705B2 (en) 2018-01-05 2021-12-07 Nextroll, Inc. Identification services for internet-enabled devices
KR20190141576A (ko) * 2018-06-14 2019-12-24 삼성전자주식회사 동적 규칙 기반의 블록 체인을 이용하는 군집 제어 장치 및 방법
CN109063655A (zh) * 2018-08-07 2018-12-21 深圳市携网科技有限公司 特征匹配方法、装置、计算机设备及存储介质
US10515106B1 (en) * 2018-10-01 2019-12-24 Infosum Limited Systems and methods for processing a database query
US11645344B2 (en) 2019-08-26 2023-05-09 Experian Health, Inc. Entity mapping based on incongruent entity data
US10979848B1 (en) * 2021-01-05 2021-04-13 Near Pte. Ltd. Method for identifying a device using attributes and location signatures from the device
CN112732934B (zh) * 2021-01-11 2022-05-27 国网山东省电力公司电力科学研究院 电网设备分词词典和故障案例库构建方法
US11055737B1 (en) * 2021-02-22 2021-07-06 Deepintent, Inc. Automatic data integration for performance measurement of multiple separate digital transmissions with continuous optimization
GB2608357B (en) 2021-06-18 2024-05-29 F Secure Corp Method for identifying network devices in computer network and an apparatus configured to identify network devices in computer network

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1719768A (zh) * 2004-07-09 2006-01-11 千乡万才科技(中国)有限公司 电子签核安全保护系统及其方法
CN1972186A (zh) * 2005-11-24 2007-05-30 中国科学院自动化研究所 一种移动式身份认证系统及其认证方法
US20080027867A1 (en) * 2006-07-28 2008-01-31 Sony Ericsson Mobile Communications Ab Methods, Systems and Computer Program Products for Determining Usage Rights for Digital Content Based on Characterizing Information Thereof and Related Devices
CN101853292A (zh) * 2010-05-18 2010-10-06 深圳市北科瑞讯信息技术有限公司 商业社会网络构建方法及系统
CN102594807A (zh) * 2012-02-02 2012-07-18 江苏南亿迪纳数字科技发展有限公司 信息空间中基于实体自身特征的网络基因识别方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6073241A (en) 1996-08-29 2000-06-06 C/Net, Inc. Apparatus and method for tracking world wide web browser requests across distinct domains using persistent client-side state
US6480844B1 (en) 1998-03-25 2002-11-12 At&T Corp. Method for inferring behavioral characteristics based on a large volume of data
US7302402B2 (en) 1998-03-30 2007-11-27 International Business Machines Corporation Method, system and program products for sharing state information across domains
US6629149B1 (en) 1999-08-17 2003-09-30 At&T Corp. Network system and method
US7551913B1 (en) 2001-12-05 2009-06-23 At&T Mobility Ii Llc Methods and apparatus for anonymous user identification and content personalization in wireless communication
US7428587B2 (en) 2002-12-19 2008-09-23 Microsoft Corporation Generating globally unique device identification
US7853533B2 (en) 2004-03-02 2010-12-14 The 41St Parameter, Inc. Method and system for identifying users and detecting fraud by use of the internet
KR100606093B1 (ko) 2004-12-17 2006-07-31 삼성전자주식회사 이동통신시스템 및 이동통신단말기에서 사용자 인증을위한 방법 및 그 이동통신시스템
US20090128513A1 (en) 2007-11-20 2009-05-21 Samsung Electronics Co., Ltd Device identification method and apparatus, device information provision method and apparatus, and computer-readable recording mediums having recorded thereon programs for executing the device identification method and the device information provision method
US20100228625A1 (en) 2008-10-06 2010-09-09 Eswar Priyadarshan Wireless network user tracking
US20100185644A1 (en) 2009-01-21 2010-07-22 Microsoft Corporatoin Automatic search suggestions from client-side, browser, history cache
US20100332331A1 (en) 2009-06-24 2010-12-30 Craig Stephen Etchegoyen Systems and Methods for Providing an Interface for Purchasing Ad Slots in an Executable Program
US8924529B2 (en) 2010-01-27 2014-12-30 Ca, Inc. Client device identification through cache manipulation

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1719768A (zh) * 2004-07-09 2006-01-11 千乡万才科技(中国)有限公司 电子签核安全保护系统及其方法
CN1972186A (zh) * 2005-11-24 2007-05-30 中国科学院自动化研究所 一种移动式身份认证系统及其认证方法
US20080027867A1 (en) * 2006-07-28 2008-01-31 Sony Ericsson Mobile Communications Ab Methods, Systems and Computer Program Products for Determining Usage Rights for Digital Content Based on Characterizing Information Thereof and Related Devices
CN101496020A (zh) * 2006-07-28 2009-07-29 索尼爱立信移动通讯有限公司 基于数字内容的特征信息确定其使用权的方法、系统和计算机程序产品以及相关设备
CN101853292A (zh) * 2010-05-18 2010-10-06 深圳市北科瑞讯信息技术有限公司 商业社会网络构建方法及系统
CN102594807A (zh) * 2012-02-02 2012-07-18 江苏南亿迪纳数字科技发展有限公司 信息空间中基于实体自身特征的网络基因识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
MICHAEL EDWARD EDGE: "A survey of signature based methods for financial fraud detection", 《COMPUTERS & SECURITY》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110825717A (zh) * 2019-10-10 2020-02-21 厦门市美亚柏科信息股份有限公司 一种身份识别的数据归一方法、装置及介质
CN110825717B (zh) * 2019-10-10 2022-05-20 厦门市美亚柏科信息股份有限公司 一种身份识别的数据归一方法、装置及介质

Also Published As

Publication number Publication date
WO2014022327A1 (en) 2014-02-06
EP2880553B1 (en) 2019-08-28
IN2015KN00515A (zh) 2015-07-17
US8438184B1 (en) 2013-05-07
EP2880553A4 (en) 2015-08-05
EP2880553A1 (en) 2015-06-10

Similar Documents

Publication Publication Date Title
CN105190595A (zh) 唯一地识别网络连接实体
US11531906B2 (en) Machine-learning-based processing of de-obfuscated data for data enrichment
US20200342041A1 (en) Audience on networked devices
US10824608B2 (en) Feature generation and storage in a multi-tenant environment
US11048690B2 (en) Contribution of multiparty data aggregation using distributed ledger technology
US10091324B2 (en) Content feed for facilitating topic discovery in social networking environments
JP6391853B1 (ja) 位置センサの精度を改善するためのシステムおよび方法
Xu et al. Integrated collaborative filtering recommendation in social cyber-physical systems
US9092732B1 (en) Software service infrastructure indexing user demographics, interests and expertise
US20130185806A1 (en) Personal-information transmission/reception system, personal-information transmission/reception method, personal-information provision apparatus, preference management apparatus and computer program
WO2014022231A1 (en) Location retargeting system for online advertising
US11030545B2 (en) Probabilistic framework for determining device associations
JP7471445B2 (ja) コンテンツの配信と分析のためのプライバシーを守る機械学習
WO2023134496A1 (zh) 对象推荐方法、装置、电子设备以及存储介质
Jeong et al. An efficient authentication scheme to protect user privacy in seamless big data services
EP2725538B1 (en) Privacy protected dynamic clustering of end users
WO2022076826A1 (en) Privacy preserving machine learning via gradient boosting
US20230078704A1 (en) Privacy preserving machine learning labelling
US10771936B2 (en) System and method of creating abstractions of real and virtual environments and objects subject to latency constraints
EP4097619A1 (en) Processing of machine learning modeling data to improve accuracy of categorization
EP4085365A1 (en) Privacy preserving cross-domain machine learning
US10692120B2 (en) System, method, and computer-readable storage medium for determining a trust circle through machine learning
CN110489669B (zh) 一种信息推送方法及装置
Kong Research on Enterprise Digital Precision Marketing Strategy Based on Big Data
KR101335470B1 (ko) 모바일 마케팅을 위한 개인 맞춤형 메시지 신디케이션 장치 및 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20151223