CN106447419B - 基于特征选择的拜访者标识 - Google Patents
基于特征选择的拜访者标识 Download PDFInfo
- Publication number
- CN106447419B CN106447419B CN201610440594.7A CN201610440594A CN106447419B CN 106447419 B CN106447419 B CN 106447419B CN 201610440594 A CN201610440594 A CN 201610440594A CN 106447419 B CN106447419 B CN 106447419B
- Authority
- CN
- China
- Prior art keywords
- profile
- features
- clickstream data
- visitor
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0254—Targeted advertisements based on statistics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0621—Item configuration or customization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/43—Querying
- G06F16/435—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0255—Targeted advertisements based on user history
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0269—Targeted advertisements based on user profile or attribute
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Probability & Statistics with Applications (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本申请的各实施例涉及基于特征选择的拜访者标识。描述了其中服务操作用于标识与拜访者与从服务提供者可获得的资源的交互对应的消费者的技术。选择用于匹配点击流数据与简档的特征,点击流数据对于未知拜访者而被收集,简档对于已知拜访者ID而被建立。基于考虑特征在简档的全集之中的一致性、完整性和唯一性的分析来选择特征。然后,使用其中点击流被视为查询并且简档被视为文档的信息取回模型来在选择的特征内计算相关性分数。使用相关性分数来匹配未知拜访者与对应的简档。然后根据基于相关性分数的匹配来控制对数字媒体内容的访问,比如通过向消费者供应以消费者的由相应的简档指示的特性为目标的个别化的营销要约和内容。
Description
技术领域
本申请的各实施例涉及基于特征选择的拜访者标识。
背景技术
随着消费者与在线资源的交互(例如,使用web资源、电子商务、浏览活动、web应用、网站拜访等)已经增长,数字营销也已经变得越来越常见。一般而言,数字营销者寻求向消费者递送用于产品、服务和内容的要约,这些消费者将发现要约令人满意并且具有对要约做出响应的高概率。因而,数字营销者面临的一个挑战是匹配要约与用户以便最大化用户将接受要约的可能性并且因而优化从要约得到的向数字营销者的汇报/奖励。一般而言,得到营销方案以使内容以具有与内容关联的特性的消费者为目标。通过收集和分析与数字媒体内容的交互对应的点击流数据(例如,页面登录请求、选择、点击、导航动作等)来汇集各个用户的特性。在本文中,拜访者标识技术涉及关联从web流量得到的点击流数据与各个用户。
正确地关联点击流数据与用户的账户和/或用户ID特别地在用户交互而未登录和使用多个不同设备的场景中有挑战。传统地,跟踪cookie被服务提供者运用作为用于标识和在使用在线资源的不同拜访者之间区分以及在人与机器流量之间区分的机制。然而,跟踪cookie随时间改变、可以被删除或者停用并且对于特定用户可以运用的多个不同设备而言不同。因而,依赖于跟踪cookie的技术能够创建应当被组合、但是作为替代与不同cookie/ID关联的用于特定用户的分离点击流。传统的基于跟踪cookie的技术没有提供用于链接分离点击流的方式,并且因此就跨设备和时间连接有关点击流而言受限。因而,用来分析和做出营销决策的跟踪数据不完整,这可能不利地影响比如对于收入、满意度、要约接受等的数字营销目标。
发明内容
这里描述了用于关联对于未知拜访者而收集的点击流数据与已知拜访者的技术。在一个或者多个实现方式中,数字营销环境包括操作用于标识与拜访者与从服务提供者可获得的资源的交互对应的消费者的服务。为了这样做,选择用于匹配点击流数据与简档(例如,用于多个交互的点击流历史)的特征,点击流数据对于未知拜访者而被收集,简档对于已知拜访者标识符(ID)而被建立。基于考虑特征在简档的全集之中的完整性、一致性和唯一性的特征选择分析来选择特征。然后,使用信息取回模型来对选择的特征计算相关性分数,在该信息取回模型中,点击流被视为查询并且简档被视为文档。基于相关性分数匹配未知拜访者与对于已知拜访者ID而建立的简档。然后可以根据匹配(比如通过向消费者供应以消费者的由相应简档指示的特性为目标的个别化的营销要约和内容)来控制消费者对数字媒体内容的访问。
本发明内容以简化的形式介绍以下在具体实施方式中进一步描述的对概念的选择。这样,本发明内容未旨在于标识要求保护的主题内容的实质特征,它也未旨在于用作辅助确定要求保护的主题内容的范围。
附图说明
参照附图描述具体实施方式。在各图中,标号的最左位标识该标号首次出现的图。在说明书和各图中的不同实例中使用相同标号可以指示相似或者相同项目。在图中表示的实体可以指示一个或者多个实体,并且因此可以在以下讨论中可互换地引用实体的单数或者复数形式。
图1是可操作用于运用用于基于特征选择的拜访者标识的技术的示例操作环境的图示。
图2是描绘根据一个或者多个实现方式的营销服务的示例细节和部件的示图。
图3是描绘根据一个或者多个实现方式的示例过程的流程图,在该过程中,使用由使用基于特征选择的拜访者标识而建立的简档指示的特性来控制对数字媒体内容的访问。
图4是描绘根据一个或者多个实现方式的示例过程的流程图,在该过程中,选择用于简档匹配的特征。
图5是描绘根据一个或者多个实现方式的示例过程的流程图,在该过程中,出现使用通过特征选择分析被选择的特征的简档匹配。
图6图示了可以用来实施这里描述的技术的方面的示例系统、设备和部件。
具体实施方式
概述
依赖于跟踪cookie的拜访者标识技术可以创建应当被组合、但是作为替代与不同cookie/ID关联的用于特定用户的分离点击流。传统的基于跟踪cookie的技术没有提供用于链接分离点击流的方式,并且因此就跨设备和时间连接有关点击流而言受限。因而,用来分析和做出营销决策的跟踪数据不完整,这可能不利地影响比如对于收入、满意度、要约接受等的数字营销目标。
这里描述了用于关联对于未知拜访者而收集的点击流数据与已知拜访者的拜访者标识技术。在一个或者多个实现方式中,数字营销环境包括操作用于使用信息取回模型来标识与拜访者与从服务提供者可获得的资源的交互对应的消费者的服务。为了这样做,选择用于匹配对于未知拜访者而收集的点击流数据与对于已知拜访者标识符(ID)而建立的简档(例如,用于多个交互的点击流历史)的特征。特征对应于web流量的属性,比如时间和日期字段、设备ID、浏览器类型、用户标识符、设备设置、语言、用户代理串、IP地址、cookie ID和位置作为一些示例。基于考虑特征在简档的全集之中的完整性、一致性和唯一性的特征选择分析来选择特征。在一种方式中,组合用于完整性、一致性和唯一性的因子以关于如何预测特征用于拜访者标识目的来对特征进行打分。完整特征是在单个简档的每个数据实例中出现的特征,一致特征具有用于每个实例的相同值,并且唯一特征没有在任何其它简档中出现。唯一标识符(例如,GUID)是完美地满足这些属性的理想特征的示例。用于其它特征的分数测量特征显现理想属性的程度,并且因此测量如何预测特征相对于彼此。可调整权值也可以与因子关联以实现基于分数调节不同因子的影响。基于打分,选择指明的数目的最高打分的特征(例如,最多预测的特征)以用于拜访者标识分析。
在结合数字媒体内容交互后续地获得实况点击流数据时,使用信息取回模型来对通过特征选择分析被选择的特征计算相关性分数,在该信息取回模型中,点击流被视为查询并且简档被视为文档。因此,计算相关性分数涉及将点击流数据变换成查询并且对现有简档(例如,文档)比对各个简档的相关性进行打分。在一种方式中,相关性分数被计算为指示选择的特征相对于各个简档的唯一性和频率的因子在选择的特征内的求和。
基于相关性分数匹配未知拜访者与对于已知拜访者ID而建立的简档。例如,只要达到阈值相关性分数就可以合并用于交互的点击流数据与最高排行的简档。阈值相关性分数保证在数据与简档之间的充分接近在数据与简档组合之前存在。在未达到阈值相关性分数时,对于与未知拜访者对应的点击流数据创建新简档。然后,可以根据基于相关性分数的匹配(比如通过向消费者供应以消费者的由相应简档指示的特性为目标的个别化的营销要约和内容)来控制消费者对数字媒体内容的访问。
以这一方式,可以标识和使用在分离点击流之间的关系以将数据合并到用于已知用户ID的简档中。通过这样做,未匹配的点击流数据的实例被减少并且在用于已知用户ID的简档中包括的数据的完整性和准确性被增加。这转而实现更高效和有效的营销决策分析,这增加用户将对基于营销决策分析被提供的有目标的内容或者要约满意的可能性。附加地,将实现数字营销者的目标的可能性也被增加。
在以下讨论中,首先描述可以实施这里描述的技术的示例环境,然后,关于一些示例场景、示图和过程讨论关于技术的示例细节。最后,讨论可以用来实施这里描述的各种技术的示例系统和该系统的部件。
示例环境
图1是可操作用于运用这里描述的技术的在示例实现方式中的环境100的图示。所示环境100包括经由网络108通信地耦合的营销者设备102、一个或者多个消费者设备104和服务提供者106。营销者设备102、消费者设备104和服务提供者106可以各自由一个或者多个计算设备实施并且也可以表示一个或者多个实体。
可以用多种方式配置计算设备。例如,计算设备可以被配置为能够通过网络108通信的计算机,比如台式计算机、移动站、娱乐装置、通信地耦合到显示设备的机顶盒、无线电话、游戏控制台等。因此,计算设备可以范围从具有大量存储器和处理器资源的全资源设备(例如,个人计算机、游戏控制台)到具有有限存储器和/或处理资源的低资源设备(例如,传统机顶盒、手持游戏控制台)。附加地,虽然在一些实例中示出了单个计算设备,但是计算设备可以表示多个不同设备,比如服务提供者106的由企业用来执行操作的多个服务器等。以下关于图6描述适合实施这里描述的技术的计算系统和设备的更多示例。
虽然网络108被图示为因特网,但是网络可以采用广泛多种配置。例如,网络108可以包括广域网(WAN)、局域网(LAN)、无线网络、公共电话网络、内部网等。另外,虽然示出了单个网络108,但是网络108可以被配置为包括多个网络。
营销者设备102还被图示为包括操作系统110。操作系统110被配置为将下层设备的下层功能抽象化成在客户端设备102上可执行的应用112。例如,操作系统110可以对处理、存储器、网络和/或显示功能进行抽象化,从而使得可以编写应用112而不知道“如何”实施这一下层功能。应用112例如如图所示向操作系统110提供数据以由显示设备渲染和显示而不理解将如何执行这一渲染。设想了通常地与设备关联的多种应用112,包括但不限于文档阅读器、多媒体播放器、图像编辑软件、集成多个办公生产率模块的生产率套件、游戏等。作为应用112的具体示例,营销者设备102也被图示为包括营销者模块114和浏览器116。
营销模块114用各种方式被配置为实施用于个人化的营销的技术。如图所示,营销模块114可以被提供作为使数字营销者能够管理营销活动、受众数据、市场分段等的单独应用。一般而言,这包括营销数据收集、分析数据以断定具有选择的特点的消费者的市场分段、创建用于产品、服务和/或内容的要约以及分发要约。营销模块114也有助于通过网络与由服务提供者106提供的营销服务118的交互。因此,营销模块114可以表示基于瘦客户端web的应用或者有web功能的桌面型应用,通过该应用,数字营销者访问与营销服务118的营销账户并且与对应数据交互。附加地或者备选地,这里描述的技术可以通过浏览器116被实施,该浏览器116被配置为通过网络108访问营销服务118。营销模块114的功能也可以与营销服务118集成。
如指出的那样,服务提供者106提供如在图1中描绘的营销服务118。营销服务118实施集成数字营销环境,该环境被配置为提供数字营销工具的套件,包括但不限于消费者数据收集和分析、社交媒体管理、数字广告、受众目标设定和/或web体验管理作为数个示例。营销服务118也实现生成可以经由消费者设备104向消费者提供的要约120。数字营销环境也操作用于如在本文中描述的那样对关于不同消费者而采取的营销动作进行个别化。
要约120可以包括但不限于广告、指向其它作为目标的资源(服务和内容)的链接、个别化的数字媒体内容、数字优惠券、告知性(例如,在售)要约和促销要约作为数个示例。经由多个不同营销渠道(比如社交联网、显示广告、电子邮件、语音邮件、即时消息收发、营销呼叫和其它类型的交互)提供要约120。使各种数字营销工具经由由营销设备102访问和渲染的网页或者其它用户界面可访问。也可以如图所示在“云”中作为通过网络可访问的服务、由在客户端-服务器环境中的一个或者多个分布式部件、作为本地部署的企业平台和/或以另一适当方式实施营销服务118。
根据以上和以下描述的技术,营销服务118包括或者以别的方式利用数据收集模块122,该数据收集模块被配置为从消费者设备104获得和操纵点击流数据124。特别地,数据收集模块122表示可操作用于收集、访问和/或利用点击流数据124的功能,该点击流数据124指示在线消费者与数字媒体内容的交互。一般而言,点击流数据124包括来自各种消费者的用户特性(例如,年龄、性别、位置、隶属、IP地址、cookie ID、用户ID等)和行为(例如,浏览习惯、收藏、购买历史、设备设置、偏好、账户活动、页面查看、要约查看等)。数据收集模块122代表数字营销者收集和存储点击流数据124。例如,可以基于对网站的拜访、与web应用的交互、作为电子商务交易的部分、基于账户签注等来收集点击流数据124。如以下更具体讨论的那样,数据收集模块122可以将点击流数据124组织到用于不同用户/消费者的简档中,这些简档反映用于多个交互的点击流历史。简档可以用来基于消费者的由相应简档指示的特性和属性来匹配要约与消费者。
简档可以与已知用户标识符(比如向由服务支持的用户账户指派的全球唯一标识符(GUID))关联。对于针对尚未与账户关联的未知拜访者而收集的点击流,可以创建简档并且在临时基础上向简档指派系统生成的标识符。这样的标识符这里被称为“软”GUID或者SGUID。这里讨论的技术被设计为发现在与SGUID关联的数据(例如,未匹配的数据)和与已知GUID关联的简档之间的匹配。在发现匹配简档时,未匹配的数据被合并到用于已知GUID的简档中,并且可以丢弃或者释放SGUID。在另一方面,如果观察到与SGUID关联的充分交互以指示未知用户事实上是新用户,则用于SGUID的简档被转换成已知用户简档和/或被视为已知用户简档。
除了收集点击流数据之外,营销服务118还被配置为以各种方式利用数据以向数字营销者通知用户活动并且有助于创建有效营销策略和活动。这样的分析的一个示例涉及在本文中描述的用于基于特征选择的拜访者标识的技术。例如,营销服务118包括或者以别的方式利用拜访者标识模块126,该拜访者标识模块126表示可操作用于按照以上和以下描述的各种方式分析、管理和操纵点击流数据124的功能。通过示例而不是限制,拜访者标识模块126包括用于实施特征选择分析的功能,该特征选择分析考虑特征在简档的全集之中的完整性、一致性和唯一性。附加地,拜访者标识模块126可以实施简档匹配功能以使用信息取回模型来匹配实况点击流数据与现有简档。在信息取回模型中,点击流数据被变换成用来在简档的全集中搜索以评估简档与点击流数据的相关性的查询参数。关于以下各图讨论关于这些和其它方面的示例和细节。
已经考虑了示例环境,现在考虑对根据一个或者多个实现方式的用于基于特征选择的拜访者设备的技术的一些示例细节的讨论。
基于特征选择细节的拜访者标识
示例营销服务
为了进一步举例说明示例技术的细节,现在考虑图2,该图在200大体上描绘了如下示图,该示图代表如关于图1描述的示例营销服务118的细节和部件,该营销服务118实施可操作用于收集点击流数据124的数据收集模块122和可操作用于以各种方式分析、管理和操纵点击流数据124的拜访者标识模块126。
数据收集模块122可以使用各种技术以获得与消费者与在线资源(比如数字媒体内容、网页、web应用、网站等)的交互有关的点击流数据124。例如,在客户端由浏览器或者其它应用收集的跟踪数据可以在通信会话期间经由客户端-服务器交换被传达给营销服务118。可以经由数字cookie、作为结构化的数据消息、通过消息元数据或者经由其它适当数据对象和消息传送点击流数据124。如在图2中表示的那样,数据收集模块122从与已知标识符202和未知拜访者204关联的消费者二者收集点击流数据124。一般而言,已知标识符202对应于与向隶属提供者提供营销服务的服务提供者106的用户账户。在用户登录到可由服务识别的账户时获得与已知标识符202关联的点击流数据124。已知拜访者204对应于未登录到账户就出现的交互。这样,对于未知拜访者204而收集的点击流数据124不能与已知标识符202立即地关联。
然而,在本文中描述的拜访者标识技术提供用于分析对于未知拜访者204而收集的点击流数据124并且在发现匹配时将数据合并到匹配简档/已知ID中,或者在确定未知拜访者是新用户时用由系统指派的未匹配的ID创建新简档的机制。例如,数据收集模块122可以提供收集的数据以用于由拜访者标识模块126使用,该拜访者标识模块126执行分析以如这里描述的那样标识与资源的交互对应的消费者。基于这一分析,反映用于不同消费者的点击流历史(例如,按账户/ID跨多个交互被收集的数据记录)的简档可以由营销服务118建立和管理。
特别地,示例营销服务118附加地包括拜访者简档数据库206,在该拜访者简档数据库206中维护对于消费者而建立的简档208。简档数据库206可以使用以特征值为关键字的反转的索引来组织简档208。例如,反转的索引被配置为将特征值映射到包含这些值的简档以有助于快速搜索。如表示的那样,简档包括用于已知标识符202的简档和与由系统指派的未匹配的标识符210关联的简档。简档208用来实施这里描述的用于拜访者标识的技术。例如,用于已知标识符202的简档可以被用作特征选择分析的部分以根据可预测性对特征进行排行并且选择特征以用作分析的部分以匹配实况点击流数据与相关简档。根据信息取回模型,简档208也被用作在通过特征选择分析被选择的特征内搜索的“文档”的全集以评估与形式为用于未知拜访者204的点击流数据的“查询”的相关性。
因此,拜访者标识模块126广而言之表示用于使用信息取回模型来实施特征选择分析和数据到简档的简档匹配二者的功能。为了提供这样的功能,拜访者标识模块126可以包括或者以别的方式利用如在图2中表示的各种子部件。特别地,在图2中表示的示例子部件包括特征选择器210、查询转换器212、点击流打分器214和简档更新器216。特征选择器210表示与执行特征选择分析以发现最多预测的特征关联的功能。特征选择器210被设计为输出排行的特征列表218,该列表218可以被用作后续分析的基础以匹配用于未知拜访者的点击流数据与已知ID。
查询转换器212、点击流打分器214和简档更新器216一起表示与用于发现与未匹配的点击流数据对应的现有简档并且在适当时将未匹配的点击流数据合并到现有简档中的简档匹配关联的功能。作为简档匹配的部分,查询转换器212被配置为将点击流数据变换成用于选择的特征的查询。这可以涉及从点击流数据提取特征值并且用这些值构造查询串。查询转换器212也可以被配置为设置在不同特征之中的不同权值。因此,可以生成并且通过指派不同权值来调节查询以控制特征对总相关性分数的影响。权值提供用于使系统适应不同场景并且适应不同目标的灵活性。
点击流打分器214被配置为计算用于未知拜访者204的点击流数据214相对于简档208的相关性分数。特别地,点击流打分器214实施信息取回模型以通过在简档208的全集(例如,拜访者简档数据库206)内搜索来计算对选择的特征计算的相关性分数以对各个简档与由查询转换器212从对应的点击流数据得到的查询的相关性进行打分和排行。
简档更新器216操作用于基于由点击流打分器214的分数和排行来更新拜访者简档数据库206中的简档208。在一个实现方式中,简档更新器216如先前描述的那样实施和强制实行相关性分数阈值。阈值相关性分数保证在数据与简档之间的充分接近在数据与简档组合之前存在。相关性分数阈值可以是由开发者设置的预先定义的值。附加地或者备选地,相关性分数阈值可以可调整以提供对打分的可调节控制。因此,只要达到阈值相关性分数,简档更新器216就可以合并点击流数据与最高排行的简档。在未达到阈值相关性分数时,对于与未知拜访者202对应的点击流数据创建新简档。关于以下示例过程讨论关于拜访者标识技术的这些和其它方面的更多细节。
示例过程
以下讨论描述可以利用先前描述的系统和设备被实施的示例过程。过程表示用于标识拜访者并且基于标识来对在数字营销环境内关于不同拜访者而采取的营销动作进行个别化的示例技术。可以在硬件、固件或者软件或者其组合中实施每个过程的方面。过程被示出为指定由一个或者多个设备执行的操作的块集合而未必限于示出的用于由相应块执行操作的顺序。在以下讨论的部分中,可以参照图1的环境100和图2的示例部件。在至少一些实施例中,过程可以由适当地配置的计算设备(比如与实施营销服务118的服务提供者116关联的一个或者多个服务器设备和/或包括适当营销模块114或者浏览器116的图1的营销者设备102)执行以实施描述的技术。
用于内容控制的拜访者标识
图3是描绘了示例过程300的流程图,在该过程300中,使用由通过基于特征选择的拜访者标识而建立的简档指示的特性来控制对数字媒体内容的访问。过程300表示如在本文中描述的特征选择和简档匹配的组合,该组合可以被用作为用于做出营销决策并且控制对内容的访问的基础。
选择用于匹配对于未知拜访者而收集的点击流数据与对于已知拜访者标识符(ID)而建立的简档的特征。可以基于考虑特征在对于已知拜访者ID而建立的简档的全集之中的完整性、一致性和唯一性的特征选择分析来选择特征(块302)。例如,营销服务118可以执行特征选择分析作为如先前描述的拜访者标识的部分。特征选择的目标是根据如何预测特征用于评估点击流数据与现有简档的相关性来对与点击流数据关联的不同特征。如指出的那样,特征对应于web流浪的属性、比如时间和日期字段、设备ID、浏览器类型、用户标识符、设备设置、语言、用户代理串、IP地址、cookie ID和位置作为一些示例。特征选择分析可以提供根据可预测性对不同特征进行排序的排行的特征列表218。可配置数目的最高预测的特征然后可以被用作后续简档匹配的部分。通过示例而不是限制,可以根据特定使用场景选择选择前10、50或者100个特征。以下关于图4的示例过程讨论可以关于结合示例过程300或者以别的方式使用的用于特征选择的示例技术的细节。
基于用于未知拜访者的点击流数据相对于简档的相关性分数匹配未知拜访者与对于已知拜访者ID而建立的简档。使用信息取回模型来对选择的特征计算相关性分数(块304)。例如,营销服务118可以执行简档匹配220作为如先前描述的拜访者标识的部分。广而言之,简档匹配涉及计算现有简档相对于用于未知拜访者的点击流数据的相关性分数并且使用分数以相应地更新简档208。在一个或者多个实现方式中,使用信息取回模型来进行简档匹配,在该信息取回模型中,点击流数据124被视为查询并且简档208被视为基于由查询指定的特征值搜索的文档。简档匹配被配置为使用根据特征选择分析被选择的预测特征。以下关于图5的示例过程讨论关于用于简档匹配的示例技术的细节。
根据基于相关性分数的匹配来控制消费者对数字媒体内容的访问(块306)。例如,营销服务118可以发起一个或者多个营销动作以部分基于使用这里描述的拜访者标识技术被建立的简档向消费者传达以消费者为目标的数字媒体内容(或者以别的方式实现/发起消费者对数字媒体内容的访问)。营销动作可以由营销服务118直接地采取以控制对经由对应的服务提供者106可用的内容的访问和/或表示营销者控制对内容的访问。附加地或者备选地,可以暴露或者供应简档和其它相关数据以用于由营销者用来通知营销决策。设想用于控制对内容的访问的各种动作。通过示例而不是限制,在图3中表示的示例动作包括做出内容推荐308、分发营销要约310、供应广告312和对数字媒体内容进行个别化314。根据作为目标的消费者的如由对应的简档208指示的特性选择和配置推荐、要约、广告和数字媒体内容。
在一个示例中,营销服务118发送控制消息或者其它适当通信以发起由营销者执行动作,比如通过包括或者利用营销模块114的对应的营销者设备102。控制消息被配置为指示由服务标识的一个或者多个营销动作并且也有效用于使得营销商设备102执行一个或者多个营销动作以向各个消费者提供作为目标的营销要约。执行一个或者多个营销动作涉及在营销者/营销服务与目标消费者之间的交互以提供从分析标识的要约120。
特征选择
图4是描绘根据一个或者多个实现方式的示例过程400的流程图,在该过程中选择用于简档匹配的特征。特征选择涉及如先前指出的那样根据可预测性对特征进行打分。可以通过营销服务118经由实施特征选择器210或者其它可比较功能的拜访者标识模块126执行打分。特征选择的结果是按照可预测性对特征进行排行的排行的特征列表218。
为了这样做,收集指示消费者与数字媒体内容的交互的点击流数据(块402)并且在对于已知拜访者标识符(ID)而维护的简档中按照已知拜访者ID对收集的点击流数据进行分组(块404)。这一过程建立与已知ID 202关联的简档208的数据库,该数据库提供用来评估不同特征的可预测性的历史点击流数据的全集。
对于在收集的点击流数据中包括的特征计算可预测性分数。定义可预测性分数以组合用于特征在简档之中的完整性、一致性和唯一性的因子(块406)。设想了用于完整性、一致性和唯一性的因子的各种不同数学组合。例如,用于因子的值可以被相乘或者相加在一起以给出总预测分数。在一种方式中,可调整权值也可以与因子关联以实现调节不同因子对分数的影响。以下转而讨论关于用于完整性、一致性和唯一性的计算的细节。
如指出的那样,特征选择使用来自其中包括已知ID的简档的点击流数据的采样。在点击流中的每个命中(页面查看或者动作)包含属性或者特征F的集合。特征指示用户/设备的特性和行为,比如cookie ID、IP地址、用户代理串、浏览器类型等。在实践中,点击流数据可以包括数百个不同特征。特征选择被设计为断定最多预测的特征并且由此创建有效匹配算法。具体而言,特征选择产生从最多到最少预测用于拜访者标识而被排行的特征F的排序的列表。
在本文中,考虑简档集合P,其中简档p∈P各自具有命中集合:h∈p。所有命中的h∈p集合由H表示。每个命中h具有用于所有特征f∈F的可以为空的值。这一个值是h[f]。预测打分算法被定义以计算和组合如下因子,这些因子指示特征f在简档的全集P之中的完整性、一致性和唯一性。
举例而言,可以如下定义用于给定的全集的每个特征的PredictScore值:
PredictScore(f;P)=complete(f;P)*consistent(f;P)*unique(f;P)
在这一方式中,PredictScore基于对在简档的全集P之中的特征f的三个分析。为了简档匹配的目的,理想特征具有完整、一致和唯一这些属性。完整特征是在单个简档的每个数据实例(例如,命中)中出现的特征,一致特征具有用于每个实例的相同值,并且唯一特征没有在任何其它简档中出现。唯一标识符(例如GUID)是完美地满足这三个属性的理想特征的示例。用于其它特征的分数测量特征理想的程度(例如,完整性、一致性和唯一性的程度)并且因此测量如何预测特征相对于彼此。属性可以被表达如下:
·一致性:每个h[f]具有用于简档中的每个命中的相同值:对于所有p∈P,hi[f]=hj[f],其中hi、hj∈p。
·唯一性:对于每个简档,hf∈P是没有在任何其它简档中出现的值。
如下定义和计算与这些性质对应并且在PredictScore计算中使用的因子:
完整性是其中特征f不为空到非空命中的数目除以命中总数。
一致性是在所有简档内平均的每个p的hf值的纯度。实质上,它对简档的命中的最频繁出现的值h求平均f。如果简档具有10个命中而用于特征的一个值出现5次,则该值将是用于该简档的0.5。
唯一性是在H之中的用于h[f]的不同值的数目的测量除以简档数目。
基于打分,指明的数目的最高打分的特征(例如,最多预测的特征)被选择用于拜访者标识分析。特别地,按照可预测性分数排行的特征的列表被生成用于在用于匹配用于未知拜访者的拜访者数据与对应于已知拜访者ID的简档的分析中使用(块408)。系统被配置为运用指明的数目的最多预测的特征以用于后续简档匹配,关于以下示例过程讨论该简档匹配的细节。因而,一旦构造了简档的全集P,为每个特征计算PredictScore(f,P)就产生最多预测特征的排序的列表。选择指明的最高数目的特征允许开发者/用户折衷准确性与空间和速度约束。
简档匹配
图5是描绘根据一个或者多个实现方式的示例过程500的流程图,在该过程中出现使用通过特征选择分析被选择的特征的简档匹配。简档匹配涉及计算现有简档相对于用于未知拜访者的点击流的相关性分数并且使用分数以相应地更新简档208。在一个或者多个实现方式中,如这里讨论的那样使用信息取回模型来进行简档匹配。可以通过营销服务118执行简档匹配,该营销服务118包括或者利用拜访者标识模块126或者可比较功能。
获得点击流数据以用于与对应于未知拜访者的数字媒体内容交互(块502)。例如,营销服务118可以实施操作以用于以先前描述的方式收集点击流数据124的数据收集模块122。这可以包括与未知拜访者对应的实况数据。
在收集用于未知拜访者的数据时,将点击流数据变换成用于信息取回模型的查询,该信息取回模型被布置为利用根据特征选择分析被选择的特征,该特征选择分析考虑特征在对于已知拜访者而建立的简档的全集之中的完整性、一致性和唯一性(块504)。例如,可以如关于图4的示例过程400和这里别处讨论的特征选择分析来确定用于简档匹配的特征。另外,可以如以上和以下描述的那样经由信息取回模型实施简档匹配。查询变换可以经由如先前讨论的查询转换器212或者等效功能而出现。变换点击流数据通过提取用于选择的特征的特征值并且生成适合搜索简档的全集的对应的查询串来出现。
然后,关于各个简档对于查询计算相关性分数。相关性分数可以被计算为指示选择的特征相对于各个简档的唯一性和频率在选择的特征内的求和(块504)。一般而言,可以运用任何适当计算以基于相关性测量相对于彼此对简档进行打分并且相应地对简档进行排行。在至少一些实现方式中,相关性分数计算被配置为考虑选择的特征相对于各个简档的唯一性和频率。在一种方式中,使用被适配用于拜访者标识技术的信息取回模型来评估相关性。
在信息取回模型中,有用户查询和基于用户查询从文档全集取回的相关文档的排行的列表。按照以下相关性分数公式计算文档与查询的相关性:
score(query,document)=sΣterm∈querytfterm,document×idfterm
在以上公式中,s是归一化因子,tf是词项在文档中如何频繁地出现,并且idf是词项在文档全集中如何唯一。一种用于计算分数的简单直接方式是跨目标全集中的所有文档使用公式。然而,在实践中,信息取回系统使用逆文档索引来跨更少文档计算分数以节约时间和计算资源。逆文档索引将词项映射到在其中出现的文档列表。因此,信息取回系统仅对从这些逆文档索引积累的非零文档进行打分。通过使用逆文档索引来限制搜索的文档集合节约时间和资源并且使系统高效地和有效地工作。
如指出的那样,这里讨论的拜访者标识技术利用适于工作用于简档匹配的信息取回模型。取代键入的查询,点击流数据和对应的命中用来驱动分析。取代搜索文档的全集,用反映点击流历史的简档的全集进行匹配。查询的词项被用于选择的特征的特征值替换。附加地,简档数据库206可以使用以特征值为关键字的反转索引来组织简档208以有助于快速搜索。在本文中,可以如下表达用于命中/点击流与简档的相关性分数:
score(hit,profile)=sΣfeature∈hittffeature,profile×idffeature
用于查询(命中)的最高结果(简档/文档)是在信息取回模型中如由相关性分数评估的最相似简档。这一最高排行的简档最可能对应于从其获得点击流数据的相同用户/设备。
使用以上模型,将点击流数据变换成查询。例如,命中可以包含对应于IP地址、语言、国家和邮政编码的以下信息“111.222.333.44,English,US,95113....”。每个特征值用作为用于匹配分析的参数。与已知标识符关联的点击流数据(例如,用于登录用户的数据和命中)如先前指出的那样被分组在一起以形成简档208。
在由匿名、未知拜访者的新交互出现时,从点击流数据生成并且根据信息取回模型使用查询以确定交互是否匹配现有简档。通过计算相关性分数来做出相关性决策,该相关性分数反映特征值(词项)在所有拜访者之中如何唯一(idf)和特征值在被打分以用于可能的匹配的拜访者简档中如何频繁地出现(tf)。
已经确定了相关性分数,根据相关性分数对简档与查询的相关性进行排行(块506)。然后,可以标识最高排行的简档。在一个或者多个实现方式中,建立阈值分数以保证充分接近在组合数据与简档之前存在于最高排行的简档与输入点击流数据之间。否则,所有新数据将被强制到简档之一中,这将在相关性分数低时导致不准确。如提到的那样,阈值分数可以由开发者建立。可选地,可以使阈值分数可由终端用户调整以对于不同场景和目标调节系统。
因而,关于是否达到阈值分数做出确定(块510)。在达到阈值分数时,点击流数据与最高排行的简档合并(块512)。在另一方面,在未达到阈值分数时,对于点击流数据创建新简档。可以向新简档指派未匹配的ID 210,比如先前讨论的SGUID。随着对于新简档收集更多信息,可以有可能通过后续分析来确定新简档确实匹配不同简档,在该情况下发起对数据的合并。备选地,在新简档中收集充分数据(例如,多个点击流实例)可以指示简档实际上确实属于分离简档,这时新简档被视为用于已知用户的简档。
已经考虑了前述示例细节,现在考虑对可以用于在一个或者多个实现方式中的拜访者标识技术的方面的示例系统和设备的讨论。
示例系统和设备
图6图示了包括示例计算设备602的大体地在600的示例系统,该计算设备602表示可以实施这里描述的各种技术的一个或者多个计算系统和/或设备。这通过包括营销服务118而被举例说明,该营销服务可以被配置为向服务的用户提供数字营销工具的套件。备选地,计算设备可以表示客户端设备,该客户端设备包括用于实施描述的技术的方面的营销模块114或者浏览器116。计算设备602可以例如是服务提供者的服务器、与客户端关联的设备(例如,客户端设备)、片上系统和/或任何其它适当计算设备或者计算系统。
示例计算设备602如图所示包括相互通信地耦合的处理系统604、一个或者多个计算机可读介质606和一个或者多个I/O接口608。虽然未示出,但是计算设备602还可以包括相互耦合各种部件的系统总线或者其它数据和命令传送系统。系统总线可以包括不同总线结构(比如存储器总线或者存储器控制器、外围总线、通用串行总线和/或利用多种总线架构中的任何总线架构的处理器或者本地总线)中的任何总线结构或者组合。也设想了多种其它示例,比如控制和数据线。
处理系统604表示用于使用硬件来执行一个或者多个操作的功能。因而,处理系统604被图示为包括可以被配置为处理器、功能块等的硬件单元610。这可以包括在硬件中实施为使用一个或者多个半导体而被形成的专用集成电路或者其它逻辑器件。硬件单元610不受形成它们的材料或者其中运用的处理机制所限制。例如,处理器可以由半导体和/或晶体管(例如,电子集成电路(IC))组成。在这样的情境中,处理器可执行的指令可以是电子可执行的指令。
计算机可读存储介质606被图示为包括存储器/存储装置612。存储器/存储装置612表示与一个或者多个计算机可读介质关联的存储器/存储容量。存储器/存储部件612可以包括易失性介质(比如随机存取存储器(RAM))和/或非易失性介质(比如只读存储器(ROM)、闪存、光盘、磁盘等)。存储器/存储部件612可以包括固定介质(例如,RAM、ROM、固定硬驱动等)以及可拆卸介质(例如,闪存、可拆卸硬驱动、光盘等)。可以用如以下进一步描述的多种其它方式配置计算机可读介质606。
输入/输出接口608表示用于允许用户向计算设备602录入命令和信息并且也允许向用户呈现信息的功能和/或使用各种输入/输出设备的其它部件或者设备。输入设备的示例包括键盘、光标控制设备(例如,鼠标)、麦克风、扫描仪、触摸功能(例如,被配置为检测物理触摸的电容或者其它传感器)、相机(例如,该相机可以运用可见或者不可见光波长(比如红外线频率)以将移动识别为未涉及触摸的手势)等。输出设备的示例包括显示设备(例如,监视器或者投影仪)、扬声器、打印机、网卡、触觉响应设备等。因此,可以用如以下进一步描述的多种方式配置计算设备602以支持用户交互。
这里可以在软件、硬件单元或者程序模块的一般情境中描述各种技术。一般而言,这样的模块包括执行特定任务或者实施特定抽象数据类型的例程、程序、对象、单元、部件、数据结构等。如这里所用的术语“模块”、“功能”和“部件”一般地表示软件、固件、硬件或者其组合。这里描述的技术的特征独立于平台,这意味着可以在具有多种处理器的多种商用计算平台上实施技术。
可以在某个形式的计算机可读介质上存储或者跨该形式的计算机可读介质传输描述的模块和技术的实现方式。计算机可读介质可以包括计算设备602可以访问的多种介质。举例而言而无限制,计算机可读介质可以包括“计算机可读存储介质”和“计算机可读信号介质”。
“计算机可读存储介质”可以是指与仅信号传输、载波或者信号本身对照而言实现信息存储的介质和/或设备。因此,计算机可读存储介质没有包括信号承载介质或者信号本身。计算机可读存储介质包括硬件,比如在适合用于存储信息(比如计算机可读指令、数据结构、程序模块、逻辑元件/电路或者其它数据)的方法或者技术中实施的易失性和非易失性、可拆卸和非可拆卸介质和/或存储设备。计算机可读存储介质的示例可以包括但不限于RAM、ROM、EEPROM、闪存或者其它存储器技术、CD-ROM、数字万用盘(DVD)或者其它光存储装置、硬盘、磁盒、磁带、磁盘存储装置或者其它磁存储设备或者适合用来存储希望的信息并且可以由计算机访问的其它存储设备、有形介质或者制造品。
“计算机可读信号介质”可以是指被配置为比如经由网络向计算设备602的硬件传输指令的信号承载介质。信号介质通常地可以在调制的数据信号(比如载波、数据信号)或者其它传送机制中体现计算机可读指令、数据结构、程序模块或者其它数据。信号介质也包括任何信息递送介质。术语“调制的数据信号”意味着如下信号,该信号让它的特性中的一个或者多个特性以对信号中的信息进行编码这样的方式来设置或者改变。举例而言而非限制,通信介质包括有线介质(比如有线网络或者直接有线连接)和无线介质(比如声学、RF、红外线和其它无线介质)。
如先前描述的那样,硬件单元610和计算机可读介质606代表以硬件形式实施的模块、可编程逻辑器件和/或固定器件逻辑,可以在一些实施例中运用该硬件形式以实施这里描述的技术的至少一些方面,比如执行一个或者多个指令。硬件可以包括集成电路或者片上系统的部件、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、复杂可编程逻辑器件(CPLD)和在硅或者其它硬件中的其它实现方式。在本文中,硬件可以作为处理设备操作,该处理设备执行由指令定义的程序任务或者由硬件体现的逻辑以及用来存储用于执行的指令的硬件,例如,先前描述的计算机可读存储介质。
可以运用前述各项的组合以实施这里描述的各种技术。因而,软件、硬件或者可执行模块可以被实施为在某个形式的计算机可读存储介质上和/或由一个或者多个硬件单元610体现的一个或者多个指令或者逻辑。计算设备602可以被配置为实施与软件和/或硬件模块对应的特定指令和/或功能。因而,可以至少部分在硬件中(例如,通过使用计算机可读存储介质和/或处理系统604的硬件单元610)来实现作为软件可由计算设备602执行的模块的实现方式。指令和功能可以可由一个或者多个制造品(例如,一个或者多个计算设备602和处理系统604)可执行/可操作以实施这里描述的技术、模块和示例。
这里描述的技术可以由计算设备602的各种配置支持而不限于这里描述的技术的具体示例。也可以全部或者部分通过使用分布式系统(比如如以下描述的那样经由平台616在“云”614之上)实施这一功能。
云614包括和/或表示用于资源618的平台616。平台616对云614的硬件(例如,服务器)和软件资源的下层功能进行抽象化。资源618可以包括可以在从计算设备602远离的服务器上执行计算机处理之时利用的应用或者数据。资源618也可以包括通过因特网或者通过预订者网络(比如蜂窝或者Wi-Fi网络)提供的服务。
平台616可以对用于连接计算设备602与其它计算设备的资源和功能进行抽象化。平台616也可以服务于抽象化对资源的缩放以提供与对于经由平台616实施的资源618的所遇需求对应的规模水平。因而,在一个互连设备实施例中,可以遍及系统600分布这里描述的功能的实现方式。例如,可以部分在计算设备602上以及经由对云614的功能进行抽象化的平台616实施该功能。
结论
虽然已经用结构特征和方法动作特有的语言描述了本发明,但是将理解,在所附权利要求中定义的本发明未必限于描述的具体特征或者动作。实际上,具体特征和动作被公开作为实施要求保护的本发明的示例形式。
Claims (17)
1.在用于向消费者递送数字媒体内容的数字媒体环境中,一种用于标识与从服务提供者可获得的资源的交互对应的消费者的方法,包括:
选择用于匹配对于未知拜访者而收集的点击流数据与对于已知拜访者标识符而建立的简档的特征,所述特征基于考虑特征在对于所述已知拜访者标识符而建立的简档的全集之中的完整性、一致性和唯一性的特征选择分析被选择,其中完整性测量特征在单个简档的每个点击流数据实例中出现的程度,其中一致性测量特征跨单个简档的不同点击流数据实例具有相同值的程度,并且其中唯一性测量特征没有在任何其它简档中出现的程度;
基于用于所述未知拜访者的所述点击流数据相对于对于已知拜访者标识符而建立的所述简档的相关性分数来匹配所述消费者与所述简档,所述相关性分数使用信息取回模型在选择的所述特征内被计算;以及
基于对在匹配所述消费者的所述简档中包含的点击流数据的分析来发起向所述消费者传达数字媒体内容。
2.根据权利要求1所述的方法,其中选择特征包括生成按照从特征选择分析得到的可预测性分数排行的特征的列表,所述特征的列表在用于匹配用于未知拜访者的拜访者数据与对应于所述已知拜访者标识符的所述简档的分析中被运用。
3.根据权利要求2所述的方法,其中生成所述特征的列表包括:收集指示所述消费者与所述数字媒体内容的所述交互的所述点击流数据;在对于所述已知拜访者标识符而维护的所述简档中按照所述已知拜访者标识符对收集的所述点击流数据进行分组;以及通过组合用于在收集的所述点击流数据中包括的特征在所述简档之中的完整性、一致性和唯一性的因子来计算用于所述特征的所述可预测性分数。
4.根据权利要求2所述的方法,其中匹配所述消费者与所述简档包括:对于与未知拜访者对应的点击流数据,将所述点击流数据变换成用于信息取回模型的查询;计算关于各个简档的用于所述查询的相关性分数为指示选择的所述特征相对于所述各个简档的唯一性和频率的因子在选择的所述特征内的求和;以及根据所述相关性分数对简档与所述查询的相关性进行排行。
5.根据权利要求4所述的方法,其中匹配所述消费者与所述简档还包括:
在达到阈值相关性分数时合并与所述未知拜访者对应的所述点击流数据与最高排行的简档;或者
在未达到所述阈值相关性分数时创建用于与所述未知拜访者对应的所述点击流数据的新简档。
6.根据权利要求1所述的方法,其中所述数字媒体内容包括以下各项中的至少一项:内容推荐、营销要约、个别化的数字媒体内容或者广告。
7.根据权利要求1所述的方法,其中发起数字媒体内容的传达包括执行一个或者多个营销动作以向各个消费者直接地提供有目标的数字媒体内容。
8.根据权利要求1所述的方法,其中发起数字媒体内容的传达包括向与营销者关联的营销设备发送一个或者多个控制消息以有效使得执行一个或者多个营销动作以向各个消费者提供有目标的数字媒体内容。
9.根据权利要求1所述的方法,其中匹配未知拜访者与所述简档包括使用用于选择的所述特征的值来搜索拜访者简档数据库,所述拜访者简档数据库被配置为使用将特征值映射到包含所述值的简档的反转索引以有助于快速搜索。
10.根据权利要求1所述的方法,其中所述方法由被使得经由服务提供者通过网络可由数字营销者和消费者访问的营销服务执行。
11.存储指令的一个或者多个计算机可读存储介质,所述指令在由处理系统执行时实施营销服务,所述营销服务被配置为执行用于标识与从服务提供者可获得的资源的交互对应的消费者的操作,所述操作包括:
收集指示消费者与数字媒体内容的交互的点击流数据;
在对于已知拜访者标识符而维护的简档中按照所述已知拜访者标识符对收集的所述点击流数据进行分组;
计算用于在收集的所述点击流数据中包括的特征的可预测性分数,所述可预测性分数被定义为组合用于所述特征在所述简档之中的完整性、一致性和唯一性的因子,其中完整性测量特征在单个简档的每个点击流数据实例中出现的程度,其中一致性测量特征跨单个简档的不同点击流数据实例具有相同值的程度,并且其中唯一性测量特征没有在任何其它简档中出现的程度;以及
生成按照所述可预测性分数排行的特征的列表以用于在用于匹配用于未知拜访者的拜访者数据与对应于所述已知拜访者标识符的简档的分析中使用。
12.根据权利要求11所述的一个或者多个计算机可读存储介质,其中完整性测量特征在单个简档的每个点击流数据实例中出现的程度。
13.根据权利要求11所述的一个或者多个计算机可读存储介质,其中一致性测量特征跨单个简档的不同点击流数据具有相同值的程度。
14.根据权利要求11所述的一个或者多个计算机可读存储介质,其中唯一性测量特征没有在任何其它简档中出现的程度。
15.在用于向消费者递送数字媒体内容的数字媒体环境中,一种计算系统包括:
处理系统;
存储指令的一个或者多个计算机可读介质,所述指令在由所述处理系统执行时实施营销服务,所述营销服务被配置为执行用于标识与从服务提供者可获得的资源的交互对应的消费者的操作,所述操作包括:
获得用于与未知拜访者对应的数字媒体内容的交互的点击流数据;
将所述点击流数据变换成用于信息取回模型的查询,所述信息取回模型被布置为利用根据特征选择分析而选择的特征,所述特征选择分析考虑特征在对于已知拜访者而建立的简档的全集之中的完整性、一致性和唯一性,其中完整性测量特征在单个简档的每个点击流数据实例中出现的程度,其中一致性测量特征跨单个简档的不同点击流数据实例具有相同值的程度,并且其中唯一性测量特征没有在任何其它简档中出现的程度;以及
计算关于各个简档的用于所述查询的相关性分数,所述相关性分数被计算为指示选择的所述特征相对于所述各个简档的唯一性和频率的因子在选择的所述特征内的求和。
16.根据权利要求15所述的计算系统,其中所述营销服务还被配置为执行操作,所述操作包括:
根据所述相关性分数对简档与所述查询的相关性进行排行;
确定是否达到阈值相关性分数;以及
在达到所述阈值相关性分数时,合并所述点击流数据与最高排行的简档;或者
在未达到所述阈值相关性分数时,创建用于所述点击流数据的新简档。
17.根据权利要求15所述的计算系统,其中计算相关性分数包括向不同的选择的特征指派不同权值以控制选择的所述特征对总相关性分数的影响。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/823,121 | 2015-08-11 | ||
US14/823,121 US10909571B2 (en) | 2015-08-11 | 2015-08-11 | Visitor identification based on feature selection |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106447419A CN106447419A (zh) | 2017-02-22 |
CN106447419B true CN106447419B (zh) | 2021-10-15 |
Family
ID=56894747
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610440594.7A Active CN106447419B (zh) | 2015-08-11 | 2016-06-17 | 基于特征选择的拜访者标识 |
Country Status (5)
Country | Link |
---|---|
US (1) | US10909571B2 (zh) |
CN (1) | CN106447419B (zh) |
AU (1) | AU2016203941A1 (zh) |
DE (1) | DE102016008612A1 (zh) |
GB (1) | GB2541275A (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10558933B2 (en) * | 2016-03-30 | 2020-02-11 | International Business Machines Corporation | Merging feature subsets using graphical representation |
CN110019826B (zh) * | 2017-07-27 | 2023-02-28 | 北大医疗信息技术有限公司 | 医疗知识图谱的构建方法、构建装置、设备和存储介质 |
US11176373B1 (en) * | 2018-01-12 | 2021-11-16 | Amazon Technologies, Inc. | System and method for visitor detection algorithm |
US11080376B2 (en) | 2018-11-28 | 2021-08-03 | Adobe Inc. | Anonymous cross-device, cross-channel, and cross-venue user identification using adaptive deep learning |
US20210133270A1 (en) * | 2019-11-05 | 2021-05-06 | International Business Machines Corporation | Referencing multiple uniform resource locators with cognitive hyperlinks |
US11489910B1 (en) * | 2021-09-03 | 2022-11-01 | Bi Science (2009) Ltd | System and a method for multisession analysis |
CN114491318B (zh) * | 2021-12-16 | 2023-09-01 | 北京百度网讯科技有限公司 | 目标信息的确定方法、装置、设备以及存储介质 |
CN118350893A (zh) * | 2024-04-17 | 2024-07-16 | 广州智赢万世市场管理有限公司 | 一种基于大数据的互联网商城运营管理系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008039784A2 (en) * | 2006-09-25 | 2008-04-03 | Compete, Inc. | Website analytics |
CN102722838A (zh) * | 2012-05-25 | 2012-10-10 | 北京邮电大学 | 用于网站向用户推荐物品的方法和装置 |
KR20140006294A (ko) * | 2012-07-02 | 2014-01-16 | (주) 씨제이오쇼핑 | 가상피팅을 이용한 상품 추천 시스템 및 추천 방법 |
CN103678672A (zh) * | 2013-12-25 | 2014-03-26 | 北京中兴通软件科技股份有限公司 | 一种信息推荐方法 |
CN104254851A (zh) * | 2012-03-17 | 2014-12-31 | 海智网聚网络技术(北京)有限公司 | 用于向用户推荐内容的方法和系统 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7251687B1 (en) | 2000-06-02 | 2007-07-31 | Vignette Corporation | Method for click-stream analysis using web directory reverse categorization |
KR101083002B1 (ko) * | 2009-09-28 | 2011-11-14 | 주식회사 다음커뮤니케이션 | 구매전환확률 산출방법 및 그를 위한 서버 장치 |
US20140136321A1 (en) * | 2012-11-09 | 2014-05-15 | ChoozOn Corporation | System for publishing content in marketing communications across digital media in online advertising |
EP3079116A1 (en) * | 2015-04-10 | 2016-10-12 | Tata Consultancy Services Limited | System and method for generating recommendations |
-
2015
- 2015-08-11 US US14/823,121 patent/US10909571B2/en active Active
-
2016
- 2016-06-10 GB GB1610166.9A patent/GB2541275A/en not_active Withdrawn
- 2016-06-11 AU AU2016203941A patent/AU2016203941A1/en not_active Abandoned
- 2016-06-17 CN CN201610440594.7A patent/CN106447419B/zh active Active
- 2016-07-15 DE DE102016008612.2A patent/DE102016008612A1/de active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008039784A2 (en) * | 2006-09-25 | 2008-04-03 | Compete, Inc. | Website analytics |
CN104254851A (zh) * | 2012-03-17 | 2014-12-31 | 海智网聚网络技术(北京)有限公司 | 用于向用户推荐内容的方法和系统 |
CN102722838A (zh) * | 2012-05-25 | 2012-10-10 | 北京邮电大学 | 用于网站向用户推荐物品的方法和装置 |
KR20140006294A (ko) * | 2012-07-02 | 2014-01-16 | (주) 씨제이오쇼핑 | 가상피팅을 이용한 상품 추천 시스템 및 추천 방법 |
CN103678672A (zh) * | 2013-12-25 | 2014-03-26 | 北京中兴通软件科技股份有限公司 | 一种信息推荐方法 |
Non-Patent Citations (2)
Title |
---|
一种解决新项目冷启动问题的推荐算法;于洪等;《软件学报》;20150630;第26卷(第6期);全文 * |
基于项目相关度的STI 新群体冷启动推荐方法;王磊等;《小型微型计算机系统》;20150331;第36卷(第3期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
US20170046735A1 (en) | 2017-02-16 |
US10909571B2 (en) | 2021-02-02 |
GB2541275A (en) | 2017-02-15 |
GB201610166D0 (en) | 2016-07-27 |
CN106447419A (zh) | 2017-02-22 |
DE102016008612A1 (de) | 2017-02-16 |
AU2016203941A1 (en) | 2017-03-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106447419B (zh) | 基于特征选择的拜访者标识 | |
US10846461B2 (en) | System and method for providing content to users based on interactions by similar other users | |
US9065727B1 (en) | Device identifier similarity models derived from online event signals | |
RU2720952C2 (ru) | Способ и система для создания рекомендации цифрового содержимого | |
RU2725659C2 (ru) | Способ и система для оценивания данных о взаимодействиях пользователь-элемент | |
US9589277B2 (en) | Search service advertisement selection | |
US11593906B2 (en) | Image recognition based content item selection | |
US9727880B2 (en) | Predicting user responses | |
US10102482B2 (en) | Factorized models | |
US20140129324A1 (en) | System and method for dynamically placing and scheduling of promotional items or content based on momentum of activities of a targeted audience in a network environment | |
US8533044B2 (en) | Considering user-relevant criteria when serving advertisements | |
US10762134B1 (en) | Node graph traversal methods | |
US20150242750A1 (en) | Asymmetric Rankers for Vector-Based Recommendation | |
US20100250335A1 (en) | System and method using text features for click prediction of sponsored search advertisements | |
US20130132437A1 (en) | Optimizing internet campaigns | |
EP2960849A1 (en) | Method and system for recommending an item to a user | |
TW201447797A (zh) | 內容個人化之多相排序方法和系統 | |
WO2011119440A2 (en) | Crowd-sourcing and contextual reclassification of rated content | |
US10402465B1 (en) | Content authority ranking using browsing behavior | |
US20120284119A1 (en) | System and method for selecting web pages on which to place display advertisements | |
EP2778979A1 (en) | Search result ranking by brand | |
US20150310487A1 (en) | Systems and methods for commercial query suggestion | |
US20150248720A1 (en) | Recommendation engine | |
US20120005021A1 (en) | Selecting advertisements using user search history segmentation | |
US8825698B1 (en) | Showing prominent users for information retrieval requests |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |