CN104737159A - 用于情境分析的数据处理方法 - Google Patents

用于情境分析的数据处理方法 Download PDF

Info

Publication number
CN104737159A
CN104737159A CN201380051219.8A CN201380051219A CN104737159A CN 104737159 A CN104737159 A CN 104737159A CN 201380051219 A CN201380051219 A CN 201380051219A CN 104737159 A CN104737159 A CN 104737159A
Authority
CN
China
Prior art keywords
situation
user
data
index
relevant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201380051219.8A
Other languages
English (en)
Other versions
CN104737159B (zh
Inventor
让-皮埃尔·马莱
亨利·马蒂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nuo fur Co
Original Assignee
Nuo fur Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nuo fur Co filed Critical Nuo fur Co
Publication of CN104737159A publication Critical patent/CN104737159A/zh
Application granted granted Critical
Publication of CN104737159B publication Critical patent/CN104737159B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • General Engineering & Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Transfer Between Computers (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Storage Device Security (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种用于通过服务器(1)处理数据的方法,所述服务器(1)包含至少一个数据处理单元和数据存储装置,所述方法的特征在于其包含以下步骤,随着处理单元执行对至少一个触发器的激活,所述触发器能够响应于预定义事件而激活:(a)尝试通过处理单元来确定至少一个索引的状态,所述至少一个索引是基于被激活的触发器由一组可观测索引中选择的,所述可观测索引与用户的个人数据有关和/或与通用数据有关;(b)基于所述尝试确定至少一个索引状态的结果来生成并在存储装置内存储用户情境签名(c)将所述用户的情境签名与多个掩膜进行比较,每个掩膜与参考情境相关并对应于情境签名空间,以便将所述用户情境识别为与至少一个包含所述情境签名的掩膜相关的参考情境;(d)通过服务器的硬件或软件情境分析装置对用户的所述识别情境进行分析以便获得处理过的数据。

Description

用于情境分析的数据处理方法
技术领域
本发明涉及用于电子贸易(e-commerce)的数据分析领域。
更具体地,本发明涉及一种用于处理互联网网站平台连接数据的系统,所述方法尤其专用于统计处理、数据挖掘、决策工具设计、诊断学、供给法或者近似法、模拟器设计、自动学习或者学习辅助系统以及通常用于情境或者情境分析的分析系统设计。
背景技术
互联网的发展引起了在线贸易或者电子贸易的增长。网络上出现了许多服务,包括产品销售、用户链接、银行或者新闻。
在其初期,电子贸易导致了“电子商务”("e-business")的出现,即,用上游部门可以执行的所有事务来建立交易,尤其是电子营销。
实际上,即使在线销售理论上能够使客户关系极为个性化,但互连网上的普遍匿名性阻止了基于客户目标性和差异化的传统市场规则的应用。
因此,认识互联网用户至关重要。一些电子贸易的参与者建议他们的客户填写个人档案来更好地识别他们,以便为他们提供个性化方案,就如同售货员所做的一样。但是这种解决方案对那些也常常谨慎给出个人信息的互联网用户是受限制的。
已知技术提出收集互联网用户的“行为数据”(例如通过他的历史内容)来更好地识别他并且个性化他所收到的内容,尤其是广告。然而,这些技术只提供了对互联网用户的部分认识,并且仅获得了极少的信息。
本发明提出了一种处理用于确认的数据连接的替代系统,所述系统借助连接到互联网网站平台上的用户新体系、新情境,然后分析它们以获得数据并且预测其他情境,而不依靠模型或者物理或逻辑实施结构。
发明内容
本发明提出一种通过服务器处理数据的方法,所述服务器包括至少一个数据处理单元和数据存储装置,所述方法的特征在于随着处理单元执行对至少一个触发器的激活,所述触发器能够响应于预定义事件而激活,它包括步骤:
(a)尝试通过处理单元来确定至少一个索引的状态,所述至少一个索引是根据被激活的触发器由一组可观测索引中选择的,所述可观测索引与用户的个人数据有关和/或与通用数据有关;
(b)根据所述尝试确定至少一个索引状态的结果来生成并在存储装置中存储用户情境签名;
(c)将所述用户的情境签名与多个掩膜进行比较,每个掩膜与参考情境相关并对应于情境签名空间,以便将所述用户情境识别为与至少一个包含所述情境签名的掩膜相关的参考情境;
(d)通过服务器的物理或逻辑情境分析装置对所述所识别的用户情境进行分析以便获得处理过的数据。根据本发明的其他优点和非限制特性:
●情境签名包括两个部分,所述两个部分包括与所述用户的个人数据有关的用于可观测索引的第一部分,以及与通用数据有关的用于可观测索引的第二部分;
●每次触发器被激活时重复所述方法,步骤(b)由更新所述情境签名的步骤(b’)代替;
●至少一个策略与每个参考情境相关,每个策略包括从情境引擎库中选择的一个或多个情境引擎,每个情境引擎能够执行给定的对用户情境的处理以便获得对情境具有预期效果的信息,方法包括步骤(d),运行至少一个与所述所识别的情境、所述情境上的所述策略的情境引擎相关的策略,以便获得至少一个信息堆栈;
●根据堆栈信息修改一组参考情境以便改善用户情境的识别;
●情境签名包括多个信息单元,每个信息单元与索引相关,每个信息单元能够具有至少三个值,如果相关索引的确定状态对应于参考状态则包括第一值,如果相关索引的确定状态不对应于参考状态则包括第二值,以及如果相关索引的状态在步骤(a)期间无法确定则包括第三值;
●所述数据是互联网网站平台的连接数据,所述预定义事件响应于所述用户通过装置连接到所述平台期间发生的触发器的激活;
●为通过装置连接到平台的多个用户执行所述方法;
●为通过装置连接到平台的每个用户执行所述步骤(a)到(c)以便识别每个用户的情境,根据服务器的所述物理或逻辑情境分析装置的能力在步骤(d)中分析所有或一些所识别的情境。
根据第二方面,本发明涉及一种包括至少一个数据处理单元和数据存储装置的服务器,在用户通过装置连接到互联网网站平台期间,所述至少一个处理单元配置为执行根据本发明第一方面的方法,所述服务器与所述平台相连接。
附图说明
本发明的其他特性和优点将从以下优选实施例的描述中显现出来。此描述将根据附图给出,其中:
-图1是符合本发明的网络架构的示意图;
-图2是图示出根据本发明的用于处理连接数据的方法步骤的示意图;
-图3是根据本发明的用于处理连接数据的系统实施例的示意图;
-图4示出了根据本发明的用于处理连接数据的系统的处理模块;
-图5是根据本发明的用于处理连接数据的系统实施例的即时处理模块的示意图;
-图6是根据本发明的用于处理连接数据的系统实施例的延迟处理模块的示意图。
具体实施方式
情境
与所有已知方法相比,根据本发明的数据处理方法是基于前述的完全“情境”分析,而不是基于简单的参数列表。
通过本描述,将对应用到前述电子贸易领域(在这种情况下所述数据是互联网网站平台的连接数据,即连接到平台的有关数据)的方法应用进行更加具体地描述,尽管很明显其可以变换为通常在工作站的用户数据处理。数据实际上可以是用户的邮件、他的系统参数等。由于此类数据的体量和多样性,连接数据的处理根据情境识别给出良好的结果。
这里的用户“情境”意味着或多或少复杂的和或多或少模糊的描述用户心理、用户社会地位以及他的情境场景(所有其他连接用户的情境)的信息。电商可以将情境称为富有意义术语,例如,午餐后浏览互联网的女人可以被无成见地定名为“下午强征者”。
通过使用分析、预测和模拟工具,情境分析打开了许多经济领域的广阔前景。情境分析(例如见法国专利申请FR2962823)能够自动地接收一个或者多个情境流的输入,从中提取情境,区分重要元素以及连续地应用处理,检测现象以及提供解决方案的演变,尤其是通过归纳法(induction)。
其优点众多:正如所见,情境系统并非由模型或实施架构来限制,并因此永久适用。正如人脑一样,它们能够通过管理它们的资源而专注于本质特征。最后,它们的潜能相比于那些任何现有专家系统展现出更加多的通用性,并在特定领域进行区分。
根据本发明的数据处理方法的原理(服务器实施处理,所述服务器包括至少一个数据处理单元和数据存储装置,在处理互联网网站平台的连接数据的情况下,服务器处于与所述平台的网络连接中)是通过第一机制识别一个或者多个用户情境,然后通过第二机制处理此后收集的情境。在电子贸易的情况中,相关用户是通过设备连接到所述平台的用户,或者如果服务器的资源允许甚至是所有访问互联网的用户(见下文)。
该处理可以具有几个接受者和许多目的,也如下文所述。
图1示出了其中实施本发明的网络构架。设备3(它可以是从工作站到移动终端(例如智能手机或触摸板)的任何形式的计算机设备,用户可以通过该设备访问互联网)通过互联网网络4连接到互联网网站的平台2。用于运行所述方法的服务器1处于与所述平台2的网络连接中,所述服务器1包括至少一个数据处理单元和数据存储装置。
对术语“平台”的理解十分重要,该术语意味着互联网网站的互联网网站主机代管页面的一个或多个互连服务器,,所述互联网网站是用户正在搜索的。进行处理的服务器1可以是构成平台2的这些服务器之一。在所有情况中用户设备3直接或间接地(通过平台2)通过互联网网络连接到执行所述方法的服务器1。值得注意的是,处理服务器1和平台2之间的连接可以是本地的,但是可选地并不禁止其通过互联网4。
第一机制:情境识别
如图2所示,连接到所述平台的用户情境识别由参考情境列表来完成,所述参考情境列表可以由互联网用户的行为观测来预先确定,或者特别有利地通过下面要描述的另一机制自动生成。
为此,根据本发明方法的情境识别机制使用“触发器”。触发器是能够根据预定事件被激活并初始化特定程序的软件模块。
触发器可以有很多类型。在第一类型中,事件是互联网用户的行为,例如咨询点击、选择点击等。在第二类型中,事件是到期期限,例如在互联网用户的最后访问之后,或者关于触发器的在前激活(在此后一种情况中,它是以固定频率被激活的,例如每个小时)。明显很多其他的配置是可能的。
对于特定触发器的激活,服务器1的数据处理装置触发对至少一个“索引”状态进行确认的尝试。索引是对情境很重要的不同元素。一些索引涉及“情境场景”,即,同时发生的连接到互联网的用户情境的集合或子集。其可以例如为时间、天气预报等。可选的,一些索引涉及“情境环境”,即互联网用户的特定情境。其可以例如为互联网用户的年纪、性别(genre)、身高、他的浏览(快速、迟缓等)、他的状态(匆忙、搜索等)。因此索引与连接到平台2的所述用户的个人数据有关和/或与通用数据有关。这两种情境“区域”的结合实际上为用户情境的可靠识别提供了良好的结果。
自然地,尤其包含与优选结果(例如交易是否终结)相关的一些索引,特别是根据情境分析。
服务器1的处理单元具有预先确定的可观测索引收集。应该注意到,可观测并不意味着必然可确定。尝试确定索引的状态可能是徒劳的。例如,互联网用户的年纪并不总是可访问的。索引于是被认为是“难以识别的”。然而后续尝试(通过相同的触发器或者另一触发器)并非不可能此时成功。
尝试确定的索引列表与每个触发器相关。如果此触发器被激活,这些索引且仅有这些索引的相关状态会被观测到。以示例方式,周期性触发器可以尝试确定天气预报或用户每秒点击量。可选地,触发器可以根据输入文本尝试确定用户的年龄和性别,所述触发器链接到模型末端“发送”按钮上的单击。
根据所述尝试的结果确定至少一个索引的状态,处理单元生成并在服务器1的存储装置中存储用户的情境签名(如果情境已经存在,其只进行更新)。
用户的情境签名对应于与索引相关的所有数据,所述索引表征用户情境。
有利地,情境签名具体包括多个信息单元,每个信息单元与索引相关(情境签名中有利地存在两个部分,分别为,如果相关索引涉及情境场景则单元被称为“阈值”,如果相关索引涉及情境环境则单元被称为“跟踪器”),每个信息单元可以具有至少三个值,如果相关索引的确定状态对应于参考状态则包括第一值(值“1”),如果相关索引的确定状态不对应于参考状态则包括第二值(值“0”),以及如果相关索引的状态无法确定(不论是因为没有对相关索引的确定进行尝试,还是因为遵从触发器设定的尝试是失败的)则包括第三值(值“X”)。每个信息单元是具有三个值的“位元”。
很明显的是符号0、1和X纯粹是说明性的,技术人员可以选择他所选择的数据表示法。具体地,使用具有非特定数目的数值且能够存储数目的信息单元是可行的,例如字符链等。然而,后面的说明关注于具有n个状态的数据单元。使用预先定义的符号,例如,1X1001XX是带有8个信息单元的情境签名。
还要注意的是即使情况“没有尝试确定”/“尝试但没有成功确定”(相同的值“X”)在此不做区分,可选地可以考虑根据其尝试进行确定的信息。实际上,尽管不能够获得构成索引状态的信息,但尝试失败的事实可以是有意义的。例如这可以意味着用户档案具有自愿的(甚至非自愿的)隐藏部分,且因此它可能是一些人尝试提高他的互联网机密性。
应该注意的是一些跟踪器或者阈值可以基于分布法积分器,例如高斯分布或者泊松分布,以授予后者长久持续的字符。换句话说,积分器根据先前的观察“提供”状态,所述状态是索引必须具有的,当先前的一个触发发生于不久之前时,短期应避免再触发进行确定尝试的需求。
用户的情境签名与多个“掩膜”进行比较。每个掩膜与参考情境相关,并且对应于情境签名的空间。为此,每个掩膜包括作为签名的多个信息单元,所述多个信息单元可以具有值0、1、X,如果信息单元可以是任意一个则其还包括第四个值(标注为“A”)。一些索引的状态实际上并非一些情境的特性。
例如,10A0AAX1是具有8个信息单元的掩膜,其组合为如下签名:1000 00X1,1000 01X1,1000 0XX1,1000 10X1,1000 11X1,1000 1XX1,1000 X0X1,1000 X1X1,1000 XXX1,1010 00X1,1010 01X1,1000 0XX1,1010 10X1,1010 11X1,1010 1XX1,1010 X0X1,1010 X1X1,1010 XXX1,10X0 00X1,10X0 01X1,10X0 0XX1,10X0 10X1,10X0 11X1,10X0 1XX1,10X0 X0X1,10X0 X1X1,10X0 XXX1。
通过逻辑门的方式很容易地完成签名和掩膜之间的比较(不具有值“A”的掩膜的每个单元通过异或门(XOR)与签名中对应单元相比较,并且与门(AND)应用于这些比较结果)。当掩膜符合时,连接到平台2的所述用户的情境被识别为是与至少一个包含所述情境签名的掩膜相关的参考情境。
应该注意的是多个掩膜有利地存储于服务器1的存储装置中,并且一些掩膜可能具有重叠的范围,换句话说,对应于给定情境的掩膜不存在唯一性。为了解决这个困难,根据循环对掩膜有利地进行迭代测试:如果测试是积极的(positive),保持与掩膜相关的参考情境,如果测试并非积极的,则测试随后的掩膜。当新的触发器被激活时,如果可能的话首先再次测试相同的情境掩膜以维持当前情境的稳定性。
凭借所述方法的第一阶段的完成,情境从而被识别为用户情境。
第二机制:情境处理
根据本发明的方法的第二机制包括通过服务器1的物理或逻辑情境分析装置对所识别的用户情境进行分析以便获得处理数据,所述处理数据对用户、互联网网站的管理人员等将非常有意义。情境分析装置可以包括由服务器1的数据处理装置(其可以是多核处理器,其中的核专用于此情境分析,如下所述)执行的应用程序。
为此,每个参考情境与至少一个“策略”相关(有利地1到3),即,包括一个或多个情境引擎(以及这些引擎的任何参数)以及信息内容的集合,即,文本、图形内容(包括图像、视频等)、URL链接(统一资源定位符)、形状要素(格式、字体参数等),和可用于个性化信息的任何其他数据。信息(也称为建议)意味着由源于处理连接数据以及对情境具有预期效果的任何形式的通信。
常规术语中,这些可以是提交给网站管理员的报告信息(例如,以邮件的形式),但是特别地可以是用于情境要进行处理的用户的信息。例如,这可以是在进行查阅的互联网页面上所显示的标语、邮件、短讯服务(SMS)等。
情境引擎是选自情境引擎库的软件元素。每个情境引擎能够在用户情境上执行给定的处理(引擎考虑整个场景和情境环境(situational sphere)的参数:实际上,如果用户的情境签名是唯一的,则所识别的情境并非唯一。考虑信息单元,即,所观察的索引状态,个性化处理)以便获得对情境具有预期效果的一个或多个信息。
引擎的第一示例可以采用连接到所访问情境(适于商店情境)的一个或者多个产品的建议。在类似于所识别的用户情境(在个人等级上),引擎的第二示例可以采用情境中互联网用户所购买的产品的建议。在引擎的第三示例中,可以简单地建议流行产品(在族群社会等级检测销售上的显著增长)。
值得注意的是相同的策略可以与几个情境相关,并且每个策略可以涉及“重要性”的等级,即,如果发生主要用户的流入则优先权标准将很重要。
对于与所述所识别的情境相关的至少一个策略(可以按重要性的顺序进行分析),服务器1的处理装置运行相关的情境引擎以获得至少一个信息堆栈。有利地,建立至少两个信息堆栈(有利地为三个),每个信息堆栈与机密性等级相关。机密性等级意味着信息公开等级。例如,在执行具有两个机密性等级的方法中,等级1与个人信息相对应,而等级2与全局信息相对应(例如网站上的标语)。前述的引擎的三个示例与三个不同的机密性等级相对应:第一等级表示机密性的“低”等级,因为它适用于任何用户;第二等级表示机密性的“高”等级,因为建议是个性化的,且因此仅适用于用户。第三等级对应于机密性的“平均”等级,因为曝光发生在群组的等级上。由这三个引擎生成的三个建议因此将在三个不同的堆栈中被找到。
这些信息堆栈于是被退栈为“曝光”信息,即,将它们发送到它们的接收者。更确切地说,其包括发送(视情况而定)所述至少一个信息堆栈的信息子集到所述用户的装置3和/或者平台2(当为网页元素时)。
这可以通过LIFO(后进先出)的简单策略完成,但是有利地采用所谓的令牌(token)策略。在此策略中,当前的网页包括曝光区域,所述曝光区域能够接收给定格式并具有给定参数的信息。当有效时,该区域发送包括不同区域参数的令牌。情境引擎接收令牌并组成“在线指令”的一个或者多个信息作为这些参数的函数。带有令牌的信息在其余信息之前由堆栈中被提取出。
信息的曝光影响情境(例如,如果它已经对用户产生预期影响则引起交易),这具有激活新的触发器和引起用户所在的情境改变的机会。所述方法被重新启动且信息的效果将在下个分析周期中被观测到。
处理能力的优化
互联网用户的活动并非整日不变的,具体地,在尖峰期,服务器1的数据处理装置在面对信息流入(换句话说,所处理的流量)时可能遭遇困难。
有利地,系统考虑这些通信量可变性以及调节方法。具体地,方法有利地调动资源,所述资源是对于识别所有连接用户的情境所必须的(方法的第一部分比第二部分消耗较少的资源),但分析仅作为每个有效能力的一部分,具体地根据前述的策略“重要性等级”进行分类。
为此,定义了三个活动渐变等级(这里称为“α层”,“β层”,“γ层”),随着操作转向降级模式(一些超过阈值的情境被舍弃)或者延期模式(由于拥塞,被认为感兴趣的一些情境没有立即处理,但是当活动降低时其将被随后处理)。规格化的情境分析也可以根据活动等级而变化:如果资源是不充分的,处理要点(“本质推理”模式),但是如果未进行精确分析(“本质归纳”模式),对此存在更多的反射。在半监督或非监督模式的情况下(如下),假设可用资源学习是受欢迎的。
上面的三个等级根据网站上活动的典型等级以每秒的动作次数进行定义。
所述α层对应于活动的“高”等级。例如,此为同时连接高至1000的网站,假设用户平均每十秒点击一次(或任何其他动作例如输入),则α层为100Hz。
所述β层对应于活动的“平均”等级。例如,如果在相同的网站上每天有100000连接,并且可知互联网用户平均停留1分30秒,则β层为10.4Hz。
所述γ层对应于活动的“低”等级。例如,如果网站一天中在最大同时连接和最小同时连接之间具有1到100的比率(或者每点击一次9秒时同时连接的最小数目为10),则γ层为1.11Hz。
在相反的情况中(比必需所更多的有效处理能力),方法可以利用“影子”,即,维持前面用户的现存情境来增加学习基础。
半监督和非监督模式
所述方法需要参考情境集合来运行,但是此集合并非固定且可以变化。具体地,策略可以包括情境引擎,所述情境引擎配置为以便信息被发送(特别是发送给网站管理员)以便指明新情境的出现。管理员可以进行其新的参考情境。
在半监督模式下,系统向管理员建议新的参考情境(与情境引擎预定的掩膜相关),并且管理员可以选择是否验证这些建议。可选地,在非监督模式下(例如图2所示),系统完全自动且包括新的参考情境。
值得注意的是通过“萌芽(budding)”的新的情境的出现被观测到。换句话说,所谓的引擎检测为更大情境的子类别的出现(例如,如果对应于参考情境的情境签名的有效数目表示被分类为“A”的索引的相同状态,即,没有对掩膜做出解释)。可选地,对于给定的参考情境,可以尝试选择这些已经在交易中完成的情境来检测有效的信息。
反射处理器
根据第二方面,本发明涉及一种系统1,具体地涉及包括至少一个数据处理单元和数据存储装置的服务器1,所述至少一个处理单元配置为在用户通过装置3连接到网站的平台2期间执行根据第一方面的方法。
如所述,通常方法是通过网站的服务器执行的,所述服务器不同于包括平台2的服务器(即,服务器托管网站的页面并管理网站的运行),用户的装置3连接到所述服务器以通过平台2执行方法。
尤其优选地,本发明的第二方面涉及一种用于处理互联网网站的平台2上的连接数据的系统1,特别优选的实施例如图3所示。该系统包括
-至少两个独立连接的数据处理模块21、22(模块“SALI2”其中SALIX和SALIC是两个版本),处理模块21、22被分为至少两个互补的群组,群组的模块21、22配置为运行操作的子集,所述操作对于用于处理所述平台2的用户连接数据的方法执行是必需的,所述平台2包括用户情境的识别,每个群组的处理模块21接收来自另一个群组处理模块22的数据以便完成所有数据处理连接过程;
-分配器模块10(“RENZO”),其接收所述连接数据并将其发送到处理模块21、22上;
-调节器模块30(“RENALDO”),其收集来自处理模块21、22的数据并将处理后的连接数据传送到所述平台2。
这些模块10、21、22、30被称作反射处理器,因为它们倾向于处理“没有优先权”的入口数据。
因此,该原理为具有n个模块21、22的两个(甚至更多个)群组,一个群组的模块21、22并行执行相同的任务,并且每个群组的任务互补地执行连接数据的处理。不同的模块21、22可以是物理上独立的处理器(通过总线连接),每个具有它的处理装置以及它的存储空间,或者可选地是用在给定装置上的软件程序块(software bricks),模块共享相同的处理器资源(可选地为多核)以及相同的存储空间。值得注意的是系统1可以分布在几个服务器之上甚至被安装于虚拟机的云计算中。模块21、22有利地以抽象语言中流的形式交换数据,例如XML(可扩充标记语言),JSON(JavaScript对象表示法)、SOAP(简单对象访问协议),Silvia甚至是Mawerick协议。
参考图4,它图示地示出了SALI2类型的处理模块21、22(独立于群组)。很明显的,它有利地具有7个进入/输出端口。实际上模块21、22优选地连接到可执行情境引擎库和/或者包括所述互联网网站本体特征的数据库以便它可以进行前述的方法步骤。
具体地:
-OBS端口(观察器)接收源自平台2的XML流形式的数据;
-COL端口(收集器)接收来自其他处理模块21、22SALI2的XML流形式的数据;
-ONT端口(本体)接收XML文件形式的本体;
-LIB端口(库)包括追踪器、阈值和情境引擎(可执行的)库;
-EDI端口(编辑器)发送XML流形式的输出数据;
-DIF端口(扩散器)发送XML流形式的数据到其他群组的处理模块21、22;
-MON端口(监控)发送统计数据。
通过模块21、22的专业化分工,模块21、22群组之间的任务分配允许更好的处理效率,并且事实上每个群组被提供数据以保证“反馈”,如图3所示。处理部分的结果改善了处理的其他部分。处理模块21、22群组之间可能分配的几个关键点将在后文进行描述。值得注意的是这些处理方法可以结合:系统1可以具有根据第一定律分配的模块21、22的两个群组,群组的模块21、22根据第二定律分配为两个子群组。
分类工作是通过分配器模块10完成的,所述分配器模块10解释了每个信息数据包,并且将其编址到适当的处理模块21、22。
调节器模块30接收根据完成的处理所发送的与信息相关的流,并处理这些信息的发布。它重组全部的流至网站的平台2和/或者用户的装置3.
根据第一变体,群组的处理单元21是前处理模块,所述前处理模块配置为识别连接到所述平台2的用户情境,另一群组的处理模块22是后处理模块,所述后处理模块配置为处理连接用户的所识别的情境。在这个特别有利的配置中,有利地存在前处理模块21和N个后处理模块22(特别为4个或8个,但应当理解这并非是对数目的限制并且其可以是任何数目),因为产生情境和信息发送的处理是最大的方法资源消耗部分。
反馈连接,如图2所示,允许前处理模块21收集来自单个后处理模块或多个后处理模块22的数据以便影响情境识别。这使得前述的非监督模式成为可能。
根据第二变体,群组的处理模块21执行实时操作(“即时处理”模块),另一个群组的模块22执行延迟操作(“延迟处理”模块)。换句话说,一些模块21执行所需的即时活动任务(例如连接到用户导航的触发器发送即时曝光信息),而其他模块22实施可能随着时间偏移而执行的任务。数据被存储在存储装置中直到可以其能够被处理。此配置促进了信息的持久性以及对过往程度的考虑,所述过往程度中任何时刻“实时”模块21接收与延迟处理有关的数据(因此为连接数据的较早产物)。反馈回路使得延迟处理模块22与“处理网格”的即时处理模块21进行通信,通过所述“处理网格”的即时处理模块21而适于即时处理。该配置也很好地适应于从即时处理向延迟处理传输数据中的强流入周期。
这涉及到图3所示的系统:“SALIX”是延迟处理模块22,“SALIC”是即时处理模块21。在此特别有利的配置中,有利地存在延迟处理模块22,和N个即时处理模块21(即时处理具有优先权,并且由于一些处理不能被延迟而存在较大消耗)。在具有4个即时处理模块21的配置中,总共存在7个模块10、21、22、30,因此特别地优选八核处理器(第八个核处理余下的系统操作)。
图5和6分别更具体地表示了SALIC类型的即时处理模块21以及SALIX类型的延迟处理模块22。这些图示出了端口OBS、COLL、EDI和DIF(端口ONT、LIB和MON在两个模块类型之间同样地用电缆连接)。
即时处理模块21SALIC通过观测器端口接收的咨询、选择和消耗向量(包括所观测到的用于确定索引状态的数据)来处理所有用户情境的识别(要即时完成)。
不同的端口传送向量(vectors)给延迟处理模块22 SALIX。收集器端口接收延迟处理的信息向量以及来自延迟处理模块22 SALIX的网格。
追踪器(和阈值)生成来自向量和网格的情境签名。执行与所识别的情境策略相关的实时情境引擎,并通过编辑器端口发送由引擎执行生成的信息。
延迟处理模块22 SALIX处理没有必要立即完成的处理。观测器端口只接收与服务器和管理用户有关的数据。收集器端口接收来自即时处理模块21 SALIC的向量。情境引擎通过计时器运行和控制,所述计时器定义在哪个点上处理被延迟。
这些引擎产生延迟信息(在访问之后几个小时发送给用户的信息,例如以促销邮件的形式鼓励用户返回网站)以及通过编辑器端口发送给适当支持者的网站管理员信息,还有通过扩散器端口发回给(带有一些向量)即时处理单元21 SALIC的处理网格,如同所述。
根据第三变体,模块21、22的每个群组对应于“服务线”。这是互联网网站内的产品分类基础单元,在系统内部线/服务/选项被称为“LSO”。服务线结合几个服务。例如,家具目录中结合了“桌子”、“TV家具”、“躺椅”等服务的分类“客厅(salon)”是服务线。同样地,分类“男士”、或“尺寸XL”是服装目录的服务线。在例如商业网站的互联网网站上,其可能表示几个分类模式下的相同产品,其中这些是不同的服务线。每个服务具有选项。在前面的例子中,“男士”线的“裤子”服务将包括选项列表,该选项是同样的裤子型号。每个选项表示具有几种变化(尺寸、颜色等)的产品;与选项相反,每个产品实际上是唯一的(给定的参考目录)。相同的产品因此可以存在于几个LSO场景之中。再次谈及此示例,相同的裤子可以在“XL”线的“男士裤子”服务中被找到。
通过服务线分隔处理模块21、22是可行的,尤其对于具有范围广泛的产品的网站,所述产品的用户情境将非常不同。值得注意的是,其适于大型网站,用户根据他所导航的服务线而重定向至平台2的非此即彼的服务。
还很有利的是这些变体中的几个进行结合。具体地,第二变体的即时处理模块21 SALIC中的每个可以专用于一个或多个服务线。在这种情况下,如果输入流是管理数据,则分配器单元10 RENZO通过将输入流引导至延迟处理单元22 SALIX而对输入流进行分配,或者如果输入流是来自用户的导航数据,则引导输入流至即时处理模块21 SALIC,根据其所处的服务线。

Claims (10)

1.一种通过服务器(1)处理数据的方法,所述服务器(1)包括至少一个数据处理单元和数据存储装置,所述方法的特征在于随着处理单元执行对至少一个触发器的激活,所述触发器能够响应于预定义事件而激活,它包括步骤:
(a)尝试通过处理单元来确定至少一个索引的状态,所述至少一个索引是根据被激活的触发器由一组可观测索引中选择的,所述可观测索引与用户的个人数据有关和/或与通用数据有关;
(b)根据所述尝试确定至少一个索引状态的结果来生成并在存储装置中存储用户情境签名;
(c)将所述用户的情境签名与多个掩膜进行比较,每个掩膜与参考情境相关并对应于情境签名空间,以便将所述用户情境识别为与至少一个包含所述情境签名的掩膜相关的参考情境;
(d)通过服务器(1)的物理或逻辑情境分析装置对所述所识别的用户情境进行分析以便获得处理过的数据。
2.根据前述权利要求所述的方法,其中情境签名包括两个部分,所述两个部分包含与所述用户的个人数据有关的用于可观测索引的第一部分,以及与通用数据有关的用于可观测索引的第二部分。
3.根据前述权利要求中任一项所述的方法,其特征在于,每次触发器被激活时重复所述方法,步骤(b)由更新所述情境签名的步骤(b’)代替。
4.根据前述权利要求中任一项所述的方法,其中至少一个策略与每个参考情境相关,每个策略包括从情境引擎库中选择的一个或多个情境引擎,每个情境引擎能够执行给定的对用户情境的处理以便获得对情境具有预期效果的信息,方法包括步骤(d),运行至少一个与所述所识别的情境、所述情境上的所述策略的情境引擎相关的策略,以便获得至少一个信息堆栈。
5.根据前述权利要求所述的方法,其中根据堆栈信息修改一组参考情境以便改善用户情境的识别。
6.根据前述权利要求中任一项所述的方法,其中情境签名包括多个信息单元,每个信息单元与索引相关,每个信息单元能够具有至少三个值,如果相关索引的确定状态对应于参考状态则包括第一值,如果相关索引的确定状态不对应于参考状态则包括第二值,以及如果相关索引的状态在步骤(a)期间无法确定则包括第三值。
7.根据前述权利要求中任一项所述的方法,其中所述数据是互联网网站平台(2)的连接数据,所述预定义事件响应于所述用户通过装置(3)连接到所述平台(2)期间发生的触发器的激活。
8.根据权利要求7所述的方法,其特征在于为通过装置(3)连接到平台(2)的多个用户执行所述方法。
9.根据权利要求8所述的方法,其中,为通过装置(3)连接到平台(2)的每个用户执行步骤(a)到(c)以便识别每个用户的情境,根据服务器(1)的所述物理或逻辑情境分析装置的能力在步骤(d)中分析所有或一些所识别的情境。
10.一种服务器(1),所述服务器(1)包括至少一个数据处理单元和数据存储装置,在用户通过装置(3)连接到互联网网站平台(2)期间,所述至少一个处理单元配置为执行根据权利要求7到9中任一项所述的方法,所述服务器(1)与所述平台(2)连接。
CN201380051219.8A 2012-08-01 2013-08-01 用于情境分析的数据处理方法 Active CN104737159B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR1257487 2012-08-01
FR1257487A FR2994296B1 (fr) 2012-08-01 2012-08-01 Procede de traitement de donnees pour analyse situationnelle
PCT/EP2013/066216 WO2014020121A1 (fr) 2012-08-01 2013-08-01 Procédé de traitement de données pour analyse situationnelle

Publications (2)

Publication Number Publication Date
CN104737159A true CN104737159A (zh) 2015-06-24
CN104737159B CN104737159B (zh) 2018-05-25

Family

ID=47594867

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201380051219.8A Active CN104737159B (zh) 2012-08-01 2013-08-01 用于情境分析的数据处理方法

Country Status (13)

Country Link
US (1) US10192226B2 (zh)
EP (1) EP2880558B1 (zh)
JP (1) JP6388582B2 (zh)
KR (1) KR20150042223A (zh)
CN (1) CN104737159B (zh)
BR (1) BR112015002250A2 (zh)
CA (1) CA2880416A1 (zh)
ES (1) ES2925535T3 (zh)
FR (1) FR2994296B1 (zh)
IN (1) IN2015DN01307A (zh)
MX (1) MX2015001364A (zh)
RU (1) RU2651155C2 (zh)
WO (1) WO2014020121A1 (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110029665A1 (en) * 2008-08-14 2011-02-03 Tealeaf Technology, Inc. Dynamically configurable session agent
CN102016870A (zh) * 2008-05-06 2011-04-13 思科技术公司 通过测量用户输入设备上按钮按压的压力来识别用户
WO2012051757A1 (en) * 2010-10-21 2012-04-26 Beijing Prosperous Biopharm Co., Ltd. Method and tool suite device for identifying modular structure in complex network

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003065240A1 (en) * 2002-02-01 2003-08-07 John Fairweather System and method for managing collections of data on a network
US7685296B2 (en) * 2003-09-25 2010-03-23 Microsoft Corporation Systems and methods for client-based web crawling
US9177124B2 (en) * 2006-03-01 2015-11-03 Oracle International Corporation Flexible authentication framework
JP2009087155A (ja) * 2007-10-01 2009-04-23 Ntt Docomo Inc 情報提供システム、情報提供装置及び情報提供方法
DE602008001506D1 (de) * 2008-06-12 2010-07-22 Sap Ag Sicherheitsaspekte von SOA
US8352319B2 (en) * 2009-03-10 2013-01-08 Google Inc. Generating user profiles
WO2010108157A2 (en) * 2009-03-20 2010-09-23 Ad-Vantage Networks, Llc Methods and systems for searching, selecting, and displaying content
FR2962823B1 (fr) 2010-07-13 2012-08-17 Ensuite Inf Processeur d'analyse situationnelle

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102016870A (zh) * 2008-05-06 2011-04-13 思科技术公司 通过测量用户输入设备上按钮按压的压力来识别用户
US20110029665A1 (en) * 2008-08-14 2011-02-03 Tealeaf Technology, Inc. Dynamically configurable session agent
WO2012051757A1 (en) * 2010-10-21 2012-04-26 Beijing Prosperous Biopharm Co., Ltd. Method and tool suite device for identifying modular structure in complex network

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陈媛嫄等: "移动情境感知及其交互研究", 《计算机应用研究》 *

Also Published As

Publication number Publication date
JP2015528963A (ja) 2015-10-01
KR20150042223A (ko) 2015-04-20
ES2925535T3 (es) 2022-10-18
RU2015105307A (ru) 2016-09-27
US20150302427A1 (en) 2015-10-22
EP2880558A1 (fr) 2015-06-10
MX2015001364A (es) 2015-09-10
BR112015002250A2 (pt) 2017-07-04
FR2994296A1 (fr) 2014-02-07
CA2880416A1 (fr) 2014-02-06
EP2880558B1 (fr) 2022-05-04
RU2651155C2 (ru) 2018-04-18
CN104737159B (zh) 2018-05-25
WO2014020121A1 (fr) 2014-02-06
JP6388582B2 (ja) 2018-09-12
US10192226B2 (en) 2019-01-29
FR2994296B1 (fr) 2015-06-19
IN2015DN01307A (zh) 2015-07-03

Similar Documents

Publication Publication Date Title
KR101525262B1 (ko) 크로스 채널 최적화 시스템 및 방법
KR101742820B1 (ko) 디지털 마케팅 최적화
US9256692B2 (en) Clickstreams and website classification
CN110033331A (zh) 一种优惠券的发放方法、系统及终端设备
CN108876406A (zh) 客服行为分析方法、装置、服务器及可读存储介质
Zhen et al. Crowdsourcing usage, task assignment methods, and crowdsourcing platforms: A systematic literature review
CN109829593B (zh) 目标对象的信用度确定方法、装置、存储介质及电子装置
CN113569162A (zh) 数据处理方法、装置、设备及存储介质
CN116823410A (zh) 数据处理方法、对象处理方法、推荐方法及计算设备
CN104704490A (zh) 处理关于互联网网站平台连接的数据的方法
CN114117227A (zh) 一种运营维护方法、系统、电子设备及存储介质
CN104737159B (zh) 用于情境分析的数据处理方法
KR102074419B1 (ko) 지능형 상품정보 갱신 서버 및 그를 이용한 지능형 상품정보 갱신 방법
CN104737520A (zh) 用于处理互联网网站平台连接数据的系统
CN109074365A (zh) 使网络通信路径参数化
WO2014086548A1 (en) Method and device for optimizing information diffusion between communities linked by interaction similarities
CN114820085B (zh) 用户筛选方法、相关装置及存储介质
CN102184175A (zh) 在网络中用于分析访问者性别的方法
CN116502202A (zh) 基于nlp技术判断用户权限模型一致性的方法及装置
Iliou Machine Learning Based Detection and Evasion Techniques for Advanced Web Bots.
CN116975160A (zh) 交易数据处理方法、装置、设备、介质和产品
CN116542733A (zh) 产品推荐方法、装置、计算机设备及存储介质
CN116976975A (zh) 数据识别方法、装置、设备、介质和产品
CN117853202A (zh) 产品推荐方法、装置、计算机设备及存储介质
CN115293273A (zh) 用户画像的生成方法、用户画像模型的训练方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant