CN101908191A - 应用于电子商务的数据分析方法及系统 - Google Patents

应用于电子商务的数据分析方法及系统 Download PDF

Info

Publication number
CN101908191A
CN101908191A CN 201010243691 CN201010243691A CN101908191A CN 101908191 A CN101908191 A CN 101908191A CN 201010243691 CN201010243691 CN 201010243691 CN 201010243691 A CN201010243691 A CN 201010243691A CN 101908191 A CN101908191 A CN 101908191A
Authority
CN
China
Prior art keywords
data
analyzed
processing data
mathematical model
carried out
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 201010243691
Other languages
English (en)
Inventor
张津铭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHENZHEN SHESHOWS FASHION ELECTRONIC BUSINESS CO Ltd
Original Assignee
SHENZHEN SHESHOWS FASHION ELECTRONIC BUSINESS CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHENZHEN SHESHOWS FASHION ELECTRONIC BUSINESS CO Ltd filed Critical SHENZHEN SHESHOWS FASHION ELECTRONIC BUSINESS CO Ltd
Priority to CN 201010243691 priority Critical patent/CN101908191A/zh
Publication of CN101908191A publication Critical patent/CN101908191A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种应用于电子商务的数据分析方法及系统,其方法包括:获取待分析处理数据,对待分析处理数据进行抽样处理;将抽样处理后的待分析处理数据存储于数据库中;根据用户策略为待分析处理数据选择对应的预置数学模型;根据对应的预置数学模型对所述待分析处理数据进行计算分析处理,得到计算分析处理结果;将计算分析处理结果进行商务智能展示。本发明应用现代数据挖掘的成熟算法,对待分析处理数据进行嵌入式计算分析处理,并采用嵌入式技术将计算中心固化成高速计算的专用芯片,不需进行数据库的全库统计,降低计算资源成本,同时大大缩短数据从分析到应用的周期。

Description

应用于电子商务的数据分析方法及系统
技术领域
本发明涉及电子商务技术领域,尤其涉及一种应用于电子商务的数据分析方法及系统。
背景技术
目前,在互联网产业高速发展的大环境下,行业间以及行业内的竞争日益激烈,互联网企业运营中的数据以爆炸的速度产生,其中信息的含金量越来越影响到企业的生存,而依靠传统数据库或者数据仓库软件来对数据进行常规分析的成本越来越昂贵,同时其实时性也无法得到保障,在现代社会,过时的信息不但不能给企业带来利益,反而可能会误导决策给企业造成危害。
现有技术中,基于Web的数据挖掘是指使用数据挖掘技术在Web数据中发现潜在的、有用的模式或信息。关于Web数据挖掘的应用包括三个主要方向:
一、面向商业智能的网站日志挖掘:随着Internet的迅速发展,越来越多的企业和个人在Internet上建立了网站,通过其网站实现关键任务的Internet应用来获得战略性优势。Web站点服务器每天产生大量的日志,其中蕴涵了用户在网站上的行为,分析这些数据可以找出用户的访问模式,确定产品的市场战略,提高商业活动的效率。
二、面向复杂系统研究的Web结构挖掘:基于Web结构的数据挖掘是对Web页面超链关系、文档内部结构、文档URL中的目录路径结构等的挖掘。对于基于Web结构的数据挖掘而言,一个重要的问题是获得有关不同网页间相似度及关联度的信息有助于用户找到相关主题的权威站点。
三、面向社会信息分析的网页内容挖掘:Web内容挖掘的对象包括文本、图象、音频、视频、多媒体和其他各种类型的数据。
现有技术中常见的数据挖掘方案包括:使用已有的大型数据库或者数据仓库管理软件(如Oracle/DB2)充当存储管理资源,采用通用的PC SERVER或者小型机充当计算资源,通过已有的数据ETL(数据提取清洗加载)工具进行流程控制,最终得到分析结果。
然而,现有技术存在以下缺点:对于互联网而言,数据的非结构化和无序性非常严重,在海量数据的情况下,分析得到有用信息的成本过于昂贵,且实时性无法得到保障。
发明内容
本发明的主要目的在于提供一种应用于电子商务的数据分析方法及系统,旨在降低数据计算资源成本并缩短数据从分析到应用的周期。
本发明提出一种应用于电子商务的数据分析方法,包括:
获取待分析处理数据,对所述待分析处理数据进行抽样处理;
将抽样处理后的所述待分析处理数据存储于数据库中;
根据用户策略为所述待分析处理数据选择对应的预置数学模型;
根据所述对应的预置数学模型对所述待分析处理数据进行计算分析处理,得到计算分析处理结果;
将所述计算分析处理结果进行商务智能展示。
优选地,所述待分析处理数据包括:站点访问数据、站内营销行为数据、站外市场分析数据、Web页面超级链接关系数据和/或SNS数据。
优选地,所述对待分析处理数据进行抽样处理具体包括:将分布的、异构数据源中的待分析处理数据抽取到临时中间层后进行清洗、转换、集成和加载。
优选地,所述计算分析处理具体为嵌入式计算分析处理。
优选地,所述将抽样处理后的所述待分析处理数据存储于数据库中的步骤之前还包括:对抽样处理后的待分析处理数据进行缓存。
优选地,所述获取待分析处理数据的步骤之前还包括:
根据业务规则和数据结构建立相应的预置数学模型。
本发明还提出一种应用于电子商务的数据分析系统,包括:
ETL控制器,用于获取待分析处理数据,对所述待分析处理数据进行抽样处理;
数据库服务器,用于将抽样处理后的所述待分析处理数据存储于数据库中;
数学模型控制中心,用于根据用户策略为所述待分析处理数据选择对应的预置数学模型;
计算中心,用于根据所述对应的预置数学模型对所述待分析处理数据进行计算分析处理,得到计算分析处理结果;
商务智能展示中心,用于将所述计算分析处理结果进行商务智能展示;
作业控制器,用于控制上述各功能服务器或中心工作以完成相应的数据流向与作业流程。
优选地,所述ETL控制器,还用于将分布的、异构数据源中的待分析处理数据抽取到临时中间层后进行清洗、转换、集成和加载。
优选地,所述系统还包括分布式缓存服务器,连接在所述ETL控制器与数据库服务器之间,用于对抽样处理后的待分析处理数据进行缓存。
优选地,所述系统还包括创建模块,与所述ETL控制器连接,用于根据业务规则和数据结构建立相应的预置数学模型。
本发明提出一种应用于电子商务的数据分析方法及系统,针对电子商务的CRM(Customer Relationship Management,客户关系管理)领域,分析出通用的客户行为模型,具体通过提取站点访问数据、站内营销行为数据、站外市场分析数据、Web页面超级链接关系数据和/或SNS数据等待分析处理数据,应用现代数据挖掘的成熟算法,对待分析处理数据进行嵌入式计算分析处理,并采用嵌入式技术将计算中心固化成高速计算的专用芯片,不需进行数据库的全库统计,降低计算资源成本,同时大大缩短数据从分析到应用的周期。
附图说明
图1是本发明应用于电子商务的数据分析系统一实施例结构示意图;
图2是本发明应用于电子商务的数据分析系统另一实施例结构示意图;
图3是本发明应用于电子商务的数据分析方法一实施例流程示意图;
图4是本发明应用于电子商务的数据分析方法另一实施例流程示意图。
为了使本发明的技术方案更加清楚、明了,下面将结合附图作进一步详述。
具体实施方式
本发明实施例解决方案主要是对获取的站点访问数据、站内营销行为数据、站外市场分析数据、Web页面超级链接关系数据和/或SNS(SocialNetworking Services,社交网络服务)等待分析处理数据,应用现代数据挖掘的成熟算法,对待分析处理数据进行嵌入式计算分析处理,并根据嵌入式分析处理结果进行商务智能展示。
如图1所示,本发明一实施例提出一种应用于电子商务的数据分析系统,包括:ETL(Extraction-Transformation-Loading,数据提取、转换和加载)控制器101、数据库服务器102、数学模型控制中心103、计算中心104、商务智能展示中心105以及作业控制器106,其中:
ETL控制器101,用于获取待分析处理数据,对待分析处理数据进行抽样处理;
在本实施例中,ETL控制器101对待分析处理数据进行抽样处理可以具体为:将分布的、异构数据源中的待分析处理数据抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中,成为联机分析处理、数据挖掘的基础。
本实施例待分析处理数据包括:站点访问数据、站内营销行为数据、站外市场分析数据、Web页面超级链接关系数据和/或SNS数据等。其中:
站点访问数据,是指当客户访问站点时会在Web服务器上留下相应的日志数据,这些日志数据通常以文本文件的形式存储在服务器上。一般包括severlogs、error logs、cookie logs等。*.log文件是日志文件,里面主要记录了系统、硬件、软件等的使用记录。日志数据是电子商务站点在服务器上产生的一种典型数据。例如,对于在线客户也许会搜索一些产品或某些广告信息,这些搜索查询信息就通过cookie或是登记信息连接到服务器的访问日志上。
站内营销行为数据,主要是传统关系数据库里存储的本站站点客户资料、客户消费情况、商品信息等数据。
站外市场分析数据,主要是指关联企业的公开信息管理,例如可能的供应商信息以及可能的竞争对手情报分析,这些数据往往是分散的、异介质的的非结构化数据。
Web页面超级链接关系数据,主要是指页面之间存在的超级链接关系,这是一种重要的资源,通过各大网站有效的互利合作,能最大限度的实现有效推送,将最合适的信息送达最多的可能客户。
对于SNS数据,SNS全称即社交网络服务,专指旨在帮助人们建立社会性网络的互联网应用服务,也指社会现有已成熟普及的信息载体,如短信SMS服务。SNS的另一种常用解释:全称Social Network Site,即“社交网站”或“社交网”。在SNS中,在朋友圈内关系往往较真实,粘着度很高,互相之间不存在所谓网络的“假面具”,因此,比较容易实现实名制;SNS基于人传人联系网络,一传多,多传多,利用网络这一低廉而快速的平台,网络建立的速度非常快,由此使得建立人脉网络的成本进一步降低。
数据库服务器102,用于将抽样处理后的待分析处理数据存储于数据库中;
本实施例中,数据库服务器102具体采用Berkeley DB(伯克利数据库服务器),Berkeley DB是一个高性能的嵌入数据库编程库,和C语言、C++、Java、Perl、Python、PHP、Tcl以及其他很多语言都有绑定。Berkeley DB可以保存任意类型的键/值对,而且可以为一个键保存多个数据。Berkeley DB可以支持数千的并发线程同时操作数据库,支持最大256TB的数据,广泛用于各种操作系统包括大多数Unix类操作系统和Windows操作系统以及实时操作系统。本实施例将其应用于存储所有已经被转换过的待处理数据。
数学模型控制中心103,用于根据用户策略为待分析处理数据选择对应的预置数学模型;
本实施例中,用户策略是指用户根据业务模型和数据结构对待分析处理数据的预期处理方式,比如用户预期想通过某个网站的浏览次数对该网站的浏览者的购买行为进行关联分析等的策略。
数学模型控制中心103根据用户策略为待分析处理数据选择对应的预置数学模型,不同的用户策略对应不同的数学模型,数学模型可以预先设置或创建但必须是由计算中心104支持的预置数学模型。根据业务模型和数据结构选择不同的数学模型,从原有的数据库全库统计模式调整为抽样数理统计分析模式,在保证数据统计有效性的情况下科学的降低了数据的计算量,并实现了数据从输入到输出的匹配。
计算中心104,用于根据对应的预置数学模型对待分析处理数据进行计算分析处理,得到计算分析处理结果;
本实施例中,具体通过嵌入式计算处理中心104来进行嵌入式计算分析处理。该嵌入式计算处理中心104为DSP(digital signal processor,数字信号处理器),DSP是一种独特的微处理器,是以数字信号来处理大量信息的器件。它不仅具有可编程性,而且其实时运行速度可达每秒数以千万条复杂指令程序,远远超过通用微处理器。本实施例将其应用于专业的数学函数计算,以解决对数据进行快速计算的问题。
商务智能展示中心105,用于将计算分析处理结果进行商务智能展示;
在本实施例中,通过商务智能展示中心105将嵌入式计算处理中心104计算分析处理的结果嵌入Business Objects专业商务智能(BI)软件,其形式多样且数据透视效果明显,可以帮助企业更加深入的跟踪和了解该企业业务状况,改善企业决策水平,优化企业绩效。
作业控制器106,用于控制各功能服务器或中心协调工作以完成数据流向与作业流程。
本实施例中,作业控制器106采用TCLSH可以实现多服务器的远程控制,协调若干机器的数据流向和作业流程。TCLSH是一种通用的脚本语言,其功能强大,几乎可以在所有的平台上解释运行。
如图2所示,本发明另一实施例提出一种应用于电子商务的数据分析系统,在上述实施例的基础上,其中,该系统还包括分布式缓存服务器1012,连接在ETL控制器101与数据库服务器102之间,用于对抽样处理后的待分析处理数据进行缓存。
在本实施例中,该系统还包括创建模块100,与ETL控制器101连接,用于根据业务规则和数据结构建立相应的预置数学模型。
本实施例通过建立符合一般电子商务企业业务标准的工作模型,对异构数据的采集、结构化与重新加载,并根据业务规则和数据挖掘原理建立可运算的数学模型以及对边缘计算技术进行融合,包括对数据挖掘技术、嵌入式开发技术、ETL数据流控制以及嵌入式数据库的使用,实现了对海量Web数据的采集、抽样、嵌入式计算与统计分析,降低了计算资源成本,同时大大缩短数据从分析到应用的周期。
如图3所示,本发明一实施例提出一种应用于电子商务的数据分析方法,包括:
步骤S101,获取待分析处理数据,对待分析处理数据进行抽样处理;
本实施例方法运行环境基于电子商务的CRM领域,包括:作业控制器(WorkFlow controller)、ETL控制器(ETL controller)、分布式缓存服务器(Memcached Server)、数据库服务器(Database Server)、数学模型控制中心(Math model selecter)、嵌入式计算中心(Embedded Computing)以及商务智能展示中心(BusinessObjects Gallery)等,由作业控制器控制其他功能服务器或控制中心完成相应的数据流向与作业流程。作业控制器采用TCLSH可以实现多服务器的远程控制,协调若干机器的数据流向和作业流程。TCLSH是一种通用的脚本语言,其功能强大,几乎可以在所有的平台上解释运行。
在本实施例中,由ETL控制器从数据源获取待分析处理数据,并对待分析处理数据进行抽样处理。ETL控制器将分布的、异构数据源中的待分析处理数据如关系数据、平面数据文件等抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中,成为联机分析处理、数据挖掘的基础。
本实施例待分析处理数据具体包括:站点访问数据、站内营销行为数据、站外市场分析数据、Web页面超级链接关系数据和/或SNS数据等。其中:
站点访问数据,是指当客户访问站点时会在Web服务器上留下相应的日志数据,这些日志数据通常以文本文件的形式存储在服务器上。一般包括severlogs、error logs、cookie logs等。*.log文件是日志文件,里面主要记录了系统、硬件、软件等的使用记录。日志数据是电子商务站点在服务器上产生的一种典型数据。例如,对于在线客户也许会搜索一些产品或某些广告信息,这些搜索查询信息就通过cookie或是登记信息连接到服务器的访问日志上。
站内营销行为数据,主要是传统关系数据库里存储的本站站点客户资料、客户消费情况、商品信息等数据。
站外市场分析数据,主要是指关联企业的公开信息管理,例如可能的供应商信息以及可能的竞争对手情报分析,这些数据往往是分散的、异介质的的非结构化数据。
Web页面超级链接关系数据,主要是指页面之间存在的超级链接关系,这是一种重要的资源,通过各大网站有效的互利合作,能最大限度的实现有效推送,将最合适的信息送达最多的可能客户。
对于SNS数据,SNS全称即社交网络服务,专指旨在帮助人们建立社会性网络的互联网应用服务,也指社会现有已成熟普及的信息载体,如短信SMS服务。SNS的另一种常用解释:全称Social Network Site,即“社交网站”或“社交网”。在SNS中,在朋友圈内关系往往较真实,粘着度很高,互相之间不存在所谓网络的“假面具”,因此,比较容易实现实名制;SNS基于人传人联系网络,一传多,多传多,利用网络这一低廉而快速的平台,网络建立的速度非常快,这使得建立人脉网络的成本进一步降低。
步骤S102,将抽样处理后的待分析处理数据存储于数据库中;
本实施例中,可以由数据库服务器存储上述抽样处理后的待分析处理数据。数据库服务器具体采用Berkeley DB(伯克利数据库服务器),Berkeley DB是一个高性能的嵌入数据库编程库,和C语言、C++、Java、Perl、Python、PHP、Tcl以及其他很多语言都有绑定。Berkeley DB可以保存任意类型的键/值对,而且可以为一个键保存多个数据。Berkeley DB可以支持数千的并发线程同时操作数据库,支持最大256TB的数据,广泛用于各种操作系统包括大多数Unix类操作系统和Windows操作系统以及实时操作系统。本实施例将其应用于存储所有已经被转换过的待处理数据。
步骤S103,根据用户策略为待分析处理数据选择对应的预置数学模型;
本实施例中,用户策略是指用户根据业务模型和数据结构对待分析处理数据的预期处理方式,比如用户预期想通过某个网站的浏览次数对该网站的浏览者的购买行为进行关联分析等的策略。
当获取到待分析处理数据并将待分析处理数据进行清洗、转换、集成等抽样处理之后,根据用户策略为待分析处理数据选择对应的预置数学模型,不同的用户策略对应不同的数学模型,数学模型可以预先设置或创建但必须是由以下所述的嵌入式计算处理中心支持的预置数学模型。根据业务模型和数据结构选择不同的数学模型,从原有的数据库全库统计模式调整为抽样数理统计分析模式,在保证数据统计有效性的情况下科学的降低了数据的计算量,并实现了数据从输入到输出的匹配。
步骤S104,根据对应的预置数学模型对待分析处理数据进行计算分析处理,得到计算分析处理结果;
本实施例中,计算分析处理具体为嵌入式计算分析处理,通过嵌入式计算处理中心来实现。该嵌入式计算处理中心为DSP,DSP是一种独特的微处理器,是以数字信号来处理大量信息的器件。它不仅具有可编程性,而且其实时运行速度可达每秒数以千万条复杂指令程序,远远超过通用微处理器。本实施例将其应用于专业的数学函数计算,以解决对数据进行快速计算的问题。
步骤S105,将计算分析处理结果进行商务智能展示。
在本实施例中,通过商务智能展示中心将嵌入式计算处理中心计算分析处理的结果嵌入Business Objects专业商务智能(BI)软件表现,其形式多样且数据透视效果明显。Business Objects是全球领先的商务智能软件公司,其可以帮助企业更加深入的跟踪和了解该企业业务状况,改善企业决策水平,优化企业绩效。
下面以某种商品的网络浏览量与成交情况的关联分析为例,对本发明技术方案进行说明:
该例数据计算环境为:OS=WinXP SP2;RAM=1G;CPU=AMD Athlon 64X2Dual 5000+;Disk=160G;默认簇大小为4K。
以浏览次数600万计算,需要插入的实际数据量为:
600*10000*2*sizeof(int)/1024/1024≈45.78MByte;
实际测试结果为:
记录数量=600万;页尺寸=4K;真实数据量=45.78MByte;数据库文件大小=160M;时间消耗为34.13秒,即代表给定配置情况下,系统可以在40秒内记录600万点击的请求。
对插入的数据进行全部统计分析,实际测试结果为:时间消耗为8.03秒,即代表现有配置情况下系统可以在9秒内分析出600万浏览者的购买行为。
由此可知,在短短的时间内即可对海量数据进行统计分析,并得到统计分析结果,极大降低了数据计算资源成本,同时大大缩短数据从分析到应用的周期,由此,可以帮助企业更加深入的跟踪和了解企业业务,改善企业决策水平,优化企业绩效。
现有网络业务模式因采用传统电子商务领域/SNS/网络游戏等多个互联网领域相结合的模式,业务发展迅速,数据异常庞大,若通过常规办法(如数据仓库及通用计算技术)则很难实现低廉高速的信息加工。
本实施例针对电子商务的CRM领域,分析出通用的客户行为模型,对获取的站点访问数据、站内营销行为数据、站外市场分析数据、Web页面超级链接关系数据和/或SNS数据等待分析处理数据,应用现代数据挖掘的成熟算法,对待分析处理数据进行嵌入式计算分析处理,并采用嵌入式技术将计算中心固化成高速计算的专用芯片,不需进行数据库的全库统计,降低计算资源成本,同时大大缩短数据从分析到应用的周期。
如图4所示,本发明另一实施例提出一种应用于电子商务的数据分析方法,在上述实施例的基础上,其中,在步骤S101之前还包括:
步骤S100,根据业务规则和数据结构建立相应的预置数学模型;
如上所述,不同的用户策略对应不同的数学模型,在本实施例中,可以根据业务规则或模型以及数据结构或数据挖掘原理建立相应的预置数学模型。
在步骤S102之前还包括:
步骤S1023,对抽样处理后的待分析处理数据进行缓存。
在本实施例中,可以采用分布式缓存服务器(Memcached Server)对抽样处理后的待分析处理数据进行缓存,Memcached是一个高性能的分布式内存对象缓存系统,用于动态Web应用以减轻数据库负载。本实施例采用Memcached进行数据缓存以加快数据运算速度。
综上所述,本发明实施例通过建立符合一般电子商务企业业务标准的工作模型、对异构数据的采集、结构化与重新加载,并根据业务规则和数据挖掘原理建立可运算的数学模型以及对边缘计算技术进行融合,包括对数据挖掘技术、嵌入式开发技术、ETL数据流控制以及嵌入式数据库的使用,实现了对海量Web数据的采集、抽样、嵌入式计算与统计分析,降低了计算资源成本,同时大大缩短数据从分析到应用的周期。也就是说,本发明实施例在业务模式相对固定的前提下,用一个统一的框架整合了嵌入式计算(硬件)和数据挖掘(软件)两个领域的基础设施,对电子商务行业的WEB海量数据从商务智能的角度进行了数学加工,以获取其背后隐藏的商业含义和销售商机。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种应用于电子商务的数据分析方法,其特征在于,包括:
获取待分析处理数据,对所述待分析处理数据进行抽样处理;
将抽样处理后的所述待分析处理数据存储于数据库中;
根据用户策略为所述待分析处理数据选择对应的预置数学模型;
根据所述对应的预置数学模型对所述待分析处理数据进行计算分析处理,得到计算分析处理结果;
将所述计算分析处理结果进行商务智能展示。
2.根据权利要求1所述的方法,其特征在于,所述待分析处理数据包括:站点访问数据、站内营销行为数据、站外市场分析数据、Web页面超级链接关系数据和/或社交网络服务SNS数据。
3.根据权利要求1所述的方法,其特征在于,所述对待分析处理数据进行抽样处理具体包括:将分布的、异构数据源中的待分析处理数据抽取到临时中间层后进行清洗、转换、集成和加载。
4.根据权利要求1所述的方法,其特征在于,所述计算分析处理具体为嵌入式计算分析处理。
5.根据权利要求1所述的方法,其特征在于,所述将抽样处理后的所述待分析处理数据存储于数据库中的步骤之前还包括:对抽样处理后的待分析处理数据进行缓存。
6.根据权利要求1、2、3、4或5所述的方法,其特征在于,所述获取待分析处理数据的步骤之前还包括:
根据业务规则和数据结构建立相应的预置数学模型。
7.一种应用于电子商务的数据分析系统,其特征在于,包括:
ETL控制器,用于获取待分析处理数据,对所述待分析处理数据进行抽样处理;
数据库服务器,用于将抽样处理后的所述待分析处理数据存储于数据库中;
数学模型控制中心,用于根据用户策略为所述待分析处理数据选择对应的预置数学模型;
计算中心,用于根据所述对应的预置数学模型对所述待分析处理数据进行计算分析处理,得到计算分析处理结果;
商务智能展示中心,用于将所述计算分析处理结果进行商务智能展示;
作业控制器,用于控制上述各功能服务器或中心工作以完成相应的数据流向与作业流程。
8.根据权利要求7所述的系统,其特征在于,所述ETL控制器,还用于将分布的、异构数据源中的待分析处理数据抽取到临时中间层后进行清洗、转换、集成和加载。
9.根据权利要求8所述的系统,其特征在于,所述系统还包括分布式缓存服务器,连接在所述ETL控制器与数据库服务器之间,用于对抽样处理后的待分析处理数据进行缓存。
10.根据权利要求9所述的系统,其特征在于,所述系统还包括创建模块,与所述ETL控制器连接,用于根据业务规则和数据结构建立相应的预置数学模型。
CN 201010243691 2010-08-03 2010-08-03 应用于电子商务的数据分析方法及系统 Pending CN101908191A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201010243691 CN101908191A (zh) 2010-08-03 2010-08-03 应用于电子商务的数据分析方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201010243691 CN101908191A (zh) 2010-08-03 2010-08-03 应用于电子商务的数据分析方法及系统

Publications (1)

Publication Number Publication Date
CN101908191A true CN101908191A (zh) 2010-12-08

Family

ID=43263644

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201010243691 Pending CN101908191A (zh) 2010-08-03 2010-08-03 应用于电子商务的数据分析方法及系统

Country Status (1)

Country Link
CN (1) CN101908191A (zh)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102654862A (zh) * 2011-03-01 2012-09-05 腾讯科技(深圳)有限公司 信息相关性分析方法和装置
CN102929888A (zh) * 2011-08-11 2013-02-13 句容今太科技园有限公司 一种基于Web的数据挖掘方法
CN103473377A (zh) * 2013-09-30 2013-12-25 国家电网公司 一种计算公式回圈点快速检测方法
CN103678425A (zh) * 2012-09-26 2014-03-26 Sap股份公司 多系统的集成分析
CN103914767A (zh) * 2013-01-06 2014-07-09 华为技术有限公司 一种会议调度的方法、设备及系统
CN104156395A (zh) * 2014-07-14 2014-11-19 上海东方延华节能技术服务股份有限公司 数据存储系统
CN104298669A (zh) * 2013-07-16 2015-01-21 江苏宏联物联网信息技术有限公司 一种基于社交网络的人员地理信息挖掘模型
CN104424309A (zh) * 2013-09-05 2015-03-18 清控科创控股股份有限公司 一种基于科技媒体云计算非结构化数据处理方法
CN104714998A (zh) * 2013-12-17 2015-06-17 国际商业机器公司 用于基于上下文在数据分析中处理推荐的方法和系统
CN105302831A (zh) * 2014-07-18 2016-02-03 上海星红桉数据科技有限公司 基于海量用户行为数据的高速计算分析方法
CN105405047A (zh) * 2015-12-30 2016-03-16 广东科海信息科技股份有限公司 一种基于社区o2o的数据分析系统及其实现方法
CN105512154A (zh) * 2014-10-20 2016-04-20 国家电网公司 一种基于嵌入式数据库的环保数据采集方法及系统
CN105678449A (zh) * 2015-12-31 2016-06-15 天津英福科技有限公司 一种商务智能系统
CN105824974A (zh) * 2016-04-19 2016-08-03 平安科技(深圳)有限公司 数据分析处理的方法和系统
CN106651403A (zh) * 2016-12-30 2017-05-10 上海富聪金融信息服务有限公司 客户信息管理系统和方法
CN106897429A (zh) * 2017-02-27 2017-06-27 和创(北京)科技股份有限公司 SaaS系统租户信息获取方法及应用其的服务器
CN107622401A (zh) * 2016-07-13 2018-01-23 天脉聚源(北京)科技有限公司 一种对互联网购物行为进行统计的方法和系统
TWI677828B (zh) * 2017-05-05 2019-11-21 平安科技(深圳)有限公司 基於資料源的業務客製裝置、方法及電腦可讀儲存介質

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1674011A (zh) * 2004-03-26 2005-09-28 赖明勇 电子商务决策支持系统
CN1890659A (zh) * 2003-11-20 2007-01-03 奥姆尼图雷有限公司 给促进商业成功的元素指定数值
CN100476819C (zh) * 2006-12-27 2009-04-08 章毅 一种基于Web的数据挖掘系统及其控制方法
CN101620691A (zh) * 2008-06-30 2010-01-06 上海全成通信技术有限公司 电信业自动化数据挖掘平台
US20100095381A1 (en) * 2008-10-13 2010-04-15 Hewlett-Packard Development Company, L.P. Device, method, and program product for determining an overall business service vulnerability score

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1890659A (zh) * 2003-11-20 2007-01-03 奥姆尼图雷有限公司 给促进商业成功的元素指定数值
CN1674011A (zh) * 2004-03-26 2005-09-28 赖明勇 电子商务决策支持系统
CN100476819C (zh) * 2006-12-27 2009-04-08 章毅 一种基于Web的数据挖掘系统及其控制方法
CN101620691A (zh) * 2008-06-30 2010-01-06 上海全成通信技术有限公司 电信业自动化数据挖掘平台
US20100095381A1 (en) * 2008-10-13 2010-04-15 Hewlett-Packard Development Company, L.P. Device, method, and program product for determining an overall business service vulnerability score

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102654862B (zh) * 2011-03-01 2016-02-17 腾讯科技(深圳)有限公司 信息相关性分析方法和装置
CN102654862A (zh) * 2011-03-01 2012-09-05 腾讯科技(深圳)有限公司 信息相关性分析方法和装置
CN102929888A (zh) * 2011-08-11 2013-02-13 句容今太科技园有限公司 一种基于Web的数据挖掘方法
CN103678425B (zh) * 2012-09-26 2019-03-15 Sap欧洲公司 多系统的集成分析
CN103678425A (zh) * 2012-09-26 2014-03-26 Sap股份公司 多系统的集成分析
CN103914767A (zh) * 2013-01-06 2014-07-09 华为技术有限公司 一种会议调度的方法、设备及系统
WO2014106430A1 (zh) * 2013-01-06 2014-07-10 华为技术有限公司 一种会议调度的方法、设备及系统
CN103914767B (zh) * 2013-01-06 2017-02-22 华为技术有限公司 一种会议调度的方法、设备及系统
CN104298669A (zh) * 2013-07-16 2015-01-21 江苏宏联物联网信息技术有限公司 一种基于社交网络的人员地理信息挖掘模型
CN104424309A (zh) * 2013-09-05 2015-03-18 清控科创控股股份有限公司 一种基于科技媒体云计算非结构化数据处理方法
CN103473377A (zh) * 2013-09-30 2013-12-25 国家电网公司 一种计算公式回圈点快速检测方法
CN104714998A (zh) * 2013-12-17 2015-06-17 国际商业机器公司 用于基于上下文在数据分析中处理推荐的方法和系统
CN104714998B (zh) * 2013-12-17 2018-02-02 国际商业机器公司 用于基于上下文在数据分析中处理推荐的方法和系统
CN104156395A (zh) * 2014-07-14 2014-11-19 上海东方延华节能技术服务股份有限公司 数据存储系统
CN105302831A (zh) * 2014-07-18 2016-02-03 上海星红桉数据科技有限公司 基于海量用户行为数据的高速计算分析方法
CN105512154A (zh) * 2014-10-20 2016-04-20 国家电网公司 一种基于嵌入式数据库的环保数据采集方法及系统
CN105405047A (zh) * 2015-12-30 2016-03-16 广东科海信息科技股份有限公司 一种基于社区o2o的数据分析系统及其实现方法
CN105678449A (zh) * 2015-12-31 2016-06-15 天津英福科技有限公司 一种商务智能系统
WO2017181786A1 (zh) * 2016-04-19 2017-10-26 平安科技(深圳)有限公司 数据分析处理的方法、装置、计算机设备及存储介质
CN105824974A (zh) * 2016-04-19 2016-08-03 平安科技(深圳)有限公司 数据分析处理的方法和系统
CN105824974B (zh) * 2016-04-19 2019-03-26 平安科技(深圳)有限公司 数据分析处理的方法和系统
CN107622401A (zh) * 2016-07-13 2018-01-23 天脉聚源(北京)科技有限公司 一种对互联网购物行为进行统计的方法和系统
CN106651403A (zh) * 2016-12-30 2017-05-10 上海富聪金融信息服务有限公司 客户信息管理系统和方法
CN106897429A (zh) * 2017-02-27 2017-06-27 和创(北京)科技股份有限公司 SaaS系统租户信息获取方法及应用其的服务器
TWI677828B (zh) * 2017-05-05 2019-11-21 平安科技(深圳)有限公司 基於資料源的業務客製裝置、方法及電腦可讀儲存介質
US11544639B2 (en) 2017-05-05 2023-01-03 Ping An Technology (Shenzhen) Co., Ltd. Data source-based service customizing device, method and system, and storage medium

Similar Documents

Publication Publication Date Title
CN101908191A (zh) 应用于电子商务的数据分析方法及系统
US10089367B2 (en) Expediting pattern matching queries against time series data
US10110687B2 (en) Session based web usage reporter
US9152691B2 (en) System and method for performing set operations with defined sketch accuracy distribution
US20140172506A1 (en) Customer segmentation
US20170330239A1 (en) Methods and systems for near real-time lookalike audience expansion in ads targeting
US20130198203A1 (en) Bot detection using profile-based filtration
US10929406B2 (en) Systems and methods for a self-services data file configuration with various data sources
US10394796B1 (en) Control selection and analysis of search engine optimization activities for web sites
JP7055153B2 (ja) デジタル通信ネットワーク上の複数のデバイスにわたるデジタルタッチポイントを確立するための分散ノードクラスタ
US20200244752A1 (en) Processing an Event Stream Using Pattern Recognition
CN110297995B (zh) 用于收藏信息的方法和装置
CN105184616A (zh) 一种业务对象定向投放的方法和装置
US20150278858A1 (en) Method and system for producing segment indexes
CN108932640B (zh) 用于处理订单的方法和装置
CN104035964A (zh) 一种用于提供信誉相关信息的方法和设备
Kim et al. Adbudgetkiller: Online advertising budget draining attack
Gaurav et al. An outline on big data and big data analytics
CN1674011A (zh) 电子商务决策支持系统
US10769110B2 (en) Facilitating queries for interaction data with visitor-indexed data objects
Alzua-Sorzabal et al. Using MWD: A business intelligence system for tourism destination web
US20140143019A1 (en) Managing modeled audience extension information
Sengottuvelan et al. An improved session identification approach in web log mining for web personalization
Maheswari et al. Algorithm for Tracing Visitors' On-Line Behaviors for Effective Web Usage Mining
Jastrzębska et al. The Pragmatics of the Data Acquisition and Assessment

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20101208