CN102012902A - 网站访客价值评估系统及方法 - Google Patents
网站访客价值评估系统及方法 Download PDFInfo
- Publication number
- CN102012902A CN102012902A CN2009101736223A CN200910173622A CN102012902A CN 102012902 A CN102012902 A CN 102012902A CN 2009101736223 A CN2009101736223 A CN 2009101736223A CN 200910173622 A CN200910173622 A CN 200910173622A CN 102012902 A CN102012902 A CN 102012902A
- Authority
- CN
- China
- Prior art keywords
- visitor
- value
- data
- new
- website
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提出一种网站访客价值评估系统及方法,其方法包括以下步骤:(1),建立一标准集,所述标准集中包括网站历史记录中一定量的访客数据。(2),根据所述标准集,构建网站访客价值的计算模型。(3),通过所述计算模型分别计算出新访客与所述标准集中所有访客的相似值。(4),取出标准集中与新访客最相似的k个访客。(5),根据这k个访客的价值,评估该新访客的价值。(6),向网站主返回新访客的价值数据。本申请可以对网站访客的价值进行人性化的评估,节约了网站主亲自评估访客价值所需的大量时间。
Description
技术领域
本申请涉及网络技术,特别涉及一种网站访客价值评估系统及方法。
背景技术
目前,很多企业都通过网站来进行信息展示和产品营销,随着网络技术的发展,网站和访客之间也可以实现更多的互动。例如,网站主可以通过网络管理系统看到访客的一些信息,根据这些信息来判断访客的价值,然后进一步对具有一定价值的访客做一些业务行为,例如与其联系,向其提供更详细的信息等。
可以想象,对于具有大量访客的网站而言,如果以人工方式来判断每个访客的价值,工作量大且效率难以保证。为了实现对网站访客价值的自动判断,现有技术中,是通过把各类“访客信息”中的单个或组合设置为条件,一旦满足条件,就认为该访客具有一定价值并通知网站主。这些条件可以包括:来访次数超过几次、访问页面超过几个、是否访问过某些特定页面、访客是否来自某些特定的省市等。
通过对现有技术的研究,申请人发现上述方法只适用于处理简单的条件组合,然而在实际需求中,访客信息和访客价值之间往往存在着更为复杂的对应关系,例如:如果访客来自北京,则其访问页面A的价值大;如果访客来自上海,则其访问页面B的价值大;男性访客访问页面C的价值大;女性访客访问页面D的价值大。类似或更为复杂的情况还有很多,这些对应关系往往是非线性的,甚至是不确知的。如果使用条件组合的方法,难以把这些复杂的对应关系全部纳入考虑,且条件组合的方式会很复杂,容易漏掉一些有价值的访客,或者造成对一些访客价值的估算错误。
例如假设系统设定的判断条件是:来访次数超过2次,且浏览网站页面超过5个的访客为有价值的访客。但在实际情况中,如果来自北京的访客E是有价值的访客,但是该访客仅访问了其感兴趣的特定页面A和特定页面B,如果按照系统的判断,会将访客E判断为无价值的访客,从而网站主便不会对访客E作进一步的业务行为,会造成网站利益受损。
综上所述,现有的自动判断访客价值的方法,容易出现漏判错判的情况,并且判断结果往往会与人工判断的结果有很大差异,容易使网站的利益受损。
发明内容
本申请的目的是提供一种网站访客价值评估系统,以解决现有网站中,自动判断访客价值的方法,容易出现漏判错判的问题。
本申请的另一目的是提供一种网站访客价值评估方法,以解决现有网站中,自动判断访客价值的方法,容易出现漏判错判的问题。
本申请另提出一种网站访客价值评估系统,包括监控单元、存储单元、模型训练单元、计算单元、评估单元及数据返回单元。监控单元用于采集访客信息,并选取一定量的访客数据以建立标准集。存储单元与所述监控单元相连,用于存放所述标准集。模型训练单元与所述存储单元相连,用于根据所述标准集,构建网站访客价值的计算模型。计算单元分别与所述存储单元及模型训练单元相连,用于通过所述计算模型计算出新访客与所述标准集中所有访客的相似值。评估单元与所述计算单元相连,用于根据所述计算单元的计算结果,选取标准集中与新访客最相似的k个访客,并根据这k个访客的价值,评估该新访客的价值。数据返回单元与所述评估单元相连,用于返回新访客的价值数据。
依照本申请较佳实施例所述的网站访客价值评估系统,所述监控单元又包括数据采集子单元及量化子单元。数据采集子单元用于采集一段时间内的访客数据,所述的访客数据包括属性数据和业务行为数据。量化子单元与所述数据采集子单元相连,用于将所采集的网站访客数据量化为布尔型,并形成所述标准集。
依照本申请较佳实施例所述的网站访客价值评估系统,所述模型训练单元又包括赋值子单元,与所述存储单元相连,用于为标准集中所有的访客数据赋予权重值。
依照本申请较佳实施例所述的网站访客价值评估系统,所述计算模型的计算公式为:∑wi*Xi
其中,wi为访客数据的权重值,Xi为该条数据与标准集中访客的对应数据的对比参数,相同为0,不同为1。
依照本申请较佳实施例所述的网站访客价值评估系统,所述评估单元又进一步包括柔化子单元,用于对访客价值的判断结果进行柔化。
依照本申请较佳实施例所述的网站访客价值评估系统,对新访客价值判断结果的柔化准则是:
a%=100%*V有效/(V有效+V非有效)
b%=100%*V非有效/(V有效+V非有效)
其中,a%为新访客有价值的概率,b%为新访客无价值的概率,V有效为k个访客中有价值访客与新访客相似值的倒数和,V非有效为k个访客中无价值访客与新访客相似值的倒数和。
依照本申请较佳实施例所述的网站访客价值评估系统,其还包括潜在访客管理单元,其与所述评估单元相连,用于储存有价值的新访客数据,并对有价值的新访客数据进行标记。
依照本申请较佳实施例所述的网站访客价值评估系统,其还包括访客追踪单元,其与所述评估单元相连,用于建立有价值的新访客与网站主之间的实时通信通道。
本申请提出一种网站访客价值评估方法,包括以下步骤:(1),建立一标准集,所述标准集中包括网站历史记录中一定量的访客数据。(2),根据所述标准集,构建网站访客价值的计算模型。(3),通过所述计算模型分别计算出新访客与所述标准集中所有访客的相似值。(4),取出标准集中与新访客最相似的k个访客。(5),根据这k个访客的价值,评估该新访客的价值。(6)向网站主返回新访客的价值数据。
依照本申请较佳实施例所述的网站访客价值评估方法,建立所述标准集具体包括以下步骤:首先,对网站进行监控,并采集一段时间内的访客数据,所述的访客数据包括属性数据和业务行为数据。然后,将所采集的网站访客数据量化为布尔型,并形成所述标准集。
依照本申请较佳实施例所述的网站访客价值评估方法,构建网站访客价值计算模型具体包括步骤:首先,为标准集中所有的访客数据赋予权重值。然后,搭建新访客与所述标准集中访客的相似值计算公式:∑wi*Xi,其中,wi为访客数据的权重值,Xi为该条数据与标准集中访客的对应数据的对比参数,相同为0,不同为1。
依照本申请较佳实施例所述的网站访客价值评估方法,评估新访客的价值具体为:当取出的k个访客中,有价值访客的数量大于无价值访客的数量,则判定新访客为有价值的访客;当取出的k个访客中,有价值访客的数量小于无价值访客的数量,则判定新访客为无价值的访客。
依照本申请较佳实施例所述的网站访客价值评估方法,评估该新访客的价值时对判断结果进行柔化。
依照本申请较佳实施例所述的网站访客价值评估方法,对新访客价值判断结果的柔化准则是:
a%=100%*V有效/(V有效+V非有效)
b%=100%*V非有效/(V有效+V非有效),
其中,a%为新访客有价值的概率,b%为新访客无价值的概率,V有效为k个访客中有价值访客与新访客相似值的倒数和,V非有效为k个访客中无价值访客与新访客相似值的倒数和。
依照本申请较佳实施例所述的网站访客价值评估方法,k的值为7或9。
依照本申请较佳实施例所述的网站访客价值评估方法,还包括步骤:定期更新所述标准集中的访客数据。
依照本申请较佳实施例所述的网站访客价值评估方法,在对新访客的价值进行评估之后还进一步包括步骤:将有价值的新访客数据进行标记并储存。
依照本申请较佳实施例所述的网站访客价值评估方法,在对新访客的价值进行评估之后还进一步包括步骤:建立有价值的新访客与网站主之间的实时通信通道。
相对于现有技术,本申请包括以下优点:
1、本申请利用邻近算法,并依据新访客与历史访客之间的相似性,对网站访客的价值进行准确地评估,可以将容易被忽略的一些隐含信息包含在算法之中,使网站主可以准确地针对有价值的访客进行后续的跟踪业务行为,省去了网站主亲自评估访客价值所花去的大量时间,同时也可以大大提高网站创造利益的效率。
2、本申请可以对访客的价值评估结果进行柔性的处理,给出新访客是否有价值的概率,以供网站主主观地判断,使评估结果更接近于人类的判断。
本申请以新访客与历史访客之间的相似性作为价值判断的依据,并利用邻近算法,可以对网站访客的价值进行人性化的评估,且将容易被忽略的一些隐含信息包含在算法之中,使对访客价值的评估更接近于人类的判断,使网站主可以准确地针对有价值的访客进行后续的跟踪业务行为,可以大大提高网站创造利益的效率。
当然,实施本申请的任一产品必不一定需要同时达到以上所述的所有优点。
附图说明
图1为本申请实施例的一种网站访客价值评估方法流程图;
图2为本申请实施例的一种建立标准集时的流程图;
图3为本申请实施例的一种网站访客价值计算模型的构建流程图;
图4为本申请实施例的一种访客价值评估方式示意图;
图5为本申请实施例的一种网站访客价值评估系统结构图;
图6为本申请实施例的一种监控单元结构图;
图7为本申请实施例的一种模型训练单元结构图;
图8为本申请实施例的一种评估单元结构图;
图9为本申请实施例的另一种网站访客价值评估系统结构图。
具体实施方式
本申请利用了邻近算法(k-Nearest Neighbor algorithm),并根据网站主对历史访客数据的价值判断,可以人性化地估算出新访客的价值,从而使网站主可以针对有价值的访客展开后续的业务行为,从而大大节省网站主的时间。
以下结合附图,具体说明本申请。
请参见图1,其为本申请实施例的一种网站访客价值评估方法流程图,其包括以下步骤:
S101,建立一标准集,所述标准集中包括网站历史记录中一定量的访客数据。
S103,根据所述标准集,构建网站访客价值的计算模型。
S105,通过所述计算模型分别计算出新访客与所述标准集中所有历史访客的相似值。
S107,取出标准集中与新访客最相似的k个历史访客。
S109,根据这k个历史访客的价值,评估该新访客的价值。
S111,向网站主返回新访客的价值数据。
对于步骤S101,在建立所述的标准集时可以通过两个过程来实现,如图2所示,其包括:
S201,对网站进行监控,并采集一段时间内的访客数据,所述的访客数据包括属性数据和业务行为数据。
网站主可以在后台服务器中搭建一个监控系统,并且通过监控系统采集一段时间内网站上的访客数据。而本申请的访客价值评估方法所需要的访客数据包括有属性数据和业务行为数据。这里所说的属性数据是指访客的基本信息和访问网站的行为信息,如访问时刻、访客地域(通过IP判断)、访问页面数、网站停留时间、重复来访次数等数据。业务行为数据是指网站主对访客是否有价值的判断信息,即表示该历史访客是有价值或无价值的数据。
S203,将所采集的网站访客数据量化为布尔型,并形成所述标准集。
为了可以建立一个简单计算模型,需要将所采集到的历史访客的属性数据和业务行为数据进行量化处理。本实施例中是将对访客价值判断有用的数据量化为布尔型。具体来说,就是将不同类型的数据进行统一规划,以便于后续的模型计算。请参见表1,其给出了部分数据的量化准则:
表1
当然,表1给出的例子仅为量化过程的一种方式,同样也可以根据其它的规则进行量化,或者也可以将各个类别的数据量化为其它的表达形式。量化后的数据可以存储到后台服务器的数据库中,作为用来判断新访客价值的标准集。也可以在量化后的访客数据中再次选取一定数量的访客数据,来作为所述的标准集,选取的数据越多则访客价值评估的可信度越高,但也意味着计算量的增加,因此数据量的选取可以依照系统实际的处理能力。另外,为了使评估结果可以保持准确性,可以定期对标准集中的访客数据进行更新。
标准集建立之后便可以构建网站访客价值的计算模型,即进入步骤103。构建计算模型可以通过两个步骤来完成,如图3所示:
S301,为标准集中所有的访客属性数据赋予权重值。
不同类别的数据对评价网站访客价值的重要性是不同的,因此要给不同类别的数据赋予权重值,重要性高的数据就给予较大的权重值,重要性低的数据就给予较小的权重值。例如表1的各类数据中,“地域”对判断访客价值较为重要,则可以将它的权重值设置为5,而“网站停留时间”对判断访客价值不是非常重要,则可以将它的权重值设置为2。
S303,搭建新访客与所述标准集中历史访客相似值的计算公式。
各类数据的权重值设置完成之后,便可以依据标准集中的访客数据来构建访客价值的计算公式:∑wi*Xi
其中,wi为访客数据的权重值。Xi为布尔型变量,它表示该条数据与标准集中历史访客的对应数据的对比参数,若新访客与历史访客对应数据的值相同则Xi为0,不同则Xi为1。
利用上述计算公式,便可以计算出新访客与标准集中历史访客的相似值,为了便于理解,现以表1中的各种数据来具体说明计算过程。
假设标准集中的访客M的数据如表2所示:
数据类别 | 数据值 | 权重值 |
地域 | 1 | 5 |
访问页面 | 3 | 4 |
页面数 | 5 | 5 |
网站停留时间 | 5 | 2 |
重复来访次数 | 2 | 10 |
网站主的判断 | T |
表2
当新访客N访问网站后,若监测到新访客N的“地域”、“访问页面”、“页面数”的数值与历史访客M相同,而“网站停留时间”、“重复来访次数”的数值与历史访客M不同,则新访客N与历史访客M的相似值=
∑wi*Xi=5*0+4*0+5*0+2*1+10*1=12
这个相似值表示了新访客N与历史访客M的相似程度,新访客N与历史访客M越相似,则这个相似值就越小。
有了计算模型之后,便可以利用计算出的相似值来对网站新访客的价值进行评估。本申请对新访客价值的评估采用邻近算法(k-Nearest Neighboralgorithm),先要计算出新访客和标准集中所有历史访客的相似值(步骤S105),然后取出标准集中与新访客最相似(即相似值最小)的k个访客(步骤S107),最后根据这k个访客的价值,评估该新访客的价值(步骤S109)。其中,k值为奇数,如可以选取7或9这样的数值。
对于新访客价值的评估(即步骤S109),又可以分为两种情况:当取出的k个访客中,有价值访客的数量大于无价值访客的数量,则判定新访客为有价值的访客i当取出的k个访客中,有价值访客的数量小于无价值访客的数量,则判定新访客为无价值的访客。
为便于理解,下面以一简单例子来说明上述评估方式,请参见图4,其为一种邻近算法的示意图。图4中,“圆圈”代表要评估价值的新访客,“三角”与“方块”表示标准集中的历史访客,其中“三角”表示无价值的历史访客,“方块”表示有价值的历史访客,而“圆圈”与“三角”、“方块”之间的距离表示其相似程度(值得注意的是,图4中两个图案的距离越近则表示这两个图案代表的访客越相似)。如果k取3,则与新访客最相似的3个历史访客中(即在实线圆内与“圆圈”距离最近的3个图案),“三角”有2个,“方块”有1个,表示有2个历史访客是无价值访客,有1个历史访客是有价值的访客,因此对新访客的评估结果是无价值访客。
但是,若k取5,则与新访客最相似的5个历史访客中(即在虚线圆内与“圆圈”距离最近的5个图案),“三角”有2个,“方块”有3个,如果按照上述评估方式,对新访客的评估结果是有价值访客,这却与k取3的评估结果相反,出现了计算误差。而造成这种情况的原因是由于标准集中历史访客的分布不平衡,因此本申请还提出在评估新访客价值时,对判断结果进行柔化的处理方式。
本申请提出的柔化准则如下:
a%=100%*V有效/(V有效+V非有效)
b%=100%*V非有效/(V有效+V非有效),
其中,a%为新访客有价值的概率,b%为新访客无价值的概率,V有效为k个访客中有价值访客与新访客相似值的倒数和,V非有效为k个访客中无价值访客与新访客相似值的倒数和。
以图4的例子来说,当k=5时,假设“圆圈”与“方块”的相似值分别为10、5、5,“圆圈”与“三角”的相似值分别为4和2(图案之间的距离越近,就越相似,则相似值就越小),则:
V有效=1/10+1/5+1/5=1/2
V非有效=1/4+1/2=3/4,
因此可以计算得到:a%=40%,b%=60%,从而告诉网站主这个“圆圈”代表的新访客是无价值的可能性更大一点,因此经过柔化处理的评估结果无疑是更合理的结论。
值得注意的是,如果新访客和“标准集”中某个历史访客的相似值为0(即二者所有的数据值都相同),由于在柔化处理时要计算新访客与历史访客相似值的倒数和,而因为分母不能等于0,所以这种情况下可以用一个较大值来代替新访客与该历史访客相似值的倒数。
在计算出新访客的价值数据之后,需要将这个价值数据返回给网站主(步骤S111)。具体来说,可以利用显示设备或者语音设备等工具将这个数据直观地表现出来,如以数字、图形、提示音等形式。而当新访客较多时,可以将新访客的价值数据传输并保存到后台服务器的数据库中,以便网站主后续的查阅。
特别地,当新访客较多时,为了防止有价值的新访客流失,可以先对有价值的新访客数据进行标记,或者新访客的有价值概率高于一个数值(如60%)时将其数据进行标记,然后再进行储存,以便网站主后续的查阅。其中,在对新访客的数据标记时,可以在其业务行为数据的字段最后标记一个字符“1”,从而网站主在查询所储存的新访客数据时,只需查看其业务行为数据的字段最后是否含有字符“1”,便可以知道该新访客是否具有业务价值。
另外,如果计算出新访客的有价值概率高于一个数值(如80%),可以建立该访客与网站主之间的实时通信通道。在实际应用时,可以同时向网站主和该新访客发出实时通信的请求,双方同意后再建立实时通信通道。通信时可以采用现有通讯技术,如IM对话框(Instant Messenger,即时通讯软件)等,在此不再赘述。
相应于上面的方法实施例,本申请还提出一种网站访客价值评估系统,请参见图5,网站访客价值评估系统505包括监控单元507、存储单元509、模型训练单元511、计算单元513、评估单元515及数据返回单元517。监控单元507与网络平台503相连,存储单元509与监控单元507相连,模型训练单元511与存储单元509相连,计算单元513分别与存储单元509及模型训练单元511相连,评估单元515与计算单元513相连,数据返回单元517与评估单元515相连。其中,访客通过终端501可以访问网络平台503上的网站信息,而网站访客价值评估系统505可以对来访的访客进行价值评估。
监控单元507会对网络平台503上的访客信息进行监控,采集并选取一定量的访客数据以建立标准集。如图6所示,监控单元507又可以包括数据采集子单元603及量化子单元605。数据采集子单元603用于采集一段时间内网络平台503上的访客数据,所述的访客数据包括属性数据和业务行为数据。这里所说的属性数据是指访客的基本信息和访问网站的行为信息,如访问时刻、访客地域(通过IP判断)、访问页面数、网站停留时间、重复来访次数等数据。业务行为数据是指网站主对访客是否有价值的判断信息,即表示该历史访客是有价值或无价值的数据。而数据采集子单元603所采集的数据会由量化子单元605量化为布尔型,将不同类型的数据进行统一规划,并形成所述标准集。
标准集的访客数据存放于存储单元509中,并提供给模型训练单元511构建网站访客价值的计算模型。请参见图7,模型训练单元511还包括有赋值子单元703,其用于为标准集中所有的访客数据赋予权重值,不同类别的数据对评价网站访客价值的重要性是不同的,因此要给不同类别的数据赋予权重值,重要性高的数据就给予较大的权重值,重要性低的数据就给予较小的权重值。
各类数据的权重值设置完成之后,模型训练单元511便可以依据标准集中的访客数据来构建访客价值的计算公式:∑wi*Xi
其中,wi为访客数据的权重值。Xi为布尔型变量,它表示该条数据与标准集中历史访客的对应数据的对比参数,若新访客与历史访客对应数据的值相同则Xi为0,不同则Xi为1。
而当新访客访问网络平台503时,计算单元513会通过计算模型计算出新访客与标准集中所有访客的相似值,这个相似值表示了新访客与标准集中历史访客的相似程度。然后,评估单元515根据计算单元的计算结果,选取标准集中与新访客最相似的k个访客,并根据这k个访客的价值,评估新访客的价值。其中,k值为奇数,如可以选取7或9这样的数值。
对于新访客价值的评估,又可以分为两种情况:当取出的k个访客中,有价值访客的数量大于无价值访客的数量,则判定新访客为有价值的访客;当取出的k个访客中,有价值访客的数量小于无价值访客的数量,则判定新访客为无价值的访客。
但是由于标准集中历史访客有可能出现分布不平衡的情况,如果单以k个访客中有价值访客的数量来判定新访客的价值,可能会产生计算误差,因此评估单元515中还设置有柔化子单元803,如图8所示,柔化子单元803用于对访客价值的判断结果进行柔化,其依照的柔化准则是:
a%=100%*V有效/(V有效+V非有效)
b%=100%*V非有效/(V有效+V非有效)
其中,a%为新访客有价值的概率,b%为新访客无价值的概率,V有效为k个访客中有价值访客与新访客相似值的倒数和,V非有效为k个访客中无价值访客与新访客相似值的倒数和。这样,评估单元515便能对新访客的价值进行概率性评估,告诉网站主新访客是有价值访客的几率,从而使评估结论更加合理。
在评估单元515得到新访客的价值数据后,会由数据返回单元517将这个价值数据返回给网站主。具体来说,数据返回单元517会将价值数据传输给显示设备或者语音设备等工具,并将这个数据直观地表现出来,如以数字、图形、提示音等形式。
请参见图9,其为本申请实施例的另一种网站访客价值评估系统结构图。与图5相比,本实施例还包括有潜在访客管理单元903以及访客追踪单元905,潜在访客管理单元903和访客追踪单元905均与评估单元515相连。
当网站的新访客较多时,为了防止有价值的新访客流失,潜在访客管理单元903会将有价值的新访客或者价值概率高于一个预设数值的新访客数据进行标记,并进行储存,以便网站主后续的查阅。其中,在对新访客的数据标记时,可以在其业务行为数据的字段最后标记一个字符“1”,从而网站主在查询所储存的新访客数据时,只需查看其业务行为数据的字段最后是否含有字符“1”,便可以知道该新访客是否具有业务价值。潜在访客管理单元903的功能可以采用现有的CRM(Customer Relationship Management,客户关系管理)技术来实现。
如果评估单元515计算出新访客的有价值概率高于一个数值(如80%),访客追踪单元905会向网站主及该新访客发出实时通信的请求信息,一旦双方同意,访客追踪单元905便会建立网站主与该新访客之间的实时通信通道。通信时可以采用现有通讯技术,如IM对话框(Instant Messenger,即时通讯软件)等。
本申请以新访客与历史访客之间的相似性作为价值判断的依据,并利用邻近算法,可以对网站访客的价值进行人性化的评估,且将容易被忽略的一些隐含信息包含在算法之中,使对访客价值的评估更接近于人类的判断,使网站主可以准确地针对有价值的访客进行后续的跟踪业务行为,可以大大提高网站创造利益的效率。
为了描述的方便,以上所述系统的各部分以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件或硬件中实现。
以上公开的仅为本申请的几个具体实施例,但本申请并非局限于此,任何本领域的技术人员能思之的变化,都应落在本申请的保护范围内。
Claims (18)
1.一种网站访客价值评估系统,其特征在于,包括:
一监控单元,用于采集网站的访客信息,并选取一定量的访客数据以建立一标准集;
一存储单元,与所述监控单元相连,用于存放所述标准集;
一模型训练单元,与所述存储单元相连,用于根据所述标准集,构建网站访客价值的计算模型;
一计算单元,分别与所述存储单元及模型训练单元相连,用于通过所述计算模型计算出新访客与所述标准集中所有访客的相似值;
一评估单元,与所述计算单元相连,用于根据所述计算单元的计算结果,选取标准集中与新访客最相似的k个访客,并根据这k个访客的价值,评估该新访客的价值;
一数据返回单元,与所述评估单元相连,用于返回新访客的价值数据。
2.如权利要求1所述的网站访客价值评估系统,其特征在于,所述监控单元又包括:
一数据采集子单元,用于采集一段时间内的访客数据,所述的访客数据包括属性数据和业务行为数据;
一量化子单元,与所述数据采集子单元相连,用于将所采集的网站访客数据量化为布尔型,并形成所述标准集。
3.如权利要求1所述的网站访客价值评估系统,其特征在于,所述模型训练单元又包括:
一赋值子单元,与所述存储单元相连,用于为标准集中所有的访客数据赋予权重值。
4.如权利要求3所述的网站访客价值评估系统,其特征在于,所述计算模型的计算公式为:∑wi*Xi
其中,wi为访客数据的权重值,Xi为该条数据与标准集中访客的对应数据的对比参数,相同为0,不同为1。
5.如权利要求1所述的网站访客价值评估系统,其特征在于,所述评估单元又进一步包括:
一柔化子单元,用于对访客价值的判断结果进行柔化。
6.如权利要求5所述的网站访客价值评估系统,其特征在于,对新访客价值判断结果的柔化准则是:
a%=100%*V有效/(V有效+V非有效)
b%=100%*V非有效/(V有效+V非有效)
其中,a%为新访客有价值的概率,b%为新访客无价值的概率,V有效为k个访客中有价值访客与新访客相似值的倒数和,V非有效为k个访客中无价值访客与新访客相似值的倒数和。
7.如权利要求1所述的网站访客价值评估系统,其特征在于,其还包括一潜在访客管理单元,其与所述评估单元相连,用于储存有价值的新访客数据,并对有价值的新访客数据进行标记。
8.如权利要求1所述的网站访客价值评估系统,其特征在于,其还包括一访客追踪单元,其与所述评估单元相连,用于建立有价值的新访客与网站主之间的实时通信通道。
9.一种网站访客价值评估方法,其特征在于,包括以下步骤:
建立一标准集,所述标准集中包括网站历史记录中一定量的访客数据;
根据所述标准集,构建网站访客价值的计算模型;
通过所述计算模型分别计算出新访客与所述标准集中所有访客的相似值;
取出标准集中与新访客最相似的k个访客;
根据这k个访客的价值,评估该新访客的价值;
向网站主返回新访客的价值数据。
10.如权利要求9所述的网站访客价值评估方法,其特征在于,建立所述标准集具体包括以下步骤:
对网站进行监控,并采集一段时间内的访客数据,所述的访客数据包括属性数据和业务行为数据;
将所采集的网站访客数据量化为布尔型,并形成所述标准集。
11.如权利要求9所述的网站访客价值评估方法,其特征在于,构建网站访客价值计算模型具体包括步骤:
为标准集中所有的访客数据赋予权重值;
搭建新访客与所述标准集中访客的相似值计算公式:∑wi*Xi
其中,wi为访客数据的权重值,Xi为该条数据与标准集中访客的对应数据的对比参数,相同为0,不同为1。
12.如权利要求9所述的网站访客价值评估方法,其特征在于,评估该新访客的价值具体为:
当取出的k个访客中,有价值访客的数量大于无价值访客的数量,则判定新访客为有价值的访客;
当取出的k个访客中,有价值访客的数量小于无价值访客的数量,则判定新访客为无价值的访客。
13.如权利要求9所述的网站访客价值评估方法,其特征在于,评估该新访客的价值时对判断结果进行柔化。
14.如权利要求13所述的网站访客价值评估方法,其特征在于,对新访客价值判断结果的柔化准则是:
a%=100%*V有效/(V有效+V非有效)
b%=100%*V非有效/(V有效+V非有效)
其中,a%为新访客有价值的概率,b%为新访客无价值的概率,V有效为k个访客中有价值访客与新访客相似值的倒数和,V非有效为k个访客中无价值访客与新访客相似值的倒数和。
15.如权利要求9所述的网站访客价值评估方法,其特征在于,k的值为7或9。
16.如权利要求9所述的网站访客价值评估方法,其特征在于,还包括步骤:定期更新所述标准集中的访客数据。
17.如权利要求9所述的网站访客价值评估方法,其特征在于,在对新访客的价值进行评估之后还进一步包括步骤:将有价值的新访客数据进行标记并储存。
18.如权利要求9所述的网站访客价值评估方法,其特征在于,在对新访客的价值进行评估之后还进一步包括步骤:建立有价值的新访客与网站主之间的实时通信通道。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2009101736223A CN102012902A (zh) | 2009-09-04 | 2009-09-04 | 网站访客价值评估系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2009101736223A CN102012902A (zh) | 2009-09-04 | 2009-09-04 | 网站访客价值评估系统及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102012902A true CN102012902A (zh) | 2011-04-13 |
Family
ID=43843074
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2009101736223A Pending CN102012902A (zh) | 2009-09-04 | 2009-09-04 | 网站访客价值评估系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102012902A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102737063A (zh) * | 2011-04-15 | 2012-10-17 | 阿里巴巴集团控股有限公司 | 一种日志信息的处理方法及系统 |
CN103020100A (zh) * | 2011-08-23 | 2013-04-03 | 波音公司 | 用于地块评估的系统、方法和计算机程序产品 |
CN103971256A (zh) * | 2013-01-25 | 2014-08-06 | 阿里巴巴集团控股有限公司 | 一种信息推送方法及设备 |
CN106170815A (zh) * | 2015-08-21 | 2016-11-30 | 广州博鳌纵横网络科技有限公司 | 一种商标价值评估方法及系统 |
CN112001742A (zh) * | 2020-07-17 | 2020-11-27 | 湖南凯迪工程科技有限公司 | 网站访客行为习惯评估方法及系统 |
-
2009
- 2009-09-04 CN CN2009101736223A patent/CN102012902A/zh active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102737063A (zh) * | 2011-04-15 | 2012-10-17 | 阿里巴巴集团控股有限公司 | 一种日志信息的处理方法及系统 |
CN102737063B (zh) * | 2011-04-15 | 2014-09-10 | 阿里巴巴集团控股有限公司 | 一种日志信息的处理方法及系统 |
CN103020100A (zh) * | 2011-08-23 | 2013-04-03 | 波音公司 | 用于地块评估的系统、方法和计算机程序产品 |
CN103971256A (zh) * | 2013-01-25 | 2014-08-06 | 阿里巴巴集团控股有限公司 | 一种信息推送方法及设备 |
CN108764949A (zh) * | 2013-01-25 | 2018-11-06 | 阿里巴巴集团控股有限公司 | 一种信息推送方法及设备 |
CN106170815A (zh) * | 2015-08-21 | 2016-11-30 | 广州博鳌纵横网络科技有限公司 | 一种商标价值评估方法及系统 |
CN112001742A (zh) * | 2020-07-17 | 2020-11-27 | 湖南凯迪工程科技有限公司 | 网站访客行为习惯评估方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10896203B2 (en) | Digital analytics system | |
Ghosh et al. | Predicting influential users in online social networks | |
Eick et al. | The physics of the Mt/G/∞ queue | |
JP5551704B2 (ja) | オンライン・マーケティング効率の評価 | |
Ballesteros et al. | Safe cities. A participatory sensing approach | |
US20140188563A1 (en) | Customer demographic data change detection based on monitored utility consumption | |
CN101771758A (zh) | 一种性能指标值正常波动范围的动态确定方法及其装置 | |
CN111723292B (zh) | 基于图神经网络的推荐方法、系统、电子设备及存储介质 | |
Ottomanelli et al. | Modelling parking choice behaviour using Possibility Theory | |
CN102012902A (zh) | 网站访客价值评估系统及方法 | |
CN106209426B (zh) | 一种基于d-s证据理论的服务器负载状态评估分析方法和系统 | |
CN116797404A (zh) | 基于大数据和数据处理的智能建筑运维监管系统 | |
Perçuku et al. | Big data and time series use in short term load forecasting in power transmission system | |
Yamada et al. | A stochastic differential equation model for software reliability assessment and its goodness-of-fit | |
CN102096692A (zh) | 网站访客价值评估系统及方法 | |
Şencan | Modeling of thermodynamic properties of refrigerant/absorbent couples using data mining process | |
Yang et al. | Dynamic Stochastic Multiattribute Decision‐Making That Considers Stochastic Variable Variance Characteristics under Time‐Sequence Contingency Environments | |
Xie et al. | Mining individual mobility patterns from mobile phone data | |
JP2019175109A (ja) | 予測制御装置、予測制御システムおよび予測制御方法 | |
Gong | An efficient collaborative recommendation algorithm based on item clustering | |
JP7020345B2 (ja) | 評価装置、方法、及びプログラム | |
Popeangă | Data mining smart energy time series | |
Nguyen | Representation choice methods as the tool for solving uncertainty in distributed temporal database systems with indeterminate valid time | |
Mustafa et al. | Software risk assessment visualization tool design using probabilistic inference models | |
CN115174226B (zh) | 基于人工智能和大数据的用户行为预测方法、设备、介质及产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1154095 Country of ref document: HK |
|
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20110413 |
|
REG | Reference to a national code |
Ref country code: HK Ref legal event code: WD Ref document number: 1154095 Country of ref document: HK |