CN102096692A - 网站访客价值评估系统及方法 - Google Patents
网站访客价值评估系统及方法 Download PDFInfo
- Publication number
- CN102096692A CN102096692A CN2009102591753A CN200910259175A CN102096692A CN 102096692 A CN102096692 A CN 102096692A CN 2009102591753 A CN2009102591753 A CN 2009102591753A CN 200910259175 A CN200910259175 A CN 200910259175A CN 102096692 A CN102096692 A CN 102096692A
- Authority
- CN
- China
- Prior art keywords
- visitor
- data
- value
- new
- website
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提出一种网站访客价值评估系统及方法,其方法包括步骤:(1)建立标准集,所述标准集中包括网站历史记录中一定量的访客数据按照价值等级划分而成的多个数据组。(2)构建新访客对各个数据组隶属度的计算模型。(3)根据计算出的隶属度,评估新访客的价值。(4)输出新访客的价值数据。本发明可以对网站访客价值人性化地评估,节约了网站主亲自评估访客价值所需的大量时间。
Description
技术领域
本申请涉及网络技术,特别涉及一种网站访客价值评估系统及方法。
背景技术
目前,很多企业都通过网站来进行信息展示和产品营销,随着网络技术的发展,网站和访客之间也可以实现更多的互动。例如,网站主可以通过网络管理系统看到访客的一些信息,根据这些信息来判断访客的价值,然后进一步对具有一定价值的访客做一些业务行为,例如与其联系,向其提供更详细的信息等。
可以想象,对于具有大量访客的网站而言,如果以人工方式来判断每个访客的价值,工作量大且效率难以保证。为了实现对网站访客价值的自动判断,现有技术中,是通过把各类“访客信息”中的单个或多个组合设置为条件,一旦满足条件,就认为该访客具有一定价值并通知网站主。这些条件可以包括:来访次数超过几次、访问页面超过几个、是否访问过某些特定页面、访客是否来自某些特定的省市等。
但是通过对现有技术的研究,申请人发现上述条件组合的方法存在着许多缺陷,主要包括以下几点:
1、现有技术中,为了可以尽可能准确地评估访客的价值,评估规则就会极为复杂,往往需要由许多个数据条件组合而成。因此系统在计算过程中就需要针对访客信息中的各条数据进行反复的计算,计算量会非常大,且计算时间过长。
2、现有的访客价值评估方法无法给出人性化的评估结论,只能输出“是”或者“否”两种结果。对于条件组合的判断方法来说,有些访客价值可能是潜在的,即这种访客的价值数据并没有被纳入判断条件中,因而现有技术很难准确地、全面地对访客价值进行判断。
综上所述,现有的自动判断访客价值的方法,其计算量大、计算时间长,容易出现漏判错判的情况,并且其判断结果往往缺乏准确性和全面性。
发明内容
本申请的目的提供一种网站访客价值评估系统,以解决现有的网站访客价值判断方法容易出现漏判错判的问题。
本申请的另一目的是提供一种网站访客价值评估方法,以解决现有的网站访客价值判断方法容易出现漏判错判的问题。
本申请提出一种网站访客价值评估系统,包括监控单元、数据组划分单元、存储单元、模型训练单元、计算单元以及数据输出单元。监控单元用于采集网站的访客信息。数据组划分单元与所述监控单元相连,用于将采集的历史访客数据按照价值等级划分多个数据组,并形成一个标准集。存储单元与所述数据组划分单元相连,用于存放所述标准集。模型训练单元与所述存储单元相连,用于根据所述标准集,构建新访客对各个数据组隶属度的计算模型。计算单元分别与所述存储单元及模型训练单元相连,用于通过所述计算模型计算出新访客对各个数据组的隶属度,以评估该新访客的价值。数据输出单元与所述计算单元相连,用于输出表示新访客价值的数据。
依照本申请较佳实施例所述的网站访客价值评估系统,所述模型训练单元又包括赋值子单元,其与所述存储单元相连,用于为标准集中所有的访客数据赋予权重值。
依照本申请较佳实施例所述的网站访客价值评估系统,所述计算模型的计算公式为:
A=∑wi*Xi
b(i)=min{bk(i)}k=1,2,...n
其中,A为新访客与历史访客之间的“距离”,wi为访客数据的权重值;Xi为该条数据与标准集中访客的对应数据的对比参数,相同为0,不同为1;S(i)为新访客对其中一数据组的隶属度;a(i)为新访客与该数据组中历史访客“距离”的平均值;bk(i)为新访客与标准集中其它数据组中历史访客“距离”的平均值。
依照本申请较佳实施例所述的网站访客价值评估系统,数据输出单元输出的数据形式为:
[S1/(S1+S2+...+Sn+1),S2/(S1+S2+...+Sn+1),...Sn+1/(S1+S2+...+Sn+1)]
其中,S1、S2、...、Sn+1表示新访客与各个数据组的隶属关系,且Sn+1=(S(i)+1)/2,n+1是标准集中数据组的数量。
依照本申请较佳实施例所述的网站访客价值评估系统,所述监控单元又包括数据采集子单元及量化子单元。数据采集子单元用于采集一段时间内的访客数据,所述的访客数据包括属性数据和业务行为数据。量化子单元与所述数据采集子单元相连,用于将所采集的网站访客数据量化为布尔型,并形成所述标准集。
依照本申请较佳实施例所述的网站访客价值评估系统,所述标准集中包括“有价值访客”和“无价值访客”两个数据组。
依照本申请较佳实施例所述的网站访客价值评估系统,所述标准集中包括“有价值访客”、“无价值访客”和“恶意访客”三个数据组。
依照本申请较佳实施例所述的网站访客价值评估系统,其还包括潜在访客管理单元,其与所述计算单元相连,用于储存有价值的新访客数据,并对有价值的新访客数据进行标记。
依照本申请较佳实施例所述的网站访客价值评估系统,其还包括访客追踪单元,其与所述计算单元相连,用于建立有价值的新访客与网站主之间的实时通信通道。
本申请另提出一种网站访客价值评估方法,包括步骤:(1)建立标准集,所述标准集中包括网站历史记录中一定量的访客数据按照价值等级划分而成的多个数据组。(2)构建新访客对各个数据组隶属度的计算模型。(3)根据计算出的隶属度,评估新访客的价值。(4)输出新访客的价值数据。
依照本申请较佳实施例所述的网站访客价值评估方法,构建所述计算模型具体包括步骤:(1)为所有数据组中的历史访客数据赋予权重值。(2)构建新访客与历史访客的“距离”计算公式:A=∑wi*Xi(3)构建新访客对各个数据组隶属度的计算公式:
b(i)=min{bk(i)} k=1,2,...n
其中,A为新访客与历史访客之间的“距离”,wi为访客数据的权重值;Xi为该条数据与标准集中访客的对应数据的对比参数,相同为0,不同为1;S(i)为新访客对其中一数据组的隶属度;a(i)为新访客与该数据组中历史访客“距离”的平均值;bk(i)为新访客与标准集中其它数据组中历史访客“距离”的平均值。
依照本申请较佳实施例所述的网站访客价值评估方法,输出新访客的价值数据时具体为输出数组:
[S1/(S1+S2+...+Sn+1),S2/(S1+S2+...+Sn+1),...Sn+1/(S1+S2+...+Sn+1)]
其中,S1、S2、...、Sn+1表示新访客与各个数据组的隶属关系,且Sn+1=(S(i)+1)/2,n+1是标准集中数据组的数量。
依照本申请较佳实施例所述的网站访客价值评估方法,建立所述标准集具体包括以下步骤:(1)对网站进行监控,并采集一段时间内的访客数据,所述的访客数据包括属性数据和业务行为数据。(2)将所采集的网站访客数据量化为布尔型。(3)根据业务行为数据将所采集的访客数据划分为多个数据组,并形成所述标准集。
依照本申请较佳实施例所述的网站访客价值评估方法,建立所述标准集时具体为:将历史访客数据按照有价值访客、无价值访客的规则划分为两个数据组。
依照本申请较佳实施例所述的网站访客价值评估方法,建立所述标准集时具体为:将历史访客数据按照按照有价值访客、无价值访客、恶意访客的规则划分为三个数据组。
依照本申请较佳实施例所述的网站访客价值评估方法,在对新访客的价值进行评估之后还进一步包括步骤:将有价值的新访客数据进行标记并储存。
依照本申请较佳实施例所述的网站访客价值评估方法,在对新访客的价值进行评估之后还进一步包括步骤:建立有价值的新访客与网站主之间的实时通信通道。
与现有技术相比,本申请具有以下优点:
1、本申请通过计算访客隶属度的方式来判别访客价值,计算公式单一,无须对访客数据进行反复的计算,使系统的计算量小,计算速度快。
2、本申请利用了模糊数学的思想来估算访客价值,可以将容易被忽略的一些隐含信息包含在算法之中,并可以输出概率性的结论,使访客价值的计算结果更加准确和全面。
当然,实施本申请的任一产品并不一定需要同时达到以上所述的所有优点。
附图说明
图1为本申请网站访客价值评估方法的一种实施例流程图;
图2为本申请网站访客价值评估方法在建立标准集时的一种实施例流程图;
图3为本申请构建计算模型的一种实施例流程图;
图4为本申请访客隶属度计算方式的一种实施例示意图;
图5为本申请网站访客价值评估系统的一种实施例结构图;
图6为本申请监控单元的一种实施例结构图;
图7为本申请模型训练单元的一种实施例结构图;
图8为网站访客价值评估系统的另一种实施例结构图;
图9为本申请网站访客价值评估系统的网络拓扑图。
具体实施方式
本申请利用了模糊数学的思想,根据网站主对历史访客数据的价值判断,并以模糊数学中隶属度来作为评估新访客是否有价值的标准,从而可以对新访客的价值进行人性化的评估,也使网站主可以有效地展开后续的业务行为。
以下结合附图,具体说明本申请。
请参见图1,其为本申请一种网站访客价值评估方法的实施例流程图,其包括以下步骤:
S101,建立标准集,所述标准集中包括网站历史记录中一定量的访客数据按照价值等级划分而成的多个数据组。
S103,构建新访客对各个数据组隶属度的计算模型。
S105,根据计算出的隶属度,评估新访客的价值。
S107,输出新访客的价值数据。
对于步骤S101,在建立所述的标准集时可以通过三个过程来实现,如图2所示,其包括:
S201,对网站进行监控,并采集一段时间内的访客数据,所述的访客数据包括属性数据和业务行为数据。
网站主可以在后台服务器中搭建一个监控系统,并且通过监控系统采集一段时间内网站上的访客数据。而本申请的访客价值评估方法所需要的访客数据包括有属性数据和业务行为数据。这里所说的属性数据是指访客的基本信息和访问网站的行为信息,如访问时刻、访客地域(通过IP判断)、访问页面数、网站停留时间、重复来访次数等数据。业务行为数据是指网站主对访客是否有价值的判断信息,即表示该历史访客是否有价值的数据。
S203,将所采集的网站访客数据量化为布尔型。
为了可以建立一个简单计算模型,需要将所采集到的历史访客的属性数据和业务行为数据进行量化处理。本实施例中是将对访客价值判断有用的数据量化为布尔型。具体来说,就是将不同类型的数据进行统一规划,以便于后续的模型计算。请参见表1,其给出了部分数据的量化准则:
数据类别 | 数据形式 | 量化规则 |
地域 | 编码 | 精确到省,编码为1、2、3...... |
访问页面 | 编码 | 将网站页面进行编号,不同页面对应不同的编码。 |
页面数 | 数值 | 划分为区间,比如1、2~3、4~5、5页面以上。 |
网站停留时间 | 数值 | 分段并简化表示,10秒内对应数值1,10~30秒对应数值2,以此类推。 |
重复来访次数 | 数值 | 以实际次数表示。 |
网站主的判断 | 数值 | 1表示是有价值访客,2表示是无价值访客,3表示恶意访客。 |
... | ... | ... |
表1
当然,表1给出的例子仅为量化过程的一种方式,同样也可以根据其它的规则进行量化,或者也可以将各个类别的数据量化为其它的表达形式。
S205,根据业务行为数据将所采集的访客数据划分为多个数据组,并形成所述标准集。
为了可以实现模糊数学的算法,本实施例要将标准集中的历史访客数据按照价值等级划分成多个数据组。由于在量化后的访客数据中,业务行为数据表示网站主对访客价值的判断,而业务行为数据的数据值可以代表该历史访客的价值等级,因此可以将业务行为数据值相同的历史访客编在同一数据组中,这样便实现了按照价值等级划分历史访客数据的目的。
在历史访客数据被划分成多个数据组后,可以将这些数据存储到后台服务器的数据库中,作为用来判断新访客价值的标准集。也可以在量化后的访客数据中再次选取一定数量的访客数据,来作为所述的标准集,选取的数据越多则访客价值评估的可信度越高,但也意味着计算量的增加,因此数据量的选取可以依照系统实际的处理能力。另外,为了使评估结果可以保持准确性,可以定期对标准集中的访客数据进行更新。
标准集建立之后便可以构建网站访客价值的计算模型,即进入步骤103。构建计算模型可以通过三个步骤来完成,如图3所示:
S301,为所有数据组中的历史访客数据赋予权重值。
不同类别的数据对评价网站访客价值的重要性是不同的,因此要给不同类别的数据赋予权重值,重要性高的数据就给予较大的权重值,重要性低的数据就给予较小的权重值。例如表1的各类数据中,“地域”对判断访客价值较为重要,则可以将它的权重值设置为5,而“网站停留时间”对判断访客价值不是非常重要,则可以将它的权重值设置为2。
S303,构建新访客与历史访客的“距离”计算公式:A=∑wi*Xi
其中,wi为访客数据的权重值。Xi为布尔型变量,它表示该条数据与标准集中历史访客的对应数据的对比参数,若新访客与历史访客对应数据的值相同则Xi为0,不同则Xi为1。
利用上述计算公式,便可以计算出新访客与标准集中历史访客的“距离”,为了便于理解,现以表1中的各种数据来具体说明计算过程。
假设标准集中的历史访客M的数据如表2所示:
数据类别 | 数据值 | 权重值 |
地域 | 1 | 5 |
访问页面 | 3 | 4 |
页面数 | 5 | 5 |
网站停留时间 | 5 | 2 |
重复来访次数 | 2 | 10 |
网站主的判断 | 1 |
表2
当新访客N访问网站后,若监测到新访客N的“地域”、“访问页面”、“页面数”的数值与历史访客M相同,而“网站停留时间”、“重复来访次数”的数值与历史访客M不同,则新访客N与历史访客M的“距离”:
A=∑wi*Xi=5*0+4*0+5*0+2*1+10*1=12
这个“距离”值表示了新访客N与历史访客M的相似程度,新访客N与历史访客M越相似,则这个“距离”值就越小。
S305,构建新访客对各个数据组隶属度的计算公式:
b(i)=min{bk(i)}k=1,2,...n
其中,S(i)为新访客对其中一数据组的隶属度;a(i)为新访客与该数据组中历史访客“距离”的平均值;bk(i)为新访客与标准集中其它数据组中历史访客“距离”的平均值。
根据上述公式,可以利用计算出的新访客与历史访客之间的“距离”值,来计算新访客对标准集中各个数据组的隶属度。为便于理解,下面以一简单的例子来说明隶属度的计算过程:
如图4所示,“圆圈”图标表示待评估的新访客,“三角”和“方块”图标表示标准集中的历史访客。其中,“三角”表示有价值的历史访客,三个“三角”与“圆圈”的“距离”分别为3、4、2,且三个“三角”处于一个“有价值访客”的数据组中。“方块”表示无价值的历史访客,三个“方块”与“圆圈”的“距离”分别为6、8、10,且三个“方块”处于一个“无价值访客”的数据组中。
按照公式计算,“圆圈”对于“有价值访客”数据组的隶属度为:
S有价值=(8-3)/8=5/8
“圆圈”对于“无价值访客”数据组的隶属度为:
S无价值=(3-8)/8=-5/8
值得注意的是,当新访客到某一数据组的平均距离比它到附近其它数据组的平均距离都小的时候,S(i)的值就会接近1.0,即说明这个新访客对该数据组的隶属度高;反之S(i)的值就会接近-1.0。
得到了新访客对各个数据组的隶属度之后,就可以利用这个隶属度来评估该新访客的价值(即步骤105)。由于数据组是按照历史访客的价值等级来划分的,因此只需考察新访客对于各个数据组的隶属度高低,便可以评估出新访客的价值。为了使新访客价值的表达更符合人类的思维方式,本申请可以对计算出的隶属度作一个简单的处理,以图4的计算结果为例,可以作如下处理:
S1=(S有价值+1)/2=13/16
S2=(S无价值+1)/2=3/16
其中,S1、S2分别表示“圆圈”对“有价值访客”和“无价值访客”的数据组的隶属关系,数值越大表示隶属关系越高,数值越小表示隶属关系越弱。在本实施例中,S1相对S2较大,所以“圆圈”代表的新访客有价值的概率较大。而由于这个隶属关系的值会始终在0%~100%之间,因而较为符合人类的思维方式。
最后,为便于网站主可以直观地了解新访客的价值,本申请可以用概率的形式输出新访客的价值数据(即步骤S107)。例如在得出上述S1和S2的结果之后,可以输出以下数组:
[S1/(S1+S2),S2/(S1+S2)],即[81.25%,18.75%]
即表示此新访客有价值的概率是81.25%,无价值的概率是18.75%。具体来说,这个数组可以通过显示设备或者语音设备等工具直观地表现出来,如以数字、图形、提示音等形式。而当新访客较多时,可以将新访客的价值数据传输并保存到后台服务器的数据库中,以便网站主后续的查阅。
值得注意的是,标准集中的历史访客数据除了划分成“有价值访客”和“无价值访客”两个数据组之外,也可以根据实际情况以及网站主的需要而划分成更多的数据组,例如可以划分出“有价值访客”、“无价值访客”、“恶意访客”三个数据组。而当标准集中包含三个或三个以上数据组时,最后输出的新访客价值数据可以按照下面规则处理:
[S1/(S1+S2+...+Sn+1),S2/(S1+S2+...+Sn+1),...Sn+1/(S1+S2+...+Sn+1)]
其中,S1、S2、...、Sn+1表示新访客与各个数据组的隶属关系,且Sn+1=(S(i)+1)/2,n+1是标准集中数据组的数量。
特别地,当新访客较多时,为了防止有价值的新访客流失,可以先对有价值的新访客数据进行标记,或者新访客的有价值概率高于一个数值(如60%)时将其数据进行标记,然后再进行储存,以便网站主后续的查阅。其中,在对新访客的数据标记时,可以在其业务行为数据的字段最后标记一个字符“1”,从而网站主在查询所储存的新访客数据时,只需查看其业务行为数据的字段最后是否含有字符“1”,便可以知道该新访客是否具有业务价值。
另外,如果计算出新访客的有价值概率高于一个数值(如80%),可以建立该访客与网站主之间的实时通信通道。在实际应用时,可以同时向网站主和该新访客发出实时通信的请求,双方同意后再建立实时通信通道。通信时可以采用现有通讯技术,如IM对话框(Instant Messenger,即时通讯软件)等,在此不再赘述。
相应于上面的方法实施例,本申请还提出一种网站访客价值评估系统,请参见图9,其为本申请网站访客价值评估系统的网络拓扑图。网站服务器903分别与访客用户端901及网站访客价值评估系统501相连,访客可以通过访客用户端901对网站服务器903进行访问。而网站访客价值评估系统501则对网站服务器903上来访的访客数据进行价值评估。
请参见图5,此网站访客价值评估系统501包括监控单元503、数据组划分单元505、存储单元507、模型训练单元509、计算单元511以及数据输出单元513。监控单元503连接到网站服务器903,其用于采集网站的访客信息。数据组划分单元505与监控单元503相连,存储单元507与数据组划分单元505相连,模型训练单元509与存储单元507相连,计算单元511分别与存储单元507及模型训练单元509相连,数据输出单元513与计算单元511相连。其中,访客可以通过各种终端设备(如个人电脑、手机终端等)访问网站服务器903上的网站信息,而网站访客价值评估系统501可以对来访的访客进行价值评估。
监控单元503会对网站服务器903上的访客信息进行监控,采集并选取一定量的访客数据。如图6所示,监控单元503又可以包括数据采集子单元603及量化子单元605。数据采集子单元603用于采集一段时间内网站服务器903上的访客数据,所述的访客数据包括属性数据和业务行为数据。这里所说的属性数据是指访客的基本信息和访问网站的行为信息,如访问时刻、访客地域(通过IP判断)、访问页面数、网站停留时间、重复来访次数等数据。业务行为数据是指网站主对访客是否有价值的判断信息,即表示该历史访客是有价值或无价值的数据。而数据采集子单元603所采集的数据会由量化子单元605量化为布尔型,并将不同类型的数据进行统一规划。
量化后的历史访客数据会由数据组划分单元505按照价值等级划分成多个数据组,并形成一个标准集。标准集中的历史访客数据存放于存储单元507中,并提供给模型训练单元509来构建新访客对各个数据组隶属度的计算模型。请参见图7,模型训练单元509还包括有赋值子单元703,其用于为标准集中所有的访客数据赋予权重值,不同类别的数据对评价网站访客价值的重要性是不同的,因此要给不同类别的数据赋予权重值,重要性高的数据就给予较大的权重值,重要性低的数据就给予较小的权重值。
各类数据的权重值设置完成之后,模型训练单元509便可以依据标准集中的访客数据来构建新访客对各个数据组隶属度的计算模型:
A=∑wi*Xi
b(i)=min{bk(i)} k=1,2,...n
其中,A为新访客与历史访客之间的“距离”,wi为访客数据的权重值;Xi为该条数据与标准集中访客的对应数据的对比参数,相同为0,不同为1;S(i)为新访客对其中一数据组的隶属度;a(i)为新访客与该数据组中历史访客“距离”的平均值;bk(i)为新访客与标准集中其它数据组中历史访客“距离”的平均值。
而当新访客访问网站服务器903时,计算单元511会通过上述计算模型计算出新访客对各个数据组的隶属度,这个隶属度表示新访客与对应数据组的接近程度。由于数据组是按照历史访客的价值等级来划分的,因而如果新访客与价值高的数据组越接近,表示新访客有价值的概率越高。反之如果新访客与价值低的数据组越接近,则表示新访客无价值的概率越高。
为了使输出的数据更符合人类的思维方式,数据输出单元513会将计算单元511得到的隶属度进行简单的处理,并以概率的形式输出。其中,数据输出单元513输出的数据形式可以是以下数组:
[S1/(S1+S2+...+Sn+1),S2/(S1+S2+...+Sn+1),...Sn+1/(S1+S2+...+Sn+1)]
其中,S1、S2、...、Sn+1表示新访客与各个数据组的隶属关系,且Sn+1=(S(i)+1)/2,n+1是标准集中数据组的数量。
具体来说,数据输出单元513可以将新访客的价值数据传输给显示设备或者语音设备等工具,并将这个数据直观地表现出来,如以数字、图形、提示音等形式。
请参见图8,其为本申请实施例的另一种网站访客价值评估系统结构图。与图5相比,本实施例还包括有潜在访客管理单元803以及访客追踪单元805,潜在访客管理单元803和访客追踪单元805均与数据输出单元513相连。
当网站的新访客较多时,为了防止有价值的新访客流失,潜在访客管理单元803会将有价值的新访客或者价值概率高于一个预设数值的新访客数据进行标记,并进行储存,以便网站主后续的查阅。其中,在对新访客的数据标记时,可以在其业务行为数据的字段最后标记一个字符“1”,从而网站主在查询所储存的新访客数据时,只需查看其业务行为数据的字段最后是否含有字符“1”,便可以知道该新访客是否具有业务价值。潜在访客管理单元803的功能可以采用现有的CRM(Customer Relationship Management,客户关系管理)技术来实现。
如果数据输出单元513所输出的新访客的有价值概率高于一个数值(如80%),访客追踪单元805会向网站主及该新访客发出实时通信的请求信息,一旦双方同意,访客追踪单元805便会建立网站主与该新访客之间的实时通信通道。通信时可以采用现有通讯技术,如IM对话框(Instant Messenger,即时通讯软件)等。
本申请利用了模糊数学的思想,通过计算新访客对不同价值等级数据组的隶属度,来估算出新访客的价值,并且输出概率性的结论,可以实现对网站访客价值的人性化评估,其计算过程简单,具有计算速度快、计算结果准确的优点。
为了描述的方便,以上所述系统的各部分以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件或硬件中实现。
以上公开的仅为本申请的几个具体实施例,但本申请并非局限于此,任何本领域的技术人员能思之的变化,都应落在本申请的保护范围内。
Claims (17)
1.一种网站访客价值评估系统,其特征在于,包括:
一监控单元,用于采集网站的访客信息;
一数据组划分单元,与所述监控单元相连,用于将采集的历史访客数据按照价值等级划分多个数据组,并形成一标准集;
一存储单元,与所述数据组划分单元相连,用于存放所述标准集;
一模型训练单元,与所述存储单元相连,用于根据所述标准集,构建新访客对各个数据组隶属度的计算模型;
一计算单元,分别与所述存储单元及模型训练单元相连,用于通过所述计算模型计算出新访客对各个数据组的隶属度,以评估该新访客的价值;
一数据输出单元,与所述计算单元相连,用于输出表示新访客价值的数据。
2.如权利要求1所述的网站访客价值评估系统,其特征在于,所述模型训练单元又包括:
一赋值子单元,与所述存储单元相连,用于为标准集中所有的访客数据赋予权重值。
3.如权利要求2所述的网站访客价值评估系统,其特征在于,所述计算模型的计算公式为:
A=∑wi*Xi
b(i)=min{bk(i)} k=1,2,...n
其中,A为新访客与历史访客之间的“距离”,wi为访客数据的权重值;Xi为该条数据与标准集中访客的对应数据的对比参数,相同为0,不同为1;S(i)为新访客对其中一数据组的隶属度;a(i)为新访客与该数据组中历史访客“距离”的平均值;bk(i)为新访客与标准集中其它数据组中历史访客“距离”的平均值。
4.如权利要求3所述的网站访客价值评估系统,其特征在于,该数据输出单元输出的数据形式为:
[S1/(S1+S2+...+Sn+1),S2/(S1+S2+...+Sn+1),...Sn+1/(S1+S2+...+Sn+1)]
其中,S1、S2、...、Sn+1表示新访客对与个数据组的隶属关系,且Sn+1=(S(i)+1)/2,n+1是标准集中数据组的数量。
5.如权利要求1所述的网站访客价值评估系统,其特征在于,所述监控单元又包括:
一数据采集子单元,用于采集一段时间内的访客数据,所述的访客数据包括属性数据和业务行为数据;
一量化子单元,与所述数据采集子单元相连,用于将所采集的网站访客数据量化为布尔型,并形成所述标准集。
6.如权利要求1所述的网站访客价值评估系统,其特征在于,所述标准集中包括“有价值访客”和“无价值访客”两个数据组。
7.如权利要求1所述的网站访客价值评估系统,其特征在于,所述标准集中包括“有价值访客”、“无价值访客”和“恶意访客”三个数据组。
8.如权利要求1所述的网站访客价值评估系统,其特征在于,其还包括一潜在访客管理单元,其与所述计算单元相连,用于储存有价值的新访客数据,并对有价值的新访客数据进行标记。
9.如权利要求1所述的网站访客价值评估系统,其特征在于,其还包括一访客追踪单元,其与所述计算单元相连,用于建立有价值的新访客与网站主之间的实时通信通道。
10.一种网站访客价值评估方法,其特征在于,包括步骤:
建立一标准集,所述标准集中包括网站历史记录中一定量的访客数据按照价值等级划分而成的多个数据组;
构建新访容对各个数据组隶属度的计算模型;
根据计算出的隶属度,评估新访客的价值;
输出新访客的价值数据。
11.如权利要求10所述的网站访客价值评估方法,其特征在于,构建所述计算模型具体包括步骤:
为所有数据组中的历史访客数据赋予权重值;
构建新访客与历史访客的“距离”计算公式:A=∑wi*Xi
构建新访客对各个数据组隶属度的计算公式:
b(i)=min{bk(i)} k=1,2,...n
其中,A为新访客与历史访客之间的“距离”,wi为访客数据的权重值;Xi为该条数据与标准集中访客的对应数据的对比参数,相同为0,不同为1;S(i)为新访客对其中一数据组的隶属度;a(i)为新访客与该数据组中历史访客“距离”的平均值;bk(i)为新访客与标准集中其它数据组中历史访客“距离”的平均值。
12.如权利要求11所述的网站访客价值评估方法,其特征在于,输出新访客的价值数据时具体为输出数组:
[S1/(S1+S2+...+Sn+1),S2/(S1+S2+...+Sn+1),...Sn+1/(S1+S2+...+Sn+1)]
其中,S1、S2、...、Sn+1表示新访客与各个数据组的隶属关系,且Sn+1=(S(i)+1)/2,n+1是标准集中数据组的数量。
13.如权利要求10所述的网站访客价值评估方法,其特征在于,建立所述标准集具体包括以下步骤:
对网站进行监控,并采集一段时间内的访客数据,所述的访客数据包括属性数据和业务行为数据;
将所采集的网站访客数据量化为布尔型;
根据业务行为数据将所采集的访客数据划分为多个数据组,并形成所述标准集。
14.如权利要求10所述的网站访客价值评估方法,其特征在于,建立所述标准集时具体为:将历史访客数据按照有价值访客、无价值访客的规则划分为两个数据组。
15.如权利要求10所述的网站访客价值评估方法,其特征在于,建立所述标准集时具体为:将历史访客数据按照按照有价值访客、无价值访客、恶意访客的规则划分为三个数据组。
16.如权利要求10所述的网站访客价值评估方法,其特征在于,在对新访客的价值进行评估之后还进一步包括步骤:将有价值的新访客数据进行标记并储存。
17.如权利要求10所述的网站访客价值评估方法,其特征在于,在对新访客的价值进行评估之后还进一步包括步骤:建立有价值的新访客与网站主之间的实时通信通道。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2009102591753A CN102096692A (zh) | 2009-12-11 | 2009-12-11 | 网站访客价值评估系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2009102591753A CN102096692A (zh) | 2009-12-11 | 2009-12-11 | 网站访客价值评估系统及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102096692A true CN102096692A (zh) | 2011-06-15 |
Family
ID=44129788
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2009102591753A Pending CN102096692A (zh) | 2009-12-11 | 2009-12-11 | 网站访客价值评估系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102096692A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102663065A (zh) * | 2012-03-30 | 2012-09-12 | 浙江盘石信息技术有限公司 | 一种广告位异常数据识别和筛选方法 |
CN104572657A (zh) * | 2013-10-12 | 2015-04-29 | 深圳市腾讯计算机系统有限公司 | 用户应用标识属性评估方法及装置 |
CN105117951A (zh) * | 2015-09-16 | 2015-12-02 | 百度在线网络技术(北京)有限公司 | 一种访客管理方法及装置 |
CN112001742A (zh) * | 2020-07-17 | 2020-11-27 | 湖南凯迪工程科技有限公司 | 网站访客行为习惯评估方法及系统 |
-
2009
- 2009-12-11 CN CN2009102591753A patent/CN102096692A/zh active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102663065A (zh) * | 2012-03-30 | 2012-09-12 | 浙江盘石信息技术有限公司 | 一种广告位异常数据识别和筛选方法 |
CN102663065B (zh) * | 2012-03-30 | 2014-12-10 | 浙江盘石信息技术有限公司 | 一种广告位异常数据识别和筛选方法 |
CN104572657A (zh) * | 2013-10-12 | 2015-04-29 | 深圳市腾讯计算机系统有限公司 | 用户应用标识属性评估方法及装置 |
CN104572657B (zh) * | 2013-10-12 | 2019-05-24 | 深圳市腾讯计算机系统有限公司 | 用户应用标识属性评估方法及装置 |
CN105117951A (zh) * | 2015-09-16 | 2015-12-02 | 百度在线网络技术(北京)有限公司 | 一种访客管理方法及装置 |
CN112001742A (zh) * | 2020-07-17 | 2020-11-27 | 湖南凯迪工程科技有限公司 | 网站访客行为习惯评估方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10896203B2 (en) | Digital analytics system | |
US10339484B2 (en) | System and method for performing signal processing and dynamic analysis and forecasting of risk of third parties | |
Sheu | Dynamic relief-demand management for emergency logistics operations under large-scale disasters | |
Sivadasan et al. | An information‐theoretic methodology for measuring the operational complexity of supplier‐customer systems | |
Fildes et al. | Forecasting competitions: Their role in improving forecasting practice and research | |
CN108647891A (zh) | 数据异常归因分析方法及装置 | |
Singh et al. | Integrated forecasting using the discrete wavelet theory and artificial intelligence techniques to reduce the bullwhip effect in a supply chain | |
CN111738843B (zh) | 一种使用流水数据的量化风险评价系统和方法 | |
CN110162445A (zh) | 基于主机日志及性能指标的主机健康评价方法及装置 | |
CN108364187A (zh) | 一种基于停电敏感特性的停电敏感用户确定方法和系统 | |
Elwakil et al. | Construction productivity fuzzy knowledge base management system | |
CN102609527B (zh) | 效果类推广信息监控方法及系统 | |
CN102096692A (zh) | 网站访客价值评估系统及方法 | |
CN102012902A (zh) | 网站访客价值评估系统及方法 | |
Wardana et al. | Comparation of SAW method and TOPSIS in assesing the best area using HSE standards | |
Elkholosy et al. | Data mining for forecasting labor resource requirements: a case study of project management staffing requirements | |
CN116228312A (zh) | 大额积分兑换行为的处理方法和装置 | |
CN113393169B (zh) | 基于大数据技术的金融行业交易系统性能指标分析方法 | |
Panenka et al. | Reliability assessment of ageing infrastructures: an interdisciplinary methodology | |
WO2002059808A1 (en) | System and method of estimating travel times | |
Popeangă | Data mining smart energy time series | |
CN112905956B (zh) | 一种基于电网运行特征分析的配网计量事件核对方法 | |
CN114240102A (zh) | 一种线损异常数据识别方法、装置、电子设备及存储介质 | |
Scheinert et al. | Growing collaborations: Forecasting changes in partnership networks using a bottom-up approach | |
JP7020345B2 (ja) | 評価装置、方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1155255 Country of ref document: HK |
|
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20110615 |
|
REG | Reference to a national code |
Ref country code: HK Ref legal event code: WD Ref document number: 1155255 Country of ref document: HK |