CN101482888A - 一种网站访客价值的计算方法及系统 - Google Patents
一种网站访客价值的计算方法及系统 Download PDFInfo
- Publication number
- CN101482888A CN101482888A CNA2009101181037A CN200910118103A CN101482888A CN 101482888 A CN101482888 A CN 101482888A CN A2009101181037 A CNA2009101181037 A CN A2009101181037A CN 200910118103 A CN200910118103 A CN 200910118103A CN 101482888 A CN101482888 A CN 101482888A
- Authority
- CN
- China
- Prior art keywords
- visitor
- computation model
- value
- information
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Marketing (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Information Transfer Between Computers (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种网站访客价值的计算方法及系统。一种网站访客价值的计算方法包括:初始化网站访客价值计算模型,所述计算模型为神经网络模型,以访客信息为输入,以访客价值为输出;使用数据样本对所述计算模型进行训练,确定所述计算模型;获得访客信息,使用所确定的计算模型,计算所述访客的价值。以上技术方案,以神经网络作为网站访客价值的计算模型。通过训练可以令模型学习网站主的主动行为,从而将业务需求中访客信息与访客价值间各种复杂的对应关系纳入模型。训练完成后,通过使用该模型,即可根据访客的各种信息,自动计算出该访客的价值,由于模型是根据人工判断的结果训练出来的,因此,其计算的结果与人工判断的结果趋于一致。
Description
技术领域
本发明涉及网络技术,特别是涉及一种网站访客价值的计算方法及系统。
背景技术
目前,很多企业都通过网站来进行信息展示和产品营销,随着网络技术的发展,网站和访客之间也可以实现更多的互动。例如,网站主可以通过网络管理系统看到访客的一些信息,根据这些信息来判断访客的价值,然后进一步对具有一定价值的访客做一些业务行为,例如与其联系,向其提供更详细的信息等等。
可以想象,对于具有大量访客的网站而言,如果以人工方式来判断每个访客的价值,工作量大且效率难以保证。为了实现对网站访客价值的自动判断,现有技术中,是通过把各类“访客信息”中的单个或组合设置为条件,一旦满足条件,就认为该访客具有一定价值并通知网站主。这些条件可以包括:来访次数超过几次、访问页面超过几个、是否访问过某些特定页面、访客是否来自某些特定的省市,等等。
通过对现有技术的研究,发明人发现上述方法只适用于处理简单的条件组合,然而在实际需求中,访客信息和访客价值之间往往存在着更为复杂的对应关系,例如:如果访客来自北京,则其访问页面A的价值大、如果访客来自上海,则其访问页面B的价值大;男性访客访问页面C的价值大、女性访客访问页面D的价值大。类似或更为复杂的情况还有很多,这些对应关系往往是非线性的,甚至是不确知的(即网站主并没有意识到自己的主动行为中存在着某种对应关系),如果使用条件组合的方法,难以把这些复杂的对应关系全部纳入考虑。因此,现有的自动判断访客价值的方法,其判断结果往往会与人工判断的结果有很大的偏差,无法达到预期效果。
发明内容
有鉴于此,本申请提供了一种网站访客价值的计算方法及系统,以解决现有自动判断访客价值的方法,其判断结果与人工判断结果存在很大偏差的问题。技术方案如下:
本申请提供一种网站访客价值的计算方法,包括:
初始化网站访客价值计算模型,所述计算模型为神经网络模型,以访客信息为输入,以访客价值为输出;
使用数据样本对所述计算模型进行训练,确定所述计算模型;
获得访客信息,使用所确定的计算模型,计算所述访客的价值
本申请还提供一种网站访客价值的计算系统,包括:
初始化单元,用于初始化网站访客价值计算模型,所述计算模型为神经网络模型,以访客信息为输入,以访客价值为输出;
训练单元,用于使用数据样本对所述计算模型进行训练,确定所述计算模型;
计算单元,用于获得访客信息,使用所确定的计算模型,计算所述访客的价值。
上述技术方案,以神经网络作为网站访客价值的计算模型。通过训练可以令模型学习网站主的主动行为,从而将业务需求中访客信息与访客价值间各种复杂的对应关系纳入模型。训练完成后,通过使用该模型,即可根据访客的各种信息,自动计算出该访客的价值,由于模型是根据人工判断的结果训练出来的,因此,其计算的结果与人工判断的结果趋于一致。
附图说明
图1为本申请实施例实现网站访客价值计算方法的流程图;
图2为本申请实施例的神经网络模型结构示意图;
图3为本申请实施例网站访客价值计算系统的结构示意图;
图4为本申请实施例网站访客价值计算系统的另一种结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请所提供的方案,下面结合附图和实施方式对本申请的实施例作进一步的详细说明。
图1所示为本申请实施例一种网站访客价值的计算方法的流程图,具体包括以下步骤:
S101,初始化网站访客价值计算模型,所述计算模型为神经网络模型,以访客信息为输入,以访客价值为输出;
为了实现根据访客信息自动计算访客的价值,需要建立各类访客信息与访客价值的对应关系。在实际需求中,各类访客信息与访客价值的关系往往是非线性甚至不确知的,因此,选择神经网络作为计算模型,可以有效地解决以上问题。
本实施例所采用的神经网络模型如图2所示,包括输入层、隐含层和输出层。该模型的数学描述如下:
Y=F(X)
=f2(W2f1(W1X+B1)+B2)
其中,X为输入向量;Y为输出向量;
W1为隐含层权值矩阵,B1为隐含层偏置向量,f1为隐含层传递函数;
W2为输出层权值矩阵,B2为输出层偏置向量,f2为输出层传递函数;
计算模型以访客信息为输入,X为n维纵向量,其中每一维的数值表示一类访客信息;以访客价值为输出,Y为m维纵向量;假设在模型的隐含层有k个节点,则W1为k×n矩阵,B1为k维纵向量,W2为m×k矩阵,B2为m维纵向量。
对于本实施例而言,所要计算的访客价值可以用一个数值来表示,因此输出向量Y为1维向量。需要说明的是,输入向量X和输出向量Y的维数是由具体需求所决定的,本实施例并不对其构成限定。
在本实施例中,隐含层传递函数f1选用神经元的非线性作用函数Sigmoid函数,即形如f(x)=1/(1+e-x)的函数;输出层传递函数f2为线性函数。理论研究表明,神经网络在其隐含层中使用Sigmoid传递函数,在输出层中使用线性传递函数,就能够以任意精度逼近任何感兴趣的函数。
对于隐含层的节点数目k而言,较多的隐含层节点可以加快神经网络的学习速度,但是也会使模型的结构变得复杂,降低模型的适应能力。节点的数目可以在训练的过程中进行调整,例如采用测试样本与训练样本的误差交叉评价的试错法来选择隐含层节点数。本领域技术人员也可以根据具体需求,采用其他方法来确定隐含层节点的数目,本实施例不对其进行限定。
S102,使用数据样本对所述计算模型进行训练,确定所述计算模型;
在S101中,对访客价值计算模型进行了初始化,在本步骤中,将通过训练对模型中的W1、W2、B1、B2等参数进行确定。
对于某个网站,可以选取一批历史数据,作为用于训练的样本。其中,样本输入为访客信息,可分为“访客属性信息”和“访客行为信息”两大类。其中,“访客属性信息”一般为相对静态的信息,包括访客的性别、年龄、地域等;而“访客行为信息”则是短期内可能发生动态变化的信息,例如访问网站的次数、所访问的页面、访问停留时间、访客是否进行了某些主动行为(如聊天、发邮件)、进行主动行为的次数等等。
为了令神经网络计算模型能够识别访客信息,可以对上述访客信息进行数值化处理,例如:对于时间、次数等信息,可以直接用其实际数值表示;对于取值为“是/否”的信息,可以使用数值0/1来表示;而对于访客地域、所访问页面这类的信息,可以分别针对每种信息的特点,预先对各种可能的取值进行编码,以“访客地域”为例,可以用001代表北京、002代表上海,等等。
对应每一位访客的一组信息,网站主会根据这些信息,对这位访客的价值给出判断,需要说明的是,这个判断过程应该是客观的,即对于相同的信息,其判断结果不会以人的主观意识而改变。当然,根据具体需求,判断的结果的表现形式是多种多样的:可以是简单的是/否有价值,或者是对价值划分出具体等级,也可以是一些具体的业务行为,例如:与访客联系(打电话、网络聊天、发邮件等),将访客加入CRM(客户管理系统)等等,这些人工判断的结果即为样本的期望输出。
与样本输入相对应,对作为样本期望输出的判断结果也应该进行数值化处理,其具体方法与对访客信息进行数值化处理的方法相类似。需要说明的是,如果判断结果是以“具体业务行为”来表示,那么对于同一位访客,可能会进行多种业务行为,这时,可以根据具体的需求,针对各种业务行为的重要程度,对判断结果进行加权平均处理。例如:将某位访客加入CRM意味着这名访客价值很大,而如果仅与某位访客进行试探性的聊天,则说明这位访客的价值相对较小,那么在进行加权平均处理的时候,“加入CRM”的权重就应该大于“聊天”。
可以想象,上述数据样本的输入和期望输出,即“访客信息”和“访客价值”之间,是存在着某种对应关系的。但是客观业务需求的复杂性导致这种对应关系难以直接描述。而通过对神经网络进行训练,神经网络可以将样本数据中所包含的对应关系以权值、偏置等形式表现在计算模型中,从而解决现有技术所存在的问题。
BP(误差反向传播)算法是比较常用的一类用于对神经网络进行训练的算法,常用的BP算法包括GD(Gradient Descent)、GDA(Gradient Descent withAdaptive learning rate)、GDM(Gradient Descent with Momentum)、GDX(Gradient Descent with momentum and adaptive learning rate)及LM(Levenberg-Marquardt)等,本实施例选用具有较好收敛性能的LM BP算法,能够达到最佳的实施效果。首先在全体数据样本中随机选定一个训练集(例如1/2的样本量)输入计算模型,将计算所得到的样本输出值与期望输出值进行比较,根据比较结果不断调整计算模型的未确定参数(如W1、W2、B1、B2等),使得样本输出值尽量接近期望输出值。模型的精度可以用均方误差来评价,当样本输出值与期望输出值的误差满足一定的精度要求时(例如均方误差小于10%),即可确定计算模型。
在训练过程中,还可以将训练集之外的数据样本作为确证集,用来辅助控制精度。理想的训练过程中,训练集的均方误差应该随着训练次数增加而逐渐减小。确证集的作用就是每进行一次(或几次)训练后即验证确证集的均方误差是否减少,如果是,继续对模型进行训练,否则停止训练,重新确认模型的参数。引入确证集的好处在于,可以自适应得到神经网络最优误差控制标准,避免选择误差控制标准的困难,还可以避免出现网络学习产生的对训练集过适应的现象。
S103,获得访客信息,使用所确定的计算模型,计算所述访客的价值。
训练完成后,使用所确定的计算模型即可自动对访客价值进行计算。其中,本领域技术人员可以根据具体需求,选择获得访客信息的具体方法。例如,对于性别、年龄、地域等“访客属性信息”,可以由该访客在网站的注册信息中获得,其中,访客的地域信息还可以通过该访客的IP地址获得。而对于“访客行为信息”则可以由网站后台的管理系统获得。
在获得某位访客的信息之后,将这些信息输入所确定的计算模型,就可以得到表示该访客价值的输出值。由于计算模型是根据人工判断的结果训练出来的,因此,其计算结果与人工判断的结果是趋于一致的。网站主根据该输出值,就可以决定是否对该访客做进一步的业务行为。
根据实际的业务需求,如果计算模型的输入仅包括“访客属性信息”这类相对静态的信息,那么模型所输出的访客价值是可以一次性计算出来的,并且在业务需求不变的前提下,可以认为这个值不会发生变化;如果计算模型的输入包括“访客行为信息”这类短期内可能发生动态变化的信息,则模型相应所输出的访客价值也应该是动态变化的。针对这种情况,可以由网站管理系统周期性地向计算模型提供/更新用户信息(或者由网站主来人工执行提供/更新用户信息的操作),以实现对访客价值的动态计算。
在计算模型中,还可以预先设置一个(或多个)访客价值阈值,当模型的输出值大于该阈值时,通过声音、屏幕视觉变化等方式提醒网站主,从而减少网站主对大量“无价值”访客的关注,提高工作效率。
在本申请的优选实施方式中,对于当前已确定的计算模型,还可以进一步对其进行修正。例如,由当前所确定的模型参数中,可以提取出每种访客信息与访客价值的相关性,如果发现某些访客信息与最终计算出的访客价值相关性很小,说明这些信息对最终结果的影响不大,那么可以将这些信息所对应的分量从计算模型的输入向量中删除,从而提高模型的计算性能。具体来讲,可以预先设定一个相关性阈值,当检测某个访客信息与访客价值的相关性小于这个阈值时,则从删除对应的分量,或者向网站主发出提示信息,让网站主来决定是否删除该分量。
此外,在计算模型的使用过程中,还可以周期性或随机地对当前所确定的计算模型的实际输出值与期望输出值进行比较,当然,期望输出值是需要由人工判断得到的,如果比较结果表明实际输出值与期望输出值的误差超过了某个预设的阈值,那么说明当前的计算模型已经过时,其原因可能是具体的业务需求方面有了变化,这时可以重新对计算模型进行训练,以适应业务需求的变化。可以理解的是,如果网站主自己能够意识到业务需求发生了变化,也可以主动触发计算模型的重构步骤。
下面将通过一个具体的实施例,对本申请的网站访客价值的计算方法进行说明。假设某企业分别针对初中生和高中生提供两类产品,并且将这两类产品信息分别发布在网站的A页面和B页面上。网站主在判断访客的价值时,遵循的原则包括:
1)如果访客年龄在10-16岁,并且访问页面A超过3次,则认为其有价值;
2)如果访客年龄在14-20岁,并且访问页面B超过3次,则认为其有价值;
3)如果访客年龄在35岁以上(可以认为是学生家长),并且访问页面A或B超过3次,则认为其有价值;
4)任意访客访问页面A或B超过10次,则认为其有价值;
5)任意年龄大于等于10岁的访客,如果向网站发送了站内咨询消息,则认为其有价值。
根据上述需求,可以首先确定模型的计算模型的输入参量包括:访客年龄、访问网页A(或B)的次数、访客是否发送过站内咨询消息三类;计算模型的输出即访客价值。所初始化的计算模型Y=F(X)中,X为3维向量,Y为1维向量。
进一步的,需要对计算模型的输入和输出进行数值化处理。对于“访客年龄”及“访问页面A(或B)的次数”,可以直接采用实际数值,对于“访客是否发送过站内咨询消息”,可以用数值1表示“是”,用数值0表示“否”。同样,作为样本期望输出的判断结果“访客是否有价值”,也用数值1表示“是”,用数值0表示“否”。
通过训练确定计算模型Y=F(X)后,就可以使用所确定的模型计算访客的价值了,对本实施例而言,“访客年龄”可以由访客在网站的注册信息中获得,优选地,还可以由当前日期与访客的出生日期(可以由注册信息中获得)相减来获得访客的年龄。
对于“访问页面A(或B)的次数”以及“访客是否发送过站内咨询消息”,这两类访客信息,可以通过网站后台的管理系统获得。由于这两类信息很有可能在短期内发生变化,因此,网站管理系统应该实时或周期性地向计算模型提供最新的信息。计算模型根据网站管理系统所提供的信息,实时或周期性地计算访客的价值。
网站管理系统获得访客的相关信息后,以预定的数据结构发送至计算模型的输入端口。假设预定的数据结构形式如下:
{访客标识,年龄,访问页面A次数,访问页面B次数,是否发送过站内咨询消息}
其中,访客标识不输入模型参与计算,而是用于唯一标识该访客,例如,可以是该访客在网站所注册的ID,或者是网站为其分配的访客编号等等。
以下假设网站管理系统以1小时为周期,向计算模型更新访客新型。访客1(网站为其分配的访客编号为001)首次访问网站后,在第一个更新时刻,网站管理系统向计算模型发送的该访客的信息数据为:
{001,15,1,1,0}
需要说明的是,我们所期望的模型结果是离散形式的(0和1),但是通过训练得到的计算模型,其输出一般都是非离散形式的,可能是[0,1]范围内的任意值,或者略超出该范围(视对计算模型的精度要求而定)。为解决这个问题,可以将模型所输出的数值进行标准离散化,例如以0.5为阈值,大于该阈值则认为访客有价值,小于该阈值则认为访客没有价值。
如果根据人工判断的原则,认为该访客是不具有价值的,由于计算模型是根据人工判断的结果所训练出来的,那么经判别后的模型输出值应该和人工判断的结果一致,即输出一个为小于0.5的值。
后续每间隔一小时,网站管理系统会将最新的访客信息提供给计算模型。计算模型也会根据网站管理系统所提供的信息,实时更新计算结果。假设在某一更新时刻,网站管理系统向计算模型发送的该访客的信息数据为:
{001,15,3,1,0}
可以看出,该信息可以满足上述的条件1),则计算模型会输出一个大于0.5的值,即认为该访客有价值。此时,计算模型可将结果反馈至网站管理系统,对本实施例而言,由于结果仅涉及“是”或“否”两种,因此可仅将该访客的标识反馈至网站管理系统,表示该访客有价值。如果计算结果涉及多个值,则应将具体的计算值也和访客标识一并反馈至网站管理系统。网站管理系统通过声音、屏幕视觉变化等方式提醒网站主,以便网站主对该访客采取进一步的业务行为。
本领域技术人员可以理解,网站管理系统每次可以向计算模型提供多名访客的信息,而计算模型可以根据其具体实现方式,并行或串行计算多名访客的价值。并将有认为价值的访客标识(以及计算结果)反馈至网站管理系统。
相应于上面的方法实施例,本申请实施例还提供一种网站访客价值的计算系统,参见图3所示,包括:
初始化单元310,用于初始化网站访客价值计算模型,所述计算模型为神经网络模型,以访客信息为输入,以访客价值为输出;
训练单元320,用于使用数据样本对所述计算模型进行训练,确定所述计算模型;
计算单元330,用于获得访客信息,使用所确定的计算模型,计算所述访客的价值。
其中,所述初始化的计算模型可以是以下的形式:
Y=f2(W2f1(W1X+B1)+B2)
X为输入向量;Y为输出向量;
W1为隐含层权值矩阵,B1为隐含层偏置向量,f1为隐含层传递函数;
W2为输出层权值矩阵,B2为输出层偏置向量,f2为输出层传递函数;
f1为神经元的非线性作用函数,f2为线性函数。
其中,根据业务的具体需求,作为计算模型输入/输出的访客信息和访客价值,可以是数值化的访客信息和访客价值。
所述训练单元320,可以使用误差反向传播算法对所述计算模型进行训练。当所述计算模型的样本输出值与期望输出值的误差满足精度要求时,确定所述计算模型。
以上所提供的系统,以神经网络作为网站访客价值的计算模型。通过训练可以令模型学习网站主的主动行为,从而将实际需求中访客信息和访客价值的各种复杂的对应关系纳入模型。训练完成后,通过使用该模型,即可根据访客的各种信息,自动计算出该访客的价值,由于模型是根据人工判断的结果训练出来的,因此,其计算的结果与人工判断的结果趋于一致。
参见图4所示,本申请实施例所提供的网站访客价值的计算系统,还可以进一步包括修正单元340,用于对当前所确定的计算模型进行修正,并将修正后的计算模型确定为新计算模型;
则所述计算单元330,用于使用所述修正单元340所确定的新计算模型,计算访客的价值。
其中,所述修正单元340可以包括:
相关性获得子单元,用于由当前所确定的计算模型中,获得访客信息类别与访客价值的相关性;
输入向量删除子单元,用于将相关性小于预设阈值的访客信息类别从所述当前所确定的计算模型的输入向量中删除。
应用上述系统,可以将对最终结果的影响不大的访客信息从计算模型的输入向量中删除,从而提高模型的计算性能。
所述修正单元340还可以包括:
比较子单元,用于周期性或随机地对当前所确定的计算模型的实际输出值与期望输出值进行比较;
重构子单元,用于当所述比较子单元所得到的误差大于预设阈值时,重新对所述计算模型进行训练。
应用上述系统,可以实时对网络误差进行监控,并根据监控结果对计算模型进行重构,以适应业务需求的动态变化。
本领域技术人员可以理解,修正单元340的构成方式,也可以是上述两种方式的结合。
对于系统实施例而言,由于其基本相应于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
为了描述的方便,描述以上系统时以功能分为各种单元分别描述。当然,在实施本发明时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请中的实施例可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请中的实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请中的各个实施例或者实施例的某些部分所述的方法。
以上所述仅是本发明的具体实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (18)
1、一种网站访客价值的计算方法,其特征在于,包括:
初始化网站访客价值计算模型,所述计算模型为神经网络模型,以访客信息为输入,以访客价值为输出;
使用数据样本对所述计算模型进行训练,确定所述计算模型;
获得访客信息,使用所确定的计算模型,计算所述访客的价值。
2、根据权利要求1所述的方法,其特征在于,所述初始化的计算模型为:
Y=f2(W2f1(W1X+B1)+B2)
其中,X为输入向量;Y为输出向量;
W1为隐含层权值矩阵,B1为隐含层偏置向量,f1为隐含层传递函数;
W2为输出层权值矩阵,B2为输出层偏置向量,f2为输出层传递函数。
3、根据权利要求2所述的方法,其特征在于,所述f1为神经元的非线性作用函数,所述f2为线性函数。
4、根据权利要求1所述的方法,其特征在于,所述作为计算模型输入的访客信息为数值化的访客信息,所述作为计算模型输出的访客价值为数值化的访客价值。
5、根据权利要求1所述的方法,其特征在于,所述对计算模型进行训练,包括:使用误差反向传播算法对所述计算模型进行训练。
6、根据权利要求1所述的方法,其特征在于,所述确定计算模型,包括:当所述计算模型的样本输出值与期望输出值的误差满足精度要求时,确定所述计算模型。
7、根据权利要求1所述的方法,其特征在于,在确定所述计算模型之后,进一步包括:对当前所确定的计算模型进行修正,并将修正后的计算模型确定为新计算模型;
则所述使用所确定的计算模型,计算访客的价值为:使用所确定的新计算模型,计算访客的价值。
8、根据权利要求7所述的方法,其特征在于,所述对当前所确定的计算模型进行修正,包括:
由当前所确定的计算模型中,获得访客信息类别与访客价值的相关性,将相关性小于预设阈值的访客信息类别从所述当前所确定的计算模型的输入向量中删除。
9、根据权利要求7所述的方法,其特征在于,所述对所确定的计算模型进行修正,包括:
周期性或随机地对当前所确定的计算模型的实际输出值与期望输出值进行比较,如果误差大于预设阈值,则重新对所述计算模型进行训练。
10、一种网站访客价值的计算系统,其特征在于,包括:
初始化单元,用于初始化网站访客价值计算模型,所述计算模型为神经网络模型,以访客信息为输入,以访客价值为输出;
训练单元,用于使用数据样本对所述计算模型进行训练,确定所述计算模型;
计算单元,用于获得访客信息,使用所确定的计算模型,计算所述访客的价值。
11、根据权利要求10所述的系统,其特征在于,所述初始化的计算模型为:
Y=f2(W2f1(W1X+B1)+B2)
其中,X为输入向量;Y为输出向量;
W1为隐含层权值矩阵,B1为隐含层偏置向量,f1为隐含层传递函数;
W2为输出层权值矩阵,B2为输出层偏置向量,f2为输出层传递函数。
12、根据权利要求11所述的系统,其特征在于,所述f1为神经元的非线性作用函数,所述f2为线性函数。
13、根据权利要求10所述的系统,其特征在于,所述作为计算模型输入的访客信息为数值化的访客信息,所述作为计算模型输出的访客价值为数值化的访客价值。
14、根据权利要求10所述的系统,其特征在于,所述训练单元,使用误差反向传播算法对所述计算模型进行训练。
15、根据权利要求10所述的系统,其特征在于,所述训练单元,当所述计算模型的样本输出值与期望输出值的误差满足精度要求时,确定所述计算模型。
16、根据权利要求10所述的系统,其特征在于,该系统还包括修正单元,用于对当前所确定的计算模型进行修正,并将修正后的计算模型确定为新计算模型;
则所述计算单元,用于使用所述修正单元所确定的新计算模型,计算访客的价值。
17、根据权利要求16所述的系统,其特征在于,所述修正单元,包括:
相关性获得子单元,用于由当前所确定的计算模型中,获得访客信息类别与访客价值的相关性;
输入向量删除子单元,用于将相关性小于预设阈值的访客信息类别从所述当前所确定的计算模型的输入向量中删除。
18、根据权利要求16所述的系统,其特征在于,所述修正单元,包括:
比较子单元,用于周期性或随机地对当前所确定的计算模型的实际输出值与期望输出值进行比较;
重构子单元,用于当所述比较子单元所得到的误差大于预设阈值时,重新对所述计算模型进行训练。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA2009101181037A CN101482888A (zh) | 2009-02-23 | 2009-02-23 | 一种网站访客价值的计算方法及系统 |
US12/658,767 US9436907B2 (en) | 2009-02-23 | 2010-02-12 | Method and system for calculating value of website visitor |
PCT/US2010/000490 WO2010096185A1 (en) | 2009-02-23 | 2010-02-19 | Method and system for calculating value of website visitor |
EP10744069A EP2399202A4 (en) | 2009-02-23 | 2010-02-19 | METHOD AND SYSTEM FOR CALCULATING WEBSITE VISITOR VALUE |
JP2011551066A JP5624562B2 (ja) | 2009-02-23 | 2010-02-19 | ウェブサイト訪問者の評価値を計算するための方法及びシステム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA2009101181037A CN101482888A (zh) | 2009-02-23 | 2009-02-23 | 一种网站访客价值的计算方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101482888A true CN101482888A (zh) | 2009-07-15 |
Family
ID=40879997
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2009101181037A Pending CN101482888A (zh) | 2009-02-23 | 2009-02-23 | 一种网站访客价值的计算方法及系统 |
Country Status (5)
Country | Link |
---|---|
US (1) | US9436907B2 (zh) |
EP (1) | EP2399202A4 (zh) |
JP (1) | JP5624562B2 (zh) |
CN (1) | CN101482888A (zh) |
WO (1) | WO2010096185A1 (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106485526A (zh) * | 2015-08-31 | 2017-03-08 | 阿里巴巴集团控股有限公司 | 一种数据挖掘模型的诊断方法和装置 |
CN108459997A (zh) * | 2018-02-07 | 2018-08-28 | 深圳市微埃智能科技有限公司 | 基于深度学习和神经网络的高偏态数据价值概率预测方法 |
CN110069617A (zh) * | 2017-11-09 | 2019-07-30 | 北京嘀嘀无限科技发展有限公司 | 论坛帖的管理方法、装置、服务器和计算机可读存储介质 |
CN111159501A (zh) * | 2019-11-22 | 2020-05-15 | 杭州蛋壳商务信息技术有限公司 | 一种基于多层神经网络建立判客模型的方法及判客方法 |
CN113256865A (zh) * | 2020-11-06 | 2021-08-13 | 上海兴容信息技术有限公司 | 一种智能门禁的控制方法和系统 |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6516406B2 (ja) * | 2013-12-13 | 2019-05-22 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 処理装置、処理方法、およびプログラム |
JP6399828B2 (ja) * | 2014-07-02 | 2018-10-03 | Kddi株式会社 | 画面変化量に基づいてコンピュータ利用行動を推定する装置、プログラム及び方法 |
CN104598521B (zh) * | 2014-12-12 | 2017-03-15 | 北京京东尚科信息技术有限公司 | 处理用户行为数据的方法和装置 |
US9915965B2 (en) * | 2015-03-16 | 2018-03-13 | The Florida International University Board Of Trustees | Flexible, secure energy management system |
CN110610392A (zh) * | 2018-06-14 | 2019-12-24 | 北京京东尚科信息技术有限公司 | 数据处理方法及系统、计算机系统和计算机可读存储介质 |
CN110659922B (zh) * | 2018-06-28 | 2021-01-26 | 马上消费金融股份有限公司 | 一种客户筛选方法、装置、服务器及计算机可读存储介质 |
Family Cites Families (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08339360A (ja) | 1995-06-13 | 1996-12-24 | Hitachi Ltd | ニューラルネットを応用した学習システム |
US6216119B1 (en) * | 1997-11-19 | 2001-04-10 | Netuitive, Inc. | Multi-kernel neural network concurrent learning, monitoring, and forecasting system |
WO2000016210A1 (en) | 1998-09-17 | 2000-03-23 | Nexchange Corporation | Affiliate commerce system and method |
WO2000067412A2 (en) | 1999-04-30 | 2000-11-09 | Dryken Technologies | Method and system for nonlinear state estimation |
US6393479B1 (en) | 1999-06-04 | 2002-05-21 | Webside Story, Inc. | Internet website traffic flow analysis |
US7610289B2 (en) | 2000-10-04 | 2009-10-27 | Google Inc. | System and method for monitoring and analyzing internet traffic |
US7370004B1 (en) | 1999-11-15 | 2008-05-06 | The Chase Manhattan Bank | Personalized interactive network architecture |
JP3743247B2 (ja) | 2000-02-22 | 2006-02-08 | 富士電機システムズ株式会社 | ニューラルネットワークによる予測装置 |
US20020062245A1 (en) | 2000-03-09 | 2002-05-23 | David Niu | System and method for generating real-time promotions on an electronic commerce world wide website to increase the likelihood of purchase |
US7558767B2 (en) | 2000-08-03 | 2009-07-07 | Kronos Talent Management Inc. | Development of electronic employee selection systems and methods |
AU2002224386B2 (en) | 2000-10-18 | 2007-12-13 | Johnson & Johnson Consumer Companies, Inc. | Intelligent performance-based product recommendation system |
US6912563B1 (en) | 2000-12-19 | 2005-06-28 | Digi-Net Technologies | Methods and systems for proactive on-line communications |
JP4071805B2 (ja) | 2000-12-27 | 2008-04-02 | 楽天株式会社 | 広告送信サーバ、広告送信プログラム及びユーザ検索方法 |
US20030033587A1 (en) * | 2001-09-05 | 2003-02-13 | Bruce Ferguson | System and method for on-line training of a non-linear model for use in electronic commerce |
US20030149603A1 (en) * | 2002-01-18 | 2003-08-07 | Bruce Ferguson | System and method for operating a non-linear model with missing data for use in electronic commerce |
US7069256B1 (en) | 2002-05-23 | 2006-06-27 | Oracle International Corporation | Neural network module for data mining |
JP2004086896A (ja) | 2002-08-06 | 2004-03-18 | Fuji Electric Holdings Co Ltd | 適応的予測モデル構築方法及び適応的予測モデル構築システム |
US7349827B1 (en) | 2002-09-18 | 2008-03-25 | Doubleclick Inc. | System and method for reporting website activity based on inferred attribution methodology |
US7085682B1 (en) | 2002-09-18 | 2006-08-01 | Doubleclick Inc. | System and method for analyzing website activity |
US7603373B2 (en) | 2003-03-04 | 2009-10-13 | Omniture, Inc. | Assigning value to elements contributing to business success |
US7328201B2 (en) | 2003-07-18 | 2008-02-05 | Cleverset, Inc. | System and method of using synthetic variables to generate relational Bayesian network models of internet user behaviors |
US8041602B2 (en) | 2003-10-15 | 2011-10-18 | Aol Advertising, Inc. | Systems and methods for providing a reverse frequency cap in advertisement viewing |
US20090006156A1 (en) | 2007-01-26 | 2009-01-01 | Herbert Dennis Hunt | Associating a granting matrix with an analytic platform |
US8782200B2 (en) * | 2004-09-14 | 2014-07-15 | Sitespect, Inc. | System and method for optimizing website visitor actions |
WO2007149064A1 (en) | 2005-04-05 | 2007-12-27 | Cleverset, Inc. | Method for tracking using dynamic relational bayesian networks |
US20060294199A1 (en) * | 2005-06-24 | 2006-12-28 | The Zeppo Network, Inc. | Systems and Methods for Providing A Foundational Web Platform |
US8396737B2 (en) | 2006-02-21 | 2013-03-12 | Hewlett-Packard Development Company, L.P. | Website analysis combining quantitative and qualitative data |
US8069182B2 (en) | 2006-04-24 | 2011-11-29 | Working Research, Inc. | Relevancy-based domain classification |
US20060271669A1 (en) * | 2006-07-13 | 2006-11-30 | Cubicice(Pty) Ltd | Method of collecting data regarding a plurality of web pages visited by at least one user |
US8676961B2 (en) | 2006-07-27 | 2014-03-18 | Yahoo! Inc. | System and method for web destination profiling |
US20080071630A1 (en) | 2006-09-14 | 2008-03-20 | J.J. Donahue & Company | Automatic classification of prospects |
EP2111593A2 (en) | 2007-01-26 | 2009-10-28 | Information Resources, Inc. | Analytic platform |
US20080306830A1 (en) * | 2007-06-07 | 2008-12-11 | Cliquality, Llc | System for rating quality of online visitors |
US8539359B2 (en) * | 2009-02-11 | 2013-09-17 | Jeffrey A. Rapaport | Social network driven indexing system for instantly clustering people with concurrent focus on same topic into on-topic chat rooms and/or for generating on-topic search results tailored to user preferences regarding topic |
-
2009
- 2009-02-23 CN CNA2009101181037A patent/CN101482888A/zh active Pending
-
2010
- 2010-02-12 US US12/658,767 patent/US9436907B2/en active Active
- 2010-02-19 WO PCT/US2010/000490 patent/WO2010096185A1/en active Application Filing
- 2010-02-19 EP EP10744069A patent/EP2399202A4/en not_active Ceased
- 2010-02-19 JP JP2011551066A patent/JP5624562B2/ja not_active Expired - Fee Related
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106485526A (zh) * | 2015-08-31 | 2017-03-08 | 阿里巴巴集团控股有限公司 | 一种数据挖掘模型的诊断方法和装置 |
CN110069617A (zh) * | 2017-11-09 | 2019-07-30 | 北京嘀嘀无限科技发展有限公司 | 论坛帖的管理方法、装置、服务器和计算机可读存储介质 |
CN108459997A (zh) * | 2018-02-07 | 2018-08-28 | 深圳市微埃智能科技有限公司 | 基于深度学习和神经网络的高偏态数据价值概率预测方法 |
CN111159501A (zh) * | 2019-11-22 | 2020-05-15 | 杭州蛋壳商务信息技术有限公司 | 一种基于多层神经网络建立判客模型的方法及判客方法 |
CN111159501B (zh) * | 2019-11-22 | 2023-09-22 | 杭州蛋壳商务信息技术有限公司 | 一种基于多层神经网络建立判客模型的方法及判客方法 |
CN113256865A (zh) * | 2020-11-06 | 2021-08-13 | 上海兴容信息技术有限公司 | 一种智能门禁的控制方法和系统 |
CN113256865B (zh) * | 2020-11-06 | 2023-01-06 | 上海兴容信息技术有限公司 | 一种智能门禁的控制方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
EP2399202A4 (en) | 2012-07-11 |
JP5624562B2 (ja) | 2014-11-12 |
US20100217734A1 (en) | 2010-08-26 |
WO2010096185A1 (en) | 2010-08-26 |
EP2399202A1 (en) | 2011-12-28 |
US9436907B2 (en) | 2016-09-06 |
JP2012518834A (ja) | 2012-08-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101482888A (zh) | 一种网站访客价值的计算方法及系统 | |
WO2023061087A1 (zh) | 信息推荐方法、装置、电子设备、计算机可读存储介质及计算机程序产品 | |
CN104881800B (zh) | 一种基于移动群智感知的激励机制实现方法 | |
Wang et al. | Research on the evolutionary game of environmental pollution in system dynamics model | |
US11170436B2 (en) | Credit scoring method and server | |
CN110417721A (zh) | 安全风险评估方法、装置、设备及计算机可读存储介质 | |
CN107609147B (zh) | 一种从日志流中自动提取特征的方法和系统 | |
CN108241964A (zh) | 基于bp人工神经网络模型算法的基建现场管控移动应用平台 | |
Bolsinova et al. | A test for conditional independence between response time and accuracy | |
US20170364931A1 (en) | Distributed model optimizer for content consumption | |
CN103886047A (zh) | 面向流式数据的分布式在线推荐方法 | |
CN103577876A (zh) | 基于前馈神经网络的可信与不可信用户识别方法 | |
CN114722281A (zh) | 基于用户画像及用户选课行为的培训课程配置方法、装置 | |
CN113869931A (zh) | 广告投放策略确定方法、装置、计算机设备和存储介质 | |
CN115345670A (zh) | 广告投放方法、装置、电子设备及存储介质 | |
CN117391866A (zh) | 一种数据处理方法、装置、设备及其存储介质 | |
CN102012902A (zh) | 网站访客价值评估系统及方法 | |
CN103838964A (zh) | 一种基于人工交通系统的社交关系网络生成方法及装置 | |
CN114862062B (zh) | 环境承载力的预警方法、装置、电子设备和可读存储介质 | |
Sari Rochman et al. | Method extreme learning machine for forecasting number of patients’ visits in dental poli (A case study: Community Health Centers Kamal Madura Indonesia) | |
CN109460925A (zh) | 一种基于bp神经网络的台区资产组绩效评价方法 | |
CN113763053A (zh) | 一种基于区块链的大数据电商平台用户活跃等级评估的方法 | |
Çağil et al. | An intelligent simulation model of online consumer behavior | |
Niu et al. | Study on a combined prediction method based on BP neural network and improved Verhulst model | |
CN108228833B (zh) | 一种利用用户倾向性学习解决社区项目推荐任务的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1132561 Country of ref document: HK |
|
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20090715 |
|
REG | Reference to a national code |
Ref country code: HK Ref legal event code: WD Ref document number: 1132561 Country of ref document: HK |