CN107145508B - 网站数据处理方法、装置及系统 - Google Patents

网站数据处理方法、装置及系统 Download PDF

Info

Publication number
CN107145508B
CN107145508B CN201710178265.4A CN201710178265A CN107145508B CN 107145508 B CN107145508 B CN 107145508B CN 201710178265 A CN201710178265 A CN 201710178265A CN 107145508 B CN107145508 B CN 107145508B
Authority
CN
China
Prior art keywords
website
user
activity
target
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710178265.4A
Other languages
English (en)
Other versions
CN107145508A (zh
Inventor
温明月
周欢
石宜
李廷威
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Infinite Information Technology Co ltd
Original Assignee
Guangdong Infinite Information Technology Co ltd
Guangzhou Yaola Network Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Infinite Information Technology Co ltd, Guangzhou Yaola Network Co ltd filed Critical Guangdong Infinite Information Technology Co ltd
Priority to CN201710178265.4A priority Critical patent/CN107145508B/zh
Publication of CN107145508A publication Critical patent/CN107145508A/zh
Application granted granted Critical
Publication of CN107145508B publication Critical patent/CN107145508B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking

Abstract

本发明涉及一种网站数据处理方法、装置及系统,该方法包括如下步骤:获取目标网站的用户行为数据;根据用户行为数据计算目标网站的用户价值参数和用户访问参数,并根据用户价值参数和用户访问参数进行加权求和,确定目标网站的网站价值参数;根据各个目标网站的网站价值参数对目标网站进行排序。本发明能更加客观、全面、高效地反映不同目标网站的价值,解决了现有技术中对于网站数据处理过程单一、局限性较大的技术问题,使得用户能够清晰地了解各个目标网站的状态,为网站整体估值提供参考依据,也为网站运营商强化网站建设提供了参考依据。

Description

网站数据处理方法、装置及系统
技术领域
本发明涉及网站技术领域,特别是涉及一种网站数据处理方法、装置及系统。
背景技术
网站是指在因特网上根据一定的规则,使用HTML(标准通用标记语言下的一个应用)等工具制作的用于展示特定内容相关网页的集合。简单地说,网站是一种沟通工具,用户可以通过网站来发布自己想要公开的资讯,或者利用网站来提供相关的网络服务。用户可以通过网站客户端(如网页浏览器)来访问网站,获取自己需要的资讯或者享受网络服务。
网站数据处理是网站建设中较为重要的环节,目前对于网站数据的处理方法,特别是网站分析数据(即用户行为数据),其处理过程较为单一,局限性较大,例如仅能通过网站数据处理来统计出网站流量,无法了解网站的状态,不能满足网站建设的要求。
发明内容
本发明提供一种网站数据处理方法、装置及系统,能快速处理目标网站的用户行为数据,获得各个目标网站的网站价值参数,据此了解目标网站的状态,并依据网站价值参数对目标网站进行排序,满足网站建设的要求。
本发明实施例采用以下技术方案:
一种网站数据处理方法,包括如下步骤:
获取目标网站的用户行为数据;
根据所述用户行为数据计算目标网站的用户价值参数和用户访问参数,并根据所述用户价值参数和所述用户访问参数进行加权求和,确定目标网站的网站价值参数;
根据各个目标网站的所述网站价值参数对目标网站进行排序。
一种网站数据处理装置,包括:
获取模块,用于获取目标网站的用户行为数据;
计算模块,用于根据所述用户行为数据计算目标网站的用户价值参数和用户访问参数,并根据所述用户价值参数和所述用户访问参数进行加权求和,确定目标网站的网站价值参数;
排序模块,用于根据各个目标网站的所述网站价值参数对各个目标网站进行排序。
一种网站数据处理系统,包括目标网站客户端、目标网站服务器、处理网站客户端以及处理网站服务器;
所述目标网站客户端用于采集目标网站的用户行为数据,并将所述用户行为数据发送给目标网站服务器;
所述目标网站服务器根据所述用户行为数据计算目标网站的用户价值参数和用户访问参数,并根据所述用户价值参数和所述用户访问参数进行加权求和,确定目标网站的网站价值参数,并将所述网站价值参数发送至所述处理网站服务器;
所述处理网站服务器根据所述网站价值参数对目标网站进行排序,并将目标网站的排序发送至所述处理网站客户端,以使所述处理网站客户端展示目标网站的排序。
本发明通过处理目标网站的用户行为数据,得到目标网站的用户价值参数和用户访问参数,并进一步确定目标网站的网站价值参数,然后依据网站价值参数对目标网站进行排序,这种处理方法能更加客观、全面、高效地反映不同目标网站的价值,解决了现有技术中对于网站数据处理过程单一、局限性较大的技术问题,使得用户能够清晰地了解各个目标网站的状态(例如价值排名,运营状态等等),为网站整体估值提供参考依据,也为网站运营商强化网站建设提供了参考依据。
附图说明
图1是本发明的网站数据处理方法在一个实施例中的流程示意图;
图2为本发明实施例中网站数据处理方法的另一流程示意图;
图3为本发明实施例中根据用户行为数据计算目标网站的用户价值参数的流程示意图;
图4为本发明实施例中计算目标网站各个用户的活跃度参数的流程示意图;
图5为本发明实施例中网站数据处理方法的又一流程示意图;
图6为本发明实施例中计算目标网站的用户访问参数的流程示意图;
图7为本发明的网站数据处理装置在一个实施例中的结构示意图;
图8为本发明实施例中网站数据处理装置的另一结构示意图;
图9为本发明实施例中计算模块的结构示意图;
图10为本发明实施例中计算模块的另一结构示意图;
图11为本发明的网站数据处理系统在一个实施例中的结构示意图。
具体实施方式
下面将结合较佳实施例及附图对本发明的内容作进一步详细描述。显然,下文所描述的实施例仅用于解释本发明,而非对本发明的限定。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解的是,尽管在下文中采用术语“第一”、“第二”等来描述各种信息,但这些信息不应限于这些术语,这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本发明范围的情况下,“第一”信息也可以被称为“第二”信息,类似的,“第二”信息也可以被称为“第一”信息。
另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。
图1是本发明的网站数据处理方法在一个实施例中的流程示意图,如图1所示,本实施例中的网站数据处理方法包括以下步骤:
步骤S11,获取目标网站的用户行为数据;
用户行为数据是指记录网站访问者相关行为的数据,例如访问时间、浏览器信息等。获取用户行为数据的方式有多种,可选的,对于任意一个目标网站,可在目标网站客户端安装JS(JavaScript)采集器来采集用户行为数据。由于用户行为数据是直接从客户端采集获得的,因此这种采集方式所获得的数据其精确度更高,这对进一步分析用户浏览网站行为,改善潜在的网站可用性问题提供了更大的帮助。
需要说明的是,步骤S11可以由目标网站的服务器来实施,也可以由其他的服务器来实施。
步骤S12,根据所述用户行为数据计算目标网站的用户价值参数和用户访问参数,并根据所述用户价值参数和所述用户访问参数进行加权求和,确定目标网站的网站价值参数;
用户价值参数用于反映目标网站用户的价值,而用户的价值则由其行为数据决定。用户访问参数用于反映目标网站的流量,其可通过用户行为数据来计算。网站价值参数用于衡量目标网站的价值,其与目标网站用户的价值以及目标网站的流量相关。
在本实施例中,当获得目标网站的用户行为数据之后,对其进行处理,计算得到目标网站的用户价值参数和用户访问参数,并根据用户价值参数和用户访问参数进行加权求和,确定目标网站的网站价值参数。
可选的,可通过以下表达式对用户价值参数和用户访问参数进行加权求和:
Wy=WFy*0.6+WUy*0.4 (1)
式(1)中,Wy为目标网站y的网站价值参数,WFy为目标网站y的用户访问参数,WUy为目标网站y的用户价值参数。
需要说明的是,步骤S12可以由目标网站的服务器来实施,也可以由其他服务器在获得目标网站的用户行为数据之后实施。
步骤S13,根据各个目标网站的所述网站价值参数对目标网站进行排序。
在计算出各个目标网站的网站价值参数之后,就可以按照网站价值参数对目标网站进行排序,例如按照网站价值参数由高到低的顺序进行排。
需要说明的是,步骤S13可以由任意一个目标网站的服务器在获得各个目标网站的网站价值参数之后来实施,也可以由其他的服务器在获得各个目标网站的网站价值参数来实施。
本发明实施例中提供的网站数据处理方法,通过处理目标网站的用户行为数据,得到目标网站的用户价值参数和用户访问参数,并进一步确定目标网站的网站价值参数,然后依据网站价值参数对目标网站进行排序,这种处理方法能更加客观、全面、高效地反映不同目标网站的价值,使得用户能够清晰的了解各个目标网站的价值排名,为网站整体估值提供参考依据,也为网站运营商强化网站建设提供了参考依据。
进一步的,参照图2所示,本发明实施例中的网站数据处理方法,在根据各个目标网站的网站价值参数对目标网站进行排序后,还包括:
步骤S14,按目标网站的排序生成用于在网站导航界面上展示的相应目标网站的链接。
具体的,基于本发明实施例提供的网站数据处理方法,还可以按目标网站的排序生成相应目标网站的链接,使得在网站客户端在网站导航界面上按目标网站的排序展示相应目标网站的链接,以实现网站导航功能。由于站点链接的排序与各目标网站的网站价值参数相关,而网站价值参数又与目标网站的用户价值参数和用户访问参数相关,因此本发明实施例中站点链接的排序能更加贴合用户的需求。
需要说明的是,步骤S14可以由任意一个目标网站的服务器在获得目标网站的排序后实施,也可以由其他服务器在获得目标网站的排序后实施。
可选的,参照图3所示,本发明实施例中根据用户行为数据计算目标网站的用户价值参数的过程包括如下步骤S31至步骤S34:
步骤S31,根据所述用户行为数据计算目标网站各个用户的活跃度参数、传播参数和经济参数;
其中,活跃度参数用于表征用户访问目标网站的活跃程度,活跃度参数可以从用户行为数据中的访问时长、访问频次等数据计算得到。
可选的,参照图4所示,对于任意一个目标网站y,可通过以下步骤S311至步骤S313来计算目标网站y各个用户的活跃度参数:
步骤S311,根据用户行为数据计算用户在统计区间内每日的活跃度;
其中,统计区间是可以根据实际情况来设置的,例如,设置统计区间为一个月。
可选的,用户每日的活跃度可以按以下表达式进行计算:
Figure BDA0001252916660000071
式(2)中,Hui表示用户u在第i日的活跃度;tli表示用户u在第i日的平均访问时长,单位为分钟;fi表示用户u在第i日的访问频次;dli表示用户u在第i日的平均访问深度;tmaxi表示用户u在第i日的最大访问时长,单位为分钟;dmaxi表示用户u在第i日的最大访问深度;ji表示用户u在第i日的交互度;n1至n6均为权重系数,可选的,n1=n4=n5=0.1,n2=n3=0.25,n6=0.2。
在式(2)中,
Figure BDA0001252916660000072
以及
Figure BDA0001252916660000073
表示各项指标的分值,若各项指标的分值大于1时,则取值为1进行计算。
其中交互度ji可以通过用户完成目标网站上指定交互操作的次数来计算。可选的,目标网站上的指定交互操作包括收藏操作、点击目标网站上的指定选项、在目标网站上发表评论、分享目标网站以及向目标网站发起咨询。其中指定选项可以是目标网站上设置的用于反映用户对于网站内容的喜好度的选项,例如设置在目标网站的“喜欢选项”、“点赞选项”。
可选的,交互度ji可以通过以下表示式进行计算:
ji=3*SC+1*XH+3*PL+5*FX+1*DZ+5*ZX (3)
在式(3)中,SC表示用户在第i日完成收藏操作的次数,XH表示用户在第i日点击目标网站上“喜欢选项”的次数,PL表示用户在第i日在目标网站上发表的评论数,FX表示用户在第i日分享目标网站的次数,DZ表示用户在第i日点击目标网站上“点赞选项”的次数,ZX表示用户在第i日对目标网站发起咨询的次数。
步骤S312,根据活跃度按照设定的活跃度衰减算法计算所述统计区间内每日的衰减活跃度,所述衰减活跃度为统计区间内每日的活跃度衰减至所述统计区间内最后一日后的活跃度;
由于用户的活跃度会随着时间的延长而衰减的,因此在获得用户在统计区间内每日的活跃度后,本实施例中采用设定的活跃度衰减算法进行计算,确定经衰减后的衰减活跃度。
下面对本实施例中提供一种设定的活跃度衰减算法进行描述。需要说明的是,除了本实施例中所提供的算法外,还可以采用其他衰减算法计算衰减活跃度,不能以此来限制本发明请求保护的范围。
在本实施例中,活跃度参数是按统计区间来进行计算的。假设用nowdate表示当前时间,用lastdate表示某个活跃度被计算的那一日,则某个活跃度被计算的那一日到当前时间的间隔天数为(nowdate-lastdate)。设lastdate这一日所对应的活跃度为lasthuoyue,lasthuoyue衰减至nowdate后的衰减活跃度为nowhuoyue,则有如下关系:
(1)若nowdate-lastdate>T,则:
nowhuoyue=0 (4)
(2)若nowdate-lastdate≤T,则:
Figure BDA0001252916660000081
其中,T为衰减周期,即活跃度衰减为0所需要的天数;p为衰减周期系数,若p越大,则活跃度越快衰减为0。T和p之间满足如下关系:
Figure BDA0001252916660000082
基于以上的活跃度衰减算法,对于步骤S311中计算出的用户u在统计区间内第i日的活跃度Hui,其衰减至统计区间内最后一日后的活跃度为:
Figure BDA0001252916660000091
式(7)中,N为统计区间内的总天数;Hu(i→N)表示用户u第i日的活跃度Hui衰减至统计区间内最后一日(即第N日)后的衰减活跃度;T为衰减周期,p为衰减周期系数。
步骤S313,根据所述统计区间所述每日的衰减活跃度的总和确定所述用户的活跃度参数。
在获得统计区间内每日的衰减活跃度之后,计算统计区间内衰减活跃度的总和,并以此确定活跃度参数。
可选的,活跃度参数Hu按以下表达式计算:
Figure BDA0001252916660000092
式(8)中,Hu为用户u活跃度参数,Hu(i→N)为用户u在统计区间内第i日的衰减活跃度,N为统计区间内的总天数。
传播参数用于表征用户访问目标网站后进行分享传播的程度,可以依据用户行为数据中的openid(用户唯一标识符)来确定。
可选的,可通过对用户访问目标网站后将网站内容分享至不同社交平台的次数进行加权计算来确定传播参数。
可选的,可参照以下表达式来计算传播参数:
Cu=m1*(Oid*l)+m2*(l1*RF+l2*DB+l3*QK+l4*WB+l5*WX)(9)
式(9)中,Cu为用户u的传播参数;Oid为用户u的openid的数量;RF为用户u分享至第一社交平台的次数,DB为用户u分享至第二社交平台的次数,QK为用户u分享至第三社交平台的次数,WB为用户u分享至第四社交平台的次数,WX为用户u分享至第五社交平台的次数;m1、m2为指标权重系数,l以及l1至l5也均为设定系数。
可选的,第一社交平台为人人网(http://www.renren.com/),第二社交平台为豆瓣网(http://www.douban.com/),第三社交平台为QQ空间(http://qzone.qq.com/),第四社交平台为微博(http://weibo.com/),第五社交平台为微信(http://weixin.qq.com/)。对于各项系数,l1取3,l2取5,l3取8,l4取8,l5取10,m1取0.4,l取10,m2取0.6。
较佳地,若计算得到的指标值大于100时,则指标值取100。即,若上式(9)中(Oid*l)大于100,则另(Oid*l)取值100;同理,如(l1*RF+l2*DB+l3*QK+l4*WB+l5*WX)大于100,也另其取值100。
经济参数用于表征访问目标网站的用户其自身的经济能力,可选的,用户的经济参数也可以通过分析各个目标网站的用户行为数据得到,例如,分析各个目标网站的用户行为数据,获得用户的收入、购物等信息,并以此确定用户的经济参数。
可选的,依据各个目标网站的用户行为数据,可以计算用户在每一个考察指标下的分值,并将各个考察指标的分值的总和作为用户的经济参数Ku。例如下表所示,设置7个考察指标,分别为年收入、购车、购房、理财、旅游频次、月订单数(指用户每月在购物网站上的购物订单数)以及月订单额(指用户每月在购物网站上的购物订单总金额),然后针对用户u在每个考察指标下的实际情况评价其分值,并计算这7个考察指标所得分值的综合,以此作为用户的经济参数Ku
Figure BDA0001252916660000111
步骤S32,分别对各个用户的所述活跃度参数、所述传播参数以及所述经济参数进行加权求和计算,获得各个用户的价值参数;
在获得目标网站各个用户的活跃度参数、传播参数以及经济参数后,通过加权求和计算确定各个用户的价值参数。可选的,按照以下表达式来计算各个用户的价值参数:
Vu=g1*Hu+g2*Cu+g3*Ku (10)
式(10)中,Vu为用户u的价值参数,Hu为用户u的活跃度参数,Cu为用户u的传播参数,Ku为用户u的经济参数;g1至g3均为权重系数。较佳地,g1取0.7,g2取0.2,g3取0.1。
获得目标网站各个用户的价值参数之后,可以依据价值参数的分布来监测网站运营的发展趋势,以便于及时调整运营策略,并能及时发现网站运营中的异常状况。
步骤S33,按照价值参数的大小顺序,从所有用户的价值参数中选取设定比例的用户的价值参数进行求和运算,获得目标网站的用户价值参数。
在获得目标网站所有用户的价值参数之后,从中选取部分用户的价值参数进行求和运算,以确定目标网站的用户价值参数WUy
在本发明实施例中,提供一种选取价值参数的原则:按照用户的价值参数由大到小的顺序,选取靠前的一定数量的价值参数,其中一定数量由目标网站的用户总数量和设定比例确定。若设定比例为θ,目标网站y的用户总数量为M,则所述的一定数量为M*θ,因此选取价值参数排序中靠前的M*θ个价值参数进行求和计算,并以此确定目标网站y的用户价值参数WUy
可选的,参照图5所示,在获得各个用户的价值参数之后,还包括:
步骤S34,从目标网站的所有用户中筛选出价值参数大于阈值的目标用户;
在本发明实施例中,依据用户的价值参数可以筛选出高质用户作。具体的,针对于用户的价值参数Vu,设置阈值V,若目标网站的某个用户的价值参数大于阈值V,则判定该用户为目标用户。
步骤S35,向所述目标用户发送回访信息。
筛选出目标网站的目标用户之后,向目标用户发送回访信息。所述回访信息可以是通过任何形式向用户发送的信息,例如向用户发送的电子邮件、短消息、MSN等等。通过这种方法,可以帮助客服人员快速锁定强需求用户,为销售过程提供决策支持,也可以通过回访信息获得用户对于网站的意见,为网站运营商强化建设网站提供参数数据。
可选的,参照图6所示,目标网站的用户访问参数可通过以下步骤进行计算:
步骤S61,根据用户行为数据计算PV浏览量、UV访客数以及平均浏览时间;
PV(Page View)浏览量即页面浏览量或点击量,用户对网站中的每个网页的访问均被记录一次。用户对同一页面多次访问时,PV浏览量将累计。UV(Unique Visitor)访客数即独立访客数,访问网站的一台客户端为一个访客,且一天内相同的客户端多次访问将只被计算一次。平均浏览时间是指浏览网站的时间与访问频度的比值,其中访问频度是指同一个访客在一天内访问网站的次数。PV浏览量、UV访客数以及平均浏览时间均可以通过用户行为数据计算得到。
步骤S62,按照以下条件式计算所述用户访问参数:
WFy=a*PV+b*UV+c*(UV+PV)*(TL/d) (11)
其中,WFy为目标网站y的用户访问参数;PV为所述PV浏览量;UV为所述UV访客数;TL为所述平均浏览时间,其单位为分钟;a、b、c、d均为设定系数;若(TL/d)大于1,则将(TL/d)取值为1。
需要说明的是,对于前述的各方法实施例,为了简便描述,将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其它顺序或者同时进行。
根据上述本发明的网站数据处理方法,本发明还提供一种网站数据处理装置,下面结合附图及较佳实施例对本发明的网站数据处理装置进行详细说明。
图7为本发明的网站数据处理装置在一个实施例中的结构示意图。如图7所示,该实施例中的网站数据处理装置包括:
获取模块1,用于获取目标网站的用户行为数据;
计算模块2,用于根据所述用户行为数据计算目标网站的用户价值参数和用户访问参数,并根据所述用户价值参数和所述用户访问参数进行加权求和,确定目标网站的网站价值参数;
排序模块3,用于根据各个目标网站的所述网站价值参数对各个目标网站进行排序。
获取模块1获取用户行为数据的方式有多种,可选的,对于任意一个目标网站,可在目标网站客户端安装JS(JavaScript)采集器来采集用户行为数据。获取模块11接收各个JS采集器所采集的用户行为数据。
当获取模块1获得目标网站的用户行为数据之后,计算模块2对用户行为数据进行处理,计算得到目标网站的用户价值参数和用户访问参数,并根据用户价值参数和用户访问参数进行加权求和,确定目标网站的网站价值参数,并输出至排序模块3。排序模块3获得各个目标网站的网站价值参数之后,就可以按照网站价值参数对目标网站进行排序,例如按照网站价值参数由高到低的顺序进行排。
进一步的,参照图8所示,本发明实施例中的网站数据处理装置,还包括:
导航模块4,用于按目标网站的排序生成用于在网站导航界面上展示的相应目标网站的链接。。
可选的,参照图9所示,计算模块2包括:
第一子参数计算模块21,用于根据所述用户行为数据计算目标网站各个用户的活跃度参数、传播参数和经济参数;
加权计算模块22,用于分别对目标网站各个用户的所述活跃度参数、所述传播参数以及所述经济参数进行加权求和计算,获得各个用户的价值参数;
用户价值参数计算模块23,按照所述价值参数的大小顺序,从目标网站所有用户的所述价值参数中选取设定比例的用户的价值参数进行求和运算,获得目标网站的用户价值参数。
可选的,参照图8所示,本实施例的网站数据处理装置还包括:
网站目标用户筛选模块5,用于从目标网站的所有用户中筛选出价值参数大于阈值的目标用户;
回访模块6,用于向所述目标用户发送回访信息。
可选的,参照图10所示,计算模块2包括:
第二子参数计算模块24,用于根据所述用户行为数据计算PV浏览量、UV访客数以及平均浏览时间;
用户访问参数计算模块25,用于按照以下条件式计算所述用户访问参数:
WFy=a*PV+b*UV+c*(UV+PV)*(TL/d)
其中,WFy为目标网站y的用户访问参数;PV为所述PV浏览量;UV为所述UV访客数;TL为所述平均浏览时间,其单位为分钟;a、b、c、d均为设定系数;若(TL/d)大于1,则将(TL/d)取值为1。
仍参照图9所示,可选的,第一子参数计算模块21包括:
日活跃度计算模块211,用于根据所述用户行为数据计算用户在统计区间内每日的活跃度;
衰减活跃度计算模块212,用于根据所述活跃度按照设定的活跃度衰减算法计算所述统计区间内每日的衰减活跃度,所述衰减活跃度为统计区间内每日的活跃度衰减至所述统计区间内最后一日后的活跃度;
活跃度参数计算模块213,用于根据所述统计区间所述每日的衰减活跃度的总和确定所述用户的活跃度参数。
上述网站数据处理装置可执行本发明实施例所提供的网站数据处理方法,具备执行方法相应的功能模块和有益效果,至于其中各个功能模块实现其功能的具体方法,可参照上述方法实施例部分的描述,此处不再赘述。
本发明实施还提供一种网站数据处理系统,参照图11所示,该系统包括目标网站客户端600a、目标网站服务器600b、处理网站客户端800a以及处理网站服务器800b。其中,目标网站客户端600a及其对应的目标网站服务器600b可以是多个。
目标网站客户端600a采集目标网站的用户行为数据,并将用户行为数据发送给目标网站服务器600b;目标网站服务器600b根据用户行为数据计算目标网站的用户价值参数和用户访问参数,并根据用户价值参数和用户访问参数进行加权求和,确定目标网站的网站价值参数,并将目标网站的网站价值参数发送至处理网站服务器800b。
处理网站服务器800b可以接收各个目标网站服务器600b发送的网站价值参数。处理网站服务器800b根据网站价值参数对目标网站进行排序,并将目标网站的排序发送至处理网站客户端800a,以使处理网站客户端800a展示目标网站的排序。
本实施例中的网站数据处理系统通过处理目标网站的用户行为数据,得到目标网站的用户价值参数和用户访问参数,并进一步确定目标网站的网站价值参数,然后依据网站价值参数对目标网站进行排序,这种处理方式能更加客观、全面、高效地反映不同目标网站的价值,使得用户能够清晰的了解各个目标网站的价值排名,为网站整体估值提供参考依据,也为网站运营商强化网站建设提供了参考依据。本实施例中的网站数据处理系统可执行本发明的网站数据处理方法,其中目标网站客户端600a采集目标网站用户行为数据的过程、目标网站服务器600b根据用户行为数据计算出目标网站的网站价值参数的过程以及处理网站服务器800b根据网站价值参数对目标网站进行排序的过程,均可以参照上述网站数据处理方法实施例中的描述,此处不再予以赘述。
进一步的,仍参照图11所示,本实施例的网站数据处理系统还包括导航网站客户端900a和导航网站服务器900b。
导航网站服务器900b用于接收处理网站服务器800b发送的目标网站的排序,并按目标网站的排序生成用于在网站导航界面上展示的相应目标网站的链接,且将相应目标网站的链接发送至导航网站客户端900a,导航网站客户端900a展示相应目标网站的链接。
对于导航网站服务器900b生成相应目标网站的链接的过程以及导航网站客户端900a展示相应目标网站的链接的过程,均可以参照上述网站数据处理方法实施例中的描述,此处不再予以赘述。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种网站数据处理方法,其特征在于,包括如下步骤:
获取目标网站的用户行为数据;
根据所述用户行为数据计算目标网站的用户价值参数和用户访问参数,并根据所述用户价值参数和所述用户访问参数进行加权求和,确定目标网站的网站价值参数;
根据各个目标网站的所述网站价值参数对目标网站进行排序;
根据所述用户行为数据计算目标网站的用户价值参数的过程包括如下步骤:
根据所述用户行为数据计算目标网站各个用户的活跃度参数、传播参数和经济参数;
分别对目标网站各个用户的所述活跃度参数、所述传播参数以及所述经济参数进行加权求和计算,获得各个用户的价值参数;
按照所述价值参数的大小顺序,从目标网站所有用户的所述价值参数中选取设定比例的用户的价值参数进行求和运算,获得目标网站的用户价值参数;
其中,根据所述用户行为数据计算目标网站各个用户的活跃度参数的过程包括:
根据所述用户行为数据计算用户在统计区间内每日的活跃度;
根据所述活跃度按照设定的活跃度衰减算法计算所述统计区间内每日的衰减活跃度,所述衰减活跃度为统计区间内每日的活跃度衰减至所述统计区间内最后一日后的活跃度,所述衰减活跃度按照如下表达式进行计算:
Figure FDA0002379075970000011
上式中,N为统计区间内的总天数;Hui表示用户u在统计区间内第i日的活跃度,Hu(i→N)表示用户u第i日的活跃度Hui衰减至统计区间内最后一日后的衰减活跃度;T为衰减周期,p为衰减周期系数,且
Figure FDA0002379075970000021
根据所述统计区间所述每日的衰减活跃度的总和确定所述用户的活跃度参数。
2.根据权利要求1所述的网站数据处理方法,其特征在于,还包括:
按目标网站的排序生成用于在网站导航界面上展示的相应目标网站的链接。
3.根据权利要求1所述的网站数据处理方法,其特征在于,在获得各个用户的价值参数之后,还包括:
从目标网站的所有用户中筛选出价值参数大于阈值的目标用户;
向所述目标用户发送回访信息。
4.根据权利要求1或2所述的网站数据处理方法,其特征在于,根据所述用户行为数据计算目标网站的用户访问参数的过程包括如下步骤:
根据所述用户行为数据计算PV浏览量、UV访客数以及平均浏览时间;
按照以下条件式计算所述用户访问参数:
WFy=a*PV+b*UV+c*(UV+PV)*(TL/d)
其中,WFy为目标网站y的用户访问参数;PV为所述PV浏览量;UV为所述UV访客数;TL为所述平均浏览时间,其单位为分钟;a、b、c、d均为设定系数;若(TL/d)大于1,则将(TL/d)取值为1。
5.根据权利要求1所述的网站数据处理方法,其特征在于,
按照如下表达式计算用户在统计区间内每日的活跃度:
Figure FDA0002379075970000022
上式中,Hui表示用户u在统计区间内第i日的活跃度;tli表示用户u在第i 日的平均访问时长,单位为分钟;fi表示用户u在第i日的访问频次;dli表示用户u在第i日的平均访问深度;tmaxi表示用户u在第i日的最大访问时长,单位为分钟;dmaxi表示用户u在第i日的最大访问深度;ji表示用户u在第i日的交互度;n1至n6均为权重系数;
Figure FDA0002379075970000031
以及
Figure FDA0002379075970000032
表示各项指标的分值,若各项指标的分值大于1,则取值为1进行计算。
6.一种网站数据处理装置,其特征在于,包括:
获取模块,用于获取目标网站的用户行为数据;
计算模块,用于根据所述用户行为数据计算目标网站的用户价值参数和用户访问参数,并根据所述用户价值参数和所述用户访问参数进行加权求和,确定目标网站的网站价值参数;
排序模块,用于根据各个目标网站的所述网站价值参数对各个目标网站进行排序;
所述计算模块包括:
第一子参数计算模块,用于根据所述用户行为数据计算目标网站各个用户的活跃度参数、传播参数和经济参数;
加权计算模块,用于分别对目标网站各个用户的所述活跃度参数、所述传播参数以及所述经济参数进行加权求和计算,获得各个用户的价值参数;
用户价值参数计算模块,用于按照所述价值参数的大小顺序,从目标网站所有用户的所述价值参数中选取设定比例的用户的价值参数进行求和运算,获得目标网站的用户价值参数;
所述第一子参数计算模块包括:
日活跃度计算模块,用于根据所述用户行为数据计算用户在统计区间内每日的活跃度;
衰减活跃度计算模块,用于根据所述活跃度按照设定的活跃度衰减算法计算所述统计区间内每日的衰减活跃度,所述衰减活跃度为统计区间内每日的活跃度衰减至所述统计区间内最后一日后的活跃度;所述衰减活跃度按照如下表达式进行计算:
Figure FDA0002379075970000041
上式中,N为统计区间内的总天数;Hui表示用户u在统计区间内第i日的活跃度,Hu(i→N)表示用户u第i日的活跃度Hui衰减至统计区间内最后一日后的衰减活跃度;T为衰减周期,p为衰减周期系数,且
Figure FDA0002379075970000042
活跃度参数计算模块,用于根据所述统计区间所述每日的衰减活跃度的总和确定所述用户的活跃度参数。
7.根据权利要求6所述的网站数据处理装置,其特征在于,还包括:
导航模块,用于按目标网站的排序生成用于在网站导航界面上展示的相应目标网站的链接。
8.一种网站数据处理系统,其特征在于,包括目标网站客户端、目标网站服务器、处理网站客户端以及处理网站服务器;
所述目标网站客户端用于采集目标网站的用户行为数据,并将所述用户行为数据发送给目标网站服务器;
所述目标网站服务器根据所述用户行为数据计算目标网站的用户价值参数和用户访问参数,并根据所述用户价值参数和所述用户访问参数进行加权求和,确定目标网站的网站价值参数,并将所述网站价值参数发送至所述处理网站服务器;其中,根据所述用户行为数据计算目标网站的用户价值参数的过程包括如下步骤:根据所述用户行为数据计算目标网站各个用户的活跃度参数、传播参数和经济参数;分别对目标网站各个用户的所述活跃度参数、所述传播参数以及所述经济参数进行加权求和计算,获得各个用户的价值参数;按照所述价值参数的大小顺序,从目标网站所有用户的所述价值参数中选取设定比例的用户的价值参数进行求和运算,获得目标网站的用户价值参数;
其中,根据所述用户行为数据计算目标网站各个用户的活跃度参数的过程包括:
根据所述用户行为数据计算用户在统计区间内每日的活跃度;
根据所述活跃度按照设定的活跃度衰减算法计算所述统计区间内每日的衰减活跃度,所述衰减活跃度为统计区间内每日的活跃度衰减至所述统计区间内最后一日后的活跃度,所述衰减活跃度按照如下表达式进行计算:
Figure FDA0002379075970000051
上式中,N为统计区间内的总天数;Hui表示用户u在统计区间内第i日的活跃度,Hu(i→N)表示用户u第i日的活跃度Hui衰减至统计区间内最后一日后的衰减活跃度;T为衰减周期,p为衰减周期系数,且
Figure FDA0002379075970000052
根据所述统计区间所述每日的衰减活跃度的总和确定所述用户的活跃度参数;
所述处理网站服务器根据所述网站价值参数对目标网站进行排序,并将目标网站的排序发送至所述处理网站客户端,以使所述处理网站客户端展示目标网站的排序。
9.根据权利要求8所述的网站数据处理系统,其特征在于,还包括导航网站客户端和导航网站服务器;
所述导航网站服务器用于接收所述处理网站服务器发送的目标网站的排序,并按目标网站的排序生成用于在网站导航界面上展示的相应目标网站的链接,且将所述相应目标网站的链接发送至所述导航网站客户端,所述导航网站客户端展示所述相应目标网站的链接。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的方法的步骤。
CN201710178265.4A 2017-03-23 2017-03-23 网站数据处理方法、装置及系统 Active CN107145508B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710178265.4A CN107145508B (zh) 2017-03-23 2017-03-23 网站数据处理方法、装置及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710178265.4A CN107145508B (zh) 2017-03-23 2017-03-23 网站数据处理方法、装置及系统

Publications (2)

Publication Number Publication Date
CN107145508A CN107145508A (zh) 2017-09-08
CN107145508B true CN107145508B (zh) 2020-06-05

Family

ID=59783553

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710178265.4A Active CN107145508B (zh) 2017-03-23 2017-03-23 网站数据处理方法、装置及系统

Country Status (1)

Country Link
CN (1) CN107145508B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107704997A (zh) * 2017-09-12 2018-02-16 广东万丈金数信息技术股份有限公司 评估客户端活跃度的方法、装置及存储介质
CN110020206B (zh) * 2019-04-12 2021-10-15 北京搜狗科技发展有限公司 一种搜索结果排序方法及装置
CN111563769B (zh) * 2020-04-26 2024-01-26 北京深演智能科技股份有限公司 数据处理方法、装置、非易失性存储介质和处理器

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102394798A (zh) * 2011-11-16 2012-03-28 北京交通大学 一种基于多元特征的微博信息传播行为预测方法及系统
CN102567477A (zh) * 2011-06-16 2012-07-11 北京亿赞普网络技术有限公司 网站价值评估方法及装置
CN102811177A (zh) * 2011-06-03 2012-12-05 腾讯科技(深圳)有限公司 网络信息的分享方法及系统
CN103049497A (zh) * 2012-12-07 2013-04-17 北京奇虎科技有限公司 用于网址导航的方法和装置
CN103209342A (zh) * 2013-04-01 2013-07-17 电子科技大学 一种引入视频流行度和用户兴趣变化的协作过滤推荐方法
CN103294668A (zh) * 2012-02-15 2013-09-11 侯圣勇 多元化指标决定网址排序的方法
CN105430100A (zh) * 2015-12-23 2016-03-23 北京奇虎科技有限公司 一种用户价值的评估方法、装置及其应用方法和系统
CN105989004A (zh) * 2015-01-27 2016-10-05 阿里巴巴集团控股有限公司 一种信息投放的预处理方法和装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102811177A (zh) * 2011-06-03 2012-12-05 腾讯科技(深圳)有限公司 网络信息的分享方法及系统
CN102567477A (zh) * 2011-06-16 2012-07-11 北京亿赞普网络技术有限公司 网站价值评估方法及装置
CN102394798A (zh) * 2011-11-16 2012-03-28 北京交通大学 一种基于多元特征的微博信息传播行为预测方法及系统
CN103294668A (zh) * 2012-02-15 2013-09-11 侯圣勇 多元化指标决定网址排序的方法
CN103049497A (zh) * 2012-12-07 2013-04-17 北京奇虎科技有限公司 用于网址导航的方法和装置
CN103209342A (zh) * 2013-04-01 2013-07-17 电子科技大学 一种引入视频流行度和用户兴趣变化的协作过滤推荐方法
CN105989004A (zh) * 2015-01-27 2016-10-05 阿里巴巴集团控股有限公司 一种信息投放的预处理方法和装置
CN105430100A (zh) * 2015-12-23 2016-03-23 北京奇虎科技有限公司 一种用户价值的评估方法、装置及其应用方法和系统

Also Published As

Publication number Publication date
CN107145508A (zh) 2017-09-08

Similar Documents

Publication Publication Date Title
US8954580B2 (en) Hybrid internet traffic measurement using site-centric and panel data
EP3893154A1 (en) Recommendation model training method and related apparatus
KR101681250B1 (ko) 온라인 소셜 네트워크 내 네트워크-인지 제품 시판
US8090679B2 (en) Method for measuring web site performance
CN108288179B (zh) 一种用户偏好房源计算方法和系统
US8682904B1 (en) System of intuitive sorting of a table based on a column containing fractions
CN109857935B (zh) 一种信息推荐方法及装置
US9900395B2 (en) Dynamic normalization of internet traffic
US8893012B1 (en) Visual indicator based on relative rating of content item
Collister et al. Distribution of red and blue galaxies in groups: an empirical test of the halo model
EP3115957A1 (en) System and method for identifying reviewers with incentives
CN107145508B (zh) 网站数据处理方法、装置及系统
US9866454B2 (en) Generating anonymous data from web data
WO2013112312A2 (en) Hybrid internet traffic measurement usint site-centric and panel data
US20100179927A1 (en) Rating risk of proposed system changes
US9524511B2 (en) Method and a system for analysing traffic on a website by means of path analysis
CN109891839A (zh) 用于节流传入网络流量请求的系统和方法
CN114245185A (zh) 视频推荐方法、模型训练方法、装置、电子设备及介质
CN116701772B (zh) 数据推荐方法和装置、计算机可读存储介质、电子设备
CN110533454B (zh) 一种识别业务对象群体的方法及系统
Frhan Website clickstream data visualization using improved Markov chain modelling in apache flume
Ulichev et al. Computer modeling of dissemination of informational influences in social networks with different strategies of information distributors
JP4962950B2 (ja) ネットワーク上のユーザに対するレコメンデーションの方法、レコメンデーションサーバ及びプログラム
JP6467694B1 (ja) 検索語の評価装置、評価システム、評価方法、及び評価モジュール生産方法
CN109413459A (zh) 一种直播平台中用户的推荐方法以及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 510665 room 906, floor 9, No. 20, Keyun Road, Tianhe District, Guangzhou City, Guangdong Province

Patentee after: Guangzhou Youla Network Technology Co.,Ltd.

Patentee after: GUANGDONG INFINITE INFORMATION TECHNOLOGY Co.,Ltd.

Address before: 510665 room 906, floor 9, No. 20, Keyun Road, Tianhe District, Guangzhou City, Guangdong Province

Patentee before: GUANGZHOU YAOLA NETWORK CO.,LTD.

Patentee before: GUANGDONG INFINITE INFORMATION TECHNOLOGY Co.,Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20230727

Address after: 510000 room 901, floor 9, No. 20, Keyun Road, Tianhe District, Guangzhou City, Guangdong Province (office use only)

Patentee after: GUANGDONG INFINITE INFORMATION TECHNOLOGY Co.,Ltd.

Address before: 510665 room 906, floor 9, No. 20, Keyun Road, Tianhe District, Guangzhou City, Guangdong Province

Patentee before: Guangzhou Youla Network Technology Co.,Ltd.

Patentee before: GUANGDONG INFINITE INFORMATION TECHNOLOGY Co.,Ltd.