CN104408119A - 网页的数据处理方法和装置 - Google Patents

网页的数据处理方法和装置 Download PDF

Info

Publication number
CN104408119A
CN104408119A CN201410692546.8A CN201410692546A CN104408119A CN 104408119 A CN104408119 A CN 104408119A CN 201410692546 A CN201410692546 A CN 201410692546A CN 104408119 A CN104408119 A CN 104408119A
Authority
CN
China
Prior art keywords
factor
changed
orthogonal
significant difference
webpage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410692546.8A
Other languages
English (en)
Other versions
CN104408119B (zh
Inventor
钦滨杰
李梦溪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gridsum Technology Co Ltd
Original Assignee
Beijing Gridsum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gridsum Technology Co Ltd filed Critical Beijing Gridsum Technology Co Ltd
Priority to CN201410692546.8A priority Critical patent/CN104408119B/zh
Publication of CN104408119A publication Critical patent/CN104408119A/zh
Application granted granted Critical
Publication of CN104408119B publication Critical patent/CN104408119B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/3668Software testing
    • G06F11/3672Test management
    • G06F11/3688Test management for test execution, e.g. scheduling of test suites
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种网页的数据处理方法和装置。其中,该网页的数据处理方法包括:接收根据待改变因素的个数和每个待改变因素的水平数选择的正交表;按照选择的正交表确定的待改变因素的组合方案来对待改变因素的组合进行试验,并记录试验结果数据,其中,组合方案包括每个待改变因素的一个水平;对试验结果数据进行正交计算,得到正交结果数据;以及根据正交结果数据从组合方案中选择一种方案对网页进行优化。通过本发明,解决了对网页进行优化时的效率比较低的问题,从而达到了提高对网页进行优化时的效率的效果。

Description

网页的数据处理方法和装置
技术领域
本发明涉及互联网领域,具体而言,涉及一种网页的数据处理方法和装置。
背景技术
随着互联网的发展,越来越多的公司开始关注自己的网站设计。网站设计直接关系到网站用户的使用体验,进而影响网页上所展示的产品的销售。网页是否要进行改版,或者改版之后是否有较好的效果,需要现有的网站的用户浏览、产品销售等数据来说明。通常,改变同一页面不同位置的不同元素的组合能够带来不同程度的效果的改变,网页的所有者希望能找到的多个元素的最佳组合,使得网站能够达到最佳效果。
现有的多变量测试技术为固定一种元素作为测试变量,使其他元素全部作为非测试变量,非测试变量保持不变,逐个将每种元素作为测试变量得到多个测试结果。通过比较多个测试结果确定包括哪些元素的组合能够使网页获得最佳效果。对单一变量进行测试时,采用这种方法是比较方便,但是对于多变量测试,尤其是当每个变量都有多个不同元素时,这种测试方法就会变得极其复杂,需要很多组测试才能将多个变量的组合测试完。比如,如果有4个位置发生变化,每个位置有3个变化元素,那么一共有3*3*3*3=81种测试可能,也就是需要进行81次测试,这必然会提高对运算能力的要求,同时也会对网站的流量要求很大,造成了网页优化时的效率比较低。
针对现有技术中对网页进行优化时的效率比较低的问题,目前尚未提出有效的解决方案。
发明内容
本发明的主要目的在于提供一种网页的数据处理方法和装置,以解决现有技术中对网页进行优化时的效率比较低的问题。
为了实现上述目的,根据本发明的一个方面,提供了一种网页的数据处理方法。根据本发明的网页的数据处理方法包括:接收根据待改变因素的个数和每个所述待改变因素的水平数选择的正交表;按照所述选择的正交表确定的所述待改变因素的组合方案来对所述待改变因素的组合进行试验,并记录试验结果数据,其中,所述组合方案包括每个所述待改变因素的一个水平;对所述试验结果数据进行正交计算,得到正交结果数据;以及根据所述正交结果数据从所述组合方案中选择一种方案对所述网页进行优化。
进一步地,根据所述正交结果数据从所述组合方案中选择一种方案对所述网页进行优化包括:判断所述正交结果数据是否指示所述待改变因素的水平满足显著性差异;如果所述正交结果数据指示所述待改变因素的水平满足所述显著性差异,从所述组合方案中选择所述待改变因素的水平中满足所述显著性差异的水平组成的优化性能最好的方案对所述网页进行优化;以及如果所述正交结果数据指示所述待改变因素的水平不满足所述显著性差异,则不对所述网页进行优化。
进一步地,判断所述正交结果数据的水平是否指示所述待改变因素满足显著性差异包括:对所述正交结果数据进行方差计算,得到方差;根据所述方差计算所述试验结果数据的显著性差异;判断所述显著性差异是否大于临界值;如果所述显著性差异大于所述临界值,则所述正交结果数据满足所述显著性差异;如果所述显著性差异小于等于所述临界值,则所述正交结果数据不满足所述显著性差异。
进一步地,按照所述选择的正交表确定的所述待改变因素的组合方案来对所述待改变因素的组合进行试验,并记录试验结果数据包括:接收所述试验所表征的指标;收集所述试验结果数据中与所述指标对应的数据;从所述组合方案中选择一种方案对所述网页进行优化包括:比较所述指标对应的数据,得到最大数值;将所述最大数值对应的组合方案作为对所述网页进行优化的方案。
进一步地,根据待改变因素的个数和每个所述待改变因素的水平数选择的正交表包括:获取待改变的因素的个数和每个所述待改变因素的水平数;比较所述待改变的因素的个数与待选择的正交表的因素的个数的大小,比较待改变因素的水平数与所述待选择的正交表的因素的水平数的大小;选择所述待选择的正交表的因素的个数大于等于所述待改变的因素的个数,且所述待选择的正交表的水平个数大于等于所述待改变因素的水平数的待选择正交表,得到第一正交表;以及计算所述第一正交表中所指示的试验的次数;从所述第一正交表中选择所述试验的次数最少的正交表作为选择的正交表。
为了实现上述目的,根据本发明的另一方面,提供了一种网页的数据处理装置。根据本发明的网页的数据处理装置包括:接收单元,用于接收根据待改变因素的个数和每个所述待改变因素的水平数选择的正交表;试验单元,按照所述选择的正交表确定的所述待改变因素的组合方案来对所述待改变因素的组合进行试验,并记录试验结果数据,其中,所述组合方案包括每个所述待改变因素的一个水平;正交单元,用于对所述试验结果数据进行正交计算,得到正交结果数据;以及选择单元,用于根据所述正交结果数据从所述组合方案中选择一种方案对所述网页进行优化。
进一步地,所述选择单元包括:判断模块,用于判断所述正交结果数据是否指示所述待改变因素的水平满足显著性差异;优化模块,用于在所述正交结果数据指示所述待改变因素的水平满足所述显著性差异时,从所述组合方案中选择所述待改变因素的水平中满足所述显著性差异的水平组成的优化性能最好的方案对所述网页进行优化;以及在所述正交结果数据指示所述待改变因素的水平不满足所述显著性差异时,不对所述网页进行优化。
进一步地,所述判断模块包括:第一计算子模块,用于对所述正交结果数据进行方差计算,得到方差;第二计算子模块,用于根据所述方差计算所述试验结果数据的显著性差异;判断子模块,用于判断所述显著性差异是否大于临界值;确定子模块,用于在所述显著性差异大于所述临界值时,所述正交结果数据满足所述显著性差异;在所述显著性差异小于等于所述临界值时,所述正交结果数据不满足所述显著性差异。
进一步地,所述试验单元包括:接收模块,用于接收所述试验所表征的指标;收集模块,用于收集所述试验结果数据中与所述指标对应的数据;所述选择单元包括:第一比较模块,用于比较所述指标对应的数据,得到最大数值;第一确定模块,用于将所述最大数值对应的组合方案作为对所述网页进行优化的方案。
进一步地,所述接收单元包括:获取模块,用于获取待改变的因素的个数和每个所述待改变因素的水平数;第二比较模块,用于比较所述待改变的因素的个数与待选择的正交表的因素的个数的大小,比较待改变因素的水平数与所述待选择的正交表的因素的水平数的大小;选择模块,用于选择所述待选择的正交表的因素的个数大于等于所述待改变的因素的个数,且所述待选择的正交表的水平个数大于等于所述待改变因素的水平数的待选择正交表,得到第一正交表;以及计算模块,用于计算所述第一正交表中所指示的试验的次数;第二确定模块,用于从所述第一正交表中选择所述试验的次数最少的正交表作为选择的正交表。
通过本发明,采用接收根据待改变因素的个数和每个待改变因素的水平数选择的正交表;按照选择的正交表确定的待改变因素的组合方案来对待改变因素的组合进行试验,并记录试验结果数据,其中,组合方案包括每个待改变因素的一个水平;对试验结果数据进行正交计算,得到正交结果数据;以及根据正交结果数据从组合方案中选择一种方案对网页进行优化的方法,根据待改变因素的个数和每个待改变因素的水平数选择正交表,再根据选择的正交表确定试验的次数,减少了试验次数,然后利用正交计算的结果从多个组合方案中选择一种方案对网页进行优化,降低了选择组合方案的复杂度,解决了对网页进行优化时的效率比较低的问题,从而达到了提高对网页进行优化时的效率的效果。
附图说明
构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的网页的数据处理方法的流程图;以及
图2是根据本发明实施例的网页的数据处理装置的示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例提供了一种网页的数据处理方法。图1是根据本发明实施例的网页的数据处理方法的流程图。如图所示,该网页的数据处理方法包括如下步骤:
步骤S102,接收根据待改变因素的个数和每个待改变因素的水平数选择的正交表。
待改变因素为网页中需要进行改变的部分,待改变因素的水平为网页中需要改变部分的可采用的改变方案,例如,待改变因素为A、B、C,待改变因素A的水平为A1、A2、A3,待改变因素B的水平为B1、B2、B3,待改变因素C的水平为C1、C2、C3。在选择正交表时可以采用三因素三水平的正交表,通过判断因素与水平的个数来选择正交表。
具体地,根据待改变因素的个数和每个待改变因素的水平数选择正交表包括:获取待改变的因素的个数和每个待改变因素的水平数。比较待改变的因素的个数与待选择的正交表的因素的个数的大小,比较待改变因素的水平数与待选择的正交表的因素的水平数的大小。以及选择待选择的正交表的因素的个数大于等于待改变的因素的个数,且待选择的正交表的水平个数大于等于待改变因素的水平数的待选择正交表作为选择的正交表。计算第一正交表中所指示的试验的次数。从第一正交表中选择试验的次数最少的正交表作为选择的正交表。
正交表的形式具有多种,但是每种正交表所需要的试验次数不同,在选择正交表时,选择能够满足待改变因素的个数和每个待改变因素的水平数的正交表,并且选择的正交表所指示的试验次数应该是所有正交表中的最少的,利用这样的正交表进行计算不仅可以使试验次数最少,还能达到正交计算的目的。即选择的正交表的因素的个数大于等于待改变因素的个数,选择的正交表的水平的个数大于等于待改变因素的水平数。
步骤S104,按照选择的正交表确定的待改变因素的组合方案来对待改变因素的组合进行试验,并记录试验结果数据,其中,组合方案包括每个待改变因素的一个水平。
例如,选择的正交表如表1所示,采用三水平四因素的正交表。表1示出了待改变因素为A、B、C的正交表。
表1正交表
通过表1可以看出,进行正交计算之前需要进行9次试验,第1次试验的组合方案为A1、B1、C1,第2次试验的组合方案为A1、B2、C2,……第9次试验的组合方案为A3、B3、C2。试验结果X在表1的最后一列示出,试验结果可以是一段时间内的结果,例如,一周内的访问量、一周内的订单量等。
步骤S106,对试验结果数据进行正交计算,得到正交结果数据。
步骤S108,根据正交结果数据从组合方案中选择一种方案对网页进行优化。
按照表1所示的试验方案进行9次试验,得到9个试验结果数据,每个试验结果数据都对应一个组合方案。对这9个试验结果数据进行正交计算,得到正交结果数据,并根据正交结果数据从组合方案中选择一种方案对网页进行优化。
通过上述实施例,根据待改变因素的个数和每个待改变因素的水平数选择正交表,再根据选择的正交表确定试验的次数,减少了试验次数,然后利用正交计算的结果从多个组合方案中选择一种方案对网页进行优化,降低了选择组合方案的复杂度,综上所述,本实施例所提供的方法解决了对网页进行优化时的效率比较低的问题,从而达到了提高对网页进行优化时的效率的效果。
可选地,为了快速准确地从多个组合方案中选择一种方案对网页进行优化,根据正交结果数据从组合方案中选择一种方案对网页进行优化包括:判断正交结果数据是否指示待改变因素的水平满足显著性差异。如果正交结果数据指示待改变因素的水平满足显著性差异,则从组合方案中选择待改变因素的水平中满足显著性差异的水平组成的优化性能最好的方案对网页进行优化。如果正交结果数据指示待改变因素的水平不满足显著性差异,则不对网页进行优化。
显著性差异是一个统计学名词。它是统计学上对数据差异性的评价。当数据之间具有了显著性差异,就说明参与比对的数据不是来自于同一总体,而是来自于具有差异的两个不同总体。对于由待改变因素的不同水平组合成的几种待定的修改方案,如果正交结果数据显示某一个(或几个)因素具有显著性差异,则说明该种(或几种)因素的不同水平之间的效果确实是不同的,此时可以选择该种(几种)因素中表现最好的水平的组合来作为修改方案,如果正交结果数据显示没有显著性差异,也就是说各种因素的不同水平的改变其实没有什么差异,此时就没有必要再对网页进行优化,当前网页已经处于最佳性能。其中,表现最好的水平可以根据每个水平对网页的优化性能来确定。
如表1所示,因素A的水平为A1、A2和A3,如果正交结果数据显示待改变因素的水平满足显著性差异,也就是说水平A1、A2和A3满足显著性差异,则可以选择A1、A2和A3中的一个水平对网页进行优化,如果正交结果数据显示待改变因素的水平不满足显著性差异,则不需要从A1、A2和A3中选择水平,即不需要对网页进行优化。
通过显著性差异的判断,可以准确、快速的看出是否需要进行网页优化,以避免单一比较某个数据造成的误判,在对多个网页进行优化时,通过快速判断每个网页是否需要优化来提高多个网页的整体优化效率;在进行一个网页的多项性能进行优化时,可以通过判断每项性能是否需要优化来提高网页的优化效率,从而解决了现有技术中进行网页优化时效率比较低的问题,达到了提高优化效率的效果。
具体地,判断正交结果数据是否指示待改变因素满足显著性差异包括:对正交结果数据进行方差计算,得到方差。根据方差计算试验结果数据的显著性差异。判断显著性差异是否大于临界值。如果显著性差异大于临界值,则正交结果数据满足显著性差异。如果显著性差异小于等于临界值,则正交结果数据不满足显著性差异。
例如:收集的数据为:
一共N次试验,共M个试验因素,假定此处每个试验因素都有4个水平,计算每个试验因素每个水平的总值。
其中,每个试验因素每个水平的总值|第j个试验因素的水平为i)。
根据上述总值,计算综合指标值其中4为水平数。
根据上一步中的数据,进行方差分析计算。
其中, SSj = 1 4 Σ i = 1 4 b ij 2 - 1 4 2 A 2 , j = 1,2 , . . . , M .
df=4-1,即为因子水平数-1;
MSj=SSj/df,j=1,2,…,M;
SSS = Σ i = 1 N a i 2 - 1 N A 2 ;
SSE = SSS - Σ j = 1 M SSj ;
MSE=SSE/df,
Fj=MSj/MSE,j=1,2,…,M。
结论判断:
根据显著性水平α,在F值表可查到F临界值Fx。若Fj>Fx,则说明第j个试验因素的各个水平之间是有显著性差异的,此时可以选择指标表现最好的一个水平来进行配置;否则,则说明第j个试验因素的各个水平之间是没有显著性差异的,即没有哪个方案是更好的,可以保持原状。以上,可以根据判断结果选择具有显著性的一个或多个因素的相应水平进行组合来实现最佳配置。
可选地,按照选择的正交表确定的待改变因素的组合方案来对待改变因素的组合进行试验,并记录试验结果数据包括:接收试验所表征的指标。收集试验结果数据中与指标对应的数据。从组合方案中选择一种方案对网页进行优化包括:比较指标对应的数据,得到最大数值。将最大数值对应的组合方案作为对网页进行优化的方案。
试验所表征的指标可以是网页访问量、网页订单量等,在进行如表1所示的试验时,每个试验都可能得到一个或者多个指标的数据。但是在优化网页时,可能只针对网站的访问量或者订单量进行优化,那么在收集数据时,可以有针对性的选择与待优化的指标对应的数据,例如,只收集订单量所对应的数据,以便于对网页的订单量进行优化。如表1所示,每个组合方案对应的试验结果都不同,根据正交试验检验的结果从这些试验中选择最佳组合方案作为最终采用的优化方案。
有针对性的选择试验时收集的数据,能够减少数据的运算量,提高运算效率,进而提高优化效率,解决现有技术中进行网页优化的效率比较低的问题,达到了提高网页优化效率的效果。
以下结合表1对本实施例的优选方案进行说明。
待改变因素为A、B、C,待改变因素A的水平为A1、A2、A3,待改变因素B的水平为B1、B2、B3,待改变因素C的水平为C1、C2、C3。采用的正交表为表1所示三因素四水平的正交表,根据表1所示的正交表进行9次试验,9次试验的试验结果分别为X1、X2……X9。对试验结果进行正交计算后,得到每个待改变因素的显著性差异,逐个判断三个待改变因素的显著性差异是否大于临界值,仅从显著性差异大于临界值的待改变因素中选择水平。如果待改变因素A的显著性差异大于临界值,待改变因素B和待改变因素C的显著性差异都小于临界值,则从A1、A2和A3中选择水平,待改变因素B和待改变因素C均保持不变。此时判断9个试验结果中哪个试验结果的指标值最大,如果是第5次试验的试验结果X5最大,则选择X5对应的组合方案,但是由于待改变因素B和待改变因素C均不需要改变,则仅选择试验结果X5对应的组合方案中的待改变因素A的水平A2,即将网页的待改变因素A改为A2,待改变因素B和待改变因素C均不变,以实现对网页的优化。
本发明实施例还提供了一种网页的数据处理装置。该装置可以通过网页的数据处理方法实现其功能。需要说明的是,本发明实施例的网页的数据处理装置可以用于执行本发明实施例所提供的网页的数据处理方法,本发明实施例的网页的数据处理方法也可以通过本发明实施例所提供的网页的数据处理装置来执行。
图2是根据本发明实施例的网页的数据处理装置的示意图。如图所示,该网页的数据处理装置包括:接收单元10、试验单元20、正交单元30和选择单元40。
接收单元10用于接收根据待改变因素的个数和每个待改变因素的水平数选择的正交表。
待改变因素为网页中需要进行改变的部分,待改变因素的水平为网页中需要改变部分的可采用的改变方案,例如,待改变因素为A、B、C,待改变因素A的水平为A1、A2、A3,待改变因素B的水平为B1、B2、B3,待改变因素C的水平为C1、C2、C3。在选择正交表时可以采用三因素三水平的正交表,通过判断因素与水平的个数来选择正交表。
具体地,接收单元10包括:获取模块,用于获取待改变的因素的个数和每个待改变因素的水平数。第二比较模块,用于比较待改变的因素的个数与待选择的正交表的因素的个数的大小,比较待改变因素的水平数与待选择的正交表的因素的水平数的大小。选择模块,用于选择待选择的正交表的因素的个数大于等于待改变的因素的个数,且待选择的正交表的水平个数大于等于待改变因素的水平数的待选择正交表,得到第一正交表。以及计算模块,用于计算第一正交表中所指示的试验的次数。第二确定模块,用于从第一正交表中选择试验的次数最少的正交表作为选择的正交表。
正交表的形式具有多种,但是每种正交表所需要的试验次数不同,在选择正交表是,选择能够满足待改变因素的个数和每个待改变因素的水平数的正交表,并且选择的正交表所指示的试验次数应该是所有正交表中的最少的,利用这样的正交表进行计算不仅可以使试验次数最少,还能达到正交计算的目的。即选择的正交表的因素的个数大于等于待改变因素的个数,选择的正交表的水平的个数大于等于待改变因素的水平数。
试验单元20按照选择的正交表确定的待改变因素的组合方案来对待改变因素的组合进行试验,并记录试验结果数据,其中,组合方案包括每个待改变因素的一个水平。
例如,选择的正交表如表1所示,采用三水平四因素的正交表。表1示出了待改变因素为A、B、C的正交表。
通过表1可以看出,进行正交计算之前需要进行9次试验,第1次试验的组合方案为A1、B1、C1,第2次试验的组合方案为A1、B2、C2,……第9次试验的组合方案为A3、B3、C2。试验结果X在表1的最后一列示出,试验结果可以是一段时间内的结果,例如,一周内的访问量、一周内的订单量等。
正交单元30用于对试验结果数据进行正交计算,得到正交结果数据。以及
选择单元40用于根据正交结果数据从组合方案中选择一种方案对网页进行优化。
按照表1所示的试验方案进行9次试验,得到9个试验结果数据,每个试验结果数据都对应一个组合方案。对这9个试验结果数据进行正交计算,得到正交结果数据,并根据正交结果数据从组合方案中选择一种方案对网页进行优化。
通过上述实施例,根据待改变因素的个数和每个待改变因素的水平数选择正交表,再根据选择的正交表确定试验的次数,减少了试验次数,然后利用正交计算的结果从多个组合方案中选择一种方案对网页进行优化,降低了选择组合方案的复杂度,从而解决了对网页进行优化时的效率比较低的问题,进而达到了提高对网页进行优化时的效率的效果。
可选地,为了快速准确地从多个组合方案中选择一种方案对网页进行优化,根据正交结果数据从组合方案中选择一种方案对网页进行优化包括:判断正交结果数据是否指示待改变因素的水平满足显著性差异。如果正交结果数据指示待改变因素的水平满足显著性差异,则从组合方案中选择待改变因素的水平中满足显著性差异的水平组成的优化性能最好的方案中对网页进行优化。如果正交结果数据指示待改变因素的水平不满足显著性差异,则不对网页进行优化。
显著性差异是一个统计学名词。它是统计学上对数据差异性的评价。当数据之间具有了显著性差异,就说明参与比对的数据不是来自于同一总体,而是来自于具有差异的两个不同总体。对于由待改变因素的不同水平组合成的几种待定的修改方案,如果正交结果数据显示某一个(或几个)因素具有显著性差异,则说明该种(或几种)因素的不同水平之间的效果确实是不同的,此时可以选择该种(几种)因素中表现最好的水平的组合来作为修改方案,如果正交结果数据显示没有显著性差异,也就是说各种因素的不同水平的改变其实没有什么差异,此时就没有必要再对网页进行优化,当前网页已经处于最佳性能。其中,表现最好的水平可以根据每个水平对网页的优化性能来确定。
如表1所示,因素A的水平为A1、A2和A3,如果正交结果数据显示待改变因素的水平满足显著性差异,也就是说水平A1、A2和A3满足显著性差异,则可以选择A1、A2和A3中的一个水平对网页进行优化,如果正交结果数据显示待改变因素的水平不满足显著性差异,则不需要从A1、A2和A3中选择水平,即不需要对网页进行优化。
通过显著性差异的判断,可以准确、快速的看出是否需要进行网页优化,以避免单一比较某个数据造成的误判,在对多个网页进行优化时,通过快速判断每个网页是否需要优化来提高多个网页的整体优化效率;在进行一个网页的多项性能进行优化时,可以通过判断每项性能是否需要优化来提供网页的优化效率,从而解决了现有技术中进行网页优化时效率比较低的问题,达到了提高优化效率的效果。
具体地,判断模块包括:第一计算子模块,用于对正交结果数据进行方差计算,得到方差。第二计算子模块,用于根据方差计算试验结果数据的显著性差异。判断子模块,用于判断显著性差异是否大于临界值。确定子模块,用于在显著性差异大于临界值时,正交结果数据满足显著性差异。在显著性差异小于等于临界值时,正交结果数据不满足显著性差异。
例如:收集的数据为:
一共N次试验,共M个试验因素,假定此处每个试验因素都有4个水平,计算每个试验因素每个水平的总值。
其中,每个试验因素每个水平的总值|第j个试验因素的水平为i)。
根据上述总值,计算综合指标值其中4为水平数。
根据上一步中的数据,进行方差分析计算。
其中, SSj = 1 4 Σ i = 1 4 b ij 2 - 1 4 2 A 2 , j = 1,2 , . . . , M .
df=4-1,即为因子水平数-1
MSj=SSj/df,j=1,2,…,M
SSS = Σ i = 1 N a i 2 - 1 N A 2 ;
SSE = SSS - Σ j = 1 M SSj ;
MSE=SSE/df,
Fj=MSj/MSE,j=1,2,…,M。
结论判断:
根据显著性水平α,在F值表可查到F临界值Fx。若Fj>Fx,则说明第j个试验因素的各个水平之间是有显著性差异的,此时可以选择指标表现最好的一个水平来进行配置;否则,则说明第j个试验因素的各个水平之间是没有显著性差异的,即没有哪个方案是更好的,可以保持原状。以上,可以根据判断结果选择具有显著性的一个或多个因素的相应水平进行组合来实现最佳配置。
可选地,试验单元20包括:接收模块,用于接收试验所表征的指标。收集模块,用于收集试验结果数据中与指标对应的数据。选择单元40包括:第一比较模块,用于比较指标对应的数据,得到最大数值。第一确定模块,用于将最大数值对应的组合方案作为对网页进行优化的方案。
试验所表征的指标可以是网页访问量、网页订单量等,在进行如表1所示的试验时,每个试验都可能得到一个或者多个指标的数据。但是在优化网页时,可能只针对网站的访问量或者订单量进行优化,那么在收集数据时,可以有针对性的选择与待优化的指标对应的数据,例如,只收集订单量所对应的数据,以便于对网页的订单量进行优化。如表1所示,每个组合方案对应的试验结果都不同,根据正交试验检验的结果从这些试验中选择最佳组合方案作为最终采用的优化方案。
有针对性的选择试验时收集的数据,能够减少数据的运算量,提高运算效率,进而提高优化效率,解决现有技术中进行网页优化的效率比较低的问题,达到了提高网页优化效率的效果。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、移动终端、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种网页的数据处理方法,其特征在于,包括:
接收根据待改变因素的个数和每个所述待改变因素的水平数选择的正交表;
按照所述选择的正交表确定的所述待改变因素的组合方案来对所述待改变因素的组合进行试验,并记录试验结果数据,其中,所述组合方案包括每个所述待改变因素的一个水平;
对所述试验结果数据进行正交计算,得到正交结果数据;以及
根据所述正交结果数据从所述组合方案中选择一种方案对所述网页进行优化。
2.根据权利要求1所述的数据处理方法,其特征在于,根据所述正交结果数据从所述组合方案中选择一种方案对所述网页进行优化包括:
判断所述正交结果数据是否指示所述待改变因素的水平满足显著性差异;
如果所述正交结果数据指示所述待改变因素的水平满足所述显著性差异,则从所述组合方案中选择所述待改变因素的水平中满足所述显著性差异的水平组成的优化性能最好的方案对所述网页进行优化;以及
如果所述正交结果数据指示所述待改变因素的水平不满足所述显著性差异,则不对所述网页进行优化。
3.根据权利要求2所述的数据处理方法,其特征在于,判断所述正交结果数据的水平是否指示所述待改变因素满足显著性差异包括:
对所述正交结果数据进行方差计算,得到方差;
根据所述方差计算所述试验结果数据的显著性差异;
判断所述显著性差异是否大于临界值;
如果所述显著性差异大于所述临界值,则所述正交结果数据满足所述显著性差异;
如果所述显著性差异小于等于所述临界值,则所述正交结果数据不满足所述显著性差异。
4.根据权利要求1至3中任一项所述的数据处理方法,其特征在于,
按照所述选择的正交表确定的所述待改变因素的组合方案来对所述待改变因素的组合进行试验,并记录试验结果数据包括:接收所述试验所表征的指标;收集所述试验结果数据中与所述指标对应的数据;
从所述组合方案中选择一种方案对所述网页进行优化包括:比较所述指标对应的数据,得到最大数值;将所述最大数值对应的组合方案作为对所述网页进行优化的方案。
5.根据权利要求1所述的数据处理方法,其特征在于,根据待改变因素的个数和每个所述待改变因素的水平数选择的正交表包括:
获取待改变的因素的个数和每个所述待改变因素的水平数;
比较所述待改变的因素的个数与待选择的正交表的因素的个数的大小,比较待改变因素的水平数与所述待选择的正交表的因素的水平数的大小;
选择所述待选择的正交表的因素的个数大于等于所述待改变的因素的个数,且所述待选择的正交表的水平个数大于等于所述待改变因素的水平数的待选择正交表,得到第一正交表;以及
计算所述第一正交表中所指示的试验的次数;
从所述第一正交表中选择所述试验的次数最少的正交表作为选择的正交表。
6.一种网页的数据处理装置,其特征在于,包括:
接收单元,用于接收根据待改变因素的个数和每个所述待改变因素的水平数选择的正交表;
试验单元,按照所述选择的正交表确定的所述待改变因素的组合方案来对所述待改变因素的组合进行试验,并记录试验结果数据,其中,所述组合方案包括每个所述待改变因素的一个水平;
正交单元,用于对所述试验结果数据进行正交计算,得到正交结果数据;以及
选择单元,用于根据所述正交结果数据从所述组合方案中选择一种方案对所述网页进行优化。
7.根据权利要求6所述的数据处理装置,其特征在于,所述选择单元包括:
判断模块,用于判断所述正交结果数据是否指示所述待改变因素的水平满足显著性差异;
优化模块,用于在所述正交结果数据指示所述待改变因素的水平满足所述显著性差异时,从所述组合方案中选择所述待改变因素的水平中满足所述显著性差异的水平组成的优化性能最好的方案对所述网页进行优化;以及在所述正交结果数据指示所述待改变因素的水平不满足所述显著性差异时,不对所述网页进行优化。
8.根据权利要求7所述的数据处理装置,其特征在于,所述判断模块包括:
第一计算子模块,用于对所述正交结果数据进行方差计算,得到方差;
第二计算子模块,用于根据所述方差计算所述试验结果数据的显著性差异;
判断子模块,用于判断所述显著性差异是否大于临界值;
确定子模块,用于在所述显著性差异大于所述临界值时,所述正交结果数据满足所述显著性差异;在所述显著性差异小于等于所述临界值时,所述正交结果数据不满足所述显著性差异。
9.根据权利要求6至8中任一项所述的数据处理装置,其特征在于,
所述试验单元包括:接收模块,用于接收所述试验所表征的指标;收集模块,用于收集所述试验结果数据中与所述指标对应的数据;
所述选择单元包括:第一比较模块,用于比较所述指标对应的数据,得到最大数值;第一确定模块,用于将所述最大数值对应的组合方案作为对所述网页进行优化的方案。
10.根据权利要求6所述的数据处理装置,其特征在于,所述接收单元包括:
获取模块,用于获取待改变的因素的个数和每个所述待改变因素的水平数;
第二比较模块,用于比较所述待改变的因素的个数与待选择的正交表的因素的个数的大小,比较待改变因素的水平数与所述待选择的正交表的因素的水平数的大小;
选择模块,用于选择所述待选择的正交表的因素的个数大于等于所述待改变的因素的个数,且所述待选择的正交表的水平个数大于等于所述待改变因素的水平数的待选择正交表,得到第一正交表;以及
计算模块,用于计算所述第一正交表中所指示的试验的次数;
第二确定模块,用于从所述第一正交表中选择所述试验的次数最少的正交表作为选择的正交表。
CN201410692546.8A 2014-11-26 2014-11-26 网页的数据处理方法和装置 Active CN104408119B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410692546.8A CN104408119B (zh) 2014-11-26 2014-11-26 网页的数据处理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410692546.8A CN104408119B (zh) 2014-11-26 2014-11-26 网页的数据处理方法和装置

Publications (2)

Publication Number Publication Date
CN104408119A true CN104408119A (zh) 2015-03-11
CN104408119B CN104408119B (zh) 2018-08-03

Family

ID=52645750

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410692546.8A Active CN104408119B (zh) 2014-11-26 2014-11-26 网页的数据处理方法和装置

Country Status (1)

Country Link
CN (1) CN104408119B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113315672A (zh) * 2020-02-27 2021-08-27 腾讯科技(深圳)有限公司 流量分配方法及装置、电子设备及计算机可读存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104008251A (zh) * 2014-06-12 2014-08-27 北京华航无线电测量研究所 一种基于正交试验的漏磁检测系统的磁路优化设计方法
CN104062901A (zh) * 2014-06-17 2014-09-24 河海大学 基于正交优选粒子群算法的控制系统参数优化方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104008251A (zh) * 2014-06-12 2014-08-27 北京华航无线电测量研究所 一种基于正交试验的漏磁检测系统的磁路优化设计方法
CN104062901A (zh) * 2014-06-17 2014-09-24 河海大学 基于正交优选粒子群算法的控制系统参数优化方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
郭伏等: "基于感性工学的电子商务网页外观设计优化", 《人类工效学》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113315672A (zh) * 2020-02-27 2021-08-27 腾讯科技(深圳)有限公司 流量分配方法及装置、电子设备及计算机可读存储介质
CN113315672B (zh) * 2020-02-27 2024-05-14 腾讯科技(深圳)有限公司 流量分配方法及装置、电子设备及计算机可读存储介质

Also Published As

Publication number Publication date
CN104408119B (zh) 2018-08-03

Similar Documents

Publication Publication Date Title
CN108090208A (zh) 融合数据处理方法及装置
TWI360754B (en) Web page analysis using multiple graphs
Charkhi et al. Asymptotic post-selection inference for the Akaike information criterion
Shin et al. A review of foundational methods for checking the structural identifiability of models: Results for rainfall-runoff
CN103995839A (zh) 基于协同过滤的商品推荐优化方法和系统
EP3279806A1 (en) Data processing method and apparatus
CN107230381A (zh) 一种停车位推荐方法、服务器以及客户端
CN105005582A (zh) 多媒体信息的推荐方法及装置
CN103051370B (zh) 一种用户设备的工作拉远射频单元选择方法和基站
CN106709625A (zh) 一种电力市场需求响应规划评估方法
CN103425664A (zh) 一种对实体数据单元进行搜索、显示的方法和设备
CN109996269A (zh) 一种无线通信网络异常原因确定方法、装置、设备及介质
CN105719164A (zh) 一种推荐付费多媒体资源的方法及装置
CN103365842B (zh) 一种页面浏览推荐方法及装置
CN113139654A (zh) 图神经网络模型的训练方法及装置
CN109857804A (zh) 一种分布式模型参数的搜索方法、装置和电子设备
CN105790866B (zh) 基站分级方法及装置
CN111061624A (zh) 策略执行效果确定方法、装置、电子设备及存储介质
CN105631732A (zh) 确定用户权限的方法和装置
CN103309885A (zh) 一种在电子交易平台中识别特征用户的方法及装置和搜索方法及装置
CN110570271A (zh) 信息推荐方法、装置、电子设备及可读存储介质
CN106909616A (zh) 基于信息熵的多目标水文站网优化模型
CN104408119A (zh) 网页的数据处理方法和装置
US20050288914A1 (en) Method and system for performing effective resistance calculation for a network of resistors
CN111177564B (zh) 一种产品推荐方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Webpage data processing method and device

Effective date of registration: 20190531

Granted publication date: 20180803

Pledgee: Shenzhen Black Horse World Investment Consulting Co.,Ltd.

Pledgor: BEIJING GRIDSUM TECHNOLOGY Co.,Ltd.

Registration number: 2019990000503

PE01 Entry into force of the registration of the contract for pledge of patent right
CP02 Change in the address of a patent holder

Address after: 100083 No. 401, 4th Floor, Haitai Building, 229 North Fourth Ring Road, Haidian District, Beijing

Patentee after: BEIJING GRIDSUM TECHNOLOGY Co.,Ltd.

Address before: 100086 Beijing city Haidian District Shuangyushu Area No. 76 Zhichun Road cuigongfandian 8 layer A

Patentee before: BEIJING GRIDSUM TECHNOLOGY Co.,Ltd.

CP02 Change in the address of a patent holder
PP01 Preservation of patent right

Effective date of registration: 20240604

Granted publication date: 20180803